Nghiên cứu sự tiến hóa và lây lan của dịch bệnh bằng cải tiến phương pháp UFBoot
Theo thống kê từ Google Scholar, công trình “UFBoot2: Improving the Ultrafast Bootstrap Approximation” (tiếng Việt, UFBoot2: Cải tiến phương pháp UFBoot xây dựng cây bootstrap tiến hóa) do nhóm nghiên cứu Khoa Công nghệ thông tin (Trường ĐH Công nghệ, ĐHQGHN) thực hiện, đã đạt hơn 2.000 trích dẫn trên tạp chí quốc tế và là công trình có số trích dẫn nhiều trong ĐHQGHN. Để tìm hiểu thêm về công trình, VNU Media đã có cuộc trò chuyện với đại diện nhóm tác giả TS. Hoàng Thị Điệp.
Tiến sĩ có thể cho biết công trình “Cải tiến phương pháp UFBoot xây dựng cây bootstrap tiến hóa” được các chuyên gia đầu ngành đánh giá như thế nào?
Bắt đầu từ năm 2018, nhóm tác giả gồm tôi cùng với PGS.TS. Lê Sỹ Vinh và TS. Bùi Quang Minh cùng các cộng sự tại Trung tâm Tin sinh tích hợp (CIBIV, University of Vienna, Áo) đã công bố công trình trên tạp chí Molecular Biology and Evolution (MBE). Tạp chí MBE có chỉ số ảnh hưởng 5 năm là 13.4, được xếp vào Q1 trong cả 3 lĩnh vực Sinh thái học, Tiến hóa, Hành vi và Hệ thống học; Di truyền và Sinh học phân tử nên tiêu chuẩn rất cao.
Vì thế, khi công trình được đăng có nghĩa các chuyên gia đầu ngành trong ban biên tập và các phản biện của tạp chí có đánh giá tích cực về đóng góp của kết quả nghiên cứu. Trong hai năm qua, số trích dẫn của công trình đã hơn 2.000 trích dẫn, nhóm tác giả cảm thấy tự hào và vinh dự khi thấy công trình có ý nghĩa khoa học và thực tiễn đối với cộng đồng nghiên cứu về lĩnh vực tiến hoá và sinh học phân tử.
Ngoài ra, tháng 1/2019, công trình được ban biên tập tạp chí MBE chọn vào danh sách MBE Citation Classics 2019 và tháng 11/2019, công trình tiếp tục được chọn vào danh sách MBE Emerging Classics 2020 để vinh danh các công bố có ảnh hưởng cao trong cộng đồng quốc tế về nghiên cứu tiến hóa.
Xuất phát từ lý do nào mà nhóm tác giả thực hiện công trình này, thưa Tiến sĩ?
Công trình này là một phần luận án của tôi trong thời gian làm nghiên cứu sinh tại Trường ĐH Công Nghệ, ĐHQGHN. Công trình xuất phát từ hợp tác nghiên cứu giữa nhóm Tin Sinh của Trường ĐHCN và Trung tâm Tin sinh tích hợp (University of Vienna, Áo). GS. Arndt von Haeseler, người đứng đầu trung tâm, là người đã có kinh nghiệm nghiên cứu về cây tiến hóa từ những năm 80 của thế kỉ trước.
Vì vậy, công trình này được thừa kế rất nhiều tài nguyên từ bề dày nghiên cứu của nhóm GS. Haeseler từ những năm 80 của thế kỉ trước. Đồng thời, tôi vinh dự nhận được sự hướng dẫn trực tiếp từ GS. Arndt von Haeseler, TS. Bùi Quang Minh và PGS.TS. Lê Sỹ Vinh.
Công trình này đề xuất phương pháp UFBoot2 là bản cải tiến cho phương pháp UFBoot (TS. Bùi Quang Minh và cộng sự, 2013). UFBoot tính nhanh cây bootstrap tiến hóa, từ đó tính nhanh được độ tin cậy của cây tiến hóa. UFBoot2 nhanh hơn và chính xác hơn UFBoot nhờ đề xuất cải tiến thuật toán ở phần lõi. Những đề xuất này được đánh giá cao về ý nghĩa khoa học. Một đóng góp quan trọng của công trình là sản phẩm phần mềm, được tích hợp vào hệ thống IQ-TREE (http://www.iqtree.org/), do đó có nhiều ý nghĩa thực tiễn. Nó đáp ứng được nhu cầu phân tích tiến hóa cho dữ liệu mới (nhiều trình tự, nhiều gen) của các nhà sinh học và của những nhà nghiên cứu dịch bệnh.
Nhu cầu này tăng mạnh kể từ sự bùng phát của đại dịch COVID-19 do nhiều trung tâm lớn trên thế giới tiến hành nghiên cứu sự tiến hóa và lây lan của SARS-CoV-2 bằng phần mềm của chúng tôi.
Trong quá trình nghiên cứu, Tiến sĩ và nhóm tác giả đã trải qua những khó khăn như thế nào?
Đối với tôi, khó khẳn chủ yếu là về chuyên môn. Công trình nghiên cứu thuộc một chuyên ngành khá hẹp của tin sinh, nhiều kiến thức về sinh học, về toán cao cấp, về thống kê tôi phải tìm hiểu thêm những bài toán hiện nay đã nghiên cứu. Bởi vì, giai đoạn định hình bài toán nên tính ứng dụng thực tế còn mù mờ, nếu tôi chỉ lao vào nghiên cứu thì giống như đi ngược với số đông. Mặt khác, các kết quả nghiên cứu trước đó của các bài toán liên quan đều đã được liệt vào hàng kinh điển, tôi phải mò mẫm thử sai rất nhiều mới ra được cải tiến.
Tuy nhiên, một trong những thuận lợi của tôi khi vừa là NCS, cũng là một giảng viên trong ĐHQGHN – là đại học nghiên cứu có uy tín lâu năm. Vì vậy, việc nghiên cứu và phát triển nhóm nghiên cứu, hợp tác khoa học được tạo mọi điều kiện thuận lợi. Đồng thời, Trường ĐHCN là môi trường nghiên cứu với nhiều giảng viên chuyên môn cao, có kinh nghiệm trong công bố quốc tế nên tôi đã học hỏi được rất nhiều. Ngoài ra, tài nguyên tính toán hiệu năng cao được Nhà trường đầu tư, giúp cán bộ và nghiên cứu sinh mạnh dạn lựa chọn các bài toán khó với phương pháp tính toán hiện đại.
Trong tương lai, nhóm nghiên cứu có tiếp tục sử dụng kết quả này để nghiên cứu hoặc ứng dụng đối với sản phẩm nào trong lĩnh vực Tiến hoá và Sinh học phân tử không?
Nhóm nghiên cứu đã và đang tiến hành nghiên cứu hợp tác với các nhóm mạnh trong nước và trên thế giới để có các phương pháp nhanh hơn, chính xác hơn cho phân tích tiến hóa (không chỉ riêng bài toán tính nhanh cây bootstrap tiến hóa và phương pháp UFBoot2), cho tin sinh và tận dụng tối đa các hệ thống tính toán hiện đại. Nhóm luôn chú trọng việc đồng thời phát triển sản phẩm phần mềm để nhà phân tích có thể thử nghiệm phương pháp mới của nhóm nghiên cứu trên tài nguyên của họ.
Cảm ơn Tiến sĩ về cuộc trò chuyện!
Theo Thiên Bình (VNU-Media)