Sự kết hợp giữa khoa học tính toán và công nghệ sinh học nhằm giải thích những cơ chế của sự sống đã mở ra một lĩnh vực nghiên cứu mới, Tin sinh học (Bioinformatics). Bắt nhịp xu thế phát triển này của khoa học thế giới, các nhà Tin sinh học Việt Nam đã xác định được những hướng đi phù hợp và đạt được thành công bước đầu với một số công trình nghiên cứu mang tính ứng dụng cao, theo nhận xét của GS. TS Trương Nam Hải (Viện Công nghệ sinh học, Viện Hàn lâm KH&CN Việt Nam).
Thay đổi phương pháp tiếp cận
Từ khi giải mã được bộ gene người và kỹ thuật giải trình tự gene thế hệ mới (NGS – Next Generation Sequence) ra đời, khối lượng dữ liệu trình tự hệ gene tăng chóng mặt, đòi hỏi những kỹ thuật tính toán mới nhằm phân tích số liệu, lắp ráp hoàn chỉnh hệ gene rồi chú giải, tìm hiểu chức năng của nó… Đây là lúc Tin sinh học nhập cuộc với sự hợp tác chặt chẽ giữa các nhà tin học và sinh học. GS.TS Hồ Tú Bảo (Viện KH&CN Tiên tiến Nhật Bản – JAIST) cho biết, ưu điểm của nghiên cứu trên máy tính so với nghiên cứu sinh học thực nghiệm là cùng lúc có thể phân tích, so sánh rất nhiều gene để đưa ra các giả thuyết về chúng và trao cho các nhà thực nghiệm kiểm chứng.
Với sự tham gia của các nhà tin học trong địa hạt sinh học phân tử, các nhà sinh học bắt đầu biết đến khái niệm in silico – phương pháp thay đổi cấu trúc của các gene, protein, enzyme trên máy tính sau khi đã mô phỏng sự tương tác giữa các phân tử này với các chất, các phân tử khác để hiểu rõ cách thức, cơ chế hoạt động của nó. Hoàn tất phần việc trên máy tính để tìm ra mô hình tối ưu về mặt tính toán, nhà nghiên cứu mới bắt tay vào thực nghiệm, phần công việc với phương pháp in vitro (trong ống nghiệm), in vivo (trên cơ thể sống)… Điều đó thể hiện phương pháp tiếp cận từ góc độ hoàn toàn mới với các kỹ thuật tính toán trước những bài toán sinh học.
Tùy theo tính chất của từng bài toán mà các nhà Tin sinh học lựa chọn những công cụ, những phần mềm xử lý phù hợp, mời thêm các chuyên gia ở lĩnh vực khác như vật lý lý thuyết (tính toán kích thước phân tử, tìm hiểu sự tương tác giữa các phân tử), hóa học (phân tích cấu trúc, bản chất hóa học của protein, enzyme…) cùng tham gia nghiên cứu, đặc biệt với các bài toán về mô hình – mô phỏng.
Tin sinh học Việt Nam còn quá ít nhiệm vụ nghiên cứu, mặc dù tính ứng dụng của các đề tài nghiên cứu trong lĩnh vực này rất lớn.
Đội ngũ Tin sinh học Việt Nam bao gồm cả các nhà nghiên cứu tiếp cận từ hai nhánh tin học và sinh học. Nhóm của GS Hồ Tú Bảo, PGS. TS Lê Sỹ Vinh (ĐH Công nghệ, ĐH Quốc gia Hà Nội), GS. TS Từ Minh Phương (ĐH Bưu chính viễn thông), TS Trần Đăng Hưng (ĐH Sư phạm, ĐH Quốc gia Hà Nội)… thuộc nhánh thứ nhất với thế mạnh làm chủ kỹ thuật tính toán, thống kê, khoa học máy tính, trí tuệ nhân tạo, khai thác dữ liệu (data mining)… Nhánh thứ hai gồm các nhóm của GS.TS Trương Nam Hải, TS Nguyễn Cường (Viện Công nghệ sinh học), PGS. TS Lê Thị Lý (ĐH Quốc tế, ĐH Quốc gia TP.HCM), TS Dương Quốc Chính (Viện Huyết học truyền máu TƯ), TS Trịnh Thanh Bình (trường Cao đẳng Thủy sản), TS Khuất Hữu Trung (Viện Di truyền nông nghiệp)…, vốn nắm rất chắc kiến thức về hệ gene học (genomics), hệ phiên mã (transcriptomics), hệ protein (protemics)… Trong số này, nhóm ở Viện Công nghệ Sinh học là một trong những nhóm đầu tiên ở Việt Nam có sự kết hợp chặt chẽ giữa sinh học và tin học mà theo GS Hải “rất cần thiết vì dân tin học có công cụ tính toán trong tay nhưng việc ứng dụng công cụ ấy vào đâu, giải quyết vấn đề nào thì cần dân sinh học. Trên cơ sở bài toán được dân sinh học ‘đọc’, dân tin học xây dựng công cụ phần mềm phù hợp để cùng nhau thực hiện”.
Các nghiên cứu của Tin sinh học Việt Nam đã góp phần giải quyết những vấn đề liên quan đến sinh học thông qua việc phân lập gene có giá trị kinh tế xã hội cao; phân tích đặc điểm của gene bằng các marker (chỉ thị phân tử) để chọn và tạo giống trong nông nghiệp, nuôi trồng thủy sản; phân tích xây dựng chỉ thị nghiên cứu sự đa dạng của các quần thể sinh học; phân tích để tìm ra đột biến gene sinh ung thư, kháng thuốc trong y học; nhận diện trong khoa học pháp y; thiết kế thuốc trong dược học…
Tuy lực lượng chưa nhiều nhưng Tin sinh học Việt Nam đã chọn được hướng đi phù hợp để bắt nhịp với thế giới. Hiện nhóm của GS Bảo đang tập trung vào hướng nghiên cứu và ứng dụng Bệnh án điện tử, EMR – Electronic Medical Record) nhằm thiết lập bệnh án của người bệnh ở dạng điện tử dựa trên hệ thống thông tin bệnh viện (HIS – Hospital Information System). Cũng thiên về y sinh song nhóm của PGS Lý đi sâu vào nghiên cứu và phát triển dược phẩm; TS Chính tìm đột biến đơn điểm SNP (Single Nucleotide Polymorphism) gây bệnh ung thư máu, SNP gây kháng thuốc. Sau những công bố về hệ gene người Việt, PGS Vinh tiếp tục con đường này và tìm cách cộng tác với các bệnh viện để đưa kết quả nghiên cứu vào thực tế điều trị. Riêng nhóm của GS Hải và TS Cường nghiên cứu xây dựng bản đồ hệ gene vi tảo, lắp ráp và chú giải hệ phiên mã tôm sú, phân tích hệ gene lúa, phân tích hệ gene metagenomics, đều là những bài toán có nhiều ý nghĩa ứng dụng.
Hai khó khăn nội tại
Theo các nhà Tin sinh học Việt Nam, do sự quan tâm của nhà nước cho lĩnh vực này vẫn còn ở mức khiêm tốn nên trong quá trình nghiên cứu gặp phải nhiều khó khăn, nhất là thiếu thốn về cơ sở vật chất, đặc biệt là thiếu hệ thống máy chủ có hiệu năng cao (HPC – High Performance Computing) chạy được những phần mềm chuyên dụng. “Trong giai đoạn đầu nghiên cứu, chúng tôi phải sử dụng nhờ hệ thống máy tính ở Trung tâm tích hợp Tin sinh học Vienna (CIBV) xử lý dữ liệu thô từ bộ gene 100 người Việt”, PGS Vinh chia sẻ. “Với dự án về gene ba người Việt, chúng tôi chủ yếu chạy dữ liệu trên hệ thống máy tính của ĐH Bách khoa Hà Nội, nơi có ổ cứng lớn đủ sức tải đống dữ liệu”.
Cũng đề cập đến khó khăn này, GS Hải cho biết thêm: “Khi thực hiện những đề tài do Bộ KH&CN giao, Viện Công nghệ sinh học đã thuyết phục Bộ đầu tư nhiều hơn cho hệ máy chủ có hiệu năng cao nhưng một vài thành viên trong hội đồng xét duyệt đề tài chưa đánh giá hết độ phức tạp của Tin sinh học nên không ủng hộ đề nghị mua máy. Vì vậy quá trình phân tích dữ liệu khi thực hiện đề tài bị ảnh hưởng rất nhiều, đơn cử như có máy chạy hai, ba tuần vẫn chưa xử lý được dữ liệu. Nếu đang xử lý mà gặp phải sự cố mất điện thì mọi việc ‘coi như xong’, phải phân tích lại từ đầu”.
Một khó khăn đáng kể nữa là Tin sinh học Việt Nam là còn quá ít nhiệm vụ, mặc dù tính ứng dụng từ các đề tài nghiên cứu trong lĩnh vực này rất lớn, như Viện Công nghệ sinh học trong vòng 10 năm qua cũng chỉ có vài nhiệm vụ: đề tài nhánh “Báo cáo phân tích thông tin cấu trúc của độc tố thần kinh nọc rắn và thụ thể nAChR” thuộc đề tài KC 04.18/06-10), đề tài “Giải trình tự hệ gene vi tảo biển dị dưỡng” (KC 04.20/11-15)… Vì vậy, nhiều nhà nghiên cứu trẻ đã ra nước ngoài tìm đất “dụng võ” như Phan Quang Huy (Mỹ), Tạ Xuân Hưng (Phần Lan), Lê Sỹ Quang (Anh), Cao Xuân Hiếu (Đức), Thắng Phạm (New Zealand)…, dẫn đến tình trạng trong nước hiếm hoi những người có chuyên môn sâu đủ khả năng xây dựng nhiệm vụ nghiên cứu, tạo ra cái vòng luẩn quẩn của việc thiếu nhân lực và nhiệm vụ trong lĩnh vực Tin sinh học Việt Nam hiện nay.
Tạo mối liên kết hợp tác giữa các nhóm nghiên cứu
Hiện nay các nhóm nghiên cứu Tin sinh học Việt Nam vẫn hoạt động đơn lẻ, chưa có nhiều liên kết và phối hợp với nhau trong nghiên cứu nên hạn chế khả năng giải quyết những bài toán sinh học lớn. Đây là lý do khiến nhóm của PGS Lê Sỹ Vinh dù có công bố quốc tế đáng ghi nhận về hệ gene người Việt nhưng vẫn chưa có cơ hội triển khai nghiên cứu để ứng dụng vào thực tế. Chính sự rời rạc của mạng lưới này cũng khiến nhiều nhà quản lý khoa học chưa đánh giá hết tiềm năng của tin sinh học Việt Nam.
Không chịu bế tắc trong cái vòng luẩn quẩn, nhiều nhóm Tin sinh học Việt Nam đã chủ động tìm hướng giải quyết như ưu tiên phát triển nhân lực, đó cũng là cách giải quyết của Viện Công nghệ sinh học. GS Hải cho biết, trong quá trình gây dựng bộ phận Tin sinh học nhằm hỗ trợ Phòng thí nghiệm trọng điểm công nghệ gene quốc gia tại Viện hoạt động hiệu quả, ông đã mời TS Nguyễn Cường, từng nghiên cứu bảy năm về Tin sinh học ở Hàn Quốc, tham gia. “Để giữ chân Cường, chúng tôi đặc cách đưa anh vào biên chế và giao phụ trách phòng Tin sinh học (LoBi – Lab of Bioinformatics)”. Sau chưa đầy hai năm hoạt động (thành lập tháng 7/2013), LoBi đã có công bố quốc tế, thực hiện được nhiều bài toán phức tạp về De novo (nghiên cứu xây dựng bản đồ hệ gene của các loài chưa được giải mã), Re-sequencing (tái giải trình tự), Metagenomics (đa hệ gene học), Transcriptomics, xây dựng cơ sở dữ liệu DNA Barcode.
Các nhóm nghiên cứu Tin sinh học Việt Nam hiện vẫn hoạt động đơn lẻ, chưa có nhiều liên kết và phối hợp với nhau trong nghiên cứu nên hạn chế khả năng giải quyết những bài toán sinh học lớn. Chính sự rời rạc của mạng lưới này cũng khiến nhiều nhà quản lý khoa học chưa đánh giá hết tiềm năng của tin sinh học Việt Nam.
Với mong muốn thiết lập mạng lưới liên kết của Tin sinh học Việt Nam, TS Nguyễn Cường đã xây dựng trang web www.tinsinhhoc.org và trang facebook fanpage với gần 1.000 thành viên đăng ký theo dõi, trên đó phổ biến những kiến thức cơ bản của Tin sinh học, cập nhật kết quả nghiên cứu trong nước và thế giới cũng như luôn đón nhận các sinh viên chuyên ngành Tin học và Sinh học quan tâm tới thực tập, làm việc tại LoBi. Theo TS Nguyễn Cường, “các hướng nghiên cứu của các nhóm trong nước hiện nay còn khá xa nhau và cũng thiếu thông tin về đề tài nghiên cứu của nhau. Trong khi Việt Nam chưa có một trung tâm dữ liệu lớn như của quốc tế để các nhóm có thể chia sẻ thông tin, kết quả nghiên cứu thì tôi hy vọng trang web sẽ trở thành cầu nối các nhóm, đồng thời thu hút các bạn trẻ quan tâm đến lĩnh vực này”. Hiện tại, LoBi có mối quan hệ hợp tác mật thiết với một số nhà khoa học tại Trường Cao đẳng thủy sản, Viện Huyết học truyền máu TƯ, Viện Di truyền nông nghiệp, ĐH Sư phạm Hà Nội để mở rộng hơn nữa khả năng nghiên cứu, ứng dụng của các đề tài.
Tương tự, PGS Vinh cũng bắt đầu đi tìm những nhóm nghiên cứu khác để tiến tới ứng dụng kết quả nghiên cứu của mình trong các dịch vụ y tế hoặc điều trị bệnh. Anh lạc quan cho rằng: “Hiện nay nhiều cơ sở y tế, trung tâm nghiên cứu lớn đã lên kế hoạch đặt mua các loại máy NGS. Khi sử dụng, NGS sẽ đưa ra hệ thống dữ liệu lớn đòi hỏi sự phân tích của khoa học tính toán. Trước vấn đề sát sườn như vậy, họ sẽ cần đến chúng tôi”. Sau công bố về hệ gene ba cá thể thuộc một gia đình người Việt vào đầu năm 2015, PGS Vinh đã nhận được một số liên hệ hợp tác từ một số nhà nghiên cứu trong nước.
Vào cuối năm 2014, Tin sinh học Việt Nam đón nhận tin vui: Tin sinh học được bổ sung vào danh mục 58 công nghệ cao được nhà nước ưu tiên phát triển. “Về lâu dài, điều đó sẽ góp phần thúc đẩy Tin sinh học Việt Nam phát triển, còn trước mắt theo tôi, Bộ KH&CN cần tăng thêm nhiệm vụ nghiên cứu và tạo điều kiện mời các chuyên gia quốc tế và người Việt Nam ở nước ngoài tham gia giải quyết các nhiệm vụ lớn cùng các đồng nghiệp Việt Nam”, GS Hải kiến nghị.
Theo Tia Sáng