Việt Nam và phát triển tin sinh học

Ngô Vũ

Senior Member
Bioinformatics hay tin sinh học là một ngành khoa học quản lý và phân tích các dữ kiện sinh học trên máy tính. Khác biệt với cản trở tài chính làm cho việc thiết lập một phòng thí nghiệm sinh học hiện đại trở nên quá tốn kém, nhiều người cho rằng việc xây dựng một cơ sở hạ tầng phục vụ cho tin sinh học là một điều mà Việt Nam hoàn toàn có thể thực hiện được. Bài viết này nhằm khuyến khích đọc giả thảo luận sâu thêm vào tính khả thi của nhận định trên.

Tin sinh học đầu tiên hổ trợ quá trình phân tích trình tự DNA và đã nhanh chóng phát triển đến mức độ có thể dùng trong việc phỏng đoán xây dựng các mô hình cấu trúc phân tử, các cơ chế tương tác điều hòa phân tử, và mối liên hệ giữa các phân tử trong tiến hóa cũng như trong sức khỏe con người. Việc ứng dụng rộng rãi và thành công của tin sinh học trong nhiều lĩnh vực sinh học đã chứng tỏ thế mạnh của nó trong việc thúc đẩy phát triển nền sinh học của một quốc gia. Thử lấy một thí dụ về ích lợi của ngành này cho quá trình nghiên cứu ứng dụng sinh học. Trong một cuộc thí nghiệm bạn khám phá ra một hiện tượng là khi so sánh hai dòng tế bào, một dòng luôn luôn nhạy cảm với một hóa chất bạn mới tách chiết được. Bạn đi thêm nhiều bước nữa và tìm ra sự khác nhau này có thể gây ra bởi một gene. Bạn đi giải trình tự gene này. Sau đó so sánh trình tự này dùng chương trình BLAST trên ngân hàng gene ở NCBI để xác định tên tuổi và họ hàng bà con của nó. Sau khi biết tên gene này bạn gõ máy để tìm hiểu chức năng của nó cũng ở trên NCBI. Kết quả sẽ cho bạn biết vị trí của gene này nằm ở đâu ở trên nhiểm sắc thể và cơ chế hoạt động tương tác của nó trong tế bào. Bạn cũng có thể tìm hiểu cấu trúc ba chiều của sản phẩm protein của gene này nếu bạn muốn tìm hiểu cơ chế tác dụng với hóa chất của bạn. Bạn cũng có thể lên bản đồ nhiểm sắc thể để tìm ra những đo lường khác như SNP hay những đột biến thường gặp trong dân số nếu bạn nghiên về dich tể học.

Qua thí dụ trên, một điều thiết yếu cần có trong tin sinh học là những ngân hàng dữ kiện cộng đồng cho phép mọi người dể dàng truy cập thông tin. Thứ hai nữa là cần có những phần mềm tin học làm công cụ để phân tích những dữ kiện trong những ngân hàng sinh học này. Một điều may mắn là những công cụ này thường được cung cấp miễn phí trên những trang web xuất xứ từ Bắc Mỹ và Âu Châu. Khi một nhà sinh học được trang bị một máy tính và có được một đường dây truy cập internet có tốc độ nhanh cần thiết thì dù cho ở vị trí địa lý nào, nhà sinh học này vẫn ngang hàng với các đồng nghiệp Bắc Mỹ và Âu Châu trong việc truy cập nguồn dữ kiện khổng lồ này. Nếu có được những cơ sở hạ tầng cơ bản không tốn kém này, nhà sinh học Việt Nam sẽ có triển vọng đuổi kịp những công trình nghiên cứu rất đương thời trên thế giới và sẽ có hứa hẹn phát triển ngành khoa học mới mẽ này lớn mạnh hơn trong tương lai.

Dù có được những lợi thế không nhỏ về những nguồn thông tin to lớn, hữu ích, và miễn phí như trên, việc sữ dụng những dữ kiện công cộng này rỏ ràng là vẫn chưa đủ để phát triển một ngành tin sinh học mạnh cho Việt Nam. Do tính cạnh tranh rất cao trong quá trình nghiên cứu khoa học trên toàn cầu, hầu hết những dữ kiện miễn phí này đã được khai thác triệt những kết quả có tính ứng dụng và thương mại hóa cao. Những gì còn sót lại trong mớ dữ kiện khổng lồ này, nếu có, sẽ là những vấn đề rất nan giải và sẽ là thữ thách cho những nhà sinh học với cặp mắt tinh tường nhất để khám phá và khai thác. Do đó, việc tạo ra những ngân hàng dữ kiện địa phương tập trung vào một vấn đề sinh học cấp bách của địa phương đó sẽ tạo một thuận lợi rất lớn cho việc áp dụng phương pháp nghiên cứu dùng tin sinh học.

Để có được những ngân hàng dữ kiện đặc hiệu cho hoàn cảnh Việt Nam, cần có một môi trường nghiên cứu phát triển thuận lợi nhằm tạo ra nhu cầu cho tin sinh học. Những môi trường này có thể kể đến những công nghệ sinh học sẳn có trong nước về nhiều lĩnh vực khác nhau như nông nghiệp, chăn nuôi, hải sản, phòng chống bệnh văcxin, kit chẩn đoán và y dược phẩm. Các hệ thống đa dạng sinh học mà Việt Nam thừa hưỡng cũng như hệ thống sinh vật biển phong phú là những chủ đề hấp dẫn đáng được khai thác qua phương pháp công nghệ sinh học. Tin sinh học cần những nhu cầu đòi hỏi từ những phát triển này để có thể xúc tác sự phát triển của riêng nó.

Việc đào tạo một đội ngũ chuyên gia về tin sinh học đương nhiên là điều quyết định cho sự thành công của sự phát triển tin sinh học. Đội ngũ này không những phải có trình độ tư duy toán học xuất sắc nhưng còn phải thông hiểu những vấn để hiện nay của sinh học. Việc đào tạo kỹ năng nghiên cứu độc lập và khả năng cộng tác với các đồng nghiệp trên thế giới của các chuyên gia này sẽ là điều kiện thiết yếu trong quá trình phát triển của ngành tin sinh học Việt Nam.

Trên đây chỉ là những nhận xét chung của tác giả bài này. Những thảo luận về chi tiết và những vấn đề cụ thể trong lĩnh vực này luôn được tác giả hoan nghên và vui lòng lắng nghe.
 
Tôi từng nghe nhiều vị khoa học gia thuộc hàng lão làng của VN (kể cả lãnh đạo) phán cho 1 câu rằng:

- ối, làm máy tính thì có gì khó, cho "nó" 20 triệu mua cái máy thiệt tốt là xong. Còn phần mềm hả, ra cửa hàng, 10 ngàn 1 dĩa thiếu gì.

Bái phục.

Và hiện nay 1 phần nhỏ thế hệ SV VN cũng đang suy nghĩ như vậy. Tự cho mình có tư chất thông minh, biết máy tính, giỏi anh văn và có thêm chút nhiệt tình say mê, thế là đâm đầu vào bioinformatics. Sau thời gian làm việc thì tay nghề ... chơi game nâng cao thấy rõ.
 
Đối với SV thì ta không nên trách vì họ có đã chui vào lữa đâu. Còn những "vị" hàng lão làng khi phát biểu như vậy thì họ đã tự lòi đuôi đánh dấu trên trán rồi. Nếu bạn phải làm việc cho những "vị" này thì nên thu xếp nhảy sang viện khác càng nhanh càng tốt nếu không muốn đấu tranh. Còn nếu viện nào cũng thế thì chỉ có nước tìm đất lành chim đậu vậy.
 
Hiểu biết của tôi về BI còn rất hạn chế, nhưng thấy đây là một quan điểm "hot" nên mạo muội có đôi lời.

Trước hết tôi hiểu môn khoa học BI theo hai ý nghĩa:
- Sử dụng: Dành cho đại bộ phận nghiên cứu viên trên toàn thế giới. Tất cả những người đã làm Sinh học phân tử đều phải biết cách tìm kiếm, khai thác thông tin và sử dụng các công cụ online cũng như offline để thiết kế quy trình thí nghiệm. Tất cả những công việc này, đối với những người đã quen với máy tính cũng còn cần phải có thời gian + kinh nghiệm làm việc mới mong có thể thành thạo mà không cần một khóa đào tạo. Còn đối với một số đông không am hiểu máy tính cho lắm thì quả thực không dễ dàng gì.
- Tạo ra cái cho người khác sử dụng: Chính là đội ngũ Lập trình viên. Không đơn thuần là người được đào tạo về lập trình mà họ còn phải hiểu, hiểu một cách sâu sắc nữa là khác, các quy trình, cơ chế ... của các đối tượng Sinh học phân tử.
Phân chia như thế nhưng nếu đặt chung trong sự phát triển BI của một quốc gia thì hai khía cạnh này là không thể tách rời.

Ở giai đoạn hiện nay, Việt Nam nên phát triển theo hướng Hỗ trợ mục đích sử dụng trước. Lý do:
- Việc sử dụng được các tài nguyên BI là tối thiểu của một nhà nghiên cứu. Điều này lẽ ra cần được tiến hành trong các trừơng đại học, nhưng vì lý do nào đó mà cách đây 2 năm môn học Ứng dụng tin học trong sinh học mà tôi được học ở ĐH KHTN HN chỉ là các ứng dụng Exel.
- Như tuchau đã nói:
cần có một môi trường nghiên cứu phát triển thuận lợi nhằm tạo ra nhu cầu cho tin sinh học
Chừng nào chưa có nhu cầu thì chừng đó BI chưa thể phát triển được.

Về việc phát triển đội ngũ những người làm Tin sinh (lập trình) theo tôi nên tách biệt rõ ràng hai đối tượng:
- Thứ nhất: Những nhà lập trình chuyên nghiệp. Họ có thể được đào tạo phần nào về Sinh học nhưng kiến thức Sinh học chỉ là thứ yếu.
- Thứ hai: Những nhà Sinh học (phân tử) có tầm cỡ là người xây dựng nên các nhu cầu Tin sinh và truyền đạt nhu cầu đó cho các nhà Lập trình thực hiện.
Hai đối tượng này cùng hoạt động.

Việc đưa các nhà Sinh học đi đào tạo lập trình để làm công việc viết lên các phần mềm Tin sinh cỡ như Vector NTI hay PCGENE ... và còn rất nhiều những công cụ phức tạp khác mà bây giờ chúng ta còn chưa hình dung ra là một điều không nên làm.
 
Hiện giờ theo Bi có 2 hướng :
1. Lập trình ra có phần mềm ứng dụng, tạo ra các database. Hướng này cần có sự kết hợp giữa CNTT và sinh học. ==> Dành cho những chuyên gia.
2. Ứng dụng các chương trình và database sẳn có để áp dụng cho hướng nghiên cứu của mình. ==> Hướng mà mà BI ở VN có thể làm.

Còn dontcry, nói
Ứng dụng tin học trong sinh học mà tôi được học ở ĐH KHTN HN chỉ là các ứng dụng Exel.
. Đó là do trình độ các giảng viên đó quá tệ.

Thực ra BI phải kết hợp các ngành khác của Sinh học và Hóa học thì mới tồn tại được.
BI thực hiện các tính tóan mô phỏng trên máy tính như modelling cá phân tử, tính tóan các tính chất ... của phân tử, đại phân tử. Và kết hợp với thực nghiệm để giải thích vấn đề cũng như dự đóan nó..

Mình có vài dòng như thế.
 
Theo tôi Việt Nam đang rất khó phát triển bioinformatics vì nghiên cứu về genomics và proteomics ở Việt Nam đơn thuần chỉ là làm theo nước ngoài.
Lĩnh vực bioinformatics không giống như các lĩnh vực sinh học khác đòi hỏi rất nhiều kiến thức hoá, lý và đặc biệt là toán và tin, kiến thức về sinh học không nhiều lắm.
Tôi đã xem nhiều bài báo và bài giảng về microarray nhưng nói chung đang như đi trong rừng già vậy.
một trong những thách thức chính của Tin Sinh trong thế kỷ này là tìm ra thuật toán để dự đoán cấu trúc không gian của protein từ chuỗi bậc một-nếu làm theo phương pháp đệ quy thì người ta tính phải mất 50000xđời người mới đưa ra hết các cấu trúc có thể.
một thách thức khác là làm sao để kết quả đọc microarray chính xác hơn
Tôi cũng đồng ý là nên phát triển Tin Sinh học ở Việt nam theo hướng nắm được những gì người ta đang làm(1) và có thể sử dụng database và một số phần mềm Tin sinh cho nghiên cứu của mình (2) (ví dụ NTSYS-pc). Không nên đặt mục tiêu quá cao vì cơ sở của mình chưa có gì. Thiếu thốn nhất là đội ngũ-mà giải quyết phải từ cấp 3 và đại học, không thể gửi thấy giáo đi học nước ngoài vì đó chỉ mới giải quyết vấn đề (1)
 
Theo tôi Việt Nam đang rất khó phát triển bioinformatics vì nghiên cứu về genomics và proteomics ở Việt Nam đơn thuần chỉ là làm theo nước ngoài.
Lĩnh vực bioinformatics không giống như các lĩnh vực sinh học khác đòi hỏi rất nhiều kiến thức hoá, lý và đặc biệt là toán và tin, kiến thức về sinh học không nhiều lắm.
Tôi đã xem nhiều bài báo và bài giảng về microarray nhưng nói chung đang như đi trong rừng già vậy.
một trong những thách thức chính của Tin Sinh trong thế kỷ này là tìm ra thuật toán để dự đoán cấu trúc không gian của protein từ chuỗi bậc một-nếu làm theo phương pháp đệ quy thì người ta tính phải mất 50000xđời người mới đưa ra hết các cấu trúc có thể.
một thách thức khác là làm sao để kết quả đọc microarray chính xác hơn
Tôi cũng đồng ý là nên phát triển Tin Sinh học ở Việt nam theo hướng nắm được những gì người ta đang làm(1) và có thể sử dụng database và một số phần mềm Tin sinh cho nghiên cứu của mình (2) (ví dụ NTSYS-pc). Không nên đặt mục tiêu quá cao vì cơ sở của mình chưa có gì. Thiếu thốn nhất là đội ngũ-mà giải quyết phải từ cấp 3 và đại học, không thể gửi thấy giáo đi học nước ngoài vì đó chỉ mới giải quyết vấn đề (1)

Em mới bắt đầu 2 tháng cho cuộc chinh phục 3-4 năm về BI. Đọc bài này có vẻ đầu óc tự tin hơn. Vì trước đến giờ vẫn chưa thấy cái đích của mình.
 

Facebook

Thống kê diễn đàn

Threads
11,649
Messages
71,550
Members
56,918
Latest member
sv368net
Back
Top