Lưu ý do đây là AOP (advance online publication) nên kô có bản PDf, anh chị nào cần đọc xin vào "Nature review genetics"
Nature Reviews Genetics AOP, published online 10 June 2005; doi:10.1038/nrg1650
BIOINFORMATICS
From genotype to phenotype: a shortcut through the library
Việc có một danh sách các gene, chắc chắn là sẽ không thể cung cấp cho nhà nghiên cứu về chức năng của chúng. Để có thể hiểu rõ tuờng tường tận từng chức năng của gene, cần phải có những nghiên cứu tiêu tốn khá nhiều thời gian – đó là một trong những hướng nghiên cứu thu hút nhiều sự quan tâm hiện nay- nghiên cứu so sánh bộ gene (comparative genomics). Một phương pháp mới vừa được đưa ra nhằm chỉ định quan hệ giữa kiểu gene và kiểu hình, theo đó tác giả tạo ra những con đường “đi tắt đón đầu” bằng cách kết hợp so sánh genome và khai thác dữ liệu có sẵn trong thư viện để chỉ định chức năng.
Peer Bork và cộng sự (xem bài báo gốc) lý luận rằng nếu chúng ta có một nhóm các lòai có cùng những đặc tính hình thái thì những gene trực giao được chia sẽ giữa các lòai này sẽ rất có thể liên quan đến những quá trình sinh học chung nào đó. Quan hệ giữa kiểu hình – kiểu gene như thế này đã được thiết lập trong quá khứ, nhưng việc sưu tập các dữ liệu hình thái cho từng lòai vốn chỉ được thực hiện nhằm vào một mục tiêu duy nhất là nghiên cứu hình thái lòai sinh vật.
Trong báo cáo mới này, các tác giả khéo léo liên kết hai khối dữ liệu của cùng một nhóm lòai đó là dữ liệu genome xuất hiện gần đây và dữ liệu hình thái xuất bản từ rất lâu trước đó. Cụ thể là tác giả chọn ra 92 lòai Prokaryotes có trình tự genome đã giải hoàn chỉnh và 172.967 bào báo (dạng tóm lượt và cả tòan văn) liên quan đến 92 lòai này được Thư viện Y học Quốc gia Hoa Kỳ (the US National Library of Medicine) sưu tập và biên sọan. Từ đó, họ tạo ra khối liên kết (tạm gọi là một NOUNS-danh từ) mà trong đó các yếu tố thành phần (ký tự tạo nên NOUNS này) phải tương thích với nhau chặt chẽ với nhau, nghĩa là một ký tự xuất hiện với tuần xuất cao ở một nhóm lòai nào đó chắc chắn phải mang tính đặc hiệu cho đặc tính của chủng này. Bằng cách sử dụng STRING (search tool for the retrieval of interacting genes/proteins- công cụ dò tìm các protein/gene tương tác), kết quả của họ cho thấy, với cùng một nhóm lòai lân cận, họ chỉ ra được 11.026 gene trực giao và một lọat các gene chung giữa nhóm lòai này.
Bước cuối cùng là các tác giả tìm cách hiệu chỉnh quan hệ giữa các nhóm NOUNS theo hình thái với các nhóm NOUNS theo các gene chung. Theo đó, Bork và cộng sự chỉ ra được 2700 dấu hiệu đặc trưng gắn kết giữa hai nhóm này. Trong số những dấu hiện gắn kết này, nhiều gắn kết kiểu gene- kiểu hình đã thực sự biết rõ từ trước, ví dụ như nhóm gene trao đổi chất có quan hệ mật thiết với độc tính trong thực thẩm, cho thấy tính giá trị của phương pháp mà Bork và cộng sự thực hiện.
Ngòai ra nhóm còn tạo ra nhiều liên kết giữa gene và các kiểu hình liên quan đến bệnh tật, điều này rất có ý nghĩa trong việc tìm kiếm nguồn thuốc mới. Hơn nữa nó còn cho thấy là yếu tố gây bệnh luôn tìm ẩn trong các chủng lòai prokaryotes đã được giải trình tự đầy đủ. Nhưng chỉ khi nhiều và nhiều prokaryotes được giải trình cũng như nhiều dữ liệu sinh học khác được công bố thì hy vọng phương pháp mới của Bork và cộng sự mới thực sự trở thành một công cụ hữu hiệu giúp thiết lập quan hệ giữa gene và các quá trình sinh học.
Bài báo gốc
Korbel, J. O. et al. Systematic association of genes to phenotypes by genome and literature mining. PLoS Biol. 3, e134 (2005)
Nature Reviews Genetics AOP, published online 10 June 2005; doi:10.1038/nrg1650
BIOINFORMATICS
From genotype to phenotype: a shortcut through the library
Việc có một danh sách các gene, chắc chắn là sẽ không thể cung cấp cho nhà nghiên cứu về chức năng của chúng. Để có thể hiểu rõ tuờng tường tận từng chức năng của gene, cần phải có những nghiên cứu tiêu tốn khá nhiều thời gian – đó là một trong những hướng nghiên cứu thu hút nhiều sự quan tâm hiện nay- nghiên cứu so sánh bộ gene (comparative genomics). Một phương pháp mới vừa được đưa ra nhằm chỉ định quan hệ giữa kiểu gene và kiểu hình, theo đó tác giả tạo ra những con đường “đi tắt đón đầu” bằng cách kết hợp so sánh genome và khai thác dữ liệu có sẵn trong thư viện để chỉ định chức năng.
Peer Bork và cộng sự (xem bài báo gốc) lý luận rằng nếu chúng ta có một nhóm các lòai có cùng những đặc tính hình thái thì những gene trực giao được chia sẽ giữa các lòai này sẽ rất có thể liên quan đến những quá trình sinh học chung nào đó. Quan hệ giữa kiểu hình – kiểu gene như thế này đã được thiết lập trong quá khứ, nhưng việc sưu tập các dữ liệu hình thái cho từng lòai vốn chỉ được thực hiện nhằm vào một mục tiêu duy nhất là nghiên cứu hình thái lòai sinh vật.
Trong báo cáo mới này, các tác giả khéo léo liên kết hai khối dữ liệu của cùng một nhóm lòai đó là dữ liệu genome xuất hiện gần đây và dữ liệu hình thái xuất bản từ rất lâu trước đó. Cụ thể là tác giả chọn ra 92 lòai Prokaryotes có trình tự genome đã giải hoàn chỉnh và 172.967 bào báo (dạng tóm lượt và cả tòan văn) liên quan đến 92 lòai này được Thư viện Y học Quốc gia Hoa Kỳ (the US National Library of Medicine) sưu tập và biên sọan. Từ đó, họ tạo ra khối liên kết (tạm gọi là một NOUNS-danh từ) mà trong đó các yếu tố thành phần (ký tự tạo nên NOUNS này) phải tương thích với nhau chặt chẽ với nhau, nghĩa là một ký tự xuất hiện với tuần xuất cao ở một nhóm lòai nào đó chắc chắn phải mang tính đặc hiệu cho đặc tính của chủng này. Bằng cách sử dụng STRING (search tool for the retrieval of interacting genes/proteins- công cụ dò tìm các protein/gene tương tác), kết quả của họ cho thấy, với cùng một nhóm lòai lân cận, họ chỉ ra được 11.026 gene trực giao và một lọat các gene chung giữa nhóm lòai này.
Bước cuối cùng là các tác giả tìm cách hiệu chỉnh quan hệ giữa các nhóm NOUNS theo hình thái với các nhóm NOUNS theo các gene chung. Theo đó, Bork và cộng sự chỉ ra được 2700 dấu hiệu đặc trưng gắn kết giữa hai nhóm này. Trong số những dấu hiện gắn kết này, nhiều gắn kết kiểu gene- kiểu hình đã thực sự biết rõ từ trước, ví dụ như nhóm gene trao đổi chất có quan hệ mật thiết với độc tính trong thực thẩm, cho thấy tính giá trị của phương pháp mà Bork và cộng sự thực hiện.
Ngòai ra nhóm còn tạo ra nhiều liên kết giữa gene và các kiểu hình liên quan đến bệnh tật, điều này rất có ý nghĩa trong việc tìm kiếm nguồn thuốc mới. Hơn nữa nó còn cho thấy là yếu tố gây bệnh luôn tìm ẩn trong các chủng lòai prokaryotes đã được giải trình tự đầy đủ. Nhưng chỉ khi nhiều và nhiều prokaryotes được giải trình cũng như nhiều dữ liệu sinh học khác được công bố thì hy vọng phương pháp mới của Bork và cộng sự mới thực sự trở thành một công cụ hữu hiệu giúp thiết lập quan hệ giữa gene và các quá trình sinh học.
Bài báo gốc
Korbel, J. O. et al. Systematic association of genes to phenotypes by genome and literature mining. PLoS Biol. 3, e134 (2005)