Mỗi tuần một chủ đề thảo luận của lonxon

Trần Hoàng Dũng

Administrator
Staff member
Xin đọc kỹ để sửa lỗi chính tả.Do bài này hơi dài mà tuần này tôi lại hơi bận nên xin phép bài sẽ cắt làm 2-3 phần. Dưới đây là phần đầu


Như đã giới thiệu trước, tuần này tôi sẽ báo cáo một đề tài nho nhỏ. Cũng như đã giới thiệu trước thì do chuyên ngành của tôi là Functional Genomics, nên vấn đề chúng ta thảo luận sẽ cố gắng xoay quanh hướng này. Trong hai bài trước, tôi đã có trình bay một cách vắn tắt một số khái niệm cơ bản của quá trình tạo cây tiến hóa dựa trên trình tự DNA cũng như dựa trên tòan bộ trình tự genome. Trong tuần qua, trong quá trình tìm kiếm một bài báo nào đó làm minh họa cho lý thuyết tôi đã giới thiệu tình cờ phát hiện bài đăng trên tờ Comapartive and Functional Genomics, qua coi sơ abstract, thấy nó đáp ứng đủ nhu cầu đặt ra, tôi đã nhờ anh tuchau load dùm bài báo (vì tự nhiên máy tính tôi không vào được trang wiley). Tôi tin là mọi người đã đọc sơ qua và chắc đang than rằng: Không hiểu gì hết. Để hiểu bày này, chúng ta sẽ quay lại bài „Giới thiệu Phylogeny“ trong đó tôi đã chỉ ra 9 bước cơ bản của một nghiên cứu phát sinh chủng lòai điển hình. Sau đây chúng ta tự hỏi và tự dò tìm câu trả lời trong bài báo này.


01- Mục tiêu của bài báo, mẫu vật nghiên cứu

Phần này chúng ta dễ dàng nhận thấy ngay trên tựa đề và trong phần Introduction. Nói một cách ngắn gọn thì nhóm alphavirus là đối tượng nghiên cứu của bài báo báo này. Mục đích của tác giả xây dựng cây tiến hóa của nhóm virus này dựa trên tòan bộ genome và kết quả sẽ dùng để so sánh với những trước quả nghiên cứu trước đó.

Ở đây chúng ta sẽ nhận thấy có một đểm vừa mập mờ nhưng cũng là điểm „láu cá“ của các tác giả. Nhóm tác giả sử dụng tòan bộ genome của virus, nghe qua thì thấy rất là to lớn vĩ đại, nhưng sự thật virus chỉ có vài gene. Do vậy, nếu xếp bài báo này vào nhóm những nghiên cứu phát sinh chủng lòai sử dụng nhiều gene thì có thể không sai. Tuy nhiên do việc nghiên cứu phát sinh chủng lòai bằng cách sử dụng tòan bộ genome chỉ mới bắt đầu được nghiên cứu nên nhiều điểm lý thuyết lẫn phương pháp thực nghiệm máy tính còn chưa rõ ràng, nên bài báo này đã có một thành công nhất định là biết chọn đối tượng có genome nhỏ nhất (nhỏ hơn cả ty thể).


02- Chọn gene để phân tích

Như đã trình bày, nhóm tác giả sử dụng tòan bộ genome của virus nhưng thực tế virus chỉ có vài gene nên có thể coi tác giả sử dụng nhiều gene cho việc phân tích của mình (các bạn thử đọc bào báo xem coi virus có mấy gene??).

Trong việc thu thập nguồn dữ liệu (tức genome database) chúng ta lưu ý là tác giả phải chỉ định rõ nguồn ngânn hàng cung cấp dữ liệu này, kèm với số Accession Number, con số này có ý nghĩa rất quan trọng.

Một điều mà chúng ta cần lưu ý là: các tác giả có đọc trình tự của một chủng lòai virus nào hay không, hay chỉ lấy từ gene bank? Câu hỏi này có ý nghĩa rất lớn để quyết định một bài báo nghiên cứu phát sinh chủng lòai được credit cao hay thấp, được những tạp chí có chỉ số Impact Factor cao chấp nhận hay không chấp nhận. Những tạp chí có chỉ số IF cao, hay những tạp chí chuyên sâu về Sinh học tiến hóa phân tử sẽ chỉ chấp nhận đăng bài nếu tác giả đích thân đọc trình tự ít nhất 50% số trình tự phân tích Trong bài này tác giả chẳng đọc trình tự một chủng lòai virus nào cả mà chỉ lấy từ gene bank. Điều này có thể có 2 lý do:
- chính sách của tờ Comaparative and Functional Genomics cho phép điều này;
- do tác giả phân tích trên „genome“ mà tòan bộ genome thì không phải lòai nào cũng được đọc, nhất là với virus, không dễ đọc. Nói cách khác, do lợi dụng khái niệm „whole-genome“ mà tác giả lách qua được chuyện không cần phải đọc thêm trình tự lòai mới.

Đến đây tôi chợt nghĩ ở VN chúng ta có thể láu cá như thế này cho việc phát triển ngành Molecular Phylogeny.

Cũng do tác giả sử dụng genome có sẵn nên việc đọc trình tự, hiệu chỉnh trình tự được bỏ qua. Phần này, nếu có sẽ được viết trong phần Materials and Methods, trong đó tác giả sẽ phải cung cấp chi tiết các cặp mồi được sử dụng cũng như các phương pháp tiến hành đọc trình tự.

3- Sắp xếp thẳng hàng các trình tự và chọn mô hình tiến hóa

Phần này thường được đề cập trong Materials and Methods. Cụ thể phần mềm Clustal X được sử dụng sử dụng cho cả sắp xếp trình tự và tạo cây tiến hóa. Tác giả sử dụng phương pháp khỏang cách (distance/neighbour-joining) cho phân tích của mình.

Câu hỏi đặt ra: tại sao tác giả chỉ sử dụng mỗi phương pháp khỏang cách để tính tóan giá trị bootstrap value? Hơn nữa trên hình ghi chú thì giá trị này kô tính theo tỷ lệ % mà để nguyên?
4- Phân tích sự phát sinh chủng lòai
 
vietbio said:
tuần vừa rồi tôi đi vắng nên ko chuẩn bị kịp topic cho tuần tới (theo lịch). Tôi nghĩ chúng ta có thể tiếp tục theo luận với course về phylogeny của anh lonxon đến khi anh "hết đạn" thì mới nên chuyển sang topic mới.

Tôi thấy vấn đề của xây dựng cây phân loài là chủ đề sẽ được nhiều ng đang làm SH ở VN quan tâm. Chắc là do sự cố DB nên chưa có nhiều thảo luận. Tôi hy vọng là sẽ học hỏi được nhiều từ anh lonxon. Tôi thấy có vẻ như anh quên mất động tác citation hay sao ấy.

to dontcry: em đưa bài của anh lonxon ra portal vào chỗ của bài anh tuchau cũ. Như thế mọi ng sẽ chú ý hơn.



Kô phải tui quên việc ghi chú tham khảo mà là do 2 lý do (1) có bài tui viết chưa xong nên chưa post hình, và đưa tài liệu chính cho mọi người đọc (2) bài phấn tích 9 bước là tài liệu cá nhân do boss tui giảng, tui viết lại nên làm gì có reference mà ghi.


To dontcry, bạn vui lòng kiểm tra lỗi chính tả.

Quá trình phân tích bài này sẽ diễn ra song song đồng thời 2 vế: (01) mọi người đặt câu hỏi, tui biết tui sẽ trả lời (2) tui tiếp tục tự phân tích theo 9 bước mà ở phần trên tui viết dở dang.


Vậy là dontcry có thể đưa cái abstract ra trang đầu để mọi người chú ý, sau đó đễ cái link cho mọi người vào forum, trong này tui sẽ post lần lượt bài phân tích của mình đồng thời mọi người thảo luận.
 
Dưới đây là mấy câu hỏi của tui:

1. Nhóm tác giả đã chọn dùng cDNA cho các gene cấu trúc và không cấu trúc, trình tự amino acid, và toàn bộ genome để lập cây phát sinh loài, vậy theo lonxon đây là pp thích hợp nhất hay chỉ cần dùng một trong ba loại dữ kiện trên cũng đủ để có được kết quả tương tự?

2. Alphavirus là một RNA virus, loại virus được phổ biến chấp nhận là có tính đột biến rất cao trong quá trình phân chia của chúng trong tế bào chủ. Vì tính đột biến cao này, người ta thường gọi một chủng virus, ngay cả ở trong một vị trí địa lý nhất định, là một quần thể của nhiều loại virus có ít nhiều điểm giống nhau nhưng không thực sự giống nhau 100% - hay còn gọi là "quasi-species". Để đối phó với hiện tượng "quasi-species" này, làm thế nào nhóm tác giả tin tưởng được các dữ kiện trình tự từ các ngân hàng gene mà họ đã dùng cho công trình của mình? Hay hỏi một cách khác, liệu sự khác biệt trong trình tự của các chủng virus được dùng trong bài báo chỉ là sự khác biệt do quá trình đột biến từ hiện tượng "quasi-species", mà không có liên quan gì đến sự tiến hóa của virus qua thời gian và khoảng cách địa lý?

3. Cây phát sinh loài mà các tác giả đã xây dựng đã cho thấy các loài alphavirus ngày nay từ các vị trí địa lý khác nhau có thể có chung tổ tiên và có thể giải thích mối liên hệ này qua sự di cư của con người cũng như của động vật liên quan. Câu hỏi là các cây phát sinh loài có thể giải thích được các áp lực chọn lọc lên sự tiến hóa của trình tự RNA của virus, chẳng hạn môi trường, sự thay đổi của động vật chủ và các vec-tơ mà virus sống cộng sinh? (Câu hỏi này không trực tiếp vào bài báo, chỉ là câu hỏi chung cho pp cây phát sinh loại và ứng dụng của nó trong thực tế, thí dụ cho dịch tể học)

4. Các áp lực chọn lọc (selective pressure) lên alphavirus là gì? Ý nghĩ sinh học của việc xây dựng cây phát sinh loài cho alphavirus trong sự tiến hóa của virus dưới các áp lực này?
 
câu 1: như đã nói trước, nhóm tác giả đã "lập lờ đánh lận con đen" khi dùng khái niệm phân tích sự phát sinh chủng lòai dựa trên tòan bộ genome, vì bộ gene của virus quá nhỏ và chỉ có vài gene, nên nếu bảo là bài báo này sử dụng nhiều gene để phân tích cũng kô sai mà nói dùng genome để phân tích cũng đúng, tuy nhiên nếu chiếu theo "luật lệ" nhà genome mà nói thì trong phân tích genome người ta phải phân tích trật tự gene, thành phần gene, những dấu hiệu hiếm thấy trong genome ...

Do đó đúng ra bài này chỉ nên gọi là multigene mà thôi, chưa đủ sức gọi là whole-genome.

Câu 2: Như cũng đã nói ở trên, nhiều tạp chí buộc tác giả phải đích thân đọc sequence ít nhất 50% gene phân tích. Trong bài này nhóm tác chỉ đi lượm gene về làm, khiến cho nhiều người thắc mắc. Do đó nếu em là reviewer em cũng sẽ có những câu hỏi tương tự như câu 2 của anh tuchau.

câu 3-4 sẽ trả lời sau khi em xong cái hội ở viện ngày thứ tư này.
 
1. Nhóm tác giả đã chọn dùng cDNA cho các gene cấu trúc và không cấu trúc, trình tự amino acid, và toàn bộ genome để lập cây phát sinh loài, vậy theo lonxon đây là pp thích hợp nhất hay chỉ cần dùng một trong ba loại dữ kiện trên cũng đủ để có được kết quả tương tự?

lonxon said:
câu 1: như đã nói trước, nhóm tác giả đã "lập lờ đánh lận con đen" khi dùng khái niệm phân tích sự phát sinh chủng lòai dựa trên tòan bộ genome, vì bộ gene của virus quá nhỏ và chỉ có vài gene, nên nếu bảo là bài báo này sử dụng nhiều gene để phân tích cũng kô sai mà nói dùng genome để phân tích cũng đúng, tuy nhiên nếu chiếu theo "luật lệ" nhà genome mà nói thì trong phân tích genome người ta phải phân tích trật tự gene, thành phần gene, những dấu hiệu hiếm thấy trong genome ...

Do đó đúng ra bài này chỉ nên gọi là multigene mà thôi, chưa đủ sức gọi là whole-genome.

Câu trả lời của anh lonxon tôi nghĩ là cần phải bổ sung. Vấn đề ở đây ko phải là genome của virus nhỏ và nhóm tác giả muốn khuyếch đại data bằng cách đưa ra nhiều cây phát sinh chủng loài.

Theo tôi, việc sử dụng trình tự gene để xây dựng cây tiến hóa thì gặp phải khó khăn là loại bỏ vai trò của CLTN. Mà cụ thể là đã đánh đồng các vị trí đột biến trên 1 gene (mặc du ai cũng biết rằng có những đột biến làm thay đổi aa, có đột biến; có những thay đổi protein tại vùng domain chức năng, có những thay đổi ko làm ảnh hưởng đến cấu trúc 3D protein, có những protein thay đổi làm ảnh hưởng đến sống còn của tế bào còn những protein chỉ làm thay đổi cấu trúc lớp vỏ protein). Tóm lại, vai trò của các vị trí nu trên genome là ko đồng nhất và đấy là lý do tại sao nên phân tích dữ liệu gene thành nhiều lớp như trên.

Ngoài ra, có một sự kết hợp tuyệt với giữa dữ liệu SHPT và phân bố địa lý để cho ra đời 1 ngành học mới là Phylogeography.
 
Ý tui trong câu 1 muốn hỏi là tại sao các dữ kiện trình tự khác nhau mà nhóm tác giả đã dùng thì tốt hơn cách dùng trước đây, tức là chỉ sử dụng trình tự của một gene. Khi dùng trình tự của nhiều gene, tác giả cũng chỉ rút ra cùng kết luận tương đương với kết quả đã có trước đây của những người khác đã làm trên 1 gene. Chỉ có thêm là pp của nhóm tác giả đã đặt đúng chổ cho thêm 2 dòng virus, cái mà có lẽ vẫn còn mập mờ vì thiếu dữ kiện trước đây. Tóm lại, không biết pp mà nhóm tác giả dùng có thực sự là một bước tiến quan trọng trong ngành vì nó chỉ bổ sung một chút ít kiến thức nhưng với một cái giá là làm rườm rà khâu phân tích một cách không cần thiết. (Cũng rất may là không phải trả một giá đắt về tài chính vì các trình tự đã được giãi mã sẳn và được tự do dùng miễn phí). Theo tôi hiểu thì nhóm tác giả có vẽ cho pp của mình có ưu thế hơn các pp trước vì họ đã dùng nhiều dữ kiện hơn. Nhưng liệu pp dùng nhiều dữ kiện khác nhau để xây dựng cây tiến hóa có chắc ưu việt hơn việc chỉ dùng một gene nhưng gene này có thể phản ánh đúng quá trình tiến hóa của loài được nghiên cứu? Tui không phản đối việc dùng nhiều dữ kiện như nhóm tác giả đã dùng vì các dữ kiện khác nhau sẽ kiểm tra chéo lẫn nhau và làm cho kết quả có tính thuyết phục mạnh hơn. Và như vậy, dùng nhiều dữ kiện khác nhau cho cùng một phân tích chỉ đóng vai trò bổ sung cho nhau chứ không phải là một pp hoàn toàn mới.

Tui có thêm một câu hỏi mới từ lập luận trên. Vậy trong nhóm gene/trình tự mà tác giả dùng, có một gene riêng rẻ nào (hay 2 gene thôi, không hơn) có thể dùng để có được cùng một kết luận mà tác giả đã có, hay cần phải dùng hết tất cả trình tự mà tác giả đã dùng? Vì nếu lúc nào cũng muốn dùng trình tự của toàn bộ genome để lập cây tiến hóa thì sẽ bế tắc nếu cần làm trên các loài bậc cao hơn với vài tỉ nu.

Theo tôi, việc sử dụng trình tự gene để xây dựng cây tiến hóa thì gặp phải khó khăn là loại bỏ vai trò của CLTN. Mà cụ thể là đã đánh đồng các vị trí đột biến trên 1 gene (mặc du ai cũng biết rằng có những đột biến làm thay đổi aa, có đột biến; có những thay đổi protein tại vùng domain chức năng, có những thay đổi ko làm ảnh hưởng đến cấu trúc 3D protein, có những protein thay đổi làm ảnh hưởng đến sống còn của tế bào còn những protein chỉ làm thay đổi cấu trúc lớp vỏ protein). Tóm lại, vai trò của các vị trí nu trên genome là ko đồng nhất và đấy là lý do tại sao nên phân tích dữ liệu gene thành nhiều lớp như trên.

Ngoài ra, có một sự kết hợp tuyệt với giữa dữ liệu SHPT và phân bố địa lý để cho ra đời 1 ngành học mới là Phylogeography.

Tui không chắc là có hiểu hết ý của vietbio không nhưng tui nghĩ khó mà hội nhập vai trò của CLTN (chọn lọc tự nhiên=natural selection?) vào pp dùng để xây dựng cây tiến hóa. Nhưng các đột biến trong trình tự gene có thể được dùng để suy luận ra vai trò của CLTN. Thí dụ như nếu người ta tìm được sự khác nhau trong trình tự của một gene trong 2 loài virus cái mà từng sống trên một động vật chủ nhưng sau đó 1 trong 2 virus này đã chuyển sang một động vật chủ mới. Việc thay đổi host này là một quá trình CLTN và sẽ ảnh hưởng đến thích nghi của virus trong cơ thể mới và điều này có thể được ghi dấu trong trình tự dna.
 
mới đi lang thang về, đến nhà là 1g30 sáng tranh thủ trả lời 1 chút:

01- đúng ra chỉ cần tòan bộ genome là đủ, nói chính xác là dùng nhiều gene để phân tích. Việc tác giả cố tình chia thành vùng mã hóa cấu trúc và kô cấu trúc là kô cần thiết. Vì xu hướng của Phylogeny là tạo các concatenated sequences để phân tích tức là người ta chọn ra nhiều gene, trên mỗi gene hoặc cả gene sẽ lấy những vùng ưu ái, rồi gắn kết chúng lại tạo thành một trình tự mới. Do vậy chính cái genome của virus chính là cái concatenated sequences.

Thậm chí trong phân tích sơ bộ, người ta sẽ phân tích cho từng gene riêng lẽ (ví dụ trong trường hợp này là cấu trúc và kô cấu trúc), nhưng sau đó tiến hành phân tích cái concatanated sequences và đem cái kết quả sau này ra biện luận.

Việc tán kết quả chỉ nên thực hiện khi các gene này nằm trên nhiều genome khác nhau, ví dụ vừa dùng gene trên nhân vừa dùng gene trên ty thể hay lục lạp, khi đó có thể có 3 kết quả: kết quả từ gene trên nhân, kết quả trên gene ty thể và kết quả từ sự kết hợp. Lúc này đi so sánh 3 kết quả mới có ý nghĩa. Trong bài báo này virus chỉ có đọan gene RNA dài chừng 14 kb và cùng nằm trên 1 sợi, nên việc tán kết quả có vẻ hơi thừa.

Em đồng ý là kết quả tán ra chỉ có ý nghĩa kiểm tra chéo lẫn nhau nên kết quả của tác giả kô có gì mới.

Ngay chính pp mà tác giả dủng để phân tích cũng gây cho em nhiều ngạc nhiên

- tại sao chỉ dùng có mỗi pp distance/neighbour-joining mà kô làm thêm Max-parsiomony? Tác giả kô biết về Max-parsimony hay có ẩn ý gì khác?? Vì người ta có thể kô dùng pp distance/neighbour-joining chứ kô thể kô dùng Max-parsimony cho việc phân tích tiến hóa.

- kô đề cập đến việc sử dụng mô hình tiến hóa nào.

- giá trị bootstrap value lại kô quy đổi ra tỷ lệ %, ????


Vế việc áp lực chọn lọc tự nhiên, tu kô hiểu ý vietbio, tui đang thắc mắc kô biết vietbio có biết qua các mô hình tiến hóa hay chưa. nếu đã biết qua các mô hình tiến hóa thì bạn sẽ kô đề cập đến chọn lọc tự nhiên ở đây. và do đó hi tui đọc cái ý ở dưới, tui càng nghi ngờ hình như bạn chưa đọc qua các mô hình tiến hóa.

"Theo tôi, việc sử dụng trình tự gene để xây dựng cây tiến hóa thì gặp phải khó khăn là loại bỏ vai trò của CLTN. Mà cụ thể là đã đánh đồng các vị trí đột biến trên 1 gene (mặc du ai cũng biết rằng có những đột biến làm thay đổi aa, có đột biến; có những thay đổi protein tại vùng domain chức năng, có những thay đổi ko làm ảnh hưởng đến cấu trúc 3D protein, có những protein thay đổi làm ảnh hưởng đến sống còn của tế bào còn những protein chỉ làm thay đổi cấu trúc lớp vỏ protein). Tóm lại, vai trò của các vị trí nu trên genome là ko đồng nhất và đấy là lý do tại sao nên phân tích dữ liệu gene thành nhiều lớp như trên. "


Nói chung là sau khi đọc thật kỹ bài này, thấy nó tệ quá, nhưng lỡ mang ra thảo luận rồi nên đành chịu vậy. Dẫu sao qua đó cũng thu được ít nhiều điều hay.
 
1. Tôi chỉ kịp nói ngắn lại ý của tôi. Nếu chỉ dùng trình tự nu để xây dựng cây sẽ ko weight được những thay đổi aa. Hiển nhiên là phải làm thêm trình tự protein tương ứng.

2. bọn này chắc đã làm MP nhưng ko biện luận nổi. Xây dựng cây phân loài cho virus hiện nay chưa có chuẩn mô hình tiến hóa nên họ chỉ đưa ra nhưng cây mà họ có thể biện luận được

3. Đối với virus tôi ưu thích dùng 1 đọan gene nhỏ và phân tích định hướng đột biến trên từng vị trí -> từng chủng và từng mẫu. Vì rõ ràng vật ký sinh bắt buộc này phụ thuộc cốt yếu vào vector và vật chủ. Do đó, giữa 2 sample trong 1 vùng địa lý có nhiều di biệt khi so sánh với việc phân loại trên đối tượng khác.

4. Phương pháp dùng toàn bộ genome của bác chỉ là dùng số lượng để che lấp các kiếm khuyết thôi. Nếu bác chỉ đơn giản là giải mã toàn bộ 1 chủng (ko nói đến chi phí và kỹ thuật) và đưa nguồn dữ liệu đấy để phân tích thì cũng chỉ ra một cây. Bác lại phải biện giải nó như là bác làm với 1 họ gene hoặc 1 họ protein thôi. Trừ phi bác làm thêm dữ liệu proteome và transcriptome nhưng mà chưa có nghiên cứu nào làm được điều này hoàn chỉnh.
 
to vietbio:

- việc dùng trình tự nu để phân tích vẫn là lựa chọn tối ưu, ngay cả khi dùng trình tự protein vẫn phải dùng trình tự nu, tức là protein kô có cũng kô sao. Trong trường hợp muốn đào sâu phân tích thì người ta sẽ tiến hành "chẻ sợi tóc ra làm tư" tức là phân tích codon usage tức là phân tích vị trí thứ 1-2 và 3 của mã codon. Phân tích này khá phức tạp, tui ngừng ở bước này, chỉ có boss tui làm.

- mô hình tiến hóa là dùng chung cho sinh giới, các mô hình này kô phân biệt virus hay động vật. Việc nhóm này kô dùng Max-parsimony hay Max-likelihood khiến tui thắc mắc vô cùng.

- tui kô là virus học nên kô đào sâu vô lĩnh vực virus.

- phylogenomics nếu dựa trên genome kô phải là dùng số lượng che khuyết điểm, bạn chịu khó đọc lại bài introduction về phylogenomics. hai tiêu chuẩn quan trọng để xét 1 phân tích dựa trên genome là phân tích trật tự gene và phân tích những điểm bất thường của genome. Bài này kô có điều này.


Dữ liệu transcriptome đã và đang được sử dụng để phân tích phylogeny, ngay chính bài này cũng dùng dữ liệu transcriptome để phân tích đấy, nhưng do bộ gene virus quá nhỏ nên transcriptome bị che lấp. Dữ liệu EST cũng là một dạng dự liệu transcriptome đã và đang dùng nhiều trong phylogeny xem bài research higlight về phát sinh chủng lòai động vật mà tui dịch khá lâu.

Proteome kô có ý nghĩa gì trong phylogeny.
 
tuchau said:
3. Cây phát sinh loài mà các tác giả đã xây dựng đã cho thấy các loài alphavirus ngày nay từ các vị trí địa lý khác nhau có thể có chung tổ tiên và có thể giải thích mối liên hệ này qua sự di cư của con người cũng như của động vật liên quan. Câu hỏi là các cây phát sinh loài có thể giải thích được các áp lực chọn lọc lên sự tiến hóa của trình tự RNA của virus, chẳng hạn môi trường, sự thay đổi của động vật chủ và các vec-tơ mà virus sống cộng sinh? (Câu hỏi này không trực tiếp vào bài báo, chỉ là câu hỏi chung cho pp cây phát sinh loại và ứng dụng của nó trong thực tế, thí dụ cho dịch tể học)



4. Các áp lực chọn lọc (selective pressure) lên alphavirus là gì? Ý nghĩ sinh học của việc xây dựng cây phát sinh loài cho alphavirus trong sự tiến hóa của virus dưới các áp lực này?

câu 3- Hòan tòan được, việc sử dụng cây phát sinh chủng lòai cùng với những phân tích sâu hơn bên trong hòan tóan có thể giúp giải thích các kiểu áp lực chọn lọc khác nhau. Ví dụ ngay như nhóm của em, bả boss phân tích khá sâu để giải thích tại sao có hiện tượng nhóm photosynthesis chuyển sang non-photosynthesis, ngòai ta kô chỉ một nhóm em làm mà khá nhiều công trình cũng dựa trên sự pscl và các phân tích khác, xin nhớ là phải có thêm các phân tích khác, để cho thấy quá trình tiến hóa đã cho ra nhiều sự đa dạng sinh học thế nào.

Nói cách khác cây tiến hóa là điều kiện cần còn những phân tích sâu hơn mới là điều kiện đủ để giải thích áp lực tiến hóa khác nhau lên sinh vật.

câu 4: em kô hiểu rõ ý anh tuchau lắm nên chưa trả lời đươc.
 
Anh cũng nghĩ như vậy. Giả sử có ai đó muốn phân tích sâu hơn thí dụ về nguồn gốc của sự đa dạng của các loài alphavirus dùng kết quả của nhóm tác giả trên thì có lẽ cũng học được nhiều điều có ích. Chẳng hạn các nhóm virus ở gần nhau hơn trên cây tiến hóa có thể vị trí địa lý của chúng cũng gần nhau hơn. Và nếu biết được động vật chủ nào và loại vector nào và sự liên hệ giữa những vật chủ này thì ta sẽ biết thêm được thế nào là động lực tiến hóa của các alphavirus này.

Còn câu 4 thì anh chỉ hỏi lang mang tổng quát về life cycle của virus. Có thể những áp lực này là những vector và động vật chủ mà virus sống ký sinh. Vì khi virus phân chia nó tạo nhiều đột biến trong genome và các đột biến này sẽ là nguồn nguyên liệu cho sự tiến hóa của virus trong cơ thể động vật chủ và vector. Mặc dù đột biến trên genôm là ngẫu nhiên nhưng chỉ có một số ít đột biến nào đó được chọn lọc để virus vừa thích nghi trên động vật chủ vừa thích nghi trên vector. Những áp lực chọn lọc khác có thể là môi trường như thuốc trừ sâu, thay đổi nguồn thức ăn của động vật chủ...

Còn một câu hỏi nữa về viêc phát hiện ra loài virus tái tổ hợp giữa hai loại virus khác. Phát hiện này cũng đồng tình với kết quả trước đây khi người ta nhận thấy một virus đã phản ứng với hai loại kháng thể trung hòa. Vậy làm sao giải thích được sự có mặt của loài virus tái tổ hợp này?
 
Thật ra em kô rành về virus nên nếu hỏi về các áp lực chọn lọc này nọ thì em cũng có thể trả lời được sau khi đọc lại 1 số tài liệu.

Tuy nhiên em phân tích bài này nhằm mục đích là chứng minh các bước cơ bản của một bài Phylogeny điển hình. Thật sự thì hơi tiếc vì bài này không hay lắm.

Câu cuối của anh tuchau cực kỳ hay. Ý anh hỏi là khả năng 2 lòai virus lai với nhau và nhờ đâu mà người ta phát hiện ra nó???nhưng do em kô rành về virus nên em đành nhờ anh thử trả lời.
 
Về câu hỏi giải thích sự xuất hiện của loài virus tái tổ hợp là hỏi về làm cách nào mà một con virus có trình tự genome từ 2 con virus khác nhau, chứ không phải là nhờ đâu người ta phát hiện ra. Người ta phát hiện ra là do so sánh trình tự hay quan sát phản ứng của chúng với 2 loại kháng thể.

Tôi tin chắc có nhiều người trên này biết câu trả lời nên sẽ đợi thêm vài ngày, nếu không tôi cũng từ từ tự mò ra.
 

Facebook

Thống kê diễn đàn

Threads
12,995
Messages
72,869
Members
45,065
Latest member
Go88aa
Back
Top