Xin đọc kỹ để sửa lỗi chính tả.Do bài này hơi dài mà tuần này tôi lại hơi bận nên xin phép bài sẽ cắt làm 2-3 phần. Dưới đây là phần đầu
Như đã giới thiệu trước, tuần này tôi sẽ báo cáo một đề tài nho nhỏ. Cũng như đã giới thiệu trước thì do chuyên ngành của tôi là Functional Genomics, nên vấn đề chúng ta thảo luận sẽ cố gắng xoay quanh hướng này. Trong hai bài trước, tôi đã có trình bay một cách vắn tắt một số khái niệm cơ bản của quá trình tạo cây tiến hóa dựa trên trình tự DNA cũng như dựa trên tòan bộ trình tự genome. Trong tuần qua, trong quá trình tìm kiếm một bài báo nào đó làm minh họa cho lý thuyết tôi đã giới thiệu tình cờ phát hiện bài đăng trên tờ Comapartive and Functional Genomics, qua coi sơ abstract, thấy nó đáp ứng đủ nhu cầu đặt ra, tôi đã nhờ anh tuchau load dùm bài báo (vì tự nhiên máy tính tôi không vào được trang wiley). Tôi tin là mọi người đã đọc sơ qua và chắc đang than rằng: Không hiểu gì hết. Để hiểu bày này, chúng ta sẽ quay lại bài „Giới thiệu Phylogeny“ trong đó tôi đã chỉ ra 9 bước cơ bản của một nghiên cứu phát sinh chủng lòai điển hình. Sau đây chúng ta tự hỏi và tự dò tìm câu trả lời trong bài báo này.
01- Mục tiêu của bài báo, mẫu vật nghiên cứu
Phần này chúng ta dễ dàng nhận thấy ngay trên tựa đề và trong phần Introduction. Nói một cách ngắn gọn thì nhóm alphavirus là đối tượng nghiên cứu của bài báo báo này. Mục đích của tác giả xây dựng cây tiến hóa của nhóm virus này dựa trên tòan bộ genome và kết quả sẽ dùng để so sánh với những trước quả nghiên cứu trước đó.
Ở đây chúng ta sẽ nhận thấy có một đểm vừa mập mờ nhưng cũng là điểm „láu cá“ của các tác giả. Nhóm tác giả sử dụng tòan bộ genome của virus, nghe qua thì thấy rất là to lớn vĩ đại, nhưng sự thật virus chỉ có vài gene. Do vậy, nếu xếp bài báo này vào nhóm những nghiên cứu phát sinh chủng lòai sử dụng nhiều gene thì có thể không sai. Tuy nhiên do việc nghiên cứu phát sinh chủng lòai bằng cách sử dụng tòan bộ genome chỉ mới bắt đầu được nghiên cứu nên nhiều điểm lý thuyết lẫn phương pháp thực nghiệm máy tính còn chưa rõ ràng, nên bài báo này đã có một thành công nhất định là biết chọn đối tượng có genome nhỏ nhất (nhỏ hơn cả ty thể).
02- Chọn gene để phân tích
Như đã trình bày, nhóm tác giả sử dụng tòan bộ genome của virus nhưng thực tế virus chỉ có vài gene nên có thể coi tác giả sử dụng nhiều gene cho việc phân tích của mình (các bạn thử đọc bào báo xem coi virus có mấy gene??).
Trong việc thu thập nguồn dữ liệu (tức genome database) chúng ta lưu ý là tác giả phải chỉ định rõ nguồn ngânn hàng cung cấp dữ liệu này, kèm với số Accession Number, con số này có ý nghĩa rất quan trọng.
Một điều mà chúng ta cần lưu ý là: các tác giả có đọc trình tự của một chủng lòai virus nào hay không, hay chỉ lấy từ gene bank? Câu hỏi này có ý nghĩa rất lớn để quyết định một bài báo nghiên cứu phát sinh chủng lòai được credit cao hay thấp, được những tạp chí có chỉ số Impact Factor cao chấp nhận hay không chấp nhận. Những tạp chí có chỉ số IF cao, hay những tạp chí chuyên sâu về Sinh học tiến hóa phân tử sẽ chỉ chấp nhận đăng bài nếu tác giả đích thân đọc trình tự ít nhất 50% số trình tự phân tích Trong bài này tác giả chẳng đọc trình tự một chủng lòai virus nào cả mà chỉ lấy từ gene bank. Điều này có thể có 2 lý do:
- chính sách của tờ Comaparative and Functional Genomics cho phép điều này;
- do tác giả phân tích trên „genome“ mà tòan bộ genome thì không phải lòai nào cũng được đọc, nhất là với virus, không dễ đọc. Nói cách khác, do lợi dụng khái niệm „whole-genome“ mà tác giả lách qua được chuyện không cần phải đọc thêm trình tự lòai mới.
Đến đây tôi chợt nghĩ ở VN chúng ta có thể láu cá như thế này cho việc phát triển ngành Molecular Phylogeny.
Cũng do tác giả sử dụng genome có sẵn nên việc đọc trình tự, hiệu chỉnh trình tự được bỏ qua. Phần này, nếu có sẽ được viết trong phần Materials and Methods, trong đó tác giả sẽ phải cung cấp chi tiết các cặp mồi được sử dụng cũng như các phương pháp tiến hành đọc trình tự.
3- Sắp xếp thẳng hàng các trình tự và chọn mô hình tiến hóa
Phần này thường được đề cập trong Materials and Methods. Cụ thể phần mềm Clustal X được sử dụng sử dụng cho cả sắp xếp trình tự và tạo cây tiến hóa. Tác giả sử dụng phương pháp khỏang cách (distance/neighbour-joining) cho phân tích của mình.
Câu hỏi đặt ra: tại sao tác giả chỉ sử dụng mỗi phương pháp khỏang cách để tính tóan giá trị bootstrap value? Hơn nữa trên hình ghi chú thì giá trị này kô tính theo tỷ lệ % mà để nguyên?
4- Phân tích sự phát sinh chủng lòai
Như đã giới thiệu trước, tuần này tôi sẽ báo cáo một đề tài nho nhỏ. Cũng như đã giới thiệu trước thì do chuyên ngành của tôi là Functional Genomics, nên vấn đề chúng ta thảo luận sẽ cố gắng xoay quanh hướng này. Trong hai bài trước, tôi đã có trình bay một cách vắn tắt một số khái niệm cơ bản của quá trình tạo cây tiến hóa dựa trên trình tự DNA cũng như dựa trên tòan bộ trình tự genome. Trong tuần qua, trong quá trình tìm kiếm một bài báo nào đó làm minh họa cho lý thuyết tôi đã giới thiệu tình cờ phát hiện bài đăng trên tờ Comapartive and Functional Genomics, qua coi sơ abstract, thấy nó đáp ứng đủ nhu cầu đặt ra, tôi đã nhờ anh tuchau load dùm bài báo (vì tự nhiên máy tính tôi không vào được trang wiley). Tôi tin là mọi người đã đọc sơ qua và chắc đang than rằng: Không hiểu gì hết. Để hiểu bày này, chúng ta sẽ quay lại bài „Giới thiệu Phylogeny“ trong đó tôi đã chỉ ra 9 bước cơ bản của một nghiên cứu phát sinh chủng lòai điển hình. Sau đây chúng ta tự hỏi và tự dò tìm câu trả lời trong bài báo này.
01- Mục tiêu của bài báo, mẫu vật nghiên cứu
Phần này chúng ta dễ dàng nhận thấy ngay trên tựa đề và trong phần Introduction. Nói một cách ngắn gọn thì nhóm alphavirus là đối tượng nghiên cứu của bài báo báo này. Mục đích của tác giả xây dựng cây tiến hóa của nhóm virus này dựa trên tòan bộ genome và kết quả sẽ dùng để so sánh với những trước quả nghiên cứu trước đó.
Ở đây chúng ta sẽ nhận thấy có một đểm vừa mập mờ nhưng cũng là điểm „láu cá“ của các tác giả. Nhóm tác giả sử dụng tòan bộ genome của virus, nghe qua thì thấy rất là to lớn vĩ đại, nhưng sự thật virus chỉ có vài gene. Do vậy, nếu xếp bài báo này vào nhóm những nghiên cứu phát sinh chủng lòai sử dụng nhiều gene thì có thể không sai. Tuy nhiên do việc nghiên cứu phát sinh chủng lòai bằng cách sử dụng tòan bộ genome chỉ mới bắt đầu được nghiên cứu nên nhiều điểm lý thuyết lẫn phương pháp thực nghiệm máy tính còn chưa rõ ràng, nên bài báo này đã có một thành công nhất định là biết chọn đối tượng có genome nhỏ nhất (nhỏ hơn cả ty thể).
02- Chọn gene để phân tích
Như đã trình bày, nhóm tác giả sử dụng tòan bộ genome của virus nhưng thực tế virus chỉ có vài gene nên có thể coi tác giả sử dụng nhiều gene cho việc phân tích của mình (các bạn thử đọc bào báo xem coi virus có mấy gene??).
Trong việc thu thập nguồn dữ liệu (tức genome database) chúng ta lưu ý là tác giả phải chỉ định rõ nguồn ngânn hàng cung cấp dữ liệu này, kèm với số Accession Number, con số này có ý nghĩa rất quan trọng.
Một điều mà chúng ta cần lưu ý là: các tác giả có đọc trình tự của một chủng lòai virus nào hay không, hay chỉ lấy từ gene bank? Câu hỏi này có ý nghĩa rất lớn để quyết định một bài báo nghiên cứu phát sinh chủng lòai được credit cao hay thấp, được những tạp chí có chỉ số Impact Factor cao chấp nhận hay không chấp nhận. Những tạp chí có chỉ số IF cao, hay những tạp chí chuyên sâu về Sinh học tiến hóa phân tử sẽ chỉ chấp nhận đăng bài nếu tác giả đích thân đọc trình tự ít nhất 50% số trình tự phân tích Trong bài này tác giả chẳng đọc trình tự một chủng lòai virus nào cả mà chỉ lấy từ gene bank. Điều này có thể có 2 lý do:
- chính sách của tờ Comaparative and Functional Genomics cho phép điều này;
- do tác giả phân tích trên „genome“ mà tòan bộ genome thì không phải lòai nào cũng được đọc, nhất là với virus, không dễ đọc. Nói cách khác, do lợi dụng khái niệm „whole-genome“ mà tác giả lách qua được chuyện không cần phải đọc thêm trình tự lòai mới.
Đến đây tôi chợt nghĩ ở VN chúng ta có thể láu cá như thế này cho việc phát triển ngành Molecular Phylogeny.
Cũng do tác giả sử dụng genome có sẵn nên việc đọc trình tự, hiệu chỉnh trình tự được bỏ qua. Phần này, nếu có sẽ được viết trong phần Materials and Methods, trong đó tác giả sẽ phải cung cấp chi tiết các cặp mồi được sử dụng cũng như các phương pháp tiến hành đọc trình tự.
3- Sắp xếp thẳng hàng các trình tự và chọn mô hình tiến hóa
Phần này thường được đề cập trong Materials and Methods. Cụ thể phần mềm Clustal X được sử dụng sử dụng cho cả sắp xếp trình tự và tạo cây tiến hóa. Tác giả sử dụng phương pháp khỏang cách (distance/neighbour-joining) cho phân tích của mình.
Câu hỏi đặt ra: tại sao tác giả chỉ sử dụng mỗi phương pháp khỏang cách để tính tóan giá trị bootstrap value? Hơn nữa trên hình ghi chú thì giá trị này kô tính theo tỷ lệ % mà để nguyên?
4- Phân tích sự phát sinh chủng lòai