Tôi ko thích dùng GO lắm vì mối quan hệ của nó kiểu network, nó thật hơn nhưng lại phức tạp để hiểu data. Tôi thường dùng COG/KOG hơn để trình bày dữ liệu.
Em không hiểu vai trò quan hệ network ấy lắm. Dùng annotation có thể cho với mỗi gene một tập hợp các từ khóa của Gen Ontology, ít nhiều mô tả bản chất của gene. Nếu mình có một nhóm các gene thì việc liệt một nhóm gene đó vào một mục nào đó của ontology (mà hầu hết các gene này nằm trong đó), nhưng sau đó không biết khai thác thế nào nữa...
Em không biết gì về COG và KOG. Nếu được anh có thể giới thiệu ngắn gọn (và đơn giản) giúp không ạ?
COG/KOG đơn giản hơn. Mỗi gene chỉ thuộc 1 thể loại duy nhất, các thể loại có quan hệ kiểu cành cây với nhau. Như vậy khi có 1 nhóm gene mình có thể nói bao nhiều gene nằm ở cell division, bao nhiêu nằm ở sugar metabolism, bao nhiêu nằm ở transcription/translation processes.
Em hỏi lại: vậy trong COG và KOG đó, nói bao nhiêu gene thuộc về nhóm nào, ví dụ "cell division, sugar metabolism, transcription" thì các terms đó có nhất thiết nằm ở gốc, hoặc ở cùng một mức độ cành (so với khoảng cách đến gốc, nói cách khác cùng thế hệ) để so sánh không ạ?
Ví dụ COG có hai mục (hai gốc ) A và B (chẳng hạn cell division và sugar metabolism), mỗi gốc sinh ra hai cành A1, A2, B1,B2. Như vậy ta có hai cây và cây này có hai nhánh, tổng thể chỉ có hai mức. Chăng hạn ta có 3 gene {G1, G2, G3}, annotation của nó cho là G1:A1, G2: A2, G3:B (Tức là hai genes thuộc về hai con của A, một gene thuộc về gốc B) vậy anh có thể đặt thử một kết luận thế nào ạ?
Giả sử như ta xem xét transcriptomics của 1 loài sinh vật trước và sau khi xử lý. Ta thấy hầu hết các gene upregulate là thuộc nhóm cell signaling hoặc stress tolerance trong khi các gene trong nhóm cell division lại downregulated. Kết luận điều kiện xử lý gây cảm giá stress cho sinh vật và có ảnh hưởng đến tốc độ sinh trưởng hoặc bộ máy phân bào. Như vậy ta so sánh A với B và C hoặc so sánh A1, A2 và B3 khi muốn nói chi tiết hơn các con đường nhỏ.
Như vậy ta so sánh là giá trị biểu hiện của gene 1 trước và sau thí nghiệm để có trend rồi gộp vào kết luận cho nhóm A1. Ví dụ 60% upregulated gene là thuộc nhóm A và mức độ tăng trung bình là gấp 5 lần. Nếu trong nhóm A có 2 subgroup có trend khác nhau hoặc 80% response gene là thuộc 1 subgroup thì ta tách ra để kết luận chi tiết hơn.
Anh làm cái đó bằng chương trình gì thế ạ ? Nếu chỉ có một hai mức thì việc phân biệt nhiều hơn và ít hơn cũng không quá khó, nhưng nếu có khoảng 10 thế hệ của cây và cành thì em thấy khả năng phân biệt đâu là subgroup khác biệt có ý nghĩa không hề đơn giản, chắc cần phải có thuật toán nào đó để làm việc này...
This site uses cookies to help personalise content, tailor your experience and to keep you logged in if you register.
By continuing to use this site, you are consenting to our use of cookies.