Hỏi về Motif

kimchi

Junior Member
Các bạn có tài liệu nào chi tiết về Motif cho mình với. Mình không phải là chuyên về Sinh học, nhưng được giao nhiệm vụ tìm hiểu nó. Bạn nào có thông tin nào chỉ giúp mình với. Mình có search trên Google và NCBI, nhưng đa số sách chuyên sâu chứ không tìm được tài lệiu nào cơ bản của Motif cả ?...

Nhờ các chuyên gia Sinh học giúp đỡ. Mình cám ơn nhiều nhiều :roll:
 
1. bạn chọn box BI có nghĩa là bạn làm về BI rồi. Từ motif trong Sinh học là bắt nguồn từ của Toán học ra mà. Về định nghĩa thì cái đấy bạn chắc rành hơn tôi nhưng bạn cứ tham khảo nhé.

http://vi.wikipedia.org/wiki/Mẫu_(dạng_thức)

2. Cái mà bạn quan tâm chắc là 1 chuỗi (DNA/ peptide) ngắn được lặp lại (hoặc có xu hướng xuất hiện nhiều lần) trong database.

Bạn vào trang tutor BI của EBI để xem về một ví dụ điển hình của motif trong protein được lưu trữ trong các database riêng như Prosite, Pfam ..

http://www.ebi.ac.uk/2can/databases/protein7.html

3. Tôi cũng mới mon men đến với BI. Nếu bạn có thời gian thỉnh thoảng ghé vào box, học được cái gì từ giảng đường thì post lên để anh em học ké với. Không được học hành chính quy thiệt vậy đó.
 
Thuật ngữ motif được Oxford Dictionary Biochemistry and Molecular Biology giải thích rõ ở trang 430 và trang 717, bạn load cuốn này về đọc nhé, hỏi dontcry, hoặc nhờ dontcry cắt trang 430 và từ trang 715 đến 723 đưa cho bạn.
 
Hi, Kim Chi. Tớ vừa chat với Tú xong. Hóa ra đều là anh em trong nhà cả. Cho tớ gửi lời chào tới các anh em ở IOIT nhé. Nếu ai rảnh vào đây làm Mode cho Box BI hộ bọn tớ được thì tốt.

Chắc chắn là mối liên hệ giữa Biology và BI phải hiện thực hóa bằng cái gì cụ thể hơn nhỉ :?
 
:lol: thì ra là người quen. Thế thì mình không khách sáo nữa đâu nhe. Chi đang bị giao nhiệm vụ làm về Motif, mà chưa rõ về nó, khái niệm Motif tổng quát thì biết rồi, nhưng ý nghĩa bên sinh học thì đang tìm tài liệu chính xác hơn.

Cám ơn các bạn đã reply, mình sẽ bắt đầu theo các chỉ dẩn ( từ trên xuống) :wink:

To vietbio: bạn đã nghĩ ra giải pháp hiện thực mối lêin hệ giữa Bilogy và Bi chưa? Khi nào có thì cho hay nhe.
 
mình hiện chỉ giúp Chi về ý nghĩa Sinh học 1 cách chung nhất thôi. Các bạn khác quan tâm thì sẽ gửi tài liệu cho Chi sau.

Motif xuất hiện ở cả DNA và protein. Ng ta nghiên cứu nó vì nguyên lý rất đơn giản của học thuyết tiến hóa. 1. Đột biến xảy ra là tương đối ngẫu nhiên; 2. Theo CLTN thì sẽ chọn cái tốt, hoặc bình thường và loại bỏ cái có hại, mất chức năng; 3. Theo thuyết chọn lọc trung tính, SV sẽ tích lũy các đột biến trung tính lại.

Như vậy, khi ng ta làm cái clustal của 1 loại protein xuất hiện ở tất cả các loài, các locus, các allelle lại thì ng ta sẽ tìm thấy những đoạn consensus -> gọi là motif. Motif có thể là 1 đoạn hoặc tổ hợp có thứ tự các đoạn consensus.

Trong sinh học, nếu các motif này được chứng minh rõ ràng chức năng, cấu trúc 3D rồi thì gọi là domain (đv protein).


Về giải thuật để tìm motif hữu hiệu nhất hiện giờ là HMM. Đa số các ngân hàng thứ cấp về protein hiện giờ dùng giải thuật này. Cụ thể thế nào thì Chi biết rõ hơn tớ rồi.
 
Nhắc đến consensus, cho mình hỏi thêm, có một vài khái niệm mà mình không biết có đúng không:

1. Motif là một đoạn trình tự có quy tắc chẳng hạn dạng consensus?
Ví dụ: M[p,4:2][h,12:4]{}_{}C{}*
2. Ngoài consensus ra còn có nhiều dạng khác nữa?
3. Đoạn Motif là đoạn trình tự có các đặc điểm, chức năng được tập hợp từ nhiều loài khác nhau được lưu lại. Như vậy nếu như có đoạn Motif mới, chúng ta sẽ so sánh trong ngân hàng dữ liệu Motif thì sẽ xác định được họ hàng đoan mới?

Còn 1 câu hỏi nữa thôi. Hiện tại bạn có nghên cứu gì liên quan đến Motif không?
 
kimchi said:
To vietbio: bạn đã nghĩ ra giải pháp hiện thực mối lêin hệ giữa Bilogy và Bi chưa? Khi nào có thì cho hay nhe.

Bạn gì đó ơi cho tui théc méc chút:

Tui kô hiểu câu hỏi này lắm (mặc dù là chuyện cá nhân). ông cha Tin học kết hôn bà mẹ Sinh học cho ra đời đứa con Tin-Sinh học rồi; bây giờ bạn hỏi quan hệ giữa Biology (sinh học) và Bioinformatics (Tin sinh học) nghĩa là sao????
 
Cái này mình cũng không rõ lắm đâu, bởi thế mình mới hỏi vietbio đó :? . vietbio đang nghĩ cách hiện thực mối liên hệ này nên chắc vietbio sẽ biết rõ lắm.
vietbio đâu rồi? giải thích giúp với? Để lonxon théc méc quá chừng kìa? 8)
 
kimchi said:
Nhắc đến consensus, cho mình hỏi thêm, có một vài khái niệm mà mình không biết có đúng không:

1. Motif là một đoạn trình tự có quy tắc chẳng hạn dạng consensus?
Ví dụ: M[p,4:2][h,12:4]{}_{}C{}*
2. Ngoài consensus ra còn có nhiều dạng khác nữa?
3. Đoạn Motif là đoạn trình tự có các đặc điểm, chức năng được tập hợp từ nhiều loài khác nhau được lưu lại. Như vậy nếu như có đoạn Motif mới, chúng ta sẽ so sánh trong ngân hàng dữ liệu Motif thì sẽ xác định được họ hàng đoan mới?

Còn 1 câu hỏi nữa thôi. Hiện tại bạn có nghên cứu gì liên quan đến Motif không?


Tớ paste định nghĩa luôn (theo đường dẫn trên của bác lonxon) rồi có gì bình luận tiếp

1.
motif (in relation to protein structure): 1 a locally ordered region
within the hydrophobic core of a globular protein molecule,
formed by three-dimensional interaction between two or
three segments of the secondary structure (a helix and/or b
strand) that are near one another along the polypeptide chain.
The most important types are: (aa), (ab), (PPP), and (pap).
See also domain. 2 or rule any set of amino acids forming part
of the primary sequence of a protein, either contiguous or capable
of being aligned to certain positions that are invariant
or conserved, that is associated with a particular function;
e.g.the motif GXGXXG is associated with nucleotide-binding
sites.

2.
consensus sequence: an idealized sequence of nucleotides, or
their constituent bases, or amino acids, base, or amino acid
that represents the nucleotide most likely to occur at each position
in the sequence. Consensus sequences are used to identify
RNA splicing sites, other sites, plasmids, and families of
proteins.


3. tớ chưa hiểu câu hỏi của bạn. Tớ thì làm như thế này:
1. nếu bạn có 1 trình tự bất kỳ, muốn biết motif là gì thì đơn giản là blast lên các ngân hàng thứ cấp đấy.
2. nếu bạn có 1 nhóm trình tự khác nhau (về loài, về locus, về chức năng ...) nhưng lại có tần số lặp lại cao đối với 1 đoạn nhất định -> đề xuất một motif mới
3. so sánh tìm mối quan hệ giữa các ngân hàng thứ cấp, giữa các nhóm motif khác nhau ... cũng tương tự như vậy

(4) Hiện nay tớ ko làm cụ thể 1 motif nhất định. Tớ phải tìm ra motif của tất cả các protein mà đang nghi vấn :D.

Nếu bạn muốn có 1 VD cho bài motif của bạn thì bạn có thể tìm hiểu về:

a) mấy cái DNA binding domain
b) nhóm protein có tên gọi là DELLA protein (vì nó chỉ giống nhau đoạn trình tự là D E L L A ) nhưng có chức năng trong quan trọng trong cơ chế cảm ứng của thực vật với GA, cái này để tạo nên các cây trồng lùn, -> cuộc cách mạng xanh trong nông nghiệp
c) protein dehydrin: là nhóm có chức năng chịu hạn, chịu stress cho cây trồng (đậu tượng) cũng có những motif đặc sắc.

a: là kinh điển sách GK, b,c là những cái tớ đã từng làm qua, đấy là những thí dụ về cái mà ng ta chỉ biết hiện tượng còn hiểu hết về nó thì chưa vì thiếu cấu trúc 3D.
 
1. nếu bạn có 1 trình tự bất kỳ, muốn biết motif là gì thì đơn giản là blast lên các ngân hàng thứ cấp đấy.
-> với công việc này những người làm về SH như bạn có thường làm không? Mình thấy bạn nói là tìm motif của tất cả protein đang nghi vấn. Như vậy bạn chỉ cần gửi trình tự lên thì ngân hàng thứ cấp trả về Motif, đâu cần xử lý hay tính toán gì hả?

2. nếu bạn có 1 nhóm trình tự khác nhau (về loài, về locus, về chức năng ...) nhưng lại có tần số lặp lại cao đối với 1 đoạn nhất định -> đề xuất một motif mới
-> 1 nhóm trình tự khác nhau, giả sử: 1 trình tự a về loài, 1 trình tự b về locus, 1 trình tự khác về chức năng. Bây giờ bạn sẽ tìm đoạn trình tự "có tần số lặp lại cao đối với 1 đoạn nhất định" trong tất cả những trình tự trên để ra đời motif mới?

3. so sánh tìm mối quan hệ giữa các ngân hàng thứ cấp, giữa các nhóm motif khác nhau ... cũng tương tự như vậy
-> so sánh để làm gì vậy? chẳng hạn khi bạn tìm được mối quan hệ giữa PROSITE với PRINTS, bạn sẽ làm gì nữa?

Chắc mình có nhiều câu hỏi vớ vẫn phải không? Mong các bạn thông cảm. Bởi mình chưa biết người làm SH làm gì, và họ cần gì? Cái tội của mình là thiếu kiến thức SH. Mình thấy đi theo Tin-Sinh thì những ai chuyên Sinh học thêm Tin nữa thì dễ, chứ bên Tin nhảy qua Sinh khó ghê. Mình đọc những vấn đề SH, nhưng không làm thực tế nên tưởng tượng ra hổng nỗi :p , PCR hay transcription, .... chỉ đọc sách thôi, tức chết được. :evil:
 
kimchi said:
1. nếu bạn có 1 trình tự bất kỳ, muốn biết motif là gì thì đơn giản là blast lên các ngân hàng thứ cấp đấy.
-> với công việc này những người làm về SH như bạn có thường làm không? Mình thấy bạn nói là tìm motif của tất cả protein đang nghi vấn. Như vậy bạn chỉ cần gửi trình tự lên thì ngân hàng thứ cấp trả về Motif, đâu cần xử lý hay tính toán gì hả?

-> đây là công việc thường xuyên. Các kết quả so sánh trên ngân hàng có sẵn sẽ đc sử dụng như là định hướng ban đầu cho các kế hoạch thí nghiệm tiếp theo.

2. nếu bạn có 1 nhóm trình tự khác nhau (về loài, về locus, về chức năng ...) nhưng lại có tần số lặp lại cao đối với 1 đoạn nhất định -> đề xuất một motif mới
-> 1 nhóm trình tự khác nhau, giả sử: 1 trình tự a về loài, 1 trình tự b về locus, 1 trình tự khác về chức năng. Bây giờ bạn sẽ tìm đoạn trình tự "có tần số lặp lại cao đối với 1 đoạn nhất định" trong tất cả những trình tự trên để ra đời motif mới?

tất nhiên là trước tiên phải làm với từng nhóm nhỏ trước. Nhưng chúng tôi ko phải làm việc này. Tôi chỉ sử dụng các kết quả có sẵn của các database. Cái mà gọi là motif mới là cái mà ko biết chắc chức năng mà chỉ là các hypothetic protein hoặc conserved hypothetic protein. 1 vd là motif YTV của vi khuẩn Rhodopirellula baltica. Ng ta thấy là chỉ có ở loài này, và có mặt ở 5 protein trong toàn bộ genome đã giải mã hết. Ng ta đề xuất một motif mới. Chẳng hiểu có ý nghĩa gì ko? :D

3. so sánh tìm mối quan hệ giữa các ngân hàng thứ cấp, giữa các nhóm motif khác nhau ... cũng tương tự như vậy
-> so sánh để làm gì vậy? chẳng hạn khi bạn tìm được mối quan hệ giữa PROSITE với PRINTS, bạn sẽ làm gì nữa?

thực ra, chúng tôi ko thể thỏa mãn với 1 kết quả của 1 ngân hàng, và do đó phải tìm các thông tin giữa các ngân hàng khác nhau, để giúp cho phán đoán của mình tốt hơn, như thế vạch kế hoạch cho thí nghiệm ít khả năng bị "bể"

Chắc mình có nhiều câu hỏi vớ vẫn phải không? Mong các bạn thông cảm. Bởi mình chưa biết người làm SH làm gì, và họ cần gì? Cái tội của mình là thiếu kiến thức SH. Mình thấy đi theo Tin-Sinh thì những ai chuyên Sinh học thêm Tin nữa thì dễ, chứ bên Tin nhảy qua Sinh khó ghê. Mình đọc những vấn đề SH, nhưng không làm thực tế nên tưởng tượng ra hổng nỗi :p , PCR hay transcription, .... chỉ đọc sách thôi, tức chết được. :evil:

Tôi ko cho là thế. Tôi hiện giờ vẫn chưa tự tay viết 1 đoạn code nào ra hồn. và cũng đang đánh vật với Ms Access để tự dựng 1 database riêng cho project của mình, vì data rất hỗn độn. Tôi chỉ đề xuất là các bạn BI ko chỉ nên chỉ có hỏi để chúng tôi đáp. Các bạn nên post các report của các bạn tại đây để chúng tôi học hỏi thêm. Đồng thời, các nhà sinh học thì là các user nên kiến thức ko được chuẩn bằng các developer nên các bạn khi phát hiện thấy chúng tôi sai thì nên nói ngay để còn sửa, ko thì ko kịp :D.

Nếu Chi và các bạn IOIT đồng ý thì chúng ta lại tiếp tục

Còn về cái vụ kết hợp giữa bio và bi chẳng qua là phép lai phân tích để kiểm tra allele nào là trội thôi bác lonxon hay tò mò àh?
 
Tôi chỉ đề xuất là các bạn BI ko chỉ nên chỉ có hỏi để chúng tôi đáp. Các bạn nên post các report của các bạn tại đây để chúng tôi học hỏi thêm. Đồng thời, các nhà sinh học thì là các user nên kiến thức ko được chuẩn bằng các developer nên các bạn khi phát hiện thấy chúng tôi sai thì nên nói ngay để còn sửa, ko thì ko kịp

Bọn mình đồng ý, dĩ nhiên là mình cũng đâu muốn chỉ nhận không. Mình sẽ vận động nhóm mình tham gia. Nhưng nếu các bạn có thắc mắc về IT thì có thể đưa lên để trao đổi luôn. Nếu mình không biết sẽ nhờ người khác giải đáp.

Tôi ko cho là thế. Tôi hiện giờ vẫn chưa tự tay viết 1 đoạn code nào ra hồn. và cũng đang đánh vật với Ms Access để tự dựng 1 database riêng cho project của mình, vì data rất hỗn độn

Mình có gợi ý này, thay vì dùng MS Access, bạn thử MySQL xem. cái này open source, nhẹ, dĩ nhiên miễn phí. Cơ quan mình đang dùng nó để chứa data bản đồ đó. Sắp tới cũng định chuyển dữ liệu SH sang MySQL luôn (đang dùng Oracle). MS Access bạn không xài được với Linux, bất tiện hơn đó.
 
kimchi said:
Cho mình hỏi cái này, bạn có dùng InterProScan ko?

http://www.ebi.ac.uk/InterProScan/

Tôi chưa dùng nó 1 cách độc lập bao giờ, vì các dữ liệu tương ứng đều đã link sẵn trên các file trình tự của EMBL và NCBI rồi.

Ngoài ra, khi Blast NCBI với trình tự protein thì nó cũng làm chức năng tương tự InterProScan luôn. Khỏi phải chui vào công cụ này nữa. Bạn có thể giới thiệu sơ qua về InterProScan được ko? Tôi nhìn sơ qua thì hình như nó dùng để scan qua mấy cái ngân hàng con này.

BlastProDom FPrintScan HMMPIR HMMPfam HMMSmart
HMMTigr ProfileScan ScanRegExp SuperFamily SignalPHMM
TMHMM
 
Xin giới thiệu với các bạn motif đệm Piano cho điệu hành khúc. ... Những điệu như Slowrock, boston thì bạn có thể xem lại những mục tôi đã post ở trên. ... đâu mà cao thủ Một số bài sử dụng chùm ba thường xuyên như bản Serenade của F.Schuber ... thay đổi các hợp âm ở các thế đảo khác nhau la nhu the nao bac ...
daynhac.com/forum/forum_posts.asp?TID=119&PN=2
________________________
:hoanho::buonchuyen:
 
Thấy các anh các chị thảo luận về BI mê quá. em cũng đang học BI nhưng chưa hiểu lắm đọc các bài của các anh chị thấy xa xôi! hihi.

Trong quá trình học có một thắc mắt mà em không có cơ hội hỏi thầy, nhân đây xin hoi các anh chị mong các anh chị giúp em nghe!

Câu hỏi em như nầy:

Trong BlastP: PSI-Blast and PHI-Blast,
Khi nào chúng ta dùng PSI-Blast? dùng như thế nào và đọc output như thế nào?
Khi nào dùng PHI-Blast? có phải dùng PHI-Blast sau khi chúng ta thực hiện PSI-Blast hay ko?
PHI-Blast search theo Pattern có phải pattern lấy từ PSI-Blast hay dựa trên cơ sở nào để có được pattern? Nếu trên PSI-Blast chỉ cho em chổ download pattern hoặc cho em một thí dụ để có được pattern cho PHI-Blast.

Năm mới chúc an khang thịnh vượng!
 

Facebook

Thống kê diễn đàn

Threads
11,650
Messages
71,549
Members
56,915
Latest member
fgfdghgfngmnjhhjm
Back
Top