Genome chó

Trần Hoàng Dũng

Administrator
Staff member
Đọc bài về chó thấy hay quá, mình có mấy câu hỏi:

- Chó có mấy NST vậy bạn
- SNP là gì vậy?
- Hiện nay người ta giải đựơc bao nhiêu bộ gene rồi?
 
- Chó có 78 nhiễm sắc thể ( 2n=78 )
- SNP viết tắt của Single Nucleotide Polymorphism. (Tiếng việt tạm dịch là Đa hình 1 nucleotit). Người ta phát âm SNP là sờ_níp :mrgreen:
- "Hiện nay người ta giải đựơc bao nhiêu bộ gene rồi?" Câu này thì chưa trả lời được ... Ai biết không ?
 
Nhưng SNP nghĩa là gì? Đã 1 nu rồi thì còn gì là đa hình? Tại sao khi giải mã gên thì người ta quan tâm nó?? Nó có ý nghĩa gì?

Tại sao chó lại hơn người về số NST, người có 2n=46 thôi mà, chó đến 78 lận, gấn gấp đôi?
 
Nhưng SNP nghĩa là gì? Đã 1 nu rồi thì còn gì là đa hình?
SNP là một vị trí trên DNA mà tại đó một số cá thể có 1 nucleotit (C chẳng hạn) trong khi một số cá thể khác mang nu khác (A)

Nói chung các dạng variations của genome không phải dễ để phân biệt. Bạn sẽ thấy SNP sao giống đột biến điểm thế?

Đúng vậy. Đột biến điểm và SNP về mặt nguyên lý là giống nhau. Sự khác nhau nằm ở Tần suất xảy ra trong quần thể. Người ta quy định nếu tần số nhỏ hơn hoặc bằng 1% thì là Đột biến điểm, còn hơn 1% sẽ là SNP.

Ý nghĩa của sự phân chia này? Đó là đột biến điểm thì không được sủ dụng như một chỉ thị di truyền (genetic marker) còn SNP là một chỉ thị di truyền rất quan trọng.

Một thuật ngữ nữa cũng khá gần với SNP và Đột biến điểm là Allelic Discrimination - Phân định Alen. Đúng hơn thì Allelic Discrimination là một ứng dụng dựa trên nguyên lý của SNP và Đột biến điểm.

Tại sao khi giải mã gene thì người ta quan tâm nó?? Nó có ý nghĩa gì?
Như bạn thấy đấy, SNP có cái chữ Polymorphism. Cái chữ này đủ nói lên ý nghĩa của SNP rùi phải không. Nó được sử dụng trong các phân tích đa hình di truyền. Nhiều alen chỉ khác nhau 1 nucleotit mà gây nên những sai khác lớn khi biểu hiện ra kiểu hình. Bệnh Beta - Thalasemia ở người là một ví dụ.
 
Dontcry đã nói khá rõ về SNP, tôi xin đưa ra cái định nghĩa SNP thế này, các bác góp ý nhé: SNP (single nucleotide polymorphism) tạm dịch đa hình di truyền do một nucleotide, phản ánh sự khác nhau trong trình tự DNA của hai cá thể thuộc cùng một loài ở mức độ một cặp base.
Đến nay người ta đã biết được trên 1,4 triệu SNP, trung bình 2kb có một SNP. SNP giống đột biến vì nó di truyền như các biến thể alen. SNP khác alen ở chỗ đôi lúc nó không tạo ra các kiểu hình khác nhau.
SNP được coi là một chỉ thị di truyền rất quan trọng do tính đa dạng cả về số lượng lẫn mức độ phân bố trong suốt toàn bộ genome. SNP có thể được sử dụng để chỉ định các gen liên quan đến bệnh tật hay quan hệ họ hàng của hai hay nhiều đối tượng nghi ngờ.

Ý bạn lonxon khi hỏi tại sao chó lại hơn người về số NST là gì? Theo tôi bạn muốn hỏi vì sao người là động vật bậc cao hơn chó nhưng lại có số NST ít hơn đúng không? Hai yếu tố làm bộ gen người tuy có số gen ít hơn nhưng lại tạo ra cơ thể phức tạp hơn nhiều loài khác. Đầu tiên, mỗi gen có nhiều DNA nên nhiều DNA có thể được sử dụng trong các trình tự tăng cường (enhancer sequence) cho phép điều hoà biểu hiện gen tinh vi hơn. Thứ hai, không có mối liên hệ 1:1 giữa gen và protein. Tức một gen có thể mã hoá nhiều protein do các cách alternative splicing khác nhau.

Hiện nay người ta đã giải mã được trên 30 bộ gen trong đó hơn 20 là genome của prokaryote.
 
Bạn Casper giỏi thật, nhưng nguyên văn của nó là vậy nè

The Human Genome Project không đơn thuần là giải trình toàn bộ bộ gene của người, mà nằm trong dự án này, người ta còn phải nỗ lực khai thác tìm kiếm các thông tin khác tìm ẩn chứa trong bộ gene người. Một trong những dạng dữ liệu đang được tập trung nghiên cứu là SNP phản ánh sự khác biệt trình tự DNA của hai cá thể đơn lẻ của cùng một loài ở mức độ một cặp base. Cũng như đột biến, SNP di truyền như các biến thể allele. Trong một ngữ cảnh nào đó thì SNP cũng giống như allele tức là tạo ra các kiểu hình khác nhau, ví dụ như các nhóm máu, nhưng ở ngữ cảnh khác thì SNP lại không giống như allele tức là nó không tạo ra các kiểu hình khác nhau. SNP tồn tại khá nhiều và xuyên suốt bộ gene. Nếu so sánh NST (ví dụ NST số 3) của hai người khác nhau, người ta có thể nhận thấy cứ trong 1000 bp sẽ có 1 nucleotide khác nhau, tức là 1 SNP/1000 bp. Do tính đa dạng cả về số lượng lẫn mức độ phân bố trong suốt toàn bộ bộ gene, nên SNP được sử dụng như một dấu ấn di truyền nghiên cứu di truyền liên kết. Ví dụ, các SNP của người đang được sắp xếp phân loại và tạo thành bản đồ để sử dụng trong việc chỉ định các gene có liên quan đến bệnh tật, vì khi người ta nhận thấy một SNP nằm gần một locus gây bệnh nào đó về mặt vật lý thì người ta có thể tin rằng SNP này sẽ di truyền cùng với gene gây bệnh này. Như vậy SNP trở thành một dấu ấn di truyền chỉ điểm cho locus gây bệnh cả về định tính lẫn định lượng (xác định được SNP nào đó tức là xác định sự hiện diện của gene gây bệnh đồng thời xác định vị trí của gene này trên genome). Hơn nữa SNP còn sử dụng để chỉ định quan hệ họ hàng của hai hay nhiều đối tượng nghi ngờ . Vì hầu hết mỗi SNP chỉ là một phiên bản duy nhất trong quần thể, nó xuất phát chỉ từ một đột biến duy nhất, do vậy khi có sự hiện diện của cùng SNP ở hai đối tượng nào đó thì có thể kết luận là hai đối tượng này có cùng huyết thống.
 
casper said:
Dontcry đã nói khá rõ về SNP, tôi xin đưa ra cái định nghĩa SNP thế này, các bác góp ý nhé: SNP (single nucleotide polymorphism) tạm dịch đa hình di truyền do một nucleotide, phản ánh sự khác nhau trong trình tự DNA của hai cá thể thuộc cùng một loài ở mức độ một cặp base.
Đến nay người ta đã biết được trên 1,4 triệu SNP, trung bình 2kb có một SNP. SNP giống đột biến vì nó di truyền như các biến thể alen. SNP khác alen ở chỗ đôi lúc nó không tạo ra các kiểu hình khác nhau.
SNP được coi là một chỉ thị di truyền rất quan trọng do tính đa dạng cả về số lượng lẫn mức độ phân bố trong suốt toàn bộ genome. SNP có thể được sử dụng để chỉ định các gen liên quan đến bệnh tật hay quan hệ họ hàng của hai hay nhiều đối tượng nghi ngờ.


hí hí, anh Casper thật sự không hiểu hay cố tính không hiểu, thôi để em post cho nó có đầu có đuôi nhé. Nếu anh vẫn chưa hiểu thì lúc đó lại nói nhé, em sẽ nói cho anh hiêu


Có một điều chúng ta phải nhớ rằng mặc dù chúng ta gọi là trình tự gene người,
nhưng thực tế mỗi cá nhân khác nhau thì hầu như có một trình tự bộ gene khác nhau (ngoại trừ anh chị em sinh cùng trứng). Sự khác biệt giữa mỗi bộ gene đơn lẻ có thể nói là cực kỳ lớn, điều này do cái gọi là tính đa hình do một nucleotide đơn gây ra (SNP đọc là SNIP viết tắt của Single nucleotide polymorphism trong đó poly là nhiều, đa; còn morph là hình thái, dạng). Nghĩa là ở một vị trị nào đó trong genome người này là A nhưng ở người khác là T. Đến nay đã thiết lập nhận diện trên 1,4 triệu SNP và trung bình thì một đoạn 2 kb sẽ có một SNP. Nghĩa là cứ 2 kb thì có một vi vệ tinh (microsatellite) còn gọi là trình tự lặp lại sóng đôi ngắn (STR – short tandem repeart). Chúng ta sẽ tìm hiểu kỹ về các trình tự vệ tinh ở phần sau, nhưng cơ bản, đó là một chuỗi các nucleotide lặp lại (ví dụ CGCGCGCGCGCG) trong đó số lần lặp lại phụ thuộc từng cá nhân. Nhiều SNP và vệ tinh không tác động lên chức năng của gene nhưng nhiều số khác lại ảnh hưởng rất mạnh. Ví dụ một phần trong số 60.000 SNP nằm bên trong gen đã tác động lên hoạt động của gene, điều này tăng sự đa dạng khiến cho mỗi chúng ta hầu như hoàn toàn khác biệt với người khác về các đặc tính sinh học.

5.1.2. Tính đa hình di truyền dựa trên một nucleotide đơn lẻ

The Human Genome Project không đơn thuần là giải trình toàn bộ bộ gene của người, mà nằm trong dự án này, người ta còn phải nỗ lực khai thác tìm kiếm các thông tin khác tìm ẩn chứa trong bộ gene người. Một trong những dạng dữ liệu đang được tập trung nghiên cứu là SNP phản ánh sự khác biệt trình tự DNA của hai cá thể đơn lẻ của cùng một loài ở mức độ một cặp base. Cũng như đột biến, SNP di truyền như các biến thể allele. Trong một ngữ cảnh nào đó thì SNP cũng giống như allele tức là tạo ra các kiểu hình khác nhau, ví dụ như các nhóm máu, nhưng ở ngữ cảnh khác thì SNP lại không giống như allele tức là nó không tạo ra các kiểu hình khác nhau. SNP tồn tại khá nhiều và xuyên suốt bộ gene. Nếu so sánh NST (ví dụ NST số 3) của hai người khác nhau, người ta có thể nhận thấy cứ trong 1000 bp sẽ có 1 nucleotide khác nhau, tức là 1 SNP/1000 bp. Do tính đa dạng cả về số lượng lẫn mức độ phân bố trong suốt toàn bộ bộ gene, nên SNP được sử dụng như một dấu ấn di truyền nghiên cứu di truyền liên kết. Ví dụ, các SNP của người đang được sắp xếp phân loại và tạo thành bản đồ để sử dụng trong việc chỉ định các gene có liên quan đến bệnh tật, vì khi người ta nhận thấy một SNP nằm gần một locus gây bệnh nào đó về mặt vật lý thì người ta có thể tin rằng SNP này sẽ di truyền cùng với gene gây bệnh này. Như vậy SNP trở thành một dấu ấn di truyền chỉ điểm cho locus gây bệnh cả về định tính lẫn định lượng (xác định được SNP nào đó tức là xác định sự hiện diện của gene gây bệnh đồng thời xác định vị trí của gene này trên genome). Hơn nữa SNP còn sử dụng để chỉ định quan hệ họ hàng của hai hay nhiều đối tượng nghi ngờ . Vì hầu hết mỗi SNP chỉ là một phiên bản duy nhất trong quần thể, nó xuất phát chỉ từ một đột biến duy nhất, do vậy khi có sự hiện diện của cùng SNP ở hai đối tượng nào đó thì có thể kết luận là hai đối tượng này có cùng huyết thống.
 
Hôm qua đọc bài của lonxon xong về nằm suy nghĩ rất nhiều. Tôi không dàm chỉ trích bạn, nhưng mong bạn hãy cẩn thận khi phát ngôn. Nếu tôi không phải là mod và tôi không mong muốn cùng chia sẻ với dontcry, với những người khác về mục tiêu xây dựng một diễn đàn “hay” theo đúng nghĩa của nó thì tôi sẽ không tranh cãi với bạn làm gì.

Tôi tạm hiểu ý bạn thế này, theo bạn thì tôi ăn cắp những gì tôi viết ở trên từ bài bạn post ra phải không? Bạn cứ nói thẳng ra, không phải ấp úng thể đâu, để tôi dễ nói cho bạn hiểu. Công nhận bài bạn post lên khá hay nếu không tính đến văn phong hơi tối. Bài này do bạn viết hay của ai để tôi có thể tranh luận trực tiếp vì họ xúc phạm tôi quá. Không biết người viết bài này tự tìm ra SNP và coi là bản quyền của riêng mình hay cũng là tổng hợp từ các tài liệu khác, không biết là viết ra với mục đích học tập, giảng dạy hay đơn thuần chỉ để xúc phạm tôi. Tôi đã nói là tôi dốt lắm, làm sao có khả năng tự phát minh ra cái SNP được, những cái tôi viết chỉ là đọc ở đâu đó thôi, nhưng chắc chắn không phải đọc từ cái bài của bạn rồi.

Bạn đã làm tôi mất khá nhiều thời gian để lục lại những tài liệu của tôi trước kia khi tìm hiểu về SNP. Mặc dù vẫn chưa phải đủ nhưng tôi xin post ra đây nguyên văn tiếng Anh một số phần đó để bạn xem những dòng tôi viết ở đâu ra. Và tôi sẽ chỉ làm thế một lần này thôi, thiết nghĩ cũng không phải tìm lại các tài liệu và dẫn chứng về định nghĩa BI của tôi nữa phải không bạn? Nếu bạn vẫn cố tình không hiểu thì tôi cũng đành chịu.

Tôi biết các bạn là những người có trình độ, có tâm huyết, nhưng mong rằng các bạn hãy nhìn lại mình một chút, đừng cho là có những cái chỉ mình mới làm được còn người khác thì không.

À, mà nghĩ lại thấy bạn rất có khả năng tìm tòi từ bài của người khác, tôi có một đề nghị thế này. Tôi có khá nhiều bài viết trên diễn đàn này, bạn có thể tìm xem những cái tôi viết lấy ra từ đâu không (từ bài tiếng Việt thì càng tốt, từ nguyên văn tiếng Anh cũng hay). Và như thế tôi với bạn thành một cặp, tôi viết bài, bạn lo references để tăng độ tin cậy của các bài tôi viết. Hoặc mở rộng ra thì tôi mời nhóm bạn chuyên tìm reference cho các bài viết trên diễn đàn này để tăng tính tin cậy của nó nhé. Bạn chấp nhận không?

Nguyên văn tiếng Anh một số bài viết về SNP mà tôi đã tham khảo trước đây:

We can use the study of genetic variation to examine differences between members of the same species, ranging from the study of bacterial characteristics (such as antibiotic resistance) to investigation of human genetic diseases, or to differentiate between individuals (for example in forensic analysis). Alternatively, we can compare the genetic composition of members of different species= even over wide taxonomic ranges- which can throw invaluable light on the processes of evolution as well as helping to define the taxonomic relationship between species...

…The simplest form of genetic variation consists of a change in the sequence of bases at a single point. Such differences are called single nucleotide polymorphisms (SNPs). It is worth reflecting briefly on the consequences of such a simple change. The first possibility is that the polymorphism is not even within a gene; indeed in eukaryote that is the most common occurrence (this is both because most eukaryotic DNA is not a part of any gene, and because a non-coding sequence is where a polymorphism is least likely to have a negative effect). Second, if the change is within a gene, the chances are (again in eukaryotes) that it is in an intron and (unless it affects a splice site) does not affect the resulting gene products. Even if it is within an exon, there may be no change at all in the sequence of the protein encoded by that gene. A single base change may alter for example a leucine codon such as UUA into CUA, which also codes for leucine. This is referred to as a synonymous substitution. This would be expected to have little or no effect on the organism (and hence is also referred to as a silent mutation)- although the change in codon usage could have some effect on the translation of the mRNA. Other changes may also be silent, although not synonymous. A change from UUA to GUA would replace the leucine with valine at that position in the protein, which may be little consequence for protein structure and function (depending on how critical that specific position is), since leucine and valine are similar amino acids. Other changes, such as UUA to UCA (serine), are more likely to have an effect, although such a change (and even more radical changes) can be tolerated at some positions. These non- synonymous (or missense) substitutions therefore may or may not give rise to changes in the characteristics of the cell…

… Natural sequence variation is a fundamental property of all genomes. Any
two haploid human genomes show multiple sites and types of polymorphism.
Some of these have functional implications, whereas many probably do not.
The most common polymorphisms in the human genome are single base-pair
differences, also called single-nucleotide polymolphisms (SNPs)….

…SNPs are abundant, stable, widely distributed across the genome, and
lend themselves to automated analysis on a very large scale, for example,
with DNA array technologies. Because of these properties, SNPs will be a
boon for mapping complex traits such as cancel; diabetes, and mental illness.
Dense maps of SNPs will make possible genome-wide association studies,
which are a powerful method for identifying genes that make a small
contribution to disease risk. In some instances, such maps will also permit
prediction of individual differences in drug response. Publicly available
maps of large numbers of SNPs distributed across the whole genome, together
with technology for rapid, large-scale identiJication and scoring of SNPs,
must be developed to facilitate this research. The early availability of a
working draft of the human genome should greatly facilitate the creation of
dense SNP maps (see Goal 1)…

…SNPs in coding sequences (also known as cSNPs) and the associated regulatory regions will be immediately useful as specifc markers for disease. An eflort should be made to identify such SNPs as soon as possible. Ultimately, a
catalog of all common variants in all genes will be desirable. This should
be cross-referenced with cDNA sequence data (see Goal 4).

SNPs are di-allelic (although in principle there is no reason why a particular base could not be substituted by more than one alternative), and thus less informative individually than microsatellites, but far more abundant. The human genome may contain millions of SNPs, yet they are probably more abundant in noncoding regions of the genome.
 
Casper và lonxon có cách viết văn sau thật giống nhau. Thông thường để tránh hiểu lầm, người ta thường dùng từ ngữ tương đương để diển tả cùng một ý. Chứ còn rinh một lúc cả câu văn của người khác thì sẽ mất hết tính nhiệm. Tôi không biết cái nào là của ai, mong hai bạn vui lòng xét xử giải quyết.
 
Mong lonxon và casper tiếp tục post bài và những hiểu biết của các bạn trong các lĩnh vực lên để các thành viên khác có thể học hỏi nhé. Các bạn đều là người hiểu biết và chịu khó tìm tòi. Mình rất phục điểm đó ở các bạn.

Chỉ mong là mình làm việc theo tinh thần hợp tác hơn thì tốt hơn phải không ?
 
Nghĩa là chịu khó tìm tòi chôm chỉa, cầm nhầm của người khác, phải kô bạn và bạn cũng phục những điểm này a?
 
Tớ dốt anh văn cực kỳ, muốn kiếm cái sờ níp này thì có hàng tá sách để đọc, cậu chỉ thảy lên 1 chút xíu cái đọan về sờ níp này, tớ tra tự điển nữa ngày mà chả hiểu gì cả. Vậy cậu chịu khó gạch dưới những chỗ hay nói đúng hơn là cụm từ, những câu mà từ đó cậu đưa ra được những lý lẽ, ý Việt ngữ. Nếu trong cái đóng hổ lốn đó không có thì cậu thử chỉ cho thiên hạ biết là chính xác cậu đọc sách nào, trang nào, dòng nào, thậm chí nếu siêng năng giỏi giang (cái này cậu có thừa) thì chép lại cái câu English đó xem, hay là cậu cho là những câu việt ngữ này do cậu "tư duy" mà ra?

"Đến nay người ta đã biết được trên 1,4 triệu SNP, trung bình 2kb có một SNP.

SNP giống đột biến vì nó di truyền như các biến thể alen. SNP khác alen ở chỗ đôi lúc nó không tạo ra các kiểu hình khác nhau.

SNP được coi là một chỉ thị di truyền rất quan trọng do tính đa dạng cả về số lượng lẫn mức độ phân bố trong suốt toàn bộ genome.

SNP có thể được sử dụng để chỉ định các gen liên quan đến bệnh tật hay quan hệ họ hàng của hai hay nhiều đối tượng nghi ngờ. "
 
Bạn loxon à, nếu bạn vẫn cố tình không chịu hiểu, cố tình không đọc những referece tôi trích dẫn thì tôi cũng cố gắng ngồi chỉ ra từng câu cho bạn vậy. Nhưng có lẽ sẽ chỉ một lần này thôi. Mong bạn đọc thật kỹ, chứ đừng bắt tôi dịch hết ra tiếng Việt để so sánh nhé, vì tôi cũng dốt tiếng Anh lắm. Mà cũng phải nói trước, nếu bạn đọc xong rồi nói trong các đoạn dẫn chứng chả có câu nào đúng y chang như câu tôi viết ra bằng tiếng Việt trên diễn đàn, thì đành chào thua bạn vậy.
Đến đây coi như tôi đã rất nhẫn nhịn với cậu rồi đấy, nói đi cũng phải nói lại, cậu có tìn rằng bây giờ cậu viết một vấn đề gì đó rồi post lên đi, cho tôi vài ngày, chả khó khăn gì để tôi có thể đưa ra một bài dài ngoằng từ cái bài đó rồi bảo bạn ăn cắp của tôi, rồi bắt bạn chỉ ra tài liệu tham khảo cho từng câu từng chữ. Làm thế chả hay chút nào.

Đoạn này nói SNP đôi lúc không tạo ra các kiều hình khác nhau: …Second, if the change is within a gene, the chances are (again in eukaryotes) that it is in an intron and (unless it affects a splice site) does not affect the resulting gene products. Even if it is within an exon, there may be no change at all in the sequence of the protein encoded by that gene. A single base change may alter for example a leucine codon such as UUA into CUA, which also codes for leucine. This is referred to as a synonymous substitution. This would be expected to have little or no effect on the organism (and hence is also referred to as a silent mutation)- although the change in codon usage could have some effect on the translation of the mRNA. Other changes may also be silent, although not synonymous.

Đoạn này nói SNP phân bố đa dạng cả về số lượng và mức độ phân bố trong genome: …SNPs are abundant, stable, widely distributed across the genome, and
lend themselves to automated analysis on a very large scale, for example,
with DNA array technologies. Because of these properties, SNPs will be a
boon for mapping complex traits such as cancel; diabetes, and mental illness.

Đoạn này nói SNP được dùng để chỉ định gen liên quân bện tật và quan hệ họ hàng: …SNPs in coding sequences (also known as cSNPs) and the associated regulatory regions will be immediately useful as specifc markers for disease…
… We can use the study of genetic variation to examine differences between members of the same species, ranging from the study of bacterial characteristics (such as antibiotic resistance) to investigation of human genetic diseases, or to differentiate between individuals (for example in forensic analysis). Alternatively, we can compare the genetic composition of members of different species= even over wide taxonomic ranges- which can throw invaluable light on the processes of evolution as well as helping to define the taxonomic relationship between species...

Còn số 1,4 triệu SNP ư, cái này tôi đọc đâu đó trong một website, không có thời gian lục lại cho bạn, nhưng thiết nghĩ, bạn vào google tìm là thấy ngay mà, còn trung bình 2kb có một SNP thì đơn giản quá, bạn có biết chia không nhỉ? À mà trong các tài liệu tôi post ra cũng có nói qua về số lượng SNP trong genome đây này … The human genome may contain millions of SNPs, yet they are probably more abundant in noncoding regions of the genome.
 
Trước tiên tôi có ý kiến thế này:

01- nếu những gì tớ viết dưới đây mà quý vị cho là tầm phào thì cho phép tơi có 1 lời xin lỗi đến bạn Capser và sau đó nói rằng bạn Capser xứng đáng dứng ngang hàng với T.A. Brown người viết cuốn Genomes 2 và Pierce tác giả cuốn Genetics-A Conceptual Approach, hai cuốn sách gối đầu giường của dân di truyền vì anh Capser đã cĩ những tư duy trùng khít với hai tác gia này.Ở dưới tôi sẽ viết tắt là Genomes và Gentics để chỉ 2 cuốn này)

02- nếu những gì tơi viết mà quý vị cho là đúng, thì tuỳ quý vị.

Về bản tiếng Việt mà cĩ là do một sự tình cờ, mà tác giả của nó là không muốn phổ biến vì còn thiếu sót. Nếu muốn đọc để hiểu thì được chứ đừng có truyền bá lung tung.

Bây giờ trước tiên tơi sẽ trích lại một phần của tập tài liệu này

......
Trình tự gene người trong cả hai dự án đều lên đến 3,2 – 3, 4 tỷ bp. Để thấy mức độ khổng lồ của trình tự này, ta hãy hình dung như sau: cứ 60 bp thì dài khoảng 10 cm trong một cuốn sách khổ lớn. Như vậy nếu in hết toàn bộ trình tự thì nó dài 5000 km, bằng chiều dài từ Montreal đến London hoặc từ Los Angeles đến Panama hoặc từ Tokyo đến Calcutta hoặc từ Cape Town đến Addis Ababa hoặc từ Auckland đến Perth (hình 37). Và cần 5000 cuốn danh bạ điện thoại khổ lớn mới in ra hết.

Có một điều chúng ta phải nhớ rằng mặc dù chúng ta gọi là trình tự gene người, nhưng thực tế mỗi cá nhân khác nhau thì hầu như có một trình tự bộ gene khác nhau (ngoại trừ anh chị em sinh cùng trứng). Sự khác biệt giữa mỗi bộ gene đơn lẻ có thể nói là cực kỳ lớn, điều này do cái gọi là tính đa hình do một nucleotide đơn gây ra (SNP- đọc là SNIP viết tắt của Single nucleotide polymorphism trong đó poly là nhiều, đa; còn morph là hình thái, dạng). Nghĩa là ở một vị trị nào đó trong genome người này là A nhưng ở người khác là T. Đến nay đã thiết lập nhận diện trên 1,4 triệu SNP và trung bình thì một đoạn 2 kb sẽ có một SNP. Nghĩa là cứ 2 kb thì có một vi vệ tinh (microsatellite) còn gọi là trình tự lặp lại sóng đôi ngắn (STR – short tandem repeart). Chúng ta sẽ tìm hiểu kỹ về các trình tự vệ tinh ở phần sau, nhưng cơ bản, đó là một chuỗi các nucleotide lặp lại (ví dụ CGCGCGCGCGCG) trong đó số lần lặp lại phụ thuộc từng cá nhân. Nhiều SNP và vệ tinh không tác động lên chức năng của gene nhưng nhiều số khác lại ảnh hưởng rất mạnh. Ví dụ một phần trong số 60.000 SNP nằm bên trong gen đã tác động lên hoạt động của gene, điều này tăng sự đa dạng khiến cho mỗi chúng ta hầu như hoàn toàn khác biệt với người khác về các đặc tính sinh học.


5.1.2. Tính đa hình di truyền dựa trên một nucleotide đơn lẻ

The Human Genome Project không đơn thuần là giải trình toàn bộ bộ gene của người, mà nằm trong dự án này, người ta còn phải nỗ lực khai thác tìm kiếm các thông tin khác tìm ẩn chứa trong bộ gene người. Một trong những dạng dữ liệu đang được tập trung nghiên cứu là tính đa hình di truyền dựa trên một nucleotide đơn lẻ (Single-Nucleotide Polymorphisms – SNP). SNP phản ánh sự khác biệt trình tự DNA của hai cá thể đơn lẻ của cùng một loài ở mức độ một cặp base. Cũøng như đột biến, SNP di truyền như các biến thể allele. Trong một ngữ cảnh nào đó thì SNP cũng giống như allele tức là tạo ra các kiểu hình khác nhau, ví dụ như các nhóm máu, nhưng ở ngữ cảnh khác thì SNP lại không giống như allele tức là nó không tạo ra các kiểu hình khác nhau. SNP tồn tại khá nhiều và xuyên suốt bộ gene. Nếu so sánh NST (ví dụ NST số 3) của hai người khác nhau, người ta có thể nhận thấy cứ trong 1000 bp sẽ có 1 nucleotide khác nhau, tức là 1 SNP/1000 bp. Do tính đa dạng cả về số lượng lẫn mức độ phân bố trong suốt toàn bộ bộ gene, nên SNP được sử dụng như một dấu ấn di truyền nghiên cứu di truyền liên kết. Ví dụ, các SNP của người đang được sắp xếp phân loại và tạo thành bản đồ để sử dụng trong việc chỉ định các gene có liên quan đến bệnh tật, vì khi người ta nhận thấy một SNP nằm gần một locus gây bệnh nào đó về mặt vật lý thì người ta có thể tin rằng SNP này sẽ di truyền cùng với gene gây bệnh này. Như vậy SNP trở thành một dấu ấn di truyền chỉ điểm cho locus gây bệnh cả về định tính lẫn định lượng (xác định được SNP nào đó tức là xác định sự hiện diện của gene gây bệnh đồng thời xác định vị trí của gene này trên genome). Hơn nữa SNP còn sử dụng để chỉ định quan hệ họ hàng của hai hay nhiều đối tượng nghi ngờ. Vì hầu hết mỗi SNP chỉ là một phiên bản duy nhất trong quần thể, nó xuất phát chỉ từ một đột biến duy nhất, do vậy khi có sự hiện diện của cùng SNP ở hai đối tượng nào đó thì có thể kết luận là hai đối tượng này có cùng huyết thống

5.1.3. Đuôi trình tự được biểu hiện

Ngoài SNP đã đề cập ở trên, một dạng dữ liệu khác cũng nằm trong sự quan tâm của HGP, đó là dữ liệu của đuôi trình tự biểu hiện (EST – expressed sequence tags). Ở eukaryote, chỉ có một tỷ lệ phần trăm rất nhỏ DNA thật sự mã hóa cho protein, ở người con số này là dưới 2%. Chính vì con số tỷ lệ DNA mã hóa cho protein quá thấp nên người ta thấy rằng việc nghiên cứu trên toàn bộ bộ gene không hiệu quả bằng nghiên cứu RNA. Khi đó RNA được nghiên cứu bằng cách sử dụng các EST. EST lúc này được xem như là dấu ấn di truyền của trình tự DNA nhưng được nhận diện gián tiếp qua RNA. Để có EST người ta sẽ thu RNA từ tế bào rồi sử dụng phản ứng phiên mã ngược để tái tạo lại các mảnh cDNA tương ứng với phân tử RNA trong tế bào. Các mảnh cDNA ngắn được giải trình tự, và các đoạn trình tự này (lúc này gọi là đuôi) chính là các dấu ấn di truyền DNA trên genome. EST được sử dụng để tìm kiếm các gene hoạt động trong một mô đặc hiệu nào đó hay tại một thời điểm nhất định nào đó trong quá trình phát triển.

5.1.4. Bioinformatics

Vào thời điểm này (11/2003) đã có hơn 100 bộ gene của sinh vật khác nhau được giải trình, và hàng loạt dự án giải trình gene đang diễn tiến. Các dự án này đều đã và đang cung cấp một khối lượng dữ liệu trình tự khổng lồ có liên quan. GeneBank, một trong những nơi tích trữ cơ sở dữ liệu chính hiện đang chứa 19 tỷ bp trình tự và con số này tăng liên tục hàng tháng. Việc phân loại, sắp xếp, lưu trữ, trích lục lượng khổng lồ các dữ liệu này thực sự là một thách thức lớn với các nhà di truyền. Bioinformatics là một lĩnh vực mới nổi lên từ sự kết hợp của sinh học và khoa học máy tính có nhiệm vụ phát triển dữ liệu, phát triển mới các thuật toán tìm kiếm dựa trên máy tính, triển khai các phần mềm chuyên dụng và các công cụ phân tích khác nhằm tạo ra tính đa chiều của dữ liệu trình tự DNA, RNA và protein. Bioinformatics đã và đang phát triển cũng như ứng dụng các công cụ này để ”thu nhỏ” dữ liệu giúp cho việc khai thác chiết xuất thông tin từ các dự án giải trình tự ngày càng tối ưu hơn.

Trước khi giải trình tự, hầu hết genome đều chứa rất ít gene biết rõ vị trí, nhưng sau khi giải trình với một khối lượng dữ liệu trình tự khổng lồ cùng với tính phức tạp cấu trúc gene khiến cho việc tìm kiếm các gene lại trở thành một nhiệm vụ cực kỳ khó khăn. May mắn là các chương trình máy tính đã phát triển để giúp cho việc tìm kiếm trình tự DNA đặc hiệu gắn kết với một gene nào đó trở nên dễ dàng hơn. Ví dụ, các gene mã hóa cho protein được xác lập qua khung đọc mở (ORF- open reading frame) bao gồm một mã mở đầu và một mã kết thúc. Các trình đặc hiệu sẽ chỉ cho thấy vị trí ghép nối giữa điểm khởi đầu và kết thúc của các intron. Một trình tự đặc hiệu khác thường bắt gặp đó là các trình tự nằm trên promoter ngay trên codon khởi sự. Các chương trình máy tính có nhiệm vụ quét qua toàn bộ trình tự của một đoạn DNA và sau đó sẽ chỉ ra vị trí chính xác của gene dựa trên cơ sở tìm kiếm sự hiện diện và vị trí của các trình tự đặc hiệu. Một số chương trình khác có khả năng dò tìm dữ liệu EST và trình tự protein để phán đoán liệu rằng một gene nào đó có biểu hiện hay không.

Tuy vậy điều quan trọng cần phải nhận thấy là các chương trình máy tính chỉ định gene trên cơ sở trình tự DNA không thực sự hoàn hảo. Vì vậy có thể thấy rằng con số các gene chứa trong một bộ genome nào đó đã công bố chỉ mang tính tương đối. Sự tồn tại của các intron, cơ chế cắt ghép khác biệt, nhiều phiên bản copy của cùng một gene và các vùng DNA không mã hóa protein nằm giữa các gene đã khiến cho việc chỉ định vị trí và tính toán số số lượng chính xác của gene trong genome còn là một bài toán chưa có lời giải đáp.
................

Bây giờ chúng ta đọc lại những gì anh Casper đã viết về SNP


Dontcry đã nói khá rõ về SNP, tôi xin đưa ra cái định nghĩa SNP thế này, các bác góp ý nhé: SNP (single nucleotide polymorphism) tạm dịch đa hình di truyền do một nucleotide, phản ánh sự khác nhau trong trình tự DNA của hai cá thể thuộc cùng một loài ở mức độ một cặp base.
Đến nay người ta đã biết được trên 1,4 triệu SNP, trung bình 2kb có một SNP. SNP giống đột biến vì nó di truyền như các biến thể alen. SNP khác alen ở chỗ đôi lúc nó không tạo ra các kiểu hình khác nhau.
SNP được coi là một chỉ thị di truyền rất quan trọng do tính đa dạng cả về số lượng lẫn mức độ phân bố trong suốt toàn bộ genome. SNP có thể được sử dụng để chỉ định các gen liên quan đến bệnh tật hay quan hệ họ hàng của hai hay nhiều đối tượng nghi ngờ.


Ta xét câu này của anh Casper trước

SNP (single nucleotide polymorphism) tạm dịch đa hình di truyền do một nucleotide, phản ánh sự khác nhau trong trình tự DNA của hai cá thể thuộc cùng một loài ở mức độ một cặp base.

Bạn dò lên phần giới thiệu (đúng ra là mục 5.1.1) và mục 5.1.2, có 2 câu viết là

Sự khác biệt giữa mỗi bộ gene đơn lẻ có thể nói là cực kỳ lớn, điều này do cái gọi là tính đa hình do một nucleotide đơn gây ra (SNP- đọc là SNIP viết tắt của Single nucleotide polymorphism trong đó poly là nhiều, đa; còn morph là hình thái, dạng).

SNP phản ánh sự khác biệt trình tự DNA của hai cá thể đơn lẻ của cùng một loài ở mức độ một cặp base.

Cứ như 2 anh em cùng cha khác ... ông nội vậy. Nhưng nguyên văn English của nó là đây

The differences between individual genomes are largely due to single nucleotide polymorphisms (SNPs). (genome 2 -http://www.ncbi.nlm.nih.gov/books/bv.fcgi?call=bv.View..ShowSection&rid=genomes.section.5276

One consists of single-nucleotide polymorphisms (SNPs, pronounced “snips”), which are single-base-pair differences in DNA sequence between individual members of a species.

Cứ cho là anh bạn Capser đã tự tư duy, nhưng tự tư duy đến mức trúng phóc ý 2 ông đại sư phụ thì quả thật trên đời hiếm có.

Chưa hết:

câu của anh casper viết

Đến nay người ta đã biết được trên 1,4 triệu SNP, trung bình 2kb có một SNP.

Câu của tác giả Vnese viết

Đến nay đã thiết lập nhận diện trên 1,4 triệu SNP và trung bình thì một đoạn 2 kb sẽ có một SNP.

Câu E gốc là

Over 1.4 million SNPs have been identified, an average of one for every 2.0 kb of sequence (Genomes, xem đường linh đã chỉ)

Câu này nữa

SNP giống đột biến vì nó di truyền như các biến thể alen. SNP khác alen ở chỗ đôi lúc nó không tạo ra các kiểu hình khác nhau.


bản Vnese viết

Cũøng như đột biến, SNP di truyền như các biến thể allele. Trong một ngữ cảnh nào đó thì SNP cũng giống như allele tức là tạo ra các kiểu hình khác nhau, ví dụ như các nhóm máu, nhưng ở ngữ cảnh khác thì SNP lại không giống như allele tức là nó không tạo ra các kiểu hình khác nhau.

Câu nguyên văn E là

Arising through mutation, SNPs are inherited as allelic variants (just like alleles that produce phenotypic differences, such as blood types), although SNPs do not usually produce a phenotypic difference. (Genetics-562)

Tác giả VNese đã dịch lướt qua đoạn này, nhưng vẫn bám đúng nghĩa.

Một câu phân tích tính chất của anh Capser

SNP được coi là một chỉ thị di truyền rất quan trọng do tính đa dạng cả về số lượng lẫn mức độ phân bố trong suốt toàn bộ genome.

Ta xem tác giả Vnese viết

Do tính đa dạng cả về số lượng lẫn mức độ phân bố trong suốt toàn bộ bộ gene, nên SNP được sử dụng như một dấu ấn di truyền nghiên cứu di truyền liên kết.

Nguyên văn E như sau:

Because of their variability and widespread occurrence throughout the genome, SNPs are valuable as markers in linkage studies. (Genetics-562)

Tiếp tục Anh Casper trình bày

SNP có thể được sử dụng để chỉ định các gen liên quan đến bệnh tật hay quan hệ họ hàng của hai hay nhiều đối tượng nghi ngờ.


Tác giả VN viết là

Hơn nữa SNP còn sử dụng để chỉ định quan hệ họ hàng của hai hay nhiều đối tượng nghi ngờ.

Thus the SNP marks the location of a genetic locus that causes the disease.A SNP can also be useful for determining family relationships—most SNPs are unique within a population, having arisen only once by mutation. Thus the presence of the same SNP in two persons often indicates that they have a common ancestor. (Genetics-562)

Trong phần mà anh Capser có chỉ ra ở những đoạn E nào anh ấy đọc rồi từ đó anh ấy tự tư duy ra những điều ở trên. Nếu đúng vậy thì anh Casper quả là thiên tài. Sao mà trúng ý ông Pierce thế.


Bây giờ ta xem cái đoạn về Bioinformatics nhé

Anh Casper viết

Tôi thấy định nghĩa về BI rất khó, vẫn chưa tìm thấy cái định nghĩa nào được sử dụng thống nhất cả. Qua nhiều nguồn tài liệu, tôi xây dựng cái định nghĩa thế này, mong các bác cho ý kiến:
BI là một lĩnh vực độc nhất vô nhị trong khoa học, là sự giao thoa của sinh học, di truyền học, hoá sinh, khoa học máy tính, toán học, thống kê học và nhiều lĩnh vực liên quan khác nhằm tìm kiếm thuật toán, triển khai các phần mềm chuyên dụng, phát triển dữ liệu, và các công cụ phân tích khác trên máy tính nhằm tạo ra tính đa chiều của dữ liệu trình tự RNA, DNA và protein.


mục 5.1.4, tác giả VN viết

Bioinformatics là một lĩnh vực mới nổi lên từ sự kết hợp của sinh học và khoa học máy tính có nhiệm vụ phát triển dữ liệu, phát triển mới các thuật toán tìm kiếm dựa trên máy tính, triển khai các phần mềm chuyên dụng và các công cụ phân tích khác nhằm tạo ra tính đa chiều của dữ liệu trình tự DNA, RNA và protein. (Genetics-562)

Nguyên văn E nó là ở đây

Bioinformatics is an emerging field consisting of molecular biology and computer science that centers on developing databases, computer-search algorithms, gene prediction software, and other analytical tools that are used to make sense of DNA, RNA, and protein sequence data. (Genetics-562)

Chú ý cụm từ .... that are used to make sense of DNA, .. có chữ make sense, tác giả VN không dịch là tạo thành (ý) nghĩa mà dịch thành ... tạo ra tính đa chiều ..

Tới đây tớ bội phục anh Casper, anh ấy đâu có đọc sách Pierce đâu, sao mà anh ta tư duy giống Pierce đến thế



(có vài chỗ font VNese hiện không rõ, xin thành thật cáo lỗi)
 
Tôi xin khâm phục tài suy luận và diễn giải của bác lonxon. Truớc tiên thì bác đòi tôi chỉ ra những đoạn tôi đọc, tôi chỉ ra rồi thì bác lại bới chỗ khác. Như nói từ trước, tôi tìm hiểu về SNP đã lâu, nên bảo tôi ngồi lọc ra từng câu từng chữ tôi viết nó ở đâu ra thì tôi không làm được như bạn. Bạn thật là chúa nói tầm phào và hoàn toàn không có căn cứ khi nói tôi chưa dọc quyển Genenomes 2 cũng như quyển Genetics-A Conceptual Approach. Chưa chắc bạn đọc hai quyển đó đã ngấm bằng tôi đâu bạn ạ.
Nghe bạn cố tình biến đổi, phân tích để ép rằng tôi lấy từ cái phần bạn trích ra thì có vẻ như có lý. Nhưng nếu lật ngược lại, tôi chả biết tác giả cái bài bạn đưa ra là ai, tại sao tự nhiên lại trùng với tôi như vậy, tác giả bài đó viết truớc hay sau khi đọc những gì tôi viết? Có cố tình biến đổi nhằm mục đích xấu không. Nếu bạn có thể chỉ ra một link nào có đăng cái bài của người này viết trước thời điểm tôi viết thì đành chịu, đằng này chỉ là cái tài liệu vớ vẩn nào đó, do tên vớ vẩn nào đó viết, rồi lại không dám quảng bá cho ai thì thật là không ổn.
Mời đọc kỹ lại văn phong của tôi và của anh bạn của bạn. Chắc hẳn ai cũng nhận ra anh bạn kia hành văn rất tối nghĩa,trình độ dịch ai chà, không biết nói thế nào nữa, chính bạn cũng phải bao biện nào là dịch lướt, nào là vẫn bám đúng nghĩa, chả biết có phải từ câu của tôi cố tình làm rườm rà ra rồi bảo tôi lấy của anh ta không nữa.
Đến đây thiết nghĩ cũng không cần phải giải thích làm gì thêm cái định nghĩa BI nữa phải không bạn, chỉ mất thời gian thôi à.Đúng là potay.com với bạn.
 
Nghe cậu Capser hùng hồn, chắc là anh ấy vô tội thật rồi:


Nếu anh ta có đọc sách Brown và Pierce thấm nhuần đến mức xuất quỷ nhập thần, hẳn nhiên khi tôi hỏi dữ liệu gốc thì anh ta đã biết liền và quăng lên ngay. Đằng này anh ta quăng lên 1 cái bài lòng thòng (link của nó đây http://www.genome.gov/pfv.cfm?pageid=10001475)
và chỉ, nè, những chổ nàynè, đây nè, tui đọc nè.

Nếu anh ta chưa hề đọc sách Brown và Pierce thì như tôi nói, tôi gọi anh ấy là bậc Tổ sư vì anh ấy tư duy i chang Pierce và Brown.

Giờ thì tớ đành hỏi câu này nữa nhé

Sách của Brown, cuốn Genomes 2 thì có trên mạng rồi, bản printed cũng đã có ở VN. Thế còn cuốn Genetics của Pierce thì sao cậu Casper, cậu có bản nào, PDF, printed, hay online? Tôi có giới thiệu trang 562 rồi, giờ cậu thử xem coi trang 561, 563 có cái gì vậy?

Dưới đây là link mà tác giả VN đã đăng 1 phần tập tài liệu anh ấy (chỉ đến trang 16-20 gì đó). Bản Word và PDF tôi có giữ vì tôi là người giúp anh ấy chỉnh sửa phần hình. Trong Word có thủ thuật là dò code sẽ biết cái document này có author, ngày viết, ngày sửa, đúng vậy không. Nếu anh chị nào muốn biết thì xin mail cho tớ

cothuongnhauthitim@yahoo.com

tớ sẽ gửi phần 5 cho mà đọc (nếu cần thì cả xấp tài liệu)




http://www.ttvnol.com/f_257/297091.ttvn
http://www.ttvnol.com/f_257/298154.ttvn
http://www.ttvnol.com/f_257/297523.ttvn
http://www.ttvnol.com/f_257/298551.ttvn
http://www.ttvnol.com/f_257/trang-8.ttvn?dropTime=10&dropSortBy=0&dropSortType=0

Tác giả chỉ post đến trang 20 thì ngưng, nhưng chú ý phần mục lục. Sẽ thấy cấu trúc mục 5.1.1 đến 5.1.4


ok, từ từ nhé
 
Tôi là người bày ra cái trò này, nay tôi cũng xin là ngừơi thu gom quét dọn nó lại, mặc dù vậy, nếu có ai muốn bơi móc thì chắc tôi cũng sẵn lòng mà chìu ý thiên hạ.

Tôi không thích nói nhiều, mà dạy dỗ người khác nơi chốn đông người lại càng không nên. Site này mới ra lò, như cái bánh mì còn nóng hôi hổi, thèm thuồng còn không hết, lấy đâu ra cái việc là lấy xô nước tạt vào ổ bánh mì này.

Biển học là mênh mông, không ai dám chê anh dốt, không ai dám chê anh ngu, chẳng ai dám chê anh bất tài nếu anh trả lời: tôi không biết, tôi không hiểu, và tôi không giải quyết vấn đề này được.

Trí tuệ của anh vẫn đươc người đời trọng dụng; trí thông minh của anh vẫn được người đời tán thưởng; năng lực của anh vẫn được người ta đánh giá cao. Nhưng đó chỉ là cái bên ngòai, nói đúng hơn là cái mà người ta tung hô để lợi dụng sức lực, trí tuệ anh nhằm phục vụ cho mục đích riêng của họ. Nhưng người ta vĩnh viên coi anh là cỏ rác nếu anh không có phẩm giá đạo đức.

Văng vẳng đâu đây tôi có nghe trong site này còn vang lên tiếng nói rằng: có tài mà không đức là vô dụng. Vâng chính xác là vậy. Mà cái chữ đức ấy nó phải khởi nguồn từ sự trung thực. Đầu tiên trung thực chính bản thân mình sau đó là trung thực với mọi người.

Người Việt Nam sắc đá có câu "Một lần bất tín thì trăm vạn lần không tin" ấy thế mà người VN ta lại khoan hồng nói rằng "Đánh kẻ chạy đi chứ ai đánh người chạy lại".
 

Facebook

Thống kê diễn đàn

Threads
11,649
Messages
71,550
Members
56,918
Latest member
sv368net
Back
Top