Genomics: Multiple moulds

Trần Hoàng Dũng

Staff member
This News will ?be translated by THD.


News and Views

Nature 438, 1092-1093 (22 December 2005) | doi:10.1038/4381092b

Genomics: Multiple moulds

André Goffeau1

Top of page
Three species of Aspergillus fungi are the latest organisms to have their genome sequenced. Comparison of the genomes sheds light on, among other things, what endows them with pathogenic or beneficial features.

The genome sequences of three Aspergillus fungi are reported in this issue: Aspergillus oryzae1, used in making the Japanese drink sake; the human pathogen Aspergillus fumigatus2; and the genetic model species Aspergillus nidulans3. The 185 known species of Aspergillus include 20 human pathogens, numerous plant pathogens and a variety of species that we use to produce foods, chemicals and industrial enzymes. The genomes provide a wealth of information about the evolution of this fascinating group of organisms, and about the beneficial or detrimental characteristics of each species.

The sequences, published by teams from Japan, the United States and Europe, cover an average of nearly 95% of each genome. In total across the three species, more than 95 megabases have been sequenced, crammed with over 33,500 protein-coding genes contained on 24 chromosomes (eight chromosomes per species). By comparison, the human genome has about 30,000 protein-coding genes in 3,000 megabases.

Aspergillus oryzae has been used for nearly a thousand years to produce traditional Japanese fermented foods and drinks. Its genome1 has about seven to nine megabases more DNA than A. fumigatus and A. nidulans. To account for this, the authors propose that some genes were transferred to A. oryzae from other species during evolution. The extra DNA stretches are dispersed throughout the genome and are enriched in genes involved in the synthesis and the transport of numerous secondary metabolites — the chemical compounds in an organism that are not directly involved in normal growth, development or reproduction. Secondary metabolites are often specific to one or a few species, so they provide a window on the particular biology of the species.

Species closely related to A. oryzae, such as Aspergillus flavus and Aspergillus niger, have similar gene acquisitions. For instance, the toxic A. flavus has 25 genes encoding proteins involved in the pathway that produces the poisonous 'aflatoxin'. These genes are present in A. oryzae but are not expressed. It is likely that an ancestor of A. flavus passed these genes to A. oryzae, and that they were then inactivated during the subsequent evolution of A. oryzae.

Aspergillus fumigatus is a potentially deadly human pathogen and a major allergen. The A. fumigatus sequence2 pinpoints nine previously unknown allergens, numerous genes involved in the production of specific secondary metabolites, and a set of essential genes that may be potential targets for drugs. However, the factors that underlie the pathogenicity of this species are complex, and their identification required other approaches to complement the genome analysis. For instance, for A. fumigatus to thrive inside warm-blooded creatures such as ourselves, it must be able to tolerate our high body temperature (compared with that of the external environment). Using DNA microarray analysis, a set of 'thermotolerance genes' whose activity increases at 37 °C has been identified. But it seems that warming up to 37 °C is insufficient to turn on many genes that are associated with virulence in this species.

Aspergillus nidulans has long been a model organism used to study the genetics of fungi. Its genome3 was crucial for the comparative analysis of the three aspergilli, but it also had some features of its own to reveal. For instance, the regulation of several of its genes was clarified, with the identification of putative binding sites for gene regulatory factors and control elements, as well as many short open reading frames that lie upstream of genes; these short sequences may stall the expression of neighbouring genes. In addition, the sequence disclosed many previously unknown genes involved in peculiar metabolic (fatty-acid oxidation), developmental (polarized growth) and DNA-repair pathways.

The three species diverged several hundred million years ago, and their genomes differ considerably3. There are almost 3,000 proteins that are closely related, or 'homologous', among the genomes. On average, these proteins have only 68% of their constituent amino acids present in all three genomes — a value comparable to that of proteins homologous between mammals and fish, which diverged around 450 million years ago. Nevertheless, the order of the homologous proteins along chromosomes (synteny) is conserved in the three species, indicating that no whole-genome duplication occurred during evolution. However, large regions lack any synteny because of small tandem repeats, gene rearrangements in the chromosome extremities, and considerable random breakage and rearrangements of syntenic blocks. Such genome reorganization is seen to a greater extent in A. oryzae than in A. fumigatus. The rates of amino-acid evolution within homologous genes are similar for all three species, so the evolution of large structural rearrangements does not parallel the rate of individual amino-acid changes.

The chief revelation from the three-genome comparison is the mating systems in A. fumigatus and A. oryzae. Sexual reproduction in yeast can take place only between individuals of opposite mating type, or 'sex', as determined by mating-type genes. Aspergillus nidulans has two mating-type genes: one contains an alpha box and the other a high-mobility-group (HMG) domain. So each cell can have two sexes at once, and A. nidulans is self-fertile. Aspergillus nidulans can also reproduce asexually by 'mitotic reproduction', creating spores that are sprinkled by structures known as conidiophores.

Aspergillus fumigatus and A. oryzae were believed to reproduce only through the asexual mitotic process. Unexpectedly, however, the A. oryzae and A. fumigatus genomes each have a mating-type gene: the A. oryzae sequence contains an alpha mating-type gene, whereas the A. fumigatus sequence has an HMG mating-type gene. These genes occupy nearly identical positions in their respective genomes, with conserved synteny for 1.7 megabases on either side. In addition, 215 genes implicated in different phases of the A. nidulans mating process occur in A. oryzae and A. fumigatus. These and other recent data4 raise the possibility that A. fumigatus and A. oryzae are heterosexual, and that conversion of bisexuality to heterosexuality occurred during the evolution of the Aspergillus genus (Fig. 1).

Figure 1: Evolutionary model of the Aspergillus mating genes.

In a bisexual common ancestor, the two mating-type genes, alpha (red) and HMG (blue), were fused head to tail on the same chromosome and share a similar flanking, regulatory region (green). In the bisexual A. nidulans, the chromosome is broken and the two mating-type genes end up on different chromosomes (with their flanking regions). In the ancestor of A. oryzae and A. fumigatus, the two mating-type genes dissociate in different strains, but remain flanked by similar genes. After speciation, both A. fumigatus and A. oryzae become fully heterosexual, with some isolates having only the alpha mating type and others only the HMG mating type, both being in similar chromosomal environments.

High resolution image and legend (28K)

These reports describe only the initial examination of the genomes, of course, and the sequences provide much scope for further analyses. The sequencing of other Aspergillus genomes is under way and will provide an even broader perspective on the biology and evolution of these fungi. The most keenly anticipated Aspergillus sequence is that of A. niger, which has long been used in the industrial production of citric acid5. The commercial significance of several Aspergillus species has meant that their genome sequences, including that of A. niger, have been kept behind the closed doors of biotechnology companies for some time. However, this practice seems to be changing: a consortium of Japanese companies has agreed to release its A. oryzae sequence, and Monsanto provided access to its A. nidulans genome sequence, so that they could be added to the publicly funded sequences now published. And, fortunately, the US Department of Energy has undertaken to complete one of the industrial A. niger sequences (which is currently of low coverage) to make public a useful version of this genome. Perhaps the time when genome sequences belong exclusively to industry is over.

Top of page
Trên tờ Narure số  428 (22-12-2005), trình tự genome 3 loài nấm mốc Aspergillus đã được  công bố. Cụ thể Aspergillus oryzae, loài thường được dùng để sản xuất rượu sake truyền thống của Nhật; nấm Aspergillus fumigatus loài gây bệnh trên người và Apsergillus nidulans thường được dùng như một mô hình trong các nghiên cứu di truyền. Cũng cần nhắc lại rằng giống Aspergillus có khoảng 185 loài, trong đó có 20 loài gây bệnh cho người, nhiều loài gây bệnh cho thực vật và nhiều loài được con người ứng dụng để sản xuất thực phẩm, hóa chất và các enzyme công nghiệm. Do đó thông tin di truyền từ bộ gene 3 loài Aspergillus vừa công bớ đã cung cấp nguồn thông tin dồi dào không chỉ về quá trình tiến hóa mà còn cung cấp thông tin về các đặc tính có lợi và có hại của từng loài.

Các trình tự này được công bố từ nhóm các nhà khoa học bao gồm Nhật, Mỹ và Châu Âu, tỷ lệ trình tự mỗi genome mà họ đọc được đạt khoảng 95%. Tổng dung lượng genome từ 3 loài đã đọc là 95 Megabase, bao gồm 33.500 gene mã hóa protein  chứa trong 24 nhiễm sắc thể (8 NST mỗi loài). So sánh với bộ gene người, chúng ta nhớ lại rằng bộ gene người dài đến 3000 Megabase nhưng chứa chỉ 30.000 gene mã hóa protein. Cho thấy hệ số nén chặt gene trong genome của Apergillus khá cao.

Aspergillus ogyzae, loài đã được sử dụng gần một ngàn năm nay để sản xuất thực phẩm và đồ uống lên men   cổ truyền của Nhật Bản. Genome của nó dài hơn genome của A. fumigatus và A. niduland khoảng 7-9 Mb. Để giải thích cho trường hợp này, các nhà khoa học giả định rằng đã có một số gene được chuyển từ loài khác sang A. ozyrae trong quá trình tiến hóa. Hơn nữa, phần DNA phụ trội (dài hơn) này không nằm trung trong genome mà ngược lại chúng phát tán nữa khắp bộ gene, đặc biệt chúng chứa khá nhiều gene liên quan đến tổng hợp và vận chuyển  nhiều chất chuyển hóa bậc hai - tức là những hợp chất hóa học không liên quan trực tiếp đến sự tăng trưởng, phát triển và sinh sản bình thường của sinh vật. Các chất chuyển hóa bậc hai thường mang tính đặc hiệu cho loài. Do vậy, việc tìm thấy các gene liên quan đến chất chuyển hóa bậc hai sẽ giúp chúng ta hiểu biết kỹ hơn về đặc tính sinh học đặc hiệu của loài quan tâm.

Quan sát các loài tương cận với A. ozyrae chẳng hạn A. flavus và A. niger, các nhà khoa học cũng thấy bọn này cũng có phương thức "chiêu mộ" gene tương tự. Chẳng hạn loài A. flavus có 25 gene mã hóa cho các protein liên quan đến con đường tạo ra độc tố "aflatoxin". Điều khá ngạc nhiên là các gene "gây độc" này cũng hiện diện ở loài A. ozyrae nhưng may mắn là chúng không biểu hiện. Điều này gợi ý rằng tổ tiên của A. flavus đã chuyển các gene "gây độc" vào A. oryzae, nhưng sau đó chúng đã bất hoạt trong quá trình tiến hóa của A. ozyrae.

Aspergillus fumigatus là loài nấm mốc gây các căn bệnh chết người và là một dị ứng nguyên không thể coi thường. Trình tự A. fumigatus đã chỉ ra 9 gene liên quan đến hiện tượng dị ứng không biết đến trước đây, cũng như nhiều gene liên quan đến quá trình sản xuất các chất chuyển hóa bậc hai đặc biệt, và một chuỗi các gene  cơ bản có thể là cái đích tiềm năng cho thuốc tác dụng lên. Tuy nhiên, các tác giả nghiên cứu nhận dịnh rằng các yếu tố đóng vai trò nền tảng cho quá trình phát sinh bệnh của loài A. fumigatus này khá là phức tạp, do đó để nhận diện đầy đủ bọn chúng, các nhà khoa học cần phải sử dụng những khuynh hướng nghiên cứu khác để bổ sung cho khuynh hướng phân tích genome đang dùng. Chẳng hạn, loài A. fumigatus phát triển rất mạnh trong loài sinh vật máu nóng (như con người chúng ta), do đó mà chúng có khả năng chịu được  nhiệt độ cơ thể cao (so sánh với nhiệt độ môi trường ngoài). Bằng cách sử dụng kỹ thuật DNA microarray, các nhà khoa học đã xác định được  một chuỗi các gene gọi là "gene chịu nhiệt" mà toàn bộ hoạt động của chúng tăng cao ở 37oC. Tuy nhiên điều may mắn là khi nhiệt độ tăng lên 37oC thì nó không đủ sức bật nhiều gene liên quan đến độc tính của loài này.

Loài Aspergillus nudulans từ đâu đã được dùng như một sinh vật mô hình nghiên cứu di truyền của nấm. Do đó mà bộ gene của nó được xem là cốt yếu để tiến hành   phân tích so sánh  ba loài Aspergillus, tuy nhiên bản thân bộ gen của A. nudulans cũng có những đặc tính riêng biệt cần được khám phá. Chẳng hạn, sự điều hòa vài gene riêng biệt đã được xác lập, trong đó các nhà khoa học đã nhận diện vị trí được giả định là nơi các yếu tố điều hòa và điều khiển phiên mã sẽ gắn lên.  Ngoài ra, các nhà nghiên cứu còn tìm thấy  nhiều khung đọc mở nhỏ  nằm ở vùng  thượng nguồn của gene có thể đóng vai trò ngăn cản sự biểu hiện của của gene nằm kề dưới nó. Thông qua bộ gene, các nhà khoa học còn tìm thấy nhiều gene, mà người ta không biết tới, liên quan đến nhiều quá trình sinh học khác thường như: quá trình trao đổi chất (oxy hóa acid béo), phát triển (tăng trưởng theo cực) và con đường sửa sai DNA.

Cấu trúc và tốc độ tiến hóa genome

Kết quả phân tích so sánh genome cho thấy 3 loài Aspergillus này đã phân ly từ hàng trăm triệu năm trước và do đó bộ gene của chúng khác biệt rấr đáng xem xét. Tính toán cho thấy có khoảng 3000 protein có liên hệ gần với nhau hoặc "homologous" trong bộ gene. Trung bình, các protein này có khoảng 68% acid amine cơ định hiện diện trong tất cả 3 bộ gene - đây là một con số đáng so sánh về sự tương đồng protein giữa thú có vú và cá vốn phân ly khoảng 450 triệu năm trước. Tuy thế mà trật  tự của các protein tương đồng dọc theo nhiễm sắc thế (synteny = sự tương kề) lại được bảo tồm nghiêm ngặt ở cả 3 loài, cho thấy rằng không có sự nhân genome trong suốt quá trình tiến hóa. Tuy nhiên, các vùng genome lớn lại thiếu sự tương kề (sự tương kề syntency được hiểu là 2 gene hay 2 locus nằm liền kề nhau trên một NST và giữa chúng có thể có hoặc không có sự liên kết về mặt di truyền). Nguyên nhân là  do  các vùng lặp lại sóng đôi trước sau kích thước nhỏ  nằm chen lẫn trong genome, vì thế các gene thường được tái sắp xếp nằm ở các đầu của NST, làm gián đoạn ngẫu nhiên và tái  sắp xếp các khối tương kề. Cấu trúc genome như thế này thường được thấy ở A ozyzae hơn là ở A. fumigatus.

Xem xét tốc độ tiến hóa các acid amin ở các gene tương đồng cho thấy tốc độ này giống nhau ở cả 3 loài. Điều này cho thấy sự tiến hóa ở cấp độ vĩ mô (tức sự tái sắp xếp ở mức nhiễm sắct thể hay từng đoạn cấu trúc lớn) không song hành với tốc độ vi mô (tức tốc độ thay đổi từng acid amine).

Giới tính của nấm mốc

Kết quả quan trọng bậc nhất thu được từ sự so sánh 3 bộ gene đó là hệ thống lai (giao phối) ở hai loài A.fumigatus và A. oryzae. Sự sinh sản hữu tính ở nấm men diễn ra giữa hai cá thể có giới tính đối nghịch và điều này được xác định nhờ 1 gene dạng giới tính. Aspergillus nidulans có cả hai gene giới tính: một gene chứa hộp alpha và một gene chứa nhóm có khả năng di động cao (high mobility group HMG - là những protein được đặt tên dựa trên độ di động của chúng khi chạy trên trường diện di). Do đó mà mỗi tế bào  Aspergillus nidulans có hai giới tính và vì thế mà chúng là loài tụ thụ. Loài này còn có thể sinh sản vô tính bằng cách tạo ra bào tử để rồi sau đó các bào tử này phát tán thông qua cuống bào tử đính.

Trước đây người ta cho rằng A. oryzae và A. fumigatus sinh sản vô tính qua quá trình phân chia đẳng nhiễm. Nhưng kết quả phân tích genome cho thấy rằng mỗi loài trong chúng nó đều có mang gene giới tính. Cụ thể: A. oryzae mang gene giới tính kiểu alpha còn A. fumigatus mang gene giới tính kiểu HMG. Các gene này chiếm đóng vị trí trong genome gần như giống nhau với khối liền kề chiếm khoảng 1,7 Mb tính về 1 phía. Ngoài ra người còn tìm thấy 215 gene tham gia vào pha biệt hóa giới tính ở A. nidulans cũng được tìm thấy ở A. oryzae và a. fumigatus. Dữ liệu này cho thấy một khả năng rằng A. fumigatus và A oryzae là loài dị giới tính, đồng thời sự bảo tồn từ dạng lưỡng tính đến dị tính đã diễn ra trong suốt quá trình tiến hóa.

Các công trình này chỉ mới mô tả những thí nghiệm khởi đầu trên genome, dĩ nhiên, trình tự này sẽ cung cấp thông tin quý giá cho nhiều mục đích nghiên cứu khác. Các nhà nghiên cứu hy vọng rằng trình tự genome của nhiều loài Asperillus khác đang giải mã sẽ sớm hoàn chỉnh, từ đó giúp các nhà khoa học hiểu rõ ràng và sâu sắc hơn sinh học và tiến hoá của giống Aspergillus. Loài Aspergillus được mong chờ nhất là A. niger, vốn là loài đã và đang được sử dụng trong công nghiệp sản xuất acid citric. Người ta hồ nghi rằng trình tự thông tin của một số loài Aspergillus có giá trị thương mại, bao gồm cả A. nider,  có thể đã được đọc trình tự nhưng chúng bị các công ty công nghệ sinh học cất giữ như một dạng thông tin bí mật. Tuy nhiên người ta cho rằng trong tương lai tình hình sẽ khác đi: một tổ hợp các công ty Nhật Bản đã đồng ý cho các ngân hàng gene công cộng sử dụng trình tự genome A oryzae và A.nidulas một cách rộng rãi mà không thu lệ phí. Một tin vui đó là Bộ Năng lượng Mỹ đang đọc trình tự A. niger và gần hoàn chỉnh, bộ genome của loài này cũng sẽ được sử dụng không thu phí khi nó hoàn tất. Vì thế mà người ta cũng cho rằng thời kỳ trình tự genome là thông tin công nghệ bí mật đã chấm dứt.

Mô hình tiến hóa của gene giới tính ở nấm Aspergillus.

Figure: Ở tổ tiên chung, đặc tính lưỡng giới được thể hiện ở sự tồn tại 2 gene giới tính: gene alpha (màu đỏ) và gene HMG (màu xanh); hai gene này hợp nhất cùng nằm trên cùng 1 NST, có chung đoạn liên sườn nhưng đối nghịch về hướng phiên mã. Quá trình tiến hóa đã phân ly thành loài A. nidulans hiện tại lưỡng tính, nhưng NST đã bị đứt đoạn và hai gene giới tính nằm ở hai đầu mút của hai NST khác nhau nhưng đoạn liên sườn vẫn còn giữ ở mỗi gene giới tính. ?Trong khi đó ở tổ tiên chung của hai loài A. oryzae và A. fumigatus, hai gene giới tính lại phân tách thành hai loài riêng biệt nhưng vẫn giữa vùng liên sườn ở cả hai gene. Sau khi trình biệt hóa thành loài mới, cả hai ?A. oryzae và A. fumigatus trở thành loài dị giới đầy đủ, tức là một cá thể chỉ có thể có hoặc gene giới tính alpha hoặc HMG.


Thống kê diễn đàn

Latest member