1 / 34

Arabidopsis thaliana genome

Arabidopsis thaliana genome. Cover illustrations Foreground shows wild-type A. thaliana , background shows a mutant in which all floral organs are converted to petals. Analysis of the genome sequence of the flowering plant Arabidopsis thaliana

austin
Télécharger la présentation

Arabidopsis thaliana genome

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Arabidopsis thaliana genome Cover illustrations Foreground shows wild-type A. thaliana, background shows a mutant in which all floral organs are converted to petals

  2. Analysis of the genome sequence of the flowering plant Arabidopsis thaliana [Nature 408:796-815 (2000 December)] The Arabidopsis Genome Initiative (Abstract) • 125 Mb (1.25  108 bp) genome 중에서 115.4 Mb의 염기서열 분석 완료. centromeric region들은 분석 중 • At는 whole-genome duplication 후에 계속적인 gene loss와 광범위한 local gene duplication에 의하여 진화 • Plastid는 cyanobacterial-like ancestor로 부터 lateral gene transfer에 의하여 dynamic하게 genome이 enrich • At에는 25,498개의 유전자가 약 11,000개 family의 단백질을 encode. 이미 분석 완료된 진핵생물인 Drosophila와 Caenorhabditis elegans와 유사

  3. (Introduction) genome analysis에서 At의 장점 (1) number of offspring, (2) Short generation time, (3) Small size, (4) Large number of offspring, (5) Relatively small nuclear genome 1996년 The Arabidopsis Genome Initiative (AGI): genome sequencing 시작 다음과 같은 내용들을 이 논문에 보고함. (1) predicted gene들에 대한 설명 (2) Functional category로 assignment (3) chromosome dynamics and architecture (4) transposable element들과 other repeat들의 분포 (5) organelle들로부터 lateral gene transfer 설명 (6) 다른 At accession (single-seed descent로 유지된 계통)들과 다른 식물 종들과의 비교 defense, photomorphogenesis, gene regulation, development, metabolism, transport and DNA repair 등 식물 특이적인 기능들을 요약

  4. (Overview of sequencing strategy) Large-insert BAC, phage, transformation-competent artificial chromosome (TAC) library들을 이용 genome sequencing 초기에는 79개 cosmid clone 이용 Columbia 품종의 physical map을 BAC clone들의 RFLP fingerprinting 분석, STS의 hybridization 및 PCR, Southern blotting으로 완성 47,788개 BAC clone들의 contig를 연결하여 분석 완성 Sequencing 정확도는 99.99와 99.999%에 해당 염기서열 분석이 완료된 길이는 총 115,409,949 bp 분석이 완료되지 않은 centromeric and rDNA repeat region들이 약 10 Mb정도 일 것이므로, 총 genome size는 약 125 Mb로 추정. 지금까지 다른 방법을 이용하여 보고된 50-150 Mb 범위 내의 크기. 589 cytoplasmic tRNAs, 27 organelle-derived tRNAs, 13 pseudognes 관찰. 지금까지 보고된 다른 어떤 genome에서 보다도 많음

  5. 총 46 tRNA families가 61개의 codon을 decode spliceosomal RNA들 (U1, U2, U4, U5, U6)은 모두 At에서 발견 At; 25,498 유전자, Ce; 19,099 유전자, Dm; 13,601 유전자 tandem gene duplication과 segmental duplication이 극히 많이 존재 centromeric region들과 chr2와 ch4의 rDNA repeat region은 repetitive structure and content 때문에 분석이 완료되지 못함.

  6. Figure 1 Representation of the Arabidopsis chromosomes. Each chromosome is represented as a coloured bar.

  7. (Characterization of the coding regions) 69% 유전자는 알려진 단백질 유전자와 match (Fig. 2) 25,498 개의 예상되는 유전산물 중에서 약 30%는 functional category에 포함할 수 없었음 At와 Escherichia coli, Synechocystis sp.(남조류-원핵), Saccharomyces cerevisiae, Caenorhabditis elegans (선충), Drosophila, Homo sapiens비교 분석 Transcription에 관여하는 At 단백질의 8-23%만 다른 진핵 genome과 유사. 이는 많은 식물 transcription factor들이 독립적으로 진화되었을 것으로 추정 반면, 단백질 합성에 관여하는 유전자들의 48-60%가 유사. 이는 highly conserved gene function을 반영 At와 bacterial protein 간의 match는 ‘metabolism’과 ‘energy’에서 가장 많았음 – plastid의 선조격인 bacteria로 부터 유전자를 받아들였을 뿐 아니라 모든 종에서 high conservation of sequences At의 많은 redundancy는 segmental duplications and tandem arrays로 나타남 총 11,601 protein type들이 관찰

  8. Figure 2. Functional analysis of Arabidopsis genes. a, Proportion of predicted Arabidopsis genes in different functional categories. b, Comparison of functional categories between organisms.

  9. 35%는 genome에서 unique. 5 member 이상인 family는 Dm (12.1%)나 Ce (24.0%) 보다 높았음 (37.4%) (Fig. 3) At의 gene family나 singleton의 개수는 다른 다세포 생물과 동일 범위. 11,000-15,000 type의 proteome 2 member 이상의 gene family로 있는 유전자 비율은 다른 진핵세포 보다 높았음 Pro-Pro-Arg repeat (involved in RNA stabilizing and RNA processing)을 갖는 단백질들은 yeast, fly, worm (총 10개)에 비하여 월등하게 많았음 (400 proteins) Protein kinase와 associate domain, 병 저항성 signature를 갖는 단백질 (169개), Toll/IL-1R (TIR) domain (pathogen recognition component)도 풍부 – 다른 생명체에 비하여 식물은 pathogen과 diverse environmental cue들에 반응하는 경로가 복잡할 것으로 예상됨 289개의 Human disease gene들 중에서 139 (48%)는 At에서 BLASTP E<10-10, 69 (24%)는 E<10-40, 26 (9.3%)는 E<10-100의 범위에서 hit 적어도 17개의 human disease gene들은 Sc, Dm, Ce 유전자보다도 At에서 더 유사하였음

  10. Figure 3. Distribution of tandemly repeated gene arrays in the Arabidopsis genome.

  11. (Genome organization and duplication) At에는 4,140 individual gene들이 1,528 tandem array를 형성하고 있고, 23개까지 array된 것도 관찰. 즉, At의 유전자들의 약 17%가 이러한 tandem array로 구성 MUMmer 프로그램을 사용하여 5개의 염색체를 both orientation으로 align하였을 때, large segmental duplication이 관찰되었는데, 100 kb 이상의 24개 large duplicated segment들이 확인 – At genome의 약 58% (65.6 Mb) 이러한 많은 duplication들은 shuffling에 의한 것으로 보임 (duplication event 후의 local inversion 등) TBLASTX를 이용하여 gene level에서 분석하였을 때, 위의 DNA level에서 분석한 것 보다 높은 약 60% genome (67.9 Mb)이 duplicated region (Fig. 4) Duplicated gene의 sequence conservation 정도는 매우 다양하였음. Segment들 내의 17,193 gene 중에서 6,303 (37%)는 highly conserved (E<10-30), 1,705 (10%)는 less significant similarity (E<10-5)

  12. Figure 4. Segmentally duplicated regions in the Arabidopsis genome.

  13. What does the duplication in the At genome tell us about the ancestry of the species? (1) 식물계에서 polyploidy는 오래 전부터 존재하였고, 식물 진화의 주요한 factor이었음 (2) At genome의 대부분이 duplicated segment라는 점은 옥수수와 같이 At도 아마 tetraploid ancestor가 존재했다는 의미 (3) At와 tomato의 comparative sequence analysis에서 볼 때 duplication은 112 Myr 전에 발생하여 tetraploid를 형성 (4) Duplicated segment의 conservation의 정도는 결국 ancestral autotetraploid form으로 부터 divergence되어진 정도를 반영하거나, 혹은allotetraploid ancestor에 존재하던 differences를 반영함

  14. (Comparative analysis of Arabidopsis accessions) At 계통들간의 high rates of polymorphism 관찰. 다른 식물 종처럼 주로 병 저항성에 관련된 유전자좌에 집중 Columbia (Col-0) 와 Landsberg erecta (Ler) 를 비교하였을 때, 주로 single nucleotide polymorphisms (SNPs)와 insertion-deletions (InDels) 존재 총 25,274 SNPs (an average density of 1 SNP per 3.3 kb) 관찰 – Transition (A/T  G/C)는 SNPs의 52.1%, transversion은 나머지: A/T  T/A, 17.3%; A/T  C/G, 22.7% and C/G  G/C, 7.9% 총 14,570 InDels (an average spacing of 6.1 kb) 관찰 (2 bp to 38 kb 크기의 변화). 하지만 95%는 50 bp보다도 작았음 Col-0에서 250 bp 보다 큰 insertion 416개를 분석한 결과, 30%는 transposon-related protein – 이는 transposon insertion or excision에 의한 결과 Gene structure도 small InDel과 SNP에 의하여 영향 받음. SNP와 InDel의 위치는 87,427 exons와 70379 introns에 mapping Exon, intron, intergenic region에서의 SNP 빈도는 각각 3.1, 2.2, 3.5 kb 마다 1 SNP InDel 빈도는 각각 9.3, 3.1, 4.3 kb 마다 1개를 보였다.

  15. (Comparison of Arabidopsis and other plant genera) Closely related된 식물 종간의 genome organization은 광범위하게 보존되었음 At와 Capsella rubella (shepherd’s purse; 냉이)는 6.2-9.8 Myr 전에 나누어졌다고 생각됨. Gene content와 genome organization이 매우 유사하고, exon length and intron position도 매우 보존적임 At와 Brassica속 (cabbage and mustard)은 12.2-19.2 Myr 전에 diverge된 것으로 추정 Coding region의 85%이상이 서로 유사하였고, genome structure가 매우 유사함 – Brassica속은 extensive triplication and rearragnement, and extensive divergence of microstructure (Fig. 3 supplement) At와 tomato는 약 150 Myr 전에 lineage가 diverge되었고, rice와는 약 200 Myr 전. Tandem gene duplication의 높은 발현빈도와 single gene의 현격한 deletion 및 인접 유전자들의 small group deletion등을 고려할 때, unequal crossing over는 plant genome microstructure의 진화에 중요한 mechanism으로 작용 (혹은 추가적인 mechanism이 있을 것으로 생각)

  16. Figure 3 (supplement). Intergenome comparisons.. Comparison of the structures of the three segments of the genome of B. oleracea related to the region of the Arabidopsis genome containing gene models At4g17260-At4g17800. Conserved genes are indicated by a closed circle, and an open circle indicates no conserved gene.

  17. (Integration of the three genomes in the plant cell) 식물의 세가지 genome (nucleus, plastids, mitochondria)들은 gene number, organization and stability에서 현격한 차이 Plastid gene들은 모든 식물에서 highly conserved plastid는 cyanobacterial lineage, mitochondria는 proteobacteria에서 endosymbiosis 두 소기관은 특정 막단백질의 set들을 갖는다. 엽록체의 유전자 61% 와 미토콘드리아의 유전자 88%는 housekeeping 소기관으로 targeting되는 핵의 유전자 산물들은 원래 organelle genome에 encode되어 있었으나, evolutionary history 과정에서 nuclear genome으로 이전 At nuclear genome과 다른 종의 organelle genome에서 만들어지는 단백질을 비교 분석한 결과, 14 mitochondrial and 44 plastid 단백질과 아주 유사하다고 결론 Genome들간의 유전자 이전은 아직도 계속된다고 보여짐 핵 내에 plastid DNA insertion (17 insertions totalling 11 kb)은 단백질이나 tRNA들을 encode하는 full-length gene들도 포함되어 있고 유전자의 fragment, intron 혹은 intergenic region들도 포함

  18. (Transposable elements) TE는 RNA intermediate (cDNA)를 통해 복제되는 retrotransposon (class I)과 DNA form으로 directly move하는 class II로 나뉨 At에서 TE는 genome의 적어도 10%를 차지 (intergenic DNA의 1/5). Class I (2,109) and II (2,203) elements와 several new groups (1,209) elements 포함 다른 식물 genome에서 공통으로 발견되는 TE는 모두 At에서 발견. copia- and gypsy-like long terminal repeat (LRT) retrotransposons, long interspersal nuclear elements (LINEs), short interspersed nuclear elements (SINEs), hobo/Activator/Tam3 (hAT)-like elements, CACTA-like elements, and miniature inverted-repeat transposable elements (MITEs) Basho와 Mutator-like elements (MULEs)는 At에서 처음 발견. Basho는 mononucleotide ‘A’가 target site이며 식물에서 고루 분포. MULEs는 sequence diversity가 매우 높고, long terminal inverted repeats (TIRs)가 없는 경우가 많다. Genome이 큰 식물은 class I이 대부분을 차지하나, At는 class I이 많지 않으며, 주로 centromere 부위에 있다. 반면에 Basho elements와 class II (such as MITEs and MULEs)는 pericentromeric domain 주변에 우점 (Fig. 5)

  19. Figure 5. Distribution of class I, II and Basho transposons in Arabidopsis chromosomes. The frequency of class I retroelements (green), class II DNA transposons (blue) and Basho elements (purple) are shown at 100-kb intervals along the five chromosomes of At.

  20. (rDNA, telomeres and centromeres) Nucleolar organizers (NORs)는 18S, 5.8S and 25S rRNA gene들의 unit repeat들로 array되어 있으며, RNA pol I에 의해 transcription 이들 RNA들은 RNA pol II로 전사된 5S RNA와 함께 세포질 ribosome의 structural and catalytic core 형성 At에서 NOR는 염색체 2와 4의 telemeres에 바로 붙어 있고, uninterrupted unit으로 존재 5S RNA genes는 염색체 3, 4, 5의 centromeric regions에 heterogeneous arrays로 존재 (Fig. 6) 두개의 NOR는 3.5 – 4.0 Mb이며, 약 350-400 개의 highly methylated rRNA gene units으로 구성 (각각 약 10 kb) At의 telomere는 CCCTAAA repeat으로 구성되어 있으며 평균 약 2 – 3 kb At의 centromere DNA는 분석이 완료되지 않았는데, 약 180-bp repeat들이 3 Mb로 있으며, 5S rDNA를 갖는다. At centromere는 다른 고등생물과 마찬가지로 많은 repetitive elements를 포함 (retroelements, transposons, microsatellites, middle repetitive DNA) 적어도 47 expressed gene들이 centromere에서 발견

  21. Figure 6. Predicted centromere composition. Genetically defined centromere boundaries are indicated by filled circles; fully and partially assembled BAC sequences are represented by solid and dashed black lines, respectively.

  22. (Membrane transport) At의 plasma and intracellular 막에 있는 transporter들은 organic and inorganic ion의 acquisition, redistribution and compartmentalization에 관여하고, toxic compound와 metabolic end product들을 배출하며, energy and signal transduction과 turgor generation에도 관여 At에는 600개 이상의 predicted membrane transport system 존재. Ce (약 700 transporters)와 비슷하며, Sc나 Ec (약 300개)의 2배에 해당 Sodium ion P-type ATPase pump를 사용하여 plasma membrane을 가로지르는 electrochemical gradient를 만드는 동물과는 달리, 식물과 곰팡이는 large membrane potential (-250 mV)을 형성하는 proton P-type ATPase pump를 사용 (Fig. 7a ) At transporter의 약 15%는 channel protein이며 단세포 생물 보다는 5배가 많으나 Ce의 절반이었음 (Fig. 7b ) At에는 phosphate, sulphate, nitrate, chloride와 같은 inorganic anion transprter와 signal transduction이나 cell homeostasis에 작용하는 metal cation channel도 있음 Ser/Thr protein kinase를 coding하는 At gene은 약 1,000개. Peptide가 plant signaling에 중요 역할을 한다는 의미 Transporter 중에서 약 12%는 sugar transporter로 예상

  23. Figure 7. Comparison of the transport capabilities of Arabidopsis, C. elegans and S. cerevisiae. Pie charts show the percentage of transporters in each organism according to bioenergetics (a) and substrate specificity (b).

  24. (DNA repair and recombination) DNA repair/recombination pathway들은 다양한 기능을 수행 (maintaining genomic integrity, regulating mutation rates, chromosome segregation and recombination, genetic exchange within and between populations, and immune system development). At도 대부분의 다른 진핵생물과 비슷한 set로 DNA repair and recombination (RAR) gene들을 갖고 있음. At는 대부분의 주요 DNA repair class들을 포함. Recombination (4개의 RecA), DNA ligation (4 개 DNA ligase I), photoreactivation (1 개 class II photolyase and 5 개 class I photolyase homologue), nucleotide excision repair (6 개 RPA1, 2 개 RPA2, 2 개 Rad25, 3 개 TFB1, 4 개 Rad23) At는 DNA base glycosylase (비정상정인 DNA base들을 인식하여 sugar-phosphate backbone으로 부터 절단하는 효소) 의 16개 homologue들을 포함 Chloroplast origin으로 보이는 repair gene homologue로는 recombination protein인 RecA, RecG and SMS, class I photolyase homologue 2개, Fpg, MutS2 단백질 2개, transcription-repair coupling factor인 Mfd 등이 발견 RAR에 중요한 단백질 중에서 At에 없는 것은 alkyltransferases, MSH4, RPA3, many components of TFIIH (TFB2, TFB3, TFB4, CCL1, Kin28)이었음

  25. (Gene regulation) Eukaryotic gene expression에는 많은 단백질이 관여됨. 즉, chromatin structure modulation, transcriptional machinery에 기여, developmental, environmental or metabolic cue에 따른 gene regulation mediation 등. At에는 3,000 개 이상의 이러한 작용 단백질이 존재 – 다른 진핵생물 보다 유전자 조절이 매우 복잡할 것으로 예상 DNA methylation mediating gene silencing과 parental imprinting 등 부가적인 gene regulation도 존재 At는 8 개의 DNA methyltransferases (DMTs) – 3 type 중에서 2 type은 포유동물 DMT와 동일, 한가지 type (chromomethyltransferase)은 식물에서만 unique. Yeast나 Ce에는 DMT가 없음. 초파리에서는 2개의 DMT-like gene이 발견 At에는 Dm과 Ce 보다 각각 2배, 3배 이상으로 많은 transcription factor들을 포함

  26. (Cellular organization) 식물 cytoskeleton의 주성분은 microtubules (MTs)와 actin filaments (AFs). Intermediate filaments (IFs)는 식물에서는 발견되지 않음. At에는 동물 IFs의 주성분인 cytokeratin or vimentin 유전자는 없지만, actin,  and tubulin의 변형체는 존재 At에는 동물세포나 yeast에서 tubulin과 actin polypeptide의 folding을 매개하는 chaperone의 homologue들을 coding At에는 MT를 dynamic하게 조직화하거나 MT track을 따라 짐의 운반에 관여하는 dynactin complex protein인 kinesin과 dynein 같은 motor molecule들을 포함 At에는 vesicle budding에 관련된 단백질 homologue들을 coding (ARFs, ARF-related small G-proteins, large but not small ARF GEFs (adenosine ribosylation factor on guanine nucleotide exchange factor), adapter proteins, coat proteins of the COP and non-COP types) 두 가지 결론: (1) At와 진핵세포는 vesicle trafficking, cytoskeleton and cell cycle과 같은 intracellualr activity에 common feature가 있음. (2) cytoskeleton의 조직과 cytokinesis 같은 진화적으로 divergent feature들이 식물세포벽에 관련된 것으로 보임

  27. (Development) 동물에서 처럼, At의 developmental regulation은 cell-cell communication, transcription factors의 일련의 과정, chromatin state의 조절 등을 포함 식물과 동물, 두 kingdom의 발육과 관련된 과정들은 오랫동안 독립적 진화가 있었다는 것이 밝혀짐 식물도 homeobox 유전자를 갖고 있으며, 동물도 MADS box 유전자를 갖고 있음 Cell-cell communication에서 보면, 식물은 receptor tyrosine kinase가 없는 것 같으나, At에는 적어도 340 개의 receptor Ser/Thr kinase 유전자가 있음 몇 family들은 cell-cell communication에 관여한다고 알려진 기능의 member들이었음. CLV1 receptor는 meristem cell signaling에, S-glycoprotein homologues는 자가불화합성의 Brassica속의 pollen to stigma signaling에, BRI1 receptor는 brassinosteroid signaling에 필수 발육 관련된 At의 몇몇 유전자들은 동물이나 곰팡이 단백질과의 연관성이 적고 오히려 cyanobacteria-like genome으로 부터 유래된 것으로 보임

  28. (Signal transduction) 환경 signal로는 light, pathogen attack, temperature, water, nutrients, touch and gravity들을 들 수 있음 Auxin 같은 호르몬은 식물체에 흡수되어지지만, ethylene, brassinosteroids, peptide CLV3 같은 호르몬들은 원형질막에 있는 receptor kinase들의 ligand로서 작용 signal이 세포의 어디에서 인식되든지, 핵으로 transduce되며, 결과적으로 gene expression의 양상을 변화 At, Ce, Dm의 comparative genome 분석으로 식물은 고유의 signal transduction pathway를 갖고 있음이 밝혀짐 척추동물, flies, worms에 일반적으로 적용되는 signaling pathway와 관련된 component들은 At에서 전혀 발견되지 않았음 (Wingless/Wnt, Hedgehog, Notch/lin12, JAK/STAT, TGF-/SMADs, receptor tyrosine kinase/Ras, the nuclear steroid hormone receptors) Mammalian genome의 signal transduction에 관여하는 G-protein-coupled receptors (GPCRs)와 seven-transmembrane protein들은 abundant함. At에서 27 개 GPCR-related domain 과 18 개 seven-transmembrane protein이 발견 (직접적인 실험 결과는 없음) At에는 MAP kinase들도 대량 발견되었다. 다른 진핵생물 보다 월등히 많은 약 20개가 발견

  29. (Recognizing and responding to pathogens) 식물은 pest, parasite, pathogen에 항상 노출되어 있기 때문에 많은 방어 기작이 발달되었음 Mammal에서 parasite recognition을 coding하는 MHC gene에서의 polymorphism은 저항성에 연관되는데, 식물의 parasite recognition에 관련된 disease resistance (R) 유전자들은 고도로 polymorphic함 저항성 유전자에 의한 parasite recognition은 다양한 signaling molecules (protein kinases and adapter proteins, ion fluxes, reactive oxygen intermediates and nitric oxide)을 통한 defense mechanism들을 trigger시킴 따라서 defense gene들의 transcriptional activation과 hypersensitive response라고 불리는 programmed cell death의 형태에 의하여 pathogen colonization을 저지 At의 많은 유전자좌에 다양한 resistance gene들이 위치하고 있음. 유전자들은 염색체에 불균등하게 분포. 염색체 1번에 49개, 2 번 2 개, 3 번 16 개, 4 번 28 개, 5 번에 55 개 발견

  30. (Photomorphogenesis and photosynthesis) 빛은 energy source로 작용할 뿐 아니라, 광 주기 등의 복잡한 발육과정의 trigger 및 modulator로서 작용 빛은 유묘 출현기에 특히 중요. chlorophyll production, leaf development, cotyledon expansion, chloroplast biogenesis, coordinated induction of many nuclear- and chloroplst-encoded genes에 관여 (photomorphogenesis). Light perception and signaling에 관여하는 후보 유전자 100 개 이상과 광합성 관련 핵 유전자 139개를 확인 이미 보고된 light photoreceptor들로는 red/far-red absorbing phytochrome (PHYA-E) 5개, blue/UV-A absorbing cryptochrome (CRY1 and CRY2) 2 개, NPH1-like (or NPL1) 1개 관찰 새롭게 발견된 것으로는 COP/DET/FUS, PKS1, PIF3, NDPK2, SPA1, FAR1, GIGANTEA, FIN219, HY5, CCA1, ATHB-2, ZEITLUPE, FKF1, LKP1, NPH3 and RPT2 Phytochrome은 N-terminal chromophore-binding domain 1개, PAS domain 2개, C-terminal Ser/Thr kinase domain 1개를 포함 At에 새로운 phytochrome-like gene은 없고, PAS와 kinase domain을 갖는 4 개 predicted protein을 확인

  31. Photosynthetic reaction center와 light-harvesting complex들의 component들, CO2 fixation and pigment biosynthesis에 관련된 효소들을 찾아 본 결과, 11 개의 core proteins of PSI과 8 개의 PSII protein들을 확인 또한 chlorophyll-a/b binding protein 18 개 (8 Lhca and 18 Lhcb)와 cytochrome b6f complex의 7 개 subunit 중에서 1개 (PetC)는 nuclear genome에 있었고, 나머지들 (PetA-D, PetG, PetL, PetM)은 엽록체에 encode Chloroplast ATP synthase complex 9 개 subunit 중에서 II-, -, -subunit은 핵에서, 나머지 (I, III, IV, , , )는 엽록체에서 encoded Electron transfer chain의 soluble component들을 coding하는 유전자 10개 (2 plastocyanins, 5 ferredoxins and 3 ferredoxin/NADP oxidoreductases) 확인 40 개의 유전자가 CO2 fixation에 역할 (Calvin-Benson cycle의 전체 효소 포함) Pigment biosynthesis에는 chlorophyll biosynthesis의 16개 유전자와 carotenoid biosynthesis의 31 개 유전자 확인

  32. (Metabolism) Photosynthesis, respiration, intermediary metabolism, mineral acquisition과 lipids, fatty acids, amino acids, nucleotides, cofactor 합성의 대사과정 효소를 encode 420 개 이상의 유전자가 cell-wall polymer synthesis와 modification에 관여 12개 유전자가 cellulose synthase를 code하고, 29 개 다른 유전자가 주요 다당류 합성 효소의 6개 family를 code 40개 이상의 다른 식물 cell type들은 각각 독특한 cell wall의 특징을 가짐. 아주 많은 수의 유전자가 wall metabolism에 관여한다고 추정되지만 연구가 극히 미진 고등식물에서는 100,000 개 이상의 secondary metabolite들이 생산 Cytochrome P450 family들은 metabolic complexity가 진화되도록 한 주요 인자이며, haem-containing protein의 superfamily로서 대부분 NADPH- and O2-dependent hydroxylation reaction들을 촉매 식물 P450은 다양한 생화학 과정에 참여 (synthesis of plant products, such as phenylpropanoids, alkaloids, terpenoids, lipids, cyanogenic glycosides and glucosinolates, and plant growth regulators, such as gibberellins, jasmonic acid and brassinosteroids)

  33. At에는 약 286 개의 P450유전자, Dm은 94 개, Ce는 73 개, yeast에는 단지 3 개의 유전자가 있음 이렇게 많은 유전자들 중에서 단지 몇 개의 식물 P450 유전자만 characterized 되었고, 많은 연구가 필요함 (Concluding remarks) 완두의 유전에서 확립된 Mendel 법칙이 재발견되면서 20세기가 시작 되었다면, 모델 식물체인 Arabidopsis의 전체 유전적 완성을 밝히면서 마감되었다고 볼 수 있음 At, Ce, Dm은 비슷하게 약 11,000-15,000 개의 다른 type의 단백질들을 함유. 이 숫자는 다양한 다세포 진핵 생물체에서 요구되는 minimal complexity일 것으로 추정 다른 진핵생물와 비교하였을 때, At는 gene copy가 특별히 많았음. 두 가지로 설명 가능한데, 첫째, At에는 개별 유전자가 independent amplification에 의해 광범위한 tandem and dispersed gene family가 생성되었고, unequal crossing over 가 predominant mechanism으로 작용되었음. 둘째, 전체 genome의 ancestral duplication과 subsequent rearrangement들은 다시 segmental duplication을 생성

  34. Basic intracellular process (such as translation or vesicle trafficking)들은 대체적으로 보존적이며, 공통의 eukaryotic heritage를 반영 Intercellular process (including physiology and development)들은 명확히 다르다는 것이 확인 반면에 DNA repair는 동물계 내에서 보다 식물과 동물 사이에 highly conserved하다. 이는 DNA methylation 같은 common factor들을 반영 또한 plastid의 endosymbiotic ancestor의 많은 유전자들은 핵으로 이전되었고, 이들은 photoautotrophic growth와 signaling에 다양한 역할을 수행

More Related