1 / 81

Биоинформатика

Биоинформатика. Распознавание генов. Таблица генетического кода. Поиск генов если известен белок: просто. … или родственный белок: тоже просто. TTT. F. TCT. S. TAT. Y. TGT. C. TTC. F. TCC. S. TAC. Y. TGC. C. TTA. L. TCA. S. TAA. stop. TGA. stop. TTG. L. TCG. S. TAG.

tanner
Télécharger la présentation

Биоинформатика

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Биоинформатика

  2. Распознавание генов

  3. Таблица генетического кода

  4. Поиск генов если известен белок: просто

  5. … или родственный белок: тоже просто

  6. TTT F TCT S TAT Y TGT C TTC F TCC S TAC Y TGC C TTA L TCA S TAA stop TGA stop TTG L TCG S TAG stop TGG W CTT L CCT P CAT H CGT R CTC L CCC P CAC H CGC R CTA L CCA P CAA Q CGA R CTG L CCG P CAG Q CGG R ATT I ACT T AAT N AGT S ATC I ACC T AAC N AGC S ATA I ACA T AAA K AGA R ATG M/ start ACG T AAG K AGG R GTT V GCT A GАT D GGT G GTC V GCC A GАC D GGC G GTA V GCA A GАA E GGA G GTG V GCG A GАG E GGG G Генетический код: стоп-кодоны

  7. Открытые рамки считывания Ген должен располагаться внутри области от стоп-кодона до следующего стоп-кодона (в той же фазе)

  8. Сильное перепред-сказание (Aeropyrum pernix)

  9. TTT F TCT S TAT Y TGT C TTC F TCC S TAC Y TGC C TTA L TCA S TAA stop TGA stop TTG L TCG S TAG stop TGG W CTT L CCT P CAT H CGT R CTC L CCC P CAC H CGC R CTA L CCA P CAA Q CGA R CTG L CCG P CAG Q CGG R ATT I ACT T AAT N AGT S ATC I ACC T AAC N AGC S ATA I ACA T AAA K AGA R ATG M/ start ACG T AAG K AGG R GTT V GCT A GАT D GGT G GTC V GCC A GАC D GGC G GTA V GCA A GАA E GGA G GTG V GCG A GАG E GGG G Генетический код: синонимы

  10. Codon usage (статистика употребления кодонов) • частоты кодонов отличаются от частот триплетов в некодирующих областях • различия в частотах аминокислот в белках • различия в частотах синонимичных кодонов • частоты синонимичных кодонов • специфичны для генома • коррелируют с концентрациями тРНК

  11. GenMark, окно 96 нт

  12. TTT F TCT S TAT Y TGT C TTC F TCC S TAC Y TGC C TTA L TCA S TAA stop TGA stop TTG L TCG S TAG stop TGG W CTT L CCT P CAT H CGT R CTC L CCC P CAC H CGC R CTA L CCA P CAA Q CGA R CTG L CCG P CAG Q CGG R ATT I ACT T AAT N AGT S ATC I ACC T AAC N AGC S ATA I ACA T AAA K AGA R ATG M/ start ACG T AAG K AGG R GTT V GCT A GАT D GGT G GTC V GCC A GАC D GGC G GTA V GCA A GАA E GGA G GTG V GCG A GАG E GGG G Генетический код: старт-кодоны

  13. Начала генов Bacillus subtilis dnaN ACATTATCCGTTAGGAGGATAAAAATG gyrA GTGATACTTCAGGGAGGTTTTTTAATG serS TCAATAAAAAAAGGAGTGTTTCGCATG bofA CAAGCGAAGGAGATGAGAAGATTCATG csfB GCTAACTGTACGGAGGTGGAGAAGATG xpaC ATAGACACAGGAGTCGATTATCTCATG metS ACATTCTGATTAGGAGGTTTCAAGATG gcaD AAAAGGGATATTGGAGGCCAATAAATG spoVC TATGTGACTAAGGGAGGATTCGCCATG ftsH GCTTACTGTGGGAGGAGGTAAGGAATG pabB AAAGAAAATAGAGGAATGATACAAATG rplJ CAAGAATCTACAGGAGGTGTAACCATG tufA AAAGCTCTTAAGGAGGATTTTAGAATG rpsJ TGTAGGCGAAAAGGAGGGAAAATAATG rpoA CGTTTTGAAGGAGGGTTTTAAGTAATG rplM AGATCATTTAGGAGGGGAAATTCAATG

  14. Участок связывания рибосом dnaN ACATTATCCGTTAGGAGGATAAAAATG gyrA GTGATACTTCAGGGAGGTTTTTTAATG serS TCAATAAAAAAAGGAGTGTTTCGCATG bofA CAAGCGAAGGAGATGAGAAGATTCATG csfB GCTAACTGTACGGAGGTGGAGAAGATG xpaC ATAGACACAGGAGTCGATTATCTCATG metS ACATTCTGATTAGGAGGTTTCAAGATG gcaD AAAAGGGATATTGGAGGCCAATAAATG spoVC TATGTGACTAAGGGAGGATTCGCCATG ftsH GCTTACTGTGGGAGGAGGTAAGGAATG pabB AAAGAAAATAGAGGAATGATACAAATG rplJ CAAGAATCTACAGGAGGTGTAACCATG tufA AAAGCTCTTAAGGAGGATTTTAGAATG rpsJ TGTAGGCGAAAAGGAGGGAAAATAATG rpoA CGTTTTGAAGGAGGGTTTTAAGTAATG rplM AGATCATTTAGGAGGGGAAATTCAATG

  15. Сравнительный анализ (один и тот же ген в нескольких геномах) Гены консервативнее, чем межгенные области (точнее, особенности эволюции другие) Sty TCGCTCG--CAGCGGAAAGAGGATTACGCCCTTCGCCTGGAGGCTGTGCAGGGGC---GCCGGAGATGGGATGCATAATT Stm TCGCTCG--CAGCGGAAAGAGGATTACGCCCTTCGCCTGGAGGCTGTGCAGGGGC---GCCGGAGATGGGATGCATAATT Sen TCGCTCG--CAGCGGAAAGAGGATTACGCCCTTCGCCTGGAGGCTGTGCAGGGGC---GCCGGAGATGGGATGCATAATT Eco TTGCCCG--TGCCAGACGGCAGATTATCTCCCTGACCTGGTGGTTGCCCAGGAGGAGGGCCGGAAATAGGTTGTATCATT Kpn ----CGG--TGGCGCAGTGCCTGATGGG-CCTCGCCCTGGAGGACGGTCTGGCAT---ATCAGCAAGGGGGTGCGTCATG Ype TTGTTAGAACAGGGGAAAACGGTAAACAGTGTGGCATTAGATGTCGGTTATAGCT-----CCGCCTCTGCTTTTATCGCC * * * * * * * * * * * Sty AATTATCCTTTAAC----------CATAAATCTGAGCAATA-TATGCTTGGCGGCCAGATTATGGC--ACACTTGTCCGG Stm AATTATCCTTTAAC----------CATAAATCTGAGCAATA-TATGCCTGGCGGCCAGATTATGGC--ACACTTGTCCGG Sen AATTATCCTTTAAC----------CATAAATCTGAGCAATA-TATGCCTGGCGGCCAGATTATGGC--ACACTTGTCCGG Eco ACGTATCCTTATAC----------CTGAAATCTTCGCAAG--TATGCCTGGCCGCGAGATTATGGC--ACACTTGTCCGG Kpn ATTCATCCTTTCGATATCGCGGTGCTGGAACCAGGTGATGAGTATGCCTGGCGGCCAGATTATGGC--ACACTTCCCCAG Ype ATGTTTCAGCAAATAT--------CGGGTACCA-CGCCTGAGCGTTTCCGGCGGGGCAATAGTGGCTTATACTAAGCCCC * ** * * * * *** * ** **** * *** ** Sty TTAACTCTCGTT-CTCAAACAG------GTACGACAGTC--GTGAAAATTCTCGTTGATGAAAATATGCCTTACGCCCGC Stm TTAACTCTCGTT-CTCAAACAG------GTACGACAGTC--GTGAAAATTCTCGTTGATGAAAATATGCCTTACGCCCGC Sen TTAACTCTCGTT-CTCAAACAG------GTACGACAGTC--GTGAAAATTCTCGTTGATGAAAATATGCCTTACGCCCGC Eco TTAACTCTCGT--CTCATACAG------GTAACACAAAC--GTGAAAATCCTTGTTGATGAAAATATGCCTTATGCCCGC Kpn TTAACTCTCGTT-CTCAGACAG------GTACTGAACT---GTGAAAATCCTCGTTGATGAAAATATGCCCTATGCCCGT Ype CTGTTTTTCATCTGTATGGCAGTTCGCTGTCGGAGAGTAAAGTGAAAATTCTGGTTGATGAAAATATGCCGTACGCTGAG * * ** * * *** ** * ******** ** ***************** ** ** 123123123123123123123123123123123123123

  16. rbsDв E. coli Eco AGGATTAAACTGTGGGTCAGCGAAACGTTTCGCTGATGGAGAAAAAAATGAAAAAAGGC Eco ACCGTTCTTAATTCTGATATTTCATCGGTGATCTCCCGTCTGGGACATACCGATACGCTG

  17. rbsDв энтеробактериях Sty AGGGTTACACTGCGGC-CAGCGAAACGTTTCGCTAGTGGAGCAGAAAAATGAAGAAAGGC Sen AGGGTTACACTGCGGC-CAGCGAAACGTTTCGCTAGTGGAGCAGAAAAATGAAGAAAGGC Stm GGGGTTACACTGCGGC-CAGCGAAACGTTTCGCTAGTGGAGCAGAAAAATGAAGAAAGGC Eco AGGATTAAACTGTGGGTCAGCGAAACGTTTCGCTGATGGAGAA-AAAAATGAAAAAAGGC Ype TTTTCTAAACTCCTTGTTAGCGAAACGTTTCGCTCTTGGAGTA-GATCATGAAAAAAGGT ** *** **************** ***** * * ***** ***** Sty ACCGTACTCAACTCTGAAATCTCGTCGGTCATTTCCCGTCTGGGGCATACTGATACTCTG Sen ACCGTACTCAACTCTGAAATCTCGTCGGTCATTTCCCGTCTGGGGCATACTGATACTCTG Stm ACCGTACTCAACTCTGAAATCTCGTCGGTCATTTCCCGTCTGGGGCATACTGATACTCTG Eco ACCGTTCTTAATTCTGATATTTCATCGGTGATCTCCCGTCTGGGACATACCGATACGCTG Ype GTATTACTGAACGCTGATATTTCCGCGGTTATCTCCCGTCTGGGCCATACCGATCAGATT * ** ** **** ** ** **** ** *********** ***** *** *

  18. rbsDв энтеробактериях: ответ Sty AGGGTTACACTGCGGC-CAGCGAAACGTTTCGCTAGTGGAGCAGAAAAATGAAGAAAGGC Sen AGGGTTACACTGCGGC-CAGCGAAACGTTTCGCTAGTGGAGCAGAAAAATGAAGAAAGGC Stm GGGGTTACACTGCGGC-CAGCGAAACGTTTCGCTAGTGGAGCAGAAAAATGAAGAAAGGC Eco AGGATTAAACTGTGGGTCAGCGAAACGTTTCGCTGATGGAGAA-AAAAATGAAAAAAGGC Ype TTTTCTAAACTCCTTGTTAGCGAAACGTTTCGCTCTTGGAGTA-GATCATGAAAAAAGGT ** *** **************** ***** * * ***** ***** Sty ACCGTACTCAACTCTGAAATCTCGTCGGTCATTTCCCGTCTGGGGCATACTGATACTCTG Sen ACCGTACTCAACTCTGAAATCTCGTCGGTCATTTCCCGTCTGGGGCATACTGATACTCTG Stm ACCGTACTCAACTCTGAAATCTCGTCGGTCATTTCCCGTCTGGGGCATACTGATACTCTG Eco ACCGTTCTTAATTCTGATATTTCATCGGTGATCTCCCGTCTGGGACATACCGATACGCTG Ype GTATTACTGAACGCTGATATTTCCGCGGTTATCTCCCGTCTGGGCCATACCGATCAGATT * ** ** **** ** ** **** ** *********** ***** *** *

  19. Мораль • Комплексный подход: использование многих разнородных соображений, каждое из которых по отдельности – слабое • Сравнительный подход: одновременный анализ множества геномов (находящихся на различных эволюционных расстояниях друг от друга)

  20. Идеология • Сходство => гомология (общность происхождения) • Гомология => сходная функция • Принцип Пирсона:консервативно то, что важно • функциональные мотивы в белках • регуляторные сайты в ДНК • не обязательно последовательности • структура белка и РНК • расположение генов на хромосоме • ко-экспрессия генов

  21. Transporters • Two main classes • ATP-dependent • TM-protein (permease) • ATPase • Substrate-binding protein • Secondary (symporters, antiporters) • Difficult to study in experiment (compared to enzymes) • Relatively easy to identify • Similarity to known transporters • Prediction of transmembrane segments • Difficult to predict specificity H+

  22. Функциональный анализ транспортеров • Предсказание общей функции • гомология • анализ трансмембранных сегментов • Отнесение к функциональной подсистеме (метаболическому пути) • ко-локализация • ко-регуляция • Предсказание специфичности • анализ филогенетического профиля • конечный продукт биосинтетического пути: присутствует в геномах, не имеющих пути (импорт заменяет биосинтез) • промежуточный продукт биосинтетического пути; может заменять часть пути «выше по течению» • исходный продукт катаболического или биосинтетического пути: не встречается в геномах, где этот путь отсутствует

  23. It is difficult to predict specificity by sequence analysis (nickel-oligopeptide family,substrate-binding NikA)

  24. PnuC family of cofactor transporters

  25. Riboflavin biosynthesis pathway

  26. 5’ UTR regionsof riboflavin genes from various bacteria

  27. Conserved secondary structure of the RFN-element Capitals: invariant (absolutely conserved) positions. Lower case letters: strongly conserved positions. Dashes and stars: obligatory and facultative base pairs N: any nucleotide. X: any nucleotide or deletion

  28. Attenuation of transcription Antiterminator Terminator The RFN element Antiterminator

  29. Attenuation of translation Antisequestor SD-sequestor The RFN element

  30. Рибопереключатель RFN: регуляторный механизм Transcription attenuation Translation attenuation

  31. YpaA/RibU: транспортёр рибофлавина • 5 предсказанных ТМ-сегментов => потенциальный транспортёр • регуляторный RFN-элемент => ко-регуляция с генами метаболизма рибофлавина => транспорт рибофлавина или предшественника • S. pyogenes, E. faecalis, Listeria: естьypaA, нет генов биосинтеза рибофлавина => транспорт рибофлавина Предсказание: YpaA – рибофлавиновый транспортёр (Gelfand et al., 1999) Проверка: • генетический анализ(Кренева и др., 2000) • биохимический эксперимент (Burgess et al., 2006)

  32. Биотиновый транспортер BioY

  33. = thiN (confirmed) Transport of HET Transport of HMP (Gram-positive bacteria) (Gram-negative bacteria) Метаболическая реконструкция тиаминового биосинтеза

  34. yuaJ(=thiT): тиаминовый транспортер (возможно, H+-зависимый) в фирмикутах • 6 предсказанных трансмембранных сегментов • Почти всегда регулируется THI-рибопереключателями • Встречается в геномах, в которых отсутствует тиаминовый путь (Streptococci); • ВB. cereusимпорт тиамина сопряжен с током протонов (Arch. Microbiol., 1977)

  35. thiX-thiY-thiZиykoF-ykoE-ykoD-ykoC: предсказанные АТФ-зависимые транспортеры HMP • Почти всегда регулируются THI-рибопереключателями • Не встречаются в геномах, в которых отсутствует тиаминовый путь • Всегда встречаются вместе сthiDиthiE • В ряде геномов (Pasteurellacee, Brucella некоторые фирмикуты) встречаются в отсутствие thiC

  36. Co и Ni • ко-локализация (хромосомные локусы) • транспортеры Ni – с генами никель-зависимых ферментов • транспортеры Co – с генами синтеза кобаламина • ко-регуляция • транспортеры Ni – фактор транскрипции NikR • транспортеры Co – рибопереключатель В12

  37. Пять семейств транспортеров

  38. Новое семейство транспортеров Co и Ni + CbiN CbiM Ni2+ Co2+ NikM + NikN + NikL, NikK + NikL

  39. Структура локусов гены B12-элемент сайт связывания NikR

  40. Структура cbiO=NikO~bioMcbiQ=NikQ~bioN

  41. Проверка: тест на транспорт ионов Co Co Ni Ni Ni Co

  42. Для транспорта достаточно компонент МN(первый пример такого АВС-транспортера) cbiMNQO cbiMNQ cbiMN cbiM контроль

  43. Вспомним BioY.Действительно, BioY достаточно; у BioMNY более крутая кинетика

  44. Экспериментальные подтверждения рибофлавин тиамин фолат

  45. Дмитрий Родионов • регуляция транскрипции • метаболическая реконструкция • идентификация транспортеров • Алексей Витрещак • рибопереключатели • А.А. Миронов • программное обеспечение • Томас Хеббельн (Берлин) – Cо, Ni, биотин • Андрей Остерман (Сан Диего) – рибофлавин • Эндрю Хансон (Флорида) – тиамин • Дирк Слотблум (Гронинген) – фолат

  46. Transporters • Two main classes • ATP-dependent • TM-protein (permease) • ATPase • Substrate-binding protein • Secondary (symporters, antiporters) • Difficult to study in experiment (compared to enzymes) • Relatively easy to identify • Similarity to known transporters • Prediction of transmembrane segments • Difficult to predict specificity H+

  47. It is difficult to predict specificity by sequence analysis (nickel-oligopeptide family,substrate-binding NikA)

More Related