1 / 53

Д. А. Равчеев

Д. А. Равчеев. Регуляция транскрипции в прокариотах. Изучение методами сравнительной геномики. Факультет Биоинженерии и Биоинформатики , Московский Государственный Университет им. М.В. Ломоносова Учебно-научный центр “ Биоинформатика ” Институт Проблем Передачи Информации РАН.

fisseha
Télécharger la présentation

Д. А. Равчеев

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Д. А.Равчеев Регуляция транскрипции в прокариотах Изучение методами сравнительной геномики Факультет Биоинженерии и Биоинформатики, Московский Государственный Университет им. М.В. Ломоносова Учебно-научный центр “Биоинформатика” Институт Проблем Передачи Информации РАН

  2. Изучение регуляции методами сравнительной геномики • Поиск потенциальных регуляторных последовательностей • Пример: сайты связывания факторов транскрипции • Что дает изучение регуляции с помощью сравнительной геномики • Полезно для функциональной аннотации и метаболической реконструкции • Интересно само по себе • Исследование эволюции

  3. Консенсусная последовательность: ACGCAAACGTTTGCGT Поиск потенциальных регуляторных сайтов Поиск по консенсусу Обучающая выборка – набор сайтов (обычно экспериментально определенных), на основании которого строится представление о структуре сигнала. Пример: Ген Сайт purLtccACGCAAACGGTTTCGTcag cvpAcctACGCAAACGTTTTCTTttt purCgatACGCAAACGTGTGCGTctg purHgttGCGCAAACGTTTTCGTtac purRtaaAGGCAAACGTTTACCTtgc prsAcgcAAGAAAACGTTTTCGCgag codBcccACGAAAACGATTGCTTttt purEgccACGCAACCGTTTTCCTtgc purMgtcTCGCAAACGTTTGCTTtcc Обучающая выборка: Поиск потенциального сайта в геномной последовательности : ACGCAAACGTTTGCGT carA atgcaatcttcttgctgCGCAAgCGTTTtCcagaacaggttagatgatctttttgtcgctt 11 нуклеотидов из 16 совпадают с консенсусом

  4. Поиск потенциальных регуляторных сайтов Поиск по консенсусу Недостатки метода: 1. Не учитывается разная значимость позиций Абсолютно консервативная позиция Консервативная позиция с малым числом замен Слабо консервативная позиция ACGCAAACGGTTTCGT ACGCAAACGTTTTCTT ACGCAAACGTGTGCGT GCGCAAACGTTTTCGT AGGCAAACGTTTACCT AAGAAAACGTTTTCGC ACGAAAACGATTGCTT ACGCAACCGTTTTCCT TCGCAAACGTTTGCTT 2. Не учитывается разность частот нуклеотидов в одной позиции А – 11% С – 0% G – 33% T – 56%

  5. Поиск потенциальных регуляторных сайтов Матрицы позиционных весов Обучающая выборка: Вес каждого нуклеотида в каждой позиции : purLACGCAAACGGTTTCGT cvpAACGCAAACGTTTTCTT purCACGCAAACGTGTGCGT purHGCGCAAACGTTTTCGT purRAGGCAAACGTTTACCT prsAAAGAAAACGTTTTCGC codBACGAAAACGATTGCTT purEACGCAACCGTTTTCCT purMTCGCAAACGTTTGCTT Характеризует встречаемость данного нуклеотида в данной позиции Характеризует консервативность данной позиции Консенсус: ACGCAAACGTTTGCGT Матрица(фрагмент) N (b,k) позиция A C G T a c g t 0.32 -0.27 -0.03 -0.03 -0.03 0.32 -0.03 -0.27 -0.16 -0.16 0.48 -0.16 • 1 7 0 1 1 • 2 1 7 1 0 • 30 0 9 0

  6. Поиск потенциальных регуляторных сайтов Матрицы позиционных весов Поиск потенциального сайта в геномной последовательности : carA atgcaatcttcttgctGCGCAAGCGTTTTCCAgaacaggttagatgatctttttgtcgctt a c g t 0.32 -0.27 -0.03 -0.03 -0.03 0.32 -0.03 -0.27 -0.16 -0.16 0.48 -0.16 0.12 0.35 -0.24 -0.24 0.48 -0.16 -0.16 -0.16 0.48 -0.16 -0.16 -0.16 0.40 0.03 -0.21 -0.21 -0.16 0.48 -0.16 -0.16 -0.16 -0.16 0.48 -0.16 -0.03 -0.27 -0.03 0.32 -0.21 -0.21 0.03 0.40 -0.16 -0.16 -0.16 0.48 -0.06 -0.30 0.13 0.23 -0.16 0.48 -0.16 -0.16 -0.31 0.04 0.17 0.11 -0.21 0.03 -0.21 0.40 Вес сайта: Вес найденного сайта: 4,57 позиция Недостаток метода: • ложные предсказания сайтов, вызванные случайным сходством последовательностей

  7. Поиск потенциальных регуляторных сайтов Распознающее правило Матрица позиционных весов Область поиска сайтов 1. 2. 3. как привило, в потенциальной реуляторной области гена:- 400 … +100 п.н. от старта трансляции. Пороговое значение для веса сайта а) Минимальный вес сайтов из обучающей выборки Сайты из обучающей выборки, оцененные по матрице весов Ген Сайт Вес cvpA purL purH purC purM purE codB purR prsA 6,23 5,94 5,94 5,81 5,79 5,78 5,55 5,53 5,32 ACGCAAACGTTTTCTT ACGCAAACGGTTTCGT GCGCAAACGTTTTCGT ACGCAAACGTGTGCGT TCGCAAACGTTTGCTT ACGCAACCGTTTTCCT ACGAAAACGATTGCTT AGGCAAACGTTTACCT AAGAAAACGTTTTCGC пороговое значение б) В соответствии с ожидаемым размером регулона

  8. Сравнительный подход к изучению регуляции Метод проверки соответствия Базовый геном гены сайты

  9. Сравнительный подход к изучению регуляции Метод проверки соответствия Базовый геном Другие геномы Ген регулируется

  10. Сравнительный подход к изучению регуляции Метод проверки соответствия Базовый геном Другие геномы Ген регулируется Ген НЕ регулируется

  11. Сравнительный подход к изучению регуляции Метод проверки соответствия Базовый геном Другие геномы ? Ген регулируется Ген НЕ регулируется

  12. Сравнительный подход к изучению регуляции Ключевые понятия Регулон (Regulon) • группа генов, непосредственно регулирующихся одной регуляторной системой в одном организме Обобщенный регулон (Regulog) • группа генов, непосредственно регулирующихся одной регуляторной системой в группе родственных организмов

  13. Сравнительный подход к изучению регуляции Ключевые понятия Регулон 1 Геном 1 Регулон 2 Геном 2 Регулон 3 Геном 3 Регулон 4 Геном 4

  14. Сравнительный подход к изучению регуляции Ключевые понятия Регулон 1 Геном 1 Регулон 2 Геном 2 Регулон 3 Геном 3 Регулон 4 Геном 4 Обобщенный регулон

  15. Сравнительный подход к изучению регуляции Ключевые понятия Регулон 1 Геном 1 Регулон 2 Геном 2 Регулон 3 Геном 3 Регулон 4 Геном 4 Обобщенный регулон Ядро обобщенного регулона

  16. Открытие BioY, транспортера биотина Исследование обобщенного BirA-регулона • Биотин (витамин Н) – кофактор ферментов карбоксилаз и декарбоксилаз, служит переносчиком карбоксильных групп • BirA – фактор транскрипции, репрессор, регулятор генов биосинтеза биотина Rodionov D.A., Mironov A.A., Gelfand M.S. (2002) Conservation of the biotin regulon and the BirA regulatory signal in Eubacteria and Archaea. Genome Res. 12 (10). 1507-1516. Исследование BirA-зависимой регуляции впрокариотах: • Бациллы • Клостридии • Актинобактерии • Зеленые серные бактерии • Цианобактерии • Археи

  17. Открытие BioY, транспортера биотина Исследование обобщенного BirA-регулона bioY – новый член обобщенного BirA-регулона • имеет консервативные сайты связывания BirA во всех исследованных геномах • не имеет гомологов с известной функцией • в белкахсемейства BioY обнаружено шесть потенциальных трансмембранных сегментов

  18. Открытие BioY, транспортера биотина Дополнительные соображения Хромосомные кластеры • гены располагаются в одном опероне или просто рядом на хромосоме • такое расположение сохраняестя в различных геномах bioY кластеризуется с: 1. cbiO-cbiQ – предполагаемые компоненты ABC-транспортной системы (Указывает нато, что BioY может выполнять транспортную функцию) 2. Гены биосинтеза жирных кислот. (Биотин является кофактором карбоксилаз, ферментов данного метаболического пути) 3. birA.

  19. Цинк-зависимая регуляция паралогов рибосомных белков Паралоги рибосомных белков Makarova K.S., Ponomarev V.A., Koonin E.V. (2001)Two C or not two C: recurrent disruption of Zn-ribbons, gene duplication, lineage-specific gene loss, and horizontal gene transfer in evolution of bacterial ribosomal proteins.Genome Biology.2(9). RESEARCH 0033. • L36, L33, L31, S14 – единственные рибосомные белки, дуплицированные более, чем в одном геноме • L36, L33, L31, S14– четыре из семи рибосомных белков, содержащих мотив цинковой ленты: четыре эволюционно консервативных цистеина (в некоторых случаях один из них может быть заменен на гистидин) • В случае наличия нескольких паралогов, одна изкопийL36, L33, L31, S14содержит мотив цинковой ленты, тогда как другие – нет

  20. Цинк-зависимая регуляция паралогов рибосомных белков Паралоги рибосомных белков Makarova K.S., Ponomarev V.A., Koonin E.V. (2001)Two C or not two C: recurrent disruption of Zn-ribbons, gene duplication, lineage-specific gene loss, and horizontal gene transfer in evolution of bacterial ribosomal proteins.Genome Biology.2(9). RESEARCH 0033.

  21. Цинк-зависимая регуляция паралогов рибосомных белков Panina E.M., Mironov A.A., Gelfand M.S. (2003) Comparative genomics of bacterial zinc regulons: enhanced ion transport, pathogenesis, and rearrangement of ribosomal proteins. Proc. Natl. Acad. Sci. U.S.A.100(17).9912-9917 Исследование цинк-зависимой регуляции:

  22. Цинк-зависимая регуляция паралогов рибосомных белков • Обнаружены паралоги рибосомных белков в других геномах (выделены жирным) • Найдены потенциальные сайты связывания регуляторов метаболизма цинка перед паралогами, не имеющими цинковой ленты.

  23. Цинк-зависимая регуляция паралогов рибосомных белков ? Зачем Zn-зависимым регуляторам контролировать синтез рибосомных белков Гипотеза • Известно, что Zn является необходимым компонентом ряда ферментов Достаточно Zn Недостаток Zn Рибосомные белки Ферменты • В случае недостатка Zn часть в рибосому включаются белки, не содержацие цинка: рибосома «отдает» часть цинка ферментам

  24. Цинк-зависимая регуляция паралогов рибосомных белков Гипотеза Недостаток Zn Достаточно Zn Рибосомные белки Ферменты Экспериментальное подтверждение дляL31Bacillus subtilis Nanamiya H., Akanuma G., Natori Y., Murayama R., Kosono S., Kudo T., Kobayashi K., Ogasawara N., Park S.M., Ochi K., Kawamura F. (2004) Zinc is a key factor in controlling alternation of two types of L31 protein in the Bacillus subtilis ribosome.Mol. Microbiol.52(1).273-283.

  25. Биосинтез лейцина в дрожжах • Начинается в митохондрии, заканчивается в цитоплазме • Транспортер промежуточного продукта, изопропилмалата, не известен Кандидат: YOR271cp • Локализован в митохондрии • Предсказаны 4 трансмембранных сегмента • Имеется консервативный сайт связывания лейцинового регулятора Leu3p • Регуляторная область YOR271c связывает Leu3p в ChIP-chip эксперименте • Гомологичен транспортеру трикарбоксилатов крысы (хотя чувствительность и специфичность эксперимента ~50%, других кандидатов с консервативными сайтами нет)

  26. Изучение эволюции регуляции Историк - это вспять обращенный пророк Г. Гегель Однажды Гегель ненароком И, вероятно, наугад Назвал историка пророком, Предсказывающим назад Б. Пастернак • Предсказание новых членов регулона способствует пониманию устройства прокариотической клетки • Изучение эволюции регуляторных систем

  27. Регуляция биосинтеза NAD Экспериментальные данные Escherichia coliи Salmonella spp. Структура белка NadR: никотинамид-нуклеотидаденилтрансферазный рибозилникотинамидкиназный ДНК-связывающий NadR-регулон:

  28. Регуляция биосинтеза NAD Данные сравнительной геномики Enterobacteriales Pasteurellales • Отсутствует ДНК-связывающий домен

  29. Регуляция биосинтеза NAD Данные сравнительной геномики Enterobacteriales Pasteurellales • Исчезновение регулона

  30. Регуляция биосинтеза NAD Данные сравнительной геномики Enterobacteriales • Ген nadA регулируется у всех предствителей порядка Enterobacteriales

  31. Регуляция биосинтеза NAD Данные сравнительной геномики Enterobacteriales • Гены nadBи pncB регулируются у близких родственников E. coliа также уS. marcescens

  32. Регуляция биосинтеза NAD Данные сравнительной геномики Enterobacteriales • Авторегуляция nadRобнаружена у ряда организмов, формирующих отдельную ветвь на филогенетическом дереве

  33. Регуляция биосинтеза NAD Модель эволюции I.Появление нового регулятора 1. Pasteurellales – регулон отсутствует, иногда белок не имеет ДНК-связывающего домена 2. Enterobacteriales – белок используется в качестве фактора транскрипции a)Регуляция гена nadA b1)Регуляция генов nadB и pncB b2)Авторегуляция гена nadR • Регуляторные взаимодействия могут менятся даже в близкородственных геномах и даже в случае регуляции важных метаболических путей Gerasimova A.V., Gelfand M.S. (2005) Evolution of the NadR regulon in Enterobacteriaceae. J. Bioinform. Comput. Biol. 3(4). 1007-1019.

  34. Эволюция FruR-регулона Экспериментальные данные FruR (Cra)Escherichia coli K-12 • Фактор транскрипции, относится к LacI-семейству • Связывается с ДНК в отсутствии лигандов, в присутствии лигандов диссоциирует от ДНК • Может являться как репрессором, так и активатором • Координирует потоки метаболизма углеводов лиганды • активация транскрипции • репрессия транскрипции

  35. Эволюция FruR-регулона Предсказанная регуляция Enterobacteriales Pasteurellales Vibrionales Pseudomonadales • исследован 21 геном из 4х порядков • предсказана регуляция 7 оперонов Предсказан регуляторный каскад Экспериментальные данные • активация транскрипции • репрессия транскрипции • предсказанная регуляция

  36. Эволюция FruR-регулона Модель эволюции FruR – изначально регулятор единственного оперона fruBKA • регуляция оперона fruBKA сохраняется в большинстве геномов

  37. Эволюция FruR-регулона Модель эволюции Регулон отсутствует FruR – изначально регулятор единственного оперона fruBKA • Pasteurellales: • в ряде геномов не найдено ортологов для FruR • в других геномах отсутствуют консервативные сайты перед предполагаемыми членами регулона

  38. Эволюция FruR-регулона Модель эволюции Расширение регулона, FruR – глобальный регулятор Регулон отсутствует FruR – изначально регулятор единственного оперона fruBKA • Enterobacteriales: • FruR регулирует гены фосфотрансферазных систем, гликолиза/глюконеогенеза, цикла Кребса, NADH-дегидрогеназы, а также глобального регулятора CRP

  39. Эволюция FruR-регулона Модель эволюции Дальнейшее расширение регулона Расширение регулона, FruR – глобальный регулятор Регулон отсутствует FruR – изначально регулятор единственного оперона fruBKA • Escherichia coliиSalmonella spp.: • FruR также регулирует опероны mtlADR, fbp, pckAиaceBAK

  40. Новые тенденции в сравнительной геномике 1. Исследование нескольких функционально связанных регуляторных систем • Восстановление оксидов азотав различных группах бактерий Rodionov D.A., Dubchak I.L., Arkin A.P., Alm E.J., Gelfand M.S. (2005) Dissimilatory metabolism of nitrogen oxides in bacteria: comparative reconstruction of transcriptional networks.PLoS Comput. Biol.1. e55. Ravcheev D.A., Gerasimova A.V., Mironov A.A, Gelfand M.S. Complex comparative genomic analysis of respiration regulation in gamma-proteobacteria. Genome Biol. [in press] 2. Изучение таксон-специфической регуляции • Сравнение геномов организмов, относящихся к одной таксономической группе • Развитию методики способствует увеличение количества полных геномных последовательностей

  41. Изучение таксон-специфической регуляции Классическая методика Enterobacteriales базовый геном Pasteurellales

  42. Изучение таксон-специфической регуляции Классическая методика Enterobacteriales базовый геном Таксон-специфичная регуляция Pasteurellales • Проведена стандартная процедура проверки соответствия

  43. Изучение таксон-специфической регуляции Классическая методика - недостатки Enterobacteriales базовый геном • Ни в базовом геноме, ни в геномах родственных видов не найдено сайтов Потеря данных о таксон-специфичной регуляции Pasteurellales

  44. Изучение таксон-специфической регуляции Модифицированная методика • Базовый геном не рассматривается • В центре внимания – геномы организмов из исследуемого таксона Попарное сравнение Поиск сайтов во всех геномах Pasteurellales • P. multocida • actinomycetemcomitans • H. influenzae • H. ducreyi Ген регулируется Ген НЕ регулируется

  45. Экспериментальные данные Escherichia coli Стимул Анаэробные условия Нитрат/Нитрит Сенсор Регулятор Регуляция транскрипции

  46. Данные сравительной геномики Yersinia spp., Pasteurellales, Vibrionales Стимул Анаэробные условия Нитрат/Нитрит Сенсор Регулятор Регуляция транскрипции • Нитрат-нитритное дыхание регулируется лишь одной регуляторной системой

  47. Исследованные геномы • Попарное сравнение всех геномов из одного таксона • Исследование сразу трех регуляторных систем: Enterobacteriaceae Pasteurellaceae • Fnr • ArcA • NarP Vibrionaceae

  48. Регуляторные каскады Escherichia coli - репрессия экспериментальные данные - активация - амбивалентная регуляция - предсказанная активация • Fnr – главный регулятор, контролирующий экспрессию генов других регуляторов • Сложная система регуляторных каскадов для регуляторов нитрат-нитритного дыхания

  49. Регуляторные каскады Yersinia spp. • Fnr – главный регулятор • NarP не участвует в регуляторных каскадах • Редукция NarP регулона

  50. Регуляторные каскады Vibrionales • Fnr – главный регулятор • Увеличение ролиArcA в регуляторных каскадах • Увеличение ArcA регулона

More Related