640 likes | 917 Vues
Системная биология – сети. М.Гельфанд «Сравнительная геномика» БиБи 4 курс, ШБ 2 год, ПФУ(КГУ) весна 201 4. разные сети. метаболические регуляторные сети (фактор-ген) белок-белковые взаимодействия синтетические летали …. свойства сетей. N = количество вершин
E N D
Системная биология – сети М.Гельфанд «Сравнительная геномика» БиБи 4 курс, ШБ 2 год, ПФУ(КГУ) весна 2014
разные сети • метаболические • регуляторные сети (фактор-ген) • белок-белковые взаимодействия • синтетические летали • …
свойства сетей • N = количество вершин • распределение степеней вершин P(k) = вероятность того, что у случайно взятой вершины будет k ребер • средняя длина пути между вершинами L
случайная сеть • пуассоновское распределение P(k) = exp(-λ) λk / k! • Теорема Эрдеша-Реньи: фазовый переход – возникновение гигантской компоненты • средняя длина пути ~ log N
scale-free network(сеть, свободная от масштаба) • P(k) ~ k–γ • γ>3 – ничего особенного • 2<γ<3 – hubs, иерархия • γ=2 большой hub, соединенный с большой долейвершин • При γ<3 удаление случайной вершины не разрушает сеть, удаление hub’а – разрушает • средняя длина пути (при 2<γ<3) ~ log log N
Случайные и scale-free графы: P(k) (линейная и лог. шкалы)
Коэффи-циент класте-ризации • Мера связи между соседями данной вершины
Один путь(метаболизм аргинина и пролина)
Ранг vs. степень вершины для метаболитов и реакций в H. pylori
Transcription regulatory network in baker’s yeast • Downloaded from the YPD database: 1276 regulations among 682 proteins by 125 transcription factors (10 regulated genes per TF) • Part of a bigger genetic regulatory network of 1772 regulations among 908 proteins • Positive to negative ratio 3:1 • Broader distribution of out-degrees (up to 72) and more narrow of in-degrees (up to 21)
регуляция транскрипции (дрожжи, ChIP-chip) • A: in-degree (относительно регулируемых генов):гистограмма (в полулогарифмических координатах) количества промоторов с заданным числом регуляторов– экспоненциальное распределение (у большинства генов мало регуляторов). Пустые кружки – случайный граф • В: out-degree (относительно факторов): гистограмма количества факторов, связывающих заданное количество промоторов – scale-free
Transcription regulatory network in Homo sapiens • Data courtesy of Ariadne Genomics obtained from the literature search: 1449 regulations among 689 proteins • Positive to negative ratio is 3:1 (again!) • Broader distribution of out-degrees (up to 95) and more narrow of in-degrees (up to 40)
Transcription regulatory network in E. coli • Data (courtesy of Uri Alon) was curated from the Regulon database: 606 interactions between 424 operons (by 116 TFs) • Positive to negative ratio is 3:2 (different from eukaryots!) • Broader distribution of out-degrees (up to 85) and more narrow of in-degrees (only up to 6 !)
Yeast protein interaction network • Data from the high-throughput two-hybrid experiment (T. Ito, et al. PNAS (2001) ) • The full set containing 4549 interactions among 3278 yeast proteins • 87% nodes in the largest component • The highest connected protein interacts with 285 others! • Figure shows only nuclear proteins
Гигантская компонента в графе белок-белковых взаимодействий в дрожжах • Красный – летальная мутация • Оранжевый – медленный рост • Желтый – неизвестно • Зеленый – нелетальная мутация
Белок-белковые взаимодействия в дрожжах: P(k) и размеры связных компонент
Предостережения • Экспериментальный шум (узлы и ребра) • Пропуски (не удается экспрессировать) • Лишнее (липкие белки, комплексы) • Дискретизация • Динамика, специфичность • время • Клеточный цикл • Условия • место • Компартменты • Ткани
Что смотрят • Биологическая интерпретация положения белка/гена в сети • Глобальные топологические свойства сетей • Интересные подсети • «графушки», модули • Эволюция • Моделирование • Сравнительный анализ (пока почти нет)
Глобальные свойства сетей Свобода от масштаба / степенное распределение – ой ли? Khanin R, Wit E. How scale-free are biological networks (J Comput Biol. 2006): … Here we study 10 published datasets of various biological interactions and perform goodness-of-fit tests to determine whether the given data is drawn from the power-law distribution. Our analysis did not identify a single interaction network that has a nonzero probability of being drawn from the power-law distribution.
зависимость физиологических и геномных свойств от топологии • дрожжи: • ~10% genes with<5links are essential • >60% genes with >15 links are essential • гены с большим числом связей • с большей вероятностью имеют ортологов в многоклеточных эукариотах • ближе к ортологам из C. elegans
Пьянки и свиданки • Бимодальное распределение корреляций уровня экспрессии • Красный: hubs • Голубой: non-hubs • Черный: случайный граф • Party hubs: сам и соседи ко-экспрессируются (комплексы) • Date hub: нет корреляции в уровнях экспрессии (сигнальные пути)
Устойчивость к атаке (распадение гигантской компоненты)основасети – party hubs • Красный: атака на party hubs • Коричневый: атака на все хабы • Голубой: атака на date hubs • Зеленый: атака на случайные белки
мотивы • клики • много в графах белок-белковых взаимодействий (масс-спек. анализ комплексов – по определению) • подграфы фиксированной структуры, встречающиеся существенно чаще, чем в случайном графе (с теми же свойствами)
Graphlets / motifs Przulj
Регуляторный каскад • R – транскрипционная регуляция • Х – ко-экспрессия
? • R – транскрипционная регуляция • Р – белок-белковое взаимодействие • Н – гомология
Субъединицы факторов транскрипции • R – транскрипционная регуляция • Р – белок-белковое взаимодействие • Н – гомология
? • R – транскрипционная регуляция • Р – белок-белковое взаимодействие • Х – ко-экспрессия • Н – гомология
Регулоны • R – транскрипционная регуляция • Р – белок-белковое взаимодействие • Х – ко-экспрессия • Н – гомология
? • Р – белок-белковое взаимодействие • Х – ко-экспрессия
Ко-экспрессия в комплексах • Р – белок-белковое взаимодействие • Х – ко-экспрессия
? • S – синтетические летали (слабость) • Н – гомология
Взаимозаменяемость паралогов (?) • S – синтетические летали (слабость) • Н – гомология
Четверные мотивы: взаимозаменяемость
Регуляция транскрипции в E.coli • Почти все “bi-fan” мотивы связаны друг с другом
Прямые петли (Feed-forward loops) Динамический ответ • Продолжающийся ответ после снятия стимула • Немонотонный ответ • Ответ на увеличение стимула (в разы), независимо от начального уровня
Метаболизм сахаров в E. coli Uri Alon
Ответ зависит от цАМФ (глюкоза) и сахара Uri Alon
Разложение на две функции ответа Uri Alon
Немонотонный ответ Uri Alon
Модули – существуют ли они? • Клики в графе белок-белковых взаимодействий – комплексы (по построению) • Много алгоритмов для поиска плотных подграфов. Вычислительные и содержательные сложности • Если хабы слабо связаны друг с другом, естественный модель – звезда с центром в хабе
Модули в сети регуляции транскрипции • Заходящие и выходящие степени не коррелируют • Сильная негативная корреляция между выходящей степенью фактора и заходящей степенью регулируемого белка • Глобальные регуляторы действуют на гены, на которые мало кто действует • Потому большие регуляторные модули слабо взаимодействуют друг с другом Maslov S, Sneppen K.
Стратификация сигнальных путей (человек) B-cell EGRF1 Ребра, ведущие назад (красные) – дефосфорилирование, убиквинизация – перезарядка сети Маслов-Исполатов
Человек: 732 белков(71 рецептор), 1671 взаимодействий(фосфорилирование, дефосфорилирование, гидролиз, и т.п.)208 «обратных» связей Маслов-Исполатов
Модульность метаболической сети отражает стиль жизни бактерий Q = ∑s [ls/L – (ds/2L)2] max s номер модуля, s = 1 … K lsколичество ребер в модуле L количество ребер в графе ds сумма степеней вершин модуля Мотивировка: минимизировать количество ребер между модулями (весь граф как модуль даст Q=0; для К несвязанных клик Q~1–1/К)
Obligate / Specialized / Aquatic / Facultative / Multiple / Terrestial Доля факторов транскрипции Размер гигантской компоненты Kashtan - Alon