1 / 28

Функции Введение

Функции Введение. А.Б.Рахманинова (27 февраля, 1 марта 2006г.). Давайте помнить цель. gcttttcattctgactgcaacgggcaatatgtctctgtgtggattaaaaaaagagtgtctgatagcagcttctgaactggttacctgccgtgagtaaattaaaattttattgactta

Télécharger la présentation

Функции Введение

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ФункцииВведение А.Б.Рахманинова(27 февраля,1 марта 2006г.)

  2. Давайте помнить цель gcttttcattctgactgcaacgggcaatatgtctctgtgtggattaaaaaaagagtgtctgatagcagcttctgaactggttacctgccgtgagtaaattaaaattttattgactta ggtcactaaatactttaaccaatataggcatagcgcacagacagataaaaattacagagtacacaacatccatgaaacgcattagcaccaccattaccaccaccatcaccattacca acggtgcgggctgacgcgtacaggaaacacagaaaaaagcccgcacctgacagtgcgggctttttttttcgaccaaaggtaacgaggtaacaaccatgcgagtgttgaagttcggca catcagtggcaaatgcagaacgttttctgcgtgttgccgatattctggaaagcaatgccaggcaggggcaggtggccaccgtcctctctgcccccgccaaaatcaccaaccacctgg cgatgattgaaaaaaccattagcggccaggatgctttacccaatatcagcgatgccgaacgtatttttgccgaacttttgacgggactcgccgccgcccagccggggttcccgctgg aattgaaaactttcgtcgatcaggaatttgcccaaataaaacatgtcctgcatggcattagtttgttggggcagtgcccggatagcatcaacgctgcgctgatttgccgtggcgaga tgtcgatcgccattatggccggcgtattagaagcgcgcggtcacaacgttactgttatcgatccggtcgaaaaactgctggcagtggggcattacctcgaatctaccgtcgatattg agtccacccgccgtattgcggcaagccgcattccggctgatcacatggtgctgatggcaggtttcaccgccggtaatgaaaaaggcgaactggtggtgcttggacgcaacggttccg actctgctgcggtgctggctgcctgtttacgcgccgattgttgcgagatttggacggacgttgacggggtctatacctgcgacccgcgtcaggtgcccgatgcgaggttgttgaagt tgtcctaccaggaagcgatggagctttcctacttcggcgctaaagttcttcacccccgcaccattacccccatcgcccagttccagatcccttgcctgattaaaaataccggaaatc aagcaccaggtacgctcattggtgccagccgtgatgaagacgaattaccggtcaagggcatttccaatctgaataacatggcaatgttcagcgtttctggtccggggatgaaaggga tcggcatggcggcgcgcgtctttgcagcgatgtcacgcgcccgtatttccgtggtgctgattacgcaatcatcttccgaatacagcatcagtttctgcgttccacaaagcgacttgc gagctgaacgggcaatgcaggaagagttctacctggaactgaaagaaggcttactggagccgctggcagtgacggaacggctggccattatctcggtggtaggtgatggtagcacct tgcgtgggatctcggcgaaattctttgccgcactggcccgcgccaatatcaacattgtcgccattgctcagggatcttctgaacgctcaatctctgtcgtggtaaataacgatgatg ccactggcgtgcgcgttactcatcagatgctgttcaataccgatcaggttatcgaagtgtttgtgattggcgtcggtggcgttggcggtgcgctgctggagcaactgaagcgtcagc gctggctgaagaataaacatatcgacttacgtgtctgcggtgttgccaactcgaaggctctgctcaccaatgtacatggccttaatctggaaaactggcaggaagaactggcgcaag aagagccgtttaatctcgggcgcttaattcgcctcgtgaaagaatatcatctgctgaacccggtcattgttgactgcacttccagccaggcagtggcggatcaatatgccgacttgc gcgaaggtttccacgttgtcacgccgaacaaaaaggccaacacctcgtcgatggattactaccatcagttgcgttatgcggcggaaaaatcgcggcgtaaattcctctatgacacca ttggggctggattaccggttattgagaacctgcaaaatctgctcaatgcaggtgatgaattgatgaagttctccggcattctttctggttcgctttcttatatcttcggcaagttag aaggcatgagtttctccgaggcgaccacgctggcgcgggaaatgggttataccgaaccggacccgcgagatgatctttctggtatggatgtggcgcgtaaactattgattctcgct aaacgggacgtgaactggagctggcggatattgaaattgaacctgtgctgcccgcagagtttaacgccgagggtgatgttgccgcttttatggcgaatctgtcacaactcgacgatc ttgccgcgcgcgtggcgaaggcccgtgatgaaggaaaagttttgcgctatgttggcaatattgatgaagatggcgtctgccgcgtgaagattgccgaagtggatggtaatgatccgc tcaaagtgaaaaatggcgaaaacgccctggccttctatagccactattatcagccgctgccgttggtactgcgcggatatggtgcgggcaatgacgttacagctgccggtgtctttg atctgctacgtaccctctcatggaagttaggagtctgacatggttaaagtttatgccccggcttccagtgccaatatgagcgtcgggtttgatgtgctcggggcggcggtgacacct gatggtgcattgctcggagatgtagtcacggttgaggcggcagagacattcagtctcaacaacctcggacgctttgccgataagctgccgtcagaaccacgggaaaatatcgtttat tgctgggagcgtttttgccaggaactgggtaagcaaattccagtggcgatgaccctggaaaagaatatgccgatcggttcgggcttaggctccagtgcctgttcggtggtcgcggcg atggcgatgaatgaacactgcggcaagccgcttaatgacactcgtttgctggctttgatgggcgagctggaaggccgtatctccggcagcattcattacgacaacgtggcaccgtgt ctcggtggtatgcagttgatgatcgaagaaaacgacatcatcagccagcaagtgccagggtttgatgagtggctgtgggtgctggcgtatccggggattaaagtctcgacggcagaa agggctattttaccggcgcagtatcgccgccaggattgcattgcgcacgggcgacatctggcaggcttcattcacgcctgctattcccgtcagcctgagcttgccgcgaagctgatg gatgttatcgctgaaccctaccgtgaacggttactgccaggcttccggcaggcgcggcaggcggtcgcggaaatcggcgcggtagcgagcggtatctccggctccggcccgaccttg gctctgtgtgacaagccggaaaccgcccagcgcgttgccgactggttgggtaagaactacctgcaaaatcaggaaggttttgttcatatttgccggctggatacggcgggcgcacga ctggaaaactaaatgaaactctacaatctgaaagatcacaacgagcaggtcagctttgcgcaagccgtaacccaggggttgggcaaaaatcaggggctgttttttccgcacgacctg gaattcagcctgactgaaattgatgagatgctgaagctggattttgtcacccgcagtgcgaagatcctctcggcgtttattggtgatgaaatcccacaggaaatcctggaagagcgc cgcgcggcgtttgccttcccggctccggtcgccaatgttgaaagcgatgtcggttgtctggaattgttccacgggccaacgctggcatttaaagatttcggcggtcgctttatggca atgctgacccatattgcgggtgataagccagtgaccattctgaccgcgacctccggtgataccggagcggcagtggctcatgctttctacggtttaccgaatgtgaaagtggttatc tatccacgaggcaaaatcagtccactgcaagaaaaactgttctgtacattgggcggcaatatcgaaactgttgccatcgacggcgatttcgatgcctgtcaggcgctggtgaagcag tttgatgatgaagaactgaaagtggcgctagggttaaactcggctaactcgattaacatcagccgtttgctggcgcagatttgctactactttgaagctgttgcgcagctgccgca acgcgcaaccagctggttgtctcggtgccaagcggaaacttcggcgatttgacggcgggtctgctggcgaagtcactcggtctgccggtgaaacgttttattgctgcgaccaacgtg gataccgtgccacgtttcctgcacgacggtcagtggtcacccaaagcgactcaggcgacgttatccaacgcgatggacgtgagtcagccgaacaactggccgcgtgtggaagagttg cgccgcaaaatctggcaactgaaagagctgggttatgcagccgtggatgatgaaaccacgcaacagacaatgcgtgagttaaaagaactgggctacacttcggagccgcacgctgta gcttatcgtgcgctgcgtgatcagttgaatccaggcgaatatggcttgttcctcggcaccgcgcatccggcgaaatttaaagagagcgtggaagcgattctcggtgaaacgttggat ccaaaagagctggcagaacgtgctgatttacccttgctttcacataatctgcccgccgattttgctgcgttgcgtaaattgatgatgaatcatcagtaaaatctattcattatctca aggccgggtttgcttttatgcagcccggcttttttatgaagaaattatggagaaaaatgacagggaaaaaggagaaattctcaataaatgcggtaacttagagattaggattgcgga taacaaccgccgttctcatcgagtaatctccggatatcgacccataacgggcaatgataaaaggagtaacctgtgaaaaagatgcaatctatcgtactcgcactttccctggttctg gctcccatggcagcacaggctgcggaaattacgttagtcccgtcagtaaaattacagataggcgatcgtgataatcgtggctattactgggatggaggtcactggcgcgaccacggc • Мы хотим знать, • что закодировано в геномах, • как это работает, • каким образом это возникло

  3. EMBL Number of entries(current 68109539)http://www3.ebi.ac.uk/Services/DBStats/ TrEMBL Number of entries(current 2 618 388 entries ) Swiss-Prot Number of entries (current 208 005 entries ) http://au.expasy.org/sprot

  4. Как узнают функцию белка или гена? • Эксперимент – прямой и генетический ждите спецкурсов и практикумов • Компьютерная аннотация — задача поиска ортологов, ….. ждите лекции М.С.Гельфанда - - - - - - - - - - - поиск гомологов- - - - - - - - - • Сообщение хотите верьте, хотите нет

  5. A Summary of the E. coli Chromosome(Gene Type Distribution),data from http://genprotec.mbl.edu/overview.htmlUpdated January 26th, 2006

  6. Основные биоинформатические базы данных Основные БД последовательностей:EMBL, GeneBank, UniProt, SwissProt. Производные PFAM,PROSITE, INTERPRO, dbEST, dbSNP……. БД 3D-структур: PDB. Производные SCOP, CATH, RNABase….. БД и энциклопедии, в которых подробно описаны функции генов и их продуктов : KEGG, BIOCYC, ENZYME, TC-DB, REACTOME……. Онтологии : GO, OBO, HUGO......

  7. ФункцииI. ОнтологииА.Б.Рахманинова(27 февраля,1 марта 2006г.)

  8. Функции каких объектов?

  9. Ген Зрелые rRNA и tRNA процессинг+модификация альтернативный сплайсинг у эукариот mRNA Белок 1 mRNA Белок 2 mRNA Процессинг и/или РТМ Белок 3 Активный mRNA Белок фермент Как понимать «гены и их продукты» ? Сколько записей в SWISS-Prot?

  10. Что такое "Функция"?( что хочется знать о функции молекулярной машины) • Где? Локализация (место в организме, клетке, комплексе) • Зачем? Предназначение, роль в организме (клетке) • Как? Тип молекулярного механизма • С чем? Тип рабочего тела (специфичность)

  11. LacY_Ecoli Клеточная мембрана Транспорт сахаров в бактериальную клетку Симпорт H+/сахар Лактозный транспортер Например • LDH_Ecoli • Цитоплазма • Анаэробный гликолиз • Оксидоредуктаза, донор – группа –CH-OH, акцептор – НАД+ • D-Лактатдегидрогеназа

  12. MDHC_YEAST в цитоплазме MDHP_YEAST в пероксисомах DHM_YEAST в матриксе митохондрий Гликонеогенез Цикл Кребса Глиоксилатный путь Почему полезно указывать все? Малатдегидрогеназа, EC 1.1.1.37 (S)-malate + NAD+ = oxaloacetate + NADH + H+ Зачем дрожжам 3 фермента с ID43-50% ??

  13. Функция —не физический объект, не ген и не белок • Одинбелок и много функций 1.1 1.2. цитохром с окислительное фосфорилирование индукция апоптоза • Одна функция и много белков 2.1.Ортологичный ряд алькогольдегидрогеназ 2.2. Аналогичные ферменты. TRPC_ECOLI ЕС 4.1.1.48 ЕС 5.3.1.24

  14. Где искать описание функции • Краткое описание функций одного белка и ссылки на другие ресурсы см. • Краткое описание функций семейств белков и доменов см. в и • Подробное описание функций генов и их продуктов см в энциклопедиях, таких как или • Подробное описание отдельных классов функций и соответствующих белков см. в специализированных БД, таких как ENZYME, , ...

  15. Самая простая, но обычная проблема • Сколько разных функций? • phosphopyruvate hydratase, 2-phosphoglycerate dehydratase, enolase 2-фосфо-D-глицерат<=> фосфоенолпируват + H2O 2. Как найти то, что непонятно, как называется ? tricarboxylic acid cycle=TCA cycle=Krebs cycle=Citrate cycle=citric acid cycle BioCycзнает «TCA cycle» и «tricarboxylic acid cycle» KEGG понимает «Citrate cycle» и «TCA cycle» и «Reductive carboxylate cycle» . -=- Гемоглобин есть вBioCycиKEGG, но обе базы не понимают “oxygen transport”

  16. Цели GO (Gene Ontology ) • Создание концепции классификации наших биологических знаний о • Молекулярных функциях (Function)(Как? С чем?) Например, carbohydrate bindingилиATPase activity • Биологических процессах (Process) (Зачем?) Например, митозилибиосинтез пуринов • Клеточных компонентах (Component) (Где?) Например, ядроилихолофермент РНК-полимераза II • Создание общего языка, применимого для всех организмов. • Создание формальной терминологии для аннотации генов и сравнении информации о разных видах.

  17. Что такое GO? • 3 независимых словаря терминов • Molecular Function (Как? С чем?) • Biological Process(Зачем?) • Cellular Component(Где?) • Термины имеют определение и перечень синонимов. • Термины в пределах одной онтологии связаны отношениями "_is_a", "_is_part_of" или "has part_of" • Термины имеют стандартные идентификаторы.

  18. tricarboxylic acid cycle Accession: GO:0006099 Ontology: biological_process Synonyms: exact: citric acid cycle exact: Krebs cycle exact: TCA cycle Definition: A nearly universal metabolic pathway in which the acetyl group of acetyl coenzyme A is effectively oxidized to two C02 and four pairs of electrons are transferred to coenzymes. The acetyl group combines with oxaloacetate to form citrate, which undergoes successive transformations to isocitrate, 2-oxoglutarate, succinyl-CoA, succinate, fumarate, malate, and oxaloacetate again, thus completing the cycle. In eukaryotes the tricarboxylic acid is confined to the mitochondria. See also glyoxylate cycle.

  19. Ген или продукт ассоцируется из одним или несколькими терминами из всех трех онтологий. Термины имеют код обоснования аннотации Аннотация GO для HBB_HUMAN (UniProt)

  20. DAG —ориентированный ациклический граф • отношение "is_part_of": "A is part of B" означает, что А — часть В, но В необязательно содержит А. • отношение "_is_a": • "A is B" означает, что • А — частный случай В;

  21. Evidence Codes • IDAInferred from Direct Assay • TASTraceable Author Statement • IMPInferred from Mutant Phenotype • IGIInferred from Genetic Interaction • IPIInferred from Physical Interaction • RCAInferred from Reviewed Computational Analysis • ISS Inferred from Sequence Similarity • IEP Inferred from Expression Pattern • NASNon-traceable Author Statement • IEA Inferred from Electronic Annotation • IC Inferred by Curator • ND No biological Data available

  22. Статистика GO • Biological process terms 9805 • Molecular function terms 7076 • Cellular component terms 1574 • Genomes with annotation*30 • Annotated gene products • Total 1 618 739 • Electronic only 1 460 632 • Manually curated 158 107 ______________________________________ * Excludes annotations from UniProt, which represent 261 annotatedproteomes. http://www.ebi.ac.uk/GOA/

  23. Есть и другие онтологии, например, exon, promoter, binding_site, non_canonical_splice_site, stop_codon. pseudogene

  24. http://obo.sourceforge.net/main.htm

  25. Резюме • Функциональная аннотация геномов — задача биоинформатики • Существуют энциклопедии, где можно узнать о функциях генов и их продуктов, например, BioCyc. • Полное описание функции — это ответы на вопросы "где?", "зачем?", "как?“, "с чем?“. • GO— перспективный подход к • разработке общего языка (решение проблема синонимов), • разработкеформализованного описания функций, общего для всех организмов.

More Related