1 / 35

Браузер для генома

Браузер для генома. Симонов Сергей Александрович к.ф.-м.н. Центр Геномной Биоинформатики им Ф. Добржанского , СпБГУ. п . Лисий Нос 7 ноября 2013. Карта современной науки (РР ноябрь 2013). План . Биоинформатика Геном – протеом Элементы генома Визуализация генома. Биоинформатика.

kylie-garza
Télécharger la présentation

Браузер для генома

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Браузер для генома Симонов Сергей Александрович к.ф.-м.н. Центр Геномной Биоинформатики им Ф. Добржанского, СпБГУ п. Лисий Нос 7 ноября 2013

  2. Карта современной науки (РР ноябрь 2013)

  3. План • Биоинформатика • Геном –протеом • Элементы генома • Визуализация генома

  4. Биоинформатика

  5. 1012 клеток В каждой клетке – Геномдлиной 3.2*109

  6. Азбука Морзе

  7. Коды Хаффмена (префиксные)

  8. A=1, C=2, G=3, T=4

  9. a1x1+a2x2+…anxn=b, n=3.2*109

  10. A=A(до); c=B(ре); g=C(ми); t=D(фа)

  11. Зачем? Не знаешь функцию – изучай структуру

  12. Примеры элементов в геноме • Повторы 50% • Гены 1-4% • Экзоны • Интроны • Эндоретровирусы 0.0… % SNP, SNV, Metilated site … 0.00… %

  13. Как «читают» геном? • Берут образец • Выделяют ДНК • Режут на фрагменты • Секвенируют, получая риды (reads) • Сибираютриды в контиги, скафолды, хромосомы, геном

  14. Есть исходный геном (reference) • Что в нем можно закодировать? • 4 типа нуклеотида • 20 аминокислот • Генетический код основан на триплетах – т.н. Кодонах • Есть Старт-кодон и три стоп кодона.

  15. Т.о. Можно видеть, что код неоднозначный. • То же самое для большинства геномных элементов – «похоже», но не тождественно! • Около 500 000 белков в базе данных.

  16. Как сравнивать последовательности? • Локально. Алгоритм Смита-Ватермана. Динамическое программирование • Глобально. Алгоритм Нудельмана-Вунша • Эвристика - БЛАСТ

  17. Сколько вычислений? • 109 мега • 1012гига • 1015 пета • 1018 экса Производительность суперкомпьютеров на уровне пета. К 2016 ожидается превышение экса

  18. Вирусы

  19. Структура вируса

  20. Итак. С помощью алгоритмов выравнивания можно находить: • Повторы • Белки • Вирусы • СНИПы • Другие элементы

  21. Несколько ссылок • http://humbio.ru/humbio/molevol/000199bc.htm про геномные элементы • http://www.ncbi.nlm.nih.gov огромная база данных с генетической информацией • http://webgbrowse.cgb.indiana.edu - открытый для всех геномный браузер • http://Garfield2.dobzhanskycenter.org - мой геномный браузер

  22. Как увидеть цельную картину и сохранить возможность пристального взгляда? • Браузер – как средство «поглазеть»… • Посмотреть в интернете (IE, FireFox, Chrome, Safari, etc • Увидеть геном (NCBI, Ensembl, UCSC, Gbrowse, Jbrowseetc).

  23. СПАСИБО Симонов Сергей Александрович к.ф.-м.н. Центр Геномной Биоинформатики им Ф. Добржанского, СпБГУ

More Related