1 / 49

Понятие (множественного) выравнивания

Понятие (множественного) выравнивания. ФББ МГУ, 2014г. Аксянов Е.А. Что такое выравнивание?. Дано 4 последовательности Найти общие мотивы. VLSGGTTMYPGIADRMQKEITALAPSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIVDRMNKELTALAPSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIADRMSKEISALAPSSMKIKVVAPPERKYSVWIGGSILA

drake-olsen
Télécharger la présentation

Понятие (множественного) выравнивания

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Понятие(множественного)выравниванияПонятие(множественного)выравнивания ФББ МГУ, 2014г.Аксянов Е.А.

  2. Что такое выравнивание?

  3. Дано 4 последовательностиНайти общие мотивы VLSGGTTMYPGIADRMQKEITALAPSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIVDRMNKELTALAPSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIADRMSKEISALAPSSMKIKVVAPPERKYSVWIGGSILA VLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA VLSGGTTMYPGIADRMQKEITALAPSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIVDRMNKELTALAPSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIADRMSKEISALAPSSMKIKVVAPPERKYSVWIGGSILA VLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA VLSGGTTMYPGIADRMQKEITALAPSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIVDRMNKELTALAPSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIADRMSKEISALAPSSMKIKVVAPPERKYSVWIGGSILA VLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA VLSGGTTMYPGIADRMQKEITALAPSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIVDRMNKELTALAPSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIADRMSKEISALAPSSMKIKVVAPPERKYSVWIGGSILA VLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA VLSGGTTMYPGIADRMQKEITALAPSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIVDRMNKELTALAPSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIADRMSKEISALAPSSMKIKVVAPPERKYSVWIGGSILA VLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA VLSGGTTMYPGIADRMQKEITALAPSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIVDRMNKELTALAPSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIADRMSKEISALAPSSMKIKVVAPPERKYSVWIGGSILA VLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

  4. Дано 4 последовательностиНайти общие мотивы VLSGGTTMYPGIADRMQKEITAL APSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIVDRMNKELTAL APSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIADRMSKEISAL APSSMKIKVVAPPERKYSVWIGGSILA VLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA VLSGGTTMYPGIADRMQKEITAL APSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIVDRMNKELTAL APSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIADRMSKEISAL APSSMKIKVVAPPERKYSVWIGGSILA VLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA VLSGGTTMYPGIADRMQKEITAL APSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIVDRMNKELTAL APSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIADRMSKEISAL APSSMKIKVVAPPERKYSVWIGGSILA VLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA VLSGGTTMYPGIADRMQKEITAL APSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIVDRMNKELTAL APSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIADRMSKEISAL APSSMKIKVVAPPERKYSVWIGGSILA VLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA ВНИМАНИЕ: в белке разрывов нет, нарисованное тут пустое место – это на самом деле пептидная связь!

  5. Выравнивание – это способ изобразить предполагаемое сходство последовательностей

  6. Что такое выравнивание? • В чем биологический смысл выравнивания и отдельных его элементов?

  7. Биологический смысл выравнивания VLSGGTTMYPGIADRMQKEITAL-----------APSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIVDRMNKELTAL-----------APSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIADRMSKEISAL-----------APSSMKIKVVAPPERKYSVWIGGSILA VLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA LNAMVLVATLRYKKLRQPLNYILVNVSFGGFLLCIFSVFPVFVASCN LNAMVLVATLRYKKLRQPLNYILVNVSFGGFLLCIFSVFPVFVASCN Может ли такое сходство быть результатом случайности? Может ли такое сходство быть результатом случайности? Возьмем из банка первуюпопавшуюся последовательность ...

  8. Биологический смысл выравнивания VLSGGTTMYPGIADRMQKEITAL-----------APSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIVDRMNKELTAL-----------APSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIADRMSKEISAL-----------APSSMKIKVVAPPERKYSVWIGGSILA VLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA • CIIVVLQSKNSDIYMTVKEQSDIVHGIMSQCVLMKNVSRP • CIIVVLQSKNSDIYMTVKEQSDIVHGIMSQCVLMKNVSRP Может ли такое сходство быть результатом случайности? Возьмем из банка вторуюпопавшуюся последовательность ...

  9. Биологический смысл выравнивания VLSGGTTMYPGIADRMQKEITAL-----------APSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIVDRMNKELTAL-----------APSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIADRMSKEISAL-----------APSSMKIKVVAPPERKYSVWIGGSILA VLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA Может ли такое сходство быть результатом случайности? НЕТ! Можно повторить этот опыт со многими последовательностями, и почти нигде мы не найдем таких мотивов. Это ЖЖЖ неспроста!

  10. Биологический смысл выравнивания VLSGGTTMYPGIADRMQKEITAL-----------APSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIVDRMNKELTAL-----------APSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIADRMSKEISAL-----------APSSMKIKVVAPPERKYSVWIGGSILA VLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA VLSGGSTM?PGI?DRM?KE??Alтут_ничего_не_было... Сходство последовательностей обычно свидетельствует об общности происхождения – гомологии. Все эти последовательности – гомологи, – то есть все они произошли от общего предка. Можете предположить последовательность предка?

  11. Биологический смысл выравнивания VLSGGTTMYPGIADRMQKEITAL-----------APSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIVDRMNKELTAL-----------APSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIADRMSKEISAL-----------APSSMKIKVVAPPERKYSVWIGGSILA VLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA VLSGGSTM?PGI?DRM?KE??Alтут_ничего_не_было... Вообще говоря, судить об общем предке по 4м последовательностям нельзя. Но если взять много гомологичных последовательностей, то наши суждения будут надежнее!

  12. Биологический смысл выравнивания VLSGGTTMYPGIADRMQKEITAL-----------APSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIVDRMNKELTAL-----------APSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIADRMSKEISAL-----------APSSMKIKVVAPPERKYSVWIGGSILA VLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA Гэп (gap), то естьпептидная связь!(тут были вставки или делеции) Идентичные аминокислоты(тут замен, наверное, не было) Похожие участки(в некоторых позициях были замены)

  13. Биологический смысл выравнивания VLSGGTTMYPGIADRMQKEITAL-----------APSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIVDRMNKELTAL-----------APSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIADRMSKEISAL-----------APSSMKIKVVAPPERKYSVWIGGSILA VLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA VLSGGSTM?PGI?DRM?KE??Alтут_ничего_не_было... Если взять много гомологичных последовательностей, то наши суждения будут надежнее! Гэпысоотвествуют вставкам или делециям (инделям). Не всегда можно уверенно сказать, чему именно. Если взять много гомологичных последовательностей, то наши суждения будут надежнее! Неконсервативные участки менялись быстрее. Если взять много гомологичных последовательностей, то наши суждения будут надежнее! Консервативные участки – это те, которые не изменились (или мало изменились – зависит от определения) в ходе эволюции.

  14. Участки выравнивания,где много совпадений соответствуют консервативным(медленно эволюционирующим)участкам последовательностей

  15. Совпадение (match) аминокислот может означать, что в данной позиции сохранилась предковая последовательность

  16. Несовпадение (mismatch) аминокислот может означать, что в данной позиции произошли замены

  17. Гэпы соответствуют вставкам или делециям (вместе они называются инделями)

  18. Что такое выравнивание? • В чем биологический смысл выравнивания и отдельных его элементов? • Как изобразить выравнивание?

  19. Обычно выравнивание выглядит так Раскраска – BLOSUM62

  20. Или так … Раскраска – ClustalX

  21. Или так … ~1400 последовательностей, - почти в каждой позиции найдется какая-нибудь вставка хотя бы в одной последовательности

  22. LOGO и консенсус RqdIAxxlGlTrETVsRxLx Большие буквы – почти консервативные позиции, Маленькие – менее консервативные позиции, х – неконсервативная позиция (Эти обозначения в разных программах могут отличаться)

  23. Существуют разные способы изображения выравнивания – различные раскраски, консенсусные последовательности, LOGO

  24. Что такое выравнивание? • В чем биологический смысл выравнивания и отдельных его элементов? • Как изобразить выравнивание? • Что такое достоверное и недостоверное выравнивание?

  25. Пример хорошего выравнивания

  26. Пример плохого выравнивания

  27. Некоторые участки выравниваются хорошо, другие - плохо

  28. Выравнивание - описание того, каким образом похожи друг на друга гомологичные последовательности Эти аминокислоты навернякапроизошли от одной предковой

  29. Выравнивание - описание того, каким образом похожи друг на друга гомологичные последовательности И эти тоже

  30. Выравнивание - описание того, каким образом похожи друг на друга гомологичные последовательности А эти – вряд ли. Почему?

  31. Выравнивание - описание того, каким образом похожи друг на друга гомологичные последовательности Ответ: участки выравнивания (не отдельные колонки), со значительным сходством свидетельствуют об общности происхождения

  32. Выравнивание или его участок, на котором много гэпов и мало совпадений не имеет никакого биологического смысла

  33. Участки с большим количеством совпадений и маленьким числом гэпов соответствуют гомологии между участками последовательностей

  34. В таких участках консервативные колонки соответствуют гомологии между буквами

  35. Что такое выравнивание? • В чем биологический смысл выравнивания и отдельных его элементов? • Как изобразить выравнивание? • Что такое достоверное и недостоверное выравнивание? • Что свидетельствует о гомологии целых последовательностей, отдельных участков и аминокислот?

  36. Гомология целых последовательностей, отдельных участков и аминокислот Блоки Блок? Есть гомология между буквами Есть гомология между участками Кластер

  37. Гомология целых последовательностей, отдельных участков и аминокислот Тут гомологичны некоторые, но не все последовательности

  38. Гомология целых последовательностей, отдельных участков и аминокислот Последовательности гомологичны целиком, т.к. есть относительно неплохое выравнивание по всей длине последовательностей. Есть блоки без гэпов и высоким процентом консервативных позиций – там можно говорить о гомологии между отдельными аминокислотами. В том числе о гомологии между аминокислотам в неконсервативных позициях! Есть короткие участки с гэпами между блоками. Можно говорить о гомологии между короткими фрагментами и длинными кластерами блоков. Некоторые участки части последовательностей могут быть гомологичны, даже есть на данном участке выравнивания нет гомологии между всеми последовательностями.

  39. Три причины, по которым можно сделать вывод об общности происхождения участков из двух разных последовательностей: Эти участки формируют консервативный блок в выравнивании. Эти участки небольшого размера находятся между двумя консервативными блоками. Это длинные участки, где наблюдается значительное сходство между этими двумя последовательностями

  40. Выравнивание - описание того, каким образом похожи друг на друга гомологичные последовательности Еще раз: совпадение отдельных букв может быть (и, скорее всего, является) случайностью. А вот совпадение или значительное сходство мотивов из 5-10 аминокислот (тем более, - протяженных доменов, длиной в десятки или сотни а.к.) не может объясняться случайными причинами.Ищите в выравнивании длинных похожие участки. Выравнивание между ними имеет биологический смысл.Выравнивание, где сходства между длинными участками нет, бессмысленно.

  41. Выравнивания. Термины • Выравнивание – сопоставление аминокислот из разных последовательностей. • Колонка, последовательность. • Гомология – общность происхождения. Если выравнивание построено правильно, то аминокислоты, расположенные в одной колонке, гомологичны. • Консервативность – сильное сходство между последовательностями. • Гэп – условное обозначение для всятавки или делеции. Никакого разрыва полипептидной цепи в последовательности, конечно, нет. • Позиция в выравнивании (номер колонки), позиция в последовательности. Не путать!

  42. Что такое выравнивание? • В чем биологический смысл выравнивания и отдельных его элементов? • Как изобразить выравнивание? • Что такое достоверное и недостоверное выравнивание? • Что свидетельствует о гомологии целых последовательностей, отдельных участков и аминокислот? • Означает ли отсутствие достоверного выравнивания отсутствие гомологии?

  43. Пример плохого выравнивания

  44. Пример плохого выравнивания Вопросы:Программа Muscle сумела построить выравнивание. Гомологичны ли последовательности? 1 2 3 4 НЕТ! Программа всегда что-нибудь построит. Правомерно ли говорить о гомологии аминокислот в колонке 2? 3? 4? НЕТ! Эти участки совершенно несходны.

  45. Пример плохого выравнивания Правомерно ли говорить о гомологии аминокислот в колонке 2? 3? 4? НЕТ! Эти участки совершенно несходны. 1 2 3 4 Правомерно ли говорить о гомологии аминокислот в колонке 1? НЕТ! Это – очевидная случайность (участок вокруг этой колонки неконсервативен).

  46. Пример плохого выравнивания Ни одна из колонок выравнивания не несет информации о родстве последовательностей. Значит, они неродственны? 1 2 3 4 НЕТ! Эти последовательности гомологичны. Это следует из Структурного сходства (хотя и слабого). Общности функций. Сходства доменной архитектуры (это – С-концевые домены α-амилаз).

  47. Вот, кстати, их “структурное” выравнивание.Между последовательностями нет ничего общего. Тоже одна консервативная колонка.

  48. Гомология между последовательностями может быть настолько слабой, что ее невозможно обнаружить при помощи выравнивания.

  49. Похожие последовательности обычно гомологичны(но бывают исключения!).Непохожие последовательности обычно негомологичны(но бывают исключения!).

More Related