1 / 27

Gena- og gagnas öfn (GEG1103)

Gena- og gagnas öfn (GEG1103). Fyrirlestrar 7 & 8 Einföld sjónræn pörun raða Almennt um pörunarskorun og skorunarfylki PAM og BLOSUM líkindafylkin. Lesefni. Krane & Raymer: kafli 2. einsleitni ( similarity ) ≠ samsvörun ( homology )

calida
Télécharger la présentation

Gena- og gagnas öfn (GEG1103)

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Gena- og gagnasöfn (GEG1103) Fyrirlestrar 7 & 8 Einföld sjónræn pörun raða Almennt um pörunarskorun og skorunarfylki PAM og BLOSUM líkindafylkin

  2. Lesefni • Krane & Raymer: kafli 2

  3. einsleitni (similarity) ≠ samsvörun (homology) • Orðin pera og gera eru similar, en ekki homologous

  4. Skyldleiki raða • Homolog (homologue) – einsleitar raðir í 2 lífverum, komnar af sama áa (ancestor) • Ortholog - Homologar með sömu virkni • Paralog – Homologar sem urðu til við gene duplication • Xenolog – “aðskotagen” http://www.ncbi.nlm.nih.gov/Education/

  5. Sjónræn pörun (visual alignment) • Pörum Dorothy Hodgkin við Dorothy Crowfoot Hodgkin: • Drögum upp matrixu þ.s. önnur röðin er lárétti ásinn, hin sá lóðrétti • Merkjum í matrixuna hvar sama stakið kemur fyrir í báðum röðum (par, match) • Finnum runur para Dorothy M. C. Hodgkin var einn af frumkvöðlum byggingargreiningar prótína. Nóbelsverðlaun 1964. Mynd frá http://www.pugwash.org

  6. DOROTHY--------HODGKIN DOROTHYCROWFOOTHODGKIN Pörunin gefur línuröðunina: (alignment) Línuröðun (alignment) alltaf niður og/eða til hægri

  7. Sjáum einnig endurtekningar .....

  8. ... og samhverfur (palindromes)

  9. Depilgraf (dot plot) • Eftirfarandi glærur eru unnur uppúr forritinu Dotlet (http://www.isrec.isb-sib.ch/java/dotlet/Dotlet.html), en sambærilegt graf má gera í Staden Package (í Spin forritinu) – skoðum í verkl. tíma ATPasar 6 úr steinsugu (Petromyzon marinus) og deplaháfi (Scyliorhinus canicula) paraðir í Dotlet

  10. Depilgraf (dot plot) SLIT prótínið í Drosophila melanogaster inniheldur endurtekin hneppi (repeated domains)

  11. Depilgraf (dot plot) Geymin hneppi (conserved domains) má einnig finna með depilgrafi. Hér er lárétta röðin Homo sapiens MS2 frumuyfirborðsmótefnið, sú lóðrétta er málmháði próteasinn adamalysin II úr eitri höggormsins Crotalus adamanteus. Bæði prótínin innihalda zink próteasa hneppi.

  12. Depilgraf (dot plot) Finna tjáraðir (exons) og innraðir (introns). Hér er cDNA calmodulin gens úr Aspergillus nidulans parað við genemengis-DNA sem inniheldur sömu röð

  13. Depilgraf (dot plot) Finna höggun á lesramma: Þegar kjarnsýruröð er pöruð við amínósýruröð, prófar Dotlet alla þrjá “áfram” lesrammana. Hér er Homo sapiens cDNA parað við sitt besta hitt úr BLASTx (Mus musculus viðtaki fyrir örva kornfrumukólonía) Skálína í raun tvær línur  höggun á lesramma, eins og sjá má í línuuppstillingunni

  14. Depilgraf (dot plot) Finna samhverfur (palindromes). Hér er Bacillus subtilis UTP-glúkósa-1-fosfat uridylýltransferasa genið parað við sjálft sig og sést þá greinilega samhverfa sem hér er þýðingartermínator.

  15. Depilgraf (dot plot) Einnar-amínósýru runur sjást sem svartir kassar.

  16. Hamming skorun (Hamming distance) • Á hversu mörgum stöðum í línuröðuninni er ekki pörun (mismatch)? (þ.e., hve mörgum stökum þarf að breyta til að breyta annarri röðinni í hina?) • Hamming distance milli GERA og PERA er 1 • ATH: raðirnar þurfa að vera jafn langar svo þetta virki! GERA ||| PERA Richard W. Hamming. Mynd frá www.cse.psu.edu

  17. Að setja inn göt (gaps) • DNA/RNA/prótín raðir eru mismunandi að lengd • Bútar hafa klippst út / bæst inn í gegnum þróunarsöguna • Setjum inn göt (táknað með ‘-’) A L I G N M E N T | | | | | | | - L I G A M E N T Vladímír Levenshtein. Mynd frá http://teormin.ifmo.ru • Levenshtein skorun: hversu margar aðgerðir (basabreytingar + göt) þarf að framkvæma til að breyta röð 1 í röð 2?

  18. Línuröðun (alignment) Levenshtein 5 2 A – C – G G – A C T | | | | | A T C G G A T _ C T A T C G G A T C T | | | | | | | A – C G G A - C T Segir aðeins hvor röðunin er „minna slæm“! (bæði Hamming og Levenshtein algóriþmarnir eru hannaðir til að finna villur) Hvor er betri?

  19. Línuröðun (alignment) Búum til skorunarskema sem mælir bæði „góð“ og „slæm“ stök. • Segjum, t.d.: pörun (match): +2 mispörun (mismatch): -1 gat (gap): –2 • Röðun 1: 5 * 2 – 1*1 – 4*2 = 10 – 1 – 8 = 1 • Röðun 2: 6 * 2 – 1*1 – 2*2 = 12 – 1 – 4 = 7 • Röðun 3: 7*2 - 2*2 = 10 A – C – G G – A C T | | | | | A T C G G A T _ C T A T C G G A T C T | | | | | | A – C G G – A C T A T C G G A T C T | | | | | | | A – C G G A - C T En, eru allar misparanir jafn „slæmar“?

  20. Líkan Kimura Tíðni kirna í seti n á tíma t. A G T CA 1-a-2bbabGb 1-a-2bbaT ab 1-a-2bbCbab 1-a-2b Ættum etv. að nota mismunandi mispörunarskor fyrir transitions vs. transversions

  21. Líkindafylki f. DNA A. Ef tíðni stökkbreytinga er alltaf eins (Jukes-Cantor módel). A G T CA 0.99 G 0.00333 0.99 T 0.00333 0.00333 0.99 C 0.00333 0.00333 0.00333 0.99 B. Ef transitions eru þrefalt algengari en transversions (Kimura módel). A G T CA 0.99 G 0.006 0.99 T 0.002 0.002 0.99 C 0.002 0.002 0.006 0.99

  22. PAM1 fylki f. DNA A. Ef tíðni stökkbreytinga er alltaf eins (Jukes-Cantor módel). A G T CA 2G -6 2 T -6 -6 2 C -6 -6 -6 2 B. Ef transitions eru þrefalt algengari en transversions (Kimura módel). A G T CA 2 G -5 2 T -7 -7 2 C -7 -7 -5 2 • ... en, set kirnis í röð (tákna) skipti líka miklu máli • gætum leiðrétt fyrir því ef lesrammi er þekktur • ... eða bara línuraðað amínósýruröðinni

  23. Líkindafylki (likelihood matrix) • Gildi fundin útfrá líkum á stökkbreytingu • Leitt út fyrir amínósýruraðir • Point Accepted Mutation (PAM)-fylki = Dayhoff-fylki Margaret Dayhoff

  24. PAM-1: líkindi á að 1 ttk. breyting sé leyfð pr. 100 AS. Fyrir fleiri leyfðar breytingar: margfalda PAM-1 með sjálfu sér. PAM-250 oft notað í praxís. PAM250

  25. PAM fylki Skoðið: http://www.lmb.uni-muenchen.de/groups/bioinformatics/04/ch_04_3.html • Margar svipaðar AS raðir margfalt paraðar og raðað í skyldleikatré • Fjöldi AS breytinga talinn • Líkindi ttk. stökkbreytinga reiknuð út • 20 x 20 fylki stökkbreytinga-líkinda dregið upp

  26. Blocks Amino Acid Substitution fylki (BLOSUM) = Henikoff fylki • Raðir flokkaðar í blokkir (signature blocks) skv. þartilgerðum gagnagrunni (BLOCKS database) • Consensus sequence búin til • 60% einsleitni: BLOSUM 60 hentar • 80% einsleitni: BLOSUM 80 hentar

  27. http://www.ncbi.nlm.nih.gov

More Related