1 / 28

Gena- og gagnas öfn (GEG1103)

Gena- og gagnas öfn (GEG1103). Fyrirlestrar 7 & 8 Einföld pörun, dýnamísk forrit. Lesefni. Gibson & Muse: kafli 2 (einkum Box 2.1) Krane & Raymer: kafli 2. Hvernig bestum við pörun?. Tvær raðir: X og Y |X| = m; |Y| = n ef göt eru meðtalin, |X| = |Y|  m+n

caine
Télécharger la présentation

Gena- og gagnas öfn (GEG1103)

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Gena- og gagnasöfn (GEG1103) Fyrirlestrar 7 & 8 Einföld pörun, dýnamísk forrit

  2. Lesefni • Gibson & Muse: kafli 2 (einkum Box 2.1) • Krane & Raymer: kafli 2

  3. Hvernig bestum við pörun? • Tvær raðir: X og Y • |X| = m; |Y| = n • ef göt eru meðtalin, |X| = |Y|  m+n • „Brute Force“:2m+n mögulegar raðir X, 2m+n Y!  2m+n * 2m+n = 2(2(m+n)) = 4m+n samanburðir • Ópraktískt!

  4. „Dynamic Programming“ • Aðferð tölvunarfræðinnar til bestunar • Verkefnið er brotið upp í smærri „undirverkefni“ sem leyst eru hvert um sig (divide&conquer!) • Recursive algorithm (rakning?)

  5. „Dynamic Programming“ • KS/AS raðir henta vel fyrir DP • „Undirverkefni“: pörun raðarbútanna á undan (5´ / N við) • Hvert undirverkefni er leyst einu sinni og skor þess geymt í matrixu • Skor í hverjum punkti byggist á besta skori þangað til • Þrjú skref: • uppsetning • skorun • rakning (pörun)

  6. Dæmi1: „Needleman-Wunsch algoriþmi“ Röð #1: GAATTCAGTTA; m = 11 Röð #2: GGATCGA; n = 7 s(aibj) = +5 ef ai = bj (match-skor) s(aibj) = -3 ef aibj (mismatch-skor) w = -4 (gap penalty)

  7. Dæmi1: „Needleman-Wunsch algoriþmi“ Þrep 1: uppsetning Si,0 = w * i S0,j = w * j s(aibj) = +5 ef ai = bj (match-skor) s(aibj) = -3 ef aibj (mismatch-skor) w = -4 (gap penalty)

  8. Dæmi1: „Needleman-Wunsch algoriþmi“ Þrep 2: skorun Si,j = MAX[ Si-1, j-1 + s(ai,bj) Si,j-1 + w Si-1,j + w ] s(aibj) = +5 ef ai = bj (match-skor) s(aibj) = -3 ef aibj (mismatch-skor) w = -4 (gap penalty)

  9. Dæmi1: „Needleman-Wunsch algoriþmi“ Þrep 2: skorun Si,j = MAX[ Si-1, j-1 + s(ai,bj) Si,j-1 + w Si-1,j + w ] s(aibj) = +5 ef ai = bj (match-skor) s(aibj) = -3 ef aibj (mismatch-skor) w = -4 (gap penalty)

  10. Dæmi1: „Needleman-Wunsch algoriþmi“ Þrep 2: skorun Si,j = MAX[ Si-1, j-1 + s(ai,bj) Si,j-1 + w Si-1,j + w ] s(aibj) = +5 ef ai = bj (match-skor) s(aibj) = -3 ef aibj (mismatch-skor) w = -4 (gap penalty)

  11. Dæmi1: „Needleman-Wunsch algoriþmi“ Þrep 2: skorun Si,j = MAX[ Si-1, j-1 + s(ai,bj) Si,j-1 + w Si-1,j + w ] s(aibj) = +5 ef ai = bj (match-skor) s(aibj) = -3 ef aibj (mismatch-skor) w = -4 (gap penalty)

  12. Dæmi1: „Needleman-Wunsch algoriþmi“ • Þrep 3: Rakning (traceback)  pörun (alignment) • Rakið til baka frá endareit, sem inniheldur SM,N (maximum global alignment score), hér = 11 • Elta örvarnar

  13. Dæmi1: „Needleman-Wunsch algoriþmi“ G A A T T C A G T T A | | | | | | G G A – T C – G - — A • Þrep 3: Rakning (traceback)  pörun (alignment) • Rakið til baka frá endareit, sem inniheldur SM,N (maximum global alignment score), hér = 11 • Elta örvarnar

  14. Passar skorið? G A A T T C A G T T A | | | | | | G G A – T C – G - — A + - + - + + - + - - + 5 3 5 4 5 5 4 5 4 4 5 5 – 3 + 5 – 4 + 5 + 5 – 4 + 5 – 4 – 4 + 5 = 11 s(aibj) = +5 ef ai = bj (match-skor) s(aibj) = -3 ef aibj (mismatch-skor) w = -4 (gap penalty)

  15. Dæmi 2: „Smith-Waterman algoriþmi“ • • „Local“ pörun - gerir kleyft að finna einnig stutta búta sem matcha innan lengri raða • • Getum notað sömu skorunartöflu • Notum ekki negatívar tölur í matrixunni (breytum í 0)

  16. Dæmi 2: „Smith-Waterman algoriþmi“ Þrep 1: uppstilling

  17. Dæmi 2: „Smith-Waterman algoriþmi“ Þrep 2: skorun S1,1 = MAX[S0,0 + 5, S1,0 - 4, S0,1 – 4,0] = MAX[5, -4, -4, 0] = 5

  18. Dæmi 2: „Smith-Waterman algoriþmi“ • S1,2 = MAX[S0,1 -3, S1,1 - 4, S0,2 – 4, 0] = MAX[0 - 3, 5 – 4, 0 – 4, 0] = MAX[-3, 1, -4, 0] = 1 Þrep 2: skorun

  19. Dæmi 2: „Smith-Waterman algoriþmi“ S1,3 = MAX[S0,2 -3, S1,2 - 4, S0,3 – 4, 0] = MAX[0 - 3, 1 – 4, 0 – 4, 0] = MAX[-3, -3, -4, 0] = 0 Þrep 2: skorun

  20. Dæmi 2: „Smith-Waterman algoriþmi“ Þrep 3: rakning Finnum hæsta skorið í töflunni =maximum local alignment score Ef > 1 reitur með hæsta skor fleiri en ein „besta röðun“

  21. Dæmi 2: „Smith-Waterman algoriþmi“ Þrep 3: rakning Rekjum frá besta skori

  22. Dæmi 2: „Smith-Waterman algoriþmi“ Þrep 3: rakning

  23. Dæmi 2: „Smith-Waterman algoriþmi“ Þrep 3: rakning

  24. G A A T T C - A | | | | | G G A T – C G A + - + + - + - + 5 3 5 5 4 5 4 5 G A A T T C - A | | | | | G G A – T C G A + - + - + + - + 5 3 5 4 5 5 4 5 Dæmi 2: „Smith-Waterman algoriþmi“

  25. Affine Gap Penalty • Í raun er líklegra aðgöt séu stærri og færri heldur en fleiri og minni • wx = g + r(x-1) • wx : total gap penalty; g: gap open penalty; r: gap extend penalty; x: lengd gats • gap penalty valin með skorunarmatrixu að viðmiði • Dæmigerð gildi: g=-12; r = -4

  26. Hvað er svo að marka þetta? • Finna út líkur á að ttk. pörun verði fyrir tilviljun • # parana sem skora a.m.k. S: E = Kmn e-lS • m,n: lengd raðanna • K ,l: tölfr.l. parametrar sem ráðast af skorunarkerfi. Fyrir PAM250: K = 0.09;  = 0.229

  27. P-gildi • Líkindi þess að ttk. S-skor fáist fyrir tilviljun P = 1 – e-E

  28. Sumarverkefni • Umsóknarfrestur í Nýsköpunarsjóð Námsmanna er 10. mars • Verkefni á sviði sameindalíffræði og örveruvistfræði (með Náttúrufræðistofnun Íslands), 1 – 2 nemendur + rannsóknamaður (Jenny Coe). • Bakteríusamfélög á fléttum, fjölbreytni og hlutverk. • Vettvangsvinna: söfnun og greining fléttusýna • Rannsóknastofuvinna: PCR + DGGE eða SSCP (hugsanlega klónun og raðgreining) • Heimildavinna: örveruvistfræði, sambýli baktería og sveppa/þörunga, sameindalíffræðileg þýðisgreining • Önnur verkefni?

More Related