1 / 52

Gene Prediction

Gene Prediction. Marco Block Jonas Heise Nima Keshvari Michael Schreiber. Einführung. Wichtiges Gebiet der Bioinformatik Problematik ( exon alignment problem ) Biologische Herangehensweise Kombinatorischer Ansatz. exon assembly problem auf Pfadsuche in einem gerichteten

genera
Télécharger la présentation

Gene Prediction

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Gene Prediction Marco Block Jonas Heise Nima Keshvari Michael Schreiber

  2. Einführung • Wichtiges Gebiet der Bioinformatik • Problematik (exon alignment problem) • Biologische Herangehensweise • Kombinatorischer Ansatz • exon assembly problem auf Pfadsuche in einem gerichteten • Graphen reduzieren (spliced alignment problem) • Optimierung :spliced alignment problem auf • network alignment problem (Kruskal) transformieren

  3. exon alignment problem

  4. exon alignment problem

  5. exon alignment problem

  6. exon alignment problem

  7. exon alignment problem

  8. exon alignment problem

  9. exon alignment problem

  10. exon alignment problem

  11. Grundlagen der Biologie Die Zelle ist von der Zellhülle oder –membran umgeben. Im Zellleib oder Soma befindet sich der Zellkern. Im Zellkern ist das Erbmaterial, die DNS.

  12. Grundlagen der Biologie Auf der DNS liegen die Gene. Die Gene codieren für Proteine.

  13. Grundlagen der Biologie Die Gene sind unterteilt in Exons und Introns.

  14. Grundlagen der Biologie Die Exons werden bei der Translation (Produktion eines Proteins aus mRNA) übersetzt, die Introns werden durch Splicing entfernt.

  15. Biologische Herangehensweise RT-PCR

  16. Naiver Ansatz • Suche alle möglichen Exon-Blöcke • Finde durch ausprobieren aller möglichen Kombinationen die bes

  17. Kombinatorischer Ansatz • Rekursives Verfahren • Gerichteter Lösungsgraph wird erstellt

  18. Kombinatorischer Ansatz 1a/10 Begrifflichkeiten : G String mit g1...gn (genomic sequence) B Substring von G mit gi...gj  = {B1,B2,...,Bb} (i) = {k : last(k) < i}, Blöcke die strikt vor der Position von i enden  = (B1,B2,...,Bb) mit B1<B2<...<Bb * String mit B1 * B2 * ... * Bb) T String mit t1...tm (target sequence) s(G,T) optimal alignment zwischen G und T

  19. Kombinatorischer Ansatz 1b/10

  20. Kombinatorischer Ansatz 2/10 Nun lässt sich das spliced alignment problem mit G,T und B formulieren, als : Suche nach der Stringkette , die unsere Funktion s(*, T), unter allen möglichen Blockketten aus B, maximiert.

  21. Kombinatorischer Ansatz 3/10 Wir erstellen einen Graphen, dessen Knoten die Blöcke und dessen Kanten die potential transitions zwischen diesen sind. Das Kantengewicht ergibt sich aus dem optimal alignment zwischen den konkatenierten Blöcken. Dieses Problem ist aber nicht mit dem kürzesten-Wege-Problem verwandt, da die Gewichte der Knoten und Kanten in den Graphen noch nicht definiert sind.

  22. Kombinatorischer Ansatz 4/10

  23. Kombinatorischer Ansatz 5/10

  24. Kombinatorischer Ansatz 5/10

  25. Kombinatorischer Ansatz 5/10

  26. Kombinatorischer Ansatz 5/10

  27. Kombinatorischer Ansatz 5/10

  28. Kombinatorischer Ansatz 5/10

  29. Kombinatorischer Ansatz 6/10 Aufruf :

  30. Kombinatorischer Ansatz 7/10 Laufzeit : O(mnc * mb²) Wir können, das spliced alignment problem zu dem bereits von Kruskal formulierten network alignment problem transformieren. Dabei versuchen wir den Weg zu finden, der die grösste Ähnlichkeit mit einer gegebenen target-Sequence besitzt. Laufzeit : O(mnc * mb) Es werden nun weniger Kanten benötigt.

  31. Kombinatorischer Ansatz 7/10 Graphskizze :

  32. Kombinatorischer Ansatz 9/10

  33. Kombinatorischer Ansatz 8/10

  34. Kombinatorischer Ansatz 8/10

  35. Vergleichsfunktion D • Zwei Aminosäuren As1 und As2 werden nach chemischer Ähnlichkeit verglichen • Eine Matrix liefert die Score für jedes As-paar • Bewertungsmatrix kann angepasst werden, keine Optimale Lösung bekannt

  36. Beispielmatrix • Scoringmatrix, nach Myers/Miller • Verwendet im Programm „ ALIEN“ ( berechnet multiple sequence Alignment )

  37. Beispielmatrix E : Glutamat, geladene As F: Phenylalanin, aromatische unpolare As -> negative Score (Penalty)

  38. Beispielmatrix K : Lysin, basische As F: Arginin, ebenfalls basisch -> positive Score

  39. Kombinatorischer Ansatz 8/10

  40. Option 2 Biologisches Phänomen: In der DNA kann es zu INsertion und DELetion von Basen kommen, es kann also ein besserer Match gefunden wenn statt zu Vergleichen diese Basen übersprungen werden. Dabei wird eine Penalty vergeben ( negatives Vorzeichen von Dindel !!!)

  41. Beispiel zu InDel LIEBE LEBEN mögliches Annealing: 1Match LIEBE_ L_EBEN besseres Annealing: 4 Matches, 2 InDel‘s

  42. Kombinatorischer Ansatz 8/10

  43. Kombinatorischer Ansatz 8/10

  44. Kombinatorischer Ansatz 8/10

  45. Kombinatorischer Ansatz 8/10

  46. Kombinatorischer Ansatz 8/10

  47. Vergleich beider Verfahren RT-PCR Nachteile : Vorteile : • nachweisbar (genauer) • grosser Aufwand Spliced Alignment Nachteile : Vorteile : • schnelleres Verfahren • je mehr Daten zur Verfügung, • desto optimaler • kurze Sequenzen probl. • ...

  48. Weitere Problemlösungsansätze • Statistische Annäherung • Hidden Markov Modelle • Reverse Gene Finding

  49. Kombinatorischer Ansatz Zusatz Beispiel : genomic sequence : It was brilliant thrilling morning and the slimy hellish lithe doves gyrated and gambled nimbly in the waves. famous line : ´t was brillig, and the slithy toves did gyre and gimble in the wabe. (Lewis Carroll)

  50. Kombinatorischer Ansatz 7/10 Ablauf des Algorithmus :

More Related