1 / 58

DNA - Computing

DNA - Computing. Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig. Überblick. Historische Entwicklung Biologische Grundlagen Hamilton Path Problem (HPP) Kombinatorische DNA – Lösung des HPP Modelle von DNA-Computing Nanostrukturen der DNA Ausblick. Einführung.

havyn
Télécharger la présentation

DNA - Computing

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig

  2. Überblick • Historische Entwicklung • Biologische Grundlagen • Hamilton Path Problem (HPP) • Kombinatorische DNA – Lösung des HPP • Modelle von DNA-Computing • Nanostrukturen der DNA • Ausblick

  3. Einführung • 1993 Adleman lernt die Grundlagen der Molekularbiologie • 1994 Adleman löst das HPP mit Hilfe von DNA • 1994 Publizierung seiner Ergebnisse • 1995 Formalisierung des ersten Modells durch Lipton • Heute Breite Forschung mit weltweiten Konferenzen

  4. Biologische Grundlagen • DNA als Informationsspeicher des DNA-Computers • Operationen eines DNA-Computer • Informationen kodieren • schreiben • lesen • manipulieren

  5. D N A • 1944 von Avery entdeckt • Gundbaustein der Natur • besteht aus einzelnen Nukleotiden (Oligonukleotide) • Zucker (desoxyribose) • Phosphatgruppe • Base

  6. Detaillierter Aufbau eines Nukleotids

  7. D N A 5‘ 3‘ • Modell der DNA • -Doppelhelix • strickleiterartiger Doppelstrang aus gleichlangen Polynukliotidketten 3‘ 5‘

  8. DNA als Informationsträger • herkömmliche Computer haben Alphabet X = {0, 1} • DNA besitzt Alphabet X‘ = {A, T, G, C} Die DNA eines Menschen umfasst 6 Milliarden Basenpaarewas einer Information von ca. 500 Büchern mit 1500 Seiten entspricht.

  9. Amplifying (Replikation)

  10. Annealing / Melting Melting(erhitzen) Annealing(abkühlen)

  11. Synthesizing

  12. Cutting

  13. Separating

  14. Extracting

  15. Substituting

  16. Detecting / Reading • Verwendung von PCR / Gelelektophorese • Einsatz von Blockmitteln bei der PCR • daraus resultieren kleinere Einzelstränge, die mit dem Hauptstrang zusammenhängen • durch veränderte Gelelektrophorese werden Positionen bestimmt Neuere Methoden verwenden Leuchtstofffärbungen statt der PCR, die bei der Gelelektrophorese erkannt werden.

  17. ...weitere Operationen • Mixing (Crossover) • Ligating (Konkatenation) • Marking / Unmarking • Destroying (Exonuclease Enzyme)

  18. „Ein DNA-Programm“ • Gefäß mit in DNA kodierter Eingabe • ...Synthesizing... • ...Marking... • ...Ligating... • ...Reading... • ... • Ausgabe durch Detection als true / false oder wieder durch DNA kodiert

  19. 5 6 3 1 7 2 4 Hamilton Path Problem Gegeben: Ein gerichteter Graph, ein Start- und ein Endknoten Gesucht: Ein Pfad vom Start- bis zum Endknoten, wobei jeder Knoten genau einmal besucht werden muß. Richtiger Weg:1326547

  20. Lösen des HPP • Erzeuge eine Menge von zufällig bestimmten Pfaden durch den Graphen • Für alle Pfade in dieser Menge: • Beginnt der Pfad mit dem Startknoten und endet mit dem Endknoten ? • Enthält der Pfad genau |V| Knoten ? • Sind alle Knoten im Pfad vorhanden? • Alle Pfade in der verbleibenden Menge sind Lösungswege, ist die Menge leer gibt es keine Lösung.

  21. Umsetzung des Algorithmus mit DNA - Sequenzen • Kodierung der Knoten und Kanten als DNA-Sequenzen durch Synthetisierung • Länge der Sequenzen jeweils 20 Basen • Jeder Knoten und jede Kante eindeutig

  22. Knoten und Kanten Knoten B Knoten A TCAGGTCGAG TCAGGTCGAG GCCTACGTAG GCCTACGTAG Komplement AGTCCAGCTC CGGATGCATC Kante A  B

  23. Erzeugung aller Pfade 100 Mikroliter Kochsalzlösung 1014 Moleküle TGAACTGGGATCTAGCTAGC 0,9 % NaCL TGAATCGACTTCCGATAGCT = TT-100

  24. Erzeugung aller Pfade II • Hybridisierung von Knoten und Kanten • Ligation, zur Verstärkung des Rückrats der DNA

  25. Ausfilterung der Pfade ohne richtigen Start- und Endknoten • Melting  Trennung der Doppelhelix • Hinzugabe von Sequenzen der Start- und Endknoten als Primer • DNA-Polymerase vermehrt die DNA-Sequenzen unterschiedlich: • Mit Start- und Endknoten exponentiell • Mit Start- oder Endknoten verdoppelt • Mit keiner Entsprechung gar nicht • Nach mehren Zyklen des Erwärmens, Abkühlens und Vermehrens wird eine Probe entnommen, die jetzt fast nur noch Pfade einen richtigen Start- und Zielknoten enthält.

  26. Kontrolle der Länge • Ein richtiger Pfad muß genau 140 bp (=Basenpaare) lang sein 7 Knoten a‘ 20 Basenpaaren • DNA-Sequenzen laufen elektrophoretisch über ein Agarose-Gel

  27. Überprüfung der Existenz jeden Knotens • Wiederholung für alle Knoten mit entsprechenden Sonden • Melting, damit DNA-Einzelstränge vorliegen • Einbringung von Eisensonden mit Komplementstrang eines Knoten • Durch Anbringung eines Magneten bleiben alle Moleküle haften, die diesen Knoten enthalten • Abgießen der Lösung und neue Lösung ansetzen • Melting trennt Stränge von Sonden • Abgießen der Lösung in ein neues Reagenzglas Falls noch DNA vorhanden ist, muß das die Lösung des Problems sein.

  28. Eisensonden mit DNA-Sequenzen Eisenkugel Sonden-DNA Enthaltener Knoten Nicht passende DNA

  29. Rückblick Alle Pfade Alle Pfade mit vS und vE Alle Pfade mit der Länge |V| Knoten 1 enthalten Knoten 2 enthalten Knoten n enthalten = Lösungsmenge

  30. Fehler beim DNA-Computing • Pfad wird nicht erzeugt • Operationen arbeiten nicht fehlerfrei Falsche Lösungen bleiben erhalten • Fehlerursache Größe, Menge und Masse der DNA Nur statistisch wahrscheinliche Lösung !

  31. Beschränktes Modell • DNA-Menge nimmt in der Berechnungsphase nicht mehr zu • DNA-Menge ist in der Initialisierungsphasebeschränkt • Anwendung von PCR wird ausgeschlossen

  32. Beschränktes Modell Bitvektoren kodierende Sequenzen werden erzeugt. X0=1 X1=1 Xn-1=1 A0 .... An A1 A2 An-1 X0=0 X1=0 Xn-1=0 Vorteil: Wiederverwendung der Bitstrings für andere Probleme

  33. Beschränktes ModellOperationen • ExtractionSequenzen werden getrennt, abhängig obSubsequenz vorhanden • MergeVereinigung zweier Mengen von DNA • DetectionTest, ob DNA überhaupt noch vorhanden

  34. Unbeschränktes Modell • Erweiterung des beschränkten Modellesdurch Adleman • Menge der DNA darf zunehmen • Erweiterte Operation: Amplify (PCR)

  35. Generator-Modell • Initialisierungsmenge effizienter nutzen • Suchraum einschränken

  36. Generator-ModellOperationen • Split Zufällige Aufteilung der DNA-Menge in zwei Mengen • Append Verlängerung der Sequenzen um Sequenzteile • Merge Vereinigung von zwei DNA-Mengen Iteratives Anwenden von Split - Append - Merge erzeugt zufällige Bitvektoren. Wenn Split - Merge an bestimmten Positionen wegge-lassen wird, haben alle Sequenzen an der Stelle die gleiche Bitbelegung.Der Suchraum hat eine Dimension weniger.

  37. Surface-Modell • DNA-Sequenzen fixiert auf einer Oberfläche • Bessere Kontrolle • Einengung des Suchraums • Modell wird verwendet, um Erkenntnisse überOperationen und deren Fehler zu gewinnen

  38. Nanostrukturen von DNA DNA-Cube

  39. Nanostrukturen von DNA • Watson-Crick komplementär bildet Doppelhelix • eine Zelle bildet verschiedene geometrische Gebilde • Verhalten der Kreuzung ist vorhersagbar • Oligonukleotide bis hin zu Superstrukturen können zur Realisierung verschiedener Rechenmodelle benutzt werden

  40. Nanostrukturen von DNA • „self-assembly“ DNA • kleine Anzahl von Oligonukleotiden bildet self-assembled DNA-Stränge • self-assembly entspricht gewissen Regeln

  41. „self-assembly“ - Einsatz • Durch die Definition verschiedene Operationen auf den verschiedenen Strukturen kann folgender Einsatz erreicht werden • linear doppelte DNA-Sequenz entspricht regulärer Sprache • self-assembled verzweigte DNA kann kontextfreie Sprachen erzeugen • doppelte Crossover-Moleküle sind geeignet für universelle Berechnungen

  42. „small Bricks“

  43. T A E Triple Doppelhelix mit anti-parallelen Überkreuzungen und einer geraden Anzahl von Halbdrehungen

  44. T A O Geeignet für Xor - Funktion / Integer - Addition

  45. Im folgenden Gebrauch schematisch dargestellt als: W Y X Z D A E Geeignet für Integer - Addition / Lösen des HPP

  46. Ein-/Ausgabe mit Nanostrukturen

  47. 3 2 4 1 7 5 6 „Adleman Graph“

  48. Ablauf des Algorithmus • Erzeugen aller Pfade von Knotenpunkt 1 zu Knotenpunkt N. • Sortieren der Knoten in jedem Pfad in ansteigender Ordnung. • Kontrolle für jeden Pfad, dass das Resultat genau “1,2, 3,...N” ist. • Ausgabe jedes Weges, der den Test erfüllt, wenn es einen gibt.

  49. Erzeugen aller Pfade

  50. Sortieren Sortieren der einzelnen „Reihen“ durch „Odd-Even-Transposition Sort“

More Related