DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

58
DNA - Computing DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig

Transcript of DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Page 1: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

DNA - ComputingDNA - Computing

Seminar 2001

Institut Wissenschaftliches Rechnen

TU Braunschweig

Page 2: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

ÜberblickÜberblick

Historische EntwicklungBiologische GrundlagenHamilton Path Problem (HPP)Kombinatorische DNA – Lösung des HPPModelle von DNA-ComputingNanostrukturen der DNA Ausblick

Page 3: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

EinführungEinführung

1993 Adleman lernt die Grundlagen der Molekularbiologie

1994 Adleman löst das HPP mit Hilfe von DNA 1994 Publizierung seiner Ergebnisse 1995 Formalisierung des ersten Modells durch

Lipton Heute Breite Forschung mit weltweiten

Konferenzen

Page 4: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Biologische GrundlagenBiologische Grundlagen

• DNA als Informationsspeicher des DNA-Computers

• Operationen eines DNA-Computer

• Informationen kodieren• schreiben• lesen• manipulieren

Page 5: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

D N AD N A• 1944 von Avery entdeckt• Gundbaustein der Natur• besteht aus einzelnen Nukleotiden (Oligonukleotide)

• Zucker (desoxyribose)• Phosphatgruppe• Base

Page 6: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Detaillierter Aufbau eines Detaillierter Aufbau eines NukleotidsNukleotids

Page 7: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

D N AD N AModell der DNA• -Doppelhelix• strickleiterartiger Doppelstrang aus gleichlangen Polynukliotidketten

5‘ 3‘

5‘3‘

Page 8: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

DNA als InformationsträgerDNA als Informationsträger

• herkömmliche Computer haben Alphabet X = {0, 1} • DNA besitzt Alphabet X‘ = {A, T, G, C}

Die DNA eines Menschen umfasst 6 Milliarden Basenpaarewas einer Information von ca. 500 Büchern mit 1500 Seiten entspricht.

Page 9: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Amplifying (Replikation)Amplifying (Replikation)

Page 10: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Annealing / MeltingAnnealing / Melting

Melting(erhitzen)

Annealing(abkühlen)

Page 11: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

SynthesizingSynthesizing

Page 12: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

CuttingCutting

Page 13: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

SeparatingSeparating

Page 14: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

ExtractingExtracting

Page 15: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

SubstitutingSubstituting

Page 16: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Detecting / ReadingDetecting / Reading• Verwendung von PCR / Gelelektophorese• Einsatz von Blockmitteln bei der PCR• daraus resultieren kleinere Einzelstränge, die mit dem Hauptstrang zusammenhängen• durch veränderte Gelelektrophorese werden Positionen bestimmt

Neuere Methoden verwenden Leuchtstofffärbungen statt der PCR, die bei der Gelelektrophorese erkannt werden.

Page 17: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

...weitere Operationen...weitere Operationen

• Mixing (Crossover)• Ligating (Konkatenation)• Marking / Unmarking• Destroying (Exonuclease Enzyme)

Page 18: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

„„Ein DNA-Programm“Ein DNA-Programm“

• Gefäß mit in DNA kodierter Eingabe• ...Synthesizing...• ...Marking...• ...Ligating...• ...Reading...• ...• Ausgabe durch Detection als true / false oder wieder durch DNA kodiert

Page 19: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Hamilton Path ProblemHamilton Path Problem

Gegeben: Ein gerichteter Graph, ein Start- und ein Endknoten

Gesucht: Ein Pfad vom Start- bis zum Endknoten, wobei jeder Knoten genau einmal besucht werden muß.

42

71

36

5

Richtiger Weg:1326547

Page 20: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Lösen des HPP Lösen des HPP

1. Erzeuge eine Menge von zufällig bestimmten Pfaden durch den Graphen

2. Für alle Pfade in dieser Menge:a. Beginnt der Pfad mit dem Startknoten und endet mit

dem Endknoten ?b. Enthält der Pfad genau |V| Knoten ?c. Sind alle Knoten im Pfad vorhanden?

3. Alle Pfade in der verbleibenden Menge sind Lösungswege, ist die Menge leer gibt es keine Lösung.

Page 21: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Umsetzung des Algorithmus Umsetzung des Algorithmus mit DNA - Sequenzenmit DNA - Sequenzen

Kodierung der Knoten und Kanten als DNA-Sequenzen durch Synthetisierung

Länge der Sequenzen jeweils 20 BasenJeder Knoten und jede Kante eindeutig

Page 22: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Knoten und KantenKnoten und Kanten

TCAGGTCGAG TCAGGTCGAG GCCTACGTAG GCCTACGTAG

Knoten A Knoten B

AGTCCAGCTC CGGATGCATC

Kante A B

Komplement

Page 23: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Erzeugung aller PfadeErzeugung aller Pfade

TGAATCGACTTCCGATAGCT

TGAACTGGGATCTAGCTAGC

1014 Moleküle

0,9 % NaCL0,9 % NaCL

100 Mikroliter Kochsalzlösung

= TT-100

Page 24: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Erzeugung aller Pfade IIErzeugung aller Pfade II

• Hybridisierung von Knoten und Kanten• Ligation, zur Verstärkung des Rückrats der DNA

Page 25: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Ausfilterung der Pfade ohne Ausfilterung der Pfade ohne richtigen Start- und Endknotenrichtigen Start- und Endknoten

• Melting Trennung der Doppelhelix• Hinzugabe von Sequenzen der Start- und Endknoten als Primer• DNA-Polymerase vermehrt die DNA-Sequenzen unterschiedlich:

• Mit Start- und Endknoten exponentiell• Mit Start- oder Endknoten verdoppelt• Mit keiner Entsprechung gar nicht

• Nach mehren Zyklen des Erwärmens, Abkühlens und Vermehrens wird eine Probe entnommen, die jetzt fast nur noch Pfade einen richtigen Start- und Zielknoten enthält.

Page 26: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Kontrolle der LängeKontrolle der Länge

• Ein richtiger Pfad muß genau 140 bp (=Basenpaare) lang sein 7 Knoten a‘ 20 Basenpaaren• DNA-Sequenzen laufen elektrophoretisch über ein Agarose-Gel

Page 27: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Überprüfung der Existenz Überprüfung der Existenz jeden Knotensjeden Knotens

•Wiederholung für alle Knoten mit entsprechenden Sonden •Melting, damit DNA-Einzelstränge vorliegen• Einbringung von Eisensonden mit Komplementstrang eines Knoten• Durch Anbringung eines Magneten bleiben alle Moleküle haften, die diesen Knoten enthalten• Abgießen der Lösung und neue Lösung ansetzen• Melting trennt Stränge von Sonden• Abgießen der Lösung in ein neues Reagenzglas

Falls noch DNA vorhanden ist, muß das die Lösung des Problems Falls noch DNA vorhanden ist, muß das die Lösung des Problems sein.sein.

Page 28: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Eisensonden mit DNA-Eisensonden mit DNA-SequenzenSequenzen

Sonden-DNA

Eisenkugel

Enthaltener Knoten

Nicht passende DNA

Page 29: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

RückblickRückblick

Alle Pfade

Alle Pfade mit vS und vE

Alle Pfade mit der Länge |V|

Knoten 1 enthalten

Knoten 2 enthalten

Knoten n enthalten =Lösungsmenge

Page 30: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Fehler beim DNA-ComputingFehler beim DNA-Computing

Pfad wird nicht erzeugtOperationen arbeiten nicht fehlerfrei

Falsche Lösungen bleiben erhaltenFehlerursache Größe, Menge und Masse der DNA

Nur statistisch wahrscheinliche Lösung !

Page 31: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Beschränktes ModellBeschränktes Modell

DNA-Menge nimmt in der Berechnungsphase nicht mehr zu

DNA-Menge ist in der Initialisierungsphasebeschränkt

Anwendung von PCR wird ausgeschlossen

Page 32: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Beschränktes ModellBeschränktes ModellBitvektoren kodierende Sequenzen werden erzeugt.

....A0

A1 A2 An-1

An

X0=1

X0=0

X1=1

X1=0

Xn-1=1

Xn-1=0

Vorteil: Wiederverwendung der Bitstrings für andere Probleme

Page 33: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Beschränktes ModellBeschränktes ModellOperationenOperationen

ExtractionSequenzen werden getrennt, abhängig obSubsequenz vorhanden

MergeVereinigung zweier Mengen von DNA

DetectionTest, ob DNA überhaupt noch vorhanden

Page 34: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Unbeschränktes ModellUnbeschränktes Modell

Erweiterung des beschränkten Modellesdurch Adleman

Menge der DNA darf zunehmenErweiterte Operation:

Amplify (PCR)

Page 35: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Generator-ModellGenerator-Modell

Initialisierungsmenge effizienter nutzenSuchraum einschränken

Page 36: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Generator-ModellGenerator-ModellOperationenOperationen

• Split Zufällige Aufteilung der DNA-Menge in zwei Mengen• Append Verlängerung der Sequenzen um Sequenzteile• Merge Vereinigung von zwei DNA-Mengen

Iteratives Anwenden von Split - Append - Merge erzeugt zufällige Bitvektoren. Wenn Split - Merge an bestimmten Positionen wegge-lassen wird, haben alle Sequenzen an der Stelle die gleiche Bitbelegung.Der Suchraum hat eine Dimension weniger.

Page 37: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Surface-ModellSurface-Modell

DNA-Sequenzen fixiert auf einer OberflächeBessere KontrolleEinengung des Suchraums

Modell wird verwendet, um Erkenntnisse überOperationen und deren Fehler zu gewinnen

Page 38: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Nanostrukturen von DNANanostrukturen von DNA

DNA-Cube

Page 39: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Nanostrukturen von DNANanostrukturen von DNA

• Watson-Crick komplementär bildet Doppelhelix

• eine Zelle bildet verschiedene geometrische Gebilde

• Verhalten der Kreuzung ist vorhersagbar

• Oligonukleotide bis hin zu Superstrukturen können zur Realisierung verschiedener Rechenmodelle benutzt werden

Page 40: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Nanostrukturen von DNANanostrukturen von DNA

• „self-assembly“ DNA

• kleine Anzahl von Oligonukleotiden bildet self-assembled DNA-Stränge

• self-assembly entspricht gewissen Regeln

Page 41: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

„„self-assembly“ - Einsatzself-assembly“ - Einsatz

Durch die Definition verschiedene Operationen auf den verschiedenen Strukturen kann folgender Einsatz erreicht werden• linear doppelte DNA-Sequenz entspricht regulärer Sprache• self-assembled verzweigte DNA kann kontextfreie Sprachen erzeugen• doppelte Crossover-Moleküle sind geeignet für universelle Berechnungen

Page 42: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

„„small Bricks“small Bricks“

Page 43: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

T A ET A E

Triple Doppelhelix mit anti-parallelen Überkreuzungen und einer geraden Anzahl von Halbdrehungen

Page 44: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

T A OT A O

Geeignet für Xor - Funktion / Integer - Addition

Page 45: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

D A ED A E

Geeignet für Integer - Addition / Lösen des HPP

X

Y

Z

W

Im folgenden Gebrauch schematisch dargestellt als:

Page 46: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Ein-/Ausgabe mit Ein-/Ausgabe mit NanostrukturenNanostrukturen

Page 47: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

„„Adleman Graph“Adleman Graph“

65

71

42

3

Page 48: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Ablauf des AlgorithmusAblauf des Algorithmus

• Erzeugen aller Pfade von Knotenpunkt 1 zu Knotenpunkt N.

• Sortieren der Knoten in jedem Pfad in ansteigender Ordnung.

•Kontrolle für jeden Pfad, dass das Resultat genau “1,2, 3,...N” ist.

• Ausgabe jedes Weges, der den Test erfüllt, wenn es einen gibt.

Page 49: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Erzeugen aller PfadeErzeugen aller Pfade

Page 50: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

SortierenSortieren

Sortieren der einzelnen „Reihen“ durch „Odd-Even-Transposition Sort“

Page 51: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Komplettieren der StrukturKomplettieren der Struktur

• Einfügen spezieller End - Einheiten• „DONE“ kann die Struktur in den Finalzustand überführen

Page 52: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

BeispielergebnisseBeispielergebnisse

Gültiger Hamilton-Pfad (1,4,5,2,3,6,7)

Page 53: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

BeispielergebnisseBeispielergebnisse

Ungültiger Pfad (1,2,3,4,5,2,3,6,7)

Page 54: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Vergleich der AlgorithmenVergleich der Algorithmen

Adleman:• N (Nodes) + E (Edges) Oligonukleotide• N Laborschritte (durch Separating)

„self-assembled“:• E² / N + N² + N DAE Einheiten• konstante Anzahl von Laborschritten (Synthesizing, Annealing, Sequenzing)

Page 55: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Ausblick und BewertungAusblick und BewertungVorteileVorteile

Hohe Parallelität der Berechnung– Maximum 270 DNA-Stränge in einem

Reagenzglas

Hohe Energieeffizienz – 1 Joule schafft 2*1019 Operationen

Geringer Platzbedarf– 1 Bit braucht 1nm³

Page 56: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Ausblick und BewertungAusblick und BewertungNachteileNachteile

Viele Operationen sind zeitaufwendig– insbesondere Ein- und Ausgabe

NP-Probleme bleiben immer noch NP-Probleme

Operationen können fehlerhaft seinStatistisches VerfahrenKostenaufwendig

Page 57: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

Ausblick und BewertungAusblick und Bewertung

Interessant für Forschung und Technik (Medizin).Evolutionäre Algorithmen...

DNA-Computer werden in den nächsten 40 Jahrenvon-Neumann-Rechner für den Home-User nicht ablösen.

Page 58: DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig.

The EndThe End

Viel Spaß auf dem Sportfest....Viel Spaß auf dem Sportfest....

...PROST....PROST.