12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

81
12.06.2003 Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Visualisierung von Sequenzvergleichen Sequenzvergleichen

Transcript of 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

Page 1: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

1 / 81

Visualisierung von Visualisierung von SequenzvergleichenSequenzvergleichen

Page 2: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

Ein paar Worte vorweg

Page 3: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

3 / 81

Wir stellen uns vor:

• André Brück

• Kai Scheiffele

2579542

25795422579542

231151923115192311519

Page 4: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

4 / 81

Warum Visualisierung von Sequenzvergleichen?

Page 5: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

5 / 81

Warum Visualisierung von Sequenzvergleichen?

• Datenmenge steigt immer weiter und immer schneller an

Page 6: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

6 / 81

Warum Visualisierung von Sequenzvergleichen?

• Datenmenge steigt immer weiter und immer schneller an

• Visualisierung von Sequenzvergleichen erleichtert es dem Wissenschaftler enorm neue Daten auszuwerten und Ergebnisse einzuordnen

Page 7: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

Gliederung

Page 8: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

8 / 81

Gliederung

• Einführung √• Grundlagen

– DNA – Datenbanken– Sequenzierung

• Algorithmen– BLAST – FASTA

• Visualisierungs - Tools – SimiTri– Alignment Viewer

• Zusammenfassung anschl. Fragen / Diskussion

Page 9: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

9 / 81

Gliederung

• Einführung √• Grundlagen

– DNA – Datenbanken– Sequenzierung

• Algorithmen– BLAST – FASTA

• Visualisierungs - Tools – SimiTri– Alignment Viewer

• Zusammenfassung anschl. Fragen / Diskussion

Page 10: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

10 / 81

Gliederung

• Einführung √• Grundlagen

– DNA – Datenbanken– Sequenzierung

• Algorithmen– BLAST – FASTA

• Visualisierungs - Tools – SimiTri– Alignment Viewer

• Zusammenfassung anschl. Fragen / Diskussion

Page 11: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

11 / 81

Gliederung

• Einführung √• Grundlagen

– DNA – Datenbanken– Sequenzierung

• Algorithmen– BLAST – FASTA

• Visualisierungs - Tools – SimiTri– Alignment Viewer

• Zusammenfassung anschl. Fragen / Diskussion

Page 12: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

12 / 81

Gliederung

• Einführung √• Grundlagen

– DNA – Datenbanken– Sequenzierung

• Algorithmen– BLAST – FASTA

• Visualisierungs - Tools – SimiTri– Alignment Viewer

• Zusammenfassung anschl. Fragen / Diskussion

Page 13: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

Grundlagen

Page 14: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

14 / 81

GrundlagenDNA

Page 15: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

15 / 81

Grundlagen DNA

• DNA ist das Molekül mit der primären genetischen Information. Sie wird aus den vier Nucleotiden A, T, G und C zusammengesetzt

Page 16: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

16 / 81

Grundlagen DNA

• DNA ist das Molekül mit der primären genetischen Information. Sie wird aus den vier Nucleotiden A, T, G und C zusammengesetzt

• Ein Codon ist ein Nucleotid-Triplet, welches für bestimmte Aminosäuren oder Termination codiert

http://www.engineering.ucsb.edu/~trevorc/images/tech/transcription.jpg

http://www.engineering.ucsb.edu/~trevorc/images/tech/translation.jpg

Page 17: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

17 / 81

Grundlagen DNA

• Der offene Leserahmen (ORF) besteht aus

einer Reihe von Codons, die für ein Peptid codieren • Auf doppelsträngiger DNA gibt es sechs solcher

ORFs

www.usask.ca/biology/211/211questions/ sgd3prob.html

Page 18: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

18 / 81

Grundlagen Datenbanken

Page 19: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

19 / 81

Grundlagen Datenbanken

• Datenbanken sind ein Hilfsmittel, welches die Informatik bereitstellt und dienen der Speicherung und Wiedergewinnung von umfangreichen Datenmengen

Page 20: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

20 / 81

Grundlagen Datenbanken

• Datenbanken sind ein Hilfsmittel, welches die Informatik bereitstellt und dienen der Speicherung und Wiedergewinnung von umfangreichen Datenmengen

• Datenbanken mit genetischen Sequenzen eignen sich besonders für Sequenzvergleiche (siehe BLAST, FASTA)

Page 21: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

21 / 81

Grundlagen Sequenzierung

Page 22: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

22 / 81

Grundlagen Sequenzierung

• Die Sequenzierung (z.B. über PCR) liefert Rohdaten für die Datenbank

Page 23: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

23 / 81

Grundlagen Sequenzierung

• Die Sequenzierung (z.B. über PCR) liefert Rohdaten für die Datenbank

• Format: ASN.1, FASTA,…

Page 24: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

24 / 81

Gliederung

• Einführung √• Grundlagen √

– DNA – Datenbanken– Sequenzierung

• Algorithmen– BLAST – FASTA

• Visualisierungs - Tools – SimiTri– Alignment Viewer

• Zusammenfassung

Page 25: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

Algorithmen

Page 26: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

26 / 81

Algorithmen

• BLAST – Wissenswertes– Mathematische Grundlagen– Wirkungsweise– Vorteile / Nachteile

• FASTA– Wissenswertes– Vorteile / Nachteile

Page 27: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

27 / 81

BLASTWissenswertes

• „Basic Local Alignment Search Tools“

• Beschrieben von Stephen F. Altschul et al. (1990)

• Effizienter Algorithmus zum Finden von Gleichheiten / Verwandtschaften zwischen DNA / Proteinsequenzen

• Findet die ähnlichste(n) Sequenz(en) innerhalb einer BLAST-Datenbank

• Als Web-Tool oder Stand-Alone (PC, UNIX, Mac)

Page 28: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

28 / 81

BLASTWissenswertes (2)

• BLASTP – Protein / Protein-Vergleich• BLASTN – DNA / DNA-Vergleich• BLASTX – DNA / Protein-Vergleich (2x3RF)• TBLASTN – Protein / DNA-Vergleich (2x3RF)• TBLASTX – Protein in DNA / Protein in DNA

DB (6*6 Reading Frames)• BLAST2 – „advanced BLAST“ / inkl. GAPs• PSIBLAST – „Position Specific Iterated“ Protein

/ Protein (mehrere Durchgänge)

Page 29: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

29 / 81

BLASTMathematische Grundlagen

• BLAST geht von 2 Sequenzen A(subject) und B(query) aus mit

• A = a1a2....an und

• B = b1b2...bn .

• Einfacher Vergleich (z.B. a1-b1) aufgrund Deletion, Insertion, ReadingFrames nicht möglich.

• Aufbau einer Matrix mit verschiedenen Gewichtungen für alle möglichen, vorkommenden Paare von Sequenzteilen.

Page 30: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

30 / 81

BLASTWirkungsweise

• Matrix: Alle RFs werden parallel durchsucht (mittels Pointer)

nur ein Durchlauf für alle RF´s

• BLAST2 kann auch GAPs ermitteln

• Beispiele für Gewichtungen:– Match 5– Mismatch –4

• Verschiedene Matrizen:– BLOSUM62– PAM120

Page 31: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

31 / 81

BLASTVorteile / Nachteile

• Vorteile– Schnell / Effizient– Variabel– Kostenlos

• Nachteile– Ausgabe muss weiter

überarbeitet werden– Ausgabe wächst mit der

Größe der Datenbank (Verdopplung DB alle 1.2 Jahre, PubMed)

Page 32: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

32 / 81

Algorithmen

• BLAST √– Wissenswertes– Mathematische Grundlagen– Wirkungsweise– Vorteile / Nachteile

• FASTA– Wissenswertes– Vorteile / Nachteile

Page 33: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

33 / 81

FASTAWissenswertes

Auch hier verschiedene Typen:

- FastA: DNA/DNA- FastX: DNA/Protein

(GAPs nur zw. Codons)- FastY: DNA/Protein

(inkl. GAPs)

- TFastA: Protein/DNA

Page 34: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

34 / 81

FASTAVorteile / Nachteile

• Vorteile– Findet GAPs selbst

innerhalb von Codons– Sensitiver als BLAST

• Nachteile– Findet nur 1

passendes Segment– Langsamer als BLAST

Page 35: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

35 / 81

FASTA FormatBeispiel

• 1: AY279354. SARS coronavirus ...[gi:31416306] AGCTGTCGCTCGGCTGCATGCCTAGTGCACCTACGCAGTATAAACAATAATAAATTTTACTATCGTTGACAAGAAACGAGTAACTCGTCCCTCTTCTGCAGACTGCTTACGGTT

TCGTCCGTGTTGCAGTCGATCATCAGCATACCTAGGTTTCGTCCGGGTGTGACCGAAAGGTAAGATGGAGAGCCTTGTTCTTGGTGTCAACGAGAAAACACACGTCCAACTCAGTTTGCCTGTCCTTCAGGTTAGAGACGTGCTAGTGCGTGGCTTCGGGGACTCTGTGGAAGAGGCCCTATCGGAGGCACGTGAACACCTCAAAAATGGCACTTGTGGTCTAGTAGAGCTGGAAAAAGGCGTACTGCCCCAGCTTGAACAGCCCTATGTGTTCATTAAACGTTCTGATGCCTTAAGCACCAATCACGGCCACAAGGTCGTTGAGCTGGTTGCAGAAATGGACGGCATTCAGTACGGTCGTAGCGGTATAACACTGGGAGTACTCGTGCCACATGTGGGCGAAACCCCAATTGCATACCGCAATGTTCTTCTTCGTAAGAACGGTAATAAGGGAGCCGGTGGTCATAGCTATGGCATCGATCTAAAGTCTTATGACTTAGGTGACGAGCTTGGCACTGATCCCATTGAAGATTATGAACAAAACTGGAACACTAAGCATGGCAGTGGTGCACTCCGTGAACTCACTCGTGAGCTCAATGGAGGTGCAGTCACTCGCTATGTCGACAACAATTTCTGTGGCCCAGATGGGTACCCTCTTGATTGCATCAAAGATTTTCTCGCACGCGCGGGCAAGTCAATGTGCACTCTTTCCGAACAACTTGATTACATCGAGTCGAAGAGAGGTGTCTACTGCTGCCGTGACCATGAGCATGAAATTGCCTGGTTCACTGAGCGCTCTGATAAGAGCTACGAGCACCAGACACCCTTCGAAATTAAGAGTGCCAAGAAATTTGACACTTTCAAAGGGGAATGCCCAAAGTTTGTGTTTCCTCTTAACTCAAAAGTCAAAGTCATTCAACCACGTGTTGAAAAGAAAAAGACTGAGGGTTTCATGGGGCGTATACGCTCTGTGTACCCTTTTGCATCTCCACAGGAGTGTAACAATATGCACTTGTCTACCTTGATGAAATGTAATCATTGCGATGAAGTTTCATGGCAGACGTGCGACTTTCTGAAAGCCACTTGTGAACATTGTGGCACTGAAAATTTAGTTATTGAAGGACCTACTACATGTGGGTACCTACCTACTAATGCTGTAGTGAAAATGCCATGTCCTGCCTGTCAAGACCCAGAGATTGGACCTGAGCATAGTGTTGCAGATTATCACAACCACTCAAACATTGAAACTCGACTCCGCAAGGGAGGTAGGACTAGATGTTTTGGAGGCTGTGTGTTTGCCTATGTTGGCTGCTATAATAAGCGTGCCTACTGGGTTCCTCGTGCTAGTGCTGATATTGGCTCAGGCCATACTGGCATTACTGGTGACAATGTGGAGACCTTGAATGAGGATCTCCTTGAGATACTGAGTCGTGAACGTGTTAACATTAACATTGTTGGCGATTTTCATTTGAATGAAGAGGTTGCCATCATTTTGGCATCTTTCTCTGCTTCTACAAGTGCCTTTATTGACACTATAAAGAGTCTTGATTACAAGTCTTTCAAAACCATTGTTGAGTCCTGCGGTAACTATAAAGTTACCAAGGGAAAGCCCGTAAAAGGTGCTTGGAACATTGGACAACAGAGATCAGTTTTAACACCACTGTGTGGTTTTCCCTCACAGGCTGCTGGTGTTATCAGATCAATTTTTGCGCGCACACTTGATGCAGCAAACCACTCAATTCCTGATTTGCAAAGAGCAGCTGTCACCATACTTGATGGTATTTCTGAACAGTCATTACGTCTTGTCGACGCCATGGTTTATACTTCAGACCTGCTCACCAACAGTGTCATTATTATGGCATATGTAACTGGTGGTCTTGTACAACAGACTTCTCAGTGGTTGTCTAATCTTTTGGGCACTACTGTTGAAAAACTCAGGCCTATCTTTGAATGGATTGAGGCGAAACTTAGTGCAGGAGTTGAATTTCTCAAGGATGCTTGGGAGATTCTCAAATTTCTCATTACAGGTGTTTTTGACATCGTCAAGGGTCAAATACAGGTTGCTTCAGATAACATCAAGGATTGTGTAAAATGCTTCATTGATGTTGTTAACAAGGCACTCGAAATGTGCATTGATCAAGTCACTATCGCTGGCGCAAAGTTGCGATCACTCAACTTAGGTGAAGTCTTCATCGCTCAAAGCAAGGGACTTTACCGTCAGTGTATACGTGGCAAGGAGCAGCTGCAACTACTCATGCCTCTTAAGGCACCAAAAGAAGTAACCTTTCTTGAAGGTGATTCACATGACACAGTACTTACCTCTGAGGAGGTTGTTCTCAAGAACGGTGAACTCGAAGCACTCGAGACGCCCGTTGATAGCTTCACAAATGGAGCTATCGTTGGCACACCAGTCTGTGTAAATGGCCTCATGCTCTTAGAGATTAAGGACAAAGAACAATACTGCGCATTGTCTCCTGGTTTACTGGCTACAAACAATGTCTTTCGCTTAAAAGGGGGTGCACCAATTAAAGGTGTAACCTTTGGAGAAGATACTGTTTGGGAAGTTCAAGGTTACAAGAATGTGAGAATCACATTTGAGCTTGATGAACGTGTTGACAAAGTGCTTAATGAAAAGTGCTCTGTCTACACTGTTGAATCCGGTACCGAAGTTACTGAGTTTGCATGTGTTGTAGCAGAGGCTGTTGTGAAGACTTTACAACCAGTTTCTGATCTCCTTACCAACATGGGTATTGATCTTGATGAGTGGAGTGTAGCTACATTCTACTTATTTGATGATGCTGGTGAAGAAAACTTTTCATCACGTATGTATTGTTCCTTTTACCCTCCAGATGAGGAAGAAGAGGACGATGCAGAGTGTGAGGAAGAAGAAATTGATGAAACCTGTGAACATGAGTACGGTACAGAGGATGATTATCAAGGTCTCCCTCTGGAATTTGGTGCCTCAGCTGAAACAGTTCGAGTTGAGGAAGAAGAAGAGGAAGACTGGCTGGATGATACTACTGAGCAATCAGAGATTGAGCCAGAACCAGAACCTACACCTGAAGAACCAGTTAATCAGTTTACTGGTTATTTAAAACTTACTGACAATGTTGCCATTAAATGTGTTGACATCGTTAAGGAGGCACAAAGTGCTAATCCTATGGTGATTGTAAATGCTGCTAACATACACCTGAAACATGGTGGTGGTGTAGCAGGTGCACTCAACAAGGCAACCAATGGTGCCATGCAAAAGGAGAGTGATGATTACATTAAGCTAAATGGCCCTCTTACAGTAGGAGGGTCTTGTTTGCTTTCTGACATAATCTTGCTAAGAAGTGTCTGCATGTTGTTGGACCTAACCTAAATGCAGGTGAGGACATCCAGCTCTTAAGGCAGCATATGAAAATTTCAATTCACAGGACATCTTACTTGCACCATTGTTGTCAGCAGGCATATTTGGTGCTAAACCACTTCAGTCTTTACAAGTGTGCGTGCAGACGGTTCGTACACAGGTTTATATTGCATCAATGACAAAGCTCTTTATGAGCAGGTTGTCATGGATTATCTTGATAACCTGAAGCCTAGAGTGGAA

Page 36: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

36 / 81

Gliederung

• Einführung √• Grundlagen √

– DNA – Datenbanken– Sequenzierung

• Algorithmen √– BLAST – FASTA

• Visualisierungs - Tools – SimiTri– Alignment Viewer

• Zusammenfassung

Page 37: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

Visualisierungstools

Page 38: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

38 / 81

SimiTri• Übersicht• Methoden• Visualisierung• Vorteile / Nachteile• Zusammenfassung

Page 39: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

39 / 81

SimiTriÜbersicht

• JAVA / Perl – based Applet

• Zum Vergleich von 3 Datensätzen

• Schnelle Übersicht von Verwandtschaften

• Vereinfacht z.B. Evolutionsforschung

Page 40: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

40 / 81

SimiTriÜbersicht (2)

• Selekt. Cluster (Name)

• Mapper• Datensätze• Visualisierung• Cutoff-Score• Zoom-Balken

Page 41: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

41 / 81

SimiTriMethoden

• Erstellen von einem „similarity profile“– Mittels BLAST-Suche

gegen versch. DB– 50 „high score“-Cluster

(Ähnliche Sequenzen werden zu Clustern zusammen-gefasst)

– Alle Scores gegenseitig in Relation setzen.

– Sequenzliste wird unterhalb der Grafik mit ausgegeben.

Page 42: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

42 / 81

SimiTriVisualisierung

• BLAST-Score = relative Entfernung des Clusters vom Zentrum

• Farbe = Cutoff-Score

• Räumliche Anordnung im Dreieck = „Näher verwandt mit...“

Page 43: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

43 / 81

SimiTriVisualisierung (2)

• Protein aus A näher Protein aus A näher verwandt mit B als mit verwandt mit B als mit CC

• In allen DB gleichIn allen DB gleich• Protein in B und C Protein in B und C

gleich, nicht in A.gleich, nicht in A.

A

B C

Page 44: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

44 / 81

SimiTriVorteile / Nachteile

• Vorteile:– Übersichtlich– Viele Information bei

Selektion eines Cluster

• Nachteile– Nur 3 Organismen– Nur 50 Cluster– Z.Zt. nur online für

Nematoden

Page 45: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

45 / 81

SimiTriZusammenfassung

• Farbige, graphische Auswertung

• Interaktiv• Zoombar• Übersichtlich• Schnell• Kostenlos

Page 46: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

Alignment Viewer(AV)

Page 47: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

47 / 81

Alignment ViewerÜbersicht

• Wofür ist der AV gut?

• Wie arbeitet der AV?

• Was bietet der AV noch für Möglichkeiten?

• Was kann der Wissenschaftler mit dem AV erkennen?

• Wie sieht die Zukunft des AV aus?

Page 48: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

48 / 81

AVWofür ist der AV gut?

Page 49: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

49 / 81

AVWofür ist der AV gut?

• Algorithmen wie BLAST liefern nur eine Textausgabe:

Page 50: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

50 / 81

Page 51: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

51 / 81

AVWofür ist der AV gut?

• Algorithmen wie BLAST liefern nur eine Textausgabe:

Page 52: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

52 / 81

AVWofür ist der AV gut?

• Algorithmen wie BLAST liefern nur eine Textausgabe:

• AV hilft bei der Analyse von Sequenzvergleichen durch Visualisierungs- techniken:

Page 53: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

53 / 81

AVWie arbeitet der AV?

Page 54: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

54 / 81

AVWie arbeitet der AV?

Page 55: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

55 / 81

AVWie arbeitet der AV?

Page 56: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

56 / 81

AVWie arbeitet der AV?

• X-Achse: Eingabesequenz

Page 57: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

57 / 81

AVWie arbeitet der AV?

• X-Achse: Eingabesequenz

• Y-Achse: Similarity score

Page 58: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

58 / 81

AVWie arbeitet der AV?

• X-Achse: Eingabesequenz

• Y-Achse: Similarity score

• Z-Achse: Leserahmen (auch durch Farben möglich)

Page 59: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

59 / 81

AV Was bietet der AV noch für Möglichkeiten?

Page 60: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

60 / 81

AV Was bietet der AV noch für Möglichkeiten?

• Hyperlinks („detail-on-demand“)

Page 61: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

61 / 81

AV Was bietet der AV noch für Möglichkeiten?

• Hyperlinks („detail-on-demand“)

• Unabhängige Skalierung aller Achsen

Page 62: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

62 / 81

AV Was bietet der AV noch für Möglichkeiten?

• Hyperlinks („detail-on-demand“)

• Unabhängige Skalierung aller Achsen

• Animierung durch 4. Dimension (Zeit)

Page 63: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

63 / 81

AV Was bietet der AV noch für Möglichkeiten?

• Hyperlinks („detail-on-demand“)

• Unabhängige Skalierung aller Achsen

• Animierung durch 4. Dimension (Zeit)

• Freie Belegung der 4 Dimensionen (X, Y, Z, Zeit) mit den 12 Variablen eines Alignments

Page 64: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

64 / 81

AV Was bietet der AV noch für Möglichkeiten?

• Hyperlinks („detail-on-demand“)

• Unabhängige Skalierung aller Achsen

• Animierung durch 4. Dimension (Zeit)

• Freie Belegung der 4 Dimensionen (X, Y, Z, Zeit) mit den 12 Variablen eines Alignments

• Filterung

Page 65: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

65 / 81

AV Was kann der Wissenschaftler mit dem AV

erkennen?

Page 66: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

66 / 81

AV Was kann der Wissenschaftler mit dem AV

erkennen? • Das Verhältnis zwischen Eingabesequenz

und Alignments

Page 67: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

67 / 81

AV Was kann der Wissenschaftler mit dem AV

erkennen? • Das Verhältnis zwischen Eingabesequenz

und Alignments

• Den korrekten Leserahmen

Page 68: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

68 / 81

AV Was kann der Wissenschaftler mit dem AV

erkennen? • Das Verhältnis zwischen Eingabesequenz

und Alignments

• Den korrekten Leserahmen

• Eventuelle Frame Shifts

Page 69: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

69 / 81

AV Was kann der Wissenschaftler mit dem AV

erkennen? • Das Verhältnis zwischen Eingabesequenz

und Alignments

• Den korrekten Leserahmen

• Eventuelle Frame Shifts

• Konservierte Regionen

Page 70: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

70 / 81

AVWie sieht die Zukunft des AV aus?

Page 71: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

71 / 81

AVWie sieht die Zukunft des AV aus?

• Flexiblere Filter

Page 72: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

72 / 81

AVWie sieht die Zukunft des AV aus?

• Flexiblere Filter

• Simultane Visualisierung von mehreren Suchreporten

Page 73: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

73 / 81

AVWie sieht die Zukunft des AV aus?

• Flexiblere Filter

• Simultane Visualisierung von mehreren Suchreporten

• Mehr Plattformen (bisher nur SGI und Sun)

Page 74: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

74 / 81

Gliederung

• Einführung √• Grundlagen √

– DNA

– Datenbanken

– Sequenzierung

• Algorithmen √– BLAST

– FASTA

• Visualisierungs - Tools √– SimiTri

– Alignment Viewer

• Zusammenfassung

Page 75: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

Zusammenfassung

Page 76: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

76 / 81

Zusammenfassung

• Einführung • Grundlagen

– DNA – Datenbanken– Sequenzierung

• Algorithmen– BLAST – FASTA

• Visualisierungs - Tools – SimiTri– Alignment Viewer

• Zusammenfassung

Page 77: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

77 / 81

Zusammenfassung

• Einführung Wofür Visualisierung von Sequenzvergl?• Grundlagen

– DNA

– Datenbanken

– Sequenzierung

• Algorithmen– BLAST

– FASTA

• Visualisierungs - Tools – SimiTri

– Alignment Viewer

• Zusammenfassung

Page 78: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

78 / 81

Zusammenfassung

• Einführung • Grundlagen

– DNA

– Datenbanken

– Sequenzierung

• Algorithmen– BLAST

– FASTA

• Visualisierungs - Tools Zwei Beispiele solcher Tools – SimiTri

– Alignment Viewer

• Zusammenfassung

Page 79: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

79 / 81

Zusammenfassung

• Einführung • Grundlagen

– DNA

– Datenbanken

– Sequenzierung

• Algorithmen Algorithmen auf denen die Tools basieren– BLAST

– FASTA

• Visualisierungs - Tools – SimiTri

– Alignment Viewer

• Zusammenfassung

Page 80: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

12.06.2003 Proseminar BioVisA. Brück & K. Scheiffele

80 / 81

Zusammenfassung

• Einführung • Grundlagen Grundlegende Begriffe zum Verständnis der Algos

– DNA

– Datenbanken

– Sequenzierung

• Algorithmen – BLAST

– FASTA

• Visualisierungs - Tools – SimiTri

– Alignment Viewer

• Zusammenfassung

Page 81: 12.06.2003Proseminar BioVis A. Brück & K. Scheiffele 1 / 81 Visualisierung von Sequenzvergleichen.

Danke für Eure Aufmerksamkeit!