Vergleich von Merkmalen in Flüssigchromatographie ... · Mathematik/Informatik Merkmale der Daten...
Transcript of Vergleich von Merkmalen in Flüssigchromatographie ... · Mathematik/Informatik Merkmale der Daten...
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Vergleich von Merkmalen inFlussigchromatographie-
Massenspektrometrie-Daten
Kristian Bredies
4. November 2005
1 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Inhalt
1 Einleitung
2 Flussigchromatographie-MassenspektrometrieDas VerfahrenMerkmale der DatenAufgabe
3 Erste LosungsansatzeEin AlgorithmusAusblick
2 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Hintergrund
Kontakt mit dem Pharma-Unternehmen Roche durch ManfredNolte seit August/September 2005
Untersuchung von Substanzen auf bestimmteStoffwechselprodukte
Vorhandene Software unzureichend
Bessere Algorithmen notig, um “schwache Signale”, zuerkennen
3 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Hintergrund
Kontakt mit dem Pharma-Unternehmen Roche durch ManfredNolte seit August/September 2005
Untersuchung von Substanzen auf bestimmteStoffwechselprodukte
Vorhandene Software unzureichend
Bessere Algorithmen notig, um “schwache Signale”, zuerkennen
3 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Allgemeine Aufgabe
Gegeben:
Ein Gemisch von Substanzen in jeweils einer Blankprobe und einerInkubationsprobe zu verschiedenen Zeitpunkten.
Gesucht:
Die Substanzen, um die sich die Proben unterscheiden und derenquantitative Entwicklung in den jeweiligen Zeiten.
4 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Allgemeine Aufgabe
Gegeben:
Ein Gemisch von Substanzen in jeweils einer Blankprobe und einerInkubationsprobe zu verschiedenen Zeitpunkten.
Gesucht:
Die Substanzen, um die sich die Proben unterscheiden und derenquantitative Entwicklung in den jeweiligen Zeiten.
4 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Das Verfahren
Die untersuchten Substanzen werden mit einemFlussigchromatographie-Massenspektrometer (LC-MS) analysiert.
Inkubationsprobe
Blankprobe
In diesen Geraten wird Chromatographie und Massenspektrometriekombiniert.
5 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Das Verfahren
Die untersuchten Substanzen werden mit einemFlussigchromatographie-Massenspektrometer (LC-MS) analysiert.
Inkubationsprobe
Blankprobe
In diesen Geraten wird Chromatographie und Massenspektrometriekombiniert.
5 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Das Verfahren
Die untersuchten Substanzen werden mit einemFlussigchromatographie-Massenspektrometer (LC-MS) analysiert.
Inkubationsprobe
Blankprobe
In diesen Geraten wird Chromatographie und Massenspektrometriekombiniert.
5 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Das Verfahren
Die untersuchten Substanzen werden mit einemFlussigchromatographie-Massenspektrometer (LC-MS) analysiert.
Inkubationsprobe
Blankprobe
In diesen Geraten wird Chromatographie und Massenspektrometriekombiniert.
5 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Flussigchromatographie-Massenspektrometrie
Schematische Funktionsweise:
100 200 300 400 500 6000
1
2
3
4x 10
6
100 200 300 400 500 6000
1
2
3
4x 10
6
100 200 300 400 500 6000
1
2
3
4x 10
6
100 200 300 400 500 6000
1
2
3x 10
6
100 200 300 400 500 6000
1
2
3x 10
6
100 200 300 400 500 6000
0.5
1
1.5
2x 10
6
6 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Flussigchromatographie-Massenspektrometrie
Schematische Funktionsweise:
100 200 300 400 500 6000
1
2
3
4x 10
6
100 200 300 400 500 6000
1
2
3
4x 10
6
100 200 300 400 500 6000
1
2
3
4x 10
6
100 200 300 400 500 6000
1
2
3x 10
6
100 200 300 400 500 6000
1
2
3x 10
6
100 200 300 400 500 6000
0.5
1
1.5
2x 10
6
6 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Flussigchromatographie-Massenspektrometrie
Schematische Funktionsweise:
100 200 300 400 500 6000
1
2
3
4x 10
6
100 200 300 400 500 6000
1
2
3
4x 10
6
100 200 300 400 500 6000
1
2
3
4x 10
6
100 200 300 400 500 6000
1
2
3x 10
6
100 200 300 400 500 6000
1
2
3x 10
6
100 200 300 400 500 6000
0.5
1
1.5
2x 10
6
6 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Flussigchromatographie-Massenspektrometrie
Schematische Funktionsweise:
100 200 300 400 500 6000
1
2
3
4x 10
6
100 200 300 400 500 6000
1
2
3
4x 10
6
100 200 300 400 500 6000
1
2
3
4x 10
6
100 200 300 400 500 6000
1
2
3x 10
6
100 200 300 400 500 6000
1
2
3x 10
6
100 200 300 400 500 6000
0.5
1
1.5
2x 10
6
6 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Flussigchromatographie-Massenspektrometrie
Schematische Funktionsweise:
100 200 300 400 500 6000
1
2
3
4x 10
6
100 200 300 400 500 6000
1
2
3
4x 10
6
100 200 300 400 500 6000
1
2
3
4x 10
6
100 200 300 400 500 6000
1
2
3x 10
6
100 200 300 400 500 6000
1
2
3x 10
6
100 200 300 400 500 6000
0.5
1
1.5
2x 10
6
6 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Flussigchromatographie-Massenspektrometrie
Schematische Funktionsweise:
100 200 300 400 500 6000
1
2
3
4x 10
6
100 200 300 400 500 6000
1
2
3
4x 10
6
100 200 300 400 500 6000
1
2
3
4x 10
6
100 200 300 400 500 6000
1
2
3x 10
6
100 200 300 400 500 6000
1
2
3x 10
6
100 200 300 400 500 6000
0.5
1
1.5
2x 10
6
6 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Flussigchromatographie-Massenspektrometrie
Schematische Funktionsweise:
100 200 300 400 500 6000
1
2
3
4x 10
6
100 200 300 400 500 6000
1
2
3
4x 10
6
100 200 300 400 500 6000
1
2
3
4x 10
6
100 200 300 400 500 6000
1
2
3x 10
6
100 200 300 400 500 6000
1
2
3x 10
6
100 200 300 400 500 6000
0.5
1
1.5
2x 10
6
6 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Flussigchromatographie-Massenspektrometrie
Schematische Funktionsweise:
100 200 300 400 500 6000
1
2
3
4x 10
6
100 200 300 400 500 6000
1
2
3
4x 10
6
100 200 300 400 500 6000
1
2
3
4x 10
6
100 200 300 400 500 6000
1
2
3x 10
6
100 200 300 400 500 6000
1
2
3x 10
6
100 200 300 400 500 6000
0.5
1
1.5
2x 10
6
6 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Flussigchromatographie-Massenspektrometrie
Schematische Funktionsweise:
100 200 300 400 500 6000
1
2
3
4x 10
6
100 200 300 400 500 6000
1
2
3
4x 10
6
100 200 300 400 500 6000
1
2
3
4x 10
6
100 200 300 400 500 6000
1
2
3x 10
6
100 200 300 400 500 6000
1
2
3x 10
6
100 200 300 400 500 6000
0.5
1
1.5
2x 10
6
6 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Merkmale der Daten
Interessant sind Peaks, die exponentiell inder Masse und wie eine Gaußkurve in derZeit verlaufen.
Die Peaks konnen sich uberlappen.
Die Datensatze sind teilweise sehr starkverrauscht, etwa in der Großenordnungder kleinsten interessanten Merkmale.
444 446 448 450
15
15.2
15.4
15.6
445
450 15
15.5
2468
x 107
7 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Merkmale der Daten
Interessant sind Peaks, die exponentiell inder Masse und wie eine Gaußkurve in derZeit verlaufen.
Die Peaks konnen sich uberlappen.
Die Datensatze sind teilweise sehr starkverrauscht, etwa in der Großenordnungder kleinsten interessanten Merkmale.
540 545 550 555 560
10
10.2
10.4
10.6
10.8
11
11.2
7 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Merkmale der Daten
Interessant sind Peaks, die exponentiell inder Masse und wie eine Gaußkurve in derZeit verlaufen.
Die Peaks konnen sich uberlappen.
Die Datensatze sind teilweise sehr starkverrauscht, etwa in der Großenordnungder kleinsten interessanten Merkmale.
250 260 2709.5
10
10.5
11
7 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Merkmale der Daten
Die LC-MS-Daten sind durchsetzt vonunerwunschten Dauerpeaks in zeitlicherRichtung.
Verschiedene Datensatze konnenzueinander zeitlich verzerrt undverschoben sein.
Die Peakhohen schwanken zwischen 105
und 108.
130 140 150 160 1709
9.5
10
10.5
11
11.5
12
12.5
13
13.5
14
8 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Merkmale der Daten
Die LC-MS-Daten sind durchsetzt vonunerwunschten Dauerpeaks in zeitlicherRichtung.
Verschiedene Datensatze konnenzueinander zeitlich verzerrt undverschoben sein.
Die Peakhohen schwanken zwischen 105
und 108.
280 300 32011.6
11.8
12
12.2
12.4
12.6
280 300 32011.6
11.8
12
12.2
12.4
12.6
280 300 32011.6
11.8
12
12.2
12.4
12.6
8 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Merkmale der Daten
Die LC-MS-Daten sind durchsetzt vonunerwunschten Dauerpeaks in zeitlicherRichtung.
Verschiedene Datensatze konnenzueinander zeitlich verzerrt undverschoben sein.
Die Peakhohen schwanken zwischen 105
und 108.
280 300 32011.6
11.8
12
12.2
12.4
12.6
280 300 32011.6
11.8
12
12.2
12.4
12.6
280 300 32011.6
11.8
12
12.2
12.4
12.6
8 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Merkmale der Daten
Die LC-MS-Daten sind durchsetzt vonunerwunschten Dauerpeaks in zeitlicherRichtung.
Verschiedene Datensatze konnenzueinander zeitlich verzerrt undverschoben sein.
Die Peakhohen schwanken zwischen 105
und 108.
140 160 180 200
2468
10
x 106
140 160 180 2000
2
4
x 105
8 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Aufgabe der Bildverarbeitung
Gegeben:
Zu unterschiedlichen Zeitpunkten jeweils ein PaarLC-MS-Datensatze.
Gesucht:
1 Die Position und Hohe der interessanten Peaks in denjeweiligen Datensatzen.
2 Eine Zuordnung der gleichen Peaks in einem Datenpaar.
3 Eine Quantifizierung der zeitlichen Entwicklung derunterschiedlichen Peaks.
9 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Aufgabe der Bildverarbeitung
Gegeben:
Zu unterschiedlichen Zeitpunkten jeweils ein PaarLC-MS-Datensatze.
Gesucht:
1 Die Position und Hohe der interessanten Peaks in denjeweiligen Datensatzen.
2 Eine Zuordnung der gleichen Peaks in einem Datenpaar.
3 Eine Quantifizierung der zeitlichen Entwicklung derunterschiedlichen Peaks.
9 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Erste Losungsansatze
Mogliches Verfahren zur Erkennung der Peaks in einem Datensatz:
Algorithmus
1 Entfernen von Rauschen.
2 Erkennen und Entfernen der Dauerpeaks in Zeitrichtung(vertikale Streifen).
3 Detektion von lokalen Maxima.
10 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Details zum Algorithmus
Entrauschen
Faltungs-Filtern entfernt kleine Peakszu schnell.
Wavelet-Hardthresholding mitz.B. db2 erhalt kleine Peaks besser.
Artefakte konnen durch Abschneidennegativer Werte verringert werden.
460 480 500
14.5
15
15.5
16
16.5
17
460 480 500
14.5
15
15.5
16
16.5
17
11 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Details zum Algorithmus
Entrauschen
Faltungs-Filtern entfernt kleine Peakszu schnell.
Wavelet-Hardthresholding mitz.B. db2 erhalt kleine Peaks besser.
Artefakte konnen durch Abschneidennegativer Werte verringert werden.
460 480 500
14.5
15
15.5
16
16.5
17
460 480 500
14.5
15
15.5
16
16.5
17
11 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Details zum Algorithmus
Entrauschen
Faltungs-Filtern entfernt kleine Peakszu schnell.
Wavelet-Hardthresholding mitz.B. db2 erhalt kleine Peaks besser.
Artefakte konnen durch Abschneidennegativer Werte verringert werden.
460 480 500
14.5
15
15.5
16
16.5
17
460 480 500
14.5
15
15.5
16
16.5
17
11 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Details zum Algorithmus
Erkennen der Basislinie
Erosion mit vertikalemStrukturelement.
Bei voller vertikaler Linie entsteheneigene unerwunschte Strukturen.
Drei-Punkt-Element bietetakzeptablen Kompromiss.
150 160 170 180 19011
11.5
12
12.5
13
150 160 170 180 19011
11.5
12
12.5
13
12 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Details zum Algorithmus
Erkennen der Basislinie
Erosion mit vertikalemStrukturelement.
Bei voller vertikaler Linie entsteheneigene unerwunschte Strukturen.
Drei-Punkt-Element bietetakzeptablen Kompromiss.
150 160 170 180 19011
11.5
12
12.5
13
150 160 170 180 19011
11.5
12
12.5
13
12 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Details zum Algorithmus
Erkennen der Basislinie
Erosion mit vertikalemStrukturelement.
Bei voller vertikaler Linie entsteheneigene unerwunschte Strukturen.
Drei-Punkt-Element bietetakzeptablen Kompromiss.
150 160 170 180 19011
11.5
12
12.5
13
150 160 170 180 19011
11.5
12
12.5
13
12 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Details zum Algorithmus
Detektieren der Peaks
Betrachte nur Peaksuber einem gewissenSchwellwert.
Finde Peaks durchlokale Maxima.
13 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Details zum Algorithmus
Detektieren der Peaks
Betrachte nur Peaksuber einem gewissenSchwellwert.
Finde Peaks durchlokale Maxima.
13 / 14Einleitung LC-MS Erste Losungsansatze
Zentrum furTechnomathematik Vergleich von LC-MS-Daten
Fachbereich 03Mathematik/Informatik
Ausblick
Folgende Schritte sind noch notig:
Exakte Bestimmung der Position und Hohe eines Peaks.
Korrektur der Zeitverzerrung/-verschiebung zwischen zweiDatensatzen.
Betrachtung und Vergleich mehrerer Datenpaare.
14 / 14Einleitung LC-MS Erste Losungsansatze