Entwicklung einer Methode zur Identifizierung von ... · zur Identifizierung von Mikroorganismen...

100
Entwicklung einer Methode zur Identifizierung von Mikroorganismen über Raman-Spektroskopie Masterarbeit zur Erlangung des Master of Science an der Fakultät Life Sciences der Hochschule Rhein-Waal, Kleve Studiengang: Lebensmittelwissenschaften vorgelegt von Thomas Johann Tewes Kleve, Januar, 2019

Transcript of Entwicklung einer Methode zur Identifizierung von ... · zur Identifizierung von Mikroorganismen...

Entwicklung einer Methode

zur Identifizierung von Mikroorganismen

über Raman-Spektroskopie

Masterarbeit

zur

Erlangung des Master of Science

an der

Fakultät Life Sciences

der

Hochschule Rhein-Waal, Kleve

Studiengang: Lebensmittelwissenschaften

vorgelegt von

Thomas Johann Tewes

Kleve, Januar, 2019

1. Prüfer: Herr Prof. Dr.-Ing Frank Platte

2. Prüfer: Herr Prof. Dr. Dirk Bockmühl

I

Danksagung

Mein besonderer Dank gilt meinen beiden Betreuern Prof. Dr. Frank Platte, der sich sehr

viel Zeit für meine Einarbeitung in das Raman-System und die Software MATLAB nahm,

sowie Herrn Prof. Dr. Dirk Bockmühl, der es mir überhaupt erst ermöglichte an diesem

hochinteressanten Thema zu arbeiten.

Ebenfalls sehr dankbar bin ich:

Frau Britta Brands und Herrn Ralf Lucassen für die Bereitstellung der Mikroorganismen

und der Materialien, sowie für Ihre beispiellose Hilfsbereitschaft und dem Interesse an

meiner Arbeit.

Sowie meinen Eltern und meiner Familie, die mich auf verschiedenste Art und Weise un-

terstützten.

II

Inhaltsverzeichnis

Kurzzusammenfassung ................................................................................................ IV

Abstract ........................................................................................................................... V

Abbildungsverzeichnis ................................................................................................. VI

Tabellenverzeichnis .................................................................................................... VIII

Abkürzungsverzeichnis ................................................................................................ IX

1 Einleitung ...........................................................................................................1

1.1 Theoretischer Hintergrund ................................................................................3

1.1.1 Physiologie der Mikroorganismen ....................................................................3

1.1.2 Methoden zur Identifizierung von Mikroorganismen ........................................6

1.1.3 Raman-Spektroskopie ......................................................................................8

1.1.3.1 Theorie des Raman-Effekts .....................................................................8

1.1.3.2 Aufbau des Raman-Messsystems ........................................................10

1.1.3.3 Informationsreiche spektrale Regionen von Mikroorganismen ............10

1.1.3.4 Einflüsse auf die Qualität eines Raman-Spektrums .............................13

1.1.4 Datenvorbehandlung und Vorhersagemodelle ...............................................18

1.1.5 Einblick in Ergebnisse bisheriger Studien ......................................................19

1.2 Zielsetzung ......................................................................................................21

2 Material und Methoden ...................................................................................23

2.1 Material ............................................................................................................23

2.1.1 Geräte .............................................................................................................23

2.1.2 Software ..........................................................................................................24

2.1.3 Mikroorganismen.............................................................................................24

2.1.4 Verbrauchsmaterialien ....................................................................................24

2.2 Methoden ........................................................................................................25

2.2.1 Anzucht der Mikroorganismen ........................................................................25

2.2.2 Probenpräparation ..........................................................................................25

2.2.3 Vorbereitung des Raman-Messsystems ........................................................26

2.2.4 Sammeln der Raman-Spektren ......................................................................26

2.2.5 Datenvorbehandlung .......................................................................................27

2.2.5.1 Interpolierung .........................................................................................27

2.2.5.2 Basislinienkorrektur und Glättung .........................................................28

2.2.5.3 Normalisierung.......................................................................................29

2.2.6 Hauptkomponentenanalyse ............................................................................31

2.2.7 Modellentwicklung zur Identifizierung von Mikroorganismen durch verschiedene Klassifikationsverfahren ...........................................................34

2.2.7.1 Quadratische Diskriminanzanalyse .......................................................34

2.2.7.2 Nächster-Nachbar-Algorithmus .............................................................36

2.2.7.3 Support Vector Maschine ......................................................................37

III

2.2.8 Validierung der Vorhersagemodelle ...............................................................38

2.2.8.1 Kreuzvalidierung ....................................................................................38

2.2.8.2 Praktische Validierung ...........................................................................39

3 Ergebnisse .......................................................................................................40

3.1 Spektrenaufzeichnung ....................................................................................40

3.1.1 Störung durch Umgebungslicht ......................................................................40

3.1.2 Störung durch Fluoreszenz .............................................................................41

3.1.3 Einfluss der Probenpräparation auf ein Spektrum .........................................41

3.1.4 Einfluss der Kultivierungsart auf ein Spektrum ..............................................43

3.1.5 Einfluss der Vorbestrahlung auf ein Spektrum ...............................................45

3.2 Modellentwicklung ...........................................................................................47

3.2.1 Datenvorbehandlung .......................................................................................47

3.2.2 Hauptkomponentenanalyse ............................................................................50

3.2.3 Klassifikationsverfahren und Kreuzvalidierung ..............................................52

3.2.3.1 Quadratische Diskriminanzanalyse .......................................................52

3.2.3.2 Nächster-Nachbar-Algorithmus .............................................................53

3.2.3.3 Support Vector Maschine ......................................................................54

3.3 Praktische Validierung ....................................................................................55

4 Diskussion .......................................................................................................61

4.1 Spektrenaufzeichnung ....................................................................................61

4.2 Datenvorbehandlung .......................................................................................62

4.3 Beurteilung der Leistung und mögliche Limitationen der entwickelten Methode ..........................................................................................................64

4.4 Möglichkeiten zur Vermeidung falsch positiver Vorhersagen ........................65

4.5 Ausblick ...........................................................................................................66

Anhang ...........................................................................................................................67

5 Literaturverzeichnis ........................................................................................82

Eidesstattliche Versicherung .......................................................................................88

IV

Kurzzusammenfassung

Zielstellung: Das Ziel dieser Arbeit war es, eine Methode zur Identifizierung von Mikroor-

ganismen über Mikro-Raman-Spektroskopie zu entwickeln. Dafür musste zunächst eine

Methode gefunden werden, um Spektren verschiedener Mikroorganismen mit ausreichen-

der Qualität zu erhalten. Im Anschluss sollte die Datensammlung erfolgen, bei der möglichst

viele repräsentative Spektren gesammelt werden. Mit den Daten mussten danach Modelle

zur Vorhersage unbekannter Raman-Spektren entwickelt werden, was eine entsprechende

Datenvorbehandlung voraussetzte. Um die Praxistauglichkeit der Modelle zu prüfen, sollten

diese auf Spektren von Proben angewandt werden, die nicht in den Kalibrationssets ent-

halten waren. Neben der Entwicklung der Methode und der Vorhersagemodelle, sollten

auch verschiedene Einflüsse der Analysebedingungen berücksichtigt werden.

Methoden: Neun verschiedene Mikroorganismen, die aus kryokonservierten Reinkulturen

stammten, wurden bei 30 °C für 24 Stunden auf Trypton Soja Agar (TSA) bebrütet. Die

Spektrenaufzeichnung erfolgte bei einer Anregung von 633 nm über ein konfokales Raman-

Mikroskop der Firma Renishaw. Sowohl die Datenvorbehandlung (Basislinienkorrektur,

Glättung, Normalisierung, Hauptkomponentenanalyse (PCA)), als auch die Modellentwick-

lung, erfolgte über die Software MATLAB. Es wurden verschiedene Klassifikationsverfahren

angewandt, um ein Modell mit möglichst guter Leistung zu finden.

Ergebnisse: Für die Entwicklung der Kalibrationsmodelle wurden insgesamt 2953 Raman-

Spektren von neun verschiedenen Mikroorganismen gesammelt. Störungen durch Fluores-

zenz wurden durch Vorbestrahlung von bis zu 15 Minuten ausgebrannt. Die Modelle basie-

rend auf der Quadratischen Diskriminanzanalyse (QDA), dem k-Nächster-Nachbar-Algo-

rithmus (kNN) und der Support Vector Maschine (SVM), wurden mit verschiedener Anzahl

an Hauptkomponenten und einer fünffachen Kreuzvalidierung erstellt. Die theoretischen

Vorhersagegüten belaufen sich bei den genauesten Modellen auf 99,0 % (QDA), 99,1 %

(kNN) und 99,7 % (SVM). Für die praktische Validierung wurden für jeden Mikroorganismus

100 weitere „unbekannte“ Spektren gesammelt. Die Vorhersagegenauigkeiten in der Praxis

belaufen sich auf 98,1 % (QDA), 97,1 % (kNN) und 97,0 % (SVM).

Diskussion: Eine zuverlässige Identifizierung der in dieser Arbeit untersuchten Mikroorga-

nismen konnte über alle verwendeten Klassifikationsverfahren erreicht werden. Auf Stamm-

ebene erzielt die SVM in der Praxis die genauesten Ergebnisse, jedoch nicht bei den rest-

lichen Mikroorganismen. Die QDA erzielt in der Praxis etwas genauere Vorhersagen als

das kNN-Modell, jedoch basiert das kNN-Modell mit der besten Leistung auf den wenigsten

Hauptkomponenten. Dies kann als Vorteil angesehen werden, da weniger Dimensionen zur

erfolgreichen Klassifizierung in der Regel robustere Modelle in der Praxis bedeuten.

V

Abstract

Objective: The objective of this work was to develop a method for the identification of

microorganisms via micro-Raman spectroscopy. First, a method was established to obtain

spectra of sufficient quality for various microorganisms. Subsequently, the data collection

was performed, in which as many representative spectra as possible were collected. After-

wards, models for the prediction of unknown Raman spectra were developed with the data,

which required a corresponding data pre-treatment. To test the practicability of the models,

they were applied to spectra of samples that were not included in the calibration sets. In

addition to the development of the method and the predictive models, different influences

of the analysis conditions should also be considered.

Methods: Nine different microorganisms from cryopreserved pure cultures were incubated

at 30 °C for 24 hours on tryptone soy agar (TSA). The spectra were obtained at 633 nm

excitation via a confocal Raman microscope from the company Renishaw. Both the data

pre-treatment (baseline correction, smoothing, normalization, principal component analysis

(PCA)) and the model development were carried out using the MATLAB software. Various

classification methods were used to determine the model with the best possible perfor-

mance.

Results: For the development of the calibration models 2953 Raman spectra of nine diffe-

rent microorganisms were collected. Disturbances by fluorescence were bleached out by

pre-irradiation for up to 15 minutes. The models based on quadratic discriminant analysis

(QDA), the k-nearest neighbor algorithm (kNN), and support vector machine (SVM) were

created with different numbers of principal components and using a five-fold cross-valida-

tion. The theoretical prediction accuracies for the most accurate models are 99.0 % (QDA),

99.1 % (kNN) and 99.7 % (SVM). For practical validation, 100 more "unknown" spectra

were collected for each microorganism. The accuracies of the prediction in practice are

98.1 % (QDA), 97.1 % (kNN) and 97.0 % (SVM).

Discussion: All classification methods used in this thesis identified reliably the investigated

microorganisms. At strain-level, SVM achieves the most accurate results in practice, but not

with the remaining microorganisms. In practice, QDA achieves slightly more accurate pre-

dictions than the kNN-model. However, the kNN-model with the best performance is based

on the lowest number of principal components. This can be considered as an advantage,

because using less dimensions for successful classification usually means more robust mo-

dels in practice.

VI

Abbildungsverzeichnis

Abbildung 1: Schema einer prokaryotischen Zelle (A) und einer eukaryotischen Zelle (B) (Fritsche, 2016) ................................................................................................4

Abbildung 2: Schematischer Aufbau einer grampositiven Zellwand (A) und einer gramnegativen Zellwand (B) (Fuchs et al., 2007) .................................................6

Abbildung 3: Schematische Darstellung der Energieniveaus bei der Rayleigh-, Stokes- und Anti-Stokes-Streuung links und fiktives Raman-Spektrum rechts (modifiziert nach (Kim et al., 2017)) ......................................................................9

Abbildung 4: Schematischer Aufbau des konfokalen Raman Mikroskops inVia (Renishaw) (modifiziert nach (Nataf, 2016) und (Vargis et al., 2012)) ...............10

Abbildung 5: Beispiel eines mit erweitertem Wellenzahlbereich erfassten Raman-Spektrums von Saccharomyces cerevisiae (A) und hervorgehobene informationsreiche Region (B) .............................................................................11

Abbildung 6: Normalschwingungen eines dreiatomigen Moleküls (z.B. Wasser) (modifiziert nach (Hasegawa, 2017)) ..................................................................12

Abbildung 7: Raman-Spektrum von E. coli K12 mit Zuordnung des biochemischen Ursprungs der Banden nach (De Gelder, 2008; Maquelin et al., 2002) .............12

Abbildung 8: Raman-Spektren zweier Bakterien mit starken Fluoreszenzstörungen ....14

Abbildung 9: Auftreten von „Cosmic spikes“ in Raman-Spektren markiert durch Pfeile 16

Abbildung 10: Raman-Spektrum eines Glasobjektträgers (A) und Raman-Spektrum von getrocknetem Nährboden (TSA) (B) .............................................................18

Abbildung 11: Konfokales Raman-Mikroskop inVia Renishaw.......................................23

Abbildung 12: Prinzip eines Tiefpassfilters zur Glättung eines Stufenspektrums ..........29

Abbildung 13: Schrittweises Schema der Datenvorbehandlung anhand dreier Spektren verschiedener Mikroorganismen; (A) Interpolierte Spektren, (B) Basislinienkorrektur und Glättung, (C) Normalisierung .......................................31

Abbildung 14: Vereinfachtes Schema einer Dimensionsreduktion durch PCA (modifiziert nach (Powell & Lehe, 2014)) ............................................................33

Abbildung 15: Beispiel zweier Datenklassen mit markiertem Klassenschwerpunkt und Projektion der Daten um die größte Varianz zu erzielen (A) und Projektion der Daten in Diskriminanzrichtung (B) (Hastie et al., 2009) ......................................35

Abbildung 16: Daten aus drei verschiedenen Klassen mit linearen Entscheidungsgrenzen durch LDA (A), quadratische Entscheidungsgrenzen, welche durch Auffinden linearer Grenzen in einem höherdimensionalem Raum erhalten wurden, zurückgeführt auf den ursprünglichen Raum (B), mittels QDA gefundene quadratische Entscheidungsgrenzen (C) (modifiziert nach (Hastie et al., 2009)) .........................................................................................................36

Abbildung 17: Grafische Erklärung von kNN anhand normalisierter Intensitäten zweier ausgewählter Wellenzahlen aus Raman-Spektren von drei verschiedenen Mikroorganismen .................................................................................................37

Abbildung 18: Schematische Darstellung des Funktionsprinzips der SVM mit den Ausgangsdaten (A), dem höherdimensionalem Raum (B) und resultierenden Entscheidungsgrenzen bei zurücktransformieren der Daten (C); Schwarze Linien sind trennende Hyperebenen, gestrichelte Linien „Support Vectors“ und Entscheidungsgrenze im höherdimensionalem Raum als graues Dreieck hervorgehoben (modifiziert nach (Van den Burg & Groenen, 2016)) .................38

Abbildung 19: Vergleich von Raman-Spektren bei verschiedenen Umgebungslichtbedingungen ohne fokussierte Probe bei einem Prozent Laserleistung und 40 Sekunden Belichtungsdauer ............................................40

VII

Abbildung 20: Einfluss der Vorbestrahlungsdauer auf eine Probe E. coli K12 (Counts normalisiert) .........................................................................................................41

Abbildung 21: Beispiel zweier Koloniematerialprobenschichten auf Glasobjektträgern zur Einschätzung der Schichtdicken (a= dünn; b= mittel; c= dick; d= ungeeigneter, noch flüssiger Bereich) .................................................................42

Abbildung 22: Einfluss der Probenschichtdicke auf das Raman-Spektrum einer Sty TA98-Probe bei zwei Minuten Vorbestrahlung; (A) unbehandelte Daten, (B) normalisierte Spektren (Eine Einschätzung der Begriffe mittlere, dünne und dicke Schicht kann anhand Abbildung 21 erfolgen).....................................42

Abbildung 23: Vergleich der Raman-Spektren aller Mikroorganismen von Kultur 1 (blau) und Kultur 2 (rot) mit fett hervorgehobenen Mittelwertspektren .45

Abbildung 24: (A) Darstellung mehrerer hintereinander aufgezeichneter Spektren von ein und demselben Bereich einer dünnen Probenschicht Micrococcus luteus (DSM-Nr. 20030) mit t als Anregungsdauer in Minuten; (B) Gleiche Spektren nach Basislinienkorrektur, Glättung und Normalisierung ....................................46

Abbildung 25: Auswirkung längerer Bestrahlung auf Peaks im Wellenzahlbereich von 600 bis 900 cm-1 bei drei verschiedenen gramnegativen Bakterien; Blau hervorgehoben ein Spektrum mit kurzer Bestrahlungsdauer und Rot ein Spektrum mit langer Bestrahlungsdauer (Die Spektren wurden basislinienkorrigiert, geglättet und normalisiert) ..................................................47

Abbildung 26: Spektren vor (A) und nach Basislinienkorrektur, Glättung und Normalisierung (B) (Zur besseren Darstellung wurden in dieser Abbildung auch die unvorbehandelten Spektren normalisiert) ............................................48

Abbildung 27: Alle zur Kalibrationsentwicklung verwendete Spektren der 9 untersuchten Mikroorganismen nach Basislinienkorrektur, Glättung und Normalisierung in Grau und farblich hervorgehobene Mittelwertspektren (n= Anzahl der Spektren) ...........................................................................................49

Abbildung 28: Abnehmende erklärende Varianz der PCs nach PCA mit vorbehandelten Daten .........................................................................................50

Abbildung 29: Darstellung der ersten drei PCs der Hauptkomponentenanalyse von allen Kalibrations-Spektren mit und ohne Vorbehandlung aus jeweils zwei verschiedenen Betrachtungswinkeln ...................................................................51

Abbildung 30: Vorhersagematrices bei Verwendung der quadratischen Diskriminanzanalyse von Modellen mit 8 und 15 PCs mit der durchschnittlichen Vorhersagegüte in Prozent ...................................................52

Abbildung 31: Vorhersagematrices bei Verwendung des Nächste-Nachbar-Algorithmus von Modellen mit 8 und 15 PCs mit der durchschnittlichen Vorhersagegüte in Prozent ..................................................................................53

Abbildung 32: Vorhersagematrices bei Verwendung der Support Vector Maschine von Modellen mit 8 und 15 PCs mit der durchschnittlichen Vorhersagegüte in Prozent .................................................................................................................54

Abbildung 33: Darstellung der ersten drei Hauptkomponenten einer PCA der Kalibrierungsspektren (markiert als Punkte n= 2953) und Validierungsspektren (markiert als Quadrate n= 900) aus zwei Ansichten (A und B) ..........................55

Abbildung 34: Durchschnittliche Vorhersagegüte bei Anwendung aller entwickelten Modelle auf die Validierungsspektren aller 9 Mikroorganismen mit Standardabweichung ...........................................................................................56

Abbildung 35: Absolute Anzahl der richtig vorhergesagten Spektren bei der Validierung dreier Klassifizierungsverfahren bei variierender Anzahl PCs ........57

VIII

Tabellenverzeichnis

Tabelle 1: Relative Häufigkeit von Makromolekülen in einer Bakterienzelle (Madigan et al., 2015) ............................................................................................................5

Tabelle 2: Banden im Raman-Spektrum und Zuordnung des biochemischen Ursprungs nach (De Gelder et al., 2007; S. Kumar et al., 2016; Munchberg et al., 2014; Sil et al., 2017; Teng et al., 2016) .......................................................13

Tabelle 3: Verwendete Mikroorganismen, Kürzel und DSM-Nr......................................24

Tabelle 4: Anzahl der zur Kalibrationsentwicklung erfassten Raman-Spektren pro Kulturtyp (Summe= 2953)....................................................................................44

Tabelle 5: Validierungsvorhersagen des QDA-Modells mit 20 PCs (Vorhersagegüte 98,1 %) ....................................................................................58

Tabelle 6:Validierungsvorhersagen des kNN-Modells mit 15 PCs (Vorhersagegüte 97,1 %) ....................................................................................59

Tabelle 7: Validierungsvorhersagen des SVM-Modells mit 15 PCs (Vorhersagegüte 96,9 %) und 20 PCs (Vorhersagegüte 97,0 %) ......................60

IX

Abkürzungsverzeichnis

Einheit Bezeichnung

a.u. Unskalierte Einheit

Engl. arbitrary unit

cm Zentimeter

g Gramm

Hz Hertz

l/mm Linienzahl pro Millimeter

min Minuten

mW Milliwatt

nm Nanometer

rpm Umdrehungen pro Minute

Engl. rounds per minute

s Sekunden

Abkürzung Bezeichnung

A Adenin

C Cytosin

CCD Engl. „Charge-coupled Device“

Def. Deformationsschwingung(en)

DNA Desoxyribonukleinsäure

DUVRRS Tief-UV-Resonanz-Raman-Spektroskopie

Engl. deep UV resonance Raman spectroscopy

EMD Empirische Bandzerlegung

Engl. empirical mode decomposition

engl. Englisch

EP Europäisches Arzneibuch

EPS Extrazelluläre polymere Substanzen

FDA-BAM Engl. Food and Drug Administration-Bacteriological

Analytical Manual

FT Fouriertransformation

G Guanin

glyk. Verb. Glykosidische Verbindung

HCA Hierarchische Clusteranalyse

HeNe Helium-Neon

IR Infrarot

ISO Internationale Organisation für Normung

JP Japanische Pharmakopöe

kNN k-Nächster-Nachbar

LDA Lineare Diskriminanzanalyse

LPS Lipopolysaccharid(e)

n Anzahl Elemente/ Beobachtungen

NaCl Natriumchlorid

Nd:YAG Neodym-dotierter Yttrium-Aluminium-Granat-Laser

NGS Engl. Next Generation Sequencing

NIR Nahinfrarot

PC(s) Hauptkomponenten

Engl. principal component(s)

X

PCA Hauptkomponentenanalyse

Engl. pricipal component analysis

PCR Polymerase-Kettenreaktion

Engl. polymerase chain reaction

PHB Polyhydroxybutyrat

Phe Phenylalanin

QDA Quadratische Diskriminanzanalyse

RNA Ribonukleinsäure

SD Standardabweichung

Engl. Standard Derivation

SERDS Engl. Shifted-excitation Raman difference

spectroscopy

SERS Oberflächenverstärkte Raman-Spektroskopie

Engl. Surface-enhanced Raman Spectroscopy

Si Silizium

spp. species pluralis

Str. Streckschwingung(en)

SVD Singulärwertzerlegung

Singular Value Decomposition

SVM Engl. Support Vector Machine

t Dauer/ Zeit

TSA Trypton Soja Agar

TXT Textdatei (Dateiformat)

Tyr Tyrosin

U Uracil

USP United States Pharmakopöe

UV Ultraviolett

WDF WiRE Data File (Dateiformat)

Einleitung

1

1 Einleitung

Mikroorganismen sind mikroskopisch kleine einzellige Organismen, die uns praktisch über-

all umgeben. In der Natur stößt man unweigerlich auf Mikroorganismen; egal ob im Wasser,

im Boden, in der Luft, auf und im Menschen aber auch in extremen Umgebungen wie in

heißen Quellen oder Gletschereis. (Madigan et al., 2015)

Mikroorganismen haben die Entwicklung aller anderen Organismen ermöglicht, sind hoch-

gradig an ihre Umwelt angepasst und weisen die größte Vielfalt aller Lebewesen auf. Der

Mensch kann ohne Mikroorganismen nicht überleben, umgekehrt sind Mikroorganismen

jedoch ohne höhere Organismen überlebensfähig. (Cypionka, 2010)

Neben den vielen nützlichen Funktionen, die Mikroorganismen in unserem Körper haben,

wie beispielsweise die Produktion von Vitaminen, und der Aufschluss von Nahrungsbe-

standteilen durch Bakterien in der Darmflora (Fritsche, 2016) werden sie auch vielseitig in

der Industrie eingesetzt. Mikroorganismen dienen beispielsweise zur Herstellung und Ver-

edelung diverser Lebensmittel und Nahrungsmittelbestandteilen und zur Herstellung von

pharmakologisch wirksamen Substanzen wie Antibiotika oder Insulin. (Fuchs et al., 2007)

Es gibt allerdings auch Mikroorganismen, die für die Vergiftung oder den Verderb von Le-

bensmitteln und das Auslösen von Krankheiten verantwortlich sind. Es gibt sowohl Krank-

heitserreger, bei denen alle Arten einer Gattung pathogen sind, wie Shigella und Yersinia,

als auch Gattungen, bei denen nur einige Arten pathogen sind, wie beispielsweise bei der

Gattung Streptococcus die Art pneumoniae oder bei der Gattung Bacillus die Art anthracis,

deren Namen hier bereits auf die auslösenden Krankheiten schließen lassen. Besonders

bedeutsam sind Bakterien, die in einer einzigen Art harmlose und pathogene Stämme auf-

weisen, wie z.B. der ungefährliche Escherichia coli K12 und der pathogene E. coli O157:H7.

(Fuchs et al., 2007)

Nach dem Ausbruch einer Krankheit ist es in der Medizin unerlässlich, den Erreger richtig

und schnell zu ermitteln um die beste Therapie zu wählen (Fuchs et al., 2007). Prüfvor-

schriften für pharmazeutische Produkte machen den Nachweis bestimmter Keime ebenfalls

erforderlich. Für die Beurteilung des Hygienezustands bestimmter Gegenstände oder Ober-

flächen sowie für die Beurteilung der Prozesshygiene in der Industrie oder im Handwerk,

ist der alleinige Nachweis von Mikroorganismen kein Anzeichen für einen Mangel; es müs-

sen spezifische Hygieneindikatoren herangezogen werden. (Krämer, 2007)

Für diese und viele weitere Fälle sind Methoden zur Differenzierung von Mikroorganismen

erforderlich.

Einleitung

2

Um Mikroorganismen zu differenzieren bzw. zu identifizieren gibt es einfache taxonomische

Verfahren, mit denen die Identität eines Mikroorganismus immer weiter eingekreist werden

kann. (Steinbüchel et al., 2012)

Molekularbiologische Methoden wie die Polymerase-Ketten-Reaktion (PCR) (Cypionka,

2010) oder Methoden wie die Fluoreszenzmikroskopie (Ivnitski et al., 1999) und Massen-

spektroskopie (Sogawa et al., 2012) bilden leistungsfähige Alternativen zu klassischen Ver-

fahren. Als geeignet haben sich auch spektroskopische Verfahren, wie die Fourier-Trans-

formations-Infrarot- (FT-IR) Spektroskopie (Ngo-Thi et al., 2003) und die Raman-Spektro-

skopie erwiesen (Harz et al., 2005; Maquelin et al., 2002; Rösch et al., 2005; Strola et al.,

2014).

Die Identifizierung eines Mikroorganismus anhand eines elektromagnetischen Spektrums,

beruhend auf der chemischen Zusammensetzung dieses Organismus, erfolgt vereinfacht

durch den Abgleich des unbekannten Spektrums mit einer Datenbank bekannter Spektren.

Spektroskopische Methoden in Verbindung mit chemometrischen Verfahren zur Entwick-

lung leistungsfähiger Vorhersagemodelle, ermöglichen eine zerstörungsfreie, schnelle und

einfache Identifizierung von Mikroorganismen.

Einleitung

3

1.1 Theoretischer Hintergrund

Da die zu entwickelnde Methode auf der Wechselwirkung von Licht und der chemischen

Zusammensetzung von Mikroorganismen basiert, soll zunächst ein Überblick der relevan-

ten theoretischen Hintergründe zu Mikroorganismen und der Raman-Spektroskopie erfol-

gen. Um einen Vergleich der Raman-Spektroskopie mit anderen Verfahren zur Identifizie-

rung von Mikroorganismen zu ermöglichen, sollen einige gängige Verfahren ebenfalls kurz

beschrieben werden. Wichtig ist neben der Theorie der Raman-Spektroskopie die Theorie

hinter multivariaten Vorhersagemodellen, welche im Methoden-Teil der Arbeit näher be-

schrieben werden. Ein Einblick in Ergebnisse bisheriger Studien zur gleichen Thematik er-

möglicht die Einordnung der in dieser Arbeit erreichten Resultate und eine Einschätzung

des momentanen Forschungsstands.

1.1.1 Physiologie der Mikroorganismen

Mikroorganismus ist ein Überbegriff für Einzeller, die man zunächst grob in Prokaryoten

und Eukaryoten einteilen kann. Prokaryoten sind einfach gebaute einzellige Organismen

ohne abgegrenzten Zellkern (siehe Abbildung 1 A). Dazu zählen die Bakterien und Archaea.

Eukaryoten sind Organismen mit echtem Zellkern, zu denen auch Pflanzen und Tiere zäh-

len; in der Mikrobiologie ist jedoch von Pilzen, Algen und Protozoen die Rede. Eukaryoten

enthalten Organellen wie Mitochondrien, endoplasmatische Retikuli und Chloroplasten

(siehe Abbildung 1 B), welche bei Prokaryoten nur in wenigen Ausnahmefällen zu finden

sind. (Cypionka, 2010)

Die für diese Arbeit relevanten Mikroorganismen stellen die Bakterien und Hefen dar (ein-

zellige Pilze). Mittels dünnen filamentösen Zellanhängen, den sogenannten Flagellen oder

Geißeln, können sich einige Bakterien frei bewegen. Andere Zellanhängsel wie Fimbrien

(Typ-I-Pili) sind dünner und kürzer als Flagellen, dienen in der Regel nicht zur Fortbewe-

gung und sind in größerer Anzahl als Flagellen vorhanden. Sie bestehen aus Protein und

ermöglichen die Anheftung der Bakterien an Oberflächen. Spezielle Pili, wie der F-Pili die-

nen zur Herstellung von Zell-Zell-Kontakten, die den Austausch genetischer Information

ermöglichen. (Fuchs et al., 2007)

Die Zellhülle umschließt das Cytoplasma. In der Regel ist die Zellhülle aus einer äußeren

Wand und einer Membran zusammengesetzt. Die Membran ist an Transportprozessen und

am Energiestoffwechsel beteiligt. Das Cytoplasma enthält die genetische Information auf

einem Chromosom bzw. in einem Nucleoid (Kernäquivalent) und bei Bakterien häufig

extrachromosomale ringförmige DNA (Plasmide), sowie Ribosomen, Proteine, Coenzyme

und alle weiteren Bestandteile aufgenommener Stoffe. (Cypionka, 2010)

Einleitung

4

Die Zellwand verleiht der Zelle Form und Druckfestigkeit gegen osmotisch bedingten Über-

druck. Daneben bilden filamentöse Proteine das Cytoskelett und sind ebenfalls an der

Formgebung und auch an der Zellteilung beteiligt. Die Zellwand stellt üblicherweise keine

Barriere für gelöste Stoffe dar und besteht bei Bakterien aus Murein, welches dem aus

Pilzen bekannten Chitin ähnelt. (Cypionka, 2010)

Abbildung 1: Schema einer prokaryotischen Zelle (A) und einer eukaryotischen Zelle (B)

(Fritsche, 2016)

Die Cytoplasmamembran ermöglicht die gezielte Aufnahme und Abgabe von Verbindun-

gen. Sie besteht aus einer etwa 8 nm dicken Phospholipid-Doppelschicht, in der Proteine

eingelagert sind. Phospholipide sind Ester aus Glycerin und zwei Fettsäuren, die sowohl

gesättigt, als auch ungesättigt sein können und 14 bis 18 Kohlenstoffatome aufweisen. Die

dritte OH-Gruppe des Glycerins ist mit Phosphorsäurederivaten verestert. Eingelagert in

die Membran sind spezielle Proteine, die am Stoffaustausch mit der Umgebung sowie dem

Aufbau von Zellenergie beteiligt sind. Ebenfalls in die Membran eingelagert können zusätz-

liche stabilisierende Verbindungen sein, wie beispielsweise Cholesterin in eukaryotischen

Membranen. Bei vielen Bakterien liegen ähnliche membranverstärkende Verbindungen

(Hopanoide) vor. Einige Bakterien besitzen zur Vergrößerung der Membranoberfläche Ein-

stülpungen der Cytoplasmamembran. Diese enthalten Enzymsysteme, welche für beson-

dere Energiestoffwechselwege notwendig sind. Auch einige intrazelluläre Einschlusskörper

werden von einfachen Membranen umgeben, wobei es sich hier häufiger um Proteinschich-

ten und nur selten um Lipidschichten handelt. (Fuchs et al., 2007)

Bakterienzellen bestehen zu 80 % aus Wasser, dem wichtigsten Reaktionspartner und die

zweitgrößte Fraktion an Zellbestandteilen bilden die Proteine (Cypionka, 2010). Die durch-

schnittliche makromolekulare Zusammensetzung einer Bakterienzelle geht aus Tabelle 1

hervor. Den größten Anteil neben den Proteinen macht die RNA aus. Die RNA-Menge ist

abhängig von der Stoffwechselaktivität, so weisen schnell wachsende Zellen bis zu 10 000

Ribosomen auf (Cypionka, 2010).

Einleitung

5

Die hauptsächlich in den Membranen vorkommenden Lipide machen etwa 9,1 % des Tro-

ckengewichts aus. Polysaccharide und Lipopolysaccharide (LPS) gemeinsam 8,4 % und

die DNA, in Form eines einzelnen Moleküls oder als Plasmide 3,1 %.

Tabelle 1: Relative Häufigkeit von Makromolekülen in einer Bakterienzelle (Madigan et al., 2015)

Makromolekül Prozent des Trockengewichts Beispiele für Zellbestandteile

Protein 55,0 % Membranproteine, Flagellen,

Ribosome, Enzyme

Lipid 9,1 % Membrane, Vesikel

Polysaccharid 5,0 % Zellwand, Energiespeicher

Lipopolysaccharid 3,4 % Membrane

DNA 3,1 % Kernäquivalent, Plasmid

RNA 20,5 % Ribosome

Ein sehr wichtiges Unterscheidungsmerkmal bei Bakterien beruht auf der Gramfärbung.

Abhängig von der Zellwandstruktur können über eine Färbungsreaktion Bakterien in gram-

positive und gramnegative eingeteilt werden (siehe Abbildung 2). Die gramnegative Zell-

wand besteht aus mindestens zwei Schichten und die grampositive Zellwand ist dicker und

besteht hauptsächlich aus einem einzigen Molekültyp. (Madigan et al., 2015)

Die Zellwände der Bakterien verfügen über eine starre Schicht aus Peptidoglykan, einem

Polysaccharid, das aus N-Acetylglucosamin, N-Acetylmuraminsäure und einigen wenigen

Aminosäuren besteht. Diese Bestandteile verbinden sich zu einer wiederholenden Struktur

(Glykantetrapeptid). Lange nebeneinanderliegende Peptidoglykanstränge umgeben die

Zelle als Schicht. Aminosäuren quervernetzen die Stränge. Glykosidische Bindungen, die

Zucker in den Glykansträngen verbinden, verleihen der Struktur nur in einer Richtung Fes-

tigkeit. Die Festigkeit in die andere Richtung bzw. die Quervernetzung entsteht bei den

gramnegativen durch Bildung einer Peptidbindung und bei grampositiven entsteht die Quer-

vernetzung durch kurze Interpeptidbrücken, mit je nach Spezies variierender Art und Anzahl

an Aminosäuren. (Madigan et al., 2015)

Die Zellwand grampositiver Bakterien (Abbildung 2 A) besteht zu 90 % aus Peptidoglykan.

In die Zellwand verankert sind Teichonsäuren. An Membranlipide gebundene Teichonsäu-

ren werden Lipoteichonsäuren genannt. Beide ragen nach außen hervor. Bei gramnegati-

ven Bakterien ist der Peptidoglykan-Anteil sehr viel geringer und eine zweite äußere Memb-

ran macht den größten Teil der Zellwand aus. Diese Membran besteht nicht nur aus einer

Lipiddoppelschicht und Proteinen, sondern beinhaltet auch Polysaccharide, die mit den Li-

piden zu einem Komplex verknüpft sind, weshalb die äußere Membran auch LPS-Schicht

genannt wird (siehe Abbildung 2 B). (Madigan et al., 2015)

Beim Lipid A sind die Fettsäuren im Gegensatz zu den Phospholipiden nicht an Glycin ge-

bunden, sondern an ein Disaccharid aus Glucosaminphosphat. Zu den Fettsäuren zählen

hier Palmitinsäure, Stearinsäure und auch kurzkettige Fettsäuren wie Myristinsäure,

Einleitung

6

Laurinsäure und Capronsäure (Fritsche, 2016). Neben einer Hauptfunktion der äußeren

Membran als Strukturgeber, liegt eine bedeutsame Eigenschaft in ihrer Toxizität. Unter En-

dotoxin versteht man den toxischen Bestandteil der LPS-Schicht (vor allem Lipid A). Einige

Vertreter der gramnegativen Gattungen Salmonella und Escherichia sind pathogen und

manche der hervorgerufenen Symptome sind auf die toxischen Bestandteile der äußeren

Membran zurückzuführen. (Madigan et al., 2015)

Abbildung 2: Schematischer Aufbau einer grampositiven Zellwand (A) und einer gramnegativen Zellwand (B) (Fuchs et al., 2007)

Bereits anhand des beschriebenen groben Überblicks zur Zusammensetzung der Bakte-

rien, kann die Vielfalt der chemischen Information einer Bakterienzelle oder einer Hefe ab-

geschätzt werden. Alle Bestandteile und die verschiedenen Verbindungstypen, selbst int-

razelluläre Einschlüsse (Ciobota et al., 2010), können eine Auswirkung auf ein Raman-

Spektrum haben. Dadurch ist die Raman-Spektroskopie zur Identifizierung von Mikroorga-

nismen hochsensitiv und sehr gut geeignet.

1.1.2 Methoden zur Identifizierung von Mikroorganismen

Klassische Methoden zur Identifizierung beginnen meistens mit der Kultivierung von Mikro-

organismen unter spezifischen Bebrütungsbedingungen um Reinkulturen zu erhalten. Er-

fordern die Folgeuntersuchungen zur Differenzierung eine größere Anzahl an Zellmaterial

als eine entsprechende Probe hergibt, muss ggfs. ein Anreicherungsschritt erfolgen.

(Steinbüchel et al., 2012)

Zur Differenzierung kann vorab die Wachstumsfähigkeit mit und ohne Sauerstoff untersucht

und das Aussehen des Koloniewachstums beurteilt werden. Über (weitere) selektive Nähr-

medien kann die Konkurrenzflora zurückgehalten werden, um spezifische Mikroorganismen

nachzuweisen. Mikroskopische Untersuchungen können Informationen über die Form, Be-

wegungsfähigkeit und Sporenbildung liefern. Durch eine Gramfärbung kann zwischen

grampositiven und gramnegativen Bakterien unterschieden werden. Der Nachweis diverser

Stoffwechsel- oder Enzymaktivitäten, wie Aktivität der Katalase, schränkt die Anzahl der

Einleitung

7

infrage kommenden Mikroorganismen, genauso wie Tests zum Nachweis spezifischer

Oberflächenantigene weiter ein. All diese Untersuchungen können insgesamt sehr zeitin-

tensiv sein und erfordern sowohl einen großen Platz- als auch Materialbedarf. Einige Sys-

teme wie „VITEK 2“ ermöglichen durch eine Vielzahl biochemischer Reaktionen die Identi-

fizierung mehrerer Proben, je nach Spezies innerhalb von 3 bis 17 Stunden (Ling et al.,

2003; Spanu et al., 2003).

Molekularbiologische Methoden zur Identifizierung von Mikroorganismen sind beispiels-

weise die PCR, mit der spezifische DNA-Abschnitte aus zuvor isolierter DNA vervielfältigt

und dann mittels Gelelektrophorese nachgewiesen werden können. Einige Nachteile hier-

bei liegen darin, dass gezielt mit entsprechenden Primern nach einer spezifischen Sequenz

gesucht werden muss und relativ viele Labor-Schritte notwendig sind. (Cypionka, 2010)

Beachtet werden sollte, dass es modernere PCR-Varianten wie die Echtzeit-PCR und die

Multiplex-PCR gibt. Bei der Echtzeit-PCR wird der Abschluss jedes DNA-Vermehrungszyk-

lus durch einen Fluoreszenzfarbstoff angezeigt, was Rückschlüsse über den Faktor der

DNA-Vervielfältigung zulässt. Bei der Multiplex-PCR werden mehrere Primerpaare einge-

setzt. (Fritsche, 2016)

Große Fortschritte wurden auch bei der DNA-Sequenzierung gemacht. Seit einigen Jahren

können ganze Genome oder spezifische DNA-Abschnitte vergleichsweise schnell und ein-

fach sequenziert werden, wobei die Kosten mit jedem Jahr um den Faktor 2 bis 3 sinken

(Pettersson et al., 2009). Mit „Next Generation Sequencing“ (NGS) sind Erregernachweise

in Proben möglich, bestimmte Einschränkungen der PCR können überwunden werden und

bisher nicht identifizierte noch unbekannte Organismen, können näher erforscht werden.

(Andrusch et al., 2018)

Einleitung

8

1.1.3 Raman-Spektroskopie

Die meisten spektroskopischen Verfahren beruhen auf den Wechselwirkungen zwischen

elektromagnetischer Strahlung mit chemischen Verbindungen. Der Physiker C. V. Raman

entdeckte 1928, dass sich die Wellenlänge eines geringen Teils, der von bestimmten Mo-

lekülen ausgehenden Streustrahlung von der des einfallenden Strahls unterscheidet und,

dass die Verschiebungen der Wellenlänge von der Struktur der streuenden Moleküle ab-

hängig sind (Skoog et al., 2013).

Wird die Lösung einer Substanz mit monochromatischem Licht bestrahlt, so tritt ein Teil der

Strahlung ungehindert hindurch, ein geringer Teil des Lichts wird in alle Raumrichtungen

gestreut und ein noch geringerer Teil tritt ebenfalls als Streustrahlung aus, besitzt jedoch

eine andere Frequenz als das eingestrahlte Licht. Diese Frequenzverschiebung entsteht

durch Absorption und Reemission in Verbindung mit Schwingungsanregung oder Schwin-

gungslöschung. Diese Streustrahlung kann spektral zerlegt und mittels eines photoelektri-

schen Detektors registriert werden. Die Differenz zwischen der Frequenz der eingestrahlten

Linie und einer Raman-Linie ist die Frequenz der dazugehörigen Schwingung. (Hesse et

al., 2008)

Das Raman-Spektrum ist ein Emissions-Spektrum. Die Frequenzen der Raman-Linien oder

-Banden können größer oder kleiner sein als die Anregungsfrequenz (Rayleigh-Linie). Cha-

rakteristisch für ein Molekül sind die Differenzen der Raman-Frequenzen von der Anre-

gungsfrequenz. Sie sind unabhängig von der Anregungsfrequenz und können auch im IR-

Spektrum wiedergefunden werden. (Hesse et al., 2008)

Die Differenz der Wellenlängen der einfallenden und gestreuten Strahlung (Raman-Ver-

schiebung; engl. Raman shift) entspricht den Wellenlängen im mittleren Infrarotbereich. Das

Raman-Streuspektrum und das IR-Absorptionsspektrum einer Verbindung ähneln sich häu-

fig sehr. Dennoch gibt es ausreichend Unterschiede zwischen speziell IR- und Raman-ak-

tiven Gruppen, sodass sich beide Verfahren ergänzen. Vorteile der Raman-Spektroskopie

gegenüber der IR-Spektroskopie sind, dass Wasser keinen starken störenden Einfluss auf

die Messung hat und die Probenvorbereitung gewöhnlich sehr viel einfacher ist.

(Skoog et al., 2013)

1.1.3.1 Theorie des Raman-Effekts

Der Raman-Effekt unterscheidet sich von der Absorption und Emission elektromagneti-

scher Strahlung von Materie. Vereinfacht kann der Raman-Effekt als Stoßprozess zwischen

Molekülen der Materie und den Photonen der elektromagnetischen Strahlung erklärt wer-

den. Bei der Rayleigh-Streuung haben das eingestrahlte Licht und das gestreute Licht die

gleiche Frequenz (elastischer Stoß). Die Energiezustände von Molekül und Photon haben

sich durch den Stoß nicht geändert; die Energie des Streulichts entspricht der Energie des

Einleitung

9

eingestrahlten Lichts (siehe Abbildung 3). Die Intensität der Rayleigh-Streuung beträgt ca.

ein Prozent der Ausgangsintensität der elektromagnetischen Welle. (Lechner, 2016)

Bei Stokes’schen Linien hat die gestreute elektromagnetische Welle eine kleinere Frequenz

als die eingestrahlte Welle (Rotverschiebung). Beim Stoß überträgt das Photon Energie auf

das Molekül und wird selbst um diesen Energiebetrag ärmer (inelastischer Stoß). Das

Streulicht ist energieärmer als das eingestrahlte Licht (siehe Abbildung 3). Ebenfalls dem

inelastischen Stoß entsprechend hat die gestreute elektromagnetische Welle bei den Anti-

stokes’schen Linien eine größere Frequenz als die eingestrahlte elektromagnetische Welle

(Blauverschiebung). Das sich im angeregten Zustand befindende Molekül überträgt beim

Stoß Energie auf das Photon, was bedeutet, dass das Streulicht energiereicher wird (siehe

Abbildung 3). (Lechner, 2016)

Abbildung 3: Schematische Darstellung der Energieniveaus bei der Rayleigh-, Stokes- und Anti-Stokes-Streuung links und fiktives Raman-Spektrum rechts (modifiziert nach (Kim et al., 2017))

Die Wellenzahl der Rayleigh-Linie aus Abbildung 3 rechts entspricht der Wellenzahl der

Anregungsstrahlung. Somit beträgt die Wellenzahl der Rayleigh-Linie bei einer Anregungs-

wellenlänge von 633 nm 15798 cm-1. Für eine einfachere Vergleichbarkeit von Raman-

Spektren mit IR-Spektren wird der Wert der Rayleigh-Linie auf null gesetzt, wobei der Be-

trag der Raman-Verschiebung für alle Anregungswellenlängen gleich ist (Salzer et al.,

2017). Die Verteilung der Stokes- und Anti-Stokes-Linien ist beidseitig der Rayleigh-Linie

symmetrisch, jedoch sind die Stokes-Linien im Vergleich zu den Anti-Stokes-Linien intensi-

ver, weshalb in der Raman-Spektroskopie häufig nur die Stokes-Seite eines Spektrums ge-

messen und ohne negatives Vorzeichen dargestellt wird. (Teixeira-Dias, 2017)

Einleitung

10

1.1.3.2 Aufbau des Raman-Messsystems

Raman-Messsysteme enthalten immer eine oder mehrere monochromatische Lichtquellen

wie in dieser Arbeit beispielsweise einen Helium-Neon- (HeNe) Laser mit einer Wellenlänge

von 633 nm. Abbildung 4 zeigt einen Teil des Aufbaus des verwendeten Messsystems.

Verzögerungs- bzw. Wellenplatten steuern die Polarisationsrichtung des einfallenden und

analysierten Lichts. Über das Mikroskop kann die Probe mit gewöhnlichem polychromati-

schem Licht bestrahlt werden, um den Probenbereich zu lokalisieren oder zur einfachen

optischen Analyse. Durch das Mikroskop wird auch der Laser auf die Probe gestrahlt und

mit derselben Objektivlinse das rückgestreute Licht über 180 Grad gesammelt. Ein motori-

sierter Objekttisch ermöglicht die Fokussierung des Lasers auf die Probe. Der Rayleigh-

Sperrfilter (Dielektrischer Kantenfilter) hält den Rayleigh-Teil des Spektrums zurück und ein

Beugungsgitter teilt das Raman-Streulicht auf. Über einen CCD- (engl. charge-coupled de-

vice) Sensor wird das Licht detektiert. (Nataf, 2016; Vargis et al., 2012)

Abbildung 4: Schematischer Aufbau des konfokalen Raman Mikroskops inVia (Renishaw) (modifiziert nach (Nataf, 2016) und (Vargis et al., 2012))

1.1.3.3 Informationsreiche spektrale Regionen von Mikroorganismen

Die Entwicklung von Vorhersagemodellen erfordert das Sammeln vieler informationsreicher

und repräsentativer Daten. Da der ausgewählte Wellenzahlbereich gerätetechnisch auf

eine Bandbreite von 1131 Wellenzahlen, also beispielsweise der Bereich von

100 bis 1231 cm-1, beschränkt ist, spielt die Wahl der richtigen Spektralregion eine wichtige

Rolle. Über das in dieser Arbeit verwendete Raman-Messsystem besteht die Möglichkeit

erweiterte „Scans“ durchzuführen, bei denen der Spektralbereich auf über 3000

Einleitung

11

Wellenzahlen vergrößert werden kann, allerdings auf Kosten der spektralen Auflösung und

der Messdauer. Der erweiterte Scan ist jedoch eine gute Möglichkeit Proben vorab grob zu

untersuchen, um informationsreiche Regionen ausfindig zu machen. Das Spektrum eines

Vorversuchs aus Abbildung 5 zeigt ein erweitertes Raman-Spektrum von Saccharomyces

cerevisiae. Die Banden im Bereich von 600 bis 1800 cm-1 (hervorgehoben in Abbildung 5

B) sind im Verhältnis zur Bande zwischen 2840 bis 3000 cm-1 schwächer ausgeprägt aber

liegen in der sogenannten „fingerprint“-Region, welche zur Identifizierung von Mikroorga-

nismen besonders gut geeignet ist (Sato & Martinho, 2018; Teng et al., 2016). Die Region

zwischen 1750 cm-1 und 2800 cm-1 besitzt keinerlei sich vom Grundrauschen abhebenden

Signaturen.

Abbildung 5: Beispiel eines mit erweitertem Wellenzahlbereich erfassten Raman-Spektrums von

Saccharomyces cerevisiae (A) und hervorgehobene informationsreiche Region (B)

Wie in Kapitel 1.1.1 beschrieben, bilden Lipide die äußere Membran der Mikroorganismen

und intrazelluläre Begrenzungen. Lipide verursachen mehrere Banden im Bereich zwischen

2800 und 3000 cm-1. Zurückzuführen sind diese auf asymmetrische Streckschwingungen

(siehe Abbildung 6 A) von CH3- und CH2-Gruppen der Fettsäuren in den Phospholipiden

(J. Kneipp, 2001).

Die Energie der asymmetrischen Schwingungen der Moleküle besitzen eine höhere Ener-

gie als die zugehörigen symmetrischen Schwingungen (siehe Abbildung 6 B). Deformati-

onsschwingungen (siehe Abbildung 6 C) von CH3 und CH2 befinden sich im Bereich von

1450 cm-1 und 1470 cm-1. Große Moleküle wie Proteine besitzen ein komplexes Schwin-

gungsspektrum und weisen daher eine Vielzahl von Banden auf. Beispielsweise die haupt-

sächlich durch C=O-Streckschwingungen der sekundären Amidstrukturen im Peptidrück-

grat hervorgerufene Amid I-Bande. Nukleinsäuren in Form von DNA und RNA weisen auf-

grund ihres Zucker-Phosphat-Rückgrats P=O-Schwingungen auf, welche in Banden im

Einleitung

12

Bereich zwischen 900 cm-1 und 1250 cm-1 resultieren. C=O-, C=N-, oder C=C-Schwingun-

gen der einzelnen Basen der DNA und RNA, liegen im Bereich von 1600 cm-1 bis

1700 cm-1. Diese Banden werden jedoch häufig von den ebenfalls in dieser Region liegen-

den Amid I-Banden der anteilmäßig stärker vorhandenen Proteine (siehe Tabelle 1) über-

lagert. Die weniger Energie besitzenden Ringschwingungen der Nukleinsäuren befinden

sich zwischen 1300 cm-1 und 1500 cm-1. Der Spektralbereich zwischen 600 und 900 cm-1

enthält äußerst spezifische spektrale Informationen, welche sich besonders aus den inten-

sitätsschwachen Ringschwingungen verschiedener Aromaten zusammensetzt (Tyrosin

(Tyr), Tryptophan (Trp), Nukleotide). (J. Kneipp, 2001)

Abbildung 6: Normalschwingungen eines dreiatomigen Moleküls (z.B. Wasser)

(modifiziert nach (Hasegawa, 2017))

Abbildung 7 zeigt ein geglättetes, ansonsten unverändertes Spektrum von E. coli K12 und

die bereits beschriebene Zuordnung einiger Banden zu bestimmten Biomolekülen und typi-

schen chemischen Verbindungen. Besonders auffällig ist der scharfe, intensive Peak bei

1003 cm-1, der durch Deformationsschwingungen von Kohlenstoffring-Verbindungen des

Phenylalanins (Phe) entsteht.

A= Adenin; C= Cytosin; G= Guanin; U= Uracil;

Def.= Deformationsschwingungen; Str.= Streckschwingungen; glyk.= glykosidische (Verbindung)

Abbildung 7: Raman-Spektrum von E. coli K12 mit Zuordnung des biochemischen Ursprungs der

Banden nach (De Gelder, 2008; Maquelin et al., 2002)

Einleitung

13

Aus Tabelle 2 gehen detaillierte Informationen zu den Banden und des biochemischen Ur-

sprungs innerhalb eines typischen Raman-Spektrums von Mikroorganismen hervor.

Tabelle 2: Banden im Raman-Spektrum und Zuordnung des biochemischen Ursprungs

nach (De Gelder et al., 2007; S. Kumar et al., 2016; Munchberg et al., 2014; Sil et al., 2017; Teng et al., 2016)

Bande [cm-1] Biochemischer Ursprung, Verbindungen, Schwingungstypen

622 Phenylalanin

637 Tyrosin

724 Adenin

783 Thymin, Cytosin, Uracil, DNA (PO2 bei DNA; Str.)

829 Protein (Fermi-Dublett)

853

895 CN, CON; Str./ CCH; Def.

960 C=C; Def.

1003 Phenylalanin (CC Ring; Def.)

1034 Phenylalanin

1087 Kohlenhydrate (C-C, C-O, -C-OH)

1128 Proteine (C-N, C-C; Str.)

1157 Amid III

1173 Phospholipide

1208 Phenylalanin, Tyrosin

1236 Amid III

1336 Tryptophan

1451 Lipide, Aminosäureseitenketten (CH2; Def.)

1557 Tryptophan (Indolring)

1582 Nukleinsäuren

1605 Tyrosin, Phenylalanin, Tryptophan

1667 Amid I (C=O; Str.)

2820-3050 Diverse Kohlenwasserstoffe (CH2, CH3, -C-H, =C-H; Str.)

(Str.= Streckschwingung, Def.= Deformationsschwingung)

1.1.3.4 Einflüsse auf die Qualität eines Raman-Spektrums

1.1.3.4.1 Störung durch Fluoreszenz

Zur Fluoreszenz kommt es, wenn ein angeregtes Molekül wieder in den Grundzustand zu-

rückfällt und dabei Strahlung bei einer Frequenz aussendet, die dem Übergang zwischen

dem angeregten und dem Grundzustand entspricht (Banwell & MacCash, 1999). Eigenflu-

oreszenz, verursacht von der biologischen Probe selbst oder von Verunreinigungen, kann

deutlich stärker als das eigentliche Raman-Signal sein, weshalb Fluoreszenz als „Offset“

auftritt, welcher das eigentliche Raman-Signal überdecken kann (Leon-Bejarano et al.,

2016).

Verschiedene Mikroorganismen verursachen unterschiedlich starke Fluoreszenzstörungen.

Pseudomonaden produzieren beispielsweise Siderophore wie Pyoverdine. Diese fluores-

zierenden Verbindungen, die vom Bakterium ausgeschieden werden, um das gering lösli-

che Eisen zu binden und aufzunehmen, sorgen beispielsweise bei P. fluorescens für starke

Einleitung

14

Fluoreszenzstörungen im Raman-Spektrum. Auch andere Bakterien produzieren Stoffe,

welche bei der „konventionellen“ Raman-Spektroskopie zu Problemen mit Fluoreszenz füh-

ren wie beispielsweise das Enterobactin von E. coli oder Salmonella Typhimurium.

(Kahlon, 2016)

Abbildung 8 zeigt exemplarisch stark durch Fluoreszenz beeinträchtigte Raman-Spektren

von P. fluorescens und B. subtilis. Die Art der Störung ist nicht identisch, sondern wirkt sich

bei B. subtilis vor allem als gleichmäßig abfallender Offset aus und bei P. fluorescens als

einen starken „Fluoreszenzhügel“ zwischen 600 und 900 cm-1 und einem Anstieg ab

1200 cm-1.

Abbildung 8: Raman-Spektren zweier Bakterien mit starken Fluoreszenzstörungen

Für die Fluoreszenzbeseitigung gibt es sowohl instrumentelle als auch mathematische An-

sätze (Leon-Bejarano et al., 2016). Wirkt sich die Fluoreszenz hauptsächlich auf die Basis-

linie eines Spektrums aus und hat nur einen geringen Einfluss auf die Banden selbst, so

können die Auswirkungen störender Fluoreszenz durch einfache mathematische Verfahren

beseitigt werden (siehe Methodik in Kapitel 2.2.5.2).

Die instrumentellen Ansätze umfassen beispielweise die Anpassung der Anregungswellen-

länge in den Nahinfraroten (NIR) Bereich, wie durch die Verwendung eines Neodym-dotier-

ten Yttrium-Aluminium-Granat- (Nd:YAG) Lasers mit einer üblichen Wellenlänge von

1064 nm. Aufgrund der geringen Quantenausbeute von Detektoren für den NIR-Spektral-

bereich und ihres hohen thermischen Rauschens, können jedoch keine kurzen Messzeiten

realisiert werden, weshalb eher im sichtbaren oder im ultravioletten (UV) Bereich angeregt

wird. Da UV-Strahlung für die meisten biologischen Materialien schädlich ist, hat sich die

Anregung im roten bzw. der Übergang in den NIR-Spektralbereich (785 nm) bewährt. Bei

785 nm Anregungswellenlänge ist der Fluoreszenzhintergrund niedrig und die

Einleitung

15

Quantenausbeute von CCD-Detektoren auf Siliziumbasis akzeptabel, weshalb sie sich als

geeignet für die Analyse biologischer Proben erwiesen hat. (Gebrekidan et al., 2016)

Bereits in zahlreichen wissenschaftlichen Veröffentlichungen wurde die oberflächenver-

stärkte Raman-Spektroskopie (SERS) (engl. Surface-enhanced Raman Spectroscopy) als

Methode zur Differenzierung von Bakterien angewandt. Bei der SERS wird die Raman-

Streuung von Molekülen in unmittelbarer Nähe einer nanostrukturierten metallischen Ober-

fläche enorm verstärkt. Die meisten SERS-Studien mit Bakterien wurden entweder mit Sil-

berkolloiden oder mit nanostrukturierten Silberoberflächen durchgeführt. (Sivanesan et al.,

2014)

Das verstärkte Signal wird durch die Kombination von elektromagnetischer und chemischer

Verstärkung erklärt. Die elektromagnetische Verstärkung ergibt sich aus der Resonanz des

angelegten Feldes mit Oberflächenplasmonen der metallischen Nanostrukturen. Die che-

mische Verstärkung bezieht sich auf den Ladungstransfer zwischen einem Substrat und

einem adsorbierten Molekül. Die elektromagnetische Verstärkung kann theoretisch Fakto-

ren von 103 bis 1011 erreichen, während für den chemischen Verstärkungsfaktor bis zu 103

berechnet wurde. Die enorme Steigerung der Raman-Streuung kann die Beobachtung ein-

zelner Moleküle ermöglichen, hat den Effekt den Fluoreszenzhintergrund zu beseitigen und

das Signal-Rausch-Verhältnis zu verbessern. (Witkowska et al., 2017)

Weitere instrumentelle Möglichkeiten sind beispielsweise die „Shifted-excitation Raman Dif-

ference Spectroscopy“ SERDS bei der mit zwei Lasern leicht unterschiedlicher Wellenlänge

zwei Spektren entstehen, von denen ein Differenzspektrum ohne Fluoreszenzstörungen

berechnet werden kann (Gebrekidan et al., 2016) und „Time-Gated Raman Spectroscopy“

bei der zeitgesteuerte Vorrichtungen kurze, intensive Laserimpulse abgeben und die Pro-

benantwort gleichzeitig mit den Impulsen aufgezeichnet wird. Die Ankunftszeit und die

Energie jedes Photons werden detektiert und durch Unterschiede in der Fluoreszenzle-

bensdauer und der „Lebensdauer“ des Raman-Signals, kann der Fluoreszenzhintergrund

eliminiert werden. (Lipiainen et al., 2018)

Da in der Praxis häufig nicht ohne Weiteres mit der Anregungswellenlänge variiert oder das

Verfahren grundlegend verändert werden kann, können auch einfache Waschschritte mit

sterilem deionisiertem Wasser (Kusic et al., 2015; Sengupta et al., 2006) oder Kochsalzlö-

sung zu einer Verringerung der Fluoreszenz führen, insbesondere wenn die Fluoreszenz

durch Pyoverdine ausgelöst wird. (Willemse-Erix et al., 2010)

Ein weiterer simpler Ansatz ist das Ausbrennen von Fluoreszenz durch Laserlicht, im eng-

lischen auch unter „Photobleaching“ bekannt. Beim „Photobleaching“ wird die Probe mit

dem Laser für einen bestimmten Zeitraum intensiv vorbestrahlt. Dies führt zu einem aus-

bleichen von Fluorophoren und somit zur Reduzierung des Fluoreszenzhintergrunds.

(Golcuk et al., 2006)

Einleitung

16

Das Ausbrennen der Fluoreszenz, hat allerdings den Nachteil, dass Proben verändert bzw.

beschädigt werden können. Pigmente, Farbstoffe und andere photochemisch empfindli-

chen Verbindungen können beispielsweise durch Anregung im sichtbaren Bereich zerstört

werden. (Schrader et al., 2000)

Veränderungen von Bakterienzellen durch elektromagnetische Strahlung haben Auswir-

kungen auf das Raman-Spektrum, welche eine Differenzierung verschiedener Mikroorga-

nismen und eine Standardisierung der Methode erschweren könnten.

1.1.3.4.2 Störung durch kosmische Strahlung und Umgebungslicht

Ein bedeutsamer Störfaktor in der Raman-Spektroskopie, sind gelegentlich auftretende un-

spezifische Peaks hoher Intensität. Diese sehr schmalen Peaks („Cosmic spikes“) entste-

hen durch kosmische Strahlung und werden von den empfindlichen CCD-Detektoren regis-

triert. (X. Zhang et al., 2017)

Abbildung 9 zeigt das mehrfache Auftreten solcher Störungen bei den Spektren zweier Mik-

roorganismen. Aufgrund ihres möglichen Einflusses auf multivariate Vorhersagemodelle,

dürfen solche Spektren nicht zur Modellentwicklung verwendet werden oder die Störungen

müssen zuvor entfernt werden. Besonders problematisch sind „Cosmic spikes“, wenn diese

sehr hohe Intensitäten aufweisen, wie beispielsweise der Peak bei ca. 960 cm-1 von B. sub-

tilis aus Abbildung 9. „Spikes“ die eine größere Bandbreite haben, als Banden mit spezifi-

scher chemometrischer Bedeutung oder „Spikes“, die direkt auf informationsreichen Regi-

onen auftreten, sind ebenfalls sehr problematisch. (L. Zhang & Henson, 2007)

Abbildung 9: Auftreten von „Cosmic spikes“ in Raman-Spektren markiert durch Pfeile

Einleitung

17

Zwar gibt es verschiedene Verfahren, um diese Störungen zu eliminieren, was vor allem in

der In-Prozess-Analytik eine wichtige Rolle spielt, jedoch werden bei Auftreten von „Cosmic

spikes“ bei den in dieser Arbeit gesammelten Spektren, keine Verfahren zur Eliminierung

angewandt, sondern betroffene Spektren verworfen.

Umgebungslicht hat insbesondere bei Verwendung von sehr schwachen Laserleistungen

einen Einfluss auf das aufgenommene Raman-Spektrum. Bestimmte Glühbirnen oder

Leuchtstoffröhren können sogar Peaks im Raman-Spektrum erzeugen, die leicht fehlinter-

pretiert werden könnten. Aus diesem Grund sollten Raman-Spektren immer in einer abge-

dunkelten Umgebung aufgezeichnet werden.

1.1.3.4.3 Einfluss der Probenpräparation

Das in dieser Arbeit vorliegende Mikro-Raman-Messsystem liefert eine Technik zur Analyse

von Oberflächen. Dennoch haben die Schichtdicken der Proben eine Auswirkung auf das

Messergebnis. Der Einfluss der Dicke des Probenfilms legt nahe, dass eine ideale Proben-

präparation gefunden werden muss, um möglichst deutliche Signale bei allen Proben zu

erhalten. Das Problem einer solchen standardisierten Probenschicht liegt darin, dass eine

Methode entwickelt werden soll, die für eine Vielzahl von Mikroorganismen geeignet ist.

Jedoch unterscheiden sich einige der hier analysierten Mikroorganismen so stark vonei-

nander, dass sich eine exakt definierte Probenpräparation, die für alle Probentypen geeig-

net ist, als schwierig erweisen könnte. Deshalb sollen vielmehr durch eine robuste Kalibrie-

rung mögliche Einflüsse durch kleinere Unterschiede in der Probenpräparation abgedeckt

werden. Im Ergebnisteil dieser Arbeit sollen auch die Auswirkungen der Probenpräparation

untersucht werden.

Neben der Schichtdicke spielt auch der Trocknungsgrad einer Probe eine Rolle. Allgemein

gilt in der Schwingungsspektroskopie, dass bei flüssigen Proben breitere, weniger scharfe

Peaks auftreten. Gase hingegen zeigen scharfe Banden, da dort die Moleküle mit einem

charakteristischem Drehimpuls frei rotieren können. Bei festen Proben treten im Vergleich

zu flüssigen Proben zusätzliche Banden aufgrund von Torsionsschwingungen auf. (Larkin,

2011)

Durch eine standardisierte Trocknungsdauer kann der Einfluss von Restfeuchte auf ein

Spektrum jedoch nahezu ausgeschlossen werden.

Kein oder nur ein sehr geringer Einfluss, könnte durch den verwendeten Glasobjektträger

entstehen (siehe Abbildung 10 A), wohingegen Rückstände des Nährmediums aufgrund

der darin enthaltenen Zucker, Proteine, Peptide und Aminosäuren durchaus einen Einfluss

haben. So zeigen sich bei einem Raman-Spektrum von getrocknetem Nährboden diverse

Peaks in informationsreichen Spektralgegenden (siehe Abbildung 10 B).

Einleitung

18

Abbildung 10: Raman-Spektrum eines Glasobjektträgers (A) und Raman-Spektrum von getrockne-tem Nährboden (TSA) (B)

1.1.4 Datenvorbehandlung und Vorhersagemodelle

Jede Datenvorbehandlung bedeutet zunächst einen Informationsverlust. Jedoch gibt es oft

Information in einem Spektrum, die für eine Klassifikation unwichtig oder sogar störend sein

können. So kann die Intensität eines Spektrums beispielsweise viel über die Leistung des

Lasers und die Anregbarkeit des Probenmaterials aussagen. Rauschen kann Rückschlüsse

auf die Sensitivität des Detektors erlauben und selbst Basislinienverschiebungen können

charakteristisch für bestimmte Umgebungsparameter sein. Doch die Art dieser Informatio-

nen sind für die Vorhersage eines unbekannten Mikroorganismus störend. Für die Entwick-

lung von Vorhersagemodellen gibt es deshalb diverse mathematische Verfahren, um die

für eine bestimmte Aufgabenstellung maximale Information aus einem Spektrum zu gewin-

nen. Viel wichtiger ist allerdings vorab die richtige Spektren-Aufnahme zu gewährleisten.

Dazu gehört beispielsweise die Wahl des für die Aufgabe geeigneten Wellenzahlbereichs,

die Standardisierung des Versuchsaufbaus oder des Prozesses und die optimalen Geräte-

Messeinstellungen. Unter Umständen kann mit einem optimierten Prozess die Datenvorbe-

handlung auf ein Minimum reduziert werden, dennoch ist sie speziell bei der Problemstel-

lung dieser Arbeit von großer Wichtigkeit. Die zuvor beschrieben Einflüsse auf ein Raman-

Spektrum, speziell Störungen durch Fluoreszenz aber auch mögliche Intensitätsunter-

schiede in Spektren von Mikroorganismen gleicher Art, Rauschen und Multikollinearität von

spektralen Daten, erfordern eine Datenvorbehandlung. Möglichkeiten zur Datenvorbehand-

lung und die Art der nötigen Verfahren werden in Kapitel 2.2.5 beschrieben.

Raman-Spektren bestehen je nach Messsystem aus vielen einzelnen Messpunkten (Vari-

ablen). Das erste Ziel der multivariaten Datenanalyse ist die Datenreduktion. Variablen mit

gleicher Information werden in sogenannte Hauptkomponenten zusammengefasst. Jedes

Objekt kann dann anstatt durch viele einzelne Variablen mit wenigen Hauptkomponenten

beschrieben werden. Ein weiterer Effekt der multivariaten Analyse ist, dass beim Berechnen

der Hauptkomponenten Variablen mit Information von Variablen ohne Information getrennt

Einleitung

19

werden. Dadurch wird auch gewährleistet, dass Rauschen nicht als Signal fehlinterpretiert

wird. Wurde die relevante Information aus einer großen Datenmenge herausgefunden,

kann daraus ein Modell erstellt werden, wie beispielsweise ein Klassifizierungsmodell zur

Vorhersage eines bestimmten Mikroorganismus aus neuen unbekannten Daten.

(Kessler, 2007)

Es gibt diverse Methoden zur Klassifizierung wie die lineare Diskriminanzanalyse (LDA)

oder die k-Nächste-Nachbarn-Klassifikation (kNN) bis hin zu komplexeren Methoden wie

„Support Vector Maschinen“ (SVM) oder künstliche neuronale Netze. Bei der Entwicklung

eines Modells sollte immer berücksichtigt werden, dass nicht nur die Vorhersageleistung

hoch ist, sondern dass die Modelle auch robust gegenüber unbekannten Daten und nicht

zu komplex sind, sodass sie für den Anwender oder zumindest den Entwickler interpretier-

bar bleiben. Um ein bestmögliches Modell zu finden, werden in dieser Arbeit drei verschie-

dene Klassifizierungsverfahren gegenübergestellt und deren Leistung verglichen.

1.1.5 Einblick in Ergebnisse bisheriger Studien

Bakterien konnten neben der Raman-Spektroskopie bereits erfolgreich über FT-IR-Spekt-

roskopie identifiziert werden (Helm et al., 1991; Ngo-Thi et al., 2003). Die Probenvorberei-

tung ist allerdings aufwendiger, als bei der Raman-Spektroskopie und durch konfokale

Mikro-Raman-Spektroskopie können bei der Analyse von Mikroorganismen anstelle meh-

rerer hundert Zellen, wie sie für die IR-Spektroskopie nötig sind, sogar einzelne Bakterien-

zellen innerhalb kurzer Zeit analysiert werden (Rösch et al., 2005).

2004 haben Lopez-Diez et al. über Tief-UV-Resonanz-Raman-Spektroskopie (engl. deep

UV resonance Raman spectroscopy, DUVRRS) verschiedene endosporenbildende Bakte-

rien der Gattungen Bacillus und Brevibacillus analysiert. Bei der Anregung im tiefen UV-

Bereich bei 244 nm findet ein Resonanzeffekt statt, welcher die Raman-Banden verstärkt.

Bei Anregung unter 260 nm Wellenlänge, werden die Messungen auch nicht von Fluores-

zenz gestört. Über Hauptkomponentenanalyse (Principal Component Analysis, PCA), Dis-

kriminanzanalyse und Hierarchische Clusteranalyse (HCA) wurde bestätigt, dass die

DUVRRS zur Differenzierung eng verwandter Endosporenbildner verwendet werden kann.

(Lopez-Diez & Goodacre, 2004)

Von wissenschaftlichen Untersuchungen zur Identifizierung von Mikroorganismen bei einer

Anregungswellenlänge von 532 nm wurde ebenfalls mehrfach berichtet, jedoch handelt es

sich dort meist um Analysen einzelner Bakterienzellen (Harz et al., 2005; Strola et al., 2014).

Raman-Spektren von einzelnen Bakterienzellen zeigen bei Anregung mit 532 nm im Ver-

gleich zu Spektren von Bakterienfilmen weniger Fluoreszenzstörung und zusätzliche Sig-

nale (Harz et al., 2005).

Einleitung

20

Möglichkeiten das Problem auftretender Fluoreszenz zu beseitigen und das schwache Ra-

man-Signal zu verstärken, wurden bereits in Kapitel 1.1.3.4.1 beschrieben. So wurde bei-

spielsweise SERS auch erfolgreich mit Goldpartikeln eingesetzt, um einzelne Bakterienzel-

len bei Anregung im NIR-Bereich zu analysieren. Das dadurch verstärkte Raman-Signal

ermöglicht im Vergleich zur herkömmlichen Raman-Messung in sehr kurzer Zeit umfang-

reiche Informationen über die Zelle und kleine chemische Veränderungen wie z.B. Ände-

rungen in den DNA-Banden zu registrieren. (K. Kneipp et al., 2002)

Eine deutliche Differenzierung von Bakterienarten und -stämmen mittels Raman-Spektro-

skopie, wurde bei Verwendung von nicht überwachten Klassifikationsverfahren wie der

Clusteranalyse nur erzielt, wenn die Kultivierungsbedingungen der Bakterien standardisiert

wurden, da verschiedene Wachstumsbedingungen einen starken Einfluss auf das Raman-

Spektrum haben. (Harz et al., 2005; Hutsebaut et al., 2004)

Baritaux et al. berichten über Raman-spektroskopische-Methoden zur Identifizierung von

Bakterien in Umweltproben. Es wurde eine Datenbank mit Raman-Spektren von Bakterien

eingerichtet, die verschiedenen Umgebungsbedingungen ausgesetzt waren. Dieser Daten-

satz wurde dazu verwendet die Möglichkeit einer Klassifizierung über eine SVM bei Mes-

sungen unter nicht idealen Bedingungen zu prüfen. Für Umweltproben sind Modelle mit

breiter Abdeckung wünschenswert, da dort die genauen Bedingungen der Bakterien nicht

kontrolliert werden können. (Baritaux et al., 2016)

Forschung mit direktem Bezug auf die Lebensmittelindustrie wurde unter anderem für die

Detektion der Bakteriengattung Brucella in Milch betrieben. Die Ergebnisse weisen darauf

hin, dass Mikro-Raman-Spektroskopie in Verbindung mit SVM eine vielversprechende Al-

ternative zur Identifizierung von Brucella spp. darstellen könnte, sowohl auf Agar-Platten,

als auch direkt in der Milch. Es kann eine Identifizierung auf Einzelzellebene innerhalb von

zwei Stunden ohne die Notwendigkeit einer Vorkultivierung erreicht werden.

(Meisel et al., 2012)

Mittels SERS und PCA konnte eine leistungsfähige Methode zum Nachweis und zur Iden-

tifizierung pathogener Bakterien in Lebensmittelproben entwickelt werden, welche als alter-

native Methode in die ISO-Normen aufgenommen werden könnte. Die Analysezeit könnte

von sechs Tagen, wie sie bei vielen gängigen Methoden nötig ist, auf zwei Tage reduziert

werden. Bei der Methode wurde die ansonsten zeitaufwendige Inkubation verkürzt und di-

rekte SERS-Analysen von auf selektiven Nährböden gewachsenen Bakterienkolonien

durchgeführt. Mit der Methode konnten in Lachs, Eiern, Säuglingsnahrung (Pulver), Milch

und Kräutermischungen gewachsene Bakterien (Salmonella enterica, Listeria monocytoge-

nes, Cronobacter sakazakii) mit 98-prozentiger Genauigkeit innerhalb von 48 Stunden iden-

tifiziert werden. (Witkowska et al., 2017)

Einleitung

21

1.2 Zielsetzung

Es wurde bereits in vielen wissenschaftlichen Veröffentlichungen nachgewiesen, dass eine

Identifizierung von Mikroorganismen über Raman-Spektroskopie sehr gute Resultate erzie-

len kann (siehe Kapitel 1.1.5). Zwar gibt es Spektren-Datenbanken, um Spektren einfacher

zu interpretieren und bestimmte Biomoleküle innerhalb eines Raman-Spektrums wiederzu-

finden, jedoch gibt es noch keine offiziellen und frei verfügbare Datenbanken, welche Ra-

man-Spektren vieler verschiedener Mikroorgansimen enthalten. Ein schneller oder automa-

tisierter Abgleich eines aufgenommenen Raman-Spektrums von einem Mikroorganismus

mit einer freien Datenbank ist bislang nicht möglich.

Neben der Auswahl des entsprechenden Wellenzahlbereichs liegt ein weiteres Problem bei

der Übertragung von bereits entwickelten Vorhersagemodellen von einem System auf ein

anderes darin, dass in der Forschung unterschiedlichste Geräte zur Erfassung der Daten

verwendet werden und jedes optische Element eines Messsystems einen Einfluss auf ein

Spektrum hat. Mit variierender Anregungswellenlänge verändern sich zwar nicht die Positi-

onen der Peaks, jedoch die Intensitäten entsprechender Banden. Auch die Umgebungsbe-

dingungen wie Licht und Temperatur unter welchen die Referenzspektren gesammelt wer-

den oder Unterschiede in der Probenpräparation, haben einen Einfluss auf ein Raman-

Spektrum. Diese Effekte können, zusammen mit diversen Variationen in den Kulturbedin-

gungen, dazu führen, dass bereits entwickelte Modelle bei einem anderen Versuchsaufbau

ungeeignet sind. Dennoch könnte eine universelle Datenbank bei entsprechender Robust-

heit und Vereinheitlichung, insbesondere bei der Datenvorbehandlung, möglich sein.

Die Hochschule Rhein-Waal in Kleve besitzt ein Mikro-Raman-Spektroskopie-System, wel-

ches eine Differenzierung von Mikroorganismen möglich machen könnte. In den meisten

Veröffentlichungen zur gleichen Thematik liegt die Anregungswellenlänge im NIR-Bereich

bei 785 nm und 1064 nm. Auch der UV-Bereich oder der sichtbare Bereich bei 532 nm

kommt häufiger zum Einsatz. Die in dieser Arbeit verwendete Anregungswellenlänge von

633 nm ist für organische Proben daher eher untypisch.

Das Ziel ist es, mit dem vorliegenden Messsystem eine zur Identifizierung einer Vielzahl

von Mikroorganismen geeigneten Methode zu entwickeln. Pathogene oder gentechnisch

veränderte Mikroorganismen werden in dieser Arbeit nicht analysiert. Es soll geprüft wer-

den, ob und welche Vorhersagemodelle die genauesten Ergebnisse erzielen und ob die

Methode in der Lage ist, Mikroorganismen auch auf Stammebene zu differenzieren. Um

diese Ziele zu erreichen muss zunächst eine Methode gefunden werden, um verwertbare

Spektren verschiedener Mikroorganismen zu erhalten. Anschließend erfolgt der Schritt der

Daten-Sammlung, bei welchem möglichst viele repräsentative Spektren verschiedener Mik-

roorganismen gesammelt werden. Mit den gesammelten Daten werden Modelle zur

Einleitung

22

Vorhersage entwickelt, was eine geeignete Datenvorbehandlung voraussetzt. Um zu über-

prüfen, wie die Modelle in der Praxis abschneiden, müssen diese auf Spektren von Proben

angewandt werden, die nicht im Kalibrationsset enthalten sind. Aus diesem Grund werden

zusätzliche Spektren für eine praktische Validierung der Modelle gesammelt. Neben dem

Schwerpunkt, nämlich der Entwicklung der Methode und der Vorhersagemodelle, sollen

auch verschiedene Einflüsse der Analysebedingungen berücksichtigt werden. Dazu gehö-

ren Einflüsse auf Raman-Spektren bei leichten Unterschieden in der Kultivierung, Neben-

effekte nach längerer Vorbestrahlung zur Fluoreszenzreduzierung und Auswirkungen der

Probenpräparation auf ein Spektrum.

Ein weiterer Fokus soll auf der späteren Anwenderfreundlichkeit der Methode liegen, was

eine einfache Durchführungsweise und robuste Vorhersagemodelle voraussetzt. Deshalb

soll ein kompakter Leitfaden zur Vorgehensweise bei der Identifizierung unbekannter Mik-

roorganismen entworfen werden. Die Ergebnisse dieser Arbeit können als Basis neuer

hochschulinternen Forschungsziele für den Einsatz der Raman-Spektroskopie in der Mik-

robiologie dienen.

Material und Methoden

23

2 Material und Methoden

2.1 Material

2.1.1 Geräte

• Brutschrank, HettCube 200 R (Hettich AG)

• Vortexschüttler, Fisherbrand ZX3 (Thermo Scientific)

• Zentrifuge, Heraeus Fresco 17 (Thermo Scientific)

• Raman Spektroskopie System, Konfokales Raman-Mikroskop inVia (Renishaw)

o Laser: HeNe-Laser, 17 mW, luftgekühlt

Plasmafilter für 633 nm, Gitter mit 1800 l/mm

o Anregungswellenlänge: 633 nm

o Spektrale Auflösung: 0,82 cm-1

o Mikroskop: adaptiertes Leica DM2700 (100X-Objektiv)

o Detektor: CCD-Chip

Abbildung 11 zeigt den Hauptteil des Raman-Messsystems. Er besteht aus dem Mikroskop,

dem Laser und dem Gehäuse unter welchem sich, wie aus Abbildung 4 zu entnehmen,

verschiedene optische Elemente sowie der Detektor befinden. Die Hardware ist mit einem

Computer verbunden und ein Trackball dient neben der mechanischen Möglichkeit zur Fo-

kussierung und Bewegung des Objekttisches, als zusätzliches Eingabegerät.

• Videokamera

• Wahlschalter

(Wechsel zwischen Lichtquelle

des Mikroskops und Laser)

• HeNe-Laser

• Objektiv(e)

• Motorisierter Mikroskoptisch

• CCD-Detektor

Abbildung 11: Konfokales Raman-Mikroskop inVia Renishaw

Material und Methoden

24

2.1.2 Software

• Bedienersoftware des Raman-Messsystems, WiRE Version 4.3 (Renishaw)

• Konvertierungssoftware, WiRE Batch Coverter (Renishaw)

• Software zur Datenverarbeitung, Datenvorbehandlung und zur Erstellung der Vor-

hersagemodelle, MATLAB R2017b Version 9.3.0.713579 (The MathWorks, Inc.)

o Spectr-O-Matic Toolbox for MATLAB Version 2.0 (Petar H. Lambrev)

o MATLAB Classification Learner, Statistics and Machine Learning Toolbox

Version 11.2 (The MathWorks, Inc.)

2.1.3 Mikroorganismen

Tabelle 3 enthält die in dieser Arbeit verwendeten Mikroorganismen. Die aufgelisteten Kür-

zel aus Tabelle 3 werden in nachfolgenden Tabellen, Abbildungen und Texten als Bezeich-

nung der Mikroorganismen verwendet.

Tabelle 3: Verwendete Mikroorganismen, Kürzel und DSM-Nr.

Kürzel Mikroorganismus DSM-Nr.

Bdi 7234 Brevundimonas diminuta 7234

Bsu 10 Bacillus subtilis 10

K12 423 Escherichia coli K12 423

MLB 28269 Micrococcus luteus 28269

Mlu 1790 Micrococcus luteus 1790

Mlu 20030 Micrococcus luteus 20030

Pfl 50090 Pseudomonas fluorescens 50090

Sce 1334 Saccharomyces cerevisiae 1334

Sty TA981 Salmonella Thyphimurium TA98 -

2.1.4 Verbrauchsmaterialien

• Trypton Soja Agar nach EP, USP, JP, ISO und FDA-BAM GranuCult (Merck KGaA)

• Impfschlingen, steril aus Polystyrol 10 µl (Sarstedt)

• Reaktionsgefäße mit Deckel, 1,5 ml

• Objektträger mit geschnittenen Kanten und Mattrand (VWR International)

1 TA98 Salmonella Thyphimurium-Stamm mit natürlicher Mutation, welche zur Apathogenität führt.

Material und Methoden

25

2.2 Methoden

2.2.1 Anzucht der Mikroorganismen

Für die Herstellung der Nährböden werden 40 g der TSA-Fertigmischung mit 1000 ml deio-

nisiertem Wasser bei 121 °C autoklaviert. Im Anschluss werden die Platten mit dem noch

flüssigen Agar gegossen und bei Raumtemperatur gelagert.

Zur Anzucht werden Mikroorganismen aus stickstoffgekühlten Reinkulturen (Suspensionen

gelagert bei -80 °C mit Glycerin als Frostschutzmittel) verwendet. Die aufgetauten Keim-

suspensionen werden mittels sterilen Einweg-Impfösen auf die TSA-Petrischalen ausge-

strichen. Die Bebrütung erfolgt bei 30 °C für 24 Stunden. Nach der Bebrütung wird ein Teil

des gewachsenen Koloniematerials erneut auf einer weiteren TSA-Platte ausgestrichen.

Zur Analyse werden sowohl die erste, als auch die zweite Kultur herangezogen. Nachfol-

gend werden in dieser Arbeit die Begriffe Kultur 1 und Kultur 2 dafür verwendet.

2.2.2 Probenpräparation

In 1,5 ml Reaktionsgefäße werden mit einer Kolbenhubpipette 1000 µl 0,9% NaCl-Lösung

vorgelegt. Mit einer Impfschlinge wird Koloniematerial von der Agarplatte in das Reaktions-

gefäß gegeben. Es wird so viel Material verwendet, wie mit drei vollgestrichenen Impfösen

aufgenommen werden kann. Beim Überführen des Koloniematerials wird beachtet, den

Nährboden nicht zu beschädigen und keine Bestandteile davon mitaufzunehmen.

Die Mischung aus Mikroorganismus und NaCl-Lösung wird solange auf einem Vortexer ge-

mischt, bis eine gleichmäßige Suspension entsteht. Mit einer Zentrifuge werden die Sus-

pensionen für drei Minuten bei 5000 Umdrehungen pro Minute (rpm) zentrifugiert. Der Über-

stand wird abpipettiert und verworfen. Das Material kann im Anschluss mittels Pipette oder

einem sterilen Kunststoffstab aus dem Reaktionsgefäß auf den Objektträger überführt wer-

den, wo die Masse dann für ein bis zwei Stunden bei Raumtemperatur getrocknet wird.

Je nach Bakterium bzw. Hefe ist die mit der Impföse aufgenommene Probenmenge variabel

und auch der Rest an NaCl-Waschlösung kann variieren, woraus kleinere Unterschiede in

der Probendarbietung auf dem Objektträger folgen können. Auch die Beschaffenheit des

Mikroorganismus selbst hat einen Einfluss auf die Trocknungsdauer und die Probendarbie-

tung. Klebriges Koloniematerial zerfließt weniger stark, wohingegen gut suspendierbare

Proben einfacher einen dünnen Film auf dem Objektträger bilden. Unabhängig von der Art

der Probe gilt, dass das Material gewöhnlich von außen nach innen durchtrocknet. Da für

die Kalibration sehr viele Spektren pro Probe gesammelt werden und es mehrere Stunden

dauert, kann dies ausgenutzt werden, indem zuerst Spektren der trockenen Randbereiche

gesammelt werden und während der Durchführung dieser Messungen die Probe im

Material und Methoden

26

Zentrum weiter trocknet. Es muss allerdings berücksichtigt werden, dass das Probenmate-

rial an keiner Stelle zu feucht ist, da die Gefahr besteht, dass Probenmaterial durch Kapil-

larkräfte auf das Objektiv gelangen könnte.

2.2.3 Vorbereitung des Raman-Messsystems

Das Raman-Messsystem wird mit folgenden Schritten in Betriebsbereitschaft gesetzt:

• Einschalten des Lasers

• Einschalten des Spektrometers

• Einschalten der Lichtquelle des Mikroskops

• Einschalten des Computers

• Starten der Software WiRE 4.3

Nach diesen ersten Schritten wird vor jedem Versuchstag über die Software WiRE 4.3 die

„Quick-Calibration“ initiiert. Diese beinhaltet die Messung eines Silizium- (Si) Standards.

Der Si-Standard wird auf dem Objekttisch fixiert und mittels Grob- und Feintrieb des Mikro-

skops wird die Oberfläche scharf gestellt. Mit dem Trackball kann die korrekte Fokussierung

überprüft werden, indem damit der Objekttisch bzw. die Probe bewegt wird und die Bewe-

gung am Bildschirm mitverfolgt wird. Über das Trackball-Eingabegerät kann die Fokussie-

rung auch nachjustiert werden.

2.2.4 Sammeln der Raman-Spektren

Pro Versuchstag werden von maximal drei verschiedenen Mikroorganismen Spektren ge-

sammelt. Der Objektträger mit der getrockneten Probe wird auf dem Objekttisch fixiert. Mit

dem 100X-Objektiv wird eine Stelle fokussiert. Danach erfolgt die Messung mit folgenden

Einstellungen:

• Wellenzahlzentrum: 1200 cm-1 (Wellenzahlbereich: ca. 605 cm-1 bis 1737 cm-1)

• Belichtungsdauer: 3 s

• Laserleistung: 100 %

• Anzahl der Einzelspektren2 für ein Spektrum: 15

Die Spektrenaufzeichnung erfolgt bei inaktiver Raumbeleuchtung und geschlossenen Ja-

lousien. Von der fokussierten Stelle werden 5 bis 10 Spektren hintereinander aufgezeich-

net. Zwischen den Messungen wird der Fokus überprüft und unter Umständen nachjustiert.

Nach dem Aufzeichnen dieser Spektren von ein und derselben Stelle, wird eine andere

Stelle auf dem Objektträger fokussiert, welche sich möglichst weit entfernt von der letzten

Stelle befindet. Von der neuen Stelle werden nun wieder 5 bis 10 Spektren aufgezeichnet

2 Durch Akkumulation mehrerer Einzelspektren wird das Rauschen reduziert

Material und Methoden

27

und danach wird die Stelle nach demselben Prinzip gewechselt. Dies wird so oft wiederholt,

bis an einem Versuchstag pro Mikroorganismus etwa 100 bis 200 Spektren entstehen. Bei

der Wahl der Stellen ist zu beachten, dass möglichst viele Variationen, die in der Praxis

vorkommen können, abgedeckt werden. Ist das Probenmaterial beim Trocknungsvorgang

beispielsweise so zerflossen, dass bestimmte Bereiche eine etwas geringere Schichtdicke

aufweisen als andere, so werden von allen Bereichen Spektren gesammelt. Die Anzahl der

Aufzeichnungen von Spektren bei variierenden Schichthöhen sollten in etwa gleichmäßig

gewichtet sein.

Die Messdauer eines Raman-Spektrums beträgt bei 3 Sekunden Belichtungszeit und

15 Einzelspektren entsprechend 45 Sekunden. Proben die starke Störung durch Fluores-

zenz aufweisen werden allerdings solange vorbestrahlt, bis für Mikroorganismen typische

Signale sichtbar werden. Sollten nach etwa zehn Minuten Vorbestrahlung keine typischen

Peaks zu sehen sein, wird die zu analysierende Stelle auf dem Objektträger gewechselt.

Es werden Spektren von Kultur 1, die direkt aus der Tiefkühlung einen Tag lang auf TSA

bebrütet werden, erfasst und Spektren von Kultur 2, bei der Koloniematerial von der ersten

Kultur überführt und ebenfalls einen Tag lang auf TSA bebrütet wird.

Um die gesammelten Daten anschließend einfach und effizient verarbeiten zu können, wer-

den die Dateinamen der Spektren nach der folgenden Logik gewählt:

• Jahr, Monat, Tag, fortlaufende Nummerierung innerhalb des Versuchstages begin-

nend mit 001, Kürzel des Mikroorganismus (z.B. 20180831 216 Sty TA98)

Mit dem WiRE Batch Converter werden die Spektren in das TXT-Format konvertiert.

Dadurch wird jedes Spektrum als eine Datei aus zwei Spalten mit der Wellenzahl und der

entsprechenden Intensität bzw. den „Counts“ abgespeichert. Jedes Spektrum hat 1015 Da-

tenpunkte bzw. 1015 Wellenzahlen (Raman shifts) mit den dazugehörigen Intensitäten

(Counts). Die originalen Dateien im sogenannten WDF-Format können mit der WiRE-Soft-

ware geöffnet werden und enthalten zusätzlich alle Informationen zu den Mess- und Gerä-

teeinstellungen.

2.2.5 Datenvorbehandlung

2.2.5.1 Interpolierung

Zunächst müssen die Spektren jedes Mikroorganismus in MATLAB eingelesen werden.

Trotz Kalibrierung des Raman-Messsystems mit dem Si-Standard, gibt es bei verschiede-

nen Versuchseinheiten kleinere Abweichungen im Wellenzahlbereich der Spektren. Diese

Unterschiede würden eine weitere Datenvorbehandlung nicht möglich machen oder könn-

ten Fehler bei der späteren Modellentwicklung hervorrufen. Aus diesem Grund werden die

Daten interpoliert. Dies hat zur Folge, dass alle Spektren auf den exakt gleichen

Material und Methoden

28

Wellenzahlbereich vereinheitlicht werden und den Vorteil, dass die Abstände zwischen den

1015 Datenpunkten äquidistant werden.

Für das weitere prozessieren der Spektren müssen die Daten als Matrix konvertiert werden.

Das Einlesen, das Interpolieren und das Transformieren als Datenmatrix, erfolgt über die

MATLAB-Befehle aus der Spectr-O-Matic Toolbox von Petar H. Lambrev. Die Vorgehens-

weise in MATLAB ist im Leitfaden zur Identifizierung von Mikroorganismen über Raman-

Spektroskopie (Anhang 7) beschrieben.

2.2.5.2 Basislinienkorrektur und Glättung

Wie in Kapitel 1.1.3.4 beschrieben, haben verschiedene Einflüsse einen Effekt auf die Qua-

lität eines Raman-Spektrums. Der bedeutendste Einfluss bei biologischen Proben stellt der

Fluoreszenzhintergrund dar.

Die vollständige Entfernung von Fluoreszenzstörung in Raman-Spektren ist aufgrund der

komplexen Merkmale biologischer Raman-Spektren eine Herausforderung.

Bei rechnerischen Verfahren zur Entfernung des Fluoreszenzhintergrunds bzw. zur Basis-

linienkorrektur, geht es gewöhnlich darum eine Basislinie zu schätzen und diese vom ge-

messenen Raman-Spektrum abzuziehen. Somit spielt die Art des Verfahrens zur Schät-

zung bzw. zur Angleichung einer Basislinie an das Spektrum eine entscheidende Rolle für

die Leistung einer Basislinienkorrektur. (Guo et al., 2016)

Rechnerische Verfahren zur Basislinienkorrektur sind neben der Bildung der ersten und

zweiten Ableitung eines Spektrums beispielsweise eine Polynomanpassung (Lieber &

Mahadevan-Jansen, 2003), Fourier Transformation (Schulze et al., 2005), Wavelet Trans-

formation und Empirische Bandzerlegung (EMD) (Leon-Bejarano et al., 2016).

Die Glättung eines Spektrums dient der Rauschverminderung. Bei Rauschen handelt es

sich um ein Störsignal, welches vom Spektrometer selbst verursacht wird. Je schwächer

das spektroskopische Signal ist, desto stärker wird das Rauschen. Zur Beseitigung oder

Eindämmung des Rauschens ist ein sehr einfacher Ansatz die Polynomglättung, bei der

nach Wahl einer Intervallgröße, ähnlich wie bei der Basislinienkorrektur, ein Polynom gefit-

tet wird. (Kessler, 2007)

Die in dieser Arbeit eingesetzten Methoden zur Basislinienkorrektur und Glättung basieren

auf einem Tiefpassfilter. Ein Tiefpass hat generell die Funktion tiefe Frequenzen eines

Spektrums passieren zu lassen bzw. höhere Frequenzen abzuschneiden (Runkler, 2016).

Ein Tiefpassfilter kann problemlos auf diverse Arten von Spektren oder Signale angewandt

werden.

Material und Methoden

29

Am ehesten kann die Funktion der Glättung durch den Tiefpassfilter anhand eines Stufen-

spektrums verdeutlicht werden. Die Kanten entsprechen den hohen Frequenzkomponen-

ten, die entfernt werden, während tiefe Frequenzen passieren können (siehe Abbildung 12).

Abbildung 12: Prinzip eines Tiefpassfilters zur Glättung eines Stufenspektrums

Bei elektromagnetischen Wellen ergibt sich die Frequenz aus der Wellenzahl multipliziert

mit der Lichtgeschwindigkeit (im Vakuum). Der Zusammenhang der Frequenz mit der Wel-

lenzahl, der Wellenlänge und der Lichtgeschwindigkeit bei elektromagnetischen Wellen

kann wie folgt beschrieben werden:

𝜈 =1

𝜆=

𝑓

𝑐

(1)

�̃� = Wellenzahl

𝜆 = Wellenlänge

𝑓 = Frequenz [1

𝑠] = [𝐻𝑧]

𝑐 = Lichtgeschwindigkeit im Vakuum ≈ 2,998 ∙ 1010 𝑐𝑚

𝑠

2.2.5.3 Normalisierung

Die Spektren gleicher Mikroorganismen unterscheiden sich nur geringfügig in ihren eigent-

lichen Signaturen, was die späteren Vorhersagen anhand unbekannter Spektren überhaupt

erst möglich macht, jedoch gibt es sehr starke Unterschiede in der Intensität der Spektren.

Insbesondre mit zunehmender Bestrahlungsdauer sinkt die Intensität eines Spektrums.

Diese Unterschiede verhindern die Entwicklung von Kalibrations-Modellen mit hoher Vor-

hersagegüte.

Eine Normalisierung gleicht systematische Veränderungen in der Intensität aus. Spektren,

bei denen die Signale das gleiche Verhältnis zueinander haben, aber unterschiedliche ma-

ximale Intensitäten, werden durch die Normalisierung identisch. Prinzipiell verändert sich

das Aussehen der Spektren durch die Normalisierung nicht. (Kessler, 2007)

Material und Methoden

30

Die Spektren werden in dieser Arbeit normalisiert, indem das Minimum eines Spektrums

als null und das Maximum als eins definiert wird. Aus Formel (2) geht die rechnerische

Vorgehensweise hervor, um die Intensität bei einer Wellenzahl eines Spektrums zu norma-

lisieren. Das entsprechende MATLAB-Skript um die Intensitäten jeder Wellenzahl aller

Spektren automatisiert zu normalisieren, befindet sich in Anhang 7.

𝐼𝑛𝑜𝑟𝑚 = 𝜇 ∙ (𝐼 − 𝐼𝑚𝑖𝑛) + 𝑖𝑚𝑖𝑛 mit 𝜇 =𝑖𝑚𝑎𝑥 − 𝑖𝑚𝑖𝑛

𝐼𝑚𝑎𝑥 − 𝐼𝑚𝑖𝑛

(2)

𝐼𝑛𝑜𝑟𝑚 = Normalisierte Intensität bei gewählter Wellenzahl des Ausgangsspektrums

𝜇 = Mittlere normalisierte Intensität des Ausgangsspektrums

𝐼 = Intensität bei gewählter Wellenzahl des Ausgangsspektrums

𝐼𝑚𝑖𝑛 = Minimalintensität des Ausgangsspektrums

𝐼𝑚𝑎𝑥 = Maximalintensität des Ausgangsspektrums

𝑖𝑚𝑖𝑛 = Definiertes Minimum = 0

𝑖𝑚𝑎𝑥 = Definiertes Maximum = 1

Abbildung 13 zeigt anhand dreier exemplarischer Spektren verschiedener Mikroorganis-

men den schrittweisen Effekt der einzelnen Vorbehandlungsarten. Die interpolierten aber

ansonsten noch unbehandelten Spektren aus Abbildung 13 A, weisen große Unterschiede

in der Intensität auf und K12 423 (blau) einen Anstieg im Bereich von 600 bis 950 cm-1.

Nach Basislinienkorrektur und Glättung (Abbildung 13 B) liegen die Spektren nahezu paral-

lel zur Wellenzahlachse, weisen geringeres Rauschen auf und die spezifischen Signaturen

werden deutlicher sichtbar. Nach Normalisierung (Abbildung 13 C) bewegen sich die Inten-

sitäten der Spektren zwischen null und eins und weisen keine negativen Intensitäten mehr

auf.

Material und Methoden

31

Abbildung 13: Schrittweises Schema der Datenvorbehandlung anhand dreier Spektren verschiede-

ner Mikroorganismen; (A) Interpolierte Spektren, (B) Basislinienkorrektur und Glättung, (C) Normalisierung

2.2.6 Hauptkomponentenanalyse

Eines der wichtigsten Ziele der Hauptkomponentenanalyse, im englischen Principal Com-

ponent Analysis (PCA) genannt, ist die Daten- bzw. Dimensionsreduktion. Viele einzelne

Variablen, wie in dieser Arbeit 1015 verschiedene Intensitäten für jedes Ramanspektrum,

werden zu wenigen Hauptkomponenten (PCs) zusammengefasst, welche für die Beschrei-

bung der Mikroorganismen ausreichen sollen. (Kessler, 2007)

Die PCA ist besonders aufgrund der hohen Multikollinearität bei spektroskopischen Daten

wichtig. Multikollinearität bedeutet, dass einzelne Intensitäten innerhalb eines Spektrums

stark miteinander korrelieren. Aufgrund der relativ hochauflösenden Abtastung benachbar-

ter Wellenzahlen sind dort die Intensitäten häufig nahezu identisch und korrelieren daher

sehr stark.

Dies bedeutet zum einen Redundanz in den Daten und somit weniger Information und zum

anderen lassen sich die vorhandenen Informationen nicht mehr eindeutig den Variablen

zuordnen (Backhaus et al., 2015). Zudem kann bei Heranziehen vieler oder aller Variablen

das Rauschen fehlerhafterweise als Signal interpretiert werden. Multikollinearität führt bei

Material und Methoden

32

vielen Klassifizierungsverfahren zu numerischen Problemen, denen eine vorangehende

PCA entgegenwirken kann (Jolliffe, 2002).

Mithilfe der PCA, werden aus den Ausgangsvariablen, also den Intensitäten der jeweiligen

Wellenzahlen, neue, latente Variablen berechnet, die sogenannten Faktoren bzw. Haupt-

komponenten. Die PCs sind mathematisch eine Linearkombination der Ausgangsvariablen.

Das heißt sie setzten sich aus einer linearen Summe der unterschiedlich gewichteten Ur-

sprungsvariablen zusammen. Zur Berechnung der PCs gibt es mehrere mathematische

Vorgehensweisen. Bei einer quadratischen Ausgangsmatrix X können die PCs als Eigen-

vektoren und zugehörige Eigenwerte der Datenmatrix X betrachtet und über einen Algorith-

mus zur Eigenwertberechnung bestimmt werden. Hierfür wird die Datenmatrix X zuerst in

die Korrelationsmatrix bzw. in die Kovarianzmatrix übertragen, damit sie quadratisch wird.

Mit der quadratischen Matrix wird die Eigenwertberechnung durchgeführt, die im englischen

Singular Value Decomposition genannt wird (SVD). (Kessler, 2007)

Jeder Eigenwert mit dem zugehörigem Eigenvektor bildet einen Faktor bzw. eine PC. Diese

PCs bilden die Faktormatrix P. Ein Faktor bildet je eine Spalte der Matrix P. Die Zeilenzahl

von P entspricht der Anzahl der Elemente pro Faktor und wird durch die Anzahl der Spalten

(Variable) in der Ausgangsmatrix bestimmt. Bei der Berechnung der Eigenwerte findet noch

keine Dimensionsreduktion statt. Die Elemente der Spalten in P werden Faktorladungen

(engl. Loadings) genannt. Der Eigenwert bestimmt hierbei den Anteil des Faktors an der

Gesamtvarianz der Ursprungsdaten. Je höher der Eigenwert ist, umso größer ist die erklärte

Gesamtvarianz und umso wichtiger ist der Faktor zur Beschreibung der Ursprungsdaten.

(Kessler, 2007)

Die Faktoren können auch bestimmt werden, indem die Richtung der maximalen Varianz

mit einem geeigneten Algorithmus in den Ausgangsdaten gesucht wird. Die hiermit gefun-

denen Faktoren stellen ein neues Koordinatensystem dar, welches die Daten besser be-

schreibt. Dann kann durch den Verzicht auf höhere Koordinatenachsen eine Datenreduk-

tion erfolgen. Es wird auf Koordinatenachsen verzichtet, die nur einen geringen Teil zur

Gesamtvarianz der Daten beitragen; somit wird nur ein Unterraum der Ausgangsdaten be-

trachtet. (Kessler, 2007)

Da die Daten durch das neue Faktorenkoordinatensystem beschrieben werden sollen, müs-

sen nach der Berechnung der PCs die Ursprungsdaten in den neuen Faktorenraum trans-

formiert werden. Um für jede Beobachtung die Koordinaten im neuen Faktorenraum zu be-

rechnen, muss jedes Objekt auf jeden der Faktoren abgebildet werden. Die dadurch erhal-

tenen Koordinaten werden Faktorenwerte bzw. mit dem englischen Begriff Scores genannt.

Für alle Objekte und jeden Faktor wird ein Scorewert berechnet, die dann die Matrix T bil-

den. Die Anzahl der Zeilen von T entsprechen der Anzahl der Objekte der Originalmatrix X

Material und Methoden

33

und die Anzahl der Spalten entsprechen der Zahl der verwendeten PCs bzw. der Dimension

des neuen Faktorenkoordinatensystems. (Kessler, 2007)

Abbildung 14 verdeutlicht das Prinzip der PCA grafisch anhand zweier Variablen (X und Y)

und fünf Beobachtungen. Das Koordinatensystem wird gedreht, damit die Beobachtungen

innerhalb der ersten Hauptachse die größte Varianz aufweisen. Das Beispiel aus Abbildung

14 verdeutlicht, dass bei Weglassen der zweiten Hauptkomponente (PC2) nur wenig Infor-

mation verloren geht. PC1 reicht also aus um die zweidimensionalen Daten mit nur einer

Dimension zu beschreiben. Genau nach diesem Prinzip können Raman-Spektren, mit je

nach Messsystem über 1000 Dimensionen, durch wenige PCs beschrieben werden.

Abbildung 14: Vereinfachtes Schema einer Dimensionsreduktion durch PCA

(modifiziert nach (Powell & Lehe, 2014))

Betrachtet man nur einen Unterraum der Originaldaten, also eine geringere Anzahl an PCs

als die Anzahl der Variablen zulassen würde, dann gibt es eine Matrix E, welche die Dimen-

sion der Originalmatrix X hat und den Anteil der Originaldaten, der nicht durch die PCs

erklärt wurde, die sogenannten Residuen enthält. Je mehr Faktoren berechnet werden,

desto kleiner werden die Werte in Matrix E. Bei Verwendung aller PCs für den Faktoren-

raum werden die Elemente der Matrix E null, womit die Berechnung der PCA beendet ist.

(Kessler, 2007)

Es sollte berücksichtigt werden, dass die ersten PCs, bzw. die Hauptkomponenten mit den

größeren Eigenwerten, nicht notwendigerweise die relevanteste Information für die Klassi-

fizierung enthalten (Chang, 1983). In dieser Arbeit soll vor jedem Klassifizierungsverfahren

eine PCA durchgeführt werden und zur Modellentwicklung eine unterschiedliche Anzahl an

PCs herangezogen werden. Jedes Klassifizierungsmodell wird jeweils unter Verwendung

von 8, 12, 15 und 20 PCs generiert.

Material und Methoden

34

2.2.7 Modellentwicklung zur Identifizierung von Mikroorganismen durch

verschiedene Klassifikationsverfahren

Ein Modell ist im Allgemeinen eine mathematische Funktion, mit welcher Vorhersagen über

unbekannte Daten gemacht werden können. Ein einfaches Beispiel eines Modells ist eine

Kalibrierungsgrade, wie sie in der quantitativen Chemie häufig verwendet wird. Zu Stan-

dards mit bekannter Konzentration werden Detektorwerte (z.B. Peakflächen bei Hochleis-

tungsflüssigkeitschromatographie) erzeugt. Werden die Konzentrationen in einem Koordi-

natensystem auf die entsprechenden Detektorwerte aufgetragen, kann eine Regressions-

gerade berechnet werden. Durch Umstellen der Geradengleichung können aus Detektor-

signalen unbekannter Proben, die unter denselben Bedingungen erfasst wurden, Konzent-

rationen berechnet werden. Einfache Vorhersagemodelle für qualitative Analysen funktio-

nieren nach dem gleichen Prinzip. Anhand einer detektierbaren Variable können Vorhersa-

gen über eine andere Eigenschaft oder Klasse gemacht werden. Die Zuordnung eines Mik-

roorganismus egal ob in Gattung, Art oder Stamm, anhand nur eines einzigen Merkmals,

wie das Gramverhalten, ist nicht möglich. Für solche Vorhersagen sind multivariate Modelle

notwendig, die mehrere beschreibende Variablen berücksichtigen. In dieser Arbeit sollen

drei gängige Klassifizierungsverfahren angewandt und Resultate verglichen werden. Hier-

bei handelt es sich um die quadratische Diskriminanzanalyse (QDA), kNN und SVM, welche

nachfolgend skizziert werden.

2.2.7.1 Quadratische Diskriminanzanalyse

Die Diskriminanzanalyse ermöglicht die Untersuchung der Unterschiedlichkeit mehrerer

Gruppen hinsichtlich einer bestimmten Anzahl von Variablen. (Backhaus et al., 2015)

Bei der LDA wird die Vorhersage unbekannter Daten erreicht, indem die Varianz innerhalb

einer Klasse (Mikroorganismus) minimiert und die Varianz zwischen verschiedenen Klas-

sen maximiert wird. (Hair et al., 2010)

Dadurch entsteht ähnlich wie bei der PCA ein neues Koordinatensystem bzw. eine Linear-

kombination. Sowohl mit der PCA, als auch über die LDA wird eine Dimensionsreduktion

erzielt. Die PCA zielt jedoch darauf ab die größte Varianz der Daten zu finden (siehe Abbil-

dung 15 A) und die LDA darauf die Trennung der bekannten Klassen zu maximieren (Ab-

bildung 15 B). Eine neue Beobachtung wird der Klasse mit dem nächstgelegenen Daten-

zentrum (Klassenschwerpunkt) zugeordnet. (Hastie et al., 2009)

Material und Methoden

35

Abbildung 15: Beispiel zweier Datenklassen mit markiertem Klassenschwerpunkt und Projektion

der Daten um die größte Varianz zu erzielen (A) und Projektion der Daten in Diskriminanzrichtung (B) (Hastie et al., 2009)

Die Diskriminanzfunktion wird auch kanonische Diskriminanzfunktion genannt und die Dis-

kriminanzvariable kanonische Variable. Der Begriff „kanonisch“ beschreibt, dass eine Line-

arkombination von Variablen vorgenommen wird. (Backhaus et al., 2015)

Die Formel der kanonischen Diskriminanzfunktion setzt sich wie folgt zusammen (Hair et

al., 2010):

𝑍𝑗𝑘 = 𝑎 + 𝑊1𝑋1𝑘 + 𝑊2𝑋2𝑘 + ⋯ + 𝑊𝑛𝑋𝑛𝑘 (3)

𝑍𝑗𝑘 = Diskriminanzvariable 𝑗 für Objekt 𝑘

𝑎 = Konstantes Glied (Achsenabschnitt)

𝑊𝑖 = Diskriminanzkoeffizient für Merkmalsvariable 𝑖

𝑋𝑖𝑘 = Merkmalsvariable 𝑖 für Objekt 𝑘

Häufig trennen lineare Entscheidungsgrenzen die Klassen nicht ausreichend. Vor allem

wenn viele Beobachtungen vorliegen, können komplexere Entscheidungsgrenzen zu ge-

naueren Vorhersagen führen. Die QDA ermöglicht im Gegensatz zur LDA quadratische

Entscheidungsgrenzen. LDA verwendet einen einzelnen Klassenschwerpunkt sowie eine

gemeinsame Kovarianzmatrix, um die Verteilung der Daten in jeder Klasse zu beschreiben.

In vielen Situationen sind mehrere Schwerpunkte geeigneter. Falls ungleiche Kovarianz-

Matrizen vorliegen, kann dies durch Anwendung einer QDA berücksichtigt werden

(Backhaus et al., 2015). Bei zu vielen korrelierten Prädiktoren, beispielsweise bei entspre-

chenden Wellenzahlen (Raman shifts), könnte die LDA zu viele Parameter verwenden, die

mit hoher Varianz geschätzt werden, worunter die Leistung des Modells leidet. (Hastie et

al., 2009)

Abbildung 16 A zeigt einige fiktive Daten aus drei verschiedenen Klassen, wobei lineare

Entscheidungsgrenzen durch LDA ermittelt wurden. Quadratische Entscheidungsgrenzen,

welche durch Auffinden linearer Grenzen in einem höherdimensionalen Raum erhalten wur-

den, gehen aus Abbildung 16 B hervor. Lineare Ungleichungen in einem entsprechend hö-

herdimensionalen Raum sind quadratische Ungleichungen im ursprünglichen Raum.

Material und Methoden

36

Abbildung 16 C zeigt die mittels QDA gefundenen quadratischen Entscheidungsgrenzen,

deren Unterschiede zum entsprechenden Fall aus Abbildung 16 B gewöhnlich gering sind.

(Hastie et al., 2009)

Die in dieser Arbeit angewandte Form der Diskriminanzanalyse ist die QDA.

Abbildung 16: Daten aus drei verschiedenen Klassen mit linearen Entscheidungsgrenzen durch LDA (A), quadratische Entscheidungsgrenzen, welche durch Auffinden linearer Grenzen in einem höherdimensionalem Raum erhalten wurden, zurückgeführt auf den ursprünglichen Raum (B), mit-

tels QDA gefundene quadratische Entscheidungsgrenzen (C) (modifiziert nach (Hastie et al., 2009))

2.2.7.2 Nächster-Nachbar-Algorithmus

Der k-Nächster-Nachbar-Algorithmus (kNN) beruht auf dem Abstand einer Beobachtung zu

seinen „k-nächsten“ Nachbarn. Es gibt hierfür verschiedene mathematische Abstands-

maße, wobei das am häufigsten verwendete der euklidische Abstand ist. Im Wesentlichen

ist dieser ein Maß für die Länge einer zwischen zwei Objekten gezogenen geraden Linie.

(Hair et al., 2010)

Vereinfacht wird kNN in Abbildung 17 anhand eines Beispiels erklärt. Zwei unbekannte Da-

tenpunkte werden mit k= 5 und k= 1 als jeweils einer der drei im Trainings-Datenset enthal-

tenen Mikroorganismen klassifiziert. Abbildung 17 macht besonders bei Datenpunkt „Unbe-

kannt 2“ deutlich, dass in Grenzregionen zweier Cluster eines Datenraums bei Wahl eines

kleinen k-Wertes eine Anfälligkeit gegenüber Ausreißern bestehen kann. Zu große k-Werte

führen allerdings zu Ungenauigkeit, insbesondere wenn die Zahl der Beobachtungen pro

Mikroorganismus stark variieren sollte.

Material und Methoden

37

Abbildung 17: Grafische Erklärung von kNN anhand normalisierter Intensitäten zweier ausgewähl-

ter Wellenzahlen aus Raman-Spektren von drei verschiedenen Mikroorganismen

Mit steigendem k-Wert existieren häufig mehr Nachbarn mit großem als mit kleinem Ab-

stand, weshalb die Vorhersage unbekannter Daten durch weit entfernt liegende Nachbarn

dominiert werden kann. Um dort entgegen zu wirken, können weiter entfernte Nachbarn so

gewichtet werden, dass sie geringeren Einfluss auf das Ergebnis haben. (Ertel, 2016)

Die Wahl der idealen Anzahl an nächsten Nachbarn könnte mittels Kreuzvalidierung be-

stimmt werden, indem Modelle mit verschiedenen k-Werten trainiert werden und die Ergeb-

nisse der Kreuzvalidierung verglichen werden. In dieser Arbeit wird die Anzahl der Nach-

barn k= 1 gewählt, womit auch keine Gewichtung erfolgt.

2.2.7.3 Support Vector Maschine

Das erste Ziel einer SVM zur Klassifizierung von Daten ist es eine Hyperebene zu finden,

die für alle enthaltenen Klassen einen möglichst großen datenfreien Bereich hat. Die der

Hyperebene am nächsten liegenden Datenpunkte werden „Support Vectors“ (Stützvekto-

ren) genannt und haben alle den gleichen Abstand zur Trenngeraden. (Ertel, 2016)

Objekte im Datenraum können bei der Problemstellung dieser Arbeit nicht linear voneinan-

der getrennt werden. Um eine nichtlineare Klassentrennung zu erzielen, können über den

sogenannten Kernel-Trick die Daten in einen höherdimensionalen Raum überführt werden,

sodass die Struktur der Daten für eine lineare Trennung geeignet wird. Werden die Daten

zurücktransformiert, wird aus der linearen eine nichtlineare Hyperebene. In vielen Fällen

wird die lineare Entscheidungsgrenze nur in einem sehr hochdimensionalen Merkmalsraum

oder sogar in einem unendlich dimensionalen Merkmalsraum erhalten, was ohne Kernel-

Trick sehr viel rechenintensiver oder unmöglich sein kann (Iba, 2018). (Runkler, 2016)

Abbildung 18 zeigt das allgemeine Prinzip der SVM anhand eines zweidimensionalen Da-

tensatzes mit drei verschiedenen Klassen, die durch variierende Symbole und Farben ge-

kennzeichnet sind. Die Originaldaten sind in Abbildung 18 A dargestellt und Abbildung 18 B

Material und Methoden

38

zeigt die Zuordnung der Daten im höherdimensionalen Raum, nachdem eine Kernel-Funk-

tion angewendet und die optimale Trennung ermittelt wurde. Die Entscheidungsgrenzen in

diesem Raum werden als graues Dreieck dargestellt. Abbildung 18 C zeigt die resultieren-

den Grenzen, die auf den ursprünglichen Datenraum zurückgebildet wurden. Der Abstand

von der Hyperebene zu den „Support Vectors“ (gestrichelte Linien) wird im englischen als

„Margin“ bezeichnet und bildet die maximale Trennspanne zwischen zwei Klassen. (Van

den Burg & Groenen, 2016)

Abbildung 18: Schematische Darstellung des Funktionsprinzips der SVM mit den Ausgangsdaten (A), dem höherdimensionalem Raum (B) und resultierenden Entscheidungsgrenzen bei zurück-transformieren der Daten (C); Schwarze Linien sind trennende Hyperebenen, gestrichelte Linien „Support Vectors“ und Entscheidungsgrenze im höherdimensionalem Raum als graues Dreieck

hervorgehoben (modifiziert nach (Van den Burg & Groenen, 2016))

2.2.8 Validierung der Vorhersagemodelle

2.2.8.1 Kreuzvalidierung

Ein Problem bei der Modellentwicklung, basierend auf multivariaten Daten ist das „Overfit-

ting“. „Overfitting“ bedeutet, dass eine Überanpassung des Modells innerhalb der soge-

nannten Trainingsdaten stattfindet (Runkler, 2016). Die theoretische Vorhersagegüte wird

mit zunehmender Variablenzahl innerhalb des Modells besser, jedoch nicht die praktische

Vorhersagegüte bei Anwenden des Modells auf unbekannte Daten. Werden für ein Modell

zu viele Hauptkomponenten bzw. zu viele Variablen herangezogen, steigt die Wahrschein-

lichkeit des Übertrainierens, da auch zufälliges Rauschen modelliert wird. (Kessler, 2007)

Ein solches „Overfitting“ kann durch eine Kreuzvalidierung vermieden werden. Bei der

Kreuzvalidierung wird jede Beobachtung, die zur Modellentwicklung verwendet wird, zur

Kalibrierung und zur Validierung eingesetzt. Dazu werden die Daten nach zufälliger Mi-

schung in Testdaten und Trainingsdaten aufgeteilt. Mit den Trainingsdaten wird das Modell

errechnet, mit welchem für den Testsatz Vorhersagen getroffen werden, um die Leistung

des Modells zu bewerten. Dieser Vorgang wird so oft wiederholt, bis jede Beobachtung

einmal weggelassen und mit dem Modell der anderen Daten vorhergesagt wurde. Aus dem

Vergleich der vorhergesagten Klasse (Mikroorganismus) mit dem tatsächlichen Wert, kann

Material und Methoden

39

der Validierfehler berechnet werden. (Runkler, 2016)

Um die auszulassenden Proben zu bestimmen, gibt es verschiedene Möglichkeiten. Bei

einer vollständigen Kreuzvalidierung wird jede Beobachtung einmal weggelassen. Bei

2000 Spektren würden demnach 2000 Kalibriermodelle erstellt und jedes Mal würde nur

eine Probe weggelassen werden. Bei großen Datensets werden gewöhnlich mehrere Be-

obachtungen auf einmal weggelassen. Die k-fache-Kreuzvalidierung (engl. k-fold-cross va-

lidation) teilt die Daten in „k“ Teile auf. Bei 2000 Beobachtungen und k= 5 werden die Daten

in Sets mit jeweils 400 Beobachtungen eingeteilt. Es werden 5 separate Trainings durch-

geführt, indem jeweils ein Set ausgelassen und als Testset verwendet wird. Die Vorhersa-

gegüte der jeweiligen Modelle (in Prozent) werden gemittelt, um die endgültige Vorhersa-

gegüte zu bestimmen. (Ertel, 2016; Perner & Petrou, 1999)

In dieser Arbeit wird für jedes Modell eine 5-fache Kreuzvalidierung durchgeführt.

2.2.8.2 Praktische Validierung

Eine Kreuzvalidierung ist nur der erste Schritt, um die Leistung eines Vorhersagemodells

zu überprüfen und „Overfitting“ entgegenzuwirken. Zwar steigt die Wahrscheinlichkeit einer

richtigen Identifizierung einer unbekannten Probe mit zunehmender Probenzahl innerhalb

des Kalibrationssets, jedoch kann die Repräsentativität gegenüber völlig unbekannten Da-

ten nicht gewährleistet werden. Für die externen Validierungen werden deshalb von neuen

Proben jedes der 9 Mikroorganismen 100 weitere Spektren gesammelt, was etwa einem

Drittel der Datenmenge, die für das Kalibrationsset verwendet werden, entspricht. Die Vali-

dierungsspektren bestehen zur Hälfte aus Spektren von Proben einer ersten Kultur und zur

anderen Hälfte aus Spektren einer zweiten Kultur (siehe Kapitel 2.2.1). Es werden für die

praktische Validierung keine Daten herangezogen, die in den entwickelten Modellen ent-

halten sind.

Die Probenpräparation, das Vorbereiten des Messsystems und das Sammeln der Validie-

rungsspektren, werden nach den exakt gleichen Methoden wie in Kapitel 2.2.2 bis 2.2.4

beschrieben, durchgeführt. Da in dieser Arbeit drei verschiedene Klassifizierungsverfahren

unter Verwendung von 8, 10, 12, 15 und 20 PCs gegenübergestellt werden, sind es insge-

samt 15 Modelle, die erstellt werden. Jedes Kalibrationsmodell wird für einen Vergleich der

Modelle untereinander auf alle 900 Validierungsspektren angewandt.

Ergebnisse

40

3 Ergebnisse

3.1 Spektrenaufzeichnung

3.1.1 Störung durch Umgebungslicht

Ein Effekt von Umgebungslicht bei Verwendung sehr geringer Laserleistungen geht aus

Abbildung 19 hervor. Dort wurden Spektren mit 1 % Laserleistung und einem 100X-Objektiv

erfasst, ohne eine Probe zu fokussieren. Abbildung 19 zeigt, dass es zu einer leichten Ab-

sorption bei ca. 1240 cm-1 kommt und bei aktiven Leuchtstoffröhren im Raum zu deutlichen

Peaks bei 710 cm-1, 1660 cm-1 und 1700 cm-1. Wird um den Laserstrahl komplett verdun-

kelt, so zeigen sich weder Absorption noch Peaks. Da diese Effekte bei höheren Laserleis-

tungen und insbesondere bei Vorhandensein einer fokussierten Probe nicht mehr auftreten,

reicht es aus, die Spektren bei dieser Arbeit wie in Kapitel 2.2.4 beschrieben bei geschlos-

senen Jalousien und inaktiver Raumbeleuchtung aufzuzeichnen.

Abbildung 19: Vergleich von Raman-Spektren bei verschiedenen Umgebungslichtbedingungen ohne fokussierte Probe bei einem Prozent Laserleistung und 40 Sekunden Belichtungsdauer

Ergebnisse

41

3.1.2 Störung durch Fluoreszenz

Fluoreszenz, die das eigentliche Signal überdeckt, stellt insbesondere bei Proben der zwei-

ten Kultur ein Problem dar. Die größten Schwierigkeiten verursachen Pseudomonas flu-

orescens und Bacillus subtilis. Auch andere Mikroorganismen weisen mit zunehmender

Kultivierungsdauer stärkere Fluoreszenz auf, jedoch lässt sich diese dort einfacher aus-

brennen, sodass nach drei bis vier Minuten Vorbestrahlung brauchbare Spektren erfasst

werden können. Abbildung 20 zeigt den Verlauf mehrerer aufeinanderfolgender Messungen

einer mehrfach auf TSA überführten und kultivierten Probe E. coli K12. Mit zunehmender

Anregungsdauer sinkt die Störung der Fluoreszenz und die eigentlichen Signale verstärken

sich. Je nach Probenalter, Schichtdicke und evtl. zusätzlichen noch unbekannten Faktoren,

schreitet dieser Prozess schneller oder langsamer voran. Ab einem gewissen Zeitpunkt (bei

Abbildung 20 etwa nach 26 Minuten) gibt es keine wesentliche Verbesserung der Signale

mehr.

Abbildung 20: Einfluss der Vorbestrahlungsdauer auf eine Probe E. coli K12 (Counts normalisiert)

3.1.3 Einfluss der Probenpräparation auf ein Spektrum

Die in Kapitel 1.1.3.4.3 beschriebenen Einflüsse der Probenpräparation auf ein Spektrum

legen nahe, dass eine exakt definierte Schichtdicke zu den besten Resultaten führen sollte.

Das Problem einer solchen standardisierten Schichtdicke liegt darin, dass eine für ein be-

stimmtes Bakterium geeignete Schichtdicke für ein anderes Bakterium oft ungeeignet ist.

Allgemein gilt, dass Probenmaterial, welches starke Fluoreszenzstörungen aufweist, bei

dicken Probenfilmen einen intensiven „Fluoreszenz-Hügel“ mit geringfügigen oder gar kei-

nen Signaturen liefert. Selbst nach langer Vorbestrahlung, können hier unter Umständen

keine verwertbaren Spektren gewonnen werden. Bei dünneren Probenschichten desselben

Materials hingegen, können nach einiger Zeit Vorbestrahlung brauchbare Spektren erfasst

Ergebnisse

42

werden. Mit abnehmender Schichtdicke werden entsprechende charakteristischen Peaks

eines Mikroorganismus schwächer und ab einer bestimmten Höhe sind sie mit der gewähl-

ten Methode nicht mehr sichtbar. Da es sich bei der nachfolgenden Einteilung der Proben-

schichten in „dick“, „dünn“ und „mittel“ um keine exakten Größen handelt, kann Abbildung

21 eine etwaige Einschätzung dieser Begrifflichkeiten ermöglichen.

Abbildung 21: Beispiel zweier Koloniematerialprobenschichten auf Glasobjektträgern zur Einschät-

zung der Schichtdicken (a= dünn; b= mittel; c= dick; d= ungeeigneter, noch flüssiger Bereich)

Aus Abbildung 22 sind die Spektren einer Sty TA98-Probe (2. Kultur) bei variierender

Schichtdicke zu entnehmen. Die Spektren wurden nach zwei Minuten Vorbestrahlung er-

zeugt. Abbildung 22 A zeigt im direkten Vergleich der Spektren die steigende Intensität mit

zunehmender Schichtdicke. Die normalisierten Spektren aus Abbildung 22 B verdeutlichen

die starken Fluoreszenzstörung bei dicker Probenschicht und die geringer ausgeprägten

Peaks bei einem dünneren Probenbereich. Die mittlere Probenschicht liefert die deutlichs-

ten Peaks.

Abbildung 22: Einfluss der Probenschichtdicke auf das Raman-Spektrum einer Sty TA98-Probe bei

zwei Minuten Vorbestrahlung; (A) unbehandelte Daten, (B) normalisierte Spektren (Eine Einschät-zung der Begriffe mittlere, dünne und dicke Schicht kann anhand Abbildung 21 erfolgen)

Ergebnisse

43

3.1.4 Einfluss der Kultivierungsart auf ein Spektrum

Kommen Mikroorganismen aus einer gefrorenen Reinkultur und werden einen Tag lang auf

TSA bebrütet (Kultur 1), so zeigen sie bei der Analyse nur geringe Störung durch Fluores-

zenz. Sind die Bakterien hingegen bereits auf dem Nährmedium gewachsen und werden

erneut auf TSA überführt und einen weiteren Tag bebrütet (Kultur 2), werden die Störungen

durch Fluoreszenz deutlich stärker. Bei der Analyse von Proben der zweiten Kultur muss

somit durchschnittlich länger vorbestrahlt werden, um Spektren mit deutlichen Signaturen

zu erhalten. Da die Mikroorganismen in der Praxis nicht aus einer tiefgekühlten Reinkultur

kommen werden und je nach durchführender Person kleinere Unterschiede in der Proben-

präparation entstehen, kann es sein, dass der Anwender Probleme hat, überhaupt ein ge-

eignetes Spektrum zu erhalten. Oft sind die „Counts“ bei stark fluoreszierenden Proben

auch so hoch, dass das Raman-Spektrum mit den ausgewählten Messeinstellungen aus

Kapitel 2.2.4 nicht einmal angezeigt werden kann. Hier empfiehlt sich in der Software

Wire 4.3 ein zweites Messfenster zu öffnen, bei welchem die Belichtungsdauer von 3 auf

0,25 Sekunden verringert wird und eine hohe Anzahl an Einzelspektren eingestellt wird

(z.B. 500). Die Akkumulationen sollen in diesem Fall nicht den eigentlich gewünschten Ef-

fekt der Rauschverminderung haben, zumal ab einer bestimmten Anzahl an Einzelspektren

keine sichtliche Besserung mehr erfolgt (Bei der vorliegenden Methode etwa nach 30 Ein-

zelspektren), sondern dazu dienen, die Messung aufrecht zu erhalten und die Entwicklung

des Raman-Spektrums zu beobachten. Die 500 Akkumulationen müssen somit nicht kom-

plett abgeschlossen werden, sondern können beispielsweise nach 60 Sekunden gestoppt

und direkt danach neu initiiert werden. Dieser Vorgang kann mehrfach wiederholt werden,

um mögliche Verbesserungen zu registrieren. Durch diese Vorgehensweise können sehr

viel schneller geeignete Probenbereiche lokalisiert werden und die Fluoreszenz effektiver

ausgebrannt werden. Sobald typische Signaturen und eine Fluoreszenzverminderung er-

sichtlich sind, kann auf die eigentliche Methode zurückgewechselt werden. Die genaue Vor-

gehensweise, um bei problematischen Proben geeignete Spektren zu erhalten, werden im

Leitfaden zur Identifizierung von Mikroorganismen über Raman-Spektroskopie (Anhang 7)

beschrieben.

Ergebnisse

44

Da für Kultur 2 durchschnittlich länger vorbestrahlt wurde, konnten dort pro Versuchstag

etwas weniger Spektren aufgezeichnet werden als von Kultur 1. Insgesamt wurden für die

Kalibrationsentwicklung 2953 Raman-Spektren erfasst, von denen 1602 aus Kultur 1 und

1351 aus Kultur 2 stammen (siehe Tabelle 4).

Tabelle 4: Anzahl der zur Kalibrationsentwicklung erfassten Raman-Spektren pro Kulturtyp

(Summe= 2953)

Mikroorganismus Kultur 1 Kultur 2

Bdi 7234 206 161

Bsu 10 163 126

K12 423 170 140

MLB 28269 191 178

Mlu 1790 208 198

Mlu 20030 151 178

Pfl 50090 130 100

Sce 1334 169 125

Sty TA98 214 145

Abbildung 23 zeigt ausgebleicht im Hintergrund alle aufgenommenen Spektren von Kultur 1

in Blau und Kultur 2 in Rot. Die Spektren sind normalisiert, ansonsten unbehandelt und die

Mittelwertspektren sind fett hervorgehoben. Mit Ausnahme von MLB 28269 sind überall die

bei Kultur 2 stärker ausgeprägten Fluoreszenzhintergründe zwischen ca. 600 bis 900 cm-1

zu erkennen.

Die Auswirkungen der beiden Kultivierungsarten sind auf Sty TA98 eher gering; dort sind

die Mittelwertspektren nahezu identisch und Fluoreszenz der Kultur 2 konnte schneller aus-

gebrannt werden als bei den anderen Proben. Effekte auf die Basislinie vieler Spektren sind

nicht nur auf die Eigenfluoreszenz der Mikroorganismen, sondern auf kleinere Variationen

in der Probenschichthöhe zurückzuführen. Die größte Streuung liegt bei Bsu 10 vor. Insbe-

sondere bei Kultur 2 sind bei Bsu 10 nur durch längeres Vorbestrahlen aussagekräftige

Spektren zu erzeugen. Die Spektren von Pfl 50090 leiden sowohl bei Kultur 2, als auch bei

Kultur 1 am stärksten unter der Fluoreszenz. Die Spektren zeigen dort nur schwach ausge-

prägte Signaturen, die sich teilweise nur gering vom Grundrauschen abheben.

Ergebnisse

45

Abbildung 23: Vergleich der Raman-Spektren aller Mikroorganismen von Kultur 1 (blau) und Kul-tur 2 (rot) mit fett hervorgehobenen Mittelwertspektren

3.1.5 Einfluss der Vorbestrahlung auf ein Spektrum

Zwar führt eine längere Bestrahlung im Normalfall zu einer Intensivierung verschiedener

Peaks (siehe Abbildung 20), allerdings kann es insbesondere bei sehr dünnen Proben-

schichten zu einem Rückgang bestimmter Peaks kommen. Abbildung 24 A zeigt mehrere

Spektren, die von ein und derselben Stelle einer dünnen M. luteus-Probenschicht gesam-

melt wurden. Es ist ersichtlich, dass die charakteristischen Peaks bei 1156 cm-1 und

1528 cm-1 mit zunehmender Bestrahlung stark an Intensität verlieren. Dies hat auch zur

Folge, dass bei Vorbehandlung der Daten bestimmte Bereiche stark gestaucht werden, was

zu Fehlinterpretationen führen könnte (siehe Abbildung 24 B).

Ergebnisse

46

Abbildung 24: (A) Darstellung mehrerer hintereinander aufgezeichneter Spektren von ein und dem-

selben Bereich einer dünnen Probenschicht Micrococcus luteus (DSM-Nr. 20030) mit t als Anre-gungsdauer in Minuten; (B) Gleiche Spektren nach Basislinienkorrektur, Glättung und Normalisie-

rung

Der Rückgang dieser Peaks ist Substanzen zuzuschreiben, die durch den Laser verändert

oder degradiert werden. Bei M. luteus handelt es sich überwiegend um Sarcinaxanthin, ein

natürliches gelbes Farbpigment aus der Gruppe der Xanthophylle, die wie die Carotine zu

den Carotinoiden gehören (Jackson et al., 2008).

Neben M. luteus, zeigen auch drei der analysierten gramnegativen Bakterien einen mög-

licherweise schadhaften Einfluss bei längerer Bestrahlung. Abbildung 25 zeigt mehrere

Spektren von B. diminuta, E. coli K12 und S. Typhimurium TA98 im Wellenzahlbereich von

600 bis 900 cm-1. Es ist anhand der hervorgehobenen Spektren deutlich erkennbar, dass

bei Probenstellen die längerer Laserbestrahlung ausgesetzt waren, der Peak bei 742 cm-1

nahezu verschwindet, wohingegen die Sichtbarkeit eines Peaks bei 780 cm-1 stark zu-

nimmt. Die Intensität dieses Peaks bei 780 cm-1 nimmt dabei nicht zu. Bei genauer Betrach-

tung der rot hervorgehobenen Spektren fällt auf, dass sich der abnehmende Peak bei

742 cm-1 in zwei schwache Peaks aufteilt. Auch beim grampositiven Bsu 10 liegt dieser

Effekt vor, jedoch ist er dort aufgrund größerer Fluoreszenzstörungen schlechter beobacht-

bar (siehe Abbildung 27).

Ergebnisse

47

Abbildung 25: Auswirkung längerer Bestrahlung auf Peaks im Wellenzahlbereich von 600 bis 900 cm-1 bei drei verschiedenen gramnegativen Bakterien; Blau hervorgehoben ein Spektrum mit kurzer Bestrahlungsdauer und Rot ein Spektrum mit langer Bestrahlungsdauer (Die Spektren wur-

den basislinienkorrigiert, geglättet und normalisiert)

3.2 Modellentwicklung

3.2.1 Datenvorbehandlung

Abbildung 26 A enthält alle zur Modellentwicklung gesammelten unbehandelten Raman-

Spektren. Zur besseren Darstellung wurden die Spektren normalisiert. Die hauptsächlich

der Fluoreszenz zuzuschreibenden „Offsets“ variieren, wobei die Auswirkungen häufiger

auf dem niedrigeren Wellenzahlbereich zu beobachten sind. Nach Datenvorbehandlung

durch Basislinienkorrektur, Glättung und Normalisierung (Abbildung 26 B), werden die spe-

zifischen Banden deutlich sichtbar. Auch die beiden Banden, die bei den unbehandelten

Spektren kaum ersichtlich sind (bei etwa 740 cm-1 und 780 cm-1), sind nach Datenvorbe-

handlung bei allen gramnegativen Bakterien klar zu erkennen. Mit Ausnahme der drei

Micrococcus luteus-Stämme haben die Banden bei 1003 cm-1 (charakteristisch für Phe-

nylalanin) und 1450 cm-1 (charakteristisch für Lipide) am häufigsten die Maximalintensität.

Die für Carotinoide typischen Banden bei 1156 cm-1 und 1528 cm-1 sind das auffälligste

Merkmal aller Micrococcus luteus-Stämme.

Ergebnisse

48

Spektrenposition Mikroorganismus

1 - 367 Bdi 7234 368 - 656 Bsu 10 657 - 966 K12 423 967 - 1335 MLB 28269 1336 - 1741 Mlu 1790 1742 - 2070 Mlu 20030 2071 - 2300 Pfl 50090 2301 - 2594 Sce 1334 2595 - 2953 Sty TA98

Abbildung 26: Spektren vor (A) und nach Basislinienkorrektur, Glättung und Normalisierung (B) (Zur besseren Darstellung wurden in dieser Abbildung auch die unvorbehandelten Spektren normalisiert)

Abbildung 27 zeigt gräulich alle vorbehandelten Kalibrations-Spektren und visualisiert somit

die Variation innerhalb der Messungen einzelner Mikroorganismen. Farblich und dick her-

vorgehoben sind die Mittelwertspektren übersichtlich dargestellt. Mikroorganismen, die bei

der Analyse stärkere Fluoreszenzstörungen aufweisen, weisen die größte Streuung inner-

halb der Messungen auf (siehe Bsu 10 und Pfl 50090 in Abbildung 27). Mit Ausnahme von

Mlu 20030 ist die Streuung der beiden anderen M. luteus-Stämme sehr gering. Die große

Variation bei etwa 1450 cm-1 aller M. luteus-Stämme aus Abbildung 27, erklärt sich durch

den in Kapitel 3.1.5 beschriebenen Effekt der Datenvorbehandlung bei Proben mit verrin-

gerter Sarcinaxanthin-Signalintensität (siehe auch Abbildung 24). Trotz des Rückgangs die-

ser Signale durch längere Bestrahlung oder einem dünnen Probenfilm, sind dies immer

noch die Peaks mit der stärksten Intensität. Eine Normalisierung, bei der das Maximum 1

und das Minimum 0 gesetzt wird, resultiert daher in einer Stauchung aller anderen Peaks,

besonders aber im Bereich zwischen 1300 bis 1500 cm-1. Der grampositive Bsu 10 zeigt

einen auffällig spezifischen Peak bei ca. 780 cm-1, bei welchem nahezu keine Variation vor-

liegt. Dieser Peak liegt auch bei den gramnegativen Bakterien vor, jedoch schwächer aus-

geprägt. Ungewöhnlich ist der aus Abbildung 27 ersichtliche unspezifische Anstieg einiger

Mlu 20030 Spektren ab 1700 cm-1.

Alle Spektren haben gemeinsam, dass sie kurz vor dem intensiven Peak bei ca. 1003 cm-1

eine Absorption aufweisen, was in einem negativen Peak resultiert. Dieser negative Peak

liegt bei allen Proben bei ca. 988 cm-1 und ist umso intensiver, je höher die Störung durch

Fluoreszenz einer Probe ist. So führt das negative Signal bei Pfl 50090 beispielsweise

Ergebnisse

49

dazu, dass sich nach der Datenvorbehandlung die eigentlichen Signale der meisten Spek-

tren in etwa bei der halben Maximalintensität bewegen. Dieser Effekt ist besonders deutlich

in Abbildung 26 B zu sehen, in welcher die Spektren 2071 bis 2300 stark vom Aussehen

der anderen Spektren abweichen. Ein zweiter „Negativpeak“ befindet sich, mit Ausnahme

der M. luteus-Stämme, bei allen Mikroorganismen bei ca. 1200 cm-1 (siehe Abbildung 27

und Abbildung 23).

Abbildung 27: Alle zur Kalibrationsentwicklung verwendete Spektren der 9 untersuchten Mikroorga-nismen nach Basislinienkorrektur, Glättung und Normalisierung in Grau und farblich hervorgeho-

bene Mittelwertspektren (n= Anzahl der Spektren)

Ergebnisse

50

3.2.2 Hauptkomponentenanalyse

Eine PCA wurde sowohl mit den unbehandelten, als auch mit den behandelten Daten

durchgeführt. Die PCA nach Vorbehandlung der Daten kann mit den ersten drei Hauptkom-

ponenten 93,1 % der Varianz erklären. Die erklärte Varianz der ersten 10 PCs geht aus

Abbildung 28 hervor. Um 95 % der Varianz zu erklären, müssen die ersten fünf PCs heran-

gezogen werden.

Abbildung 28: Abnehmende erklärende Varianz der PCs nach PCA mit vorbehandelten Daten

Abbildung 29 stellt aus zwei Betrachtungswinkeln die ersten drei PCs nach der Hauptkom-

ponentenanalyse dar. Die unvorbehandelten Daten zeigen bei Darstellung der ersten drei

PCs keine deutlichen Muster. Datenpunkte der nicht behandelten Spektren, die nahezu auf

einer exakten Geraden hintereinander aufgereiht sind, erklären sich durch die bis zu zehn-

fache Mehrfachmessung von ein und derselben Stelle einer Probe was häufig zu Spektren

führt, die sich in ihren Signaturen kaum unterscheiden, jedoch stark in der Intensität. Be-

sonders deutlich sind solche Muster bei den unbehandelten Pfl 50090 Daten zu erkennen.

Aus der Darstellung der PCA mit den vorbehandelten Daten aus Abbildung 29, geht die

deutliche Aufteilung in drei Hauptcluster hervor. Die sich grundlegend in ihrem Aufbau von

Bakterien unterscheidenden Hefen (Sce 1334), weisen die größte Distanz zum Zentrum der

Daten auf. Die drei M. luteus-Stämme, welche sich durch die Besonderheit des enthaltenen

Carotinoids auszeichnen, liegen dicht zusammen und sind ebenfalls weit vom Zentrum ent-

fernt. Die Daten von Bdi 7234, Bsu 10, K12 423, Pfl 50090 und Sty TA98 überschneiden

sich zwar alle, sind jedoch größtenteils separat angehäuft und ohne größere Ausreißer.

Auffällig ist die Aufteilung der Pfl 50090-Daten in zwei Untergruppen, von denen sich eine

nahezu im Zentrum der Daten befindet (Kultur 2) und die andere weiter außerhalb (Kul-

tur 1). Eine Aufteilung der Pfl 50090-Spektren in zwei Bereiche, ist auch bei den unbehan-

delten Daten in Abbildung 29 zu erkennen.

71,32

19,32

2,45 1,55 0,74 0,55 0,51 0,45 0,25 0,210

20

40

60

80

1 2 3 4 5 6 7 8 9 10

Erk

lärt

e V

ari

an

z [%

]

PC

Ergebnisse

51

Abbildung 29: Darstellung der ersten drei PCs der Hauptkomponentenanalyse von allen Kalibrati-ons-Spektren mit und ohne Vorbehandlung aus jeweils zwei verschiedenen Betrachtungswinkeln

Ergebnisse

52

3.2.3 Klassifikationsverfahren und Kreuzvalidierung

Jedes Modell aller Klassifizierungsverfahren wurde mit dimensionsreduzierten Daten er-

stellt. Es wurden Modelle nach 8, 10, 12, 15 und 20 PCs generiert. Nachfolgend werden die

Wahrheits- bzw. Vorhersagematrices der Modelle nach 5-facher Kreuzvalidierung bei Ver-

wendung von 8 und 15 PCs dargestellt. Die restlichen Vorhersagematrices befinden sich in

Anhang 1 (QDA) Anhang 2 (kNN) und Anhang 3 (SVM). Eine Wahrheitsmatrix zeigt die

wahren Werte, also die zu klassifizierenden Mikroorganismen und die kreuzvalidierten Vor-

hersagewerte des Modells. Daraus kann eine erste Einschätzung der Vorhersagegüte der

Modelle erfolgen und es kann nach Mustern bei falsch positiven Vorhersagen gesucht wer-

den.

3.2.3.1 Quadratische Diskriminanzanalyse

Abbildung 30 zeigt die Vorhersagematrices zweier QDA-Modelle unter Verwendung von 8

und 15 PCs. Die Vorhersagegüte bewegt sich zwischen 95 und 98 %. Bei beiden Modellen

liegen die meisten falschen Vorhersagen bei den drei M. luteus-Stämmen vor, wobei

MLB 28269 am schlechtesten und Mlu 20030 am genauesten vorhergesagt wird. Beim Mo-

dell mit 15 PCs liegen kaum noch fehlerhafte Vorhersagen außerhalb der Stammebene vor,

wohingegen beim Modell mit 8 PCs falsche Vorhersagen stärker verteilt sind. Pfl 50090

wird dort 210 Mal richtig vorhergesagt und 20 Mal als Sty TA98, was einer Genauigkeit von

91,3 % entspricht. Bei Sty TA98 gibt es bei 8 PCs falsche Vorhersagen für Pfl 50090,

K12 423 und Bdi 7234. Bei all diesen falschen Vorhersagen handelt es sich, wie auch bei

Sty TA98 selbst, um gramnegative Bakterien.

8 PCs (94,9 %) 15 PCs (98,3 %)

Wa

hr

Vorhersagen Vorhersagen

Abbildung 30: Vorhersagematrices bei Verwendung der quadratischen Diskriminanzanalyse von

Modellen mit 8 und 15 PCs mit der durchschnittlichen Vorhersagegüte in Prozent

Ergebnisse

53

3.2.3.2 Nächster-Nachbar-Algorithmus

Sowohl die richtigen als auch fehlerhaften Vorhersagen aus den kNN-Modellen von Abbil-

dung 31 zeigen ähnliche Muster wie QDA-Modelle aus Abbildung 30. Wobei die Vorhersa-

gen außerhalb der Stammebene bei dem kNN-Modell mit 15 PCs etwas genauer sind als

die Vorhersagen des QDA-Modells. Nur eine einzige Vorhersage liegt bei kNN mit 15 PCs

außerhalb der Stammebene, womit dieses Modell die genauesten Vorhersagen auf Art-

Ebene erzielt. Auffallend ist, dass Mlu 20030 besonders bei nur 8 PCs deutlich ungenauer

vorhergesagt wird (mehr als 10 % falsche Vorhersagen) als bei den QDA-Modellen.

8 PCs (94,4 %) 15 PCs (98,4 %)

Wa

hr

Vorhersagen Vorhersagen

Abbildung 31: Vorhersagematrices bei Verwendung des Nächste-Nachbar-Algorithmus von Model-

len mit 8 und 15 PCs mit der durchschnittlichen Vorhersagegüte in Prozent

Ergebnisse

54

3.2.3.3 Support Vector Maschine

Prozentual gesehen liefert die SVM bei Verwendung von 8 PCs etwa 2 % genauere Vor-

hersagen als entsprechende kNN- und QDA-Modelle. Auch das SVM Modell mit 15 PCs

zeigt eine um 1 % genauere Vorhersage als die Modelle mit 15 PCs aus Abbildung 30 und

Abbildung 31. Besonders auf Stammebene scheint nach Abbildung 32 die SVM deutlich

besser abzuschneiden als die vergleichbaren Modelle der beiden anderen Klassifizierungs-

verfahren. Bei der SVM (15 PCs) wird jedoch zum ersten Mal eines der 329 Spektren eines

M. luteus-Stamm fälschlicherweise als Bsu 10 vorhergesagt. Zwar ist dies prozentual ge-

sehen immer noch sehr viel genauer als die anderen Modelle, jedoch handelt es sich bei

Bsu 10 um ein Bakterium, welches sich stark von Mlu 20030 unterscheidet, was die falsche

Vorhersage schwerer nachvollziehbar macht, als falsche Vorhersagen innerhalb der

Stammebene von M. luteus.

8 PCs (96,5 %) 15 PCs (99,4 %)

Wa

hr

Vorhersagen Vorhersagen

Abbildung 32: Vorhersagematrices bei Verwendung der Support Vector Maschine von Modellen mit 8 und 15 PCs mit der durchschnittlichen Vorhersagegüte in Prozent

Ergebnisse

55

3.3 Praktische Validierung

Die aus Kapitel 3.2.3 hervorgehenden Wahrheitsmatrices liefern eine erste Einschätzung

über die Genauigkeit der Vorhersagemodelle. Allerdings kann es trotz Kreuzvalidierung zu

„Overfitting“ kommen. Aus diesem Grund ist es unerlässlich die Modelle auf völlig unbe-

kannte Daten anzuwenden, also auf Spektren, welche nicht im Kalibrationsset enthalten

sind und aus anderen Proben der gleichen Mikroorganismen stammen.

Für die Validierung der entwickelten Kalibrationsmodelle wurden insgesamt 900 weitere

Spektren gesammelt. Die Validierungssets aller Mikroorganismen bestehen jeweils aus 100

Spektren, von denen 50 aus einer ersten Kultur und 50 aus einer zweiten Kultur stammen.

Aufgrund schlechten Wachstums der Pfl 50090-Kultur 1, wurden dort keine Spektren auf-

genommen, dafür 100 Validierungsspektren von einer Kultur 2.

Eine PCA, berechnet aus den Kalibrations- und Validierungsspektren, dargestellt in Abbil-

dung 33, zeigt sowohl die Kalibrierungsspektren (Punkte) als auch die Validierungsspektren

(Quadrate). Insgesamt decken die Kalibrationsspektren den größten Teil der Validierungs-

spektren ab. Eine Zuordnung der Validierungsspektren von M. luteus (auf Art-Ebene) und

S. cerevisiae, könnte bei Darstellung der ersten drei PCs mit dem bloßen Auge erfolgen.

Dennoch sind Unterschiede erkennbar. Einige Validierungsspektren von Sce 1334 sind

stärker in die PC3-Dimension gestreut und werden nicht vom Kalibrationsset abgedeckt.

Auch bei M. luteus bilden einige Validierungsspektren die äußersten Grenzen des entspre-

chenden Clusters. Jedoch beschrieb dort derselbe Stamm (Mlu 20030) zuvor bereits die

äußerste Grenze des Clusters in die gleiche Richtung, womit die Daten noch am ehesten

diesem Stamm zuzuordnen sind.

Abbildung 33: Darstellung der ersten drei Hauptkomponenten einer PCA der Kalibrierungsspektren

(markiert als Punkte n= 2953) und Validierungsspektren (markiert als Quadrate n= 900) aus zwei Ansichten (A und B)

Ergebnisse

56

Da keine Validierungsspektren aus einer ersten Kultur von Pfl 50090 aufgenommen wur-

den, liegen dort alle 100 erfassten Validierungsspektren im zentralen Cluster und kein ein-

ziges außerhalb (deutlich auf Abbildung 33 B).

Abbildung 34 gibt einen Überblick der durchschnittlichen Vorhersagegüte aller Modelle bei

der Validierung, berücksichtigt allerdings nicht die spezifische Genauigkeit bei einzelnen

Mikroorganismen. Um die Unterschiede besser zu visualisieren ist der Minimalwert der Y-

Achse auf 50 % angepasst. Die roten Fehlerindikatoren geben die Standardabweichung

wieder, also die Streuung der Vorhersagegüte zwischen den neun verschiedenen Mikroor-

ganismen innerhalb eines Modells.

Durchschnittlich schneiden Modelle mit 15 PCs am besten ab. Die QDA ist das einzige

Klassifizierungsverfahren, welches sich bei 20 PCs nochmals deutlich verbessert. Beim

kNN-Modell mit 20 PCs sinkt die Genauigkeit gegenüber dem kNN-Modell mit 15 PCs um

3 % und bei der SVM gibt es bei 20 PCs keine wesentliche Verbesserung mehr gegenüber

dem vorherigen Modell. Alle Modelle (bezogen auf 15 PCs) zeigen in der Praxis erwar-

tungsgemäß schlechtere Vorhersagen als die Vorhersagen bei der Kreuzvalidierung.

Abbildung 34: Durchschnittliche Vorhersagegüte bei Anwendung aller entwickelten Modelle auf die Validierungsspektren aller 9 Mikroorganismen mit Standardabweichung

Die Unterschiede zwischen der Vorhersagegüte der praktischen Validierung zur Kreuzvali-

dierung sind jedoch nur geringfügig und wirken sich hauptsächlich auf QDA und SVM aus.

Dort schneidet die Kreuzvalidierung um etwa 2 % genauer ab, als das Modell in der Praxis.

Bei kNN liegt dieser Unterschied bei nur ca. einem Prozent.

Die Standardabweichung bei Modellen die 8 und 10 PCs verwenden, bewegt sich zwischen

25,5 und 17,7. Bei der SVM ist die Standardabweichung auch nach 12 PCs mit 19,2 noch

sehr hoch. Ab 15 PCs streuen die Vorhersagen mit Standardabweichungen von 4,8 bis 8,1

vergleichsweise wenig.

9084

8989

8786

9391 88

96 97 979894 97

50

60

70

80

90

100

QDA kNN SVM

Ric

htig

e V

orh

ers

ag

en

[%

]

Klassifizierungsverfahren

8 PCs

10 PCs

12 PCs

15 PCs

20 PCs

Ergebnisse

57

Um nachzuvollziehen, welche falschen Vorhersagen hauptsächlich für größere Stan-

dardabweichungen verantwortlich sind und um Modelle nach der Vorhersagegüte spezifi-

scher Mikroorganismen einschätzen zu können, ist es wichtig, die Anzahl korrekt hervorge-

sagter Spektren jedes Modells einzeln zu betrachten.

Abbildung 35 zeigt für alle drei angewandten Klassifizierungsverfahren „Heatmaps“, welche

die Anzahl der richtig vorhergesagten Spektren bei entsprechender Anzahl PCs darstellen.

Ungenaue Vorhersagen mit weniger als 50 % Trefferquote, werden als rötlich dargestellt.

Vorhersagen mit über 90 % Richtigkeit werden als grünlich dargestellt. Werte dazwischen

bewegen sich im orangefarbenen bis gelben Bereich.

QDA kNN SVM

PCs PCs PCs

Abbildung 35: Absolute Anzahl der richtig vorhergesagten Spektren bei der Validierung dreier Klas-sifizierungsverfahren bei variierender Anzahl PCs

Besonders deutlich gehen aus Abbildung 35 die ungenauen Vorhersagen für K12 423 her-

vor. Die 100 Spektren dieses Bakteriums werden bei allen drei Klassifizierungsverfahren

bei Verwendung von bis zu 12 PCs mit etwa weniger als der Hälfte richtig vorhergesagt. Mit

steigender Anzahl an PCs werden die Vorhersagen jedoch genauer, sodass mit dem kNN-

Modell mit 15 PCs alle 100 Spektren von K12 423 richtig vorhergesagt werden. Aus den

Wahrheitsmatrices der Kreuzvalidierung in Kapitel 3.2.3 und den aus den Anhängen 1 bis

3 geht hervor, dass die Genauigkeit der Modelle mit zunehmender Anzahl an Dimensionen

steigt. Die Validierung zeigt allerdings, dass sich die Modelle von kNN und SVM ab 20 PCs

wieder verschlechtern. Auf die ideale Anzahl an PCs, die für ein Modell herangezogen wer-

den sollten, kann daraus jedoch noch nicht klar geschlossen werden, da es vom Mikroor-

ganismus abhängig ist. So liefert beispielsweise die SVM bei 20 PCs die genauesten Vor-

hersagen für die drei M. luteus-Stämme, jedoch werden die Vorhersagen für Pfl 50090 um

13 % ungenauer als beim SVM-Modell mit nur 10 PCs. Auch bei den kNN-Modellen werden

23 % der Pfl 50090-Spektren erst ab 20 PCs falsch vorhergesagt. Bei den Modellen mit

weniger als 20 PCs liegen dort die Fehlerquoten zwischen null und einem Prozent.

Ergebnisse

58

Für eine solide Einschätzung über die Leistung der Modelle ist es nicht nur erforderlich zu

wissen, welche Mikroorganismen wie häufig richtig bzw. falsch vorhergesagt werden, son-

dern auch die falsch positiven Vorhersagen zu kennen. So zeigt sich beispielsweise, dass

nahezu alle falsch vorhergesagten K12 423 Spektren als Sty TA98 vorhergesagt wurden;

einem Bakterium, das mit K12 423 eng verwandt ist.

Die nachfolgenden Tabellen 5 bis 7 zeigen die Validierungsvorhersagen des jeweils genau-

esten Modells jedes Klassifizierungsverfahrens im Detail. Bei der SVM ist das Modell mit

20 PCs um 0,11 % genauer als das Modell mit 15 PCs, dennoch könnte das 20 PC-Modell

aufgrund des starken Verlusts der Genauigkeit bei Pfl 50090, als das schlechtere Modell

eingestuft werden. Aus diesem Grund werden die Vorhersagen beider SVM-Modelle dar-

gestellt. Die spezifischen Vorhersagen der restlichen Modelle befinden sich in den Anhän-

gen 4 bis 6.

Die aus Tabelle 5 hervorgehenden Vorhersagen zeigen, dass die fünf falschen Identifizie-

rungen für K12 423 Treffer für Sty TA98 sind. Die falschen Vorhersagen bei M. luteus liegen

innerhalb der Stammebene, wobei alle Mlu 20030 Spektren richtig vorhergesagt wurden.

Tabelle 5: Validierungsvorhersagen des QDA-Modells mit 20 PCs (Vorhersagegüte 98,1 %)

QDA 20 PCs Vorhersagen

Bdi 7234

Bsu 10 K12 423

MLB 28269

Mlu 1790

Mlu 20030

Pfl 50090

Sce 1334

Sty TA98

Wahr

Bdi 7234 100 Bsu 10 100

K12 423 95 5 MLB 28269 97 3 Mlu 1790 7 91 Mlu 20030 100 Pfl 50090 100 Sce 1334 100 Sty TA98 100

Das genauste kNN-Modell liefert mit 95 bis 100 % sehr gute Vorhersagen bei allen Mikro-

organismen mit Ausnahme der M. luteus-Stämme MLB 28269 und Mlu 1790 (siehe Tabelle

6). Dort liegt die Vorhersagegüte bei 92 bzw. 87 %. Beim kNN-Modell werden im Gegensatz

zum QDA-Modell alle K12 423 richtig vorhergesagt, jedoch werden genau komplementär

dazu fünf Sty TA98 Spektren als K12 423 interpretiert. Mit einer durchschnittlichen Vorher-

sagegüte von 97,1 % ist das kNN-Modell, mit geringem Abstand das in der Praxis leistungs-

fähigste Modell, aller auf 15 PCs basierenden Modelle.

Ergebnisse

59

Tabelle 6:Validierungsvorhersagen des kNN-Modells mit 15 PCs (Vorhersagegüte 97,1 %)

kNN 15 PCs Vorhersagen

Bdi 7234

Bsu 10 K12 423

MLB 28269

Mlu 1790

Mlu 20030

Pfl 50090

Sce 1334

Sty TA98

Wa

hr

Bdi 7234 100 Bsu 10 100

K12 423 100 MLB 28269 92 7 1 Mlu 1790 13 87 Mlu 20030 100 Pfl 50090 100 Sce 1334 100 Sty TA98 5 95

Aus Tabelle 7 geht hervor, dass die SVM bei Verwendung von 15 PCs die genausten Vor-

hersagen auf Stammebene der M. luteus Proben liefert. Jedoch ist das genannte SVM-

Modell schlecht geeignet, um Vorhersagen für K12 423 zu treffen, da dort 20 % der Spek-

tren fälschlicherweise als Sty TA98 identifiziert wurden.

Das SVM-Modell basierend auf 20 PCs schneidet bei der Validierung geringfügig besser

ab als das 15 PC-Modell. Die Verbesserung auf Stammebene ist vernachlässigbar klein,

jedoch sinkt die Fehlerrate bei K12 423 von 20 % auf 9 %. Bei den falschen Vorhersagen

handelt es sich hierbei wieder um den eng verwandten Sty TA98. Auffällig ist, dass bei der

SVM mit 20 PCs Pfl 50090 acht Mal als StyTA98 und fünf Mal als Sce 1334 vorhergesagt

wird. Diese falschen Vorhersagen sind aufgrund der größeren spektralen Unterschiede die-

ser Mikroorganismen schwer nachvollziehbar. Aufgrund der Komplexität einer trennenden

Hyperebene der SVM in einem 20-dimensionalen Raum, sind fehlerhafte Vorhersagen oh-

nehin schwerer zu interpretieren als beispielsweise bei kNN.

Ergebnisse

60

Tabelle 7: Validierungsvorhersagen des SVM-Modells mit 15 PCs (Vorhersagegüte 96,9 %) und 20 PCs (Vorhersagegüte 97,0 %)

SVM 15 PCs Vorhersagen

Bdi 7234

Bsu 10 K12 423

MLB 28269

Mlu 1790

Mlu 20030

Pfl 50090

Sce 1334

Sty TA98

Wa

hr

Bdi 7234 99 1 Bsu 10 100

K12 423 80 20 MLB 28269 96 2 2 Mlu 1790 2 97 1 Mlu 20030 100 Pfl 50090 100 Sce 1334 100 Sty TA98 100

SVM 20 PCs Vorhersagen

Bdi 7234

Bsu 10 K12 423

MLB 28269

Mlu 1790

Mlu 20030

Pfl 50090

Sce 1334

Sty TA98

Wa

hr

Bdi 7234 100 Bsu 10 100

K12 423 91 9 MLB 28269 96 3 1 Mlu 1790 1 99 Mlu 20030 100 Pfl 50090 87 5 8 Sce 1334 100 Sty TA98 100

Diskussion

61

4 Diskussion

4.1 Spektrenaufzeichnung

Zwar können bei gleichbleibender Laserleistung (100 %) und längeren Belichtungszeiten

bei einigen Mikroorganismen Spektren besserer Qualität gewonnen werden (z.B. bei

Bdi 7234 und Sty TA98), jedoch weisen Spektren bei Belichtungszeiten über 3 Sekunden

bei vielen Mikroorganismen zu hohe „Counts“ auf und können nicht mehr detektiert werden

(z.B. Bsu 10, Pfl 50090, K12 423). Die in der Methodik aufgelisteten Messeinstellungen

(Kapitel 2.2.4), insbesondere die Belichtungszeit von 3 Sekunden und die Akkumulation

von 15 Einzelspektren, erweisen sich als guter Kompromiss zwischen Messdauer, Qualität

des Spektrums und Wirksamkeit auf die hier verwendeten Mikroorganismen.

Störende Fluoreszenz konnte bei allen Proben, mit Ausnahme von Pfl 50090, effektiv aus-

gebrannt werden. Bei problematischen Proben wie Pfl 50090 können zusätzliche Wasch-

schritte des Probenmaterials mit NaCl-Lösung zu besseren Resultaten führen (Willemse-

Erix et al., 2010). Allerdings müsste dies im Kalibrationsset mit entsprechenden Referenz-

spektren berücksichtigt werden. Eine zuverlässige Differenzierung verschiedener Pseu-

domonaden-Arten ist mit der bislang entwickelten Methode ohne weitere Maßnahmen zur

Fluoreszenzverringerung eher unwahrscheinlich, da auch andere Pseudomonaden wie

P. aeruginosa störende Pyoverdine produzieren (Kahlon, 2016).

Eine Fluoreszenzverminderung durch Chemikalien wie Wasserstoffperoxid (H2O2), kann

bei einigen biologischen Proben wie Knochengewebe erfolgreich erreicht werden, wobei

die Zeitspanne zwischen Fluoreszenzreduzierung und der Beschädigung der Probe sehr

gering ist (Golcuk et al., 2006; Penel et al., 1998). Aufgrund der Toxizität von H2O2 gegen-

über vielen Mikroorganismen, schon bei geringer Konzentration, scheidet dieses als Mittel

zur Fluoreszenzverringerung sicherlich aus.

Eine noch längere Vorbestrahlung der Proben (z.B. mehr als 30 Minuten) kann zu aussa-

gekräftigeren Spektren führen. Hierbei besteht aber zum einen das Risiko das Material noch

schwerer zu beschädigen und zum anderen wäre der große Vorteil der schnellen Analyse

ab einem gewissen Punkt nicht mehr gegeben. Auch die Modellentwicklung würde sehr viel

länger dauern, wenn die Aufnahmezeit der Referenzspektren verlängert wird.

Die Auswirkungen längerer Vorbestrahlung auf das Spektrum von M. luteus legen nahe,

dass es zu einer Schädigung des enthaltenen Sarcinaxanthins kommt. Carotinoide dienen

dem Bakterium unter anderem zur Stärkung der Membranintegrität und als Schutz vor ioni-

sierender Strahlung. Nicht alle Carotinoide sind stark photoinstabil und die Diversität der

Diskussion

62

Carotinoide machen sie bei einigen Bakterien selbst auf Stammebene zu einem idealen

Unterscheidungsmerkmal. (B. N. V. Kumar et al., 2015)

Aus Abbildung 25 geht der Effekt des Rückgangs der Peaks bei ca. 742 cm-1 bei längerer

Laserbestrahlung dreier gramnegativer Bakterien hervor. Die Bande bei dieser Wellenzahl

könnte von Peptidoglycan stammen (Wang et al., 2017), jedoch sollte sie dann bei gram-

positiven deutlicher erkennbar sein, als bei gramnegativen und wäre weder photoinstabil

noch besonders empfindlich gegenüber einer möglichen Erhitzung durch den Laser. In der

Literatur, die für Tabelle 2 und Abbildung 7 herangezogen wurden, sind für Mikroorganis-

men keine spezifischen Banden im Bereich von 742 cm-1 aufgeführt. Die Bande könnte in

dieser Arbeit durch Rückstände des Nährmediums verursacht worden sein. Abbildung 10

zeigt bei einem Raman-Spektrum von getrocknetem TSA ebenfalls einen Peak bei ca.

742 cm-1, was diesen Verdacht erhärtet. Es könnte sich allerdings auch um extrazelluläre

polymere Substanzen (EPS) handeln, die durch die Energie des Laserbeschusses nach

und nach verdrängt werden. Kanematsu et al. berichten von Raman-Peaks bei 743 cm-1,

welche den Polysacchariden in EPS des Biofilms von E. coli zuzuschreiben sind

(Kanematsu et al., 2016).

Bei dem besonders stark ausgeprägten Peak von Bacillus subtilis bei 780 cm-1, handelt es

sich um ein für DNA/RNA typisches Signal (Ringschwingungen von Cytosin und Uracil). Da

das Genom von B. subtilis nicht größer als beispielsweise das Genom von E. coli ist, könn-

ten diese Signale aufgrund der unterschiedlich beschaffenen Zellwand bei grampositiven

leichter zu gewinnen sein als bei gramnegativen. Es könnte allerdings auch mit der Fähig-

keit der Sporenbildung von B. subtilis zusammenhängen; so enthalten Sporen drei bis vier

Mal so viel RNA als DNA (P. Zhang et al., 2011) und somit auch mehr Uracil, welches bei

etwa 780 cm-1 das charakteristische Signal zeigt.

4.2 Datenvorbehandlung

Trotz stark variierender Auswirkungen verschiedener Messbedingungen auf die Basislinie

(siehe Abbildung 23), kann mit der verwendeten MATLAB-Routine eine gleichmäßige

Transformierung der Spektren erzielt werden (siehe Abbildung 27). Anhand der PCA nach

Datenvorbehandlung wird eine klare Auftrennung der Daten in spezifische Cluster sichtbar.

Der ungewöhnliche Anstieg einiger Spektren von Mlu 20030 nach Datenvorbehandlung

(Abbildung 27) liegt an etwa 10 Spektren, welche von einer sehr dünnen Bakterienschicht

aufgenommen wurden. Hier verlaufen die Spektren, ähnlich wie das Spektrum des Glasob-

jektträgers (Abbildung 10) als ansteigende Gerade mit gering ausgeprägten Signaturen.

Teilweise erkennbar sind diese Spektren in den ausgebleichten Hintergrundspektren aus

Abbildung 23 (ab 1600 cm-1). Bei solchen Fällen, in denen die letzten Datenpunkte die

Diskussion

63

höchsten Intensitäten aufweisen, führt das angewandte Verfahren zur Basislinienkorrektur

zu einem entsprechenden Anstieg an dieser Stelle. Die betroffenen Spektren aus dem Ka-

librationsset zu entfernen, könnte zu einer leichten Verbesserung der Modelle führen.

Als besonders bedeutsam kann die auftretende Absorption nahezu aller Spektren bei etwa

988 cm-1 und 1200 cm-1 angesehen werden (siehe Abbildung 23). Mit zunehmender Fluo-

reszenz steigt besonders bei 988 cm-1 die Absorption. Dieser negative Peak verleiht dem

Spektrum nach Vorbehandlung einen gleichmäßigen „Offset“ aller Banden (siehe Abbildung

27). Möglicherweise beruhen die sehr genauen Vorhersagen zu einem großen Teil auf ge-

nau diesem Umstand. Mlu 20030 ist der Stamm, welcher durchweg am genauesten vorher-

gesagt wird, selbst bei Verwendung von nur 8 PCs wird er mit allen drei Klassifizierungs-

verfahren zu durchschnittlich 97,3 % richtig identifiziert (siehe Abbildung 35). Die beiden

anderen M. luteus-Stämme, die einen geringeren „Offset“ aufweisen, werden bei 8 PCs mit

allen Klassifizierungsverfahren durchschnittlich nur zu 79 % (MLB 28269) bzw. 90 %

(Mlu 1790) richtig identifiziert. Um zu untersuchen ob diese „Negativpeaks“ für genauere

Vorhersagen sorgen, müssten neue Modelle erstellt werden, bei denen der ausgewählte

Wellenzahlbereich vor der Basislinienkorrektur entsprechend angepasst wird. Sollte der

durch die Absorption verliehene „Offset“ für die gute Differenzierbarkeit verantwortlich sein,

wäre dies nicht zwingend nachteilig, da diese Auswirkungen auf die Spektren charakteris-

tisch und reproduzierbar sind. Allerdings wären die Modelle dann ggfs. nur beschränkt auf

externe Daten anwendbar, die ein solches Verhalten nicht aufweisen. Der „Negativpeak“

bei 988 cm-1 wird in diesem Ausmaß in der Literatur nicht vorgefunden, jedoch ist in vielen

Publikationen bei Raman-Spektren von Bakterien ein Minimum oder zumindest eine deutli-

che „Einkerbung“ innerhalb der Spektren bei 1200 cm-1 zu beobachten (De Gelder, 2008;

Van de Vossenberg et al., 2013).

Neben der Basislinienkorrektur, Glättung und der Normalisierung, stellt auch die PCA eine

Datenvorbehandlungsmethode dar. Es ist, wie in Kapitel 2.2.6 beschrieben, möglich, dass

die Wahl bzw. die Reihenfolge der PCs nicht die relevantesten Eigenschaften zur Vorher-

sage wiedergeben (Chang, 1983). Mögliche Verbesserungen der Modellleistungen, basie-

rend auf der Datenvorbehandlung, könnten unter Umständen durch eine stärkere Gewich-

tung ausgewählter spektraler Bereiche erzielt werden.

Ein sehr einfacher Ansatz der ggfs. zu weiteren Verbesserungen der Modelle führen könnte,

ist das Bilden von Ableitungen der Spektren zur Basislinienkorrektur. Vorversuche in die-

sem Bereich erzielten zwar schlechtere Resultate, jedoch könnte dies hauptsächlich mit der

Reihenfolge der einzelnen Vorbehandlungsschritte zusammenhängen. Ableitungsverfah-

ren neigen in Umgebungen mit hohem Rauschen dazu, schlechtere Ergebnisse zu erzielen

(Prakash & Wei, 2011). Es sollte also vor der Bildung der Ableitung die Glättung der

Diskussion

64

Spektren durchgeführt werden. Ein Nachteil dieser Vorbehandlungsmethode besteht darin,

dass die Spektren aufgrund der Veränderungen der Peaks schwerer zu interpretieren sind.

4.3 Beurteilung der Leistung und mögliche Limitationen der

entwickelten Methode

Die Ergebnisse dieser Arbeit zeigen, dass mit dem verwendeten Raman-Messsystem eine

zuverlässige Differenzierung der 9 untersuchten Mikroorganismen bei einer Anregungswel-

lenlänge von 633 nm möglich ist. Die Vorhersagegüten der leistungsfähigsten Modelle bei

praktischer Validierung liegen bei 98,1 % (QDA 20 PCs), 97,1 % (kNN 15 PCs) und 97,0 %

(SVM 20 PCs). Somit zeigt keines der Klassifizierungsverfahren einen deutlichen Vorteil

gegenüber den anderen, vielmehr Ergänzen sich die Verfahren. Das ausgewählte QDA-

Modell liefert beispielsweise auf Stammebene genauere Vorhersagen als das kNN-Modell,

jedoch basiert das kNN-Modell nur auf 15 PCs, was als Vorteil angesehen werden kann.

Weniger Dimensionen zur erfolgreichen Klassifizierung, bedeuten in der Regel robustere

Modelle in der Praxis. Die SVM-Modelle mit 15 und 20 PCs sind auf Stammebene deutlich

genauer als die QDA- und kNN-Modelle, schneiden aber bei ansonsten gut zu identifizie-

renden Bakterien (K12 423 und Pfl 50090) schlecht ab. Dies könnte zumindest bei

Pfl 50090 damit zusammenhängen, dass das Kalibrationsset aufgrund der zwei verschie-

denen Kultivierungsbedingungen zwei Cluster enthält, die leicht widersprüchlich sind. Eine

Vergrößerung des Kalibrationssets, oder eine Anpassung der Methode auf die Beschrän-

kung nur einer einzigen Kultivierungsart, könnte zu besseren Resultaten führen. Jedoch

sind diese Maßnahmen aufgrund der großen Störungen durch Fluoreszenz bei Pfl 50090

nicht ratsam. Die guten Vorhersagen für Pfl 50090 beruhen hauptsächlich auf dem großen

Unterschied zu den anderen Raman-Spektren, welche allerdings nicht direkt der chemi-

schen Zusammensetzung der Zelle zuzuschreiben sind, sondern der daraus resultierenden

Signalstörung. Da diese starke Störung bei nur einem einzigen Mikroorganismus innerhalb

des Kalibrationssets vorkommt, ermöglicht das schlechte Signal die gute Vorhersage.

Modelle für die weniger als 15 PCs herangezogen wurden, zeigen starke Probleme bei der

Unterscheidung von K12 423 von StyTA98 (siehe Abbildung 35). Die Ursache für die fal-

sche Identifizierung von K12 423 als Sty TA98 und nicht umgekehrt, könnte mit dem leicht

größeren Datenumfang der Sty TA98-Spektren zusammenhängen. Dies weist darauf hin,

dass sich eine gleichmäßige Datengewichtung eng verwandter Mikroorganismen innerhalb

eines Kalibrationsmodells positiv auf die Vorhersageleistung auswirken könnte.

Die sehr genauen Vorhersagen auf Stammebene von M. luteus müssen vorsichtiger be-

trachtet werden als die Vorhersagen bei den anderen Mikroorganismen. Erste Modelle, die

für M. luteus jeweils noch 100 Referenzspektren weniger enthielten als die finalen Modelle,

Diskussion

65

zeigten angewandt auf 200 völlig unbekannte Spektren Vorhersagegüten von 60 %

(MLB 28269), 70 % (Mlu 1790) und 99 % (Mlu 20030). Aufgrund der geringen Vorhersage-

güte bei den ersten beiden Stämmen, wurde das Kalibrationsset um jeweils 100 zufällig

gewählte Referenzspektren aus diesen 200 Spektren aufgestockt. Die restlichen 100 Vali-

dierungsspektren für M. luteus sind deshalb zwar nicht im Kalibrationsset enthalten, jedoch

wurden sie am gleichen Tag von demselben Probenmaterial erfasst. Da eine Mehrfachauf-

nahme von 5 bis 10 Spektren pro Stelle erfolgte, können im Kalibrationsset ähnliche Spek-

tren vorliegen wie bei der Validierung. Dies kann möglicherweise zu leicht überbestimmten

Resultaten geführt haben. Dennoch zeigt dies, dass mit robusten Referenzdatenbanken,

anhand vieler Proben aus mehreren Versuchstagen, immer genauere Vorhersagen für un-

bekannte Daten gemacht werden können. Die PCA aus Abbildung 33, welche sowohl die

Kalibrations-, als auch die Validierungsspektren enthält, verdeutlicht dies. Werden bei-

spielsweise nachträglich die Validierungsspektren in das Kalibrationsset mitaufgenommen,

würden insbesondere bei Sce 1334 und Mlu 20030 eine breitere Abdeckung erfolgen.

Mögliche Limitationen bei der Anwendung der Methode sind bei Mikroorganismen denkbar,

die besonders lichtempfindlich sind oder dunkles Koloniematerial aufweisen. Dunkles oder

farbiges Koloniematerial absorbiert einen größeren Anteil des Laserlichts, was zu einem

Verbrennen der Probe führen könnte (Banwell & MacCash, 1999).

4.4 Möglichkeiten zur Vermeidung falsch positiver Vorhersagen

Die entwickelten Kalibrationsmodelle basieren auf teilweise sehr komplexen Entschei-

dungsgrenzen in einem definierten Datenraum. Diese Grenzen führen dazu, dass ein

Spektrum eines unbekannten Mikroorganismus entweder der einen oder der anderen

Klasse zugeordnet wird. Unbekannte Spektren werden mit den entwickelten Modellen also

dem spektral ähnlichsten Mikroorganismus „zugeordnet“, selbst wenn die Unterschiede

sehr groß sein sollten. Bei einer Identifizierung pathogener Stämme müssten Kalibrations-

modelle auch das Ergebnis „unbekannt“ ausgeben können, oder einen Wert zur Beurteilung

der Wahrscheinlichkeit, dass ein Messergebnis korrekt ist. In der Medizin könnte eine sol-

che Vorhersage für das gesundheitliche Wohl eines Menschen entscheidend sein.

Unter anderem spricht man in der medizinischen Diagnostik von Sensitivität und Spezifität

eines Tests. Die Sensitivität ist ein Maß für das Erkennen eines oder mehrerer bestimmter

Merkmale. Führt das Vorhandensein dieser Merkmale immer zu einem positiven Test, so

beträgt die Sensitivität 100 %. Übertragen bedeutet dies, dass bei entsprechenden Intensi-

täten innerhalb eines definierten Wellenzahlbereichs ein Mikroorganismus vorhergesagt

wird. Die Spezifität ist hingegen ein Maß für das Erkennen, dass bestimmte Merkmale nicht

vorliegen. Werden alle negativen Proben, also Mikroorganismen, die nicht im Kalibratiosset

enthalten sind stets als „negativ“ vorhergesagt, so beträgt die Spezifität 100 %. Erst durch

Diskussion

66

Kombination von hoher Sensitivität und Spezifität werden Testergebnisse verlässlich.

(Suerbaum et al., 2016)

Für die hier verwendeten Klassifikationsverfahren gibt es verschiedene Ansätze, mit denen

die Zuverlässigkeit einer Vorhersage näher beschrieben werden könnte. Für den kNN-Al-

gorithmus wurden Methoden zur Berechnung der Wahrscheinlichkeit einer korrekten Klas-

sifizierung entwickelt, die über das sogenannte „Bootstrapping“-Verfahren erreicht werden

(Holmes & Adams, 2002; Villa et al., 2008). Bei der QDA können vergleichsweise einfach

über das Bayes-Theorem A-posteriori-Wahrscheinlichkeiten bestimmt werden, über welche

die Vertrauenswürdigkeit von Vorhersagen abgeschätzt werden können (Backhaus et al.,

2015). SVMs bieten solche Klassifizierungswahrscheinlichkeiten nicht direkt, jedoch gibt es

auch dort Ansätze, um A-posteriori-Wahrscheinlichkeiten zu erhalten. Es kann eine Schätz-

funktion bestimmt werden, die als trennende Hyperebene zwischen den Kalibrationsdaten

und abweichenden unbekannten Daten fungiert. (Platt, 1999; Schölkopf et al., 2001)

4.5 Ausblick

Aufgrund der nachgewiesenen Eignung des Messsystems für die Identifizierung der neun

verwendeten Mikroorganismen, ist eine Vielzahl weiterer Experimente denkbar. Die we-

sentlichsten neuen Projekte könnten unter anderem die Untersuchung weiterer Mikroorga-

nismen sein. Besonders Versuche mit Mikroorganismen, die photosensitive Pigmente oder

dunkles Koloniematerial aufweisen, könnten weitere Aufschlüsse über den Eignungsbe-

reich der Methode geben. Eine Untersuchung zur Auswirkung einer variierenden Anzahl an

Waschschritten auf die Fluoreszenzstörung bestimmter Mikroorganismen wäre ebenfalls

ein interessanter Schritt für die Weiterentwicklung der Methode.

Die Einschätzung der Zuverlässigkeit vorhergesagter Mikroorganismen mit den jetzigen

Daten könnte am einfachsten bei einem QDA-Modell umgesetzt werden. Dort bietet die

Software MATLAB die Möglichkeit neben der Vorhersage der Klasse auch A-posteriori-

Wahrscheinlichkeiten auszugeben. Allerdings können die Modelle hierfür nicht mit dem

Classification-Learner-Tool erstellt werden, sondern müssen manuell über die Kommando-

zeile programmiert werden.

Besonders interessant ist das Anpassen der entwickelten Methode, um Untersuchungen

zum Nachweis der Produktion bestimmter Substanzen durch Mikroorganismen zu ermögli-

chen. Über die Mikro-Raman-Spektroskopie können solche Analysen stark vereinfacht wer-

den. Beispielsweise ist das von einigen Bakterien produzierbare Polyhydroxybutyrat (PHB)

für die industrielle Produktion von biologisch abbaubaren Kunststoffen von großer Bedeu-

tung. Die Raman-Spektroskopie kann als schnelles und nichtinvasives Verfahren zum

Nachweis und zur Bestimmung des Gehalts von PHB in Bakterien dienen. (Gelder et al.,

2008; Samek et al., 2016)

Anhang

67

Anhang

Anhangsverzeichnis

Anhang 1: Vorhersagematrices QDA ..............................................................................68

Anhang 2: Vorhersagematrices kNN...............................................................................69

Anhang 3: Vorhersagematrices SVM ..............................................................................70

Anhang 4: Validierungsvorhersagen der restlichen QDA-Modelle .................................71

Anhang 5: Validierungsvorhersagen der restlichen kNN-Modelle ..................................72

Anhang 6: Validierungsvorhersagen der restlichen SVM-Modelle .................................73

Anhang 7: Leitfaden zur Identifizierung von Mikroorganismen über Raman-Spektroskopie ......................................................................................................74

Anhang

68

Anhang 1: Vorhersagematrices QDA

10 PCs (96,8 %) 12 PCs (97,0 %) W

ah

r

Vorhersagen Vorhersagen

20 PCs (99,0 %)

Wa

hr

Vorhersagen

Anhang

69

Anhang 2: Vorhersagematrices kNN

10 PCs (96,9 %) 12 PCs (97,5 %) W

ah

r

Vorhersagen Vorhersagen

20 PCs (99,1 %)

Wa

hr

Vorhersagen

Anhang

70

Anhang 3: Vorhersagematrices SVM

10 PCs (98,3 %) 12 PCs (98,5 %) W

ah

r

Vorhersagen Vorhersagen

20 PCs (99,7 %)

Wa

hr

Vorhersagen

Anhang

71

Anhang 4: Validierungsvorhersagen der restlichen QDA-Modelle

QDA 8 PCs Vorhersagen

Bdi 7234

Bsu 10 K12 423

MLB 28269

Mlu 1790

Mlu 20030

Pfl 50090

Sce 1334

Sty TA98

Wa

hr

Bdi 7234 100 Bsu 10 100

K12 423 1 34 3 62 MLB 28269 86 11 3 Mlu 1790 8 90 2 Mlu 20030 1 1 98 Pfl 50090 100 Sce 1334 100 Sty TA98 98

QDA 10 PCs Vorhersagen

Bdi 7234

Bsu 10 K12 423

MLB 28269

Mlu 1790

Mlu 20030

Pfl 50090

Sce 1334

Sty TA98

Wa

hr

Bdi 7234 98 2 Bsu 10 100

K12 423 26 3 71 MLB 28269 94 3 3 Mlu 1790 6 91 3 Mlu 20030 3 97 Pfl 50090 100 Sce 1334 100 Sty TA98 1 99

QDA 12 PCs Vorhersagen

Bdi 7234

Bsu 10 K12 423

MLB 28269

Mlu 1790

Mlu 20030

Pfl 50090

Sce 1334

Sty TA98

Wahr

Bdi 7234 99 1 Bsu 10 100

K12 423 51 3 46 MLB 28269 96 3 1 Mlu 1790 4 93 3 Mlu 20030 1 99 Pfl 50090 100 Sce 1334 100 Sty TA98 2 98

QDA 15 PCs Vorhersagen

Bdi 7234

Bsu 10 K12 423

MLB 28269

Mlu 1790

Mlu 20030

Pfl 50090

Sce 1334

Sty TA98

Wahr

Bdi 7234 100 Bsu 10 100

K12 423 76 24 MLB 28269 97 3 Mlu 1790 6 91 3 Mlu 20030 100 Pfl 50090 100 Sce 1334 100 Sty TA98 100

Anhang

72

Anhang 5: Validierungsvorhersagen der restlichen kNN-Modelle

kNN 8 PCs Vorhersagen

Bdi 7234

Bsu 10 K12 423

MLB 28269

Mlu 1790

Mlu 20030

Pfl 50090

Sce 1334

Sty TA98

Wa

hr

Bdi 7234 100 Bsu 10 99 1

K12 423 1 22 77 MLB 28269 67 23 10 Mlu 1790 12 86 2 Mlu 20030 4 1 95 Pfl 50090 99 1 Sce 1334 1 99 Sty TA98 1 7 4 88

kNN 10 PCs Vorhersagen

Bdi 7234

Bsu 10 K12 423

MLB 28269

Mlu 1790

Mlu 20030

Pfl 50090

Sce 1334

Sty TA98

Wa

hr

Bdi 7234 100 Bsu 10 98 2

K12 423 46 54 MLB 28269 78 11 11 Mlu 1790 16 79 5 Mlu 20030 4 96 Pfl 50090 1 99 Sce 1334 1 99 Sty TA98 3 7 90

kNN 12 PCs Vorhersagen

Bdi 7234

Bsu 10 K12 423

MLB 28269

Mlu 1790

Mlu 20030

Pfl 50090

Sce 1334

Sty TA98

Wahr

Bdi 7234 100 Bsu 10 100

K12 423 59 41 MLB 28269 93 4 3 Mlu 1790 9 84 7 Mlu 20030 3 3 94 Pfl 50090 100 Sce 1334 100 Sty TA98 9 91

kNN 20 PCs Vorhersagen

Bdi 7234

Bsu 10 K12 423

MLB 28269

Mlu 1790

Mlu 20030

Pfl 50090

Sce 1334

Sty TA98

Wahr

Bdi 7234 100 Bsu 10 100

K12 423 95 5 MLB 28269 88 10 2 Mlu 1790 6 94 Mlu 20030 1 99 Pfl 50090 1 77 16 6 Sce 1334 1 1 98 Sty TA98 2 98

Anhang

73

Anhang 6: Validierungsvorhersagen der restlichen SVM-Modelle

SVM 8 PCs Vorhersagen

Bdi 7234

Bsu 10 K12 423

MLB 28269

Mlu 1790

Mlu 20030

Pfl 50090

Sce 1334

Sty TA98

Wa

hr

Bdi 7234 99 1 Bsu 10 100

K12 423 32 68 MLB 28269 84 15 1 Mlu 1790 5 94 1 Mlu 20030 1 99 Pfl 50090 3 95 2 Sce 1334 4 96 Sty TA98 2 98

SVM 10 PCs Vorhersagen

Bdi 7234

Bsu 10 K12 423

MLB 28269

Mlu 1790

Mlu 20030

Pfl 50090

Sce 1334

Sty TA98

Wa

hr

Bdi 7234 83 17 Bsu 10 100

K12 423 26 74 MLB 28269 77 17 6 Mlu 1790 3 96 1 Mlu 20030 100 Pfl 50090 100 Sce 1334 6 94 Sty TA98 1 99

SVM 12 PCs Vorhersagen

Bdi 7234

Bsu 10 K12 423

MLB 28269

Mlu 1790

Mlu 20030

Pfl 50090

Sce 1334

Sty TA98

Wahr

Bdi 7234 83 17 Bsu 10 99 1

K12 423 39 61 MLB 28269 85 9 6 Mlu 1790 6 93 1 Mlu 20030 1 1 98 Pfl 50090 100 Sce 1334 5 95 Sty TA98 3 97

Anhang

74

Anhang 7: Leitfaden zur Identifizierung von Mikroorganismen über Raman-Spektroskopie

1. Allgemeines

• Befolgen Sie die allgemeinen und raumspezifischen Sicherheitsvorschriften.

• Beachten Sie bei der Verwendung des Raman-Mikroskopie-Systems inVia von Renishaw

das im Labor ausliegende Dokument „Vor jeder Messung“.

• Bisher (Stand Januar 2019) können folgende Mikroorganismen identifiziert werden:

Kürzel Mikroorganismus DSM-Nr. Geschätzte Vorhersagegüte [%]*

QDA kNN SVM

Bdi 7234 Brevundimonas diminuta 7234 100 100 100

Bsu 10 Bacillus subtilis 10 100 100 100

K12 423 Escherichia coli K12 423 95 100 91

MLB 28269 Micrococcus luteus 28269 97 92 96

Mlu 1790 Micrococcus luteus 1790 91 87 99

Mlu 20030 Micrococcus luteus 20030 100 100 100

Pfl 50090 Pseudomonas fluorescens 50090 100 100 87

Sce 1334 Saccharomyces cerevisiae 1334 100 100 100

Sty TA98 Salmonella Thyphimurium TA98 - 100 95 100

* basierend auf dem Ergebnis einer Validierung mit jeweils 100 unbekannten Spektren und Modellen mit 20 Hauptkomponenten (QDA und SVM) und 15 Hauptkomponenten (kNN)

2. Anzucht der Mikroorganismen und Probenvorbereitung

• Machen Sie von dem zu identifizierenden Koloniematerial einen Ausstrich auf TSA-Nähr-

boden und bebrüten Sie diesen bei 30 °C für 24 h.

• Legen Sie 1000 µl sterile NaCl-Lösung (0,9 %) in ein 1,5 ml-Reaktionsgefäß vor.

• Überführen Sie so viel Koloniematerial in das Reaktionsgefäß, wie Sie etwa mit drei Abstri-

chen einer 10 µl Impfschlinge aufnehmen können.

• Mischen Sie den Inhalt durch einen Vortex-Mi-

scher, bis eine gleichmäßige Suspension entsteht.

• Zentrifugieren Sie das Material für 3 Minuten bei

5000 rpm und verwerfen Sie anschließend den

Überstand.

• Überführen Sie das Zellmaterial auf einen Glasob-

jektträger (mittels Pipette oder Kunststoffstab).

Anhang

75

• Lassen Sie das Koloniematerial trocknen

(Bei Raumtemperatur ca. 1 bis 2 Stunden).

• Bereiten Sie das Raman-Messsystem nach den

Vorgaben des Dokuments „Vor jeder Messung“ vor

(Kalibrierung mit Si-Standard).

• Platzieren Sie die getrocknete Probe auf dem Ob-

jekttisch und fokussieren Sie diese mit dem 100X-

Objektiv.

3. Spektrenaufzeichnung

• Gehen Sie sicher, dass die Jalousien des Labors geschlossen sind und die Raumbeleuch-

tung inaktiv ist.

• Verwenden Sie folgende Messeinstellungen:

Wellenzahlzentrum: 1200 cm-1

Belichtungsdauer: 3 Sekunden

Laserleistung: 100 %

Akkumulationen: 15

• Starten Sie eine Messung und ordnen Sie das Resultat in eine der nachfolgenden

Kategorien A bis D ein.

A1

A2

B

C1

C2

D

• Zur Einschätzung der Begriffe „dünn“, „dick“, „mittel“ bei Probenschichten kann nachfol-

gende Abbildung eine Einschätzung ermöglichen:

Beispiel zweier Kolonie-

materialprobenschich-

ten auf Glasobjektträ-

gern zur Einschätzung

der Schichtdicken

(a= dünn; b= mittel;

c= dick; d= ungeeignet,

noch flüssig

Anhang

76

Weiteres Vorgehen bei Kategorie A (A1 und A2)

• Diese Spektren sind bereits verwertbar (Zeichnen Sie am besten mehrere Spektren an die-

ser Stelle auf, wechseln Sie anschließend die fokussierte Position und zeichnen Sie ggfs.

weitere Spektren auf).

• Speichern Sie Spektren unter einem Dateinamen ab, der einer bestimmten Logik folgt: z.B.

Jahr, Monat, Tag, fortlaufende Nummerierung, Kürzel des Mikroorganismus oder der

Probe (z.B. 20180831 001 K12 423).

Weiteres Vorgehen bei Kategorie B

• Ihre Probenschicht ist vermutlich zu dünn oder das Koloniematerial so blass, dass ein gro-

ßer Teil des Laserlichts hindurchtritt. Wechseln Sie die fokussierte Stelle oder sorgen Sie

für einen dickeren Probenfilm und versuchen Sie es erneut.

Weiteres Vorgehen bei Kategorie C (C1 und C2)

• Ihre Probenschicht ist vermutlich zu dick; Bestrahlen Sie die Probe länger vor, indem Sie

mit denselben Messeinstellungen nacheinander Messungen starten.

• Sie können die Belichtungszeit an dieser Stelle auch verringern und die Akkumulationen

erhöhen. Dadurch müssen Sie nicht so häufig eine neue Messung initiieren und die Aus-

wirkung der Vorbestrahlung ist schneller ersichtlich.

• Bestrahlen Sie insgesamt etwa 5 bis 15 Minuten vor und beobachten Sie ob Signaturen

erkennbar werden. Werden in diesem Zeitraum Peaks erkennbar, wechseln Sie ggfs. zu-

rück zu den 15 Akkumulationen und den 3 Sekunden Belichtungszeit und zeichnen Sie ein

Spektrum auf.

• Raman-Spektren die von „mittleren“ oder „dicken“ Probenschichten nach Vorbestrahlung

erhalten werden, entwickeln sich häufig wie das Beispiel A2. Diese Spektren sind verwert-

bar. Verfahren Sie dann nach Kategorie A weiter.

Sieht das Spektrum nach etwa 15 Minuten Vorbestrahlung noch aus wie bei C, sollten Sie

eine dünnere Probenschicht fokussieren.

Weiteres Vorgehen bei D:

• Die Counts sind zu hoch. Es wird kein Spektrum angezeigt. Dies kann bei Proben passie-

ren, die starke Eigenfluoreszenz aufweisen, insbesondere bei dicken Probenschichten.

• Untersuchen Sie die Probe mit kürzerer Belichtungszeit z.B. 0,25 Sekunden und stellen

Sie eine hohe Akkumulation ein z.B. 500. Bestrahlen Sie die Probe 2 Minuten vor und initi-

ieren Sie die Messung mit verkürzter Belichtungszeit erneut.

• Wiederholen Sie dies einige Male, bis die Fluoreszenz soweit ausgebrannt wurde, dass

auch bei 3 Sekunden Belichtungszeit ein Spektrum angezeigt wird.

• Prüfen Sie nach spätestens 15 Minuten Vorbestrahlung, ob das Spektrum in Kategorie A,

B, oder C fällt und verfahren Sie entsprechend weiter.

Anhang

77

4. Datenverarbeitung

• Konvertieren Sie die WDF-Dateien mit dem WiRE Batch Converter in das TXT-Format.

• Erstellen Sie auf dem Computer, auf dem die Software MATLAB (R2017b) installiert ist,

einen neuen Ordner.

• Kopieren Sie folgende Dateien in diesen Ordner:

o f = Wellenzahlachse

o lpf = Tiefpassfilter

o specdata = Tool-Sammlung

o Alle Modelle = Sammlung der entwickelten Vorhersagemodelle

o Ihre konvertierten TXT-Files der Spektren

• Starten Sie MATLAB und wählen Sie den entsprechenden Ordner aus.

• Nachfolgende Befehle müssen in das Kommandofenster eingegeben werden.

Was in der Kommandozeile nach einem %-Zeichen geschrieben wird, hat keinen Einfluss,

sondern dient als Kommentar. Die Schriftart Courier weist darauf hin, dass der Text di-

rekt in MATLAB kopiert und ausgeführt werden könnte.

Anhang

78

% Erstellen Sie ein Datenpaket, das Ihre Spektren enthält. Sie können das

Paket benennen wie Sie wollen (es empfiehlt sich eine kurze Bezeichnung).

In diesem Beispiel wird das Paket als „Bdi“ bezeichnet. Der Befehl

„specdata“ erlaubt eine Einschränkung der Suchkriterien durch „*“

Bdi=specdata.load('2018*Bdi*.txt')

%Standardisieren Sie die Wellenzahlachse (Interpolieren)

Bdi_x=Bdi.setx(606:1.114:1736)

%Konvertieren Sie die Spektren als Datenmatrix

Bdi_x_mat=Bdi_x.xymat

• Nun müssen Sie die erste Spalte ihrer Datenmatrix löschen (Wellenzahlen) und die Daten

anschließend transponieren, sodass die 1015 Wellenzahlen die Spalten ergeben und die

(in diesem Beispiel 50) Spektren die Zeilen.

• Kopieren Sie in Ihren „Workspace“ die Wellenzahlachse „f“

%Führen Sie die Basislinienkorrektur und Glättung aus.

dim = 50 %Anzahl Ihrer Spektren

for i = 1:1*dim

Bdi_x_mat_treat(i,:) = Bdi_x_mat(i,:) - lpf(f, Bdi_x_mat(i,:), 20) ;

Bdi_x_mat_treat(i,:) = lpf(f, Bdi_x_mat_treat(i,:),3) ;

end

Anhang

79

% Die Spektren werden nun normalisiert, also das Minimum 0 und das Maximum

als 1 definiert

imax = 1;

imin = 0;

% Zeilenweise Bestimmung

Bdi_x_mat_treat_min = min(Bdi_x_mat_treat,[],2);

Bdi_x_mat_treat_max = max(Bdi_x_mat_treat,[],2);

y = zeros(50,1015); %(50,1015)Entspricht dem Format der Datenmatrix

for i=1:length(Bdi_x_mat_treat_max)

Mittel = (imax - imin) / (Bdi_x_mat_treat_max(i) - Bdi_x_mat_treat_min(i));

% jede Zeile einzeln normieren

Bdi_x_mat_treat_norm (i,:) = Mittel*( Bdi_x_mat_treat (i,:) -

Bdi_x_mat_treat_min(i)) + imin;

end

• Die blau hinterlegten Dateien werden nicht weiter benötigt. Alle anderen sollten Sie abspei-

chern. Prüfen Sie Ihre Daten an dieser Stelle auf Plausibilität, indem Sie die Spektren in

MATLAB „plotten“ (plot(f, Bdi_x_mat_treat_norm))

• Kopieren Sie die vorbehandelte Datenmatrix und fügen Sie diese in Microsoft Excel ein,

wobei sie in Excel die erste Spalte frei lassen. Speichern Sie die Excel-Datei in Ihren er-

stellten Ordner.

Anhang

80

• Importieren Sie in MATLAB eine Datentabelle basierend auf Ihrer Excel-Datei und benen-

nen Sie diese entsprechend. Sorgen Sie dafür, dass auch die leere Spalte 1 importiert wird

(VarName1). Die 1015 Wellenzahlen werden automatisch als VarName2 bis Var-

Name1016 bezeichnet, was für die Vorhersage mit den entwickelten Modellen erforderlich

ist.

• Wählen Sie eines der Modelle aus dem Paket aus und fügen Sie es in Ihren „Workspace“

ein. Hier wird das kNN-Modell, basierend auf 15 Hauptkomponenten gewählt

(model5_KNN_15PC)

Anhang

81

• Nun erfolgt die Vorhersage der vorbehandelten unbekannten Spektren über das ausge-

wählte Modell.

% Geben Sie eine Bezeichnung für die Vorhersage ein (Vorhersage). Wählen

Sie den Namen des entsprechenden Modells (model5_KNN_15PC). Den Befehl zur

Vorhersage (.predictFcn) und den Namen der Datenmatrix für die Sie eine

Vorhersage machen wollen (Bdi_vali).

Vorhersage = model5_KNN_15PC.predictFcn(Bdi_vali)

• Sie erhalten nun eine Liste, in der mit dem ausgewählten Modell für jedes Raman-Spekt-

rum eine Vorhersage gemacht wurde.

Anhang

82

5 Literaturverzeichnis

Andrusch, A., Dabrowski, P. W., Klenner, J., Tausch, S. H., Kohl, C., Osman, A. A., . . . Nitsche, A. (2018). PAIPline: pathogen identification in metagenomic and clinical next generation sequencing samples. Bioinformatics, 34(17), S. i715-i721. doi: 10.1093/bioinformatics/bty595

Backhaus, K., Erichson, B., Plinke, W., & Weiber, R. (2015). Multivariate Analysemethoden: Eine anwendungsorientierte Einführung: Springer Berlin Heidelberg. S. 107, 216, 221, 250, 263, 268

Banwell, C. N., & MacCash, E. M. (1999). Molekülspektroskopie: Ein Grundkurs: Oldenbourg. S. 164, 165

Baritaux, J. C., Simon, A. C., Schultz, E., Emain, C., Laurent, P., & Dinten, J. M. (2016). A study on identification of bacteria in environmental samples using single-cell Raman spectroscopy: feasibility and reference libraries. Environ Sci Pollut Res Int, 23(9), S. 8184-8191. doi: 10.1007/s11356-015-5953-x

Chang, W.-C. (1983). On using principal components before separating a mixture of two multivariate normal distributions. Applied Statistics, 32, S. 267-275.

Ciobota, V., Burkhardt, E. M., Schumacher, W., Rösch, P., Kusel, K., & Popp, J. (2010). The influence of intracellular storage material on bacterial identification by means of Raman spectroscopy. Anal Bioanal Chem, 397(7), S. 2929-2937. doi: 10.1007/s00216-010-3895-1

Cypionka, H. (2010). Grundlagen der Mikrobiologie: Springer Berlin Heidelberg. S. 1, 2, 4, 15, 16, 19, 27, 30, 94, 95

De Gelder, J. (2008). Raman spectroscopy as a tool for studying bacterial cell compounds. Ghent University.

De Gelder, J., De Gussem, K., Vandenabeele, P., & Moens, L. (2007). Reference database of Raman spectra of biological molecules. Journal of Raman Spectroscopy, 38(9), S. 1133-1147. doi: 10.1002/jrs.1734

Ertel, W. (2016). Grundkurs Künstliche Intelligenz: Eine praxisorientierte Einführung: Springer Fachmedien Wiesbaden. S. 212, 232, 233, 298

Fritsche, O. (2016). Mikrobiologie: Springer Berlin Heidelberg. S. 6, 10, 11, 21, 326

Fuchs, G., Eitinger, T., & Schlegel, H. G. (2007). Allgemeine Mikrobiologie: Thieme. S. 26, 86, 130-133, 135-136, 138-142, 581, 612, 623

Gebrekidan, M. T., Knipfer, C., Stelzle, F., Popp, J., Will, S., & Braeuer, A. (2016). A shifted-excitation Raman difference spectroscopy (SERDS) evaluation strategy for the efficient isolation of Raman spectra from extreme fluorescence interference. Journal of Raman Spectroscopy, 47(2), S. 198-209. doi: 10.1002/jrs.4775

Gelder, J. D., Willemse-Erix, D., Scholtes, M. J., Sanchez, J. I., Maquelin, K., Vandenabeele, P., . . . Vos, P. D. (2008). Monitoring poly(3-hydroxybutyrate) production in cupriavidus necator DSM 428 (H16) with raman spectroscopy. Anal Chem, 80(6), S. 2155-2160. doi: 10.1021/ac702185d

Golcuk, K., Mandair, G. S., Callender, A. F., Sahar, N., Kohn, D. H., & Morris, M. D. (2006). Is photobleaching necessary for Raman imaging of bone tissue using a green laser? Biochim Biophys Acta, 1758(7), S. 868-873. doi: 10.1016/j.bbamem.2006.02.022

Anhang

83

Guo, S., Bocklitz, T., & Popp, J. (2016). Optimization of Raman-spectrum baseline correction in biological application. Analyst, 141(8), S. 2396-2404. doi: 10.1039/c6an00041j

Hair, J. F., Black, W. C., & Babin, B. J. (2010). Multivariate Data Analysis: A Global Perspective: Pearson Education. S. 340, 506, 507, 530

Harz, M., Rösch, P., Peschke, K. D., Ronneberger, O., Burkhardt, H., & Popp, J. (2005). Micro-Raman spectroscopic identification of bacterial cells of the genus Staphylococcus and dependence on their cultivation conditions. Analyst, 130(11), S. 1543-1550. doi: 10.1039/b507715j

Hasegawa, T. (2017). Quantitative Infrared Spectroscopy for Understanding of a Condensed Matter: Springer Japan. S. 5

Hastie, T., Tibshirani, R., & Friedman, J. (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition: Springer New York. S. 103, 111, 116, 438, 439

Helm, D., Labischinski, H., Schallehn, G., & Naumann, D. (1991). Classification and identification of bacteria by Fourier-transform infrared spectroscopy. J Gen Microbiol, 137(1), S. 69-79. doi: 10.1099/00221287-137-1-69

Hesse, M., Meier, H., & Zeeh, B. (2008). Spectroscopic methods in organic chemistry: Thieme. S. 69, 70, 71

Holmes, C. C., & Adams, N. M. (2002). A probabilistic nearest neighbour method for statistical pattern recognition. Journal of the Royal Statistical Society: Series B (Statistical Methodology), 64(2), S. 295-306. doi: 10.1111/1467-9868.00338

Hutsebaut, D., Maquelin, K., De Vos, P., Vandenabeele, P., Moens, L., & Puppels, G. J. (2004). Effect of culture conditions on the achievable taxonomic resolution of Raman spectroscopy disclosed by three Bacillus species. Anal Chem, 76(21), S. 6274-6281. doi: 10.1021/ac049228l

Iba, H. (2018). Evolutionary Approach to Machine Learning and Deep Neural Networks: Neuro-Evolution and Gene Regulatory Networks: Springer Singapore. S. 37

Ivnitski, D., Abdel-Hamid, I., Atanasov, P., & Wilkins, E. (1999). Biosensors for detection of pathogenic bacteria. Biosensors and Bioelectronics, 14(7), S. 599-624. doi: 10.1016/S0956-5663(99)00039-1

Jackson, H., Braun, C. L., & Ernst, H. (2008). The chemistry of novel xanthophyll carotenoids. Am J Cardiol, 101(10A), S. 50D-57D. doi: 10.1016/j.amjcard.2008.02.008

Jolliffe, I. T. (2002). Principal Component Analysis: Springer. S. 167

Kahlon, R. S. (2016). Pseudomonas: Molecular and Applied Biology: Springer International Publishing. S. 48, 49, 146

Kanematsu, H., Kudara, H., Kanesaki, S., Kogo, T., Ikegai, H., Ogawa, A., & Hirai, N. (2016). Application of a Loop-Type Laboratory Biofilm Reactor to the Evaluation of Biofilm for Some Metallic Materials and Polymers such as Urinary Stents and Catheters. Materials (Basel), 9(10). doi: 10.3390/ma9100824

Kessler, W. (2007). Multivariate Datenanalyse: für die Pharma, Bio- und Prozessanalytik: Wiley. S. 21-36, 53, 156, 187

Kim, Y.-i., Jeong, S., Jun, B.-H., Lee, Y.-S., Lee, Y.-S., Jeong Dae, H., & Lee Dong, S. (2017). Endoscopic imaging using surface-enhanced Raman scattering. In European Journal of Nanomedicine (Vol. 9, pp. 91).

Anhang

84

Kneipp, J. (2001). Fourier-Transform-Infrarotmikrospektroskopische Charakterisierung transmissibler spongiformer Enzephalopathien. Freie Universität Berlin, https://docplayer.org/8549739-Fourier-transform-infrarotmikrospektroskopische-charakterisierung-transmissibler-spongiformer-enzephalopathien.html Abgerufen am 2.11.2018.

Kneipp, K., Haka, A. S., Kneipp, H., Badizadegan, K., Yoshizawa, N., Boone, C., . . . Feld, M. S. (2002). Surface-Enhanced Raman Spectroscopy in Single Living Cells Using Gold Nanoparticles. Applied Spectroscopy, 56(2), S. 150-154. doi: 10.1366/0003702021954557

Krämer, J. (2007). Lebensmittel-Mikrobiologie: 49 Tabellen: Ulmer. S. 364, 365

Kumar, B. N. V., Kampe, B., Rösch, P., & Popp, J. (2015). Characterization of carotenoids in soil bacteria and investigation of their photodegradation by UVA radiation via resonance Raman spectroscopy. Analyst, 140(13), S. 4584-4593. doi: 10.1039/c5an00438a

Kumar, S., Verma, T., Mukherjee, R., Ariese, F., Somasundaram, K., & Umapathy, S. (2016). Raman and infra-red microspectroscopy: towards quantitative evaluation for clinical research by ratiometric analysis. Chem Soc Rev, 45(7), S. 1879-1900. doi: 10.1039/c5cs00540j

Kusic, D., Kampe, B., Ramoji, A., Neugebauer, U., Rösch, P., & Popp, J. (2015). Raman spectroscopic differentiation of planktonic bacteria and biofilms. Anal Bioanal Chem, 407(22), S. 6803-6813. doi: 10.1007/s00216-015-8851-7

Larkin, P. (2011). Infrared and Raman Spectroscopy: Principles and Spectral Interpretation: Elsevier Science. S. 55-57

Lechner, M. D. (2016). Einführung in die Quantenchemie: Aufbau der Atome und Moleküle, Spektroskopie: Springer Berlin Heidelberg. S. 93

Leon-Bejarano, M., Dorantes-Mendez, G., Ramirez-Elias, M., Mendez, M. O., Alba, A., Rodriguez-Leyva, I., & Jimenez, M. (2016). Fluorescence background removal method for biological Raman spectroscopy based on empirical mode decomposition. Conf Proc IEEE Eng Med Biol Soc, 2016, S. 3610-3613. doi: 10.1109/EMBC.2016.7591509

Lieber, C. A., & Mahadevan-Jansen, A. (2003). Automated method for subtraction of fluorescence from biological Raman spectra. Appl Spectrosc, 57(11), S. 1363-1367. doi: 10.1366/000370203322554518

Ling, T. K., Liu, Z. K., & Cheng, A. F. (2003). Evaluation of the VITEK 2 system for rapid direct identification and susceptibility testing of gram-negative bacilli from positive blood cultures. J Clin Microbiol, 41(10), S. 4705-4707.

Lipiainen, T., Pessi, J., Movahedi, P., Koivistoinen, J., Kurki, L., Tenhunen, M., . . . Strachan, C. J. (2018). Time-Gated Raman Spectroscopy for Quantitative Determination of Solid-State Forms of Fluorescent Pharmaceuticals. Anal Chem, 90(7), S. 4832-4839. doi: 10.1021/acs.analchem.8b00298

Lopez-Diez, E. C., & Goodacre, R. (2004). Characterization of microorganisms using UV resonance Raman spectroscopy and chemometrics. Anal Chem, 76(3), S. 585-591. doi: 10.1021/ac035110d

Madigan, M. T., Martinko, J. M., Stahl, D. A., & Clark, D. P. (2015). Brock Mikrobiologie kompakt: Pearson Studium. S. 2, 8, 44-47, 81

Maquelin, K., Kirschner, C., Choo-Smith, L. P., van den Braak, N., Endtz, H. P., Naumann, D., & Puppels, G. J. (2002). Identification of medically relevant microorganisms by vibrational spectroscopy. J Microbiol Methods, 51(3), S. 255-271.

Anhang

85

Meisel, S., Stockel, S., Elschner, M., Melzer, F., Rösch, P., & Popp, J. (2012). Raman spectroscopy as a potential tool for detection of Brucella spp. in milk. Appl Environ Microbiol, 78(16), S. 5575-5583. doi: 10.1128/AEM.00637-12

Munchberg, U., Rösch, P., Bauer, M., & Popp, J. (2014). Raman spectroscopic identification of single bacterial cells under antibiotic influence. Anal Bioanal Chem, 406(13), S. 3041-3050. doi: 10.1007/s00216-014-7747-2

Nataf, G. F. (2016). New approaches to understand conductive and polar domain walls by Raman spectroscopy and low energy electron microscopy. (Doctoral dissertation), Université Paris-Saclay, https://tel.archives-ouvertes.fr/tel-01412787/document Abgerufen am 11.10.2018.

Ngo-Thi, N. A., Kirschner, C., & Naumann, D. (2003). Characterization and identification of microorganisms by FT-IR microspectrometry. Journal of Molecular Structure, 661-662, S. 371-380. doi: 10.1016/j.molstruc.2003.08.012

Penel, G., Leroy, G., & Bres, E. (1998). New Preparation Method of Bone Samples for Raman Microspectrometry (Vol. 52).

Perner, P., & Petrou, M. (1999). Machine Learning and Data Mining in Pattern Recognition: First International Workshop: Springer Berlin Heidelberg. S. 169, 170

Pettersson, E., Lundeberg, J., & Ahmadian, A. (2009). Generations of sequencing technologies. Genomics, 93(2), S. 105-111. doi: 10.1016/j.ygeno.2008.10.003

Platt, J. (1999). Probabilistic Outputs for Support Vector Machines and Comparisons to Regularized Likelihood Methods. 10.

Powell, V., & Lehe, L. (2014). Principal Component Analysis Explained Visually. http://setosa.io/ev/principal-component-analysis/ Abgerufen am 19.11.2018.

Prakash, B. D., & Wei, Y. C. (2011). A fully automated iterative moving averaging (AIMA) technique for baseline correction. Analyst, 136(15), S. 3130-3135. doi: 10.1039/c0an00778a

Rösch, P., Harz, M., Schmitt, M., Peschke, K. D., Ronneberger, O., Burkhardt, H., . . . Popp, J. (2005). Chemotaxonomic identification of single bacteria by micro-Raman spectroscopy: application to clean-room-relevant biological contaminations. Appl Environ Microbiol, 71(3), S. 1626-1637. doi: 10.1128/AEM.71.3.1626-1637.2005

Runkler, T. A. (2016). Data Analytics: Models and Algorithms for Intelligent Data Analysis: Springer Fachmedien Wiesbaden. S. 31, 79-81, 99-102

Salzer, R., Thiele, S., & Suemmchen, L. (2017). Schwingungsspektroskopie - kompakt. http://www.chemgapedia.de/vsengine/vlu/vsc/de/ch/3/anc/ir_spek/spek_kompakt.vlu/Page/vsc/de/ch/3/anc/ir_spek/schwspek/methoden/raman_spek/ramanspektrum_m21ht0502.vscml/Supplement/2.html Abgerufen am 2.12.2018.

Samek, O., Obruca, S., Siler, M., Sedlacek, P., Benesova, P., Kucera, D., . . . Zemanek, P. (2016). Quantitative Raman Spectroscopy Analysis of Polyhydroxyalkanoates Produced by Cupriavidus necator H16. Sensors (Basel), 16(11). doi: 10.3390/s16111808

Sato, E. T., & Martinho, H. (2018). First-principles calculations of Raman vibrational modes in the fingerprint region for connective tissue. Biomed Opt Express, 9(4), S. 1728-1734. doi: 10.1364/BOE.9.001728

Schölkopf, B., Platt, J. C., Shawe-Taylor, J., Smola, A. J., & Williamson, R. C. (2001). Estimating the support of a high-dimensional distribution. Neural Comput, 13(7), S. 1443-1471. doi: 10.1162/089976601750264965

Schrader, B., Schulz, H., Andreev, G. N., Klump, H. H., & Sawatzki, J. (2000). Non-destructive NIR-FT-Raman spectroscopy of plant and animal tissues, of food and works of art. Talanta, 53(1), S. 35-45.

Anhang

86

Schulze, G., Jirasek, A., Yu, M. M., Lim, A., Turner, R. F., & Blades, M. W. (2005). Investigation of selected baseline removal techniques as candidates for automated implementation. Appl Spectrosc, 59(5), S. 545-574. doi: 10.1366/0003702053945985

Sengupta, A., Mujacic, M., & Davis, E. J. (2006). Detection of bacteria by surface-enhanced Raman spectroscopy. Anal Bioanal Chem, 386(5), S. 1379-1386. doi: 10.1007/s00216-006-0711-z

Sil, S., Mukherjee, R., Kumar, N. S., S, A., Kingston, J., & Singh, U. K. (2017). Detection and classification of Bacteria using Raman Spectroscopy Combined with Multivariate Analysis. Defence Life Science Journal, 2(4). doi: 10.14429/dlsj.2.12275

Sivanesan, A., Witkowska, E., Adamkiewicz, W., Dziewit, L., Kaminska, A., & Waluk, J. (2014). Nanostructured silver-gold bimetallic SERS substrates for selective identification of bacteria in human blood. Analyst, 139(5), S. 1037-1043. doi: 10.1039/c3an01924a

Skoog, D. A., Holler, F. J., Crouch, S. R., Föllner, B., Möhring, H. J., & Niessner, R. (2013). Instrumentelle Analytik: Grundlagen - Geräte - Anwendungen: Springer Berlin Heidelberg. S. 321-333

Sogawa, K., Watanabe, M., Sato, K., Segawa, S., Miyabe, A., Murata, S., . . . Nomura, F. (2012). Rapid identification of microorganisms by mass spectrometry: improved performance by incorporation of in-house spectral data into a commercial database. Anal Bioanal Chem, 403(7), S. 1811-1822. doi: 10.1007/s00216-011-5656-1

Spanu, T., Sanguinetti, M., Ciccaglione, D., D'Inzeo, T., Romano, L., Leone, F., & Fadda, G. (2003). Use of the VITEK 2 system for rapid identification of clinical isolates of Staphylococci from bloodstream infections. J Clin Microbiol, 41(9), S. 4259-4263.

Steinbüchel, A., Oppermann-Sanio, F. B., Ewering, C., & Pötter, M. (2012). Mikrobiologisches Praktikum: Versuche und Theorie: Springer Berlin Heidelberg. S. 39, 40, 333

Strola, S. A., Baritaux, J. C., Schultz, E., Simon, A. C., Allier, C., Espagnon, I., . . . Dinten, J. M. (2014). Single bacteria identification by Raman spectroscopy. J Biomed Opt, 19(11), S. 111610. doi: 10.1117/1.JBO.19.11.111610

Suerbaum, S., Burchard, G. D., Kaufmann, S. H. E., & Schulz, T. F. (2016). Medizinische Mikrobiologie und Infektiologie: Springer Berlin Heidelberg. S. 147

Teixeira-Dias, J. J. C. (2017). Molecular Physical Chemistry: A Computer-based Approach using Mathematica® and Gaussian: Springer International Publishing. S. 176

Teng, L., Wang, X., Wang, X., Gou, H., Ren, L., Wang, T., . . . Xu, J. (2016). Label-free, rapid and quantitative phenotyping of stress response in E. coli via ramanome. Sci Rep, 6, S. 34359. doi: 10.1038/srep34359

Van de Vossenberg, J., Tervahauta, H., Maquelin, K., Blokker-Koopmans, C. H. W., Uytewaal-Aarts, M., van der Kooij, D., . . . van der Gaag, B. (2013). Identification of bacteria in drinking water with Raman spectroscopy. Analytical Methods, 5(11), S. 2679-2687. doi: 10.1039/C3AY40289D

Van den Burg, G., & Groenen, P. (2016). A Generalized Multiclass Support Vector Machine. Journal of Machine Learning Research, 17.

Vargis, E., Tang, Y. W., Khabele, D., & Mahadevan-Jansen, A. (2012). Near-infrared Raman Microspectroscopy Detects High-risk Human Papillomaviruses. Transl Oncol, 5(3), S. 172-179.

Anhang

87

Villa, J. L., Boqué, R., & Ferré, J. (2008). Calculation of the probability of correct classification in probabilistic bagged k-Nearest Neighbours. Chemometrics and Intelligent Laboratory Systems, 94(1), S. 51-59. doi: 10.1016/j.chemolab.2008.06.007

Wang, P., Pang, S., Pearson, B., Chujo, Y., McLandsborough, L., Fan, M., & He, L. (2017). Rapid concentration detection and differentiation of bacteria in skimmed milk using surface enhanced Raman scattering mapping on 4-mercaptophenylboronic acid functionalized silver dendrites. Anal Bioanal Chem, 409(8), S. 2229-2238. doi: 10.1007/s00216-016-0167-8

Willemse-Erix, D. F., Jachtenberg, J. W., Schut, T. B., van Leeuwen, W., van Belkum, A., Puppels, G., & Maquelin, K. (2010). Towards Raman-based epidemiological typing of Pseudomonas aeruginosa. J Biophotonics, 3(8-9), S. 506-511. doi: 10.1002/jbio.201000026

Witkowska, E., Korsak, D., Kowalska, A., Ksiezopolska-Gocalska, M., Niedziolka-Jonsson, J., Rozniecka, E., . . . Kaminska, A. (2017). Surface-enhanced Raman spectroscopy introduced into the International Standard Organization (ISO) regulations as an alternative method for detection and identification of pathogens in the food industry. Anal Bioanal Chem, 409(6), S. 1555-1567. doi: 10.1007/s00216-016-0090-z

Zhang, L., & Henson, M. J. (2007). A practical algorithm to remove cosmic spikes in Raman imaging data for pharmaceutical applications. Appl Spectrosc, 61(9), S. 1015-1020. doi: 10.1366/000370207781745847

Zhang, P., Kong, L., Wang, G., Setlow, P., & Li, Y. Q. (2011). Monitoring the wet-heat inactivation dynamics of single spores of Bacillus species by using Raman tweezers, differential interference contrast microscopy, and nucleic acid dye fluorescence microscopy. Appl Environ Microbiol, 77(14), S. 4754-4769. doi: 10.1128/AEM.00194-11

Zhang, X., Chen, S., Ling, Z., Zhou, X., Ding, D. Y., Kim, Y. S., & Xu, F. (2017). Method for Removing Spectral Contaminants to Improve Analysis of Raman Imaging Data. Sci Rep, 7, S. 39891. doi: 10.1038/srep39891

Eidesstattliche Versicherung

88

Eidesstattliche Versicherung

Ich versichere an Eides statt, dass ich die vorliegende Arbeit selbständig angefertigt und

mich fremder Hilfe nicht bedient habe.

Alle Stellen, die wörtlich oder sinngemäß veröffentlichtem oder nicht veröffentlichtem

Schrifttum entnommen sind, habe ich als solche kenntlich gemacht.

_____________________ ____________________________________

Ort, Datum Unterschrift