D.2.2 Aufreinigung und Größenselektion der isolierten...

36
D Ergebnisse 69 D.2.2 Aufreinigung und Größenselektion der isolierten Metagenom-DNA Die Reinigung der DNA erfolgte in einer 2-phasigen Agarosegelelektrophorese, die in unserem Labor entwickelt wurde (Quaiser et al., 2002). Dabei besteht die erste Phase des Gels aus 1% Agarose mit 2% Polyvinylpyrrolidon (PVP) und die zweite aus normaler Agarose. Mit dieser Methode ist es möglich, die DNA von polyphenolischen Komponenten wie Huminsäuren zu reinigen, indem das PVP diese zurückhält und die DNA frei wandern kann. Um das PVP, das seinerseits die DNA für molekularbiologische Methoden unzugänglich machen würde, wieder zu entfernen, wurde eine zweite Phase mit normaler Agarose angeschlossen. Aus dieser kann dann die gereinigte DNA isoliert werden. Die Methode ist auch mittels zweier getrennter Gele möglich (Treusch, 2000), doch konnten durch die Zusammenfassung der beiden Elektrophoresen die Verluste minimiert werden. Für die Reinigung wurde das 2-Phasengel mit einer großen Tasche in der Mitte hergestellt, die das komplette Volumen der aufkonzentrierten DNA aufnehmen konnte. Weiterhin wurde die zweite Phase mit low melting Agarose angesetzt, um die DNA später mittels GELase aus der Agarose isolieren zu können. Abbildung 8: 2-Phasen Pulsfeldgelelektrophorese von hochmolekularer DNA aus Rotböll. Gezeigt sind die gefärbten Ränder des Gels vor (a) und die restlichen Gelstücke nach dem Ausschneiden der DNA richtiger Größe (b). Das Gel bestand aus 1% Agarose, wobei in der 1. Phase zusätzlich 2% PVP zugegeben wurde. Bei (b) sind die oberen Hälften der beiden ausgeschnittenen Gelstücke gefärbt und an ihrer ursprünglichen Position eingefügt worden. M 1: MidRange PFG Marker I, M2: λ-DNA/EcoRI+HindIII-Marker. Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen, die eine Auftrennung der DNA bis zu einer Größe von ca. 40 kb bewirkten. Die DNA, die M 1 M 2 M 1 RUD-DNA 21,2 kb ~ 40 kb a) b) M 2 M 2 1. Phase 2. Phase M 2

Transcript of D.2.2 Aufreinigung und Größenselektion der isolierten...

Page 1: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

69

D.2.2 Aufreinigung und Größenselektion der isolierten Metagenom-DNA

Die Reinigung der DNA erfolgte in einer 2-phasigen Agarosegelelektrophorese, die inunserem Labor entwickelt wurde (Quaiser et al., 2002). Dabei besteht die erste Phase desGels aus 1% Agarose mit 2% Polyvinylpyrrolidon (PVP) und die zweite aus normalerAgarose. Mit dieser Methode ist es möglich, die DNA von polyphenolischen Komponentenwie Huminsäuren zu reinigen, indem das PVP diese zurückhält und die DNA frei wandernkann. Um das PVP, das seinerseits die DNA für molekularbiologische Methodenunzugänglich machen würde, wieder zu entfernen, wurde eine zweite Phase mit normalerAgarose angeschlossen. Aus dieser kann dann die gereinigte DNA isoliert werden. DieMethode ist auch mittels zweier getrennter Gele möglich (Treusch, 2000), doch konntendurch die Zusammenfassung der beiden Elektrophoresen die Verluste minimiert werden.Für die Reinigung wurde das 2-Phasengel mit einer großen Tasche in der Mitte hergestellt,die das komplette Volumen der aufkonzentrierten DNA aufnehmen konnte. Weiterhin wurdedie zweite Phase mit low melting Agarose angesetzt, um die DNA später mittels GELase ausder Agarose isolieren zu können.

Abbildung 8: 2-Phasen Pulsfeldgelelektrophorese von hochmolekularer DNA aus Rotböll. Gezeigt sind diegefärbten Ränder des Gels vor (a) und die restlichen Gelstücke nach dem Ausschneiden der DNA richtiger Größe(b). Das Gel bestand aus 1% Agarose, wobei in der 1. Phase zusätzlich 2% PVP zugegeben wurde. Bei (b) sinddie oberen Hälften der beiden ausgeschnittenen Gelstücke gefärbt und an ihrer ursprünglichen Position eingefügtworden. M 1: MidRange PFG Marker I, M2: λ-DNA/EcoRI+HindIII-Marker.

Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen, die eineAuftrennung der DNA bis zu einer Größe von ca. 40 kb bewirkten. Die DNA, die

M 1 M 2 M 1 RUD-DNA

21,2 kb

~ 40 kb

a) b)

M 2 M 2

1. Phase

2. Phase

M 2

Page 2: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

70

höhermolekular war, lief in einer Kompressionszone bei der Ausschlussgröße und wurdesomit aufkonzentriert. Dies ist gut an den gefärbten Rändern des Pulsfeldgels zu sehen(Abb. 8 a). Anhand dieser Ränder konnte die Laufweite der DNA bestimmt und diesemarkiert werden. Anschließend wurden dann zwei Gelstücke im Bereich derKompressionszone (>40 kb) und knapp darunter (ca. 20-40 kb) aus dem weder mitEthidiumbromid gefärbten, noch mit UV-Licht bestrahlten Mittelteil des Gels ausgeschnitten.Diese Gelstücke wurden weiter verkleinert, indem der obere Teil (1/3 bis 1/2) abgeschnittenwurde. Diese oberen Teile wurden zusammen mit den anderen Stücken des Mittelteils desGels gefärbt und unter UV-Licht analysiert (Abb. 8 b). Gut zu sehen ist hierbei der DNA-„Schmier“ bis zu sehr niedermolekularen Bereichen. Auch kann man links und rechts aufdem Gel oberhalb der ausgeschnittenen Gelstücke noch teilweise Reste derhochmolekularen DNA erkennen. Die oberen Teile der ausgeschnittenen Gelstücke zeigennur kleine Reste von DNA, vor allem jenes aus dem Bereich der Kompressionzone.Interessanterweise beginnt die Lauffront der DNA in diesem Gelstück bei einer deutlichgeringeren Größe als dies anhand der Reste im oberen Gelabschnitt zu erwarten gewesenwäre. Bei Betrachtung des rechten Gelrandes im Querschnitt war der Grund dafür ersichtlich:die DNA lief am Boden des Gels und zog erst zur Lauffront hin in obere Gelbereiche hoch.Somit wurde die hochmolekulare DNA fast komplett ausgeschnitten. Die Extraktion der DNAaus dem Gel erfolgte mit Hilfe des Enzyms GELase.In einer anschließenden gelelektrophoretischen Analyse der DNA-Lösungen stellte sichheraus, dass in allen Ansätzen DNA vorhanden, deren Konzentration aber recht gering war.Die Ansätze wurden deshalb vereinigt und auf weniger als 1/20 des Ursprungsvolumenseingeengt. Dabei blieb die DNA-Lösung klar und ungefärbt.Die DNA wurde zusammen mit zwei weiteren DNA-Präparationen, die von Robert Pieper undBernd Köhler (BRAIN AG) aus den Böden S247 und S248 isoliert, und nach demselbenVerfahren gereinigt worden waren, gelelektrophoretisch untersucht (Abb. 9). Anhand derunterschiedlichen Mengen an aufgetragenem Marker (Spuren A bis D) konnte dieKonzentration der verschiedenen DNA-Lösungen abgeschätzt werden. Die DNAs von RUD(Spur 1) und S247 (Spur 2) hatten eine Konzentration von ca. 50 ng/µl, die von S248 (Spur3) eine von ca. 100 ng/µl.Um die Sauberkeit der DNA zu überprüfen wurden jeweils 1 µl einer 1:1, 1:10, 1:100 und1:1000 Verdünnung in eine PCR mit archaealen 16S rDNA-primern (Arch20F/Arch958R)eingesetzt. Die Ergebnisse sind in Abbildung 9 in den Spuren 4 bis 7 zu sehen. Demnachwar es möglich, mit der aufgearbeiteten RUD-DNA unverdünnt ein PCR-Produkt zu erhalten.Allerdings zeigten sich noch gewisse Hemmeffekte, denn das PCR-Produkt in der 1:10Verdünnung war deutlich stärker, während die Menge an Produkt bis zur 1:1000 Verdünnungkontinuierlich abnahm.Somit konnten aus etwa 285 Gramm Boden 10 µg hochmolekulare DNA isoliert werden, diegroßteils frei von Huminsäuren war.

Page 3: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

71

Abbildung 9: Agarosegelelektrophorese (1%) von hochmolekularen DNAs von RUD, S247 und S248. Ferner isteine 16S rDNA-PCR mit archaealen primern von verschiedenen Verdünnungen von RUD-DNA gezeigt. Zu sehensind λ-DNA/EcoRI+HindIII-Marker in den Mengen 500 ng (A), 250 ng (B), 125 ng (C), 62,5 ng (D);hochmolekulare DNA von RUD (1), S247 (2), S248 (3); 16S PCR mit Archaea-spezifischen primern undfolgenden DNAs als Matrizen: RUD 1:1 (4), 1:10 (5), 1:100 (6), 1:1000 (7); S. solfataricus (8), Wasser (9).

D.2.3 Klonierung von hochmolekularen Metagenom-DNAs in Fosmid-Vektoren

Um die aufgearbeitete hochmolekulare DNA aus RUD und die beiden von Bernd Köhler undRobert Pieper zur Verfügung gestellten DNAs von S247 und S248 zu klonieren wurde derFosmid-Vektor pEpiFOS-5 verwendet (Abb. 4, Material und Methoden). Der Ablauf und dieEffizienz der Klonierungen der drei DNAs ist in Tabelle 2 zusammengefasst.Für die Klonierung mussten erst die Enden der DNAs vorbereitet, d.h. geglättet werden.Dazu wurden je DNA von RUD und S248 ca. 2,5 µg in den jeweiligen Enden-Modifizierungsansatz eingesetzt, von S247 das gesamte vorhandene Material (ca. 2 µg). Fürdie Ligation in den Fosmid-Vektor wurde ein molekulares Verhältnis von ca. 1 zu 0,86 bis1 zu 0,66 (Vektor:Insert) gewählt. Anschließend erfolgte die Verpackung in Phagenköpfe unddie Infektion der E. coli-Zellen.Trotz eines sehr standardisierten Ablaufs der Modifizierung der Enden, der Ligation,Verpackung und Infektion zeigten sich deutliche Unterschiede bei den erhaltenen Klonzahlenaus den drei DNA-Präparationen (Tab. 2). So lieferten die DNAs von RUD003 und S247Klonierungseffizienzen mit 12 bzw. 8 Klonen pro Nanogramm eingesetzter Umwelt-DNA,während S248 mit 203 Klonen pro Nanogramm eingesetzter DNA eine um 17- bis 25-fachhöhere Effizienz zeigte. Beim Vergleich mit den Effizienzen der Verpackung waren weitereUnterschiede, aber auch Gemeinsamkeiten auszumachen. So lag zwischen der allgemeinenKlonierungseffizienz von RUD003 und S247 nur ein Faktor von 1,5, bei denVerpackungseffizienzen betrug er schon über 2. Vergleicht man die Faktoren derKlonierungs- bzw. Verpackungseffizienzen zwischen RUD003 und S248, so betrugen sie inbeiden Fällen 17, wohingegen sie im Vergleich von S247 mit S248 mit 25 zwischen den

A B C 1kb

21,2

5,1

1,4

2 3 4 5 6 7 8 9D

940 bp

Page 4: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

72

Klonierungseffizienzen und 35 zwischen den Verpackungseffizienzen doch sehr starkvoneinander abwichen.

Tabelle 2: Übersicht zur Herstellung der Umwelt-Genbanken.

Genbank RUD003 S247 S248

Ökosystem nährstoffarmer Sandboden Graslandboden Mischwaldboden

Art der DNA-Isolierung CTAB/Proteinase K/

SDS*

Lysozym/ Proteinase K/

SDS**

Lysozym/ Proteinase K/

SDS**

Enden-Modifizierungs-Ansätze

(jeweils eingesetzte DNA)

2

(2,5 µg)

1

(2 µg)

1

(2,5 µg)

Ligationen

(jeweils eingesetzte DNA)

3

(1 µg)

2

(0,8 µg)

1

(1 µg)

Verpackungsreaktionen

(jeweils eingesetzte DNA)

12

(250 ng)

9

( 5x 200 + 4x 150 ng)***

1

(250 ng)

Anzahl der insgesamt erhaltenen

Klone

35.160 12.980 50.800

Effizienz der Verpackung

(∅ Klone/Verpackungsextrakt)

2.930 1.442 50.800

Effizienz der Klonierung

(Klone/ng eingesetzter DNA)

12 8 203

Anzahl der insgesamt

konservierten Klone

30.366 11.520 19.968#

Anzahl der gelagerten

Mikrotiterplatten (384 Kavitäten)

79 30 52

Menge an konservierter Boden-

DNA (Mbp)

1.215 461 799

* beschrieben unter C.7.2 bis C.7.4** beschrieben unter Treusch et al., 2004, durchgeführt durch Robert Pieper und Bernd Köhler*** um die Effizienzen zu Erhöhen wurden bei S247 4-mal nur ca. 150 ng DNA pro Verpackungsreaktion eingesetzt# zusätzlich wurden die restlichen Klone in 30 Untergruppen gemischt abgeschwemmt und konserviert

Schwankungen wurden auch beim Vergleich der einzelnen Arbeitsschritte von nur einer DNAdeutlich. Diese sollen hier anhand der Herstellung der Genbank RUD003 näher erläutertwerden (Tab. 3). So waren die Anzahl der erhaltenen Klone bei den beiden Enden-Modifizierungsreaktionen mit 14 Klonen pro Nanogramm eingesetzter DNA und 8 Klonen proNanogramm DNA verschieden. Auch bei den drei Ligationen zeigten sich Differenzenzwischen den Effizienzen der Ansätze mit 8, 11 und 17 Klonen pro Nanogramm eingesetzterDNA. Sehr drastisch sind die Unterschiede zwischen den einzelnen Verpackungsreaktionen:

Page 5: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

73

hier wurden bei gleichen Mengen an eingesetzten Ligationsansätzen je Reaktion Klonzahlenzwischen 150 und 5.350 erhalten.

Tabelle 3: Daten zur Herstellung der Genbank RUD003.

Enden-Modifizierung* Ligation* Verpackungs-reaktion Nr.**

Klone Klone/Ligation

Klone/Verpackungsreaktion

1 3.3002 5.2103 3.2604 2.410#

11 µg; 17/ng

5 2.410#

16.590 3.318

6 1.5007 150

8 7709 3.870

12,5 µg; 14/ng

21 µg; 11/ng

11 4.550

10.840 2.168

10 2.38022,5 µg; 8/ng

31 µg; 8/ng 12 5.350

7.730 3.865

* Angaben sind immer: Ansatz Nr.; eingesetzte DNA-Menge (µg); Effizienz (Klone/ng DNA)** je 250 ng DNA eingesetzt# Verpackungsreaktionen 4 + 5 wurden zusammen ausgewertet (4.820 Klone)

D.2.4 Restriktionsanalysen von Einzelklonen

Um die Qualität der erhaltenen Genbanken abschätzen zu können, wurden bei RUD003 von20 zufällig ausgesuchten Einzelklonen und bei S247 und S248 von je 10 Einzelklonen dieFosmide isoliert und durch Hydrolyse mit dem Enzym NotI (Erkennungssequenz:GC/GGCCGC) analysiert. NotI schneidet flankierend zur inserierten DNA im Fosmidvektor.Abbildung 10 zeigt die Fosmide aus der Genbank RUD003: bis auf einen Klon bei dem keineFosmid-DNA isoliert werden konnte (Spur 1), zeigten alle Klone die Vektorbande bei ca.7,5 kb. Bei 8 Klonen zeigte sich neben dieser nur ein weiteres Fragment, bei 5 weiterenKlonen nur zwei zusätzliche. Alle anderen klonierten DNAs wurden durch das Enzym in mehrals 3 Fragmente zerlegt, was auf einen hohen G+C-Gehalt des jeweiligen kloniertenFragments schließen lässt. Vektorbanden wurden auch bei allen analysierten Klonen derGenbanken S247 (Abb. 11, Spuren 1-10) und S248 (Spuren 11-20) festgestellt. Dieunterschiedliche Anzahl an zusätzlichen Restriktionsfragmenten deutete auch hier aufklonierte DNA-Fragmente mit unterschiedlichen G+C-Gehalten hin.Um die Klone der Genbanken zu konservieren, wurden diese geordnet in Mikrotiterplattenabgelegt, angezogen und bei -80 °C gelagert. Von den Genbanken RUD003 und S247wurden alle von den Agarplatten abnehmbaren Einzelklone auf diese Art konserviert (30.366bzw. 11.520; siehe Tab. 2), von S248 nur 19.968. Die restlichen über 30.000 Klone wurden,

Page 6: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

74

Abbildung 10: Pulsfeldgelelektrophorese-Analyse von mit NotI geschnittenen Fosmid-Klonen der GenbankRUD003. Verwendete Marker: MidRange PFG Marker I (A), λ-DNA/EcoRI+HindIII-Marker (B), Gene Ruler DNAladder Mix (C). Die Pfeile markieren die Vektorbande bei 7,5 kb.

Abbildung 11: Pulsfeldgelelektrophorese-Analyse von mit NotI geschnittenen Fosmid-Klonen der GenbankenS247 (1-10) und S248 (11-20). Verwendete Marker: MidRange PFG Marker I (A), λ-DNA/EcoRI+HindIII-Marker(B), Gene Ruler DNA ladder Mix (C). Die Pfeile markieren die Vektorbande bei 7,5 kb.

A B C 1kb

21

5

1

2 3 4 5 6 7 8 9 AC B11 12 13 14 15 16 17 18 1910 20

48

3

2

1510

A B C 1kb

21

5

1

2 3 4 5 6 7 8 9 AC B11 12 13 14 15 16 17 18 1910 20

48

3

2

1510

Page 7: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

75

aufgeteilt in 30 Untergruppen, von den Agarplatten abgeschwemmt und mit Glycerin versetztebenfalls bei -80 °C gelagert.Anhand der über die Restriktionsanalyse bestimmten durchschnittlichen Größe der kloniertenFragmente von 40 kb wurde die Menge an geordnet konservierter Umwelt-DNA extrapoliert(Tab. 2). Sie betrug bei RUD003 1.215 Mbp, bei S247 461 Mbp und bei S248 ohne die 30gemischten Konserven 799 Mbp.Für die weiteren Studien wurde zusätzlich zu den drei oben beschriebenen Genbanken dieBank RUD001 verwendet. Diese war von Achim Quaiser nach einem anderen Verfahrenebenfalls aus Boden des Ökosystems Rotböll hergestellt worden und umfasste 25.344 Klonemit 1.014 Mbp konservierter Umwelt-DNA (Quaiser et al., 2002).

D.3 Charakterisierung der Metagenombanken

Um die erstellten Metagenombanken zu charakterisieren, wurden zwei Ansätze gewählt:zum einen wurde in einer Stichprobe die für die Herstellung der Genbanken verwendeteDNA auf ihre archaeale und bakterielle 16S rDNA-Diversität hin untersucht, zum anderenwurden von zufällig ausgewählten Fosmidklonen der drei Genbanken randständige DNA-Sequenzen (Endsequenzen) in einem Umfang von insgesamt 4 Mbp bestimmt.

D.3.1 Bestimmung der bakteriellen und archaealen Diversität in den für die Herstellungder Genbanken verwendeten DNAs

Für die Bestimmung der Diversität in den für die Genbanken verwendeten DNAs wurden diedarin enthaltenen 16S rRNA-kodierenden Gene mittels zweier primer-Paareherausamplifiziert, um sie klonieren und sequenzieren zu können. Für die Archaea wurdedas primer-Paar Arch20F/Arch958R (DeLong et al., 1992) gewählt, für die BakterienUniv27F/Univ1390R (DeLong et al., 1992, Reysenbach et al., 1995). Bis auf dieAmplifizierung archaealer 16S rRNA-Gene aus der DNA von S248, wurden bei allenAnsätzen Produkte erhalten, wobei allerdings teilweise Fehlamplifikate anderer Größenauftraten. Durch eine Erhöhung der Zyklenzahl auf 35 und mehrere parallel durchgeführteAnsätze konnte letztendlich auch bei S248 genügend PCR-Produkt für eine Klonierungamplifiziert werden. Die PCR-Produkte richtiger Größe wurden aus den Agarosegelenausgeschnitten und aus dem Gel extrahiert. In Abbildung 12 a) und c) sind die so gereinigtenca. 940 bp großen archaealen, und in b) und d) die ca. 1.350 bp großen bakteriellen PCR-Produkte zu sehen. Alle Produkte wurden kloniert, wobei die Anzahlen an erhaltenen Klonenrecht gut die Mengen an eingesetzten DNAs widerspiegelten. Bei den gereinigtenarchaealen PCR-Produkten hatte S248 (134 Klone) die höchste DNA-Konzentration, gefolgtvon RUD003 (98 Klone) und S247 (41 Klone). Die Ausbeuten bei der Klonierung derbakteriellen PCR-Produkte variierten ebenfalls von 128 Klonen bei S247 zu 81 bei S248 zu

Page 8: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

76

62 bei RUD003, wobei diese allerdings nicht so gut mit den Mengen an eingesetzter DNAkorrelierten.

Abbildung 12: Agarosegelelektrophorese (1%) von über Gelextraktion gereinigten 16S rDNA PCR-Produktenaus den für die Herstellung der Genbanken verwendeten DNAs. Zu sehen sind die (a) archaealen Produkte vonRUD003, S247 und S248 (Spuren 1-3) bzw. die (b) bakteriellen (Spuren 1-3), weiterhin das archaealen Produktsvon S248 (c; Spur 3) und das bakteriellen von S247 (d; Spur 2). M: λ-DNA/EcoRI+HindIII-Marker.

Tabelle 4: 16S rDNA-Klonbibliotheken aus den für die Herstellung der Genbanken verwendeten DNAs.

Genbank RUD003 S247 S248

Klone Archaea Bakterien Archaea Bakterien Archaea Bakterien

erhalten 98 62 41 128 134 81

mit Kolonie-PCR untersucht 25 19 41 40 40 40

mit RFLP* untersucht 15 14 41 40 40 40

Anzahl der erhaltenen Muster 6 14 4 40 8 40

sequenziert** 12 24 12 24 12 24

* RFLP: restriction fragment length polymorphism Analyse** Die Sequenzauswertung der bakteriellen Klone ist in Abb. 15 dargestellt.

Von einem Teil der erhaltenen Klone (Tab. 4, Zeile 2) wurden mittels PCR von Kolonien dieklonierten Fragmente herausamplifiziert und durch Restriktionsanalyse mit NdeII untersucht(Tab. 4). Die Ergebnisse dieser RFLP-Analysen sind am Beispiel von S248 in denAbbildungen 13 und 14 gezeigt. Die bakteriellen Klone waren alle unterschiedlich (Abb. 13),obwohl manchmal die Abweichungen in nur minimal anderen Fragmentgrößen bestanden(z.B. Klone 19 und 20). Bei den archaealen Klonen zeigte sich ein anderes Bild: hier tratennur insgesamt 8 verschiedene RFLP-Muster auf (Abb. 14). Auch bei den anderenKlonbibliotheken zeigte sich ein ähnliches Bild. So traten bei S247 nur vier verschiedene

a) b) c) d)

1350 bp

1 32

940 bp940 bp

1350 bp

M M M M1 32 1 32 1 2

Page 9: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

77

archaeale RFLP-Muster auf, bei RUD003 sechs (Tab. 4). Alle untersuchten bakteriellenKlone zeigten auch hier voneinander abweichende Muster (Daten nicht gezeigt).

Abbildung 13: Agarosegelelektrophorese (3%) der bakteriellen 16S rDNA Restriktionsfragmente von S248.Gezeigt sind die Muster der Klone 18 bis 33. M: λ-DNA/EcoRI+HindIII-Marker.

Abbildung 14: Agarosegelelektrophorese (3%) der archaealen 16S rDNA Restriktionsfragmente von S248.Gezeigt sind die Muster der Klone 15 bis 30. M: Gene Ruler DNA ladder Mix.

18bp

2027

1375

564

19 20 21 22 23 24 25 26 MM 28 29 30 31 32 3327

947831

19041584

15bp

1031

300

16 17 18 19 20 21 22 23 MM 25 26 27 28 29 3024

600500

1500

200

100

400

700800

Page 10: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

78

Von je 12 klonierten archaealen Fragmenten jeder DNA wurden unter Berücksichtigung allerverschiedenartigen Muster die Sequenzen bestimmt. Bei den bakteriellen Klonen wurden jeGenbank 24 mit möglichst verschiedenartigen RFLP-Mustern ausgewählt und ihreSequenzen bestimmt. Nahezu alle sequenzierten Fragmente kodierten wie erwartet für 16SrRNA-Gene der entsprechenden Organismengruppen. Einzige Ausnahme bildeten dieuntersuchten archaealen Klone von S248: hier kodierten nur 8 Fragmente für 16S rRNA-Gene, der Rest zeigte keine Ähnlichkeiten mit Genen aus den Datenbanken. Die Sequenzenwurden zur Rekonstruktion phylogenetischer Stammbäume in das Programmpaket ARBimportiert. Die Berechnung der Stammbäume erfolgte durch Torsten Ochsenreiter.Parallel zu dieser Diversitätsstudie mit den DNAs von RUD003, S247 und S248 wurde vonAchim Quaiser die für die Klonierung der Genbank RUD001 verwendete DNA entsprechenduntersucht. Die daraus hervorgegangenen Daten werden hier vergleichend mit aufgeführtund später auch diskutiert.Alle erhaltenen archaealen 16S rRNA-Gene aus den DNAs von RUD001, RUD003 und S247fielen in die Gruppe 1.1b der mesophilen Crenarchaeota, die hauptsächlich in Bödenvorkommen und auch zuvor im Ökosystem RUD nachgewiesen wurden (Ochsenreiter et al.,2003). Dabei wurden trotz der nahen Verwandtschaft keine identischen Sequenzengefunden. Bei S248 wurde, neben Sequenzen die in die Gruppe 1.1b fielen, auch eineSequenz gefunden, die zur Gruppe 1.1c gehörte, einer vorher hauptsächlich in finnischenWaldböden beschriebenen Gruppe.

Abbildung 15: Verteilung der analysierten 16S rDNA-Klone aus den für die Herstellung der Genbankenverwendeten DNAs auf verschiedene bakterielle Phyla. RUD001 (grün), RUD003 (rot), S247 (gelb), S248 (blau).Die phylogenetische Zuordnung erfolgte über das Programmpaket ARB.

0

1

2

3

4

5

6

Anza

hl

Alpha-Proteo

bacter

ia

Beta-Proteo

bacter

ia

Acidobac

teria

Nitrosp

ira

Plancto

mycete

s

Gemmim

onas

Actinobac

teria

OP9

Bacter

oidetes

Chlorobi

Chloroflexi

TM7OP11

ohne Zuordnung

RUD001RUD003

S247S248

RUD001

RUD003

S247S248

Page 11: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

79

Anhand der phylogenetischen Analyse der generierten bakteriellen Sequenzen konntegezeigt werden, dass in den DNAs von RUD001 und RUD003 jeweils 16S rRNA-Gene vonOrganismen aus mindestens 6 bzw. 7 verschiedenen bakteriellen Phyla vertreten waren(Abb. 15). Interessanterweise überlappten nur zwei Phyla (Alpha-/Beta-Proteobacteria bzw.Gemmimonas). In S247 und S248 konnten 16S rDNAs die in jeweils 6 verschiedene Phylafielen, nachgewiesen werden. Aufgrund der sehr kleinen Stichprobe können vergleichendeAussagen nicht getroffen werden, doch ist insgesamt eine bakterielle Diversität, die 12 Phylaabdeckt in den DNAs zu finden.

D.3.2 Bestimmung von randständigen DNA-Sequenzen (Endsequenzen) zurCharakterisierung der Genbanken

Um die Genbanken genauer zu charakterisieren, wurden von 2.688 zufällig ausgewähltenFosmid-Klonen der drei Genbanken jeweils beide randständigen Sequenzen bestimmt. Eswurden 1 536 Sequenzen aus der Genbank RUD001, 3.072 Sequenzen aus RUD003 und768 Sequenzen aus S248 erstellt (siehe Tab. 5). Somit ergab sich eine Gesamtmenge ansequenzierter DNA von 4,03 Mbp. Von den generierten 5.376 Sequenzen hatten 5.125 einehohe Qualität und wurden für weitere Auswertungen verwendet.

Tabelle 5: Übersicht der aus den drei Genbanken ermittelten randständigen DNA-Sequenzen (Endsequenzen).

Genbank RUD001 % RUD003 % S248 % total %

sequenzierte Klone 768 1.536 384 2.688

erstellte Sequenzen 1.536 3.072 768 5.376

Gesamtmenge an sequenzierter DNA (Mbp) 1,15 2,3 0,58 4,03

Sequenzen von hoher Qualität * 1.447 100 2.915 100 763 100 5.125 100

Sequenzen mit Ähnlichkeiten <e-15 ** 594 41,0 1.244 42,7 422 55,3 2.260 44,1

Klone mit Treffern 422 917 289 1.628

Klone mit Treffern auf nur einer Seite 250 590 156 996

Klone mit Treffern auf beiden Seiten 172 327 133 632

höchste Ähnlichkeit mit bakteriellem Gen 575 39,7 1.166 40,0 410 53,7 2.151 42,0

höchste Ähnlichkeit mit archaealem Gen 11 0,8 36 1,2 10 1,3 57 1,1

höchste Ähnlichkeit mit eukaryontischem Gen 6 0,4 27 0,9 2 0,3 35 0,7

höchste Ähnlichkeit mit Bakteriophagen-Gen 2 0,1 16 0,6 0 0 18 0,3

* alle Sequenzen waren länger als 700 bp, die Mehrzahl ca. 750 bp** e-Werte von BlastX-Vergleichen gegen die NR Datenbank

Page 12: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

80

D.3.2.1 Analyse des G+C-Gehalts der Endsequenzen

Die Analyse des G+C-Gehalts der in den Genbanken abgelegten DNAs ergab deutlicheUnterschiede. Obwohl die DNAs für die Genbanken RUD001 und RUD003 aus demselbenBoden stammten, wurden in den Genbanken G+C-Gehalte von durchschnittlich 61% bzw.51,25% bestimmt. Somit war der G+C-Gehalt von RUD001-DNA ähnlich dem von S248-DNA, der mit 60% G+C bestimmt wurde. In einer genaueren Analyse wurde die Verteilungder einzelnen Sequenzen auf verschiedene G+C-Bereiche betrachtet (Abb. 16). Hierbeiwurde bei RUD001 und S248 eine glockenförmige Verteilung mit einem Maximum bei 60-65% G+C erkannt. RUD003 hingegen zeigte eine breitere Verteilung der Sequenzen mitzwei Maxima, wovon sich eins bei 45-50% und das andere bei 60-65% G+C befindet. DerAnteil an Sequenzen mit einem G+C-Gehalt unter 50% war im Fall von RUD003 erheblichhöher als in den beiden anderen Genbanken.

Abbildung 16: Verteilung von Fosmid-Endsequenzen (je >700 bp) der drei Genbanken RUD001 (grün), RUD003(rot) und S248 (blau) basierend auf deren G+C-Gehalt (30-35 entspricht 30% bis <35% GC-Gehalt usw.). DieAnzahl der analysierten Sequenzen ist aus Tabelle 5 zu entnehmen.

D.3.2.2 Charakterisierung der Endsequenzen durch Vergleiche mit den Datenbanken

Ein BlastX-Vergleich aller Sequenzen mit hoher Qualität gegen die nr-Datenbank egab ininsgesamt 44,1% aller Fälle Ähnlichkeiten bei e-Werten <e-15 mit bekannten Sequenzen,wobei der Anteil an Treffern mit 41% und 42,7% für RUD001 bzw. RUD003 recht ähnlich warund deutlich von den 55,3% bei S248 abwich (Tab. 5). 2.151 der Sequenzen (42%) zeigtengrößte Ähnlichkeiten mit Genen bakteriellen Ursprungs, 57 (1,1%) mit archaealen Genen, 35(0,7%) mit eukaryontischen und 18 (0,3%) mit solchen von Bakteriophagen.Um einen Überblick über die kodierten Proteine und die genetische Vielfalt in denGenbanken zu bekommen, wurden alle 5.125 Sequenzen mit Hilfe der COG-Datenbank(clusters of orthologous groups, http://www.ncbi.nlm.nih.gov/COG) analysiert.

0

5

10

15

20

25

30

35

40

≤30

30-35

35-40

40-45

45-50

50-55

55-60

60-65

65-70 >7

0

G+C-Gehalt (%)

% S

eque

nzen

RUD001RUD003S248

Page 13: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

81

Tabelle 6: Verteilung von BlastX-Ähnlichkeiten der erstellten Fosmid-Endsequenzen sowie von ausgesuchtenReferenzorganismen auf verschiedene COG-Kategorien*.

RUD001 RUD003 S248 Mesorh. Bacillus Mc. Kategorie

loti subtilis janasch

1,15 2,3 0,58 7,04 4,22 1,67 Mbp sequenzierte DNA/Genomgröße

1.536 3.072 768 6.746 4.112 1.729 n Sequenzen/ORFs**

69,9 71,4 57,0 23,2 25,1 18,1 % nicht in COG

30,1 28,6 43,0 76,8 74,9 81,9 % in COGs (=100%)*

Info.-speicherung und -prozessierung

5,0 7,5 5,5 3,5 5,1 10,6 J Translation, ribosomale Strukt.& Biogenese

0 0 0 0 0 0,1 A RNA-Prozessierung und Modifikation

4,3 3,8 3,0 10,3 9,4 4,2 K Transkription

3,7 9,2 7,3 5,1 4,3 6,6 L Replikation, Rekombination und Reparatur

0 0 0 0,1 0 0,1 B Chromatin-Struktur und -Dynamik

Zelluläre Prozesse und Signalübermittl.

0,6 1,1 1,8 0,5 1,1 1,3 D Zellzykluskontrolle, Zell- & Chromos.teilung

0 0 0 0 0 0 Y Kernstruktur

1,3 2,4 3,0 1,2 1,9 1,1 V Verteidigungsmechanismen

8,7 5,9 2,4 3,7 3,9 0,7 T Signaltransduktionsmechanismen

6,7 6,6 7,0 5,6 5,8 2,3 M Zellwand/-Membran/-Hülle-Biogenese

0,9 1,7 1,2 0,9 1,8 1,3 N Zellbewegung

0 0 0 0 0 0 Z Cytoskelett

0 0 0 0 0 0 W Extrazelluläre Strukturen

1,3 1,6 0,6 1,4 0,8 0,8 U Intrazell. trafficking, Sekretion, vesik.

Transp.

3,7 3,4 4,2 3,5 3,2 3,2 O Posttransl.Modif., Prot.umsetz., Chaperone

Metabolismus

8,0 6,3 9,1 5,7 5,5 9,7 C Energieproduktion und -Konversion

6,7 7,3 9,1 9,4 9,4 3,2 G Kohlenhydrat-Transport und -Metabolismus

9,3 9,9 7,0 12,8 9,5 7,3 E Aminosäure-Transport und -Metabolismus

2,6 2,9 3,0 1,6 2,7 3,2 F Nukleotid-Transport und -Metabolismus

4,3 3,6 3,6 3,1 3,4 6,6 H Coenzym-Transport und -Metabolismus

5,2 5,1 6,7 3,7 2,9 1,1 I Lipid-Transport und -Metabolismus

5,4 2,7 5,8 3,7 5,3 4,3 P Inorgan. Ionen-Transport und -

Metabolismus

1,5 1,4 1,8 3,7 2,9 0,6 Q Sek. Metabolite-Biosynth., Transp.,Katabol.

Wenig charakterisiert

13,4 10,6 13,0 11,0 11,3 17,2 R Nur generelle Funktionsvorhersage

7,4 6,8 4,8 9,5 10,0 14,4 S Funktion unbekannt

* Prozentwerte sind auf alle Sequenzen die man in COG (clusters of orthologous groups, NCBI)-Kategorien mitBlastX-Ähnlichkeiten ≤ e-15 einordnen kann bezogen.

** Sequenzen: von den Umwelt-Genbanken generierte Sequenzen (siehe Tabelle 5), ORFs: identifiziertevermutliche Gene in den Genomen von Mesorhizobium loti, Bacillus subtilis, Methanococcus janaschii.

Page 14: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

82

In Tabelle 6 ist die mittels BlastX-Vergleichen gegen die COG-Datenbank bestimmteVerteilung der Sequenzen auf die verschiedenen Kategorien gezeigt. Um die Datenvergleichen zu können, wurden dieselben Datensätze für drei Organismen erhoben undebenfalls dargestellt. Zwei davon, Mesorhizobium loti (Alpha-Proteobakterium) und Bacillussubtilis (Gram-positves Bakterium), sind heterotrophe Organismen die häufig aus Bödenkultiviert werden können. Methanococcus janaschii hingegen ist ein autotrophermethanogener und hyperthermophiler Euryarchaeot (Archaea). Von den Endsequenzen ausden Genbanken konnten zwischen 57% und 71,4% nicht in COGs eingeordnet werden, wasvermutlich daran lag, dass Gene nur partiell getroffen waren und auch intergene Regionen inden Endsequenzen mit enthalten waren. Bei denjenigen Sequenzen, die in COGseingeordnet werden konnten, wurde aber keine deutliche Abweichung in der Verteilung aufdie verschiedenen Kategorien im Vergleich mit den drei Referenzorganismen festgestellt.Leichte Abweichungen bestanden aber: so zeigten alle drei Genbanken höhere Anteile in derKategorie „M“ (Zellwand/-Membran/-Hülle-Biogenese) und „I“ (Lipid-Transport und–Metabolismus). Zwischen den drei Genbanken gab es ebenfalls Unterschiede. So hattenRUD003 und S248 mehr Sequenzen die in die Kategorien „L“ (Replikation, Rekombinationund Reparatur) und „V“ (Verteidigungsmechanismen) fielen, wohingegen RUD001 und S248einen hohen Anteil an der Kategorie „P“ (Inorganischer Ionen-Transport und –Metabolismus)und RUD001 und RUD003 einen solchen an „T“ (Signaltransduktionsmechanismen) zeigten.

D.3.2.3 Analyse der genomischen Diversität in den Genbanken

Um einen Eindruck über die phylogenetische Verteilung der erhaltenen Endsequenzen zubekommen, wurden alle Sequenzen die sehr hohe Ähnlichkeiten mit Genen aus derDatenbank aufwiesen zusammengestellt und ausgewertet. Dazu wurde nur Sequenzenverwendet, die bei BlastX-Vergleichen einen Score >600 aufwiesen, was den Datensatz auf92 Sequenzen aus Genbank RUD001, 213 aus RUD003 und 74 aus S248 reduzierte. DieVerteilung dieser Sequenzen in verschiedene Phyla (Abb. 17) muss nicht unbedingt diewahren phylogenetischen Zugehörigkeiten reflektieren, gibt aber einen Eindruck von der inden Genbanken abgelegten genomischen Diversität und zeigt Unterschiede zwischen denGenbanken auf. So fällt z.B. der hohe Anteil an Sequenzen die bei RUD003 höchsteÄhnlichkeiten mit Genen von Bacteroidetes zeigen auf, genauso wie der hohe Anteil analpha-proteobakteriellen Sequenzen in Genbank S248.

Page 15: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

83

Abbildung 17: Phylogenetische Verteilung von Fosmid-Endsequenzen mit sehr hohen BlastX-Ähnlichkeiten(Score ≥600). Die zugrunde liegenden Datensätze aus den drei Genbanken entsprechen denen in Tabelle 5vorgestellten.

D.4 Durchmusterung der Genbanken nach genomischen Fragmenten

Um Klone mit DNA-Fragmenten bestimmter Mikroorganismen in den Genbanken zuidentifizieren, wurden zwei Ansätze gewählt. Zum einen wurde spezifisch nachGenomfragmenten mit 16S und 23S rRNA-Genen von Archaea und Streptomycetengesucht. Zum anderen wurden die ca. 4 Mbp der Endsequenzen (D.3.2) genutzt, um darinnach Klonen mit archaealen Genen zu suchen.

D.4.1 Durchmusterung mittels spezifischen Oligonukleotiden

D.4.1.1 Durchmusterung mittels Archaea-spezifischen Oligonukleotiden

Die Durchmusterung der Genbanken nach archaealen 16S rRNA-Genen erfolgte mit dem,bereits während der Diversitätsstudie verwendeten, primer-Paar Arch20F/Arch958R. AlsMatrize in der PCR dienten die von den Klonen jeder Mikrotiterplatte (384 Klone)hergestellten Fosmid-DNA-Pools. Insgesamt wurden 79 Pools der Genbank RUD003 und 52Pools der Genbank S248 durchgemustert. Alle positiven Pools wurden durch eine zweite,unabhängige PCR bestätigt. Bei der Genbank RUD003 wurde dabei ein positiver Pool (Nr.54) identifiziert (Abb. 18). Die Hybridisierung des von der Mikrotiterplatte hergestellten Filtersmit einer gegen die 16S rDNA des archaealen Fosmids 29i4 (Quaiser et al., 2002)gerichteten, DIG-markierten Sonde identifizierte eindeutig den Klon „d9“ (Abb. 19). Dieses

05101520253035404550

Alpha-Proteobacteria

Beta-Proteobacteria

Gamma-Proteobacteria

Delta-Proteobacteria

Cyanobacteria

Actinobacteria

Firmicutes

Bacteroidetes

Planctomycetes

Spirochaeates

Chloroflexi

Thermotogae

Aquificae

Eukaryota

Archaea

% T

reffe

r S

core

≥60

0 RUD001RUD003S248

Page 16: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

84

Ergebnis ließ sich später auch mittels einer 16S rDNA-PCR mit archaealen primernbestätigen. Durch Hydrolyse der isolierten Fosmid-DNA mit verschiedenen Enzymen undAuswertung der erhaltenen Fragmente konnte die Größe des klonierten Fragments auf ca.43 kb bestimmt werden (Abb. 20). Die komplette Sequenz von Klon 54d9 wurde bestimmtund die Ergebnisse sind unter D.5.3 aufgeführt.

Abbildung 18: Agarosegelelektrophorese (1%) von PCR-Produkten aus der Durchmusterung der DNA-Pools 48bis 55 von Genbank RUD003 mit Archaea-spezifischen 16S rDNA primern. S: Positivkontrolle Sulfolobussolfataricus, 0: Negativkontrolle Wasser, M: λ-DNA/EcoRI+HindIII-Marker.

Abbildung 19: Filterhybridisierung von Klonen der Mikrotiterplatte 54 der Genbank RUD003 mit einerCrenarchaeota-spezifischen 16S rDNA-Sonde. Zu sehen ist der positive Klon 54d9. Als Positivkontrolle dientedas archaeale PCR-Produkt des Pools 54.

A 1 A 24

P 1 P 24

Positivkontrolle

54d9

M 48 49 50 51 52 53 54 55 0 MS

940 bp

Page 17: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

85

Abbildung 20: Agarosegel (0,7%) von Restriktionsfragmenten des Fosmids 54d9. Restriktion mit NotI (Spur 1),EcoRI (Spur 2), NdeI (Spur 3), HindIII (Spur 4) und NdeI/HindIII (Spur 5). Marker: λ-DNA/EcoRI+HindIII-Marker(A), λ-DNA/Eco47III+Eco91I-Marker (B), Gene Ruler DNA ladder Mix (C).

Die Ergebnisse waren nicht immer so eindeutig wie bei Mikrotiterplatte 54. So konnten in denPools der Mikrotiterplatten 6, 17-25 und 27 ebenfalls recht spezifische PCR-Produkte derrichtigen Größe amplifiziert werden. Aufgrund der geringen Wahrscheinlichkeit, dass in 9 bis10 aufeinander folgenden Pools archaeale 16S rRNA-Gene zu finden seien, wurden dieerhaltenen Signale der Pools 17-25 und 27 nicht weiter verfolgt. Das recht eindeutige PCR-Produkt aus Pool 6 (Abb. 21) wurde aber kloniert und sequenziert. Tatsächlich konnte ein zurGruppe 1.1b der Crenarchaeota gehörendes 16S rRNA-Gen bestätigt werden. DieHybridisierung des Filters mit derselben 16S rDNA-Sonde wie bei 54d9 ergab aber keineneindeutig identifizierbaren Klon.

Abbildung 21: Agarosegelelektrophorese (1%) von PCR-Produkten der Durchmusterung der DNA-Pools 1 bis 16von Genbank RUD003 mit Archaea-spezifischen 16S rDNA primern. M: λ-DNA/EcoRI+HindIII-Marker.

A B C 1 2 3 4 5 A B C kb

21

5

1

8

3

2

6

10

940 bp

M 1 2 3 4 5 6 7 8 9 M11 12 13 14 15 1610

Page 18: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

86

Ebenfalls mit den archaealen 16S rDNA-primern wurden die Pools der Genbank S248durchgemustert. Dabei ergaben sich bei den Pools 5, 6, 11, 14 und 48 PCR-Produkte,wovon nur das aus Pool 6 die erwartete Größe von 940 bp hatte. Das Produkt von Pool 5war etwas zu groß und die von 11, 14 und 48 waren etwas zu klein. Keines der Signalewurde daher weiter charakterisiert.Um weitere archaeale Genomfragmente identifizieren zu können, wurde das gegenarchaeale 23S rRNA-Gene gerichtete Oligonukleotid-Paar LS177F und LS2445a-R (Beja,2000b) zur Durchmusterung verwendet. In Abbildung 22 sind die Ergebnisse einer PCR mitTest-DNAs verschiedener Organismen zu sehen. Wie erwartet kam es zu keinenAmplifikaten bei den bakteriellen DNAs (Spuren 1-3). Bei den archaealen Test-DNAs konntejeweils das 2.270 bp große Fragment amplifiziert werden. Dass bei Haloferax mediterraneikein Amplifikat erhalten wurde, lag nicht an der Inkompatibilität der Oligonukleotide sondernan einem undichten Reaktionsgefäß.

Abbildung 22: Agarosegelelektrophorese (1%) von PCR-Produkten eines Tests von Archaea-spezifischen 23SrDNA primern auf DNAs verschiedener Archaea und Bakterien: Escherichia coli (Spur 1), Enterobacter aerogenes(Spur 2), Streptomyces sp. (Spur 3), Sulfolobus solfataricus (Spur 4), Halobacterium salinarum pHH1 (Spur 5),Haloferax mediterranei (Spur 6) und Haloferax volcanii (Spur 7). Marker: λ-DNA/EcoRI+HindIII-Marker (A), GeneRuler DNA ladder Mix (B).

Die Durchmusterung der Genbank RUD003 ergab mehr oder weniger starke Amplifikate inden Pools 23, 31, 36, 42, 46, 48, (49), 52, (54), 55, 58, (64), 66, (68), 71, 73 und 79 (inKlammern: sehr schwache Amplifikate oder solche abweichender Größe).Interessanterweise gab es bei Pool 54, in dem bereits der über seine 16S rDNA gefundeneund 23S rDNA-tragende Klon 54d9 identifiziert wurde, nur ein schwaches Amplifikat.Weiterverfolgt wurde das starke PCR-Amplifikat richtiger Größe aus Pool 42 (Abb. 23). Eswurde für die Herstellung einer DIG-markierten Sonde verwendet mit der anschließend der

A B 1 2 3 4 5 6 7

2270 bp

Page 19: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

87

Filter von Mikrotiterplatte 42 hybridisiert wurde. Dabei ergaben sich zwei positive Klone(42d14 und 42g4), die sich bei einer anschließenden Restriktionsanalyse als identischherausstellten. Bei den durch Christian Zurek (BRAIN AG) direkt von isolierter Fosmid-DNAdurchgeführten Sequenzierungen mit jeweils einem der beiden Oligonukleotide LS177F oderLS2445a-R wurden Sequenzen erhalten, die Ähnlichkeiten mit 23S rDNA von Bakterien ausder Gruppe der Planctomyceten aufwiesen. Demnach waren durch die eigentlich alsArchaea-spezifisch geltenden Oligonukleotide auch bakterielle 23S rRNA-Gene amplifiziertworden.

Abbildung 23: Agarosegelelektrophorese (1%) von PCR-Produkten der Durchmusterung der DNA-Pools 37 bis54 von Genbank RUD003 mit Archaea-spezifischen 23S rDNA primern. M: Gene Ruler DNA ladder Mix.

D.4.1.2 Durchmusterung mittels Bakterien-spezifischen Oligonukleotiden

Für die Suche nach bakteriellen Genomfragmenten mussten gruppenspezifischeOligonukleotide verwendet werden, da in den Fosmidisolierungungen noch Reste von E. coli-DNA vorhanden waren. Diese würde bei Verwendung von z.B. universell-bakteriellen 16SrDNA-Oligonukleotiden zu überlagernden Fehlamplifikaten führen.Im Rahmen diese Arbeit wurden gegen die 16S rDNA gerichtete primer verwendet, die fürdie Gruppe der Streptomyceten spezifisch sein sollten. Streptomyceten gelten als typischeBodenbakterien und können aus einer Vielzahl von Böden kultiviert werden. Anhand desDatensatzes an 16S rRNA-Genen in dem Programmpaket ARB wurden die Streptomyceten-spezifischen Oligonukleotide Strep230F und Strep1445R abgeleitet. Sie wurdenanschließend auf verschiedenen Kontroll-DNAs getestet und zeigten sich spezifisch fürStreptomyceten-DNAs. Wichtig war dabei auch, dass sie E. coli-16S rDNA nicht amplifizierenkonnten (Abb. 24, Spuren E und S). Eine Durchmusterung der Genbank RUD003 ergabAmplifikate von den Pools 11, 18, 19, 25, 27 und 36, wobei das von Pool 18 allerdingsdeutlich zu groß war (Abb. 24). Bei einer Reihe von Pools ergaben sich auch schwache

M 37 38 39 40 41 42 43 44 45 46 47 49 50 51 52 53 54 M48

2270 bp

Page 20: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

88

Amplifikate, die aber deutlich von den als positiv gewerteten zu unterscheiden waren. DieAmplifikate richtiger Größe wurden kloniert und sequenziert. Nur bei den PCR-Produkten ausden Pools 11, 19 und 27 handelte es sich um 16S rRNA-Gene, die allerdings nicht vonOrganismen die in die Gruppe der Streptomyceten gehörten, stammten. Daraufhin wurdedas Projekt nicht weiter verfolgt.

Abbildung 24: Agarosegelelektrophorese (1%) von PCR-Produkten der Durchmusterung der DNA-Pools 1 bis 28von Genbank RUD003 mit den 16S rDNA primern Strep230F/Strep1445R. Neben den Produkten aus derGenbank (Spuren 1-28) sind die von den Test-DNAs Escherichia coli (E), Streptomyces sp. (S), positiver Pool derMikrotiterplatten 57-60 von der während der Diplomarbeit hergestellten Genbank RUD000 (R) und dieNegativkontrolle mit Wasser (0) aufgetragen. M: Gene Ruler DNA ladder Mix.

Um dennoch Genomfragmente von Streptomyceten identifizieren zu können, wurde das inder Zwischenzeit publizierte Oligonukleotid-Paar StrepB/StrepF (Rintala et al., 2001) fürweitere Durchmusterungen verwendet. Allerdings wurde in keiner der Genbanken RUD001,RUD003, S247 und S248 ein positiver Pool detektiert, obwohl die Oligonukleotide auf Test-DNAs und bei Kontrollreaktionen der entsprechenden PCRs Amplifikate lieferten (nichtgezeigt). Somit konnten in keiner der Genbanken Genomfragmente von Streptomycetennachgewiesen werden.

M 1 2 3 4 5 6 7 8 9 10 E R 0 MS

1215 bp

1215 bp

M 11 12 13 14 15 16 17 18 19 20 21 23 24 M22 25 2726 28

Page 21: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

89

D.4.2 Identifizierung archaealer Klone durch Bestimmung von randständigen DNA-Sequenzen (Endsequenzen)

Die zur Charakterisierung der Genbanken erstellten Endsequenzen bildeten einen großenDatensatz, in dem mittels BlastX-Vergleichen gegen die nr-Protein-Datenbank auch nachGenomfragmenten von Archaea gesucht wurde. Hier bestand die Chance, neue Bereichedes Genoms fernab der 16S rDNA zu erhalten. Von der Charakterisierung derEndsequenzen war bekannt, dass insgesamt 57 Sequenzen höchste Ähnlichkeiten mitGenen archaealer Herkunft hatten (Tab. 5). Anhand von Ähnlichkeiten mit Genen in derDatenbank lassen sich allerdings keine gesicherten phylogenetischen Aussagen treffen.Deshalb wurden weitere Kriterien zur Zuordnung herangezogen. Durch die bereits eindeutigmittels kodierten 16S rRNA-Genen identifizierten beiden archaealen Genomfragmente ausdemselben Boden (29i4, Quaiser et. al., 2002; 54d9, diese Studie) war bekannt, dass derG+C-Gehalt dieser Fragmente deutlich unter 40% lag. Wurde dieses Kriterium auf diegefundenen Endsequenzen angewendet, konnte ein Großteil aussortiert werden. Bei denverbleibenden wurden zusätzlich weitere Merkmale wie z.B. ausschließlich signifikanteÄhnlichkeiten mit archaealen Genen oder potentielle archaeale Promotorregionen vor denGenen als Entscheidungshilfen herangezogen. Dadurch konnte am Ende siebenGenomfragmenten mit recht hoher Sicherheit ein archaealer Ursprung zugewiesen werden(Tab. 7). Interessanterweise wurden sie alle in der Genbank RUD003 identifiziert, die einen

Tabelle 7: Identifizierung potentieller archaealer Genomfragmente auf der Basis von Fosmid-Endsequenzen.

Klon Seq.* GC (%) ähnlichstes orthologes Gen** Identitäten (AS)

6a13# fwd 38 cdc 48 Zellteilungskontrollprotein, AAA-Familie, P. furiosus 54/98 (55%)

rev 36 kein Treffer

58c20 fwd 38 Asparaginyl-tRNA Synthetase, P. furiosus 96/198 (48%)

rev 38 kein Treffer

6d1 fwd 36 kein Treffer

rev 35 Nicotinat-Nukleotid Pyrophosphorylase, P. furiosus 96/193 (49%)

6o3 fwd 39 kein Treffer

rev 31 HIT-Familie Hydrolase, P. abyssi 47/106 (44%)

68f19# fwd 43 lemA Protein, T. maritima 60/153 (39%)

rev 38 Thermosom Alpha-Untereinheit, T. litoralis 145/242 (59%)

23b18 fwd 38 Phosphomannomutase (pmmA), M. jannaschii 79/231 (34%)

rev 38 Vng0419c / 30S rib. Protein, Halobact. sp./ B. stearothermophilus 65/139 (46%) / 40/73 (54%)

23l19 fwd 40 konserviert hypothetisches Protein, R. solanacearum 63/156 (40%)

rev 43 CTP Synthase, P. furiosus 61/125 (48%)

* fwd: Sequenzen wurden mit prCLyEpiFOS primer generiert, rev: Sequenzen wurden mit T7 Promotor primer generiert(siehe auch C.6.4.2).

** ähnlichste orthologe Gene wurden durch BlastX-Abgleiche gegen die NR-Datenbank bestimmt.# die kompletten Sequenzen der Klone 6a13 und 68f19 werden in dieser Studie präsentiert.

Page 22: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

90

geringeren G+C-Gehalt aufwies. Von zwei der Fragmente, 6a13 und 68f19, wurden imRahmen dieser Studie die kompletten Sequenzen bestimmt, welche ihre Herkunft vonarchaealen Organismen bestätigten (siehe Abschnitt D.5). Die fünf weiteren Klone sindKandidaten für eine zukünftige Sequenzierung.Abgesehen von den archaealen Klonen sind auch noch weitere Genomfragmente mitinteressanter Herkunft oder interessanten kodierten Genen in den Endsequenzen entdecktworden. Potentiell zu Organismen zuordenbar sind Fragmente deren Endsequenzen Genetragen, die sich phylogenetisch einordnen lassen, was bei einer ganzen Reihe Sequenzender Fall war (Tab. 8). So wurden neben rRNA-Genen (2 x 16S, 1 x 23S) auch solche die fürRNA- (11) bzw. DNA-Polymerasen (19) kodierten gefunden. Weiterhin konnten in denEndsequenzen 19 Gene für ribosomale Proteine, 22 für Transkriptionsfaktoren, 15 fürTranslationsfaktoren, 43 für tRNA Synthetasen und 10 für Hitze-/Kälteschock-Proteineidentifiziert werden. Insgesamt können somit wahrscheinlich mindestens diese 142Genomfragmente phylogenetisch zugeordnet werden. Von Klon 23e14, einem der 16SrDNA-tragenden Klone, der in die Cytophaga/Bacteroidetes-Gruppe gehört, wurde bereitsdie komplette 41.179 bp lange Sequenz bestimmt. Der G+C-Gehalt betrug 43,1% und dieAnnotation der kodierten Gene ist in Arbeit.

Tabelle 8: Endsequenzen mit kodierten phylogenetisch relevantenGenen aus den drei Genbanken RUD001, RUD003 und S248.

Art der Gene Anzahl in den

Endsequenzen

16S rRNA 2*

23S rRNA 1

RNA-Polymerasen 11

DNA-Polymerasen 19

Ribosomale Proteine 19

Transkriptionsfaktoren/-regulatoren 22

Translationsfaktoren 15

tRNA Synthetasen 43

Hitze-/Kälteschock-Proteine 10

* identifizierter 16S rDNA-tragender Klon 23e14 wurde bereitsvollständig sequenziert.

Aus biotechnologischer Sicht interessant sind eine ganze Reihe in den Endsequenzenidentifizierte Enzym-kodierende Gene, darunter Hydrolasen, Isomerasen und Kinasen.Zusätzlich wurden 14 Klone identifiziert, bei denen randständige Gene Hinweise aufmöglicherweise auf diesen Fragmenten kodierten Polyketid-Synthese-Cluster ergaben(eigene Beobachtung und Guido Meurer, persönliche Mitteilung).

Page 23: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

91

D.5 Auswertung der Sequenzinformation von drei archaealen Genomfragmenten

Die DNAs der drei Kandidatenklone 6a13, 68f19 und 54d9 wurden für die Sequenzierung inkleine Fragmente (1,5 bis 5 kb) zerlegt und in Form von Genbanken in pGEM-T abgelegt.Sequenziert wurden die Klonbanken im Labor von Stephan Schuster (MPI Tübingen) biseine 8-fache Abdeckung der Sequenzen erreicht war. Eventuell vorhandene Lücken wurdenebenfalls dort durch Sequenzbestimmung mit speziell abgeleiteten Oligonukleotidengeschlossen. Die Fehlerrate der Sequenzen betrug weniger als 0,07 Fehler pro 10 kb außerin einer 200 bp-Region bei Klon 54d9.

D.5.1 Auswertung des crenarchaealen Genomfragments 6a13

Das Fosmid 6a13 wurde anhand von einem randständig kodierten partiellen Cdc 48-Proteinsowie einem ribosomalen Protein identifiziert (Tab. 7). Ferner waren eine vermutlichearchaeale Promotorregion vor dem cdc 48-Gen und der niedrige G+C-Gehalt weitereIndizien für die archaeale Herkunft des Genomfragments. Nach der komplettenSequenzbestimmung des 35,5 kb großen Fragments wurde der G+C-Gehalt mitdurchschnittlich 37,5% bestimmt. Auf dem Fosmid kodiert waren 39 ORFs (Abb. 25 und Tab.9), von denen 21 höchste Ähnlichkeiten mit Sequenzen von kultivierten oder nicht-kultiviertenArchaea hatten (Abb 25, Markierung „A“ oder „C“). Die abgeleiteten Aminosäuresequenzenvon 5 ORFs zeigten ausschließlich Ähnlichkeiten mit Proteinen von Archaea (rot markiert),einer mit einem nur in Archaea und Eukaryonten vorkommend Protein (ORF 2). 9 ORFs,inklusive denen die für Cdc 48 und 50S ribosomale Proteine kodierten (ORFs 1 und 2),zeigten größte Ähnlichkeiten mit Genen von kultivierten und nicht-kultivierten Crenarchaeota,wobei eins davon (ORF 7) bislang ausschließlich in Crenarchaeota gefunden wurde. Einevermutliche Mannosyl-3-Phosphoglycerat-Synthase (ORF 14) zeigte größte Ähnlichkeiten(54% identische Positionen auf 394 Aminosäuren) mit dem homologen, durch ORF 10 desKlon 29i4 kodierten Protein (Quaiser et al., 2002). Alle diese Befunde unterstützten dieAnnahme, dass es sich um ein Genomfragment von einem Crenarchaeoten handelte.17 (44%) der ORFs konnten anhand von Ähnlichkeiten mit bekannten Sequenzen aus denDatenbanken Funktionen zugewiesen werden, 11 (28%) zeigten Ähnlichkeiten mithypothetischen Genen und weitere 11 (28%) hatten gar keine Ähnlichkeiten mitirgendwelchen bekannten Genen. Die meisten der den ORFs zugewiesenen Funktionenspielen eine Rolle im zentralen Stoffwechsel, so z.B. Schwefel- und Stickstoff-Assimilationund Elektronentransfer, oder haben Aufgaben bei Transport- bzw. DNA-Reparatur/-Modifikationsprozessen oder der Translation (siehe auch Anhang 1). Funktionell interessanteAussagen lieferte die vermutliche Mannosyl-3-Phosphoglycerat-Synthase (ORF 14), die aufeine compatible solute-Biosynthese schließen lässt (siehe Santos & da Costa, 2002).Weiterhin gibt es Hinweise auf zwei verschiedene Transportsysteme. Neben einem ABC-Transporter (ORFs 36 und 37) konnte auch eine Komponente des Tat-Sekretionssystems

Page 24: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

92

Abbildung 25: Schematische Darstellung des 35.469 bp großen archaealen Fosmids 6a13. Die Farbkodierungzeigt das Vorkommen der abgeleiteten Protein-kodierenden Gene in den verschiedenen Domänen an: Archaea(rot), Archaea/Bakterien (grün), Archaea/Eukaryonten (gelb), Bakterien/Eukaryonten (dunkelblau) undArchaea/Bakterien/Eukaryonten (hellblau). Gene ohne Homologe oder mit solchen in nicht phylogenetischzuordenbaren Sequenzen aus der Umwelt sind dunkelgrau dargestellt. Zusätzlich sind ORFs markiert, derenähnlichstes Ortholog archaeal ist (A) oder von unkultivierten Crenarchaeota stammt (C). ORFs 4 und 15 zeigtenausschließlich Ähnlichkeiten mit Sequenzen unbekannter Herkunft aus der Sargassosee.

Tabelle 9: Vorhergesagte Protein-kodierende Gene auf dem archaealen Fosmid 6a13.

ORF Leserahmen Nt. Bereich Proteingrösse (AS) Vorhergesagte Funktion Phyl. Einord.#

01 -3 1-322 106 cdc 48 ABE02 +3 564-1295 243 50S ribosomales Protein L2 AE03 +2 1388-2047 219 Endonuklease III ABE04 -2 2049-2774 241 konserviert hypothetisches Protein05 -1 2794-3936 380 Sulfat Adenylyltransferase (SAT) ABE06 -2 3942-4721 259 PAPS Reduktase (cysH) ABE07 +1 4882-6255 457 konserviert hypothetisches Protein A08 +3 6330-6770 146 HIT Superfamilie Hydrolase ABE09 -1 6820-7527 235 konserviert hypothetisches Protein AB(E)10 +2 7715-8476 253 konserviert hypothetisches Protein AB11 -3 8525-9496 323 CorA-artiges Transportprotein BAE12 +1 9784-10092 102 Rieske-Typ Ferredoxin BEA13 +1 10294-10674 126 konserviert hypothetisches Protein14 +2 10751-11935 394 Mannosyl-3-Phosphoglycerat Synthase ABE15 -1 12088-12939 283 konserviert hypothetisches Protein16 +3 13092-13520 142 hypothetisches Protein17 -1 13528-14625 365 konserviert hypothetisches Protein A18 -3 14966-15838 290 TatC Protein Sekretionsweg Komponente ABE19 -1 16051-16410 119 hypothetisches Membranprotein20 +2 16865-17128 87 hypothetisches Protein AB21 +2 17426-17734 102 hypothetisches Membranprotein22 +1 18019-18330 103 hypothetisches Protein23 +1 18649-19254 201 hypothetisches Protein24 +1 19369-19932 187 hypothetisches Protein25 -1 19927-20463 178 hypothetisches Protein26 +2 20558-21592 344 hypothetisches Protein27 +1 21595-23052 485 konserviert hypothetisches Protein A28 +2 23282-23629 115 Stickstoff-Regulatorprotein P II BAE29 +3 23793-24590 265 Fructose-1, 6-bisphosphat Aldolase AB30 +1 24613-25632 339 konserviert hypothetisches Protein AEB31 +2 25733-26602 289 Typ II DNA Modifikations-Methylase BA32 -3 27122-27466 114 hypothetisches Protein33 -1 27532-27954 140 konserviert hypothetisches Protein A34 +3 28680-29606 308 Translations-Elongationsfaktor EF Tu-ähnliches Protein ABE35 +2 29606-30025 139 konserviert hypothetisches Protein A36 +2 30314-31300 328 ABC Transporter ATP Bindeprotein AB37 +3 31278-32060 260 ABC Transporter Permeaseprotein ABE38 +3 33129-33554 141 hypothetisches Protein39 +1 33895-34857 320 UDP-3-O-(3-Hydroxymyristoyl) glucosamin N-Acyltransferase B(E)

# Phyl. Einord.: Phylogenetische Einordnung, zeigt Vorkommen von Homologen in Archaea (A), Bakterien (B) oder

Eukaryonten (E) an. Fettdruck zeigt Vorkommen von Homologen mit den größten Ähnlichkeiten in dieser Domäne an.

Für eine ausführlichere Version dieser Annotationstabelle siehe Anhang 1.

(TatC, ORF 18) identifiziert werden. Enzyme wie die Typ II DNA Modifikations-Methylase(ORF 31) sind häufig Hinweise auf in der Nähe kodierte Restriktionsenzyme. UDP-3-O-(3-Hydroxymyristoyl)-glucosamin N-Acyltransferasen (ORF 39) sind bislang nur bei Gram-

Page 25: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

93

negativen Bakterien gefunden worden, wo sie den dritten Schritt der Lipid A-Biosynthesedurchführen. Ihre Funktion in diesem Crenarchaeot bleibt ungeklärt.Die Sequenz des Fosmids wurde unter der Zugangsnummer AJ627420 in der EMBLNukleotid-Datenbank deponiert.

D.5.2 Auswertung des crenarchaealen Genomfragments 68f19

Abbildung 26: Schematische Darstellung des 35.501 bp großen archaealen Fosmids 68f19. Die Farbkodierungzeigt das Vorkommen der abgeleiteten Protein-kodierenden Gene in den verschiedenen Domänen an: Archaea(rot), Archaea/Bakterien (grün), Archaea/Eukaryonten (gelb), Bakterien/Eukaryonten (dunkelblau) undArchaea/Bakterien/Eukaryonten (hellblau). Gene ohne Homologe oder mit solchen in nicht phylogenetischzuordenbaren Sequenzen aus der Umwelt sind dunkelgrau dargestellt. Zusätzlich sind ORFs markiert derenähnlichstes Ortholog archaeal ist (A) oder von unkultivierten Crenarchaeota stammt (C). ORF 29 zeigteausschließlich Ähnlichkeiten mit einer Sequenz unbekannter Herkunft aus der Sargassosee.

Tabelle 10: Vorhergesagte Protein-kodierende Gene auf dem archaealen Fosmid 68f19.

ORF Leserahmen Nt. Bereich Proteingrösse (AS) Vorhergesagte Funktion Phyl. Einord.#

01 -1 1-254 84 konserviert hypothetisches Protein BA02 -3 325-1203 292 konserviert hypothetisches Membranprotein BE03 +2 1433-2854 472 Aspartokinase I Homoserin-Dehydrogenase BEA04 +1 2854-3768 304 branched chain Aminosäure Aminotransferase ABE05 -2 3857-4795 312 Aspartat-Carbamoyltranferase katalytische Untereinheit AEB06 +3 4917-5843 308 hypothetisches Protein07 -1 5862-6527 221 Translations-Initiationsfaktor 6 AE08 -1 6714-9434 906 Ribonukleotid-Reduktase alpha Untereinheit ABE09 +2 9545-9724 59 hypothetisches Protein10 -1 9831-11939 702 anaerobe Ribonukleosid-Triphosphat-Reduktase BA11 -2 12041-12727 228 konserviert hypothetisches Protein AE12 -1 12810-13196 128 konserviert hypothetisches Protein BA13 -1 13212-14369 385 Acetyl-CoA Acetyltransferase ABE14 +3 14544-16691 715 DNA-Topoisomerase I ABE15 -2 16658-17515 285 vorhergesagte Amidohydrolase ABE16 -2 18029-18628 199 konserviert hypothetisches Protein BE17 +2 18737-19096 119 hypothetisches Protein18 +2 19211-19624 137 konserviert hypothetisches Protein A19 +1 19627-21171 514 Queuin/Archaeosin tRNA-Ribosyltransferase ABE20 +1 21241-21648 135 konserviert hypothetisches Protein A21 -2 21689-23035 448 Molydopterin-Biosynthesese Protein ABE22 -3 23053-24279 408 Threonin-Synthase BAE23 -1 24456-24803 115 Phosphoribosyl-AMP Cyclohydrolase ABE24 -1 25335-27137 600 Oligoendopeptidase F BAE25 -1 27435-28505 356 Deoxyhypusin-Synthase BAE26 -1 28608-29204 198 konserviert hypothetisches Protein AEB27 -3 29290-29661 123 konserviert hypothetisches Protein AB28 +3 29892-30614 240 konserviert hypothetisches Protein AB29 +3 30699-31385 228 konserviert hypothetisches Protein30 +1 31393-32925 510 GMP-Synthetase BAE31 -2 32927-33973 348 Ribokinase BEA32 -3 34078-35499 473 Thermosom-Untereinheit AE

# Phyl. Einord.: Phylogenetische Einordnung, zeigt Vorkommen von Homologen in Archaea (A), Bakterien (B) oderEukaryonten (E) an. Fettdruck zeigt Vorkommen von Homologen mit den größten Ähnlichkeiten in dieser Domäne an.

Für eine ausführlichere Version dieser Annotationstabelle siehe Anhang 2.

Page 26: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

94

Dieses Fosmid wurde anhand seines randständig kodierten Klasse II Chaperonins (ORF 32,Abb. 26 und Tab. 10) identifiziert. Die phylogenetische Analyse des Chaperonins konnte diecrenarchaeale Herkunft des Genomfragments bestätigen. Klasse II Chaperonine wurdenbislang nur in Archaea und im Cytosol von Eukaryonten nachgewiesen (Trent et al., 1991;Archibald et al., 2000), jedoch nicht in Bakterien, die Klasse I Chaperonine haben.Phylogenetische Analysen haben bewiesen, dass man trotz vieler Genduplikationen anhandvon Klasse II Chaperoninen zwischen Crenarchaeota und Euryarchaeota unterscheidenkann (Archibald et al., 2001). Abbildung 27 zeigt das Ergebnis der von Arnulf Kletzin undTorsten Ochsenreiter durchgeführten phylogenetischen Analyse. Demnach gruppiert dasChaperonin von 68f19 mit hoher Wahrscheinlichkeit mit denen von Crenarchaeota, wobei essich an der Basis des crenarchaealen Astes befindet. Somit ist eine Herkunft desGenomfragments von einem crenarchaealen Organismus recht wahrscheinlich.

Abbildung 27: Phylogenetische Analyse von archaealen Chaperoninen inklusive der abgeleitetenAminosäuresequenz von ORF 32 des Klons 68f19. Aus einem 39 Sequenzen enthaltenden Alignment mit 425alignierten Aminosäurepositionen wurde der Maximium likelihood Stammbaum rekonstruiert. Gezeigt ist diephylogenetische Verteilung von 28 Sequenzen, wobei die Anordnung identisch zu der durch Archibald et al.(2001) bestimmten ist. Die Zuordnung der Sequenzen zu den beiden archaealen Königreichen Euryarchaeotaund Crenarchaeota sowie zu den beiden verschiedenen Gen-/Untereinheiten-Familien (α und ß) sind markiert.Für signifikante Knoten des Stammbaums sind die statistischen Absicherungen (NJ/Parsimony) gezeigt. DerMaßstab repräsentiert die angenommene Anzahl an Aminosäure-Substitutionen pro Position.

Der durchschnittliche G+C-Gehalt der 35,5 kb großen Sequenz betrug 36% und sie enthielt32 vorhergesagte Protein-kodierende Gene. 17 davon zeigten größte Ähnlichkeiten mit

Eury

arch

aeot

a

Haloferax volcanii 2

Methanopyrus kandleriArchaeoglobus fulgidus α

0.1

Haloferax volcanii 3100/100

100/100

100/100

100/100

100/100

100/100100/100

98/91

99/5696/85

94/89

97/89

92/74

100/100

Archaeoglobus fulgidus βThermococcus litoralis α

Thermococcus litoralis βNanoarchaeum equitans

Thermoplasma acidophilum βThermoplasma acidophilum α

Sulfolobus shibatae βSulfolobus solfataricus β

Sulfolobus tokodaii βSulfolobus acidocaldarius β

Acidianus tengchongenses βPyrodictium occultum β

Desulforococcus mobilis βAeropyrum pernix βPyrobaculum aerophilum β

Acidianus tengchongenses αSulfolobus solfataricus αSulfolobus shibatae α

Sulfolobus acidocaldarius αSulfolobus tokodaii α

Aeropyrum pernix αPyrodictium occultum αPyrobaculum aerophilum α

68f19

Cren

arch

aeot

a

β

α

Page 27: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

95

Homologen aus Archaea, wovon zwei (ORFs 18 und 20) wiederum ausschließlich inCrenarachaeota vorkamen. Weiterhin zeigte das hypothetische Protein von ORF 20 nurÄhnlichkeiten mit ORF 16 von Klon 54d9, was ein weiterer Hinweis für den crenarchaealenUrsprung des Genomfragments war. Von den kodierten ORFs konnten insgesamt 18 (56%)eine Funktion zugewiesen werden, 11 (34%) waren konserviert hypothetisch und 3 (10%)hypothetische. Kodiert waren vermutliche Proteine des Aminosäure- und Nukleotid-Metabolismus, der Kofaktor-Biosynthese und des Acetyl-CoA-Metabolismus. Interessantwaren auch eine DNA-Topoisomerase (ORF 14) und zwei paraloge Ribonukleotid-Reduktasen (ORFs 8 und 10), die vermutlich identische enzymatische Funktionen unteraeroben bzw. anaeroben Bedingungen aufweisen (siehe auch Anhang 2).Die Sequenz des Fosmids wurde unter der Zugangsnummer AJ627421 in der EMBLNukleotid-Datenbank deponiert.

D.5.3 Auswertung des crenarchaealen Genomfragments 54d9

Das Fosmid 54d9 wurde aufgrund des kodierten 16S rRNA-Gens mittels spezifischerOligonukleotide identifiziert. Seine 43,4 kb große Sequenz hatte einen G+C-Gehalt von36,4% und trug neben den 16S und 23S rRNA-Gene weitere 43 vermutliche Protein-kodierende Gene (Abb. 28 und Tab. 11). Die Sequenz der 16S rDNA zeigte über die volleLänge 93% identische Positionen zu der des vorher aus der Genbank RUD001 isoliertencrenarchaealen Fosmids 29i4 (Quaiser et al., 2002). Beide fielen bei phylogenetischenAnalysen in die Gruppe 1.1b der nicht-kultivierten Crenarchaeota aus Boden. Von den 43ORFs konnte 13 (30%) eine Funktion zugeordnet werden und jeweils 15 (35%) warenkonserviert hypothetisch bzw. hypothetisch. 5 ORFs zeigten interessanterweiseausschließlich Ähnlichkeiten mit Genen von marinen oder terrestrischen nicht-kultiviertenCrenarchaeoten (markiert mit „C“ in Abb. 28). Neben Genen deren Produkte bei Translation,Transkription, Aminosäure- und Purin-Biosynthese, Transport, RNA-Modifikation undProteinfaltung eine Rolle spielten, wurden auch Gene gefunden, die Hinweise auf speziellephysiologische Eigenschaften dieser Organismen gaben. Hier sind eine Kupfer-enthaltendedissimilatorische Nitritreduktase (NirK) zu nennen (ORF 26), die ungewöhnlich im Bezug aufeine zusätzlich C-terminal fusionierte Amicyanin-Domäne ist. Die NirK-Domäne zeigte trotzihrer großen Distanz zu allen physiologisch charakterisierten Proteinen dieser Familie eineKonservierung der Kupfer-koordinierenden Aminosäuren. Für eine genaue bioinformatischeAnalyse siehe D.6.1. Die heterologe Expression des Nitritreduktase-Gens ist im Kapitel D.7beschrieben. Weiterhin gab es zwei ORFs (37 und 39) die, neben hohen Ähnlichkeiten mitanderen Sequenzen aus der Umwelt, schwache Ähnlichkeiten mit den Genen für die beidenUntereinheiten von Monooxygenasen zeigten. Diese sind in anderen Organismen an derOxidation von Ammonium oder Methan beteiligt. Für eine genauere Analyse siehe D.6.2.Die Sequenz des Fosmids wurde unter der Zugangsnummer AJ627422 in der EMBLNukleotid-Datenbank deponiert.

Page 28: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

96

Abbildung 28: Schematische Darstellung des 43.377 bp großen archaealen Fosmids 54d9. Die Farbkodierungzeigt das Vorkommen der abgeleiteten Protein-kodierenden Gene in den verschiedenen Domänen an: Archaea(rot), Bakterien (magenta), Archaea/Bakterien (grün), Archaea/Eukaryonten (gelb), Bakterien/Eukaryonten(dunkelblau) und Archaea/Bakterien/Eukaryonten (hellblau). Gene ohne Homologe oder mit solchen in nichtphylogenetisch zuordenbaren Sequenzen aus der Umwelt sind dunkelgrau dargestellt, rRNA-Gene hellgrau.Zusätzlich sind ORFs markiert deren ähnlichstes Ortholog archaeal ist (A) oder von unkultivierten Crenarchaeotastammt (C). ORF 38 zeigte ausschließlich Ähnlichkeiten mit einer Sequenz unbekannter Herkunft aus derSargassosee.

Tabelle 11: Vorhergesagte RNA- und Protein-kodierende Gene auf dem archaealen Fosmid 54d9.

ORF Leserahmen Nt. Bereich Proteingrösse (AS) Vorhergesagte Funktion Phyl. Einord.#

01 -2 1-212 70 aa hypothetisches Protein02 +2 392-997 201 aa hypothetisches Protein03 -1 1186-1800 204 aa NAD(P)H Flavin-Oxidoreduktase AB04 +1 1957-2445 162 aa hypothetisches Protein05 -3 2504-4057 517 aa Konserviert hypothetisches Protein A06 -3 4307-5017 236 aa konserviert hypothetisches Protein ABE07 -3 5108-5674 188 aa 3-Methyladenin DNA-Glycosylase I BE08 -2 6114-6755 213 aa hypothetisches Protein09 +1 6823-7200 125 aa hypothetisches Protein10 +1 7420-7689 89 aa konserviert hypothetisches Membranprotein ABE11 -1 7915-8589 224 aa konserviert hypothetisches Protein AB12 -2 8595-9503 302 aa konserviert hypothetisches Protein BEA13 +3 9699-9893 64 aa hypothetisches Protein14 +3 10134-10403 89 aa konserviert hypothetisches Protein AE15 -3 10535-11668 377 aa konserviert hypothetisches Protein AB16 +1 11704-12153 149 aa konserviert hypothetisches Protein A17 +2 12296-12571 91 aa hypothetisches Protein18 +2 12608-12847 79 aa hypothetisches Protein19 +2 12971-13339 122 aa hypothetisches Protein20 +2 13412-14044 210 aa konserviert hypothetisches Membranprotein BA21 -3 14126-15151 341 aa Zink-abhängige Alkohol-Dehydrogenase BAE22 -1 15172-17517 781 aa Valyl-tRNA-Synthetase AB23 -2 17670-18524 284 aa konserviert hypothetisches Protein A24 +3 19017-19820 267 aa Asparagin-Synthetase ABE25 -3 19817-21184 455 aa Adenylosuccinat-Lyase ABE26 +1 21352-22965 537 aa Cu-haltige Nitritreduktase mit C-term. Amicyanin-Domäne BA27 -2 23127-25073 648 aaa Chlor-Kanalprotein ABE28 +3 25275-25454 60 aa hypothetisches Protein29 -3 25520-26104 194 aa hypothetisches Protein30 +1 26365-27474 369 aa konserviert hypothetisches Protein A31 +1 27646-27831 62 aa hypothetisches Protein32 +2 28016-28267 83 aa hypothetisches Protein33 +2 28364-28729 121 aa hypothetisches Protein34 +2 28847-29431 194 aa Molekulares Chaperon ABE35 -3 29459-30001 180 aa Coenzyme A-bindendes Protein AB(E)36 +1 30259-31173 304 aa Transkriptions-Initiationsfaktor TFIIB AE37 -3 31292-31882 196 aa konserviert hypothetisches Protein B38 +3 32055-32375 106 aa konserviert hypothetisches Protein39 +1 32578-33234 218 aa konserviert hypothetisches Protein40 +3 33612-35570 652 aa 2-Oxoacid-Ferredoxin Oxidoreduktase alpha Untereinheit AB41 +1 35557-36522 321 aa 2- Oxoacid-Ferredoxin Oxidoreduktase beta Untereinheit AB42 -3 36659-36955 98 aa hypothetisches Protein43 -1 37327-38322 331 aa konserviert hypothetisches Protein A44 + 38670-40139 16S rRNA45 + 40357-43320 23S rRNA

# Phyl. Einord.: Phylogenetische Einordnung, zeigt Vorkommen von Homologen in Archaea (A), Bakterien (B) oderEukaryonten (E) an. Fettdruck zeigt Vorkommen von Homologen mit den größten Ähnlichkeiten in dieser Domäne an.

Für eine ausführlichere Version dieser Annotationstabelle siehe Anhang 3.

A AAC CCA AAA A A A C A A A A A C

1 3 4 52 876 111210 14 151618 21 22 23 24 25 26 27 29 30 32 34 36 37 39 40 41 42 4320

16S 23S

CC

Page 29: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

97

D.6 Bioinformatische Analyse von auf dem archaealen Genomfragment 54d9 kodiertenGenen

Verschiedene Gene des crenarchaealen Genomfragments 54d9 wurden näher analysiert.Dazu zählten besonders die für eine Nitritreduktase und eine vermutliche Monooxygenasekodierenden Gene, die Hinweise auf spezielle physiologische Eigenschaften geben.

D.6.1 Bioinformatische Analyse der neuartigen archaealen Kupfer-enthaltenden Nitrit-reduktase

Die abgeleitete Aminosäuresequenz des auf dem crenarchaealen Genomfragment 54d9identifizierten ORF 26 zeigte Ähnlichkeiten mit Kupfer-enthaltenden dissimilatorischenNitritreduktasen (NirKs), war aber in Bezug auf eine fusionierte C-terminale Amicyanin-Domäne einzigartig. Durch die Analyse mit einem Programm zur Vorhersage vonTransmembrandomänen (TMHMM, Version 2.0, http://www.cbs.dtu.dk/services/TMHMM/)konnten bei dem 537 Aminosäuren langen Protein eine N-terminale Transmembrandomäneim Bereich der Aminosäuren 5 bis 27 vermutet werden. Sehr wahrscheinlich handelt es sichdabei um ein Signalpeptid, da mit dem Programm SignalP (Version 2.0,http://www.cbs.dtu.dk/services/SignalP-2.0/) mit den auf Signalpeptide von Eukaryonten,Gram-negativen und Gram-positiven Bakterien trainierten Netzwerken positive Resultateerhalten wurden. Mit dem eukaryontischen Netzwerk wurde eine Schnittstelle zwischen denAminosäuren 22 und 23, bei beiden bakteriellen zwischen den Aminosäuren 35 und 36vorhergesagt.Bei einer Alignierung der NirK-Domäne mit NirK-Homologen aus den Datenbanken konntendie konservierten Kupfer-koordinierenden Aminosäuren auch in diesem Protein bestätigtwerden (Abb. 29). Ein Methionin, ein Cystein und zwei Histidine (dunkelblaue Punkte)koordinieren das Typ 1 Kupferzentrum. Das Typ 2 Zentrum wird neben dem Kupfer von dreiHistidinen (hellblaue Punkte) gebildet. Auf Basis eines 290 Aminosäuren langen Alignmentswurde die phylogenetische Einordnung der NirK-Domäne von 54d9 durch Hans-Peter Klenkbestimmt. Der in Abbildung 30 gezeigte Stammbaum wurde mittels der MaximumParsimony-Methode rekonstruiert und zeigt eine gewisse Verwandtschaft der neuen NirK mitdenen von Thermobifida fusca, Nitrosomonas europaea und Ralstonia solanacearum.Weiterhin ist auffällig, dass die NirKs halophiler Euryarchaeota nicht die nächstenVerwandten sind. Noch entfernter verwandt sind die NirKs klassischer Denitrifizierer wie z.B.Alcaligenes faecalis.

Abbildung 29 (nächste Seite): Alignment von 54d9 NirK mit anderen Kupfer-haltigen Nitritreduktasen. In rot sindidentische Aminosäuren dargestellt, in blau die in 60% der Sequenzen konservierten und in grün ähnliche. Gelbunterlegt sind die Kupfer-koordinierenden Aminosäuren, in dunkelblau markierte gehören zum Typ 1 Zentrum, inhellblau markierte zum Typ 2 Zentrum. Hal mar: Haloarcula marismortui, Hfer den: Haloferax denitrificans, Niteuro: Nitrosomonas europaea, Th fusca: Thermobifida fusca, Hyph den: Hyphomicrobium denitrificans, Ral sola:Ralstonia solanacearum, Sargas 1 und 2: Umweltsequenzen aus der Sargassosee auf archaealen Genom-scaffolds, Sino mel: Sinorhizobium meliloti, Rhiz sul: Rhizobium sullae, Pseu chl: Pseudomonas chlororaphis,Bruc mel: Brucella melitensis, Brad jap: Bradyrhizobium japonicum, Alc faec: Alcaligenes faecalis, Agro tum:Agrobacterium tumefaciens.

Page 30: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

98

54d9NirK GIMYNAMVFNGTIPGPVISIDQGDTLNITLKNEGQTI..HSLDFHAGFGP.GKALSGSVEPGQSKTWSLTGEFPGVFL-YHCGADHal mari GVTYTYMTFGDQIPGPMIRVRRGDTVELTITNEEGNSMPHNIDLHAVRGPGGGAEASMVTPGQTKTFRFKATYPGAFI-YHCAVPHfer den GVTFTYTTYNGQVPGPLVRVRQGDTVNLTFENPEENTMPHNVDFHAVAGPGGGAEATMTNPGETAHLRFKATYPGAYI-YHCAVPNit euro GSTYRAWTFDGKVPGPVVRVTEGDTVEFTLINDKNSKNSHSMDFHAARLDVVEDF.ESIKPGETKKYTFTADNPGVFF-YHCGSDNeis gon GVEYRYWTFDGDVPGRMIRVREGDTVEVEFSNNPSSTVPHNVDFHAATGQGGGAAATFTAPGRTSTFSFKALQPGLYI-YHCAVATh fusca GVRQSVWTFGGDVPGPVLRGKVGDVFTVTFVNDGTMG..HGIDFHASSLAPDEPM.RTINPGERLTYRFRAEKAGAWV-YHCSTSHyph den NTTYTYWTFNGKVPGPFLRVRVGDTVELHLKNHKDSLMVHSVDFHGATGPGGAAAFTQTDPGEETVVTFKALIPGIYV-YHCATPRal sola GVSYTFWTFGGTVPGSFIRVRQGDTVEFHLKNHPDSKMPHNIDLHGVTGPGGGAASSFTAPGHESQFTFKALNEGVYV-YHCATASargas 1 GSTYSAMTFSEQVPGPTLRVTQGDVVHMTLTIPGDEVTQHGNDMHASQMSSKPYMG.AVNIGETGEYCFIAEVPGVFK-YHCSGVSargas 2 GSTYSAMTFSEQVPGPTLRVTQGDVVHMTLTIPGDEMTQHGNDMHASQMSSKPYMG.AVNIGETGEYCFIAEVPGVFK-YHCSGVSino mel GTELHAMTFNGSVPGPLMVVHQDDYVELTLINPDTNTLQHNIDFHSATGALGGGALTVVNPGDTTVLRFKASKAGVFV-YHCAPPRhiz sul GTEVNAMTFDGSVPGPLIVVHQDDYVEVTLVNPETNTLQHNIDFHSATGALGGGALTVVNPGESAVLRFKATKAGVFV-YHCAPPPseu chl GTEVHAMTFDGSVPGPMMIVHQDDYVELTLVNPDTNELQHNIDFHSATGALGGGALTVVNPGDTAVLRFKATKAGVFV-YHCAPABruc mel GTEVHAMTFNGTVPGPLMVVHQDDYLELTLINPETNTLLHNIDFHAATGALGGGGLTEINPGEKTVLRFKATKPGVFV-YHCAPPBrad jap GTTFQAMTFNGSMPGPLMVVHEGDYVETTLVNPATNTMPHNIDFHSATGALGGGALTLINPGEQVVLRWKATKTGVFV-YHCAPGAlc faec GTEVHAMAFNGTVPGPLMVVHQDDYLELTLINPETNTLMHNIDFHAATGALGGGGLTEINPGEKTILRFKATKPGVFV-YHCAPPAgro tum GTEVHAMTFNGSVPGPLMVVHQDDYVELTLINPDTNELQHNIDFHSATGALGGGGLTIVNPGEKAILRFKATKAGVFV-YHCAPP

54d9NirK GNGV.WEHISNGMYGGIVVHPTNEEPA.........KEFYMVFSEIYNSADKGGSFDIGKFISNNPDLVLTNGMSHKYVPAVGEVHal mari ..NL.DMHISSGMFGMILVEPKEGLPE.......VDHEFYFGQHELYTTGDT..........GEKGHHDFDMEAMAAEEPTYVLMHfer den ..NM.DMHISAGMFGLILVEPPEGLPE.......VDHEIYLGQHELYTDKDA..........GEEGQHTFDYEAMRNEDPTYVLMNit euro ..PM.IQHIARGMYGVIIVDPKDALPK.......ADREYVLIQAEHYENPD.....DKTAMMQNKWSNVVFNGGVFKYDP.....Neis gon ..PV.GMHIANGMYGLILVEPKEGLPK.......VDKEFYIVQGDFYTKGKK..........GAQGLQPFDMDKAVAEQPEYVVFTh fusca ..PM.LQHIGNGMYGAVIIDPPDLEPV........DREYLLVQGELYLGEP..DQVARMRAGE..PDAWVFNGVAAGYAHPLAEVHyph den .SVP.T.HITNGMYGLLLVEPEGGLPQ.......VDREFYVMQGEIYTVKSF..........GTSGEQEMDYEKLINEKPEYFLFRal sola ..PV.GMHIANGMYGLILVEPPEGLPK.......VDHEYYVMQGDFYTTGKYR..FDMEKAIDERPTYVLFNG..AEG.......Sargas 1 NIAAMDQHVLSGMYGITIVDPLDGYKRLMVEKTALQGGEVVKDKKFYDADALEFQLQYNQLYLTDAGTYDMGKMMSHSTSQ.TVVSargas 2 NVAAMDQHVLSGMYGITIVDPLDGYKRLMVEKTALEGGQVVKDKQFYDADALEFQLQYNQLYLTDAGTYDMSKMMSHSTSQ.TVVSino mel GMVP.W.HVTSGMNGAIMVLPREGLTDGKGNSITYDKVYYVGEQDFYVPRDANGKFKKYESVGEA..YADTLEVMRTLTPSHIVFRhiz sul GMVP.W.HVTSGMNGAIMVLPREGLTDGHGKELVYDKVYYLGEQDFYIPRDEKGEFKKYDSPGEA..YEDTVAVMRTLTPTHIVFPseu chl GMVP.W.HVTSGMNGAIMVLPRDGLKDHKGHELVYDKVYYVGEQDFYVPKDENGKFKKYESAGEA..YPDVLEAMKTLTPTHVVFBruc mel GMVP.W.HVVSGMNGAVMVLPREGLHDGKGNKLTYDKVYYVGEQDFYVPRDENGNYKTYEAPGDA..YEDTVKVMRTLTPTHVVFBrad jap GMIP.W.HVVSGMNGAVMVLPRDGLNDGKGHALKYDKVYYVGEQDMYVPRDEKGNFKSYDSPGEA..STDTEEMMKKLIPSHVVFAlc faec GMVP.W.HVVSGMNGAIMVLPREGLHDGKGKALTYDKIYYVGEQDFYVPRDENGKYKKYEAPGDA..YEDTVKVMRTLTPTHVVFAgro tum GMVP.W.HVTSGMNGAIMVLPREGLTDGHGKELVYDKVYYVGEQDFYIPRDENGNFKKYESAGDA..MADTLEVMRKLTPSHIVF

54d9NirK NKLELNKDAEIFKVKP...GELTRWYIVNPGPNDGVSF..............................HFISGMLS.VRDGSNTAHal mari NGEKYAITPDRHGSPSMQVGETARVYFVTGGPNLDSSF..............................HPIGSVWDEVWQQGSIAHfer den NGEKYAWTPNGRGPAATVGGETVRVYFVDGGPNLSSSF..............................HPIGSVWETLYPEGSLTNit euro ..VHDSEATSWLQAKP...GERVRIYFVNAGPNELSSL..............................HPIAGIWDRVYPSGNPKNeis gon NGHVGSIAGDNALKAKA..GETVRMYVGNGGPNLVSSF..............................HVIGEIFDKVYVEGGKLTh fusca ...................GERVRIWVVAAGPTSGTSF..............................HIVGAQFDTVYKEGAYLHyph den NGSVGSLTRSHPLYASV..GETVRIFFGVGGPNFTSSF..............................HVIGEIFDHVYSLGSVVRal sola ....ALTGDKAMHAKT...GETVRIFVGNGGPNLVSSF..............................HVIGAIFDQVRYEG.GTSargas 1 NGQAFGYVPNGIHNLLMF.GDANKNIFLA.QPWNSMDLKQYQSQLLFVPTDEHVRFFIENQGNEPVYWHIVGEILDRVTQANRVQSargas 2 NGQAFSYVPNEIHNLLMF.GDANKNIFIA.QPWNSMDLKQYQSQLLFVPTGEHVRFFVENQGNEPVYWHIVGEILDRVTQANRVQSino mel NGAVGALTGDSALKAAV..GEKVLIVHSQANRDTRP................................HLIGGHGDYVWATGKFRRhiz sul NGAVGALTGENALTAAV..GERVLIVHSQANRDTRP................................HLIGGHGEYVWRTGKFVPseu chl NGAVGALTGDNALQAKV..GDRVLILHSQANRDTRP................................HLIGGHGDYVWATGKFABruc mel NGAVGALTGDKALTAKV..GEKVLIIHSQANRDTRP................................HLIGGHGDYVWATGKFNBrad jap NGKVGALTGKNALTANV..GENVLIVHSQANRDSRP................................HLIGGHGDYVWETGKFGAlc faec NGAVGALTGDKAMTAAV..GEKVLIVHSQANRDTRP................................HLIGGHGDYVWATGKFNAgro tum NGAVGALTGEHALQAAV..GEKVLIVHSQANRDTRP................................HLIGGHGDYVWATGKFR

54d9NirK NNGQDINDETWWIPPGSGSVIESTFPQEGVYVGVDHAMSDVVKGGAFAVLAVENSTATDHPEGTCVSAHal mari GPPNRYVQTTPVKPGSCAIATLHA.EVPGPIKLVDHALSRVARKATMAIINREGAANPDVFEPEA...Hfer den TEPQTHIQTRQVPPGSTTIATMSS.PVPGDFKLVDHSLSRVVRKGCMAVVRAEGPEDPEIFDPDPDPQNit euro NVQQ.....SYLIGAGDAATLDLISPVEGANAIVDHSMRH.AHSGAIAVIMFTN..............Neis gon I..NENVQSTIVPAGGSAIVEFKV.DIPGSYTLVDHSIFRAFNKGALGQLKVEGAENPEIMTQKLSDTTh fusca VRRGGAQALDLAVAQGG..FVETVFPEAGSYPFVDHDMRH.AENG.......................Hyph den SPPLIGVQTVSVPPGGATIVDFKI.DRAGRYILVDHALSRLEH.GLVGFLNVDGPKNDSIMHEGPAKQRal sola NVQQ.....TTLIPAGGAAVVKFTARVPGSYVLVDHSIFRAFNKGAMAILKIDGP.............Sargas 1 AQGT----ETWLLGGSQNMIVDVVFDEPGIYAAVNHDYAAIYS.GAATIFVA.GLPLDPVNEAATALVSargas 2 AQGT----ETWLLGGSQNMIVDVVFDEPGVYAAVNHDYAAIYS.GAATVIVA.GLPLDPINEAATALVSino mel NAP.DVDQETWFIPGGTAGAAFYTFEQPGIYAYVNHNLIEAFELGAAAHFAVTGDWNDDLMTSVRAPSRhiz sul NVP.DRDQETWFIPGPTRGAAYYTFEQPGIYAYVNHNLIEAFELGAAAHFKVTGDWNDDLMTTVRSPSPseu chl NPP.ELDQETWFIPGGAAGAAYYTFQQPGIYAYVNHNLIEAFELGAAGHFKVTGDWNDDLMTAVVSPTBruc mel TPP.DVDQETWFIPGGAAAAAFYTFRQPGIYAYVNHNLIEAFELGAAAHFKVTGE.NDDLMTSILAPSBrad jap NAP.EVGLETWFIRGGSAGAAMYKFMQPGIYAYVTHNLIEAADLCATAHFKVEGKWNDDLMTQVKAPAAlc faec TPP.DVDQETWFIPGGAAGAAFYTFQQPGIYAYVNHNLIEAFELGAAAHFKVTGEWNDDLMTSVLAPSAgro tum NPP.DLDQETWFIPGGTAGAAFYTFEQPGIYAYVNHNLIEAFELGAAAHFKVTGEWNNTLMQAVLAPS

Page 31: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

99

Abbildung 30: Rekonstruktion der Phylogenie von NirK. Auf Basis eines 290 Aminosäure langen Alignments vonNirK-Sequenzen kultivierter Mikroorganismen und 54d9 NirK wurde mit dem Programm PHYLIP der Baum nachder Maximum Parsimony- (Sparsamkeits-) Methode rekonstruiert. Gezeigt ist der Konsensus aus 200 Bäumen.Bootstrap-Werte größer 60% sind angegeben. Blau markiert sind NirKs von halophilen Euryarchaeoten.

Die zusätzlich zur NirK-Domäne vorhandene Amicyanin-Domäne wurde ebenfalls näheranalysiert. Amicyanine sind normalerweise kleine Elektronenüberträgerproteine mit einemTyp 1 Kupferzentrum. Auch hier konnten durch Alignierung der Domäne von 54d9 mitSequenzen aus den Datenbanken die Kupfer-koordinierenden Aminosäuren bestätigtwerden (Abb. 31). Die Identifizierung als Amicyanin erfolgte anhand der für diese Proteinerecht charakteristischen Aminosäureabfolge CT P H P F M im Bereich der an derKupferkoordinierung beteiligten Aminosäuren (diese sind fett dargestellt; Canters et al.,2000). Bei dem Amicyanin von 54d9 war zwar die dritte Aminosäure dieses Motivsausgetauscht (CTLHPFM), doch waren die Ähnlichkeiten trotzdem noch hoch genug, vorallem im Vergleich mit anderen blauen Kupferproteinen, um die Einordnung vornehmen zukönnen.

Abbildung 31: Alignment der Amicyanin-Domäne der Nitritreduktase von 54d9 mit anderen Amicyaninen. Diedas Typ 1 Kupferzentrum koordinierenden Aminosäuren sind gelb unterlegt dargestellt. Para.ver: Paracoccusversutus, Para.de: Paracoccus denitrificans, Met.ex: Methylobacterium extorquens, Meth.acet: Methanosarcinaacetivorans, Met.maz: Methanosarcina mazei, Sino.mel: Sinorhizobium meliloti. Von M. acetivorans und M. mazeiwaren je zwei unterschiedliche Proteine vertreten.

Alcaligenes sp.Pseudomonas chlororaphisAlcaligenes xylosoxidans

Rhodobacter sphaeroidesRhizobium sullaePseudomonas sp.

Agrobacterium tumefaciensSinorhizobium meliloti

Brucella melitensisAlcaligenes faecalis

Achromobacter xylosoxidansNeisserida gonorrhoeaeNeisseria meningitidis

Hyphomicrobium denitrificans

Haloarcula marismortuiRalstonia solanacearumNitrosomonas europaea

Thermobifida fusca54d9

1e+02Bradyrhizobium japanicum

69%

100%

97%

100%

91%

Haloferax denitrificans100%

100%

96% 94%

74%

97%97%

Haloferax lucentense

54d9 F-YEPPTLTV PTGTTVTWKN TDSTLHTVTS GSAESGVSGT EFDSSYMAGG KTFQHTFSSA GTFDYYCTLH PFMKGQVVVN Para.ver MKYLTPEVTI KAGETVYWVN GEVMPHNVAF KKGIVGED-- AFRGEMMTKD QAYAITFNEA GSYDYFCTPH PFMRGKVIVE Para.de MKYETPELHV KVGDTVTWIN REAMPHNVHF VAGVLGEA-- ALKGPMMKKE QAYSLTFTEA GTYDYHCTPH PFMRGKVVVE Met.ex MKFQTPEVRI KAGSAVTWTN TEALPHNVHF KSGPGVEK-- DVEGPMLRSN QTYSVKFNAP GTYDYICTPH PFMKGKVVVE Meth.acet FSFNPESVTV SAGDTVRWTN MDSVGHTVSG PT-------- -FESGILENG DSFEFLFTDP GVYDYSCSIH PSMKGTVIVE Meth.maz2 FTFNPESVTI STNDTVRWTN LDPITHTVTG PD-------- -FTSGALRDG DSFELSFTKK GVYRYYCSIH PSMEGVVTVEMeth.acet2 FAFNPDSVTI SPGDTVRWTN LDLFTHTVTG PD-------- -FSSGTLRDG DSYEFTFTRE GTYRYYCSIH ASMEGVVTVE Meth.maz NAFDPATVNI FTGDTVRWTN LDSTPHTVTG AT-------- -FGINNLNPG ASYEFLFTDP GTYEYYCEIH PSMEGTVIVK Sino.mel LVYLPAEIEA KVGDEVEWIN RDALVHTATV EGG------- --ADVLLPAN KTGRLVLQEA GSFDYICRYH PNMKGRITVR

Page 32: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

100

Somit war das vorhergesagte Protein aus drei Domänen aufgebaut: einem Signalpeptid, derNirK-Domäne und der Amicyanin-Domäne (siehe auch Abb. 35).

D.6.2 Bioinformatische Analyse einer potentiellen Monooxygenase

Bei der Annotation des Genomfragments 54d9 wurden zwei ORFs (37 und 39) gefunden,deren abgeleitete Aminosäuresequenzen bei BlastP-Analysen sehr schwache Ähnlichkeitenmit Ammonium- (Amo) bzw. Methan- (Pmo) Monooxygenasen-Untereinheiten B bzw. Azeigten. In kürzlich bestimmten Sequenzen aus der Sargassosee (Venter et al., 2004) undaus Cenarchaeum symbiosum (Edward DeLong, persönliche Mitteilung) wurden Gene fürProteine mit hohen Ähnlichkeiten zu den beiden auf 54d9 kodierten identifiziert.Strukturvorhersagen von bekannten AmoAs ergaben genauso wie die von 54d9 ORF 39,dem potentiellen Protein von Cenarchaeum symbiosum und dem aus der Sargassosee 5-6Transmembrandomänen, von denen eine am C-terminalen Ende, und die übrigen N-terminallagen (Abb. 32). Auffällig war aber, dass trotz der hohen Ähnlichkeit der Sequenz von ORF39 mit denen von Cenarchaeum und aus der Sargassosee bei ORF 39 nur fünfTransmembrandomänen vorhergesagt wurden. In allen Fällen gab es aber einenperiplasmatisch oder cytosolisch lokalisierten Bereich vor der C-terminalenTransmembrandomäne.

Abbildung 32: Vorhergesagte Transmembrandomänen des von 54d9 ORF39 kodierten Proteins (AmoA/PmoA-ähnlich). Zum Vergleich sind die homologen Proteine von Cenarchaeum symbiosum (Censym), einerUmweltsequenz aus der Sargasssosee (Sargasso) sowie AmoA von Nitrosomonas europaea (Nmeur) und PmoAvon Methylosinus trichosporium (Mtri) abgebildet. Gelb unterlegt sind die mit T M H M M Version 2.0(http://www.cbs.dtu.dk/services/TMHMM/) vorhergesagten Regionen, die in der Membran integriert vorliegensollen. Ein größeres Alignment mit weiteren homologen Proteinsequenzen ist in Abb. 33 dargestellt.

ORF39_54d9 VMVWLRRTTH-YLF-I-VVVAVNST--L-LTINAGDYIFYTDW---AWTSFVV-FSVSQST-ML-VVGAIYYMLFTGV--P-GTA

Censym TMVWLRRCTH-YLF-IA-VVAVNST--L-LTINAGDYIFYTDW---AWTSFTV-FSISQ-TLML-VVGATYYLTFTGV--P-GTA

Sargasso LMVWLRRCTH-YLF-I-VVVAVNST--L-LTINAGDYIFYTDW---AWTSFVV-FSISQ-TLML-AVGASYYLTFTGV--P-GTA

AmoA_Nmeur EAVHTSRLIDAVYFPILIILLV-GTYHMHFMLLAGDWDFWMDWKDRQWWP-VV-TPIVGIT-YC-SAIM-YYL-WVNYRQPFG-A

PmoA_Mtri EAAGCVKTTDWMFLTLLFLAVL-GGYHIHFMLTAGDWDFWVDWKDRRMWP-TV-VPILGVT-FA-AAAQ-AFF-WENFKLPFG-A

ORF39_54d9 TY-YATIMTIYTWVAK---GA-WFALGYPYDFIVTP-VW-IPSAMLLDLT-YWATRRNKHAAIIIGGTLVGLSL-P----IFNMI

Censym TY-YALIMTVYVWIAK---GA-WFALGYPYDFIATP-IW-LPSAMLLDLA-YWATKRNKHSLILFGGVLVGMSL-P----LFNMV

Sargasso TY-YALIMTVYTWIAK---GA-WFALGYPYDFIVTP-VW-LPSAMLLDLA-YWATKKNKHSLILFGGVLVGMSL-P----LFNMV

AmoA_Nmeur TLCVVCLL-IGEWLTR-YWGFYWWSH-YPINF-VTPGIM-LPGALMLDFT-LYLTR-NWLVTALVGGGFFGLLFYPGNWPIFGPT

PmoA_Mtri TFAVSGLL-IGEWINR-YCNFWGWTY-FPISL-VFPSAL-VVPALWLDIIMLLSGS-YV-ITAVVGSLGWGLLFYPNNWPAIAAL

ORF39_54d9 NLLLVRDP--LEMA-FK---YPRPTLPPYMTPIEPQVGKFYNSPVALGSGAGAVLSVPIAALGAKLN-T-WTY--R-WMAA--W

Censym NLITVADP--LETA-FK---YPRPTLPPYMTPIEPQVGKFYNSPVALGAGAGAVLSVTFAALGVKLN-T-WTY--R-WMAA--W

Sargasso NLITVADP--LETA-FK---YPRPTLPPYMTPIEPQVGKFYNSPVALGAGAGAVLSVTFTALGCKLT-T-WTY--R-WMAA--W

AmoA_Nmeur HLPIVVEGTLLSMADYMGHLYVRTGTPEYVRHIE-Q-GSLR-T---FG-GHTTVIAAFFSAFVSMLMFTVWWYLGKVYCTAFFY

PmoA_Mtri HQATEQHGQLMSLADLVGFHFVRTSMPEYIRMVE-R-GTLR-T---FG-KEVVPVAAFFSGFVSMMVYFLWWFVGKWYSTTKVI

Page 33: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

101

Abbildung 33: Alignment von Ammonium- (AmoA) und Methan-Monooxygenase-Untereinheiten A (PmoA)verschiedener Organismen. In rot sind identische Aminosäuren dargestellt, in blau die in 60% der Sequenzenkonservierten und in grün ähnliche. Gelb unterlegt sind konservierte Aminosäurepositionen in AmoA und PmoA-Proteinen (nach Tukhavatullin et al., 2001). Abkürzungen: 54d9: crenarchaeales Genomfragment, Censym:Cenarchaeum symbiosum, Sargasso: Umweltsequenz aus der Sargassosee, Nmeur:Nitrosomonas europaea,Nmeut: Nitrosomonas eutropha, NmspENI11: Nitrosomonas sp. ENI-11, Nsbri:Nitrospira briens,Nvten:Nitrosovibrio tenuis, Nsmul:Nitrosospira multiformis, Nmsp_JL21: Nitrosomonas sp. JL21, Nmcry:Nitrosomonas cryotolerans, Nssp_Np39:Nitrosospira sp. Np39-19, Ncoce:Nitrosococcus oceani,Mtri:Methylosinus trichosporium, Mcap:Methylococcus capsulatus.

Aufgrund dieser Daten wurde ein Alignment von den drei neuen Sequenzen und bekanntenAmoAs und PmoAs erstellt (Abb. 33). Von den in der Abbildung gelb unterlegten, alskonserviert in Amo/PmoAs geltenden 36 Aminosäuren (Tukhavatullin et al., 2001) waren 13(36%) auch in den neuen Sequenzen vorhanden. Weitere 10 über alle Sequenzenkonservierte Aminosäuren konnten in dem 254 Positionen umfassenden Alignmentidentifiziert werden. Außerdem wurden zusätzlich 27 Aminosäuren entdeckt, die in denneuen Sequenzen und allen AmoAs (Nitrosococcus oceani teilweise ausgenommen)konserviert waren. Weitere 21 Aminosäuren der neuen Sequenzen kamen auch in anderen

ORF39_54d9 VMVWLRRTTH-YLF-I-VVVAVNST--L-LTINAGDYIFYTDW---AWTSFVV-FSVSQST-ML-VVGAIYYMLFTGV--P-GTACensym TMVWLRRCTH-YLF-IA-VVAVNST--L-LTINAGDYIFYTDW---AWTSFTV-FSISQ-TLML-VVGATYYLTFTGV--P-GTASargasso LMVWLRRCTH-YLF-I-VVVAVNST--L-LTINAGDYIFYTDW---AWTSFVV-FSISQ-TLML-AVGASYYLTFTGV--P-GTAAmoA_Nmeur EAVHTSRLIDAVYFPILIILLV-GTYHMHFMLLAGDWDFWMDWKDRQWWP-VV-TPIVGIT-YC-SAIM-YYL-WVNYRQPFG-AAmoA_Nmeut EAVHMSRLIDAVYFPILVVLLV-GTYHMHFMLLAGDWDFWMDWKDRQWWP-VV-TPIVGIT-YC-SAIM-YYL-WVNYRQPFG-AAmoA_NmspENI11 EAVHMSRLIDAVYFPILIVLLV-GTYHMHFMLLAGDWDFWMDWKDRQWWP-VV-TPIVGIT-YC-SAIM-YYL-WVNYRQPFG-AAmoA_Nsbri EAVKMSRMIDAVYFPILCILLV-GTYHMHFMLLAGDWDFWLDWKDRQWWP-VV-TPIVGIT-YC-AAIM-YYL-WVNYRLPFG-AAmoA_Nvten EAVKMSRMIDAVYFPILCILLV-GTYHMHFMLLAGDWDFWLDWKDRQWWP-VV-TPIVGIT-YC-AAIM-YYL-WVNYRLPFG-AAmoA_Nsmul EAVKMSRMIDVIYFPILCILLV-GTYHMHFMLLAGDWDFWLDWKDRQWWP-VV-TPIVGIT--CYAAIM-YYL-WVNYRLPYG-AAmoA_Nmsp_JL21 EAVRMSRYIDAVYFPILCILLV-GTYHMHFMLLAGDWDFWLDWKDRQWWP-VV-TPIVGIM-YC-AALM-YYL-WVNYRLPFG-AAmoA_Nmcry EAIKMSRMIDAVYFPILCILLV-GTYHMHFMLLAGDWDFWLDWKDRQYWP-VV-TPIVGIM-YC-AAIM-YYL-WVNYRLPFG-AAmoA_Nssp_Np39 ~~~~MSRMIDAVYFPILCILLV-GTYHMHFMLLAGDWDFWLDWKDRQWWP-VV-TPIVGIT-YC-AAIM-YYL-WVNYRLPFG-AAmoA_Ncoce EAAKVFRTLDFIALGAFFMILL-ASHHVHVMLLMGDWDFWVDWKDRRFWV-TV-VPIVSVA-YP-AAAQ-AFF-WEKFRLPFG-APmoA_Mtri EAAGCVKTTDWMFLTLLFLAVL-GGYHIHFMLTAGDWDFWVDWKDRRMWP-TV-VPILGVT-FA-AAAQ-AFF-WENFKLPFG-APmoA_Mcap EAVQVSRTIDWMALFVVFFVIV-GSYHIHAMLTMGDWDFWSDWKDRRLWV-TV-TPIVLVT-FP-AAVQ-SYL-WERYRLPWG-A

ORF39_54d9 TY-YATIMTIYTWVAK---GA-WFALGYPYDFIVTP-VW-IPSAMLLDLT-YWATRRNKHAAIIIGGTLVGLSL-P----IFNMICensym TY-YALIMTVYVWIAK---GA-WFALGYPYDFIATP-IW-LPSAMLLDLA-YWATKRNKHSLILFGGVLVGMSL-P----LFNMVSargasso TY-YALIMTVYTWIAK---GA-WFALGYPYDFIVTP-VW-LPSAMLLDLA-YWATKKNKHSLILFGGVLVGMSL-P----LFNMVAmoA_Nmeur TLCVVCLL-IGEWLTR-YWGFYWWSH-YPINF-VTPGIM-LPGALMLDFT-LYLTR-NWLVTALVGGGFFGLLFYPGNWPIFGPTAmoA_Nmeut TLCVVCLL-IGEWLTR-YWGFYWWSH-YPLNF-VTPGIM-LPGALMLDFT-MYLTR-NWLVTALVGGGFFGLMFYPGNWPIFGPTAmoA_NmspENI11 TLCVVCLL-IGEWLTR-YWGFYWWSH-YPINF-VTPGIM-LPGALMLDFT-MYLTR-NWLVTALVGGGFFGVLFYPGNWPIFGPTAmoA_Nsbri TLCVVCLL-TGEWLTR-YWGFYWWSH-YPINF-VFPSTM-IPGALVMD-TVMLLTR-NWMITALVGGGAFGLLFYPGNWPIFGPTAmoA_Nvten TLCIVCLL-AGEWLTR-FWGFYWWSH-YPMSF-VFPSTM-IPGALVMD-TVMLLTR-NWMITALVGGGAFGLLFYPGNWPIFGLTAmoA_Nsmul TLCIVCLL-VGEWLTR-FWGFYWWSH-YPINF-VFPSTM-IPGALIMD-TVMLLTR-NWMITALIGGGAFGLLFYPGNWPIFGPTAmoA_Nmsp_JL21 TLCIVCLL-VGEWLTR-YWGFYWWSH-YPLNF-VLPSTM-IPGALMMD-TIMLLTG-NWLVTALLGGGFFGLFFYPGNWPIFGPTAmoA_Nmcry TLCIVCLL-VGEWLTR-YWGFYWWSH-YPMNF-VLPSTM-IPGALMLD-TVMLLTR-SWLVTALVGGGFFGLFFYPGNWPIFGPTAmoA_Nssp_Np39 TLCIVCLL-SGEWLTR-YWGFYWWSH-YPISF-VFPSTM-IPGALVMD-TVMLLTR-NWMITALVGGGAFGLLFYPGNWPIFGPTAmoA_Ncoce TLVTLGVL-AGEWANR-YFNFVGFTY-FPINF-VWPTIL-LPMALFLD-A-MLAISKSYGLTAVVGGLMYGLLMYPANWPLLSAFPmoA_Mtri TFAVSGLL-IGEWINR-YCNFWGWTY-FPISL-VFPSAL-VVPALWLDIIMLLSGS-YV-ITAVVGSLGWGLLFYPNNWPAIAALPmoA_Mcap TVCVLGLL-LGEWINR-YFNFWGWTY-FPINF-VFPASL-VPGAIILDTVLMLSGS-YLF-TAIVGAMGWGLIFYPGNWPIIAPL

ORF39_54d9 NLLLVRDP--LEMA-FK---YPRPTLPPYMTPIEPQVGKFYNSPVALGSGAGAVLSVPIAALGAKLN-T-WTY--R-WMAA--WCensym NLITVADP--LETA-FK---YPRPTLPPYMTPIEPQVGKFYNSPVALGAGAGAVLSVTFAALGVKLN-T-WTY--R-WMAA--WSargasso NLITVADP--LETA-FK---YPRPTLPPYMTPIEPQVGKFYNSPVALGAGAGAVLSVTFTALGCKLT-T-WTY--R-WMAA--WAmoA_Nmeur HLPIVVEGTLLSMADYMGHLYVRTGTPEYVRHIE-Q-GSLR-T---FG-GHTTVIAAFFSAFVSMLMFTVWWYLGKVYCTAFFYAmoA_Nmeut HLPIVVEGTLLSMVDYMGHLYVRTGTPEYVRHIE-Q-DSLR-T---FG-GHTTVIAAFFAAFVSMLMFAVWWYLGKVYCTAFFYAmoA_NmspENI11 HLPIVVEGTLLSMADYMGHMYVRTGTPEYVRHIE-Q-GSLR-T---FG-GHTTVIAAFFSAFVSMLMFTVWWYLGKVYCTAFFYAmoA_Nsbri HLPLAAEGVLLSVADYTGFLYVRTGTPEYVRNIE-Q-GSLR-T---FG-GHTTVIASFFAAFVSMLMFCLWWYFGKLYCTAFFYAmoA_Nvten HLPLVVEGVLLSVADYTGFLYVRTGTPEYVRNIE-Q-GSLR-T---FG-GHTTVIAAFFAAFISMLMFTIWWYFGKLYCTAFFYAmoA_Nsmul HLPLVAEGVLLSVADYTGFLYVRTGTPEYVRLIE-Q-GSLR-T---FG-GHTTVIAAFFSAFVSMLMFTVWWYFGKVYCTAFFYAmoA_Nmsp_JL21 HLPVVVEGVLLSIADYTGFLYVRTGTPEYVRLIE-Q-GSLR-T---FG-GHTTVIAAFFSAFVSMLMFCVWWYFGKLYCTAFYYAmoA_Nmcry HLPVVVEGVLLSLADYTGFLYVRTGTPEYVRLIE-Q-GSLR-T---FG-GHTTVIAAFFAAFVSMLMFCVWWYFGKLYCTAFTMAmoA_Nssp_Np39 HLPLVVEGVLLSVADYTGFLYVRTGTPEYVRNIE-Q-GSLR-T---FG-GHTTVIAAFFAAFISMLMFCIWWYFGKLYCTAFFYAmoA_Ncoce HVPAEYNGVVMSLADIMGYQYVRTGTPEYIRMVE-K-GTLK-T---FG-KDVVPVSAFFSGFVAMVMYFVWHFVGRWFSKDYHIPmoA_Mtri HQATEQHGQLMSLADLVGFHFVRTSMPEYIRMVE-R-GTLR-T---FG-KEVVPVAAFFSGFVSMMVYFLWWFVGKWYSTTKVIPmoA_Mcap HVPVENNGMLMSIADIQGYNYVRTGTPEYIRMVE-K-GTLR-T---FG-KDVAPVSAFFSAFMSILIYFMWHFIGRWFSNERFL

Page 34: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

102

AmoAs oder PmoAs vor, waren aber nicht konserviert. Weiterhin gab es auch eine Reihekonservativer Austausche, d.h. Aminosäuren waren durch solche mit ähnlichenEigenschaften ersetzt worden. Somit sprechen 71 Aminosäurepositionen (28%) desAlignments für eine Monooxygenase, davon 27 Positionen (11%) für eine Ammonium-Monooxygenase-Untereinheit A.Analysen der Umgebung der beiden ORFs 37 und 39 ergaben weitere Hinweise auf einenZusammenhang der ORFs mit Ammonium-Monooxygenasen (Abb. 34). So zeigten diebeiden ORFs wie schon ausgeführt schwache Ähnlichkeiten bei BlastP-Analysen mitAmmonium-Monooxygenase-Untereinheiten B bzw. A und hohe mit Sequenzen aus derSargassosee. Der kleine ORF 38 zwischen den beiden kodierten mutmaßlichenUntereinheiten zeigte ausschließlich eine Ähnlichkeit mit einem ORF auf einem kurzenGenomfragment aus der Sargassosee. Auf demselben Fragment aus der Sargassosee warein zweiter ORF lokalisiert, der seinerseits schwache Ähnlichkeiten mit dem Gen amoCzeigte.

Abbildung 34: Ähnlichkeiten zwischen den ORFs 37, 38 und 39 des archaealen Fosmids 54d9 und Sequenzenaus den Datenbanken bestimmt durch BlastP. Für die blau markierten ORFs wurden Funktionen der Genprodukteannotiert, die gelb markierten stammen aus einem Metagenom-Sequenzierprojekt (Venter et al., 2004).

Zusammengenommen sind dies natürlich keine Beweise, allerdings doch eine Reihe vonIndizien, die auf Gene für Ammoniumoxidation hinweisen.

54d9

Sargassosee (e-60 - e-50) Sargassosee (e-79)

unkult. Bakterium (0.24)

UnknownUnknown

amoAamoB

Nitrosococcus oceani (e-04)

ORF 37 ORF 38 ORF 39

amoC

Nitrosomonas europaea (e-07)

UnknownUnknown

Sargassosee (e-10)

Page 35: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

103

D.7 Heterologe Expression einer neuartigen archaealen Kupfer-enthaltendenNitritreduktase (NirK) in Escherichia coli

Um Voraussetzungen für eine biochemische Charakterisierung der potentiellenNitritreduktase zu schaffen, wurde die heterologe Expression in E. coli gewählt.Problematisch stellt sich bei Kupfer-haltigen Proteinen häufig der Einbau der Metallzentrendar. In diesem Fall mussten neben den sechs Kupferzentren des potentiellen NirK-Homotrimers (Boulanger & Murphy, 2002) noch die des Amicyanins eingebaut werden, alsoinsgesamt neun Kupferzentren für ein aktives Enzym. Außer über die Enzymaktivität lässtsich der Kupfereinbau, zumindest der von blauen Typ 1 Zentren, durch UV-Spektroskopienachweisen.

D.7.1 Herstellung der Überexpressionskonstrukte

Da in der Literatur Probleme bei der Überexpression von Nitritreduktasen in E. coli mit derrichtigen Inkorporation der Kupferzentren beschrieben sind, wurden verschiedene Konstruktehergestellt (Abb. 35). Neben dem Konstrukt NR1/5N, das wie die native NirK aus demvermutlichen Signalpeptid, der Nitritreduktase-Domäne und der Amicyanin-Domänebestehen sollte, wurden verkürzte Konstrukte hergestellt, um eventuelle Probleme bei derzellulären Lokalisation und Faltung des Konstrukts NR1/5N zu umgehen. So wurden zweiKonstrukte ohne das Signalpeptid für eine cytoplasmatische Expression hergestellt (NR3/5Nund NR3/5), wobei bei NR3/5 ein Hexa-Histidin-tag zur leichteren Reinigung angehängtwurde. Ebenfalls mit His-tag wurde das nur aus der Nitritreduktase-Domäne bestehendeKonstrukt NR3/4 versehen. Um eventuell Elektronentransferstudien zwischen derNitritreduktase- und der Amicyanin-Domäne betreiben zu können, wurde zusätzlich einKonstrukt mit nur der Amicyanin-Domäne hergestellt (NR4/5N). Für eine bessere Faltung dernativ periplasmatisch lokalisierten NirK wurde außerdem bei dem Konstrukt NR3/5N27 dasnative, vermutliche Signalpeptid durch ein PelB-Signalpeptid ersetzt. Dieses sollte durch E.coli erkannt werden und zum Transport des fusionierten Proteins in das Periplasma führen.Bis auf NR3/5N27 wurden alle Konstrukte in den E. coli-Überexpressions-Vektor pET28kloniert. NR3/5N27 wurde in dem ähnlichen Vektor pET27 konstruiert, indem derLeserahmen für die Nitritreduktase- und die Amicyanin-Domäne hinter die speziell in diesemVektor vorhandene PelB-kodierende Region kloniert wurden.In allen Fällen wurden die entsprechenden Regionen des Gens mit primern die 15Nukleotide Überlapp mit dem Gen hatten und zusätzlich über Schnittstellen für dieKlonierung in den Vektor verfügten, amplifiziert. Da die PCR-Produkte sehr sauber, d.h. ohneFehlamplifikationsprodukte waren, konnten sie direkt mit einem PCR-Aufreinigungs-Kit vonden Resten der Reaktionspuffer und den verbliebenen primern gereinigt werden.Anschließend erfolgte die Herstellung kompatibler Enden durch Restriktion mit den EnzymenNcoI und XhoI. Die beiden Vektoren pET27 und pET28 wurden ebenfalls mit diesenEnzymen aufgeschnitten. Nach Ligation und Transformation von E. coli TOP10F`-Zellenwurden von den erhaltenen Klonen jeweils sechs mittels Restriktionen überprüft. Bei NR3/5

Page 36: D.2.2 Aufreinigung und Größenselektion der isolierten ...tuprints.ulb.tu-darmstadt.de/493/2/Treusch_Diss_2.pdf · Die Elektrophorese erfolgte in einer Pulsfeldapparatur unter Bedingungen,

D Ergebnisse

104

Abbildung 35: Schematische Darstellung der Konstrukte zur heterologen Expression des archaealenNitritreduktase-Gens. Abkürzungen: TM: natürlich vorkommende Transmembrandomäne, vermutlichSignalpeptid; PelB: von E. coli erkanntes Signalpeptid (Vektor-kodiert); His: Hexa-Histidin-tag.

waren zwei davon richtig, bei allen anderen Konstrukten alle analysierten Klone.Weitergearbeitet wurde mit jeweils einem der Klone. Die Plasmide wurden in denExpressionsstamm E. coli BL21-CodonPlus(DE3)-RIL mittels Elektroporation transformiert.Von den daraufhin untersuchten Klonen enthielten alle neben dem eingebrachten Konstruktdas 3.582 bp große CodonPlus-Plasmid mit zusätzlichen tRNA-Genen, um den geringerenG+C-Gehalt des zu exprimierenden Gens auszugleichen. Für alle folgendenExpressionsversuche wurden die Klone frisch aus Kryokonserven angeimpft.Für die genauen Protokolle der Herstellung der Konstrukte siehe C.12.1.

D.7.2 Überexpression der Nitritreduktase

Anfänglich wurde überprüft, ob die ausgewählten Klone das gewünschte Proteinexprimierten. Dazu wurden die Zellen aus einer Übernachtkultur angeimpft und bis zumErreichen einer OD von 0,8 geschüttelt. Dann erfolgte die Induktion mit 0,1 mM IPTG, wobeizusätzlich 50 µM CuSO4 zugesetzt wurden. Die Dauer der Induktion betrug 6 Stunden mitProbenentnahmen zum Zeitpunkt der Induktion sowie nach 1, 2 und 3 Stunden. In Abbildung36 sind die Zell-Rohextrakte sowie die Cytoplasmafraktionen (Überstande nach 20.000 rpmZentrifugation) und die 20.000 rpm-Fraktionen (Sedimente nach 20.000 rpm Zentrifugation)der Konstrukte NR3/4, NR3/5N und NR4/5N nach Auftrennung in einer SDS-Polyacrylamidgelelektrophorese zu sehen. Bei NR3/4 (Spuren 1-6) erkennt man, dass ein

54d9 NirK

NR 1/5N

NR 3/5N

NR 3/5

NR 3/4

NR 4/5N

NR 3/5N27

Nitritreduktase-Domäne (NirK) AmicyaninTM

Nitritreduktase-Domäne (NirK) AmicyaninTM

Nitritreduktase-Domäne (NirK) Amicyanin

Nitritreduktase-Domäne (NirK) His

Amicyanin

Nitritreduktase-Domäne (NirK) AmicyaninPelB

Nitritreduktase-Domäne (NirK) Amicyanin His

Signalpeptidase-Spaltstelle

N C

N

N

N

N

N

N

C

C

C

C

C

C