Ektope Genexpression in Bakterien und · PDF fileOxidasen und Protein-Disulfid-Isomerasen...
Transcript of Ektope Genexpression in Bakterien und · PDF fileOxidasen und Protein-Disulfid-Isomerasen...
Ektope Genexpression in Bakterien und Hefen Robert Jabulowsky AG Wels Methodenseminar BCII-Praktikum am Georg-Speyer-Haus 10.01. und 31.01.2012
Produktion von rekombinanten Proteinen
⇒ zahlreiche Expressionssysteme mit einer Reihe gut bekannter Organismen oder Zelllinien und verschiedenen Expressionsvektoren .
= die gezielte Synthese (großer Mengen) eines gewünschten fremden Genprodukts in einer lebenden Zelle
Ablauf: Ø Einführen des für das rekombinante Protein kodierende Gen in einen Vektor (Plasmid) Ø Transformation/Transfektion der gewählten Zielzelle
Ø Kultivierung der Wirtszelle
Ø Expression des Gens konstitutiv oder induziert ab einem best. Zeitpunkt
Ø Reinigung des rekombinanten Proteins
Genexpressionssysteme
prokaryontische Expressionssysteme Escherichia coli (E. coli) Lactococcus lactis andere Bakterien (z.B. Bacillus subtilis)
eukaryontische Expressionssysteme
Hefe: Saccharomyces cerevisiae
Pichia pastoris Hansenula polymorpha
Insektenzellen: Baculovirus-System
stabile, das rekombinante Protein exprimierende Zelllinien Säugetierzellen: stabile, das rekombinante Protein exprimierende Zelllinien
induzierbare Systeme
Suche nach einem geeigneten Expressionssystem
Die Kombination aus Wirtszelle und Expressionsvektor richtet sich nach dem späteren Verwendungszweck des Proteins d.h. nach den Anforderungen an das Expressionsprodukt:
• Bioaktivität bzw. posttranslationelle Modifikation gewünscht bzw. erforderlich?
• Hohe Ausbeute wichtig?
• Protein evt. zytotoxisch?
• Expressionssysteme einfach und schnell zu etablieren?
• Expressionsbedingungen einfach und schnell zu optimieren?
• Wie hoch sind Aufwand und Kosten der Kultivierung der Wirtszelle?
• Evt. Vorerfahrungen mit den Wirtszellen?
• Expressionsprodukte einfach zu reinigen?
⇒ Abwägung der Vor- und Nachteile des jeweiligen Systems führt zur Wahl des für das interessierende Protein geeigneten Expressionssystems
bakterielle Expressionssysteme
Vorteile • hohe Ausbeute
• einfache, billige Kultivierung
• gute Raum-/Zeit-Ausbeute
• Organismus umfassend bekannt, einfach zu handhaben und zu manipulieren
• zahlreiche Kontrollelemente auf Transkriptions- und Translationsebene bekannt
Nachteile • keine posttranslationale Modifikation und
Sekretionsmechanismen eukaryontischer Zellen
⇒ häufig keine bioaktiven Proteine
• Expressionsprodukte evt. schwerlöslich in Form von „inclusion bodies“
Escherichia coli
Ø gram-negatives Bakterium (Enterobacteriaceae) Entdecker: Theodor Escherich, 1919 einer der am besten untersuchten Organismen der Welt
E. coli
Ø relativ kleines Genom (ca.4,6 Millionen Basenpaare = ca. 5000 Gene) wurde als eines der ersten vollständig sequenziert (1997; E. coli Stamm K-12, MG1655)
Ø der am häufigsten verwendete Organismus für die heterologe Proteinexpression Standard für die Produktion von diagnostischen und analytischen Enzymen industrielle Biosynthese von Insulin, Aminosäuren und pharmazeutisch relevanter Proteine (Einschränkung: Proteine dürfen nicht aus mehreren Untereinheiten bestehen oder posttranslationelle Modifikationen benötigen)
⇒ Es gibt viele verschiedene Stämme, die für die Proteinexpression eingesetzt werden, und hunderte verschiedener Expressionsvektoren mit unterschiedlichen Promotoren, Selektionsmarkern und evtl. Fusionspartnern
Escherichia coli
Die meisten E. coli Stämme im Labor gehen auf den E. coli K-12 Stamm zurück. E. coli
keine Toxine keine Adhäsionsfaktoren keine Invasionsfaktoren kein Eisen-Transport-System keine Kapsel keine Plasmide kleineres Genom rauer Kolonietyp (unvollständiges LPS)
Eisentransport
Toxine Kapsel Adhesion
Invasion
Andere häufig verwendete Stämme stammen von E. coli B ab; ebenfalls ohne Pathogenitätsfaktoren. Mühldorfer & Hacker (1994). Microbial Pahtogenesis 16, 171. Kuhnert et al. (1997). Appl. Environ. Microbiol. 63(2), 703.
pathogener E. coli E. coli K-12
Sicherheitsmerkmale von E. coli K-12:
Aufbau eines Expressionsvektors für E. coli
Replikationsursprung (Origin of replication; Ori) Selektionsmarker (z.B. Resistenzgen) Expressionskassette für eine regulierte Transkription und Translation Promoter Transkriptionsterminator Ribosomenbindungsstelle mit Shine-Dalgarno Sequenz Start- und Stoppkodon Multiple Klonierungsstelle optional: Sequenz für Fusionsprotein, N- und/oder C-terminalen Tag regulatorisches Gen (z.B. Repressorgen)
E. coli
Replikationsursprung
Die Initiation der DNA-Replikation beginnt bei Prokaryoten stets an einer best. Stelle des DNA-Moleküls, die als Ursprung der Replikation bezeichnet wird: origin of replication (Ori) kontrolliert die Anzahl der Kopien eines Plasmids (= Anzahl der Plasmid-Moleküle pro Zelle)
Viele Expressionssysteme basieren auf den ColE1-Typ des origin of replication (multicopy Plasmid). Der Verlust dieser best. Sequenz führt zum Verlust der Fähigkeit, sich selbst zu replizieren.
E. coli
Selektionsmarker
Antibiotika-Resistenz-Gen Nachweis und Selektion transformierter Bakterien Selektionsdruck Fehlender Selektionsdruck kann zum Verlust des Expressionsplasmids führen.
E. coli
Promotor
= Basensequenz, an die die RNA-Polymerase bindet (Transkriptionsinitiation) steuert die Herstellung großer Mengen mRNA des interessierenden Gens
E. coli
Ein guter Promoter sollte folgende Eigenschaften mitbringen: 1. stark (10-30 % des Gesamtproteins sollte rekombinantes Protein sein)
2. gut regulierbar (nur geringe basale Transkription)
• Hohe konstitutive heterologe Expressionsraten beeinträchtigen häufig den Zellmetabolismus und führen dadurch zum Absterben der Zellen. (metabolischer Stress und genetische Instabilität) • exprimiertes Protein könnte toxisch sein
Regulation der Promotor-Aktivität
E. coli
⇒ Einsatz von induzierbaren Expressionssystemen Induktion der Genexpression durch Metabolitzugabe Entfernen bestimmter Kohlenstoffquellen Temperaturveränderung
⇒ Regulation durch Expression eines Repressors
Promotoren von Expressionsvektoren sollten während der Wachstumsphase inaktiv und erst nach Induktion der Genexpression aktiv sein.
häufig verwendete induzierbare Promotoren
E. coli Promotor Induktion durch lac-Promotoren IPTG (Isopropyl-β-D-1-thiogalactopyranoside; lac Lactose-Derivat) lac/UV5 tac trc T7 IPTG trp Tryptophanmangel araB Arabinose phoA Phosphatmangel
lac-Promotoren Repressorprotein ist durch das lac I-Gen codiert. Der lac-Repressor ist bei Abwesenheit des Effektormoleküls aktiv und bindet an den Promotor. Das Effektormolekül/Induktor (hier IPTG) bindet an den Repressor und löst die Bindung des Repressors an die Operator-Sequenz auf.
Regulation der Promotor-Aktivität
E. coli Minimierung der basalen Transkription durch die Anwesenheit eines Repressors z.B. durch Bindung von Regulatorproteinen an den Promoter
Der lac I-Gen liegt entweder auf dem Expressionsvektor (bei high copy Plasmiden) oder im E. coli Genom. z.T. werden E. coli Stämme mit einer mutierten Form des lac I Allels (lacIq) verwendet, was zu einer 10fach höheren Repressorproduktion führt.
pET (plasmid for expression by T7 RNA-Polymerase) sehr häufig verwendetes, sehr gut regulierbares Expressionssystem pET-Vektoren besitzen den sehr starken T7-Promotor (aus dem Bakteriophagen T7) der von der T7-RNA-Polymerase erkannt wird.
pET-System (Novagen)
E. coli
Regulation der Expression durch die Verwendung von E. coli Stämmen, bei denen das Gen der T7-Phagen-RNA-Polymerase (hier des Prophagen DE3) unter der Kontrolle des Lac/UV5-Promotors ins Chromosom integriert ist.
zum Teil auch T7 lac-Promotor T7-Promoter mit zusätzlicher downstream lac-Operator-Sequenz
pET-System (Novagen)
E. coli
lacI = lac-Repressor-Gen
Sequenz, die zur Termination der Transkription führt. Ausbildung einer haarnadelförmigen Sekundärstruktur innerhalb der RNA, die den Transkriptionsapparat behindert, so dass die Transkription zum Erliegen kommt. Zusätzlich ist die mRNA dadurch stabilisiert und vor Exonukleasen geschützt.
Transkriptionsterminator
E. coli transcription terminator (TT)
Initiation der Translation: Ribosomenbindungsstelle (RBS) mit Shine-Dalgarno Sequenz (SD) Die Shine-Dalgarno Sequenz ist 5-13 Nukleotide upstream des Startkodons lokalisiert. (optimaler Abstand: 8 Nukleotide). Konsensus-Sequenz: 5’-TAAGGAGG-3’. bindet die ribosomale 16S rRNA. Startkodon (Translationsinitiationskodon) Termination der Translation: Stoppkodon (UAA in E. coli)
Translation
E. coli
stopcodon
Multiple Klonierungsstelle
multiple cloning site (MCS) im Anschluss an die Kontrollregionen des Expressionsvektors Sequenz mit verschiedenen Schnittstellen für Restriktionsendonukleasen zum Einbringen einer Gensequenz in den Expressionsvektor Schnittstellen sind einzigartig auf dem Vektor und sollten in der das rekombinante Protein kodierenden DNA-Sequenz nicht vorkommen. Aus den verschiedenen Restriktionsschnittstellen kann die jeweils am besten passende ausgewählt und verwendet werden.
E. coli
Detektion und Reinigung
Zur Erleichterung der Detektion und der Reinigung der rekombinanten Proteine beinhalten die Expressionsvektoren oft Sequenzen für eine/ein • N-terminale oder C-terminale kurze Peptidsequenz (tag) • Fusionsprotein Tags und Fusionsproteine können z.T. mit Hilfe von geeigneten spezifischen Proteasen wieder abgespalten werden. Vektoren weisen oft Linkerregionen auf, die für Protease-Erkennungssequenzen kodieren.
E. coli
Tags (Bsp.): Polyhistidin ⇒ Detektion, Aufreinigung Myc ⇒ Detektion Strep ⇒ Detektion, Aufreinigung
Fusionsprotein (Bsp.): Glutathion-S-Transferase ⇒ Detektion, Aufreinigung
Kritische Punkte bei der Proteinexpression
Proteolyse
Disulfidverbrückung und Faltung
Toxizität
Aggregation und Bildung von Inclusion Bodies (Einschlusskörpern)
Abweichungen in der Kodon-Auswahl (Codon Usage)
E. coli
Niedrige Ausbeuten sind häufig Folge proteolytischen Abbaus während der Kultivierung oder während der Reinigung.
⇒ Verwendung von Protease-defizienten E. coli Stämmen
E. coli BL21 defizient für lon Protease (intrazellulär) ompT Protease (äußere Membran)
⇒ niedrige Kultivierungstemperaturen ⇒ kurze Inkubationszeiten ⇒ Stabilisierung des Proteins durch weniger anfälligen Aminoterminus ⇒ Sekretion in den periplasmatischen Raum
Vermeidung von Proteolyse
E. coli
Disulfidverbrückung und Faltung
Viele Proteine benötigen die Ausbildung von Disulfidbrücken für die richtige Faltung und Aktivität ⇒ Transport/Sekretion in ein oxidierendes Zellkompartiment, das Periplasma ⇒ Verwendung von E. coli Stämmen mit veränderten Redoxbedingungen im Cytosol, die die Ausbildung von Disulfidbrücken im Cytosol erlauben. z.B. durch Inaktivierung der Thioredoxin-Reduktase
erhältlich E. coli Stämme: AD494: Mutation der Thioredoxin-Reduktase (trxB). Origami: Mutation der Thioredoxin-Reduktase und Glutathione-Reduktase (gor)
E. coli
Periplasmatische Expression
Die Sekretion von rekombinantem Protein in das Periplasma wird durch eine Fusion mit einem N-terminalen Leader- oder Signalpeptid erreicht z.B. das von OmpT, OmpA oder PelB. Das Periplasma ist ein Zellkompartiment zwischen Cytoplasmamembran und äußerer Membran gram-negativer Bakterien.
E. coli
Jeff Dahl, en.wikipedia.org
Periplasmatische Expression
Vorteile • Expression von nativem Protein mit entsprechender Faltung möglich • oxidierende Bedingungen im Periplasma gram-negativer Bakterien erlauben die Ausbildung von Disulfidbrücken (≠ Cytoplasma: reduzierende Bedingungen) • korrekte Ausbildung von Disulfidbrücken durch die im Periplasma anwesenden Foldasen, Oxidasen und Protein-Disulfid-Isomerasen (z.B. DsbA, DsbC) • Aggregatbildung kann unterdrückt werden • reduzierte Proteolyse (weniger Proteine anwesend) • im Cytoplasma toxische Proteine können im Periplasma akkumuliert werden
E. coli
Nachteile • relativ niedriges Expressionsniveau • durch den limitierenden Membrantransport z.T. Akkumulation von Vorläuferproteinen im Cytoplasma
Inclusion Bodies (Einschlusskörper)
Intrazelluläre Aggregate von zumeist fehlerhaft oder unvollständig gefalteten Proteinen (bis zu 50% des gesamten Proteingehalts)
Eines der Hauptprobleme bei der Expression v.a. hydrophober rekombinanter Proteine unter einem starken Promotor
Proteine in Inclusion Bodies sind meist inaktiv und denaturiert.
E. coli
Vorteile • Expression sehr großer Proteinmengen möglich v.a. von Vorteil, wenn Protein renaturierbar ist oder denaturiert verwendet werden kann • Inclusion Bodies enthalten häufig exklusiv das rekombinante Protein. • Inclusion Bodies verleihen den Proteinen einen gewissen Schutz vor proteolytischem Abbau. • Auch toxische Proteine können so in relativ großen Mengen im Cytosol exprimiert werden.
Inclusion Bodies
E. coli Reinigung rekombinanter Proteine aus Inclusion Bodies bei gleichzeitiger Wiederherstellung der biologischen Aktivität (kritischer Punkt) 1. Isolation der Inclusion Bodies durch Zentrifugation nach Zellaufschluss 2. Lösung der aggregierten Proteine mit denaturierenden Agenzien (8M Urea, 6M Guanidine-HCl) 3. Renaturierung der Proteine durch Dialyse 4. Reinigung des nativen Proteins
Erhöhung der Löslichkeit rekombinanter Proteine
E. coli • Sekretion ins Periplasma • Vermeidung der Ausbildung von Inclusion Bodies:
⇒ Expression zusammen mit einem Fusionsprotein, dass die Löslichkeit des rekombinanten Proteins erhöht z.B. Glutathion-S-Transferase (GST) N utilizations substance A (NusA)
⇒ Reduktion der Temperatur während der Proteinexpression auf 20°C
Kodon-Auswahl (codon usage)
= Häufigkeit der Verwendung bestimmter Kodons und der damit verbundenen Anpassung der Expression der entsprechenden tRNAs • nicht alle 61 möglichen mRNA Kodons werden von verschiedenen Spezies mit der gleichen Frequenz verwendet > Konzentration bestimmter tRNAs kann dadurch für eine effiziente Expression des gewünschten Proteins zum limitierenden Faktor werden. ⇒ Seltene Kodons können den Translationsprozess verlangsamen und zur Anhäufung verkürzter Formen des gewünschten Proteins führen.
E. coli
Kodon-Auswahl (codon usage)
E. coli Kodons, die mit Translationsproblemen in E. coli assoziiert sind:
Mittlerweile erhältliche E. coli Stämme, die von einem Helferplasmid seltene tRNAs exprimieren:
Hefen-Expressionssysteme
Vorteile • Organismus gut bekannt • Kultivierung und Manipulation ausführlich beschrieben • einfache Handhabung • kurze Generationszeit • einfache und kostengünstige Medien (im Vergleich zu Medien für Insekten- und Säugerzellen) • fast alle posttranslationale Modifikationen, Proteinprozessierungen- und Sekretionsmechanismen höherer eukaryontischer Zellen (korrekte Faltung der Proteine, Bildung von Disulfidbrücken, Glykosylierungen, Phosphorylierungen etc.)
Nachteile • einige posttranslationelle Glykosylierungen abweichend von Säugerzellen • Ausbeuten niedriger als z.B. bei E. coli
Pichia pastoris versus Saccharomyces cerevisiae
Nachteile der Proteinexpression in Saccharomyces cerevisiae: • kein starker, induzierbarer Promotor
• vergleichsweise niedrige Produktausbeute (1-5 % des Gesamtproteins)
• heterologe Expression des Proteins während der Wachstumsphase behindert das Wachstum
• z.T. Hyperglykosylierung von rekombinanten Proteinen
⇒ Probleme mit der Immunogenität und reduzierte Aktivität
• häufig nur schwache Sekretion von Fremdproteinen in den Kulturüberstand
Vorteile der Proteinexpression in Pichia pastoris (1)
• Pichia pastoris kann unter ähnlichen Konditionen kultiviert werden wie S. cerevisiae
⇒ methylotrophe Hefe: Wachstum mit Methanol als einzige Kohlenstoffquelle möglich
• Verfügbarkeit eines sehr starken, streng regulierten Promotors
• extrem hohe Produktionsraten bei intrazellulär lokalisierten Proteinen
• viele Proteine können effektiv in das nahezu proteinfreie Medium sezerniert werden
⇒ N-terminales α-Faktor Sekretionssignal
• einfache und effiziente Anzucht im Fermenter zu extrem hohen Zelldichten
• im Gegensatz zu S. cerevisiae stark reduzierte alkoholische Gärung
d.h. selbst bei hohen Zellzahlen keine toxischen Ethanolkonzentrationen
Pichia pastoris versus S. cerevisiae
Vorteile der Proteinexpression in Pichia pastoris (2) • wesentlich seltener Hyperglykosylierung rekombinanter Proteine
• keine Ausbildung stark immunogener α-1,3-mannosidischen Bindungen
• Glykosylierungsmuster ähnlich dem in humanen Zellen
• Integration des rekombinanten Vektors in das P. pastoris-Genom führt zu stabilen Klonen
Pichia pastoris versus S. cerevisiae
Pichia pastoris Vektoren sind E. coli shuttle Vektoren Klonierung im E.coli Hintergrund E. coli Replikationsursprung (ori) E. coli Resistenzgen Expressionskassette für P. pastoris • AOX1 promoter • α-mating factor Signalsequenz (Sig) von S. cerevisiae (für Sekretion) • Multiple Klonierungsstelle (MCS) • Transkriptionsterminator • Kozak-Sequenz (Translationsinitiation) Selektionsmarker (oft his-4; Histidinol-Dehydrogenase-Gen) zur Selektion auf Histidin-Mangelmedium von transformierten his- Stämmen 5‘- und 3‘- AOX1 Sequenzen erlauben die Rekombination mit dem AOX1 Locus im Pichia pastoris Genome (zielgerichtete Plasmidintegration)
Aufbau eines Expressionsvektors für P. pastoris
Alkoholoxidase 1 Promotor (AOX1) • sehr effiziente Regulation
• vollständig reprimierbar durch Glucose und hohe Konzentrationen anderer Kohlenstoffquellen
• starke Induktion bei Wachstum auf Methanol als einzige C-Quelle
• induzierbarer Promoter erlaubt eine hohe Wachstumsrate vor der Proteinproduktion
(wichtig für Expression von toxischen Proteinen)
AOX1-Promotor
P. pastoris besitzt keine eigenen stabilen, episomalen Plasmide ⇒ Zur Expression fremder Gene werden die Expressionsvektoren ins Genom integriert
Vektoren werden vor der Transformation linearisiert (Vektorinterne Restriktionsschnittstellen) Integration erfolgt über homologe Rekombination
Integration des Expressionsvektors ins Genom
Single crossover Event: (Integration) AOX, (his-4)
Integration des Expressionsvektors ins Genom
Double crossover Event (Genaustausch): AOX, (his-4)
Integration des Expressionsvektors ins Genom
Ø Klonierung der gewünschten Gensequenz in den Expressionsvektor
Ø Linearisierung des Expressionsvektors
Ø Transformation kompetenter Hefezellen (his-) mit der linearisierten Plasmid-DNA durch Elektroporation Ø Selektion von positiven Klonen auf Platten mit Histidin-Mangelmedium Ø Animpfen von Expressionskulturen mit verschiedenen Klonen, um das individuelle Expressionslevel zu bestimmen Ø Wachstum der Hefeklone in komplexem Glycerol-Medium (BMGY); 2 Tage Ø Induktion der Proteinexpression durch Umsetzen auf Methanol-haltiges Medium Ø Analyse der Hefekulturüberstände nach 2-4 Tagen (z.B. im Westernblot)
Proteinexpression in Pichia pastoris
Genetische Modifikation von P. pastoris
führt zu Glykosilierungsmustern die
denen des Menschen entsprechen.
Humanisierter Glykosylierungsapparat
humane Proteine in Pichia pastoris exprimiert
Zusammenfassung und Ausblick