Post on 07-Feb-2022
1
Genomforschung und SequenzanalyseEinführung in Methoden der Bioinformatik
Bernhard Lieb & T. Hankeln
WS 2006/2007
Protein-Sequenzanalyse
&
Proteomics
Proteine ?!
2
Themen
Was sind Proteine?
„Protein-Sequenz-Analyse“
"Proteomics"
Aufbau von Aminosäuren
NC
C
HH
R1
O
OHH
Rest: Definiert die Eigenschaften
Carboxylgruppe
Ca-Atom
Aminogruppe
Aminosäuren unterscheiden sich – bis auf Prolin – nur in den Resten
3
Aufbau von ProteinenAlanin Ala A Serin Ser SValin Val V Threonin Thr TPhenylalanin Phe F Tyrosin Tyr YProlin Pro P Histidin His HMethionin Met M Cystein Cys CLeucin Leu L Asparagin Asn NIsoleucin Ile I Glutamin Gln QAspartat Asp D Tryptophan Trp WGlutamat Glu E Glycin Gly GLysin Lys KArginin Arg R
hydrophobgeladenpolar
Rest
AminosäurenNicht jeder Aminosäureaustausch ist gleich wahrscheinlich!
Aminosäure-Eigenschaften:
CP
GGAVIL
MF
YW H
KR
E Q
DNS
TCSH
S+S
sehr klein
klein
geladen
positivpolararomatisch
aliphatisch
hydrophob
4
Die Peptidbindung
NCa
C
HH
R1
O
H N
Ca
C
HH
R2
O
OH
NCa
C
HH
R1
O
OHH N
Ca
C
HH
R2
O
OH
H+
H2O
-> Kondensation
Peptidbindung
Partiellen Doppelbindungscharakter der C-N-Bindung=> Rotation nur möglich am Cα-Atom möglich!
C
O
N
H
5
Primärstruktur
NH2-Met-Ala-Asp-Arg-Ile-Ala-Asn-Ala Ala Asn Asp Glu Leu Glu Ala-COOH
Primärstruktur: Reihenfolge der Aminosäuren.kodiert durch DNA
Schreibweise: vom N- zum C-Terminus (Translationsrichtung!)
Die Sequenz wird im Genom festgelegt, d.h., wenn wir die DNA-Sequenz kennen, kennen wir auch (fast) das Protein.
= M A D R I A N A A N D E L E N A
Sekundärstruktur
α-Helix
β-Faltblatt
= feste, sich wiederholende Faltungselemente in einem Protein
Seitenketten sind an der Faltung nicht beteiligt.aber: bestimmte Aminosäuren sind in den Strukturen häufiger beteiligt als andere!
6
Tertiärstruktur3D-Struktur bzw. Faltung eines Proteins bzw. einer Polypeptidkette.
‚Jedes‘ Protein bzw. Peptid hat eine Tertiärstruktur!
Hämocyanin
Quartärstruktur
Besteht ein funktionelles Protein aus mehreren Polypeptidketten, so nennt man die Anordnung der Ketten "Quartärstruktur".
=> Jedes Protein hat eine Tertiärstuktur, aber nicht jedes hat eine Quartär-struktur!
HHÄÄMOCYANINMOCYANIN
7
Proteinsequenzanalyse
Genomforschung:• Ermittlung und Analyse von DNA-Sequenzen, bis hin zurBestimmung vollständiger Genome.
• Ein wichtiges Ziel ist die Vorhersage von Genen etc.• Daraus: Vorhersage von Proteinsequenzen. • Aber: pure Sequenz sagt meist nichts über Struktur und Funktion im Organismus.
ATGCTCAAGATACAT ...
M L K I H...
O2
Expert Protein Analysis System
10
Proteinsequenzanalyse(am Computer)
Eingabe: AminosäuresequenzHauptziel: Vorhersage der Funktion!- Welche biochemischenbiochemischen Eigenschaften hat das
Protein? - Gibt es verwandteverwandte Proteine, evt. mit bekannter
Funktion?- Gibt es bekannte SequenzmotiveSequenzmotive?- WoWo ist das Protein wahrscheinlich lokalisiert?- Welche posttranslationalenposttranslationalen Änderungen kann es
geben?- Vorhersage der 2D und 3D3D--StrukturStruktur
Biochemische EigenschaftenIsoelektrischer Punkt (pI)Molekulargewicht/Molekülmasse (MW)
Erste Analyse einer Proteinsequenz:=> Stimmen die berechneten Daten mit den biochemischen Daten überein?=> Wo muss ich mein Protein im 2D-Gel suchen?
Theoretical pI/MW (average) for the proteinsequence
MGAVLSVVWG ... NAVIFTSYDA :
Theoretical pI/Mw: 6.09 / 20728.86
11
Proteinsequenzanalyse(am Computer)
Eingabe: AminosäuresequenzHauptziel: Vorhersage der Funktion!- Welche biochemischenbiochemischen Eigenschaften hat das
Protein? - Gibt es verwandteverwandte Proteine, evt. mit bekannter
Funktion?- Gibt es bekannte SequenzmotiveSequenzmotive?- WoWo ist das Protein wahrscheinlich lokalisiert?- Welche posttranslationalenposttranslationalen Änderungen kann es
geben?- Vorhersage der 2D und 3D3D--StrukturStruktur
12
Proteinfunktion
Proteine mit gleicher Funktion in verschiedenenOrganismen sind häufig ortholog, sie zeigen daher signifikante Sequenzübereinstimmungen.Proteine mit ähnlicher Funktion im gleichen oder in verschiedenen Organismen zeigen ebenfalls häufig signifikante Sequenzübereinstimmungen (paralog). => Funktionsvorhersage durch Vergleich => Datenbankanalysen (BLAST, PSI-BLAST)Aber: Um sicher zu gehen, muss die vorhergesagte Funktion des gesuchten Proteins in vivo überprüft werden.
HämocyanineUntereinheit
Proteinsequenzanalyse(am Computer)
Eingabe: AminosäuresequenzHauptziel: Vorhersage der Funktion!- Welche biochemischenbiochemischen Eigenschaften hat das
Protein? - Gibt es verwandteverwandte Proteine, evt. mit bekannter
Funktion?- Gibt es bekannte SequenzmotiveSequenzmotive?- WoWo ist das Protein wahrscheinlich lokalisiert?- Welche posttranslationalenposttranslationalen Änderungen kann es
geben?- Vorhersage der 2D und 3D3D--StrukturStruktur
14
Pfam (Protein Families)gegründet 1997
Erik Sonnhammer (Karolinska Institutet, Stockholm),Sean Eddy (Washington University in St. Louis),
Richard Durbin (Sanger Center, Cambridge)Zusammensetzung eines Proteins aus einzelnen Proteindomänen ermittelbar
Wikipedia
Protein(super)familien
Proteine mit ähnlicher Sequenz und ähnlicher Funktion werden in Proteinfamilien zusammengefasst.Bsp.: Hämoglobine: Hämoglobin α und β-Ketten der Wirbeltiere
Hämocyanine: Hämocyaninuntereinheiten der ArthropodenWeiter entfernt verwandte Proteine mit erkennbarenSequenzähnlichkeiten, aber nicht notwendigerweise ähnlicherFunktion fasst man als Proteinsuperfamilien zusammen.Bsp.: Globine: alle Globin-ähnlichen Sequenzen in Bakterien, Pilzen,
Protisten und TierenHämocyaninsuperfamilie: Hämocyanine, Tyrosinasen…
Aber: Bezeichnung nicht immer eindeutig! (Ursprünglich nach Dayhoff: >50% Identität = Proteinfamilie)
16
Motive und DomänenHäufig ist bei Proteinen ähnlicher Funktion nicht das gesamte Protein konserviert, sondern nur Teilbereiche.Funktionell und strukturell wichtige Regionen eines Proteins (z.B. aktive Zentren) sind in der Evolution stärker konserviert als andereBereiche. Kurze Sequenzen nennt man "Motive" (Segmente, Blocks), grössereAbschnitte "Domänen". Solche Abschnitte können in ansonsten strukturell und/oderfunktionell sehr unterschiedlichen Proteinen vorkommen.Domänen stellen zumeist Faltungsabschnitte in der 3D-Struktur einesProteins dar. Durch Vergleich mit Gruppen anderer Proteine bekannter Funktion istes möglich, diese funktionellen Bereiche herauszufiltern.
Proteinsequenzanalyse(am Computer)
Eingabe: AminosäuresequenzHauptziel: Vorhersage der Funktion!- Welche biochemischenbiochemischen Eigenschaften hat das
Protein? - Gibt es verwandteverwandte Proteine, evt. mit bekannter
Funktion?- Gibt es bekannte SequenzmotiveSequenzmotive?- WoWo ist das Protein wahrscheinlich lokalisiert?- Welche posttranslationalenposttranslationalen Änderungen kann es
geben?- Vorhersage der 2D und 3D3D--StrukturStruktur
17
Domänen in PFAM
=> Funktionsvorhersagen!
DrosophilaProteine
Signal Transduction
4%
Enzyme18%
Nucleic AcidBinding
8%Hypothetical
11%
Unknown48%
Transporter 4%
Structural Protein2%
Ligand Binding orCarrier
2%
Cell Adhesion1%Motor Protein
1%Chaperone
1%
Nucleic Acid Binding Enzyme Signal TransductionTransporter Structural Protein Ligand Binding or CarrierCell Adhesion Chaperone Motor ProteinUnknown Hypothetical
13.601 Gene
18
Proteinsequenzanalyse(am Computer)
Eingabe: AminosäuresequenzHauptziel: Vorhersage der Funktion!- Welche biochemischenbiochemischen Eigenschaften hat das
Protein? - Gibt es verwandteverwandte Proteine, evt. mit bekannter
Funktion?- Gibt es bekannte SequenzmotiveSequenzmotive?- WoWo ist das Protein wahrscheinlich lokalisiert?- Welche posttranslationalenposttranslationalen Änderungen kann es
geben?- Vorhersage der 2D und 3D3D--StrukturStruktur
Postranslationale Modifikationen
Viele Proteine werdenposttranstionalmodifiziertGlykosylierung, Phosphorylierung, Sulphorylierung ...
19
Postranslationale Modifikationen
z.B. N-Glycosylierung: N-X{P}-[TS]
Aber: Wenn Sequenz-Motiv vorhanden, heißt das nicht, dass dieses benutzt wird! Genauigkeit ~ 50 bis 80%.
Hauptgrund: Proteinstruktur! Lokalisation!
Asparagin
‚Irgendeine‘ Prolin hemmt
Threonin oder Serin
Nachweis ????
Signalsequenzen
20
Konservierte "Signale" in der AS-Sequenz verraten vielüber die Lokalisation des Proteins in der Zelle, und damitüber dessen (mögliche) Funktion:Mitochondriales LokalisationsignalExportsignale (Signalpeptid)TransmembransequenzKernlokalisationssignalDNA-Bindungsmotive…
Signalsequenzen
DPTNIRKNVADLTHDVALNLQIAL…
Signalpeptide
Schnittstelle
Ein eukaryontisches Signalpeptid besteht aus:einer ‘positiv geladenen’ etwas ‘Argninn’-Regioneiner kurzen, sehr hydrophoben α-hhelicalen (hh-Region)einer "ccleavage"-Region; -33,-1 Positionen meist kleine ungeladene AS
Nautilus pompilius hemocyanin
h-Region
MNWHALQRSMATHWHSLLLFSLQLLVFTYAATS
n-Region c-Region
rich in Ala, Asp/Glu, and Ser/Thrno pattern +1 to +5 region
almost exclusively Ala small and neutral residues -3,-1 positions
longer, Pro+Thr-rich short, Ser+Ala-rich short, no pattern c-regions
very long, less hydrophobic slightly longer, less hydrophobic short, very hydrophobic h-regions
Lys+Arg-rich only slightly Arg-rich n-regions
32.0 aa 25.1 aa 22.6 aa Total length (average)
Gram-positive Gram-negative
Prokaryotes Eukaryotes
http://www.cbs.dtu.dk/services/SignalP-3.0/background/dataset.php
21
SignalP< Is the sequence a signal peptide?>Sequence length = 56# Measure Position Value Cutoff signal peptide?max. C 33 0.768 0.32 YESmax. Y 33 0.820 0.33 YESmax. S 23 0.994 0.87 YES
# Most likely cleavage site between pos. 32 and 33: ATS-DP
C = cleavage score S = signal peptide score Y = combined score
Vorhersage transmembranerHelix-Regionen
Problem: Es sind nicht sehr viele 3D-Strukturen von transmembranen Proteinen bekannt (Probleme mit Kristallographie)Durch Analyse der Ladungseigenschaften (hydrophil vs. hydrophob)können putative Transmembranregionen entdeckt werden.Transmembranregionen bestehen aus hydrophoben AS, die gerne eine α-Helix bilden.
• In einer α-Helix Rotation um 100° pro AS • Ganghöhe 1,5 Å pro AS• Eine Membran hat einen Durchmesser von ca. 30 Å• 30/1,5 = ~20 AS für transmembrane α-Helix
22
Für Transmembran-Region wirdtypischerweise eine "window"-Größe von 9 bis 11 verwendet.
Wie wird eine Transmembran-Region vorhergesagt?Berechnung des durchschnittlichen Hydrophobizitätsindexes mit"sliding window"-Ansatz:
I L V K E I R M S L I D
Rhodopsin: 7 α-Helices
Vorhersage transmembranerHelix-Regionen
Proteinsequenzanalyse(am Computer)
Eingabe: AminosäuresequenzHauptziel: Vorhersage der Funktion!- Welche biochemischenbiochemischen Eigenschaften hat das
Protein? - Gibt es verwandteverwandte Proteine, evt. mit bekannter
Funktion?- Gibt es bekannte SequenzmotiveSequenzmotive?- WoWo ist das Protein wahrscheinlich lokalisiert?- Welche posttranslationalenposttranslationalen Änderungen kann es
geben?- Vorhersage der 2D und 3D3D--StrukturStruktur
23
StrukturvorhersagenMGCAISSLGAKAEFGDRSAEEEDAAAAAAVVYPREDQIQMIKDSWKVIRDDIAKVGIIMFVRLFETHPECKDVFFLFRDVEDLERLRSSRELRAHGLRVMSFIEKSVARLDQQDRLEALAVELGKSHYHYNAPPKYYSYVGAEFICAVQPILKERFTSELEEAWKTLFQYVTGLMRKGHQEEGSRQRHLALPPKDGPEKRTSAL
3D
2D
2D-Strukturvorhersagen einfacher als 3D-Strukturvorhersagen(> 40 Jahre Erfahrung)Information für 3D-Strukturvorhersagen Zusätzliche Information für AlignmentsVorhersage der ProteinfunktionProteinklassifizierung
24
α-HelixEine Proteinkette!H-Brücken zwischen -C=O (i) und -N-H (i + 4)
β-Faltblatt
Zwischen verschiedenenProteinkettenH-Brücken zwischen den ProteinkettenKetten laufen meist antiparallel; sind z.T. durch U-Turn verbunden
25
Chou & FasmanHäufigkeit best AS in best Sekundärstruktur / Häufigkeit insgesamt
=> „propensity“-Index („propensity = Neigung“)
Amino acid propensities
0
0.5
1
1.5
2
A C D E F G H I K L M N P Q R S T V W Y
Sec
onda
ry S
truct
ure
Pre
fere
nces
alpha-helixbeta-sheet
26
Chou-Fasman"Sliding Window" mit 6 AS "Fenster"=> 4/6 mit P(H) >1.00 = "alpha-helix nucleus"
G S P T A E L M H S T PP(H) 57 77 57 69 142 151 121 145 100 77 69 57
G S P T A E L M H S T PP(H) 57 77 57 69 142 151 121 145 100 77 69 57
/100
Helix wird nach beiden Seiten erweitert bisder Schnitt von 4 AS P(H) <1.00.
G S P T A E L M H S T PP(H) 57 77 57 69 142 151 121 145 100 77 69 57
/100
Genauigkeit ~ 60%
Chou-Fasman
27
Methoden der 2D-Strukturvorhersage
Statistische MethodenGOR (zentrale AS +/- 8 AS) (~64% Genauigkeit)"Nearest neighbors"Bezieht verwandte Sequenzen aus Datenbankenmit ein (~70% Genauigkeit)"Neural network"
"Lernmaschinen"; werden mit bekanntenStrukturen trainiert (~76% Genauigkeit)
3DMGCAISSLGAKAEFGDRSAEEEDAAAAAAVVYPREDQIQMIKDSWKVIRDDIAKVGIIMFVRLFETHPECKDVFFLFRDVEDLERLRSSRELRAHGLRVMSFIEKSVARLDQQDRLEALAVELGKSHYHYNAPPKYYSYVGAEFICAVQPILKERFTSELEEAWKTLFQYVTGLMRKGHQEEGSRQRHLALPPKDGPEKRTSAL
?
28
Warum 3D-Struktur?
Sequenz
Struktur
Funktion
Medizin
Methoden der 3D-Modellierung"Ab Initio"-Methoden
=> nach thermodynamischen Grundlagen
Wissenbasierte Methoden=> Homologiemodellierung=> "threading"
29
CASP"Critical Assessment of Structure Prediction"
predictioncenter.gov
• Contest zur Überprüfung von Methoden zur 3D Vorhersage
• Unveröffentlichte Proteinstrukturen als Vorgabe für die Berechnungen
• Vergleich von Vorhersage und experimentellen Laborergebnissen
ProteomicsKurzfassung:
1994 überraschte ein neues Wort die Gemeinde der Biowissenschaftler: das Proteom. Der australische Biochemiker Marc Wilkins hat dieses Kunstwort erfunden und sich dabei vom Genom inspirieren lassen. So wie das Genom die Gesamtheit der Gene und deren Wechselwirkungen bezeichnet, steht das Proteom für die Gesamtheit der Proteine und deren Wechselwirkungen. Die Erforschung des Genoms wird im englischen
Sprachraum als Genomics bezeichnet. Dementsprechend steht Proteomics für die Erforschung des Proteoms. Dieser neue Name ist sehr werbewirksam und sorgt für
sprudelnde Forschungsgelder, aber wirklich neu ist diese Forschungsrichtung nicht. Sie hieß früher Proteinbiochemie und kam mit dem Aufschwung der Molekularbiologie
(der Genomics) aus der Mode. Die Molekularbiologen hatten die Vorstellung, alle Phänomene des Lebens über die Erbanlagen erklären zu können. Die Erbanlagen sind in der DNA im Zellkern der höheren Organismen gespeichert. Sie liefern aber nur den
vorläufigen Bauplan für die lebenswichtigen Moleküle – die Proteine. Die Proteine selbst entwickeln eigene Strategien, die nicht in der Information aus der DNA enthalten sind. Wer wirklich hinter die Geheimnisse des Lebens kommen will, muss sich
den Proteinen widmen.http://www.brockhaus.de/infothek/infothek_detail.php?nr=12124
PROTEins expressed by a genOME or tissue
30
Yeast-2-Hybrid-SystemeProteinfunktion/Protein-Protein-Interaktion
Gelelektrophorese(2D-PAGE)
Proteinarrays,MeCAT
Proteinexpression
Röntgenbeugungsanalyse(XRD)
NMR
3-D-Struktur
Massenspektrometrie(MALDI-TOF, ESI-MS/MS, LC-MS/MS)
De novo Sequenzierung
Proteinidentifikation
Edman-SequenzierungProteinsequenzierung
Proteomik
Die "-omics"Gesamtheit des genetischen Materials: "Genom"Gesamtheit des transkribierten Materials (RNA): "Transkriptom"Gesamtheit der translatierten Proteine: "Proteom"
Genom (DNA) Transcriptom (RNA) Proteom (Protein)
"Metabolom", "Interactom" …
31
Proteom: alle Proteine eines Organismus (einer Zelle, eines Gewebes ...)~ 22,000 Gene~ 500.000 Proteine im Menschen (mit Modifikationen)mRNA und Proteinexpression kann unterschiedlich sein
Proteom
Proteom
identisches Genom – aber unterschiedliche Proteome!
32
ProteomicsProteomics: Untersuchung der Proteinexpressioneines biologischen Systems
Häufigkeit, posttranslationale ModifikationenKorrelation mit zellulären Faktoren (Zellspezifität)Korrelation mit Krankheiten oder UmweltfaktorenProtein-Protein-InteraktionenProteinkomplexe
Zell-spezifische Expression
Temperatur
Interaktionen
StressChemikalien
Medikamente
Proteom
ProteomicsKrankheiten Metabolismus
Proteomics: Untersuchung der Proteinexpression eines biologischen Systems
33
Proteinbiochemische Techniken “Heute so gut wie damals“
Proteinfällung (z.B. (NH4)2SO4)Größenfraktionierung (SEC)Ionenaustauschchromatographie (IEC)Hydrophobe Interaktion (HIC)SDS-PAGEWestern blottingProteinsequenzierung etc.
Hierfür jedoch relativ große Proteinmengen notwendig!=> Limitierung auf bestimmte Proteine bzw. Analysen.
„The Modern Art ofProteomics"
2D-GelelektrophoreseProteinsequenzierungMassenspektroskopieTwo-Hybrid-SystemProtein Chips....
Nur wenig Protein zur Analyse notwendig
34
2D-Elektrophorese
1. Dimension:Isoelektrische FokussierungAuftrennung nach Ladung (pI)
2. Dimension:SDS-PAGEAuftrennung nach Masse (Mr)
2D-Elektrophorese
pH-Gradient
Mas
se
35
Vorteile:Viele Proteine können gleichzeitig visualisiert werden.Massenspektrometrie möglichIsoformen und Modifikationen können visualisiert werden
2D-Elektrophorese
2D-Elektrophorese
Nachteile:Nur „hochexprimierte“ Proteine können leichtvisualisiert werden.Funktioniert „nicht“ mit sehr kleinen oder hydrophoben ProteinenAuftrennung „schwer“ reproduzierbar!
36
Datenbanken für 2D-Gele
2D-ElektrophoreseProteine aus einem erkrankten Gewebe
Kontrolle: Proteine aus einem gesunden Gewebe
ausschneiden und analysieren.
37
Identifizierung eines Proteins
Immunodetektion• Spezifischer Antikörpernotwendig
• Sensitivität : >250 fMol• teuer und zeitraubend:• 15h für ~ 15 AS
Identifizierung mittelsMassenspektrometrie
Proteinsequenzierung(Edman-Abbau)
• Sensitivität : <1 fMol• Bei Automatisierung bis zu 100 Proteine eines bekannten Genoms
Was ist Massenspektrometrie?
Die Beschleunigung von geladenen Teilchen (z.B. ionisierten Peptiden) in einem elektrischen Feld hängt von deren Masse (m) und Ladung (z) ab.
MALDI–TOF: Matrix Assisted Laser Desporption/Ionisation – Time Of Flight SELDI–TOF: Surface Enhanced Laser Desporption/Ionisation – Time Of FlightESI: Electrospray Ionization
Detektor
VakuumkammerSample
Elektrisches Feld
38
Matrix-Assisted Laser Desorption/IonisationTime-of-Flight Mass Spectrometry
(MALDI-TOF-MS)Laser pulse irradiation
Sample plate
SampleMatrix
Ions
Sample plateUV-Laser
Acceleration grids Detector
• Proteine werden mit der Matrix-Substanz gemischt und getrocknet.
• Matrix wird mit gepulstem UV-Laser beschossen
• Schwingungsenergie wird auf Biomoleküle übertragen, die in die Gasphase übergehen
MALDI-Signal
M+3H+
M+2H+
m/z
M+H+
M+
39
0
100
%
1588.21573.91431.8
1539.8
Relative
Int
ensity
MALDI-TOF
Identifikation bekannter Proteine anhand ihrer Masse.Massenbestimmung ist eindeutig. für Proteine < 106 Da geeignet.Größere Proteine, oder wenn mehr Information gewünscht wird, müssen zuvor mit einer Protease (meist Trypsin) in kleinere Peptide zerlegt werden.
N-Asp-Ala-Gly-Arg-His-Cys-Lys-Trp-Lys-Ser-Glu-Asn-Leu-Ile-Arg-Thr-Tyr-C
Trypsin
N-Asp-Ala-Gly-Arg
His-Cys-Lys-Trp-Lys
Ser-Glu-Asn-Leu-Ile-Arg
Thr-Tyr-C
Enzymatischer Verdau
Die Massen (aus MALDI-TOF) der Peptide können mit zuvor bestimmter Proteinsequenz (z.B. aus cDNA) verglichen werden.Wenn Massen und weitere Daten (MW, pI) bekannt sind, können die Massen zur Identifikation des Proteins in den Datenbanken verwendet werden.
40
MALDI-TOF
Vergleich der theoretischen Massen mit
den MALDI-Daten.
cDNA
Protein
Verdau
Massen
Protein
Verdau
Massen
‚Genomics‘ vs ‚Proteomics‘(lets play together)
2D PAGE
MALDI-TOF
41
< 10-12 M werden benötigt
Electrospray-MS (ESI-MS)• Proteine werden in flüchtigem Lösungsmittel
mittels Kapillare in eine Ionisationskammer injiziert
• Spannung erzeugt feine Tröpfchen, die verdunsten und in der Gasphase geladene Biomoleküle zurücklassen.
42
Protein-Protein-Interaktionen
Wenn wir nur die Proteine kennen, wissen wir noch wenig über deren Zusammenwirken im Organismus.=> Bestimmung der Protein-Protein-Interaktionen:
1. 2-Hybrid-System2. Protein Chips3. Computeranalysen
Yeast 2-Hybrid-System oder
‚Beziehungskisten‘Genom der Hefe..6000Proteine …6000 x 6000 mögliche Interaktionen…nicht mehr von Hand durchtesten. ……für die Two-Hybrid-Screens einen Two-Hybrid- Roboter kaufen…Vollautomatische Laborsklaven sind nicht billig ~165.000 Euro…zieht dann aber 100.000 Hefehochzeiten alias "Matings" pro Tag klaglos durch.
(mod. nach H. Zähringer, Laborjournal 01/2006, Stand: Januar 2006, alle Angaben ohne Gewähr
43
Protein bzw. ProteomchipsMethode: Jedes translatierte Protein soll auf einen Glasträger ge”spottet”werden.Ziel: en masse-Analyse von intermolekularen Interaktionen. Erster Proteom Chip (2001):
94% der Hefe ORFs in Proteine translatiert und auf Ni-NTAbeschichteten Glasträger aufgetragen=> 39 Proteine binden Calmodulin6 bekannt33 unbekannt!
Phylogenetic profiles: 20,749 LinksmRNA expression: 26,013 LinksDomain fusion: 45,502 Links
=> Funktionelle Links von 62% der bislang 2557 Hefe-Proteineunbekannter Funktion.
in silicoin silico