Proteine BL V5 - uni-mainz.de

44
1 Genomforschung und Sequenzanalyse Einführung in Methoden der Bioinformatik Bernhard Lieb & T. Hankeln WS 2006/2007 Protein- Sequenzanalyse & Proteomics Proteine ?!

Transcript of Proteine BL V5 - uni-mainz.de

1

Genomforschung und SequenzanalyseEinführung in Methoden der Bioinformatik

Bernhard Lieb & T. Hankeln

WS 2006/2007

Protein-Sequenzanalyse

&

Proteomics

Proteine ?!

2

Themen

Was sind Proteine?

„Protein-Sequenz-Analyse“

"Proteomics"

Aufbau von Aminosäuren

NC

C

HH

R1

O

OHH

Rest: Definiert die Eigenschaften

Carboxylgruppe

Ca-Atom

Aminogruppe

Aminosäuren unterscheiden sich – bis auf Prolin – nur in den Resten

3

Aufbau von ProteinenAlanin Ala A Serin Ser SValin Val V Threonin Thr TPhenylalanin Phe F Tyrosin Tyr YProlin Pro P Histidin His HMethionin Met M Cystein Cys CLeucin Leu L Asparagin Asn NIsoleucin Ile I Glutamin Gln QAspartat Asp D Tryptophan Trp WGlutamat Glu E Glycin Gly GLysin Lys KArginin Arg R

hydrophobgeladenpolar

Rest

AminosäurenNicht jeder Aminosäureaustausch ist gleich wahrscheinlich!

Aminosäure-Eigenschaften:

CP

GGAVIL

MF

YW H

KR

E Q

DNS

TCSH

S+S

sehr klein

klein

geladen

positivpolararomatisch

aliphatisch

hydrophob

4

Die Peptidbindung

NCa

C

HH

R1

O

H N

Ca

C

HH

R2

O

OH

NCa

C

HH

R1

O

OHH N

Ca

C

HH

R2

O

OH

H+

H2O

-> Kondensation

Peptidbindung

Partiellen Doppelbindungscharakter der C-N-Bindung=> Rotation nur möglich am Cα-Atom möglich!

C

O

N

H

5

Primärstruktur

NH2-Met-Ala-Asp-Arg-Ile-Ala-Asn-Ala Ala Asn Asp Glu Leu Glu Ala-COOH

Primärstruktur: Reihenfolge der Aminosäuren.kodiert durch DNA

Schreibweise: vom N- zum C-Terminus (Translationsrichtung!)

Die Sequenz wird im Genom festgelegt, d.h., wenn wir die DNA-Sequenz kennen, kennen wir auch (fast) das Protein.

= M A D R I A N A A N D E L E N A

Sekundärstruktur

α-Helix

β-Faltblatt

= feste, sich wiederholende Faltungselemente in einem Protein

Seitenketten sind an der Faltung nicht beteiligt.aber: bestimmte Aminosäuren sind in den Strukturen häufiger beteiligt als andere!

6

Tertiärstruktur3D-Struktur bzw. Faltung eines Proteins bzw. einer Polypeptidkette.

‚Jedes‘ Protein bzw. Peptid hat eine Tertiärstruktur!

Hämocyanin

Quartärstruktur

Besteht ein funktionelles Protein aus mehreren Polypeptidketten, so nennt man die Anordnung der Ketten "Quartärstruktur".

=> Jedes Protein hat eine Tertiärstuktur, aber nicht jedes hat eine Quartär-struktur!

HHÄÄMOCYANINMOCYANIN

7

Proteinsequenzanalyse

Genomforschung:• Ermittlung und Analyse von DNA-Sequenzen, bis hin zurBestimmung vollständiger Genome.

• Ein wichtiges Ziel ist die Vorhersage von Genen etc.• Daraus: Vorhersage von Proteinsequenzen. • Aber: pure Sequenz sagt meist nichts über Struktur und Funktion im Organismus.

ATGCTCAAGATACAT ...

M L K I H...

O2

Expert Protein Analysis System

8

Der universelle (?) genetischeCode

9

Intron Exon Übergang

‚Das Gen‘

10

Proteinsequenzanalyse(am Computer)

Eingabe: AminosäuresequenzHauptziel: Vorhersage der Funktion!- Welche biochemischenbiochemischen Eigenschaften hat das

Protein? - Gibt es verwandteverwandte Proteine, evt. mit bekannter

Funktion?- Gibt es bekannte SequenzmotiveSequenzmotive?- WoWo ist das Protein wahrscheinlich lokalisiert?- Welche posttranslationalenposttranslationalen Änderungen kann es

geben?- Vorhersage der 2D und 3D3D--StrukturStruktur

Biochemische EigenschaftenIsoelektrischer Punkt (pI)Molekulargewicht/Molekülmasse (MW)

Erste Analyse einer Proteinsequenz:=> Stimmen die berechneten Daten mit den biochemischen Daten überein?=> Wo muss ich mein Protein im 2D-Gel suchen?

Theoretical pI/MW (average) for the proteinsequence

MGAVLSVVWG ... NAVIFTSYDA :

Theoretical pI/Mw: 6.09 / 20728.86

11

Proteinsequenzanalyse(am Computer)

Eingabe: AminosäuresequenzHauptziel: Vorhersage der Funktion!- Welche biochemischenbiochemischen Eigenschaften hat das

Protein? - Gibt es verwandteverwandte Proteine, evt. mit bekannter

Funktion?- Gibt es bekannte SequenzmotiveSequenzmotive?- WoWo ist das Protein wahrscheinlich lokalisiert?- Welche posttranslationalenposttranslationalen Änderungen kann es

geben?- Vorhersage der 2D und 3D3D--StrukturStruktur

12

Proteinfunktion

Proteine mit gleicher Funktion in verschiedenenOrganismen sind häufig ortholog, sie zeigen daher signifikante Sequenzübereinstimmungen.Proteine mit ähnlicher Funktion im gleichen oder in verschiedenen Organismen zeigen ebenfalls häufig signifikante Sequenzübereinstimmungen (paralog). => Funktionsvorhersage durch Vergleich => Datenbankanalysen (BLAST, PSI-BLAST)Aber: Um sicher zu gehen, muss die vorhergesagte Funktion des gesuchten Proteins in vivo überprüft werden.

HämocyanineUntereinheit

Proteinsequenzanalyse(am Computer)

Eingabe: AminosäuresequenzHauptziel: Vorhersage der Funktion!- Welche biochemischenbiochemischen Eigenschaften hat das

Protein? - Gibt es verwandteverwandte Proteine, evt. mit bekannter

Funktion?- Gibt es bekannte SequenzmotiveSequenzmotive?- WoWo ist das Protein wahrscheinlich lokalisiert?- Welche posttranslationalenposttranslationalen Änderungen kann es

geben?- Vorhersage der 2D und 3D3D--StrukturStruktur

13

14

Pfam (Protein Families)gegründet 1997

Erik Sonnhammer (Karolinska Institutet, Stockholm),Sean Eddy (Washington University in St. Louis),

Richard Durbin (Sanger Center, Cambridge)Zusammensetzung eines Proteins aus einzelnen Proteindomänen ermittelbar

Wikipedia

Protein(super)familien

Proteine mit ähnlicher Sequenz und ähnlicher Funktion werden in Proteinfamilien zusammengefasst.Bsp.: Hämoglobine: Hämoglobin α und β-Ketten der Wirbeltiere

Hämocyanine: Hämocyaninuntereinheiten der ArthropodenWeiter entfernt verwandte Proteine mit erkennbarenSequenzähnlichkeiten, aber nicht notwendigerweise ähnlicherFunktion fasst man als Proteinsuperfamilien zusammen.Bsp.: Globine: alle Globin-ähnlichen Sequenzen in Bakterien, Pilzen,

Protisten und TierenHämocyaninsuperfamilie: Hämocyanine, Tyrosinasen…

Aber: Bezeichnung nicht immer eindeutig! (Ursprünglich nach Dayhoff: >50% Identität = Proteinfamilie)

15

Protein(superfamilien) in PFAM

gut charakteri-

sierte Domänen

Domänen mit unbekannter

Funktion

16

Motive und DomänenHäufig ist bei Proteinen ähnlicher Funktion nicht das gesamte Protein konserviert, sondern nur Teilbereiche.Funktionell und strukturell wichtige Regionen eines Proteins (z.B. aktive Zentren) sind in der Evolution stärker konserviert als andereBereiche. Kurze Sequenzen nennt man "Motive" (Segmente, Blocks), grössereAbschnitte "Domänen". Solche Abschnitte können in ansonsten strukturell und/oderfunktionell sehr unterschiedlichen Proteinen vorkommen.Domänen stellen zumeist Faltungsabschnitte in der 3D-Struktur einesProteins dar. Durch Vergleich mit Gruppen anderer Proteine bekannter Funktion istes möglich, diese funktionellen Bereiche herauszufiltern.

Proteinsequenzanalyse(am Computer)

Eingabe: AminosäuresequenzHauptziel: Vorhersage der Funktion!- Welche biochemischenbiochemischen Eigenschaften hat das

Protein? - Gibt es verwandteverwandte Proteine, evt. mit bekannter

Funktion?- Gibt es bekannte SequenzmotiveSequenzmotive?- WoWo ist das Protein wahrscheinlich lokalisiert?- Welche posttranslationalenposttranslationalen Änderungen kann es

geben?- Vorhersage der 2D und 3D3D--StrukturStruktur

17

Domänen in PFAM

=> Funktionsvorhersagen!

DrosophilaProteine

Signal Transduction

4%

Enzyme18%

Nucleic AcidBinding

8%Hypothetical

11%

Unknown48%

Transporter 4%

Structural Protein2%

Ligand Binding orCarrier

2%

Cell Adhesion1%Motor Protein

1%Chaperone

1%

Nucleic Acid Binding Enzyme Signal TransductionTransporter Structural Protein Ligand Binding or CarrierCell Adhesion Chaperone Motor ProteinUnknown Hypothetical

13.601 Gene

18

Proteinsequenzanalyse(am Computer)

Eingabe: AminosäuresequenzHauptziel: Vorhersage der Funktion!- Welche biochemischenbiochemischen Eigenschaften hat das

Protein? - Gibt es verwandteverwandte Proteine, evt. mit bekannter

Funktion?- Gibt es bekannte SequenzmotiveSequenzmotive?- WoWo ist das Protein wahrscheinlich lokalisiert?- Welche posttranslationalenposttranslationalen Änderungen kann es

geben?- Vorhersage der 2D und 3D3D--StrukturStruktur

Postranslationale Modifikationen

Viele Proteine werdenposttranstionalmodifiziertGlykosylierung, Phosphorylierung, Sulphorylierung ...

19

Postranslationale Modifikationen

z.B. N-Glycosylierung: N-X{P}-[TS]

Aber: Wenn Sequenz-Motiv vorhanden, heißt das nicht, dass dieses benutzt wird! Genauigkeit ~ 50 bis 80%.

Hauptgrund: Proteinstruktur! Lokalisation!

Asparagin

‚Irgendeine‘ Prolin hemmt

Threonin oder Serin

Nachweis ????

Signalsequenzen

20

Konservierte "Signale" in der AS-Sequenz verraten vielüber die Lokalisation des Proteins in der Zelle, und damitüber dessen (mögliche) Funktion:Mitochondriales LokalisationsignalExportsignale (Signalpeptid)TransmembransequenzKernlokalisationssignalDNA-Bindungsmotive…

Signalsequenzen

DPTNIRKNVADLTHDVALNLQIAL…

Signalpeptide

Schnittstelle

Ein eukaryontisches Signalpeptid besteht aus:einer ‘positiv geladenen’ etwas ‘Argninn’-Regioneiner kurzen, sehr hydrophoben α-hhelicalen (hh-Region)einer "ccleavage"-Region; -33,-1 Positionen meist kleine ungeladene AS

Nautilus pompilius hemocyanin

h-Region

MNWHALQRSMATHWHSLLLFSLQLLVFTYAATS

n-Region c-Region

rich in Ala, Asp/Glu, and Ser/Thrno pattern +1 to +5 region

almost exclusively Ala small and neutral residues -3,-1 positions

longer, Pro+Thr-rich short, Ser+Ala-rich short, no pattern c-regions

very long, less hydrophobic slightly longer, less hydrophobic short, very hydrophobic h-regions

Lys+Arg-rich only slightly Arg-rich n-regions

32.0 aa 25.1 aa 22.6 aa Total length (average)

Gram-positive Gram-negative

Prokaryotes Eukaryotes

http://www.cbs.dtu.dk/services/SignalP-3.0/background/dataset.php

21

SignalP< Is the sequence a signal peptide?>Sequence length = 56# Measure Position Value Cutoff signal peptide?max. C 33 0.768 0.32 YESmax. Y 33 0.820 0.33 YESmax. S 23 0.994 0.87 YES

# Most likely cleavage site between pos. 32 and 33: ATS-DP

C = cleavage score S = signal peptide score Y = combined score

Vorhersage transmembranerHelix-Regionen

Problem: Es sind nicht sehr viele 3D-Strukturen von transmembranen Proteinen bekannt (Probleme mit Kristallographie)Durch Analyse der Ladungseigenschaften (hydrophil vs. hydrophob)können putative Transmembranregionen entdeckt werden.Transmembranregionen bestehen aus hydrophoben AS, die gerne eine α-Helix bilden.

• In einer α-Helix Rotation um 100° pro AS • Ganghöhe 1,5 Å pro AS• Eine Membran hat einen Durchmesser von ca. 30 Å• 30/1,5 = ~20 AS für transmembrane α-Helix

22

Für Transmembran-Region wirdtypischerweise eine "window"-Größe von 9 bis 11 verwendet.

Wie wird eine Transmembran-Region vorhergesagt?Berechnung des durchschnittlichen Hydrophobizitätsindexes mit"sliding window"-Ansatz:

I L V K E I R M S L I D

Rhodopsin: 7 α-Helices

Vorhersage transmembranerHelix-Regionen

Proteinsequenzanalyse(am Computer)

Eingabe: AminosäuresequenzHauptziel: Vorhersage der Funktion!- Welche biochemischenbiochemischen Eigenschaften hat das

Protein? - Gibt es verwandteverwandte Proteine, evt. mit bekannter

Funktion?- Gibt es bekannte SequenzmotiveSequenzmotive?- WoWo ist das Protein wahrscheinlich lokalisiert?- Welche posttranslationalenposttranslationalen Änderungen kann es

geben?- Vorhersage der 2D und 3D3D--StrukturStruktur

23

StrukturvorhersagenMGCAISSLGAKAEFGDRSAEEEDAAAAAAVVYPREDQIQMIKDSWKVIRDDIAKVGIIMFVRLFETHPECKDVFFLFRDVEDLERLRSSRELRAHGLRVMSFIEKSVARLDQQDRLEALAVELGKSHYHYNAPPKYYSYVGAEFICAVQPILKERFTSELEEAWKTLFQYVTGLMRKGHQEEGSRQRHLALPPKDGPEKRTSAL

3D

2D

2D-Strukturvorhersagen einfacher als 3D-Strukturvorhersagen(> 40 Jahre Erfahrung)Information für 3D-Strukturvorhersagen Zusätzliche Information für AlignmentsVorhersage der ProteinfunktionProteinklassifizierung

24

α-HelixEine Proteinkette!H-Brücken zwischen -C=O (i) und -N-H (i + 4)

β-Faltblatt

Zwischen verschiedenenProteinkettenH-Brücken zwischen den ProteinkettenKetten laufen meist antiparallel; sind z.T. durch U-Turn verbunden

25

Chou & FasmanHäufigkeit best AS in best Sekundärstruktur / Häufigkeit insgesamt

=> „propensity“-Index („propensity = Neigung“)

Amino acid propensities

0

0.5

1

1.5

2

A C D E F G H I K L M N P Q R S T V W Y

Sec

onda

ry S

truct

ure

Pre

fere

nces

alpha-helixbeta-sheet

26

Chou-Fasman"Sliding Window" mit 6 AS "Fenster"=> 4/6 mit P(H) >1.00 = "alpha-helix nucleus"

G S P T A E L M H S T PP(H) 57 77 57 69 142 151 121 145 100 77 69 57

G S P T A E L M H S T PP(H) 57 77 57 69 142 151 121 145 100 77 69 57

/100

Helix wird nach beiden Seiten erweitert bisder Schnitt von 4 AS P(H) <1.00.

G S P T A E L M H S T PP(H) 57 77 57 69 142 151 121 145 100 77 69 57

/100

Genauigkeit ~ 60%

Chou-Fasman

27

Methoden der 2D-Strukturvorhersage

Statistische MethodenGOR (zentrale AS +/- 8 AS) (~64% Genauigkeit)"Nearest neighbors"Bezieht verwandte Sequenzen aus Datenbankenmit ein (~70% Genauigkeit)"Neural network"

"Lernmaschinen"; werden mit bekanntenStrukturen trainiert (~76% Genauigkeit)

3DMGCAISSLGAKAEFGDRSAEEEDAAAAAAVVYPREDQIQMIKDSWKVIRDDIAKVGIIMFVRLFETHPECKDVFFLFRDVEDLERLRSSRELRAHGLRVMSFIEKSVARLDQQDRLEALAVELGKSHYHYNAPPKYYSYVGAEFICAVQPILKERFTSELEEAWKTLFQYVTGLMRKGHQEEGSRQRHLALPPKDGPEKRTSAL

?

28

Warum 3D-Struktur?

Sequenz

Struktur

Funktion

Medizin

Methoden der 3D-Modellierung"Ab Initio"-Methoden

=> nach thermodynamischen Grundlagen

Wissenbasierte Methoden=> Homologiemodellierung=> "threading"

29

CASP"Critical Assessment of Structure Prediction"

predictioncenter.gov

• Contest zur Überprüfung von Methoden zur 3D Vorhersage

• Unveröffentlichte Proteinstrukturen als Vorgabe für die Berechnungen

• Vergleich von Vorhersage und experimentellen Laborergebnissen

ProteomicsKurzfassung:

1994 überraschte ein neues Wort die Gemeinde der Biowissenschaftler: das Proteom. Der australische Biochemiker Marc Wilkins hat dieses Kunstwort erfunden und sich dabei vom Genom inspirieren lassen. So wie das Genom die Gesamtheit der Gene und deren Wechselwirkungen bezeichnet, steht das Proteom für die Gesamtheit der Proteine und deren Wechselwirkungen. Die Erforschung des Genoms wird im englischen

Sprachraum als Genomics bezeichnet. Dementsprechend steht Proteomics für die Erforschung des Proteoms. Dieser neue Name ist sehr werbewirksam und sorgt für

sprudelnde Forschungsgelder, aber wirklich neu ist diese Forschungsrichtung nicht. Sie hieß früher Proteinbiochemie und kam mit dem Aufschwung der Molekularbiologie

(der Genomics) aus der Mode. Die Molekularbiologen hatten die Vorstellung, alle Phänomene des Lebens über die Erbanlagen erklären zu können. Die Erbanlagen sind in der DNA im Zellkern der höheren Organismen gespeichert. Sie liefern aber nur den

vorläufigen Bauplan für die lebenswichtigen Moleküle – die Proteine. Die Proteine selbst entwickeln eigene Strategien, die nicht in der Information aus der DNA enthalten sind. Wer wirklich hinter die Geheimnisse des Lebens kommen will, muss sich

den Proteinen widmen.http://www.brockhaus.de/infothek/infothek_detail.php?nr=12124

PROTEins expressed by a genOME or tissue

30

Yeast-2-Hybrid-SystemeProteinfunktion/Protein-Protein-Interaktion

Gelelektrophorese(2D-PAGE)

Proteinarrays,MeCAT

Proteinexpression

Röntgenbeugungsanalyse(XRD)

NMR

3-D-Struktur

Massenspektrometrie(MALDI-TOF, ESI-MS/MS, LC-MS/MS)

De novo Sequenzierung

Proteinidentifikation

Edman-SequenzierungProteinsequenzierung

Proteomik

Die "-omics"Gesamtheit des genetischen Materials: "Genom"Gesamtheit des transkribierten Materials (RNA): "Transkriptom"Gesamtheit der translatierten Proteine: "Proteom"

Genom (DNA) Transcriptom (RNA) Proteom (Protein)

"Metabolom", "Interactom" …

31

Proteom: alle Proteine eines Organismus (einer Zelle, eines Gewebes ...)~ 22,000 Gene~ 500.000 Proteine im Menschen (mit Modifikationen)mRNA und Proteinexpression kann unterschiedlich sein

Proteom

Proteom

identisches Genom – aber unterschiedliche Proteome!

32

ProteomicsProteomics: Untersuchung der Proteinexpressioneines biologischen Systems

Häufigkeit, posttranslationale ModifikationenKorrelation mit zellulären Faktoren (Zellspezifität)Korrelation mit Krankheiten oder UmweltfaktorenProtein-Protein-InteraktionenProteinkomplexe

Zell-spezifische Expression

Temperatur

Interaktionen

StressChemikalien

Medikamente

Proteom

ProteomicsKrankheiten Metabolismus

Proteomics: Untersuchung der Proteinexpression eines biologischen Systems

33

Proteinbiochemische Techniken “Heute so gut wie damals“

Proteinfällung (z.B. (NH4)2SO4)Größenfraktionierung (SEC)Ionenaustauschchromatographie (IEC)Hydrophobe Interaktion (HIC)SDS-PAGEWestern blottingProteinsequenzierung etc.

Hierfür jedoch relativ große Proteinmengen notwendig!=> Limitierung auf bestimmte Proteine bzw. Analysen.

„The Modern Art ofProteomics"

2D-GelelektrophoreseProteinsequenzierungMassenspektroskopieTwo-Hybrid-SystemProtein Chips....

Nur wenig Protein zur Analyse notwendig

34

2D-Elektrophorese

1. Dimension:Isoelektrische FokussierungAuftrennung nach Ladung (pI)

2. Dimension:SDS-PAGEAuftrennung nach Masse (Mr)

2D-Elektrophorese

pH-Gradient

Mas

se

35

Vorteile:Viele Proteine können gleichzeitig visualisiert werden.Massenspektrometrie möglichIsoformen und Modifikationen können visualisiert werden

2D-Elektrophorese

2D-Elektrophorese

Nachteile:Nur „hochexprimierte“ Proteine können leichtvisualisiert werden.Funktioniert „nicht“ mit sehr kleinen oder hydrophoben ProteinenAuftrennung „schwer“ reproduzierbar!

36

Datenbanken für 2D-Gele

2D-ElektrophoreseProteine aus einem erkrankten Gewebe

Kontrolle: Proteine aus einem gesunden Gewebe

ausschneiden und analysieren.

37

Identifizierung eines Proteins

Immunodetektion• Spezifischer Antikörpernotwendig

• Sensitivität : >250 fMol• teuer und zeitraubend:• 15h für ~ 15 AS

Identifizierung mittelsMassenspektrometrie

Proteinsequenzierung(Edman-Abbau)

• Sensitivität : <1 fMol• Bei Automatisierung bis zu 100 Proteine eines bekannten Genoms

Was ist Massenspektrometrie?

Die Beschleunigung von geladenen Teilchen (z.B. ionisierten Peptiden) in einem elektrischen Feld hängt von deren Masse (m) und Ladung (z) ab.

MALDI–TOF: Matrix Assisted Laser Desporption/Ionisation – Time Of Flight SELDI–TOF: Surface Enhanced Laser Desporption/Ionisation – Time Of FlightESI: Electrospray Ionization

Detektor

VakuumkammerSample

Elektrisches Feld

38

Matrix-Assisted Laser Desorption/IonisationTime-of-Flight Mass Spectrometry

(MALDI-TOF-MS)Laser pulse irradiation

Sample plate

SampleMatrix

Ions

Sample plateUV-Laser

Acceleration grids Detector

• Proteine werden mit der Matrix-Substanz gemischt und getrocknet.

• Matrix wird mit gepulstem UV-Laser beschossen

• Schwingungsenergie wird auf Biomoleküle übertragen, die in die Gasphase übergehen

MALDI-Signal

M+3H+

M+2H+

m/z

M+H+

M+

39

0

100

%

1588.21573.91431.8

1539.8

Relative

Int

ensity

MALDI-TOF

Identifikation bekannter Proteine anhand ihrer Masse.Massenbestimmung ist eindeutig. für Proteine < 106 Da geeignet.Größere Proteine, oder wenn mehr Information gewünscht wird, müssen zuvor mit einer Protease (meist Trypsin) in kleinere Peptide zerlegt werden.

N-Asp-Ala-Gly-Arg-His-Cys-Lys-Trp-Lys-Ser-Glu-Asn-Leu-Ile-Arg-Thr-Tyr-C

Trypsin

N-Asp-Ala-Gly-Arg

His-Cys-Lys-Trp-Lys

Ser-Glu-Asn-Leu-Ile-Arg

Thr-Tyr-C

Enzymatischer Verdau

Die Massen (aus MALDI-TOF) der Peptide können mit zuvor bestimmter Proteinsequenz (z.B. aus cDNA) verglichen werden.Wenn Massen und weitere Daten (MW, pI) bekannt sind, können die Massen zur Identifikation des Proteins in den Datenbanken verwendet werden.

40

MALDI-TOF

Vergleich der theoretischen Massen mit

den MALDI-Daten.

cDNA

Protein

Verdau

Massen

Protein

Verdau

Massen

‚Genomics‘ vs ‚Proteomics‘(lets play together)

2D PAGE

MALDI-TOF

41

< 10-12 M werden benötigt

Electrospray-MS (ESI-MS)• Proteine werden in flüchtigem Lösungsmittel

mittels Kapillare in eine Ionisationskammer injiziert

• Spannung erzeugt feine Tröpfchen, die verdunsten und in der Gasphase geladene Biomoleküle zurücklassen.

42

Protein-Protein-Interaktionen

Wenn wir nur die Proteine kennen, wissen wir noch wenig über deren Zusammenwirken im Organismus.=> Bestimmung der Protein-Protein-Interaktionen:

1. 2-Hybrid-System2. Protein Chips3. Computeranalysen

Yeast 2-Hybrid-System oder

‚Beziehungskisten‘Genom der Hefe..6000Proteine …6000 x 6000 mögliche Interaktionen…nicht mehr von Hand durchtesten. ……für die Two-Hybrid-Screens einen Two-Hybrid- Roboter kaufen…Vollautomatische Laborsklaven sind nicht billig ~165.000 Euro…zieht dann aber 100.000 Hefehochzeiten alias "Matings" pro Tag klaglos durch.

(mod. nach H. Zähringer, Laborjournal 01/2006, Stand: Januar 2006, alle Angaben ohne Gewähr

43

Protein bzw. ProteomchipsMethode: Jedes translatierte Protein soll auf einen Glasträger ge”spottet”werden.Ziel: en masse-Analyse von intermolekularen Interaktionen. Erster Proteom Chip (2001):

94% der Hefe ORFs in Proteine translatiert und auf Ni-NTAbeschichteten Glasträger aufgetragen=> 39 Proteine binden Calmodulin6 bekannt33 unbekannt!

Phylogenetic profiles: 20,749 LinksmRNA expression: 26,013 LinksDomain fusion: 45,502 Links

=> Funktionelle Links von 62% der bislang 2557 Hefe-Proteineunbekannter Funktion.

in silicoin silico

44

Identifizierung von Protein-Protein-Interaktionen

Idee: Suche nach Interaktionen (< 5Å Abstand) in 3D-Strukturen (PDB-Datenbank).Gibt es diese Strukturen auf verschiedenen Proteinen in Hefe?Wenn ja, dann gibt es möglicherweise eine Interaktion!

BioinformaticsBioinformatics…

…viel Erfolg