Ubungsblatt zu Protein Interaction Networks · PDF fileUbungsblatt zu Protein Interaction...
-
Upload
nguyendiep -
Category
Documents
-
view
214 -
download
1
Transcript of Ubungsblatt zu Protein Interaction Networks · PDF fileUbungsblatt zu Protein Interaction...
Ubungsblatt zu Protein InteractionNetworks
Samira Jaeger
January 10, 2011
1 Netzwerkzentralitat (6P)
In der Vorlesung haben Degree Centrality besprochen. Finde drei weitere etablierteZentralitatsmaße und diskutiere diese. In welchem Zusammenhang werden diese ver-wendet und welche biologischen Aussagen konnen fur biologische Netzwerke durchZentralitatsanalyse getroffen werden ?
Die Abgabe beinhaltet: (a) Definition der Zentralitatsmaße, (b) Erlauterung der zuGrunde liegenden Idee des jeweiligen Maßes, und (c) Anwendungsbeispiele fur biolo-gischen Netzwerke.
2 Datenbanksuche (2P)
Neben Protein-protein Interaktionen innerhalb einer Spezies gibt es auch spezies-ubergreifende Interaktionen, z.B. Virus-Host-Interaktionen. HIV-1 oder das Epstein-Barr Virus infizieren Menschen uber Virus-Host-Interaktionen. Spezifische Daten-banken erfassen und speichern diese Host-Virus-Interakionen, z.B. HIV-1, Human Pro-tein Interaction Database (http://www.ncbi.nlm.nih.gov/RefSeq/HIVInteractions/index.html).
Das HIV-1 Genom besteht aus 9 Genen die wiederum 19 Proteine kodieren, welchein unterschiedlichster Art und Weise mit einer Vielzahl von menschlichen Proteineninteragieren, um verschiedene Pathways im menschlichen Organismus auszunutzen.
• Welche Formen von Interaktionen zwischen HIV-1 und Mensch konnen unter-schieden werden?
• Gibt es HIV-1 Proteine, die mit den selben menschlichen Proteinen interagieren?Wenn ja, welche sind dies und welchen Pathways kommen diese vor?
Die Abgabe beinhaltet: (a) eine Listen der unterschiedlichen Interaktionstypen zwis-chen HIV-1 und menschlichen Proteine und (b) eine Liste der HIV-1 und menschlichenProteinen die miteinander interagieren und die mit ihnen assozierten Pathways.
1
3 Analyse eines Proteininteraktionsnetzwerkes (12P)
Auf der Vorlesungsseite ist das Proteininteraktionsnetzwerk der Fruchtfliege (Drosophilamelanogaster) bereit gestellt, welches im Rahmen der Ubung analysiert werden soll.Das Netzwerk ist im sif-format Formaten verfugbar.
P1 P2
P3
P4
Figure 1: Beispielgraph.
Das sif-format ist ein einfaches Textformat in dem Proteininteraktionen einesNetzwerkes/Graphens folgendermassen dargestellt werden. Jede Zeile steht fur eineungerichtete Kante und hat die Form:P1 pp P2
P2 pp P3
P2 pp P4
Dabei sind Px und Py Proteinidentifier (UniProt Ids) und pp zeigt eine Protein-Protein-Interaktion an.
3.1 Netzwerkeigenschaften (5P)
Im ersten Teil der Aufgabe soll das Interaktionsnetzwerk in Java eingelesen werdenund anschließend seine Eigenschaften bestimmt werden:
• Charakterisiere das Interaktionsnetzwerk: Wie viele Proteine und Interaktionenumfasst es ? Bestimme die durchschnittliche Anzahl Interaktionen pro Protein.
• Berechne die (a) Kantendichte und (b) den durchschnittlichen Clusterkoeffizien-ten in obigem Fliege-Netzwerk.
• Berechne fur jedes Protein die Degree Centrality und ordne die Proteine nachihrer Zentralitat. Welches sind die 5 zentralsten Proteine im Netzwerk (undwelche funktionalen Aufgaben erfullen sie) ?
Die Abgabe beinhaltet: (a) den Java Code, (b) die Berechnung und Ausgabe dergesuchten Netzwerkeigenschaften und eine Liste der 5 zentralsten Proteine im Netzwerkinklusive der jeweiligen Degree centrality.
2
3.2 Funktionale Module (7P)
Im zweiten Teil der Aufgabe sollen funktionale Module identifiziert werden. Funk-tionale Module oder Cluster sind in Netzwerken als stark vernetzte Subgraphen zufinden. Die Identifizierung von k-cores in Interaktionsnetzwerken ist eine Moglichkeitum solche stark vernetzten Subgraphen zu detektieren. k-cores sind definiert als eineGruppe von Proteinen, in der jedes Protein mindestens k Interaktionen besitzt.
Figure 2: Beispiel k-cores fur k = 0, 1, 2, 3. k gibt an, wie viele Verbindungenein Knoten zu anderen Knoten im selben k-core hat bzw. haben muss, umTeil eines k-cores zu sein. (Nachtrag zur Vorstellung der Ubung: Die beidenweißen Knoten sind nicht Teil des k = 3-cores, da sie nur nur mit zwei im k= 3-core liegenden Knoten verbunden sind, der dritte Link geht jeweils zueinem Knoten im k = 2-core.)
Algorithmus zur Detektion von k-cores:for all v ∈ V do
consider its node degree and the degree of its neighborsif deg(v) <k then
prune velse
if v has n neighbors with degree <k thendeg(v) = deg(v) - nif deg(v) <k then
prune vend if
end ifend if
end for
• Implementiere das vorgestellte Verfahren zur Identifizierung von k-cores. Findeden großten k-core in dem Interaktionsnetzwerk und visualisiere diesen. Wie vieleProteine enthalt dieser k-core und wie viele Interaktionen besitzt jedes Protein
3
im k-core.
• Analysiere die funktionalen Eigenschaften des Modules reprasentiert durch denidentifizierten k-core. Tipp: Die funktionale Analyse kann mit Hilfe von DAVID(http://david.abcc.ncifcrf.gov/) durchgefuhrt werden. DAVID ist ein Analyse-Tool mit dem Gruppen von Genen und Proteinen anhand ihrer Funktion, Path-ways oder Domanen untersucht werden konnen, um uberreprasentierte funk-tionale Eigenschaften in diesen Gruppen zu finden.
Die Abgabe beinhaltet: (a) den Java Code, (b) die Visualisierung des großten k-cores und Erlauterung seiner Eigenschaften (Anzahl der Proteine, Mindestanzahl vonInteraktionen pro Protein (k)) und (c) die funktionale Charakterisierung des k-coresanhand von uberreprasentierten Funktionen, Pathways und Domanen mit Hilfe vonDAVID.
4