Ubungsblatt zu Protein Interaction Networks · PDF fileUbungsblatt zu Protein Interaction...

4
¨ Ubungsblatt zu Protein Interaction Networks Samira Jaeger January 10, 2011 1 Netzwerkzentralit¨ at (6P) In der Vorlesung haben Degree Centrality besprochen. Finde drei weitere etablierte Zentralit¨ atsmaße und diskutiere diese. In welchem Zusammenhang werden diese ver- wendet und welche biologischen Aussagen k¨ onnen f¨ ur biologische Netzwerke durch Zentralit¨ atsanalyse getroffen werden ? Die Abgabe beinhaltet: (a) Definition der Zentralit¨ atsmaße, (b) Erl¨ auterung der zu Grunde liegenden Idee des jeweiligen Maßes, und (c) Anwendungsbeispiele f¨ ur biolo- gischen Netzwerke. 2 Datenbanksuche (2P) Neben Protein-protein Interaktionen innerhalb einer Spezies gibt es auch spezies- ¨ ubergreifende Interaktionen, z.B. Virus-Host-Interaktionen. HIV-1 oder das Epstein- Barr Virus infizieren Menschen ¨ uber Virus-Host-Interaktionen. Spezifische Daten- banken erfassen und speichern diese Host-Virus-Interakionen, z.B. HIV-1, Human Pro- tein Interaction Database (http://www.ncbi.nlm.nih.gov/RefSeq/HIVInteractions/ index.html). Das HIV-1 Genom besteht aus 9 Genen die wiederum 19 Proteine kodieren, welche in unterschiedlichster Art und Weise mit einer Vielzahl von menschlichen Proteinen interagieren, um verschiedene Pathways im menschlichen Organismus auszunutzen. Welche Formen von Interaktionen zwischen HIV-1 und Mensch k¨ onnen unter- schieden werden? Gibt es HIV-1 Proteine, die mit den selben menschlichen Proteinen interagieren? Wenn ja, welche sind dies und welchen Pathways kommen diese vor? Die Abgabe beinhaltet: (a) eine Listen der unterschiedlichen Interaktionstypen zwis- chen HIV-1 und menschlichen Proteine und (b) eine Liste der HIV-1 und menschlichen Proteinen die miteinander interagieren und die mit ihnen assozierten Pathways. 1

Transcript of Ubungsblatt zu Protein Interaction Networks · PDF fileUbungsblatt zu Protein Interaction...

Page 1: Ubungsblatt zu Protein Interaction Networks · PDF fileUbungsblatt zu Protein Interaction Networks Samira Jaeger January 10, 2011 1 Netzwerkzentralit at (6P) In der Vorlesung haben

Ubungsblatt zu Protein InteractionNetworks

Samira Jaeger

January 10, 2011

1 Netzwerkzentralitat (6P)

In der Vorlesung haben Degree Centrality besprochen. Finde drei weitere etablierteZentralitatsmaße und diskutiere diese. In welchem Zusammenhang werden diese ver-wendet und welche biologischen Aussagen konnen fur biologische Netzwerke durchZentralitatsanalyse getroffen werden ?

Die Abgabe beinhaltet: (a) Definition der Zentralitatsmaße, (b) Erlauterung der zuGrunde liegenden Idee des jeweiligen Maßes, und (c) Anwendungsbeispiele fur biolo-gischen Netzwerke.

2 Datenbanksuche (2P)

Neben Protein-protein Interaktionen innerhalb einer Spezies gibt es auch spezies-ubergreifende Interaktionen, z.B. Virus-Host-Interaktionen. HIV-1 oder das Epstein-Barr Virus infizieren Menschen uber Virus-Host-Interaktionen. Spezifische Daten-banken erfassen und speichern diese Host-Virus-Interakionen, z.B. HIV-1, Human Pro-tein Interaction Database (http://www.ncbi.nlm.nih.gov/RefSeq/HIVInteractions/index.html).

Das HIV-1 Genom besteht aus 9 Genen die wiederum 19 Proteine kodieren, welchein unterschiedlichster Art und Weise mit einer Vielzahl von menschlichen Proteineninteragieren, um verschiedene Pathways im menschlichen Organismus auszunutzen.

• Welche Formen von Interaktionen zwischen HIV-1 und Mensch konnen unter-schieden werden?

• Gibt es HIV-1 Proteine, die mit den selben menschlichen Proteinen interagieren?Wenn ja, welche sind dies und welchen Pathways kommen diese vor?

Die Abgabe beinhaltet: (a) eine Listen der unterschiedlichen Interaktionstypen zwis-chen HIV-1 und menschlichen Proteine und (b) eine Liste der HIV-1 und menschlichenProteinen die miteinander interagieren und die mit ihnen assozierten Pathways.

1

Page 2: Ubungsblatt zu Protein Interaction Networks · PDF fileUbungsblatt zu Protein Interaction Networks Samira Jaeger January 10, 2011 1 Netzwerkzentralit at (6P) In der Vorlesung haben

3 Analyse eines Proteininteraktionsnetzwerkes (12P)

Auf der Vorlesungsseite ist das Proteininteraktionsnetzwerk der Fruchtfliege (Drosophilamelanogaster) bereit gestellt, welches im Rahmen der Ubung analysiert werden soll.Das Netzwerk ist im sif-format Formaten verfugbar.

P1 P2

P3

P4

Figure 1: Beispielgraph.

Das sif-format ist ein einfaches Textformat in dem Proteininteraktionen einesNetzwerkes/Graphens folgendermassen dargestellt werden. Jede Zeile steht fur eineungerichtete Kante und hat die Form:P1 pp P2

P2 pp P3

P2 pp P4

Dabei sind Px und Py Proteinidentifier (UniProt Ids) und pp zeigt eine Protein-Protein-Interaktion an.

3.1 Netzwerkeigenschaften (5P)

Im ersten Teil der Aufgabe soll das Interaktionsnetzwerk in Java eingelesen werdenund anschließend seine Eigenschaften bestimmt werden:

• Charakterisiere das Interaktionsnetzwerk: Wie viele Proteine und Interaktionenumfasst es ? Bestimme die durchschnittliche Anzahl Interaktionen pro Protein.

• Berechne die (a) Kantendichte und (b) den durchschnittlichen Clusterkoeffizien-ten in obigem Fliege-Netzwerk.

• Berechne fur jedes Protein die Degree Centrality und ordne die Proteine nachihrer Zentralitat. Welches sind die 5 zentralsten Proteine im Netzwerk (undwelche funktionalen Aufgaben erfullen sie) ?

Die Abgabe beinhaltet: (a) den Java Code, (b) die Berechnung und Ausgabe dergesuchten Netzwerkeigenschaften und eine Liste der 5 zentralsten Proteine im Netzwerkinklusive der jeweiligen Degree centrality.

2

Page 3: Ubungsblatt zu Protein Interaction Networks · PDF fileUbungsblatt zu Protein Interaction Networks Samira Jaeger January 10, 2011 1 Netzwerkzentralit at (6P) In der Vorlesung haben

3.2 Funktionale Module (7P)

Im zweiten Teil der Aufgabe sollen funktionale Module identifiziert werden. Funk-tionale Module oder Cluster sind in Netzwerken als stark vernetzte Subgraphen zufinden. Die Identifizierung von k-cores in Interaktionsnetzwerken ist eine Moglichkeitum solche stark vernetzten Subgraphen zu detektieren. k-cores sind definiert als eineGruppe von Proteinen, in der jedes Protein mindestens k Interaktionen besitzt.

Figure 2: Beispiel k-cores fur k = 0, 1, 2, 3. k gibt an, wie viele Verbindungenein Knoten zu anderen Knoten im selben k-core hat bzw. haben muss, umTeil eines k-cores zu sein. (Nachtrag zur Vorstellung der Ubung: Die beidenweißen Knoten sind nicht Teil des k = 3-cores, da sie nur nur mit zwei im k= 3-core liegenden Knoten verbunden sind, der dritte Link geht jeweils zueinem Knoten im k = 2-core.)

Algorithmus zur Detektion von k-cores:for all v ∈ V do

consider its node degree and the degree of its neighborsif deg(v) <k then

prune velse

if v has n neighbors with degree <k thendeg(v) = deg(v) - nif deg(v) <k then

prune vend if

end ifend if

end for

• Implementiere das vorgestellte Verfahren zur Identifizierung von k-cores. Findeden großten k-core in dem Interaktionsnetzwerk und visualisiere diesen. Wie vieleProteine enthalt dieser k-core und wie viele Interaktionen besitzt jedes Protein

3

Page 4: Ubungsblatt zu Protein Interaction Networks · PDF fileUbungsblatt zu Protein Interaction Networks Samira Jaeger January 10, 2011 1 Netzwerkzentralit at (6P) In der Vorlesung haben

im k-core.

• Analysiere die funktionalen Eigenschaften des Modules reprasentiert durch denidentifizierten k-core. Tipp: Die funktionale Analyse kann mit Hilfe von DAVID(http://david.abcc.ncifcrf.gov/) durchgefuhrt werden. DAVID ist ein Analyse-Tool mit dem Gruppen von Genen und Proteinen anhand ihrer Funktion, Path-ways oder Domanen untersucht werden konnen, um uberreprasentierte funk-tionale Eigenschaften in diesen Gruppen zu finden.

Die Abgabe beinhaltet: (a) den Java Code, (b) die Visualisierung des großten k-cores und Erlauterung seiner Eigenschaften (Anzahl der Proteine, Mindestanzahl vonInteraktionen pro Protein (k)) und (c) die funktionale Charakterisierung des k-coresanhand von uberreprasentierten Funktionen, Pathways und Domanen mit Hilfe vonDAVID.

4