Zusammenfassung Systembiologie - FS18glebert/download/systembiologie/...Zusammenfassung...

of 19/19
Zusammenfassung Systembiologie - FS18 v1.3 Madlaina Mettier, Gleb Ebert 10. August 2018 Vorwort Diese Zusammenfassung enth¨ ahlt wenn verf¨ ugbar alle Lernziele und passende Beispielaufgaben der Vorlesung Systembiologie (Stand FS18). Lernziele bzw. Aufgaben sind jeweils in fett geschrieben. Antworten bzw. L¨ osungen folgen direkt danach in normaler Schrift. Bei fehlenden Lernzielen wurden die wichtigsten Konzepte und Beispiele aus den Vorlesungsfolien zusammengefasst. Die Nummern der Kapitel entsprechen den Vorlesungswochen. Kapitel 5 entspricht dabei den Wochen 5 und 6. Wir k¨ onnen leider weder Vollst¨ andigkeit noch die Abwesenheit von Fehlern garantieren. Insbesondere unsere L¨ osungen der Aufgaben wurden nach besten Wissen und Gewissen erstellt und m¨ ussen nicht in dieser Form korrekt sein. F¨ ur Fragen, Anregungen oder Verbesserungsvor- schl¨ agen k¨ onnen wir unter [email protected] erreicht werden. Die neuste Version dieser Zusammenfassung kann stets unter https://n.ethz.ch/ ~ glebert/ gefunden werden. Inhaltsverzeichnis 1 Einf¨ uhrung 2 2 Modellierung von Enzymreaktionen 3 3 Modellierung von Stoffwechselwegen 5 4 Regulation von Stoffwechselwegen 7 5 Analyse von metabolischen Netzwerken durch Flux Balance Analysis 8 7 Modellierung von Signaltransduktionswegen 11 8 Analysis of omics data 13 9 Feature Selection 14 10 Clustering 15 11 Clustering Applications 16 12 Link Prediction 17 13 Biological Networks 19 1
  • date post

    05-Sep-2020
  • Category

    Documents

  • view

    1
  • download

    0

Embed Size (px)

Transcript of Zusammenfassung Systembiologie - FS18glebert/download/systembiologie/...Zusammenfassung...

  • Zusammenfassung Systembiologie - FS18v1.3

    Madlaina Mettier, Gleb Ebert

    10. August 2018

    Vorwort

    Diese Zusammenfassung enthählt wenn verfügbar alle Lernziele und passende Beispielaufgaben derVorlesung Systembiologie (Stand FS18). Lernziele bzw. Aufgaben sind jeweils in fett geschrieben.Antworten bzw. Lösungen folgen direkt danach in normaler Schrift. Bei fehlenden Lernzielenwurden die wichtigsten Konzepte und Beispiele aus den Vorlesungsfolien zusammengefasst. DieNummern der Kapitel entsprechen den Vorlesungswochen. Kapitel 5 entspricht dabei den Wochen5 und 6. Wir können leider weder Vollständigkeit noch die Abwesenheit von Fehlern garantieren.Insbesondere unsere Lösungen der Aufgaben wurden nach besten Wissen und Gewissen erstelltund müssen nicht in dieser Form korrekt sein. Für Fragen, Anregungen oder Verbesserungsvor-schlägen können wir unter [email protected] erreicht werden. Die neuste Version dieserZusammenfassung kann stets unter https://n.ethz.ch/~glebert/ gefunden werden.

    Inhaltsverzeichnis

    1 Einführung 2

    2 Modellierung von Enzymreaktionen 3

    3 Modellierung von Stoffwechselwegen 5

    4 Regulation von Stoffwechselwegen 7

    5 Analyse von metabolischen Netzwerken durch Flux Balance Analysis 8

    7 Modellierung von Signaltransduktionswegen 11

    8 Analysis of omics data 13

    9 Feature Selection 14

    10 Clustering 15

    11 Clustering Applications 16

    12 Link Prediction 17

    13 Biological Networks 19

    1

    mailto:[email protected]://n.ethz.ch/~glebert/

  • 1 Einführung

    1.1 Lernziele

    Limitationen des traditionellen molekularbiologi-schen Ansatzes anhand von Beispielen aufzeigen.Vom Human Genome Project hatte man sich erhofft, al-len Genen eine Funktion zuordnen zu können. Es gibt aberviel mehr zelluläre Funktionen als Gene. Um das Systemzu verstehen, muss man die einzelnen Komponenten, ihreInteraktionen und wie eine Veränderung sich auf das Systemauswirkt verstehen.

    Den Ansatz und die Ziele der Systembiologie be-schreiben und Beispiele für Fragestellungen nennen,mit denen sich die Systembiologie beschaftigt. In derSystembiologie versucht man mithilfe computergestütztermathematischer Modelle zu verstehen, wie das funktionie-rende Zusammenwirken der molekularen Komponenten zudem Verhalten und den Eigenschaften führt, die biologischeSysteme zeigen.

    Sie können Faktoren nennen, die zur Komplexitätbiologischer Systeme beitragen. Die Komplexität wirdschnell zu hoch wenn verschieden Prozesse und Regel-mechanismen wie Genexpression, Signalverarbeitung undRückkopplung ineinander greifen. Dabei hat man oft einefast unendliche Menge Daten und Möglichkeiten diese zuverknüpfen.

    An Beispielen aufzeigen, warum Modelle nützlichsind, um biologische Fragestellungen zu beantwor-ten, die man nicht allein durch Intuition lösen kann.An einem Beispiel erklären, wie man bei einer Sys-temanalyse grundsätzlich vorgeht. Mögliche Fragestel-lungen sind die Systemanalyse eines genregulatorischen Mo-dells oder Michaelis-Menten-Kinetik. Misst man z.B. dieExpression eines Gens in Populationen mit unterschiedlichgrossen Aminosäurevorräten, muss bedacht werden, dassZellen mit mehr AS grösser wachsen könnten und die Ex-pressionsprodukte so verdünnter wären.

    Ausgehend von einem Schema eines Reaktions-oder Pathway-Systems, die Geschwindigkeitsgeset-ze aufstellen, die dieses System beschreiben (Ver-tiefung in Woche 2).

    A+Bk−→ C

    d[A]

    dt= −k[A][B]

    d[B]

    dt= −k[A][B]

    d[C]

    dt= +k[A][B]

    Die Annahmen nennen, die beim Massenwirkungs-gesetz getroffen werden. Gleichgewicht, reversible Reak-tion, konstante Temperatur, kein Katalysator

    Ausgehend von den Elementarreaktionen ei-ner Enzym-katalysierten Reaktion die Michaelis-Menten-Gleichung und ähnliche Gleichungen ein-facher Enzymkinetiken herleiten und angeben,welche Annahmen man dabei trifft. Vereinfachun-gen: Produkt wird in irreversibler Reaktion hergestellt;[E]total = [E] + [ES], [ES] ist konstant

    E + Sk1−−⇀↽−−k−1

    E ∗ Sk2−→ E + P

    d[S]

    dt= −k1[E][S] + k−1[E ∗ S]

    . . .

    v =vmax[S]

    Km + [S]mit vmax = kcat[E]

    Km =k−1 + k2

    k1

    Für jeden Parameter der Michaelis-Menten-Gleichung beschreiben, wofür dieser inhaltlichsteht und wie sich der Kurvenverlauf qualitativverändert, wenn dieser Parameter verändert wird.vmax: maximale Reaktionsrate → vmax ↑ ⇒ höhere Ober-grenze; KM : Affinität des Enzym-Substrat-Komplexes (Sub-stratkonzentration bei 50% vmax) → KM ↑ ⇒ Kurve flacher

    Andere Beispiele neben der Enzymkinetik nen-nen, auf die die Michaelis-Menten-Gleichungübertragbar ist und wissen die Parameter der Glei-chung inhaltlich zuzuordnen. Bindung eines Trankrip-tionsfaktors T an eine DNA-Sequenz G: [T ] entspricht derSubstratkonzentration; K gibt Affinität von T an G an

    [G ∗ T ] =[G]T ∗ [T ]

    [T ] +K

    1.2 Beispielaufgaben

    1.2.1

    Die irreversible Reaktion S → P wird vom EnzymE mit dem katalytischen Koeffizienten kcat (1 s

    −1)und der Substrataffinität KM (1 mM) katalysiert.Die Reaktion folgt einer Michaelis-Menten-Kinetik.(a) Welche Gleichung beschreibt die Reaktionsra-

    te v als Funktion der Substrat- [S] und Enzym-konzentration [E]?

    (b) Berechnen Sie die Reaktionsrate (in mM s−1)für die Konzentrationen [E] = 3mM und [S] =2mM.

    (c) Zeichnen sie schematisch einen v-s-Plot mitdem Kurvenverlauf und geben Sie die Positi-on von Km und vmax an.

    (a) v = vmax[S]Km+[S] =kcat[E][S]Km+[S]

    (b) v = 1 s−1

    ∗3mM∗2mM1mM+2mM =

    6mM2 s−1

    3mM = 2mMs−1

    (c)

    2

  • 1.2.2

    Formulieren Sie die Geschwindigkeitsgesetze für dasProteinsystem in dem Signalweg, der in der folgen-den Abbildung dargestellt ist. Tipp: ModellierenSie jeden Prozess als das Produkt einer Geschwin-digkeitskonstante und der Konzentration der betei-ligten Variable(n).

    d[P0]

    dt= −kα0 [P0] + kβ1 [P1]

    d[P1]

    dt= −kα1 [P1]− kβ1 [P1] + kα0 [P0] + kβ2 [P2]

    d[P2]

    dt= −kβ2 [P2] + kα1 [P1]

    2 Modellierung von Enzymreaktionen

    2.1 Lernziele

    Den allgemeinen Arbeitsablauf beim Aufstellen ei-nes Modells beschreiben.

    Die Rolle der Auswahl einer angemessenen Zeit-und Grössenskala bei dem Aufstellen eines Modellserklären. Man muss die Zeit und Grösse das Modellorga-nismus oder Modelles allgemein der Fragestellung anpas-sen. Z.B. sind für geologische Prozesse Jahrhunderte nötigwährend für Diffusion in einer Zelle Sekunden ausreichen.

    Die Unterschiede zwischen dynamischen und sta-tischen Modellen erklären und für eine gegebe-ne Fragestellung eine geeignete Modellwahl tref-fen. Dynamische Modelle verwendet man, wenn zeitlicheVeränderungen bei dem modellierten Prozess eine Rolle spie-len. Für die Beantwortung zeitunabhängiger Fragestellungeneignen sich statische Modelle.

    Den Begriff steady state definieren und biologischeBeispiele für steady-state-Bedingungen nennen. DasSystem befindet sich im GGW-Zustand, wenn sich die Kon-zentrationen der Metaboliten nicht verändern. Die Ein- undAusflüsse eines Metaboliten halten sich die Waage.

    Die Vorteile der Annahme eines steady states beider mathematischen Modellierung erklären. Er isteine mathematische Vereinfachung, weil man durch die zeit-liche Konstanz Gleichungssysteme statt Differentialgleichun-gen aufstellen kann.

    Die Begriffe Konstante, Parameter, Variable, Zu-standsgrösse (state variable) und Systemzustand(system state) definieren. Konstante: GleichbleibendeZahl Zustandsgrösse: Grössen die den Zustand biologi-scher Objekte wie Gene, Zellen oder Moleküle als auchdas Verhalten des Modells beschreiben. Variable: Wertveränderlich und hängt von anderen Komponenten des Mo-dells ab. Parameter: Durch abschätzen, Literatur oder Ex-perimente festgelegte Werte (z.B. KM ). Systemzustand:Der Zustand des Systems zu einem spezifischen Zeitpunkt t,zu dem alle Werte bekannt sind.

    Die ODE-Modelle für die elementaren Reaktionenaufstellen, die man in einem biochemischen Netz-werk findet, und kennen deren Lösung für einzelneReaktionsschritte.Konstante Produktion

    k1−→ A

    d[A]

    dt= k1 ⇒ [A] = [A]0 + k1 ∗ t

    Linearer Abbau

    Ak1−→

    d[A]

    dt= −k1[A] ⇒

    d[A]

    [A]= −k1 ∗ dt

    ∫ [A]

    [A]0

    d[A]

    [A]= −k1

    ∫ t

    0

    dt = [A] = [A]0 ∗ e−k1∗t

    t1/2 =ln(2)

    k1

    3

  • Autokatalyse

    k1∗[A]−−−−→ A

    [A] = [A]0 ∗ ek1∗t t1/2 =

    ln(2)

    k1

    Dimerisierung

    A+Bk1−→ A ∗B

    [A] = [A]0 − [A ∗B] [B] = [B]0 − [A ∗B]

    d[A]

    dt=

    d[B]

    dt= −k1[A][B]

    d[A ∗B]

    dt= k1[A][B]

    [A ∗B] =[A]0[B]0(1− e

    −k1t([A]0−[B]0))

    [A]0 − [B]0e−k1t([A]0−[B]0)

    Reversible Dimerisierung

    A+Bk1−−⇀↽−−k−1

    A ∗B

    [A ∗B]SS =k1k−1

    KD =k−1k1

    d[A ∗B]

    dt= +k1[A][B]− k−1[A ∗B] = 0

    Produktion und Degradation

    k1u−−→Ak2−→ [A]SS =

    k1 ∗ u

    k2d[A]

    dt= +k1 ∗ u− k2[A] [A] =

    k1 ∗ u

    k2

    (1− e−k2∗t

    )

    Ausgehend von einem Schema eines mehrschrit-tigen Reaktions- oder Pathway-Systems die Ge-schwindigkeitsgesetze aufstellen, die dieses Systembeschreiben. Die Konzentrationsveränderung über Zeitsetzt sich immer aus allen Zu- und Abflüssen zusammen.

    z.B.d[A]

    dt= k1 ∗ u− k2[A] oder [A]SS =

    k1 ∗ u

    k2

    Erklären, wie sich die Reaktionsgeschwindigkeit inAbhängigkeit der Substratkonzentration zwischenEnzymen, die der Michaelis-Menten-Kinetik folgen,und Enzymen, die Substratinhibition zeigen, unter-scheidet und die Kurvenverläufe qualitativ aufzeich-nen.

    Anhand einer Zeichnung erklären, wie sichdie steady-state-Konzentration schalterartig mitVeränderung einer Kinetik (z.B. durch Änderungder externen Substratkonzentration) ändern kann.Wo befinden sich die steady states?

    Substratinhibition v([S]) = vmax[S][S]+KM+

    [S]2

    KI

    Transport vTrans.([Sext], [S]) = D([S]ext − [S])

    Schnittpunkte der schwarzen und roten Linien sind steadystates. Die schwarze Linie beschreibt die Substratinhibition.

    2.2 Beispielaufgaben

    2.2.1

    Sie möchten die ersten 5 Minuten der Stoffwechsel-reaktion von Leberzellen auf die Zugabe von Inhibi-toren der Glykolyse vorhersagen. Dazu entwickelnSie ein Modell welches Sie mit der Reaktion aufeinen bekannten Inhibitor trainieren.(a) Welche Art von Modell brauchen Sie für diese

    Aufgabe?(b) Welche Informationen und welche Daten brau-

    chen Sie dafür?(c) Beschreiben Sie kurz wie Sie das Problem an-

    gehen, wie Sie das Modell entwickeln werden,und was Ihr Vorgehen ist falls das Modell dieDaten nicht beschreiben kann.

    (a) dynamisch(b) beteiligte Reaktionen, kinetische Parameter, Anfangs-

    konzentrationen(c) spezifische Frage, Modell auf Robustheit prüfen, Dyna-

    mik validieren, mögliche Verhalten vorhersagen, Mo-dell implementieren, Hypothese testen; allfällige Ab-weichungen erklären und Modell ggf. anpassen

    4

  • 2.2.2

    Ein Systembiologe möchte die Ausbreitung einer an-steckenden Krankheit modellieren, um die Anzahlvon Individuen in einer Population abzuschätzen,die mit der Krankheit infiziert sind (I), empfänglichfür eine Infektion sind (S) und resistent gegen dieKrankheit sind, nachdem sie von ihr genesen sind(R). Er hat ein Modell aufgestellt, angemesseneWerte für die Parameter angenommen und den Ver-lauf der Grössen I, S und R über die Zeit grafischdargestellt.(a) Hat der Systembiologe ein statisches oder dy-

    namisches Modell gewählt? Begründen Sie ih-re Antwort.

    (b) Für welchen Zeitraum eignet sich die Annah-me eines steady states? Markieren Sie diesenin der Zeichnung.

    (c) Was ist der Vorteil einer steady-state-Annahme für die Modellierung eines Systems?

    (d) Werden sich für die Variablen I, S und R,unabhängig von den Annahmewerten für dieModellparameter, immer die im Diagrammoben gezeigten steady-state-Werte einstellen?Begründen Sie Ihre Antwort.

    (a) dynamisch, da Zeitdimension berücksichtigt wird(b) ab ∼ 75 auf Zeitskala(c) mathematisch einfacher und damit weniger rechenin-

    tensiv(d) nein, z.B. oszillierend wenn Resistenz nur kurz anhal-

    tend

    2.2.3

    Ein Substrat S wird mit der Rate vD von der Zel-le über die Plasmamembran aufgenommen und ineinem irreversiblen metabolischen Pathway weiter-verwendet. Die Kinetik des ersten Enzyms des Pa-thways ist in der folgenden Abbildung gezeigt. DasSystem sei immer im steady state.(a) Um welche Art von Kinetik handelt es sich bei

    dem Enzym?(b) Die Aufnahmegeschwindigkeit in die Zelle

    vD sei gegeben durch die Gleichung vD =D([Sextern] − [S]), wobei D = 1s

    −1 eine Diffusi-onskonstante und [Sextern] die Substratkonzen-tration ausserhalb der Zelle ist. Zeichnen SievD als Funktion von [S], wenn Sextern = 4mMin das Diagramm ein.

    (c) Begründen Sie, warum die interne Substrat-konzentration bei (b) im steady state [S] <1mM sein muss.

    (d) Schätzen Sie ab, welche interne Substratkon-zentration sich für [S]extern = 6mM einstellenwird. Zeigen Sie auch dies zeichnerisch.

    (a) Substratinhibition(b) vD = D([Sextern]− [S]) = D[Sextern]−D[S]

    = 1s−14mM − 1s−1[S] = −1s−1[S] + 4mMs−1

    y = ax+ b⇒ Gerade von (0, 4) zu (4, 0)

    (c) Schnittpunkt von vD([S]) mit Enzymkinetik ist< 1mMs−1 bzw. ab 1mM wird Enzym inhibiert

    (d) [S] ≈ 5mM ; Gerade von (0, 6) zu (6, 0)

    3 Modellierung von Stoffwechselwegen

    3.1 Lernziele

    Anhand von Beispielen Probleme aufzei-gen, die in biologischen Pathways ohneRückkopplungsmechanismen entstehen können unddaraus die Notwendigkeit für solche Mechanismenerklären.Der Input steigt in folgendem Pathway plötzlich um das

    sechsfache an: → AE1−−→. E1 kommt nicht mit, [A] steigt

    unbegrenzt an und führt zu einem overshoot. Flüsse ineinem biologischen Pathway müssen regulierbar sein, umungewollte Verhaltensweisen wie overshoots zu verhindern.

    Erklären, welche Funktionen negative und positiveFeedbacksysteme in Pathways innehaben.

    Durch negative Feedbacksysteme stellt sich schnell ein be-stimmter Gleichgewichtszustand ein. Durch positive Feed-backsysteme können kontinuierliche Inputsignalen in ver-schiedene diskrete Gleichgewichtszustände überführt wer-den.

    5

  • An einem Beispiel erklären, wie ein Systemnur aufgrund eines dynamischen Prozesses eineGedächtnisfunktion zeigen kann.

    Bei genau derselben externen Konzentration können sichzwei verschiedene steady states einstellen, wobei es von deraktuellen internen Substratkonzentation abhängt, welcherGleichgewichtszustand erreicht wird. Der mittlere Schnitt-punkt ist kein stabiler steady state.

    Herausforderungen nennen, die in birektionalenbiologischen Pathways (z.B. Glykolyse und Gluco-neogenese) entstehen und die Notwendigkeit fürFeedback-Mechanismen in solchen Pathways aufzei-gen.

    1) Damit die Richtung schnell gewechselt werden kann,müssen zu allen Zeiten bestimmte Mindestmengen vonEnzymen und Cofaktoren vorhanden sein.

    2) Sind gleichzeitig entgegengesetzte Reaktionen am lau-fen, verändert sich trotz hohen Energieaufwand wenigan der totalen Konzentration (futile cycles). Regulati-onsmechanismen verhindern dies.

    Erklären, warum die möglichst gute Abschätzungder Parameterwerte beim Modellieren wichtig ist.

    Konzeptionell beschreiben, wie man die Qualität ei-nes Parameterwertes bestimmt.Man simuliert das System für verschiedene Parameterwerteund vergleicht die Resultate mit Messungen. Die Differenzsollte klein genug sein, dass sie bei angemessenem Signifi-kanzniveau auf Zufall zurückführbar ist.

    Für eine gegebene Fragestellung zu den Kursthe-men in Form eines kurzen Skripts in Pseudocodezeigen, wie man bei der Beantwortung vorgehenwürde (kursübergreifendes Lernziel).Universelle Schlüsselwörter wie IF, ELSE, DO oder FOR miteinfach verständlichem Englisch oder Deutsch kombinieren.Der genaue Syntax ist unwichtig, solange die Funktionsweiseverständlich ist.

    3.2 Beispielaufgaben

    3.2.1

    Im Stoffwechselweg A → B → C gibt es eine Feed-backhemmung von C auf das erste Enzym, welchesdie Umwandlung von A zu B katalysiert. NennenSie 2 Gründe, wieso dieses Feedback für die Zellenotwendig sein könnte.

    • kein Ressourcenverbrauch wenn genug C• B oder C evtl. toxisch in grossen Mengen

    3.2.2

    Sie konstruieren einen synthetischen Stoffwechsel-weg zu einem biotechnologischen Produkt mit meh-reren Enzymen, die sich alle durch Michaelis-Menten-Kinetik beschreiben lassen. Dieser Stoff-wechselweg wird ohne Regulationsmechanismen inein Bakterium eingebaut.(a) Während des Produktionsprozesses verdop-

    pelt sich der Zuckerfluss in das Bakteriumschlagartig. Nennen Sie 2 mögliche Konse-quenzen, die diese dynamische Veränderungfür ihren synthetischen Stoffwechselweg habenkönnte.

    (b) Zu welchen konkreten Zellstoffwechselproble-men könnten diese Konsequenzen führen?Nennen Sie 3 Beispiele.

    (c) Wie könnten Sie diese Probleme verhindern?(a) • ganzer Pathway schneller

    • Überproduktion eines Intermediats(b) • futile cycles

    • zu viel eines toxischen Intermediats• substrate accelerated death

    (c) Feedbackmechanismen

    6

  • 3.2.3

    In einem Stoffwechselweg wie im Bild unten wirdder Fluss v1 durch das Endprodukt Y inhibiert;Fluss v3 repräsentiert den zellulären Bedarf an Y .

    (a) Welche Funktionen haben negative Feedback-systeme im Allgemeinen?

    (b) Welche Aussagen können Sie über die Konzen-tration von Y machen, wenn das System imstationären Zustand ist und Sie nicht mehr zudem Stoffwechselweg wissen?

    (c) Für ein vereinfachtes Modell des Stoffwechsel-wegs nehmen Sie an: v1 =

    k11+[Y ] und v2 = k2[X],

    wobei k1,2 kinetische Parameter und [X], [Y ]Metabolitkonzentrationen sind. Geben Sie dasODE-Modell an.

    (d) Mit dem Modell, dem gemessenen Fluss v3 =1 mmol/h und den Parameterwerten k1 = 2mmol/h und k2 = 1 mmol/h, was sind die sta-tionären Konzentrationen von X und Y ?

    (a) • keine Ressourcenverschwendung• keine übermässige Ansammlung eines Metaboli-

    ten(b) • [Y ] kann nicht hoch genug sein, um v1 komplett

    zu inhibieren• [Y ] bleibt konstant

    (c)d[X]

    dt= v1 − v2 =

    k11 + [Y ]

    − k2[X]

    d[Y ]

    dt= v2 − v3 = k2[X]− v3

    (d) k2[X]− v3 = 0 → k2 =v3[X] → [X] =

    v3k2

    = 1k1

    1+[Y ] − k2[X] = 0 → [Y ] =k1

    k2[X]− 1 = 1

    3.2.4 (Fortsetzung von 2.2.3)

    Ein Substrat S wird mit der Rate vD von der Zel-le über die Plasmamembran aufgenommen und ineinem irreversiblen metabolischen Pathway weiter-verwendet. Die Kinetik des ersten Enzyms des Pa-thways ist in der folgenden Abbildung gezeigt. DasSystem sei immer im steady state.

    (a) Die Aufnahmegeschwindigkeit in die ZellevD sei gegeben durch die Gleichung vD =D([Sextern] − [S]), wobei D = 1s

    −1 eine Diffusi-onskonstante und [Sextern] die Substratkonzen-tration ausserhalb der Zelle ist. Zeichnen SievD als Funktion von [S], wenn Sextern = 4.5 mMin das Diagramm ein.

    (b) Welche interne(n) Substratkonzentration(en)sind möglich für Sextern = 4.5 mM? BegründenSie Ihre Antwort und geben Sie eine ungefähreAbschätzung.

    (c) Falls in (b) mehrere stationäre Zustände exis-tieren, was ist der Mechanismus und wovonhängt ab, in welchem Zustand sich das Systembefindet?

    (a) Gerade von (0, 4.5) bis (4.5, 0)(b) [S]1 ≈ 1; [S]2 ≈ 3 → Schnittpunkte(c) je nach dem welchem Schnittpunkt [S] näher ist

    4 Regulation von Stoffwechselwegen

    4.1 Lernziele

    Eine biologische Erklärung für die Notwendigkeitvon Regulationsmechanismen im Stoffwechsel ge-ben. Wenn das Substrat plötzlich im Übermass oder nichtmehr vorkommt stirbt die Zelle.

    Verschiedene Mechanismen nennen, durch die Re-aktionsraten von Enzymen reguliert werden, undjeweils angeben, welchen Faktor der Enzymkinetiksie beeinflussen. Genexpression, post-translationale Mo-difikation, allosterische Regulation, Enzym-Kapazität unddas Metaboliten-Level

    Angeben, auf welcher Zeitskala die verschiedenenRegulationsmechanismen stattfinden, und aufgrundvon diesem Wissen erklären, wie man den Einflusseinzelner Regulationsprozesse untersuchen kann.Man kann die Zeitskala trennen und Prozesse erst untersu-chen, wenn sie beispielsweise schon im gehemmten steadystate sind.

    Erklären, wie die Metabolitkonzentration und meta-bolischer Fluss miteinander in Verbindung stehen.Die Differenz aus Einfluss und Ausfluss bestimmt die Kon-zentrationsveränderung eines Metaboliten. Umgekehrt be-einflussen die Metabolitkonzentrationen die metabolischenFlüsse durch die Abhängigkeit der Reaktionsrate von derSubstratkonzentration.

    Verschiedene Feedback-Typen (proportional, inte-gral, differentiell) beschreiben und ihre Funktion inder Regulation biologischer Pathways diskutieren.Proportional: Durch allosterische Hemmung: PFK wirdgehemmt, wenn die ATP Konzentration zu hoch wird. Je-doch ist die Hemmung zeitverzögert und das resultiert inInstabilität. Ein Problem ist, dass es nicht zum gleichen stea-dy state führt. Integral: Korrigiert den Fehler als hätte eszu wenig ATP und viel AMP. Aktiviert PFK2 und die Gly-kolyse läuft weiter. Differential: Kompensiert für schnelleVeränderungen. Puffer sind differential. Z.B. die Kreatin-kinase phosphoryliert Kreatin, dephosphoryliert dieses aberwieder, wenn der ATP-Spiegel zu niedrig fällt.

    7

  • 4.2 Beispielfragen

    4.2.1

    Im Stoffwechselweg A → B → C gibt es eine Feed-backhemmung von C auf das erste Enzym, dieUmwandlung von A zu B. Nennen Sie 3 Beispie-le, wie diese Hemmung mechanistisch erreicht wer-den könnte und geben Sie eine kurze Erklärungbezüglich der zu erwartenden Geschwindigkeit.

    • kompetitiv (v′max = k2[E]0, wie ohne Inhibition)• nicht kompetitiv / allosterische Hemmung(sinkt: v′max =

    vmax1+

    [I]KI

    )

    • unkompetitiv (sinkt: v′max =vmax1+

    [I]KI

    )

    4.2.2

    Die irreversible Reaktion S → P wird vom En-zym E mit dem katalytischen Koeffizienten kcat undder Substrataffinität km katalysiert. Die Reaktionfolgt einer Michaelis-Menten-Kinetik und der Flusswird durch die folgende Gleichung beschrieben: v =

    [E] ∗ kcat ∗[S]

    km+[S]. Nehmen Sie an, dass System wäre

    transkriptionell reguliert. Welcher Teil der Glei-chung wird sich ändern und wieso? Wird der Flussv grösser, kleiner oder bleibt er unverändert, wennsich das Expressionlevel auf 10% des Normalzustan-des reduziert (unter der Annahme, dass von jedemTranskript ein Protein gebildet wird)?Annahme: Zellvolumen konstant → Fluss kleiner, da [E]transkriptionell Reguliert wird.

    5 Analyse von metabolischen Netzwerkendurch Flux Balance Analysis

    5.1 Lernziele

    Die grundlegende Annahme kennen, die man beider Modellierung sehr grosser Stoffwechselnetzwer-ke trifft und können erklären, warum diese Annah-me notwendig ist.Man nimmt an, dass alle Metabolitkonzentrationen im stea-dy state sind. Man kennt die Stöchiometrie aller Reaktionenund sucht nach den Werten der metabolischen Flüsse un-ter bestimmten Bedingungen. Für ein dynamisches Modellmüsste man alle Informationen über jede zelluläre Reak-tion eines Organimus haben. Ausserdem ist die benötigteRechenleistung heutzutage noch zu gross.

    Konzeptionell beschreiben, wie man von einzelnenbiochemischen Reaktionen genomweite Stoffwech-selnetzwerke rekonstruiert und welche Quellen mandafür nutzt. Achtung: Ein- und Ausfluss eines Systemssind nicht zwingend gleich gross!

    d[A]

    dt= v1 − v2 − v3 = 0 v1 = v2 + v3

    d[B]

    dt= v2 + v3 − v4 = 0 v4 = v2 + v3

    Die stöchiometrische Matrix für das Schema eineseinfachen metabolischen Netzwerks aufstellen undangeben, in welchem Zahlenverhältnis die Flüsse imNetzwerk zueinander stehen.

    Pro Zyklus entsteht A ein Mal in R1 und wird in R2 einMal verbraucht usw.

    dc

    dt= S ∗ v = 0 mit v = (v1, v2, v3, v4)

    Den zweidimensionalen Lösungsraum für zweiFlüsse aus einem einfachen metabolischen Netz-werks grafisch darstellen.

    (A) Für jeden Einfluss (hier v1 = 5) liegen alle möglichenLösungen für v2 und v3 auf einer Geraden imLösungsraum.

    (B) Weil v1 beliebig gross sein kann, setzt sich derLösungsraum für v2 und v3 aus unendlich vielen Paral-lelen Geraden zusammen und ist eine unendlich grosseFläche.

    (C) Unter der Annahme, dass irreversible Flüsse nicht klei-ner als 0 sein können, lässt sich der Lösungsraum aufden ersten Quadranten einschränken.

    Eine Kernel-Matrix für ein einfaches metaboli-sches Netzwerk konstruieren und zur Analyse vonKopplungen in dem Netzwerk verwenden. DenZusammenhang zwischen dem Lösungsraum einerstöchiometrischen Matrix und ihrer Kernel-Matrixerklären.

    8

  • Prinzipienbasierte und datenbasierte Ein-schränkungen (constraints) nennen, die bei einerFlux Balance Analysis getroffen werden können.

    1) Struktur des Netzwerks2) steady-state-Annahme3) (Ir)reversibilität der Reaktionen4) Obergrenzen der Reaktionsraten5) Bedingungen unter denen sich die Zelle befindet.

    Die Notwendigkeit für Zielfunktionen (objecti-ve functions) bei einer Flux Balance Analysiserläutern und die Eignung verschiedener Zielset-zungen für eine gegebene Fragestellung diskutieren.

    Allgemein ausgedrückt gibt die Zielfunktion einen Wertdafür, wie gut ein Stoffwechselnetzwerk darin ist, ein be-stimmtes Ziel zu erreichen (z.B. Sekretion eines bestimmtenStoffes, maximale Wachstumsrate, Robustheit bei wechseln-den Umweltbedingungen, maximale Effizienz bei der Nut-zung einer Ressource). Oft optimiert man statt nur einenmehrere Flüsse gleichzeitig.

    Allgemein beschreiben, was Input und Output einerFlux Balance Analysis sind.Nährstoffe sind der Input und Biomasse ist der Output.

    An Anwendungsbeispielen von Flux-Balance-Analysen aufzeigen, welche Erkenntnisse jeweilsdurch die Analyse gewonnen wurden.Vorhersage von Mutantenverhalten: StöchiometrischesModell für E. coli ; FBA für maximales Wachstum nach Gen-deletion; 86% Vorhersagewahrscheinlichkeit. Annahmen:Zellen wollen so schnell wie möglich wachsen und sind an die-ses Ziel angepasst. FBA-Vorhersagen sind mit Experimenteneinig, aber nicht direkt nach einem Knock-out.

    Anhand von Beispielen begründen, wie die Formu-

    lierung einer biologischen Fragestellung die Komple-xität der computergestützten Analysen beeinflus-sen und sie ggf. verhindern kann.FBA ist nicht möglich, wenn folgende Situationen auftreten:

    • parallele Pathways• futile cycles• reversible Reaktionen• verzweigte Pathways ⇒

    – Einschränkungen einführen– stark vereinfachende Annahmen treffen

    Anhand von Beispielen diskutieren, wie experimen-telle Daten für die Analyse von Stoffwechselmodel-len integriert werden können und welche (prinzipi-ellen) Schwierigkeiten dabei auftreten.

    • Omics-Daten: Enzymmengen messen und in Kinetikals linearen Faktor berücksichtigen, der Lösung ver-

    bessert → dc(t)dt = S ∗ E ∗ v′ = 0 (mit E ∗ v′ = v ?)

    Schwierigkeiten

    – [E] verändert sich aber der Fluss nicht (Metabo-litenkonzentration passt sich an)

    – Einschränkungen erlauben keinen metabolischensteady state

    • Regulatorische Netzwerke: Reaktionen sind vontranskriptionellen Netzwerken reguliert → einfa-che Zustände (an/aus ⇒ 1/0) als Einschränkungeneinführen

    Für eine gegebene Fragestellung zu den Kursthe-men in Form eines kurzen Skripts in Pseudocodezeigen, wie man bei der Beantwortung vorgehenwürde (kursübergreifendes Lernziel).Konzept Flux Variability Analysis (FVA): minimalenund maximalen Fluss von Reaktionen in einem Netzwerkfinden, während ein bestimmter Zustand beibehalten wird.

    Inputs stöchiometrische Matrix als auch Ober- undUntergrenzen der Flüsse

    Output minimale und maximale Flüsse

    FOR each of the reaction directions {forward,

    backward}

    FOR each reaction as a target

    SET weights for FBA such that the target reaction

    is the objective in the correct direction

    RUN FBA

    SAVE optimized flux for the target reaction

    END

    END

    9

  • 5.2 Beispielfragen

    5.2.1

    Sie haben ein stöchiometrisches Netzwerkmodellfür den Menschen mit m Metaboliten und n enzym-katalysierten Reaktionen gegeben. Sie wollen FBAanwenden, um metabolische Funktionen des Netz-werkes zu analysieren.(a) Geben Sie ein kleines aber effizientes Skript

    in Pseudocode an, das es Ihnen erlaubt, her-auszufinden welche Doppelmutanten letal fürZellwachstum sind. Berücksichtigen Sie dabeialle letalen Doppelmutanten, nicht nur synthe-tisch letale.

    (b) Wie müssten Sie Ihr Skript anpassen, wenn Sienur an synthetisch letalen Doppelmutanten in-teressiert sind? Antworten Sie qualitativ, nichtdurch Angabe eines neuen Skripts.

    (c) Welche Objective Function würden Sie nichtwählen, um Vorhersagen über Flussverteilun-gen zu erhalten (und warum)?

    (d) Aus Genexpressionsanalysen wissen Sie, dassbestimmte Enzyme in bestimmten Gewebennicht exprimiert werden. Wie könnten Sie die-ses Wissen nutzen, um das Modell zu verfei-nern?

    (a) Inputs: stöchiometrisches Modell des Stoffwechsel-netzwerks, Einschränkungen der Reaktionsraten, Op-timierungsfunktionOutput: Kombinationen von je 2 Reaktionen die letalsind, wenn beide Reaktionen fehlen

    Create a matrix of zeros M of the size n x n

    For each (but the last) reaction k

    For each of the subsequent reactions l

    Load model

    Set upper and lower flux bounds for

    reactions k and l to zero

    Run FBA

    If combination is lethal

    Set value (k, l) in matrix M to 1

    End

    End

    (b) vorher FBAs mit je nur einer Mutante laufen lassenund lethale später nicht mehr berücksichtigen

    (c) evolutionär sinnvoll für Organismus, da lethale Dop-pelmutanten keinen evolutionären Sinn ergeben

    (d) die von diesen Enzymen katalysierten Reaktionen vonAnfang an ignorieren

    5.2.2

    Sie analysieren ein metabolisches Netzwerk im stati-onären Zustand. Das Netzwerk hat fünf interne Me-tabolite A−E, vier interne Reaktionen mit Flüssenr1 − r4, sowie zwei externe Reaktionen mit FlüssenrA und rE. Alle Reaktionen sind irreversibel; sie lau-ten:

    rA−−→ A Ar3−→ 2D

    Ar1−→ B C +D

    r4−→ A+ E

    Br2−→ C E

    rE−−→

    (a) Geben sie die stöchiometrische Matrix desNetzwerkes an.

    (b) Sie haben den Fluss rE = 1mmol/h gemessen.Welche anderen stationären Flüsse können Siedirekt bestimmen und welche Werte haben die-se?

    (a) S =

    rA r1 r2 r3 r4 rE

    A 1 −1 0 −1 1 0B 0 1 −1 0 0 0C 0 0 1 0 −1 0D 0 0 0 2 −1 0E 0 0 0 0 1 −1

    (b) d[A]dt = rA + r4 − r1 − r3 = 0 → rA + r4 = r1 + r3d[B]dt = r1 − r2 = 0 → r1 = r2

    d[C]dt = r2 − r4 = 0 → r2 = r4

    d[D]dt = 2r3 − r4 = 0 → r3 =

    12r4

    d[E]dt = r4 − rE = 0 → r4 = rE

    r1 = r2 = r4 = rE = 1mmol/h → r3 = 0.5mmol/hrA + r4 = r1 + r3 → rA = 0.5mmol/h

    5.2.3

    Sie analysieren das gegebene metabolische Netz-werk im stationären Zustand. Pfeile notieren Reak-tionen (alle Reaktionen sind irreversibel, die ent-sprechenden Symbole für Flüsse sind annotiert)und Buchstaben die Metabolite. Die Zellgrenze istdurch die gestrichelte Linie gezeigt.

    (a) Geben Sie die stöchiometrische Matrix desNetzwerkes an.

    (b) Sie haben die Aufnahmeraten rA = 2mmol/hund rB = 1mmol/h gemessen. Welche anderenstationären Flüsse können Sie bestimmen undwelche Werte haben diese?

    (a) S =

    rA rB r1 r2 r3 rD

    A 1 0 −1 −1 0 0B 0 1 0 0 −1 0C 0 0 0 1 −1 0D 0 0 2 0 0 −2

    E nicht im Netzwerk → weggelassen, da kein steadystate mögliche ist ohne Ausfluss

    (b) rA = 2mmol/h; rB = 1mmol/hd[A]dt = rA − r1 − r2 = 0 → rA = r1 + r2

    d[B]dt = rB − r3 = 0 → rB = r3 = 1mmol/h

    d[C]dt = r2 − r3 = 0 → r2 = r3 = 1mmol/h

    d[D]dt = 2r1 − 2rD = 0 → r1 = rD

    r1 = rD = rA − r2 = 1mmol/h

    10

  • 5.2.4

    Sie haben ein stöchiometrisches Netzwerkmodellfür humane Krebszellen mit Metaboliten undEnzym-katalysierten Reaktionen gegeben. Sie wol-len FBA anwenden, um metabolische Funktionendes Netzwerkes zu analysieren.(a) Mit diesem Modell ist kein Zellwachstum

    möglich. Sie vermuten, dass eine Komponenteder im Modell repräsentierten Biomasse nichtsynthetisiert werden kann. Geben sie ein klei-nes Skript in Pseudocode an, das es Ihnen er-laubt, herauszufinden welche Biomassekompo-nente dies ist.

    (b) Nach Korrektur des Modells: welche Objecti-ve Function würden Sie wählen, um Vorhersa-gen über Flussverteilungen zu erhalten (undwarum)?

    (c) Wie könnten Sie das Modell verwenden um zuanalysieren, welche metabolischen Reaktionenfür diese Krebszellen essentiell sind?

    (a) Input: stöch Mod. des Stoffwechselnetzwerkes, Ein-schränkungen der Reaktionsraten, Optimierungsfunk-tionOutput: Vektor der für jede Reaktion, die im Modell 0ist, besagt, ob sie beim Anschalten Biomassensyntheseerlaubt

    FOR each reaction that is 0 in the model

    SET reaction to 1 (running)

    LOAD model

    RUN FBA

    IF biomass is synthesized

    SAVE reaction as crucial in vector

    END

    (b) maximales Wachstum(c) je eine Reaktion löschen und testen, ob Zelle noch

    wächst

    5.2.5

    Gegeben ist das folgen-de Reaktionssystem,das aus vier Metabo-liten (A, B, C, D) undsechs irreversiblen Re-aktionen (R1 bis R6)besteht:

    (a) Stellen Sie die Massenbilanz für jeden der vierMetaboliten auf.

    (b) Zeichnen Sie den Lösungsraum für die Ge-schwindigkeit v6 in Abhängigkeit von v1 in dasDiagramm.

    (a)d[A]

    dt= v1 − v2 − v3

    d[B]

    dt= v2 − v4 − v5

    d[C]

    dt= v3 − v4

    d[D]

    dt= v4 − v6

    (b)

    LGS (Matrix) auflösen bis al-

    le Flüsse in Abhängigkeit von

    1-2 Flüssen dargestellt werden

    können. Einfache Zahlen wie

    1 oder 0 in diese Flüsse ein-

    setzen → zwei Lösungen erge-

    ben Vektoren (der Rest sind de-

    ren Linearkombinationen) →

    Kernelmatrix & Grenzen des

    Lösungsraums

    5.2.6

    Was ist die Hauptannahme bei einer Flux BalanceAnalysis? Erklären Sie anhand dieser Annahme denNamen der Analysemethode. Flux balance = steadystate = keine Veränderungen der Flüsse

    7 Modellierung von Signaltransduktionswegen

    7.1 Lernziele

    Herausforderungen nennen, die für eine Zelle beider Signaltransduktion auftreten. Sie muss auf sehrkleine Konzentrations-Änderungen reagieren können. Z.B.bei der Michaelis-Menten-Kinetik muss der Input um das81-fache gesteigert werden um von 90%zu steigen. Da Zellen schneller als das reagieren müssen, gibtes Ultrasensitivität.

    Ultrasensitivität definieren und verschiedene Me-chanismen beschreiben, durch die eine Zelle Ultra-sensitivität erreicht. Ultrasensitivität bedeutet, dass einSystem stärker auf eine Signalveränderung reagiert alsMichaelis-Menten Kinetik erläuben würde. So kann schalter-artiges Verhalten erzielt werden. Mechanismen dafür sind

    • Kooperation (z.B. Hämoglobin)• Signalkaskaden (z.B. MapKKK)

    Eine biologische Interpretation verschiedener Hill-Koeffizienten in der Hill-Gleichung geben und je-weils den Kurvenverlauf zeichnen.

    Output = OutputmaxInputn

    Inputn +KnM

    Wenn n = 1 liegt Michaelis-Menten-Kinetik vor. n ist dersogenannte Hill-Koeffizient, ist ein Mass für Ultrasensiti-vität und beschreibt die kooperative Bindung. Je grössern, desto steiler ist die sigmoidale Kurve und desto klei-ner ist der Änderungsbereich beim Inputwert, der zu einerschalterartigen Veränderung des Outputs führt. Input0.5 istder Inputwert, bei dem die Hälfte des maximalen Outputserreicht wird.

    Grafisch zeigen, warum die Kombination mehrererultrasensitiver Schritte in einem Pathway zu einemnoch höheren Hill-Koeffizienten der gesamten Kas-kade führt. ntot ist grösser als n1 und n2 zusammen. KM1bestimmt KM,tot der Kaskade (kann nicht kleiner sein alsdas KM der ersten Reaktion), denn die Schalterreaktionliegt im Bereich des ersten Proteins.

    11

  • 1) Inputwert (x-Achse) des Schnittpunktes von 10% mitKurve 2 ablesen

    2) Inputwert auf Aktivitätsachse (y) übertragen undSchnittpunkt mit Kurve 1 suchen

    3) Schnittpunkt auf x-Achse übertragen4) Schritte 1) bis 3) für 90% wiederholen5) die letzten 10%- bzw. 90%-Schnittpunkte bilden auf

    der x-Achse den Switch-Bereich6) Sigmoidale Kurve durch Schnittpunkte der 10%- und

    90%-Linien mit dem Switch-Bereich zeichnen

    Kriterien nennen, durch die man das Ergebnis einerSignalkaskade quantitativ charakterisieren kann.

    • Signaling time τ : Expected time of arrival of the signal.• Signal duration υ: Variance of the expected time.• Signal amplitude S: Average amplitude during signa-

    ling.

    Diskutieren, welche Faktoren die Dynamik einer Si-gnalkaskade beeinflussen.

    dX1dt

    = vp,1 − vd,1

    = α1X̃1R− β1X1dXidt

    = vp,i − vd,i

    = αiX̃iXi−1 − βiXi

    X: phosphorylierte Kinase

    X̃: nicht phosphorylierte

    Kinase

    Erklären, warum eukaryotische Signalkaskaden ausmehreren Kaskadestufen bestehen. So kann das Signalamplifiziert oder abgeschwächt werden. Es wird auch enormverschnellert.

    Am Beispiel eines Signalmoleküls erklären, wie einSignalmolekül viele verschiedene Signale interpre-tieren und durch unterschiedliche dynamische Ver-haltensweisen reagieren kann. Src-Kinase: SchlüsselRegulator mit mehreren Funktionen: Beweglichkeit, Prolife-ration, überleben, Zell-Zell Adhäsion. Bis zu 350 potenzielleSubstrate.

    Wird reguliert durch 2 Phosphorilierungs-Events, von de-ne eines inhibiert und das andere aktiviert. So gibt es 4Stadien und insgesamt 7 Reaktionen. Sie folgen nicht derMichaelis-Menten-Kinetik. So ergibt sich ein dynamischesGedächtnis, welches vom vorherigen Zustand der Kinaseabhängt. RPTP ist die Phosphatase, welche die inaktiveForm der Src-Kinase Si durch Dephosphorylierung in dieteilweise aktive Form S überführt.

    Ist die Konzentration von RPTP tief, ist auch die Konzen-tration der Form S und damit die Src-Aktivität tief (Punkt1). Ist die Konzentration von RPTP hingegen hoch, liegtviel der aktiven Form der Src-Kinase vor, die sich durch Au-tophosphorylierung selbst weiter aktivieren kann (Punkt 3).Interessant wird es, wenn man die Src-Kinase-Aktivität beieiner mittleren RPTP-Konzentration betrachtet: Abhängigvon der vorherigen Aktivität der Src-Kinase ist die Aktivitätnun tief, wenn sie auch vorher tief war, bzw. hoch, wenn sievorher hoch war (Punkt 2). Die Schnittpunkte sind dabeisteady states.

    v3 =

    (kcatSKS

    [S] +kcata1Ka2

    [S] +kcata2Ka2

    [S]

    )[S]

    Erklären, was bei einer Sensitivitätsanalyse unter-sucht wird und an einem Beispiel erklären, wie mandurch so eine Analyse potentielle Angriffspunktefür Medikamente identifizieren kann. Man verändertdie Parameter KM für die verschiedenen Reaktionsschrit-te und sieht anhand des Outputs wie sensitiv dieser Teil-schritt ist. Beim sensitivsten Teilschritt findet die grössteVeränderung des Outputs statt. Dies zeigt den Angriffs-punkt des Medikaments an. Krebs entsteht häufig durcheine Mutation im MapKKK Pathway oder im AKT Pathway.Man sucht den sensitivsten Teilschritt/Rezeptor/Kinase undversucht ihn mit einem Medikament zu inhibieren.

    12

  • 7.2 Beispielfragen

    7.2.1

    Die Aktivität einer Signalkaskade im stationärenZustand kann mit Hilfe der sogenannten Hill-Kinetik beschrieben werden:

    Ai =Ani−1

    KnM,i +Ani−1

    wobei Ai die Aktivität der i-ten Kinase ist, wel-che von der vorhergehenden Kinaseaktivität Ai−1abhängt, n der Hill-Koeffizient (Exponent) ist undKM,i die Michaelis-Menten-Konstante für die Akti-vierung von Kinase i ist.(a) Wie muss n sein, um Ultrasensitivität jedes Si-

    gnalschrittes zu erreichen?(b) Nehmen Sie an, dass eine MAPK-Kaskade mit

    i = 1 . . . 3 Kinasen die folgenden Parameterwer-te hat: n = 8, K1 = 0.2, K2 = 0.4 und K3 = 0.8.Skizzieren Sie graphisch die Aktivitäten dereinzelnen Kinasen als Funktion der vorherge-henden Kinaseaktivität bzw. des Inputs A0 (al-le Signale sind in [0, 1]).

    (c) Welche Kinasekaskade wird den Output aufder letzten Ebene bei einem geringeren Input-signal aktivieren: die Kaskade aus (b) oder einalternativer Signalweg mit n = 8, K1 = 0.8,K2 = 0.4 und K3 = 0.2? Begründen Sie IhreAntwort.

    (a) > 1

    (b)

    (c) (b) ist schneller, da bei (c) zuerst 0.8 erreicht werdenmuss, bevor Kinasen 2 und 3 aktiv werden

    8 Analysis of omics data

    Know what biological insights are to be obtainedby data mining of omics data. Hypothesen generieren,Komponenten identifizieren, Netzwerk- und Interaktionsvor-hersagen, Klassifizierung und Vorhersage von Features

    Describe the typical problems associated with omicsdata. Es sind sehr viele Daten und es ist schwierig denÜberblick nicht zu verlieren (Unwichtiges rausfiltern). DasRisiko des overfitting besteht. Die Experimente müssen tech-nisch reproduzierbar bleiben. Daten beeinhalten statistischesRauschen.

    # of detected features >>> # of samples

    Describe the role of statistics in biological context.Statistik wird benutzt, um Hypothesen zu verwerfen. Eskann jedoch nie mit 100% Sicherheit etwas bewiesen oderverworfen werden.

    8.1 Data Mining

    • biologische Frage• keine eindeutige Antwort erwarten• positive und negative Kontrolle• möglichst einfach halten• verschiedene Herangehensweisen nutzen

    8.2 Analyse und Statistik

    Differential, univariate analysis between two groupsDie Daten wurden bereits in zwei Gruppen z.B. Mutant/WToder gesund/krank gesammelt. Nun ist interessant, ob wei-tere Abweichungen wie zelluläre Prozesse bestehen.

    Understand the basic form of univariate analysis.Man nimmt eine Komponente zu einer bestimmten Zeit undvergleicht die zwei Gruppen. Dies wird für jede Komponentewiederholt. Man berechnet die Grösse der Veränderung mitdem fold-change. Für bessere symmetrische Visualisierungbenutzt man den Logarithmus davon.

    FC =mean(GroupA)

    mean(GroupB)

    log2(FC) = log2

    (mean(GroupA)

    mean(GroupB)

    )

    Man benutzt dann verschiedene statistische Tests um heraus-zufinden, ob die Null-Hypothese (die zwei Gruppen folgenderselben Verteilung) stimmt.

    • t-Test: beruht auf Normalverteilug• Mann-Whitney- / Wilcoxon- / Ranksum-Test:benutzen Ranking

    • Permutations-Test: Für Studien mit vielen Proben;Die Datenpunkte werden zufällig einer Gruppe zuge-wiesen und es wird getestet, wie oft die neuen Gruppenmehr Sinn machen als die ursprünglichen.

    Mit dem generierten p-Wert wird dann ein volcano ploterstellt. Allgemein gilt in der Biologie: p < 0.05 ist akzep-tierbar; p < 0.01 ist super.

    Fold Change Treshold

    • beliebiges Signifikanzniveau bestimmen (z.B.|log2(FC)| > 1)

    • empirisches Vorgehen: Niveau so wählen, dass ähnlicheDinge nicht signifikant unterschiedlich sind

    • Schätze die Verteilung zwischen beliebigen oder allenTeilmengen der negativen Kontrollen

    13

  • Multiples Testen: Das Problem mit dem p-Treshold ist,dass mit einem Signifikanzniveau von 0.05 eine Chance von5% auf ein falsch positives Resultat besteht. An sich istdas in Ordnung bei einem durchgeführten Test, wenn manden Test jedoch oft widerholt, steigt die Wahrscheinlich-keit auf einen falsch positiven Wert rasant an. Es gibt dreiMöglichkeiten dies zu Korrigieren.

    • Family-Wise Error Rate: Schützt gegen allefalschen Positive und ist somit sehr strikt. Bonferroni:Korrigiere den p-Wert mit der Anzahl Tests p ≤ αm ;Wahrscheinlichkeit min. 1 falsches Positiv zu erhalten= FWER = P (V ≥ 1)

    • False Discovery Rate (FDR) / Benjamini-Hochberg: Steuert die Anzahl falsch positiver Er-eignisse unter den abgelehnten Hypothesen. p-Wert >Korrigierter p-Wert der FDR, verwirft Hi wenn korri-giertes pi ≤ α; OK wenn Differenzen selten (π0 ≈ 1).

    • Positive False Discovery Rate / Storey-Tibshirani: Kontrolliert die Rate der falschen Ereig-nisse. Besser wenn Differenzen oft vorkommen (π0 < 1)

    0 signifikanteVeränderungen

    Datenqualität prüfen;niedrige p-Werte, hoherFC → Replikatanzahlerhöhen

    wenig signifikanteVeränderungen

    einfachster Fall → was istdie Identität der Marker?

    viele signifikanteVeränderungen; kein klaresRanking

    relativ häufig; schwierigHypothese aufzustellen;Kombination aus primärenund sekundären Effekten→ enrichment analysis

    8.3 Enrichment Analysis

    Wie erkennt man signifikant veränderte zelluläreProzesse? Ordne die gemessenen Eigenschaften in Unter-gruppen. Eigenschaften können dabei in mehreren Gruppengleichzeitig vorkommen. Sind bestimmte signifikante Eigen-schaften in einer gewissen Gruppe besonders häufig? →hotspot

    Damit kann man nun einen Fischer Exact Test machenund herausfinden, wie gross die Wahrscheinlichkeit ist die

    gleichen Resultate unter der Nullhypothese zu erhalten.

    8.3.1 Gen Set Enrichment Analysis (GSEA)

    1) entscheiden welche Vorzeichen einbezogen werden

    2) Vorgehen für 1 Pathway / Gruppe / Prozess1) sehr lockere Grenzen setzen (z.B. |log2(FC) >

    0.2 und p < 0.1)2) alle Ergebniss nach p-Wert (bevorzugt) oder

    log2(FC) ordnen3) contingency tables für 2, 3, 4, . . . alle besten Er-

    gebnisse erstellen4) jeweils p-Wert mit Fisher’s exact test berechnen5) niedrigsten p-Wert behalten = bestes enrichment

    3) für alle Pathways / Gruppen / Prozesse wiederholen4) FDR-Korrektur (Benjamini-Hochberg oder Storey)

    9 Feature Selection

    Das grundlegende Problem der Feature Selection in der Sys-tembiologie ist es, diejenigen Komponenten eines Systemszu finden, die einen bestimmten Output, Funktion oderPhänotyp beeinflussen. Gründe dafür sind um molekulareMechanismen des Phänotyps zu verstehen, die Dimensiondes Modells zu verringern und um allfälliges Rauschen zuentfernen. Ein Anwendungsbeispiel sind GWAS (siehe Vor-lesung Genetik, Genomik, Bioinformatik für Einzelheiten).

    9.1 Univariate Feature Selection

    Für jedes Feature j wird der Relevanz-Wert (score) r(j)berechnet. Anschliessend werden Features nach r(j) sortiertund als geordnete Liste zurückgeben. Limitationen sind:

    • nur Effekt eins Gens• ignoriert Korrelation zwischen Genen• ignoriert additive Effekte zwischen Genen• ignoriert Interaktionen zwischen Genen

    Univariate Feature Selection ignoriert den systembiologi-schen Charakter des Problems.

    9.1.1 Anzahl Features

    • Ein zufälliges Rausch-Feature z generieren. Alle Fea-tures mit r(j) > r(z) wählen.

    • Für jeden Zusammenhang zwischen Feature undPhänotyp einen p-Wert berechnen. Nur Features mitsignifikanten Zusammenhängen wählen.

    9.1.2 Multiples Testen

    Durch Zufall werden bei Tausenden getesteten Feature ei-nige mit fälschlicherweise signifikanten Zusammenhängendabei sein. Die Bonferroni-Korrektur kann diese Problemlösen, ist oft aber zu streng. Alternativen sind z.B. die FalseDiscovery Rate.

    14

  • 9.1.3 Instabilität

    Instabilität von Resultaten: Es werden verschieden Teilmen-ge eines Datensatzen getestet oder unterschiedliche Feature-Selection-Methoden verwendet. Die resultierenden Rangord-nungen können stark unterschiedlich voneinander sein. Umaus mehreren Resultaten ein möglichst gutes zu gewinnen,können folgende Strategien angewandt werden:

    • Durchschnittlichen Rang eines Gens über alle Experi-mente hinweg berechnen.

    • Die Wahrscheinlichkeit berechnen, dass ein Gen injedem Experiment unter den Top-k ist (z.B. mit Fis-her’s Inverse χ2 test)

    9.2 Multivariate Feature Selection

    9.2.1 Additive Models

    Methoden mit linearer Regression, die aus x eine Vorhersagefür y zu treffen versuchen. Features bekommen Gewichtun-gen in β. Relevante Features haben eine Gewichtung, dieungleich null ist. Je nach Formulierung des Modell, trifftdies aber auf sehr viele Features zu.

    arg minβ ||y −Xβ||22

    9.2.2 L1- und L2-Normen

    Die L2-Norm belohnt höhere Werte statt kleinere zu verrin-gern. Die L1-Norm belohnt beides gleich stark.

    9.2.3 Lasso Model

    Lösungen mit wenig relevanten Features werden bevorzugt.Bei Gruppen von korrelierten Features wird aber nur einesdavon ausgewählt.

    arg minβ ||y −Xβ||22 + γ1||β||1

    Die L1-Norm von β wird minimiert: ||β||1 =∑d

    i=1 |βi|

    9.2.4 Ridge Regression

    Lösungen in denen korrelierte Features ähnliche Gewich-tungen erhalten, werden bevorzugt. Die Lösung ist oft abernicht besonders spärlich.

    arg minβ ||y −Xβ||22 + γ2||β||

    22

    Die L2-Norm von β wird minimiert: ||β||2 =√∑d

    i=1 β2i

    9.2.5 Elastic Net

    Lösungen in denen Gruppen von korrelierten Featuresähnliche Gewichtungen haben und wenige Gewichtungenungleich null sind. Es müssen allerdings zwei Parametergesetzt werden.

    arg minβ ||y −Xβ||22 + γ1||β||1 + γ2||β||

    22

    Hier werden sowohl die L1- als auch die L2-Norm minimiert.

    9.2.6 Overfitting

    Stichprobenverzerrung resultiert in zu optimistischen Resul-taten. Feature Selection und Vorhersagen dürfen nicht mitdem selben Datenset gemacht werden. Man benutzt alsoeinen Trainings- und einen Test-Datensatz.

    10 Clustering

    Beim Clustering versucht man Gruppen von Datenpunktenzu bilden, welche einander ähnlich sind.

    10.1 Clustering-k means, Centroid based

    Jeder Cluster wird von einem Vektor / Punkt repräsentiert,welcher aber kein existierender Datenpunkt sein muss. Manordnet sie wie folgt:

    1) wähle k zufällige Cluster-Mittelpunkte2) ordne jeden Punkt dem nächsten Mittelpunkt zu3) berechne den neuen Mittelpunkt des Clusters4) wiederhole 2) und 3) bis sich nichts mehr ändert

    k muss vom Benutzer gefunden werden

    je nach Startpunkt können Ergebnisse unterschiedlich sein

    nicht-sphärische Cluster bereiten Probleme

    10.2 Graph-based Clustering

    Annahmen

    • Daten sind in Form eines Netzwerks / Graphen• jeder Punkt ist ein Objekt• Kanten verbinden verwandte Objekte• Gewichtung von Kanten repräsentiert die Entfernung

    zwischen Objekten

    Graphen stammen aus

    • Literatur über biologische Netzwerke• treshold distance matrix

    15

  • Vorgehen1) entferne alle Kanten, die schwerer gewichtet sind als

    eine bestimmte Vorgabe2) finde alle verbliebenen Punkte → Cluster

    10.3 DBSCAN

    Rausch-resistente Variante von Graphen-basiertem Cluste-ring: Density Based Spatial Clustering of Applicati-ons with Noise. Dabei gibt es drei Arten von Punkten:

    • core object : Punkt mit Mindestanzahl (MinPt) vonPunkten in Entfernung Epsilon

    • border point : innerhalb Epsilon eines core objects• noise: restliche Punkte

    Algorithmus1) wähle noch nicht zugewiesenen Punkt2) ist er ein core object, erstelle ein neues Cluster, sonst

    markiere ihn als noise3) füge seine Nachbarn zum selben Cluster hinzu4) kontrolliere jeden Nachbarn, ob er ein core object ist

    1) wenn ja, füge seine Nachbarn zum selben Clusterhinzu und wiederhole 4) für diese

    2) falls nein, Cluster nicht weiter wachsen lassen5) kehre zu 1) zurück, bis alle Punkte erfasst wurden

    Vorteile Nachteile

    kein k benötigt zwei Parameter müssengewählt werden

    Cluster, die k-means nichtfindet

    Initialisierungs-abhängigeResultate

    robuster gegenüberRauschen

    bei variierender Dichte(häufig beihochdimensionalenDatensätzen) werden vieleCluster nicht gefunden

    10.4 Hierarchical Clustering

    In den anderen Methoden sind Cluster einander gleichge-stellt. Mit dieser Methode clustert man kleinere Clusterimmer wieder zu grösseren Clustern. Man Beginnt mit je-dem Datenpunkt als Cluster und beendet den Prozess, wennnur noch ein grosses Cluster übrig ist.

    Vorteile mehr Einsicht in die Struktur der Daten

    Nachteil für weitere Verwendung braucht man meistgleichgestellte Cluster

    11 Clustering Applications

    Clustering von samples (verschiedene Mutanten, Bedingun-gen, Behandlungen) über features hinweg erlaubt es, Zell-typen oder Ähnlichkeiten in (intrazellulären) dynamischenAntworten zu identifizieren. Z.B. Timing von Ereignissen,konservierte Antworten auf Medikamente, Proteinkomplexeaus phänotypischen Antworten in knock-outs.Clustering von features (Gene, Metaboliten, Proteine) übersamples hinweg erlaubt es, korrelierte features zu finden undist oft mit enrichment analysis verbunden.Co-clustering wird zur Rauschreduktion verwendet.

    11.1 Dimensionsreduktion

    In grossen Datensätzen (viele Features = viele Dimensionen)will man die Anzahl Dimensionen reduzieren, ohne dabeiInformationen über die Ähnlichkeit von Samples zu verlie-ren. Dabei versucht man z.B. Redundanzen und Rauschenzu entfernen. Weniger Dimensionen sind nützlich zur Visua-lisierung, Qualitätskontrolle und Verarbeitung von Datenbevor andere Methoden benutzt werden.

    11.2 Principal Component Analysis (PCA)

    Die PCA versucht PCs in multidimensionalen Daten zufinden. PCs sind lineare, orthonormale Kombinationen derursprünglichen Dimensionen. Sie werden dabei nacheinan-der so bestimmt, dass die Varianz entlang der Projektionjeweils maximal ist. Eigenwerte sind die Varianz der Punkteprojeziert auf jede einzelne Komponente.

    Typische Kriterien um die Anzahl der zu behaltenden Kom-ponenten zu bestimmen sind

    • k Komponenten erklären einen bestimmten prozentua-len Anteil der Varianz (z.B. 75%)

    • k Eigenwerte sind über dem durchschnittlichen Eigen-wert

    • Wo ist der letzte grosse Sprung im Scree-Plot (siehe11.2.2)?

    16

  • 11.2.1 Bi Plot

    • nahegelegene Samples haben ähnliche Profile• nahegelegene Features korrelieren• Samples nahe an einem Feature haben alle hohe Levels

    des selben Features• Samples gegenüber des Features haben geringe Levels

    davon

    11.2.2 Scree Plot

    11.3 Recap

    • Gruppen unbekannt

    – Clustering– Dimensionsreduktion → visuelle Inspektion

    • Gruppen bekannt

    – Feature selection

    ∗ univariate∗ multivariate

    12 Link Prediction

    Was ist link prediction (collaborative filtering)? Beieinem gegebenen Netzwerk will man fehlenden Kanten her-vorsagen, z.B. um herauszufinden, welcher Transkriptions-faktor welches Gen beeinflusst. Man brauch dazu Gen-Expressions-Daten, eine bekannte Netzwerkstruktur undeine Gen- / Protein-Sequenz.

    Unsupervised link prediction: Nicht auf das Lernen ausBeispielen ausgelegt, sondern auf vordefinierten Regeln.Supervised link prediction: Man basiert das Wissen aufbekannten Beispielen (Komponenten die interagieren odernicht interagieren).

    12.1 Similarity-Based Approach

    Setze Kante zwischen Genen a und b, wenn ihreÄhnlichkeit s(a, b) über einem bestimmten Wert θ liegt.

    Vorteile Nachteile

    einfach umzusetzen man muss θ setzen

    skaliert zu grossenNetzwerken

    Ähnlichkeit muss nicht =Interaktion sein

    Typische similarity measures in link prediction sind:

    • Pearsons correlation coefficient• Mutual Information• String kernels that count common subsequences intwo protein sequences (k-mers)

    • Number of shared neighbors

    12.2 Cluster-Based Learning

    Wenn a und b im selben Cluster liegen, sagt man eine Kantevoraus.

    Vorteile Nachteile

    allgemeiner als similaritybased pairs

    wie realistisch hängt vonGüte der Cluster ab

    12.3 Latent Group Models

    Das Ziel ist es Interaktionen zwischen Genen herzuleiten.Als erstes kommt die Trainingsphase:

    1) wähle eine Grupps S von Genen2) cluster die Gene von S in k verschiedene Gruppen

    aufgrund der Expressionsprofile3) Für jedes Paar Cluster i und j bestimme die empirische

    Interaktionswahrscheinlichkeit pijNun will man eine Voraussage für zwei Gene machen:

    5) gegeben ist ein Paar Gene a und b6) weise a und b den ähnlichsten Cluster Ca und Cb zu7) finde die Interaktionswarscheinlichkeit pa,b von der

    Trainingsphase.Hängt von einem Set von latenten oder versteckten Eigen-schaften ab, während cluster-based link prediction nur voneiner latenten Variable abhängig ist.

    12.4 Matrix Factorization

    Ra,b =

    h∑

    i=1

    Ua,iVi,b

    Da nicht alle Interaktionen in R bekannt sind, zerlegt mandie Matrix um die restichen Werte vorauszusagen.

    17

  • 12.5 Kernel approaches: Similarity-based classification

    Für manche Genpaare ist bekannt, dass sie interagieren undfür andere das sie nicht interagieren. Wenn man nun einGenpaar hat, über das nichts bekannt ist, versucht man siemit anderen zu vergleichen und aufgrund der Ähnlichkeitvorherzusagen, wie sie interagieren. Kernel ist dabei eineÄhnichkeitsfunktion.

    Tensor pairwise kernel bestimmt die Ähnlichkeit derbeiden Knotenpaare bezüglich ihrer Kanten in beide Rich-tungen.

    ktensor((a, b), (c, d)) =knodes(a, c)knodes(a, c)

    +knodes(a, d)knodes(b, c)

    Metric learning pairwise kernel: ϕ(g) ist ein Vektor,der die Eigenschaften vom Gen/Protein g beschreibt.

    kml((a, b), (c, d)) =[(ϕ(a)− ϕ(b))T (ϕ(c)− ϕ(d))

    ]

    Das Paar (a, b) ist ähnlich zu (c, d), wenn a− b ähnlich zuc− d oder d− c ist.

    Negativ Kontrollen gut zu wählen ist schwierig. Diehäufigste Strategie ist es Proteine von anderen Zellkom-partimenten auszuwählen. Oft ist das aber eine zu grosseVereinfachung. Eine andere Strategie ist es, die positivenund negativen Kontrollen gleich zu gewichten, was jedochzu einem zu pessimistischen Resultat führt.

    12.6 Regression-based

    Sage den Zustand eines Gens voraus, wenn alle anderenGene gegeben sind. Jedes Gen ist durch einen Vektor re-präsentiert (mit Expressionswerten). Man macht dann eineRegression. Meistens wird LASSO für die Regression be-nutzt, was die Annahme unterstützt, dass ein Gen jeweilsnur mit einem kleinen Set von anderen Genen interagiert.

    true (R) vs. predicted label (R∗) R = 1 R = −1

    R∗ = 1 TP FPR∗ = −1 FN TN

    P N

    accuracy =TP + TN

    TP + FP + FN + TN

    Welcher Anteil an Vorhersagen ist korrekt?

    • sensitivity / recall / true positive rate: = TPP .Wie hoch ist die Rate an positiven Beispielen, die derclassifier fand?

    • specificity = TNN• false positive rate = FPN = 1− specificity

    • precision = TPTP+FP . Welcher Anteil an positivenVorhersagen ist korrekt?

    Receiver operating characteristic (ROC)

    AUC = Area under the ROC curve → Ist die Wahrschein-lichkeit das positive Sample zu finden, wenn es mit einempositiven und einem negativen Beispiel konfrontiert ist. Pit-fall: Auch mit einem sehr hohen AUC ist der Classifierziemlich unnötig, wenn eine Klasse viel grösser ist als dieandere. Dann muss man sich die Presicion/Recall Kurveanschauen.

    Beispiel: We perform link prediciton for 102 pairs of nodes.For 2 pairs, a link actually exists. They are ranked in the11th and 12th position of the solution.

    AUC/ROC is misleading here and looks much better thanthe precision-recall curve.

    18

  • 13 Biological Networks

    • Gene regulatory networksTranskriptionsfaktor-Gen-Interaktionen

    • Protein-protein interaction networksProtein-Protein-Interaktionen

    • Phosphorylation networksKinase/Phosphatase-Ziel-Interaktionen

    • Metabolic networksEnzym-Metabolit-Interaktionen

    13.1 Rekonstruktion von biologischen Netzwerken

    Experimentell kann nur ein kleiner Teil aller möglichenInteraktionen untersucht werden, da Ressourcen limitiertund Interaktionen dynamisch sind als auch Methoden sichüberschneidende Resultate liefern. Trotzdem sind experimen-telle Methoden weiterhin wichtig um die Basis zu legen. Re-chengestüzte Methoden werden zur Hilfe genommen um dasNetzwerk mit link prediction zu erweitern und überprüfen alsauch um aus bekannten Interaktionen diejenigen zu finden,welche aktiv und wichtig für den Phänotyp sind.

    13.1.1 Probleme von Vorhersagemethoden

    • Schlecht darin, kurzanhaltende Interaktionen und In-teraktionen mit schlecht untersuchten Interaktions-partnern vorherzusagen.

    • Wenn eine Methode Training benötigt, kann sie einbias für den Trainingsdatensatz erhalten.

    13.1.2 Mehrere Methoden

    Die Analyse von verfügbaren Methoden zeigt, dass jedeFamilie von Methoden bestimmte Zusammenhänge besservorhersagt als andere. Es ist also stets besser, Methodenaus verschiedenen Familien zu kombinieren.

    13.2 Nutzen von Netzwerken

    • Funktion und Organisation entdecken• durch differenzielle Analyse dynamische oder konser-vierte Module finden

    • Netzwerke unterstützen Dateninterpretation

    13.2.1 Effekte von Medikamenten

    Ein grosses Problem in der Suche nach neuen Medikamentenist, dass bei der Zugabe eines Stoffes zu einer Zelle Hunder-te bis Tausende Genprodukte direkt oder indirekt auf dieVeränderungen reagieren. Eine mögliche Herangehensweiseum die direkten Effekte rauszufiltern sieht wie folgt aus:

    1) Zelle auf verschiedene Arten behandeln2) RNA-Expression für jede Behandlung messen3) Netzwerkmodell erstellen4) Zelle mit Medikament behandeln5) RNA-Expression messen6) Daten mithilfe des Modells filtern → nur direkte Ziele

    des Medikaments bleiben übrig.

    13.2.2 Krebs-Kategorisierung

    Viele Krebsarten haben mehrere Unterarten mit verschie-denen Ursachen und Folgen. Tumor-Genome sind wichti-ge Informationsquelle, sind aber schwierig zu vergleichen,da zwei Tumore selten die selben Mutationen haben. Mitnetwork-based stratification (NBS) können Tumor-Genomemit Gennetzwerken integriert werden. Dies erlaubt die iden-tifizierung von Unterarten durch clustering von Mutationenin ähnlichen Netzwerkregionen. Mithilfe des Modells könnenfür jede Unterart mRNA-Expressionssignaturen erstellt wer-den.

    19

    EinführungModellierung von EnzymreaktionenModellierung von StoffwechselwegenRegulation von StoffwechselwegenAnalyse von metabolischen Netzwerken durch Flux Balance AnalysisModellierung von SignaltransduktionswegenAnalysis of omics dataFeature SelectionClusteringClustering ApplicationsLink PredictionBiological Networks