19
Zusammenfassung Systembiologie - FS18 v1.3 Madlaina Mettier, Gleb Ebert 10. August 2018 Vorwort Diese Zusammenfassung enth¨ ahlt wenn verf¨ ugbar alle Lernziele und passende Beispielaufgaben der Vorlesung Systembiologie (Stand FS18). Lernziele bzw. Aufgaben sind jeweils in fett geschrieben. Antworten bzw. L¨ osungen folgen direkt danach in normaler Schrift. Bei fehlenden Lernzielen wurden die wichtigsten Konzepte und Beispiele aus den Vorlesungsfolien zusammengefasst. Die Nummern der Kapitel entsprechen den Vorlesungswochen. Kapitel 5 entspricht dabei den Wochen 5 und 6. Wir k¨ onnen leider weder Vollst¨ andigkeit noch die Abwesenheit von Fehlern garantieren. Insbesondere unsere L¨ osungen der Aufgaben wurden nach besten Wissen und Gewissen erstellt und m¨ ussen nicht in dieser Form korrekt sein. F¨ ur Fragen, Anregungen oder Verbesserungsvor- schl¨ agen k¨ onnen wir unter [email protected] erreicht werden. Die neuste Version dieser Zusammenfassung kann stets unter https://n.ethz.ch/ ~ glebert/ gefunden werden. Inhaltsverzeichnis 1 Einf¨ uhrung 2 2 Modellierung von Enzymreaktionen 3 3 Modellierung von Stoffwechselwegen 5 4 Regulation von Stoffwechselwegen 7 5 Analyse von metabolischen Netzwerken durch Flux Balance Analysis 8 7 Modellierung von Signaltransduktionswegen 11 8 Analysis of omics data 13 9 Feature Selection 14 10 Clustering 15 11 Clustering Applications 16 12 Link Prediction 17 13 Biological Networks 19 1

Zusammenfassung Systembiologie - FS18glebert/download/systembiologie/...Zusammenfassung Systembiologie - FS18 v1.3 MadlainaMettier,GlebEbert 10.August2018 Vorwort Diese Zusammenfassung

  • Upload
    others

  • View
    6

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Zusammenfassung Systembiologie - FS18glebert/download/systembiologie/...Zusammenfassung Systembiologie - FS18 v1.3 MadlainaMettier,GlebEbert 10.August2018 Vorwort Diese Zusammenfassung

Zusammenfassung Systembiologie - FS18v1.3

Madlaina Mettier, Gleb Ebert

10. August 2018

Vorwort

Diese Zusammenfassung enthahlt wenn verfugbar alle Lernziele und passende Beispielaufgaben derVorlesung Systembiologie (Stand FS18). Lernziele bzw. Aufgaben sind jeweils in fett geschrieben.Antworten bzw. Losungen folgen direkt danach in normaler Schrift. Bei fehlenden Lernzielenwurden die wichtigsten Konzepte und Beispiele aus den Vorlesungsfolien zusammengefasst. DieNummern der Kapitel entsprechen den Vorlesungswochen. Kapitel 5 entspricht dabei den Wochen5 und 6. Wir konnen leider weder Vollstandigkeit noch die Abwesenheit von Fehlern garantieren.Insbesondere unsere Losungen der Aufgaben wurden nach besten Wissen und Gewissen erstelltund mussen nicht in dieser Form korrekt sein. Fur Fragen, Anregungen oder Verbesserungsvor-schlagen konnen wir unter [email protected] erreicht werden. Die neuste Version dieserZusammenfassung kann stets unter https://n.ethz.ch/~glebert/ gefunden werden.

Inhaltsverzeichnis

1 Einfuhrung 2

2 Modellierung von Enzymreaktionen 3

3 Modellierung von Stoffwechselwegen 5

4 Regulation von Stoffwechselwegen 7

5 Analyse von metabolischen Netzwerken durch Flux Balance Analysis 8

7 Modellierung von Signaltransduktionswegen 11

8 Analysis of omics data 13

9 Feature Selection 14

10 Clustering 15

11 Clustering Applications 16

12 Link Prediction 17

13 Biological Networks 19

1

Page 2: Zusammenfassung Systembiologie - FS18glebert/download/systembiologie/...Zusammenfassung Systembiologie - FS18 v1.3 MadlainaMettier,GlebEbert 10.August2018 Vorwort Diese Zusammenfassung

1 Einfuhrung

1.1 Lernziele

Limitationen des traditionellen molekularbiologi-schen Ansatzes anhand von Beispielen aufzeigen.Vom Human Genome Project hatte man sich erhofft, al-len Genen eine Funktion zuordnen zu konnen. Es gibt aberviel mehr zellulare Funktionen als Gene. Um das Systemzu verstehen, muss man die einzelnen Komponenten, ihreInteraktionen und wie eine Veranderung sich auf das Systemauswirkt verstehen.

Den Ansatz und die Ziele der Systembiologie be-schreiben und Beispiele fur Fragestellungen nennen,mit denen sich die Systembiologie beschaftigt. In derSystembiologie versucht man mithilfe computergestutztermathematischer Modelle zu verstehen, wie das funktionie-rende Zusammenwirken der molekularen Komponenten zudem Verhalten und den Eigenschaften fuhrt, die biologischeSysteme zeigen.

Sie konnen Faktoren nennen, die zur Komplexitatbiologischer Systeme beitragen. Die Komplexitat wirdschnell zu hoch wenn verschieden Prozesse und Regel-mechanismen wie Genexpression, Signalverarbeitung undRuckkopplung ineinander greifen. Dabei hat man oft einefast unendliche Menge Daten und Moglichkeiten diese zuverknupfen.

An Beispielen aufzeigen, warum Modelle nutzlichsind, um biologische Fragestellungen zu beantwor-ten, die man nicht allein durch Intuition losen kann.An einem Beispiel erklaren, wie man bei einer Sys-temanalyse grundsatzlich vorgeht. Mogliche Fragestel-lungen sind die Systemanalyse eines genregulatorischen Mo-dells oder Michaelis-Menten-Kinetik. Misst man z.B. dieExpression eines Gens in Populationen mit unterschiedlichgrossen Aminosaurevorraten, muss bedacht werden, dassZellen mit mehr AS grosser wachsen konnten und die Ex-pressionsprodukte so verdunnter waren.

Ausgehend von einem Schema eines Reaktions-oder Pathway-Systems, die Geschwindigkeitsgeset-ze aufstellen, die dieses System beschreiben (Ver-tiefung in Woche 2).

A+Bk−→ C

d[A]

dt= −k[A][B]

d[B]

dt= −k[A][B]

d[C]

dt= +k[A][B]

Die Annahmen nennen, die beim Massenwirkungs-gesetz getroffen werden. Gleichgewicht, reversible Reak-tion, konstante Temperatur, kein Katalysator

Ausgehend von den Elementarreaktionen ei-ner Enzym-katalysierten Reaktion die Michaelis-Menten-Gleichung und ahnliche Gleichungen ein-facher Enzymkinetiken herleiten und angeben,welche Annahmen man dabei trifft. Vereinfachun-gen: Produkt wird in irreversibler Reaktion hergestellt;[E]total = [E] + [ES], [ES] ist konstant

E + Sk1−−⇀↽−−k−1

E ∗ Sk2−→ E + P

d[S]

dt= −k1[E][S] + k−1[E ∗ S]

. . .

v =vmax[S]

Km + [S]mit vmax = kcat[E]

Km =k−1 + k2

k1

Fur jeden Parameter der Michaelis-Menten-Gleichung beschreiben, wofur dieser inhaltlichsteht und wie sich der Kurvenverlauf qualitativverandert, wenn dieser Parameter verandert wird.vmax: maximale Reaktionsrate → vmax ↑ ⇒ hohere Ober-grenze; KM : Affinitat des Enzym-Substrat-Komplexes (Sub-stratkonzentration bei 50% vmax) → KM ↑ ⇒ Kurve flacher

Andere Beispiele neben der Enzymkinetik nen-nen, auf die die Michaelis-Menten-Gleichungubertragbar ist und wissen die Parameter der Glei-chung inhaltlich zuzuordnen. Bindung eines Trankrip-tionsfaktors T an eine DNA-Sequenz G: [T ] entspricht derSubstratkonzentration; K gibt Affinitat von T an G an

[G ∗ T ] =[G]T ∗ [T ]

[T ] +K

1.2 Beispielaufgaben

1.2.1

Die irreversible Reaktion S → P wird vom EnzymE mit dem katalytischen Koeffizienten kcat (1 s−1)und der Substrataffinitat KM (1 mM) katalysiert.Die Reaktion folgt einer Michaelis-Menten-Kinetik.(a) Welche Gleichung beschreibt die Reaktionsra-

te v als Funktion der Substrat- [S] und Enzym-konzentration [E]?

(b) Berechnen Sie die Reaktionsrate (in mM s−1)fur die Konzentrationen [E] = 3mM und [S] =2mM.

(c) Zeichnen sie schematisch einen v-s-Plot mitdem Kurvenverlauf und geben Sie die Positi-on von Km und vmax an.

(a) v = vmax[S]Km+[S] =

kcat[E][S]Km+[S]

(b) v = 1 s−1∗3mM∗2mM

1mM+2mM = 6mM2 s−1

3mM = 2mMs−1

(c)

2

Page 3: Zusammenfassung Systembiologie - FS18glebert/download/systembiologie/...Zusammenfassung Systembiologie - FS18 v1.3 MadlainaMettier,GlebEbert 10.August2018 Vorwort Diese Zusammenfassung

1.2.2

Formulieren Sie die Geschwindigkeitsgesetze fur dasProteinsystem in dem Signalweg, der in der folgen-den Abbildung dargestellt ist. Tipp: ModellierenSie jeden Prozess als das Produkt einer Geschwin-digkeitskonstante und der Konzentration der betei-ligten Variable(n).

d[P0]

dt= −kα0

[P0] + kβ1[P1]

d[P1]

dt= −kα1 [P1]− kβ1 [P1] + kα0 [P0] + kβ2 [P2]

d[P2]

dt= −kβ2

[P2] + kα1[P1]

2 Modellierung von Enzymreaktionen

2.1 Lernziele

Den allgemeinen Arbeitsablauf beim Aufstellen ei-nes Modells beschreiben.

Die Rolle der Auswahl einer angemessenen Zeit-und Grossenskala bei dem Aufstellen eines Modellserklaren. Man muss die Zeit und Grosse das Modellorga-nismus oder Modelles allgemein der Fragestellung anpas-sen. Z.B. sind fur geologische Prozesse Jahrhunderte notigwahrend fur Diffusion in einer Zelle Sekunden ausreichen.

Die Unterschiede zwischen dynamischen und sta-tischen Modellen erklaren und fur eine gegebe-ne Fragestellung eine geeignete Modellwahl tref-fen. Dynamische Modelle verwendet man, wenn zeitlicheVeranderungen bei dem modellierten Prozess eine Rolle spie-len. Fur die Beantwortung zeitunabhangiger Fragestellungeneignen sich statische Modelle.

Den Begriff steady state definieren und biologischeBeispiele fur steady-state-Bedingungen nennen. DasSystem befindet sich im GGW-Zustand, wenn sich die Kon-zentrationen der Metaboliten nicht verandern. Die Ein- undAusflusse eines Metaboliten halten sich die Waage.

Die Vorteile der Annahme eines steady states beider mathematischen Modellierung erklaren. Er isteine mathematische Vereinfachung, weil man durch die zeit-liche Konstanz Gleichungssysteme statt Differentialgleichun-gen aufstellen kann.

Die Begriffe Konstante, Parameter, Variable, Zu-standsgrosse (state variable) und Systemzustand(system state) definieren. Konstante: GleichbleibendeZahl Zustandsgrosse: Grossen die den Zustand biologi-scher Objekte wie Gene, Zellen oder Molekule als auchdas Verhalten des Modells beschreiben. Variable: Wertveranderlich und hangt von anderen Komponenten des Mo-dells ab. Parameter: Durch abschatzen, Literatur oder Ex-perimente festgelegte Werte (z.B. KM ). Systemzustand:Der Zustand des Systems zu einem spezifischen Zeitpunkt t,zu dem alle Werte bekannt sind.

Die ODE-Modelle fur die elementaren Reaktionenaufstellen, die man in einem biochemischen Netz-werk findet, und kennen deren Losung fur einzelneReaktionsschritte.Konstante Produktion

k1−→ A

d[A]

dt= k1 ⇒ [A] = [A]0 + k1 ∗ t

Linearer Abbau

Ak1−→

d[A]

dt= −k1[A] ⇒

d[A]

[A]= −k1 ∗ dt

∫ [A]

[A]0

d[A]

[A]= −k1

∫ t

0

dt = [A] = [A]0 ∗ e−k1∗t

t1/2 =ln(2)

k1

3

Page 4: Zusammenfassung Systembiologie - FS18glebert/download/systembiologie/...Zusammenfassung Systembiologie - FS18 v1.3 MadlainaMettier,GlebEbert 10.August2018 Vorwort Diese Zusammenfassung

Autokatalyse

k1∗[A]−−−−→ A

[A] = [A]0 ∗ ek1∗t t1/2 =

ln(2)

k1

Dimerisierung

A+Bk1−→ A ∗B

[A] = [A]0 − [A ∗B] [B] = [B]0 − [A ∗B]

d[A]

dt=

d[B]

dt= −k1[A][B]

d[A ∗B]

dt= k1[A][B]

[A ∗B] =[A]0[B]0(1− e−k1t([A]0−[B]0))

[A]0 − [B]0e−k1t([A]0−[B]0)

Reversible Dimerisierung

A+Bk1−−⇀↽−−k−1

A ∗B

[A ∗B]SS =k1k−1

KD =k−1

k1

d[A ∗B]

dt= +k1[A][B]− k−1[A ∗B] = 0

Produktion und Degradation

k1u−−→Ak2−→ [A]SS =

k1 ∗ u

k2d[A]

dt= +k1 ∗ u− k2[A] [A] =

k1 ∗ u

k2

(1− e−k2∗t

)

Ausgehend von einem Schema eines mehrschrit-tigen Reaktions- oder Pathway-Systems die Ge-schwindigkeitsgesetze aufstellen, die dieses Systembeschreiben. Die Konzentrationsveranderung uber Zeitsetzt sich immer aus allen Zu- und Abflussen zusammen.

z.B.d[A]

dt= k1 ∗ u− k2[A] oder [A]SS =

k1 ∗ u

k2

Erklaren, wie sich die Reaktionsgeschwindigkeit inAbhangigkeit der Substratkonzentration zwischenEnzymen, die der Michaelis-Menten-Kinetik folgen,und Enzymen, die Substratinhibition zeigen, unter-scheidet und die Kurvenverlaufe qualitativ aufzeich-nen.

Anhand einer Zeichnung erklaren, wie sichdie steady-state-Konzentration schalterartig mitVeranderung einer Kinetik (z.B. durch Anderungder externen Substratkonzentration) andern kann.Wo befinden sich die steady states?

Substratinhibition v([S]) = vmax[S]

[S]+KM+[S]2

KI

Transport vTrans.([Sext], [S]) = D([S]ext − [S])

Schnittpunkte der schwarzen und roten Linien sind steady

states. Die schwarze Linie beschreibt die Substratinhibition.

2.2 Beispielaufgaben

2.2.1

Sie mochten die ersten 5 Minuten der Stoffwechsel-reaktion von Leberzellen auf die Zugabe von Inhibi-toren der Glykolyse vorhersagen. Dazu entwickelnSie ein Modell welches Sie mit der Reaktion aufeinen bekannten Inhibitor trainieren.(a) Welche Art von Modell brauchen Sie fur diese

Aufgabe?(b) Welche Informationen und welche Daten brau-

chen Sie dafur?(c) Beschreiben Sie kurz wie Sie das Problem an-

gehen, wie Sie das Modell entwickeln werden,und was Ihr Vorgehen ist falls das Modell dieDaten nicht beschreiben kann.

(a) dynamisch(b) beteiligte Reaktionen, kinetische Parameter, Anfangs-

konzentrationen(c) spezifische Frage, Modell auf Robustheit prufen, Dyna-

mik validieren, mogliche Verhalten vorhersagen, Mo-dell implementieren, Hypothese testen; allfallige Ab-weichungen erklaren und Modell ggf. anpassen

4

Page 5: Zusammenfassung Systembiologie - FS18glebert/download/systembiologie/...Zusammenfassung Systembiologie - FS18 v1.3 MadlainaMettier,GlebEbert 10.August2018 Vorwort Diese Zusammenfassung

2.2.2

Ein Systembiologe mochte die Ausbreitung einer an-steckenden Krankheit modellieren, um die Anzahlvon Individuen in einer Population abzuschatzen,die mit der Krankheit infiziert sind (I), empfanglichfur eine Infektion sind (S) und resistent gegen dieKrankheit sind, nachdem sie von ihr genesen sind(R). Er hat ein Modell aufgestellt, angemesseneWerte fur die Parameter angenommen und den Ver-lauf der Grossen I, S und R uber die Zeit grafischdargestellt.(a) Hat der Systembiologe ein statisches oder dy-

namisches Modell gewahlt? Begrunden Sie ih-re Antwort.

(b) Fur welchen Zeitraum eignet sich die Annah-me eines steady states? Markieren Sie diesenin der Zeichnung.

(c) Was ist der Vorteil einer steady-state-Annahme fur die Modellierung eines Systems?

(d) Werden sich fur die Variablen I, S und R,unabhangig von den Annahmewerten fur dieModellparameter, immer die im Diagrammoben gezeigten steady-state-Werte einstellen?Begrunden Sie Ihre Antwort.

(a) dynamisch, da Zeitdimension berucksichtigt wird(b) ab ∼ 75 auf Zeitskala(c) mathematisch einfacher und damit weniger rechenin-

tensiv(d) nein, z.B. oszillierend wenn Resistenz nur kurz anhal-

tend

2.2.3

Ein Substrat S wird mit der Rate vD von der Zel-le uber die Plasmamembran aufgenommen und ineinem irreversiblen metabolischen Pathway weiter-verwendet. Die Kinetik des ersten Enzyms des Pa-thways ist in der folgenden Abbildung gezeigt. DasSystem sei immer im steady state.(a) Um welche Art von Kinetik handelt es sich bei

dem Enzym?(b) Die Aufnahmegeschwindigkeit in die Zelle

vD sei gegeben durch die Gleichung vD =D([Sextern] − [S]), wobei D = 1s−1 eine Diffusi-onskonstante und [Sextern] die Substratkonzen-tration ausserhalb der Zelle ist. Zeichnen SievD als Funktion von [S], wenn Sextern = 4mMin das Diagramm ein.

(c) Begrunden Sie, warum die interne Substrat-konzentration bei (b) im steady state [S] <1mM sein muss.

(d) Schatzen Sie ab, welche interne Substratkon-zentration sich fur [S]extern = 6mM einstellenwird. Zeigen Sie auch dies zeichnerisch.

(a) Substratinhibition(b) vD = D([Sextern]− [S]) = D[Sextern]−D[S]

= 1s−14mM − 1s−1[S] = −1s−1[S] + 4mMs−1

y = ax+ b⇒ Gerade von (0, 4) zu (4, 0)

(c) Schnittpunkt von vD([S]) mit Enzymkinetik ist< 1mMs−1 bzw. ab 1mM wird Enzym inhibiert

(d) [S] ≈ 5mM ; Gerade von (0, 6) zu (6, 0)

3 Modellierung von Stoffwechselwegen

3.1 Lernziele

Anhand von Beispielen Probleme aufzei-gen, die in biologischen Pathways ohneRuckkopplungsmechanismen entstehen konnen unddaraus die Notwendigkeit fur solche Mechanismenerklaren.Der Input steigt in folgendem Pathway plotzlich um das

sechsfache an: → AE1−−→. E1 kommt nicht mit, [A] steigt

unbegrenzt an und fuhrt zu einem overshoot. Flusse ineinem biologischen Pathway mussen regulierbar sein, umungewollte Verhaltensweisen wie overshoots zu verhindern.

Erklaren, welche Funktionen negative und positiveFeedbacksysteme in Pathways innehaben.

Durch negative Feedbacksysteme stellt sich schnell ein be-stimmter Gleichgewichtszustand ein. Durch positive Feed-backsysteme konnen kontinuierliche Inputsignalen in ver-schiedene diskrete Gleichgewichtszustande uberfuhrt wer-den.

5

Page 6: Zusammenfassung Systembiologie - FS18glebert/download/systembiologie/...Zusammenfassung Systembiologie - FS18 v1.3 MadlainaMettier,GlebEbert 10.August2018 Vorwort Diese Zusammenfassung

An einem Beispiel erklaren, wie ein Systemnur aufgrund eines dynamischen Prozesses eineGedachtnisfunktion zeigen kann.

Bei genau derselben externen Konzentration konnen sichzwei verschiedene steady states einstellen, wobei es von deraktuellen internen Substratkonzentation abhangt, welcherGleichgewichtszustand erreicht wird. Der mittlere Schnitt-punkt ist kein stabiler steady state.

Herausforderungen nennen, die in birektionalenbiologischen Pathways (z.B. Glykolyse und Gluco-neogenese) entstehen und die Notwendigkeit furFeedback-Mechanismen in solchen Pathways aufzei-gen.

1) Damit die Richtung schnell gewechselt werden kann,mussen zu allen Zeiten bestimmte Mindestmengen vonEnzymen und Cofaktoren vorhanden sein.

2) Sind gleichzeitig entgegengesetzte Reaktionen am lau-fen, verandert sich trotz hohen Energieaufwand wenigan der totalen Konzentration (futile cycles). Regulati-onsmechanismen verhindern dies.

Erklaren, warum die moglichst gute Abschatzungder Parameterwerte beim Modellieren wichtig ist.

Konzeptionell beschreiben, wie man die Qualitat ei-nes Parameterwertes bestimmt.Man simuliert das System fur verschiedene Parameterwerteund vergleicht die Resultate mit Messungen. Die Differenzsollte klein genug sein, dass sie bei angemessenem Signifi-kanzniveau auf Zufall zuruckfuhrbar ist.

Fur eine gegebene Fragestellung zu den Kursthe-men in Form eines kurzen Skripts in Pseudocodezeigen, wie man bei der Beantwortung vorgehenwurde (kursubergreifendes Lernziel).Universelle Schlusselworter wie IF, ELSE, DO oder FOR miteinfach verstandlichem Englisch oder Deutsch kombinieren.Der genaue Syntax ist unwichtig, solange die Funktionsweiseverstandlich ist.

3.2 Beispielaufgaben

3.2.1

Im Stoffwechselweg A → B → C gibt es eine Feed-backhemmung von C auf das erste Enzym, welchesdie Umwandlung von A zu B katalysiert. NennenSie 2 Grunde, wieso dieses Feedback fur die Zellenotwendig sein konnte.

• kein Ressourcenverbrauch wenn genug C• B oder C evtl. toxisch in grossen Mengen

3.2.2

Sie konstruieren einen synthetischen Stoffwechsel-weg zu einem biotechnologischen Produkt mit meh-reren Enzymen, die sich alle durch Michaelis-Menten-Kinetik beschreiben lassen. Dieser Stoff-wechselweg wird ohne Regulationsmechanismen inein Bakterium eingebaut.(a) Wahrend des Produktionsprozesses verdop-

pelt sich der Zuckerfluss in das Bakteriumschlagartig. Nennen Sie 2 mogliche Konse-quenzen, die diese dynamische Veranderungfur ihren synthetischen Stoffwechselweg habenkonnte.

(b) Zu welchen konkreten Zellstoffwechselproble-men konnten diese Konsequenzen fuhren?Nennen Sie 3 Beispiele.

(c) Wie konnten Sie diese Probleme verhindern?(a) • ganzer Pathway schneller

• Uberproduktion eines Intermediats(b) • futile cycles

• zu viel eines toxischen Intermediats• substrate accelerated death

(c) Feedbackmechanismen

6

Page 7: Zusammenfassung Systembiologie - FS18glebert/download/systembiologie/...Zusammenfassung Systembiologie - FS18 v1.3 MadlainaMettier,GlebEbert 10.August2018 Vorwort Diese Zusammenfassung

3.2.3

In einem Stoffwechselweg wie im Bild unten wirdder Fluss v1 durch das Endprodukt Y inhibiert;Fluss v3 reprasentiert den zellularen Bedarf an Y .

(a) Welche Funktionen haben negative Feedback-systeme im Allgemeinen?

(b) Welche Aussagen konnen Sie uber die Konzen-tration von Y machen, wenn das System imstationaren Zustand ist und Sie nicht mehr zudem Stoffwechselweg wissen?

(c) Fur ein vereinfachtes Modell des Stoffwechsel-wegs nehmen Sie an: v1 = k1

1+[Y ] und v2 = k2[X],

wobei k1,2 kinetische Parameter und [X], [Y ]Metabolitkonzentrationen sind. Geben Sie dasODE-Modell an.

(d) Mit dem Modell, dem gemessenen Fluss v3 =1 mmol/h und den Parameterwerten k1 = 2mmol/h und k2 = 1 mmol/h, was sind die sta-tionaren Konzentrationen von X und Y ?

(a) • keine Ressourcenverschwendung• keine ubermassige Ansammlung eines Metaboli-

ten(b) • [Y ] kann nicht hoch genug sein, um v1 komplett

zu inhibieren• [Y ] bleibt konstant

(c)d[X]

dt= v1 − v2 =

k11 + [Y ]

− k2[X]

d[Y ]

dt= v2 − v3 = k2[X]− v3

(d) k2[X]− v3 = 0 → k2 = v3

[X] → [X] = v3k2

= 1k1

1+[Y ] − k2[X] = 0 → [Y ] = k1

k2[X] − 1 = 1

3.2.4 (Fortsetzung von 2.2.3)

Ein Substrat S wird mit der Rate vD von der Zel-le uber die Plasmamembran aufgenommen und ineinem irreversiblen metabolischen Pathway weiter-verwendet. Die Kinetik des ersten Enzyms des Pa-thways ist in der folgenden Abbildung gezeigt. DasSystem sei immer im steady state.

(a) Die Aufnahmegeschwindigkeit in die ZellevD sei gegeben durch die Gleichung vD =D([Sextern] − [S]), wobei D = 1s−1 eine Diffusi-onskonstante und [Sextern] die Substratkonzen-tration ausserhalb der Zelle ist. Zeichnen SievD als Funktion von [S], wenn Sextern = 4.5 mMin das Diagramm ein.

(b) Welche interne(n) Substratkonzentration(en)sind moglich fur Sextern = 4.5 mM? BegrundenSie Ihre Antwort und geben Sie eine ungefahreAbschatzung.

(c) Falls in (b) mehrere stationare Zustande exis-tieren, was ist der Mechanismus und wovonhangt ab, in welchem Zustand sich das Systembefindet?

(a) Gerade von (0, 4.5) bis (4.5, 0)(b) [S]1 ≈ 1; [S]2 ≈ 3 → Schnittpunkte(c) je nach dem welchem Schnittpunkt [S] naher ist

4 Regulation von Stoffwechselwegen

4.1 Lernziele

Eine biologische Erklarung fur die Notwendigkeitvon Regulationsmechanismen im Stoffwechsel ge-ben. Wenn das Substrat plotzlich im Ubermass oder nichtmehr vorkommt stirbt die Zelle.

Verschiedene Mechanismen nennen, durch die Re-aktionsraten von Enzymen reguliert werden, undjeweils angeben, welchen Faktor der Enzymkinetiksie beeinflussen. Genexpression, post-translationale Mo-difikation, allosterische Regulation, Enzym-Kapazitat unddas Metaboliten-Level

Angeben, auf welcher Zeitskala die verschiedenenRegulationsmechanismen stattfinden, und aufgrundvon diesem Wissen erklaren, wie man den Einflusseinzelner Regulationsprozesse untersuchen kann.Man kann die Zeitskala trennen und Prozesse erst untersu-chen, wenn sie beispielsweise schon im gehemmten steady

state sind.

Erklaren, wie die Metabolitkonzentration und meta-bolischer Fluss miteinander in Verbindung stehen.Die Differenz aus Einfluss und Ausfluss bestimmt die Kon-zentrationsveranderung eines Metaboliten. Umgekehrt be-einflussen die Metabolitkonzentrationen die metabolischenFlusse durch die Abhangigkeit der Reaktionsrate von derSubstratkonzentration.

Verschiedene Feedback-Typen (proportional, inte-gral, differentiell) beschreiben und ihre Funktion inder Regulation biologischer Pathways diskutieren.Proportional: Durch allosterische Hemmung: PFK wirdgehemmt, wenn die ATP Konzentration zu hoch wird. Je-doch ist die Hemmung zeitverzogert und das resultiert inInstabilitat. Ein Problem ist, dass es nicht zum gleichen stea-

dy state fuhrt. Integral: Korrigiert den Fehler als hatte eszu wenig ATP und viel AMP. Aktiviert PFK2 und die Gly-kolyse lauft weiter. Differential: Kompensiert fur schnelleVeranderungen. Puffer sind differential. Z.B. die Kreatin-kinase phosphoryliert Kreatin, dephosphoryliert dieses aberwieder, wenn der ATP-Spiegel zu niedrig fallt.

7

Page 8: Zusammenfassung Systembiologie - FS18glebert/download/systembiologie/...Zusammenfassung Systembiologie - FS18 v1.3 MadlainaMettier,GlebEbert 10.August2018 Vorwort Diese Zusammenfassung

4.2 Beispielfragen

4.2.1

Im Stoffwechselweg A → B → C gibt es eine Feed-backhemmung von C auf das erste Enzym, dieUmwandlung von A zu B. Nennen Sie 3 Beispie-le, wie diese Hemmung mechanistisch erreicht wer-den konnte und geben Sie eine kurze Erklarungbezuglich der zu erwartenden Geschwindigkeit.

• kompetitiv (v′max = k2[E]0, wie ohne Inhibition)• nicht kompetitiv / allosterische Hemmung(sinkt: v′max = vmax

1+[I]KI

)

• unkompetitiv (sinkt: v′max = vmax

1+[I]KI

)

4.2.2

Die irreversible Reaktion S → P wird vom En-zym E mit dem katalytischen Koeffizienten kcat undder Substrataffinitat km katalysiert. Die Reaktionfolgt einer Michaelis-Menten-Kinetik und der Flusswird durch die folgende Gleichung beschrieben: v =

[E] ∗ kcat ∗[S]

km+[S] . Nehmen Sie an, dass System ware

transkriptionell reguliert. Welcher Teil der Glei-chung wird sich andern und wieso? Wird der Flussv grosser, kleiner oder bleibt er unverandert, wennsich das Expressionlevel auf 10% des Normalzustan-des reduziert (unter der Annahme, dass von jedemTranskript ein Protein gebildet wird)?Annahme: Zellvolumen konstant → Fluss kleiner, da [E]transkriptionell Reguliert wird.

5 Analyse von metabolischen Netzwerkendurch Flux Balance Analysis

5.1 Lernziele

Die grundlegende Annahme kennen, die man beider Modellierung sehr grosser Stoffwechselnetzwer-ke trifft und konnen erklaren, warum diese Annah-me notwendig ist.Man nimmt an, dass alle Metabolitkonzentrationen im stea-

dy state sind. Man kennt die Stochiometrie aller Reaktionenund sucht nach den Werten der metabolischen Flusse un-ter bestimmten Bedingungen. Fur ein dynamisches Modellmusste man alle Informationen uber jede zellulare Reak-tion eines Organimus haben. Ausserdem ist die benotigteRechenleistung heutzutage noch zu gross.

Konzeptionell beschreiben, wie man von einzelnenbiochemischen Reaktionen genomweite Stoffwech-selnetzwerke rekonstruiert und welche Quellen mandafur nutzt. Achtung: Ein- und Ausfluss eines Systemssind nicht zwingend gleich gross!

d[A]

dt= v1 − v2 − v3 = 0 v1 = v2 + v3

d[B]

dt= v2 + v3 − v4 = 0 v4 = v2 + v3

Die stochiometrische Matrix fur das Schema eineseinfachen metabolischen Netzwerks aufstellen undangeben, in welchem Zahlenverhaltnis die Flusse imNetzwerk zueinander stehen.

Pro Zyklus entsteht A ein Mal in R1 und wird in R2 einMal verbraucht usw.

dc

dt= S ∗ v = 0 mit v = (v1, v2, v3, v4)

Den zweidimensionalen Losungsraum fur zweiFlusse aus einem einfachen metabolischen Netz-werks grafisch darstellen.

(A) Fur jeden Einfluss (hier v1 = 5) liegen alle moglichenLosungen fur v2 und v3 auf einer Geraden imLosungsraum.

(B) Weil v1 beliebig gross sein kann, setzt sich derLosungsraum fur v2 und v3 aus unendlich vielen Paral-lelen Geraden zusammen und ist eine unendlich grosseFlache.

(C) Unter der Annahme, dass irreversible Flusse nicht klei-ner als 0 sein konnen, lasst sich der Losungsraum aufden ersten Quadranten einschranken.

Eine Kernel-Matrix fur ein einfaches metaboli-sches Netzwerk konstruieren und zur Analyse vonKopplungen in dem Netzwerk verwenden. DenZusammenhang zwischen dem Losungsraum einerstochiometrischen Matrix und ihrer Kernel-Matrixerklaren.

8

Page 9: Zusammenfassung Systembiologie - FS18glebert/download/systembiologie/...Zusammenfassung Systembiologie - FS18 v1.3 MadlainaMettier,GlebEbert 10.August2018 Vorwort Diese Zusammenfassung

Prinzipienbasierte und datenbasierte Ein-schrankungen (constraints) nennen, die bei einerFlux Balance Analysis getroffen werden konnen.

1) Struktur des Netzwerks2) steady-state-Annahme3) (Ir)reversibilitat der Reaktionen4) Obergrenzen der Reaktionsraten5) Bedingungen unter denen sich die Zelle befindet.

Die Notwendigkeit fur Zielfunktionen (objecti-ve functions) bei einer Flux Balance Analysiserlautern und die Eignung verschiedener Zielset-zungen fur eine gegebene Fragestellung diskutieren.

Allgemein ausgedruckt gibt die Zielfunktion einen Wertdafur, wie gut ein Stoffwechselnetzwerk darin ist, ein be-stimmtes Ziel zu erreichen (z.B. Sekretion eines bestimmtenStoffes, maximale Wachstumsrate, Robustheit bei wechseln-den Umweltbedingungen, maximale Effizienz bei der Nut-zung einer Ressource). Oft optimiert man statt nur einenmehrere Flusse gleichzeitig.

Allgemein beschreiben, was Input und Output einerFlux Balance Analysis sind.Nahrstoffe sind der Input und Biomasse ist der Output.

An Anwendungsbeispielen von Flux-Balance-Analysen aufzeigen, welche Erkenntnisse jeweilsdurch die Analyse gewonnen wurden.Vorhersage von Mutantenverhalten: StochiometrischesModell fur E. coli ; FBA fur maximales Wachstum nach Gen-deletion; 86% Vorhersagewahrscheinlichkeit. Annahmen:Zellen wollen so schnell wie moglich wachsen und sind an die-ses Ziel angepasst. FBA-Vorhersagen sind mit Experimenteneinig, aber nicht direkt nach einem Knock-out.

Anhand von Beispielen begrunden, wie die Formu-

lierung einer biologischen Fragestellung die Komple-xitat der computergestutzten Analysen beeinflus-sen und sie ggf. verhindern kann.FBA ist nicht moglich, wenn folgende Situationen auftreten:

• parallele Pathways• futile cycles

• reversible Reaktionen• verzweigte Pathways ⇒

– Einschrankungen einfuhren– stark vereinfachende Annahmen treffen

Anhand von Beispielen diskutieren, wie experimen-telle Daten fur die Analyse von Stoffwechselmodel-len integriert werden konnen und welche (prinzipi-ellen) Schwierigkeiten dabei auftreten.

• Omics-Daten: Enzymmengen messen und in Kinetikals linearen Faktor berucksichtigen, der Losung ver-

bessert → dc(t)dt = S ∗ E ∗ v′ = 0 (mit E ∗ v′ = v ?)

Schwierigkeiten

– [E] verandert sich aber der Fluss nicht (Metabo-litenkonzentration passt sich an)

– Einschrankungen erlauben keinen metabolischensteady state

• Regulatorische Netzwerke: Reaktionen sind vontranskriptionellen Netzwerken reguliert → einfa-che Zustande (an/aus ⇒ 1/0) als Einschrankungeneinfuhren

Fur eine gegebene Fragestellung zu den Kursthe-men in Form eines kurzen Skripts in Pseudocodezeigen, wie man bei der Beantwortung vorgehenwurde (kursubergreifendes Lernziel).Konzept Flux Variability Analysis (FVA): minimalenund maximalen Fluss von Reaktionen in einem Netzwerkfinden, wahrend ein bestimmter Zustand beibehalten wird.

Inputs stochiometrische Matrix als auch Ober- undUntergrenzen der Flusse

Output minimale und maximale Flusse

FOR each of the reaction directions {forward,

backward}

FOR each reaction as a target

SET weights for FBA such that the target reaction

is the objective in the correct direction

RUN FBA

SAVE optimized flux for the target reaction

END

END

9

Page 10: Zusammenfassung Systembiologie - FS18glebert/download/systembiologie/...Zusammenfassung Systembiologie - FS18 v1.3 MadlainaMettier,GlebEbert 10.August2018 Vorwort Diese Zusammenfassung

5.2 Beispielfragen

5.2.1

Sie haben ein stochiometrisches Netzwerkmodellfur den Menschen mit m Metaboliten und n enzym-katalysierten Reaktionen gegeben. Sie wollen FBAanwenden, um metabolische Funktionen des Netz-werkes zu analysieren.(a) Geben Sie ein kleines aber effizientes Skript

in Pseudocode an, das es Ihnen erlaubt, her-auszufinden welche Doppelmutanten letal furZellwachstum sind. Berucksichtigen Sie dabeialle letalen Doppelmutanten, nicht nur synthe-tisch letale.

(b) Wie mussten Sie Ihr Skript anpassen, wenn Sienur an synthetisch letalen Doppelmutanten in-teressiert sind? Antworten Sie qualitativ, nichtdurch Angabe eines neuen Skripts.

(c) Welche Objective Function wurden Sie nichtwahlen, um Vorhersagen uber Flussverteilun-gen zu erhalten (und warum)?

(d) Aus Genexpressionsanalysen wissen Sie, dassbestimmte Enzyme in bestimmten Gewebennicht exprimiert werden. Wie konnten Sie die-ses Wissen nutzen, um das Modell zu verfei-nern?

(a) Inputs: stochiometrisches Modell des Stoffwechsel-netzwerks, Einschrankungen der Reaktionsraten, Op-timierungsfunktionOutput: Kombinationen von je 2 Reaktionen die letalsind, wenn beide Reaktionen fehlen

Create a matrix of zeros M of the size n x n

For each (but the last) reaction k

For each of the subsequent reactions l

Load model

Set upper and lower flux bounds for

reactions k and l to zero

Run FBA

If combination is lethal

Set value (k, l) in matrix M to 1

End

End

(b) vorher FBAs mit je nur einer Mutante laufen lassenund lethale spater nicht mehr berucksichtigen

(c) evolutionar sinnvoll fur Organismus, da lethale Dop-pelmutanten keinen evolutionaren Sinn ergeben

(d) die von diesen Enzymen katalysierten Reaktionen vonAnfang an ignorieren

5.2.2

Sie analysieren ein metabolisches Netzwerk im stati-onaren Zustand. Das Netzwerk hat funf interne Me-tabolite A−E, vier interne Reaktionen mit Flussenr1 − r4, sowie zwei externe Reaktionen mit FlussenrA und rE. Alle Reaktionen sind irreversibel; sie lau-ten:

rA−−→ A Ar3−→ 2D

Ar1−→ B C +D

r4−→ A+ E

Br2−→ C E

rE−−→

(a) Geben sie die stochiometrische Matrix desNetzwerkes an.

(b) Sie haben den Fluss rE = 1mmol/h gemessen.Welche anderen stationaren Flusse konnen Siedirekt bestimmen und welche Werte haben die-se?

(a) S =

rA r1 r2 r3 r4 rE

A 1 −1 0 −1 1 0B 0 1 −1 0 0 0C 0 0 1 0 −1 0D 0 0 0 2 −1 0E 0 0 0 0 1 −1

(b) d[A]dt = rA + r4 − r1 − r3 = 0 → rA + r4 = r1 + r3

d[B]dt = r1 − r2 = 0 → r1 = r2

d[C]dt = r2 − r4 = 0 → r2 = r4

d[D]dt = 2r3 − r4 = 0 → r3 = 1

2r4d[E]dt = r4 − rE = 0 → r4 = rE

r1 = r2 = r4 = rE = 1mmol/h → r3 = 0.5mmol/hrA + r4 = r1 + r3 → rA = 0.5mmol/h

5.2.3

Sie analysieren das gegebene metabolische Netz-werk im stationaren Zustand. Pfeile notieren Reak-tionen (alle Reaktionen sind irreversibel, die ent-sprechenden Symbole fur Flusse sind annotiert)und Buchstaben die Metabolite. Die Zellgrenze istdurch die gestrichelte Linie gezeigt.

(a) Geben Sie die stochiometrische Matrix desNetzwerkes an.

(b) Sie haben die Aufnahmeraten rA = 2mmol/hund rB = 1mmol/h gemessen. Welche anderenstationaren Flusse konnen Sie bestimmen undwelche Werte haben diese?

(a) S =

rA rB r1 r2 r3 rD

A 1 0 −1 −1 0 0B 0 1 0 0 −1 0C 0 0 0 1 −1 0D 0 0 2 0 0 −2

E nicht im Netzwerk → weggelassen, da kein steady

state mogliche ist ohne Ausfluss(b) rA = 2mmol/h; rB = 1mmol/h

d[A]dt = rA − r1 − r2 = 0 → rA = r1 + r2

d[B]dt = rB − r3 = 0 → rB = r3 = 1mmol/h

d[C]dt = r2 − r3 = 0 → r2 = r3 = 1mmol/h

d[D]dt = 2r1 − 2rD = 0 → r1 = rD

r1 = rD = rA − r2 = 1mmol/h

10

Page 11: Zusammenfassung Systembiologie - FS18glebert/download/systembiologie/...Zusammenfassung Systembiologie - FS18 v1.3 MadlainaMettier,GlebEbert 10.August2018 Vorwort Diese Zusammenfassung

5.2.4

Sie haben ein stochiometrisches Netzwerkmodellfur humane Krebszellen mit Metaboliten undEnzym-katalysierten Reaktionen gegeben. Sie wol-len FBA anwenden, um metabolische Funktionendes Netzwerkes zu analysieren.(a) Mit diesem Modell ist kein Zellwachstum

moglich. Sie vermuten, dass eine Komponenteder im Modell reprasentierten Biomasse nichtsynthetisiert werden kann. Geben sie ein klei-nes Skript in Pseudocode an, das es Ihnen er-laubt, herauszufinden welche Biomassekompo-nente dies ist.

(b) Nach Korrektur des Modells: welche Objecti-ve Function wurden Sie wahlen, um Vorhersa-gen uber Flussverteilungen zu erhalten (undwarum)?

(c) Wie konnten Sie das Modell verwenden um zuanalysieren, welche metabolischen Reaktionenfur diese Krebszellen essentiell sind?

(a) Input: stoch Mod. des Stoffwechselnetzwerkes, Ein-schrankungen der Reaktionsraten, Optimierungsfunk-tionOutput: Vektor der fur jede Reaktion, die im Modell 0ist, besagt, ob sie beim Anschalten Biomassensyntheseerlaubt

FOR each reaction that is 0 in the model

SET reaction to 1 (running)

LOAD model

RUN FBA

IF biomass is synthesized

SAVE reaction as crucial in vector

END

(b) maximales Wachstum(c) je eine Reaktion loschen und testen, ob Zelle noch

wachst

5.2.5

Gegeben ist das folgen-de Reaktionssystem,das aus vier Metabo-liten (A, B, C, D) undsechs irreversiblen Re-aktionen (R1 bis R6)besteht:

(a) Stellen Sie die Massenbilanz fur jeden der vierMetaboliten auf.

(b) Zeichnen Sie den Losungsraum fur die Ge-schwindigkeit v6 in Abhangigkeit von v1 in dasDiagramm.

(a)d[A]

dt= v1 − v2 − v3

d[B]

dt= v2 − v4 − v5

d[C]

dt= v3 − v4

d[D]

dt= v4 − v6

(b)

LGS (Matrix) auflosen bis al-

le Flusse in Abhangigkeit von

1-2 Flussen dargestellt werden

konnen. Einfache Zahlen wie

1 oder 0 in diese Flusse ein-

setzen → zwei Losungen erge-

ben Vektoren (der Rest sind de-

ren Linearkombinationen) →

Kernelmatrix & Grenzen des

Losungsraums

5.2.6

Was ist die Hauptannahme bei einer Flux BalanceAnalysis? Erklaren Sie anhand dieser Annahme denNamen der Analysemethode. Flux balance = steady

state = keine Veranderungen der Flusse

7 Modellierung von Signaltransduktionswegen

7.1 Lernziele

Herausforderungen nennen, die fur eine Zelle beider Signaltransduktion auftreten. Sie muss auf sehrkleine Konzentrations-Anderungen reagieren konnen. Z.B.bei der Michaelis-Menten-Kinetik muss der Input um das81-fache gesteigert werden um von <10% auf mehr als >90%zu steigen. Da Zellen schneller als das reagieren mussen, gibtes Ultrasensitivitat.

Ultrasensitivitat definieren und verschiedene Me-chanismen beschreiben, durch die eine Zelle Ultra-sensitivitat erreicht. Ultrasensitivitat bedeutet, dass einSystem starker auf eine Signalveranderung reagiert alsMichaelis-Menten Kinetik erlauben wurde. So kann schalter-artiges Verhalten erzielt werden. Mechanismen dafur sind

• Kooperation (z.B. Hamoglobin)• Signalkaskaden (z.B. MapKKK)

Eine biologische Interpretation verschiedener Hill-Koeffizienten in der Hill-Gleichung geben und je-weils den Kurvenverlauf zeichnen.

Output = Outputmax

Inputn

Inputn +KnM

Wenn n = 1 liegt Michaelis-Menten-Kinetik vor. n ist dersogenannte Hill-Koeffizient, ist ein Mass fur Ultrasensiti-vitat und beschreibt die kooperative Bindung. Je grossern, desto steiler ist die sigmoidale Kurve und desto klei-ner ist der Anderungsbereich beim Inputwert, der zu einerschalterartigen Veranderung des Outputs fuhrt. Input0.5 istder Inputwert, bei dem die Halfte des maximalen Outputserreicht wird.

Grafisch zeigen, warum die Kombination mehrererultrasensitiver Schritte in einem Pathway zu einemnoch hoheren Hill-Koeffizienten der gesamten Kas-kade fuhrt. ntot ist grosser als n1 und n2 zusammen. KM1

bestimmt KM,tot der Kaskade (kann nicht kleiner sein alsdas KM der ersten Reaktion), denn die Schalterreaktionliegt im Bereich des ersten Proteins.

11

Page 12: Zusammenfassung Systembiologie - FS18glebert/download/systembiologie/...Zusammenfassung Systembiologie - FS18 v1.3 MadlainaMettier,GlebEbert 10.August2018 Vorwort Diese Zusammenfassung

1) Inputwert (x-Achse) des Schnittpunktes von 10% mitKurve 2 ablesen

2) Inputwert auf Aktivitatsachse (y) ubertragen undSchnittpunkt mit Kurve 1 suchen

3) Schnittpunkt auf x-Achse ubertragen4) Schritte 1) bis 3) fur 90% wiederholen5) die letzten 10%- bzw. 90%-Schnittpunkte bilden auf

der x-Achse den Switch-Bereich6) Sigmoidale Kurve durch Schnittpunkte der 10%- und

90%-Linien mit dem Switch-Bereich zeichnen

Kriterien nennen, durch die man das Ergebnis einerSignalkaskade quantitativ charakterisieren kann.

• Signaling time τ : Expected time of arrival of the signal.• Signal duration υ: Variance of the expected time.• Signal amplitude S: Average amplitude during signa-

ling.

Diskutieren, welche Faktoren die Dynamik einer Si-gnalkaskade beeinflussen.

dX1

dt= vp,1 − vd,1

= α1X1R− β1X1

dXi

dt= vp,i − vd,i

= αiXiXi−1 − βiXi

X: phosphorylierte Kinase

X: nicht phosphorylierte

Kinase

Erklaren, warum eukaryotische Signalkaskaden ausmehreren Kaskadestufen bestehen. So kann das Signalamplifiziert oder abgeschwacht werden. Es wird auch enormverschnellert.

Am Beispiel eines Signalmolekuls erklaren, wie einSignalmolekul viele verschiedene Signale interpre-tieren und durch unterschiedliche dynamische Ver-haltensweisen reagieren kann. Src-Kinase: SchlusselRegulator mit mehreren Funktionen: Beweglichkeit, Prolife-ration, uberleben, Zell-Zell Adhasion. Bis zu 350 potenzielleSubstrate.

Wird reguliert durch 2 Phosphorilierungs-Events, von de-ne eines inhibiert und das andere aktiviert. So gibt es 4Stadien und insgesamt 7 Reaktionen. Sie folgen nicht derMichaelis-Menten-Kinetik. So ergibt sich ein dynamischesGedachtnis, welches vom vorherigen Zustand der Kinaseabhangt. RPTP ist die Phosphatase, welche die inaktiveForm der Src-Kinase Si durch Dephosphorylierung in dieteilweise aktive Form S uberfuhrt.

Ist die Konzentration von RPTP tief, ist auch die Konzen-tration der Form S und damit die Src-Aktivitat tief (Punkt1). Ist die Konzentration von RPTP hingegen hoch, liegtviel der aktiven Form der Src-Kinase vor, die sich durch Au-tophosphorylierung selbst weiter aktivieren kann (Punkt 3).Interessant wird es, wenn man die Src-Kinase-Aktivitat beieiner mittleren RPTP-Konzentration betrachtet: Abhangigvon der vorherigen Aktivitat der Src-Kinase ist die Aktivitatnun tief, wenn sie auch vorher tief war, bzw. hoch, wenn sievorher hoch war (Punkt 2). Die Schnittpunkte sind dabeisteady states.

v3 =

(kcatS

KS[S] +

kcata1

Ka2[S] +

kcata2

Ka2[S]

)[S]

Erklaren, was bei einer Sensitivitatsanalyse unter-sucht wird und an einem Beispiel erklaren, wie mandurch so eine Analyse potentielle Angriffspunktefur Medikamente identifizieren kann. Man verandertdie Parameter KM fur die verschiedenen Reaktionsschrit-te und sieht anhand des Outputs wie sensitiv dieser Teil-schritt ist. Beim sensitivsten Teilschritt findet die grossteVeranderung des Outputs statt. Dies zeigt den Angriffs-punkt des Medikaments an. Krebs entsteht haufig durcheine Mutation im MapKKK Pathway oder im AKT Pathway.Man sucht den sensitivsten Teilschritt/Rezeptor/Kinase undversucht ihn mit einem Medikament zu inhibieren.

12

Page 13: Zusammenfassung Systembiologie - FS18glebert/download/systembiologie/...Zusammenfassung Systembiologie - FS18 v1.3 MadlainaMettier,GlebEbert 10.August2018 Vorwort Diese Zusammenfassung

7.2 Beispielfragen

7.2.1

Die Aktivitat einer Signalkaskade im stationarenZustand kann mit Hilfe der sogenannten Hill-Kinetik beschrieben werden:

Ai =An

i−1

KnM,i +An

i−1

wobei Ai die Aktivitat der i-ten Kinase ist, wel-che von der vorhergehenden Kinaseaktivitat Ai−1

abhangt, n der Hill-Koeffizient (Exponent) ist undKM,i die Michaelis-Menten-Konstante fur die Akti-vierung von Kinase i ist.(a) Wie muss n sein, um Ultrasensitivitat jedes Si-

gnalschrittes zu erreichen?(b) Nehmen Sie an, dass eine MAPK-Kaskade mit

i = 1 . . . 3 Kinasen die folgenden Parameterwer-te hat: n = 8, K1 = 0.2, K2 = 0.4 und K3 = 0.8.Skizzieren Sie graphisch die Aktivitaten dereinzelnen Kinasen als Funktion der vorherge-henden Kinaseaktivitat bzw. des Inputs A0 (al-le Signale sind in [0, 1]).

(c) Welche Kinasekaskade wird den Output aufder letzten Ebene bei einem geringeren Input-signal aktivieren: die Kaskade aus (b) oder einalternativer Signalweg mit n = 8, K1 = 0.8,K2 = 0.4 und K3 = 0.2? Begrunden Sie IhreAntwort.

(a) > 1

(b)

(c) (b) ist schneller, da bei (c) zuerst 0.8 erreicht werdenmuss, bevor Kinasen 2 und 3 aktiv werden

8 Analysis of omics data

Know what biological insights are to be obtainedby data mining of omics data. Hypothesen generieren,Komponenten identifizieren, Netzwerk- und Interaktionsvor-hersagen, Klassifizierung und Vorhersage von Features

Describe the typical problems associated with omicsdata. Es sind sehr viele Daten und es ist schwierig denUberblick nicht zu verlieren (Unwichtiges rausfiltern). DasRisiko des overfitting besteht. Die Experimente mussen tech-nisch reproduzierbar bleiben. Daten beeinhalten statistischesRauschen.

# of detected features >>> # of samples

Describe the role of statistics in biological context.Statistik wird benutzt, um Hypothesen zu verwerfen. Eskann jedoch nie mit 100% Sicherheit etwas bewiesen oderverworfen werden.

8.1 Data Mining

• biologische Frage• keine eindeutige Antwort erwarten• positive und negative Kontrolle• moglichst einfach halten• verschiedene Herangehensweisen nutzen

8.2 Analyse und Statistik

Differential, univariate analysis between two groupsDie Daten wurden bereits in zwei Gruppen z.B. Mutant/WToder gesund/krank gesammelt. Nun ist interessant, ob wei-tere Abweichungen wie zellulare Prozesse bestehen.

Understand the basic form of univariate analysis.Man nimmt eine Komponente zu einer bestimmten Zeit undvergleicht die zwei Gruppen. Dies wird fur jede Komponentewiederholt. Man berechnet die Grosse der Veranderung mitdem fold-change. Fur bessere symmetrische Visualisierungbenutzt man den Logarithmus davon.

FC =mean(GroupA)

mean(GroupB)

log2(FC) = log2

(mean(GroupA)

mean(GroupB)

)

Man benutzt dann verschiedene statistische Tests um heraus-zufinden, ob die Null-Hypothese (die zwei Gruppen folgenderselben Verteilung) stimmt.

• t-Test: beruht auf Normalverteilug• Mann-Whitney- / Wilcoxon- / Ranksum-Test:benutzen Ranking

• Permutations-Test: Fur Studien mit vielen Proben;Die Datenpunkte werden zufallig einer Gruppe zuge-wiesen und es wird getestet, wie oft die neuen Gruppenmehr Sinn machen als die ursprunglichen.

Mit dem generierten p-Wert wird dann ein volcano plot

erstellt. Allgemein gilt in der Biologie: p < 0.05 ist akzep-tierbar; p < 0.01 ist super.

Fold Change Treshold

• beliebiges Signifikanzniveau bestimmen (z.B.|log2(FC)| > 1)

• empirisches Vorgehen: Niveau so wahlen, dass ahnlicheDinge nicht signifikant unterschiedlich sind

• Schatze die Verteilung zwischen beliebigen oder allenTeilmengen der negativen Kontrollen

13

Page 14: Zusammenfassung Systembiologie - FS18glebert/download/systembiologie/...Zusammenfassung Systembiologie - FS18 v1.3 MadlainaMettier,GlebEbert 10.August2018 Vorwort Diese Zusammenfassung

Multiples Testen: Das Problem mit dem p-Treshold ist,dass mit einem Signifikanzniveau von 0.05 eine Chance von5% auf ein falsch positives Resultat besteht. An sich istdas in Ordnung bei einem durchgefuhrten Test, wenn manden Test jedoch oft widerholt, steigt die Wahrscheinlich-keit auf einen falsch positiven Wert rasant an. Es gibt dreiMoglichkeiten dies zu Korrigieren.

• Family-Wise Error Rate: Schutzt gegen allefalschen Positive und ist somit sehr strikt. Bonferroni:Korrigiere den p-Wert mit der Anzahl Tests p ≤ α

m ;Wahrscheinlichkeit min. 1 falsches Positiv zu erhalten= FWER = P (V ≥ 1)

• False Discovery Rate (FDR) / Benjamini-Hochberg: Steuert die Anzahl falsch positiver Er-eignisse unter den abgelehnten Hypothesen. p-Wert >Korrigierter p-Wert der FDR, verwirft Hi wenn korri-giertes pi ≤ α; OK wenn Differenzen selten (π0 ≈ 1).

• Positive False Discovery Rate / Storey-Tibshirani: Kontrolliert die Rate der falschen Ereig-nisse. Besser wenn Differenzen oft vorkommen (π0 < 1)

0 signifikanteVeranderungen

Datenqualitat prufen;niedrige p-Werte, hoherFC → Replikatanzahlerhohen

wenig signifikanteVeranderungen

einfachster Fall → was istdie Identitat der Marker?

viele signifikanteVeranderungen; kein klaresRanking

relativ haufig; schwierigHypothese aufzustellen;Kombination aus primarenund sekundaren Effekten→ enrichment analysis

8.3 Enrichment Analysis

Wie erkennt man signifikant veranderte zellulareProzesse? Ordne die gemessenen Eigenschaften in Unter-gruppen. Eigenschaften konnen dabei in mehreren Gruppengleichzeitig vorkommen. Sind bestimmte signifikante Eigen-schaften in einer gewissen Gruppe besonders haufig? →hotspot

Damit kann man nun einen Fischer Exact Test machenund herausfinden, wie gross die Wahrscheinlichkeit ist die

gleichen Resultate unter der Nullhypothese zu erhalten.

8.3.1 Gen Set Enrichment Analysis (GSEA)

1) entscheiden welche Vorzeichen einbezogen werden

2) Vorgehen fur 1 Pathway / Gruppe / Prozess1) sehr lockere Grenzen setzen (z.B. |log2(FC) >

0.2 und p < 0.1)2) alle Ergebniss nach p-Wert (bevorzugt) oder

log2(FC) ordnen3) contingency tables fur 2, 3, 4, . . . alle besten Er-

gebnisse erstellen4) jeweils p-Wert mit Fisher’s exact test berechnen5) niedrigsten p-Wert behalten = bestes enrichment

3) fur alle Pathways / Gruppen / Prozesse wiederholen4) FDR-Korrektur (Benjamini-Hochberg oder Storey)

9 Feature Selection

Das grundlegende Problem der Feature Selection in der Sys-tembiologie ist es, diejenigen Komponenten eines Systemszu finden, die einen bestimmten Output, Funktion oderPhanotyp beeinflussen. Grunde dafur sind um molekulareMechanismen des Phanotyps zu verstehen, die Dimensiondes Modells zu verringern und um allfalliges Rauschen zuentfernen. Ein Anwendungsbeispiel sind GWAS (siehe Vor-lesung Genetik, Genomik, Bioinformatik fur Einzelheiten).

9.1 Univariate Feature Selection

Fur jedes Feature j wird der Relevanz-Wert (score) r(j)berechnet. Anschliessend werden Features nach r(j) sortiertund als geordnete Liste zuruckgeben. Limitationen sind:

• nur Effekt eins Gens• ignoriert Korrelation zwischen Genen• ignoriert additive Effekte zwischen Genen• ignoriert Interaktionen zwischen Genen

Univariate Feature Selection ignoriert den systembiologi-schen Charakter des Problems.

9.1.1 Anzahl Features

• Ein zufalliges Rausch-Feature z generieren. Alle Fea-tures mit r(j) > r(z) wahlen.

• Fur jeden Zusammenhang zwischen Feature undPhanotyp einen p-Wert berechnen. Nur Features mitsignifikanten Zusammenhangen wahlen.

9.1.2 Multiples Testen

Durch Zufall werden bei Tausenden getesteten Feature ei-nige mit falschlicherweise signifikanten Zusammenhangendabei sein. Die Bonferroni-Korrektur kann diese Problemlosen, ist oft aber zu streng. Alternativen sind z.B. die False

Discovery Rate.

14

Page 15: Zusammenfassung Systembiologie - FS18glebert/download/systembiologie/...Zusammenfassung Systembiologie - FS18 v1.3 MadlainaMettier,GlebEbert 10.August2018 Vorwort Diese Zusammenfassung

9.1.3 Instabilitat

Instabilitat von Resultaten: Es werden verschieden Teilmen-ge eines Datensatzen getestet oder unterschiedliche Feature-Selection-Methoden verwendet. Die resultierenden Rangord-nungen konnen stark unterschiedlich voneinander sein. Umaus mehreren Resultaten ein moglichst gutes zu gewinnen,konnen folgende Strategien angewandt werden:

• Durchschnittlichen Rang eines Gens uber alle Experi-mente hinweg berechnen.

• Die Wahrscheinlichkeit berechnen, dass ein Gen injedem Experiment unter den Top-k ist (z.B. mit Fis-her’s Inverse χ2 test)

9.2 Multivariate Feature Selection

9.2.1 Additive Models

Methoden mit linearer Regression, die aus x eine Vorhersagefur y zu treffen versuchen. Features bekommen Gewichtun-gen in β. Relevante Features haben eine Gewichtung, dieungleich null ist. Je nach Formulierung des Modell, trifftdies aber auf sehr viele Features zu.

arg minβ ||y −Xβ||22

9.2.2 L1- und L2-Normen

Die L2-Norm belohnt hohere Werte statt kleinere zu verrin-gern. Die L1-Norm belohnt beides gleich stark.

9.2.3 Lasso Model

Losungen mit wenig relevanten Features werden bevorzugt.Bei Gruppen von korrelierten Features wird aber nur einesdavon ausgewahlt.

arg minβ ||y −Xβ||22 + γ1||β||1

Die L1-Norm von β wird minimiert: ||β||1 =∑d

i=1 |βi|

9.2.4 Ridge Regression

Losungen in denen korrelierte Features ahnliche Gewich-tungen erhalten, werden bevorzugt. Die Losung ist oft abernicht besonders sparlich.

arg minβ ||y −Xβ||22 + γ2||β||22

Die L2-Norm von β wird minimiert: ||β||2 =√∑d

i=1 β2i

9.2.5 Elastic Net

Losungen in denen Gruppen von korrelierten Featuresahnliche Gewichtungen haben und wenige Gewichtungenungleich null sind. Es mussen allerdings zwei Parametergesetzt werden.

arg minβ ||y −Xβ||22 + γ1||β||1 + γ2||β||22

Hier werden sowohl die L1- als auch die L2-Norm minimiert.

9.2.6 Overfitting

Stichprobenverzerrung resultiert in zu optimistischen Resul-taten. Feature Selection und Vorhersagen durfen nicht mitdem selben Datenset gemacht werden. Man benutzt alsoeinen Trainings- und einen Test-Datensatz.

10 Clustering

Beim Clustering versucht man Gruppen von Datenpunktenzu bilden, welche einander ahnlich sind.

10.1 Clustering-k means, Centroid based

Jeder Cluster wird von einem Vektor / Punkt reprasentiert,welcher aber kein existierender Datenpunkt sein muss. Manordnet sie wie folgt:

1) wahle k zufallige Cluster-Mittelpunkte2) ordne jeden Punkt dem nachsten Mittelpunkt zu3) berechne den neuen Mittelpunkt des Clusters4) wiederhole 2) und 3) bis sich nichts mehr andert

k muss vom Benutzer gefunden werden

je nach Startpunkt konnen Ergebnisse unterschiedlich sein

nicht-spharische Cluster bereiten Probleme

10.2 Graph-based Clustering

Annahmen

• Daten sind in Form eines Netzwerks / Graphen• jeder Punkt ist ein Objekt• Kanten verbinden verwandte Objekte• Gewichtung von Kanten reprasentiert die Entfernung

zwischen Objekten

Graphen stammen aus

• Literatur uber biologische Netzwerke• treshold distance matrix

15

Page 16: Zusammenfassung Systembiologie - FS18glebert/download/systembiologie/...Zusammenfassung Systembiologie - FS18 v1.3 MadlainaMettier,GlebEbert 10.August2018 Vorwort Diese Zusammenfassung

Vorgehen1) entferne alle Kanten, die schwerer gewichtet sind als

eine bestimmte Vorgabe2) finde alle verbliebenen Punkte → Cluster

10.3 DBSCAN

Rausch-resistente Variante von Graphen-basiertem Cluste-ring: Density Based Spatial Clustering of Applicati-ons with Noise. Dabei gibt es drei Arten von Punkten:

• core object : Punkt mit Mindestanzahl (MinPt) vonPunkten in Entfernung Epsilon

• border point : innerhalb Epsilon eines core objects

• noise: restliche Punkte

Algorithmus1) wahle noch nicht zugewiesenen Punkt2) ist er ein core object, erstelle ein neues Cluster, sonst

markiere ihn als noise3) fuge seine Nachbarn zum selben Cluster hinzu4) kontrolliere jeden Nachbarn, ob er ein core object ist

1) wenn ja, fuge seine Nachbarn zum selben Clusterhinzu und wiederhole 4) fur diese

2) falls nein, Cluster nicht weiter wachsen lassen5) kehre zu 1) zuruck, bis alle Punkte erfasst wurden

Vorteile Nachteile

kein k benotigt zwei Parameter mussengewahlt werden

Cluster, die k-means nichtfindet

Initialisierungs-abhangigeResultate

robuster gegenuberRauschen

bei variierender Dichte(haufig beihochdimensionalenDatensatzen) werden vieleCluster nicht gefunden

10.4 Hierarchical Clustering

In den anderen Methoden sind Cluster einander gleichge-stellt. Mit dieser Methode clustert man kleinere Clusterimmer wieder zu grosseren Clustern. Man Beginnt mit je-dem Datenpunkt als Cluster und beendet den Prozess, wennnur noch ein grosses Cluster ubrig ist.

Vorteile mehr Einsicht in die Struktur der Daten

Nachteil fur weitere Verwendung braucht man meistgleichgestellte Cluster

11 Clustering Applications

Clustering von samples (verschiedene Mutanten, Bedingun-gen, Behandlungen) uber features hinweg erlaubt es, Zell-typen oder Ahnlichkeiten in (intrazellularen) dynamischenAntworten zu identifizieren. Z.B. Timing von Ereignissen,konservierte Antworten auf Medikamente, Proteinkomplexeaus phanotypischen Antworten in knock-outs.Clustering von features (Gene, Metaboliten, Proteine) ubersamples hinweg erlaubt es, korrelierte features zu finden undist oft mit enrichment analysis verbunden.Co-clustering wird zur Rauschreduktion verwendet.

11.1 Dimensionsreduktion

In grossen Datensatzen (viele Features = viele Dimensionen)will man die Anzahl Dimensionen reduzieren, ohne dabeiInformationen uber die Ahnlichkeit von Samples zu verlie-ren. Dabei versucht man z.B. Redundanzen und Rauschenzu entfernen. Weniger Dimensionen sind nutzlich zur Visua-lisierung, Qualitatskontrolle und Verarbeitung von Datenbevor andere Methoden benutzt werden.

11.2 Principal Component Analysis (PCA)

Die PCA versucht PCs in multidimensionalen Daten zufinden. PCs sind lineare, orthonormale Kombinationen derursprunglichen Dimensionen. Sie werden dabei nacheinan-der so bestimmt, dass die Varianz entlang der Projektionjeweils maximal ist. Eigenwerte sind die Varianz der Punkteprojeziert auf jede einzelne Komponente.

Typische Kriterien um die Anzahl der zu behaltenden Kom-ponenten zu bestimmen sind

• k Komponenten erklaren einen bestimmten prozentua-len Anteil der Varianz (z.B. 75%)

• k Eigenwerte sind uber dem durchschnittlichen Eigen-wert

• Wo ist der letzte grosse Sprung im Scree-Plot (siehe11.2.2)?

16

Page 17: Zusammenfassung Systembiologie - FS18glebert/download/systembiologie/...Zusammenfassung Systembiologie - FS18 v1.3 MadlainaMettier,GlebEbert 10.August2018 Vorwort Diese Zusammenfassung

11.2.1 Bi Plot

• nahegelegene Samples haben ahnliche Profile• nahegelegene Features korrelieren• Samples nahe an einem Feature haben alle hohe Levels

des selben Features• Samples gegenuber des Features haben geringe Levels

davon

11.2.2 Scree Plot

11.3 Recap

• Gruppen unbekannt

– Clustering– Dimensionsreduktion → visuelle Inspektion

• Gruppen bekannt

– Feature selection

∗ univariate∗ multivariate

12 Link Prediction

Was ist link prediction (collaborative filtering)? Beieinem gegebenen Netzwerk will man fehlenden Kanten her-vorsagen, z.B. um herauszufinden, welcher Transkriptions-faktor welches Gen beeinflusst. Man brauch dazu Gen-Expressions-Daten, eine bekannte Netzwerkstruktur undeine Gen- / Protein-Sequenz.

Unsupervised link prediction: Nicht auf das Lernen ausBeispielen ausgelegt, sondern auf vordefinierten Regeln.Supervised link prediction: Man basiert das Wissen aufbekannten Beispielen (Komponenten die interagieren odernicht interagieren).

12.1 Similarity-Based Approach

Setze Kante zwischen Genen a und b, wenn ihreAhnlichkeit s(a, b) uber einem bestimmten Wert θ liegt.

Vorteile Nachteile

einfach umzusetzen man muss θ setzen

skaliert zu grossenNetzwerken

Ahnlichkeit muss nicht =Interaktion sein

Typische similarity measures in link prediction sind:

• Pearsons correlation coefficient• Mutual Information• String kernels that count common subsequences intwo protein sequences (k-mers)

• Number of shared neighbors

12.2 Cluster-Based Learning

Wenn a und b im selben Cluster liegen, sagt man eine Kantevoraus.

Vorteile Nachteile

allgemeiner als similarity

based pairs

wie realistisch hangt vonGute der Cluster ab

12.3 Latent Group Models

Das Ziel ist es Interaktionen zwischen Genen herzuleiten.Als erstes kommt die Trainingsphase:

1) wahle eine Grupps S von Genen2) cluster die Gene von S in k verschiedene Gruppen

aufgrund der Expressionsprofile3) Fur jedes Paar Cluster i und j bestimme die empirische

Interaktionswahrscheinlichkeit pijNun will man eine Voraussage fur zwei Gene machen:

5) gegeben ist ein Paar Gene a und b6) weise a und b den ahnlichsten Cluster Ca und Cb zu7) finde die Interaktionswarscheinlichkeit pa,b von der

Trainingsphase.Hangt von einem Set von latenten oder versteckten Eigen-schaften ab, wahrend cluster-based link prediction nur voneiner latenten Variable abhangig ist.

12.4 Matrix Factorization

Ra,b =

h∑

i=1

Ua,iVi,b

Da nicht alle Interaktionen in R bekannt sind, zerlegt mandie Matrix um die restichen Werte vorauszusagen.

17

Page 18: Zusammenfassung Systembiologie - FS18glebert/download/systembiologie/...Zusammenfassung Systembiologie - FS18 v1.3 MadlainaMettier,GlebEbert 10.August2018 Vorwort Diese Zusammenfassung

12.5 Kernel approaches: Similarity-based classification

Fur manche Genpaare ist bekannt, dass sie interagieren undfur andere das sie nicht interagieren. Wenn man nun einGenpaar hat, uber das nichts bekannt ist, versucht man siemit anderen zu vergleichen und aufgrund der Ahnlichkeitvorherzusagen, wie sie interagieren. Kernel ist dabei eineAhnichkeitsfunktion.

Tensor pairwise kernel bestimmt die Ahnlichkeit derbeiden Knotenpaare bezuglich ihrer Kanten in beide Rich-tungen.

ktensor((a, b), (c, d)) =knodes(a, c)knodes(a, c)

+knodes(a, d)knodes(b, c)

Metric learning pairwise kernel: ϕ(g) ist ein Vektor,der die Eigenschaften vom Gen/Protein g beschreibt.

kml((a, b), (c, d)) =[(ϕ(a)− ϕ(b))T (ϕ(c)− ϕ(d))

]

Das Paar (a, b) ist ahnlich zu (c, d), wenn a− b ahnlich zuc− d oder d− c ist.

Negativ Kontrollen gut zu wahlen ist schwierig. Diehaufigste Strategie ist es Proteine von anderen Zellkom-partimenten auszuwahlen. Oft ist das aber eine zu grosseVereinfachung. Eine andere Strategie ist es, die positivenund negativen Kontrollen gleich zu gewichten, was jedochzu einem zu pessimistischen Resultat fuhrt.

12.6 Regression-based

Sage den Zustand eines Gens voraus, wenn alle anderenGene gegeben sind. Jedes Gen ist durch einen Vektor re-prasentiert (mit Expressionswerten). Man macht dann eineRegression. Meistens wird LASSO fur die Regression be-nutzt, was die Annahme unterstutzt, dass ein Gen jeweilsnur mit einem kleinen Set von anderen Genen interagiert.

true (R) vs. predicted label (R∗) R = 1 R = −1

R∗ = 1 TP FPR∗ = −1 FN TN

P N

accuracy =TP + TN

TP + FP + FN + TN

Welcher Anteil an Vorhersagen ist korrekt?

• sensitivity / recall / true positive rate: = TPP .

Wie hoch ist die Rate an positiven Beispielen, die derclassifier fand?

• specificity = TNN

• false positive rate = FPN = 1− specificity

• precision = TPTP+FP . Welcher Anteil an positiven

Vorhersagen ist korrekt?

Receiver operating characteristic (ROC)

AUC = Area under the ROC curve → Ist die Wahrschein-lichkeit das positive Sample zu finden, wenn es mit einempositiven und einem negativen Beispiel konfrontiert ist. Pit-fall: Auch mit einem sehr hohen AUC ist der Classifierziemlich unnotig, wenn eine Klasse viel grosser ist als dieandere. Dann muss man sich die Presicion/Recall Kurveanschauen.

Beispiel: We perform link prediciton for 102 pairs of nodes.For 2 pairs, a link actually exists. They are ranked in the11th and 12th position of the solution.

AUC/ROC is misleading here and looks much better thanthe precision-recall curve.

18

Page 19: Zusammenfassung Systembiologie - FS18glebert/download/systembiologie/...Zusammenfassung Systembiologie - FS18 v1.3 MadlainaMettier,GlebEbert 10.August2018 Vorwort Diese Zusammenfassung

13 Biological Networks

• Gene regulatory networksTranskriptionsfaktor-Gen-Interaktionen

• Protein-protein interaction networksProtein-Protein-Interaktionen

• Phosphorylation networksKinase/Phosphatase-Ziel-Interaktionen

• Metabolic networksEnzym-Metabolit-Interaktionen

13.1 Rekonstruktion von biologischen Netzwerken

Experimentell kann nur ein kleiner Teil aller moglichenInteraktionen untersucht werden, da Ressourcen limitiertund Interaktionen dynamisch sind als auch Methoden sichuberschneidende Resultate liefern. Trotzdem sind experimen-telle Methoden weiterhin wichtig um die Basis zu legen. Re-chengestuzte Methoden werden zur Hilfe genommen um dasNetzwerk mit link prediction zu erweitern und uberprufen alsauch um aus bekannten Interaktionen diejenigen zu finden,welche aktiv und wichtig fur den Phanotyp sind.

13.1.1 Probleme von Vorhersagemethoden

• Schlecht darin, kurzanhaltende Interaktionen und In-teraktionen mit schlecht untersuchten Interaktions-partnern vorherzusagen.

• Wenn eine Methode Training benotigt, kann sie einbias fur den Trainingsdatensatz erhalten.

13.1.2 Mehrere Methoden

Die Analyse von verfugbaren Methoden zeigt, dass jedeFamilie von Methoden bestimmte Zusammenhange besservorhersagt als andere. Es ist also stets besser, Methodenaus verschiedenen Familien zu kombinieren.

13.2 Nutzen von Netzwerken

• Funktion und Organisation entdecken• durch differenzielle Analyse dynamische oder konser-vierte Module finden

• Netzwerke unterstutzen Dateninterpretation

13.2.1 Effekte von Medikamenten

Ein grosses Problem in der Suche nach neuen Medikamentenist, dass bei der Zugabe eines Stoffes zu einer Zelle Hunder-te bis Tausende Genprodukte direkt oder indirekt auf dieVeranderungen reagieren. Eine mogliche Herangehensweiseum die direkten Effekte rauszufiltern sieht wie folgt aus:

1) Zelle auf verschiedene Arten behandeln2) RNA-Expression fur jede Behandlung messen3) Netzwerkmodell erstellen4) Zelle mit Medikament behandeln5) RNA-Expression messen6) Daten mithilfe des Modells filtern → nur direkte Ziele

des Medikaments bleiben ubrig.

13.2.2 Krebs-Kategorisierung

Viele Krebsarten haben mehrere Unterarten mit verschie-denen Ursachen und Folgen. Tumor-Genome sind wichti-ge Informationsquelle, sind aber schwierig zu vergleichen,da zwei Tumore selten die selben Mutationen haben. Mitnetwork-based stratification (NBS) konnen Tumor-Genomemit Gennetzwerken integriert werden. Dies erlaubt die iden-tifizierung von Unterarten durch clustering von Mutationenin ahnlichen Netzwerkregionen. Mithilfe des Modells konnenfur jede Unterart mRNA-Expressionssignaturen erstellt wer-den.

19