14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur...

43
1 4. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften und möglichen Wechselwirkungen von organischen Molekülen hängen eng mit ihren zugänglichen Konformationen zusammen. Die Wahrscheinlichkeit, daß eine bestimmte Konformation bei Raumtemperatur eingenommen wird, hängt über die Boltzmann- Verteilung von ihrer Energie ab. In Anwendungen wie der Vorhersage von Drug-Aktivitäten ist man daher daran interessiert, alle Konformationen mit einer Energie nahe des globalen Energie-minimums zu identifizieren (z.B. innerhalb von 10 kJ mol -1 ). Dies ist das Problem der Konformationssuche. Allerdings ist die Dimension des Konformationsraums 3N-6, wobei N die Anzahl der Atome eines Moleküls ist. Bereits für kleine Moleküle gibt es daher eine enorme Anzahl an lokalen Energieminima.

Transcript of 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur...

Page 1: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

1 4. Vorlesung SS 2005

Computational Chemistry

V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling

Die Eigenschaften und möglichen Wechselwirkungen von organischen Molekülen

hängen eng mit ihren zugänglichen Konformationen zusammen.

Die Wahrscheinlichkeit, daß eine bestimmte Konformation bei Raumtemperatur

eingenommen wird, hängt über die Boltzmann-Verteilung von ihrer Energie ab.

In Anwendungen wie der Vorhersage von Drug-Aktivitäten ist man daher daran

interessiert, alle Konformationen mit einer Energie nahe des globalen Energie-

minimums zu identifizieren (z.B. innerhalb von 10 kJ mol-1).

Dies ist das Problem der Konformationssuche.

Allerdings ist die Dimension des Konformationsraums 3N-6, wobei N die Anzahl

der Atome eines Moleküls ist. Bereits für kleine Moleküle gibt es daher eine

enorme Anzahl an lokalen Energieminima.

Lesehinweis:

Kapitel 10 aus [Schlick]

Page 2: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

2 4. Vorlesung SS 2005

Computational Chemistry

Warum kT ?

Entsprechend dem Äquipartitionsprinzip hat jeder Freiheitsgrad eines Moleküls

(d.h. eine bestimmte Bindungslänge, ein Bindungswinkel etc.)

im Mittel die Energie kT, wobei

k kB die Boltzmann-Konstante ist kB = 1,381 10-23 J K-1

und T die herrschende Temperatur.

Bei Raumtemperatur (25 º C) ist

kT 2.5 kJ mol-1

Ein Molekül ist ständig in Bewegung, d.h. es fliessen

ständig kleine Energiebeiträge zwischen den einzelnen

Freiheitsgraden hin und her.

Das Molekül ist also stets in der Lage, kleine Energiebarrieren

in der Grösse von ein paar kT zu überwinden.

Ludwig Boltzmann1844 - 1906

Page 3: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

3 4. Vorlesung SS 2005

Computational Chemistry

Energiehyperflächen, Methoden zur Energieminimierung und zum

Konformationssampling

kleine Moleküle mit wenigen Freiheitsgraden:

systematische Durchsuche des Konformationsraums (Sampling) möglich

große Moleküle (Proteine) mit vielen Freiheitsgraden:

verwende stochastische Suchmethoden

• Energieminimimierung findet lokales Minimum

• Die Frage ist, was wir möchten

– globales Energieminimum

– alle Minima geringer Energie

– die gesamte Oberfläche der PES einschliesslich Sattelpunkte und Maxima

– Einzelmoleküle oder Molekül-Ensembles

• unterschiedliche Aufgaben erfordern unterschiedliche Methoden

und unterschiedlich viel Aufwand

Page 4: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

4 4. Vorlesung SS 2005

Computational Chemistry

Interne Koordinaten kartesische Koordinaten

Interne Koordinaten: definieren die Positionen aller Atome eines Moleküls relativ

zur Position eines ausgezeichneten Atoms (‘Aufpunkt’) durch Angabe von

Bindungslängen, Bindungswinkeln und Torsionswinkeln.

z-Matrix: begegnet uns wieder in Vorlesung 7.

Kartesische Koordinaten: definieren Position jedes Atoms i im Raum

durch 3 Koordinaten (xi,yi,zi).

Ein Molekül mit N Atomen hat daher 3N unabhängig voneinander variierbare

Koordinaten = Freiheitsgrade.

Üblicherweise hält man den Gesamtschwerpunkt des Systems im Raum fest.

Damit legt man 6 Koordinaten fest = 3 Translations- und 3 Rotationsfreiheitsgrade.

Es bleiben also 3N – 6 Freiheitsgrade übrig.

Page 5: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

5 4. Vorlesung SS 2005

Computational Chemistry

Energiehyperfläche

Page 6: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

6 4. Vorlesung SS 2005

Computational Chemistry

Energiehyperfläche

f = (x-2)2 + (y+1)2

Einfache Energiehyperflächen kann man entweder als Hyperfläche (links)

oder als Contour-Plot (rechts) darstellen.

Ran Friedmanbioinfo.tau.ac.il/Protein_Visualization_01-02/Lesson%207/Introduction_Prot_Simul.ppt

Page 7: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

7 4. Vorlesung SS 2005

Computational Chemistry

Energiehyperfläche: Drehung um 2 Torsionswinkel

Vom globalen Minimum links

unten geht es in beide

Richtungen bergauf.

Gerader Verlauf:

die Drehung um beide

Torsionswinkel ist energetisch

recht unabhängig voneinander.

http://www.brunel.ac.uk/depts/chem/ch241s/re_view/gridview/paper/paper.htm

Page 8: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

8 4. Vorlesung SS 2005

Computational Chemistry

Energiehyperfläche

Wo ist Sattelpunkt?

Was erwarten Sie im Bereich

von 0 bis 180 Grad für beide

Diederwinkel?

http://www.brunel.ac.uk/depts/chem/ch241s/re_view/gridview/paper/paper.htm

Page 9: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

9 4. Vorlesung SS 2005

Computational Chemistry

Energiehyperfläche

Energiehyperfläche für eine

chemische Reaktion.

http://www.brunel.ac.uk/depts/chem/ch241s/re_view/gridview/paper/paper.htm

Page 10: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

10 4. Vorlesung SS 2005

Computational Chemistry

• Gradient – die erste Ableitung der Energie E bezüglich der Koordinaten

kartesische Koordinaten x, y, z

interne Koordinaten l, ,

Kraft

• Stationäre Punkte - Punkte auf der Energiehyperfläche, in denen der

Gradient (bzw. die Kraft) gleich Null ist.

Dies sind Maxima, Minima, Übergangszustände und Sattelpunkte.

Energiehyperfläche: Gradient

E

bzw

Ex

E EF

r y

Ez

Fr

Page 11: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

11 4. Vorlesung SS 2005

Computational Chemistry

• Für eine stetige und zweimal differenzierbare Funktion f ist

g(x) =(g1, ..., gN) der Gradientenvektor der ersten Ableitungen

• Die N N Matrix der zweiten Ableitungen heisst Hess’sche-Matrix.

• In einem Minimum ist die Krümmung positiv.

In höheren Dimensionen wird Konvexität in einem Punkt x* als positive

Definitheit der Hess’schen Matrix bezeichnet:

Positive Definitheit garantiert, daß alle Eigenwerte in x* positiv sind.

Energiehyperfläche: Hess’sche Matrix

ji

ij xx

xfxH

2

i

i x

xfxg

00* yyxHyT

Page 12: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

12 4. Vorlesung SS 2005

Computational Chemistry

• Eine positiv-semidefinite Matrix hat nichtnegative Eigenwerte.

• Eine negativ-semidefinite Matrix hat nichtpositive Eigenwerte.

• Eine negativ-definite Matrix hat lediglich negative Eigenwerte.

• Ansonsten ist die Matrix indefinit.

Energiehyperfläche: Definitionen

Stationäre Punkte

sind fett markiert.

Page 13: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

13 4. Vorlesung SS 2005

Computational Chemistry

Vorzeichen der zweiten Ableitungen

• Durch Diagonalisierung der Hess’schen Matrix erhält man Eigenvektoren, die

die normalen ( = orthogonalen) Schwingungsmoden des Moleküls sind.

Die zugehörigen Eigenwerte sind proportional zum Quadrat der jeweiligen

Schwingungsfrequenz..

• Das Vorzeichen der zweiten Ableitungen entscheidet, ob es sich bei stationären

Punkten auf der PES um Maxima oder um Minima handelt, da mit einer

Frequenzrechnung das Vorzeichen der Schwingungsfrequenzen bestimmt

wird. Damit lässt sich auch endgültig klären, ob eine Konformation tatsächlich

ein Minimum auf der PES ist

• Minima auf der PES besitzen nur positive Eigenwerte bzw. reelle

Schwingungsfrequenzen

• Maxima oder Sattelpunkte (Maximum in einer Richtung, aber Minima in allen

anderen Richtungen) besitzen eine oder mehrere imaginäre Schwingungs-

frequenzen. (Die Quadratwurzel aus einer negativen Zahl ergibt eine imaginäre

Zahl).

Page 14: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

14 4. Vorlesung SS 2005

Computational Chemistry

Algorithmen zur Energieminimierung

Lokales Minimum:

Für einen Vektor x mit n Komponenten {xi} lautet das Minimierungsproblem

minx { f(x) }, x D n. Dann ist x ein lokales Minimum und

f( x) < f(y) y D n, y x

Globales Minimum:

x n ist ein globales Minimum f( x) < f(y) y n x

[Schlick 10.2.4]

Page 15: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

15 4. Vorlesung SS 2005

Computational Chemistry

Methode, die nur die Energiewerte verwendet ...

• Am einfachsten zu implementieren.

• Läuft in eine Richtung bis die Energie

ansteigt, dreht dann um die

Suchrichtung um 90º, etc.

• ist am wenigsten effizient

– viele Schritte notwendig

– Schritte sind nicht gerichtet

• wird daher selten verwendet.

Page 16: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

16 4. Vorlesung SS 2005

Computational Chemistry

Grundlegende algorithmische KonzepteDie grundlegende Struktur von iterativen, lokalen Optimierungsalgorithmen ist die

des “greedy descent”.

D.h. ausgehend von einem Startpunkt x0 wird eine Sequenz von Schritten {xk}

erzeugt, wobei bei jeder Iteration versucht wird, den Wert der Zielfunktion f(x) zu

verringern.

Es gibt 2 Klassen von Algorithmen: line-search und trust-region.

Beide sind weitverbreitet und sind Bestandteile von Optimierungsmethoden, die von

jedem Startpunkt aus die Konvergenz zu einem lokalen Minimum garantieren.

Beide Methoden sind gleichermaßen empfehlenswert.

Page 17: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

17 4. Vorlesung SS 2005

Computational Chemistry

Line-Search basierender Descent Algorithmus [A1]

Von einem gegebenen Anfangspunkt x0 aus, führe für k = 0, 1, 2, … die folgenden

Schritte so lange aus bis Konvergenz eintritt.

(1) Überprüfe xk auf Konvergenz

(2) Berechne eine Abstiegs-Richtung pk

(3) Bestimme eine Schrittweite k durch eine 1-dimensionale Suche so dass für

den neuen Positionsvektor xk+1 = xk + k pk und den entsprechenden Gradient

gk+1 gilt:

(“ausreichende Abnahme”)

(“ausreichende Verringerung der

gerichteten Ableitung”)

z.B. = 10-4, = 0.9 in Newton-Methoden

(4) Setze xk+1 = xk + k pk und k k + 1 und gehe zurück nach (1)

10

und

1

1

mit

ff

kTkk

Tk

kTkkkk

pgpg

pgxx

Page 18: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

18 4. Vorlesung SS 2005

Computational Chemistry

[A1] (2): Richtung der Abnahme

Eine solche Richtung pk ist eine Richtung, entlang derer die Funktion f lokal

abnimmt.

Solch einen Vektor kann man durch definieren.

Für genügend kleine gilt dann:

0kTkpg

0

2

2

pxg

pxHppxgxpx

T

TTff

Page 19: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

19 4. Vorlesung SS 2005

Computational Chemistry

Steepest Descent (SD)

Die einfachste Möglichkeit, eine gültige Abnahme-Richtung vorzugeben, ist

zu setzen:

Damit ist automatisch erfüllt

kk gp

0...

...

...

223

22

21

3

2

1

321

n

n

n

kTkk

Tk

gggg

g

g

g

g

gggg

ggpg

Page 20: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

20 4. Vorlesung SS 2005

Computational Chemistry

Steepest Descent (SD) Methode in der Praxis• Ist die einfachste häufig verwendete Methode

• folgt wie oben erwähnt jeweils dem negativen

Gradienten g (also der grössten Kraft)

d = - g

• man legt meist einen minimalen und maximalen

Wert für die Verschiebung der Koordinaten fest

• jenach, wie steil der Gradient ist, wird die

Schrittweite vergrössert oder verkleinert

• SD ist die schnellste Methode, wenn man eine

schlechte Startgeometrie besitzt

• konvergiert langsam in der Nähe des Minimums

• kann dort um das Minimum oszillieren

Page 21: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

21 4. Vorlesung SS 2005

Computational Chemistry

Conjugate Gradient (CG) Methode• verwendet die ‘Geschichte’ der Minimierung,

also den vorherigen Wert di-1.

di = - gi + i-1 di-1

• Im Gegensatz zu SD wird also implizit die

Information der zweiten Ableitungen

verwendet um die Suche zu steuern.

• Es gibt viele Varianten von CG wie

Fletcher-Reeves, Davidon-Fletcher-Powell

und Polak-Ribiere Methoden.

• CG konvergiert wesentlich schneller in der

Nähe des Minimums als SD!

Page 22: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

22 4. Vorlesung SS 2005

Computational Chemistry

Methoden mit zweiter Ableitung• Die zweite Ableitung der Energie E bezüglich der (kartesischen)

Koordinaten r – die Hess’sche Matrix H(r) – bestimmt den Suchpfad.

Entwickle E(r) um r

Dann ist der Newton-Raphson Schritt

• fi ist die Projektion des Gradienten entlang des

Hess’schen Eigenvektors mit Eigenwert i.

• Ist rechenaufwendiger, aber gewöhnlich

schnell und zuverlässig, besonders in

der Nähe des Minimums.

• Varianten: Quasi-Newton (QN), Newton-Raphson ...

0 0 0 0

12

ttE E r r g r r r r H r r

' ' ', ii i

i i

fx x

r

Page 23: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

23 4. Vorlesung SS 2005

Computational Chemistry

Trust-Region basierender Descent Algorithmus [A2]

Nimm an, daß in einer inneren Region eine quadratische Funktion qk als Näherung

an f existiert, der man “vertrauen kann”. Es reicht dann aus, das Minimum dieser

quadratischen Funktion zu finden.

Algorithmus:

Von einem gegebenen Anfangspunkt x0 aus, führe für k = 0, 1, 2, … die folgenden

Schritte so lange aus bis Konvergenz eintritt.

(1) Überprüfe xk auf Konvergenz

(2) Berechne einen Schritt sk durch Lösen des Subproblems

wobei qk das quadratische Model der Zielfunktion ist:

Dies gilt für s innerhalb einer Schranke k > 0.

Ausgedrückt mit einer Skalierungsmatrix Dk gilt

(3) Setze xk+1 = xk + sk und k k + 1 und gehe zurück nach (1)

sqksmin

sHssgxs kTT

kkk fq2

1

kk sD

Page 24: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

24 4. Vorlesung SS 2005

Computational Chemistry

praktische Empfehlungen

• Benutze viele Startwerte

• Vergleiche Ergebnisse mehrerer Algorithmen (bzw. mehrerer Kraftfelder)

• überprüfe Eigenwerte im Minimum.

Bis auf 6 Eigenwerte, die fast gleich Null sein sollten und die Translations- und

Rotationsinvarianz wiederspiegeln, sollten alle positiv sein.

[Schlick, Kap. 10.7]

Page 25: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

25 4. Vorlesung SS 2005

Computational Chemistry

Verfahren um das globale Energie-Minimum zu finden

• Systematische Variation der Torsionswinkel

• Randomization-minimization (Monte Carlo)

• Moleküldynamik (Newton’sche Bewegungsgleichung)

• Simulated Annealing (reduziere Temperatur während MD Simulation)

• Genetische Algorithmen (man startet wird einer Menge von Konformationen;

kleine Veränderungen; behalte die der geringsten Energie; wiederhole diese

Schritte)

• Reine Zufallssuche (funktioniert am schlechtesten)

Page 26: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

26 4. Vorlesung SS 2005

Computational Chemistry

Systematische Variation der Torsionswinkel

Für N rotierbare Bindungen eines Moleküles, die mit

Auflösung d abgesucht werden sollen, gibt es Nd

Konformationen.

Dies geht nur bei kleiner Anzahl von Freiheitsgraden,

da sonst kombinatorische Explosion.

NIH guide to molecular modellinghttp://cmm.info.nih.gov/modeling/guide_documents/sybyl

Page 27: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

27 4. Vorlesung SS 2005

Computational Chemistry

Systematische Variation der Torsionswinkel: Gridsuche

Vorgabe: Struktur soll bestimmte Distanzen aus NMR-Messung erfüllen.

Lisa T. KelloggPhD thesis, MIT

Page 28: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

28 4. Vorlesung SS 2005

Computational Chemistry

Systematische Variation der Torsionswinkel: Baumsuche

Lisa T. KelloggPhD thesis, MIT

Page 29: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

29 4. Vorlesung SS 2005

Computational Chemistry

moderne Verfahren: Teile und Herrsche (Divide-and-Conquer)

Lisa T. KelloggPhD thesis, MIT

• schließe Regionen des Konformationsraums aus aufgrund der Bewertung

von Unterproblemen niedriger Dimensionalität

• verbessere Baumsuche

– bewerte jedes Stück bevor neue Aufgabe in Angriff genommen wird

– nachdem Unterproblem gelöst ist, speichere Ergebnis

– durch Zerlegung in Unterprobleme sind diese im Mittel leichter zu lösen

als bei der Baumsuche

Page 30: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

30 4. Vorlesung SS 2005

Computational Chemistry

Stochastische Methoden

Stochastische Suchverfahren, die nur wichtige Bereiche des Konformationsraums

durchsuchen ("importance sampling„) können wesentlich effizienter für

Konformationssampling in grossen Molekülen sein als systematische Methoden.

(1) Beginne mit Anfangskonfiguration; minimiere diese Struktur bezüglich Energie

(2) Wähle beliebige Anzahl an Torsionswinkeln dieser Konformation und variiere sie

zufällig. Dann minimiere die Konformation

(3) Benutze ein Energiekriterium um zu entscheiden, ob die neue Konformation

akzeptiert wird. Falls ja, fahre fort, sonst gehe zurück zu 1.

(4) Vergleiche die neue Struktur gegen die Menge aller alten Strukturen. Falls es

eine neue Konformation ist, speichere sie ab.

(5) Gehe zurück zu Schritt 2

(6) Beende die Suche wenn keine neuen Strukturen mehr gefunden werden.

Page 31: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

31 4. Vorlesung SS 2005

Computational Chemistry

Anmerkungen zu Strukturen minimaler Energie

• Was bedeutet die Struktur des globalen Energieminimums eigentlich?

Sie ist bei Raumtemperatur nämlich gar nicht populiert/besetzt/zugänglich.

• Benutzen Reaktionen/Wechselwirkungen notwendigerweise diese

Geometrien minimaler Energie?

• Welche anderen Konformationen niedriger Energie sind verfügbar?

Boltzmann-Ensemble

Page 32: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

32 4. Vorlesung SS 2005

Computational Chemistry

Boltzmann-Verteilung(1) In einem System mit N Teilchen sei Teilchenzahl konstant.

(2) Gesamtenergie des Systems sei konstant.

D.h. es gibt Energieaustausch zwischen den Teilchen, aber nicht mit der Umgebung.

(3) Wenn solch ein System im Gleichgewicht ist, ist die Energie der Teilchen E

entsprechend einer Boltzmann-Verteilung populiert:

00 exp E

ENEN

Boltzmann-verteilte Systeme findet man in vielen Bereichen der

Physikalischen Chemie.

Page 33: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

33 4. Vorlesung SS 2005

Computational Chemistry

PhasenraumdichteDie Wahrscheinlichkeitsdichte im Phasenraum (= kurz die “Phasenraumdichte”) ist

im kanonischen Ensemble proportional zum Boltzmann-Faktor:

XEXNVT exp

wobei E die Gesamtenergie des Systems ist und = kBT.

Für zwei Zustände des Systems X und X’ lautet das Verhältnis ihrer Wahrscheinlich-

keiten:

'

,exp'

XEXEE

EX

X

NVT

NVT

Page 34: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

34 4. Vorlesung SS 2005

Computational Chemistry

Phasenraumdichte

Der Normalisierungsfaktor der ersten Gleichung ist die Zustandssumme des

gesamten Phasenraums (Raum der 3N Koordinaten und 3N Geschwindigkeiten):

dxxENh

Q

Q

XE

NhX

NNVT

NVTNNVT

exp!

1

exp

!

1

3

3

Der Erwartungswert einer Observablen A des Systems lässt sich darstellen als:

dxxAxxA NVTNVT

Im Metropolis-Algorithmus erzeugt man eine geeignete Markov-Kette von

Konfigurationen, so dass der Erwartungswert von A als einfacher Mittelwert folgt:

M

ii

MNVT

xAM

xA1

1lim

Page 35: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

35 4. Vorlesung SS 2005

Computational Chemistry

Markov-Kette

Betrachte Markov-Kette von N molekularen Zuständen {X1, X2, X3, ...} mit einer

Verteilung NVT(X) für N .

In einer Markov-Kette gehört jeder Zustand zu einer endlichen Menge an

Zuständen aus dem Zustandsraum D0 D.

Für die konditionelle Verteilung jedes Zustands P bezüglich aller vorherigen

Zustände gilt: nnnn XDXPXXDXP 01001 ,...,

d.h. das Ergebnis Xn+1 hängt nur von Xn ab.

Der Metropolis-Algorithmus erzeugt eine stochastische und ergodische

Übergangsmatrix für die Markovkette, so dass die Verteilung für jeden Zustand Xi

im Limit i = NVT (Xi) ist.

So wird eine Phasenraumtrajektorie im kanonischen Ensemble erzeugt.

Page 36: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

36 4. Vorlesung SS 2005

Computational Chemistry

mikroskopische Reversibilität (“detailed balance”)

Lege Übergangsmatrix fest durch Definition einer Übergangswahrscheinlichkeit für

jeden Übergang von Xi nach Xj, so dass mikroskopische Umkehrbarkeit erfüllt ist:

jijiji

Das Verhältnis der Übergangswahrscheinlichkeiten hängt damit nur vom

Energieunterschied zwischen den Zuständen i und j ab:

jiij

ijij

ji

j

i

XEXEE

E

exp

Page 37: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

37 4. Vorlesung SS 2005

Computational Chemistry

Metropolis AlgorithmusDie am häufigsten verwendete Technik zur Auswahl von Konformeren („importance

sampling“) mittels Monte-Carlo-Methoden ist der Metropolis Algorithmus:

(1) konstruiere Anfangskonfiguration des Moleküls

(2) führe zufällige Änderung eines Freiheitsgrades (z.B. eines Torsionswinkel)

durch.

(3) berechne Änderung der Energie E aufgrund dieser Änderung der

Konformation.

(4) falls E < 0 akzeptiere die neue Konfiguration

falls E > 0 berechne die Wahrscheinlichkeit

erzeuge Zufallszahl r im Intervall [0,1]

akzeptiere die neue Konfiguration, falls w r, sonst verwerfe sie.

Da die Boltzmann-gewichtete Energiedifferenz mit einer Zufallszahl verglichen

wird, werden auch vereinzelt Konformere hoher Energie akzeptiert. Daher erhält

man ein Ensemble (Menge) von Konformationen mit einer Energieverteilung

entsprechend einer Boltzmann-Verteilung.

Tk

Ew

B

exp

Page 38: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

38 4. Vorlesung SS 2005

Computational Chemistry

Moleküldynamik-Simulation

Basiert auf Newtonscher Bewegungsgleichung für ein Atom i eines Moleküls:

wobei Fi die Kraft, mi seine Masse und

die Beschleunigung ist, die auf Atom i wirkt.

Die Kräfte lassen sich aus den Ableitungen der Energie nach den kartesischen

Koordinaten ausrechnen.

• Die Trajektorie eines Systems ist die Aneinanderreihung der einzelnen Koordinaten

und Geschwindigkeiten, also ein Film, der die Dynamik des Systems zeigt.

• Ein Ensemble ist eine Menge von Konfigurationen, aus den man Eigenschaften des

Systems berechnen kann (mittlere Energie, Wärmekapazität ...)

• mehr zu MD-Simulationen folgt in Vorlesung 4

2

2i imt

r

F

2

2i

it

r

a

Page 39: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

39 4. Vorlesung SS 2005

Computational Chemistry

was bedeutet Moleküldynamik ?

Konformationelle Koordinate

Ene

rgie

= p

oten

tielle

Ene

rgie

+ k

inet

isch

e E

nerg

ie

Energie, die dem minimierten System zu Beginn der Simulation mitgeben wird.

Konformation kann nicht durch Standard-MD erreicht werden;MD ist also nicht optimal für Suche des Konformationsraums!

Startkonfiguration

lokalesMinimum

Page 40: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

40 4. Vorlesung SS 2005

Computational Chemistry

Simulated Annealing

Beginne Konformationssampling (z.B. mit Moleküldynamik) bei hoher Temperatur

um Energiebarrieren leicht zu überwinden. Kühle Simulationstemperatur dann ab.

Viele verschiedene Abkühlstrategien möglich:

http://members.aol.com/btluke/simanf1.htm

Simulationszeit

Te

mp

era

tur

Davon ist keine “richtig” oder “falsch”. Wichtig ist, was praktisch funktioniert.

Page 41: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

41 4. Vorlesung SS 2005

Computational Chemistry

Genetische Algorithmen (GA)• Genetische Algorithmen basieren auf dem Prinzip der Vererbung und dem

Überleben des am besten Angepassten, “survival of the fittest”.

• Starte Konformationssuche in lokalem Minimum (lokalen Minima). Eine

“Generation” i enthalte N Konformationen (z.B. N = 100).

• Die nächste Generation i+1 unterliegt natürlicher Selektion, d.h. wir behalten

die N/Faktor Strukturen aus Generation i mit den niedrigsten Energien und

erzeugen im Sinne der “Evolution” neue Konformationen durch kleine

“Mutationen” der Elternkonformationen, also z.B. Änderungen der

Bindungswinkel und Torsionswinkel.

• Interessant werden GAs durch Genduplikation und Cross-over.

Page 42: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

42 4. Vorlesung SS 2005

Computational Chemistry

Genetische Algorithmen (GA)

Bsp. lineares n-mer Peptid mit 2n Diederwinkeln des Rückgrats.

Angenommen, es wurden 2 Konformationen gefunden, in denen entweder die erste

Hälfte des Peptids eine energetisch günstige Konformation einnimmt oder die

zweite.

Eine vorteilhafte “cross-over” Mutation kombiniert nun die zwei günstigen Hälften

des Moleküls miteinander.

Page 43: 14. Vorlesung SS 2005 Computational Chemistry V4: Energiehyperflächen, Methoden zur Energieminimierung und zum Konformationssampling Die Eigenschaften.

43 4. Vorlesung SS 2005

Computational Chemistry

Sampling des Konformationsraums

Zurück zu der anfänglich gestellten Frage:

Was möchten wir charakterisieren?

– Verfeinerung einer experimentellen Struktur bei geringer Auflösung

(lokales Energieminimum)

– globales Energieminimum

– alle Minima geringer Energie

– die gesamte Oberfläche der PES einschliesslich Sattelpunkte und Maxima

– Einzelmoleküle oder Molekül-Ensembles?

Zu jedem dieser Problem gibt es einfache oder mächtige Methoden, die die

Lösung prinzipiell finden können.

In den Fällen grosser Moleküle mit vielen Freiheitsgraden ist eine perfekte

Lösung jedoch oft nicht praktikabel.