Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie...

137
Theoretische Physik II: Analytische Mechanik und Grundlagen der Thermodynamik Version SS 2015 — Tilman Plehn Original von Matthias Bartelmann 1. September 2015

Transcript of Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie...

Page 1: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

Theoretische Physik II: AnalytischeMechanik und Grundlagen der

Thermodynamik

Version SS 2015 — Tilman PlehnOriginal von Matthias Bartelmann

1. September 2015

Page 2: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

i

• stellen Sie Fragen!

• sollten Sie Werbung fur die Fachschaft oder anderes studentischesEngagement machen wollen, dann melden Sie sich gerne bei mir.

• Informationen zum Beispiel zur Organisation der Vorlesung undder Ubungen gibt es in der Vorlesung.

• die erste Ubung ist eine Prasenzubung.

• Ubungsblatter konnen gerne in Kleingruppen bearbeitet werden.Die Losungen werden einzeln abgegeben, und mussen in derUbungsgruppe vorgerechnet werden konnen.

• die letzte Vorlesung findet am 9.7. statt.

• die Woche des 13.7. dient der Klausurvorbereitung (study week).

• 60% der Ubungspunkte sind die Voraussetzung fur die Klausur-zulassung.

• die beste Vorbereitung fur die Klausur sind die Ubungsblatter.

• es gibt nur eine Klausur am 18.7 von 9:15-13:00

• zur Klausur konnen Sie ein doppelseitig beschriebenes oder. be-drucktes DIN-A4-Blatt mitnehmen, weitere Hilfsmittel werdennicht benotigt.

• es gibt eine Nachklausur am Ende der Semesterferien. Wer zumBeispiel aus Krankheitsgrunden nur einen Teil der ersten Klau-sur(en) schreiben konnte melde sich bitte bei Johann Brehmer.

Herzlichen Dank an viele Studentinnen und Studenten, die das Skriptkommentiert und korrigiert haben und damit sehr dazu beigetragen ha-ben, es zu verbessern und verstandlicher zu machen!

Page 3: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

Inhaltsverzeichnis

1 Schwingungen gekoppelter Systeme 1

1.1 Parametrisierte Koordinaten . . . . . . . . . . . . . . 2

1.2 Normalkoordinaten . . . . . . . . . . . . . . . . . . . 5

1.2.1 Transformation auf Normalkoordinaten . . . . 5

1.2.2 Bestimmung der Normalkoordinaten . . . . . . 6

1.2.3 Stabilitat . . . . . . . . . . . . . . . . . . . . 7

1.2.4 Gekoppelte Pendel . . . . . . . . . . . . . . . 9

1.3 Dreiatomiges Molekul (nicht in Vorlesung) . . . . . . 10

1.3.1 Kinetische und potentielle Energie . . . . . . . 10

1.3.2 Normalkoordinaten . . . . . . . . . . . . . . . 10

2 Systeme mit Nebenbedingungen 13

2.1 Vorbereitung . . . . . . . . . . . . . . . . . . . . . . 13

2.1.1 Verallgemeinerte Koordinaten . . . . . . . . . 13

2.1.2 Lagrange-Multiplikatoren . . . . . . . . . . . 14

2.2 Das d’Alembertsche Prinzip . . . . . . . . . . . . . . 16

2.2.1 Zwangskrafte im Gleichgewicht . . . . . . . . 16

2.2.2 Dynamische Systeme . . . . . . . . . . . . . . 18

2.2.3 Lagrange-Gleichungen erster Art . . . . . . . 20

3 Lagrange-Formulierung 23

3.1 Lagrange-Gleichungen zweiter Art . . . . . . . . . . . 23

3.1.1 Herleitung . . . . . . . . . . . . . . . . . . . 23

3.1.2 Beispiele . . . . . . . . . . . . . . . . . . . . 25

ii

Page 4: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

INHALTSVERZEICHNIS iii

3.1.3 Beschleunigte Bezugssysteme . . . . . . . . . 25

3.2 Kreiselbewegung . . . . . . . . . . . . . . . . . . . . 27

3.2.1 Kraftefreier symmetrischer Kreisel . . . . . . . 27

3.2.2 Eulersche Gleichungen (nicht in Vorlesung) . . 29

3.2.3 Kreisel im Schwerefeld . . . . . . . . . . . . . 31

4 Extremalprinzipien 34

4.1 Prinzip der stationaren Wirkung . . . . . . . . . . . . 34

4.1.1 Das Fermatsche Prinzip . . . . . . . . . . . . 34

4.1.2 Hamiltons Prinzip . . . . . . . . . . . . . . . 35

4.2 Hamilton-Funktion . . . . . . . . . . . . . . . . . . . 37

4.2.1 Die kanonischen Gleichungen . . . . . . . . . 37

4.2.2 Hamilton-Funktion und Energie . . . . . . . . 39

4.2.3 Hamilton-Gleichungen und Wirkungsprinzip . 41

5 Symmetrien und Erhaltungssatze 43

5.1 Galilei-Invarianz . . . . . . . . . . . . . . . . . . . . 43

5.2 Noether-Theoreme . . . . . . . . . . . . . . . . . . . 45

5.3 Lorentz-Invarianz (nicht in Vorlesung) . . . . . . . . . 48

5.3.1 Spezielle Lorentztransformation . . . . . . . . 48

5.3.2 Der Minkowski-Raum . . . . . . . . . . . . . 49

6 Analytische Mechanik 52

6.1 Kanonische Transformationen . . . . . . . . . . . . . 52

6.1.1 Bahnen im erweiterten Phasenraum . . . . . . 52

6.1.2 Kanonische Transformationen . . . . . . . . . 54

6.1.3 Hamilton-Jacobi-Gleichung . . . . . . . . . . 55

6.1.4 Harmonischer Oszillator . . . . . . . . . . . . 56

6.1.5 Bewegung des freien Massenpunkts . . . . . . 57

6.2 Liouvillescher Satz, Poisson-Klammern . . . . . . . . 58

6.2.1 Liouvillescher Satz . . . . . . . . . . . . . . . 59

Page 5: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

INHALTSVERZEICHNIS iv

6.2.2 Poisson-Klammern . . . . . . . . . . . . . . . 59

7 Stabilitat und Chaos 61

7.1 Stabilitat . . . . . . . . . . . . . . . . . . . . . . . . . 61

7.1.1 Bewegung in der Nahe des Gleichgewichts . . 61

7.1.2 Asymmetrischer Kreisel . . . . . . . . . . . . 63

7.1.3 Satze zur Stabilitat . . . . . . . . . . . . . . . 65

7.1.4 Attraktoren und van-der-Pol-Gleichung . . . . 66

7.2 Chaos in der Himmelsmechanik . . . . . . . . . . . . 66

7.2.1 Saturnmond Hyperion . . . . . . . . . . . . . 66

7.2.2 Chaotisches Taumeln auf der Ellipsenbahn . . 68

8 Statistische Physik 70

8.1 Grundpostulat . . . . . . . . . . . . . . . . . . . . . . 70

8.1.1 Mikro- und Makrozustande . . . . . . . . . . . 70

8.1.2 Phasenraum . . . . . . . . . . . . . . . . . . . 71

8.1.3 Der Liouvillesche Satz . . . . . . . . . . . . . 72

8.1.4 Ubergang ins Gleichgewicht . . . . . . . . . . 73

8.1.5 Anzahl zuganglicher Zustande . . . . . . . . . 74

8.2 Wechselwirkungen zwischen Systemen . . . . . . . . 75

8.2.1 Mechanische Arbeit und Warme . . . . . . . . 75

8.2.2 Unvollstandige Differentiale . . . . . . . . . . 77

8.2.3 Quasistatische Zustandsanderungen . . . . . . 78

9 Temperatur und Entropie 80

9.1 Thermisches Gleichgewicht . . . . . . . . . . . . . . . 80

9.1.1 Reversible Zustandsanderungen . . . . . . . . 80

9.1.2 Temperatur . . . . . . . . . . . . . . . . . . . 81

9.1.3 Energieverteilung . . . . . . . . . . . . . . . . 83

9.2 Entropie . . . . . . . . . . . . . . . . . . . . . . . . . 83

9.2.1 Definition . . . . . . . . . . . . . . . . . . . . 83

Page 6: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

INHALTSVERZEICHNIS v

9.2.2 Erster Hauptsatz . . . . . . . . . . . . . . . . 85

9.3 Maxwell-Boltzmann-Verteilung . . . . . . . . . . . . 87

9.3.1 Maxwell-Verteilung . . . . . . . . . . . . . . 87

9.3.2 Boltzmann-Verteilung . . . . . . . . . . . . . 89

9.4 Beispiele (nicht in Vorlesung) . . . . . . . . . . . . . 89

9.4.1 Verlauf einer Adiabate . . . . . . . . . . . . . 89

9.4.2 Helium-Diffusion . . . . . . . . . . . . . . . . 90

9.4.3 Fermi-Druck . . . . . . . . . . . . . . . . . . 91

10 Thermodynamik 93

10.1 Thermodynamische Beziehungen . . . . . . . . . . . . 93

10.1.1 Eindeutigkeit der Entropie . . . . . . . . . . . 93

10.1.2 Thermisches und mechanisches Gleichgewicht 94

10.1.3 Warmekapazitat und spezifische Warme . . . . 95

10.2 Ideales Gas . . . . . . . . . . . . . . . . . . . . . . . 96

10.2.1 Zustandsgleichung . . . . . . . . . . . . . . . 96

10.2.2 Spezifische Warmen und Entropie . . . . . . . 97

10.2.3 Adiabatische Expansion . . . . . . . . . . . . 99

10.2.4 Erweiterungen (nicht in Vorlesung) . . . . . . 100

10.3 Thermodynamische Funktionen . . . . . . . . . . . . 101

10.3.1 Legendre-Transformationen . . . . . . . . . . 101

10.3.2 Enthalpie etc . . . . . . . . . . . . . . . . . . 103

10.3.3 Maxwell-Relationen . . . . . . . . . . . . . . 105

10.4 Anwendungen (nicht in Vorlesung) . . . . . . . . . . . 106

10.4.1 Spezifische Warmen . . . . . . . . . . . . . . 106

10.4.2 Entropie und Energie . . . . . . . . . . . . . . 108

11 Phasenubergange 111

11.1 Phasengleichgewicht . . . . . . . . . . . . . . . . . . 111

11.1.1 Extremaleigenschaften . . . . . . . . . . . . . 111

11.1.2 Chemisches Potential . . . . . . . . . . . . . . 113

Page 7: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

INHALTSVERZEICHNIS vi

11.1.3 Gibbssche Phasenregel . . . . . . . . . . . . . 114

11.1.4 Reaktionsgleichgewichte . . . . . . . . . . . . 115

11.2 Phasenubergang im Van der Waals-Gas . . . . . . . . 116

11.2.1 Van der Waals-Gas . . . . . . . . . . . . . . . 116

11.2.2 Kritische Isotherme . . . . . . . . . . . . . . . 117

11.2.3 Latente Warme . . . . . . . . . . . . . . . . . 119

12 Statistik 121

12.1 Wahrscheinlichkeitsverteilungen . . . . . . . . . . . . 121

12.1.1 Unsicherheiten . . . . . . . . . . . . . . . . . 121

12.1.2 Zentraler Grenzwertsatz . . . . . . . . . . . . 124

12.1.3 Daten vs Theorie . . . . . . . . . . . . . . . . 124

12.2 Satz von Bayes . . . . . . . . . . . . . . . . . . . . . 125

12.2.1 Bayesische Wahrscheinlichkeit . . . . . . . . . 126

12.2.2 Volumeneffekte . . . . . . . . . . . . . . . . . 127

12.2.3 Profile-Likelihood . . . . . . . . . . . . . . . 129

Page 8: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

Kapitel 1

Schwingungen gekoppelterSysteme

Im vergangenen Semester haben wir uns physikalisch vor allem mit derBewegung punktformiger Korper in Raum und Zeit befasst. Die ent-sprechenden Kapitel behandelten:

• Newtonsche Axiome und den freien Fall

• Bahnkurven, Energieerhaltung und konservative Krafte

• beschleunigte Bezugssysteme

• Bewegung starrer Korper

• Tragheit

• harmonische Oszillatoren

• Pendel

Die formale Grundlage aller dieser Systeme waren die NewtonschenAxiome, vor allem die Losung der Differentialgleichung zweiter Ord-nung, F = mx, mit dem Ergebnis einer Tajektorie x(t). Als alternativenWeg zur Beschreibung eines sich bewegenden Teilchens haben wir le-diglich Erhaltungssatze genutzt. Ein Beispiel war Energieerhaltung, diewir uber Newtonsche Mechanik und einen integrierenden Faktor abge-leitete hatten.

Zwei Aspekte haben wir in diesem Formalismus nicht wirklich zufrie-denstellend behandeln konnen. Erstens haben wir Randbedingungendurch eine geeignete Wahl der Koordinaten zwar elegant aber nicht sehrallgemein berucksichtigt. Zweitens haben wir nie wirklich Systeme mitmehr als einem Teilchen berechnet.

1

Page 9: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 1. SCHWINGUNGEN GEKOPPELTER SYSTEME 2

In diesem Semester werden wir diese beiden Einschrankungen umge-hen. Dazu brauchen wir einen neuen Formalismus, der die Newton-schen Axiome ersetzen sollte. Wir werden sehen, dass er sich grob ausder Idee der Energieerhaltung entwickeln lasst. Der erste Schritt in die-se Richtung ist aber eine verallgemeinerte Beschreibung der Bewegungvon Massenpunkten jenseits der ublichen, vom 3-dimensionalen Rauminspirierten Koordinaten.

1.1 Parametrisierte Koordinaten

Bei der Diskussion des Pendels war uns bereits ein Fall begegnet, indem die Koordinaten ~x durch einen Winkel φ ausgedruckt wurden, weilsich ein Massenpunkt auf einer Kreislinie in einer Ebene bewegt. Da-durch wird die Anzahl der Freiheitsgrade von drei auf einen reduziert.Ein weiteres Beispiel sind zwei Pendel, die durch eine Stange zwischenihren beiden Massen verbunden sind. Die Kopplung zwischen den Pen-deln reduziert die sechs Freiheitsgrade auf einen.

• Allgemein betrachten wir den N Massenpunkte, die so aneinan-der gekoppelt sind, so dass ihnen f Freiheitsgrade bleiben. ZurBeschreibung der Bewegung brauchen wir f Parameter qk(t), vondenen die Raumkoordinaten abhangen,

x j = x j[qk(t)] ⇒ x j =∂x j

∂qkqk (1.1)

Stellen wir die Parameter q j durch die Koordinaten xk dar, danngilt auch

q j =∂q j

∂xkxk oder

∂q j

∂xk=∂q j

∂xk. (1.2)

• Es muss moglich sein, auch die kinetische und die potentiel-le Energie durch die Parameter q j auszudrucken. Die kinetischeEnergie eines einzelnen Massenpunkts mi ist

Ti =mi

2~x2

i =mi

2∂~xi

∂q jq j

∂~xi

∂qkqk =

mi

2∂~xi

∂q j

∂~xi

∂qkq jqk , (1.3)

und die gesamte kinetische Energie ergibt sich durch die Summeuber alle Massenpunkte,

T (~q) =

f∑j=1

f∑k=1

N∑i=1

mi

2∂~xi

∂q j

∂~xi

∂qk

q jqk . (1.4)

Page 10: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 1. SCHWINGUNGEN GEKOPPELTER SYSTEME 3

• Nach dem zweiten Newtonschen Axiom lautet die Bewegungs-gleichung fur die Koordinate x j des Massenpunkts mi in einemkonservativen Kraftfeld

F j = mi x j = −∂V(~x)∂x j

. (1.5)

Mithilfe der kinetischen Energie des Massenpunkts lasst sich die-se Bewegungsgleichung durch

ddt∂Ti

∂xk= −

∂V(~x)∂xk

(1.6)

ausdrucken. Eine ganz ahnlich Relation hatten wir fur den inte-grierenden Faktor bei der Ableitung des Energiesatzes verwendet.Wenn wir hier die Parameter q j einfuhren, dann wird aus dieserRelation

ddt∂Ti(~q)∂q j

∂q j

∂xk= −

∂V(~q)∂q j

∂q j

∂xk. (1.7)

Wir setzen nun voraus, dass die Verknupfung der beiden Koordi-naten ∂q j/∂xk zeitunabhangig ist und erhalten mit (1.2)

ddt∂Ti

∂q j

∂q j

∂xk=

ddt∂Ti

∂q j

∂q j

∂xk=

(ddt∂Ti

∂q j

)∂q j

∂xk= −

∂V(~q)∂q j

∂q j

∂xk, (1.8)

was im Allgemeinen nur moglich ist, wenn

ddt∂Ti(~q)∂q j

= −∂V(~q)∂q j

(1.9)

ist. Die Bewegungsgleichungen fur die Parameter q j enspricht al-so (1.6) fur die Koordinaten xk.

• In der Gleichgewichtslage des Systems durfen sich die Parameterq j nicht andern, q j = 0. Da die kinetische Energie T nach (1.4)eine quadratische Form in den verallgemeinerten Geschwindig-keiten q j ist, ist dort auch ∂T/∂q j = 0,

0 =ddt∂Ti(~q)∂q j

= −∂V(~q)∂q j

, (1.10)

d.h. die verallgemeinerten Kraftkomponenten Qi = −∂V/∂qi ver-schwinden im Gleichgewicht.

• Wir definieren den Ursprung q j = 0 als Gleichgewichtslage undentwickeln die potentielle Energie als Taylorreiche bis zur 2. Ord-

Page 11: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 1. SCHWINGUNGEN GEKOPPELTER SYSTEME 4

nung in kleinen Auslenkungen q j,

V(~q) = V |q=0 +

f∑j=1

∂V∂q j

∣∣∣∣∣∣q=0

q j +12

f∑j,k=1

∂2V∂q j∂qk

∣∣∣∣∣∣q=0

q jqk + O(q3)

=12

f∑j,k=1

∂2V∂q j∂qk

∣∣∣∣∣∣q=0

q jqk + O(q3)

=:12

f∑j,k=1

V jk q jqk + O(q3) , (1.11)

wegen (1.10). Eine Konstante im Potential kann gleich Null ge-setzt werden. Analog kann die kinetische Energie auch nahe derGleichgewichtslage als

T =12

f∑j,k=1

N∑i=1

mi

(∂~xi

∂q j

∂~xi

∂qk

)q jqk =:

12

f∑j,k=1

T jk q jqk (1.12)

geschrieben werden.

• Die quadratischen Formen T und V konnen nun durch Matrizenausgedruckt werden. Dazu definieren wir

~q :=

q1...

q f

, T :=

T11 · · · T1 f...

...T f 1 · · · T f f

= T T

V :=

V11 · · · V1 f...

...V f 1 · · · V f f

= VT . (1.13)

Fur beliebige ~q ist ~q TT ~q ≥ 0, denn

~q TT ~q =

N∑i=1

mi

f∑j,k=1

∂~xi

∂q jq j∂~xi

∂qkqk =

N∑i=1

mi

f∑j=1

∂~xi

∂q jq j

2

≥ 0 .

(1.14)Die kinetische Energie kann nicht negativ werden, also ist T einepositiv-semidefinite Matrix. Wir nehmen im folgenden an, dass Tpositiv definit ist. Aus (1.9) folgen dann wieder unter der Bedin-gung dass die Relation der Koordinaten zeitlich konstant ist, dieBewegungsgleichungen

ddtT ~q = −V~q ⇒ T ~q +V~q = 0 , (1.15)

die offensichtlich eine Verallgemeinerung der harmonischenSchwingungsgleichung x + ω2

0x = 0 sind.

Page 12: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 1. SCHWINGUNGEN GEKOPPELTER SYSTEME 5

1.2 Normalkoordinaten

Wir haben gelernt, dass man Systeme mit N Massenpunkten undkomplizierten Randbedingungen durch parametrisierte Koordinaten be-schrieben kann, die im wesentlichen den bekannten Bewegungsglei-chungen gehorchen, und mit deren Hilfe man die kinetische und po-tentielle Energie genau wie in Ortskoordinaten schreiben kann. Aller-dings sind die entsprechenden quadratischen Formen T und V starkzwischen den Richtungen q j korreliert. Nachdem wir Matrizen diago-nalisieren konnen stellt sicht die Frage, ob man auch die quadratischenFormen T oderV durch eine geeignete Koordinatenwahl vereinfachenkann.

1.2.1 Transformation auf Normalkoordinaten

• Da T positiv definit ist, gibt es eine Matrix B so, dass

T = BTB (1.16)

gilt. Zum Beweis benutzen wir, dass sich T diagonalisieren lasst.Seien t1, . . . , t f die Eigenwerte, also die Diagonalelemente nachder Diagonalisierung. Dann gibt es eine orthogonale Koordina-tentransformation R so, dass

T = RT diag(t j)R (1.17)

gilt. Da T positiv definit ist, sind die t j ≥ 0. Sei nun B′ =

diag(√

t1, . . . ,√

t f )R, dann gilt offenbar

T =(B′

)TB′ , (1.18)

und außerdem ist

detB′ =

f∏j=1

√t j . (1.19)

Die Matrix B′ ist selbst nur bis auf eine orthogonale Transforma-tion S festgelegt, denn B′ → SB′ =: B liefert ebenfalls

BTB =(B′

)T(STS

)B′ =

(B′

)TB′ = T . (1.20)

• Wir transformieren jetzt in einem ersten Schritt die Parameterq j → ξ j, wobei ~ξ = B~q. Da detB > 0 ist, lasst B sich invertieren,

~q = B−1~ξ =: A~ξ . (1.21)

Damit nimmt die kinetische Energie die vereinfachte Form

T =12~q TT ~q =

12~q TBTB~q =

12~ξ TI~ξ =

12~ξ T ~ξ (1.22)

Page 13: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 1. SCHWINGUNGEN GEKOPPELTER SYSTEME 6

an, aber die potentielle Energie wird

V =12~q TV~q =

12~ξ TATVA~ξ . (1.23)

• Wir konnen in einem zweiten Schritt B von links mit einer ortho-gonalen Matrix S zu multiplizieren,

B = SB′ ⇒ A = B−1 =(B′

)−1S−1 =: A′ST . (1.24)

Der Ausdruck fur die kinetischen Energie andert sich nicht, aberwir erhalten fur die potentielle Energie

V =12~ξ T S

[(A′

)TVA′

]ST ~ξ

=12~ξ T diag(λ j) ~ξ , (1.25)

mit einer geeigneten Wahl von S und den zu berechnenden Ei-genwerten λ j.

• Ausgedruckt durch die Parameter ξ j lassen sich die kinetische unddie potentielle Energie daher in die einfache Form

T =12

f∑j=1

ξ2j , V =

12

f∑j=1

λ jξ2j (1.26)

bringen, und die Bewegungsgleichungen lauten dann

ddt∂T∂ξ j

+∂V∂ξ j

=ddtξ j + λ jξ j = ξ j + λ jξ j = 0 (1.27)

fur alle 1 ≤ j ≤ f . Durch die Einfuhrung der Parameter ξ j ent-koppeln also die Bewegungsgleichungen und beschreiben f un-abhangige harmonische Oszillatoren. Die ξ j heißen Normalkoor-dinaten.

1.2.2 Bestimmung der Normalkoordinaten

• Normalkoordinaten sind nur hilfreich, wenn wir sie fur ein gege-benes System einfach konstruieren konnen. Zunachst bestimmenwir die Eigenwerte λ j uber das charakteristische Polynom vonATVA,

det(ATVA− λ

)= 0

⇔ det[BT

(ATVA− λ

)B]

= 0

⇔ det (V − λT ) = 0 (1.28)

Page 14: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 1. SCHWINGUNGEN GEKOPPELTER SYSTEME 7

d.h. die λ j sind auch die Eigenwerte von V bezuglich T . Außer-dem gilt

ATVA =diag(λ j)

⇔ VA =BT diag(λ j)

=BT (BB−1) diag(λ j) = TA diag(λ j) . (1.29)

• Um die Eigenvektoren zu den Eigenwerten λ j zu erhalten zerle-gen wir die MatrixA in Spaltenvektoren ~a j,

A =(~a1, . . . , ~a f

), ~a j =

A1 j...

A f j

(1.30)

und erhalten damit aus (1.29) die Eigenwertgleichung

V~a j = λ j T~a j , (1.31)

in der T an die Stelle der Einheitsmatrix tritt.

• Die Satze uber das gewohnliche Eigenwertproblem sindvollstandig auf das Eigenwertproblem ubertragbar, in dem T dieRolle der Einheitsmatrix ubernimmt (T ist der metrische Tensordes Eigenwertproblems). Zum Beispiel sind die ~a j orthonormalbezuglich T , denn

ATTA = ATBTBA = 1 ⇒ ~aTj T~ak = δ jk . (1.32)

Daraus ergibt sich folgende Vorschrift fur die Konstruktion derMatrixA und fur die Transformation auf Normalkoordinaten ~ξ:

1. Zunachst das Eigenwertproblem (V − λT )~a = 0 losen undein vollstandiges, bezuglich T orthonormales System vonEigenvektoren ~a j bestimmen,

2. danach mittels

~q =

f∑j=1

~a j ξ j = A~ξ (1.33)

auf Normalkoordinaten transformieren.

1.2.3 Stabilitat

• Die Losungen der Bewegungsgleichungen (1.27) nehmen dieForm

ξ j ∼

e±i√λ jt (λ j , 0)

ξ j (λ j = 0)(1.34)

an. Wie konnen als zwei Falle unterscheiden:

Page 15: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 1. SCHWINGUNGEN GEKOPPELTER SYSTEME 8

1. Alle λ j > 0, also λ j =: ω2j ; dann sind die Losungen harmo-

nische Schwingungen,

ξ j(t) = C j cos(ω jt − δ j) (1.35)

mit konstanten C j und δ j.

2. Mindestens ein λ j ≤ 0, dann kann ξ j im Rahmen der be-trachteten Naherung unbegrenzt wachsen.

• Stabilitat ist sicher, wenn alle λ j > 0 sind. Das ist genau dann derFall, wennV strikt positiv ist, d.h. wenn die Potentialfunktion inder Ruhelage ein striktes Minimum hat. Das System ist instabil,wenn mindestens ein λ j < 0 ist. Wenn mindestens ein Eigenwertλ j = 0 und die anderen λk ≥ 0 sind, mussen fur die Stabilitats-analyse Terme hoherer Ordnung herangezogen werden.

• Wenn alle λ j > 0 sind, dann ist die allgemeine Losung der Bewe-gungsgleichung fur das Gesamtsystem nach (1.33) und (1.35)

~q(t) =

f∑j=1

~a j ξ j(t) =

f∑j=1

~a jC j cos(ω jt − δ j) . (1.36)

Die ω j sind die Eigenfrequenzen und werden auch Normalfre-quenzen genannt. Bei Normalschwingungen ist nur eine Normal-koordinate angeregt, z.B. ξ j, und die anderen sind in Ruhe. Dannist

~q(t) = ~a jC j cos(ω jt − δ j) (1.37)

ohne Summation uber j.

• Die Konstanten C j und δ j werden durch die Anfangsbedingungenbestimmt, ~q(t = 0) = ~q0, ~q(t = 0) = ~q0. Damit folgt

~q0 =

f∑j=1

~a jC j cos δ j , ~q0 =

f∑j=1

~a jC jω j sin δ j . (1.38)

Wegen der Orthonormalitat der ~a j bezuglich T ist

~a Tj T~q0 = C j cos δ j , ~a T

j T ~q0 = C jω j sin δ j , (1.39)

woraus C j und δ j bestimmt werden konnen.

• Bemerkung: Das System kehrt nie in seine Anfangslage zuruck,wenn die ω j nicht in rationalen Verhaltnissen zueinander stehen.

Page 16: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 1. SCHWINGUNGEN GEKOPPELTER SYSTEME 9

1.2.4 Gekoppelte Pendel

Nachdem wir atypisch fur diese Vorlesung die Normalkoordinaten erstformal eingefuhrt haben fehlt uns noch ein illustratives Beispiel.

• Gegeben seien zwei gleiche ebene Pendel der Lange l, andenen Massenpunkte der Masse m hangen. Der Abstand derAufhangungspunkte sei x0, und die Pendel seien durch eine Fe-der mit der Federkonstanten k und der Ruhelange x0 aneinandergekoppelt.

• Geeignete Parameter zur Beschreibung dieses Systems sind diebeiden Auslenkwinkel ϕ1 und ϕ2. Damit lautet die kinetischeEnergie

T =m2

(l2ϕ2

1 + l2ϕ22

)oder T = ml2

(1 00 1

). (1.40)

Die potentielle Energie setzt sich aus den Beitragen des Schwere-felds und der Feder zusammen,

V = − mgl[cosϕ1 + cosϕ2

]+

k2

[ √(x1 − x2)2 + (y1 − y2)2 − x0

]2. (1.41)

Fur kleine Auslenkungen konnen die y1,2 gegenuber den x1,2

vernachlassigt werden. Außerdem konnen x1 = l sinϕ1 ≈ lϕ1,x2 = x0 + lϕ2 und cosϕ j ≈ 1 − ϕ2

j/2 genahert werden. Damitlautet die potentielle Energie

V = mgl(ϕ2

1

2+ϕ2

2

2

)+

k2

l2 (ϕ1 − ϕ2)2

oder V = mgl(

1 00 1

)+ kl2

(1 −1−1 1

). (1.42)

wobei die Konstante −2mgl weggelassen wurde.

• Die Gleichung det(V − λT ) = 0 bestimmt das charakteristischePolynom

(mgl + kl2 − ml2λ)2 − k2l4 = 0 , (1.43)

woraus man die Losungen

λ1 =g

l, λ2 =

g

l+ 2

km

(1.44)

erhalt. Die beiden entsprechend (1.32) normierten Eigenvektorensind

~a1 =1√

2ml

(11

), ~a2 =

1√

2ml

(1−1

), (1.45)

d.h. die Normalschwingungen entsprechen solchen Schwingun-gen, bei denen die beiden Pendel entweder gleichphasig oder ge-genphasig schwingen.

Page 17: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 1. SCHWINGUNGEN GEKOPPELTER SYSTEME 10

1.3 Dreiatomiges Molekul (nicht in Vorle-sung)

1.3.1 Kinetische und potentielle Energie

• Wir betrachten ein lineares, dreiatomiges, symmetrisches Mo-lekul mit Atomen der Masse m rechts und links im Abstand lvon einem zentralen Atom der Masse M. Die Wechselwirkungzwischen den Atomen werde beschrieben durch ”Federn“ mit derFederkonstante k > 0 (Beispiel: CO2). Wir beschranken uns aufBewegungen langs der Molekulachse.

• Die kinetische Energie ist

T =m2

(x2

1 + x23

)+

M2

x22 , (1.46)

und die potentielle Energie ist

V =k2

[(x2 − x1 − l)2 + (x3 − x2 − l)2

]. (1.47)

Die Ruhelage stellt sich im Minimum von V ein, also bei

x2 − x1 = l = x3 − x2 . (1.48)

• Diese Beschreibung ist eindeutig bis auf eine Verschiebung langsder x-Achse (Translation des Molekuls ohne innere Bewegung).Wir wahlen den Ursprung so, dass in der Ruhelage x2 = 0 istund bezeichnen mit q j die Auslenkungen der Atome aus ihrenRuhelagen,

q1 := x1 + l , q3 = x3 − l , x2 = q2 . (1.49)

• Damit lauten die kinetische und die potentielle Energie des Mo-lekuls

T =m2

(q2

1 +Mm

q22 + q2

3

), V =

k2

[(q2 − q1)2 + (q3 − q2)2

].

(1.50)

1.3.2 Normalkoordinaten

• Aus (1.50) lassen sich die Matrizen T undV ablesen:

T =

m 0 00 M 00 0 m

, V =

k −k 0−k 2k −k0 −k k

. (1.51)

Page 18: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 1. SCHWINGUNGEN GEKOPPELTER SYSTEME 11

• Das charakteristische Polynom lautet

det (V − λT ) = 0 ⇒

det

k − λm −k 0−k 2k − λM −k0 −k k − λm

= 0 ⇒

(k − λm)[(2k − λM)(k − λm) − k2

]− k2(k − λm) = 0 .(1.52)

Eine Losung ist offenbar λ1 = k/m; die anderen beiden ergebensich aus

Mmλ2 − k(M + 2m)λ = 0 (1.53)

zu λ2 = 0 und λ3 = k(M + 2m)/(Mm).

• Die Eigenfrequenzen sind ωi =√λi, also

ω1 =

√km, ω2 = 0 , ω3 =

√k

M + 2mMm

. (1.54)

• Das orthonormale Eigensystem ~ai muss nun aus (1.31) bestimmtwerden. Fur i = 1 gilt

0 −k 0−k k

(2 − M

m

)−k

0 −k 0

a11

a21

a31

= 0 , (1.55)

woraus unmittelbar a21 = 0 und a11 + a31 = 0 folgen. Die Ortho-normalitatsbedingung ~aT

1T~a1 = 1 verlangt

(a11, a21, a31)

m 0 00 M 00 0 m

a11

a21

a31

= 1 , (1.56)

woraus insgesamt a11 = 1/√

2m folgt, also

~a1 =1√

2m

10−1

. (1.57)

Fur i = 2 ist k −k 0−k 2k −k0 −k k

a12

a22

a32

= 0 , (1.58)

also a12 = a22 = a32, und die Orthonormalitatsbedingung fordert(2m + M)a2

12 = 1. Daher folgt

~a2 =1

√2m + M

111

. (1.59)

Page 19: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 1. SCHWINGUNGEN GEKOPPELTER SYSTEME 12

Fur i = 3 ist schließlich −k 2mM −k 0−k −k M

m −k0 −k −k 2m

M

a13

a23

a33

= 0 , (1.60)

woraus man a13 = a33 und a13 = −a23M/(2m) erhalt. Die Ortho-normalitatsbedingung ergibt dann

a12 =1√

2m(1 + 2m

M

) , (1.61)

so dass der dritte Eigenvektor

~a3 =

√M

2m(M + 2m)

1−2m/M

1

(1.62)

lautet. Die allgemeine Losung bekommt man dann aus (1.36).

• Den drei Eigenschwingungen entsprechen folgende Bewegun-gen:

1. Fur i = 1 ruht M und die beiden außeren Atome schwingengegeneinander,

2. i = 2 entspricht einer Translation des gesamten Molekulslangs der x-Achse, und

3. fur i = 3 schwingt M gegenphasig gegen die beiden gleich-phasig schwingenden außeren Atome.

Page 20: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

Kapitel 2

Systeme mit Nebenbedingungen

Im vorigen Kapitel haben wir gelernt, dass geeignete Koordinaten furdie Freiheitsgrade eines Systems nicht immer intuitiv gewahlt werdenmussen, sondern gezielt konstruiert werden konnen. Bei der Konstruk-tion der Freiheitsgrade spielen Neben- oder Zwangbedingungen einezentrale Rolle. In diesem Kapitel verfolgen wir weiter die Abstrahie-rung von Koordinaten und die Konstruktion von Bewegungsgleichun-gen, aber im Hinblick auf Zwangsbedingungen.

2.1 Vorbereitung

2.1.1 Verallgemeinerte Koordinaten

• Neben- oder Zwangsbedingungen konnen auf verschiedene Wei-sen formuliert werden. Oft ist es moglich, sie durch Gleichungender Art

gi(~x1, . . . , ~xN , t) = 0 , 1 ≤ i ≤ r (2.1)

auszudrucken, die r Bedingungen an die N Ortsvektoren der Mas-senpunkte stellen. Bei r Zwangsbedingungen fur N Massenpunk-te reduziert sich die Anzahl der Freiheitsgrade auf f = 3N−r. Wirnehmen im Folgenden an, dass die gi genugend oft differenzierbarsind und dass die Matrix

∂g1∂x1

. . . ∂g1∂x3N

......

∂gr∂x1

. . . ∂gr∂x3N

(2.2)

dort den Rang r hat, wo gi(~x j, t) = 0 erfullt ist1 Beispiele furZwangsbedingungen dieser Art sind:

1Der Rang einer linearen Abbildung A : V → V ist die Dimension ihres Bildraums,d.h. die Dimension des Raums, der von den Bildvektoren aller Vektoren aus dem Vek-torraum V aufgespannt wird.

13

Page 21: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 2. SYSTEME MIT NEBENBEDINGUNGEN 14

– Eine Bewegung auf einer Ebene erfullt die Bedingung ~x·~n =

0, wenn ~n der Normalenvektor der Ebene ist.– Eine Bewegung auf einer Kugel stellt die Bedingung |~x| =

R = konst., also |~x| − R = 0.

Zwangsbedingungen dieses Typs heißen holonom, sonst nichtho-lonom. Ein Beispiel fur eine nichtholonome Zwangsbedingung istdie Bewegung innerhalb einer Kugel, also |~x| ≤ R. Bedingungen,die die Zeit explizit enthalten, heißen rheonom, anderenfalls skle-ronom (rheos, fließend; skleros, starr).

• Der Konfigurationsraum eines Systems ist der Teil des 3N-dimensionalen Raums, der von den Koordinaten der N Massen-punkte erreicht werden kann. Die r Bedingungsgleichungen gi de-finieren eine (3N − r)-dimensionale so genannte Untermannigfal-tigkeit im Konfigurationsraum. Auf dieser Untermannigfaltigkeitkann die Lage des Systems durch f = 3N − r unabhangige Pa-rameter q j angegeben werden. Wir kennen sie als parametrisierteoder verallgemeinerte Koordinaten.

• Zum Beispiel ist der Konfigurationsraum eines freien Massen-punkts der dreidimensionale reelle Raum R3. Die Zwangsbe-dingung |~x| = R definiert eine zweidimensionale Untermannig-faltigkeit, namlich eine Kugelschale. So zum Beispiel kann dieZwangsbedingung fur die Bewegung eines Massenpunktes aufder Oberflache einer Kugel mit Radius R, |~x| − R = 0, durch

~x = R ·

sinϑ cosϕsinϑ sinϕ

cosϑ

(2.3)

mit 0 ≤ ϑ ≤ π, 0 ≤ ϕ ≤ 2π angegeben werden, d.h. (q1, q2)konnen durch die Winkel (ϑ, ϕ) reprasentiert werden.

2.1.2 Lagrange-Multiplikatoren

• In der Physik geht es oft darum, eine gegebene Große unter Rand-bedingungen zu optimieren. Als Beispiel betrachten wir die Ober-flache eines Zylinders mit dem Radius R und der Hohe H, diebei konstantem Volumen V minimiert werden soll. Die holonomeZwangsbedingung lautet

πR2H − V = 0 , (2.4)

In R und H ist die Richtung einer erlaubten Anderung durch dietotale Ableitung

0 =∂

∂R

(πR2H − V

)dR +

∂H

(πR2H − V

)dH

= 2πRH dR + πR2 dH (2.5)

Page 22: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 2. SYSTEME MIT NEBENBEDINGUNGEN 15

gegeben. Das Minimum der Flache A = 2πRH + 2πR2 bei einergleichzeitigen Variation von R und H ist ebenfalls durch die totaleAbleitung gegeben,

0 =∂A∂R

dR +∂A∂H

dH= (2πH + 4πR) dR + 2πR dH (2.6)

Wir konnten nun die Zwangsbedingung in eine Relation zwischenR und H umwandeln und dann die Minimumsbedingung losen.Alternativ gibt es eine Methode, die sich leichter auf komplexereSysteme erweitern lasst. Dazu kombinieren wir die beiden Be-dingungen (2.5) und (2.6) mit Hilfe eines unbestimmten Faktorsλ ∈ R,

0 = (2πH + 4πR + λ 2πRH) dR +(2πR + λ πR2

)dH (2.7)

Wenn beide originalen Bedingung erfullt sind, dann gilt diese Be-dingung fur jeden Wert von λ. Dieselbe Gleichung konnen wiraber auch losen, indem wir λ bestimmen und im Gegenzug einekorrelierte Variation von R und H erhalten. Der zweite Termin in(2.7) gibt uns den sogenannten Lagrange-Multiplikator

2πR + λπR2 = 0 ⇔ λ = −2R. (2.8)

Der erste Term definiert die Verknupfung zwischen R und H,

0 = 2πH + 4πR −2R

2πRH

= 2πH + 4πR − 4πH⇔ H = 2R (2.9)

Die Oberflache eines Zylinders mit festem Volumen wird alsodann extremal, wenn sein Durchmesser gleich seiner Hohe ist.

• Diesen Zugang fur die Suche nach Extrema von Funktionen unterNebenbedingungen verallgemeinern wir nun. Fur eine Funktionf (~x) liegen ihre Extrema dort, wo der Gradient verschwindet,

~∇ f (~x) = ~0 . (2.10)

Entlang einer gemeinsamen Variation der Koordinaten muss dietotale Ableitung verschwinden,

d f = ~∇ f · d~x = 0 . (2.11)

Eine holonome Nebenbedingung reduzierte die Anzahl der Frei-heitsgrade um einen und ist durch

g(~x) = 0 , (2.12)

Page 23: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 2. SYSTEME MIT NEBENBEDINGUNGEN 16

beschrieben. Diese Nebenbedingung bedeutet, dass sich g(~x)langs erlaubter Bewegungen nicht andern darf,

dg = ~∇g · d~x = 0 . (2.13)

Mit Hilfe eines Lagrange-Multiplikator λ ∈ R kombinieren wirdie beiden Bedingungen zu

d f + λdg = ~∇( f + λg) · d~x = 0 . (2.14)

Wir konnen einen Term herausgreifen um λ zu bestimmen,

∂ f∂x3

+ λ∂g

∂x3= 0 , (2.15)

solange ∂g/∂x3 , 0. Ebenso mussen die beiden anderen Ablei-tungen separat verschwinden,

∂ f∂x j

+ λ∂g

∂x j= 0 ( j = 1, 2) (2.16)

Aus diesen Bedingungen erhalten wir die erlaubte Koordinaten-flache.

• Wenn allgemein r Bedingungen gk = 0 (1 ≤ k ≤ r) zu erfullensind, wird jede mit einem eigenen Lagrange-Multiplikator λk

berucksichtigt, so dass dann die Bedingungen fur Extrema unterNebenbedingungen

∂ f∂x j

+

r∑k=1

λk∂gk

∂x j= 0 (1 ≤ j ≤ N) (2.17)

lauten.

2.2 Das d’Alembertsche Prinzip

Im vorigen Kapitel haben wir die Bewegung von Teilchen unterZwangsbedingungen mit Hilfe geeigneter Koordinaten beschrieben. DieNewtonsche Mechanik und insbesondere Krafte haben hier keine Rollegespielt. Das wird auch so bleiben, allerdings werden wir vorher nocheinen kurzen Blick auf die Verbindung zwischen Zwangsbedingungenund entsprechenden Zwangskraften werfen.

2.2.1 Zwangskrafte im Gleichgewicht

Jean Baptiste le Rond d’Alembert• Als Beispiel betrachten wir eine Kugel, die unter dem Einfluss

der Schwerkraft ~F reibungsfrei in einer Rohre in der y-z-Ebenegleite, beschrieben durch die holonome Zwangsbedingung

f (y, z) = 0 (2.18)

Page 24: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 2. SYSTEME MIT NEBENBEDINGUNGEN 17

Die Tangentialkomponente von ~F relativ zur Rohre verursachteine Bewegung, wahrend die Normalkomponente durch eineZwangskraft ~Z kompensiert wird,

~Z = −( ~F · ~n)~n . (2.19)

Im Gleichgewicht haben wir die komplette Kompensation

~F + ~Z = ~0 . (2.20)

• Wir wollen die Gleichgewichtsbedingung in allgemeinen Fallenfinden. Dazu denken wir uns eine virtuelle Verruckung δ~x

δ~x =

(δyδz

), (2.21)

fur die0 = ~∇ f · δ~x =

∂ f (y, z)∂y

δy +∂ f (y, z)∂z

δz (2.22)

gelten muss, wenn der Massenpunkt in der Rohre bleibt. Die vir-tuelle Verruckung erfordert eine virtuelle Arbeit, die im Gleich-gewicht wegen (2.20) verschwindet,

δA = ( ~F + ~Z) · δ~x = ~0 · δ~x = 0 . (2.23)

Die Gleichgewichtslage ist dadurch charakterisiert, dass dort vir-tuelle Verruckungen keine virtuelle Arbeit verrichten.

Da immer δ~x tangential und ~Z normal zur Rohre ist, gilt ~Z ·δ~x = 0,d.h. die Zwangskraft leistet nie virtuelle Arbeit. In der Gleichge-wichtslage konnen also auch die außeren Krafte keine virtuelleArbeit leisten, so dass die beiden Bedingungen

~F · δ~x = 0 und ~∇ f · δ~x = 0 (2.24)

gelten. Das ist das Prinzip der virtuellen Arbeit oder dasd’Alembertsche Prinzip.

• Wir wissen aus der vorherigen Rechnung, dass wir die beidenBedingungen (2.24) mit Hilfe eines Lagrange-Multiplikators λerfullen konnen,

0 = ( ~F + λ~∇ f ) · δ~x

=

(Fy + λ

∂ f∂y

)δy +

(Fz + λ

∂ f∂z

)δz = 0 . (2.25)

Im Gegensatz zur Optimierung im vergangenen Kapitel bestim-men wir jetzt die Gleichgewichtslage komplett. Die beiden Koor-dinaten δy und δz sind zunachst unabhangig, werden aber durchdie Zwangsbedingung miteinander verknupft. Wenn wir f (y, z) =

0 ebenfalls erfullen, dann definiert (2.25) drei Gleichungen furdrei Unbekannte.

Page 25: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 2. SYSTEME MIT NEBENBEDINGUNGEN 18

• Als Beispiel betrachten wir einen Massenpunkt, der langs einerParabel in der y-z-Ebene gleitet, also f (y, z) = z − y2 = 0. DieSchwerkraft ist ~F = −mg~ez. Das Prinzip der virtuellen Arbeitliefert zunachst fur die Gleichgewichtslage(

~F + λ~∇ f)· δ~x =

[(0−mg

)+ λ

(−2y

1

)]·

(δyδz

)= 0 , (2.26)

woraus

− 2λyδy = 0 und − mgδz + λδz = 0 (2.27)

folgen. Wenn die δy und δz beliebig sein durfen, erhalten wir

λ = mg und y = 0 . (2.28)

Bei y = 0 muss wegen der Zwangsbedingung aber auch z = 0sein. Also wird das Gleichgewicht bei (y, z) = (0, 0) erreicht, wodie Zwangskraft

~Z = −λ ~∇ f∣∣∣∣y=0,z=0

= −mg(

01

)= −mg~ez (2.29)

betragt.

2.2.2 Dynamische Systeme

• Wir formulieren nun das d’Alembertsche Prinzip um, so dass wires von statischen auf dynamische Systeme erweitern konnen. Ge-geben seien N Massenpunkte mit den Ortsvektoren ~xi, 1 ≤ i ≤ N,die sich unter dem Einfluss der außeren Krafte ~Fi bewegen.Zwangsbedingungen werden durch Zwangskrafte ~Z dargestellt.Virtuell heißt eine Verruckung δxi , die unendlich klein, mit denZwangsbedingungen vertraglich und sonst willkurlich ist. Wenndie Zwangskrafte keine virtuelle Arbeit verrichten, also

N∑i=1

~Zi · δ~xi = 0 (2.30)

erfullen, dann folgt im Gleichgewicht sofort

N∑i=1

~Fi · δ~xi = 0 . (2.31)

Im Gleichgewicht verschwindet demnach die virtuelle Arbeit deraußeren Krafte.

Page 26: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 2. SYSTEME MIT NEBENBEDINGUNGEN 19

• Abseits vom Gleichgewicht lautet die Bewegungsgleichung furjeden Massenpunkt

~Fi + ~Zi = ~pi . (2.32)

Wenn die Zwangskrafte wieder (2.30) erfullen, dann gilt offenbardas d’Alembertsche Prinzip in der Form

N∑i=1

( ~Fi − ~pi) · δ~xi = 0 . (2.33)

Man betrachtet dann die −~pi als Krafte, die so genanntenTragheitskrafte. Die Bewegung verlauft also so, dass die virtuelleArbeit der Summe von außeren und Tragheitskraften verschwin-det.

• Als Beispiel bewege sich ein Massenpunkt der Masse m an einemEnde einer masselosen Stange der Lange l, die in ihrem anderenEnde drehbar aufgehangt ist. Sein Ortsvektor, seine Geschwin-digkeit und seine Beschleunigung sind

~x =

(yz

)= l

(sinϕ− cosϕ

), ~x = lϕ

(cosϕsinϕ

),

~x = lϕ(

cosϕsinϕ

)+ lϕ2

(− sinϕcosϕ

). (2.34)

Eine konstanter Winkelgeschwindigkeit ϕ erzeugt dann dieTragheitskraft

~p = −m~x = mlϕ2(

sinϕ− cosϕ

)= mlϕ2~x =

mv2

l~xl, (2.35)

da v = |~x | = lϕ. Das ist die Zentrifugalkraft.

• Zur Illustration wenden wir das d’Alembertsche Prinzip auf dasmathematische Pendel an. Die Zwangskraft ~Z muss senkrecht zurBewegung von m zeigen. Die außere Kraft ist die Schwerkraft~F = −mg~ez. Die Zwangsbedingung legt den Massenpunkt aufeinen Kreisbogen fest,

~x =

(yz

)= l

(sinϕ− cosϕ

)(2.36)

Eine virtuelle Verruckung δ~x, die mit der Zwangsbedingung ver-traglich ist, muss demnach

δ~x = lδϕ(

cosϕsinϕ

)(2.37)

erfullen. Aus dem d’Alembertschen Prinzip (2.33) mit derTragheitskraft (2.34) erhalten wir[−mg

(01

)− mlϕ

(cosϕsinϕ

)− mlϕ2

(− sinϕcosϕ

)]· δ~x = 0 (2.38)

Page 27: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 2. SYSTEME MIT NEBENBEDINGUNGEN 20

oder(−mgl sinϕ − ml2ϕ)δϕ = 0 . (2.39)

Da δϕ beliebig war, folgt daraus

ϕ = −g

lsinϕ ≈ −

g

lϕ . (2.40)

Fur kleine Auslenkungen ϕ 1 ist dies offensichtlich die Glei-chung eines harmonischen Oszillators mit der Kreisfrequenz ω =√g/l, wie es fur das mathematische Pendel sein muss.

2.2.3 Lagrange-Gleichungen erster Art

• Gegeben sei wieder ein mechanisches System aus N Massen-punkten. Zur Vereinfachung der Notation betrachten wir die3N Koordinaten xi, 1 ≤ i ≤ 3N, der Massenpunkte statt ih-rer N Ortsvektoren. Das System erfahre die außeren Krafte Fi,1 ≤ i ≤ 3N, und unterliege r holonomen Zwangsbedingungeng j(x1, . . . , x3N) = 0, 1 ≤ j ≤ r. Das d’Alembertsche Prinzip be-sagt dann fur einen Satz virtualle Verruckungen δxi

3N∑i=1

(Fi − mi xi) δxi = 0 , (2.41)

wobei die δxi wegen der Zwangsbedingungen die r Gleichungen

3N∑i=1

∂g j

∂xiδxi = 0 (2.42)

erfullen mussen. Wegen der r Zwangsbedingungen sind nur 3N −r der Verruckungen δxi beliebig, wahrend die r anderen davonabhangig sind. Die beiden Gleichungen (2.41) und (2.42) lassensich wieder durch r Lagrange-Multiplikatoren λ j kombinieren,

3N∑i=1

Fi − mi xi +

r∑j=1

λ j∂g j

∂xi

δxi = 0 . (2.43)

• Die λ j konnen nun so gewahlt werden, dass die Vorfaktoren derr abhangigen Verruckungen in (2.43) verschwinden. Nehmen wiro.B.d.A. an, das seien die ersten r Verruckungen, dann folgt

Fi − mi xi +

r∑j=1

λ j∂g j

∂xi= 0 , 1 ≤ i ≤ r , (2.44)

oder, in Matrix-Schreibweise,

F ~λ = ~Q , (2.45)

Page 28: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 2. SYSTEME MIT NEBENBEDINGUNGEN 21

wobei die Abkurzungen

F = (Fi j) :=(∂g j

∂xi

), ~Q = (Qi) := mi xi − Fi (2.46)

eingefuhrt wurden, in denen 1 ≤ i, j ≤ r sind. Offensichtlich ist(2.45) ein lineares Gleichungssystem fur die r Multiplikatoren λ j,das eindeutig losbar ist, wenn detF , 0 gilt, was wir schon zuBeginn des Kapitels in (2.2) vorausgesetzt hatten. Dann konnenwir die r Lagrange-Multiplikatoren durch die Inversion

~λ = F −1 ~Q (2.47)

bestimmen.

• Die derart bestimmten λ j, 1 ≤ j ≤ r, werden dann in die verblei-benden 3N − r Gleichungen eingesetzt,

3N∑i=r+1

Fi − mi xi +

r∑j=1

λ j∂g j

∂xi

δxi = 0 . (2.48)

Diese restlichen δxi betrachten wir wie gewohnt als beliebig, alsomuss

Fi − mi xi +

r∑j=1

λ j∂g j

∂xi= 0 , r + 1 ≤ i ≤ 3N (2.49)

gelten. Dies sind die Lagrange-Gleichungen erster Art.

• Beispiel: Eine Perle gleite reibungslos auf einem masselosenDraht, der sich um eines seiner Enden dreht und dabei die x-y-Ebene uberstreicht. Die eine Zwangsbedingung ist, dass die Perleden Draht nicht verlassen kann,

f (x, y) = y cosϕ − x sinϕ = 0 (2.50)

Da keine außeren Krafte wirken, folgt aus dem d’AlembertschenPrinzip (2.41) mit dem einen Lagrange-Multiplikator λ

− m(

xy

)+ λ~∇ f = −m

(xy

)+ λ

(− sinϕcosϕ

)= 0 . (2.51)

Gleichzeitig mit den Koordinaten x, y, und φ zu arbeiten ist nichtpraktisch. Der naheliegende Ansatz x = r cosϕ, y = r sinϕ gibt(

xy

)= r

(cosϕsinϕ

)+ rϕ

(− sinϕcosϕ

)(2.52)(

xy

)= (r − rϕ2)

(cosϕsinϕ

)+ (2rϕ + rϕ)

(− sinϕcosϕ

).

Page 29: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 2. SYSTEME MIT NEBENBEDINGUNGEN 22

Wenn wir dies in (2.51) einsetzen erhalten wir

(r − rϕ2)(

cosϕsinϕ

)+ (2rϕ + rϕ)

(− sinϕcosϕ

)=λ

m

(− sinϕcosϕ

).

(2.53)Indem wir zum Beispiel diese Gleichung einmal mit (cosϕ, sinϕ)und einmal mit (− sinϕ, cosϕ) multiplizieren, folgen die beidenunabhangigen Bedingungen

λ

m= 2rϕ + rϕ und r − rϕ2 = 0 . (2.54)

Die zweite Gleichung ist die Bewegungsgleichung. Man sieht,dass die Zentrifugalkraft mrϕ2 als Tragheitskraft auftritt, die diePerle radial nach außen treibt.

Page 30: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

Kapitel 3

Lagrange-Formulierung

Mit dem d’Alamberschen Prinzip verlassen wir jetzt die NewtonscheMechanik mit ihrer Betrachtung von Kraften und wenden uns einer For-mulierung ausschließlich uber die Lagrange-Gleichung und ihre verall-gemeinerten Koordinaten zu. Wie im vergangenen Kapitel beschriebenkann man naturlich die Krafte weiterhin bestimmen, aber wir werdensehen dass sie bei der Berechung von dynamischen Systemen keineRolle mehr spielen. Stattdessen entwickeln wir unseren Formalimus inRichtung Erhaltungsgroßen.

3.1 Lagrange-Gleichungen zweiter Art

3.1.1 Herleitung

Joseph Louis Lagrange• Statt der kartesischen Koordinaten benutzen wir nun f = 3N − r

verallgemeinerten Koordinaten qi. Die kartesischen Koordinatenlassen sich dann in der Form xi = xi(~q; t) schreiben. Fur dasd’Alembertsche Prinzip ist zunachst die virtuelle Arbeit der auße-ren Krafte

δAe =

3N∑i=1

Fi δxi =

f∑j=1

3N∑i=1

Fi∂xi

∂q j

δq j =:f∑

j=1

Q jδq j , (3.1)

wobei wir verallgemeinerten Kraftkomponenten definieren,

Q j =

3N∑i=1

Fi∂xi

∂q j= −

3N∑i=1

∂V(~x; t)∂xi

∂xi

∂q j= −

∂V(~x(~q; t); t)∂q j

(3.2)

23

Page 31: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 3. LAGRANGE-FORMULIERUNG 24

• Die virtuelle Arbeit der Tragheitskrafte ist

δAt = −

3N∑i=1

mi xiδxi

= −

f∑j=1

3N∑i=1

mi xi

(∂xi

∂q jδq j

)

= −

f∑j=1

ddt

3N∑i=1

mi xi∂xi

∂q j

− 3N∑i=1

mi xiddt∂xi

∂q j

δq j . (3.3)

Die Zeitableitung im zweiten Term konnen wir vereinfachen,

ddt∂xi(~q; t)∂q j

=

f∑k=1

∂2xi

∂q j∂qkqk +

∂2xi

∂t∂q j

=∂

∂q j

f∑k=1

∂xi

∂qkqk +

∂xi

∂t

=∂xi(~q; t)∂q j

, (3.4)

mit der ublichen Definition x(~q, t) = dx(~q, t)/dt. Weiterhin nutzenwir (1.2) oder ∂xi/∂q j = ∂xi/∂q j, dann wird

δAt = −

f∑j=1

ddt

3N∑i=1

mi xi∂xi

∂q j

− 3N∑i=1

mi xi∂xi

∂q j

δq j

= −

f∑j=1

(ddt∂T∂q j−∂T∂q j

)δq j , (3.5)

wobei wir die kinetische Energie

T =12

3N∑i=1

mi x2i (3.6)

identifiziert haben.

• Nach dem d’Alembertschen Prinzip muss die gesamte virtuelleArbeit der außeren und der Tragheitskrafte verschwinden, also

0 = δAe + δAt =

f∑j=1

(Q j −

ddt∂T∂q j

+∂T∂q j

)δq j . (3.7)

Fur beliebige δq j folgen die Lagrange-Gleichungen zweiter Art,

ddt∂T∂q j−∂T∂q j

= Q j = −∂V∂q j

. (3.8)

Definieren wir die Lagrange-Funktion durch

L = T − V = T (q, q, t) − V(q, t) , (3.9)

Page 32: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 3. LAGRANGE-FORMULIERUNG 25

dann lauten die Lagrange-Gleichungen zweiter Art einfach

ddt∂L∂q j−∂L∂q j

= 0 . (3.10)

In dieser Form werden sie gewohnlich als Lagrange-Gleichungenbezeichnet. Mit ihrer Hilfe lost sich die Mechanik von den kar-tesischen Koordinaten. Die Lagrange-Gleichungen zeigen dann,wie sich aus Ableitungen der Lagrange-Funktion die Bewegungs-gleichungen in den verallgemeinerten Koordinaten ergeben.

3.1.2 Beispiele

• Fur einen Massenpunkt der Masse m im Feld einer vorgegebenenPotentialkraft ist die Lagrange-Funktion

L = T − V =m2

3∑i=1

x2i − V . (3.11)

Hieraus folgen die Bewegungsgleichungen

ddt

mxi +∂V∂xi

= 0 . (3.12)

• Zur Beschreibung eines Massenpunkts m im Feld einer Zen-tralkraft wahlen wir ebene Polarkoordinaten (r, ϕ) als verallge-meinerte Koordinaten. Das Potential ist V = V(r), und wegen~x 2 = r2 + r2ϕ2 ist die kinetische Energie T = m(r2 + r2ϕ2)/2.Damit lautet die Lagrange-Funktion

L =m2

(r2 + r2ϕ2) − V(r) , (3.13)

und fur die beiden verallgemeinerten Koordinaten r und ϕ erhal-ten wir sofort die beiden Lagrange-Gleichungen

d(mr2ϕ)dt

= 0 und mr − mrϕ2 +∂V∂r

= 0 . (3.14)

Die erste Gleichung formuliert die Drehimpuls-Erhaltung, diezweite ist die Bewegungsgleichung.

3.1.3 Beschleunigte Bezugssysteme

• Kehren wir zuruck zur Behandlung der Scheinkrafte, die in be-schleunigten Bezugssystemen deswegen auftreten, weil sie keineInertialsysteme sind. Sei also ein (ungestrichenes) Bezugssystemgegeben, das sich relativ zu einem (gestrichenen) Inertialsystem

Page 33: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 3. LAGRANGE-FORMULIERUNG 26

dreht und bewegt, so dass zwischen gestrichenen und ungestri-chenen Ortsvektoren die Beziehung

~x ′ = R(~a + ~x) (3.15)

besteht, wobei ~a der zeitlich konstante Ortsvektor des Ursprungsdes Inertialsystems aus der Sicht des beschleunigten Systems ist.Zwischen den Geschwindigkeiten in beiden Systemen bestehtdann die Beziehung

~x ′ = R[~x + ~ω × (~a + ~x)

], (3.16)

wie im ersten Teil der Vorlesung gezeigt wurde.

• Um die Lagrange-Funktion im gestrichenen System aufzustellen,brauchen wir zunachst die kinetische Energie

T =m2

[~x + ~ω × (~a + ~x)

]2

L =m2

~x 2 + 2~x ·

[~ω × (~a + ~x)

]+

[~ω × (~a + ~x)

]2− V(~x) . (3.17)

Die partielle Ableitung nach xi ergibt∂L∂xi

+∂V∂xi

=m2

∂xi

2x jε jklωk(a + x)l + ε jklε jmnωk(a + x)lωm(a + x)n

=

m2

2x jε jkiωk + ε jkiε jmnωkωm(a + x)n + ε jklε jmiωk(a + x)lωm

= mx jε jkiωk +

m2ε jkiε jmnωkωm(a + x)n +

m2ε jklε jmiωk(a + x)lωm

= mx jε jkiωk +m2ε jkiε jmnωkωm(a + x)n +

m2ε jknε jmiωk(a + x)nωm

= mx jε jkiωk + mε jkiε jmnωkωm(a + x)n

= mx jε jkiωk + mεi jk

(ε jmnωm(a + x)n

)ωk

= m(~x × ~ω)i + m[[~ω × (~a + ~x)

]× ~ω

]i , (3.18)

Die partielle Ableitung nach den Geschwindigkeiten ~x liefert∂L∂xi

= mxi + m(~ω × (~a + ~x)

)i . (3.19)

Deswegen lauten die Bewegungsgleichungen

mddt

[~x + ~ω × (~a + ~x)

]− m~x × ~ω − m

[~ω × (~a + ~x)

]× ~ω + ~∇V = 0

(3.20)oder

m~x + m[~ω × (~a + ~x)

]+ 2m~ω × ~x

+ m[ω ×

(~ω × ~x

)]+ m

[ω ×

(~ω × ~a

)]+ ~∇V = 0 , (3.21)

in Ubereinstimmung mit dem Ergebnis aus dem ersten Teil derVorlesung.

Page 34: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 3. LAGRANGE-FORMULIERUNG 27

3.2 Kreiselbewegung

Um die Anwendung der Lagrange-Gleichungen auf physikalische Sy-steme zu illustrieren nutzen wir Kreisel. Offensichtlich sind dort kar-tesische Koordinaten ungeeignet, und die Bewegungen konnen je nachKraft komplex genugend komplex sein, um als Beispiele fur den neuenFormalismus zu dienen und uns dann in Richtung von Erhaltungsgroßenzu fuhren.

3.2.1 Kraftefreier symmetrischer Kreisel

• Wir hatten im ersten Teil der Vorlesung gesehen, dass die kineti-sche Energie der Rotation eines starren Korpers

Trot =12~ωT Θ ~ω (3.22)

ist, wobei Θ der Tragheitstensor ist. Außerdem hatten wir dortdie drei Euler-Winkel (ϕ, ϑ, ψ) eingefuhrt und in (I-9.13) gezeigt,dass sich die Winkelgeschwindigkeit ~ω eines starren Korpers all-gemein durch

ω1 = ϕ sinϑ sinψ + ϑ cosψ ,ω2 = ϕ sinϑ cosψ − ϑ sinψ ,ω3 = ϕ cosϑ + ψ (3.23)

darstellen lasst. Die drei Euler-Winkel sind die nachstliegendenverallgemeinerten Koordinaten, durch die die drei Rotationsfrei-heitsgrade des starren Korpers ausgedruckt werden konnen.

• Die Energie des kraftefreien Kreisels setzt sich aus der Rotationund der Translation zusammen. Wir wahlen zunachst ein Bezugs-system, in dem der Schwerpunkt des Kreisels ruht. Außerdemkonnen wir die Rotationsenergie in einem beliebigen Bezugs-system auswerten, weil sie als Skalar unabhangig vom Bezugs-system ist. Dafur bietet sich das Hauptachsensystem des starrenKorpers an, in dem sein Tragheitstensor die Form

Θ = diag(Θ1,Θ2,Θ2) (3.24)

annimmt. Nehmen wir der Einfachheit halber weiter an, dassder starre Korper symmetrisch gegenuber Drehungen um die x3-Achse ist, gilt weiter Θ1 = Θ2. Die Lagrange-Funktion lautetdann

L(ϕ, ϑ, ψ) =Θ1

2

(ω2

1 + ω22

)+

Θ3

2ω2

3 (3.25)

=Θ1

2

(ϕ2 sin2 ϑ + ϑ2

)+

Θ3

2

(ϕ cosϑ + ψ

)2.

Page 35: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 3. LAGRANGE-FORMULIERUNG 28

• Allgemein muss immer die Energie erhalten bleiben. Außerdemhangt L nicht von ϕ und ψ ab. Mit den zugehorigen konjugiertenImpulse haben wir also drei Erhaltungsgroßen

E = Trot = L

pψ =∂L∂ψ

= Θ3

(ϕ cosϑ + ψ

)pϕ =

∂L∂ϕ

= Θ1ϕ sin2 ϑ + Θ3

(ϕ cosϑ + ψ

)cosϑ . (3.26)

Zunachst konnen wir den Winkel ψ aus pϕ eliminieren,

pϕ =Θ1ϕ sin2 ϑ + pψ cosϑ

⇔ ϕ =pϕ − pψ cosϑ

Θ1 sin2 ϑ. (3.27)

Damit konnen wir die erhaltene Energie durch

E =Θ1

2

(pϕ − pψ cosϑ

Θ1 sin2 ϑ

)2

sin2 ϑ +Θ1

2ϑ2 +

p2ψ

2Θ3

⇔2

Θ1

E −p2ψ

2Θ3

=

(pϕ − pψ cosϑ

Θ1 sin2 ϑ

)2

sin2 ϑ + ϑ2 (3.28)

ausdrucken. Diese Gleichung enthalt weder ϕ noch ψ und ist einegewohnliche Differentialgleichung erster Ordnung fur ϑ. Um siezu losen, fuhren wir einige Abkurzungen ein, namlich

α :=2

Θ1

E −p2ψ

2Θ3

a :=pψΘ1

b :=pϕΘ1

. (3.29)

Außerdem fuhren wir y := cosϑ ein. Dann ist y = − sinϑϑ, und(3.28) lautet

α =

(pϕ − pψ cosϑ

Θ1

)2 1sin2 ϑ

+y2

sin2 ϑ

= (b − ay)2 11 − y2 +

y2

1 − y2

⇔ y2 =α(1 − y2) − (b − ay)2 . (3.30)

Ihre implizite Losung erhalten wir durch Separation der Varia-blen,

t − t0 =

∫ y(t)

y0

dy√α(1 − y2) − (b − ay)2

. (3.31)

Man kann solche Gleichungen numerisch losen, aber analytischkommen wir an dieser Stelle nicht weiter.

Page 36: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 3. LAGRANGE-FORMULIERUNG 29

3.2.2 Eulersche Gleichungen (nicht in Vorlesung)

• Die Kreiselbewegung kann auch direkt mithilfe der Drehimpul-serhaltung untersucht werden, allerdings mussen wir dann zwi-schen dem kreiselfesten System ~x und dem Inertialsystem ~x′ un-terscheiden. Wir nehmen zusatzlich an, dass auf den i-ten Mas-senpunkt im Inertialsystem die außere Kraft ~F′i wirkt. Sie ubt aufden Kreisel das gesamte Drehmoment

~M′ =d~L′

dt=

N∑i=1

(~x ′i × ~F

′i

)(3.32)

aus. Zu den Großen ~L und ~M im kreiselfesten System bestehendie Zusammenhange ~L′ = R~L und ~M′ = R ~M. Außerdem gilt nachDefinition des Tragheitstensors im Inertialsystem ~L = Θ~ω. In (I-8.15) konnen wir den Impuls durch den Drehimpuls ersetzen underhalten die Relation zwischen den Bezugssystemen

R ~M = ~M′ =ddt~L′ = R

(~L + ~ω × ~L

). (3.33)

Multiplikation mit RT von links gibt uns die Euler-Gleichungenim kreiselfesten System

~M = ~L + ~ω × ~L = Θ~ω + ~ω × Θ~ω , (3.34)

die im Hauptachsensystem die Form

M1 = Θ1ω1 + ω2ω3(Θ3 − Θ2)M2 = Θ2ω2 + ω1ω3(Θ1 − Θ3)M3 = Θ3ω3 + ω1ω2(Θ2 − Θ1) (3.35)

annehmen.

• Wieder setzen wir fur den symmetrischen Kreisel Θ1 = Θ2 ,Θ3 und nehmen zunachst an, dass er sich kraftefrei bewege, dasaußere Drehmoment also verschwinde, ~M′ = 0 = ~M. Mit derDefinition ∆Θ := Θ3 − Θ1 werden die Euler-Gleichungen (3.35)

Θ1ω1 + ω2ω3∆Θ = 0 ,Θ1ω2 − ω1ω3∆Θ = 0 ,

Θ1ω3 = 0 . (3.36)

Also ist ω3 konstant, was der Aussage aus (3.26) und (3.57) ent-spricht, dass ψ = pψ eine Konstante der Bewegung ist.

• Die verbleibenden beiden Euler-Gleichungen, konnen zu dereinen Gleichung

ddt

(ω1 + iω2) − i(ω1 + iω2)ω3∆Θ

Θ1= 0 (3.37)

Page 37: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 3. LAGRANGE-FORMULIERUNG 30

fur die komplexe Winkelgeschwindigkeit ω1 + iω2 zusammenge-fasst werden. Trennung der Variablen ergibt die Losung

ω1 + iω2 = A exp[iω3∆Θ

Θ1t]

(3.38)

oder

ω1 = A cos(ω3∆Θ

Θ1t), ω2 = A sin

(ω3∆Θ

Θ1t). (3.39)

Die Winkelgeschwindigkeit ~ω lauft im korperfesten System mitder Frequenz ω3∆Θ/Θ1 um die Figurenachse.

• Wegen ~L = Θ~ω folgt fur den Drehimpuls

L1 = AΘ1 cos(ω3∆Θ

Θ1t), L2 = AΘ1 sin

(ω3∆Θ

Θ1t),

L3 = Θ3ω3 = konst. (3.40)

Wenn wir das raumfeste System wieder so wahlen, dass ~e ′3 ‖ ~L′

ist, dann ist der Winkel zwischen der Figurenachse und ~e ′3 kon-stant, ϑ = konst. und ϑ = 0, und

tanϑ =

√L2

1 + L22

L3=|A|Θ1

Θ3ω3. (3.41)

Wegen ϑ = 0 vereinfachen sich die Komponenten der Winkelge-schwindigkeit (3.23) in raumfesten Koordinaten zu

ω1 = ϕ sinϑ sinψ ,ω2 = ϕ sinϑ cosψ ,ω3 = ϕ cosϑ + ψ . (3.42)

Daraus erhalten wir

ω1 + iω2 =ϕ sinϑ(sinψ + i cosψ) = iϕ sinϑe−iψ ,

ω3 =ϕ cosϑ + ψ = konst. (3.43)

• Vergleichen wir dieses Ergebnis mit (3.38) und schreiben diekomplexe Amplitude A in der Form

A = |A|eiδ , (3.44)

erhalten wir

ϕ sinϑ = − i(ω1 + iω2)eiψ

= − i|A| exp[i(ω3∆Θ

Θ1t + δ + ψ

)]=|A| exp

[i(ω3∆Θ

Θ1t + δ + ψ −

π

2

)]. (3.45)

Page 38: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 3. LAGRANGE-FORMULIERUNG 31

Da hier eine reelle mit einer komplexen Große verglichen wird,muss das Argument der Exponentialfunktion verschwinden,

ψ =π

2−ω3∆Θ

Θ1t − δ

⇒ ϕ sinϑ =|A| . (3.46)

Demnach folgt mit (3.41)

ϕ =|A|

sinϑt + ϕ0 =

Θ3ω3

Θ1 cosϑt + ϕ0 . (3.47)

Die Figurenachse lauft mit der Kreisfrequenz Θ3ω3/Θ1 cosϑ umden Drehimpulsvektor.

3.2.3 Kreisel im Schwerefeld

• Schließlich untersuchen wir noch einen symmetrischen Kreiselder Masse m mit Θ1 = Θ2 , Θ3 im Schwerefeld der Erde, deraußerhalb seines Schwerpunkts, aber auf der Figurenachse un-terstutzt wird. Der Vektor vom Unterstutzungspunkt zum Schwer-punkt sei ~s. Er definiert eine zweite (mogliche) Drehbewegung.Die nach unten zeigende Schwerkraft ~g ubt dann das Drehmo-ment

~M = m~s × ~g (3.48)

auf den Kreisel aus.

• Die Lagrange-Funktion (3.25) enthalt nun auch die potentielleEnergie V = −m~g · ~s = mgs cosϑ,

L =Θ1

2

(ϕ2 sin2 ϑ + ϑ2

)+

Θ3

2

(ϕ cosϑ + ψ

)2−mgs cosϑ . (3.49)

Wieder kommen ϕ und ψ nicht in der Lagrange-Funktion vor, sodass pϕ und pψ wie in (3.26) Konstanten der Bewegung bleiben.Damit bleibt auch (3.27) fur ϕ, aber die Energie ist

E = T + V = L + 2V (3.50)

=Θ1

2

(ϕ2 sin2 ϑ + ϑ2

)+

Θ3

2

(ϕ cosϑ + ψ

)2+ mgs cosϑ .

Der Term V = mgs cosϑ kommt also auch auf der rechten Seitevon (3.28) dazu. Definieren wir zusatzlich zu den Abkurzungen(3.29) noch

β :=2mgsΘ1

, (3.51)

verandert sich die Differentialgleichung (3.30) zu

y2 = (α − βu)(1 − u2) − (b − au)2 , (3.52)

deren implizite Losung im Allgemeinen auf elliptische Integra-le fuhrt. Wie schon in (3.31) sind wir an dieser Stelle am Endeunserer analytischen Moglichkeiten angelangt.

Page 39: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 3. LAGRANGE-FORMULIERUNG 32

• Die Betrachtung mit Hilfe der Drehimpulserhaltung wird einfa-cher, wenn man das Inertialsystem so orientiert, dass eine seinerAchsen, etwa die x′3-Achse, in Richtung des konstanten gesam-ten Drehimpulses ~L′ zeigt. Zunachst ist die Komponente L3 desDrehimpulses im kreiselfesten Hauptachsensystem

L3 = Θ3ω3 = Θ3

(ϕ cosϑ + ψ

)= pψ (3.53)

sie ist also eine Konstante der Bewegung. Das bedeutet, dass auchunter der Wirkung der Gewichtskraft der Kreisel unbeeintrachtigtrotiert. Da der Euler-Winkel ϑ angibt, um welchen Winkel dieSymmetrieachse des Kreisels aus der x′3-Richtung verkippt ist,muss

L3 = |~L′| cosϑ (3.54)

gelten. Da sowohl |~L′| als auch L3 Konstanten der Bewegung seinmussen, muss dann auch ϑ konstant sein, also ϑ = 0. Fur einenkraftefreien Kreisel folgt aus (3.27)

ϕ =pϕ − pψ cosϑ

Θ1 sin2 ϑt + ϕ0 , (3.55)

d.h. der Kreisel dreht sich um die x′3-Achse des Inertialsystemsmit der konstanten Winkelgeschwindigkeit

ωϕ =pϕ − pψ cosϑ

Θ1 sin2 ϑ. (3.56)

Aus der Konstanz von pψ folgt schließlich mithilfe von (3.26) diekonstante Winkelgeschwindigkeit des kraftefreien Kreisels umseine eigene Achse,

ωψ =pψΘ3− ωϕ cosϑ . (3.57)

• In Gegenwart der Gewichtskraft konnen wir den Kreisel unterder Annahme untersuchen, dass die zusatzliche Kraft eine kleineStorung der oben beschriebenen Bewegung ist. Wenn der Kreiselfor allem schnell um seine Figurenachse rotiert, dann ist auch dergesamte Drehimpulsvektor nahe der Figurenachse. Unter dieserAnnahme ist ~s ′ etwa parallel zu ~L′, also

~s ′

s′≈~L′

L′. (3.58)

Die Anderung der Richtung des gesamten Drehimpulses ~L′ durchdie Gewichtskraft ist dann

~M′ =d~L′

dt= m(~s ′ × ~g ′) ≈

ms′

L′(~L′ × ~g ′)

⇒ ~L′(t + dt) ≈~L′(t) +ms′

L′(~L′ × ~g ′

)dt . (3.59)

Page 40: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 3. LAGRANGE-FORMULIERUNG 33

Das ist eine infinitesimalen Drehung mit der Winkelgeschwindig-keit

~Ω′ ≈ −ms′

L′~g ′ . (3.60)

Der Drehimpulsvektor weicht also bei gleichbleibender Langesenkrecht zur Schwerkraft aus. Die Figurenachse des um sichselbst rotierenden Kreisels folgt im wesentlichen dem Drehim-pulsvektor. Die Zeitskala, auf der sich der gesamte Drehimpulsandert, ist

τ1 ∼L′

L′∼

L′

V, (3.61)

wahrend die typische Zeitskala fur die Rotation des Kreiselsdurch

τ2 ∼1ω∼

L′

T(3.62)

gegeben ist. Unter der Annahme schneller Rotation ist T Vund daher τ2 τ1, d.h. die Figurenachse prazediert im Vergleichzur Rotation langsam um die Vertikale. Je rascher der Kreisel ro-tiert, desto langsamer prazediert er, weil dann seine potentiellegegenuber seiner kinetischen Energie immer unwichtiger wird.

Page 41: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

Kapitel 4

Extremalprinzipien

Im vorigen Kapitel haben wir die Lagrange-Gleichungen abgeleitetund damit ein Werkzeug eingefuhrt, das mit leichten Modifikationenin der aktuellen Forschung eine wichtige Rolle einnimmt. Lagrange-Funktionen sind in der Hochenergiephysik das Bindeglied zwischen ex-perimentellen Messungen und theoretischen Annahmen. In diesem Ka-pitel geht es nun nicht darum, diesen Mechanismus weiterzuentwickeln,sondern darum, ahnlich universelle Zugange fur andere Felder der Phy-sik anzuleiten. Wir werden zeigen, dass sowohl das Prinzip der Stati-onaren Wirkung als auch die Hamilton-Gleichungen auivalent zu denLagrange-Gleichungen sind.

4.1 Prinzip der stationaren Wirkung

In einem ersten Schritt fuhren wir ein neues Konzept in die Mechanikein, das Extremalprinzip. Wir werden zeigen, dass fur eine entsprechenddefinierte Wirkung die Lagrange-Gleichungen aquivalent sind zur Aus-sage, dass diese Wirkung extremal ist.

4.1.1 Das Fermatsche Prinzip

• Bisher haben wir mechanische Systeme differentiell beschrieben:Aus dem Zustand zur Zeit t wurde eine Anderung innerhalb derZeit dt vorhergesagt. Jetzt bereiten wir eine Beschreibung vor, diedie gesamte Bahn eines Systems zur Grundlage nimmt. Gegebensei dazu ein System mit f Freiheitsgraden und verallgemeinertenKoordinaten (q1, . . . , q f ). Diese mogen in einem Bereich B ∈ R f

variieren, dem so genannten Konfigurationsraum. Durch die Be-wegung des Systems zwischen den t0 und t1 > t0 wird eine Kurveim Konfigurationsraum durchlaufen, die als Bahn des Systemsbezeichnet wird.

34

Page 42: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 4. EXTREMALPRINZIPIEN 35

• Wir nehmen an, dass die Bewegungsgleichungen des Systems auseiner Lagrange-Funktion L(~q,~q, t) ableitbar seien. Wodurch un-terscheidet sich dann die wirkliche Bahn ~q(t), t0 ≤ t ≤ t1, zwi-schen den zwei festen Punkten P0 und P1 von allen denkbarenanderen Bahnen ~q′(t) mit ~q′(t0) = ~q(t0) und ~q′(t1) = ~q(t1)? EinBeispiel liefert das Fermatsche Prinzip der geometrischen Optik,das besagt, dass langs des tatsachlich realisierten Lichtstrahls dieLichtlaufzeit extremal wird.

• Betrachten wir den Ubergang eines Lichtstrahls aus dem linkenHalbraum mit dem Brechungsindex n1 in den rechten Halbraummit dem Brechungsindex n2. Der Lichtstrahl soll zwischen zweifesten Punkten ~x1 und ~x2 verlaufen, und seine Bahnebene sei diex-y-Ebene. Das Licht folgt in beiden Halbraumen Geraden. DerUbergang vom linken in den rechten Halbraum finde im Punkt(0, y) statt. Die gesamte Lichtlaufzeit ist dann

τ =n1

c

√x2

1 + (y − y1)2 +n2

c

√x2

2 + (y2 − y)2 , (4.1)

weil die Lichtgeschwindigkeit durch die Brechungsindizes aufc/n1,2 reduziert ist. Fermats Prinzip besagt

δτ = 0 , (4.2)

weil die Lichtlaufzeit extremal werden soll. Wir konnen dieStorung δτ als Funktion der Koordinate y parametrisieren, alsoδτ = δy (dτ/dy). Das Verschwinden der Ableitung bedeutet

n1

cy − y1√

x2 + (y − y1)2=

n2

cy2 − y√

x2 + (y2 − y)2(4.3)

oder, mit den Winkeln α1,2 der Lichtstrahlen bezuglich der Nor-malen zur Trennflache zwischen den beiden Halbraumen,

n1 sinα1 = n2 sinα2 . (4.4)

Das ist das Brechungsgesetz, abgeleitet aus einer Extremalbedin-gung.

4.1.2 Hamiltons Prinzip

William Rowan Hamilton• In der Mechanik postulieren wir nun, dass entlang der wirklichen

Bahn die so definierte Wirkung

S [~q(t)] :=∫ t1

t0L(~q, ~q, t) dt (4.5)

Page 43: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 4. EXTREMALPRINZIPIEN 36

extremal wird. Die Wirkung hat offensichtlich die DimensionEnergie × Zeit. Sie ist ein Funktional der Kurve ~q(t), d.h. ei-ne Funktion einer Funktion. Das Hamiltonsche Prinzip der sta-tionaren Wirkung lautet dann

δS [~q(t)] = δ

[∫ t1

t0L(~q, ~q, t)dt

]= 0 . (4.6)

Wie man das Extremum eines Funktionals findet, ist Gegenstandder Variationsrechnung von Leonhard Euler, die uns mathema-tisch wieder an Rechnungen mit totalen Ableitungen und entspre-chenden Differentialen erinnern wird.

• Sei also ~q(t) die wahre Bahn und ~q′(t) = ~q(t) + δ~q(t) eine leichtgestorte Bahn. Dann muss δS in erster Ordnung in der Storung δ~qverschwinden, also

δS =

∫ t1

t0L(~q + δ~q, ~q + δ~q, t)dt −

∫ t1

t0L(~q, ~q, t)dt = 0 . (4.7)

Wir entwickeln zunachst die Lagrange-Funktion langs dergestorten Bahn bis zur ersten Ordnung in δ~q, indem wir sowohlbezuglich der verallgemeinerten Koordinaten q j also auch derverallgemeinerten Geschwindigkeiten q j Taylor-entwickeln,

L(~q + δ~q, ~q + δ~q, t) =L(~q, ~q, t) +

f∑j=1

(∂L∂q j

δq j +∂L∂q j

δq j

)

⇔ δS =

∫ t1

t0

f∑j=1

(∂L∂q j

δq j +∂L∂q j

δq j

)dt = 0 . (4.8)

Partielle Integration des zweiten Terms nach der Zeit gibt∫ t1

t0

(∂L∂q j

δq j

)dt =

∂L∂q j

δq j

∣∣∣∣∣∣t1t0

∫ t1

t0

(ddt∂L∂q j

)δq jdt . (4.9)

Der Oberflachenterm verschwindet, weil die Endpunkte der Bahnfestgehalten werden, δq j(t0) = 0 = δq j(t1). Daher folgt

δS =

∫ t1

t0dt

f∑j=1

(ddt∂L∂q j−∂L∂q j

)δq j = 0 . (4.10)

Fur beliebige δq j gibt uns das die bekannten Lagrange-Gleichungen

ddt∂L∂q j−∂L∂q j

= 0 . (4.11)

Da jeder der vorangegangenen Rechenschritte reversibel war, istdas Hamiltonsche Prinzip der stationaren Wirkung aquivalent zuden Lagrange-Gleichungen.

Page 44: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 4. EXTREMALPRINZIPIEN 37

• Das Wirkungsprinzip zeigt auch, dass die Lagrange-Funktionnicht eindeutig ist: Wenn man die Lagrangefunktion L durcheinen Term erganzt, der die totale Zeitableitung einer beliebigenFunktion f (~q, t) der Koordinaten und der Zeit ist,

L→ L +d f (~q, t)

dt(4.12)

dann andert sich dadurch die Wirkung um eine Konstante,

S =

∫ t1

t0L(~q, ~q, t) dt → S + f (~q1, t1) − f (~q0, t0) , (4.13)

die bei der Variation verschwindet. Die Bewegungsgleichungenbleiben dadurch unverandert. Das ist ein sehr einfaches Beispielfur eine so genannte Eichinvarianz, die in der Feldtheorie eineentscheidend wichtige Rolle spielt.

4.2 Hamilton-Funktion

In einem zweiten Schritt entwickeln wir eine weitere, zu den Lagrange-Gleichungen aquivalente Methode. Sie fuhrt uns auf die Hamilton-Funktion, die in der Quantenmechanik oder der Festkorperphysik einezentrale Rolle spielt.

4.2.1 Die kanonischen Gleichungen

• Die Lagrange-Funktion des freien Teilchens und ihre Ableitungsind

Lfrei =m2

(x2

1 + x22 + x2

3

)∂Lfrei

∂x j=mx j = p j . (4.14)

Weil die Lagrange-Funktion ohne Potentialterm die kinetischeEnergie beschreibt, ist es naheliegend die Ableitung ∂Lfrei/∂x j

wie schon in (3.26) mit dem zu x j gehorigen Impuls zu identi-fizieren.

• Analog wird anhand der verallgemeinerten Koordinaten ein ver-allgemeinerter Impuls definiert,

p j :=∂L∂q j

. (4.15)

Er heißt der zu q j kanonisch konjugierte Impuls. Er hat im Allge-meinen nicht die Dimension eines Impulses, aber q j p j behalt die

Page 45: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 4. EXTREMALPRINZIPIEN 38

Dimension einer Wirkung, also Energie × Zeit. Seine Zeitablei-tung kann durch die Lagrange-Gleichungen vereinfacht werden,

p j =ddt∂L∂q j

=∂L∂q j

. (4.16)

Wenn die Transformation von q j auf p j umkehrbar ist, konnen dieq j durch p j ersetzt werden,

q j = q j(~q, ~p, t) . (4.17)

Die verallgemeinerten Koordinaten ~q und ihre kanonisch konju-gierten Impulse ~p spannen einen 2 f -dimensionalen Raum auf,den sogenannten Phasenraum. Indem sich das gesamte Systemzeitlich verandert, werden diese 2 f Werte einen Bereich P ⊂ R2 f

des gesamten Phasenraums uberstreichen. Einer Kurve im Pha-senraum entspricht eine Bahn im Konfigurationsraum B ⊂ R f .Damit stellt sich die Frage wie nun die Bewegungsgleichungenausgedruckt in (~q, ~p) aussehen?

• Wir definieren zuerst ohne weitere Motivation die Hamilton-Funktion

H(~q, ~p, t) := ~q~p − L(~q, ~q, t) (4.18)

mit der impliziten Abhangigkeit ~q(~q, ~p, t). Ihre totale Ableitungnach der Zeit ist

dH =

f∑j=1

∂H∂q j

dq j +

f∑j=1

∂H∂p j

dp j +∂H∂t

dt

=

f∑j=1

(p jdq j + q jdp j −

∂L∂q j

dq j −∂L∂q j

dq j

)−∂L∂t

dt

=

f∑j=1

(q jdp j −

∂L∂q j

dq j

)−∂L∂t

dt . (4.19)

Daraus konnen wir die drei partiellen Ableitungen der Hamilton-Funktion

∂H∂p j

= q j∂H∂q j

= −∂L∂q j

= −p j∂H∂t

= −∂L∂t

(4.20)

ablesen. Die ersten beiden Gleichungen heißen Hamiltonschenkanonischen Gleichungen. In der Herleitung der zweiten Glei-chung benutzen wir die Lagrange-Gleichungen (4.16), dieHamilton-Gleichungen sind daher wiederum aquivalent mit denLagrange-Gleichungen. Wir hatten schon bemerkt, dass der zu q j

konjugierte Impuls p j erhalten ist, wenn L nicht explizit von q j

abhangt. Solche Koordinaten heißen zyklisch.

Page 46: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 4. EXTREMALPRINZIPIEN 39

• Beispiel: Die Lagrange-Funktion des harmonischen Oszillators ineiner Dimension lautet

L(x, x) =m2

x2 −k2

x2 =m2

(x2 − ω2

0x2)

∂L∂x

=mx = p . (4.21)

Der Oszillator beschreibt also eine Ellipse im zweidimensionalenPhasenraum,(

xp

)=

(x

mx

)= A0

(cos(ω0t − δ0)

−mω0 sin(ω0t − δ0)

), (4.22)

Fur ihn erhalten wir die Hamilton-Funktion

H(x, p) = xp−L(x, x) =p2

m−

p2

2m+

m2ω2

0x2 =p2

2m+

m2ω2

0x2 (4.23)

und die Hamilton-Gleichungen

x =pm

und p = mx = −mω20x . (4.24)

Die erste Gleichung ist identisch mit der Definition des Impulses,und die zweite ist die Bewegungsgleichung.

4.2.2 Hamilton-Funktion und Energie

• Nach (4.19) ist die totale zeitliche Anderung der Hamiltonfunkti-on

dHdt

=

f∑j=1

(∂H∂q j

q j +∂H∂p j

p j

)+∂H∂t

=

f∑j=1

(−p jq j + q j p j

)+∂H∂t

=∂H∂t

, (4.25)

Wenn also H nicht explizit von der Zeit abhangt, ist H eine Er-haltungsgroße.

Anhand eines Beispiels konnen wir diese Erhaltungsgroße iden-tifizieren: Fur einen Massenpunkt der Masse m, der im Feld einerPotentialkraft die potentielle Energie V(x1, x2, x3) hat, lautet dieLagrange-Funktion

L =m2

(x21 + x2

2 + x23) − V(x1, x2, x3)

⇒ p j =∂L∂x j

= mx j

⇒ H =

3∑j=1

p j x j − L =

3∑j=1

p2j

2m+ V = E . (4.26)

Die Hamiltonfunktion sollte die Gesamtenergie sein.

Page 47: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 4. EXTREMALPRINZIPIEN 40

• Sei allgemein ein konservatives System von N Massenpunktengegeben. Es unterliege r holonom-skleronomen Zwangsbedin-gungen f j(~xi) = 0. Diese werden durch Einfuhrung von f = 3N−rverallgemeinerten Koordinaten ~q erfullt. Wegen der skleronomenZwangsbedingungen kommt in der Relation zwischen den ~xi und~q die Zeit nicht explizit vor. Fur die Geschwindigkeiten und dieEnergie gilt wir schon in (1.13)

~xi =

f∑j=1

∂~xi

∂q jq j , 1 ≤ i ≤ N

T =

N∑i=1

mi

2~x 2

i =

f∑j,k=1

N∑i=1

mi

2∂xi

∂q j

∂xi

∂qk

q jqk . (4.27)

Die Energie ist eine homogene Funktion zweiten Grades in q j,und V hangt nicht explizit von q j ab. Aus der Lagrange-FunktionL = T (~q, ~q) − V(~q) erhalten wir die kanonischen Impulse

p j =∂L∂q j

=∂T∂q j

(4.28)

und damit die Hamiltonfunktion

H =

f∑j=1

p jq j − L =

f∑j=1

q j∂T∂q j− T + V (4.29)

• Nun konnen wir ein allgemeines Resultat verwenden: Die Funk-tion f (~x) ist eine homogene Funktion vom Grad k in ~x, wennf (a~x) = ak f (~x). In dem Falle gilt

x j ·∂ f (a~x)∂(ax j)

=∂

∂af (a~x) =

∂a[ak f (~x)] = k ak−1 f (~x) . (4.30)

Fur a = 1 ist dies das Euler-Theorem uber homogene Funktionen,

~x · ~∇ f (~x) = k f (~x) . (4.31)

Da T homogen vom Grad k = 2 in q ist, muss

f∑j=1

q j∂T∂q j

= 2T ⇒ H = 2T − T + V = T + V = E . (4.32)

Da H nicht explizit von der Zeit abhangt, folgt die Erhaltung derGesamtenergie,

dHdt

=∂H∂t

= 0 . (4.33)

Diese Identitat ist in der Praxis wichtig, denn sie bedeutet, dasswir im Hamilton-Zugang uber die Hamilton-Funktion physikali-sche Aussagen uber unser System machen konnen, selbst wennwir in keinem der Zugange die Bewegungsgleichungen losenkonnen oder wollen.

Page 48: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 4. EXTREMALPRINZIPIEN 41

• Es gibt zahlreiche weitere Extremalprinzipien; als Beispiel verall-gemeinern wir nun das Hamiltonsche Prinzip auf nichtkonserva-tive Systeme. Seien N Massenpunkte gegeben, die r < 3N holo-nomen Zwangsbedingungen unterliegen. Fur solche Systeme ver-schwindet die Variation

δ

∫ t1

t0T (~q, ~q, t)dt +

∫ t1

t0δAedt = 0 , (4.34)

Wobei wie vorher angenommen wird, dass die Bahnen im Konfi-gurationsraum dieselben Anfangs- und Endpunkte durchlaufen,

δ~q(t0) = ~0 = δ~q(t1) . (4.35)

Unter Verwendung der verallgemeinerten Kraft in (3.1) lautet dieVariation (4.34)∫ t1

t0dt

f∑j=1

[∂T∂q j

δq j +∂T∂q j

δq j + Q jδq j

]= 0 , (4.36)

woraus nach partieller Integration∫ t1

t0dt

f∑j=1

[∂T∂q j

+ Q j −ddt∂T∂q j

]δq j +

∂T∂q j

δq j

∣∣∣∣∣∣t1t0

(4.37)

folgt. Die Randterme in (4.37) verschwinden wegen (4.35), undda die δq j beliebig sind, folgt

ddt∂T∂q j−∂T∂q j− Q j = 0 . (4.38)

Das sind die Lagrange-Gleichungen 2. Art fur den Fall nichtkon-servativer Krafte. Die Umkehrung erfolgt vollig analog, wodurchgezeigt ist, dass das Extremalprinzip (4.34) zu den Lagrange-Gleichungen 2. Art (4.38) aquivalent ist, auch im Falle niche kon-servativer Krafte.

4.2.3 Hamilton-Gleichungen und Wirkungsprinzip

• Bislang haben wir gezeigt, dass das Prinzip der stationaren Wir-kung auivalent zu den Lagrange-Gleichungen ist, und dass dieHamilton-Gleichungen aquivalent zu den Lagrange-Gleichungensind. Zur Illustration zeigen wir jetzt die verbleibende direkte Ver-knupfung zwischen der Wirkung und den Hamilton-Gleichungen.

• Entsprechend der Definition der Hamiltonfunktion lasst sich dieWirkung auch in die Form

S =

∫ t1

t0L(~q, ~q, t)dt =

∫ t1

t0

[~q~p − H(~q, ~p, t)

]dt (4.39)

Page 49: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 4. EXTREMALPRINZIPIEN 42

bringen. Die Variation der Wirkung fuhrt dann auf

0 = δS =

f∑j=1

∫ t1

t0

[p jδq j + q jδp j −

∂H∂q j

δq j −∂H∂p j

δp j

]dt .

(4.40)Der erste Term in eckigen Klammern kann partiell integriert wer-den,

f∑j=1

∫ t1

t0p jδq jdt =

f∑j=1

p jδq j

∣∣∣∣∣∣∣t1

t0

f∑j=1

∫ t1

t0p jδq j = −

f∑j=1

∫ t1

t0p jδq j.

(4.41)Damit erhalt man

0 = δS =

f∑j=1

∫ t1

t0

[(q j −

∂H∂p j

)δp j −

(p j +

∂H∂q j

)δq j

]dt . (4.42)

Es folgen die Hamilton-Gleichungen, weil die Variationen imPhasenraum δq j und δp j beliebig sind.

Page 50: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

Kapitel 5

Symmetrien undErhaltungssatze

Bei der Losung von Bewegungsgleichungen in der Newtonschen Me-chanik (Energie) oder in der Struktur der Lagrange-Gleichungen (Im-puls) sind fast beilaufig auf Erhaltungsgroßen gekommen. Wir habenauch gesehen, dass sich manche Probleme wie der Kreisel sehr ein-fach mit Hilfe von Erhaltungsgroßen losen lassen. Es wird daher Zeit,dass wir uns diesem Problem systematisch nahern. Dies wird es unserlauben, uber die Analyse der Lagrangefunktion Symmetrien unseresSystems und Erhaltungsgroßen zu verknupfen.

5.1 Galilei-Invarianz

• Inertialsysteme waren als Idealisierungen eingefuhrt worden, diedie Realitat mehr oder weniger gut beschreiben. Die naheliegendeFrage ist, ob ein Beobachter in einem abgeschlossenen Kastenfeststellen kann, ob sein Referenzsystem ein Inertialsystem ist.Offensichtlich wird er/sie zunachst uberprufen, welche Form dieBewegungsgleichungen in seinem System annehmen.

Er betrachte also N Massenpunkte der Massen mi an den Or-ten ~xi, zwischen denen Potentialkrafte wirken, d.h. die potenti-elle Energie des Massenpunkts i relativ zum Massenpunkt j seiV ji(|~xi − ~x j|), und damit ist die Kraft des j-ten auf den i-ten Mas-senpunkt durch ~F ji(~xi) = −~∇iV ji(|~xi − ~x j|) gegeben. Das Systemlasst sich also durch eine Lagrangefunktion beschreiben,

ddt∂L(~x, ~x, t)∂xi, j

−∂L(~x, ~x, t)∂xi, j

= 0 , (5.1)

mit 1 ≤ i ≤ N and j = 1, 2, 3. Nach (4.12) ist die Lagrange-funktion aber nicht eindeutig, weil man zu ihr die totale zeitliche

43

Page 51: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 5. SYMMETRIEN UND ERHALTUNGSSATZE 44

Ableitung einer beliebigen Funktion f (~x, t) addieren kann, ohnedie Physik zu andern. Dies ist die einzige Willkur, die die Lagran-gefunktion erlaubt.

• Das Beobachtungssystem sei wie immer (t, ~x ), ein sicherlich exi-stierendes Inertialsystem (t′, ~x ′). Allgemein gilt dann

t′ = t + τ und ~x ′ = ~a(t) + R(t) · ~x(t) . (5.2)

Die erste Gleichung beschreibt eine Verschiebung der Zeit, diezweite eine Translation und Rotation des Koordinatensystems.Wie kann sich der Beobacher bewegen, ohne es feststellen zukonnen? Zunachst mussen R(t) und ~a(t) konstant sein, denn sonsttraten Scheinkrafte zum Beispiel bei einem Foucaultschen Pendelauf. Damit konnen wir die Lagrangefunktion vom Inertialsystemins Beobachtersystem umrechnen,

~x ′2 =(~a(t) + R~x(t)

)2= ~a(t)2 + 2~aT (t)R~x(t) + ~x(t)2

L =12

N∑i=1

mi~x ′2i −∑j,i

V ji(|~x′i − ~x′j|)

=

12

N∑i=1

mi~x 2i −

∑j,i

V ji(|~xi − ~x j|)

+ ~aTN∑

i=1

miR~xi +~a 2

2

N∑i=1

mi .

(5.3)

In der ersten Zeile haben wir benutzt, dass die Rotation R dieLange des Vektors ~x erhalt. Die beiden Systeme unterscheidensich also in den letzten beiden Termen.

• Nur falls es eine Funktion f (x, t) gibt, deren totale zeitliche Ab-leitung die zusatzlichen Terme in (5.3) darstellen kann, dann sinddie beobachteten Bewegungsgleichungen mit denen im Inertial-system identisch:

d f (~x, t)dt

=∂ f (~x, t)∂t

+

N∑i=1

~x Ti ·

~∇i f (~x, t)

=~aTN∑

i=1

miR~xi +~a 2

2

N∑i=1

mi

=

N∑i=1

~x Ti miRT ~a +

~a 2

2

N∑i=1

mi . (5.4)

Nach der ~x-Abhangigkeit ist das (genau dann) der Fall, wenn dieBedingungen

∂ f (~x, t)∂t

=~a 2

2

N∑i=1

mi und ~∇i f (~x, t) = miRT ~a (5.5)

Page 52: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 5. SYMMETRIEN UND ERHALTUNGSSATZE 45

gelten. Nach unserer Annahme, dass es keine offensichtlichenScheinkrafte gibt, gilt ~a(t) = ~a0 + ~at mit konstanten ~a0 und ~a.Damit vereinfacht hat die Bedingung (5.4) eine einfache Stamm-funktion, namlich die Translation

f (~x, t) = ~aTN∑

i=1

miR~xi +~a 2t2

N∑i=1

mi . (5.6)

• Wenn wir unsere bekannten Bedingungen in (5.1) einsetzen, dannerhalten wir die allgemeine Gestalt derjenigen Transformationen,die im Beobachtersystem nicht nachweisbar sind, weil sie die Be-wegungsgleichungen invariant lassen,

t′ = t + τ , ~x ′ = ~a0 + ~at + R · ~x , ~a0 = ~a = R = konst. (5.7)

Die freien Parameter sind also τ,~a0, ~a und R. Diese Methode istcharakteristisch fur die moderne Physik: Wir haben aus der Ei-chinvarianz der klassischen Mechanik, ausgedruckt durch (4.12),ihre Symmetrie gegenuber der so defiierten zehnparametrigenGalilei-Gruppe gefolgert. Sie hat folgenden physikalischen Ge-halt:

1. Die Transformation t′ = t + τ und ~x ′ = ~x entspricht einerNullpunktsverschiebung der Zeit. Diese Invarianz bedeutetdie Homogenitat der Zeit.

2. Transformationen mit t′ = t und ~x ′ = ~a0 + ~x entsprechen derWahl des Koordinatenursprungs. Diese Invarianz bedeutetdie Homogenitat des Raums.

3. Transformationen mit t′ = t und ~x ′ = R · ~x bedeuten eineDrehung der Koordinatenachsen. Diese Invarianz bedeutetdie Isotropie des Raums, keine Richtung ist ausgezeichnet.

4. Transformationen mit t′ = t und ~x ′ = ~x + ~at bedeuten ei-ne geradlinig-gleichformiger Bewegung. Eine beschleunigteBewegung ware feststellbar.

5.2 Noether-Theoreme

Nachdem wir die Bedeutung von Symmetrien der Lagrange-Funktionfur die Galilei-Transformationen verstanden haben, gehen wir einenSchritt weiter und verknupfen sie mit Erhaltungssatzen, von denen wirja wissen wie sie mit den Lagrange-Gleichungen zusammenhangen.

• Wir beginnen mit infinitesimale Koordinaten-Transformationender Art (5.7), die die Lagrangefunktion nur um eine totale zeit-

Page 53: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 5. SYMMETRIEN UND ERHALTUNGSSATZE 46

liche Ableitung andern,

t →t′ = t + δt~xi(t)→~x ′i (t′) = ~xi(t) + δ~xi(t)

L(~x, ~x, t)→L(~x′, ~x′, t′) = L(~x, ~x, t) +d f (~x, t)

dt. (5.8)

Die Zeitverschiebung sei konstant, δt = konst. Durch die Koordi-natentransformation andert sich das Wirkungsintegral zu

S ′ =

∫ t′1

t′0

dt′L(~x ′, ~x ′, t′)

=S +

∫ t1

t0dt

[∂L∂xi, j

(~x ′i − ~xi) j +∂L∂xi, j

(~x ′i − ~xi) j

]+ δt

[L(~x(t1), ~x(t1), t1

)− L

(~x(t0), ~x(t0), t0

)], (5.9)

wobei der Ausdruck in der letzten Zeile durch die infinitesimaleVeranderung der Integrationsgrenzen zustande kommt und wir furj = 1, 2, 3 die Summenkonvention benutzen. Partielle Integrati-on und Verwendung der Euler-Lagrange-Gleichungen fuhren nunzunachst auf∫ t1

t0dt∂L∂xi, j

(~x ′i − ~xi) j =∂L∂xi, j

(~x ′i − ~xi) j

∣∣∣∣∣∣t1t0

∫ t1

t0dt

ddt

∂L∂xi, j

(~x ′i − ~xi) j

=∂L∂xi, j

(~x ′i − ~xi) j

∣∣∣∣∣∣t1t0

∫ t1

t0

∂L∂xi, j

(~x ′i − ~xi) jdt .

(5.10)

Damit schrumpft (5.9) auf

S ′ = S +

[∂L∂xi, j

(~x ′i (t) − ~xi(t)) j + L(~x, ~x, t)δt]t1

t0

. (5.11)

• Schließlich gilt entlang der Trajektorie eines Massenpunktes

~x ′i (t′) =~x ′i (t + δt) = ~xi(t) + δ~xi

⇔ ~x ′i (t) =~xi(t − δt) + δ~xi = ~xi(t) − ~xi(t)δt + δ~xi , (5.12)

womit sich der Term in eckigen Klammern in (5.11) zu

∂L∂xi, j

(~x ′i − ~xi) j + L(~x, ~x, t)δt =∂L∂xi, j

δxi, j −

(∂L∂xi, j

xi, j − L)δt

=~piδ~xi −(~pi~xi − L

)δt

=~piδ~xi − Hδt δt (5.13)

Page 54: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 5. SYMMETRIEN UND ERHALTUNGSSATZE 47

umformen lasst, wobei wir den konjugierten Impuls p = ∂L/∂xund der Hamilton-Funktion H = px − L verwenden. Fur die Wir-kung heißt das unter der Annahme, dass wir die Physik nichtandern

S ′ = S + ~piδ~xi − Hδt∣∣∣t1t0

=S + δ f |t1t0⇔

[~piδ~xi − Hδt − δ f

]t1t0 =0 (5.14)

Dabei hat die infinitesimale Verschiebung der Lagrange-Funktionnach (5.6) die Form

δ f = ~a TN∑

i=1

miR δ~xi +~a 2

2δt

N∑i=1

mi . (5.15)

Weil t0 und t1 beliebige Zeitpunkte waren muss also der Ausdruck

~piδ~xi − Hδt − δ f (5.16)

eine Erhaltungsgroße darstellen.Emmy Noether (1882-1935)

• Zu welchen Erhaltungsgroßen fuhrt daher die Symmetrie unterder Galilei-Gruppe?

1. Zeittranslationen t′ = t +δt mit δ~xi = 0 und ~a = 0 fuhren aufδ f = 0 und Hδt = konst. oder H =konst. Die Homogenitatder Zeit fuhrt also zur Energieerhaltung.

2. Ortstranslationen mit δt = 0 und ~x ′ = ~x+δ~x bedeuten wegen~a = 0 wieder δ f = 0, was mit (5.16) auf ~pi · δ~x = konst oder~pi · ~ex = konst, weil die Lange des Vektors ~x sich bei einerTranslation nicht andert. Die Homogenitat des Raums fuhrtalso zur Impulserhaltung.

3. Rotationen mit t′ = t und δ~x = δ~ϕ×~x um den infinitesimalenDrehwinkel δ~ϕ bedeuten mit ~a = 0 ebenfalls δ f = 0. Aus(5.16) folgt wegen δt = 0 auch

N∑i=1

~pi · (δ~ϕ × ~xi) = δ~ϕ ·

N∑i=1

(~xi × ~pi) = konst. (5.17)

Da der Drehwinkel δ~ϕ konstant ist, folgt aus der Isotropiedes Raums die Drehimpulserhaltung.

4. Seien nun schließlich t = t′ und ~x ′ = δ~a t + ~x. Dann ist

δ f = δ~a TN∑

i=1

mi~xi + O(δ~a 2) , (5.18)

und daher wegen (5.16)

δ~a T

t N∑i=1

~pi −

N∑i=1

mi~xi

= konst. (5.19)

Page 55: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 5. SYMMETRIEN UND ERHALTUNGSSATZE 48

Fur konstantes δ~a ist dies die geradlinig-gleichformige Be-wegung des Schwerpunkts,

~X =1M

N∑i=1

mi~xi = ~X0 +t

M

N∑i=1

~pi . (5.20)

Die zehn Parameter der Galilei-Gruppe, und damit ihre zehnGeneratoren, gehoren also zu zehn Erhaltungsgroßen: Eine istdie Energie, drei garantieren die Tragheitsbewegung des Schwer-punkts, und jeweils drei die Erhaltung des Impulses und des Dre-himpulses.

5.3 Lorentz-Invarianz (nicht in Vorlesung)

5.3.1 Spezielle Lorentztransformation

• Die Galilei-Invarianz fuhrt zu Widerspruchen mit der Erfahrung.Beispiele dafur liefert etwa der Zerfall von Myonen. Myonen sindLeptonen wie etwa das Elektron, die nach

µ→ e− + νe + νµ (5.21)

in Elektronen und (Anti-)Neutrinos zerfallen, wobei die Lebens-dauer τµ = 2 × 10−6 s betragt. Experimentell zeigt sich aber, dassdie Lebensdauer zunimmt, wenn das Myon sich im Laborsystemmit Geschwindigkeiten nahe der Lichtgeschwindigkeit bewegt.Das beim Zerfall emittierte Elektron hat beinahe Lichtgeschwin-digkeit, aber selbst dann nie eine hohere Geschwindigkeit, wennbereits das Myon sich fast mit Lichtgeschwindigkeit bewegte.

• Die Lichtgeschwindigkeit im Vakuum betragt c = 2.99792458 ×1010 cm s−1. Dass sie endlich ist, wurde bereits von dem danischenAstronomen Ole Rømer (1644-1710) vermutet, der sie mithilfeder Jupitermonde zu c = 2.14 × 1010 cm s−1 bestimmte.

• Ausgehend von dem Postulat, dass die Lichtgeschwindigkeit c ei-ne universelle Konstante sei, die nicht vom Bewegungszustanddes Inertialsystems abhange, in dem sie gemessen wird, kon-struieren wir nun eine Transformation zwischen Inertialsyste-men, die bei sehr hohen Geschwindigkeiten nahe c die Galilei-Transformation ersetzen soll. Dazu geben wir uns zwei Inertial-systeme K und K′ vor, die zum Zeitpunkt t = 0 = t′ zusam-menfallen. K bewege sich von K′ aus gesehen mit der konstantenGeschwindigkeit v . c langs ihrer gemeinsamen ~e3-Achse.

Page 56: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 5. SYMMETRIEN UND ERHALTUNGSSATZE 49

• Fur ein Lichtsignal, das bei t = 0 im gemeinsamen Ursprung vonK und K′ langs ~e3 ausgesandt wird, muss aufgrund der Vorausset-zung

(x3)2 − (ct)2 = (x′3)2 − (ct′)2 (5.22)

gelten. Lineare Transformationen zwischen K und K′ mussendemnach durch

(x′3 + ct′) = f (x3 + ct) , (x′3 − ct′) =1f

(x3 − ct) (5.23)

bestimmt sein. Summe und Differenz dieser beiden Gleichungenergeben

(x′3, ct′) =12

[f (x3 + ct) ±

1f

(x3 − ct)], (5.24)

wobei das positive Vorzeichen fur x′3, das negative fur ct′ gilt.

• Da sich der Ursprung von K′ mit der Geschwindigkeit −v in Kbewegt, muss außerdem fur x′3 = 0

x3 = −vt = −v

c(ct) =: −β (ct) (5.25)

sein, wobei die dimensionslose Geschwindigkeit β := v/c ein-gefuhrt wurde. Setzen wir dieses x3 in (5.24) ein und verlangenx′3 = 0, folgt sofort

f (1 − β) −1f

(1 + β) = 0 ⇒ f =

√1 + β

1 − β. (5.26)

Setzen wir dieses Ergebnis in (5.24) ein, erhalten wir

x′3 = γ(x3 + βct) , ct′ = γ(ct + βx3) , (5.27)

worin der Lorentz-Faktor

γ := (1 − β2)−1/2 (5.28)

eingefuhrt wurde. Im Grenzfall kleiner Geschwindigkeiten, β 1, ist γ ≈ 1 + β2/2 ≈ 1.

5.3.2 Der Minkowski-Raum

• Wir fuhren ct =: x0 als weitere Koordinate ein und fassen die Ko-ordinatenquadrupel zu Vierervektoren x = (xµ) = (x0, x1, x2, x3)zusammen. Sie spannen den Minkowski-Raum M auf. Zwi-schen zwei verschiedenen Inertialsystemen im Minkowski-Raum

Page 57: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 5. SYMMETRIEN UND ERHALTUNGSSATZE 50

vermittelt die Lorentz-Transformation. Die spezielle Lorentz-Transformation (5.27) lasst sich durch

x′0x′1x′2x′3

=

γ 0 0 γβ0 1 0 00 0 1 0γβ 0 0 γ

·

x0

x1

x2

x3

(5.29)

darstellen. Da sie aufgrund ihrer Konstruktion den Ausdruck−(x0)2+~x 2 invariant lasst, definieren wir als Skalarprodukt zweierVierervektoren

〈xµ, xµ〉 = −(x0)2 + ~x 2 = gµνxµxν , (5.30)

worin die Komponenten (gµν) = diag(−1, 1, 1, 1) der Metrik g an-stelle des Kronecker-Symbols auftreten.

• Die Metrik g ist ein symmetrischer Tensor zweiter Stufe, weil siezwei Vektoren aus einem Vektorraum V auf bilineare Weise inden Zahlenkorper abbildet,

g : V × V → R , (v, w) 7→ g(v, w) . (5.31)

Mit ihrer Hilfe lasst sich eine lineare Abbildung

v∗ : V → R , w 7→ v∗(w) = g(v, w) = 〈v, w〉 (5.32)

einfuhren, die Vektoren nach R abbildet. Die Menge der linea-ren Abbildungen (5.32) wird als Dualraum des Vektorraums Vbezeichnet.

• Vierervektoren werden mit oberen Indizes gekennzeichnet, Dual-vektoren mit unteren. Demnach hat wegen

〈x, y〉 = gµνxµyν = (gµνxµ)yν (5.33)

der Dualvektor x∗ eines Vierervektors x die Komponenten

xν = gµνxµ = (−x0, x1, x2, x3) . (5.34)

Im Euklidischen Raum ist der Unterschied zwischen Vektorenund Dualvektoren unerheblich, weil die die Metrik dort durch dieEinheitsmatrix dargestellt werden kann. In der Relativitatstheoriewird er entscheidend wichtig. Die Einsteinsche Summenkonven-tion wird in der Relativitatstheorie dadurch modifiziert, dass ubergleiche Indizes summiert wird, wenn sie auf verschiedenen Nive-aus stehen.

• Daher lasst sich die spezielle Lorentz-Transformation (5.30) inder Form

(xµ)′ = Λµν xν (5.35)

Page 58: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 5. SYMMETRIEN UND ERHALTUNGSSATZE 51

schreiben, wobei die Λµν die Komponenten der Matrix aus (5.30)

sind. Wie man leicht nachrechnet, gilt

ΛµνΛ

µ′

ν′gµµ′ = gνν′ , (5.36)

was die Orthogonalitatsrelation fur Koordinatentransformationenim Euklidischen Raum ersetzt.

• Allgemein ist das Quadrat eines Vierervektors invariant unterTransformationen der Lorentzgruppe, die sich aus speziellen Lor-entztransformationen, orthogonalen dreidimensionalen Transfor-mationen und Zeitumkehrtransformationen zusammen setzen.

• Als Beispiel fur die Lorentz-Transformation betrachten wir dieAddition von Geschwindigkeiten. Sei w < c die Geschwindigkeiteines Teilchens im ungestrichenen System in x3-Richtung, (xµ) =

(ct, 0, 0, wt). Dann ist

(xµ)′ = γ

ct + βwt

00

βct + wt

. (5.37)

Seine Geschwindigkeit im gestrichenen System ist

w′ =(x3)′

t′=βct + wtct + βwt

c =w + v

1 + vw/c2 ; (5.38)

das ist das Geschwindigkeits-Additionstheorem.

Page 59: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

Kapitel 6

Analytische Mechanik

In den vergangenen Kapiteln haben wir in verschiedenen Zugangen undim Detail die Bahnen von Korpern durch ihre Bewegungsgleichungenbestimmt. Dabei war der Konfigurationsraum durch die Koordinaten qdefiniert, der Phasenraum durch die Kombination von Orts- und Impuls-koordinaten (q, p). Die Bahnen von Korpern waren als Funktionen derZeit q(t) gegeben, woraus auch immer die Geschwindigkeiten q(t) unddie Impulse p(t) als Funktion der Zeit folgen. Diese Zeitabhangigkeitder Bahnen im so definierten erweiterten Phasenraum (q, p, t) betrach-ten wir in diesem Kapitel.

6.1 Kanonische Transformationen

6.1.1 Bahnen im erweiterten Phasenraum

• Wir betrachten ein mechanisches System mit f Freiheitsgradenund den verallgemeinerten Koordinaten q j, 1 ≤ j ≤ f . Die La-grangefunktion sei L(~q, ~q, t), und die Bewegungsgleichungen sei-en dementsprechend

ddt∂L∂q j−∂L∂q j

= 0 . (6.1)

Die zu den q j kanonisch konjugierten Impulse sind

p j =∂L∂q j

. (6.2)

Wenn sich diese Gleichungen nach q j auflosen lassen, konnen dieq j durch die p j dargestellt werden. In diesem Fall kann man dieHamiltonfunktion

H(~q, ~p, t) = p jq j − L(~q, ~q, t) (6.3)

52

Page 60: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 6. ANALYTISCHE MECHANIK 53

mit q j = q j(~q, ~p, t) explizit ausschreiben. Die Bewegungsglei-chungen sind dann

q j =∂H∂p j

und p j = −∂H∂q j

. (6.4)

• Wir zum Beispiel in (5.14) betrachten wir nun das vollstandigeDifferential der Wirkung

dS := p jdq j − Hdt = p jq jdt − Hdt (6.5)

auf dem erweiterten Phasenraum. Die zweite Form nimmt an,dass wir das Diffenetial d~q als Funktion der Zeit schreibenkonnen. Das System werde zu zwei Zeiten t1, t2 > t1 bei den La-gekoordinaten ~q1,2 mit den Impulsen ~p1,2 untersucht, d.h. an zweiPunkten P1,2 im erweiterten Phasenraum. Wir behaupten, dass diewirkliche Bewegung des Systems so verlauft, dass

δ

∫ P2

P1

dS = 0 (6.6)

gilt. Damit ware das Hamiltonsche Prinzip auf Bahnen im erwei-terten Phasenraum ubertragen.

• Zum Beweis geben wir die wirkliche Bahn des Systems im er-weiterten Phasenraum vor, q j = q j(t), p j = p j(t). Die Anfangs-und Endpunkte sind ~q(ti) = ~q(i), ~p(ti) = ~p(i) fur i = 1, 2. Dazufuhren wir leicht gestorte Vergleichsbahnen ~q′ = ~q(t) + δ~q(t) mit~p′ = ~p(t) + δ~p(t) ein, ohne dabei die Anfangs- und Endpunktezu verandern, δ~q(t1) = ~0 = δ~q(t2). Anderungen der Anfangs- undEndimpulse, δ~p(t1) und δ~p(t2), bleiben hier noch zugelassen. DieVariation des Wirkungs-Differentials ist dann bis zur ersten Ord-nung in den Storgroßen

0 =δ

∫ t2

t1

[p jq j − H(~q, ~p, t)

]dt

=

∫ t2

t1

[(p j + δp j)(q j + δq j) − H(~q + δ~q, ~p + δ~p, t)

]dt

∫ t2

t1

[p jq j − H(~q, ~p, t)

]dt

=

∫ t2

t1

[(p j δq j + q j δp j

)−

(∂H∂q j

δq j +∂H∂p j

δp j

)]dt

=

∫ t2

t1

[(p j

dδq j

dt+ q jδp j

)−

(∂H∂q j

δq j +∂H∂p j

δp j

)]dt

=

∫ t2

t1

[(−p j −

∂H∂q j

)δq j +

(q j −

∂H∂p j

)δp j

]dt = 0 , (6.7)

wo wir im letzten Schritt wieder partiell integriert haben und dieOberflachenterme verschwinden. Da δq j und δp j beliebig waren,

Page 61: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 6. ANALYTISCHE MECHANIK 54

folgen die Hamiltonschen kanonischen Gleichungen. Die Um-kehrung ist in jedem Schritt moglich. Damit ist bewiesen, dass(6.6) die wahre Bahn des Systems im erweiterten Phasenraum be-schreibt.

6.1.2 Kanonische Transformationen

• Aus der Verknupfung von Wirkung und Lagrange-Formalismushatten wir die Freiheit abgeleitet, zur Lagrange-Funktion einentotale Zeitableitung zu addieren. Welche Transformationen las-sen nun die Hamiltonschen Gleichungen invariant? Zunachstsind der Lagrange- und Hamiltonformalismus vollig unabhangigvon der speziellen Wahl der verallgemeinerten Koordinaten, alsokonnen wir beliebige neue verallgemeinerte Koordinaten q′j(~q, t)einfuhren. Wenn die Funktionaldeterminante∣∣∣∣∣∣∂(q′1, . . . , q

′f )

∂(q1, . . . , q f )

∣∣∣∣∣∣ (6.8)

nicht verschwindet, konnen wir eindeutig auf die q j(~q′, t) zuruck-transformieren. Wegen

p′j =∂L∂q′j

=∂L∂qk

∂qk

∂q′j= a jk pk (6.9)

induziert der Ubergang zu neuen verallgemeinerten Koordinatenq′j eine lineare Transformation der dazu konjugierten Impulse.Die Lagrange-Gleichungen bleiben ebenso unverandert wie dieHamiltonschen Gleichungen.

• Nach der Diskussion der Eichfreiheit in (4.13) vermuten wir,dass auch die Hamiltonschen Gleichungen eine erheblich großereKlasse von Transformationen erlauben. Um das einzusehen, ge-ben wir unabhangige Transformationen

q′j(~q, ~p, t) und p′j(~p, ~q, t) (6.10)

auf dem erweiterten Phasenraum vor und verlangen, dass es ei-ne Funktion Φ geben moge so, dass sich die Differentiale dSaus (6.5) vor und nach der Transformation (6.10) nur um dasvollstandige Differential von Φ unterscheiden,

dS = p jdq j − Hdt = p′jdq′j − H′dt + dΦ = dS ′ + dΦ . (6.11)

Wenn das so ist, bleiben die Hamiltonschen Gleichungen erhal-ten. Dies ist leicht einzusehen, denn∫

dS =

∫dS ′ +

∫dΦ =

∫dS ′ + (Φ2 − Φ1) . (6.12)

Page 62: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 6. ANALYTISCHE MECHANIK 55

Wenn nun die Endpunkte der Bahn im erweiterten Phasenraumnicht variiert werden, wenn also auch die Anfangs- und Endim-pulse unverandert bleiben, δp j(t1) = 0 = δp j(t2), folgt

δ

∫dS = δ

∫dS ′ , (6.13)

Solche Transformationen des erweiterten Phasenraums heißenkanonisch. Fur eine eventuelle Anwendung stellt sich nun die Fra-ge, wie man eine solche Funktion Φ konstruiert.

6.1.3 Hamilton-Jacobi-Gleichung

Carl Gustav Jakob Jacobi• Wir nehmen zunachst an, dass Φ neben den verallgemeinerten

Koordinaten ~q auch von weiteren f Parametern q′j und von derZeit t abhangt. Wir verlangen nur, dass

det ∂2Φ

∂q j∂q′j

, 0 (6.14)

sei, d.h. die Determinante der Krummungsmatrix von Φ mogenicht verschwinden. Wenn wir eine geeigneten Wahl vonΦ(~q, ~q′, t) indirekt durch

p j =∂Φ

∂q jund p′j = −

∂Φ

∂q′j(6.15)

oder~p = ~∇qΦ und ~p′ = −~∇q′Φ (6.16)

definieren, dann konnen wir zeigen, dass die Transformation ka-nonisch ist.

• Fur den Beweis betrachten wir das totale Differential von Φ

dΦ =∂Φ

∂tdt +

∂Φ

∂q jdq j +

∂Φ

∂q′jdq′j

=∂Φ

∂tdt + p jdq j − p′jdq′j

=∂Φ

∂tdt + dS + Hdt − p′jdq′j . (6.17)

Wir konnen dies analog zu (6.11) umschreiben als

dS =p′jdq′j −(H +

∂Φ

∂t

)dt + dΦ

=p′jdq′j − H′dt + dΦ ⇔ H′ = H +∂Φ

∂t. (6.18)

Die Transformation (6.16) mit der entsprechenden Definition vonH′ ist also in der Tat kanonisch. Die Funktion Φ heißt in diesemFall erzeugende Funktion der Transformation.

Page 63: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 6. ANALYTISCHE MECHANIK 56

• Die neue Hamiltonfunktion H′ verschwindet offenbar fur eine ge-eignete Zeitanhangigkeit von Φ, beschrieben durch die Hamilton-Jacobi-Gleichung

H(~q, ~∇qΦ, t

)+∂Φ(~q, ~q′, t)

∂t= 0 . (6.19)

Wenn immer H′ ≡ 0 gilt, dann sind nach den Hamilton-Gleichungen auch q′j = 0 = p′j. Man nennt dies eine ”Transforma-tion auf Ruhe“. Diese abstrakte Herleitung verlangt offensichtlichnach Beispielen.

6.1.4 Harmonischer Oszillator

• Die Lagrange-Funktion des harmonischen Oszillator ist zum Bei-spiel nach (4.21)

L(q, q) =m2

(q2 − ω2q2

), (6.20)

Der kanonisch konjugierte Impuls ist p = mq, und damit lautetdie Hamilton-Funktion

H(q, p) =p2

2m+

mω2

2q2 . (6.21)

• Wir betrachten nun die erzeugende Funktion

Φ(q, q′) =m2ωq2 cot q′ . (6.22)

Sie ist nicht von der Zeit abhangig, wir werden also keine Trans-formation auf Ruhe konstruieren, sondern ein anderes geeignetesKoordinatensystem. Die Impulse ergeben sich aus (6.16) zu

p =∂Φ

∂q= mωq cot q′ (6.23)

p′ = −∂Φ

∂q′=

m2ωq2 1

sin2 q′⇔ q =

√2p′

mωsin q′

p =√

2p′mω cos q′,

wobei (cot x)′ = − sin−2 x verwendet wurde. Da Φ(q, q′) nicht ex-plizit von der Zeit abhangt, ist H′ = H.

• Wenn man q und p in der Hamilton-Funktion durch (6.23) ersetzt,folgt

H′ = H =1

2m2p′mω cos2 q′ +

mω2

22p′

mωsin2 q′ = p′ω . (6.24)

Page 64: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 6. ANALYTISCHE MECHANIK 57

Da H′ nicht von q′ abhangt, ist q′ offenbar zyklisch. Die entspre-chende Hamilton-Gleichung ergibt

p′(t) = −∂H′

∂q′= 0 ⇒ p′(t) = konst. =: p′0 . (6.25)

Außerdem folgt nach der zweiten Hamilton-Gleichung im gestri-chenen System

q′(t) =∂H′

∂p′= ω ⇒ q′(t) = ωt + q′0 . (6.26)

Damit ist in den gestrichenen Koordinaten das System nicht mehroszillierend, sondern eine lineare Bewegung mit konstantem Im-puls und Geschwindigkeit.

• Setzt man dies wieder in q aus (6.23) ein, folgt im originalen,ungestrichenen System

q(t) =

√2p′

mωsin(ωt + q′0) (6.27)

mit den beiden Integrationskonstanten q′0 und p′0, durch die dieAmplitude und die Phase der Schwingung festlegt werden. Wirsehen also dass unsere beiden neuen Koordinaten beide Frei-heitsgrade des harmonischen Oszillators beschreiben: q′ ist daszeitabhangige Argument der Schwingung und p′ ist die konstanteAmplitude.

6.1.5 Bewegung des freien Massenpunkts

• Als weiteres Beispiel betrachten wir die kraftefreie Bewegung ei-nes Massenpunkts m mit kartesischen Koordinaten q j = x j. DieLagrange- und die Hamilton-Funktion sind

L =m2~q 2 und H =

12m

~p 2 . (6.28)

In diesem Fall wollen wir das System auf Ruhe transformieren.Die Hamilton-Jacobi-Gleichung (6.19) mit der Ersetzung p →∂Φ/∂q lautet

12m

( ∂Φ

∂q1

)2

+

(∂Φ

∂q2

)2

+

(∂Φ

∂q3

)2 +∂Φ

∂t= 0 . (6.29)

Zu ihrer Losung verwenden wir den Ansatz

Φ(~q, ~q′, t) = q′1q1 + q′2q2 + q′3q3 − Et (6.30)

mit einer weiteren Konstanten E. Offenbar ist damit die Voraus-setzung (6.14) erfullt, denn die Krummungsmatrix von Φ ist dieEinheitsmatrix,

∂2Φ

∂q j∂q′j=∂q′j∂q′j

= δi j . (6.31)

Page 65: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 6. ANALYTISCHE MECHANIK 58

• Die Hamilton-Jacobi-Gleichung verlangt dann

12m

[(q′1)2 + (q′2)2 + (q′3)2

]− E = 0 ⇒ E =

~q′2

2m(6.32)

⇒ Φ =~q′ · ~q −~q′2

2mt

Fur die konjugierten Impulse erhalten wir nach (6.16)

p j =∂Φ

∂q j= q′j

p′j = −∂Φ

∂q′j= −q j +

p j

mt . (6.33)

Aus den Bedingungen (q′j, p′j) = konst. folgt damit p j = konst.und q j = p jt/m + konst. Zu gegebener, fester Zeit t beschreibt

Φ(~q, ~q′, t) =~q ′ · ~q −~q′2

2mt = konst.

⇔Φ(~q, ~q′, t) − konst

|~q′|=q ′ · ~q −

|~q′|2m

t (6.34)

fur ~q eine Ebenenschar mit dem Normaleneinheitsvektor q ′. We-gen ~p = ~∇qΦ stehen die Impulse senkrecht auf dieser Ebenen-schar. Als Funktion der Zeit wandern Ebenen mit festem Φ mitder Geschwindigkeit |~q ′|/(2m) in Richtung ~q ′ oder ~p weiter.

• Diese Wanderung der Ebenen stellt eine Wellenbewegung dar, dieeine Analogie zwischen geometrischer Optik und theoretischerMechanik herstellt. In der geometrischen Optik heißt Φ Eikonal-funktion und stellt die Phase der Lichtwelle dar. Angeregt durchde Broglie und Einstein fasste Schrodinger die Punktmechanikals Grenzfall der Wellenmechanik auf und setzte fur die Wellen-funktion eines freien Teilchens

ψ(~x, t) = exp[

i~

Φ(~x, t, ~q′)]

(6.35)

an. Φ/~ ist die dimensionslose Phase mit ~ := h/(2π). Fur dieseWellenfunktion verlangt die Hamilton-Jacobi-Gleichung

−~2

2m

(∂2

∂x21

+∂2

∂x22

+∂2

∂x23

)ψ = i~

∂tψ , (6.36)

was bereits die Schrodinger-Gleichung fur ein freies Teilchen ist.

6.2 Liouvillescher Satz, Poisson-Klammern

Bevor wir die Mechanik von einzelnen Teilchen abschließen mussenwir noch zwei Aspekte des (erweiterten) Phasenraumes einfuhren, diein der statistischen Physik, der Quantenmechanik, und der Quantenfeld-theorie wichtig werden.

Page 66: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 6. ANALYTISCHE MECHANIK 59

6.2.1 Liouvillescher Satz

• Gegeben sei ein Ensemble von Systemen, deren Bahnen bei t =

t0 einen Bereich σ0 des Phasenraums uberdecken. Der Satz vonLiouville besagt, dass das Volumen des uberdeckten Phasenraumskonstant bleibt,

Volumen[σ(t)] = konst (6.37)

oder in Form des Integralmaßes∫σ(t)

d~qd~p = konst . (6.38)

• Zum Beweis dieses wichtigen Satzes gehen wir in zwei Schrit-ten vor: Erstens haben wir oben gesehen, dass sich jedes Ha-miltonsche mechanische System durch eine geeignete kanonischeTransformation auf Ruhe transformieren lasst. Diese Transforma-tion wird im Allgemeinen von der Zeit abhangen. Mit ihrer Hilfelasst sich eine Schar von Trajektorien im erweiterten Phasenraumin ein Geradenbundel transformieren, das parallel zur Zeitachseverlauft. Dieses Geradenbundel schließt ein festes Phasenraum-volumen ein.

• Das beweist den Satz von Liouville noch nicht, weil die kano-nische Transformation das Phasenraumvolumen bereits geanderthaben kann. Wir brauchen also zweitens die Aussage, dass ka-nonische Transformationen das Phasenraumvolumen unverandertlassen. Dies wird dadurch ausgedruckt, dass bei kanonischenTransformationen (q, p, t)→ (q′, p′, t) die Funktionaldeterminan-te immer gleich eins ist, ∣∣∣∣∣∣ ∂(~q, ~p)

∂(~q′, ~p′)

∣∣∣∣∣∣ = 1 , (6.39)

was wir hier ohne Beweis verwenden. Fur den freien Massen-punkt hatten wir dies aber explizit gesehen. Das druckt geradeden benotigten Sachverhalt aus, dass kanonische Transformatio-nen das Volumenelement im Phasenraum konstant lassen.

• Beide Schritte zusammengenommen bedeuten also, dass jedesHamiltonsche System sich durch eine kanonische Transformationauf Ruhe transformieren lasst, dass sich dabei das Phasenraumvo-lumen nicht andert, und dass dann trivialerweise σ(t) = σ0 gilt.Das beweist die Aussage des Satzes von Liouville.

6.2.2 Poisson-Klammern

• Sei ρ(q, p, t) die Dichteverteilung des Ensembles im Phasenraum,d.h. ρ(q, p, t)dqdp ist die Anzahl der Ensemblemitglieder zur Zeit

Page 67: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 6. ANALYTISCHE MECHANIK 60

t im Phasenraumelement zwischen [q, q + dq] und [p, p + dp].Die Systeme konnen im erweiterten Phasenraum nicht verlorengehen,

ρ(q, p, t)dqdp = ρ(q0, p0, t0)dq0dp0 (6.40)

woraus mithilfe des Liouvilleschen Satzes

ρ(q, p, t) = ρ(q0, p0, t0) (6.41)

folgt. Die totale Ableitung der Dichte ρ ist wegen der Hamilton-Gleichungen

∂ρ

∂t+

f∑j=1

(q j∂ρ

∂q j+ p j

∂ρ

∂p j

)=∂ρ

∂t+

f∑j=1

(∂H∂p j

∂ρ

∂q j−∂H∂q j

∂ρ

∂p j

).

(6.42)Den Ausdruck in Klammern nennen wir Poisson-Klammer. Sieist allgemein durch

f , g :=f∑

j=1

(∂ f∂p j

∂g

∂q j−∂ f∂q j

∂g

∂p j

)(6.43)

definiert und erfullt folgende Eigenschaften:

f , g = −g, f (6.44) f , g1 + g2 = f , g1 + f , g2

f , g1g2 = g1 f , g2 + g2 f , g1

0 = f , g1, g2 + g1, g2, f + g2, f , g1 ;

die letzte Gleichung heißt Jacobis Identitat.

• Mithilfe der Poisson-Klammern lautet (6.42)

∂ρ

∂t+ H, ρ = 0 , (6.45)

und die Hamiltonschen kanonischen Gleichungen lauten

q j = H, q j , p j = H, p j . (6.46)

In dieser Form wurden sie grundlegend fur die HeisenbergscheFormulierung der Quantenmechanik.

Page 68: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

Kapitel 7

Stabilitat und Chaos

Bislang waren wir bei allen unseren Analysen implizit davon ausgegan-gen, dass uns die Kenntnis des Systems zu einem gegebenen Zeitpunktzu einem Verstandnis des Systems zu spatereren Zeiten verhilft. Dasmuss nicht der Fall sein, und man kann die Systeme, fur die dies giltdurch ihre Stabilitat charakterisieren. Beschrieben wird sie durch dasVerhalten eines Systems im Phasenraum. In diesem Kapitel werden wirverschiedene Systeme in ihrem Phasenraum analysieren und dabei ver-schiedene Muster finden. Chaotische Systeme zeichnen sich dadurchaus, dass man Kenntnis des Systems zu einem Zeitpunkt nicht nutzenkann, um Vorhersagen bei spateren Zeiten zu machen.

7.1 Stabilitat

Nicht-konservative Systeme heißen dissipativ. Wir wissen schon, dasssie Energie verlieren, indem sie auf irgendeine Weise an ihre Umgebungoder an andere Systeme ankoppeln. Zentral fur das Verhalten dissipati-ver Systeme ist die Starke dieser Kopplung, zum Beispiel der Reibungs-konstante λ beim gedampften harmonischen Oszillator. In diesem Ka-pitel werden wir untersuchen, ob und wann bei kritischen Werten dieserKopplung wesentliche Anderungen im Verhalten des Systems auftreten.

7.1.1 Bewegung in der Nahe des Gleichgewichts

• Ein Systems wird durch den Phasenfluss, die Gesamtheit der Tra-jektorien des Systems beschrieben, die durch alle moglichen An-fangsbedingungen und die Wahl der Kopplungsparameter erlaubtwerden. Damit ist die Frage, ob es kritische Werte der Kopplunggibt, bei denen sich die Eigenschaften des Phasenflusses wesent-lich andern. Statt einzelner Trajektorien wird dann die gesamteLosungsmannigfaltigkeit des Systems betrachtet.

61

Page 69: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 7. STABILITAT UND CHAOS 62

• Wir gehen von Bewegungsgleichungen der Form

~z = ~F(~z, t) (7.1)

aus. Auf eine solche Form lassen sich die dynamischen Gleichun-gen immer bringen. Zum Beispiel fur den gedampften harmoni-schen Oszillator ist x + 2λx + ω2x = 0. Wir fuhren ~z := (x, x) einund erhalten (

z1

z2

)=

(z2

−2λz2 − ω2z1

). (7.2)

Die Gleichgewichtslage ~z0 ist durch ~F(~z0) = 0 bestimmt. All-gemein heißen Punkte ~z0, fur die ~F(~z0) = 0 gilt, singulare oderkritische Punkte von ~F. Um diese Punkte kann man in einer Tay-lorreihe entwickeln,

~z = ~F(~z0) +∂~F∂z j

∣∣∣∣∣∣~z=~z0

(~z −~z0) j + O((~z −~z2

0))

⇔ ~y =∂~F∂z j

∣∣∣∣∣∣~z=~z0

y j + O(~y2

)(7.3)

mit ~y := ~z −~z0.

• Im allgemeineren, dynamischen Fall seien ~ζ(t) eine Losungskurvevon ~z = ~F(~z, t) und ~y(t) := ~z(t) − ~ζ(t), dann ist offenbar

~y + ~ζ = ~F(~y + ~ζ, t)

⇔ ~y = − ~ζ + ~F(~y + ~ζ, t)

= − ~F(~ζ, t) + ~F(~y + ~ζ, t) =∂~F∂z j

∣∣∣∣∣∣~z=~ζ

y j + · · · (7.4)

In der Umgebung einer Losungskurve ~ζ lassen sich die dynami-schen Gleichungen also in die Form

~y = A · ~y mit Ai j =∂Fi

∂z j

∣∣∣∣∣∣~z=~ζ

(7.5)

bringen.

• Die Losung dieser Gleichung ist

~y(t) = exp [A(t − t0)] · ~y0 . (7.6)

Die Exponentialfunktion einer Matrix A kann man uber ihre Tay-lorreihe definieren,

exp[A(t − t0)] :=∞∑

n=0

(t − t0)n

n!An . (7.7)

Wenn A in Diagonalform gebracht wird und die Eigenwerte αi

hat, dann ist auch exp[A(t − t0)] in Diagonalform und hat die Ei-genwerte exp[αi(t − t0)]. Die Eigenwerte αi heißen kritische Ex-ponenten des Vektorfeldes ~F entlang der Losungskurve ~ξ.

Page 70: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 7. STABILITAT UND CHAOS 63

• Als Beispiel betrachten wir ein ebenes Pendel der Lange l und derMasse m. Seine Lagrange-Funktion ist

L =m2

l2ϕ2 + mgl cosϕ , (7.8)

woraus bei linearer Naherung die Bewegungsgleichung

ϕ + ω2ϕ = 0 , ω :=√g

l(7.9)

folgt. Mit y1 = ϕ und y2 = ϕ ist(y1

y2

)=

(y2

−ω2y1

)=

(0 1−ω2 0

) (y1

y2

). (7.10)

Aus dem charakteristischen Polynom α2 +ω2 = 0 erhalten wir dieEigenwerte α1,2 = ±iω. Beide kritische Exponenten sind imaginarund beschreiben daher Schwingungen des Pendels und nicht einexponentielles Weglaufen aus dem Gleichgewicht.

• Mit Reibung lautet die Bewegungsgleichung den Pendels

ϕ + 2λϕ + ω2ϕ = 0 . (7.11)

Mit derselben Definition von y1,2 folgt(y1

y2

)=

(y2

−2λy2 − ω2y1

)=

(0 1

−ω2 −2λ

) (y1

y2

). (7.12)

Das charakteristische Polynom ergibt die Eigenwerte

0 =α(α + 2λ) + ω2 = α2 + 2λα + ω2

⇔ α1,2 = − λ ± i√ω2 − λ2 . (7.13)

Nur fur λ > 0 und t → ∞ lauft das System ins Gleichgewichtϕ = 0, wahrend es sich fur λ < 0 exponentiell vom Gleichgewichtweg bewegt.

7.1.2 Asymmetrischer Kreisel

• Ein interessantes Beispiel fur Stabilitatsbedingungen ist die Krei-selbewegung in drei Dimensionen. Im Inertialsystem ~x′ wirke aufden i-ten Massenpunkt die außere Kraft ~F′i . Sie ubt auf den Krei-sel das gesamte Drehmoment

~M′ =d~L′

dt=

N∑i=1

(~x ′i × ~F

′i

)= R ~M (7.14)

Page 71: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 7. STABILITAT UND CHAOS 64

aus, wobei ~x das kreiselfeste System ist. Ebenso gilt ~L′ = R~L unddamit fur die Zeitableitung des Drehimpulses

R ~M =ddt~L′ = R

(~L + ~ω × ~L

)~M =~L + ~ω × ~L = Θ~ω + ~ω × Θ~ω , (7.15)

In dieser Herleitung der Euler-Gleichungen haben wir die Defini-tion des Tragheitstensors als ~L = Θ~ω benutzt. Im Hauptachsen-system mit den drei Eigenwerten 0 < Θ1 < Θ2 < Θ3 nehmen wirnun an, dass sich der Kreisel kraftefrei bewegt, ~M′ = 0 = ~M. Mitder Definition zi := ωi erhalten wir

0 = Mi = Θizi + εi jk Θk z jzk (7.16)

oder komponentenweise mit der Definition (7.1)

Θ1F1 =Θ1z1 = −z2z3 (Θ3 − Θ2)Θ2F2 =Θ2z2 = z1z3 (Θ3 − Θ1)Θ3F3 =Θ3z3 = −z1z2 (Θ2 − Θ1) . (7.17)

Die Bewegungsgleichung ist beschrieben durch die Ableitungs-matrix

A =

(∂Fi

∂z j

)=

0 −

Θ3 − Θ2

Θ1z3 −

Θ3 − Θ2

Θ1z2

Θ3 − Θ1

Θ2z3 0

Θ3 − Θ1

Θ2z1

−Θ2 − Θ1

Θ3z2 −

Θ2 − Θ1

Θ3z1 0

.

(7.18)

• Die drei Gleichgewichtslagen des Systems sind durch

~z0,1 =

ω00 , ~z0,2 =

0ω0

, ~z0,3 =

00ω

(7.19)

gegeben, worin ω jeweils eine beliebige Konstante ist. Dort ver-schwinden alle Komponenten von ~z. Um jede dieser drei Gleich-gewichtslagen konnen wir ~y := ~z − ~z0,i entwickeln. Zum Beispielum ~z0,1 erhalten wir nach (7.5)

~y = A · ~y =

0 0 0

0 0 ωΘ3 − Θ1

Θ2

0 −ωΘ2 − Θ1

Θ30

y1

y2

y3

. (7.20)

Die charakteristischen Exponenten zur Gleichgewichtslage ~x0,1

ergeben sich aus det(A − α1,iI) = 0, also

α1,i

(α2

1,i + ω2 Θ3 − Θ1

Θ2

Θ2 − Θ1

Θ3

)= 0 (7.21)

Page 72: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 7. STABILITAT UND CHAOS 65

zu

α1,1 = 0 , α1,2 = −α1,3 = iω[(Θ2 − Θ1)(Θ3 − Θ1)

Θ2Θ3

]1/2

. (7.22)

• Auf vollig analoge Weise oder durch zyklische Vertauschung fin-det man ebenfalls

α2,1 = 0 , α2,2 = −α2,3 = ω

[(Θ3 − Θ2)(Θ2 − Θ1)

Θ1Θ3

]1/2

α3,1 = 0 , α3,2 = −α3,3 = iω[(Θ3 − Θ2)(Θ3 − Θ1)

Θ1Θ2

]1/2

(7.23)

fur die Eigenwerte der Entwicklung um die anderen beidenGleichgewichtslagen. Die Eigenwerte α2,2 und α2,3 sind nicht vir-tuell, die Bewegung des Kreisels um die Hauptachse mit demmittleren Eigenwert entspricht also keiner Rotation. Insbesondereist α2,2 positive, so dass die Drehungen des kraftefreien, asymme-trischen Kreisels um die Achse mit dem mittleren Haupttragheits-moment instabil sind.

7.1.3 Satze zur Stabilitat

• Diese Uberlegungen motivieren die folgenden Definitionen:

1. Ein Punkt ~z0 auf der Losungskurve eines Systems heißt Lia-punov-stabil, wenn zu jeder Umgebung U von ~z0 eine Um-gebung V von ~z0 existiert so, dass die Losungskurve, die zurZeit t = 0 durch V geht, fur alle t ≥ 0 in U liegt. Mathema-tisch formuliert: ~z ∈ V : ζ~z(t) ∈ U (t ≥ 0).

2. Der Punkt ~z0 heißt asymptotisch stabil, wenn es zu ~z0 eineUmgebung U gibt so, dass die Losungskurve durch ein be-liebiges ~z ∈ U fur t → ∞ nach ~z0 lauft. Ein asymptotischstabiler Punkt ist auch Liapunov-stabil.

• Folgende Satze beschreiben die Stabilitat:

1. Sei ~z0 ein Gleichgewichtspunkt von ~F, ferner sei<(αi) < 0fur alle αi, dann existiert eine Umgebung U von ~z0 so, dassder Fluss dort fur alle positiven Zeiten definiert ist. Weiter-hin gebe es ein c > 0 mit |<(αi)| > c und ein d ∈ R so, sodass fur alle ~z ∈ U und alle t ≥ 0 gilt∣∣∣∣~ζ~z ∣∣∣∣ ≤ de−ct

∣∣∣~z −~z0

∣∣∣ (7.24)

(exponentielle, gleichmaßige Konvergenz nach ~z0).

2. Wenn ~z0 stabil ist, hat keiner der Eigenwerte von A einenpositiven Realteil.

Page 73: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 7. STABILITAT UND CHAOS 66

7.1.4 Attraktoren und van-der-Pol-Gleichung

• Attraktoren sind Bereiche des Phasenraums, zu denen Losungs-kurven laufen. Zunachst verandern wir den gedampften harmo-nische Oszillator dadurch, dass die Dampfungskonstante von derAmplitude abhangt,

x(t) + 2λ(x)x(t) + ω2x(t) = 0 . (7.25)

Wir erinnern uns, dass das System nur fur λ > 0 fur t → ∞ insGleichgewicht lauft. Die van-der-Polsche Gleichung erhalt manfur die spezielle Form

λ(x) = λ0

(x2

x20

− 1), λ0 > 0 . (7.26)

Fur x > x0 wird der Oszillator gedampft, wobei der Reibungs-term von der Amplitude abhangt. Fur x x0 hingegen wird derOszillator angetrieben, wodurch Energie in das System gepumptwird.

Auslenkung und Geschwindigkeiteines Oszillators, der durch die van-der-Polsche Gleichung beschriebenwird

• Als dimensionslose Variable fuhren wir τ := ωt und

q(τ) =

√2λ0

ω

xx0

=:√ε

xx0

p(τ) =q(τ) =dqdτ

(7.27)

ein. Damit kann die van-der-Polsche Gleichung in die Form

p + q − (ε − q2)p = 0 (7.28)

gebracht werden. Das Phasenportrait der van-der-Polschen Glei-chung zeigt ihr Attraktorverhalten: Abhangig von den Anfangs-bedingungen (p, q) entwickeln sich die Losungskurven fur großeZeiten zum stabilen Attraktor hin.

Bewegung des van-der-PolschenOszillators im Phasenraum aus ver-schiedenen Anfangszustanden hinzum Attraktor

7.2 Chaos in der Himmelsmechanik

7.2.1 Saturnmond Hyperion

• Wir betrachten die Bewegung des asymmetrischen Mondes Hy-perion um den Planeten Saturn auf einer Ellipse mit der Exzentri-zitat ε. Die Asymmetrie des Mondes werde dadurch modelliert,dass er aus zwei verschieden langen Hanteln zusammen gesetztgedacht wird, an deren Enden jeweils Massenpunkte mit dem-selben Massenanteil m sitzen. Die Langen der beiden Hanteln

Page 74: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 7. STABILITAT UND CHAOS 67

seien d und e < d. Die drei Achsen der Haupttragheitsmomen-te sind entlang der kurzeren Hantel, entlang der langeren Hantelund senkrecht auf beiden gerichtet. Die Haupttragheitsmomentesind

Θ1 =m2

e2 < Θ2 =m2

d2 < Θ3 =m2

(d2 + e2) . (7.29)

• Fur unsere Stabilitatsbetrachtung betrachten wir die Rotation umdie 3-Achse. Beim asymmetrischen Kreisel war diese Rotationmit dem großten Tragheitsmoment stabil,

M =L = Θ3ω = Θ3φ (7.30)

Der Winkel φ beschreibt die Rotation um die 3-Achse. In dieserskalaren Form haben wir den Einheitsvektor ~e3 auf beiden Sei-ten vernachlassigt. Zum entsprechenden Drehmoment durch dieAnziehungskraft des Saturns das Drehmoment tragen nach (7.29)alle vier Massenpunkte bei. Entlang der langeren der beiden Ach-sen ist das Drehmoment

~M1 =~d2× ( ~F1 − ~F2) (7.31)

durch die an den beiden Endpunkten anliegende Anziehungskraft

~Fi = −GMm

r3i

~ri mit ~r1,2 = ~r ±~d2

(7.32)

gegeben. Wegen d |~r| gilt

r31,2 =

~r ± ~d

2

23/2

= r3[1 ±

dr

cosα +d2

4r2

]3/2

≈r3[1 ±

3d2r

cosα + O

(d2

r2

)]⇒ ~F1,2 ≈ −

GMmr3

(1 ∓

3d2r

cosα) ~r ± ~d

2

, (7.33)

wobei α der Winkel zwischen ~r und ~d ist. Die Betrage der Kreuz-produkte im Drehmoment sind∣∣∣∣∣∣∣ ~d2 × ~F1,2

∣∣∣∣∣∣∣ ≈ − GMm2r3

(1 ∓

3d2r

cosα) ∣∣∣∣~d × (

~r ± ~d)∣∣∣∣

= −GMm

2r3

(1 ∓

3d2r

cosα)

dr sinα

⇒ ~M1 = −GMm

2r3

(−

3dr

cosα)

dr sinα~e3

=GMm

2r3 3d2 sin(2α)2

~e3 =3GM2r3 Θ2 sin(2α)~e3 . (7.34)

Page 75: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 7. STABILITAT UND CHAOS 68

• Entsprechend erhalt man fur die darauf senkrecht stehende, zwei-te Hantel ebenfalls in die Richtung des großten Tragheitsmoments

~M2 = −3GM2r3 Θ1 sin(2α)~e3 . (7.35)

Sie enthalt wegen sin(2α) = − sin(2(α + 90)) denselben Winkel.Die entsprechende Bewegungsgleichung nach (7.30) ist

M =M1 + M2 =3GM2r3 (Θ2 − Θ1) sin(2α)

⇔ φ =GM2r3

3(Θ2 − Θ1)Θ3

sin(2α) . (7.36)

Ebenso tragt zumindest eine Projektion des zeitabhangigen Win-kels α zu der Gesamtanderung von φ bei. Wir schreiben oh-ne Herleitung dieser Relation α = ϕ − φ, definieren außerdemβ2 = 3(Θ2 − Θ1)/Θ3 und erhalten

φ =GMr3

β2

2sin[2(ϕ − φ)] . (7.37)

Diese Formel sieht einfach aus, aber wir mussen in Erinnerungbehalten, dass bei einer Ellipsenbahn nicht nur φ und ϕ, sondernauch r von der Zeit abhangen.

Poincare-Abbildungen fur dieMarsmonde Deimos (oben,ε = 0.0005, β = 0.81), Phobos(Mitte, ε = 0.015, β = 0.83) undden Saturnmond Hyperion (unten,ε = 0.1, β = 0.89)

• Die Kreisbahn als Spezialfall ist ungleich einfacher. Es gilt r =

konst und ϕ = ωt. Die konstante Winkelgeschwindigkeit im Gra-vitationsfeld ist GM/r3 = ω2, und damit

φ =β2

2ω2 sin

[2(ωt − φ)

]⇔ φ′ = −

β2

2ω2 sin 2φ′ (7.38)

mit φ′ = φ − ωt. Diese Bewegungsgleichung enthalt nur dieZeitabhangigkeit von φ′ und kann damit integriert werden.

7.2.2 Chaotisches Taumeln auf der Ellipsenbahn

• Der asymmetrische Mond auf der elliptischen Bahn zeigt chaoti-sches Verhalten. Um dieses sichtbar zu machen, benutzt man dieso genannte Poincare-Abbildung: In festen Zeitabstanden wirddie Lage des Systems im Phasenraum dargestellt.

• Im Fall des Mondes auf seiner Umlaufbahn wahlt man als festenZeitabstand die Umlaufperiode um den Saturn und gibt etwa beijedem Durchgang des Mondes durch sein Perisaturnion seine Ori-entierung θ sowie dessen Anderung θ an.

Page 76: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 7. STABILITAT UND CHAOS 69

• Fuhrt man dies fur einige zufallig gewahlte Anfangswerte θ0

und θ0 durch und betrachtet die Poincare-Abbildung nach sehrvielen Umlaufen, zeigt sich ein charakteristisches Bild: Berei-chen, in denen geordnetes Verhalten auftritt, stehen Bereiche ge-genuber, in denen sich die Position des Systems im Phasenraumvon Umlauf zu Umlauf unkontrollierbar andert: Der asymmetri-sche Mond taumelt. Die Abbildungen zeigen die Poincare-Ab-bildungen fur die Marsmonde Phobos und Deimos und fur denSaturnmond Hyperion.

Page 77: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

Kapitel 8

Statistische Physik

In den vergangenen Kapiteln haben wir unsere Techniken zur Beschrei-bung von physikalischen Korpern immer weiter verfeinert. Im letztenSchritt haben wir den Phasenraum eingefuhrt und aus dem zeitlichenVerlauf von Losungen im Phasenraum grundsatzliche Aspekte unseresSystems analysiert. Was uns bislang fehlt ist die offensichtlich moglicheBeschreibung von Systemen von mehr als einem Massenpunkt im Pha-senraum. Allgemein sind Systeme mit eine kleinen Anzahl von Mas-senpunkten am schwersten zu beschreiben, wir verallgemeinern unsereMethoden also direkt zu großen Systemen, die wir statistisch beschrei-ben konnen.

8.1 Grundpostulat

8.1.1 Mikro- und Makrozustande

• Wenn man zum Beispiel die Hamiltonschen Bewegungsgleichun-gen fur ein beliebig komplexes nicht-chaotisches System gelosthatte, dann waren die verallgemeinerten Koordinaten qi und diedazu kanonisch konjugierten Impulse pi zu jedem Zeitpunkt be-kannt, wenn sie zu einem Zeitpunkt bekannt waren. Fur ein Sy-stem mit f Freiheitsgraden spannen sie den 2 f -dimensionalenPhasenraum auf. Je großer die Anzahl f der Freiheitsgrade wird,umso weniger ist man in der Regel daran interessiert, die genaueLage des Systems im Phasenraum zu kennen. Betrachten wir zumBeispiel einen Liter eines Gases. Es enthalt unter Normalbedin-gungen

N =1

22.4mol =

6.022 × 1023

22.4= 2.69 × 1022 (8.1)

Punktteilchen, also ist f = 8.07 × 1022. In praktisch allen Fallensind nicht der genaue Ort und der genaue Impuls aller dieser Teil-

70

Page 78: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 8. STATISTISCHE PHYSIK 71

chen zu jedem beliebigen Zeitpunkt relevant.

• Einerseits ist also der genaue mechanische Zustand des Systems,der durch die Angabe aller Phasenraumkoordinaten gekennzeich-net ist, fur unser physikalisches Verstandnis unwichtig. Anderer-seits wir allein er wird aber durch die mechanischen Gleichun-gen beschrieben. Statt seiner sind wir am Makrozustand des Sy-stems interessiert, also an den physikalischen Eigenschaften desGesamtsystems, die durch wenige, makroskopisch messbare Pa-rameter x j ausgedruckt werden sollen. Solche makroskopischenParameter konnen zum Beispiel die Gesamtenergie, das Volumen,der Druck usw. eines Gases sein.

• Um den Makrozustand physikalisch zu beschreiben, mussen wirzunachst eine Zustandsbeschreibung suchen, die keine genaueKenntnis aller Phasenraumkoordinaten voraussetzt. Dazu denkenwir uns den 2 f -dimensionalen Phasenraum in n Zellen gleicherGroße gegliedert,

δqiδp j = h0 , (8.2)

wobei h0 in der klassischen Mechanik beliebig klein gewahlt wer-den kann. Der Zustand des Systems kann nun durch die Angabeder Zelle n gekennzeichnet werden, in der es sich gerade befin-det. Uber die Große h0 stellen wir ein, wie prazise wir das Sy-stem verstehen wollen. Jede Phasenraumzelle kennzeichnet einenMikrozustand des Systems.

8.1.2 Phasenraum

• Unser System kann sich jetzt bei vorgegebenen x j in verschie-dener Phasenraumzellen aufhalten, weil in der Regel viele ver-schiedene Mikrozustande mit dem durch die Parameter x j vorge-gebenen Makrozustand vereinbar sein werden. Wir nennen sie diedem System unter den gegebenen Bedingungen zuganglichen Mi-krozustande. Sie beschreiben ein Ensemble (gedachter) physikali-scher Systeme, die makroskopisch gleichartig sind. Ohne Kennt-nisse uber jedes Teilchen im Phasenraum fragen wir als nach derWahrscheinlichkeit pn, dass sich unser System mit makroskopi-schen Zustandsparametern x j in in einer Phasenraum-Zelle n be-findet. Wir erwarten dann, in einem Ensemble aus N makrosko-pisch gleichartigen Systemen die mittlere Anzahl

Nn = pn N (8.3)

von Systemen im Zustand n zu finden.

• Ohne weitere Detailkenntnisse konnen wir uber die Wahrschein-lichkeiten pn a priori nichts aussagen. Wir konnen aber hoffen,

Page 79: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 8. STATISTISCHE PHYSIK 72

zu allgemein gultigen Aussagen zu gelangen, wenn wir uns aufSysteme beschranken, fur die sich die Wahrscheinlichkeiten pn

zeitlich nicht andern. Von solchen Systemen sagen wir, sie sei-en im Gleichgewicht. Das bedeutet, dass sich das Ensemble ausvielen Systemen zeitlich nicht andern wird. Fur isolierte Systemeim Gleichgewicht, deren Gesamtenergie E konstant bleibt, fuhrenwir nun das folgende plausible Postulat ein:

Isolierte Systeme im Gleichgewicht halten sich mit gleicher Wahr-scheinlichkeit in jedem ihnen zuganglichen Zustand auf.

Wir kennzeichnen solche isolierte Systeme durch ihre Energie Eund bezeichnen die Anzahl der ihnen zuganglichen Zustande alsmikrokanonische Zustandssumme

Ω(E) := Anzahl zuganglicher Zustande bei Energie E . (8.4)

Da wir den Phasenraum in Zellen endlicher Große eingeteilt ha-ben, wird die Energie nicht genau einen beliebigen Wert E an-nehmen konnen. Deswegen ist mit solchen Aussagen immer ge-meint, dass die Energie zwischen E und E +δE liegen soll, wobeiδE E ist.

• Jetzt konnen wir schließen, welchen mittleren Wert ein bestimm-ter Parameter des Systems einnehmen wird. Seien y j alle mogli-chen Werte, die dieser Parameter in dem betrachteten System an-nehmen kann. Wir betrachten denjenigen Bereich des zugangli-chen Phasenraums, in dem der Parameter einen festen Wert yk

annimmt. Die Anzahl der Zustande in diesem Bereich bezeich-nen wir mit Ω(E; yk). Dann sind die Wahrscheinlichkeit, dass yk

angenommen wird und der Mittelwert von y

p(yk) =Ω(E; yk)

Ω(E)

y =∑

k

yk p(yk) =

∑k ykΩ(E; yk)

Ω(E). (8.5)

8.1.3 Der Liouvillesche Satz

• Dass dieses Postulat nicht nur einleuchtend, sondern auch phy-sikalisch plausibel und mit der klassischen Mechanik vertraglichist, zeigt der Liouvillesche Satz, den wir bereits unter 6.3.1 be-sprochen hatten. Betrachten wir ein Ensemble aus einer sehrgroßen Zahl gleichartiger physikalischer Systeme, deren Zustanddurch die 2 f Phasenraumkoordinaten (~q, ~p) gekennzeichnet ist.Einige der Systeme werden sich zur Zeit t zwischen qi und qi +dqi

und zwischen p j und p j + dp j befinden. Die Anzahl dieser Syste-me im Ensemble bezeichnen wir mit

ρ(~q, ~p, t) d~qd~p . (8.6)

Page 80: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 8. STATISTISCHE PHYSIK 73

Der Liouvillesche Satz besagt, dass sich ihr Volumen im Phasen-raum konstant ist. Die Anzahl (8.6) der Systeme, die sich im be-trachteten Volumen aufhalten, muss also konstant sein,

0 =dρdt

=∂ρ

∂t+∂ρ

∂qiqi +

∂ρ

∂p jp j . (8.7)

Das einmal vom System eingenommene Volumen im Phasenraumkann sich durchaus verschieben und deformieren, aber der Liou-villesche Satz garantiert, dass sich sein Inhalt nicht verandert.

• Wenn jeder zugangliche Zustand mit gleicher Wahrscheinlichkeitauftritt, ist die erwartete Anzahl der Systeme im Ensemble in je-dem dieser Zustande gleich groß. Also ist ρ im Phasenraum kon-stant,

∂ρ

∂qi= 0 =

∂ρ

∂p j(1 ≤ i, j ≤ f ) . (8.8)

Daher ist wegen des Liouvilleschen Satzes (8.7)

0 =dρdt

=∂ρ

∂t. (8.9)

Wenn also die Situation eingetreten ist, dass alle Zustande gleichwahrscheinlich sind, dann andert sie sich allein aufgrund der klas-sischen Mechanik nicht mehr. Deswegen ist das Grundpostulat,dass ein isoliertes System im Gleichgewicht alle ihm zugangli-chen Zustande mit gleicher Wahrscheinlichkeit einnimmt, mit denGesetzen der klassischen Mechanik vertraglich.

8.1.4 Ubergang ins Gleichgewicht

• Betrachten wir ein isoliertes System, das anfanglich im Gleichge-wicht ist. Das bedeitet, dass es sich mit gleicher Wahrscheinlich-keit pn in jedem ihm zuganglichen Zustande aufhalten kann. Ineinem Ensemble aus einer großen Zahl N gleichartiger Systemekonnen wir nach (8.3) erwarten Nn Systeme in jedem einzelnender Zustande zu finden.

• Welche Zustande im Phasenraum dem System zuganglich sind,wird durch die makroskopischen Parameter x j vorgegeben. Dadas System isoliert ist, wird seine Energie E konstant sein.Andern wir einen der anderen makroskopischen Parameter so,dass sich der zugangliche Bereich im Phasenraum andert, wirddas System aus dem Gleichgewicht gebracht.

Wenn sich der zugangliche Bereich vergroßert, gibt es nachherzugangliche Zustande im Phasenraum, die im Ensemble der Sy-steme unbesetzt sind. Um wieder ins Gleichgewicht zu kommen,

Page 81: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 8. STATISTISCHE PHYSIK 74

mussen Wechselwirkungen zwischen den Komponenten des Sy-stems dafur sorgen, dass auch bislang unbesetzte Zustande er-reicht werden. Wie lange dieser Vorgang dauert, hangt von derStarke der Wechselwirkung ab.

Wenn sich der zugangliche Bereich im Phasenraum verkleinert,muss fur jetzt ausgeschlossenen Zustande die Wahrscheinlich-keit auf Null sinken, dass sich das System dort aufhalt. Dement-sprechend großer muss die Wahrscheinlichkeit an den weiter-hin zuganglichen Stellen des Phasenraums werden. Wiederummussen die Wechselwirkungen zwischen den Komponenten desSystems fur diese Entwicklung sorgen.

• Ein Beispiel fur solche Vorgange ist ein isoliertes Volumen, daszunachst durch eine undurchlassige Wand in zwei Halften geteiltwird. Nur eine Halfte sei anfanglich mit Gas gefullt. Wenn jetztdie Wand entfernt wird, verdoppelt sich bei gleich bleibender Ge-samtenergie der Gasteilchen das zugangliche Volumen. Umge-kehrt kann das einem Gas zugangliche Volumen in einem Zylin-der dadurch verringert werden, dass ein Kolben in den Zylindergeschoben wird.

8.1.5 Anzahl zuganglicher Zustande

• Wie groß die Anzahl der zuganglichen Zustande eines makrosko-pischen Systems aus sehr vielen Teilchen sein kann, zeigen wiram Beispiel eines idealen Gases. Ideal heißt ein Gas, dessen Teil-chen nur durch direkte Stoße miteinander wechselwirken und kei-ne innere Struktur haben. Jedes Teilchen hat drei Freiheitsgradeder Translation, und die gesamte Energie ist

E = T + V = T =

N∑i=1

~p 2i

2m. (8.10)

Die potentielle Energie verschwindet, weil die Teilchen keineKrafte aufeinander ausuben, wenn sie nicht direkt aneinander sto-ßen.

• Die Anzahl der Zustande, die dem System bei vorgegebener Ener-gie E zuganglich sind, ist gleich dem zuganglichen Volumen imPhasenraum, geteilt durch die Zellengroße h f

0 ,

Ω(E) =1

h f0

∫ E+δE

Ed~qd~p , (8.11)

im Grenzfall δE → 0. Das Integral uber die verallgemeinertenKoordinaten ist einfach auszufuhren. Fur jedes einzelne Gasteil-chen muss im Ortsraum∫

dq1dq2dq3 = V (8.12)

Page 82: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 8. STATISTISCHE PHYSIK 75

ergeben. Insgesamt ergibt das Integral uber alle dqi also VN , wennN die Teilchenzahl ist.

• Um das Integral uber die Impulse abzuschatzen, betrachten wirzunachst die Anzahl Φ der Zustande mit einer Energie ≤ E. Danngilt fur kleine δE die Taylorreihe

Ω(E) = Φ(E + δE) − Φ(E) =∂Φ(E)∂E

δE . (8.13)

Wegen (8.10) ist der Radius einer Kugelschale im f -dimensionalen Impulsraum mit ebenfalls konstanter Energiedurch

Rp =

√√N∑

i=1

~p 2i =√

2mE (8.14)

gegeben. Das Volumen dieser Kugel wird analog zum 3-dimensional Raum zu R f

p proportional sein. Die Proportionalitats-konstante ist fur unsere Betrachtung uninteressant. Also habenwir

Φ(E) ∝VN (2mE) f /2

⇒ Ω(E) ∝VN f2

2m (2mE) f /2−1 δE . (8.15)

Wir ziehen daraus drei wesentliche Schlusse. Erstens ist Ω(E)proportional zu δE, zweitens ist Ω(E) proportional zur riesigenAnzahl der Freiheitsgrade f , und drittens nimmt Ω(E) extremsteil wie E f /2−1 ≈ E f /2 zu. Auf diese Eigenschaften von Ω(E)werden wir spater wieder zuruckkommen.

8.2 Wechselwirkungen zwischen Systemen

Im vorigen Kapitel haben wir einen Formalismus entwickelt, der es unserlaubt, Systeme mit einer sehr grossen Anzahl elementarer Freiheits-grade durch makroskopische Parameter zu beschreiben. Offensichtlichist der Schlussel zur Physik zut mikroskopischen Beschreibung des Sy-stems die Wechselwirkung zwischen den einzelnen Teilchen. Makro-skopisch ist nach dem bisherigen Gang der Vorlesung nicht klar, welcheEigenschaften des Systems wir wie mit Messungen verknupfen wollen.Andererseits sind diese Eigenschaften historisch durch die Thermody-namik schon lange definiert.

8.2.1 Mechanische Arbeit und Warme

• Nach der Definition der Hamiltonfunktion wird die Energie einesSystems im Zustand n durch alle Parameter x j beeinflusst, die in

Page 83: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 8. STATISTISCHE PHYSIK 76

seiner Hamiltonfunktion auftauchen,

En = En(x1, . . . , x j, . . .) . (8.16)

Die Parameter x j beschreiben den Makrozustand des Systemsund heißen außere Parameter oder Zustandsparameter. Beispie-le dafur sind das Volumen eines Gases, ein von außen angelegteselektrisches oder magnetisches Feld, usw.

• Wir konnen allgemein Wechselwirkungen, in deren Verlauf die x j

nicht verandert werden, von solchen unterscheiden, in denen siesich andern. Dazu stellen wir uns zwei Systeme A und B vor, diegemeinsam gegenuber ihrer Umwelt isoliert sind, zwischen denenaber Energie ausgetauscht werden kann. Die Zustandsparameterbleiben zunachst unverandert. Die Gesamtenergie der beiden Sy-steme muss dann erhalten bleiben, also gilt

∆EA + ∆EB = 0 oder ∆EA,B = ±Q , (8.17)

wenn wir mit Q die Energie oder Warmemenge bezeichnen, dieohne Veranderung der Zustandsparameter vom jeweils anderenSystem kommt bzw. an das jeweils andere System abgegebenwird.

Alternativ konnen wir uns den direkten Energieaustausch zwi-schen den beiden Systemen unterbunden denken, aber zulassen,dass die beiden Systeme mechanisch miteinander wechselwir-ken. Ein Beispiel ist ein Gasvolumen, das durch eine beweglicheWand in zwei Halften A und B unterteilt wird. Indem das Gas ineinem Teilvolumen die Wand zum anderen hin verschiebt, ver-richtet es mechanische Arbeit am anderen System. Unter diesenUmstanden andern sich fur beide Teilsysteme zumindest einigeder Zustandsparameter, und daher auch deren Energie um ∆xEA,B.Diese rein mechanische Energieanderung wird mit der mechani-schen Arbeit W identifiziert, die vom System verrichtet wurde.Also gilt

∆xEA,B + WA,B = 0 . (8.18)

Im Allgemeinen wird die Energie jedes der beiden Systeme sichsowohl durch direkten Energieaustausch als auch durch mechani-sche Arbeit verandern. Mit (8.17) und (8.18) gilt also, wenn wirdie Inzides unterdrucken

∆E = ∆xE + Q = −W + Q ⇔ Q = ∆E + W . (8.19)

Diese Gleichung verknupft die Warmemenge Q, die nicht auf-grund mechanischer Arbeit, sondern ohne Veranderung der Zu-standsparameter aufgenommen oder abgegeben wird mit der vomSystem verrichtete mechanische Arbeit W.

Page 84: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 8. STATISTISCHE PHYSIK 77

• Im Falle der kontinuierlichen Energie des Systems konnen wirleicht infinitesimale Anderungen dE definieren. Fur eine von au-ßen ubertragene Warmemenge oder mechanische Arbeit ist dasnicht offensichtlich. Wir schreiben daher der Sicherheit halber dieinfinitesimale Version von (8.19) als

dQ = dE + dW (8.20)

mit quergestrichenem d und betrachten als Nachstes den Unter-schied zwischen einem vollstandigen Differential wie dE und ei-ner infinitesimalen Anderung dW.

8.2.2 Unvollstandige Differentiale

• Das vollstandige Differential einer Funktion F(x, y) ist

dF =∂F(x, y)∂x

dx +∂F(x, y)∂y

dy =: A(x, y)dx + B(x, y)dy . (8.21)

Als vollstandiges Differential hangt es nicht vom Weg ab, analogzur Definition konservativer Krafte im vorigen Semester. Begin-nen wir umgekehrt mit zwei Funktionen C(x, y) und D(x, y), dannkonnen wir

dG(x, y) := C(x, y)dx + D(x, y)dy (8.22)

definieren. Ein vollstandiges Differential ist dies, wenn es da-durch definiert eine Funktion G(x, y) gibt, fur die

C(x, y) =∂G(x, y)∂x

und D(x, y) =∂G(x, y)∂y

(8.23)

gilt. Das muss nicht immer gelten. Als Beispiel setzen wir

C(x, y) = C0 und D(x, y) =xy. (8.24)

Verlangen wir, dass diese beiden Funktionen die Bedingungen(8.23) erfullen sollen, erhalten wir gleichzeitig

G(x, y) =C0x + g(y)G(x, y) =x ln y + h(x) , (8.25)

mit unbestimmten Funktionen g(y) und h(x), die nicht von demjeweils anderen Argument abhangen durfen. Wir konnen zwarh(x) = C0x setzen, aber anhand des Terms x ln y sehen wirdass nicht beiden Gleichungen (8.25) erfullt werden konnen. Dasheisst dG ist zwar eine infinitesimal klein, kann aber nicht als in-finitesimale Differenz zwischen infinitesimal benachbarten Wer-ten einer Funktion G aufgefasst werden. Sie heißt unvollstandigesDifferential.

Page 85: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 8. STATISTISCHE PHYSIK 78

• Das Integral ∫ 2

1dG (8.26)

von (x1, y1) zu (x2, y2) kann naturlich immer als Summe uber in-finitesimale Großen verstanden und berechnet werden. Es wirdaber in der Regel vom Integrationsweg abhangen. Im Gegensatzdazu darf das Integral uber das vollstandige Differential dF nichtvom Weg abhangen. Nach (8.21) ist also∫ 2

1dF =

∫ (x2,y1)

(x1,y1)A(x, y)dx +

∫ (x2,y2)

(x2,y1)B(x, y)dy

= F(x2, y2) − F(x1, y1) (8.27)

unabhangig vom Weg und daher eindeutig bestimmt. Dadurchwird der Zusammenhang zwischen vollstandigen Differentialenund Funktionen hergestellt, die als Gradient eines Potentials dar-gestellt werden konnen, wie wir sie im Zusammenhang mit kon-servativen Kraftfeldern besprochen hatten.

• In diesem Sinn sind dQ und dW unvollstandige Differentiale: Siesind infinitesimal kleine Großen, aber im allgemeinen nicht alsAbleitungen zweier Funktionen Q und W darstellbar. Die zwi-schen zwei Systemen ausgetauschte Warme dQ oder die von ei-nem System an einem anderen verrichtete mechanische ArbeitdW sind nur wahrend des jeweiligen Vorgangs definiert, abernicht als Unterschied zwischen zwei ”Warmemengen“ Q2 und Q1

oder zwei ”Arbeitsmengen“ W2 und W1.

Die wahrend eines endlichen Prozesses ausgetauschte Warme-menge oder die gesamte dabei verrichtete mechanische Arbeit

Q12 =

∫ 2

1dQ oder W12 =

∫ 2

1dW (8.28)

werden daher davon abhangen, entlang welches Wegs der Pro-zess vom Zustand 1 zum Zustand 2 gefuhrt wird. Wenn allerdingswahrend des Prozesses die außeren Zustandsparameter konstantgehalten werden, so dass zum Beispiel dW = 0 und dQ = dEgilt, muss Q12 von der Prozessfuhrung unabhangig werden, weildE ein vollstandiges Differential ist. Gleiches gilt fur den FalldW = dE.

8.2.3 Quasistatische Zustandsanderungen

• Wenn sich die außeren Parameter x j eines Systems andern, wer-den sich die Energien En aller Zustande n andern. Wie genau dasgeschieht, wird davon abhangen, wie schnell die Zustandsande-rung geschieht. Wenn sie so langsam ablauft, dass das System

Page 86: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 8. STATISTISCHE PHYSIK 79

nach jedem infinitesimal kleinen Schritt Gelegenheit hat, seinGleichgewicht wieder zu finden, dann konnen wir wahrend dergesamten Zustandsanderung annehmen, dass das System eineFolge von Gleichgewichtszustanden durchlauft.

• Zunachst bewirkt eine infinitesimale Anderung der außeren Zu-standsparameter eine Anderung der Energie En um

dEn =∂En

∂x jdx j . (8.29)

Wenn das System im Zustand n bleibt, kompensiert es die Ener-gieanderung aufgrund der Anderung der außeren Parameter x j

zum Beispiel nach (8.20), indem es die Arbeit

dWn = −dEn = −∂En

∂x jdx j =: Xn, jdx j , (8.30)

verrichtet, wobei wir die verallgemeinerten Krafte

Xn, j := −∂En

∂x j(8.31)

eingefuhrt haben. Fur ein Ensemble gleichartiger Systeme, derenaußere Zustandsparameter sich in derselben Weise andern, unddie nach unserem Postulat jeden Zustand n mit gleicher Wahr-scheinlichkeit fullen, erhalten wir die mittlere vom System ver-richtete Arbeit, indem wir uber alle zuganglichen Zustande mit-teln,

dW = −∂En

∂x jdx j = −

∑n

pn∂En

∂x jdx j = X jdx j . (8.32)

• Als Beispiel betrachten wir die mechanische Arbeit, die durcheinen konstanten Druck verrichtet wird. Ein isolierter, gasgefull-ter Zylinder der Querschnittsflache A werde durch einen rei-bungsfrei beweglichen Kolben verschlossen. Da wegen der Iso-lierung keine Warme aufgenommen oder abgegeben wird, istdQ = 0 oder dE = −dW. Verschiebt das Gas den Kolben umeinen kleinen Weg ds, verrichtet es nach Definition die mechani-sche Arbeit

dE = −dW = −Kraft ·Weg . (8.33)

Die Kraft ist das Produkt aus Druck P und Flache A, also gilt

dE = −dW = −(PA)ds = −P(Ads) = −PdV . (8.34)

Der veranderliche außere Parameter ist hier das Volumen, undder Druck die (negative) zum Volumen gehorige verallgemeinerteKraft,

P = −∂E∂V

. (8.35)

Page 87: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

Kapitel 9

Temperatur und Entropie

Aus dem letzten Kapitel wissen wir, wann Systeme sich aus mikrosko-pischer Sicht im Gleichgewicht befinden. Fur isolierte Systeme hattenwir das Grundpostulat der statistischen Physik eingefuhrt, nachdem je-der zugangliche Zustand mit gleicher Wahrscheinlichkeit angenommenwird. Was uns fehlt ist eine makroskopische Beschreibung von Gleich-gewicht und den entsprechenden ubergangen. Oder mit anderen Worten,wir haben den Begriff der Temperatur noch nicht definiert. Ebenso fehltuns der Begriff der Entropie. Im Folgenden werden wir beide aus derSichtweise der statistischen Physik definieren, bevor wir sie dann alsthermodynamische Großen nutzen.

9.1 Thermisches Gleichgewicht

9.1.1 Reversible Zustandsanderungen

• Betrachten wir ein isoliertes System, das bestimmten Zwangenunterliegt, zum Beispiel ein isoliertes Volumen, das durch ei-ne isolierende Wand in zwei Teilvolumina unterteilt ist, von de-nen nur eines gasgefullt ist. Dieses isolierte System befinde sichzunachst im Gleichgewicht. Unmittelbar nach der Entfernungder Wand kann das System nicht im Gleichgewicht sein, weilsich der ihm zugangliche Bereich des Phasenraums um einenTeil vergroßert hat. Aber nach einiger Zeit wird es wieder einenGleichgewichtszustand erreichen, in dem nun die Anzahl der ihmzuganglichen Zustande großer ist als vorher.

• Die Zwangsbedingung kann durch feste außeren Parameter x j =

v j formuliert werden. Wenn sie wegfallt, dann vergroßert sich inder Regel die Anzahl der zuganglichen Zustande, Ωf > Ωi (”final“und ”initial“), wenn das System weniger eingeschrankt ist als vor-her. Allgemein mussen wir auch erlauben, dass sich ein System

80

Page 88: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 9. TEMPERATUR UND ENTROPIE 81

nicht wesentlich andert, so dass allgemein

Ωf ≥ Ωi . (9.1)

gilt. Im ersten Fall wird das System nicht in seinen Ausgangs-zustand zuruckkehren konnen, wenn die Wand wieder eingefuhrtwird. Im zweiten Fall hangt der Zustand des Gesamtsystems nichtvon der Lage der Wand ab. Mit (9.1) konnen wir eine prazise De-finition formulieren: Eine Zustandsanderung eines isolierten Sy-stems ist reversibel, wenn sich die Anzahl der ihm zuganglichenZustande nicht verandert, und irreversibel, wenn sie zunimmt.

• Nach dem statistischen Grundpostulat ist im Gleichgewicht dieWahrscheinlichkeit, fur xk einen Wert vk zu messen, proportionalzur Anzahl der ensprechenden zuganglichen Zustande

p(xk = vk) ∝ Ω(xk = vk) . (9.2)

In einem großen Ensemble von gleichartigen Ubergangen wirddaher mit großter Wahrscheinlichkeit derjenige Wert von xk ge-messen, zu dem die großte Zahl zuganglicher Zustande gehort.Die außeren Parameter eines isolierten Systems werden sich al-so dahin entwickeln, dass die Anzahl der dadurch ermoglich-ten, zuganglichen Zustande maximal wird. Aus dem statistischenGrundpostulat folgt also direkt ein Extremalprinzip.

9.1.2 Temperatur

• Betrachten wir nun zwei makroskopische Systeme, die gemein-sam isoliert sind und keine mechanische Arbeit aneinander ver-richten, aber in thermischen Kontakt gebracht werden und sichins thermischen Gleichgewicht entwickeln. Die Gesamtenergie Ebleibt dabei konstant. Wenn wir die Energie E1 als einen aus-seren Parameter ansehen, dann ist sie zunachst konstant. Durchden thermischen Kontakt darf E1 variieren. Nach einer gewissenZeit wird ein neuer Gleichgewichtszustand erreicht, in dem E1

die Anzahl der zuganglichen Zustande maximiert. Ohne weitereaußeren Parameter konnen wir die Anzahl zuganglicher Zustandeals Funktion von E1 auffassen, Ω = Ω(E1). Fur jeden Zustand,den das erste System unter der Vorgabe von E1 einnehmen kann,Ω1(E1), kann das zweite System jeden Zustand mit E2 = E − E1

einnehmen. Also ist kombiniert

Ω(E, E1) = Ω1(E1)Ω2(E − E1) . (9.3)

Die Wahrscheinlichkeit, das Gesamtsystem in einem Zustand zufinden, in dem sich die Gesamtenergie E in die Teile E1 und E−E1

aufteilt, ist gleich dem Produkt der Wahrscheinlichkeiten, dassdas eine Teilsystem die Energie E1 und das andere die EnergieE − E1 hat.

Page 89: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 9. TEMPERATUR UND ENTROPIE 82

• In (8.15) haben wir gesehen, dass Ω(E) extrem steil mit E zuneh-men und proportional zur sehr großen Anzahl der Freiheitsgra-de sein muss. Mit zunehmendem E1 wird der erste Faktor sehrschnell zu-, der zweite sehr schnell abnehmen. Zusammen de-finieren sie ein extrem scharfes Maximum. Weiterhin wird dasProdukt (9.3) eine sehr große Zahl sein, weswegen wir den strengmonotonen Logarithmus ln Ω = ln Ω1 + ln Ω2 betrachten. Wir be-stimmen E1 also so, dass

0 =∂ ln Ω1(E′)

∂E′

∣∣∣∣∣E′=E1

−∂ ln Ω2(E′)

∂E′

∣∣∣∣∣E′=E−E1

(9.4)

Mit der Bezeichnung

β(E) :=∂ ln Ω(E′)

∂E′

∣∣∣∣∣E′=E

. (9.5)

lautet die Gleichgewichtsbedingung (9.4)

β1(E1) = β2(E − E1) . (9.6)

• Phanomenologisch soll gleiche Temperatur T ein thermischesGleichgewicht zwischen zwei Systemen kennzeichnen. Dieseempirische Relation muss gerade durch die Bedingung (9.6) aus-gedruckt werden, oder die Temperatur muss eine Funktion von βsein. Wegen (8.15) ist

β(E) =∂ ln Ω(E′)

∂E′

∣∣∣∣∣E′=E≈

f2∂ ln E∂E

∣∣∣∣∣E′=E

=f

2E, (9.7)

Wenn die Temperatur mit zunehmender Energie zunehmen sollte,ist es sinnvoll

β =1

kT⇒ kT ≈

2Ef. (9.8)

zu identifizieren. Die Energie pro Freiheitsgrad im Gleichge-wicht ist von der Ordnung kT . Die Proportionalitatskonstante kmit der Dimension Energie pro Temperatur ist die so genannteBoltzmann-Konstante

k = 1.38 × 10−16 ergK

(9.9)

Wenn Ω mit E steil zunimmt, ist β positiv und damit T ≥ 0. Nega-tive Temperaturen treten nur auf, wenn aufgrund spezieller auße-rer Umstande die Anzahl zuganglicher Zustande mit der Ener-gie abnimmt. Solche Situationen sind sehr außergewohnlich. Dazumindest im Prinzip die Anzahl der Zustande in einem isolier-ten System bei vorgegebener Energie abzahlbar ist, konnen Ω(E)und β bestimmt werden. Daher legen (9.5) und (9.8) eine absoluteTemperaturskala fest, die in Kelvin (K) gemessen wird.

Page 90: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 9. TEMPERATUR UND ENTROPIE 83

9.1.3 Energieverteilung

• Wir hatten gesehen, dass das Maximum im Produkt (9.3) der Zu-standszahlen extrem scharf sein musse. Da die Energie E1 durchdie Lage dieses Maximums von Ω bestimmt wird, interessiert unswie scharf es bestimmt ist. Sei E die Lage des Maximums,

ε := E1 − E und λ := −∂2 ln Ω

∂E2

∣∣∣∣∣∣E=E

= −∂β

∂E

∣∣∣∣∣E=E

.

(9.10)Wir entwickeln ln Ω um E bis zur zweiten Ordnung und erhalten

ln Ω(E) = ln Ω(E) + βε −λ

2ε2 + O(ε3) . (9.11)

Eingesetzt in jeden der beiden Faktoren in (9.3) gibt uns das

ln Ω(E1) = ln [Ω1(E1)Ω2(E − E1)]

= ln Ω(E) + (β1 − β2)ε −ε2

2(λ1 + λ2) + O(ε3) . (9.12)

Im Gleichgewicht ist β1 = β2. Setzen wir λ := λ1 + λ2, folgt

ln Ω(E1) = ln Ω(E) −λ

2ε2 + O(ε3)

⇔ Ω(E1) =Ω(E) exp[−λ

2(E1 − E)2

]+ O(ε3) . (9.13)

• In der Nahe des Maximums bei E1 = E nimmt Ω(E1) die Formeiner Gaußverteilung an. Die mittlere Energie E1 wird also gleichE sein. Ihre Breite ist konnen wir mithilfe von (9.7) abschatzen,

σ =1√λ

=

(−∂β

∂E

)−1/2

(f

2E2

)−1/2

= E

√2f. (9.14)

Die relative Abweichung der mittleren Energie E1 vom MaximumE

|E1 − E|E

≈σ

E≈

√2f

(9.15)

ist wegen der großen Anzahl der Freiheitsgrade extrem klein. Imthermischen Gleichgewicht wird ein makroskopisches System da-her mit fantastischer Genauigkeit die Energie einnehmen, die derLage des Maximums von Ω entspricht.

9.2 Entropie

9.2.1 Definition

• Offensichtlich ist die Zustandssumme Ω eine zentrale Große, mitderen Hilfe man Systeme mikrospopisch und makroskopisch ver-stehen kann. Die Entropie S ist ein logarithmisches Maß fur die

Page 91: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 9. TEMPERATUR UND ENTROPIE 84

Anzahl der zuganglichen Zustande, S ∝ ln Ω. Als Proportiona-litatskonstante dient wieder die Boltzmann-Konstante,

S := k ln Ω ⇒∂S∂E

= k∂ ln Ω

∂E=

1T. (9.16)

Die Entropie gibt an, wieviele Zustande einem isolierten Sy-stem unter den gegebenen Bedingungen zuganglich sind. Sie alsein ”Maß fur die Unordnung“ zu bezeichnen, ist mindestens ir-refuhrend. Als ein Maß fur die Anzahl moglicher Mikrozustandebei vorgegebenem Makrozustand ist sie eine Art ”Gestaltenfulle“eines Systems unter gegebenen außeren Bedingungen. Wenn einisoliertes System durch den Wegfall von Zwangsbedingungenvon einem in ein anderes Gleichgewicht ubergeht, ist im rever-sible Fall die Anzahl der verfugbaren Zustande konstant, ande-renfalls nimmt sie zu. Dasselbe folgt nach der Definition fur dieEntropie,

∆S ≥ 0 . (9.17)

• Betrachten wir nun zwei Systeme im thermischen Gleichgewicht,von denen das eine sehr viel ”großer“ als das andere ist. Bezeich-nen wir das großere System mit dem Index 1, ist damit

E2 E1 . (9.18)

Daher werden sich die Temperatur T1 oder β1 des großen Systemskaum andern, wenn das kleine mit ihm in thermischen Kontaktgebracht wird. Wenn die ubertragene Energie durch die Warme-menge Q gegeben ist, dann heisst das∣∣∣∣∣∂β1(E1)

∂E1

∣∣∣∣∣ ∣∣∣∣∣β1(E1)Q

∣∣∣∣∣ . (9.19)

Das große System 1 wird dann als Warmereservoir oder Warme-bad bezeichnet. Wenn die Anzahl der dem Warmereservoirzuganglichen Zustande sich durch die Warmemenge Q nur we-nig verandert, dann konnen wir die Taylor-Entwicklung

ln Ω1(E1 + Q) − ln Ω1(E1) = β1Q + O(Q2) (9.20)

nach der ersten Ordnung abbrechen. Multiplizieren wir beide Sei-ten mit k, dann erhalten wir die Entropieanderung

∆S =QT1

. (9.21)

Die Entropie des Warmereservoirs andert sich im Kontakt mit ei-nem sehr viel kleineren System um die ausgetauschte Warme-menge, geteilt durch die Temperatur des Reservoirs.

Page 92: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 9. TEMPERATUR UND ENTROPIE 85

• Dasselbe Ergebnis konnen wir durch die entsprechenden Diffe-rentiale erhalten. Die Entropie eines isolierten Systems wird vonseiner Energie und den außeren Parametern x j abhangen. Wennnur Warme ausgetauscht wird, ist dW = 0 und dE = dQ. Wegen(9.16) ist dann

dS =∂S∂E

dE =dET

=dQT

. (9.22)

Die infinitesimale Entropieanderung eines Systems ist die ihmzugefuhrte Warmemenge pro Temperatur. Je heißer das Systemschon war, desto weniger wird seine Entropie erhoht, wenn ihmweitere Warme zugefuhrt wird.

9.2.2 Erster Hauptsatz

• Allgemein kann durch Wechselwirkung zwischen Systemen nichtnur Energie ausgetauscht werden, sondern es andern sich auchaußere Parameter x j durch mechanische Arbeit. In diesem Fall istdas vollstandige Differential von ln Ω

d ln Ω =∂ ln Ω

∂EdE +

∂ ln Ω

∂x jdx j = βdE +

∂ ln Ω

∂x jdx j . (9.23)

• Beschranken wir uns bei Berechnung des zweiten Terms in (9.23)der Einfachheit halber auf einen außeren Parameter x. Die Ener-gie jedes Zustands n wird von ihm abhangen, En = En(x). Wennsich x andert, dann bedeutet dies

dEn =∂En(x)∂x

dx =: Yndx . (9.24)

Wir konnen jetzt alle Zustande auch nach ihrem Wert Y organi-sieren. Die Anzahl aller zuganglichen Zustande zwischen E undE+δE ist Ω(E). Entsprechend ist ΩY(E) die Anzahl aller Zustandezwischen E und E + δE, deren Energie sich nach (9.24) um Ydxverandert. Die gesamte Anzahl Ω(E) ist dann eine geeignete Sum-me oder ein Integral uber Y ,

Ω(E) =∑

Y

ΩY(E)

⇒ Y =1

Ω(E)

∑Y

YΩY(E) . (9.25)

• Durch die Energieanderung der Zustande werden einige Zustandein das Energieband zwischen E und E + δE eintreten und ei-nige aus ihm austreten, wenn x sich andert. Da die Anzahlder Zustande pro Energieeinheit gleich Ω(E)/δE ist und sich

Page 93: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 9. TEMPERATUR UND ENTROPIE 86

die Energien der zuganglichen Zustande im Mittel um Ydxverandern, treten durch die Energieverschiebung in den unterenRand des Energiebands

dΩ+ =Ω(E − δE)

δEY(E − δE)dx (9.26)

Zustande in das Energieband ein. Am oberen Rand treten entspre-chend

dΩ− =Ω(E)δE

Y(E)dx (9.27)

Zustande aus. Die Anzahl zuganglicher Zustande im Energiebandandert sich also insgesamt um

dΩ =dΩ+ − dΩ−

=(ΩY)(E − δE) − (ΩY)(E)

δEdx

= −∂(ΩY)(E)

∂Edx

⇔∂Ω

∂x= −

∂(ΩY)∂E

= −Y∂Ω

∂E−Ω

∂Y∂E

. (9.28)

Wahrend der zweite Term proportional zu Ω ∝ f E f /2 ist, istder erste Term proportional zu f 2E f /2. Also konnen wir in besterNaherung

∂Ω

∂x= −Y

∂Ω

∂E(9.29)

setzen. Die Ableitungen der Energie nach den außeren Parame-tern hatten wir schon in (8.31) bzw. (8.32) als verallgemeiner-te Krafte identifiziert, dort allerdings mit negativem Vorzeichen.Demnach ist Y = −X. Verallgemeinern wir schließlich das Ergeb-nis (9.29) auf beliebig viele außere Parameter x j, erhalten wir

∂Ω

∂x j= X j

∂Ω

∂E. (9.30)

Teilen wir auf beiden Seiten durch Ω(E) und verwenden (9.5),folgt schließlich

∂ ln Ω

∂x j= X j

∂ ln Ω

∂E= βX j . (9.31)

• In (9.23) nehmen wir an dass die Wechselwirkung quasistatischerfolgt, so dass die verallgemeinerten Krafte X j definiert sind, undzwei Gleichgewichtszustande miteinander verbindet. Mit (9.31)folgt daraus

d ln Ω =β (dE + X jdx j) =1

kT(dE + X jdx j)

⇔ TdS =dE + dW = dQ . (9.32)

Page 94: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 9. TEMPERATUR UND ENTROPIE 87

Die Beziehung (9.21) oder (9.22) bleibt also auch dann gultig,wenn durch die Wechselwirkung zweier Systeme nicht nurWarme ausgetauscht, sondern auch auf quasi-statische Weise me-chanische Arbeit verrichtet wird. Die Relation (9.32) heisst auchder Erste Hauptsatz der Thermodynamik.

• Wird in einem Prozess keine Warme ausgetauscht, heißt er adia-batisch. Ist dies bei einem quasistatischen Prozess der Fall, istwegen (9.32) auch dS = 0. Das zeigt, dass sich die Entropieauch dann nicht andert, wenn an einem isolierten System aufquasi-statische Weise eine endliche Menge Arbeit verrichtet wird.Damit sind solche endlichen, adiabatischen und quasi-statischenProzesse auch reversibel. Die Entropie kann auch bei adiabati-schen Prozessen aber durchaus zunehmen kann, wenn der Prozessnicht quasi-statisch gefuhrt wird. Nur unter dieser Einschrankungtrifft die haufige Identifizierung zu, dass adiabatisch auch isen-trop bedeute.

9.3 Maxwell-Boltzmann-Verteilung

9.3.1 Maxwell-Verteilung

• Wir fragen nun danach, wie die Geschwindigkeiten der Teilcheneines Gases verteilt sein mogen, d.h. wir suchen eine Verteilungs-funktion f (vx, vy, vz) im Geschwindigkeitsraum so, dass die Große

f (vx, vy, vz)dvxdvydvz (9.33)

die Wahrscheinlichkeit angibt, ein Teilchen mit einer Geschwin-digkeit zwischen (vx, vy, vz) und (vx+dvx, vy+dvy, vz+dvz) zu finden.

• Von Maxwell selbst stammt folgende elegante Uberlegung: Ineinem Gas im thermodynamischen Gleichgewicht wird die Ge-schwindigkeitsverteilung nicht mehr von der Richtung der Bewe-gung abhangen, weil alle Richtungen gleich wahrscheinlich auf-treten werden. Also kann die Verteilung nur vom Betrag von ~voder, aquivalent dazu, nur von ~v 2 abhangen. Weiterhin mussendie Wahrscheinlichkeiten dafur voneinander unabhangig sein, inwelcher Raumrichtung sich die Teilchen bewegen. Also muss

f (~v 2) = f (v2x + v2

y + v2z ) = f (v2

x) f (v2y) f (v2

z ) (9.34)

gelten. Das Produkt der Verteilungsfunktionen der Geschwindig-keitsquadrate in allen Koordinatenrichtungen muss also gleichder Verteilungsfunktion der Summe der Geschwindigkeitsquadra-te sein.

Page 95: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 9. TEMPERATUR UND ENTROPIE 88

• Die einzige Funktion f , die dieser Forderung genugt, ist die Ex-ponentialfunktion. Wir mussen also

f (~v 2) = C exp(−a~v 2) (9.35)

fordern. Die Großen C und a durfen nicht von der Geschwindig-keit abhangen, sind aber sonst vorerst beliebig. Damit die Vertei-lung normiert werden kann, muss aber a > 0 sein. Damit nimmtdie Verteilung die Form einer Gaußverteilung im Geschwindig-keitsraum mit Mittelwert vx = vy = vz = 0 und der Standardab-weichung

σv =1√

2a(9.36)

an. Die allgemeine Normierung der Wahrscheinlichkeit ergibtdann

C =1

(2πσ2v )3/2 , (9.37)

weil ja in jeder Raumrichtung normiert werden muss.

• Nun bleibt nur noch die Bedeutung von a zu bestimmen. Offenbarmuss die Streuung jeder Geschwindigkeitskomponente um ihrenMittelwert gleich σv sein. Also mussen wir

v2i = σ2

v . (9.38)

fordern. Die mittleren Geschwindigkeitsquadrate hangennaturlich mit der mittleren Energie ε der Gasteilchen zusammen.In der Bewegung in jede Raumrichtung muss im Mittel dieselbeEnergie stecken, weil die Raumrichtungen nicht voneinanderverschieden sind. Deswegen muss

ε =m2

(v2

x + v2y + v2

z

)=

3m2v2

x =3m2σ2v (9.39)

gelten. Die Streuung der Geschwindigkeit muss demnach propor-tional zur mittleren Energie eines Gasteilchens sein. Die Energieeines idealen Gases mit N Teilchen mit jeweils drei Freiheitsgra-den sollte nach (9.8)

E =32

NkT (9.40)

sein, weshalb

ε =32

kT ⇒ σ2v =

kTm

(9.41)

sein muss. Wir erhalten damit die Maxwellsche Geschwindig-keitsverteilung

f (~v 2) =

( m2πkT

)3/2exp

(−

m~v 2

2kT

). (9.42)

Page 96: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 9. TEMPERATUR UND ENTROPIE 89

9.3.2 Boltzmann-Verteilung

• Betrachten wir ein isoliertes Gesamtsystem der Energie E, dasaus einem Warmereservoir A1 der Energie E1 und einem sehr vielkleineren System A2 mit der Energie E2 = E−E1 besteht, das mitA1 im thermischen Gleichgewicht steht. Wie groß ist die Wahr-scheinlichkeit, das System A2 im Zustand n bei der Energie En zufinden?

• Nach dem statistischen Grundpostulat ist diese Wahrscheinlich-keit proportional zur Anzahl der dem Gesamtsystem zugangli-chen Zustande. Da das System A2 gerade in dem einen festen Zu-stand n sein soll, ist

pn ∝ Ω1(E − En) , (9.43)

wobei Ω1(E1) die Anzahl der dem Reservoir zuganglichenZustande ist.

• Da En E sein muss, weil es sich bei A1 um ein Warmereservoirhandelt, konnen wir ln Ω1(E − En) wieder um die GesamtenergieE entwickeln,

ln Ω1(E−En) = ln Ω1(E)−∂ ln Ω1(E1)

∂E1

∣∣∣∣∣E1=E

En +O(E2n) . (9.44)

Verwenden wir hier (9.5), folgt zunachst

Ω1(E − En) = Ω1(E) e−β1En , (9.45)

und darauspn ∝ e−βEn = e−En/kT , (9.46)

wobei T die Temperatur des Warmereservoirs (und damit auchdes Systems A2) ist. Die Proportionalitatskonstante folgt aus derBedingung, dass die Wahrscheinlichkeiten auf eins normiert seinmussen,

pn = C−1 e−En/kT , C :=∑

n

e−En/kT . (9.47)

Dieses sehr allgemein gultige Ergebnis ist die Boltzmann-Verteilung. Sie zeigt, dass die Besetzung der Zustande eines Sy-stems, das sich im thermischen Gleichgewicht mit einem Warme-bad befindet, exponentiell von dem Verhaltnis der Zustandsener-gie En zur thermischen Energie kT abhangt.

9.4 Beispiele (nicht in Vorlesung)

9.4.1 Verlauf einer Adiabate

• Eine Adiabate ist eine Kurve oder Flache, auf der sich ein Sy-stem unter adiabatischen Zustandsanderungen im Zustandsraum

Page 97: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 9. TEMPERATUR UND ENTROPIE 90

bewegt. Betrachten wir zum Beispiel ein System, dessen Energiedurch

E = A P2 V , A = konst. (9.48)

gegeben ist. Adiabatische Zustandsanderungen bedeuten d Q = 0,und daher mit (9.32) und (8.35)

dE = 2A PV dP + A P2 dV = P dV . (9.49)

Division durch P und Trennung der Variablen P und V fuhrt auf

−dV2V

=AdP

AP − 1⇒ −

12

ln V = ln(AP − 1) + C′ , (9.50)

woraus sofort die Beziehung

P =1A

(1√

CV+ 1

), C := eC′ (9.51)

fur die Adiabate im P-V-Diagramm folgt.

• Die Bedeutung der Konstanten A und C wird klarer, wenn wirverlangen, dass der Druck gleich P0 wird, wenn das Volumengleich V0 ist. Das konnen wir erreichen, indem wir C := 1/V0

und P0 = 2/A setzen. Dann lautet die Adiabatengleichung

P =P0

2

√V0

V+ 1

. (9.52)

9.4.2 Helium-Diffusion

• Als zweites Beispiel betrachten wir einen Glasballon mit dem Vo-lumen V1, der anfanglich mit Argon gefullt ist. Das umgebendeVolumen V2 sei anfanglich mit Helium gefullt. Beide VoluminaV1 + V2 = V seien gemeinsam nach außen isoliert, aber mit-einander im thermischen Gleichgewicht bei der Temperatur T .Anfanglich herrsche Druckgleichgewicht zwischen den beiden,P1i = P2i. Das Glas sei so beschaffen, dass es Helium durchlasst,Argon aber nicht. Was passiert?

• Da das Helium in den Ballon eindringen kann, erfordert schonallein das statistische Grundpostulat, dass es sich gleichmaßig imgesamten Volumen V ausbreiten wird. Die Verteilung des Argonsbleibt dagegen unverandert. Wenn NHe,Ar die Gesamtzahlen derHelium- bzw. Argonatome sind, dringen

NHe,1 =V1

VNHe (9.53)

Heliumatome in V1 ein.

Page 98: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 9. TEMPERATUR UND ENTROPIE 91

• Da die Temperatur gleich bleibt, brauchen wir nur die Abhangig-keit der Entropie vom Volumen zu betrachten. Wegen (8.15) ist

Ω ∝ VN , S ∝ N ln V . (9.54)

Wegen (9.32) ist daher der Druck

P = T∂S∂V∝

NV. (9.55)

Vor der Heliumdiffusion ist wegen

P1i = P2i ⇒NHe

V2=

NAr

V1. (9.56)

Nachher muss der Druck im Volumen V1 wegen der zusatzlichenTeilchen auf

P1f ∝NHe,1 + NAr

V1=

NHe

V+

NAr

V1=

NHe

V2

V2

V+

NAr

V1

∝ P1i

(1 +

V2

V

)(9.57)

ansteigen, wahrend der Druck in V2 auf

P2f ∝NHe,2

V2=

NHe − NHe,1

V2∝ P1i

(1 −

V1

V2

)(9.58)

abfallt. Wenn V1 V2 ist, steigt der Druck in V1 gerade auf dendoppelten Ausgangsdruck an.

9.4.3 Fermi-Druck

• Fermionen sind Teilchen, von denen hochstens zwei diesel-be Phasenraumzelle besetzen durfen. Elektronen gehoren dazu.Wenn in einem festen Volumen V eine Anzahl Ne Elektronen un-tergebracht werden sollen, geht das nur, wenn der Phasenraum zugenugend hohen Impulsen pF erweitert wird. Selbst bei T = 0mussen Elektronen daher einen endlichen Druck haben, wenn siein einem Volumen V eingesperrt sind. Wie groß ist dieser Druck?

• Die Anzahl der Phasenraumzellen, die einem Elektron mit Impulsp ≤ pF zur Verfugung stehen, ist

Ω =Vh3

0

4π∫ pF

0p2dp =

4π3h3

0

V p3F ; (9.59)

das ist das Volumen im Ortsraum V , multipliziert mit dem Volu-men im Impulsraum, geteilt durch die Große h3

0 der Phasenraum-zellen. Fur Quantensysteme ist h0 = h, das Plancksche Wirkungs-quantum.

Page 99: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 9. TEMPERATUR UND ENTROPIE 92

• Die Anzahl der Phasenraumzellen muss fur Ne Elektronen rei-chen, Ne = 2Ω. Wir ersetzen außerdem den Fermi-Impuls pF

durch die Fermi-Energie

EF =p2

F

2m(9.60)

und erhalten aus (9.59)

Ne =8π3h3 V(2mEF)3/2 . (9.61)

Die Fermi-Energie ist also durch

EF =1

2m

(3h3Ne

8πV

)2/3

(9.62)

gegeben. Daraus erhalten wir den Fermi-Druck

PF = −∂EF

∂V=

23

EF

V∝ V−5/3 . (9.63)

Dieser Druck baut sich allein deswegen auf, weil Elektronen denPhasenraum nicht beliebig dicht fullen durfen. Er ist ein Beispielfur einen temperaturunabhangigen Druck.

Beachten Sie, dass wir in den letzten beiden Beispielen nur dieAbzahlung von Zustanden im Phasenraum und das Grundpostulatder statistischen Physik verwendet haben und trotzdem zu weit-reichenden physikalischen Schlussen gelangt sind!

Page 100: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

Kapitel 10

Thermodynamik

In diesem Kapitel werden wir die Grundbegriffe der Thermodynamikherleiten und ihre Verknupfungen betrachten. Das beste Beispiel isttypischerweise das ideale Gas. Bei der gesamten Begriffsbildung derThermodynamik sollten wir aber nicht vergessen, dass wir immer aufdie exakten Definitionen mit Hilfe der statistischen Physik und speziellder Zustandssumme Ω zuruckgreifen konnen. Ein Teil der Begriffe, diewir in diesem Kapitel einfuhren gehort zu den Grundkenntnissen, ohnedass wir sie in dieser Vorlesung weiter benotigen.

10.1 Thermodynamische Beziehungen

10.1.1 Eindeutigkeit der Entropie

• Nach (9.16) ist die Entropie ist ein logarithmisches Maß fur dieAnzahl der Zustande, die ein isoliertes System einnehmen kann.Ihre Zahl hangt von unserer Wahl der Konstante h0 in (8.2) ab,

Ω =1

h f0

∫ f∏i=1

dqi

∫ f∏j=1

dp j =:Γ

h f0

⇒ S =k ln Ω = k ln Γ − k f ln h0 (10.1)

Die Große Γ ist das gesamte zugangliche Phasenraumvolumen.Die Entropie ist nur bis auf eine additive Konstante festgelegt. Inder Quantenmechanik stellt sich heraus, dass es eine naturlicheWahl fur h0 gibt, namlich das Plancksche Wirkungsquantum h.Damit verliert die Entropie eines Quantensystems ihre Uneindeu-tigkeit.

• Nimmt die Energie eines Systems ab, wird sich das ihm zugang-liche Phasenraumvolumen Γ verringern. Fur E → 0 werden nureiner oder wenige Zustande ubrig bleiben, ln Γ → 0. Nach (10.1)

93

Page 101: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 10. THERMODYNAMIK 94

wird die Entropie im Allgemeinen nicht gegen Null gehen. DieKonstante kann aber so gewahlt werden, dass S → 0 geht, wennE → 0 geht und damit ebenfalls T → 0. Der Nullpunkt der abso-luten Temperaturskala liegt bei

T0 = −273.15 Celsius . (10.2)

• Eine aufgenommene oder abgegebene Warmemenge dQ hattenwir als unvollstandiges Differential identifiziert. Im Gegensatz da-zu muss das Differential der Entropie vollstandig sein, weil dieEntropie als Zustandsgroße des Systems nur den Anfangs- undEndzustand einer quasi-statischen Zustandsanderung kennzeich-net,

S f − S i =

∫ f

idS =

∫ f

i

dQT

. (10.3)

Der Faktor 1/T ist offenbar ein integrierender Faktor fur d Q.

10.1.2 Thermisches und mechanisches Gleichgewicht

• Ohne weitere außeren Parameter ist die Entropie durch

S (E,V) = S 1(E1,V1) + S 2(E − E1,V − V1) (10.4)

beschrieben. In allen folgenden Betrachtungen nehmen wir an,dass (9.32) oder der erste Hauptsatz der Thermodynamik

TdS = dQ = dE + dW (10.5)

erfullt ist. Nach (8.34) gilt

TdS = dQ = dE + dW = dE + PdV ⇒∂S∂V

=PT. (10.6)

• Das Gleichgewicht wird wie gewohnt durch maximales S (E,V)bestimmt, also

0 = dS =∂S 1

∂E1dE1 +

∂S 2

∂E2dE2 +

∂S 1

∂V1dV1 +

∂S 2

∂V2dV2

=

(1T1−

1T2

)dE1 +

(P1

T1−

P2

T2

)dV1

⇔1T1−

1T2

=0 undP1

T1−

P2

T2= 0 . (10.7)

Außer den Temperaturen gleichen sich also die Drucke in denbeiden Systemen aneinander an.

Page 102: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 10. THERMODYNAMIK 95

10.1.3 Warmekapazitat und spezifische Warme

• Die Aufnahmefahigkeit eines Systems fur Warme wird durch dieWarmekapazitat

Cx :=(dQdT

)x

(10.8)

beschrieben. Dabei ist in dieser Notation allgemein x ein außererZustandsparameter, der wahrend der Warmeaufnahme konstantgehalten wird. Die explizite Angabe der konstant zu haltendenGroße ist in der Thermodynamik wichtig, weil oft ganz andereGroßen als die expliziten unabhangigen Variablen der thermody-namischen Funktionen konstant gehalten werden mussen. EineMaterialgroße erhalten wir mit der spezifische Warme cx, indemman Cx entweder durch die Molzahl ν oder die Masse m teilt. DasErgebnis ist

cx =Cx

νoder cx =

Cx

m, (10.9)

mit den Einheiten erg K−1 mol−1 im ersten und erg K−1 g−1 imzweiten Fall.

• Damit wissen wir, welche Temperatur sich einstellen wird, wennzwei gemeinsam isolierte Systeme in thermischen Kontakt ge-bracht werden. Wenn keine mechanische Arbeit ausgeubt wird,gilt

0 = Q1 + Q2 = m1

∫ T

T1

cV1(T ′)dT ′+m2

∫ T

T2

cV2(T ′)dT ′ , (10.10)

wenn cV die spezifische Warme pro Masse bei konstantem Volu-men ist. Wenn zudem cV von der Temperatur zumindest approxi-mativ unabhangig ist, erhalten wir daraus die Mischungstempera-tur,

m1cV1(T − T1) + m2cV2(T − T2) =0

⇔ T =m1cV1T1 + m2cV2T2

m1cV1 + m2cV2. (10.11)

Ebenso konnen wir die Entropie berechnen. In einer quasistati-scher Verschiebung von Ti zu Tf gilt bei konstantem x

S f − S i =

∫ f

i

dQT

=

∫ f

iCx

dTT

= Cx lnTf

Ti, (10.12)

wenn die Warmekapazitat Cx wieder schwach von T abhangt.

Page 103: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 10. THERMODYNAMIK 96

10.2 Ideales Gas

10.2.1 Zustandsgleichung

• Nach ihrer Definition heißen Gase ideal, wenn ihre Teilchen nurdurch direkte Stoße miteinander wechselwirken und als Punktteil-chen behandelt werden konnen. Dann ist die Anzahl der zugang-lichen Zustande im Phasenraum nach (8.11) und mit f = 3N

Ω =VNω(E)

h3N0

⇒ S =kN ln V + k lnω(E) − 3Nk ln h0 , (10.13)

wobei ω(E) eine Funktion der Energie allein ist, die unter ande-rem den bekannten Term (2mE) f /2 unserer mikroskopischen Dar-stellung enthalt. Nach (10.6) ist die Zustandsgleichung

PT

=∂S∂V

=kNV

⇒ PV = NkT . (10.14)

Die Temperatur, nach (9.16) durch

1T

=∂S∂E

=k

ω(E)∂ω(E)∂E

(10.15)

bestimmt, hangt nur von der Energie, aber nicht vom Volumenab. Umgekehrt ist die Energie eines idealen Gases eine Funktionallein der Temperatur, E = E(T ).

• Alternativ konnen wir die Zustandsgleichung (10.14) als expe-rimentell gegeben ansehen und aus thermodynamischen Zusam-menhangen Schlusse uber ideale Gase zu ziehen. Wir beginnenmit der Entropie jetzt als Funktion des Volumens und der Tempe-ratur,

dS =dET

+PdV

T(10.16)

nach (10.14) und dem ersten Hauptsatz der Thermodynamik. Furdie als Funktion der Temperatur und des Volumens bekommenwir

dE(T,V) =

(∂E∂T

)V

dT +

(∂E∂V

)T

dV

⇒ dS (T,V) =1T

(∂E∂T

)V

dT +

(PT

+1T

(∂E∂V

)T

)dV (10.17)

und damit(∂S∂T

)V

=1T

(∂E∂T

)V(

∂S∂V

)T

=PT

+1T

(∂E∂V

)T

=NkV

+1T

(∂E∂V

)T, (10.18)

Page 104: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 10. THERMODYNAMIK 97

wobei wir im letzten Schritt die Zustandsgleichung (10.14) ver-wendet haben.

• Die gemischten Ableitungen mussen aber ubereinstimmen,

∂2S∂T∂V

=1T

∂2E∂V∂T

=∂2S∂V∂T

=∂

∂T

(1T∂E∂V

)= −

1T 2

(∂E∂V

)T

+1T

∂2E∂T∂V

(10.19)

woraus wir und daraus (∂E∂V

)T

= 0 (10.20)

erhalten. Die Energie eines thermodynamischen Systems mit dergemessenen Zustandsgleichung (10.14) kann daher nicht vom Vo-lumen abhangen. Aus der Zustandsgleichung und den den ther-modynamischen Gesetzen schließen wir also, dass die Teilchendes Systems nur durch direkte Stoße wechselwirken konnen.

10.2.2 Spezifische Warmen und Entropie

• Fur die spezifische Warme pro Mol bei konstantem Volumen, cV ,erhalten wir aus ihrer Definition und dem ersten Hauptsatz

cV =1ν

(dQdT

)V

=1ν

(dE + PdV

dT

)V

=1ν

∂E∂T

⇒ dE =∂E∂T

dT = νcVdT , (10.21)

denn die Energie hangt nur von der Temperatur ab. Wenn wir stattdes Volumens den Druck konstant halten, dann mussen wir erlau-ben, dass sich das Volumen andern kann. Die spezifische Warmepro Mol bei konstantem Druck ist analog

cP =1ν

dE + PdVdT

= cV +PdVνdT

= cV +NkdTνdT

= cV +Nkν

=cV + R mit R := NAk = 8.31 × 107 ergmol K

(10.22)

wegen der Zustandsgleichung (10.14) und mit der so definiertenGaskonstante R. Die spezifische Warme bei konstantem Druck istgroßer als die spezifische Warme bei konstantem Volumen, weildas Gas bei konstantem Druck außer einer Temperaturerhohungauch mechanische Arbeit verrichten kann, indem es sein Volumenvergroßert.

Page 105: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 10. THERMODYNAMIK 98

• Auf der mikroskopische Ebene konnen wir die beiden Warmeka-pazitaten ausrechnen. Wir beginnen mit der Zustandssumme

Ω ∝VN E f /2 = VN E3N/2

⇒ S =kN ln V +3kN

2ln E + · · ·

⇒1T

=∂S∂E

=3Nk2E

⇔ E =32

NkT (10.23)

Nun ist nach (10.21) und nach dem ersten Hauptsatz bei dV = 0

cV =1ν

∂E∂T

=32

Nkν

=32

R und cP =52

R . (10.24)

• Auf ahnliche Weise erhalten wir die Entropie, zumindest bis aufeine Konstante. Wegen (10.21) gilt

TdS =dE + PdV = νcVdT + PdV

⇒ dS =νcVdTT

+NkV

dV = νcVdTT

+ νRdVV

. (10.25)

• Wir betrachten ν0 = 1 Mol eines idealen Gases mit einer Tem-peratur T0 und einem Volumen V0. Ein Gas mit derselben Tem-peratur T0 und ν Mol hat das Volumen (ν/ν0)V0, weil das Volu-men eine extensive Große ist, die sich bei der Verbindung zweierSysteme addiert. Nun gehen wir zunachst bei konstanter Tempe-ratur zum Volumen V und anschließend bei konstantem Volumenzur Temperatur T . Wenn wir dies quasi-statisch tun, dann bleibt(10.25) gultig. Die vom Weg unabhangige Entropieanderung istnach (10.25)

∆S = νcV

∫ T

T0

dT ′

T ′+ νR

∫ V

(ν/ν0)V0

dV ′

V ′

= νcV lnTT0

+ νR lnV

(ν/ν0)V0

= νcV lnTT0

+ νR lnVV0− νR ln

ν

ν0. (10.26)

Indem wir die Molzahlen ν durch Teilchenzahlen N = νNA erset-zen und R = kNA verwenden, erhalten wir

∆S =3Nk

2ln

TT0

+ Nk lnVV0− Nk ln

NNA

. (10.27)

• Dieses Ergebnis ist wegen des letzten Terms problematisch. Den-ken wir uns ein Gasvolumen mit N Teilchen gefullt und betrach-ten jeweils eine Halfte der Teilchen. Wir erwarten aus der Defini-tion der Zustandssummen, dass die gesamte Entropie gleich derSumme der Entropien der beiden Halften ist. Gleichung (10.27)

Page 106: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 10. THERMODYNAMIK 99

skaliert aber nicht auf diese Weise. Stattdessen finden wir fur dieSumme der Entropieanderungen in den beiden Halften

2∆S N/2 =3Nk

2ln

TT0

+ Nk lnVV0− 2

Nk2

lnN

2NA

=3Nk

2ln

TT0

+ Nk lnVV0− 2

Nk2

(ln

NNA− ln 2

)=∆S N + Nk ln 2 (10.28)

Dies ist das Gibbssche Paradoxon, das uns spater noch beschafti-gen wird.

10.2.3 Adiabatische Expansion

• Wenn ein Gas im Kontakt mit einem Warmereservoir expandiert,dann bleibt seine Temperatur konstant. Aufgrund der Zustands-gleichung ist damit

PV = NkT = konst. (10.29)

Anders verlauft die Expansion, wenn das ideale Gas thermischisoliert ist. Diese adiabatische Expansion erfullt

0 = dQ = dE + PdV = νcVdT + PdV . (10.30)

Die Zustandsgleichung sagt uns außerdem

d(PV) = VdP + PdV = NkdT = νRdT . (10.31)

Eliminieren wir dT zwischen den beiden Gleichungen (10.30)und (10.31), folgt

cV

R(VdP + PdV) + PdV = 0

⇔cV

RVdP = −

cV + RR

PdV = −cP

RPdV , (10.32)

mit (10.22). Trennung der Variablen und Integration fuhrt schließ-lich zu

dPP

=cP

cV

dVV

⇒ P ∝V−γ mit γ :=cP

cV=

53

(10.33)

• Uber die Zustandsgleichung PV = νRT fuhrt (10.33) auf einenZusammenhang zwischen dem Volumen und der Temperatur,

PVγ = (PV)Vγ−1 = νRTVγ−1 = konst. ⇒ TVγ−1 = konst.(10.34)

Page 107: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 10. THERMODYNAMIK 100

10.2.4 Erweiterungen (nicht in Vorlesung)

• Oft konnen die Teilchen des Gases nicht als punktformig ange-nommen werden. Dann muss berucksichtigt werden, dass sie ei-ne innere Struktur haben konnen, deren Anregungen zu weiterenFreiheitsgraden Anlass geben.

• Betrachten wir ein Gas, das aus zweiatomigen Molekulen besteht.Zu den drei Freiheitsgraden der Translation kommen dann nochzwei Freiheitsgrade der Rotation dazu; nicht drei, weil die Dre-hung um die Verbindungsachse der Atome keine Energie auf-nimmt, solange die Atome punktformig bleiben. Da jedes Teil-chen dann funf Freiheitsgrade hat, ist f = 5N. Weiterhin sindSchwingungen der beiden Atome gegeneinander moglich, durchdie ein weiterer Freiheitsgrad dazu kommt, so dass f = 6N wird.

• Unsere vorangegangenen Betrachtungen andern sich dadurch aufminimale Weise. Zunachst lautet (10.23)

1T

=f k2E

=6Nk2E

=3Nk

E, E = 3NkT . (10.35)

Damit erhohen sich die spezifischen Warmen bei konstantem Vo-lumen bzw. konstantem Druck auf

cV = 3R , cP = cV + R = 4R , (10.36)

und der Adiabatenindex verringert sich zu

γ =cP

cV=

43. (10.37)

• Die Anzahl der effektiven Freiheitsgrade wird außerdem da-von abhangen, ob die Rotations- und die Vibrationsfreiheitsgra-de uberhaupt angeregt werden konnen. Bei niedriger Temperaturmag das nicht der Fall sein, so dass cV von 3R/2 uber 5R/2 zu 3Rzunimmt, wenn zunachst die Rotations- und dann die Vibrations-freiheitsgrade zu den Translationsfreiheitsgraden dazukommen.

• Wenn sich die Gasteilchen mit relativistischen Geschwindigkei-ten bewegen, also mit Geschwindigkeiten, die einen nennenswer-ten Bruchteil der Lichtgeschwindigkeit c ausmachen, andert sichder Zusammenhang zwischen Impuls und kinetischer Energie.Statt

E =~p 2

2m(10.38)

gilt dann fur extrem relativistische Teilchen wie z.B. Photonen

E = cp . (10.39)

Page 108: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 10. THERMODYNAMIK 101

• Damit andert sich der Zusammenhang (10.23), den wir bei dermikroskopischen Berechnung der Anzahl zuganglicher Zustandeverwendet hatten. Weil die Energie jetzt linear vom Impulsabhangt und nicht mehr quadratisch, gilt

Ω ∝ VN E f statt Ω ∝ VN E f /2 . (10.40)

Die Entropie wird dadurch zu

S = kN ln V + k f ln E + · · · , (10.41)

woraus1T

=k fE

=3Nk

Eund E = 3NkT (10.42)

folgen. Daraus erhalten wir die spezifischen Warmen bei konstan-tem Volumen bzw. bei konstantem Druck und den Adiabatenin-dex

cV = 3R , cP = 4R , γ =43. (10.43)

• Dehnt sich ein Gemisch aus einem einatomigen, nichtrelativi-stischen idealen Gas und Photonen adiabatisch aus, fallt nach(10.34) die Temperatur Tg des nichtrelativistischen Gases schnel-ler als die Temperatur Tγ der Photonen ab, denn

Tg ∝ V−2/3 , Tγ ∝ V−1/3 . (10.44)

Wenn keine Wechselwirkung zwischen den Photonen und denGasteilchen fur thermisches Gleichgewicht zwischen beidensorgt, wird es daher sinnlos, von einer einzigen Temperatur desGemischs zu sprechen.

10.3 Thermodynamische Funktionen

10.3.1 Legendre-Transformationen

• In der experimentellen Praxis kann oft der Druck besser kontrol-liert werden als das Volumen. Experimente in offenen Behalternlaufen beispielsweise bei konstantem außeren Druck ab. Es lohntes sich dann, ein Systems nicht als Funktion der Entropie und desVolumens, sondern der Entropie und des Drucks zu beschreiben,also die Variablentransformation (S ,V) → (S , P) durchzufuhren.Um diese Transformation zu verstehen, beginnen wir erneut mitdem ersten Hauptsatz

dQ = TdS = dE + PdV ⇒ dE = TdS − PdV . (10.45)

Page 109: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 10. THERMODYNAMIK 102

In dieser Form konnen wir die Energie als Funktion der Entropieund des Volumens auffassen,

dE =

(∂E∂S

)V

dS +

(∂E∂V

)S

dV . (10.46)

Identifizieren wir die beiden Darstellungen, dann erhalten wir(∂E∂S

)V

= T und(∂E∂V

)S

= −P . (10.47)

Nach (10.47) ist der Druck als die zum Volumen gehorende ver-allgemeinerte Kraft gerade die (negative) Ableitung der Energienach dem Volumen. Die Transformation von V nach P ist also einBeispiel fur Transformationen, bei der eine Funktion f (x) in eineFunktion g(u) uberfuhrt werden soll, wobei die neue Variable ugerade durch

u = ±d f (x)

dx(10.48)

bestimmt ist. Das Vorzeichen spielt keine wesentliche Rolle, sodass wir der Einfachheit halber das negative ignorieren.

• Wenn die vollstandigen Differentiale von f (x) und g(u) durch

d f =d f (x)

dxdx = u dx , dg(u) =

dg(u)du

du = −x du (10.49)

festgelegt werden, gilt

dg = −x du = u dx − (x du + u dx) = d f − d(ux) , (10.50)

woraus durch Integration bis auf eine Konstante

g = f − ux bzw. g(u) = f [x(u)] − ux(u) (10.51)

folgt. Die Funktion g(u) heißt Legendre-Transformierte der Funk-tion f (x). Wenn x(u) nicht eindeutig bestimmt ist, wird dieLegendre-Transformation allgemein durch

g(u) = infx f [x(u)] − ux(u) (10.52)

bestimmt.

• Als Beispiel betrachten wir

f (x) = x2 + 1 ⇒ u(x) =2x ⇒ x(u) =u2

⇒ g(u) = f(u2

)−

u2

2= 1 −

u2

4. (10.53)

und

f (x) =x3

6−

x2

2⇒ u(x) =

x2

2− x

⇒ x(u) =1 ±√

1 + 2u (10.54)

Die Legendre-Transformierte von f (x) ist im zweiten Fall durchdie kleinere der beiden Losungen x(u) definiert.

Page 110: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 10. THERMODYNAMIK 103

• Eine Legendre-Transformation war uns schon bei der Hamilton-Formulierung der klassischen Mechanik begegnet. Dort ha-ben wir die Argumente Ort und Geschwindigkeit durch Ortund kanonisch-konjugierten Impuls ersetzt. Der kanonisch-konjugierte Impuls ist nach p = ∂L/∂q gerade die Ableitung derLagrange-Funktion nach der Geschwindigkeit, also nach der zuersetzenden Variablen. Die Hamilton-Funktion war dann

H(q, p) = qp − L(q, q) , (10.55)

was bis auf ein unerhebliches Vorzeichen von der Form (10.51)ist.

• Der Vollstandigkeit halber tragen wir nach, dass wegen desvollstandiges Differentials dE die verschiedenen partiellen Ablei-tungen von E nicht unabhangig sein konnen. Wir konnen also diegemischten zweite Ableitungen miteinander identifizieren, zumBeispiel

∂2E∂V∂S

=∂2E∂S ∂V

. (10.56)

Das bedeutet ausgeschrieben(∂

∂V

)S

(∂E∂S

)V

=

(∂

∂S

)V

(∂E∂V

)S. (10.57)

Mit den Identifikationen (10.47) erhalten wir(∂T∂V

)S

= −

(∂P∂S

)V. (10.58)

10.3.2 Enthalpie etc

• Einmal in Schwung konnen wir aus der Energie E(S ,V) die Ent-halpie H(S , P) mit P = −(∂E/∂V)S definieren. Die entsprechendeLegendre-Transformation lautet

H(S , P) = E(S ,V) + PV , (10.59)

wobei das positive Vorzeichen in diesem Fall physikalisch sinn-voll ist. Ihr vollstandiges Differential ist

dH = d(PV) + dE = VdP + PdV + TdS − PdV = TdS + VdP ,(10.60)

woraus zunachst(∂H∂S

)P

= T und(∂H∂P

)S

= V (10.61)

Page 111: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 10. THERMODYNAMIK 104

folgen. Wenn dH ein vollstandiges Differential ist, mussen wiederBeziehungen zwischen den partiellen Ableitungen der Enthalpiegelten. Wir identifizieren die zweiten Ableitungen nach S und P,

∂2H∂S ∂P

=∂2H∂P∂S

, (10.62)

und erhalten daraus(∂

∂S

)P

(∂H∂P

)S

=

(∂

∂P

)S

(∂H∂S

)P, (10.63)

oder mit Hilfe von (10.61)(∂V∂S

)P

=

(∂T∂P

)S. (10.64)

• Als nachstes Argument mochten wir die Entropie ersetzen, zumBeispiel durch die Temperatur, (S ,V) → (T,V). Das ist wegenT = (∂E/∂S )V wieder eine Legendre-Transformation auf die freieEnergie

F(T,V) = E(S ,V) − TS . (10.65)

Ihr vollstandiges Differential ist

dF(T,V) = dE−d(TS ) = TdS−PdV−S dT−TdS = −PdV−S dT ,(10.66)

woraus wir wie vorher(∂F∂V

)T

= −P ,

(∂F∂T

)V

= −S (10.67)

erhalten. Die Gleichsetzung der gemischten zweiten Ableitungenergibt in diesem Fall

∂2F∂T∂V

=∂2F∂V∂T

, (10.68)

so dass wir mit (10.67) (∂P∂T

)V

=

(∂S∂V

)T

(10.69)

ableiten konnen.

• Schließlich bleibt noch eine Transformation, die dann sinnvollist, wenn Temperatur und Druck statt Temperatur und Volumenexperimentell kontrolliert werden konnen, (T,V) → (T, P). MitP = −(∂F/∂V)T ist dies wieder eine Legendre-Transformationauf die freie Enthalpie

G(T, P) = F(T,V) + PV = E(S ,V) − TS + PV , (10.70)

Page 112: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 10. THERMODYNAMIK 105

deren vollstandiges Differential nun offenbar

dG = dF +VdP+PdV = −PdV−S dT +VdP+PdV = VdP−S dT(10.71)

ist. Die nun schon gewohnte Prozedur, die auf der Gleichsetzungder gemischten zweiten Ableitungen beruht, fuhrt mit(

∂G∂T

)P

= −S ,

(∂G∂P

)T

= V (10.72)

auf die weitere Relation(∂S∂P

)T

= −

(∂V∂T

)P. (10.73)

10.3.3 Maxwell-Relationen

• Fassen wir zusammen: Wir hatten anfanglich Systeme durch ihreEnergie E gekennzeichnet, mit dem Volumen V also alleinigemaußere Parameter. Die Entropie S (E,V) hatten wir als ein loga-rithmisches Maß dafur eingefuhrt, wie viele Zustande dem Sy-stem unter Vorgabe von E und V zuganglich sind. Damit warenwir fur quasi-statische Zustandsanderungen auf den ersten Haupt-satz (10.45) gekommen, in dem die unvollstandigen DifferentialedQ und dW mithilfe der Temperatur und des Drucks durch dievollstandigen Differentiale TdS der Entropie und PdV des Volu-mens ersetzt werden konnten.

• Dann hatten wir umgekehrt die Entropie als Zustandsgroße ver-wendet und die Energie E(S ,V) als Funktion der Entropie unddes Volumens aufgefasst. Davon ausgehend, hatten wir durchvier verschiedene Legendre-Transformationen die unabhangigenGroßen durch andere ersetzt. Diese Legendre-Transformationenuberfuhren entweder V → P oder S → T , oder beide. Da-durch entstehen anstelle der Energie E neue thermodynamischeFunktionen, die naturlich alle die Dimension einer Energie ha-ben. Funktionen, in denen die Temperatur statt der Entropie un-abhangig ist, heißen ”frei“; Funktionen, in denen der Druck an-stelle des Volumens unabhangig ist, heißen ”Enthalpie“,

Energie E(S ,V)freie Energie F(T,V) = E(S ,V) − TSEnthalpie H(S , P) = E(S ,V) + PVfreie Enthalpie G(T, P) = F(T,V) + PV = E(S ,V) − TS + PV James Clerk Maxwell

Ihre vollstandigen Differentiale waren:

dE = TdS − PdVdF = −S dT − PdVdH = TdS + VdPdG = −S dT + VdP (10.74)

Page 113: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 10. THERMODYNAMIK 106

Aus der Voraussetzung, dass alle diese Differentiale vollstandigsein mussen, hatten wir schließlich noch die Maxwell-Relationenabgeleitet,(

∂T∂V

)S

= −

(∂P∂S

)V

,

(∂T∂P

)S

=

(∂V∂S

)P,(

∂S∂V

)T

=

(∂P∂T

)V

,

(∂S∂P

)T

= −

(∂V∂T

)P. (10.75)

10.4 Anwendungen (nicht in Vorlesung)

10.4.1 Spezifische Warmen

• Sehen wir uns zunachst wieder die spezifischen Warmen bei kon-stantem Volumen oder bei konstantem Druck an. Sie waren durch(10.7) definiert,

CV =

(dQdT

)V

= T(∂S∂T

)V, CP =

(dQdT

)P

= T(∂S∂T

)P.

(10.76)Wir wahlen (T, P) als unabhangige Variable, schreiben die Entro-pie als Funktion derselben, S = S (T, P), und bekommen daraus

TdS = T[(∂S∂T

)P

dT +

(∂S∂P

)T

dP]

= CPdT + T(∂S∂P

)T

dP ,

(10.77)wobei bereits CP aus (10.76) eingesetzt wurde. Wenn der Druckkonstant gehalten wird, ist dP = 0, und (10.77) fallt auf die Defi-nition (10.76) von CP zuruck.

• Wenn statt des Drucks das Volumen festgehalten wird, kann derDruck nur von der Temperatur abhangen,

dP =

(∂P∂T

)V

dT , (10.78)

so dass aus (10.77)

CVdT = CPdT + T(∂S∂P

)T

(∂P∂T

)V

dT (10.79)

folgt. Nun machen wir von einer der Maxwell-Relationen (10.75)Gebrauch, um die Ableitung der Entropie zu ersetzen,(

∂S∂P

)T

= −

(∂V∂T

)P. (10.80)

Page 114: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 10. THERMODYNAMIK 107

Die Große auf der rechten Seite hat eine anschauliche Bedeu-tung: Sie beschreibt, wie das Volumen auf Grund einer Tempe-raturanderung zunimmt, wenn der Druck konstant bleibt, und da-mit die isobare Warmeausdehnung des Systems. Wir definierenden Warmeausdehnungskoeffizienten

α :=1V

(∂V∂T

)P

(10.81)

und bekommen aus (10.80)

CV = CP − αVT(∂P∂T

)V. (10.82)

• Die verbliebene Ableitung erhalten wir, indem wir das Volu-men als Funktion von Druck und Temperatur auffassen. Seinvollstandiges Differential

dV =

(∂V∂P

)T

dP +

(∂V∂T

)P

dT = 0 (10.83)

muss verschwinden, weil wir von konstantem Volumen ausgehen.Deswegen muss (

∂V∂P

)T

dP = −

(∂V∂T

)P

dT (10.84)

sein, woraus wir mit (10.78)(∂V∂P

)T

(∂P∂T

)V

= −

(∂V∂T

)P⇒

(∂P∂T

)V

= −

(∂V∂T

)P(

∂V∂P

)T

(10.85)

bekommen. Den Zahler kennen wir bereits aus (10.81). Der Nen-ner beschreibt, wie sich das Volumen bei konstanter Temperaturandert, wenn der Druck verandert wird, und damit die isothermeKompressibilitat

κ := −1V

(∂V∂P

)T. (10.86)

Fassen wir (10.85), (10.85) und (10.81) zusammen, erhalten wiraus (10.82) den allgemeinen Zusammenhang

CP −CV = VTα2

κ(10.87)

zwischen den beiden Warmekapazitaten bei konstantem Druckbzw. konstantem Volumen.

• Bekommen wir daraus das bekannte Ergebnis (10.22) fur dasideale Gas zuruck? Zunachst bestimmen wir den Warmeausdeh-nungskoeffizienten des idealen Gases. Wegen der Zustandsglei-chung des idealen Gases, PV = NkT = νRT , ist VdP + PdV =

Page 115: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 10. THERMODYNAMIK 108

νRdT . Bei konstantem Druck, dP = 0, ist PdV = νRdT , unddaher ist der isobare Warmeausdehnungskoeffizient

α =1V

(∂V∂T

)P

=νRPV

=1T. (10.88)

Ahnlich einfach bekommen wir die isotherme Kompressibilitat,denn bei dT = 0 ist VdP + PdV = 0, daher dV/dP = −V/P, und

κ = −1V

(∂V∂P

)T

=1P. (10.89)

Setzen wir (10.88) und (10.89) in die allgemeine Formel (10.87)ein, bekommen wir

CP −CV = VTPT 2 =

PVT

= νR , (10.90)

wie es sein muss.

10.4.2 Entropie und Energie

• Sehen wir die Entropie als Funktion der Temperatur und des Vo-lumens an, S = S (T,V), ist ihr vollstandiges Differential

dS =

(∂S∂T

)V

dT +

(∂S∂V

)T

dV =CV

TdT +

(∂P∂T

)V

dV , (10.91)

wobei im zweiten Schritt wieder eine der Maxwell-Relationen(10.75) Verwendung fand. Wenn wir die Zustandsgleichung ken-nen, beispielsweise durch Messung, ist der zweite Term auf derrechten Seite schon bekannt.

• Mit der Warmekapazitat konnen wir wie folgt verfahren: Auf-grund ihrer Definition ist(

∂CV

∂V

)T

=

(∂

∂V

)T

[T

(∂S∂T

)V

]= T

∂2S∂V∂T

. (10.92)

Hier kehren wir die Reihenfolge der partiellen Ableitungenum und finden, wiederum unter Einsatz einer der Maxwell-Relationen (10.75)

T∂2S∂T∂V

= T(∂

∂T

)V

(∂S∂V

)T

= T(∂

∂T

)V

(∂P∂T

)V. (10.93)

Die Kombination von (10.93) mit (10.92) erlaubt es, auchdie Warmekapazitat durch die Zustandsgleichung auszudrucken,denn (

∂CV

∂V

)T

= T(∂2P∂T 2

)V. (10.94)

Page 116: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 10. THERMODYNAMIK 109

Das erlaubt zuerst die bemerkenswerte Schlussfolgerung, dass je-des System, dessen Druck nur linear von der Temperatur abhangt,eine Warmekapazitat hat, die nicht vom Volumen abhangt, wiewir das beim idealen Gas kennengelernt hatten.

• Mit (10.94) konnen wir die Warmekapazitat, die wir aus der zwei-ten Ableitung der Zustandsgleichung erhalten hatten, nach derTemperatur integrieren, denn fur jede Temperatur T gilt

CV(T,V) = CV(T,V0) + T∫ V

V0

(∂CV

∂V

)T

dV ′ . (10.95)

Sobald CV(T,V) innerhalb des benotigten Temperaturbereichsbekannt ist, kann dann die Entropie aus (10.91) konstruiert wer-den. Die Kenntnis der Zustandsgleichung und der Warmekapa-zitat bei konstantem Volumen als Funktion der Temperatur rei-chen also aus, um die Entropie zu berechnen.

• Wenn wir auch die Energie als Funktion von T und V darstellen,schreiben wir das vollstandige Differential der Entropie wie in(10.91) und erhalten aus dem ersten Hauptsatz

dE = TdS − PdV = T[CV

TdT +

(∂P∂T

)V

dV]− PdV

= CVdT +

[T

(∂P∂T

)V− P

]dV . (10.96)

Die partiellen Ableitungen der Energie lauten demnach(∂E∂T

)V

= CV ,

(∂E∂V

)T

= T(∂P∂T

)V− P . (10.97)

Wenn die Zustandsgleichung und die spezifische Warme bekanntsind, kann also auch die Energie direkt durch Integration be-stimmt werden.

• Eine sehr schone Anwendung der letzten Gleichung auf die Elek-trodynamik liefert ein wichtiges und haufig angewandtes Ergeb-nis. Der Druck, der durch ein elektromagnetisches Feld der Ener-giedichte ε ausgeubt wird, ist

P =ε

3⇒ E = εV = 3PV . (10.98)

• Davon kann man sich wie folgt uberzeugen: Ein elektromagneti-sches Feld kann als Photonengas aufgefasst werden, also als idea-les Gas relativistischer Teilchen. Wegen des dann linearen Zu-sammenhangs E = cp zwischen Energie und Impuls gilt (10.40).Bei konstanter Entropie ist

dS = 0 = d ln Ω = Nd ln V + f ln E = NdVV

+ fdEE

, (10.99)

Page 117: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 10. THERMODYNAMIK 110

woraus gleich mit (10.47)(∂E∂V

)S

= −P = −Nf

EV

⇒ P =ε

3(10.100)

folgt, denn f = 3N und die Energiedichte ist ε = E/V .

• Eingesetzt in die zweite Gleichung (10.97) ergibt (10.98)

3P = T(∂P∂T

)V− P ⇒ T

(∂P∂T

)V

= 4P . (10.101)

Variablentrennung und Integration nach T fuhrt auf

P ∝ T 4 , E ∝ T 4 , (10.102)

d.h. Druck und Energie eines elektromagnetischen Feldes im ther-modynamischen Gleichgewicht sind proportional zur vierten Po-tenz der Temperatur. Das ist das Stefan-Boltzmannsche Gesetz.

Page 118: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

Kapitel 11

Phasenubergange

Im vergangenen Kapitel haben wir im Rahmen der Thermodynamikverschiedene Arten der Veranderung von Zustandsgroßen kennenge-lernt. Sie beruhten zum Beispiel in der Wechselwirkung mit einemWarmebad oder entlang einer Adiabate darauf, das System moglichsthomogen zu verandern. Interessanter ist allerdings die Frage, ob manin einem System drastische Veranderungen erzeugen kann — dieAbkuhlung von Wasser zum Beispiel wird eigentlich erst interessant,wenn wir Wasser in Eis umwandeln. In diesem Kapitel werden wir unssolchen drastischen Veranderungen wieder in der Sprache der statistischdefinierten Thermodynamik widmen

11.1 Phasengleichgewicht

11.1.1 Extremaleigenschaften

• Wir wissen, die Wahrscheinlichkeit, in einem Ensemble gleichar-tiger Systeme den Wert vk zu messen, proportional ist zur Anzahlder mit vk vertraglichen Zustande im Phasenraum,

p(vk) ∝ Ω(vk) = exp(S (vk)

k

). (11.1)

Im Gleichgewicht wird also mit großter Wahrscheinlichkeit derWert von vk gemessen werden, der Ω(vk) maximiert. Fur einenSatz außerer Parameter x j wird sich ein isoliertes System alsoeinstellen, dass auch die Entropie maximal wird,

dS = 0 und∂2S∂x2

j

≤ 0 (11.2)

fur alle außeren Parameter x j. Diese Aussage stellt im Lich-te der Wahrscheinlichkeitsinterpretation der Entropie beinahe ei-ne Trivialitat dar: Das System wird seine außeren Parameter im

111

Page 119: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 11. PHASENUBERGANGE 112

Gleichgewicht so einstellen, dass sie ihm einen moglichst großenBereich im Phasenraum erlauben, weil dann die Wahrschein-lichkeit moglichst groß wird, das System dort zu finden. Daskonnte man in der Formulierung ”wahrscheinlich geschieht im-mer das Wahrscheinlichste“ zusammenfassen. Diese fundamen-tale Aussage beruht jedoch auf dem Postulat gleicher a-priori-Wahrscheinlichkeiten und der Tatsache, dass die Entropie alslogarithmisches Maß des Phasenraumvolumens eine Zustands-funktion physikalischer Systeme darstellt. Die Maximierung derEntropie im Gleichgewicht isolierter Systeme ist deswegen so-wohl eine Aussage uber Wahrscheinlichkeiten als auch uber dieaußeren physikalischen Parameter dieser Systeme.

• Fur isolierte Systeme ist die Energie konstant und es wird keineArbeit am oder vom System verrichtet. Dann sind (E,V) vorge-geben, und der Gleichgewichtszustand ist durch (11.2) gekenn-zeichnet, dS = 0. In thermischem Kontakt mit einem Warme-reservoir der Temperatur T stellt sich ein anderes Gleichgewichtein. Sei S die Entropie des gesamten Systems, S 1 die des Reser-voirs und S 2 die des Systems, gilt

0 = dS =dS 1 + dS 2 =dQ1

T+ dS 2

=−dE2 + TdS 2

T=−dF2

T, (11.3)

weil die Warmeanderung d Q1 des Reservoirs allein die Energiedes Systems verandert, und die Temperatur durch das Reservoirkonstant ist. Das Funktional der extremalen freie Energie ken-nen wir aus (10.66). Bei vorgegebener Temperatur und festemVolumen stellt sich also ein System so ein, dass die freie EnergieF(T,V) minimal wird.

• Ebensogut konnen wir statt des Volumens V den Druck P vor-geben. Dann muss das System aus dem Reservoir so viel Warmeentnehmen, dass es nicht nur seine Energie, sondern auch sein Vo-lumen geeignet einstellen kann. Statt wie in (11.3) ist jetzt abernicht dQ1 = TdS 1, sondern

dQ1 = − dQ2 = TdS 2 = −dE2 − P2dV2

⇒ 0 = dS =dS 1 + dS 2 =d Q1

T+ dS 2

=−dE2 − P2dV2 + TdS 2

T=−dG2

T. (11.4)

Hier nutzen wir die freie Enthalpie G aus (10.70). Bei festemDruck und vorgegebener Temperatur stellt sich das Gleichge-wicht eines Systems so ein, dass die freie Enthalpie G(T, P) mi-nimal wird. Naturlich ist auch das eine vererbte Konsequenz derExtremaleigenschaft der Entropie.

Page 120: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 11. PHASENUBERGANGE 113

11.1.2 Chemisches Potential

• Erlauben wir jetzt außer Veranderungen des Volumens oder desDrucks und der Temperatur oder der Energie auch Anderungender Teilchenzahl N. Dann ist E = E(S ,V,N), und es tritt eineweitere verallgemeinerte Kraft im Sinn der Definition (8.31) auf,

µ :=(∂E∂N

)T,S

. (11.5)

Sie heißt chemisches Potential und gibt an, wie sich die Ener-gie andert, wenn sich N andert. Das vollstandige Differential derEnergie gibt mit Hilfe der drei verallgemeinerten Krafte

dE =

(∂E∂S

)V,N

dS +

(∂E∂V

)S ,N

dV +

(∂E∂N

)S ,V

dN

=TdS − PdV + µdN

⇔ dS =dET

+PdV

T−µdN

T. (11.6)

• Betrachten wir nun ein isoliertes System, das aus zwei Phasen be-steht. Als Phase wird ein chemisch und physikalisch homogenerBereich bezeichnet. Im Falle eines Eiswurfel im Wasserglas sindWasser und Eis zwar chemisch homogen, physikalisch homogensind aber nur der Eiswurfel und das flussige Wasser fur sich ge-nommen. Beide Phasen seien durch (E1,V1,N1) und (E2,V2,N2)gekennzeichnet, allerdings mit konstanten Gesamtgroßen

E2 = E − E1 , V2 = V − V1 , N2 = N − N1 . (11.7)

Das Gleichgewicht stellt sich wieder fur

0 =dS = dS 1 + dS 2 (11.8)

=

(∂S 1

∂E1−∂S 2

∂E1

)dE1 +

(∂S 1

∂V1−∂S 2

∂V1

)dV1 +

(∂S 1

∂N1−∂S 2

∂N1

)dN1

ein. Fur willkurliche dE1, dV1 und dN1 sind also

T1 = T2 , P1 = P2 , µ1 = µ2 . (11.9)

Die ersten beiden Bedingung kennen wir schon als Bedingungenfur thermisches und mechanisches Gleichgewicht, die dritte istneu und beschreibt das so genannte Phasengleichgewicht. Pha-sengleichgewicht herrscht also dann, wenn die chemischen Po-tentiale der beteiligten Phasen gleich sind.

Page 121: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 11. PHASENUBERGANGE 114

11.1.3 Gibbssche Phasenregel

• Erweitern wir nun das System weiter, indem wir mehrere Kom-ponenten zulassen. Komponenten sind die verschiedenen chemi-schen Stoffe, aus denen eine Phase zusammengesetzt ist. Ein Bei-spiel fur ein System aus zwei Komponenten und zwei Phasenist ein flussiges Alkohol-Wasser-Gemisch in einem offenen Glas.Wir bezeichnen Großen fur die Komponente i in der Phase j zumBeispiel als µ(i)

j . Fur die Gesamtenergie gilt dann statt (11.6)

dE = TdS − PdV +∑

i, j

µ(i)j dN(i)

j . (11.10)

Die Bedingung fur das Phasengleichgewicht muss jetzt separatfur alle Komponenten in allen Phasen gelten,

µ(i)1 = µ(i)

2 = . . . = µ(i)nP. (11.11)

Dies sind nP − 1 Gleichungen. Da sie fur jede Komponentei = 1, ..., nK gelten mussen, entsteht ein System aus (nP − 1)nK

Gleichungen.

• Die beteiligten Variablen sind der gemeinsame Druck, diegemeinsame Temperatur, sowie die einzelnen TeilchenzahlenN1, . . . ,NnK . Von den nK Teilchenzahlen sind (nK−1) unabhangig,wenn die Gesamtzahl der Teilchen aller Komponenten festgehal-ten wird. Fur diese insgesamt 2 + nP(nK − 1) Variablen stehenuns die (nP − 1)nK Gleichungen zur Verfugung. Die Anzahl derunbestimmten Freiheitsgrade ist daher

nF = 2 + nP(nK − 1) − (nP − 1)nK = 2 − nP + nK . (11.12)

Das ist die Gibbssche Phasenregel.

• Fur ein Systems, das nur aus Wasser besteht, ist nK = 1. Wasserkann in drei Phasen vorliegen; fest, flussig oder gasformig. Wenngleichzeitig zwei Phasen auftreten sollen, nP = 2, bleibt

nF = 2 − 2 + 1 = 1 . (11.13)

Das Gleichgewicht zwischen den beiden Phasen legt also nur zumBeispiel den Druck als Funktion der Temperatur fest, bei denenbeide Phasen im Gleichgewicht koexistieren konnen. Die Dampf-druckkurve des Wassers ist dafur ein Beispiel. Sollen die drei Pha-sen gleichzeitig im Gleichgewicht stehen (nP = 3), ist die Freiheitaufgebraucht

nF = 2 − 3 + 1 = 0 . (11.14)

Eine Koexistenz der drei Phasen ist nur am Tripelpunkt moglich.

Page 122: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 11. PHASENUBERGANGE 115

11.1.4 Reaktionsgleichgewichte

• Im ersten Teil der Vorlesung hatten wir homogene Funktionenvom Grad k besprochen, die durch

f (λ~x) = λk f (~x) (11.15)

definiert sind. Extensive thermodynamische Großen mussen ho-mogen vom Grad eins sein. Wenn ein System beispielsweise hal-biert wird, mussen sich auch seine Entropie, seine Energie, undseine Teilchenzahl(en) halbieren,

E(λS , λV, λNi) = λE(S ,V,Ni) . (11.16)

Damit gilt aber auch der Eulersche Satz uber homogene Funktio-nen,

~x · ~∇ f (~x) = k f (~x) . (11.17)

Er besagt im Fall der Energie E(S ,V,Ni) fur k = 1

S(∂E∂S

)V,N

+ V(∂E∂V

)S ,N

+ Ni

(∂E∂Ni

)S ,V

=E(S ,V,Ni)

⇔ TS − PV + µiNi =E(S ,V,Ni)⇔ G(T, P,Ni) =µiNi , (11.18)

wenn wir die freie Enthalpie G = E + PV −TS einfuhren. Dies istdie Gibbs-Duhem-Beziehung. Fur Systeme aus nur einer Kompo-nente ist also µ = G/N.

• Gleichgewicht zwischen zwei Phasen einer Komponente setzt

µ1 = µ2 oder dµ1 = dµ2 (11.19)

voraus. Aus der Gibbs-Duhem-Beziehung und (10.74) wissen wir

dµi =dGi

Ni=−S idT + VidP

Ni= − sidT + vidP

⇔ −s1dT + v1dP = − s2dT + v2dP

⇔dPdT

=s1 − s2

v1 − v2. (11.20)

wobei s und v Entropie und Volumen pro Teilchen sind.Wenn wir den Entropieunterschied zwischen den beiden Pha-sen durch die Verdampfungswarme pro Teilchen ausdrucken,s1−s2 = |Q|/(NT ), dann heißt diese Relation Clausius-Clapeyron-Gleichung.

• Chemische Reaktionsgleichungen wie die der Verbrennung vonWasserstoff zu Wasser,

2H2 + O2 → 2H2O , (11.21)

Page 123: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 11. PHASENUBERGANGE 116

lassen sich in die Gestalt

ν jA j = 0 (11.22)

bringen, wenn ν j die beteiligten Molzahlen sind und Reaktions-produkte mit negativen ν j gekennzeichnet werden. Fur die Was-serstoffverbrennung sind νH2 = 2, νO2 = 1 und νH2O = −2. DieAnderungen in den Teilchenzahlen sind proportional zu den Mol-zahlen ν j,

dN j = λν j . (11.23)

Deswegen konnen wir die Bedingung dG = 0 fur das Reaktions-gleichgewicht durch

0 = dG =∂G∂Ni

dNi = µidNi = µiλνi ⇔ µiνi = 0

(11.24)darstellen.

11.2 Phasenubergang im Van der Waals-Gas

11.2.1 Van der Waals-Gas

• Die Zustandsgleichung des idealen Gases muss modifiziert wer-den, wenn die Wechselwirkung zwischen Gasteilchen und dereneigenes, endliches Volumen berucksichtigt werden. Die entspre-chende Van-der-Waalssche Gasgleichung lautet statt PV = νRT(

P +aν2

V2

)(V − νb) = νRT . (11.25)

Die Konstante a beschreibt, um wieviel der Druck aufgrund derWechselwirkung zwischen den Gasteilchen erhoht wird, und dieKonstante b quantifiziert das Volumen der Gasteilchen.

Johannes D. Van der Waals• Wir berechnen zunachst die Energie des Van der Waals-Gases

als Funktion von T und V . Wegen (10.97) brauchen wir ausser(∂E/∂T )V = CV noch(

∂E∂V

)T

=T(∂P∂T

)V− P

=T(∂

∂T

)V

(νRT

V − νb−

aν2

V2

)− P

=TνR

V − νb−

(νRT

V − νb−

aν2

V2

)=

aν2

V2 . (11.26)

Page 124: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 11. PHASENUBERGANGE 117

Integriert erhalten wir

E(T,V) =

∫ T

T0

CV(T ′)dT ′ + aν2∫ V

V0

dV ′

V ′2

=CV(T − T0) − aν2(

1V−

1V0

), (11.27)

wobei wir im zweiten Schritt annehmen, dass CV nicht vonder Temperatur abhangt. Die Energie hangt jetzt vom Volumenab, weil in der Wechselwirkung der Gasteilchen eine potentielleEnergie steckt, die zunimmt, wenn die Gasteilchen sich vonein-ander entfernen.

• Im Vorbeigehen betrachten wir den Joule-Thomson-Effekt fur dasVan der Waals-Gas. Er beschreibt die Temperaturanderung einesexpandierenden Gases. Wenn die Energie anders als beim idealenGas von der Temperatur und dem Volumen abhangt, dann erhal-ten wir bei einer warmeisolierten Expansion wegen (11.27)

CV(T1 − T0) − aν2(

1V1−

1V0

)=CV(T2 − T0) − aν2

(1V2−

1V0

)⇒ T1 − T2 =

aν2

CV

(1V1−

1V2

)(11.28)

Im Van der Waals-Gas sorgen die langreichweitigen Wechselwir-kungen der Gasteilchen untereinander fur eine Abkuhlung, wenndas Gas sich frei ausdehnt.

11.2.2 Kritische Isotherme

• Um eine Eigenart der Van der Waals-Gleichung (11.25) zu er-halten, leiten wir sie bei konstanter Temperatur nach dem Volu-men V ab. Auf diese Weise definieren wir Isothermen im P − V-Diagramm,[(

∂P∂V

)T−

2aν2

V3

](V − νb)+

(P +

aν2

V

)= 0

(∂P∂V

)T

= −νRT

(V − νb)2 +2aν2

V3 . (11.29)

Fur jede Temperatur beschreiben sie aufintegriert eine KurveP(V). Setzen wir diese Ableitung gleich Null, erhalten wir die-jenigen Punkte langs dieser Isothermen, bei denen der Druck alsFunktion des Volumens extremal wird,

2aν2

V3 =νRT

(V − νb)2 ⇔(1 − v)2

v3 =RTb2a

, (11.30)

Page 125: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 11. PHASENUBERGANGE 118

wo v := V/(νb) das Verhaltnis das Gasvolumens zum Volumenseiner Teilchen ist. Bei v = 3 hat die Funktion (1 − v)2/v3 einMaximum der Hohe 4/27. Die hochste Temperatur, bei der dieGleichung (11.30) erfullt sein kann, ist also durch

Tkrit =8a

27Rb(11.31)

gegeben. Sie heißt kritische Temperatur. Die durch sie definiertekritische Isotherme hat im P-V-Diagramm bei vkrit = 3 und Pkrit =

a/(27b2) ein Maximum. Die Gleichung (11.30) lasst sich mithilfeder kritischen Temperatur in die dimensionslose Form

(1 − v)2

v3 =4t27

mit t :=T

Tkrit(11.32)

bringen, und die Zustandsgleichung nimmt die Form

p :=P

Pkrit=

8t(v − 1)

−27v2 (11.33)

an.

Einige Isothermen eines Van derWaals-Gases unterhalb der kriti-schen Temperatur. Rot markiert istdie Kurve, die die Maxima und dieMinima der Isothermen verbindet.

• Der Kurze halber bezeichnen wir das Maximum der Isothermenfur t < 1 als Punkt 1 mit den Koordinaten (v1, p1) und das Mini-mum als Punkt 2 mit den Koordinaten (v2, p2). Wenn der Druckzwischen p1 und p2 liegt, dann gibt es drei passende Volumina.

Bewegen wir uns entlang der Isothermen von großem Volumenkommend auf das Maximum 1 zu. Das Volumen nimmt ab, derDruck nimmt langsam zu, bis das Maximum erreicht ist. Danachnimmt der Druck mit abnehmendem Volumen ab, wobei man zei-gen kann, dass dies die Stabilitatsbedingung verletzt. Die Isother-me zwischen (v2, p2) und (v1, p1) stellt also offenbar keine physi-kalisch stabile Situation dar. Erst jenseits von v2, steigt der Druckmit abnehmendem Volumen weiter an. Nur die beiden abfallen-den Zweige der Isothermen beschreiben also physikalisch stabi-le Verhaltnisse. Sie gehoren zu zwei Phasen des Van der Waals-Gases.

Bei hohem Druck, p > p1, existiert nur die Phase mit gerin-gem Volumen. Hier hangt der Druck steil mit dem Volumen zu-sammen, die Kompressibilitat ist gering, charakteristisch fur ei-ne flussige Phase. Bei niedrigem Druck, p < p2, existiert nurdie Phase mit großem Volumen. Die hohe Kompressibilitat kenn-zeichnet eine Gasphase. Im Bereich p2 < p < p1 existieren beidePhasen nebeneinander, welche wird also im Gleichgewicht ange-nommen?

• Das Gleichgewicht wird dadurch bestimmt, dass die freie Enthal-pie minimal werden muss. Also untersuchen wir

G(T, P) =

∫dG =

∫(−S dT + VdP) , (11.34)

Page 126: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 11. PHASENUBERGANGE 119

berucksichtigen dT = 0 langs der Isothermen und integrieren voneinem beliebigen, bei großem Volumen liegenden Punkt (V0, P0)entlang der Isothermen zu kleinerem Volumen (V, P) hin. Dannist, ausgedruckt durch die dimensionslosen Großen,

g(t, p) =

∫ p

p0

v(p′)dp′ =

∫ v

v0

v′(dpdv

)(v′)dv′

=p(v′)v′∣∣∣∣vv0−

∫ v

v0

p(v′)dv′

=pv − p0v0 − 8t lnv − 1v0 − 1

− 27(1v−

1v0

). (11.35)

Um die Zustandsgleichung p(v) in (11.33) statt ihrer Umkehr-funktion v(p) verwenden zu konnen, haben wir partiell integriert.

Freie Enthalpie eines Van derWaals-Gases unterhalb der kriti-schen Temperatur (bei t = 0.9).

Dargestellt als Funktion des Drucks zeigt die Enthalpie ein aufden ersten Blick eigenartiges Verhalten. Ausgehend von niedri-gem Druck steigt sie steil an, bis das Maximum der Isothermeerreicht wird. Danach fallt sie flacher wieder ab, bis das Mini-mum der Isotherme erreicht wird, um anschließend abermals fla-cher anzusteigen. Der rucklaufige Teil der Kurve entspricht derinstabilen Situation, in der der Druck mit abnehmendem Volumenabnimmt. Der steile ansteigende Ast stellt demnach die Gaspha-se dar, wahrend der flache die flussige Phase vertritt. Die beidenschneiden sich in einem Kreuzungspunkt (etwa bei p ≈ 0.65).Bei kleineren Drucken hat die Gasphase die kleinere Enthalpie,bei großeren die flussige Phase. Der Kreuzungspunkt markiert al-so denjenigen Druck, bei dem die flussige in die gasformige Pha-se ubergeht, also den Verdampfungsdruck bei der vorgegebenenTemperatur der Isotherme.

Latente Warme des Phasenuber-gangs in einem Van der Waals-Gasbei t = 0.9.11.2.3 Latente Warme

• Der Phasenubergang von der flussigen in die gasformige Phasebenotigt Energie. Bei gleichbleibender Temperatur und konstan-tem Druck muss dem verflussigten Van der Waals-Gas die Ver-dampfungswarme zugefuhrt werden, um es in die Gasphase zuuberfuhren. Diese latente Warme genannte Energiemenge kannman berechnen.

• Bei einem Druck p2 < p < p1 nennen wir die Volumina der flussi-gen und der gasformigen Phase vf und vg. Ihre Werte folgen direktaus der Zustandsgleichung. Die Entropieanderung langs der Iso-thermen ist

∆s =

∫ds =

∫ vg

vf

(∂s∂v

)tdv =

∫ vg

vf

(∂p∂t

)v

dv , (11.36)

Page 127: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 11. PHASENUBERGANGE 120

wobei im letzten Schritt eine Maxwell-Relation aus (10.75) be-nutzt wurde. Die Ableitung des Drucks nach der Temperatur beikonstantem Volumen ist durch die Zustandsgleichung (11.33) ge-geben,(

∂p∂t

)v

=8

v − 1⇒ ∆s =8 ln

vf − 1vg − 1

⇒ ∆q :=t∆s = 8t lnvf − 1vg − 1

(11.37)

Phasenubergange, bei denen eine solche latente Warme auftritt,heißen erster Art.

Page 128: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

Kapitel 12

Statistik

In der Experimentalphysik haben wir ganz zu Beginn einige Grundla-gen der Wahrscheinlichkeitsrechnung eingefuhrt. Wahrscheinlichkeits-rechnungen sind in der Physik zentral, sobald wir ein Experiment aus-werten, denn zu jedem experimentellen Ergebnis gehort nicht nur derzentrale Messwert, sondern vor allem auch eine Fehlerabschatzung.Wenn man Folgerungen aus einer Messung ziehen mochte, dann sinddie Fehlerbalken mindestens so wichtig wie der Zentralwert, denn wirstellen immer dieselbe Frage: Ist dieses Ergebnis im Rahmen allerUnsicherheiten in Ubereinstimmung mit der Theorie-Vorhersage, odermussen wir die zugrundeliegene Theorie modifizieren? In diesem Ka-pitel betrachten wir zwei Aspekte der Statistik physikalischer Messun-gen. Zuerst widmen wir und den Wahrscheinlichkeitsverteilungen furverschiedene Fehlerquellen. Im zweiten Schritt beschreiben wir Mes-sungen, die von verschiedenen Fehlerquellen beeinflusst werden. Dabeimussen wir zwischen einem Frequentist-Zugang und eine BayesischenWahrscheinlichkeit unterscheiden.

12.1 Wahrscheinlichkeitsverteilungen

12.1.1 Unsicherheiten

• Fur jede physikalische Messung kombiniert man drei Arten vonUnsicherheiten, wenn man den Fehlerbalken konstruiert. Derwohl bekannteste Beitrag ist die statistische Unsicherheit. Wir be-ginnen mit einem Wurfelexperiment, von dem wir wissen, dassdas Ergebnis durch eine Binomialverteilung beschrieben wird.Dies beruht auf dem Postulat, dass alle Wurfelversuche gleichar-tig und voneinander unabhangig sind. In diesem Fall ist die Wahr-scheinlichkeit n Ereignisse in N Versuchen bei einer einzelnen

121

Page 129: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 12. STATISTIK 122

konstanten Wahrscheinlichkeit n/N zu beobachten

P(n|n) =N!

n!(N − n)!

( nN

)n (1 −

nN

)N−n

. (12.1)

In der Physik gehen wir davon aus, dass wir Prazisionsexperimen-te sehr oft wiederholen konnen, wobei die positiven Ergebnissenicht haufig sein mussen, N n. In diesem Grenzfall kann mandie Binomialverteilung umformen und erhalt

P(n|n) =nn

n!lim

N→∞

N!(N − n)!Nn

(1 −

nN

)N (1 −

nN

)−n

=nn

n!lim

N→∞1n

(1 −

nN

)N

1−n

=nn

n!lim

N→∞exp ln

(1 −

nN

)N

=nn

n!lim

N→∞exp N ln

(1 −

nN

)=

nn

n!e−n (12.2)

Dies ist die Poisson-Verteilung fur die Wahrscheinlichkeit, einenWert n zu messen, wenn wir n erwarten. Sie ist zunachst fur allenaturlichen Zahlen n ≥ 0 definiert. Negative Zahlen ergeben inder Poisson-Verteilung ebenso wenig Sinn wie in einem Zahlex-periment. Mathematisch ist fur jede Art von Wahrscheinlichkeits-verteilung die Normierung zentral. Sie bedeutet, dass ein Systemeinen der moglichen Messwerte annehmen muss,

∞∑n=0

P(n|n) = e−n∞∑

n=0

nn

n!= e−nen = 1 (12.3)

Dazu haben wir lediglich die Taylor-Entwicklung der Exponenti-alfunktion benotigt.

• In der Praxis ist die Definition der Poisson-Verteilung unhandlich.Im Grenzwert großer Zahlen von positiven Messungen n 1konnen wir zunachst die Stirling-Formel n! ≈

√2πn(n/e)n benut-

zen und die Poisson-Verteilung auf positive reelle Zahlen verall-gemeinern. Wenn wir Event-Zahlen nahe Null vermeiden und furgroße Event-Zahlen n = n(1 + δ) oder δ = (n − n)/n annehmen,

Page 130: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 12. STATISTIK 123

dann ergibt sich

P(n|n) =nn(1+δ)

√2πn(1 + δ)

(e

n(1 + δ)

)n(1+δ)

e−n

=1√

2πn

nn(1+δ)

√1 + δ

enδ

nn(1+δ)(1 + δ)n(1+δ)

=1√

2πn

enδ

(1 + δ)n(1+δ)+1/2

=enδ

√2πn

exp[ln(1 + δ)−n(1+δ)−1/2

]=

enδ

√2πn

exp[(−n(1 + δ) −

12

)ln(1 + δ)

]=

enδ

√2πn

exp[(−n − nδ −

12

) (δ −

δ2

2+ O(δ3)

)]=

enδ

√2πn

exp[−nδ −

δ

2− nδ2 +

nδ2

2+δ2

4+ O(δ3)

]=

1√

2πnexp

[−

nδ2

2−δ

2+δ2

4+ O(δ3)

]≈

1√

2πne−(n−n)2/(2n) (12.4)

Im letzten Schritt erhalten wir die Gauss-Verteilung oder Normal-verteilung im Grenzfall hoher Statistik n, n 1. Wichtig ist auchin diesem Fall die Normierung der Gauss-Verteilung

1√

2πn

∫ ∞

−∞

dn e−(n−n)2/(2n) = 1 . (12.5)

Die Gauss-Verteilung ist fur alle rellen Werte von n definiert undsymmetrich um den Erwartungswert n. Ihre Standardabweichungist σ =

√n.

• Neben dem fur kleine oder große Werte wohldefiniertem statisi-tischen Fehler gibt es experimentell auch systematische Fehler.Sie kommen zum Beispiel aus der Eichung des Versuchsaufbausoder aus Fehlern auf andere Messgroßen, die fur unsere eigent-liche Messung benotigt werden. Nur wenn Systematiken mit an-deren Messungen im Grenzfall großer Statistik bestimmt werden,dann kann man fur sie auch eine Gauss-Verteilung annehmen. ImIdealfall kann man zum Beispiel einen Input-Parameter mit seinergesamten gemessenen Wahrscheinlichkeitsverteilung angeben.

• Schliesslich gibt es auch fur jede theoretische Vorhersage einenTheorie-Fehler, weil wir kein komplexes System prazise berech-nen konnen. Beispiele sind in diesem Fall eine Taylorreihe um

Page 131: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 12. STATISTIK 124

eine kleine Storung oder statistische Unsicherheiten in rein nu-merischen Berechnungen. Das Problem mit theoretischen Feh-lern ist, dass wir nicht wissen wie wahrscheinlich zum Beispieleine Abweichung von 10% im Vergleich zu einer Abweichungum 20% ist. Streng genommen wissen wir zwar, dass bei ei-ner zu großen Diskrepanz der Messung von der Vorhersage dieTheorie als widerlegt betrachten werden, konnen diese Grenzeaber nicht wissenschaftlich prazise festlegen. Mit anderen Wor-ten: Theoretische Fehler konnen mit unseren statistischen Werk-zeugen nicht beschrieben werden. Ein weit verbreiteter Zugangist es, die Wahrscheinlichkeitsverteilung des Theorie-Fehler fureine Observable zentral als flach anzunehmen und jenseits ei-ner akzeptierten Grenze guten Geschmacks komplett abzuschnei-den. Auf diese Weise nehmen wir an, dass anders als bei stati-stischen Prozessen keine kleine Wahrscheinlichkeit besteht, dasseine Theorie eine beliebig schlechte Vorhersage liefert.

12.1.2 Zentraler Grenzwertsatz

• Die Herleitung der Gauss-Verteilung aus der Poisson-Verteilung,die man wiederum aus der Binomial-Verteilung herleiten kannsuggeriert, dass der Gauss-Verteilung im Grenzfall großer Stati-stik eine Sonderrolle zukommt. Eine Annahme, die wir sicherlichmachen mussen ist, dass wir in vielen Versuchen immer dieselbeWahrscheinlichkeitsverteilung testen und dass die Versuche von-einander unabhangig sind.

• Statt den zentralen Grenzwertsatz zu beweisen, sehen wir uns le-diglich die Annahmen im Detail an. Der Beweis beruht auf ei-ner Reihe von Schritten: Zunachst nimmt man an, dass man diemoglichen Messwerte n um einen wohldefinierten Erwartungs-wert n zentrieren kann. Als nachstes wird diese zentrierte Vertei-lung auf die Standardabweichung σ normiert. Und schliesslichnehmen wir an, dass die Wahrscheinlichkeitsverteilung integrier-bar und daher normierbar ist. Unter diesen Annahmen kann manzeigen, dass fur große n die Wahrscheinlichkeitsverteilung dieGauss-Form (12.4) haben muss.

12.1.3 Daten vs Theorie

• Nachdem wir die Wahrscheinlichkeitsverteilung der verschiede-nen Fehler verstanden haben, stellt sich die Frage, wie man Datenmit Vorhersagen vergleicht. Wir nehmen in einem ersten Schritteine Zahlexperiment an, fur das wir die komplette Wahrschein-lichkeitsverteilung P(n) kennen. Beginnen wir mit dem Fall, dass

Page 132: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 12. STATISTIK 125

Experiment und Theorie im wesentlichen ubereinstimmen. Mitdieser Information konnen wir zum Beispiel alternative Theorienausschliessen, die eine hohere Zahlrate nT vorhersagen. Was unsinteressiert ist der Anteil der Wahrscheinlichkeitsverteilung, diemit der alternativen Theorie vertraglich ware. Wenn zum Beispieldie Bedingung∫ ∞

nT

dn P(n) < 0.05 mit∫ ∞

−∞

dn P(n) = 1 (12.6)

an das Integral erfullt ist, dann ist die alternative Theorie nurzu 5% erlaubt oder entsprechend zu 95% confidence level aus-geschlossen. Wichtig ist, dass in diese Definition die Details derwiderlegten Zahlrate um nT keine Rolle spielt.

• Alternativ konnen wir die Entdeckung eines neuen Teilchens wiedes Higgs-Teilchens dadurch beweisen, dass die Theorie ohnedieses neue Teilchen mit ihrer entsprechenden Wahrscheinlich-keitsverteilung nicht mit der Messung ubereinstimmt. Dazu defi-nieren wir fur die gemessene Ereigniszahl nE den Wert

p0 =

∫ ∞

nE

dn P(n) . (12.7)

Er beschreibt, welcher Teil der Wahrscheinlichkeitsverteilung oh-ne das Higgs-Teilchen mit der hoheren Messung nE vertraglichist. In der Teilchenphysik hat man sich darauf geeinigt, dass fureine Entdeckung die Bedingung p0 < 3 × 10−7 erfullt ist. Dasentspricht im Gauss-Limes funf Standardabweichungen.

• Schliesslich konnen wir mit Hilfe des p0-Wertes noch eine wei-tere Komplikation verstehen: Wenn man zum Beispiel in einerVerteilung einer gemessenen Große nach einer Anomalie sucht,dann untersucht man die gesamte Kurve. Wenn man eine Kurvein 10 Bereiche unterteilt und diese Bereiche nacheinander unter-sucht, dann gibt es eine hohere Wahrscheinlichkeit, zum Beispieleine statistische Fluktuation zu beobachten. In erster Naherungist diese kombinierte Wahrscheinlichkeit das zehnfache der ein-fachen Messung. Um eine globale Wahrscheinlichkeit von funfStandardabweichungen zu erhalten muss man einen lokalen Wertp0 < 3 × 10−8 unterschreiten. Dieser Effekt heißt look-elsewhereeffect, wobei er eigentlich look-anywhere effect heißen sollte.

12.2 Satz von Bayes

Im vorigen Kapitel haben wir gezeigt, die man mit Hilfe einer bekann-ten Wahrscheinlichkeitsverteilung Messungen mit theoretischen Vor-hersagen vergleichen kann. Das Problem in der Praxis ist, dass die

Page 133: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 12. STATISTIK 126

Wahrscheinlichkeitverteilung P(n) nicht nur eine der drei statistischenVerteilungen ist. Stattdessen ist sie eine Kombination mehrerer Quel-len von statistischen, systematischen und theoretischen Unsicherheiten.Wir mussen also die Frage beantworten, wie wir in einem komplexenSystem verschiedene Quellen von Unsicherheiten kombinieren konnen.

12.2.1 Bayesische Wahrscheinlichkeit

• Als Basis fur die folgende, formale Diskussion von Wahrschein-lichkeiten beginnen wir mit den drei Kolmogorov-Axiomen: Daserste Axiom besagt, dass jede Wahrscheinlichkeit fur alle Er-gebnisse eine nicht negative reelle Zahl ist, also P(A) ∈ R undP(A) ≥ 0. Das zweite Axiom besagt, dass die Wahrscheinlichkeitalles moglichen Ausgange kombiniert eins ist. Das dritte Axiombesagt, dass sich Wahrscheinlichkeiten fur disjunkte Ausgangeaddieren, P(A ∪ B) = P(A) + P(B).

• Bevor wir uns mit der Frage befassen konnen, wie man tatsachlichdie Wahrscheinlichkeit einer Theorie mit gegebenen Daten be-rechnen kann, benotigen wir sogenannte bedingte Wahrschein-lichkeiten. Wir betrachten zwei verschiedenen Messungen unddefinieren die bedingte Wahrscheinlichkeit fur ein Ergebnis A un-ter der Annahme, dass wir auch B beobachten als

P(A|B) :=P(A ∩ B)

P(B)⇔ P(A|B) P(B) = P(A ∩ B) .

(12.8)

Weil A∩ B = B∩A vertauscht ist P(A∩ B) = P(B∩A) und damitdie umgekehrte bedingte Wahrscheinlichkeit

P(B|A) =P(A ∩ B)

P(A). (12.9)

Diese Formeln sind je nach Geschmack Definitionen oder Axio-me, die allerdings aus den elementaren Kolmogorov-Axiomenmotiviert. Zwei Messungen A und B sind statistisch unabhangig,wenn fur ihre bedingte Wahrscheinlichkeit P(A ∩ B) = P(A)P(B)gilt. Diese Relation sollte man allerdings in der Physik nur anneh-men, nachdem man sie sorgfaltig getestet hat.

• Der Satz von Bayes besagt, dass die bedingte Wahrscheinlichkeitfur T gegeben M durch

P(T |M) =P(M|T ) P(T )

P(M)(12.10)

gegeben ist. Dies folgt einfach aus der Definition der beding-ten Wahrscheinlichkeit. Wichtig sind fur die Anwendungen ei-nige Definitionen: P(T |M) nennt man posterior probability oder

Page 134: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 12. STATISTIK 127

im folgenden einfach Wahrscheinlichkeit; P(T ) und P(M) heis-sen jeweils prior probability oder kurz Prior; wenn man P(M|T )als Funktion vom zweiten Argument T betrachtet, dann heisst esLikelihood. Das Kernproblem mit der Likelihood ist, dass sie alsFunktion von T nicht normiert ist und sich damit grundlegendenAnnahmen der Wahrscheinlichkeitstheorie entzieht.

• Wenn man in (12.10) T mit der Theorie-Vorhersage und M mitden Messungen identifiziert, dann steht auf der linken Seite dieGroße, die uns in der Physik eigentlich interessiert: Wie großist nach einem Experiment M die Wahrscheinlichkeit, dass eineTheorie T die Messung korrekt beschreibt. Der Satz von Bayesgibt uns auch die formal korrekte Definition fur diese Wahr-scheinlichkeit und damit die Großen, die wir nun bestimmenmussen. Die Likelihood P(M|T ) kann man zum Beispiel aus ei-ner Simulation eines Experiments erhalten — wir untersuchenalle nach irgendeinem Maß vernunftigen oder relevanten Theo-rien T und erhalten fur jedes T eine Vorhersage fur M. Weiterhinkonnen wir uns eventuell behelfen, indem wir den Prior P(M) ausder Normierungsbedingung an unsere gewunschte Wahrschein-lichkeit erhalten. Das Problem bleibt dann der Prior P(T ), also einMaß fur Wahrscheinlichkeit im Theorie-Raum. Aus dem Beweisdes Satzes von Bayes ist klar, dass man nur totale Wahrschein-lichkeiten P(T ∩M) identifizieren kann, wir uns aber fur eine be-dingte Wahrscheinlichkeit interessieren und daher die Definitioneines Priors nicht vermeiden konnen.

Streng genommen sind diese Definitionen von Ausschluss undEntdeckung in (12.6) und (12.7) im Frequentist-Zugang definiert,denn die zugrundeliegenden Verteilungen P(n) beschreiben dasstatistisch reproduzierbare Verhalten einer großen Zahl von Ex-perimenten unter der Annahme einer Theorie, kurz P(M|T ).

12.2.2 Volumeneffekte

• Der Satz von Bayes (12.10) lasst uns zwei Moglichkeiten, Theo-rie und Messungen mathematisch korrekt zu verknupfen. ImBayes-Zugang definieren wir die P(T |M) als den offensichtlichdegree of belief, womit uns nichts ubrig bleibt als einen Prioroder Mass uber den Wahrscheinlichkeitsraum der Theorie zu de-finieren. Im Frequentist-Zugang erlauben wir keine Großen, diesich nicht durch eine Verteilung einer großer Zahl experimentellerErgebnisse definieren lassen. In diesem Fall muss uns die Like-lihood P(M|T ) = L(T ) als degree of belief genugen. Sie definiertzum Beispiel den Punkt im Theorie-Raum, der am besten mit derMessung ubereinstimmt.

Page 135: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 12. STATISTIK 128

• Den Unterschied zwischen diesen beiden Zugangen kann mananhand eines einfachen Beispiels illustrieren. Betrachten wireinen Becher voll Wasser einerseits und eine Wolke aus Wassen-dampf andererseits. Die Wassermenge in der Wolke ist wesentlichgroßer, aber die Wasserdichte wesentlich geringer.

Die zunachst unspezifische physikalische Frage ist, wo wir wahr-scheinlich ein Wassermolekul finden werden. Nach dem Satz vonBayes suchen wir nach dem Objekt, in dem sich ein Wassermo-lekul wahrscheinlicher befindet. Dies ist offensichtlich die Wolke.Ein Frequentist konnte lediglich fragen, an welchem Ort sich einWassermolekul am wahrscheinlichsten befindet, weil die Defini-tion von Wolke oder Wasserbecher eine Frage der Interpretationund nicht der Messung ist. Die Antwort ist dann der Wasserbechermit seinre großeren Wasserdichte. Man kann sich nun trefflichstreiten, wer die korrekte Antwort gibt, aber man kann sich auchdaran erinnern, dass es sich um zwei Antworten auf zwei ver-schiedene Fragen handelt. In diesem Fall unterscheiden sie sichum einen sogenannten Volumeneffekt, den man in Bayes-Zugangberucksichtigt (oder erzeugt).

• Dieselbe Fragen nach einem Maß, oder besser nach einem Inte-grationsmaß stellt sich auch in einem anderen Zusammenhang.Nehmen wir an, dass wir zwei Quellen von Unsicherheiten mit-einander kombinieren wollen, und dass wir beide individuellenVerteilungen kennen. Uns interessiert aber nur eine der beidenVerteilungen, weil sie zum Beispiel eine Likelihood als Funkti-on einer physikalisch interessanten Große ist, der zweite Para-meter hingegen intern die Eichung des experimentellen Aufbausbeschreibt. Ein solcher, fur das physikalische Ergebnis nicht re-levanter Parameter heißt Nuisance-Parameter und wird am Endeaus dem experimentellen Ergebnis eliminiert. Wir tun die zumBeispiel durch Integration mit dem als im Bayes-Zugang immerbekannten oder postulierbaren Maß. Wenn beide VerteilungenGauss-Form haben, dann ergibt sich zunachst ohne Berucksich-tigung der Normierung

P(n) ∝∫ ∞

−∞

dm e−m2/(2σ21) e−(n−m)2/(2σ2

2)

=

∫ ∞

−∞

dm exp[−

m2(σ21 + σ2

2) − 2nmσ21 + n2σ2

1

2σ21σ

22

]=

∫ ∞

−∞

dm exp[−σ2

1 + σ22

2σ21σ

22

(m2 − 2nm

σ21

σ21 + σ2

2

+ n2 σ21

σ21 + σ2

2

)]=

∫ ∞

−∞

dm exp

− σ2

2σ21σ

22

(m − nσ2

1

σ2

)2

− n2σ41

σ4 + n2σ21

σ2

(12.11)

An dieser Stelle verschieben wir die Integrationskonstante zu

Page 136: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 12. STATISTIK 129

m′ = m − nσ21/σ

2 und definieren σ2 = σ21 + σ2

2. Damit erhal-ten wir fur das Integral

P(n) ∝∫ ∞

−∞

dm′ exp[−

σ2

2σ21σ

22

(m′2 − n2σ

41

σ4 + n2σ21

σ2

)]=

∫ ∞

−∞

dm′ exp[−

σ2

2σ21σ

22

(m′2 − n2σ

41 − σ

21σ

2

σ4

)]=

∫ ∞

−∞

dm′ exp[−

σ2

2σ21σ

22

(m′2 + n2σ

21σ

22

σ4

)]=e−n2/(2σ2)

∫ ∞

−∞

dm′ e−m′2σ2/(2σ21σ

22)

=σ1σ2√

2πσe−n2/(2σ2) (12.12)

Wenn wir die Normierungskonstanten der beiden originalenGauss-Verteilungen 1/(

√2πσi) einsetzen, dann sehen wir, dass

die Kombination zweier Gauss-Verteilung wieder eine solche ist.Die Breiten der Gauss-Verteilungen addieren sich im Quadrat.

• In der Herleitung von (12.12) haben wir angenommen, dass wiruber m integrieren und bei dieser Integration ein flaches Integra-tionsmaß haben. Eine Annahme dieser Art mussen wir machen,um die Integration ausfuhren zu konnen. Wir konnten stattdessenauch uber d log m integrieren und aus der Substitution ein Inte-grationsmaß d log m/dm = 1/m erhalten. Eine solche Variationdes Priors oder Integrationsmaßes sollte Teil jeder Analyse vonBayes-Wahrscheinlichkeiten sein, um die Stabilitat des Ergebnis-ses gegenuber veranderten Annahmen zu uberprufen.

• Wenn wir statt mit zwei Gauss-Verteilung mit beliebigen ande-ren Verteilungen beginnen, dann sagt der zentrale Grenzwertsatz,dass im Grenzfall vieler solcher Verteilungen wieder eine Gauss-Verteilung entsteht. Der einzige Weg, die Addition der Breiten imQuadrat zu entgehen ist, die beiden Parameter m und n nicht alsunkorreliert zu betrachten. In diesem Fall konnen wir bei einervollstandigen Korrelation zum Beispiel eine lineare Addition derbeiden Breiten erreichen.

12.2.3 Profile-Likelihood

• Im Frequentist-Zugang existiert kein Integrationsmaß, um einenNuisance-Parameter auszuintegrieren. Um trotzdem eine Like-lihood um eine Dimension zu reduzieren greifen wir auf einenTrick zuruck: Wir projizieren den großten Wert der Likelihood alsFunktion des Nuisance-Parameters auf den verbleibenden, physi-kalischen Parameter. Auf diese Weise konnen wir immer noch

Page 137: Theoretische Physik II: Analytische Mechanik und ...plehn/pics/complete_th2.pdf · i stellen Sie Fragen! sollten Sie Werbung fur die Fachschaft oder anderes studentisches¨ Engagement

KAPITEL 12. STATISTIK 130

verschiedene Werte des physikalischen Parameters miteinandervergleichen und insbesondere den wahrscheinlichsten Wert able-sen. Nehmen wir wie in (12.12) zunachst an, dass beide individu-ellen Likelihoods eine Gauss-Verteilung haben,

L(n) = maxm

e−m2/(2σ21) e−(n−m)2/(2σ2

2)

= maxm

exp[−

m2(σ21 + σ2

2) − 2nmσ21 + n2σ2

1

2σ21σ

22

]= max

mexp

[−σ2

1 + σ22

2σ21σ

22

(m2 − 2nm

σ21

σ21 + σ2

2

+ n2 σ21

σ21 + σ2

2

)]= max

mexp

− σ2

2σ21σ

22

(m − nσ2

1

σ2

)2

− n2σ41

σ4 + n2σ21

σ2

= max

m′exp

[−

σ2

2σ21σ

22

(m′2 − n2σ

41 − σ

21σ

2

σ4

)]= max

m′exp

[−

σ2

2σ21σ

22

(m′2 + n2σ

21σ

22

σ4

)]= e−n2/(2σ2) max

m′e−m′2σ2/(2σ2

1σ22) = e−n2/(2σ2) , (12.13)

wobei wir wie vorher m′ = m−nσ21/σ

2 und σ2 = σ21 +σ2

2 definie-ren. Dieses Ergebnis ist identisch mit dem Ergebnis fur die Inte-gration im Bayes-Zugang. Allerdings ist in der Profile-Likelihooddie Normierung verlorengegangen, die im Bayes-Zugang erhaltenwurde.

• Interessant wird es, wenn wir im Extremfall nun zwei Verteilun-gen mit einer Box-Form kombinieren. Wie nehmen an, dass beideBoxen die Breite (n +− n−) haben und erhalten

L(n) = maxm

Θ(n+ − m) Θ(m − n−) Θ(n+ − n + m) Θ(n − m − n−)

= maxm∈[n−,n+]

Θ((n+ + m) − n) Θ(n − (n− + m))

= Θ(2n+ − n) Θ(n − 2n−) . (12.14)

Dies ist eine Box der doppelten Breite 2(n+ − n−), die Profile-Likelihood hat also fur zwei unkorrelierte Box-Verteilungen dieBreiten linear addiert.

• Aus dieser Diskussion konnen wir sofort ableiten, in welchemGrenzfall der Bayes-Zugang mit dem Frequentist-Zugang iden-tisch ist: die Verteilungen mussen Gauss-Form haben und, umVolumeneffekte zu vermeiden, eine kleine Breite haben. Oder mitanderen Worten, der Bayes-Zugang und der Frequentist-Zugangliefern nur im Grenzfall perfekter Statistik dasselbe Ergebnis.