Analysis II im WS 2011/2012 { Kurzskript · Analysis II im WS 2011/2012 { Kurzskript Prof. Dr. C. L...

60
Analysis II im WS 2011/2012 – Kurzskript Prof. Dr. C. L¨ oh Wintersemester 2011/2012 Inhaltsverzeichnis -1 Literaturhinweise 2 0 Einf¨ uhrung 3 1 Metrische R¨ aume und normierte R¨ aume 4 2 Topologische Grundlagen 13 3 Mehrdimensionale Analysis – Differenzierbarkeit 22 4 Mehrdimensionale Analysis – Integration 40 5 Gew¨ ohnliche Differentialgleichungen 45 Version vom 10. Februar 2012 [email protected] Fakult¨ at f¨ ur Mathematik, Universit¨ at Regensburg, 93040 Regensburg

Transcript of Analysis II im WS 2011/2012 { Kurzskript · Analysis II im WS 2011/2012 { Kurzskript Prof. Dr. C. L...

Analysis II im WS 2011/2012 – Kurzskript

Prof. Dr. C. Loh Wintersemester 2011/2012

Inhaltsverzeichnis

-1 Literaturhinweise 2

0 Einfuhrung 3

1 Metrische Raume und normierte Raume 4

2 Topologische Grundlagen 13

3 Mehrdimensionale Analysis – Differenzierbarkeit 22

4 Mehrdimensionale Analysis – Integration 40

5 Gewohnliche Differentialgleichungen 45

Version vom 10. Februar [email protected] fur Mathematik, Universitat Regensburg, 93040 Regensburg

-1 Literaturhinweise

Die folgenden Listen enthalten eine kleine Auswahl an Literatur zur Analysis II.

Topologie

[1] K. Janich. Topologie, achte Auflage, Springer, 2008.

[2] J.L. Kelley. General Topology, Springer, 1975.

[3] J.R. Munkres. Topology, zweite Auflage, Pearson, 2003.

[4] L.A. Steen. Counterexamples in Topology, Dover, 1995.

(Mehrdimensionale) Analysis

[5] R. Denk, R. Racke. Kompendium der ANALYSIS, Vieweg+Teubner, 2011.

[6] O. Forster. Analysis 1/2/3, neunte uberarbeitete Auflage, Vieweg+Teubner,2009.

[7] S. Lang. Undergraduate Analysis, zweite Auflage, Springer, 2010.

[8] S. Lang. Real and Functional Analysis, dritte Auflage, Springer, 1993.

[9] T. Tao. Analysis I/II, zweite Auflage, Hindustan Book Agency, 2009.

[10] W. Walter. Analysis 1/2, siebte Auflage, Springer, 2009.

. . . und viele weitere Bucher; je nach eigenen Vorlieben werden Ihnen mancheBucher besser gefallen als andere.

Gewhnliche DifferentialgleichungenEinige der oben genannten Bucher uber mehrdimensionale Analysis behandelnauch gewohnliche Differentialgleichungen.

[11] M. Wilke, J.W. Pruss. Gewohnliche Differentialgleichungen und dynamische Sy-steme, Birkhauser/Springer, 2010.

[12] J.C. Robinson. An Introduction to Ordinary Differential Equations, CambridgeUniversity Press, 2004.

Weiterfuhrende Themen

[13] M. Aigner, G. Ziegler. Proofs from the BOOK, vierte Auflage, Springer, 2009.

[14] A. Engel. Problem Solving Strategies, zweite Auflage, Springer, 1999.

2

0 Einfuhrung

Grob gesagt ist Analysis das Studium lokaler und globaler Eigenschaften reell- oderkomplexwertiger Funktionen (insbesondere gehoren dazu die Begriffe Konvergenz, Ste-tigkeit, Differenzierbarkeit, Integration und Approximationseigenschaften).

In der Analysis I haben wir uns im wesentlichen mit Funktionen vom Typ X −→ Rbeschaftigt, wobei X ⊂ R ist.

Ziel der Analysis II ist nun, diese Konzepte auf den mehrdimensionalen Fall zu ver-allgemeinern; dabei werden wir insbesondere wichtige Generalisierungs- und Abstrak-tionstechniken (einem zentralen Bestandteil der modernen Mathematik) kennenlernen.

3

1 Metrische Raume und normierte Raume

Der zentrale Begriff in der Analysis ist Approximation bzw. Konvergenz. Bisher habenwir uns im wesentlichen mit Konvergenz in R beschaftigt. Unser erstes Ziel ist es, denKonvergenzbegriff geeignet zu verallgemeinern. Dies geschieht in zwei Schritten:

– Erster Abstraktionsschritt: metrische Raume (insbesondere normierte Raume).– Zweiter Abstraktionsschritt: topologische Raume (s. Kapitel 2).

Metrische Raume

Um den Konvergenzbegriff zu verallgemeinern, orientieren wir uns an folgender Stra-tegie zur Generalisierung/Abstraktion:

1. Was sind die zentralen Objekte/Eigenschaften fur den betrachteten Aspekt?2. Wir verwenden diese Objekte/Eigenschaften als Definition und abstrahieren so-

mit von der gegebenen konkreten Situation.3. Wir uberprufen, ob sich die klassische Theorie (d.h. Satze, Beispiele, . . . ) hinrei-

chend gut in der allgemeineren Theorie widerspiegelt.Im Beispiel des Konvergenzbegriffs (fur Konvergenz in R) stellen wir fest, dass der

”Abstand“ |x − y| zwischen reellen Zahlen x, y ∈ R und der Wertebereich R≥0 dieser

”Abstandsfunktion“ die zentralen Objekte sind, und dass die zentralen Eigenschaften

davon sind, dass der”Abstand“ (Un)Gleichheit von Elementen entdecken kann, dass

er symmetrisch ist und dass er die Dreiecksungleichung erfullt.Dies fuhrt zum Begriff metrischer Raume:

Definition 1.1 (metrischer Raum). Ein metrischer Raum ist ein Paar (X, d), wobeiX eine Menge und d eine Metrik auf X ist, d.h. d ist eine Abbildung X ×X −→ R≥0mit folgenden Eigenschaften:

– Fur alle x, y ∈ X ist genau dann d(x, y) = 0, wenn x = y ist.– Fur alle x, y ∈ X ist d(x, y) = d(y, x).– Dreiecksungleichung. Fur alle x, y, z ∈ X ist

d(x, z) ≤ d(x, y) + d(y, z).

Notation 1.2.– Man bezeichnet die durch

R× R −→ R≥0(x, y) 7−→ |x− y|

gegebene Metrik als Standardmetrik auf R.– Ist X eine Menge, so bezeichnet man die durch

X ×X −→ R≥0

(x, y) 7−→

{0 falls x = y

1 falls x 6= y

gegebene Metrik als diskrete Metrik auf X.

4

Notation 1.3 (offene/abgeschlossene Balle). Sei (X, d) ein metrischer Raum, sei x ∈X und sei r ∈ R≥0. Dann ist

U(x, r) :={y ∈ X

∣∣ d(x, y) < r}

bzw.

B(x, r) :={y ∈ X

∣∣ d(x, y) ≤ r}

der offene bzw. abgeschlossene Ball vom Radius r um x. Ist der umgebende me-trische Raum nicht aus dem Kontext ersichtlich, so schreiben wir auch U (X,d)(x, r)bzw. B(X,d)(x, r).

Caveat 1.4. In der Literatur wird die Notation B(. . . ) manchmal auch fur offeneBalle verwendet!

Wir konnen nun die Definition der Konvergenzbegriffe in den Kontext metrischerRaume ubersetzen:

Definition 1.5 (Cauchyfolge, Grenzwert, konvergente Folge). Sei (X, d) ein metrischerRaum und sei (an)n∈N eine Folge in X.

– Die Folge (an)n∈N ist eine Cauchyfolge in (X, d), wenn

∀ε∈R>0∃N∈N ∀n,m∈N≥N

d(an, am) ≤ ε.

Wenn die Metrik auf X aus dem Kontext klar hervorgeht, sagen wir in diesemFall auch Cauchyfolge in X.

– Ein Element a ∈ X ist ein Grenzwert von (an)n∈N in (X, d), wenn

∀ε∈R>0∃N∈N ∀n∈N≥N

d(an, a) ≤ ε.

– Die Folge (an)n∈N ist konvergent in (X, d), wenn sie einen Grenzwert in (X, d)besitzt.

Viele grundlegende Eigenschaften von Cauchyfolgen bzw. konvergenten Folgen in Rbzw. Q ubertragen sich nun ohne weiteres auf die Situation metrischer Raume:

Proposition 1.6 (Grundlegende Eigenschaften von konvergenten Folgen). Sei (X, d)ein metrischer Raum und sei (an)n∈N eine Folge in X.

1. Ist (an)n∈N in X konvergent, so ist (an)n∈N eine Cauchyfolge in X.2. Ist (an)n∈N in X konvergent, so besitzt (an)n∈N genau einen Grenzwert in X

und wir bezeichnen diesen mitlimn→∞

an.

3. Ist (an)n∈N eine Cauchyfolge in X, so ist die Menge {an | n ∈ N} ⊂ X in Xbeschrankt; dabei heißt eine Teilmenge Y ⊂ X beschrankt, wenn die Menge{d(y, y′) | y, y′ ∈ Y } ⊂ R beschrankt ist.

Caveat 1.7. Im allgemeinen ist nicht in jedem metrischen Raum jede Cauchyfolgebereits konvergent!

5

Definition 1.8 (vollstandig). Ein metrischer Raum (X, d) ist vollstandig, wenn jedeCauchyfolge in X bereits in X konvergiert.

Bemerkung 1.9 (Vervollstandigung metrischer Raume). Analog zur Konstruktionvon R aus Q kann man mit Hilfe von Aquivalenzklassen von Cauchyfolgen zu jedemmetrischen Raum einen

”geeigneten“ vollstandigen metrischen Raum konstruieren.

Abbildungen zwischen metrischen Raumen

Wie in jeder mathematischen Theorie wollen wir nicht nur Objekte, sondern auch

”strukturerhaltende“ Abbildungen zwischen diesen Objekten untersuchen. Je nachdem

wie stark die Metrik von Abbildungen zwischen metrischen Raumen respektiert werdensoll, erhalten wir verschiedene Begriffe. Wir beginnen mit den starksten Bedingungenund schwachen diese im Verlauf weiter ab.

Definition 1.10 (Isometrie). Seien (X, dX) und (Y, dY ) metrische Raume.– Eine Abbildung f : X −→ Y ist eine isometrische Einbettung, wenn f die Metrik

erhalt, d.h., wenn

∀x,x′∈X dY(f(x), f(x′)

)= dX(x, x′).

– Eine Abbildung f : X −→ Y ist eine Isometrie, wenn sie eine isometrische Ein-bettung ist und es eine isometrische Einbettung g : Y −→ X mit f ◦g = idY undg ◦ f = idX gibt.

Bemerkung 1.11. Seien (X, dX) und (Y, dY ) metrische Raume.1. Jede isometrische Einbettung X −→ Y ist injektiv.2. Eine isometrische Einbettung X −→ Y ist genau dann eine Isometrie, wenn sie

bijektiv ist.

Bemerkung 1.12 (Isometriegruppe). Ist (X, d) ein metrischer Raum, so bildet dieMenge

Isom(X) := {f : X −→ X | f ist eine Isometrie}

bezuglich Komposition von Abbildungen eine Gruppe, die sogenannte Isometriegruppevon X.

Geometrisch interpretiert man Isometrien als”Symmetrien“ von geometrischen Ob-

jekten und Isometriegruppen sind historisch einer der Ursprunge fur den abstraktenGruppenbegriff.

Eine erste Abschwachung des Isometriebegriffs fuhrt zu Lipschitz-Abbildungen:

Definition 1.13 (Lipschitz, kontrahierend). Seien (X, dX) und (Y, dY ) metrischeRaume und sei f : X −→ Y eine Abbildung.

– Eine Zahl L ∈ R≥0 ist eine Lipschitz-Konstante fur f , falls

∀x,x′∈X dY(f(x), f(x′)

)≤ L · dX(x, x′).

– Besitzt f eine Lipschitz-Konstante, so ist f Lipschitz.

6

– Besitzt f eine Lipschitz-Konstante, die echt kleiner als 1 ist, so ist f kontrahie-rend.

Bemerkung 1.14.– Alle Isometrien sind Lipschitz, aber im allgemeinen nicht kontrahierend.– Alle Funktionen in C1([0, 1],R) sind Lipschitz (bezuglich der Standardmetrik

auf [0, 1] bzw. R).

Lasst man nicht nur einen gleichmaßigen multiplikativen Fehler, sondern auch einengleichmaßigen additiven Fehler zu, so gelangt man vom Begriff der Lipschitz-Abbil-dungen zu den sogenannten quasi-isometrischen Einbettungen bzw. Quasi-Isometrien,die in der geometrischen Gruppentheorie eine wichtige Rolle spielen.

Eine weitere Abschwachung ist der Stetigkeitsbegriff – hierbei bleibt nur noch Kon-vergenz erhalten. Wir definieren Stetigkeit genauso wie im Fall von Funktionen vomTyp R −→ R uber die Vertraglichkeit mit Approximation:

Definition 1.15 (stetig). Seien (X, dX) und (Y, dY ) metrische Raume. Eine Abbil-dung f : X −→ Y heißt stetig, wenn folgendes gilt: Fur alle Folgen (an)n∈N in X, diegegen a ∈ X konvergieren, ist (f(an))n∈N in Y konvergent und es gilt

limn→∞

f(an) = f(a).

Bemerkung 1.16.– Fur Funktionen vom Typ X −→ R mit X ⊂ R stimmt dieser Stetigkeitsbegriff

(bezuglich der Standardmetrik) mit dem klassischen Stetigkeitsbegriff uberein.– Alle Lipschitz-Abbildungen sind stetig.

Caveat 1.17. Im allgemeinen sind nicht alle stetigen Abbildungen zwischen metri-schen Raumen Lipschitz!

Wie im klassischen Fall konnen wir stetige Funktionen auch durch das ε-δ-Kriteriumcharaktierisieren:

Proposition 1.18 (ε-δ-Kriterium). Seien (X, dX) und (Y, dY ) metrische Raume.Dann ist eine Abbildung f : X −→ Y genau dann stetig, wenn

∀x∈X ∀ε∈R>0∃δ∈R>0

∀x′∈X(dX(x, x′) < δ =⇒ dY (f(x), f(x′)) < ε

).

Auch andere grundlegende Eigenschaften stetiger Funktionen ubertragen sich aufden Kontext metrischer Raume; wir gehen hier aber nicht genauer darauf ein, da wirdies dann im noch allgemeineren Kontext der topologischen Raume genauer behandelnwerden (s. Kapitel 2).

Der Banachsche Fixpunktsatz

Fixpunktsatze sind ein wichtiges Hilfsmittel, da sie erlauben, auf die Losbarkeit gewis-ser Gleichungen zu schließen; ein grundlegendes Beispiel ist der Banachsche Fixpunkt-satz:

7

Satz 1.19 (Der Banachsche Fixpunktsatz). Sei (X, d) ein nicht-leerer vollstandigermetrischer Raum und sei f : X −→ X eine kontrahierende Abbildung.

1. Dann besitzt f genau einen Fixpunkt x in X.2. Genauer gilt: Sei c ∈ [0, 1) eine Lipschitz-Konstante fur f und sei x0 ∈ X. Sei

(xn)n∈N die induktiv durch xn+1 := f(xn) fur alle n ∈ N definierte Folge in X.Dann gilt fur alle n ∈ N, dass

d(xn, x) ≤ cn

1− c· d(x1, x0).

Man beachte dabei, dass der Banachsche Fixpunktsatz (im Gegensatz zum Brou-werschen Fixpunktsatz) konstruktiv ist und sogar eine Abschatzung angibt, wie weitdie konstruierten Punkte hochstens vom gesuchten Fixpunkt entfernt sind.

Anwendungen des Banachschen Fixpunktsatzes sind zum Beispiel:– Der Banachsche Fixpunktsatz erlaubt es, iterativ approximativ gewissen Glei-

chungen zu losen.– Der Satz uber lokale Umkehrbarkeit von Funktionen in mehreren Variablen

(Satz 3.49).– Der Satz von Picard-Lindelof (Satz 5.5) uber die Existenz und Eindeutigkeit von

Losungen gewisser gewohnlicher Differentialgleichungen.

Normierte Raume

Normierte Raume sind reelle Vektorraume mit einem Langenbegriff, der mit der alge-braischen Struktur vertraglich ist. Aus Normen erhalt man Metriken und somit einegroße und wichtige Klasse von Beispielen metrischer Raume.

Definition 1.20 (normierter Raum). Ein normierter Raum ist ein Paar (V, ‖ · ‖),wobei V ein R-Vektorraum und ‖ · ‖ eine Norm auf V ist, d.h. ‖ · ‖ ist eine Abbildungvom Typ V −→ R≥0 mit folgenden Eigenschaften:

– Fur alle x ∈ V ist genau dann ‖x‖ = 0, wenn x = 0 ist.– Fur alle x ∈ V und alle c ∈ R ist ‖c · x‖ = |c| · ‖x‖.– Dreiecksungleichung. Fur alle x, y ∈ V ist

‖x+ y‖ ≤ ‖x‖+ ‖y‖.

Proposition 1.21 (metrische Raume aus normierten Raumen). Sei (V, ‖ · ‖) ein nor-mierter Raum. Dann ist

V × V −→ R≥0(x, y) 7−→ ‖x− y‖

eine Metrik auf V , die sogenannte von ‖ · ‖ auf V induzierte Metrik.

8

Bemerkung 1.22 (1-Norm/∞-Norm).1. Ist n ∈ N, so sind

‖ · ‖1 : Rn −→ R≥0

x 7−→n∑j=1

|xj |,

‖ · ‖∞ : Rn −→ R≥0x 7−→ max

j∈{1,...,n}|xj |

Normen auf Rn.2. Analog sind auch

‖ · ‖1 : C([0, 1],R) −→ R≥0

f 7−→∫ 1

0

|f |,

‖ · ‖∞ : C([0, 1],R) −→ R≥0f 7−→ sup

x∈[0,1]|f(x)|

Normen auf C([0, 1],R).Konvergenz bezuglich der von der Norm ‖·‖∞ induzierten Metrik auf C([0, 1],R)stimmt mit gleichmaßiger Konvergenz von Funktionen in C([0, 1],R) uberein. Dagleichmaßige Grenzwerte stetiger Funktionen stetig sind, ist C([0, 1],R) bezuglichder von ‖·‖∞ induzierten Metrik vollstandig, und somit ein sogenannter Banach-raum.Der Raum (C([0, 1],R), ‖·‖1) ist jedoch nicht vollstandig; diese Tatsache spielt inder Maßtheorie bei der Konstruktion des Lebesgue-Integrals eine entscheidendeRolle.

3. Ahnlich sind die Abbildungen

‖ · ‖1 : `1 −→ R≥0

(an)n∈N 7−→∞∑n=0

|an|,

‖ · ‖∞ : `∞ −→ R≥0(an)n∈N 7−→ sup

n∈N|an|

Normen auf den R-Vektorraumen

`1 :={

(an)n∈N∣∣ (an)n∈N ist eine Folge in R, fur die

∑∞n=0 |an| konvergiert

}`∞ :=

{(an)n∈N

∣∣ (an)n∈N ist eine beschrankte Folge in R}.

In Anlehnung an den Satz von Pythagoras erhalt man die euklidische Norm bzw.Metrik, die dem Langenbegriff unserer Anschauung in der Ebene R2 bzw. im Raum R3

entspricht:

9

Proposition 1.23 (euklidische Norm/Metrik). Sei n ∈ N. Dann ist

‖ · ‖2 : Rn −→ R≥0

x 7−→

√√√√ n∑j=1

|xj |2

eine Norm auf Rn, die sogenannte euklidische Norm. Die von ‖ · ‖2 auf Rn induzierteMetrik heißt euklidische Metrik.

Um zu zeigen, dass diese Abbildung tatsachlich die Dreiecksungleichung erfulltdruckt man ‖ · ‖2 mit Hilfe des Standardskalarproduktes auf R2 aus und verwendetdann die folgende Abschatzung:

Lemma 1.24 (Cauchy-Schwarzsche Ungleichung). Sei V ein reeller Vektorraum undsei 〈·, ·〉 : V × V −→ R ein Skalarprodukt auf V . Dann gilt fur alle x, y ∈ V , dass

〈x, y〉2 ≤ 〈x, x〉 · 〈y, y〉

bzw. |〈x, y〉| ≤√〈x, x〉 ·

√〈y, y〉. Ist y 6= 0, so gilt genau dann Gleichheit in der obigen

Abschatzung, wenn x = 〈x, y〉/〈y, y〉 · y ist.

Bemerkung 1.25 (2-Norm/p-Norm).1. Analog kann man zeigen, dass

‖ · ‖2 : C([0, 1],R) −→ R≥0

f 7−→

√∫ 1

0

|f |2,

‖ · ‖2 : `2 −→ R≥0

(an)n∈N 7−→

√√√√ ∞∑n=0

|an|2

Normen auf C([0, 1],R2) bzw.

`2 :={

(an)n∈N∣∣ (an)n∈N ist eine Folge in R, fur die

∑∞n=0 |an|2 konvergiert

}sind.

2. Außerdem kann man fur jedes p ∈ R>1 in derselben Art und Weise auf geeignetenRaumen sogenannte p-Normen ‖·‖p :=

”p√∑

| · |p“ definieren; statt der Cauchy-Schwarzschen Ungleichung benotigt man dann die Minkowskische Ungleichung.

Proposition 1.26 (Vollstandigkeit euklidischer Raume). Ist n ∈ N, so ist Rn bezuglichder von der euklidischen Norm induzierten Metrik vollstandig.

10

Korollar 1.27. Insbesondere ist die Betragsfunktion

| · | : C −→ R≥0z 7−→

√(Re z)2 + (Im z)2 =

√z · z

eine Norm auf dem R-Vektorraum C und C ist bezuglich der induzierten Metrik voll-standig.

Bemerkung 1.28. Man kann zeigen, dass alle Normen auf einem endlich-dimensiona-len R-Vektorraum in einem gewissen Sinne aquivalent sind und insbesondere denselbenKonvergenzbegriff liefern (Satz 2.44).

Definition 1.29 (Reihen in normierten Vektorraumen). Sei (V, ‖ · ‖) ein normierterVektorraum und sei (an)n∈N eine Folge in V .

– Die Reihe∑∞n=0 an konvergiert in V bezuglich ‖·‖, wenn die Folge (

∑nk=0 ak)n∈N

der Partialsummen in V bezuglich der von ‖ · ‖ induzierten Metrik konvergiert;in diesem Fall nennt man den Grenzwert auch Wert der Reihe

∑∞n=0 an.

– Ist V ein Banachraum und konvergiert∑∞n=0 ‖an‖ in R, so nennt man

∑∞n∈N an

absolut konvergent.

Die Eigenschaften (absolut) konvergenter Reihen in R ubertragen sich nun mehroder weniger wortlich auf Reihen in (vollstandigen) normierten Raumen.

Bemerkung 1.30 (komplexe Exponentialfunktion). Analog zur reellen Exponential-funktion definiert man die komplexe Exponentialfunktion

exp: C −→ C

z 7−→∞∑n=0

zn

n!

(dass die Exponentialreihe auf ganz C (absolut) konvergiert, folgt mit denselben Ar-gumenten wie im reellen Fall). Außerdem zeigen Argumente analog zum reellen Fall,dass

exp(x+ y) = exp(x) · exp(y)

fur alle x, y ∈ C gilt. Zusammen mit der Beobachtung, dass fur alle x ∈ R die Bezie-hungen

cosx = Re(exp(i · x)

)und sinx = Im

(exp(i · x)

)gelten, erhalt man daraus die Additionstheoreme fur Sinus bzw. Kosinus und Periodi-zitatsaussagen.

Zum Abschluss geben wir noch eine Charakterisierung fur Stetigkeit von linearenAbbildungen zwischen normierten Raumen:

Satz 1.31 (Stetigkeit und Beschranktheit). Seien (V, ‖·‖V ) und (W, ‖·‖W ) normierteVektorraume und sei f : V −→W eine lineare Abbildung. Dann sind aquivalent:

11

1. Die Abbildung f : V −→ W ist bezuglich den von den Normen induzierten Me-triken stetig.

2. Die Abbildung f : V −→W ist beschrankt in dem Sinne, dass{‖f(x)‖W

∣∣ x ∈ V, ‖x‖V ≤ 1}

in R beschrankt ist; in diesem Fall heißt

‖f‖ := sup{‖f(x)‖W

∣∣ x ∈ V, ‖x‖V ≤ 1}

Norm von f .

Die Funktionalanalysis beschaftigt sich systematisch mit (unendlich-dimensionalen)normierten Vektorraumen und stetigen linearen Abbildungen dazwischen.

12

2 Topologische Grundlagen

Im vorigen Kapitel haben wir Konvergenz und Stetigkeit auf metrische Raume ver-allgemeinert. Wir werden nun einen weiteren Abstraktionsschritt in Angriff nehmen –den Schritt zu den topologischen Raumen:

Wahrend man in metrischen Raumen einen quantitativen Begriff von Nahe hat(namlich durch die Metrik), schwacht man diesen fur topologische Raume zu einemqualitativen Begriff von Nahe ab. Anschaulich gesprochen erhalt man so eine ArtGeometrie, die ohne Begriffe wie Lange und Winkel auskommt und die

”prinzipielle“

Form von Objekten beschreibt.Es wird sich herausstellen, dass sich mit dieser Abstraktion der Stetigkeitsbegriff

und damit zusammenhangende Konzepte wie zum Beispiel Kompaktheit eleganter undeffizienter formalisieren lasst.

Topologische Raume

Die Grundidee topologischer Raume ist, Nahe nicht durch Abstande, sondern durchSysteme von Teilmengen auszudrucken – den sogenannten offenen Mengen:

Definition 2.1 (topologischer Raum, Topologie). Ein topologischer Raum ist einPaar (X,T ), wobei X eine Menge und T eine Topologie auf X ist, d.h. T ist eineTeilmenge von P (X) mit folgenden Eigenschaften:

– Es ist ∅ ∈ T und X ∈ T .– Ist U ⊂ T , so ist

⋃U ∈ T .

– Ist U ⊂ T endlich, so ist⋂U ∈ T .

Die Elemente von T heißen offene Mengen (bezuglich T ); ist A ⊂ X und X \ A ∈ T ,so heißt A abgeschlossen (bezuglich T ).

Warum man gerade diese Axiome fur offene Mengen betrachtet, kann man gut an-hand des Beispiels metrischer Raume illustrieren:

Proposition 2.2 (die von einer Metrik induzierte Topologie). Sei (X, d) ein metri-scher Raum. Dann ist

T :={U ⊂ X

∣∣ ∀x∈U ∃ε∈R>0U(x, ε) ⊂ U

}eine Topologie auf X. Man nennt T die von d auf X induzierte Topologie.

Bemerkung 2.3.– Der Begriff offener Mengen bezuglich der Standardmetrik auf R stimmt also mit

dem Begriff aus der Analysis I uberein.– Die von der euklidischen Metrik auf Rn induzierte Topologie auf Rn heißt Stan-

dardtopologie auf Rn.– Ist (X, d) ein metrischer Raum, ist x ∈ X und ist ε ∈ R>0, so ist U(x, ε) in X

offen. D.h. offene Balle sind tatsachlich offene Mengen bezuglich der von derMetrik induzierten Topologie.

13

– Analog zum Fall von Teilmengen von R kann Abgeschlossenheit in metrischenRaumen auch durch Konvergenz von Folgen ausgedruckt werden. Daraus folgt,dass abgeschlossene Balle tatsachlich bezuglich der von der Metrik induziertenTopologie abgeschlossen sind.

Caveat 2.4. Nicht jeder topologische Raum ist metrisierbar! (Korollar 2.28).

Bemerkung 2.5 (Klumpentopologie, diskrete Topologie). Sei X eine Menge.– Dann ist {∅, X} eine Topologie auf X, die sogenannte Klumpentopologie auf X.– Außerdem ist P (X) eine Topologie auf X, die sogenannte diskrete Topologie

auf X; iese stimmt mit der von der diskreten Metrik induzierten Topologie ube-rein.

Zwei elementare Konstruktionen topologischer Raume sind Teilraume und Produkte:

Bemerkung 2.6 (Teilraumtopologie). Sei (X,T ) ein topologischer Raum und Y ⊂ X.Dann ist

{U ∩ Y | U ∈ T}

eine Topologie auf Y , die sogenannte Teilraumtopologie. Ist T auf X von einer Metrik dauf X induziert, so stimmt die Teilraumtopologie auf Y mit der von d auf Y induziertenMetrik induzierten Topologie uberein.

Bemerkung 2.7 (Produkttopologie). Seien (X,TX) und (Y, TY ) topologische Raume.Dann ist {

U ⊂ X × Y∣∣ ∀x∈U ∃UX∈TX

∃UY ∈TYx ∈ UX × UY ⊂ U

}eine Topologie auf X × Y , die sogenannte Produkttopologie.

Die Standardtopologie auf R2 = R× R stimmt dabei mit der Produkttopologie derStandardtopologie auf R uberein.

Außerdem ist es oft nutzlich, die folgenden Begriffe zur Verfugung zu haben:

Definition 2.8 ((offene) Umgebung). Sei (X,T ) ein topologischer Raum und x ∈ X.– Eine Teilmenge U ⊂ X ist eine offene Umgebung von x, wenn U offen ist undx ∈ U ist.

– Eine Teilmenge U ⊂ X ist eine Umgebung von x, wenn es eine offene Umge-bung V ⊂ X von x mit V ⊂ U gibt.

Definition 2.9 (Abschluss, Inneres, Rand). Sei (X,T ) ein topologischer Raum undsei Y ⊂ X.

– Das Innere von Y ist

Y ◦ :=⋃{U | U ∈ T und U ⊂ Y }.

D.h. Y ◦ ist die (bezuglich Inklusion) großte in X offene Menge, die in Y enthaltenist.

14

– Der Abschluss von Y ist

Y :=⋂{A | X \A ∈ T und Y ⊂ A}.

D.h. Y ist die (bezuglich Inklusion) kleinste in X abgeschlossene Menge, die Yenthalt.

– Der Rand von Y ist∂Y := Y ∩ (X \ Y ).

Stetige Abbildungen

Wir haben bereits gesehen, dass fur Abbildungen vom Typ X −→ R mit X ⊂ R(Folgen)Stetigkeit bzw. das ε-δ-Kriterium dazu aquivalent sind, dass Urbilder offenerMengen offen sind. Im Kontext topologischer Raume machen die ersten beiden For-mulierungen im allgemeinen keinen Sinn (da die Topologie im allgemeinen nicht voneiner Metrik induziert wird), letztere kann aber formuliert werden und wird daherals Definition fur Stetigkeit verwendet. Stetige Abbildungen spielen also die Rolle derstrukturvertraglichen Abbildungen in der Welt der topologischen Raume:

Definition 2.10 (stetig). Seien (X,TX) und (Y, TY ) topologische Raume. Eine Ab-bildung f : X −→ Y ist stetig (bezuglich TX und TY ), wenn

∀U∈TYf−1(U) ∈ TX ,

d.h., wenn Urbilder offener Mengen offen sind.

Bemerkung 2.11.– Fur Abbildungen vom Typ X −→ R mit X ⊂ R stimmt dieser Begriff von

Stetigkeit mit dem aus der Analysis I uberein.– Dasselbe Argument uber das ε-δ-Kriterium zeigt: Fur Abbildungen zwischen

metrischen Raumen stimmt dieser Begriff von Stetigkeit mit dem bereits zuvordefinierten uberein.

– Sei X eine Menge und seien T bzw. T ′ Topologien auf X. Dann ist die IdentitatidX : (X,T ) −→ (X,T ′) genau dann stetig, wenn T ′ ⊂ T ist, d.h. wenn T ′ groberals T ist.

– Die Abbildungen +, ·,− : R2 −→ R und / : R × (R \ {0}) −→ R sind bezuglichder Standardtopologie stetig.

– Ist (X,T ) ein topologischer Raum und Y ⊂ X, so ist die Inklusion Y ↪→ Xbezuglich der Teilraumtopologie auf Y stetig.

– Konstante Abbildungen sind stetig.

Proposition 2.12 (Vererbungseigenschaften stetiger Abbildungen). Seien (X,TX),(Y, TY ) und (Z, TZ) topologische Raume und seien f : X −→ Y und g : Y −→ ZAbbildungen.

1. Sind f und g stetig, so ist auch g ◦ f : X −→ Z stetig.2. Ist f stetig und ist A ⊂ X, so ist auch die Einschrankung f |A : A −→ Y stetig

(bezuglich der Teilraumtopologie auf A).

15

3. Die Abbildung f : X −→ Y ist genau dann stetig, wenn f : X −→ f(X) bezuglichder Teilraumtopologie auf f(X) stetig ist.

Proposition 2.13 (Verkleben stetiger Funktionen). Seien (X,TX) und (Y, TY ) topo-logische Raume, seien A,B ⊂ X abgeschlossene Teilmengen mit A∪B = X und seienf : A −→ Y und g : B −→ Y stetige Abbildungen (bezuglich der Teilraumtopologieauf A bzw. B) mit f |A∩B = g|A∩B. Dann ist die (wohldefinierte) Abbildung

f ∪A∩B g : X −→ Y

x 7−→

{f(x) falls x ∈ A,g(x) falls x ∈ B

stetig.

Der Isomorphiebegriff in der Kategorie der topologischen Raume ist Homoomorphie:

Definition 2.14 (Homoomorphismus). Seien (X,TX) und (Y, TY ) topologische Raume.Eine Abbildung f : X −→ Y ist ein Homoomorphismus, wenn sie stetig ist und es einestetige Abbildung g : Y −→ X mit g ◦ f = idX und f ◦ g = idY gibt. Falls es einenHomoomorphismus X −→ Y gibt, heißen X und Y homoomorph.

Caveat 2.15. Nicht jede stetige bijektive Abbildung ist ein Homoomorphismus!

Anschaulich gesprochen sind topologische Raume genau dann homoomorph, wennman sie durch

”verbiegen“ und

”aufblasen/schrumpfen“ ineinander uberfuhren kann,

ohne zu”schneiden“ oder zu

”kleben“.

Im allgemeinen ist es nicht leicht bzw. sogar nicht moglich zu entscheiden, ob zweigegebene topologische Raume homoomorph sind oder nicht – da es im allgemeinensehr viele stetige Abbildungen gibt. In der algebraischen Topologie studiert man alge-braische Invarianten, um Probleme dieser Art (partiell) zu losen.

Zum Abschluss dieses allgemeinen Abschnitts uber stetige Abbildungen geben wirnoch ein Beispiel fur die allgemeine Strategie, Objekte durch ihre strukturerhaltendenMorphismen zu charakterisieren statt durch ihre

”Punkte“:

Proposition 2.16 (universelle Eigenschaft der Produkttopologie). Seien (X,TX) und(Y, TY ) topologische Raume und seien πX : X × Y −→ X bzw. πY : X × Y −→ Ydie Projektionsabbildungen. Ist (Z, TZ) ein weiterer topologischer Raum, so ist eineAbbildung f : Z −→ X ×Y genau dann stetig, wenn die Abbildungen πX ◦ f : Z −→ Xund πY ◦ f : Z −→ Y stetig sind.

Bemerkung 2.17 (universelle Eigenschaften).– Analog kann man Produkte beliebig vieler topologischer Raume durch die ana-

loge universelle Eigenschaft charakterisieren.– Die universelle Eigenschaft der Produkttopologie ist das topologische Analogon

der universellen Eigenschaft von Produkten (nicht Summen!) von Vektorraumen,Gruppen, . . .

– Ahnlich kann man auch andere Konstruktionen topologischer Raume durch ent-sprechende universelle Eigenschaften charakterisieren (z.B. das Verkleben topo-logischer Raume, was durch Summen bzw. Quotienten modelliert wird).

16

(Weg)Zusammenhang

Einer der zentralen Satze uber stetige Funktionen vom Typ [0, 1] −→ R ist der Zwi-schenwertsatz. Im allgemeineren Kontext der topologischen Raume kann man diesesPhanomen durch die Begriffe Wegzusammenhang und Zusammenhang beschreiben.

Definition 2.18 (Weg, wegzusammenhangend). Sei (X,T ) ein topologischer Raum.– Ein Weg in X ist eine stetige Abbildung γ : [0, 1] −→ X (bezuglich der Standard-

topologie auf [0, 1] ⊂ R). Man nennt γ(0) den Startpunkt und γ(1) den Endpunktvon γ. Der Weg γ heißt geschlossen, wenn γ(0) = γ(1) ist.

– Der Raum X ist wegzusammenhangend, wenn folgendes gilt: Fur alle x, y ∈ Xgibt es einen Weg γ : [0, 1] −→ X mit γ(0) = x und γ(1) = y.

Bemerkung 2.19.– Das Einheitsintervall ist (bezuglich der Standardtopologie) wegzusammenhangend.– Ist n ∈ N, so ist Rn wegzusammenhangend (bezuglich der Standardtopologie).– Ist X eine Menge mit |X| ≥ 2, so ist X bezuglich der diskreten Topologie nicht

wegzusammenhangend.

Proposition 2.20 (Stetigkeit und Wegzusammenhang). Seien (X,TX) und (Y, TY )topologische Raume und sei f : X −→ Y stetig. Ist X wegzusammenhangend, so istauch f(X) bezuglich der Teilraumtopologie wegzusammenhangend.

Insbesondere gilt: Sind X und Y homoomorph, so ist X genau dann wegzusam-menhangend, wenn Y wegzusammenhangend ist. Mit anderen Worten: Wegzusammen-hang ist eine topologische Invariante.

Zum Beispiel kann man diese Eigenschaft (und einen kleinen Trick) verwenden, umzu zeigen, dass R nur dann zu Rn homoomorph ist (bezuglich der Standardtopologie),wenn n = 1 ist.

Eine Abschwachung des Wegzusammenhangsbegriffs ist Zusammenhang:

Definition 2.21 (zusammenhangend). Ein topologischer Raum (X,TX) ist zusam-menhangend, wenn folgendes gilt: Fur alle U, V ∈ TX mit U ∩ V = ∅ und U ∪ V = Xist bereits U = ∅ oder V = ∅. (D.h. X lasst sich nur trivial in offene Mengen zerlegen).

Bemerkung 2.22. Das Einheitsintervall [0, 1] ist bezuglich der Standardtopologiezusammenhangend.

Proposition 2.23 (Wegzusammenhang impliziert Zusammenhang). Jeder wegzusam-menhangende topologische Raum ist zusammenhangend.

Caveat 2.24. Es gibt topologische Raume, die zusammenhangend, aber nicht weg-zusammenhangend sind!

In diesem allgemeinen Kontext lautet der verallgemeinerte Zwischenwertsatz nunwie folgt:

Proposition 2.25 (Verallgemeinerter Zwischenwertsatz). Seien (X,TX) und (Y, TY )topologische Raume und sei f : X −→ Y stetig. Ist X zusammenhangend, so ist auchf(X) zusammenhangend (bezuglich der Teilraumtopologie).

17

Insbesondere: Sind X und Y homoomorph, so ist X genau dann zusammenhangend,wenn Y zusammenhangend ist. Mit anderen Worten: Zusammenhang ist eine topolo-gische Invariante.

Hausdorffraume

Die Klumpentopologie zeigt bereits, dass es viele exotische und unintuitive Topologiengibt. Daher gibt es viele Begriffe fur topologische Raume, die sicherstellen, dass Raumehinreichend gutartig sind. Ein Beispiel ist der folgende Begriff, der zu den sogenanntenTrennungseigenschaften gehort:

Definition 2.26 (hausdorffsch). Ein topologischer Raum (X,T ) ist hausdorffsch,wenn folgendes gilt: Fur alle x, y ∈ X mit x 6= y existieren offene Mengen U, V ⊂ Xmit x ∈ U , y ∈ V und U ∩ V = ∅. (D.h. je zwei Punkte konnen durch offene Mengengetrennt werden.)

Proposition 2.27 (metrische Raume sind hausdorffsch). Ist (X, d) ein metrischerRaum, so ist X bezuglich der von der Metrik d auf X induzierten Topologie haus-dorffsch.

Korollar 2.28. Sei X eine Menge mit |X| ≥ 2. Dann gibt es keine Metrik auf X, diedie Klumpentopologie auf X induziert.

Bemerkung 2.29. Sind (X,TX) und (Y, TY ) homoomorphe topologische Raume, soist X genau dann hausdorffsch, wenn Y hausdorffsch ist.

Es gibt noch weitere Trennungseignschaften topologischer Raume, sowie sogenannteAbzahlbarkeitseigenschaften; die Zusammenhange zwischen diesen Begriffen sind et-was unubersichtlich und konnen gut in dem Buch Counterexamples in Topology vonL.A. Steen und J.A. Seebach Jr nachgelesen werden.

Kompaktheit

Einer der wichtigsten und nutzlichsten topologischen Begriffe ist Kompaktheit; grobgesprochen ist Kompaktheit eine Art topologische Endlichkeitsbedingung. Wir begin-nen mit der abstrakten Definition als Endlichkeitsbedingung von Uberdeckungen undzeigen spater, dass dieser Begriff den bisherigen Kompaktheitsbegriff in R verallgemei-nert (Satz 2.38).

Definition 2.30 (kompakt). Ein topologischer Raum (X,T ) ist kompakt, wenn jedeoffene Uberdeckung von X eine endliche Teiluberdeckung enthalt, d.h., wenn folgendesgilt: Fur alle U ⊂ T mit

⋃U = X gibt es eine endliche Teilmenge V ⊂ U mit

⋃V = X.

Bemerkung 2.31. Sei X eine Menge. Dann ist X bezuglich der Klumpentopologiekompakt. Außerdem ist X genau dann bezuglich der diskreten Topologie kompakt,wenn X endlich ist.

Wir werden spater eine Charakterisierung kompakter Mengen in Rn geben undzunachst allgemeine Eigenschaften kompakter Mengen aus der Definition ableiten:

18

Proposition 2.32 (Verallgemeinertes Extremalprinzip). Seien (X,TX) und (Y, TY )topologische Raume und sei f : X −→ Y stetig. Ist X kompakt, so ist auch f(X)kompakt (bezuglich der Teilraumtopologie).

Korollar 2.33 (Kompaktheit ist eine topologische Invariante). Insbesondere gilt: Sind(X,TX) und (Y, TY ) homoomorphe topologische Raume, so ist X genau dann kompakt,wenn Y kompakt ist.

Proposition 2.34 (Abgeschlossenheit und Kompaktheit). Sei (X,T ) ein topologi-scher Raum und sei Y ⊂ X.

1. Ist X kompakt und Y in X abgeschlossen, so ist Y bezuglich der Teilraumtopo-logie kompakt.

2. Ist X hausdorffsch und Y bezuglich der Teilraumtopologie kompakt, so ist Y in Xabgeschlossen.

Korollar 2.35. Sei (X,TX) ein kompakter topologischer Raum, sei (Y, TY ) ein Haus-dorffraum und sei f : X −→ Y stetig und bijektiv. Dann ist f bereits ein Homoomor-phismus(!).

Zum Abschluss des Abschnitts uber allgemeine Kompaktheitseigenschaften betrach-ten wir noch die Vertraglichkeit von Kompaktheit mit Produkten:

Proposition 2.36 (Produkt zweier kompakter Raume). Seien (X,TX) und (Y, TY )kompakte topologische Raume. Dann ist das Produkt X × Y bezuglich der Produktto-pologie kompakt.

Bemerkung 2.37 (Satz von Tychonoff). Der Satz von Tychnoff

Beliebige (auch unendliche!) Produkte kompakter topologischer Raume sind kom-pakt.

ist aquivalent zum Auswahlaxiom (!), und damit auch aquivalent zum Zornschen Lem-ma bzw. dem Wohlordnungssatz.

Der Satz von Heine-Borel

Unser nachstes Ziel ist es, eine einfache Charakterisierung kompakter Mengen im eu-klidischen Raum Rn zu geben:

Satz 2.38 (Satz von Heine-Borel). Sei n ∈ N und sei A ⊂ Rn. Wir betrachten auf Adie von der Standardtopologie auf Rn induzierte Teilraumtopologie. Dann sind die fol-genden Aussagen aquivalent:

1. Die Menge A ist kompakt.2. Die Menge A ist in Rn bezuglich der euklidischen Metrik beschrankt und abge-

schlossen.3. Die Menge A ist bezuglich der euklidischen Metrik folgenkompakt, d.h. jede Folge

in A besitzt eine bezuglich der euklidischen Metrik konvergente Teilfolge, derenGrenzwert auch in A liegt.

Der Beweis der Implikation”1. =⇒ 2.“ beruht auf der folgenden Beobachtung:

19

Proposition 2.39. Kompakte Mengen in metrischen Raumen sind beschrankt undabgeschlossen.

Caveat 2.40. Die Umkehrung der obigen Proposition gilt im allgemeinen nicht ! D.h.es gibt beschrankte und abgeschlossene Mengen in gewissen (sogar vollstandigen)metrischen Raumen, die nicht kompakt sind (zum Beispiel sind unendliche Mengenbezuglich der diskreten Metrik in sich selbst beschrankt und abgeschlossen, aber nichtkompakt).

Der Beweis der Implikation”2. =⇒ 3.“ ist eine einfache Verallgemeinerung des Satzes

von Bolzano-Weierstraß.Der Beweis der Implikation

”3. =⇒ 1.“ beruht darauf, dass Rn das sogenannte zweite

Abzahlbarkeitsaxiom erfullt und auf der folgenden Variante des Intervallschachtelungs-prinzips:

Proposition 2.41 (Intervallschachtelung in folgenkompakten metrischen Raumen).Sei (X, d) ein folgenkompakter metrischer Raum und sei (An)n∈N eine Folge nicht-leerer abgeschlossener Teilmengen von X mit der Eigenschaft, dass An+1 ⊂ An furalle n ∈ N erfullt ist. Dann ist der Durchschnitt

⋃n∈NAn nicht leer.

Korollar 2.42. Der allgemeine Kompaktheitsbegriff stimmt fur Teilmengen von R mitdem Folgenkompaktheitsbegriff (bezuglich der Standardmetrik) uberein.

Insbesondere ist nach dem Satz von Heine-Borel jede kompakte Teilmenge von Rbeschrankt und abgeschlossen und besitzt somit (falls sie nicht-leer ist) ein Minimumund ein Maximum. Damit folgt aus dem verallgemeinerten Extremalprinzip:

Korollar 2.43 (Verallgemeinertes Extremalprinzip fur reellwertige Funktionen). Sei(X,T ) ein kompakter topologischer Raum und sei f : X −→ R stetig (bezuglich derStandardtopologie auf R).

1. Dann ist f(X) ⊂ R kompakt, und damit insbesondere beschrankt und abgeschlos-sen.

2. Insbesondere gilt: Ist X 6= ∅, so nimmt f auf X Minimum und Maximum an,d.h. es existieren x−, x+ ∈ X mit

∀x∈X f(x−) ≤ f(x) ≤ f(x+).

Außerdem liefert der Satz von Heine-Borel einen eleganten Beweis fur die Tatsache,dass alle Normen auf einem gegebenen endlich-dimensionalen R-Vektorraum aquivalentsind:

Satz 2.44 (Aquivalenz von Normen auf Rn). Sei n ∈ N und seien ‖ · ‖ und ‖ · ‖′Normen auf Rn. Dann sind ‖ · ‖ und ‖ · ‖′ im folgenden Sinne aquivalent: Es existiertein c ∈ R>0 mit

∀x∈Rn

1

c· ‖x‖′ ≤ ‖x‖ ≤ c · ‖x‖′.

Insbesondere induzieren ‖ · ‖ und ‖ · ‖′ dieselbe Topologie auf Rn.

20

Korollar 2.45. Seien (V, ‖ · ‖V ) und (W, ‖ · ‖W ) normierte Vektorraume und seif : V −→W linear. Ist V endlich-dimensional, so ist f stetig.

Caveat 2.46. Auf unendlich-dimensionalen R-Vektorraumen sind nicht alle Normenaquivalent!

21

3 Mehrdimensionale Analysis – Differenzierbarkeit

Funktionen vom Typ Rn −→ Rm treten in den Anwendungen haufig auf, z.B. bei derModellierung der Bewegung eines Objekts im euklidischen Raum, bei der Modellierungvon Hohenprofilen oder bei der Modellierung von (Magnet)Feldern.

Wir suchen eine lokale Beschreibung von Funktionen vom Typ Rn −→ Rm durchmoglichst einfache (d.h. lineare) Abbildungen bzw. wir mochten verstehen, fur welcheFunktionen eine solche lokale Beschreibung moglich ist.

Dies fuhrt zum Begriff der (totalen) Differenzierbarkeit und der Ableitung.Allerdings ist die mehrdimensionale Theorie etwas vielfaltiger als die der differen-

zierbaren Funktionen vom Typ R −→ R, da es viele verschiedene interessante undauch fur die Anwendungen wichtige Differentialoperatoren gibt.

Wir beginnen mit der Entwicklung der Theorie analog zum eindimensionalen Fall,leiten erste Vererbungseigenschaften her, und untersuchen dann, inwieweit sich mehrdi-mensionale Differenzierbarkeit in viele eindimensionale Probleme ubersetzen lasst (waszur partiellen Differenzierbarkeit fuhrt). Außerdem betrachten wir wie im eindimensio-nalen Fall Optimierungsprobleme als Anwendung der Differentialrechnung. Langfristigerhalten wir dadurch die Werkzeuge, die notig sind, um Kurven und hoherdimensionalegeometrische Objekte wie Flachen etc. besser zu verstehen.

Notation 3.1. Seien n,m ∈ N.– Im folgenden sind Elemente von Rn immer als Spaltenvektoren zu verstehen.– Wir schreiben L(Rn,Rm) fur die Menge der R-linearen Abbildungen Rn −→ Rm.– Die Standardbasis von Rn bezeichnen wir mit (e1, . . . , en).

Totale Differenzierbarkeit

Analog zum eindimensionalen Fall nennen wir eine Funktion vom Typ Rn −→ Rm(total) differenzierbar, wenn sie sich lokal gut durch eine lineare Abbildung beschreibenlasst:

Definition 3.2 ((total) differenzierbar, Ableitung). Seien n,m ∈ N, sei X ⊂ Rn offenund sei f : X −→ Rm eine Abbildung.

– Sei x ∈ X. Dann ist f in x (total) differenzierbar, wenn es eine lineare Abbil-dung A ∈ L(Rn,Rm) mit folgender Eigenschaft gibt: es gibt eine offene Umge-bung U ⊂ Rn um 0 mit x+ U ⊂ X und eine Abbildung E : U −→ Rm mit

∀h∈U f(x+ h) = f(x) +A(h) + E(h)

und (bezuglich der euklidischen Metrik)

limU\{0}3h→0

1

‖h‖2· E(h) = 0.

Man kann zeigen, dass A in diesem Fall eindeutig bestimmt ist, und wir nennen

f ′(x) := A ∈ L(Rn,Rm)

die Ableitung von f in x.

22

– Die Abbildung f : X −→ Rm ist auf X differenzierbar, wenn f in jedem Punktvon X differenzierbar ist.

Im pathologischen Fall, dass der Startraum R0 ist, sind alle Funktionen R0 −→ Rmdifferenzierbar und die Ableitung im Punkt 0 ∈ R0 ist 0 ∈ L(R0,Rm).

Bemerkung 3.3 (Ableitungen von Abbildungen vom Typ R −→ R). Im Falle vondifferenzierbaren Abbildungen f : X −→ R, wobei X ⊂ R offen ist, verwenden wir dieIdentifikation

L(R,R)←→ Rg 7−→ g(x)

(x 7→ a · x)←− [ a

und fassen so zu x ∈ X die Ableitung f ′(x) ∈ L(R,R) als reelle Zahl auf. Diese stimmtdann mit der gewohnlichen Ableitung im eindimensionalen Fall uberein.

Fur die Ableitung f ′(x) gibt es viele weitere gebrauchliche Notationen, z.B. Df(x),df(x), . . .

Bemerkung 3.4 (Lokalitat von Differenzierbarkeit). Aus der Definition bzw. derWohldefiniertheit folgt, dass Differenzierbarkeit eine lokale Eigenschaft ist: Sei X ⊂ Rnoffen und sei f : X −→ Rm eine Abbildung. Ist x ∈ X und ist U ⊂ X eine offeneUmgebung von x, so ist f genau dann in x differenzierbar, wenn f |U : U −→ Rm in xdifferenzierbar ist; und es gilt im differenzierbaren Fall, dass

f ′(x) = (f |U )′(x) ∈ L(Rn,Rm).

Caveat 3.5 (Differentialquotient). Da es in Rn im allgemeinen keine vernunftige Di-visionsoperation gibt, gibt es auch keine offensichtliche Beschreibung der Ableitung alsDifferentialquotient.

Proposition 3.6 (Differenzierbarkeit impliziert Stetigkeit). Sei X ⊂ Rn offen, seix ∈ X und sei f : X −→ Rm in x differenzierbar. Dann ist f auch in x stetig (bezuglichder euklidischen Metrik).

Den Beweis dieser Proposition kann man analog zum eindimensionalen Fall fuhren,indem man das folgenden Ubersetzungsprinzip anwendet:

R −→ R allgemeiner Fall Rn −→ Rm

1h

1‖h‖2

f ′(x) · h(f ′(x)

)(h)

Stetigkeit der Skalarmultiplikation Stetigkeit von f ′(x) : Rn −→ Rm

Caveat 3.7. Die Umkehrung gilt im allgemeinen nicht, d.h. nicht jede stetige Funk-tion Rn −→ Rm ist bereits differenzierbar.

23

Caveat 3.8 (komplexe Differenzierbarkeit). Komplexe Differenzierbarkeit von Funk-tionen C −→ C kann uber den komplexen Differentialquotient definiert werden undist nicht dasselbe wie (reelle) Differenzierbarkeit von Funktionen R2 −→ R2. Die Ei-genschaften von komplex differenzierbaren Funktionen sind der Gegenstand der soge-nannten Funktionentheorie.

Grundlegende Vererbungseigenschaften von Differenzierbarkeit

Analog zum eindimensionalen Fall gelten auch im mehrdimensionalen entsprechendeVererbungseigenschaften:

Proposition 3.9 (Linearitat von Differenzierbarkeit). Sei X ⊂ Rn offen, sei x ∈X, seien f, g : X −→ Rm in x differenzierbar, und seien a, b ∈ R. Dann ist aucha · f + b · g : X −→ Rm in x differenzierbar und es gilt

(a · f + b · g)′(x) = a · f ′(x) + b · g′(x) ∈ L(Rn,Rm).

Proposition 3.10 (Kettenregel). Seien X ⊂ Rn und Y ⊂ Rm offene Mengen undseien f : X −→ Y ⊂ Rm und g : Y −→ Rk Abbildungen. Außerdem sei x ∈ X. Istf in x differenzierbar und ist g in f(x) differenzierbar, so ist g ◦ f : X −→ Rk in xdifferenzierbar und es gilt

(g ◦ f)′(x) = g′(f(x)) ◦ f ′(x) ∈ L(Rn,Rk).

Mit Hilfe der Kettenregel und der Tatsache, dass lineare Isomorphismen die Dimen-sion erhalten, folgt die Invarianz der Dimension unter Diffeomorphismen:

Definition 3.11 (Diffeomorphismus). Seien n,m ∈ N und seien X ⊂ Rn und Y ⊂ Rmoffen. Eine Abbildung f : X −→ Y ⊂ Rm ist ein Diffeomorphismus, wenn f auf Xdifferenzierbar ist und es eine differenzierbare Abbildung g : Y −→ X ⊂ Rn mit

g ◦ f = idX und f ◦ g = idY

gibt. Falls es einen Diffeomorphismus X −→ Y gibt, so sind X und Y diffeomorph.

Caveat 3.12. Nicht jede bijektive differenzierbare Abbildung ist ein Diffeomorphis-mus!

Je nach Situation/Literatur kann der Begriff des Diffeomorphismus auch starkereDifferenzierbarkeitsbedingungen enthalten als in obiger Definition.

Korollar 3.13 (Invarianz der Dimension). Seien m,n ∈ N und seien X ⊂ Rn undY ⊂ Rm nicht-leere offene Mengen.

1. Ist x ∈ X und f : X −→ Y ein Diffeomorphismus, so ist f ′(x) ∈ L(Rn,Rm) eineinvertierbare lineare Abbildung.

2. Insbesondere: Sind X und Y diffeomorph, so ist n = m.

Weitere Vererbungseigenschaften von Differenzierbarkeit und lokale Umkehrbarkeits-kriterien werden wir spater kennenlernen.

24

Partielle Differenzierbarkeit

Bisher haben wir außer der Definition und den ersten Vererbungseigenschaften nochkeine praktikablen Kriterien um festzustellen, ob eine Funktion Rn −→ Rm differen-zierbar ist, oder gar die Ableitung in einem Punkt zu bestimmen. Wir werden imfolgenden untersuchen, inwiefern man dieses mehrdimensionale Problem durch (viele)eindimensionale Probleme ersetzen kann. Dazu fuhren wir Richtungsableitungen undpartielle Differenzierbarkeit ein:

Definition 3.14 (Richtungsableitung, partielle Ableitung). Sei X ⊂ Rn offen und seif : X −→ R eine Abbildung. Sei x ∈ X.

– Sei v ∈ Rn \ {0}. Dann ist f in x in Richtung v (partiell) differenzierbar, wennes ein ε ∈ R>0 gibt mit U(x, ε/‖v‖2) ⊂ X, so dass

(−ε, ε) −→ Rt 7−→ f(x+ t · v)

in 0 differenzierbar ist. Die Ableitung dieser Funktion in 0 wir dann mit ∂vf(x) ∈R bezeichnet und heißt Richtungsableitung von f in x in Richtung v.

– Sei j ∈ {1, . . . , n}. Dann ist f in x in Richtung des j-ten Einheitsvektors parti-ell differenzierbar, wenn die Richtungsableitung ∂ejf(x) existiert. Wir schreibendann kurz

∂jf(x) := ∂ejf(x) ∈ R.

– Ist f in x in Richtung aller n Einheitsvektoren partiell differenzierbar, so ist fin x partiell differenzierbar.

Eine Abbildung g : X −→ Rm ist in x partiell differenzierbar, wenn alle m Koordina-tenfunktionen g1, . . . , gm : X −→ R von g in x partiell differenzierbar sind.

Caveat 3.15 (Notation partieller Ableitungen). Oft wird fur die partiellen Ableitun-gen ∂jf(x) auch die Notation ∂

∂xjf(x) verwendet; letztere Notation beruht jedoch auf

einer impliziten Namensgebung der Variablen(!) und kann daher zu Missverstandnissenfuhren; zum Beispiel ist nicht klar, was

∂x1f(x2, x

21)

bedeutet . . .

Caveat 3.16 (partielle vs. totale Differenzierbarkeit). Partiell differenzierbare Funk-tionen sind im allgemeinen nicht total differenzierbar. Im allgemeinen genugt auch dieExistenz aller Richtungsableitungen nicht !

Umgekehrt ist jedoch jede differenzierbare Funktion partiell differenzierbar und mankann die Ableitung mit Hilfe der partiellen Ableitungen beschreiben:

25

Definition 3.17 (Jacobi-Matrix). Sei X ⊂ Rn offen, sei x ∈ X und sei f : X −→ Rmin x partiell differenzierbar. Dann ist

Jf(x) :=

∂1f1(x) . . . ∂nf1(x)...

. . ....

∂1fm(x) . . . ∂nfm(x)

∈ Rm×n

die Jacobi-Matrix von f in x; hierbei bezeichnen f1, . . . , fm : X −→ R die Komponen-ten von f und Rm×n ist die Menge der reellen m× n-Matrizen.

Satz 3.18 (Ableitung und Jacobi-Matrix). Sei X ⊂ Rn offen, sei x ∈ X und seif : X −→ Rm in x differenzierbar. Dann ist f in x partiell differenzierbar und f ′(x)ist die lineare Abbildung, die bezuglich der Standardbasis von Rn bzw. Rm durch dieJacobi-Matrix Jf(x) dargestellt wird, d.h.

f ′(x) =

(Rn −→ Rmh 7−→ Jf(x) · h

)∈ L(Rn,Rm).

Wir geben nun noch ein praktikables hinreichendes Kriterium fur mehrdimensionaleDifferenzierbarkeit:

Satz 3.19 (Hinreichendes Kriterium fur Differenzierbarkeit). Sei X ⊂ Rn offen, seif : X −→ R eine auf X partiell differenzierbare Abbildung und die partiellen Ablei-tungen ∂1f, . . . , ∂nf : X −→ R seien stetig. Dann ist f auf X differenzierbar (und dieAbleitung wird durch die Jacobi-Matrix beschrieben).

Korollar 3.20. Sei X ⊂ Rn offen, sei f : X −→ Rm partiell differenzierbar und diepartiellen Ableitungen ∂1f1, . . . , ∂nfm : X −→ R von f seien alle stetig. Dann ist fauf X differenzierbar (und die Ableitung wird durch die Jacobi-Matrix beschrieben).

Insbesondere sind alle”polynomialen“ Abbildungen Rn −→ Rm differenzierbar und

die Polarkoordinatenabbildung ist differenzierbar.

Der Mittelwertsatz

Wir behandeln nun eine hoherdimensionale Variante des Mittelwertsatzes; analog zumeindimensionalen Fall konnen wir damit den Kern des Differenzierens bestimmen.

Satz 3.21 (Mittelwertsatz). Sei X ⊂ Rn offen und sei f : X −→ R eine differenzier-bare Funktion. Seien a, b ∈ X und es gebe einen stetigen Weg γ : [0, 1] −→ X ⊂ Rn mitγ(0) = a und γ(1) = b, der auf (0, 1) differenzierbar ist. Dann existiert ein ξ ∈ (0, 1)mit

f(b) = f(a) + f ′(γ(ξ)

)◦(γ′(ξ)

)(1).

Korollar 3.22. Sei X ⊂ Rn offen und sei f : X −→ R differenzierbar. Seien a, b ∈ Xund es gelte {

t · b+ (1− t) · a∣∣ t ∈ [0, 1]

}⊂ X.

Dann existiert ein ξ ∈ X mit

f(b) = f(a) +(f ′(ξ)

)(b− a).

26

Caveat 3.23. Es gibt keinen analogen Mittelwertsatz fur differenzierbare Funktionenvom Typ Rn −→ Rm mit m > 1.

Korollar 3.24 (Kern des Differenzierens, I). Sei X ⊂ Rn offen und zusammnen-hangend (bezuglich der Teilraumtopologie), sei f : X −→ R differenzierbar und es gel-te f ′(x) = 0 fur alle x ∈ X. Dann ist f konstant.

Korollar 3.25 (Kern des Differenzierens, II). Sei X ⊂ Rn offen und zusammenhan-gend, sei f : X −→ Rm differenzierbar und es gelte f ′(x) = 0 fur alle x ∈ X. Dann istf konstant.

Hohere Ableitungen

Bisher haben wir nur Ableitungen in einem Punkt betrachtet. Um hohere Ableitungendefinieren zu konnen, mussen wir nun die Ableitungen an den einzelnen Punkten wiedergeeignet zu einer Abbildung zusammenfassen:

Konvention 3.26. Ist X ⊂ Rn offen und f : X −→ Rm differenzierbar, so erhaltenwir durch Ableiten die Abbildung

f ′ : X −→ L(Rn,Rm)

x 7−→ f ′(x).

Da wir L(Rn,Rm) als R-Vektorraum kanonisch mit Rm×n ∼= Rm·n identifizieren konnen,konnen wir f ′ als Abbildung

f ′ : X −→ Rm·n

auffassen, wofur wir bereits einen Differenzierbarkeitsbegriff haben.

Definition 3.27 (Funktionenraume Ck). Seien m,n ∈ N und sei X ⊂ Rn offen.– Dann schreiben wir

C(X;Rm) := {f : X −→ Rm | f ist stetig}.

– Induktiv definieren wir C0(X;Rm) := C(X;Rm) und

Ck+1(X;Rm) :={f : X −→ Rm∣∣ f ist auf X differenzierbar und f ′ ∈ Ck(X,L(Rn,Rm)

}fur alle k ∈ N.

– Außerdem setzen wir

C∞(X;Rm) :=⋂k∈N

Ck(X;Rm).

Sei k ∈ N ∪ {∞}; die Elemente von Ck(X;Rm) heißen dann k-fach stetig differenzier-bare Abbildungen X −→ Rm.

Aus dem hinreichenden Kriterium fur Differenzierbarkeit (Satz 3.19) folgt induktiv:

27

Proposition 3.28 (stetige Differenzierbarkeit vs. stetige partielle Differenzierbarkeit).Sei X ⊂ Rn offen und k ∈ N. Dann ist

Ck(X;Rm) :={f : X −→ Rm

∣∣ f ist k-fach stetig partiell differenzierbar auf X}.

Mit den Vererbungseigenschaften erhalten wir, dass Ableiten im folgenden linear ist:

Proposition 3.29 (Linearitat des Ableitens). Sei X ⊂ Rn offen und sei k ∈ N. Dannsind Ck+1(X,Rm) und Ck(X;L(Rn,Rm)) reelle Vektorraume (bezuglich punktweiserAddition und Skalarmultiplikation) und die Abbildung

Ck+1(X;Rm) −→ Ck(X;L(Rn,Rm)

)f 7−→ f ′

ist linear.

Wie im eindimensionalen Fall ist der wichtigste Fall hoherer Ableitungen die zweiteAbleitung (da sie bei Optimierungsproblemen eine wichtige Rolle spielt):

Proposition 3.30 (Zweite Ableitung als bilineare Abbildung). Sei X ⊂ Rn offen, seix ∈ X und sei f : X −→ Rm auf X differenzierbar und in x zweimal differenzierbar(d.h. f ′ ist in x differenzierbar). Dann ist die Abbildung

Rn × Rn −→ Rm

(h, k) 7−→(f ′′(x)(k)

)(h)

bilinear.

Der Beweis dieser Proposition beruht auf dem sogenannten Exponentialgesetz fur(bi)lineare Abbildungen.

Analog kann man naturlich auch die hoheren Ableitungen in einem gegebenen Punktals multilineare Abbildungen auffassen.

Proposition 3.31 (quadratische Abbildungen). Sei b : Rn ×Rn −→ Rm bilinear und

q : Rn −→ Rm

x 7−→ b(x, x)

sei die zugehorige quadratische Abbildung. Dann ist q ∈ C∞(Rn;Rm) und es gilt:1. Fur alle x ∈ Rn ist

q′(x) =(h 7→ b(x, h) + b(h, x)

)∈ L(Rn,Rm).

Insbesondere ist q′ : X −→ L(Rn,Rm) linear.2. Also gilt fur alle x ∈ Rn, dass

q′′(x) =

(Rn × Rn −→ Rm

(h, k) 7−→ b(k, h) + b(h, k)

).

3. Fur alle k ∈ N≥3 ist q(k) = 0.

28

Satz 3.32 (Satz von Schwarz). Sei X ⊂ Rn offen, sei x ∈ X, sei f : X −→ Rm auf Xdifferenzierbar und in x existiere die zweite Ableitung von f .

1. Dann gilt fur alle h, k ∈ Rn, dass

f ′′(x)(h, k) = f ′′(x)(k, h).

D.h. die bilineare Abbildung f ′′(x) ist symmetrisch.2. Insbesondere gilt fur alle j, k ∈ {1, . . . , n} und alle ` ∈ {1, . . . ,m}, dass

∂j∂kf`(x) = ∂k∂jf`(x).

Korollar 3.33 (Hesse-Matrix). Sei X ⊂ Rn offen, sei x ∈ X und sei f : X −→ Rauf X differenzierbar und in x zweimal differenzierbar. Dann ist die Hesse-Matrixvon f in x

Hessf (x) :=(∂j∂kf(x)

)j,k∈{1,...,n} ∈ Rn×n

symmetrisch und es gilt

f ′′(x) =

(Rn × Rn −→ R

(h, k) 7−→ h> ·Hessf (x) · k

).

Taylorentwicklung und lokale Extrema

Analog zum eindimensionalen Fall konnen wir auch im hoherdimensionalen Fall ver-suchen, hinreichend oft differenzierbare Funktionen durch ihre hoheren Ableitungenpolynomial zu approximieren; dies fuhrt zur Taylorentwicklung:

Satz 3.34 (Taylorentwicklung). Sei X ⊂ Rn offen, sei N ∈ N und sei f ∈ CN+1(X;R).Sei x ∈ X und sei h ∈ Rn so klein, dass die Verbindung {x + t · h | t ∈ [0, 1]} von xnach x+ h in X liegt. Dann gilt

f(x+h) =

N∑j=0

1

j!· f (j)(x) (h, . . . , h)︸ ︷︷ ︸

j-mal︸ ︷︷ ︸N-tes Taylor-Polynom von f um x

+1

N !·∫ 1

0

(1− t)N · f (N+1)(x+ t · h) (h, . . . , h)︸ ︷︷ ︸N + 1-mal

dt

︸ ︷︷ ︸Restglied in Integralform

.

Alternativ kann das Restglied auch durch den Wert von f (N+1) an einer geeignetenStelle, angewendet auf geeignete Vektoren ausgedruckt werden.

Analog zum eindimensionalen Fall kann man naturlich auch fur unendlich oft stetigdifferenzierbare Funktionen untersuchen, unter welchen Bedingungen die entsprechen-de Taylorreihe konvergiert und ob sie die gegebene Funktion darstellt. Darauf gehenwir nun nicht im Detail ein.

Wenn man mit hoheren Taylor-Polynomen rechnen mochte, bietet es sich an, diefolgende Notation mit Hilfe von Multi-Indizes zu verwenden:

Notation 3.35 (Multiindizes). Sei n ∈ N und sei α ∈ Nn; man bezeichnet α dannauch als Multiindex.

29

– Wir schreiben kurz

α! := α1! · · · · · αn!,

|α| := α1 + · · ·+ αn.

– Ist h ∈ Rn, so schreiben wir

hα := hα11 · · · · · hαn

n .

– Ist f ∈ C |α|(X;R) und x ∈ X (wobei X ⊂ Rn offen ist), so schreiben wir

∂αf(x) := ∂α11 . . . ∂αn

n f(x).

Ist h ∈ Rn, so steht ∂αf(x)·hα also fur den Ausdruck ∂α11 . . . ∂αn

n f(x)·hα11 ·· · ··hαn

n .

Indem man verwendet, dass man die Ableitung (und die hoheren Ableitungen) an ei-nem Punkt auch durch entsprechende partielle Ableitungen darstellen kann, den Satzvon Schwarz uber die Vertauschbarkeit partieller Ableitungen anwendet und Sum-manden geeignet zusammenfasst, kann man obige Taylorentwicklung auch wie folgtdarstellen:

Bemerkung 3.36 (Taylorentwicklung via Multiindizes). Sei X ⊂ Rn offen, sei N ∈ Nund sei f ∈ CN+1(X;R). Sei x ∈ X und sei h ∈ Rn so klein, dass {x+ t · h | t ∈ [0, 1]}in X liegt. Dann gilt

f(x+h) =∑

α∈Nn,|α|≤N

1

α!·∂αf(x) ·hα+

1

N !·∫ 1

0

(1− t)N ·f (N+1)(x+ t ·h) (h, . . . , h)︸ ︷︷ ︸N + 1-mal

dt.

Als Anwendung der Taylorentwicklung zeigen wir wie man mit Hilfe der Differen-tialrechnung eine Strategie zum Losen von Optimierungsproblemen erhalt:

Satz 3.37 (Stationaritat lokaler Extrema). Sei X ⊂ Rn offen, sei x ∈ X und seif : X −→ R in x differenzierbar. Sei x eine lokale Extremalstelle von f , d.h. es gibteine offene Umgebung U ⊂ X von x mit

∀y∈U f(y) ≤ f(x) oder ∀y∈U f(y) ≥ f(x);

in ersterem Fall nennt man x eine lokale Maximalstelle, in letzterem Fall eine lokaleMinimalstelle von f . Dann ist x eine kritische Stelle von f , d.h. f ′(x) = 0 ∈ L(Rn,R).

Im allgemeinen ist dieses notwendige Kriterium uber die erste Ableitung nicht hin-reichend (wie bereits schon im eindimensionalen Fall). Analog zum eindimensionalenFall liefert die

”Positivitat/Negativitat“ der zweiten Ableitung ein hinreichendes Kri-

terium:

Satz 3.38 (hinreichendes Kriterium fur lokale Extrema). Sei X ⊂ Rn offen und seif ∈ C2(X;R). Sei x ∈ X mit f ′(x) = 0. Dann gilt:

30

1. Ist f ′′(x) bzw. Hessf (x) positiv definit [negativ definit], so ist x eine lokale Mi-nimalstelle [Maximalstelle] von f .

2. Ist f ′′(x) bzw. Hessf (x) indefinit, so ist x keine lokale Extremalstelle von f .

Bemerkung 3.39 (positiv/negativ definit, indefinit). Sei b : Rn × Rn −→ R einesymmetrische Bilinearform. Dann ist b

– positiv definit [negativ definit ], falls ein a ∈ R>0 existiert mit

∀h∈Rn b(h, h) ≥ a · ‖h‖22[bzw. ∀h∈Rn b(h, h) ≤ −a · ‖h‖22.

]– indefinit, falls es h+, h− ∈ Rn gibt mit

b(h+, h+) > 0 und b(h−, h−) < 0.

Sei A ∈ Rn×n die (symmetrische) Matrix, die b bezuglich der Standardbasis darstellt,d.h. fur alle j, k ∈ {1, . . . , n} ist Ajk = b(ej , ek) bzw. fur alle h, k ∈ Rn ist

b(h, k) = h> ·A · k.

Dann ist A als reelle symmetrische Matrix uber R diagonalisierbar und alle Eigenwertevon A sind reell. Dabei gilt: Die Bilinearform b ist genau dann

– positiv definit [negativ definit], wenn alle Eigenwerte von A positiv [negativ] sind.– indefinit, wenn A sowohl einen positiven als auch einen negativen Eigenwert

besitzt.

Man kann nun versuchen, Optimierungsprobleme zu losen, indem man zunachstversucht, alle kritischen Stellen der zu optimierenden Funktion zu bestimmen unddann mit Hilfe des obigen hinreichenden Kriteriums festzustellen, bei welchen dieserkritischen Stellen es sich tatsachlich um lokale Extremalstellen handelt.

Man beachte dabei, dass sich auch Ungleichungen als Optimierungsprobleme formu-lieren lassen und diese Methode somit einen Ansatz liefert, um gewisse Ungleichungenzu beweisen.

Beispiele fur Differentialoperatoren

Wir werden im folgenden kurz ein paar wichtige Beispiele fur Differentialoperatorenvorstellen und ihre geometrische Bedeutung bzw. ihre Rolle in den Anwendungen skiz-zieren.

”Definition“ 3.40 (Differentialoperator). Ein (linearer) Differentialoperator ist ei-

ne (lineare) Abbildung zwischen geeigenten Funktionenraumen, die durch Kompositi-on/Linearkombination von gewissen partiellen Ableitungen gegeben ist.

Gradient

Der Gradient liefert (bis auf ein Vorzeichen) zu einem Potential (z.B. Graviationspo-tential, elektrostatisches Potential, . . . ) das zugehorige Vektorfeld (Gravitationsfeld,elektrostatisches Feld, . . . ).

31

Definition 3.41 (Gradient). Sei X ⊂ Rn offen und sei f : X −→ R auf X differen-zierbar. Dann heißt

∇f : X −→ Rn

x 7−→

∂1f(x)...

∂nf(x)

Gradient von f ; das Symbol

”∇“ heißt Nabla.

Man beachte: Ist x ∈ X, so ist ∇f(x) =(Jf(x)

)> ∈ Rn ein Spaltenvektor.

Mit Hilfe der Cauchy-Schwarzschen Ungleichung (Lemma 1.24) konnen wir eine erstegeometrische Bedeutung des Gradienten herleiten:

Proposition 3.42 (geometrische Bedeutung des Gradienten). Sei X ⊂ Rn offen, seif : X −→ R auf X differenzierbar, sei x ∈ X und es gelte ∇f(x) 6= 0. Dann ist ∇f(x)die Richtung der großten lokalen Veranderung von f in x, d.h. fur alle v ∈ Rn \ {0}gilt

|∂vf(x)|‖v‖2

≤|∂∇f(x)(x)|‖∇f(x)‖2

,

und Gleichheit gilt genau dann, wenn v und ∇f(x) linear abhangig ist.

Auf dieser Proposition beruht ein numerisches Optimierungsverfahren, das dem

”Gradientenfluss“ folgt, um lokale Minimalstellen zu finden.Intuitiv sollte die großte Veranderungsrichtung (also der Gradient) senkrecht auf den

Hohenlinien (bzw. allgemeiner den Niveauhyperflachen) stehen; dies ist tatsachlich derFall:

Proposition 3.43 (der Gradient ist orthogonal zu den Niveaulinien). Sei X ⊂ Rnoffen, sei f : X −→ R auf X differenzierbar, sei c ∈ R und sei γ : (0, 1) −→ f−1(c) ⊂X ⊂ Rn differenzierbar. Dann gilt fur alle t ∈ (0, 1), dass⟨

∇f(γ(t)), γ′(t)⟩

= 0.

Caveat 3.44. Nicht jedes Vektorfeld entsteht als Gradient einer geeigneten Potenti-alfunktion!

Divergenz

Die Divergenz eines Vektorfeldes beschreibt die”Quellenstarke“:

Definition 3.45 (Divergenz eines Vektorfeldes). Sei X ⊂ Rn offen, sei f : X −→ Rnauf X differenzierbar. Dann ist

div f :=

n∑j=1

∂jfj : X −→ R

die Divergenz von f .

32

Rotation

Die Rotation eines dreidimensionalen Vektorfeldes beschreibt, wie sehr”Teilchen“ al-

lein durch das Feld in Rotation versetzt werden und um welche Rotationsachse:

Definition 3.46 (Rotation). Sei X ⊂ R3 offen und sei f : X −→ R3 auf X differen-zierbar. Dann ist

rot f : X −→ R3

x 7−→

∂2f3(x)− ∂3f2(x)∂3f1(x)− ∂1f3(x)∂1f2(x)− ∂2f1(x)

die Rotation von f .

Mit Hilfe des Satzes von Schwarz (Satz 3.32) folgt:

Proposition 3.47 (Vertraglichkeit von Rotation mit anderen Differentialoperatoren).Sei X ⊂ R3 offen.

1. Ist f : X −→ R3 zweimal differenzierbar, so ist

div rot f = 0.

2. Ist f : X −→ R zweimal differenzierbar, so ist

rot∇f = 0.

Der Laplace-Operator

Der Laplace-Operator eines Potentials misst die Anderungsrate des Mittelwerts desPotentials auf Spharen um den betrachteten Punkt bei Anderung des Radius. Dahertritt der Laplace-Operator oft bei der Beschreibung physikalischer Systeme auf; z.B.liefert der Laplace-Operator eines Gravitationspotentials (bzw. eines elektrostatischenPotentials) die zugehorige Massenverteilung (bzw. die zugehorige Ladungsverteilung).Außerdem tritt er auch in der Warmeleitungsgleichung auf, und in der Differentialgeo-metrie.

Der Laplace-Operator ist ein linearer Differentialoperator zweiter Ordnung:

Definition 3.48 (Laplace-Operator). Sei X ⊂ Rn offen und sei f : X −→ R auf Xzweimal differenzierbar. Dann ist

∆f := div∇f =

n∑j=1

∂j∂jf : X −→ R

der Laplace-Operator angewendet auf f .Ist ∆f = 0, so heißt f harmonisch.

33

Lokale Umkehrbarkeit

Wir wollen uns im folgenden damit beschaftigen, unter welchen Voraussetzungen wirdifferenzierbare Funktionen lokal invertieren konnen. Dabei haben wir folgende Ziele:

1. Aus der Analysis I wissen wir: Ist f ∈ C1(R,R) und ist x ∈ R mit f ′(x) 6= 0, soist f lokal um x invertierbar und das Inverse ist auch stetig differenzierbar. Gibtes eine Verallgemeinerung auf den mehrdimensionalen Fall?

2. Wir mochten die Geometrie von Niveaulinien von Funktionen vom Typ Rn −→ Rbesser verstehen (und allgemeiner von Untermannigfaltigkeiten) bzw. Gleichun-gen dieser Art lokal

”auflosen“ konnen oder zumindest die lokale Losbarkeit

untersuchen.Der zentrale Satz in diesem Kontext ist der Satz uber lokale Umkehrbarkeit:

Satz 3.49 (lokale Umkehrbarkeit). Sei X ⊂ Rn offen, sei f ∈ C1(X,Rn), sei x ∈ Xund sei f ′(x) ∈ L(Rn,Rn) invertierbar (d.h. det Jf(x) 6= 0). Dann gibt es eine offeneUmgebung U ⊂ X von x mit folgenden Eigenschaften:

1. Die Einschrankung f |U : U −→ Rn ist injektiv.2. Die Menge f(U) ⊂ Rn ist offen.3. Die Umkehrabbildung (f |U )−1 : f(U) −→ U ist stetig differenzierbar.

D.h. f |U : U −→ f(U) ist ein C1-Diffeomorphismus.

Die grundlegende Idee des Beweises ist es, Invertierbarkeit als ein geeignetes Fix-punktproblem aufzufassen und dann den Banachschen Fixpunktsatz (Satz 1.19) anzu-wenden.

Zum Beispiel kann man mit Hilfe des Satzes uber lokale Umkehrbarkeit leicht nach-weisen, dass die Polarkoordinatenabbildung ein lokaler C1-Diffeomorphismus ist.

Als Anwendung des Satzes uber lokale Umkehrbarkeit geben wir einen ersten Schrittzur Losung des zweiten Problems: Die Frage nach der Existenz lokaler C1-Parametri-sierungen von Hohenlinien (und ihren Verallgemeinerungen) wird durch den Satz uberimplizite Funktionen beantwortet:

Um den Satz formulieren zu konnen, benotigen wir noch eine geeignete Notation furgewisse Teile der Jacobi-Matrix:

Notation 3.50. Seien n,m ∈ N und sei X ⊂ Rn × Rm offen. Ist x ∈ X, so schreibenwir kurz

xÀ := (x1, . . . , xn)> ∈ Rn und xÁ := (xn+1, . . . , xn+m)>;

dies hangt naturlich von der Zerlegung von n + m in n und m ab – um die Notationnicht zu uberfrachten, fugen wir dies aber nicht auch noch zur Notation hinzu.

Ist f : X −→ Rn differenzierbar, so schreiben wir fur alle x ∈ X außerdem

JÀf(x) :=

∂1f1(x) . . . ∂nf1(x)...

. . ....

∂1fn(x) . . . ∂nfn(x)

∈ Rn×n,

34

sowie

JÁf(x) :=

∂n+1f1(x) . . . ∂n+mf1(x)...

. . ....

∂n+1fn(x) . . . ∂n+mfn(x)

∈ Rn×m.

Satz 3.51 (Satz uber implizite Funktionen). Sei X ⊂ Rn × Rm offen und sei f ∈C1(X;Rn). Sei x ∈ X mit f(x) = 0 und det JÀf(x) 6= 0. Dann existiert eine of-fene Umgebung U ⊂ Rm von xÁ, so dass es eine lokal um xÁ eindeutig bestimmteAbbildung ϕ ∈ C1(U ;Rn) mit ϕ(xÁ) = xÀ und {(ϕ(t), t) | t ∈ U} ⊂ X sowie

∀t∈U f(ϕ(t), t

)= 0

gibt.

Dieser Satz spielt in der Differentialtopologie eine wichtige Rolle.

Extrema unter Nebenbedingungen

Haufig stoßt man auf Optimierungsprobleme der folgenden Form: Gesucht sind dieExtrema einer Einschrankung f |M , wobei f : Rn −→ R und M ⊂ Rn gegeben sind.Oft ist dabei M in der Form M = g−1({0}) fur eine geeignete Abbildung g : Rn −→ Rmgegeben.

Caveat 3.52. Im allgemeinen sind in dieser Situation lokale Extrema der Einschran-kung f |M : M −→ R keine lokalen Extrema der Funktion f : Rn −→ R.

Eine naive Losungsstrategie ist, die Menge M explizit zu parametrisieren (d.h. dieGleichung

”g(x) = 0“ aufzulosen) und dann in f einzusetzen. Im allgemeinen ist dies

aber naturlich nicht explizit moglich. Mithilfe des Satzes uber implizite Funktionen(Satz 3.51) kann man aus dieser Strategie aber ein praktikables notwendiges Kriteriumableiten:

Satz 3.53 (Extrema unter Nebenbedingungen und Lagrange-Multiplikatoren). SeiX ⊂ Rn offen, sei f ∈ C1(X;R), sei g ∈ C1(X;Rm) und es gelte fur alle x ∈ X, dassrg Jg(x) = m ist (Regularitatsbedingung). Außerdem sei

M := g−1({0}) ={x ∈ X

∣∣ ∀j∈{1,...,m} gj(x) = 0}

und sei x ∈M eine lokale Extremalstelle von f |M (d.h. es existiert eine offene Umge-bung U ⊂M von x in M bezuglich der Teilraumtopologie, so dass x eine Extremalstellevon f |U : U −→ R ist). Dann gibt es ein λ ∈ Rm mit

∇f(x) +

m∑j=1

λj · ∇gj(x) = 0.

Man bezeichnet λ dann als Lagrange-Multiplikator.

35

Kurven und Untermannigfaltigkeiten

Im folgenden geben wir einen kurzen Ausblick wie man mithilfe der mehrdimensionalenDifferentialrechnung geometrische Objekte wie Kurven, Flachen etc. untersuchen undbeschreiben kann.

Wir beginnen mit (parametrisierten) Kurven und werden dann fur hoherdimensio-nale Objekte zu einer lokaleren Perspektive wechseln.

Definition 3.54 ((regulare) parametrisierte Kurve). Sei n ∈ N.– Eine parametrisierte Kurve in Rn ist eine C1-Abbildung I −→ Rn, wobei I ⊂ R

ein Intervall ist.Als Intervall sind hierbei offene, halboffene und abgeschlossene Intervalle in Rzugelassen, wobei wir bei offenen Grenzen auch

”±∞“ erlauben.

Eine Abbildung γ : I −→ Rn ist eine C1-Abbildung, wenn γ auf I stetig ist, γ|I◦auf I◦ differenzierbar ist und die Ableitung γ′|I◦ stetig auf I fortgesetzt werdenkann.

– Eine parametrisierte Kurve γ : I −→ Rn heißt regular, wenn fur alle t ∈ I◦ gilt,dass γ′(t) 6= 0 ist.

Analog kann man naturlich auch Kurven betrachten, die ofter differenzierbar bzw.sogar glatt sind.

Definition 3.55 (Aquivalenz parametrisierter Kurven). Sei n ∈ N und seien I1, I2 ⊂ RIntervalle. Zwei parametrisierte Kurven γ1 : I1 −→ Rn und γ2 : I2 −→ Rn in Rn heißenaquivalent, wenn es einen C1-Diffeomorphismus ϕ : I2 −→ I1 mit γ2 = γ1 ◦ ϕ gibt.

Ein C1-Diffeomorphismus ist dabei eine C1-Abbildung ϕ : I2 −→ I1, fur die es eineC1-Abbildung ψ : I1 −→ I2 mit ϕ ◦ ψ = idI1 und ψ ◦ ϕ = idI2 gibt.

Bemerkung 3.56. Dieser Begriff von”Aquivalenz“ fur [regulare] parametrisierte Kur-

ven in Rn ist tatsachlich eine Aquivalenzrelation auf der Menge der [regularen] para-metrisierten Kurven in Rn.

Indem wir nun jeweils die parametrisierten Kurven einer Aquivalenzklasse identifi-zieren, erhalten wir den Begriff der Kurve:

Definition 3.57 (Kurve). Sei n ∈ N. Eine Kurve in Rn ist eine Aquivalenzklasseregularer parametrisierter Kurven in Rn.

Wir mochten nun geeignete Invarianten fur Kurven definieren. Wir beginnen miteiner globalen Invariante, der Lange:

Notation 3.58. Ist γ : I −→ Rn eine parametrisierte Kurve und ist t ∈ I◦, so schrei-ben wir kurz (und etwas schlampig)

γ′(t) :=

γ′1(t)...

γ′n(t)

∈ Rn.

36

Definition 3.59 (Lange parametrisierter Kurven). Seien a, b ∈ R mit a ≤ b und seiγ : [a, b] −→ Rn eine parametrisierte Kurve. Dann heißt

`(γ) :=

∫ b

a

∥∥γ′(t)∥∥2dt

Lange von γ.

Mit Hilfe dieser Lange von Kurven lasst sich insbesondere der Winkelbegriff aufgeeignete Bogenlangen zuruckfuhren.

Satz 3.60 (Lange parametrisierter Kurven via Polygonzuge). Seien a, b ∈ R mit a ≤ bund sei γ : [a, b] −→ Rn eine parametrisierte Kurve in Rn. Dann ist

`(γ) = sup{`P (γ)

∣∣ P ist eine Partition von [a, b]},

wobei wir die Abkurzung

`P (γ) :=

k∑j=1

∥∥γ(tj)− γ(tj−1)∥∥2

verwenden, wenn P = (t0, . . . , tk) eine Partition von [a, b] ist (dies ist die Lange desPolygonzugs auf γ zur Partition P ).

Die Lange einer Kurve hangt nicht von der Geschwindigkeit ab, mit der sie durch-laufen wird, d.h. aquivalente parametrisierte Kurven haben dieselbe Lange:

Proposition 3.61 (Lange von Kurven). Sei n ∈ N und seien γ1 : [a1, b1] −→ Rn undγ2 : [a2, b2] −→ Rn regulare parametrisierte Kurven in Rn, die dieselbe Kurve c in Rnreprasentieren. Dann ist

`(γ1) = `(γ2).

Man nennt in diesem Fall `(c) := `(γ1) = `(γ2) die Lange von c.

Ausgezeichnete Parametrisierungen von Kurven sind die, die mit der Lange vonTeilkurven kompatibel sind:

Definition 3.62 (nach Bogenlange parametrisiert). Sei I ⊂ R ein Intervall. Eineparametrisierte Kurve γ : I −→ Rn in Rn ist nach Bogenlange parametrisiert, wenn‖γ′(t)‖2 = 1 fur alle t ∈ I◦ gilt.

Mit Hilfe des Hauptsatzes der Differential- und Integralrechnung kann man zeigen,dass solche Parametrisierungen immer existieren und im wesentlichen eindeutig sind:

Proposition 3.63 (Existenz und Eindeutigkeit von Parametrisierungen nach Bo-genlange). Sei I ⊂ R ein Intervall und sei γ : I −→ Rn eine regulare parametrisierteKurve in Rn.

1. Dann gibt es eine nach Bogenlange parametrisierte Kurve in Rn, die zu γ aqui-valent ist.

37

2. Sind γ1 : I1 −→ Rn und γ2 : I2 −→ Rn nach Bogenlange parametrisierte Kurven,die zu γ aquivalent sind, so existiert ein c ∈ R mit

∀t∈I2 γ2(t) = γ1(t+ c) oder ∀t∈I2 γ2(t) = γ2(−t+ c).

Die Lange einer Kurve ist eine globale Invariante. Geschwindigkeit und Krummungsind hingegen lokale Invarianten. Die Krummung einer Kurve in einem Punkt ist dieAnderung der Geschwindigkeit(srichtung):

Definition 3.64 (Krummung von parametrisierten Kurven). Sei I ⊂ R ein Intervallund sei γ : I −→ Rn eine zweimal differenzierbare nach Bogenlange parametrisierteKurve in Rn und sei t ∈ I◦. Dann ist

κγ(t) :=∥∥γ′′(t)∥∥

2∈ R

die Krummung von γ in t. (Dabei fassen wir γ′′(t) wie γ′(t) als Vektor in Rn auf).

Im Falle ebener Kurven kann man diese Krummung noch durch ein Vorzeichenverfeinern. Dies beruht auf der Tatsache, dass der der Krummung zugrundeliegendeVektor senkrecht auf der Geschwindigkeitsrichtung steht:

Proposition 3.65 (Krummung vs. Geschwindigkeit). Sei I ⊂ R ein Intervall undsei γ : I −→ Rn eine zweimal differenzierbare nach Bogenlange parametrisierte Kurve.Dann gilt fur alle t ∈ I◦, dass

γ′(t)⊥γ′′(t).

Definition 3.66 (Einheitsnormalenvektor, signierte Krummung). Sei I ⊂ R ein In-tervall, sei γ : I −→ R2 eine zweimal differenzierbare nach Bogenlange parametrisierteKurve, und sei t ∈ I◦.

– Der Einheitsnormalenvektor von γ in t ist

νγ(t) :=

(0 −11 0

)· γ′(t) ∈ R2.

– Wegen νγ(t)⊥γ′(t) und γ′′(t)⊥γ′(t) sowie ‖νγ(t)‖2 = ‖γ′(t)‖2 = 1 6= 0 existiertalso (da dimR R2 = 2) genau ein κγ(t) ∈ R mit

γ′′(t) = κγ(t) · νγ(t).

Man nennt κγ(t) die signierte Krummung von γ in t.

Nach Definition ist in dieser Situation |κγ | = κγ , die signierte Krummung ist alsoeine Verfeinerung der Krummung.

Analog zu (parametrisierten) Kurven kann man auch (parametrisierte) Flachenin Rn definieren und Krummungsbegriffe fur Flachen einfuhren. Die Krummungsbe-griffe fur Flachen beruhen auf den Krummungsbegriffen fur Kurven.

Wir andern nun den Blickwinkel und betrachten Teilmengen von Rn statt Parame-trisierungen von Teilmengen von Rn:

38

Definition 3.67 (Untermannigfaltigkeit). Seien k, n ∈ N mit k ≤ n. Eine Teilmen-ge M ⊂ Rn ist eine k-dimensionale C1-Untermannigfaltigkeit von Rn, wenn es zu je-dem x ∈M eine C1-Karte um x in M gibt, d.h., wenn es eine offene Umgebung U ⊂ Rnvon x in Rn und einen C1-Diffeomorphismus ϕ : U −→ Rn mit

ϕ(U ∩M) = Rk × {0} ⊂ Rn

gibt. (D.h. lokal sieht M ⊂ Rn wie Rk × {0} ⊂ Rn aus).

Bemerkung 3.68 (Urbilder regularer Werte). Seien n, k ∈ N mit k ≤ n, sei f ∈C1(Rn,Rn−k) und sei y ∈ Rn−k ein regularer Wert von f , d.h. fur alle x ∈ f−1({y})ist rg Jf(x) = n−k. Dann ist f−1({y}) eine k-dimensionale C1-Untermannigfaltigkeitvon Rn.

Untermannigfaltigkeiten konnen lokal linear durch Tangentialraume approximiertwerden:

Definition 3.69 (Tangentialraum). Seien k ∈ N, sei M ⊂ Rn eine C1-Untermannig-faltigkeit und sei x ∈M . Dann heißt

TRn

x M :={v ∈ Rn

∣∣ es gibt ein ε ∈ R>0 und

eine parametrisierte Kurve γ : (−ε, ε)→ Rn

mit γ(0) = x, γ((−ε, ε)) ⊂M , und γ′(0) = v}⊂ Rn

Tangentialraum von M in x.

Proposition 3.70 (Tangentialraume sind Untervektorraume). Seien k, n ∈ N mit k ≤n, sei M ⊂ Rn eine k-dimensionale C1-Untermannigfaltigkeit und sei x ∈ M . Dannist TRn

x M ⊂ Rn ein Untervektorraum von Rn und es gilt

dimR TRn

x M = k.

Insbesondere ist die Dimension von (nicht-leeren) C1-Untermannigfaltigkeiten von Rneindeutig bestimmt.

Indem man nun das allgemeine Prinzip verwendet, lokale Eigenschaften via Kartenauf globale Eigenschaften von Mannigfaltigkeiten hochzuziehen, kann man die Diffe-rentialrechnung auf Mannigfaltigkeiten ubertragen. Zum Beispiel kann man auf dieseWeise definieren, wann eine Abbildung M1 −→M2 zwischen C1-Untermannigfaltigkei-ten M1 ⊂ Rn1 bzw. M2 ⊂ Rn2 stetig differenzierbar ist; ist f : M1 −→ M2 stetigdifferenzierbar und x ∈M1, so erhalt man eine lineare Abbildung

Txf : TRn1

x M1 −→ TRn2

f(x)M2,

die man als Ableitung von f in x auffassen kann.Im nachsten Abstraktionsschritt definiert man einen intrinsichen Mannigfaltigkeits-

begriff, der ohne einen umgebenden Raum Rn auskommt, sowie Tangentialbundel,Differenzierbarkeit, Krummung, Volumen, . . . Dies ist Gegenstand der Analysis IV,sowie der Differentialtopologie und Differentialgeometrie. Anwendungen findet dieseTheorie zum Beispiel in der Kartographie und in der Physik.

39

4 Mehrdimensionale Analysis – Integration

Wir geben nun einen kurzen Uberblick uber die wichtigsten Begriffe und Satze zurIntegration von Funktionen vom Typ Rn −→ R; Details werden in den VorlesungenAnalysis III (Maßtheorie und Funktionentheorie), sowie Analysis IV (Analysis aufMannigfaltigkeiten) behandelt.

Konstruktion des Lebesgue-Integrals – Skizze

Wir skizzieren kurz die Konstruktion des Lebesgue-Integrals auf Rn. Wie beim Rie-mann-Integral auf R beginnen wir mit Treppenfunktionen – jedoch mussen wir etwasallgemeinere Grundmengen als Intervalle/Quader fur die Stufen zulassen und einenVolumenbegriff fur solche Mengen erklaren. Der erste Schritt ist daher das Lebesgue-Maß auf Rn:

Das Lebesgue-Maß auf Rn

Wir beginnen mit grundlegenden Begriffen aus der Maßtheorie; ahnlich zu topologi-schen Raumen formalisiert man Maßtheorie uber Mengensysteme:

Definition 4.1 (messbarer Raum, σ-Algebra, messbare Funktion, Maß).– Ein messbarer Raum ist ein Paar (X,S), wobei X eine Menge und S eine σ-Al-

gebra auf X ist, d.h. S ⊂ P (X) erfullt die folgenden Eigenschaften:– Es ist ∅ ∈ S und X ∈ S.– Fur alle Folgen (An)n∈N in S ist

⋃n∈NAn ∈ S.

– Fur alle A ∈ S ist X \A ∈ S.– Seien (X,SX) und (Y, SY ) messbare Raume. Eine Abbildung f : X −→ Y ist

messbar, wenn: fur alle A ∈ SY ist f−1(A) ∈ SX .– Sei (X,S) ein messbarer Raum. Ein Maß auf (X,S) ist eine Abbildung

µ : S −→ R≥0 ∪ {∞}

mit folgenden Eigenschaften:– Es ist µ(∅) = 0 und µ(X) 6= 0.– Ist (An)n∈N eine Folge paarweise disjunkter Mengen aus S, so ist

µ

(⋃n∈N

An

)=

∞∑n=0

µ(An).

Konvention 4.2 (”Rechnen“ mit ∞). Wir definieren

∞+∞ :=∞,a+∞ :=∞,∞+ a :=∞,b · ∞ :=∞,∞ · b :=∞

40

fur alle a ∈ R und alle b ∈ R>0. Man beachte jedoch, dass”∞−∞“ nicht definiert ist.

Definition 4.3 (Borel-σ-Algebra). Sei n ∈ N. Die bezuglich Inklusion kleinste σ-Al-gebra auf Rn, die alle bezuglich der Standardtopologie offenen Mengen von Rn enthalt,heißt Borel-σ-Algebra auf Rn und wird mit B(Rn) bezeichnet.

Satz 4.4 (Lebesgue-Maß). Sei n ∈ N. Es gibt genau ein Maß λn : B(Rn) −→ R≥0 ∪{∞} auf (Rn, B(Rn)) mit folgender Eigenschaft: Fur alle a, b ∈ Rn mit aj ≤ bj furalle j ∈ {1, . . . , n} gilt

λn([a1, b1]× · · · × [an, bn]

)=

n∏j=1

(bj − aj).

Man nennt λn das Lebesgue-Maß auf Rn.

Bemerkung 4.5 (Lebesgue-messbare Mengen). Man kann B(Rn) bezuglich λn zueiner etwas großeren σ-Algebra B(Rn)

”vervollstandigen“, und man kann λn zu einem

Maß auf B(Rn) fortsetzen. Wir bezeichnen diese Fortsetzung auch wieder als Lebesgue-Maß λn und nennen die Mengen in B(Rn) Lebesgue-messbar.

Bemerkung 4.6 (stetige Abbildungen sind messbar). Ist n ∈ N und f : Rn −→ Rstetig, so ist f bezuglich den σ-Algebren B(Rn) und B(R) (bzw. B(Rn) und B(R))messbar.

Caveat 4.7 (exotische Mengen). Man kann zeigen, dass aus dem Auswahlaxiom folgt,dass B(Rn) 6= P (Rn) gilt, dass es also Mengen in Rn gibt, die nicht Lebesgue-messbarsind; dies hangt mit dem sogenannten Banach-Tarski-Paradoxon zusammen.

Das Lebesgue-Integral auf Treppenfunktionen

Wir setzen nun messbare Stufen zu Treppenfunktionen zusammen und definieren furdiese ein Integral:

Definition 4.8 (Treppenfunktionen). Sei n ∈ N.– Eine Fuktion f : Rn −→ R ist eine Treppenfunktion, wenn es ein k ∈ N und

paarweise disjunkte Mengen A1, . . . , Ak ∈ B(Rn) sowie a1, . . . , ak ∈ R gibt mit:Fur alle j ∈ {1, . . . , k} ist µ(Aj) <∞ und es gilt

f =

k∑j=1

aj · χAj : Rn −→ R.

Hierbei bezeichnet zu einer Menge A ⊂ Rn das Symbol χA die zugehorige cha-rakteristische Funktion:

χA : Rn −→ R

x 7−→

{1 falls x ∈ A0 falls x ∈ Rn \A.

41

– Wir bezeichnen die Menge aller solchen Treppenfunktionen mit T (Rn, λn).

Man beachte, dass T (Rn, λn) bezuglich punktweiser Addition bzw. Skalarmultipli-kation ein reeller Vektorraum ist.

Proposition 4.9 (Integral von Treppenfunktionen). Sei n ∈ N und sei

I : T (Rn, λn) −→ Rk∑j=1

aj · χAj7−→

k∑j=1

aj · λn(Aj).

Dann gilt:1. Die Abbildung I ist wohldefiniert und R-linear.2. Die Abbildung

‖ · ‖1 : T (Rn, λn) −→ R≥0f 7−→ I

(|f |)

ist eine (Halb-)Norm auf T (Rn, λn).3. Die Abbildung I ist bezuglich ‖ · ‖1 stetig.

Vervollstandigung und Fortsetzung des Integrals

Wir vervollstandigen nun den (halb-)normierten Raum der Treppenfunktionen undsetzen dann das Integral von Treppenfunktionen auf diese Vervollstandigung fort:

Definition 4.10. Sei n ∈ N. Die Vervollstandigung von T (Rn, λn) bezuglich ‖ · ‖1bezeichnen wir mit L1(Rn, λn).

Der folgende zentrale Satz zeigt, dass die Elemente des (zunachst abstrakt definier-ten) Raumes L1(Rn, λn) in einem gewissen Sinne wieder als Funktionen Rn −→ Raufgefasst werden konnen:

Satz 4.11 (Lebesgue-integrierbare Funktionen und das Lebesgue-Integral). Sei n ∈ N.1. Es gibt einen Isomorphismus

L1(Rn, λn)←→ gewisse messbare Funktionen Rn → R{f : Rn → R

∣∣ f ist messbar und λn(f−1(R \ {0})) = 0}

der die kanonische Abbildung T (Rn, λn) −→ L1(Rn, λn) fortsetzt.Man nennt daher die Elemente von L1(Rn,R) Lebesgue-integrierbare Funktionenauf Rn und fasst sie als Funktionen Rn −→ R auf.

2. Die eindeutige stetige lineare Fortsetzung∫Rn

· dλn : L1(Rn, λn) −→ R

von I : T (Rn, λn) −→ R auf L1(Rn, λn) heißt Lebesgue-Integral auf Rn.

42

3. Die Abbildung

‖ · ‖1 : L1(Rn, λn) −→ R≥0

f −→∫Rn

|f | dλn

ist eine Norm auf L1(Rn, λn).

Man beachte, dass Elemente aus L1(Rn, λn) nicht eindeutig Funktionen Rn −→ Rentsprechen, sondern nur bis auf λn-Nullmengen (d.h. Mengen, deren λn-Maß 0 ist).

Notation 4.12. Ist f ∈ L1(Rn, λn) und A ∈ B(Rn), so schreiben wir∫A

f dλn :=

∫Rn

f · χA dλn.

Wichtige Satze

Wir stellen nun einen Werkzeugkasten der wichtigsten Satze uber das Lebesgue-Integralzusammen, der es bereits ermoglicht, das Lebesgue-Integral in vielen Fallen zu berech-nen:

Satz 4.13 (Positivitat des Integrals). Sei n ∈ N und sei f ∈ L1(Rn, λn) so dassλn-fast uberall f ≥ 0 gilt (d.h. es ist λn({x ∈ Rn | f(x) < 0} = 0). Dann ist∫

Rn

f dλn ≥ 0.

Satz 4.14 (Riemann- vs. Lebesgue-Integral). Seien a, b ∈ R mit a ≤ b und sei

f : [a, b] −→ R Riemann-integrierbar. Dann gibt es eine Funktion f ∈ L1([a, b], λ1|[a,b]),die λn-fast uberall mit f ubereinstimmt und es gilt∫ b

a

f =

∫[a,b]

f dλ1.

Caveat 4.15. Es gibt jedoch viel mehr Lebesgue-integrierbare Funktionen als Riemann-integrierbare Funktionen!

Satz 4.16 (Integrierbarkeit stetiger Funktionen). Sei n ∈ N, sei f : Rn −→ R stetigund sei A ⊂ Rn kompakt. Dann ist χA · f ∈ L1(Rn, λn).

Satz 4.17 (monotone Konvergenz). Sei n ∈ N. Sei (fk)k∈N eine λn-fast uberall mo-noton wachsende Folge von Elementen von L1(Rn, λn) mit der Eigenschaft, dass dieMenge {

∫Rn fk dλ

n | k ∈ N} ⊂ R beschrankt ist. Dann gibt es ein f ∈ L1(Rn, λn),so dass (fk)k∈N bezuglich ‖ · ‖1 und λn-fast uberall punktweise gegen f konvergiert.Insbesondere ist

limk→∞

∫Rn

fk dλn =

∫Rn

f dλn.

43

Satz 4.18 (dominierte Konvergenz). Sei n ∈ N und sei (fk)k∈N eine Folge in L1(Rn, λn),die λn-fast uberall punktweise gegen f : Rn −→ R konvergiert. Außerdem gebe esein g ∈ L1(Rn, λn) mit der Eigenschaft, dass λn-fast uberall |fk| ≤ g fur alle k ∈ Ngilt. Dann ist f ∈ L1(Rn, λn) und

limk→∞

∫Rn

fk dλn =

∫Rn

f dλn.

Satz 4.19 (Satz von Fubini). Seien n, n1, n2 ∈ N mit n1+n2 = n, und sei f : Rn −→ Rmessbar. Fur x ∈ Rn1 sei

fx : Rn2 −→ Ry 7−→ f(x, y).

1. Fur λn1-fast alle x ∈ Rn1 sei fx ∈ L1(Rn2 , λn) und die Abbildung

Rn1 −→ R

x 7−→∫Rn2

|fx| dλn2

sei in L1(Rn1 , λn1). Dann ist f ∈ L1(Rn, λn).2. Sei f ∈ L1(Rn, λn). Dann gilt: Fur λn1-fast alle x ∈ Rn1 ist fx ∈ L1(Rn2 , λn2)

und

Rn1 −→ R

x 7−→∫Rn2

|fx| dλn2

ist in L1(Rn1 , λn1) und es gilt∫Rn

f dλn =

∫Rn1

∫Rn2

fx(y) dλn2(y) dλn1(x)

=

∫Rn1

∫Rn2

f(x, y) dλn2(y) dλn1(x).

Satz 4.20 (Transformationssatz). Sei n ∈ N, seien A,B ⊂ Rn offene Mengen und seiϕ : A −→ B ein C1-Diffeomorphismus. Sei außerdem f : Rn −→ R messbar. Dann istf · χB genau dann Lebesgue-integrierbar, wenn (f ◦ ϕ) · χA Lebesgue-integrierbar istund es gilt ∫

ϕ(A)

f dλn =

∫A

(f ◦ ϕ) · | det Jϕ| dλn.

Zum Beispiel kann man mehrdimensionale Integrale auch verwenden, um Integralevon Funktionen R −→ R besser zu bestehen; etwa folgt∫

Re−x

2

dλ1(x) =√π

aus der Betrachtung des Integrals einer geeigneten Funktion R2 −→ R.Via Karten und Differentialformen kann man Integration und Volumina etc. auch

auf Mannigfaltigkeiten erklaren (Analysis IV).

44

5 Gewohnliche Differentialgleichungen

Systeme in den Naturwissenschaften oder Wirtschaftswissenschaften werden oft durchsogenannte Differentialgleichungen modelliert. Außerdem treten Differentialgleichun-gen auch z.B. in der Differentialgeometrie auf. Grob gesagt beschreibt eine Differen-tialgleichung die gewunschten Beziehungen zwischen einer Funktion und ihren Ablei-tungen.

Wir wollen uns im folgenden mit solchen Gleichungen beschaftigen. Wichtige Fra-gestellungen sind dabei:

– Existiert eine Losung? Zumindest lokal?– Sind Losungen eindeutig?– (Wie) Kann man Losungen explizit berechnen?– Was kann man uber die

”langfristige“ Entwicklung des Systems aussagen?

– Wie stabil sind solche Gleichungen/Losungen unter”kleinen Veranderungen“?

Wir beginnen mit der Formalisierung des Begriffs”gewohnliche Differentialglei-

chung“ bzw.”Losung einer gewohnlichen Differentialgleichung.“

Definition 5.1 (gewohnliche Differentialgleichung, Losung davon). Seien n,m, k ∈ N.– Eine gewohnliche Differentialgleichung der Ordnung ≤ k ist gegeben durch eine

Abbildung D −→ Rm, wobei D ⊂ R× (Rn)k+1 ist.– Sei D ⊂ R × (Rn)k+1 und sei f : D −→ Rm. Ist I ⊂ R ein Intervall, so isty ∈ Ck(I,Rn) eine Losung der durch f gegebenen Differentialgleichung, wennfolgende Bedingungen erfullt sind:

– Fur alle t ∈ I◦ ist(t, y(t), y′(t), . . . , y(k)(t)

)∈ D, und

– fur alle t ∈ I◦ istf(t, y(t), y′(t), . . . , y(k)(t)

)= 0.

Wir schreiben dann

Gesucht: y ∈ Ck(〈R1〉, 〈Rn〉

)mit

0 = f( · , y, y′, . . . , y(k))fur das entsprechende Problem.

Bemerkung 5.2 (partielle Differentialgleichungen). Gewohnliche Differentialgleichun-gen handeln von Funktionen mit eindimensionalem Definitionsbereich; treten Funktio-nen mit weiteren Parametern und ihre partiellen Ableitungen auf, so gelangt man zuden sogenannten partiellen Differentialgleichungen. Dieses Gebiet ist jedoch deutlichschiweriger und unubersichtlicher als der Zoo der gewohnlichen Differentialgleichun-gen.

Gewohnliche Differentialgleichungen, geometrisch

Um ein besseres Gefuhl fur Differentialgleichungen zu bekommen, geben wir fur zweispezielle Arten von gewohnlichen Differentialgleichungen geometrische Veranschauli-chungen:

45

Definition 5.3 (Richtungsfeld). Sei D ⊂ R×R und sei f : D −→ R. Das Richtungsfeldder zugehorigen gewohnlichen Differentialgleichung

Gesucht: y ∈ C1(〈R1〉, 〈R1〉

)mit

y′ = f( · , y)

erster Ordnung ist die Menge{((t, x),

(1

f(t, x)

)) ∣∣∣∣ (t, x) ∈ D}⊂ D × R2.

(Diese Differentialgleichung heißt”explizit,“ da sie bereits nach der ersten Ableitung

aufgelost ist).

Eine Funktion lost eine solche Differentialgleichung genau dann, wenn das Rich-tungsfeld der Differentialgleichung uberall tangential zur Funktion verlauft. Mithilfevon Richtungsfeldern kann man also solche gewohnlichen Differentialgleichungen gra-phisch

”losen.“

Definition 5.4 (Phasenebene, stationarer Punkt, erstes Integral). Sei D ⊂ R2 undsei f : D −→ R2. Wir betrachten das autonome explizite zweidimensionale System

Gesucht: y1, y2 ∈ C1(〈R1〉, 〈R1〉

)mit

y′1 = f1(y1, y2)y′2 = f2(y1, y2)

erster Ordnung. (Eine solche Differentialgleichung heißt”autonom“ da die

”rechte“

Seite nicht vom Parameter”t“ abhangt.)

– Die Phasenebene (oder das Phasenportrait) dieser gewohnlichen Differentialglei-chung ist die Menge {(

x, f(x)) ∣∣ x ∈ D} ⊂ D × R2.

– Ist x ∈ D mit f(x) = 0, so heißt x stationarer Punkt (oder Gleichgewichtspunkt)dieser Gleichung.

– Eine (nicht-konstante) Abbildung ϕ : D −→ R heißt erstes Integral der obigenDifferentialgleichung, falls: Ist y ∈ C1(I,R2) eine Losung dieser Differential-gleichung, so ist ϕ ◦ y konstant (d.h. alle Losungen dieser Differentialgleichungverlaufen in den Niveaumengen von ϕ).

Eine parametrisierte Kurve in R2 lost genau dann ein solches Differentialgleichungs-system, wenn die Vektoren der Phasenebene uberall tangential an die Kurve anliegen.Mithilfe der Phasenebene kann man also solche gewohnlichen Differentialgleichungengraphisch

”losen.“

Man beachte, dass die stationaren Punkte gerade den konstanten Losungen entspre-chen, und dass erste Integrale helfen konnen, Eigenschaften von Losungen zu finden(z.B. Beschranktheit, ohne die Differentialgleichung selbst losen zu mussen).

46

Existenz und Eindeutigkeit

Wir werden uns nun etwas systematischer mit den folgenden Fragen beschaftigen:Existieren Losungen (zumindest lokal)? Sind sie eindeutig?

Der zentrale Satz in der Theorie der gewohnlichen Differentialgleichungen ist derSatz von Picard-Lindelof:

Satz 5.5 (Satz von Picard-Lindelof). Sei n ∈ N, sei D ⊂ R × Rn offen, sei t0 ∈ Rund x0 ∈ Rn mit (t0, x0) ∈ D und sei f : D −→ Rn stetig und lokal Lipschitz in denletzten n Variablen. Wir betrachten die folgende Differentialgleichung (ein sogenanntesAnfangswertproblem):

Gesucht: y ∈ C1(〈R1〉, 〈Rn〉

)mit

y′ = f( · , y)y(t0) = x0

Dann gilt:1. Lokale Existenz. Es existiert ein δ0 ∈ R>0, so dass dieses Anfangswertproblem

eine Losung in C1([t0 − δ0, t0 + δ0],Rn) besitzt.2. Eindeutigkeit. Ist I ⊂ R ein Intervall mit t0 ∈ I und sind y, y ∈ C1(I,Rn)

Losungen des obigen Anfangswertproblems, so ist y = y.

Definition 5.6 (lokal Lipschitz). Sei n ∈ N, sei D ⊂ R×Rn offen und sei f : D −→ Rneine Abbildung. Dann ist f lokal Lipschitz in den letzten n Variablen, wenn: Fur al-le (t0, x0) ∈ D (mit t0 ∈ R und x0 ∈ Rn) gibt es ein δ ∈ R>0, eine offene Umge-bung U ⊂ Rn von x0 mit [t0 − δ, t0 + δ]× U ⊂ D, und ein L ∈ R≥0 mit

∀t∈[t0−δ,t0+δ] ∀x,x∈U∥∥f(t, x)− f(t, x)

∥∥2≤ L · ‖x− x‖2.

Der Beweis des Satzes von Picard-Lindelof beruht auf dem Banachschen Fixpunkt-satz (Satz 1.19); insbesondere erhalt man so auch ein Verfahren, um Losungen iterativanzunahern (da der Banachsche Fixpunktsatz ein solches Verfahren zum Bestimmenvon Fixpunkten liefert).

Das folgende Kriterium erlaubt es in vielen Fallen nachzuweisen, dass die Voraus-setzungen des Satzes von Picard-Lindelof erfullt sind:

Proposition 5.7 (ein hinreichendes Kriterium fur lokal Lipschitz). Sei I ⊂ R of-fen, sei X ⊂ Rn offen und sei f : I × X −→ Rn eine Abbildung mit den folgendenEigenschaften:

– Fur alle t ∈ I ist die Abbildung

ft : X −→ Rn

x 7−→ f(t, x)

stetig differenzierbar.

47

– Die Abbildung

I ×X −→ Rn×n

(t, x) 7−→ Jft(x)

ist stetig.Dann ist f lokal Lipschitz bezuglich der letzten n Variablen.

Der Satz von Picard-Lindelof garantiert zunachst nur lokale Existenz von solchenAnfangswertproblemen. Unter welchen Voraussetzungen kann man solche Losungenfortsetzen bzw. unter welchen Voraussetzungen existieren globale Losungen?

Es gibt zwei Phanomene, die die Fortsetzbarkeit von Losungen verhindern:– Explosion von Losungen– Erreichen des Randes des Definitionsbereichs des Anfangswertproblems

Andernfalls konnen Losungen fortgesetzt werden:

Satz 5.8 (Fortsetzbarkeit von Losungen). Sei I ⊂ R ein offenes Intervall, sei D ⊂ Rnoffen und sei f : I × Rn −→ Rn stetig und lokal Lipschitz in den letzten n Variablen.Wir betrachten das System

Gesucht: y ∈ C1(〈R1〉, 〈Rn〉

)mit

y′ = f( · , y)

Seien a, b ∈ I mit a < b und sei y ∈ C1((a, b),Rn) eine Losung dieser Differentialglei-chung mit folgenden Eigenschaften:

– Es existiert ein c ∈ R≥0 mit

∀t∈(a,b)∥∥y(t)

∥∥2≤ c.

– Es ist y((a, b)) ⊂ D.Dann existiert eine Fortsetzung der Losung y zu einer Losung auf einer Umgebungvon (a, b), d.h. es existiert ein δ ∈ R>0 und eine Losung y ∈ C1((a− δ, b+ δ),Rn) derobigen Differentialgleichung.

Der Beweis beruht darauf, dass man den Satz von Picard-Lindelof auf geeigneteAnfangswertprobleme am Rand des Intervalls (a, b) anwendet und dann diese Losungmit der ursprunglichen verklebt.

Unter geeigneten Wachstumsbedingungen lassen sich dann Losungen sogar zu glo-balen Losungen zusammensetzen:

Korollar 5.9 (globale Existenz). Sei I ⊂ R ein Intervall, sei (t0, x0) ∈ I × Rn undsei f : I × Rn −→ Rn stetig und lokal Lipschitz in den letzten n Variablen. Außerdemgebe es α, β ∈ R≥0 mit

∀(t,x)∈I×Rn

∥∥f(t, x)∥∥2≤ α+ β · ‖x‖2.

Dann besitzt das Anfangswertproblem

48

Gesucht: y ∈ C1(〈R1〉, 〈Rn〉

)mit

y′ = f( · , y)y(t0) = x0

genau eine Losung in C1(I,Rn).

Dass die Wachstumsbedingung an f verhindert, dass Losungen solcher Anfangswert-probleme explodieren (und der obige Fortsetzungssatz somit anwendbar ist), wird mitHilfe des Lemmas von Gronwall gezeigt.

Separable Gleichungen

Wir beschaftigen uns nun mit einer speziellen Art von gewohnlichen Differentialglei-chungen, fur die es eine Losungsstrategie gibt. Viele weitere gewohnliche Differential-gleichungen werden durch geeignete Transformationen auf diese zuruckgefuhrt.

Satz 5.10 (Trennung der Variablen). Seien I, J ⊂ R offene Intervalle, seien h : I −→R und g : J −→ R stetig und sei (t0, x0) ∈ I × J . Wir betrachten das Anfangswertpro-blem

Gesucht: y ∈ C1(〈R1〉, 〈R1〉

)mit

y′ = h · (g ◦ y)y(t0) = x0

Dann gilt:1. Ist g(x0) = 0, so ist die konstante Funktion x0 : I −→ R eine Losung dieses

Anfangswertproblems (im allgeminen ist diese Losung jedoch nicht eindeutig).2. Ist g(x0) 6= 0, so existieren δ, ε ∈ R>0, so dass

y : (t0 − δ, t0 + δ) −→ Rt 7−→ G−1 ◦H(t),

wobei

G : (x0 − ε, x0 + ε) −→ R

x 7−→∫ x

x0

1

g(s)ds,

H : (t0 − δ, t0 + δ) −→ R

t 7−→∫ t

t0

h(s) ds,

wohldefiniert und eine Losung des obigen Anfangswertproblems ist.Ist y ∈ C1((t0 − δ, t0 + δ),R) eine Losung des obigen Anfangswertproblems, soist y = y.

49

Caveat 5.11. Man beachte dabei, dass die im obigen Satz betrachteten Anfangswert-probleme im allgemeinen nicht die Voraussetzungen des Satzes von Picard-Lindelof(Satz 5.5) erfullen, da nicht alle stetigen Funktionen lokal Lipschitz sind.

Caveat 5.12. Im allgemeinen kann man die Integrale und das Inverse in der obigenLosung nicht explizit berechnen.

Lineare Differentialgleichungssysteme

Im folgenden betrachten wir die Klasse der linearen gewohnlichen Differentialglei-chungssysteme etwas genauer. Da man Systeme hoherer Ordnung durch Einfuhrungneuer Variablen auf Systeme erster Ordnung zuruckfuhren kann, betrachten wir nur(explizite) Systeme erster Ordnung:

Definition 5.13 (lineare gewohnliche Differentialgleichung erster Ordnung). Sei n ∈N, sei I ⊂ R ein Intervall und seien A : I −→ Rn×n und b : I −→ Rn stetig. EinDifferentialgleichungssystem der Form

Gesucht: y ∈ C1(〈R1〉, 〈Rn〉

)mit

y′ = A · y + b

heißt lineares (gewohnliches) Differentialgleichungssystem erster Ordnung.Ist b = 0: I −→ Rn, so nennt man das System homogen, andernfalls inhomogen.

Mit dem globalen Existenzsatz (Korollar 5.9) erhalt man (indem man zunachstkompakte Intervalle betrachtet und dann die Losungen zusammensetzt):

Satz 5.14 (Existenz und Eindeutigkeit von Losungen von linearen Anfangswertpro-blemen). Sei n ∈ N, sei I ⊂ R ein Intervall, seien A : I −→ Rn×n und b : I −→ Rnstetig und seien t0 ∈ I, x0 ∈ Rn. Dann besitzt das Anfangswertproblem

Gesucht: y ∈ C1(〈R1〉, 〈Rn〉

)mit

y′ = A · y + by(t0) = x0

genau eine Losung in C1(I,Rn).

Satz 5.15 (Losungsraume linearer Differentialgleichungen). Sei n ∈ N, sei I ⊂ Rein nicht-leeres Intervall und seien A : I −→ Rn×n und b : I −→ Rn stetig. Sei L ⊂C1(I,Rn) die Menge der Losungen in C1(I,Rn) des homogenen Systems

Gesucht: y ∈ C1(〈R1〉, 〈Rn〉

)mit

y′ = A · y

Dann gilt:

50

1. Es ist L ein reeller Untervektorraum von C1(I,Rn).2. Es ist dimR L = n. Genauer gilt: Sind y(1), . . . , y(n) ∈ L und ist t0 ∈ I, so ist

(y(1), . . . , y(n)) genau dann eine Basis von L, wenn(y(1)(t0), . . . , y(n)(t0)

)eine

Basis von Rn ist.3. Ist y ∈ C1(I,Rn) eine Losung des Systems

Gesucht: y ∈ C1(〈R1〉, 〈Rn〉

)mit

y′ = A · y + b

(d.h. y ist eine sogenannte spezielle Losung), so ist

{y + y | y ∈ L}

die Menge der Losungen in C1(I,Rn) des obigen inhomogenen Systems.

Es bietet sich an, Basen des Losungsraums zu matrixwertigen Funktionen zusam-menzufassen:

Definition 5.16 (Fundamentalmatrix, Wronski-Determinante). Sei n ∈ N, sei I ⊂ Rein Intervall und sei A : I −→ Rn×n stetig. Sei L ⊂ C1(I,Rn) der Losungsraum von

Gesucht: y ∈ C1(〈R1〉, 〈Rn〉

)mit

y′ = A · y

in C1(I,Rn).– Basen von L heißen auch Fundamentalsysteme der obigen Differentialgleichung.– Ist (y(1), . . . , y(n)) eine Basis von L, so nennt man

I −→ Rn×n

t 7−→(y(1)(t), . . . , y(n)(t)

)(d.h., die Spalten der Matrix rechts sind durch die Losungen y(1), . . . , y(n) gege-ben) eine Fundamentalmatrix des obigen Systems.

– Ist Y : I −→ Rn×n eine Losungsmatrix des obigen Systems (d.h. die Spalten-funktionen von Y liegen in L), so heißt

detY : I −→ Rt 7−→ det

(Y (t)

)Wronski-Determinante von Y .

Bemerkung 5.17. Nach Satz 5.15 kann man also an der Wronski-Determinante ab-lesen, ob eine Losungsmatrix eine Fundamentalmatrix ist oder nicht.

Kennt man die Losungen eines homogenen linearen Differentialgleichungssystems,so kann man daraus spezielle Losungen der zugehorigen inhomogenen Systeme

”be-

rechnen“:

51

Satz 5.18 (Variation der Konstanten). Sei n ∈ N, sei I ⊂ R ein Intervall und seienA : I −→ Rn×n und b : I −→ Rn stetig. Sei t0 ∈ I und sei Y : I −→ Rn×n eineFundamentalmatrix von

Gesucht: y ∈ C1(〈R1〉, 〈Rn〉

)mit

y′ = A · y.

Dann ist

I −→ Rn

t 7−→ Y (t) ·∫ t

t0

(Y (s)

)−1 · b(s) dswohldefiniert und eine Losung des Systems

Gesucht: y ∈ C1(〈R1〉, 〈Rn〉

)mit

y′ = A · y + b.

Im folgenden beschreiben wir, wie man lineare gewohnliche Differentialgleichungs-systeme mit konstanten Koeffizienten losen kann.

Dazu betrachtet man die matrixwertige Exponentialfunktion:

Proposition 5.19 (matrixwertige Exponentialfunktion). Sei n ∈ N, sei A ∈ Cn×n.Dann ist

exp(A) :=

∞∑k=0

1

k!·Ak

in Cn×n absolut konvergent. Dabei gilt:1. Ist A ∈ Rn×n, so ist auch exp(A) ∈ Rn×n.2. Ist B ∈ Cn×n mit A ·B = B ·A, so gilt

exp(A+B) = exp(A) · exp(B).

Diese Eigenschaften lassen sich analog zu den entsprechenden Eigenschaften dergewohnlichen reellen/komplexen Exponentialfunktion beweisen. Ausßerdem folgt ana-log zum eindimensionalen Fall:

Proposition 5.20 (Fundamentalmatrix via Exponentialfunktion). Sei n ∈ N und seiA ∈ Rn×n. Dann ist

R −→ Rn×n

t 7−→ exp(t ·A) =

∞∑k=0

tk

k!·Ak

stetig differenzierbar und eine Fundamentalmatrix des Systems

52

Gesucht: y ∈ C1(〈R1〉, 〈Rn〉

)mit

y′ = A · y.

Man berechnet die matrixwertige Exponentialfunktion, indem man die Jordan-Nor-malform uber C der entsprechenden Matrix betrachtet. Wir beginnen mit einem ein-fachen Spezialfall:

Bemerkung 5.21 (reell diagonalisierbare Systeme). Sei n ∈ N und sei A ∈ Rn×nuber R diagonalisierbar. Dann existiert eine Matrix S ∈ GL(n,R) und eine Diagonal-matrix D ∈ Rn×n mit A = S−1 ·D · S (d.h. die Spalten von S−1 bilden eine Basis ausEigenvektoren von A von Rn). Seien λ1, . . . , λn ∈ R die Diagonaleintrage von D (d.h.die Eigenwerte von A). Dann gilt

exp(t ·A) = S−1 · exp(t ·D) · S = S−1 ·

et·λ1 0

. . .

0 et·λn

· Sfur alle t ∈ R. Insbesondere gilt: Ist (u1, . . . , un) eine Basis von Rn aus Eigenvektorenvon A zu den Eigenwerten λ1, . . . , λn, so ist

R −→ Rn×n

t 7−→(et·λ1 · u1, . . . , et·λn · un

)eine Fundamentalmatrix des homogenen linearen Differentialgleichungssytems, dasdurch die Matrix A gegeben ist.

Der Vollstandigkeit halber erinnern wir nochmal an die Jordan-Normalform:

Bemerkung 5.22 (Jordan-Normalform). Sei n ∈ N und sei A ∈ Rn×n. Dann existierteine Matrix S ∈ GL(n,C) so dass S−1 ·A · S in Jordan-Normalform uber C ist, d.h.

S ·A · S−1 =

� 0�

. . .

0 �

,

wobei jedes der Kastchen � ein Jordan-Kastchen ist; d.h. jedes dieser Kastchen � istvon der Gestalt

λ 1 0

λ. . .

. . . 10 λ

wobei λ ∈ C ein Eigenwert von A uber C ist. Dabei gilt:

53

1. Ist λ ∈ R, so gibt es zu jedem Jordan-Kastchen zum Eigenwert λ eine zugehorigereelle Kette von Eigen- bzw. Hauptvektoren von A.

2. Ist λ ∈ C\R, so gibt es zu jedem Jordan-Kastchen zum Eigenwert λ ein entspre-chendes Jordan-Kastchen derselben Große zum Eigenwert λ; die Konjugierteneiner Kette von Eigen- bzw. Hauptvektoren von A zum Eigenwert λ bilden eineKette von Eigen- bzw. Hauptvektoren von A zum Eigenwert λ.

Bemerkung 5.23 (Reduktion auf Jordan-Kastchen). Wegen der folgenden beidenEigenschaften der Exponentialfunktion genugt es, die Exponentialfunktion fur Jordan-Kastchen zu bestimmen:

1. Fur alle B ∈ Cn×n und alle S ∈ GL(n,C) gilt

exp(S−1 ·B · S) = S−1 · exp(B) · S.

2. Fur alle B ∈ Cm×m und alle C ∈ Ck×k gilt

exp

(B 00 C

)=

(exp(B) 0

0 exp(C)

).

Proposition 5.24 (Exponentialfunktion von Jordankastchen). Sei n ∈ N, sei λ ∈ Cund sei

A =

λ 1 0

λ. . .

. . . 10 λ

.

Dann gilt fur alle t ∈ R, dass

exp(t ·A) = et·λ ·

1 t t2

2 . . . tn−1

(n−1)!

0 1 t. . .

...

0 0 1. . . t2

2...

. . . t0 . . . 0 1

.

Korollar 5.25 (Fundamentalmatrizen fur reelle Jordankastchen-Systeme). Sei n ∈ N,sei λ ∈ R und sei A ∈ Rn mit Jordan-Normalform

λ 1 0

λ. . .

. . . 10 λ

.

54

Ist (u1, . . . , un) eine zugehorige Kette von reellen Eigen- bzw. Hauptvektoren von A,so ist

R −→ Rn×n

t 7−→(et·λ · u1, et·λ · (u2 + t · u1), . . . , et·λ ·

n−1∑k=0

tk

k!· un−k

)eine Fundamentalmatrix des durch A gegebenen homogenen linearen Differentialglei-chungssystems.

Sind die Eigenwerte nicht reell, so betrachtet man den Real- bzw. Imaginarteil derzugehorigen komplexen Eigen- bzw. Hauptvektoren zum entsprechenden Eigenwert(damit ist dann auch der dazu konjugierte Eigenwert bereits abgedeckt). Wir formu-lieren dies nur im folgenden Spezialfall explizit:

Bemerkung 5.26 (Systeme mit komplexen Eigenwerten). Sei A ∈ R2×2 eine Matrixmit Eigenwert λ ∈ C \ R; dann ist auch λ ein Eigenwert von A. Sei u ∈ C2 ein Eigen-vektor von A zum Eigenwert λ; dann ist u ein Eigenvektor von A zum Eigenwert λ.Wir schreiben

λ = α+ i · β und u = v + i · w

mit α, β ∈ R und v, w ∈ R2. Dann ist

R −→ R2×2

t 7−→(Re(et·λ · u), Im(et·λ · u)

)=(et·α ·

((cos(β · t)) · v − (sin(β · t)) · w

), et·α ·

((sin(β · t)) · v + (cos(β · t)) · w

))eine Fundamenatlmatrix fur die lineare homogene Differentialgleichung, die durch Agegeben ist.

Zusammenfassung der bisherigen Losungsstrategien

In Abbildung 1 und Abbildung 2 sind die bisher behandelten Losungsstrategien zu-sammengestellt.

55

gewohnliche Differentialgleichung

implizit explizit1

hohere Ordnung2

erste Ordnung

Existenz und Eindeutigkeit?(insbesondere: Picard-Lindelof)

Losung raten?

Spezielle Losungsverfahren?(getrennte Variablen, lineare Systeme, . . . )

Spezielle Losungsverfahrennach Transformation?

[numerische Verfahren]

1 lokales Auflosen (falls hinreichend regular)2 Reduktion (Variablen fur die hoheren Ableitungen einfuhren)

Abbildung 1: Wie lost man gewohnliche Differentialgleichungen?

56

lineare gewohnliche Differentialgleichung

hohere Ordnung erste Ordnung

inhomogen homogen

konstante Koeffizienten

Normalform/exp bestimmen

nicht-konstante Koeffizienten

hohere Dimension Dimension 1(getrennteVariablen)

1

2

3

1 Reduktion (Variablen fur die hoheren Ableitungen einfuhren)2 Variation der Konstanten3 [d’Alembert-Reduktion]

Abbildung 2: Wie lost man lineare gewohnliche Differentialgleichungen?

57

Stabilitat

Wir beschaftigen uns nun mit der Frage wie Losungen von Anfangswertproblemenvon den Anfangswerten abhangen und insbesondere mit der Stabilitat von stationarenPunkten. Dadurch werden insbesondere auch die verschiedenen Typen von stabilenLagen physikalischer/wirtschaftlicher Systeme modelliert.

Definition 5.27 (stabil, instabil, attraktiv, asymptotisch stabil). Sei n ∈ N, sei t0 ∈ R,sei I ⊂ R ein Intervall mit [t0,∞) ⊂ I und sei f : I × Rn −→ Rn stetig und lokalLipschitz in den letzten n Variablen. Wir betrachten die Differentialgleichung

Gesucht: y ∈ C1(〈R1〉, 〈Rn〉

)mit

y′ = f( · , y).

– Eine Losung y ∈ C1([t0,∞),Rn) dieser Differentialgleichung heißt stabil (bezug-lich t0), wenn: Zu jedem ε ∈ R>0 gibt es ein δ ∈ R>0 mit folgender Eigen-schaft: Ist x0 ∈ B(y(t0), δ), so existiert die Losung y dieser Differentialgleichungmit y(t0) = x0 auf [t0,∞) und

∀t∈[t0,∞)

∥∥y(t)− y(t)∥∥2< ε.

– Eine Losung in C1([t0,∞),Rn) heißt instabil (bezuglich t0), wenn sie nicht stabilist.

– Eine Losung y ∈ C1([t0,∞),Rn) heißt attraktiv (bezuglich t0), wenn: Es gibtein δ ∈ R>0 mit: Ist x0 ∈ B(y(t0), δ), so existiert die Losung y dieser Differenti-algleichung mit y(t0) = x0 und

limt→∞

∥∥y(t)− y(t)∥∥2

= 0.

– Eine Losung heißt asymptotisch stabil (bezuglich t0), wenn sie stabil und asym-ptotisch stabil bezuglich t0 ist.

Die Stabilitat der trivialen Losung 0 bezuglich 0 von linearen Differentialgleichungs-systemen kann man im wesentlichen anhand der Jordan-Normalform charakterisieren.

Satz 5.28 (Stabilitat in linearen Systemen (ohne Beweis)). Sei n ∈ N und A ∈ Rn×n.Wir betrachten das lineare Differentialgleichungssystem

Gesucht: y ∈ C1(〈R1〉, 〈Rn〉

)mit

y′ = A · y.

Dann gilt:1. Es ist 0 ∈ C1([0,∞),Rn) genau dann stabil (bezuglich 0) fur das obige System,

wenn gilt: Fur alle Eigenwerte λ ∈ C von A uber C ist Reλ ≤ 0 und fur alleEigenwerte λ ∈ C von A uber C mit Reλ = 0 ist λ fur A halbeinfach (d.h. diegeometrische und die algebraische Vielfachheit von λ stimmen uberein).

58

2. Es ist 0 ∈ C1([0,∞),Rn) genau dann asymptotisch stabil (bezuglich 0) fur dasobige System, wenn alle Eigenwerte λ ∈ C von A uber C erfullen, dass Reλ < 0ist.

Dies ubertragt sich durch lineare Approximation analog auch auf allgemeinere au-tonome Systeme:

Satz 5.29 (Prinzip der linearisierten Stabilitat (ohne Beweis)). Sei n ∈ N, sei f ∈C1(Rn,Rn) und sei x0 ∈ Rn mit f(x0) = 0 (d.h. x0 ist ein stationarer Punkt derentsprechenden Differentialgleichung). Sei A := Jf(x) ∈ Rn×n. Wir betrachten dieautonome Differentialgleichung

Gesucht: y ∈ C1(〈R1〉, 〈Rn〉

)mit

y′ = f ◦ y.

Dann gilt:1. Gibt es einen Eigenwert λ ∈ C von A uber C mit Reλ > 0, so ist die konstante

Losung x0 ∈ C1([0,∞),Rn) instabil (bezuglich 0) fur die obige Differentialglei-chung.

2. Gilt Reλ < 0 fur alle Eigenwerte λ ∈ C von A uber C, so ist die konstan-te Losung x0 ∈ C1([0,∞),Rn) asymptotisch stabil (bezuglich 0) fur die obigeDifferentialgleichung.

Ein weiteres Hilfsmittel bei Stabilitatsproblemen ist die sogenannte direkte Methodemithilfe von Lyapunov-Funktionen:

Definition 5.30 ((strikte) Lyapunov-Funktion). Sei n ∈ N und sei f : Rn −→ Rnlokal Lipschitz. Wir betrachten die autonome Differentialgleichung

Gesucht: y ∈ C1(〈R1〉, 〈Rn〉

)mit

y′ = f ◦ y.

– Eine Lyapunov-Funktion fur diese Differentialgleichung ist eine Funktion ϕ ∈C(Rn,R) mit folgender Eigenschaft: Ist y ∈ C1(I,Rn) eine Losung dieser Diffe-rentialgleichung, so ist ϕ ◦ y : I −→ R monoton fallend.

– Eine strikte Lyapunov-Funktion fur diese Differentialgleichung ist eine Funk-tion ϕ ∈ C(Rn,R) mit folgender Eigenschaft: Ist y ∈ C1(I,Rn) eine nicht-konstante Losung dieser Differentialgleichung, so ist ϕ ◦ y : I −→ R streng mo-noton fallend.

Satz 5.31 (direkte Methode (ohne Beweis)). Sei n ∈ N und sei f : Rn −→ Rn lokalLipschitz. Wir betrachten die autonome Differentialgleichung

Gesucht: y ∈ C1(〈R1〉, 〈Rn〉

)mit

y′ = f ◦ y.

59

Sei x0 ∈ Rn ein stationarer Punkt dieser Differentialgleichung, d.h. f(x0) = 0. Danngilt:

1. Ist ϕ ∈ C(Rn,R) eine Lyapunov-Funktion dieser Differentialgleichung und x0eine strikte lokale Minimalstelle der Funktion ϕ, so ist die konstante Losung x0 ∈C1([0,∞),Rn) stabil bezuglich 0 fur die obige Differentialgleichung.

2. ist ϕ ∈ C(Rn,R) eine strikte Lyapunov-Funktion fur die obige Differentialglei-chung, ist x0 ein isolierter Punkt von f−1({0}) und ist x0 eine strikte lokaleMinimalstelle von ϕ, so ist die konstante Losung x0 ∈ C1([0,∞),Rn) asympto-tisch stabil bezuglich 0 fur die obige Differentialgleichung.

60