1 Das Integral - math.uni-wuppertal.debongartz/anaskelett.pdf · De nition 3 Eine Funktion f:...

22
1 Das Integral Stets seien a<b reelle Zahlen. Definition 1 a) Eine Zerlegung Z von [a, b] ist eine endliche Folge Z = (x 0 = a, x 1 ,x 2 ,...,x n = b) mit x i <x i+1 ur alle i zwischen 0 und n - 1. Die x i ’s heißen die Teilungspunkte der Zerlegung. b) Eine Zerlegung Z 0 =(x 0 0 ,x 0 1 ,x 2 ,...,x 0 n 0 ) heisst feiner als Z =(x 0 ,x 1 ,x 2 ,...,x n ), falls f¨ ur jedes i ein j existiert mit x i = x 0 j . Man schreibt daf¨ ur Z≤Z 0 . c) Sind Z 0 =(x 0 0 ,x 0 1 ,x 2 ,...,x 0 n 0 ) und Z =(x 0 ,x 1 ,x 2 ,...,x n ) zwei Zerlegun- gen, so ist Z∪Z 0 =(z 0 ,z 1 ,...,z m ) die eindeutig bestimmte Zerlegung mit {z 0 ,z 1 ,...z m } = {x 0 ,x 1 ,...x n }∪{x 0 0 ,x 0 1 ,...x 0 n 0 }. Bemerkung 1 Immer gilt Z≤Z∪Z 0 . Beispiel 1 ur jede nat¨ urliche Zahl n 1 hat man die ¨aquidistante Zerlegung mit den n +1 Teilungspunkten x i = a + i b-a n ur i =0, 1,...,n. Definition 2 Sei f :[a, b] R eine beschr¨ankte Abbildung und Z =(x 0 ,x 1 ,...,x n ) eine Zerlegung. F¨ ur i =1, 2,...,n sei m i (f ) das Infimum und M i (f ) das Su- premum der Menge f ([x i-1 ,x i ]). Dann definiert man die Unter- bzw. die Ober- summe von f zur Zerlegung Z als U Z (f )= n X i=1 m i (f )(x i - x i-1 ) bzw. O Z (f )= n X i=1 M i (f )(x i - x i-1 ). Bemerkung 2 Ist stets f (x) 0, so ist die Untersumme eine untere, die Ober- summe eine obere Approximation an den noch zu definierenden Inhalt der Fl¨ache zwischen dem Graphen von f und der x-Achse. Es gelten folgende einfache, aber wichtige Rechenregeln und Definitionen: Lemma 1 Sei wieder f :[a, b] R eine beschr¨ankte Abbildung und Z eine Zerlegung. Dann gilt: a) U Z (f ) O Z (f ). b) Aus Z≤Z 0 folgt U Z (f ) U Z 0 (f ) und O Z 0 (f ) O Z (f ). c) Das Supremum U R b a f der U Z (f ) ¨ uber alle Zerlegungen existiert und es heißt das Unterintegral von f auf dem Intervall [a, b]. d) Das Infimum O R b a f der O Z (f ) ¨ uber alle Zerlegungen existiert und es heißt das Oberintegral von f auf dem Intervall [a, b]. e) Man hat stets U R b a f O R b a f . 1

Transcript of 1 Das Integral - math.uni-wuppertal.debongartz/anaskelett.pdf · De nition 3 Eine Funktion f:...

1 Das Integral

Stets seien a < b reelle Zahlen.

Definition 1 a) Eine Zerlegung Z von [a, b] ist eine endliche Folge Z =(x0 = a, x1, x2, . . . , xn = b) mit xi < xi+1 fur alle i zwischen 0 und n− 1.Die xi’s heißen die Teilungspunkte der Zerlegung.

b) Eine Zerlegung Z ′ = (x′0, x′1, x2, . . . , x

′n′) heisst feiner als Z = (x0, x1, x2, . . . , xn),

falls fur jedes i ein j existiert mit xi = x′j. Man schreibt dafur Z ≤ Z ′.

c) Sind Z ′ = (x′0, x′1, x2, . . . , x

′n′) und Z = (x0, x1, x2, . . . , xn) zwei Zerlegun-

gen, so ist Z∪Z ′ = (z0, z1, . . . , zm) die eindeutig bestimmte Zerlegung mit{z0, z1, . . . zm} = {x0, x1, . . . xn} ∪ {x′0, x′1, . . . x′n′}.

Bemerkung 1 Immer gilt Z ≤ Z ∪ Z ′.

Beispiel 1 Fur jede naturliche Zahl n ≥ 1 hat man die aquidistante Zerlegungmit den n+ 1 Teilungspunkten xi = a+ i b−a

n fur i = 0, 1, . . . , n.

Definition 2 Sei f : [a, b] → R eine beschrankte Abbildung und Z = (x0, x1, . . . , xn)eine Zerlegung. Fur i = 1, 2, . . . , n sei mi(f) das Infimum und Mi(f) das Su-premum der Menge f([xi−1, xi]). Dann definiert man die Unter- bzw. die Ober-summe von f zur Zerlegung Z als

UZ(f) =n∑

i=1

mi(f)(xi − xi−1) bzw. OZ(f) =n∑

i=1

Mi(f)(xi − xi−1).

Bemerkung 2 Ist stets f(x) ≥ 0, so ist die Untersumme eine untere, die Ober-summe eine obere Approximation an den noch zu definierenden Inhalt der Flachezwischen dem Graphen von f und der x-Achse.

Es gelten folgende einfache, aber wichtige Rechenregeln und Definitionen:

Lemma 1 Sei wieder f : [a, b] → R eine beschrankte Abbildung und Z eineZerlegung. Dann gilt:

a) UZ(f) ≤ OZ(f).

b) Aus Z ≤ Z ′ folgt UZ(f) ≤ UZ′(f) und OZ′(f) ≤ OZ(f).

c) Das Supremum U∫ b

af der UZ(f) uber alle Zerlegungen existiert und es

heißt das Unterintegral von f auf dem Intervall [a, b].

d) Das Infimum O∫ b

af der OZ(f) uber alle Zerlegungen existiert und es heißt

das Oberintegral von f auf dem Intervall [a, b].

e) Man hat stets U∫ b

af ≤ O

∫ b

af .

1

Definition 3 Eine Funktion f : [a, b] → R heißt (Riemann-) integrierbar, wennf beschrankt ist und Ober-und Unterintegral ubereinstimmen. Man nennt diese

Zahl dann das bestimmte Integral von f uber [a, b] und schreibt dafur∫ b

af . Fur

die Menge der integrierbaren Funktionen auf [a, b] schreibt man R([a, b])

Satz 1 Sei f : [a, b] → R eine Abbildung. Genau dann ist f integrierbar, wennf beschrankt ist und fur jedes ε > 0 eine Zerlegung Z existiert mit OZ(f) −UZ(f) < ε.

Satz 2 Sei f : [a, b] → R eine Abbildung. Falls f monoton ist oder stetig, soist f integrierbar.

Beispiele 1 a) Die Funktion f : [0, 1] → R mit f(x) = 1 fur rationale undf(x) = 0 fur irrationale Zahlen ist nicht integrierbar, weil jede Obersumme1 und jede Untersumme 0 ist.

b) Fur jedes x in [a, b] ist die Funktion ex : [a, b] → R mit ex(x) = 1 undex(y) = 0 fur y 6= x integrierbar mit Integral 0.

c) Fur a = b lassen wir auch die Zerlegung (x0 = a, x1 = b) zu. Dann istjede Funktion auf [a, a] integrierbar mit Integral 0.

Lemma 2 Sei f : [a, b] → R eine Abbildung. Sei a ≤ c ≤ b. Sei f1 : [a, c] → Rdefiniert durch f1(x) = f(x) und sei f2 : [c, b] → R analog definiert. Danngilt f ∈ R([a, b]) genau dann, wenn f1 ∈ R([a, c]) und f2 ∈ R([c, b]) gelten. In

diesem Fall ist∫ b

af =

∫ c

af1 +

∫ b

cf2.

Definiert man also in naheliegender Weise stuckweise monotone oder stuck-weise stetige Funktionen, so sind diese integrierbar.

Definition 4 Sei f : [a, b] → R eine Abbildung. Wir definieren f+ : [a, b] → Rdurch f+(x) = f(x) fur f(x) ≥ 0 und f+(x) = 0 sonst. Ferner sei f− : [a, b] →R gegeben durch f−(x) = −f(x) fur f(x) ≤ 0 und f+(x) = 0 sonst.

Satz 3 Seien f, g in R([a, b]). Dann gilt:

a) f + g ist integrierbar mit∫ b

a(f + g) =

∫ b

af +

∫ b

ag.

b) Fur jeden Skalar λ ist λf integrierbar mit∫ b

a(λf) = λ

∫ b

af .

c) f+, f− und | f |= f+ + f− sind integrierbar.

d) Aus f ≤ g ( d.h. fx ≤ gx fur alle x aus [a, b] ) folgt∫ b

af ≤

∫ b

ag.

e) |∫ b

af |≤

∫ b

a| f |≤‖ f ‖ (b− a) mit ‖ f ‖= sup | f | ([a, b]).

f) fg ist integrierbar.

2

Bemerkung 3 Die ersten beiden Teile des Satzes besagen gerade, dass R([a, b])ein Unterraum des Vektorraumes aller reellwertigen Abbildungen auf [a, b] ist

und∫ b

aeine lineare Abbildung ist. Es gibt noch einen allgemeineren Integral-

begriff als den Riemannschen, namlich den Lebesgueschen. Dieser liefert einenviel großeren Raum L([a, b]) von integrierbaren Funktionen und ein allgemei-neres Integral, das fur Riemann-integrierbare Funktionen mit dem Riemann-Integral ubereinstimmt. Der Ubergang von den rationalen Zahlen zu den reellenZahlen entspricht dabei dem Ubergang von den Riemann-integrierbaren zu denLebesgue-integrierbaren Funktionen. Das wird in Analysis 3 erklart.

Satz 4 ( Verallgemeinerter MWS der Integralrechnung ) Sei f : [a, b] → Rstetig, p : [a, b] → R integrierbar mit p ≥ 0. Dann existiert ein ξ aus [a, b] mit∫ b

a(fp) = f(ξ)

∫ b

ap. Speziell fur die Funktion p(x) = 1 fur alle x folgt also der

MWS: Es gibt ein ξ mit ∫ b

a

f = f(ξ)(b− a).

Satz 5 Sei (fn) eine Folge in R([a, b]), die gleichmaßig gegen f konvergiert.Dann ist auch f integrierbar und es gilt∫ b

a

f = lim(

∫ b

a

fn).

2 Der Hauptsatz der Differential- und Integral-rechnung

Definition 5 Fur integrierbares f : [a, b] → R definieren wir∫ a

bf = −

∫ b

af .

Satz 6 Sei f : [a, b] → R integrierbar. Definiere F : [a, b] → R durch F (x) =∫ x

af(t)dt. Dann gilt:

a) Fur alle x, y aus [a, b] ist | F (x)− F (y) |≤‖ f ‖| x− y |. Insbesondere istF Lipschitz-stetig.

b) Falls f in x0 aus [a, b] stetig ist, so ist F in x0 differenzierbar mit F ′(x0 =f(x0.

Definition 6 Sei I ein Intervall und f : I → R eine Abbildung. Eine FunktionF : I → R heißt Stammfunktion von f , falls F ′ = f .

Bemerkung 4 Im allgemeinen hat f keine Stammfunktion. Ist F eine Stamm-funktion von f , so auch F + c fur jede konstante Funktion c. Sind F und GStammfunktionen von f , so ist F − G eine konstante Funktion. Es gibt alsonicht die Stammfunktion. Man schreibt oft

∫f und meint damit eine Stamm-

funktion von f .

3

Satz 7 ( Hauptsatz der Differential-und Integralrechnung ) Sei I ein Intervallund f : I → R stetig. Dann gilt:

a) Fur jedes a ∈ I ist F (x) :=∫ x

af(t)dt eine Stammfunktion von f .

b) Fur jede Stammfunktion G von f und alle a < b mit a, b ∈ I gilt∫ b

af(t)dt =

G(b)−G(a) = [G]ba.

Bemerkung 5 a) Nicht jede Ableitung ist beschrankt oder sogar integrier-bar. Ein Beispiel ist f(x) = xsin(x−1) fur x 6= 0 und f0 = 0. Also ist eine’Formel’ wie

∫(f ′) = f im allgemeinen Unsinn, weil die linke Seite uber-

haupt nicht definiert ist. Aber selbst fur integrierbares f ′ ist die Formelmit Vorsicht zu genießen, weil die linke Seite nur bis auf Addition einerKonstanten festliegt.

b) Eine Formel wie (∫f)′ = f ist im allgemeinen ebenfalls Unsinn, z.B. fur

die integrierbaren Funktionen ex. Diese Formel ist sinnvoll fur stetigesf . Mit ihrer Hilfe erhalt man aus der Produktregel und der Kettenregel diebeiden folgenden Satze, die bei der Integration eine zentrale Rolle spielen.

Satz 8 ( Partielle Integration ) Seien f und g stetig differenzierbar auf [a, b].

Dann gilt∫(f ′g) = (fg)−

∫(fg′) bzw.

∫ b

a(f ′g) = [(fg)]ba −

∫ b

a(fg′)

Satz 9 ( Substitutionsregel ) Sei I ein Intervall und f : I → R stetig. Fernersei g : [a, b] → R stetig differenzierbar mit g([a, b]) ⊆ I. Dann gilt:∫ b

a

f(g(t))g′(t)dt =

∫ g(b)

g(a)

f(u)du.

Das Problem mit diesen beiden Integrationsmethoden - aber auch die Her-ausforderung an die mathematische Intuition - ist, dass es unendlich viele Artengibt, eine gegebene Funktion h als Produkt (f ′g) zu schreiben oder als Produkt(h ◦ g)g′. In der Literatur finden sich viele Tipps, was bei bestimmten Typenvon Funktionen zu tun ist. Aber selbst harmlos aussehende Funktionen lassensich nicht in geschlossener Form durch elementare Funktionen integrieren. Au-ßerdem ist die Darstellung einer Funktion als Integral oft aus theoretischen undnumerischen Grunden anderen Darstellungen vorzuziehen.

In der Vorlesung gab es zur Illustration nur ein paar nicht-triviale Beispieleund Anwendungen: Das Wallissche Produkt, die Stirlingsche Formel und dieFormel fur den Flacheninhalt des Kreises. All das kann man im Forster gutnachlesen.

3 Approximation durch Polynome

Stets sei I ein Intervall, f : I → R eine stetige Abbildung eventuell mit gewissenzusatzlichen Eigenschaften. Gesucht ist ein Polynom bzw. eine polynomiale Ab-bildung P , die f moglichst gut annahert. Dabei sind viele verschiedene Begriffeder ’Annaherung’ zu unterscheiden:

4

• ( Interpolation ) P soll an endlich vielen vorgegebenen Stellen mit f uber-einstimmen.

• ( Taylor-Polynom und Taylor-Reihe ) P und f sollen in einem Punktgleiche Ableitungen haben bis zu einer gewissen Ordnung.

• ( Gleichmaßige Approximation ) Das Supremum der Differenzen der Funk-tionswerte von f und P soll klein sein.

• ( Approximation im Mittel ) Das Integral von | f − P |2 soll klein sein.

Wir werden uns in diesem Kapitel mit den ersten drei Begriffen auseinanderset-zen und beginnen mit dem einfachsten.

Satz 10 Seien x0, x1, . . . , xn paarweise verschiedene Elemente aus I und seieny0, y1, . . . , yn beliebige reelle Zahlen. Dann gibt es genau ein Polynom vom Gradhochstens n mit reellen Koeffizienten, derart dass P (xi) = yi fur alle i gilt.Insbesondere gibt es zu jeder Funktion f : I → R genau ein Polynom vom Gradhochstens n mit f(xi) = P (xi) fur i = 0, 1, . . . , n.

Im folgenden benotigen wir einige grundlegende Satze aus der Analysis I, andie wir nun erinnern. Dabei sei stets I ein Intervall mit mindestens 2 Punkten.Stets sei f : I → R stetig und es sei hn : I → R eine gleichmaßig gegen hkonvergente Folge von Funktionen. Dann gilt:

• Das Bild J := f(I) ist ein Intervall.

• f ist injektiv genau dann, wenn f strikt monoton ist. In diesem Fall istdie induzierte Abbildung g : I → J mit g(x) = f(x) invertierbar mitstetiger Umkehrabbildung. Ist g sogar auf I differenzierbar, so ist g−1

genau dann differenzierbar auf J , wenn g′(x) 6= 0 fur alle x ∈ I. Es istdann (g−1)′(x) = 1

g′(g−1(x)) fur alle x.

• Sind alle hn stetig, so auch h.

• Sind alle hn integrierbar, so auch h. Ferner gilt∫h = lim

∫hn.

• Sind alle hn differenzierbar und konvergiert die Folge der Ableitungen h′ngegen eine Funktion g, so ist h differenzierebar und g ist die Ableitung.

• Die wichtigste Anwendung finden die letzten drei Satze bei Potenzrei-hen. Sei P (x) =

∑∞n=0 an(x − a)n eine Potenzreihe mit Konvergenzra-

dius R > 0. Setzt man dann Q(x) =∑∞

n=0 ann(x − a)n−1 und R(x) =∑∞n=0

an

n+1 (x− a)n+1, so haben Q(x) und R(x) ebenfalls Konvergenzradi-us R und es gilt P ′(x) = Q(x) und R′(x) = P (x) fur alle x im Innerendes Konvergenzkreises. Kurz: Potenzreihen darf man gliedweise dif-ferenzieren und integrieren .

5

Definition 7 Sei f : I → R eine n + 1-mal stetig differenzierbare Funktion.Sei a ein Punkt aus I. Dann heisst

Ta,nf(x) =n∑

i=0

f i(a)

i!(x− a)i

das Taylorpolynom zu f vom Grad n an der Stelle a. Die Differenz Ra,nf(x) =f(x)−Ta,nf(x) heisst n-tes Restglied. Ist f beliebig oft auf I differenzierbar, soheisst

Ta,f(x) =∞∑i=0

f i(a)

i!(x− a)i

Taylorreihe von f in a.

Bemerkungen 1 • Die ite Ableitung von f bezeichnen wir mit f (i) oder

mit di

dxi f .

• Das Taylorpolynom ist das eindeutig bestimmte Polynom P vom Grad ndessen Ableitungen an der Stelle a bis zur Ordnung n mit denen von fubereinstimmen.

• Taylorpolynom und Taylorreihe hangen nur von einer ε-Umgebung von aab. Die Reihe konvergiert genau dann im Punkt x gegen die Ausgangs-funktion f , wenn das Restglied an dieser Stelle gegen 0 konvergiert.

• Ist P =∑∞

i=0 ai(x−a)i eine Potenzreihe mit Konvergenzradius R > 0, soist P auch die Taylorreihe zu der durch P im Inneren des Konvergenzkrei-ses gegebenen Funktion . Somit kennen wir die Taylorreihen an der Stelle0 von exp, sin, cos.

• Man kann fur f(x) = ln(1 − x) direkt induktiv die Taylorreihe in 0 aus-rechnen, aber man benutzt besser die geometrische Reihe und gliedweiseIntegration. Der gleiche Trick funktioniert auch noch in anderen Fallen,etwa fur arctan(x) in 0.

Satz 11 Sei f : I → R n+1-mal stetig differenzierbar und a aus I. Dann gilt:

a) Ra,nf(x) =1n!

∫ x

a(x− t)nf (n+1)(t)dt. ( Integralform des Restglieds )

b) Ra,nf(x) =1

(n+1)! (x − a)n+1f (n+1)(ξ) fur ein ξ zwischen a und x. ( La-

grangesche Form des Restglieds )

c) Es ist Ra,nf(x) = η(x)(x − a)n fur eine Funktion η mit η(x) → 0 furx→ a.

Dieser Satz liefert ein gutes hinreichendes Kriterium fur Extremstellen, dasunsere fruheren Ergebnisse verallgemeinert und in den Ubungen besprochenwird.

Auf dem Konvergenzkreis einer Potenzreihe kann Divergenz oder Konver-genz vorliegen. Wie wir nun sehen, erhalt man im zweiten Fall interessanteGrenzwerte aus Stetigkeitsaussagen.

6

Lemma 3 ( Abelsche partielle Summation ) Seien c0, c1, . . . , cn und d0, d1, . . . , dnkomplexe Zahlen. Setze Cm =

∑mi=0 ci fur m = 0, 1, . . . n und C−1 = 0. Dann

gilt:n∑

i=0

cidi =n−1∑i=0

Ci(di − di+1) + Cndn.

Satz 12 ( Grenzwertsatz von Abel ) Sei P (x) =∑an(x − a)n eine komplexe

Potenzreihe mit Konvergenzradius 0 < R < ∞. In einem Punkt b auf demRand des Konvergenkreises sei die Reihe konvergent gegen c. Dann konvergiertdie Reihe gleichmaßig auf jeder Teilmenge D des Konvergenzkreises, auf der| b − x | /(R− | x − a |) beschrankt bleibt. Insbesondere ist P auf D ∪ {b}definiert und stetig. Es gilt P (b) = c.

Beispiele 2 • Fur D ist immer die Strecke zwischen a und b zugelassen.

• ln(2) = 1− 12 + 1

3 − . . .

• π4 = 1− 1

3 + 15 − 1

7 + . . ..

Binomialreihe

Lemma 4 Seien f, g auf dem Intervall I n-mal differenzierbar. Dann gilt

(fg)(n) =

n∑i=0

(n

i

)f (i)g(n−i).

Proposition 1 a) Die Funktion f : R → R mit f(x) = 0 fur x ≤ 0 undf(x) = exp(− 1

x ) fur x > 0 ist beliebig oft differenzierbar und alle Ablei-tungen verschwinden im Nullpunkt ( ’f ist platt in 0’ ).

b) Zu beliebigen reellen Zahlen a < a′ < b′ < b gibt es eine beliebig oftdifferenzierbare Funktion h : R → R mit 0 ≤ h(x) ≤ 1 fur alle x, h(x) =1 fur x aus [a′, b′] sowie h(x) = 0 fur x außerhalb von [a, b] ( h heißt’Hutfunktion’ ).

Satz 13 ( E.Borel ) Jede reelle Potenzreihe∑anx

n ist die Taylorreihe einerbeliebig oft differenzierbaren Funktion f : R → R.

Bemerkung 6 Fur eine auf einem Intervall I mit a ∈ I beliebig oft differen-zierbare Funktion f existiert immer die Taylor-Reihe T um a, aber folgendeFalle treten auf:

• T hat Konvergenzradius 0.

• T hat Konvergenzradius R > 0, aber die Potenzreihe zu T stimmt nichtmit der Ausgangsfunktion uberein.

• T hat Konvergenzradius R > 0 und im Inneren des Konvergenzkreisesstimmen f und die Potenzreihe zu T uberein. Eventuell ist aber der Kon-vergenzbereich viel kleiner als I.

7

Definitionen 1 Sei (X, d) ein metrischer Raum und Y eine Teilmenge.

a) Eine offene Uberdeckung von Y ist eine Familie (Ui)i∈I von offenen Men-gen Ui, derart dass Y ⊆ ∪i∈IUi gilt.

b) Eine solche offene Uberdeckung besitzt eine endliche Teiluberdeckung, fallses eine endliche Teilmenge J von I gibt, so dass Y ⊆ ∪j∈JUj gilt.

c) Y heißt kompakt, wenn jede offene Uberdeckung von Y eine endliche Teiluber-deckung besitzt.

d) Y heißt folgenkompakt, wenn jede Folge (yn) aus Y eine konvergente Teil-folge besitzt mit Grenzwert in Y .

Lemma 5 ( Lebesgue ) Sei Y folgenkompakt in einem metrischen Raum undsei (Ui)i∈I eine offene Uberdeckung von Y . Dann gibt es ein ε > 0, so dass furjedes y ∈ Y ein Index iy existiert mit Uε(y) ⊆ Uiy .

Satz 14 Eine Teilmenge eines metrischen Raumes ist genau dann kompakt,wenn sie folgenkompakt ist.

Definition 8 Sei K ein kompakter metrischer Raum und C0(K,R) die Mengeder stetigen Funktionen f : K → R versehen mit der Supremumsnorm ‖f‖ =sup | f(x) |. Eine Teilmenge D von C0(K,R) trennt die Punkte, wenn es zux 6= y aus K stets eine Funktion f aus D gibt mit f(x) 6= f(y).

Definition 9 Eine Teilmenge D von C0(K,R) heißt Unteralgebra, falls sie ab-geschlossen ist unter Addition und Multiplikation und die Eins 1 enthalt.

Beispiel 2 Fur K = [a, b] ist die Menge der Polynome eine Unteralgebra, diedie Punkte trennt.

Satz 15 ( Stone-Weierstrass ) Sei K ein kompakter metrischer Raum und Deine Unteralgebra von C0(K,R), die die Punkte trennt. Dann gibt es zu jedemf ∈ C0(K,R) und jedem ε > 0 ein g ∈ D mit ‖f − g‖ < ε.

Folgerung 1 ( Klassischer Satz von Weierstrass ) Jede stetige Funktion f :[a, b] → R ist gleichmaßiger Grenzwert einer Folge von Polynomen.

4 Grundlagen aus der mengentheoretischen To-pologie

Definition 10 Sei V ein R-Vektorraum.

a) Ein Skalarprodukt auf V ist eine positiv definite, symmetrische, bilineareAbbildung [ , ] : V × V → R. Fur alle Vektoren x, y, z und alle Skalarea, b gilt also [x, x] ≥ 0 und [x, x] = 0 nur fur x = 0, [x, y] = [y, x] und[ax + by, z] = a[x, z] + b[y, z]. Ein Vektorraum mit einem Skalarproduktheißt Euklidischer Raum. Zwei Vektoren x, y heissen orthogonal, wenn[x, y] = 0.

8

b) Eine Norm auf V ist eine Abbildung ‖ ‖: V → R mit ‖ x ‖≥ 0 mitGleichheit genau fur x = 0, ‖ ax ‖=| a |‖ x ‖ und mit ‖ x + y ‖≤‖ x ‖+ ‖ y ‖ fur alle Vektoren x, y und alle Skalare a. Das Paar V, ‖ ‖) heißtnormierter Raum.

Lemma 6 Sei V ein Euklidischer Raum. Dann gilt:

a) ( Cauchy-Schwarzsche Ungleichung ) Fur alle x, y gilt [x, y]2 ≤ [x, x][y, y].Gleichheit gilt genau dann, wenn x und y linear abhangig sind.

b) Durch ‖ x ‖:=√[x, x] wird eine Norm auf V induziert.

Beispiele sind V = Rn mit dem Skalarprodukt [x, y] =∑n

i=1 xiyi und V =

C0([a, b], R mit dem Skalarprodukt [f, g] =∫ b

afg. Die zugehorige Norm wird

mit ‖ f ‖2 bezeichnet.

Definition 11 Ein metrischer Raum (X, d) ist eine Menge X versehen miteiner Abbildung d : X×X → R, so dass d(x, y) ≥ 0 mit Gleichheit genau fur x =y, d(x, y) = d(y, x) und d(x, y) ≤ d(x, z) + d(z, y) fur alle x, y, z gelten. d(x, y)heißt dann der Abstand von x und y bezuglich der Metrik d. Die Ungleichungheißt Dreiecksungleichung.

Jeder normierte Raum wird durch d(x, y) =‖ x − y ‖ zu einem metri-schen Raum und jede Teilmenge eines metrischen Raumes wird durch die Ein-schrankung der Metrik zu einem metrischen Raum.

Definition 12 Sei (X, d) ein metrischer Raum.

• Fur ε > 0 und x aus X ist die ε−Umgebung Uε(x) definiert als die Mengealler Punkte x′ aus X mit d(x, x′) < ε.

• Eine Teilmenge U von X heißt offen in X, wenn es zu jedem u aus U ein( von u abhangiges ) ε > 0 gibt, derart dass Uε(u) in U liegt.

• Eine Teilmenge A heißt abgeschlossen in X, wenn ihr Komplement offenist.

• Eine offene Umgebung eines Punktes x ist eine offene Teilmenge von X,die x enthalt.

• Eine Folge (xn) in X heißt konvergent mit Grenzwert x, falls ein Punktx in X existiert, so dass (d(xn, x)) eine Nullfolge ist. Die Folge heißtCauchy-Folge, falls zu jedem ε > 0 ein n0 existiert mit d(xn, xm) < ε furalle n,m ≥ n0.

• X heißt vollstandig, wenn jede Cauchy-Folge in X konvergiert.

• Eine Teilmenge B heißt beschrankt, wenn es einen Punkt x aus X undeine Konstante C gibt mit d(b, x) < C fur alle b aus B gibt.

9

Jede Folge hat hochstens einen Grenzwert, und jede konvergente Folge isteine Cauchy-Folge. Die Eigenschaften ’offen’ und ’abgeschlossen’ hangen von derumgebenden Menge ab, die Eigenschaft ’kompakt’ nicht.

Lemma 7 Sei X ein metrischer Raum mit einer Teilmenge A. Genau dannist A abgeschlossen in X, wenn A die Grenzerte aller konvergenten Folgen (an)mit Folgegliedern aus A enthalt.

Satz 16 Sei X ein metrischer Raum und K eine Teilmenge. Dann gilt:

a) Ist K kompakt, so ist K abgeschlossen in X und beschrankt.

b) Ist A eine Teilmenge der kompakten Menge K, die in K abgeschlossen ist,so ist A kompakt.

Definition 13 Zwei Normen ‖ ‖ und ‖ ‖′ auf dem gleichen Vektorraum V hei-ßen aquivalent, wenn es Konstanten C,D gibt mit

‖ x ‖≤ C ‖ x ‖′ und ‖ x ‖′≤ D ‖ x ‖ fur alle x.

Aquivalente Normen induzieren die gleichen offenen Mengen, die gleichenkonvergenten Folgen etc. , obwohl die ε-Umgebungen sehr verschieden aussehenkonnen.

Definition 14 Ein normierter Raum, der bezuglich der induzierten Metrik vollstandigist, heißt Banachraum.

Satz 17 Sei V ein endlichdimensionaler normierter Raum. Dann gilt:

a) Je zwei Normen auf V sind aquivalent.

b) V ist ein Banachraum.

c) Eine Teilmenge von V ist kompakt genau dann, wenn sie abgeschlossenund beschrankt ist.

C0([a, b],R) ist bezuglich der Supremumsnorm ‖ ‖∞ vollstandig, aber nichtbezuglich ‖ ‖2. Die abgeschlossene Einheitskugel ist in beiden Normen nichtkompakt.

Definition 15 Sei f : X → Y eine Abbildung zwischen metrischen Raumen.

a) f heißt stetig im Punkt x, falls zu jedem ε > 0 ein δ > 0 existiert, so dassd(fx, fx′) < ε gilt fur alle x′ mit d(x, x′) < δ.

b) f heißt stetig auf X, falls f in jedem Punkt stetig ist.

c) f heißt gleichmaßig stetigstetig , falls zu jedem ε > 0 ein δ > 0 existiert,so dass d(fx, fx′) < ε gilt fur alle x, x′ mit d(x, x′) < δ.

Satz 18 Sei f : X → Y eine Abbildung zwischen metrischen Raumen. Danngilt:

10

a) f ist stetig in x genau dann, wenn fur jede gegen x konvergente Folge (xn)die Folge der Bilder (fxn) gegen fx konvergiert.

b) f ist stetig auf X genau dann, wenn das Urbild jeder in Y offenen Mengeoffen ist in X.

c) Die analoge Aussage gilt fur abgeschlossene Mengen.

Trivialerweise ist die Komposition stetiger Abbildungen stetig.

Satz 19 Sei f : X → Y stetig und X kompakt. Dann gilt:

a) f ist gleichmaßig stetig.

b) Das Bild von X ist kompakt. Insbesondere nimmt fur Y = R die Funktionf ihr Minimum und ihr Maximum an.

Definition 16 Sei f : V → W eine lineare Abbildung zwischen normiertenRaumen. Setze dann ‖ f ‖ gleich dem Supremum uber alle ‖ fx ‖, wobei x alleVektoren der Norm 1 durchlauft. Falls dies eine relle Zahl ist, heißt f beschrankt.

Lemma 8 Fur eine lineare Abbildung f : V →W zwischen normierten Raumensind gleichwertig:

a) f ist gleichmaßig stetig.

b) f ist stetig in 0.

c) Es gibt eine Konstante C mit ‖ fx ‖≤ C ‖ x ‖ fur alle x.

d) f ist beschrankt.

Es gilt dann ‖ fx ‖≤‖ f ‖‖ x ‖ fur alle x.

Nimmt man V = W = C0([0, 1],R) so ist die Identitat nicht beschrankt,wenn man auf zuerst die Integralnorm und dann die Supremumsnorm nimmt.

Satz 20 Seien f : V → W und g : W → U lineare Abbildungen zwischenendlichdimensionalen normierten Raumen. Dann gilt:

a) f ist beschrankt. Man erhalt durch f 7→‖ f ‖ eine Norm auf dem Vektor-raum Hom(V,W ), die sogenannte Operatornorm.

b) ‖ gf ‖≤‖ g ‖‖ f ‖ .

Satz 21 ( Banachscher Fixpunktsatz ) Sei f : X → X eine Selbstabbildungeines vollstandigen metrischen Raumes X. Es gebe eine Konstante K < 1 mitd(fx, fx′) ≤ Kd(x, x′) fur alle x, x′ aus X. Dann hat f genau einen Fixpunktx0 in X. Dabei gilt folgender Zusatz: Wahlt man x beliebig und definiert rekursivx1 = x sowie xn+1 = fxn, so konvergiert (xn) gegen x0 und es gilt d(x0, xn) ≤Kn

1−K d(x0, x1).

11

5 Die Ableitung

Definition 17 Seien V,W normierte Vektorraume endlicher Dimension. SeiU eine offene Teilmenge von V und sei x ∈ U . Eine Abbildung f : U → Wheißt differenzierbar an der Stelle x mit Ableitung f ′(x) = Df(x) = A, fallseine lineare Abbildung A : V →W existiert mit

f(x+ h) = f(x) +A(h) + ρ(h)

fur alle h ∈ V , so dass x+h zu U gehort. Schreibt man dabei ρ(h) = ρ(h) ‖ h ‖,so muß fur h→ 0 auch ρ(h) → 0 gelten, d.h. zu jedem ε > 0 existiert ein δ > 0mit ‖ ρ(h) ‖< ε fur alle h 6= 0 mit x+ h ∈ U und ‖ h ‖< δ.

Ist f in jedem Punkt aus U differenzierbar, so heißt f differenzierbar auf U .

Bemerkungen 2 • Wegen der Offenheit von U gibt es ein ζ > 0, so dassfur alle h mit ‖ h ‖< ζ stets x+h ∈ U gilt. Fur alle solche h sind also ρ(h)und ρ(h) definiert, wobei man ρ(0) = 0 vereinbart. Die Differenzierbarkeitin x hangt nur ab von einer ( beliebig kleinen ) offenen Umgebung von x.

• A und damit auch ρ liegen bei dieser Definition eindeutig fest. Ferner folgtdie Stetigkeit in x aus der Differenzierbarkeit.

• Aquivalente Normen liefern den gleichen Differenzierbarkeitsbegriff unddie gleiche Ableitung. Im endlichdimensionalen Fall ist also alles eindeu-tig.

• Eine sogenannte affine Abbildung f : V → W ( d.h. es ist f(x) = Ax+ bfur eine fest gewahlte lineare Abbildung A und einen festen Vektor b ) istin jedem Punkt x differenzierbar mit f ′(x) = A.

• Ist f auf U differenzierbar, so hat man die Abbildung f ′ : U → Hom(V,W ).

• Die Summe von zwei in x differenzierbaren Funktionen ist differenzierbarund es gilt f ′x + g′x = (f + g)′x. Fur skalare Vielfache gilt die analogeAussage.

Satz 22 ( Kettenregel ) Seien X,Y, Z normierte Raume, X ′ offen in X undY ′ offen in Y . Ferner seien f : X ′ → Y ′ und g : Y ′ → Z Abbildungen. Istdann f differenzierbar in x und g in fx, so ist g ◦ f differenzierbar in x undes gilt (g ◦ f)′(x) = g′(fx)f ′(x), wobei rechts die Komposition zweier linearerAbbildungen steht.

Um mit den Ableitungen rechnen zu konnen, fuhren wir nun Koordinatenein und wir identifizieren eine lineare Abbildung von Rn nach Rm mit einerm × n-Matrix. Mit pj : Rm → R bezeichnen wir die Projektion auf die j-teKomponente und mit fj = pj◦f die j-te Komponentenfunktion einer Abbildung

f : U → Rm.

12

Definition 18 Sei U eine offene Teilmenge von Rn, f : U → R, u ∈ Uund v ∈ Rn beliebig. Wegen der Offenheit von U existiert ein ε > 0 mit u +tv ∈ U fur alle |t| < ε und es ist g = gv :] − ε, ε[→ U mit g(t) = u + tv)differenzierbar in 0 mit Ableitung v. Falls f ◦ gv in 0 differenzierbar ist, soheisst f an der Stelle u differenzierbar in Richtung v und wir schreiben Dvf(u)fur diese Richtungsableitung von f in Richtung v im Punkt u. Speziell fur v = eischreibt man kurzer Di statt Dei und wir nennen dies die i.te partielle Ableitungvon f an der Stelle u. Man schreibt dafur auch ∂f

∂xi(u).

Falls fur f : U → Rm alle partiellen Ableitungen aller Komponentenfunktio-nen an der Stelle u existieren, so definiert man die Jacobi-Matrix Jf (u) als diem× n-Matrix mit Djfi(u) in der i-ten Zeile und j-ten Spalte.

Satz 23 Sei f : U → Rm eine auf einer offenen Teilmenge U des Rn definierteAbbildung. Dann gilt:

a) f ist genau dann differenzierbar in x, wenn alle Komponentenfunktionenfj in x differenzierbar sind. Dabei ist f ′(x) die Matrix, deren i-te Zeilegerade aus der 1× n-Matrix f ′i(x) besteht.

b) Ist f in u differenzierbar, so existieren dort alle partiellen Ableitungen undes gilt f ′(u) = Jf (u).

c) Genau dann existieren alle partiellen Ableitungen Difj aller fj auf Uund sind dort stetig, wenn f auf U differenzierbar ist und die Abbildungf ′ : U → Hom(Rn,Rm) = Rm×n stetig ist.

Bemerkungen 3 • Jedes Difj ist wieder eine Abbildung von U nach Rund kann erneut partiell abgeleitet werden.

• Die Existenz aller partieller Ableitungen reicht nicht aus fur die Existenzder ( totalen ) Ableitung.

Definition 19 Sei f : U → Rm wie im Satz. f heißt k-mal stetig differenzierbarauf U , falls fur alle Indizes i1, i2, . . . , ir mit r ≤ k und alle j die partielleAbleitung DikDik−1

. . . Di1fj existiert und stetig ist. Man schreibt Ck(U,Rm)fur die Menge dieser Funktionen.

Satz 24 ( Satz von Schwarz ) Fur jede C2-Funktion f : U → R gilt DiDjf =DjDif fur alle i und j.

Der Satz bleibt nicht gultig ohne die Stetigkeit der partiellen Ableitungen.

6 Lokale Eigenschaften

Stets sei f : U → R eine Abbildung von einer offenen Teilmenge des Rn nachR. Mit AT bezeichnen wir die transponierte Matrix zu A. A heißt symmetrisch,falls A = AT .

13

Definition 20 a) f hat ein lokales Maximum bzw. isoliertes Maximum inu ∈ U , falls auf einer ε-Umgebung von u gilt fx ≤ fu bzw. fx < fu.Analoges definiert man fur Minima. Ein Extremum ist ein Minimum oderMaximum.

b) Ist f differenzierbar auf U so ist der Gradient von f das Vektorfeld gradf :U → Rn definiert durch gradf(u) = f ′(u)T . u heisst stationarer Punktvon f , wenn gradf(u) = 0. Ein stationarer Punkt, an dem f kein lokalesExtremum hat, heisst Sattelpunkt.

Der Gradient zeigt die Richtung der starksten Anderung von f an.

Satz 25 Sei f differenzierbar auf U . Hat f ein lokales Extremum in u, so istu ein stationarer Punkt.

Beispiel 3 Sei A eine symmetrische Matrix und fx = xTAxxT x

auf der MengeU aller Vektoren 6= 0 definiert. Dann ist fU das Bild der Menge der Einheits-vektoren. Also hat f ein lokales Maximum und somit einen stationaren Punktu. Nach Quotientenregel ist dies ein Eigenvektor zum ( maximalen ) EigenwertuTAu von A. Induktiv folgt leicht, dass A diagonalisierbar ist und eine Ortho-normalbasis aus Eigenvektoren besitzt.

Definition 21 a) Fur h ∈ Rn ist Dh der Differentialoperator∑n

i=1 hiDi.Dann ist Dhf(u) die Richtungsableitung von f in Richtung h an der Stelleu.

b) Fur f aus C2 ist die Hesse-Matrix Hf (u) zu f an der Stelle u definiertals die symmetrische (!) Matrix mit DiDjf(u) in der iten Zeile und jtenSpalte.

Satz 26 ( Taylor-Formel ) Sei f k + 1-mal stetig differenzierbar auf U . Sei uaus U und ε > 0 so gewahlt, dass Uε(u) ganz in U liegt. Dann gilt fur alle h mit‖ h ‖< ε die Taylor-Formel

f(u+ h) =k∑

i=0

1

i!(Dh)

if(u) +1

(k + 1)!(Dk+1

h )f(u+ th)

fur ein t zwischen 0 und 1. Dabei geht der letzte Term fur h → 0 von hohererOrdnung als k gegen 0. Speziell fur k = 2 gilt

f(u+ h) = f(u) + [gradf(u), h] +1

2[h,Hf (u)h] + ρ(h)

mit ρ‖h‖2 → 0 fur h→ 0.

Definition 22 Eine symmetrische Matrix A heisst positiv definit bzw. positivsemi-definit, wenn xTAx > 0 bzw. ≥ 0 fur alle x 6= 0 gilt. Analog definiertman negativ definit bzw. negativ semi-definit. A heisst indefinit, wenn sowohlxTAx > 0 als auch yTAy < 0 fur geeignete x, y auftritt.

14

Bemerkung 7 Eine Diagonalmatrix D ist positiv definit bzw. positiv semi-definit bzw. indefinit genau dann, wenn alle Diagonaleintrage dii > 0 bzw. ≥ 0bzw. einer > 0 und ein anderer < 0 ist.

Satz 27 Sei A eine symmetrische Matrix. Dann kann man mit dem Gauss-Algorithmus eine invertierbare Matrix S konstruieren, derart dass SAST = Deine Diagonalmatrix ist. Dabei ist A positiv definit bzw semi-definit bzw. inde-finit genau dann, wenn das entsprechende fur D gilt.

Satz 28 Sei A eine symmetrische Matrix. Dann sind gleichwertig:

a) A ist positiv definit.

b) Fur alle i = 1, 2, . . . n ist der sogenannte Hauptminor det(Ai) > 0. Dabeiist Ai die i× i-Untermatrix von A in der linken oberen Ecke.

c) Man kann in endlich vielen Schritten eine untere Dreiecksmatrix L mitlauter Einsen auf der Diagonalen konstruieren , so dass LALT = D eineDiagonalmatrix mit dii > 0 fur alle i ist.

d) Alle Eigenwerte von A sind > 0.

Bemerkung 8 Eine symmetrische Matrix A ist genau dann positiv definit,wenn eine Konstante C > 0 existiert mit xTAx ≥ CxTx fur alle Vektorenx.

Satz 29 Sei f dreimal stetig differenzierbar und u ein stationarer Punkt. Danngilt:

a) Ist Hf (u) positiv definit, so hat f in u ein ( isoliertes ) lokales Minimum.

b) Hat f in u ein lokales Minimum, so ist Hf (u) positiv semi-definit.

c) Die analoge Aussage gilt fur lokale Maxima.

d) Ist Hf (u) indefinit, so ist u ein Sattelpunkt.

7 Der Satz von der inversen Funktion

In diesem Abschnitt arbeiten wir der Einfachheit halber stets mit der Maximums-Norm und der Zeilensummennorm als zugehoriger Operatornorm und schreibenkurz ‖ x ‖ statt ‖ x ‖∞. Ferner bezeichnen wir mit Kr(u) die Menge aller x mit‖ x− u ‖≤ r und nennen dies die abgeschlossene Kugel um u mit Radius r.

Satz 30 ( Mittelwertsatz ) Sei f : U → Rm eine C1-Funktion definiert aufeiner offenen Teilmenge U des Rn. Fur u ∈ U sei r > 0 so gewahlt, dass Kr(u)in U liegt. Sei M das Maximum aller ‖ f ′(x) ‖ mit x ∈ Kr(u). Dann gilt

‖ fx− fx′ ‖≤M ‖ x− x′ ‖

fur alle x, x′ aus Kr(u).

15

Definition 23 Ein Diffeomorphismus f ist eine bijektive Abbildung f : U → Vzwischen nicht-leeren offenen Teilmengen des Rn bzw. Rm, so dass f und dieUmkehrabbildung f−1 uberall differenzierbar sind. Ist f eine Ck-Abbildung mitk ≥ 1, so heisst f ein Ck-Diffeomorphismus.

Bemerkung 9 Ist f ein Diffeomorphismus, so folgt aus der Kettenregel, dassn = m und (f−1)′(y) = (f ′(f−1(y)))−1 fur alle y gilt. Insbesondere ist dann mitf auch f−1 eine C1-Abbildung.

Jede affine Abbildung x 7→ Ax + b mit invertierbarer Matrix A ist ein C∞-Diffeomorphismus von Rn nach Rn.

Satz 31 ( Satz von der inversen Funktion ) Sei f : U → Rn eine C1-Funktiondefiniert auf einer offenen Teilmenge U des Rn. Fur ein u ∈ U sei f ′(u) inver-tierbar. Dann gibt es offene Umgebungen U1 von u und V1 von fu, so dass dieAbbildung f1 : U1 → V1 definiert durch f1x = fx ein C1-Diffeomorphismus ist.

Lokal in einer ganzen offenen Umgebung vom Punkt u ist also f invertierbar,falls die Ableitung f ′(u) nur in dem Punkt invertierbar ist. Der Satz verallge-meinert sich leicht auf Ck-Funktionen mit beliebigem k ≥ 1.

8 Implizite Funktionen und Untermannigfaltig-keiten

Fur n > m schreiben wir einen Vektor x in Rn als Spalte

[x′

x′′

]mit x′ ∈ Rn−m

und x′′ ∈ Rm sowie eine m × n-Matrix A als eine Zeile[A′ A′′ ]

bestehendaus einer m× (n−m)-Matrix A′ und einer m×m-Matrix A′′.

Satz 32 (Satz von der impliziten Funktion ). Sei U offen in Rn, f : U → Rm

eine C1-Funktion, u =

[u′

u′′

]in U und b = fu. Ferner gelte fur f ′(x) =

Jf (x) =[(Jf (x))

′ (Jf (x))′′ ]

, dass Jf (u)′′ invertierbar ist. Dann gibt es

offene Umgebungen U ′ von u′ und U ′′ von u′′ sowie eine C1-Abbildung g :U ′ → U ′′, so dass der Graph Γ(g) von g der Durchschnitt von f−1(b) mitder U ′ × U ′′ ist. g ist i.a. nicht explizit bekannt, aber fur die Ableitung gilt

g′(h(x′)) = −((Jf (hx′))′′)−1(Jf (hx

′))′. Dabei ist hx′ =

[x′

gx′

]Satz 33 ( Extrema mit Nebenbedingungen ) Sei U offen in Rn und seien h :U → R sowie f : U → Rm stetig differenzierbare Abbildungen. Setze M =f−1(0) und es sei der Rang von f ′(u) fur alle u ∈M gleich m. Ist dann x ∈ Ueine Extremstelle von h unter der Nebenbedingung f(u) = 0 ( d.h. es ist x ∈Mund es gibt eine in U enthaltene ε-Umgebung V von x, so dass fur alle u ∈M ∩ V gilt h(u) ≤ h(x) bzw. h(u) ≥ h(x) ), so gibt es Skalare λ1, . . . , λm mith′(x) =

∑mi=1 λif

′i(x). Die eindeutig bestimmten Skalare heißen Lagrangesche

Multiplikatoren.

16

Wie das Verschwinden des Gradienten ist dies nur ein notwendiges Kriteriumfur eine Extremstelle. Die Existenz muß gesondert nachgewiesen werden.

Im folgenden fassen wir fur m < n den Rm als Unterraum von Rn auf, deraus allen Spalten besteht, deren letzte n−m Komponenten verschwinden.

Definition 24 Eine nicht-leere Teilmenge M des Rn heißt m-dimensionaleCk-Untermannigfaltigkeit, falls es fur jeden Punkt p ∈M eine offene UmgebungU und eine offene Menge V gibt, sowie einen Ck-Diffeomorphismus h : U → Vmit h(M ∩ U) = V ∩ Rm. Dabei sei k ≥ 1. Ein Vektor v ∈ Rn ist dann einTangentenvektor an M in p, wenn es fur eine ε-Umgebung I von 0 in R einedifferenzierbare Abbildung α : I → Rn gibt mit α(t) ∈ M fur alle t, α(0) = pund α′(0) = v. Die Menge TpM aller solcher Tangentenvektoren heißt Tangen-tialraum an M im Punkt p.

Lokal um p liegt also nach dem ’krummlinigen’ Koordinatenwechsel h dieMenge M so in Rn wie Rm und ein Tangentialvektor ist die Tangente an eineKurve durch p.

Wir betrachten von jetzt an der Einfachheit halber nur noch den Fall k = 1.Eine Ebene im Raum kann man bekanntlich entweder durch eine Gleichungoder durch eine Parameterdarstellung angeben. Eine analoge Aussage gilt furUntermannigfaltigkeiten.

Satz 34 Sei m < n und M eine nicht-leere Teilmenge von Rn. Dann sindaquivalent:

a) M ist eine m-dimensionale C1-Untermannigfaltigkeit des Rn.

b) Zu jedem p ∈ M gibt es eine offene Umgebung U und eine C1-Abbildungf : U → Rn−m mit Rangf ′(p) = n−m, so dass M ∩U = f−1(0). ( ’Lokalwird M durch n−m Gleichungen beschrieben. ’)

c) Zu jedem p ∈ M gibt es eine offene Umgebung U , eine offene Nullum-gebung P in Rm, eine C1-Abbildung φ : P → Rn mit φ(0) = p undRangφ′(0) = m, so dass φ einen Homoomorphismus zwischen P undM ∩ U liefert. ( ’Lokal wird M durch m freie Parameter beschrieben ’).

Sind die Voraussetzungen erfullt, so gilt TpM = Kern f ′(p) = Bild φ′(0).Insbesondere ist der Tangentialraum ein Unterraum und seine Dimension istm.

Definition 25 Sei f : U → Rn−m eine C1-Abbildung mit einer nicht-leerenoffenen Menge U des Rn als Definitionsbereich. Ein Element b im Bild f(U)heisst regularer Wert, wenn Rangf ′(x) = n−m fur alle x ∈ U mit fx = b gilt.

Folgerung 2 Ist f : U → Rn−m eine C1-Abbildung und b ein regularer Wert,so ist M = f−1(b) eine m-dimensionale Untermannigfaltigkeit

Fur f : Rn → R mit f(x) =∑n

i=1 x2i beispielsweise ist 1 ein regularer Wert

und man erhalt die n−1-dimensionale SphareM als Untermannigfaltigkeit. DerTangentialraum TxM besteht aus allen Vektoren, die auf x senkrecht stehen.

17

9 Einfuhrung in gewohnliche Differentialglei-chungen

Definition 26 Sei D ein Intervall in R, das sog. Zeitintervall, und U eineoffene Teilmenge des Rn, der sog. Phasenraum. Weiter sei (t0, u0) ∈ D × U .

a) Ein stetiges Vektorfeld ist eine stetige Abbildung v : D × U → Rn.

b) Sei D′ ein offenes Teilintervall, das t0 enthalt. Eine lokale Losung des zu vund (t0, u0) gehorenden Anfangswertproblems - abgekurzt AWP - oder auchder zu v gehorenden DGL mit Anfangsbedingung ist eine C1-Abbildungφ : D′ → U , so dass φ(t0) = u0 und φ′(t) = v(t, φ(t)) fur alle t aus D′

gilt. Die Losung heißt maximal, falls φ nicht auf ein großeres Intervall D′′

mit D′ ⊂ D′′ ⊆ D fortgesetzt werden kann, und global fur D′ = D.

c) Das Vektorfeld v erfullt auf der offenen Menge D′ × U ′ ⊆ D × U eineLipschitz-Bedingung, wenn es eine sog. Lipschitz-Konstante L gibt, so dassfur alle t ∈ D′ und u, u′ ∈ U ′ gilt

||v(t, u)− v(t, u′)|| ≤ L||u− u′||.

Das Vektorfeld erfullt lokale L-Bedingungen, wenn jeder Punkt von D ×U in einer derartigen offenen Menge liegt, und es erfullt eine globale L-Bedingung, wenn v auf D × U eine L-Bedingung erfullt.

Ein Vektorfeld heftet also jedem Punkt aus U einen von der Zeit t abhangigenVektor an, und eine lokale Losung mit Anfangsbedingung φ(t0) = u0 ist eineKurve, die zur Zeit t0 durch den Punkt u0 lauft und deren Tangente zur Zeit tgerade v(t, φ(t)) ist.

Beispiel 4 Stets sei D = U = R. Dann erfullt v(t, u) = u23 in keiner Umgebung

von (0, 0) eine Lipschitz-Bedingung und v(t, u) = exp(u) zwar lokale, aber keineglobale.

Lemma 9 a) Ist v : D × U → Rn bezuglich der Variablen u stetig differen-zierbar, so erfullt v lokale L-Bedingungen.

b) Ist B : D →Mn×n(R) stetig, so erfullt v : D ×Rn → Rn definiert durchv(t, u) = B(t)u lokale L-Bedingungen.

Lemma 10 ( Gronwalls Lemma ) Sei h : [a, b] → R stetig und L ≥ 0.

a) Ist C > 0 eine Konstante mit 0 ≤ h(x) ≤ C+L∫ x

ah(t)dt fur alle x ∈ [a, b],

so ist h(x) ≤ Cexp(L(x− a)) fur alle x ∈ [a, b].

b) Aus 0 ≤ h(x) ≤ L∫ x

ah(t)dt fur alle x ∈ [a, b] folgt h = 0.

18

Bemerkung 10 Die Ableitung einer Kurve ist komponentenweise definiert.

Analog definiert man das Integral∫ b

aφ uber eine stetige Kurv als den Vektor,

dessen i-te Komponente das Integral der i-ten Komponentenfunktion φi ist. BeiVerwendung der Maximumsnorm ist dann die Abschatzung ||

∫φ|| ≤

∫||φ|| of-

fensichtlich.Das AWP φ′(t) = v(t, φ(t)) und φ(t0 = u0 wird damit nach dem Hauptsatz

der Differential- und Integralrechnung aquivalent zur Integralgleichung

φ(t) = u0 +

∫ t

t0

v(s, φ(s))ds

.Diese Uminterpretation ist von entscheidender Bedeutung.

Satz 35 ( Eindeutigkeit lokaler Losungen ) Sei v ein Vektorfeld, das lokaleLipschitz-Bedingungen erfullt, und sei (t0, u0) ∈ D × U . Dann stimmen zweilokale Losungen φi : D′

i → U , i = 1, 2, des zugehorigen AWP auf D′1 ∩ D′

2

uberein. Falls das AWP also uberhaupt eine lokale Losung hat, so gibt es genaueine maximale Losung.

Bevor wir zur allgemeinen Theorie der Existenz von Losungen kommen,behandeln wir zwei wichtige Klassen von Beispielen, die manchmal durch ele-mentare Funktionen losbar sind.

Satz 36 ( Lineare DGL in einer Variablen ) Sei D ein Intervall und sei-en a, b stetige Funktionen von D nach R. Sei U = R. Die zum Vektorfeldv(t, u) = a(t)u + b(t) gehorige DGL φ′(t) = a(t)φ(t) + b(t) heißt lineare DGL,und zwar homogene fur b = 0 und inhomogene fur b 6= 0. Sei (t0, u0) ∈ D × U .Die zugehorigen AWP besitzen in beiden Fallen eindeutige globale Losungen,namlich:

a) Mit A(t) =∫ t

t0a(s)ds ist φ(t) = u0exp(A(t)) die Losung des homogenen

AWP.

b) Sei ψ(t) = exp(A(t))u(t). Genau dann ist ψ eine Losung des inhomogenen

AWP’s, wenn u(t) = u0 +∫ t

t0exp(−A(s))b(s)ds.

Man wird selbst fur die lineare DGL nur in Glucksfallen die Losungen durchelementare Funktionen ausdrucken konnen, weil beispielsweise der inhomoge-ne Fall mit a = 0 das Finden einer Stammfunktion der stetigen Funktion berfordert.

Bei den Differentialgleichungen mit getrennten Variablen sind D und U zweioffene Intervalle und f : D → R sowie g : U → R stetige Abbildungen. Wirbetrachten das Vektorfeld v(t, u) = f(t)g(u) und wollen das AWP fur (t0, u0)losen. Dabei sind zwei Falle zu unterscheiden:

1.Fall g(u0) = 0. Dann ist die konstante Funktion φ = u0 eine Losung desAWP. Falls v aber nicht lokalen L-Bedingungen genugt, kann es noch andere

19

Losungen geben. Sei etwa f = 1 und g(u) = 3u23 . Dann ist φ(t) = t3 nicht-

triviale Losung des AWP fur (0, 0).2.Fall g(u0) 6= 0.Wegen der Stetigkeit verschwindet dann g auf einer offenen Umgebung nicht.

Sei J das großte offene Teilintervall von U ( warum existiert dies ? ), auf demg nicht den Wert 0 annimmt. Definiere G : J → R durch G(u) =

∫ u

u0

1g(v)dv.

Wegen G′ = 1g ist G nach Satzen aus Analysis I strikt monoton, G(J) ein offenes

Intervall und die Umkehrabbildung H : G(J) → J ist differenzierbar.

Definiere weiter F : D → R durch F (t) =∫ t

t0f(s)ds. Dann ist F (t0) = 0 =

G(u0). Wegen der Stetigkeit von F wird eine ganze Umgebung von t0 unter Fnach G(J) abgebildet und es sei I das großte offene t0 enthaltende Teilintervallvon D mit dieser Eigenschaft.

Satz 37 ( DGL mit getrennten Variablen ) Mit obigen Voraussetzungen undBezeichnungen ist φ(t) = H(F (t)) eine Losung φ : I → J des AWP.

Ist ψ : D′ → J eine andere lokale Losung, so ist D′ ⊆ I und ψ ist dieEinschrankung von φ.

Implizit ist also die Losung durch F = G ◦ φ gegeben.

Beispiel 5 Wir wollen als Beispiel die logistische DGL φ′t = kφ(t)(K − φ(t))mit φ(0) = u0 untersuchen. Dabei ist k > 0 der Wachstumsfaktor und K > 0 dasSupremum der Anzahl φ(t) der zur Zeit t vorhandenen ’Lebewesen’. Wir nehmenan, dass 0 < u0 < K gilt. Es ist g(u) = u(K − u) und J =]0,K[ das großteu0 enthaltende Intervall, auf dem g nirgends verschwindet. Nun gilt 1

v(K−v) =1K ( 1v + 1

K−v ), wie man mit Hilfe sog. Partialbruchzerlegung findet. Also folgt

G(u) =∫ u

u0

1g(v)dv = 1

K (ln( uK−u )− C) mit C = ln( u0

K−u0). Offenbar ist G(J) =

R und daher D = R = I. Weiter ist F (t) =∫ t

0kds = kt. Aus G(φ(t)) = F (t),

erhalt man ln( φ(t)K−φ(t) = Kkt+C und durch Exponieren φ(t)

K−φ(t) = exp(Kkt+C).

Der Kehrwert liefert Kφ(t) = 1 + exp(−kKt− C) also schließlich

φ(t) = K1

1 + exp(−kKt− C)= K

1

1 + exp(−kKt)(Ku0

− 1).

Lemma 11 Sei K ein kompakter und T ein vollstandiger metrischer Raum.Dann ist die Menge C0(K,T ) versehen mit der Metrik

d(f, g) = sup{d(fx, gx)|x ∈ K}

ein vollstandiger metrischer Raum.

Wir kommen nun zum Hauptsatz uber die Existenz lokaler Losungen von DGL’sund deren stetige Abhangigkeit von den Anfangswerten. Zur prazisen Formulie-rung fixieren wir einige Notationen.

Seien zunachst D ein offenes Intervall, U eine offene Teilmenge des Rn,v : D×U → Rn ein stetiges Vektorfeld und (t0, u0) ∈ D×U . Sei weiter D′ ⊆ D

20

ein offenes Intervall, das t0 enthalt und U ′ ⊆ U eine offene Umgebung von u0,derart dass die Menge K = D′ × U ′ kompakt ist und in D × U liegt. Ist nunβ : K → U eine stetige Abbildung, so sei Pβ : K → Rn definiert durch

(Pβ)(t, u) = u+

∫ t

t0

v(s, β(s, u)ds.

P heißt Picard-Lindelof-Operator.

Lemma 12 ( Schlussel-Lemma ) Wir behalten obige Notationen und Voraus-setzungen bei. Zusatzlich gebe es eine Konstante L mit ||v(t, u) − v(t, u′)|| ≤L||u − u′|| fur alle t ∈ D und u, u′ ∈ U sowie einen vollstandigen metrischenRaum U ′′ mit U ′ ⊆ U ′′ ⊆ U , so dass (Pβ)(K) fur jedes stetige β : K → U ′′

wieder in U ′′ liegt. dann gilt:

a) P bildet M = C0(K,U ′′) in sich ab und P ist stetig.

b) Definiert man rekursiv α0(t, u) = u und αn+1 = Pαn, so konvergiert dieFolge (αn) in M gegen einen Fixpunkt α von P .

c) α induziert eine stetige Abbildung von D′ × U ′ nach U , so dass fur jedesu ∈ U ′ die Kurve αu(t) = α(t, u) eine lokale Losung der DGL ist mit An-fangsbedingung αu(t0) = u.( Diese lokalen Losungen existieren also alleauf dem gleichen Zeitintervall und sie hangen stetig von den Anfangsbe-dingungen ab. )

Satz 38 ( Satz von Picard-Lindelof ) Sei v : D × U → Rn ein stetiges Vektor-feld, das lokalen L-Bedingungen genugt. Dann gibt es zu jedem Punkt t0 ∈ Dund u0 ∈ U offene Umgebungen D′ ⊆ D und U ′ ⊆ U und eine stetige Abbil-dung α : D′ × U ′ → U , so dass fur jedes u ∈ U ′ die Kurve αu : D′ → U mitαu(t) = α(t, u) die eindeutige lokale Losung der DGL mit Anfangswert u ist.

Man kann daruber hinaus zeigen, dass α im letzten Satz stetig differenzierbarnach u ist, wenn v es ist. Einen Beweis findet man in dem schonen Buch vonLang ’Undergraduate Analysis’ auf Seite 558 oder im Lehrbuch ’GewohnlicheDifferentialgleichungen’ von Arnold ab Seite 273.

Definition 27 Sei D ein Zeitintervall und seien B : D → Mn×n(R) sowieb : D → Rn stetige Abbildungen. Die zum Vektorfeld v : D × Rn → Rn mitv(t, u) = B(t)u gehorende DGL φ′(t) = B(t)φ(t) + b(t) heisst lineare DGL. Furb = 0 heißt die Gleichung homogen, sonst inhomogen. Es sei H die Menge derLosungen der homogenen DGL.

Satz 39 ( Lineare DGL ) Mit den Notationen und Annahmen der voranstehen-den Definition gilt:

a) Zu jedem (t0, u0) hat das AWP genau eine globale Losung.

b) H ist ein Unterraum von C1(D,Rn) und fur jedes t induziert die Abbil-dung φ 7→ φ(t) einen Isomorphismus zwischen H und Rn.

21

c) Fur eine Basis (φ1, φ2, . . . , φn) von H - ein sogenanntes Fundamentalsy-stem - ist fur jedes s die sog. Fundamentalmatrix F (s) mit φj(s) in derj.ten Spalte fur 1 ≤ j ≤ n invertierbar. Eine spezielle Losung des in-homogenen AWP ist dann wie im eindimensionalen Fall gegeben durchψ(t) = F (t)u(t) mit u(t) = u0 +

∫ t

t0((F (s)−1)b(s)ds.

Besonders einfach wird die Situation, wenn B(t) = A eine konstante Funk-tion ist.

Definition 28 Fur A ∈Mn×n(R) ist exp(A) =∑∞

i=0Ai

i! .

Diese Reihe konvergiert, weil Mn×n(R) ein Banachraum ist.

Satz 40 Fur alle A,B ∈Mn×n(R) gilt:

a) Aus AB = BA folgt exp(A+B) = exp(A)exp(B) und Bexp(A) = exp(A)B.Insbesondere ist En = exp(0) = exp(A)exp(−A) = exp(−A)exp(A) undjedes exp(A) ist invertierbar.

b) Die Abbildung φ : R → Mn×n(R) definiert durch φ(t) = exp(tA) istdifferenzierbar mit φ′(t) = Aexp(tA) = Aφ(t).

c) Fur jedes invertierbare S ist S−1exp(A)S = exp(S−1AS).

d) exp(AT ) = exp(A)T .

e) Ist A eine Blockdiagonalmatrix mit zwei Blocken A1 und A2, so ist exp(A)Blockdiagonalmatrix mit Blocken exp(A1) und exp(A2). Das verallgemei-nert sich auf mehrere Blocke. Insbesondere ist das Exponential einer Dia-gonalmatrix eine Diagonalmatrix mit den Exponentialen der Eigenwerteals Eintrage.

f) Die Abbildungen φi(t) = exp(tA)ei , i = 1, 2, . . . n bilden ein Fundamen-talsystem der homogenen linearen DGL ψ′(t) = Aψ(t).

Fur Matrizen in Jordanscher Normalform kann man also explizit ein Funda-mentalsystem angeben. Zu diesem Zweck wurde die Jordansche Normalformentwickelt. Es ist dabei vorteilhaft uber den komplexen Zahlen zu arbeiten. Dieerforderlichen Anpassungen sind alle einfach und man kann sie gut in dem imInternet frei zuganglichen Buch von Brocker ’Analysis 3’ auf den Seiten 39− 63nachlesen. Dort wird auch gezeigt, wie man mit einem Trick die entwickelteTheorie ubertragen kann auf explizite Differentialgleichungen hoheren Grades.Schließlich wird dort der zweidimensionale Fall und insbesondere der harmoni-sche Oszillator ausfuhrlich behandelt. Die Beweise beruhen neben der von unsdargestellten allgemeinen analytischen Theorie auf linearer Algebra.

22