Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun...

327
Inhaltsverzeichnis §1 Erg¨ anzungen zur Differentialrechnung ................. 1 §2 Integralrechnung ............................. 51 §3 Uneigentliche Integrale .......................... 109 §4 Funktionenfolgen und normierte R¨ aume ................ 122 §5 Eigenwerte und die Jordansche Normalform .............. 162 §6 Symmetrische und hermitesche Matrizen ................ 203 §7 Orthogonale und unit¨ are Matrizen ................... 242 §8 Differentialrechnung im R n ....................... 253 §9 Ableitungen h¨ oherer Ordnung ...................... 304 $Id: analytisch.tex,v 1.13 2011/09/21 13:37:41 hk Exp $ Vorlesung 1, Mittwoch 13.04.2011 §1 Erg¨ anzungen zur Differentialrechnung Dieses einleitende Kapitel wollen wir verwenden um den Anschluss an das vorige Se- mester herzustellen. Eine direkte Wiederholung soll es hier nicht geben, anstelle dessen besprechen wir einige weitere Anwendungen der eindimensionalen Differentialrechnung. ξ a b Zuerst wollen wir an den Mittelwertsatz erinnern. Bei diesem war eine stetige Funktion f :[a, b] R ge- geben, die im Inneren (a, b) des Intervalls differenzierbar ist. Der Mittelwertsatz besagte dann, dass es stets eine Stelle ξ (a, b) gibt an der die Steigung der Tangente in ξ gleich der Sekantensteigung zwischen a und b ist. Aus diesem Satz folgte dann beispielsweise die Kenn- zeichnung der Monotonie von Funktionen ¨ uber das Vor- zeichen ihrer Ableitung und das hinreichende Kriterium ur lokale Extrema. Eine weitere Anwendung, die f¨ ur uns in diesem Semester noch wichtig werden wird, ist das folgende Lemma. Lemma 1.1 (Kennzeichnung konstanter Funktionen) Seien I R ein Intervall und f : I R eine stetige Funktion, die im Inneren I des 1

Transcript of Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun...

Page 1: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Inhaltsverzeichnis

§1 Erganzungen zur Differentialrechnung . . . . . . . . . . . . . . . . . 1§2 Integralrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51§3 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . 109§4 Funktionenfolgen und normierte Raume . . . . . . . . . . . . . . . . 122§5 Eigenwerte und die Jordansche Normalform . . . . . . . . . . . . . . 162§6 Symmetrische und hermitesche Matrizen . . . . . . . . . . . . . . . . 203§7 Orthogonale und unitare Matrizen . . . . . . . . . . . . . . . . . . . 242§8 Differentialrechnung im Rn . . . . . . . . . . . . . . . . . . . . . . . 253§9 Ableitungen hoherer Ordnung . . . . . . . . . . . . . . . . . . . . . . 304

$Id: analytisch.tex,v 1.13 2011/09/21 13:37:41 hk Exp $

Vorlesung 1, Mittwoch 13.04.2011

§1 Erganzungen zur Differentialrechnung

Dieses einleitende Kapitel wollen wir verwenden um den Anschluss an das vorige Se-mester herzustellen. Eine direkte Wiederholung soll es hier nicht geben, anstelle dessenbesprechen wir einige weitere Anwendungen der eindimensionalen Differentialrechnung.

ξa b

Zuerst wollen wir an den Mittelwertsatz erinnern.Bei diesem war eine stetige Funktion f : [a, b] → R ge-geben, die im Inneren (a, b) des Intervalls differenzierbarist. Der Mittelwertsatz besagte dann, dass es stets eineStelle ξ ∈ (a, b) gibt an der die Steigung der Tangentein ξ gleich der Sekantensteigung zwischen a und b ist.Aus diesem Satz folgte dann beispielsweise die Kenn-zeichnung der Monotonie von Funktionen uber das Vor-zeichen ihrer Ableitung und das hinreichende Kriteriumfur lokale Extrema.

Eine weitere Anwendung, die fur uns in diesem Semester noch wichtig werden wird,ist das folgende Lemma.

Lemma 1.1 (Kennzeichnung konstanter Funktionen)Seien I ⊆ R ein Intervall und f : I → R eine stetige Funktion, die im Inneren I◦ des

1

Page 2: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 13.04.2011

Intervalls differenzierbar ist. Dann ist f genau dann konstant wenn f ′(x) = 0 fur jedesx ∈ I◦ gilt.

Beweis: ”=⇒” Klar.”⇐=” Seien x, y ∈ I mit x < y. Dann ist f in (x, y) ⊆ I◦ differenzierbar, also gibt esnach dem Mittelwertsatz I.§14.Satz 10 ein ξ ∈ (a, b) mit f(y)−f(x) = f ′(ξ)·(y−x) = 0,und somit ist f(x) = f(y). Damit ist die Funktion f konstant.

Schon aus diesem einfachen Lemma lassen sich leicht komplizierter erscheinendeAussagen herleiten. Wir hatten beispielsweise gesehen, dass die Exponentialfunktiongleich ihrer eigenen Ableitung ist, und konnen uns jetzt fragen ob es noch mehr Funk-tionen mit dieser Eigenschaft gibt. Trivialerweise gibt es naturlich die Vielfachen derExponentialfunktion und wir wollen einsehen, dass diese die einzigen Beispiele sind.Etwas allgemeiner fragen wir gleich nach Funktionen f , deren Ableitung ein Vielfachesf ′ = λ · f von f ist, also etwa f(x) = Ceλx mit C ∈ R.

Wir behaupten: Sind I ⊆ R ein Intervall und f : I → R eine differenzierbareFunktion mit f ′ = λ · f fur eine λ ∈ R, so existiert eine Konstante C ∈ R mit f(x) =C · eλx fur alle x ∈ I. Um dies einzusehen, betrachten wir die ebenfalls differenzierbareHilfsfunktion h(x) := f(x)e−λx fur x ∈ I. Als Ableitung ergibt sich

h′(x) = f ′(x)e−λx − λf(x)e−λx = 0

fur alle x ∈ I, die Funktion h ist also konstant, etwa h(x) = C fur alle x ∈ I. Es folgtf(x) = Ceλx fur jedes x ∈ I.

1.1 Konvexe und konkave Funktionen

Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einfuhren und untersuchen, die sogenannten konvexen beziehungsweise konkavenFunktionen. An diesem Thema kann man auch schon die Anwendung unserer bisherigenErgebnisse uber differenzierbare Funktionen sehen. Insbesondere wird die Kennzeich-nung monotoner Funktionen durch ihre Ableitung eine wichtige Rolle spielen.

Definition 1.1: Seien I ⊆ R ein Intervall und f : I → R eine Funktion. Wir nennendie Funktion f

(a) konvex, wenn fur alle x, y ∈ I mit x < y und alle t ∈ [0, 1] stets

f((1− t)x+ ty) ≤ (1− t)f(x) + tf(y)

gilt.

(b) strikt konvex, wenn fur alle x, y ∈ I mit x < y und alle t ∈ (0, 1) stets

f((1− t)x+ ty) < (1− t)f(x) + tf(y)

gilt.

2

Page 3: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 13.04.2011

(c) konkav, wenn fur alle x, y ∈ I mit x < y und alle t ∈ [0, 1] stets

f((1− t)x+ ty) ≥ (1− t)f(x) + tf(y)

gilt.

(d) strikt konkav, wenn fur alle x, y ∈ I mit x < y und alle t ∈ (0, 1) stets

f((1− t)x+ ty) > (1− t)f(x) + tf(y)

gilt.

Beachte das in der Definition einer konvexen beziehungsweise konkaven Funktion diefragliche Ungleichung im Fall t = 0 und t = 1 immer erfullt ist, wir konnen uns alsoauch dort stets auf den Fall 0 < t < 1 beschranken. Auch auf die Bedingung

”a < b“

kann verzichtet werden. Fur a = b sind unsere Ungleichungen trivialerweise erfulltund fur a 6= b konnen wir a und b durch Ubergang von t zu 1 − t vertauschen. Beider Definition einer strikt konvexen beziehungsweise strikt konkaven Funktion brauchtman dann entsprechend nur die Bedingung a 6= b.

(1−t)f(a)+tf(b)

a bξf(ξ ) = f((1−t)a+tb)

Wir wollen uns zunachst einmal klarma-chen was die Konvexitatsbedingung anschau-lich bedeutet. Seien a, b ∈ I mit a < bim Definitionsbereich der Funktion f und seit ∈ (0, 1). Dann ist ξ = (1 − t)a + tb einPunkt zwischen a und b, wenn t von t = 0bis t = 1 lauft, so durchlauft ξ die Werte zwi-schen ξ = a und ξ = b. Weiter schauen wiruns die Verbindungsstrecke der beiden Punkte (a, f(a)) und (b, f(b)) an. Der Punktauf dieser Strecke mit x-Koordinate ξ ist(

af(a)

)+t·

(b− a

f(b)− f(a)

)=

((1− t)a+ tb

(1− t)f(a) + tf(b)

)=

(1− t)f(a) + tf(b)

),

d.h. (1−t)f(a)+tf(b) ist die y-Koordinate dieses Punktes. Dass f konvex ist, bedeutetalso genau dass der Graph von f unterhalb der Sekante zwischen je zwei Punkten aufdiesem Graphen liegt. Fur konkake Funktionen muss der Graph entsprechend oberhalbverlaufen. Beachte das f offenbar genau dann konkav beziehungsweise strikt konkav ist,wenn −f konvex beziehungsweise strikt konvex ist. Daher konnen wir uns im folgendenmeist auf konvexe Funktionen beschranken und die entsprechenden Aussagen geltendann entsprechend auch fur konkave Funktionen. Wir gehen jetzt einige Beispiele durch.

1. Fur alle a, b ∈ R ist die lineare Funktion f : R → R;x 7→ ax + b konvex undkonkav. Mit der obigen geometrischen Interpretation ist dies klar, wir konnen esaber auch direkt nachrechnen. Sind x, y ∈ R mit x < y und 0 ≤ t ≤ 1, so istf((1−t)x+ty) = (1−t)ax+tay+b = (1−t)(ax+b)+t(ay+b) = (1−t)f(x)+tf(y).

3

Page 4: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 13.04.2011

2. Sind a, b, c ∈ R mit a > 0, so ist die quadratische Funktion f : R → R;x 7→ax2 + bx + c strikt konvex. Um dies einzusehen seien wieder x, y ∈ R mit x < yund t ∈ (0, 1) gegeben. Dann sind

f((1− t)x+ ty) = a[(1− t)2x2 + t2y2 + 2t(1− t)xy

]+ (1− t)bx+ tby + c,

(1− t)f(x) + tf(y) = a[(1− t)x2 + ty2

]+ (1− t)bx+ tby + c,

es ist also

(1−t)f(x)+tf(y)−f((1−t)x+ty) = at(1−t)·(x2+y2−2xy) = at(1−t)(x−y)2 > 0.

3. Durch Ubergang zur negativen Funktion folgt das fur alle a, b, c ∈ R mit a < 0die quadratische Funktion f : R → R;x 7→ ax2 + bx+ c strikt konkav ist.

4. Die Betragsfunktion f : R → R;x 7→ |x| ist konvex. Seien namlich wieder x, y, t ∈R mit x < y und 0 < t < 1 gegeben. Dann ist

f((1− t)x+ ty) = |(1− t)x+ ty| ≤ (1− t)|x|+ t|y| = (1− t)f(x) + tf(y).

Einige Umformulierungen der Konvexitatsdefinition sind gelegentlich nutzlich. Seienwieder I ⊆ R ein Intervall und f : I → R eine Funktion. Seien a, b ∈ I mit a < bgegeben. Sei ξ ∈ (a, b) zwischen a und b. Dann konnen wir ξ = (1−t)a+tb = a+t(b−a)fur ein t ∈ (0, 1) schreiben, explizit ist t = (ξ−a)/(b−a), also auch 1−t = (b−ξ)/(b−a).Damit wird

(1− t)f(a) + tf(b) =(b− ξ)f(a) + (ξ − a)f(b)

b− a=bf(a)− af(b) + ξ(f(b)− f(a))

b− a,

und die Konvexitatsbedingung schreibt sich als

(b− a)f(ξ) ≤ (b− ξ)f(a) + (ξ − a)f(b).

Dies konnen wir noch etwas weiter umformulieren, wegen b− a = (b− ξ) + (ξ − a), istdie obige Abschatzung weiter aquivalent zu (b− ξ)(f(ξ)− f(a)) ≤ (ξ−a)(f(b)− f(ξ)),beziehungsweise

f(ξ)− f(a)

ξ − a≤ f(b)− f(ξ)

b− ξ.

Insgesamt haben wir damit

f konvex ⇐⇒ ∀(a, b ∈ I, a < b)∀(ξ ∈ (a, b)) : (b− a)f(ξ) ≤ (b− ξ)f(a) + (ξ − a)f(b)

⇐⇒ ∀(a, b ∈ I, a < b)∀(ξ ∈ (a, b)) :f(ξ)− f(a)

ξ − a≤ f(b)− f(ξ)

b− ξ.

Entsprechend haben wir auch aquivalente Beschreibungen der strikten Konvexitat vonf indem wir

”≤“ durch

”<“ ersetzen und um auch konkave Funktionen zu behandeln

mussen wir die Ungleichungen umdrehen.

4

Page 5: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 13.04.2011

ξx

f(x)

a b dx

f(x)

a cb

Die obenstehende Ungleichung druckt die Konvexitat der Funktion f durch das Verhal-ten von Sekantensteigungen, also von Differenzenquotienten, der Funktion f aus. Diesist im oben links stehenden Bild gezeigt, die Steigung aufeinanderfolgender Sekantenwird großer. Durch Verwendung der im rechten Bild gepunktet eingezeichneten Hilfsse-kante, sehen wir das dies auch auf nicht direkt aufeinanderfolgende Sekantensteigungenzutrifft.

Analog konnen wir auch Sekantensteigungen mit gleichem Startpunkt behandeln.Seien wieder I ⊆ R ein Intervall, f : I → R eine Funktion und a, b, c ∈ I mit a < b < c.Wie schon gesehen ist f genau dann konvex wenn fur alle solchen a, b, c stets

(c− a)f(b) ≤ (c− b)f(a) + (b− a)f(c)

gilt. Schreiben wir hier c−b = (c−a)− (b−a) beziehungsweise b−a = (c−a)− (c−b),so wird diese Ungleichung zu (c−a)(f(b)−f(a)) ≤ (b−a)(f(c)−f(a)) beziehungsweise(c − b)(f(c) − f(a)) ≤ (c − a)(f(c) − f(b)), und dies konnen wir noch zur folgendenUngleichung zwischen Differenzenquotienten

f(b)− f(a)

b− a≤ f(c)− f(a)

c− abeziehungsweise

f(c)− f(a)

c− a≤ f(c)− f(b)

c− b

umschreiben. Diese Rechnungen ergeben damit insgesamt die folgenden Umformulie-rungen des Konvexitatsbegriffs

f ist konvex ⇐⇒ ∀(a, b, c ∈ I, a < b < c) :f(b)− f(a)

b− a≤ f(c)− f(a)

c− a

⇐⇒ ∀(a, b, c ∈ I, a < b < c) :f(c)− f(a)

c− a≤ f(c)− f(b)

c− b.

Wollen wir entsprechend strikt konvexe Funktionen kennzeichnen, so muss wieder”≤“

durch”<“ ersetzt werden, und fur die entsprechenden Aussagen uber konkave Funk-

tionen mussen die Ungleichungen umgedreht werden.

ca b ca b

5

Page 6: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 13.04.2011

Man bezeichnet die eben hergeleitete Eigenschaft konvexer Funktionen auch als die

”Monotonie des Differenzenquotienten“, denn wir konnen unsere Aussagen so zusam-

menfassen, das die Funktion

Da : I\{a} → R;x 7→ f(x)− f(a)

x− a

fur jedes a ∈ I monoton steigend ist, wenn f konvex ist. Um jetzt weiterzukommen,benotigen wir ein kleines Lemma uber Grenzwerte monotoner Funktionen, dieses istahnlich zum Satz I.§6.Satz 3 uber Grenzwerte monotoner Folgen. In der Vorlesunghaben wir dieses nur fur den Fall monoton steigender Funktionen angegeben und aufeinen Beweis verzichtet, hier wollen das Lemma vollstandig behandeln.

Lemma 1.2 (Grenzwerte monotoner Funktionen)Seien I ⊆ R ein Intervall, f : I → R eine monotone Funktion und a ∈ R ein

Haufungspunkt von I. Dann gelten:

(a) Ist a ein rechtsseitiger Haufungspunkt von I, so existiert der Grenzwert limx↓a f(x)in R und zwar ist

limx↓a

f(x) =

{inf{f(x)|x ∈ I, x > a} ∈ R ∪ {−∞}, f ist monoton steigend,

sup{f(x)|x ∈ I, x > a} ∈ R ∪ {+∞}, f ist monoton fallend.

(b) Ist a ein linksseitiger Haufungspunkt von I, so existiert der Grenzwert limx↑a f(x)in R und zwar ist

limx↑a

f(x) =

{sup{f(x)|x ∈ I, x < a} ∈ R ∪ {+∞}, f ist monoton steigend,

inf{f(x)|x ∈ I, x < a} ∈ R ∪ {−∞}, f ist monoton fallend.

(c) Ist a ∈ I◦, so istlimx↑a

f(x) ≤ limx↓a

f(x)

wenn f monoton steigend ist und

limx↑a

f(x) ≥ limx↓a

f(x)

wenn f monoton fallend ist.

Beweis: Wir beweisen die Aussage wenn f monoton steigend ist, der Beweis fur mo-noton fallende Funktionen ist analog.(a) Setze s := inf{f(x)|x ∈ I, x > a} ∈ R∪{−∞}. Sei (xn)n∈N eine gegen a konvergenteFolge in I mit xn > a fur alle n ∈ N. Wir mussen zeigen, dass dann auch (f(xn))n∈N −→s gilt. Zunachst ist zumindest f(xn) ≥ s fur jedes n ∈ N. Sei b ∈ R mit b > s. NachDefinition von s existiert dann ein x ∈ I mit x > a und f(x) < b. Wegen (xn)n∈N −→ a

6

Page 7: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 13.04.2011

existiert weiter ein n0 ∈ N mit xn < x fur alle n ∈ N mit n ≥ n0 und fur jedes n ∈ Nmit n ≥ n0 ist damit auch f(xn) ≤ f(x) < b. Dies beweist (f(xn))n∈N −→ s und (a)ist gezeigt.(b) Dies ist analog zum Beweis von (a).(c) Sei b ∈ I mit b > a. Fur jedes x ∈ I mit x < a ist dann auch x < b, alsof(x) ≤ f(b) und somit haben wir limx↑a f(x) ≤ f(b) nach (b). Mit (a) folgt hierausweiter limx↑a f(x) ≤ limx↓a f(x).

Damit haben wir alles beisammen den Hauptsatz uber konvexe und konkave Funktio-nen zu beweisen. Zuvor wollen wir aber noch kurz die verwendete Sprechweise erlautern.Schon in I.§14 hatten wir links- und rechtsseitige Ableitungen eingefuhrt. In Erweite-rung der dort gegebenen Definition sprechen wir im folgenden Satz auch von links-und rechtsseitigen Ableitungen in R, dies meint das der jeweilige Grenzwert der Dif-ferenzenquotienten in R interpretiert werden soll, also auch ±∞ als Wert zugelassenwird. Wir sprechen aber weiterhin nur dann von links- beziehungsweise rechtsseitigerDifferenzierbarkeit wenn die entsprechende Ableitung reell ist.

Satz 1.3 (Hauptsatz uber konvexe Funktionen)Seien I ⊆ R ein Intervall und f : I → R eine konvexe Funktion.

(a) Sei a ∈ I mit a 6= inf I. Dann existiert die rechtsseitige Ableitung f ′+(a) ∈ R ∪{−∞} in R. Ist f ′+(a) 6= −∞, so ist limx↓a f(x) = f(a) und fur alle x ∈ I mitx ≥ a gilt

f(x) ≥ f(a) + f ′+(a) · (x− a).

Ist die Funktion f sogar strikt konvex, so gilt f(x) > f(a) + f ′+(a) · (x − a) furalle x ∈ I mit x > a.

(b) Sei a ∈ I mit a 6= sup I. Dann existiert die linksseitige Ableitung f ′−(a) ∈ R ∪{+∞} in R. Ist f ′−(a) 6= +∞, so ist limx↑a f(x) = f(a) und fur alle x ∈ I mitx ≤ a gilt

f(x) ≥ f(a) + f ′−(a) · (x− a).

Ist die Funktion f sogar strikt konvex, so gilt f(x) > f(a) + f ′−(a) · (x − a) furalle x ∈ I mit x > a.

(c) Sind a, b ∈ I mit a < b, so ist f ′+(a) ≤ f ′−(b), und ist f sogar strikt konvex so istf ′+(a) < f ′−(b).

(d) Ist a ∈ I◦, so ist f in a stetig sowie links- und rechtsseitig differenzierbar und esgilt f ′−(a) ≤ f ′+(a).

Beweis: (a) Die Monotonie der Differenzenquotienten der Funktion f und Lemma2.(a) ergeben die Existenz der rechtsseitigen Ableitung

f ′+(a) = limx↓a

f(x)− f(a)

x− a= inf

{f(x)− f(a)

x− a

∣∣∣∣ x ∈ I, x > a

}∈ R ∪ {−∞}.

7

Page 8: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 13.04.2011

Wir nehmen jetzt f ′+(a) 6= −∞ an. Dann ist die Funktion f in a rechtsseitig dif-ferenzierbar und nach I.§14.Lemma 3 ist f in a auch rechtsseitig stetig, d.h. es giltlimx↓a f(x) = f(a). Sei x ∈ I mit x > a. Dann ist

f ′+(a) ≤ f(x)− f(a)

x− a=⇒ f(x) ≥ f(a) + f ′+(a) · (x− a).

Nehme schließlich zusatzlich an, dass f sogar strikt konvex ist. Wahle dann ein x′ ∈ Imit a < x′ < x. Dann folgt mit der strengen Monotonie des Differenzenquotienten

f ′+(a) ≤ f(x′)− f(a)

x′ − a<f(x)− f(a)

x− a,

also auch f(x) > f(a) + f ′+(a) · (x− a).(b) Analog zu (a), wobei diesmal

f ′−(a) = sup

{f(x)− f(a)

x− a

∣∣∣∣ x ∈ I, x < a

}∈ R ∪ {+∞}

gilt.(c) Wahle ein ξ ∈ (a, b). Mit (a,b) folgt dann

f ′+(a) ≤ f(ξ)− f(a)

ξ − a≤ f(b)− f(ξ)

b− ξ=f(ξ)− f(b)

ξ − b≤ f ′−(b),

und ist f strikt konvex, so gilt in der mittleren Ungleichung sogar”<“ statt

”≤“.

(d) Nach Lemma 2.(c) gilt

−∞ < f ′−(a) = limx↑a

f(x)− f(a)

x− a≤ lim

x↓a

f(x)− f(a)

x− a= f ′+(a) < +∞

und insbesondere sind f ′−(a) 6= +∞ und f ′+(a) 6= −∞. Damit ist f in a links- undrechtsseitig differenzierbar und nach (a,b) gelten auch limx↑a f(x) = limx↓a f(x) = f(a),d.h. die Funktion f ist nach I.§13.Lemma 8.(e) in a stetig.

x

f(x)Wir wollen noch ein paar Anmerkungen zum eben be-

wiesenen Satz machen. Der Satz sagt unter anderem, dasseine konvexe Funktion in jedem inneren Punkt ihres Defi-nitionsintervalls stetig ist, dies trifft tatsachlich nicht mehrauf eventuelle Randpunkte des Intervalls zu. Beispielsweiseist die nebenstehend gezeigte Funktion

f : [0, 1] → R;x 7→

{1, x = 0 oder x = 1,

0, x ∈ (0, 1)

8

Page 9: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 13.04.2011

offenbar konvex aber in den beiden Randpunkten nicht stetig. In R haben wir hier

f ′+(0) = limx↓0

f(x)− f(0)

x= lim

x↓0

(−1

x

)= −∞,

und analog folgt f ′−(1) = +∞. Weiter zeigt der Satz das eine konvexe Funktion automa-tisch recht starke Differenzierbarkeitseigenschaften hat, außerhalb der Randpunkte gibtes immer links- und rechtsseitige Ableitungen. Die Funktion muss in inneren Punkten aaber nicht unbedingt differenzierbar sein, letzteres ist nach I.§14.Lemma 7 gleichwertigzu f ′−(a) = f ′+(a), es kann aber durchaus f ′−(a) < f ′+(a) sein. Ist beispielsweise f dieBetragsfunktion, von der wir ja bereits eingangs gesehen haben das sie konvex ist, sohaben wir f ′−(0) = −1 und f ′+(0) = 1, in a = 0 liegt also keine Differenzierbarkeitvor. Auch die Abschatzungen in den Aussagen (a) und (b) des Satzes lassen sich nochgeometrisch interpretieren.

y=f(a)+f’(a)(x−a)

a x

f(x)

ba x

f(x)

Wir betrachten wieder einen inneren Punkt a. Das linke Bild zeigt uns dann die Be-deutung der Ungleichung f(x) ≥ f(a) + f ′+(a) · (x − a) fur x ≥ a, die rechte Seite istgerade die rechtsseitige Tangente an den Graphen von f im Punkt (a, f(a)), die Aus-sage ist also das die Funktion oberhalb dieser Tangente verlauft. Weiter ist f ′+(a) dasInfimum der Steigungen aller mit a startenden Sekanten, alle ist die Steigung f ′+(a) derrechtsseitigen Tangente kleiner als all diese Sekantensteigungen, wie auch im rechtenBild gezeigt. Analoges gilt fur die linksseitige Tangente. Ist die Funktion in a sogar dif-ferenzierbar, so haben wir eine Tangente und die Funktion verlauft dann ganz oberhalbdieser Tangente. Wie bemerkt gelten fur konkave Funktionen dann analoge Aussagen,dies werden wir bei Bedarf auch ohne weitere Begrundungen verwenden.

Wir wollen uns jetzt ein rechnerisch oft bequem handhabbares Kriterium fur dieKonvexitat einer gegebenen Funktion herleiten. In unseren einleitenden Beispielen warder Nachweis der definierenden Konvexitatsbedingung ja teilweise etwas muhsam. DieseKriterien werden zwar nur auf ausreichend differenzierbare Funktionen anwendbar sein,dies reicht aber zur Behandlung vieler wichtiger Beispiele vollig aus.

Korollar 1.4 (Konvexitat und Monotonie der Ableitung)Seien I ⊆ R ein Intervall und f : I → R eine stetige Funktion die im Inneren I◦

des Intervalls differenzierbar ist. Dann ist f genau dann konvex wenn die Ableitungf ′ : I◦ → R monoton steigend ist und genau dann ist f strikt konvex wenn f ′ strengmonoton steigend ist.

9

Page 10: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 13.04.2011

Beweis: ”=⇒” Dies ist klar nach Satz 3.(c).”⇐=” Sei f ′ als monoton steigend vorausgesetzt. Seien a, b ∈ I mit a < b und ξ ∈ (a, b)gegeben. Nach dem Mittelwertsatz I.§14.Satz 10 gibt es η− ∈ (a, ξ) und η+ ∈ (ξ, b) mit

f(ξ)− f(a)

ξ − a= f ′(η−) und

f(b)− f(ξ)

b− ξ= f ′(η+).

Dann ist auch η− < η+ und die Monotonie von f ′ ergibt

f(ξ)− f(a)

ξ − a= f ′(η−) ≤ f ′(η+) =

f(b)− f(ξ)

b− ξ.

Ist f ′ sogar streng monoton steigend, so gilt f ′(η−) < f ′(η+) und wir haben oben sogareine echte Ungleichung. Dies zeigt das f konvex, beziehungsweise im streng monotonsteigenden Fall sogar strikt konvex, ist.

Kombinieren wir dies noch mit der Kennzeichung monotoner Funktionen durch ihreAbleitung, so folgt

Korollar 1.5 (Kriterium fur konvexe Funktionen)Seien I ⊆ R ein Intervall und f : I → R eine stetige, in I◦ zweifach differenzierbare,

Funktion. Dann gelten:

(a) Genau dann ist f konvex wenn f ′′(x) ≥ 0 fur alle x ∈ I◦ gilt.

(b) Gilt f ′′(x) > 0 fur alle x ∈ I◦, so ist f strikt konvex.

Beweis: Klar nach Korollar 4 und I.§14.Korollar 11.

Wie schon im letzten Semester festgehalten reicht es in Teil (b) in Wahrheit schon dasf ′′(x) > 0 fur alle x ∈ I◦ bis auf isolierte Ausnahmepunkte gilt. Außerdem haben wirauch ein entsprechendes Kriterium fur konkave Funktionen, diese sind durch f ′′(x) ≤ 0fur alle x ∈ I◦ gekennzeichnet. Mit dem eben bewiesenen Kriterium ist es jetzt leichtweitere Beispiele konvexer funktionen zu finden.

1. Die Exponentialfunktion exp : R → R ist strikt konvex. Dies ist klar, da furjedes x ∈ R stets exp′′(x) = exp(x) > 0 gilt. Als eine kleine Anwendung dieserBeobachtung betrachte die Tangente in x = 0. Wegen exp′(0) = exp(0) = 1 istdiese als x 7→ x + 1 gegeben, und damit folgt fur alle x ∈ R mit x 6= 0 stetsex > x+ 1. Das kann man naturlich auch direkt einsehen.

2. Nun sei a ∈ R mit a > 0 und betrachte die Funktion f : R → R;x 7→ ax. Dannsind f ′(x) = ln(a)ax und f ′′(x) = ln2(a)ax fur jedes x ∈ R, d.h. die Funktion fist konvex und fur a 6= 1 sogar strikt konvex.

10

Page 11: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 15.4.2011

3. Nun sei n ∈ N und wir betrachten die Potenzfunktion f : R → R;x 7→ xn. DieFalle n = 0, 1, 2 kennen wir dabei bereits und konnen somit n ≥ 3 annehmen.Fur jedes x ∈ R sind f ′(x) = nxn−1 und f ′′(x) = n(n − 1)xn−2. Ist n gerade, soist f also strikt konvex und ist n ungerade, so ist f in [0,∞) strikt konvex undin (−∞, 0] strikt konkav.

4. Nun sei a ∈ R und wir betrachten f : R>0 → R;x 7→ xa. Fur x > 0 haben wirf ′(x) = axa−1 und f ′′(x) = a(a− 1)xa−2. Je nach Wert von a treten verschiedeneFalle auf. Ist a > 1 oder a < 0 so ist f strikt konvex und ist 0 < a < 1 so ist fstrikt konkav. Ist a = 0, so ist f konstant und ist a = 1 so ist f linear, also ist fin diesen beiden Fallen konvex und konkav.

5. Als letztes Beispiel betrachten wir den Logarithmus ln : R>0 → R. Fur alle x > 0ist dann f ′(x) = 1/x und f ′′(x) = −1/x2 < 0, also ist der Logarithmus striktkonkav.

1.2 Taylorentwicklung und partielle Ableitungen

Vorlesung 2, Freitag 15.4.2011

In I.§14 hatten wir das n-te Taylorpolynom einer n-fach differenzierbaren Funktionf zum Entwicklungspunkt x0 als

Tn(x) =n∑

k=0

f (k)(x0)

k!(x− x0)

k

definiert, und bewiesen das der Approximationsfehler f(x)− Tn(x) sich als

f(x)− Tn(x) =f (n+1)(ξ)

(n+ 1)!(x− x0)

n+1

schreiben liess, wobei ξ zwischen x0 und x liegt. Dabei war diese Formel fur (n+1)-fachdifferenzierbare Funktionen anwendbar. Diesen Fehlerterm konnte man dann auswer-ten, indem |f (n+1)(ξ)| durch eine obere Schranke der (n+1)-ten Ableitung zwischen x0

und x ersetzt wurde. Als ein weiteres Beispiel wollen wir das sogenannte”Problem der

schwingenden Saite“ behandeln, dieses ist ihnen wahrscheinlich bereits aus ihren an-deren Vorlesungen bekannt. Wir werden die sogenannten partiellen Ableitungen einerFunktion in mehreren Variablen benotigen, daher beginnen wir damit diese einzufuhren.Wir beschranken uns dabei auf das Notwendigste, einer genauere Behandlung partiellerAbleitungen erfolgt spater in diesem Semester.

11

Page 12: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 15.4.2011

Definition 1.2 (Partielle Ableitungen)Seien n ∈ N mit n ≥ 1, D ⊆ Rn und f : D → R eine Funktion. Weiter seien a ∈ D

und ein Index 1 ≤ i ≤ n gegeben. Dann heißt die Funktion f im Punkt a nach deri-ten Variablen partiell differenzierbar, wenn ai ein Haufungspunkt der Menge

Di,a := {x ∈ R|(a1, . . . , ai−1, x, ai+1, . . . , an) ∈ D}

ist und die Funktion

fi,a : Di,a → R;x 7→ f(a1, . . . , ai−1, x, ai+1, . . . , an)

in ai differenzierbar ist. In diesem Fall definieren wir die partielle Ableitung von f imPunkt a nach der i-ten Variablen als

∂f

∂xi

(a) := f ′i,a(ai).

Es gibt eine erstaunlich grosse Vielfalt verschiedener Schreibweisen fur die partiellenAbleitungen. Sie finden oft auch die alternativen Notationsmoglichkeiten

∂f

∂xi

(a) = ∂xif(a) = Dxi

f(a) = fxi(a).

Ist die Funktion f durch eine explizite Formel gegeben, so hat”xi“ in dem Ausdruck

∂f/∂xi zwei verschiedene Bedeutungen, einmal wird es rein symbolisch verwendet,um anzugeben nach welcher Variablen abgeleitet wird, und zum anderen taucht es alsArgument in f auf. Einige Autoren bevorzugen es zumindest gelegentlich diese beidenBedeutungen zu trennen und so etwas wie ∂f/∂ri zu schreiben. Noch konsequenter,und auch haufiger zu finden, ist es nur noch i statt xi zu schreiben, also

∂f

∂xi

(a) = ∂if(a) = Dif(a) = fi(a).

Schließlich wird die Auswertung an der Stelle a oftmals auch in der Form

∂f

∂xi

(a) =∂f

∂xi

∣∣∣∣x=a

=∂f

∂xi

∣∣∣∣a

,

geschrieben, wenn fur f eine explizite Formel eingesetzt ist, so werden auch wir dieseSchreibweise verwenden. Rechnerisch stellt uns die Berechnung partieller Ableitungenvor keine neuen Probleme, es werden alle Variablen ausser xi als Konstanten behan-delt und ganz normal nach der verbleibenden Variablen xi abgeleitet. Kann man alsonormale Ableitungen berechnen, so kennt man auch partielle Ableitungen. Wir wollenein paar kleine Beispiele rechnen.

12

Page 13: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 15.4.2011

1. Sei f(x, y) = x+y2. Hier ist also n = 2 die Zahl der Variablen, und fur die MengeD konnen wir den ganzen R2, also D = R2, verwenden. Wir wollen die partielleAbleitung von f nach der ersten Variablen, also nach x berechnen. Unsere De-finition sagt wir mussen y als Konstante behandeln, und nach der Variablen xableiten, und somit ergibt sich

∂f

∂x= 1

denn die Ableitung von x+ Konstante ist Eins. Fur die partielle Ableitung nachy betrachten wir x als konstant, und leiten damit die Funktion Konstante + y2

ab, d.h.∂f

∂y= 2y.

2. Jetzt betrachten wir die Funktion f(x, y) = x cos y, wieder auf D = R2 definiert.Denken wir uns y als konstant, so ist auch cos y konstant, wir haben also eineFunktion Konstante · x abzuleiten, und dies gibt einfach die Konstante, also

∂f

∂x= cos y.

Fur die partielle Ableitung nach y haben wir dagegen Konstante · cos y mit derAbleitung

∂f

∂y= −x sin y.

3. Jetzt betrachten wir die Funktion

f(x, y) :=y

x.

Diese konnen wir offenbar nicht fur alle x, y ∈ R definieren, hier ist es also notig,wirklich eine echte Teilmenge D des R2 als Definitionsbereich zu verwenden.Naheliegenderweise verwenden wir hierfur die Menge D := {(x, y) ∈ R2|x 6= 0}.Fur die partielle Ableitung nach x haben wir diesmal Konstante · 1/x und 1/xhat die Ableitung −1/x2, wir kriegen also

∂f

∂x= − y

x2.

Als Funktion von y ist f dagegen einfach Konstante · y, also

∂f

∂y=

1

x.

4. Wir betrachten jetzt noch ein letztes Beispiel f(x, y) = xy. Potenzen mit reellenExponenten waren nur fur positive Basen sinnvoll, also sollten wir als Definitions-bereich die Menge D = {(x, y) ∈ R2|x > 0} benutzen. Die partiellen Ableitungen

13

Page 14: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 15.4.2011

berechnen sich diesmal zu

∂f

∂x= yxy−1,

∂f

∂y= ln(x)xy.

Bevor wir die hoheren partiellen Ableitungen definieren wollen wir noch eine weiterekleine Anmerkung zur Definition von ∂f/∂xi in einem Punkt a machen. Wie schonbemerkt werden alle Variablen xj = aj fur j 6= i konstant gehalten und dann wird inai nach xi abgeleitet.

Da

b

x

y

fa,x

fa,y

fb,x

fb,y

x

y

D

Wenn wir uns dies beispielsweise fur n = 2 Argumente x, y einmal hinmalen, so be-trachtet man die Funktion f zur Berechnung von ∂f/∂x(a) auf waagerechten Gera-denstucken durch den Punkt a und zur Berechnung von ∂f/∂y(a) werden vertikaleGeradenstucke durch a verwendet. Damit die partielle Ableitung uberhaupt sinnvolldefiniert ist, muss der im Definitionsbereich D der Funktion f liegende Teil des jeweili-gen Geradenstucks sich bei a haufen, in der Definition der partiellen Ableitung ∂f/∂xi

ist dies gerade die Bedingung das ai ein Haufungspunkt der Menge Di,a ist. In den

”Randpunkten“ von D kann dies durchaus eine Einschrankung sein, im Beispiel des

obigen linken Bildes ist alles gut, aber im rechten Bild sieht man einige Problemfalle.Dort ist der Definitionsbereich D ein Kreis mit Mittelpunkt (0, 0) und irgendeinem Ra-dius r > 0. Ist a = (r, 0) der Punkt ganz rechts, so ist das vertikale Geradenstuck durcha tangential zum Kreis D und trifft diesen nur im Punkt a, eine partielle Ableitungnach y ist in diesem Punkt also nicht definiert. Entsprechendes trifft fur den Punkta = (−r, 0) ganz links zu. Dagegen ist in den Punkten (0,±r) die partielle Ableitungnach x nicht definiert.

Welche partiellen Ableitungen sinnvoll sind, hangt also auch von der Geometrieder Menge D ab, bei einem Kreis gibt es wie gesehen vier problematische Punkte.Ist dagegen D etwa ein Rechteck, so sind in jedem Punkt von D beide partiellenAbleitungen, zumindest potentiell, definiert. Diesen etwas storenden Punkt werden wirspater in diesem Semester umgehen, indem wir nur noch sogenannte

”offene Mengen“

14

Page 15: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 15.4.2011

D betrachten, aber dazu kommen wir erst spater. In diesem Paragraphen wird dieuns interessierende Menge D ein Streifen D = [0, l] × R sein, und auch dies ist einunkritischer Fall. Nun kommen wir zu den partiellen Ableitungen hoherer Ordnung.Genau wie die hoheren Ableitungen von Funktionen in einer Variablen werden dieserekursiv definiert.

Definition 1.3: Seien n ∈ N mit n ≥ 1, D ⊆ Rn eine Teilmenge und f : D → R eineFunktion. Dann definieren wir:

(a) Sei 1 ≤ i ≤ n. Dann heißt die Funktion f nach der i-ten Variablen partiell dif-ferenzierbar, wenn f in jedem Punkt a ∈ D nach der i-ten Variablen partielldifferenzierbar ist. Die partielle Ableitung von f nach der i-ten Variablen istdann die Funktion

∂1f

∂xi

=∂f

∂xi

: D → R; a 7→ ∂f

∂xi

(a).

(b) Hohere partielle Ableitungen werden jetzt induktiv definiert. Sei r ∈ N mit r ≥ 2und seien weiter 1 ≤ i1, . . . , ir ≤ n gegeben. Dann heißt die Funktion f in einemPunkt a ∈ D nach xir , . . . , xi1 partiell differenzierbar, wenn f nach xir−1 , . . . , xi1

partiell differenzierbar ist und die Funktion ∂r−1f/∂xir−1 · · · ∂xi1 in a nach derir-ten Variable partiell differenzierbar ist. In diesem Fall schreiben wir

∂rf

∂xir · · · ∂xi1

(a) :=∂

∂xir

∣∣∣∣a

(∂r−1f

∂xir−1 · · · ∂xi1

).

Weiter heißt f partiell nach xir , . . . , xi1 differenzierbar wenn f in jedem Punkta ∈ D nach xir , . . . , xi1 partiell differenzierbar ist und die r-te partielle Ableitungvon f nach xir , . . . , xi1 ist die Funktion

∂rf

∂xir · · · ∂xi1

: D → R; a 7→ ∂rf

∂xir · · · ∂xi1

(a).

(c) Ist r ∈ N mit r ≥ 1, so heißt die Funktion f r-fach partiell differenzierbar, wennf fur alle 1 ≤ i1, . . . , ir ≤ n partiell nach xir , . . . , xi1 differenzierbar ist.

Beachte das die partielle Differenzierbarkeit einer Funktion f : D → R nach einerVariablen xi implizit auch eine Bedingung an den Definitionsbereich D ist. Analogzu einfachen partiellen Ableitungen gibt es auch wieder eine ganze Reihe alternativerSchreibweisen, zum Beispiel

∂rf

∂xir · · · ∂xi1

= ∂xir ,...,xi1f = Dxir ,...,xi1

f = fxir ,...,xi1= Dir,...,i1f = fir,...,i1 .

Nach diesen Vorbereitungen kommen wir jetzt zur schwingenden Saite. Wir betrachteneinen eingespannten metallischen Draht, der in einer Dimension schwingen kann, etwaeine Saite einer Gitarre. Dabei denken wir uns, dass die Bewegung der Saite nur in

15

Page 16: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 15.4.2011

einer Richtung stattfindet, und konnen die Saite dann durch eine Funktion u(x, t)beschreiben. Hier steht t fur die Zeit und x fur die Ortskoordinate auf der Saite. DerWert u(x, t) ist die Auslenkung bei x zum Zeitpunkt t.

u(x,t)u

x=0 x=lx

Die Saite habe eine Lange l > 0 und sei an den beiden Enden fest eingespannt, d.h.wir wollen u(0, t) = u(l, t) = 0 fur alle t ∈ R haben. Wir wollen eine Gleichung zurBeschreibung der Bewegung dieser Saite herleiten. Das prinzipielle Vorgehen ist dabeiklar, wir haben die Anderung des Impulses, also Masse mal Beschleunigung, gleich derwirkenden Kraft zu setzen, und hieraus ist dann die gesuchte Gleichung abzuleiten.Kommen wir zuerst einmal zur Beschleunigung. Wir setzen uns auf einen Punkt x derSaite und verfolgen wie sich dieser Punkt im Laufe der Zeit andert. Anders gesagt istdie Bewegung dieses festen Punktes x auf der Saite durch die Funktion t 7→ u(x, t)gegeben, wir halten x also als Konstante fest und betrachten u als Funktion von t.Die Geschwindigkeit erhalten wir durch Ableiten dieser Funktion nach t und dies istdefinitionsgemaß die partielle Ableitung der Funktion u nach t. Weiteres Ableiten nacht liefert die Beschleunigung

a =∂2u

∂t2:=

∂2u

∂t∂t.

Weiter bezeichne M > 0 die Masse unserer Saite. Denken wir uns die Saite als ho-mogen, so ergibt sich im Punkt x die Dichte M/l und die Anderung des Impulseswird (M/l)∂2u/∂t2. Ist F die auf unseren Punkt wirkende Kraft, so erhalten wir dieBewegungsgleichung

F =M

l· ∂

2u

∂t2.

Um jetzt weiter zu kommen, muss F bestimmt werden. Dafur nehmen wir an dasdiese Kraft nur von den Rucktriebskraften innerhalb der Saite verursacht wird, alsodenjenigen Kraften die versuchen die Saite in horizontale Lage zu bringen. Um diesezu berechnen, denken wir uns die Saite in eine große Zahl n ∈ N gleichgroßer Teilezerlegt. Jedes dieser n Teilstucke hat dann die Lange ε = l/n und die Masse m = M/n.

16

Page 17: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 15.4.2011

ε

u

x=0 x=l

u(x,t)

x=lk/n

x−ε x+

Wir betrachten dann nur noch die x-Werte x = kl/n = kε fur k = 0, 1, . . . , n. Wirnehmen weiter an das es ausreicht nur die von den beiden unmittelbaren Nachbarnbewirkten Rucktriebskrafte zu berucksichtigen. Diese sind in den Punkten x − ε undx+ ε. Um diese Krafte zu bestimmen, nehmen wir weiter an, dass wir uns den Punkt(x, u(x, t)) mit seinen beiden Nachbarn (x− ε, u(x− ε, t)) und (x+ ε, u(x+ ε, t)) durchFedern verbunden denken konnen, wir denken uns also die Saite als aus kleinen Federnaufgebaut. Bei geeigneten Materialen, die wir uns bei unserer Saite als gegeben denken,und nicht zu grossen Auslenkungen ist die von der Feder bewirkte Kraft proportionalzum Verbindungsvektor der beiden Punkte, wobei der Proportionalitatsfaktor als diesogenannte Federkonstante bezeichnet wird. Uns interessieren nur die Krafte in verti-kaler Richtung, und diese sind

C · (u(x− ε, t)− u(x, t)) nach links und C · (u(x+ ε, t)− u(x, t)) nach rechts,

wobei C die Federkonstante ist. Weiter machen wir die ubliche Annahme das sich dieFederkonstante als C = c0 · D/ε zusammensetzt, wobei c0 eine Materialkonstante, Dder Durchmesser der Feder, also der Durchmesser unserer Saite, und ε die Lange derFeder im Ruhezustand, also in horizontaler Lage, sind. Als Gesamtkraft auf x ergibtsich

F =c0D

ε(u(x+ ε, t) + u(x− ε, t)− 2u(x, t)).

Dieser Ausdruck ist leider noch recht kompliziert, und wir verwenden daher eine qua-dratische Taylorapproximation zu seiner Vereinfachung. Hierzu denken wir uns denZeitpunkt t fixiert und entwickeln u(x, t) als Funktion von x mit dem Entwicklungs-punkt x0 = kε. Hierbei treten die Ableitungen der Funktion u(x, t) nach x bei konstantgehaltenen t auf, also gerade die partiellen Ableitungen der Funktion u nach der Va-riablen x. Es sind

u(x+ ε, t) = u(x, t) +∂u

∂x(x, t)ε+

1

2· ∂

2u

∂x2(x, t)ε2 + τ+,

u(x− ε, t) = u(x, t)− ∂u

∂x(x, t)ε+

1

2· ∂

2u

∂x2(x, t)ε2 + τ−,

17

Page 18: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 15.4.2011

wobei τ+, τ− die jeweiligen Approximationsfehler sind. Nach dem Satz uber das La-grangesche Restglied I.§14.Satz 16 hat etwa τ+ die Form

τ+ =1

6

∂3u

∂x3(ξ, t)ε3

mit einem ξ zwischen x und x + ε. Wir gehen implizit davon aus, dass die dritteAbleitung nach x langs der ganzen Saite beschrankt bleiben wird, und haben dann|τ+| ≤ A+ε

3 mit einer Konstanten A+. Entsprechendes gilt fur τ−. Ignorieren wir dieFehler so wird die Kraft F zu

c0D

ε

[u(x, t) +

∂u

∂x(x, t)ε+

1

2· ∂

2u

∂x2ε2 + u(x, t)− ∂u

∂x(x, t)ε+

1

2· ∂

2u

∂x2ε2 − 2u(x, t)

]= c0Dε ·

∂2u

∂x2(x, t).

Etwas genauer, also mit Fehlerterm, ist

F = c0Dε ·∂2u

∂x2(x, t) +O(ε2)

wobei O(ε2) fur eine Funktion steht, die wir als |O(ε2)| ≤ Aε2 mit einer Konstanten Aabschatzen konnen. Dieses sogenannte Landau-Symbol ist nur eine praktische Notationum nicht jedem auftretenden Fehlerterm einen eigenen Namen geben zu mussen. Wirsetzen jetzt F gleich der Impulsanderung, die wir schon oben ausgerechnet haben. Dawir jetzt aber nicht einen einzelnen Punkt sondern ein Teilstuck der Saite der Lange εbetrachten, mussen wir die Dichte M/l durch (M/l) · ε = M/n ersetzen. Wir erhaltendie Gleichung

M

n· ∂

2u

∂t2(x, t) = F = c0Dε ·

∂2u

∂x2(x, t) +O(ε2) =

c0Dl

n· ∂

2u

∂x2(x, t) +O

(1

n2

).

beziehungsweise∂2u

∂t2(x, t) =

c0Dl

M

∂2u

∂x2(x, t) +O

(1

n

).

Fassen wir die vier Materialkonstanten M, c0, D, l zu

ν :=

√M

c0Dl> 0

zusammen und fuhren den Grenzubergang n → ∞ durch, so haben wir damit dieGleichung

∂2u

∂t2=

1

ν2· ∂

2u

∂x2

fur unsere Saite erhalten. Dies ist die sogenannte eindimensionale Wellengleichung.Losungen dieser Gleichung kann man etwa durch den sogenannten Separationsansatzu(x, t) = ϕ(x) · ψ(t) mit zu bestimmenden Funktionen ϕ, ψ finden, aber darum gehtes uns hier nicht mehr. Fur unsere Zwecke war nur der Einsatz des quadratischenTaylorpolynoms zur Herleitung der Wellengleichung von Interesse.

18

Page 19: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 15.4.2011

1.3 Analytische Funktionen

Wir wollen die Taylorentwicklung noch etwas weiter untersuchen. Wir beginnen miteinem rechnerischen Aspekt. Angenommen wir wollen die Taylorentwicklung der Funk-tion

f(x) =1

1 + sinx

zum Entwicklungspunkt x0 = 0 berechnen, etwa bis hin zur dritten Ordnung. Direktnach der Definition des Taylorpolynoms mussen wir hierzu die ersten drei Ableitungender Funktion f berechnen. Dies ist naturlich leicht machbar, aber doch eine etwas unan-genehme Rechnung. Tatsachlich lasst sich das Taylorpolynom T3 bestimmen ohne eineeinzige Ableitung von f auszurechnen. Wir fuhren hier zunachst nur den Rechenwegvor, und kummern uns erst danach um seine exakte Begrundung. Wir wollen

1

1 + sinx= a+ bx+ cx2 + dx3 + · · ·

schreiben. Verwenden wir die uns bereits bekannte Potenzreihenentwicklung des Sinus,so haben wir

1 + sinx = 1 + x− 1

6x3 + · · ·

also

(a+ bx+ cx2 + dx3 + · · · ) ·(

1 + x− 1

6x3 + · · ·

)= 1.

Multiplizieren wir dieses Produkt aus, so ergibt sich

a+(a+b)x+(b+c)x2+(c+ d− a

6

)x3+· · · !

= 1 =⇒ a = 1, a+b = b+c = c+d− a6

= 0.

Hierzu mussen wir glauben, dass die obige Identitat bereits erzwingt das die Koeffizi-enten aller hoheren Potenzen von x auf der linken Seite gleich Null sind. Wie schonbemerkt wollen wir uns erst spater um Begrundungen kummern. Weiter rechnen wir

a = 1, b = −a = −1, c = −b = 1 und d =a

6− c = −5

6,

also ist das dritte Taylorpolynom zum Entwicklungspunkt 0

T3(x) = 1− x+ x2 − 5

6x3.

Dies ist tatsachlich das korrekte Ergebis, aber warum funktioniert diese Methode?Bevor wir dies klaren fuhren wir noch eine weitere solche Rechnung vor, diesmal wollenwir das dritte Taylorpolynom der Funktion f(x) = esin x zum Entwicklungspunkt x0 = 0berechnen. Wir verwenden wieder sinx = x− x3/6 + · · · und erhalten

sin2 x =

(x− 1

6x3 + · · ·

)2

= x2 + · · · ,

sin3 x = (x2 + · · · ) ·(x− 1

6x3 + · · ·

)= x3 + · · ·

19

Page 20: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 15.4.2011

also

esin x = 1 + sinx+1

2sin2 x+

1

6sin3 x+ · · · = 1 + x+

1

2x2 + 0 · x3 + · · · ,

und das dritte Taylorpolynom ist T3(x) = 1 + x+ x2/2. Wir wollen uns uberlegen furwelche Funktionen derartige Rechnungen moglich sind. Schon im letzten Semester hat-ten wir angemerkt, dass man sich Potenzreihen als

”Polynome von Grad ∞“ vorstellen

sollte. Dies legt es nahe in der Taylorentwicklung”n = ∞“ zu setzen, man erhalt dann

eine Potenzreihe die sogenannte Taylorreihe. Damit diese uberhaupt definiert ist, mussunsere Funktion unendlich oft differenzierbar sein, also Ableitungen beliebiger Ordnunghaben.

Definition 1.4 (Die Taylorreihe eine unendlich oft differenzierbaren Funktion)Seien I ⊆ R ein Intervall, f : I → R eine unendlich oft differenzierbare Funktion undx0 ∈ I. Die Taylorreihe der Funktion f zum Entwicklungspunkt x0 ist die Potenzreihe

T (x) :=∞∑

n=0

f (n)(x0)

n!(x− x0)

n.

Beachte das die Taylorreihe einer Funktion f nur von den Werten von f nahe beimEntwicklungspunkt abhangt, d.h. ist ε > 0 und betrachten wir das kleinere Intervall

I := {x ∈ I : |x− x0| < ε} = I ∩ (x0 − ε, x0 + ε),

so stimmen die Taylorreihen von f und der Einschrankung f |I zum Entwicklungspunktx0 uberein. Dies ist klar aufgrund der entsprechenden Eigenschaft I.§14.Lemma 1.(b)von Ableitungen. Ist insbesondere g : I → R eine weitere unendlich oft differenzierbareFunktion, die auf I mit f ubereinstimmt, so stimmen auch die Taylorreihen von f undg zum Entwicklungspunkt x0 uberein.

Bevor wir fortfahren ist noch eine Anmerkung zum Unterschied zwischen der reel-len und der komplexen Theorie angebracht. Wir haben die Taylorreihe, und im letztenSemester das Taylorpolynom, nur fur reelle Funktionen eingefuhrt. Da wir in diesemSemester primar an der reellen Theorie interessiert sind, ist dies auch durchaus an-gebracht. In diesem Abschnitt werden wir aber auch eine ganze Reihe von Aussagenuber Potenzreihen formulieren und beweisen, und diese wollen wir fast alle sowohl reellals auch komplex behandeln. Wie wir noch sehen werden, ist die komplexe Sichtweisefur die Untersuchung von Potenzreihen tatsachlich der angemessene Standpunkt. Diemeisten anderen Begriffe werden wir dagegen nur reell formulieren.

Diejenigen Funktionen fur die Rechnungen wie zu Beginn dieses Abschnitts im-mer moglich sind, sind die sogenannten analytischen Funktionen, dies sind unendlichoft differenzierbare Funktionen deren Taylorreihe bei jedem Entwicklungspunkt posi-tiven Konvergenzradius hat und gegen die Funktion konvergiert. Als exakte Definitionverwenden wir:

20

Page 21: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 15.4.2011

Definition 1.5 (Analytische Funktionen)Seien I ⊆ R ein offenes Intervall und f : I → R eine unendlich oft differenzierbareFunktion. Dann heißt f analytisch in einem Punkt x0 ∈ I wenn die Taylorreihe T vonf zum Entwicklungspunkt x0 positiven Konvergenzradius r > 0 hat und es ein ε > 0mit ε ≤ r gibt so, dass fur jedes x ∈ R mit |x − x0| < ε stets x ∈ I und f(x) = T (x)ist. Weiter heißt die Funktion f analytisch wenn sie in jedem Punkt x0 ∈ I analytischist.

Zunachst fragt man sich naturlich ob es uberhaupt nicht analytische, aber unendlichoft differenzierbare Funktionen gibt. Leider gibt es solche Funktionen. Es gibt sogarderartige Funktionen bei denen die Taylorreihe uberall konvergiert, aber ihr Grenzwertvon der gegebenen Funktion verschieden ist. Als ein solches Beispiel betrachten wir dieFunktion

f : R → R;x 7→

{e−1/x, x > 0,

0, x ≤ 0.

Als eine Ubungsaufgabe werden Sie nachrechnen, dass die Funktion f unendlich oftdifferenzierbar ist, und das es fur jedes n ∈ N eine rationale Funktion Rn : R>0 → Rmit

f (n)(x) =

{Rn(x)e−1/x, x > 0,

0, x ≤ 0

fur alle x ∈ R gibt. Insbesondere ist f (n)(0) = 0 fur jedes n ∈ N, im Nullpunktverschwinden also uberhaupt alle Ableitungen der Funktion f . Insbesondere ist dieTaylorreihe T von f zum Entwicklungspunkt x0 = 0 identisch Null T (x) = 0, stelltalso nicht die Funktion f dar, nicht einmal fur kleine positive x. Diese Funktion ist alsoin x0 = 0 nicht analytisch. Die Funktion f ist dabei noch ein vergleichsweise harmlosesBeispiel, es gibt unendlich oft differenzierbare Funktionen die in keinem einzigen Punktanalytisch sind. Ein solches Beispiel ist die Funktion f : R → R definiert als

f(x) =∞∑

n=0

cos(2nx)

n!,

deren exakte Behandlung eine Ubungsaufgabe spater in diesem Semester sein wird.Analog zur reellen Definition kann man auch komplexe analytische Funktionen definie-ren, man muss nur anstelle von offenen Intervallen als Definitionsbereich die sogenann-ten offenen Teilmengen von C verwenden. Dieser Begriff stellt sich dann allerdings alsredundant heraus, eine auf einer offenen Teilmenge von C definierte und differenzier-bare Funktion ist bereits analytisch. Die komplexe Theorie ist damit viel besser als diereelle, aber kein Gegenstand dieses Semesters.

Nachdem wir jetzt einige Beispiele nicht analytischer Funktionen hatten, wollen wirjetzt auch einmal analytische Funktionen sehen. Wir werden einsehen, dass die Funk-tionen sin, cos und exp alle analytisch sind. Alle diese Funktionen hatten wir im letztenSemester als Potenzreihen schreiben konnen, und wir wollen uns allgemein uberlegen

21

Page 22: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 15.4.2011

das jede durch eine Potenzreihe gegebene Funktion analytisch ist. Hierzu mussen wirdie Taylorreihen einer Potenzreihenfunktion berechnen. Wir beginnen mit dem einfach-sten Fall das der Entwicklungspunkt der Taylorreihe mit dem Entwicklungspunkt derPotenzreihe zusammenfallt. Sei also K ∈ {R,C} und sei f(z) =

∑∞n=0 an(z − z0)

n einePotenzreihe uber K mit Entwicklungspunkt z0 ∈ K und positiven Konvergenzradiusr > 0. Durch Induktion folgt aus I.§14.Satz 5 das die Funktion f : Br(z0) → K unend-lich oft differenzierbar ist und das fur jedes z ∈ K mit |z − z0| < r und jedes k ∈ Nauch

f (k)(z) =∞∑

n=0

(n+ 1) · . . . · (n+ k)an+k(z − z0)n =

∞∑n=0

(n+ k)!

n!an+k(z − z0)

n

ist, wobei auch diese Potenzreihe den Konvergenzradius r hat. Insbesondere ist furjedes n ∈ N auch

f (n)(z0)

n!= an.

Im Fall K = R stimmt also die Taylorreihe der Funktion f zum Entwicklungspunktz0 mit der ursprunglichen Potenzreihe uberein. Damit ist eine Potenzreihenfunktionzumindest in ihrem Entwicklungspunkt analytisch. Wir zeigen jetzt, dass sie auch inallen anderen Punkten analytisch ist.

Lemma 1.6 (Potenzreihen sind analytisch)Sei f(x) =

∑∞n=0 an(x − x0)

n eine reelle Potenzreihe mit positiven Konvergenzradiusr > 0. Dann ist die Funktion f : Br(x0) → R analytisch.

Beweis: Wir haben bereits eingesehen, dass f im Entwicklungspunkt x0 analytisch ist.Sei jetzt x1 ∈ R mit |x− x1| < r gegeben. Nach I.§13.Lemma 18 ist die Reihe

bn :=∞∑

k=0

(n+ k

n

)an+k(x1 − x0)

k

fur jedes n ∈ N absolut konvergent, die Potenzreihe g(x) :=∑∞

n=0 bn(x−x1)n hat einen

Konvergenzradius s ≥ r−|x1−x0| > 0 und fur jedes x ∈ R mit |x−x1| < r−|x1−x0|ist g(x) = f(x). Damit ist g(x) auch die Taylorreihe von f zum Entwicklungspunkt x1,und setzen wir ε := min{1, r − |x1 − x0|} > 0, so ist ε ≤ s und fur jedes x ∈ R mit|x− x1| < ε sind auch x ∈ Br(x0) und f(x) = g(x). Damit ist f analytisch in x1.

Damit sind die Exponentialfunktion, Sinus, Cosinus und naturlich auch alle Polynomeanalytisch. Wir werden noch einsehen, dass uberhaupt alle Grundfunktionen analytischsind. Ob eine Funktion in einem Punkt analytisch ist, ist eine lokale Eigenschaft, sindI, J ⊆ R zwei offene Intervalle mit x0 ∈ J ⊆ I und f : I → R eine Funktion, soist f genau dann in x0 analytisch wenn die Einschrankung f |J in x0 analytisch ist.Insbesondere kann eine Funktion f nicht nur in isolierten Punkten analytisch sein, istunser f in x0 ∈ I analytisch, so gibt es ein ε > 0 mit (x0 − ε, x0 + ε) ⊆ I so, dass

22

Page 23: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 15.4.2011

f |(x0− ε, x0 + ε) eine Potenzreihenfunktion ist. Nach dem Lemma ist f damit in jedemPunkt x1 ∈ (x0 − ε, x0 + ε) analytisch.

Unsere Beobachtung das die Taylorreihe einer Potenzreihe im Entwicklungspunktmit der Potenzreihe identisch ist, hat noch einige weitere wichtige Folgerungen. Ei-ne davon ist der sogenannte

”Koeffizientenvergleich“. Dies ist gerade die formale Be-

grundung unseres Koeffizientenvergleichs bei der Berechnung der Taylorreihe der Funk-tion f(x) = 1/(1+sinx) zu Beginn dieses Abschnitts. In der Vorlesung hatten wir diesesLemma nur im reellen Fall formuliert und auch nur Teil (a), in einer etwas anderenFormulierung, vorgefuhrt.

Lemma 1.7 (Koeffizientenvergleich)Seien K ∈ {R,C}, z0 ∈ K, f(z) =

∑∞n=0 an(z − z0)

n eine Potenzreihe mit Konver-genzradius r > 0 und g(z) =

∑∞n=0 bn(z − z0)

n eine Potenzreihe mit Konvergenzradiuss > 0.

(a) Gibt es ein ε > 0 mit ε ≤ min{r, s} und f(z) = g(z) fur alle z ∈ K mit |z−z0| < ε,so ist an = bn fur alle n ∈ N.

(b) Gibt es eine Folge (zn)n∈N in K mit (zn)n∈N −→ z0 und 0 < |zn− z0| ≤ min{r, s},f(zn) = g(zn) fur alle n ∈ N, so ist an = bn fur alle n ∈ N.

Beweis: (a) Die lokale Natur der Ableitung I.§14.Lemma 1.(b) und die obige Uberle-gung ergibt an = f (n)(z0)/n! = g(n)(z0)/n! = bn fur alle n ∈ N.(b) Wir zeigen an = bn fur alle n ∈ N durch Induktion nach n. Da Potenzreihen nachI.§13.Satz 19 stetig sind, haben wir zunachst

a0 = f(z0) = limn→∞

f(zn) = limn→∞

g(zn) = g(z0) = b0,

und der Induktionsanfang ist eingesehen. Nun sei n ∈ N mit n ≥ 1 und fur alle0 ≤ k < n gelte bereits ak = bk. Dann betrachten wir die beiden Potenzreihen

f(z) :=∞∑

k=0

an+k(z − z0)k und g(z) :=

∞∑k=0

bn+k(z − z0)k,

die offenbar wieder die Konvergenzradien r beziehungsweise s haben. Fur alle m ∈ Ngilt dann

f(zm) =1

(zm − z0)n

(f(zm)−

n−1∑k=0

ak(zm − z0)k

)

=1

(zm − z0)n

(g(zm)−

n−1∑k=0

bk(zm − z0)k

)= g(zm),

und mit dem bereits behandelten Induktionsanfang angewandt auf f und g ergibt sichauch an = bn. Per vollstandiger Induktion ist damit an = bn fur alle n ∈ N bewiesen.

23

Page 24: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 15.4.2011

Alternativ kann man Teil (a) naturlich auch als eine Folgerung aus Teil (b) beweisen.Um das Lemma in der Rechnung zu Beginn dieses Abschnitts anzuwenden, also umdie Implikatiom

a+(a+b)x+(b+c)x2+(c+ d− a

6

)x3+· · · = 1 =⇒ a = 1, a+b = b+c = c+d− a

6= 0

zu begrunden, muss man sich die rechte Seite nur als 1+0 ·x+0 ·x2 + · · · denken. Wirwollen jetzt noch mehr analytische Funktionen kennenlernen. Unsere einzigen Beispieleanalytischer Funktionen sind zur Zeit die Potenzreihen, und daher ist es von Interessedas Verhalten von Potenzreihen unter den Grundrechenarten zu untersuchen. Wir be-ginnen diese Untersuchungen mit dem folgenden Lemma, bei dem alle benotigte Arbeitschon im letzten Semester geleistet wurde. Im Gegensatz zur Vorlesung formulieren wirdas Lemma hier in der komplexen und in der reellen Version.

Lemma 1.8: Seien K ∈ {R,C}, z0 ∈ K, f(z) =∑∞

n=0 an(z − z0)n eine Potenzreihe

uber K mit Konvergenzradius r > 0 und g(z) =∑∞

n=0 bn(z−z0)n eine Potenzreihe uber

K mit Konvergenzradius s > 0. Setze t := min{r, s} > 0. Dann gelten:

(a) Die Potenzreihe∑∞

n=0(an + bn)(z− z0)n hat einen Konvergenzradius r ≥ t und fur

alle z ∈ Bt(z0) gilt∑∞

n=0(an + bn)(z − z0)n = f(z) + g(z).

(b) Ist c ∈ K so hat die Potenzreihe∑∞

n=0(can)(z−z0)n einen Konvergenzradius r ≥ r

und fur alle z ∈ Br(z0) gilt∑∞

n=0(can)(z − z0)n = cf(z).

(c) Die Potenzreihe

h(z) =∞∑

n=0

[n∑

k=0

akbn−k

](z − z0)

n

hat einen Konvergenzradius r ≥ t und fur alle z ∈ Bt(z0) gilt h(z) = f(z) · g(z).

Beweis: (a,b) Klar nach I.§7.Lemma 5.

(c) Klar nach I.§7.Satz 18.

In Teil (b) ist naturlich sogar r = r solange c 6= 0 ist. Die Aussage (c) gibt uns die Be-grundung fur das

”Ausmultiplizieren“ von Potenzreihen, wie wir es in den Rechnungen

zu Beginn dieses Abschnitts praktiziert haben. Eine weitere Methode zur Herstellungvon Potenzreihen, und damit von analytischen Funktionen, ist es in schon bekanntePotenzreihen fur die Variable

”x“ etwas anderes einzusetzen. Als Startpunkte konnen

24

Page 25: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 20.4.2011

wir etwa die uns bekannten Potenzreihen mit Entwicklungspunkt 0

ex =∞∑

n=0

1

n!xn,

sin x =∞∑

n=0

(−1)n

(2n+ 1)!x2n+1,

cosx =∞∑

n=0

(−1)n

(2n)!x2n,

1

1− x=

∞∑n=0

xn,

verwenden, wobei die geometrische Reihe im letzten Beispiel fur |x| < 1 konvergiert.Setzen wir jetzt zum Beispiel x2 fur x in die Cosinusreihe ein, so ergibt sich

cos(x2) =∞∑

n=0

(−1)n

(2n)!x4n

fur alle x ∈ C, und durch Einsetzen in die geometrische Reihe ergeben sich beispiels-weise

1

1 + x=

∞∑n=0

(−1)nxn,1

1− x2=

∞∑n=0

x2n,1

1 + x2=

∞∑n=0

(−1)nx2n

jeweils fur alle x ∈ C mit |x| < 1. Außerdem wissen wir das wir Potenzreihen gliedweiseableiten konnen, und Ableiten der geometrischen Reihe liefert

1

(1− x)2=

∞∑n=0

(n+ 1)xn =⇒∞∑

n=1

nxn =x

(1− x)2

fur alle x ∈ C mit |x| < 1. Diese Formel hatten wir auch schon im letzten Semestermit Hilfe des Cauchyprodukts von Reihen eingesehen, aber die Herleitung uber dieAbleitung der geometrischen Reihe ist einfacher.

Vorlesung 3, Mittwoch 20.4.2011

Wir beschaftigen uns gerade mit der Berechnung von Taylorreihen und den analyti-schen Funktionen. Als ein Beispiel hatten wir das dritte Taylorpolynom der Funktionf(x) = 1/(1 + sinx) zum Entwicklungspunkt x0 = 0 mittels der folgenden Rechnung

25

Page 26: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 20.4.2011

bestimmt:

(1)1

1 + sinx= a+ bx+ cx2 + dx3 + · · ·

(2) a+ (a+ b)x+ (b+ c)x2 +(c+ d− a

6

)x3 + · · ·

= (a+ bx+ cx2 + dx3 + · · · ) ·(

1 + x− 1

6x3 + · · ·

)!= 1

(3) a = 1, a+ b = b+ c = c+ d− a

6= 0

=⇒ b = −a = −1, c = −b = 1 und d =a

6− c = −5

6.

Zwei dieser drei Rechenschritte konnten wir inzwischen begrunden. Das Ausmultipli-zieren der beiden Potenzreihen im zweiten Schritt ist gerade Lemma 8.(c), also letzt-lich das Cauchyprodukt von Reihen aus dem letzten Semester. Die Berechnung vona, b, c, d im dritten Schritt ist der in Lemma 7 behandelte Koeffizientenvergleich. Of-fen ist noch warum wir die Funktion f im ersten Schritt uberhaupt als Potenzreiheansetzen konnen. Um dieses einzusehen, werden wir noch zeigen das diese Funktionanalytisch ist, dies ergibt dann insbesondere das die Taylorreihe von f ausreichend na-he bei x0 = 0 tatsachlich konvergiert und die Funktion darstellt. Dass die berechnetenKoeffizienten der Potenzreihe am Ende der Rechnung dann tatsachlich das vierte Tay-lorpolynom der Funktion f sind, ergibt sich da wir auch schon eingesehen haben, dassdie Taylorreihe einer Potenzreihenfunktion im Entwicklungspunkt mit der Potenzrei-he selbst ubereinstimmt. Als ein zweites Beispiel hatten wir das dritte Taylorpolynomder Funktion f(x) = esin x, wieder im Entwicklungspunkt x0 = 0, durch Einsetzen derSinusreihe in die Exponentialreihe berechnet. Hierfur fehlt uns noch eine Begrundung.

Wir hatten bereits angemerkt, dass jede Funktion die sich als eine Formel in denGrundfunktionen schreiben laßt, analytisch ist. Dies trifft dann insbesondere auf dieFunktion f(x) = 1/(1+ sin x) zu. Wirklich gezeigt, haben wir bisher aber nur das eini-ge der Grundfunktion wie Sinus, Cosinus und die Exponentialfunktion analytisch sind.Wir mussen dies noch fur die restlichen Grundfunktionen einsehen und beweisen das ausanalytischen Funktionen zusammengesetzte Funktionen, also beispielsweise Summen,Produkte, Hintereinanderausfuhrungen, wieder analytisch sind. Der Nachweis dieserTatsachen teilt sich in der Regel in zwei Teile auf, zuerst beweist man die entspre-chenden Aussagen fur Potenzreihen und folgert sie daraus fur allgemeine analytischeFunktionen. Dass eine lokal als Potenzreihe beschriebene Funktion analytisch ist, habenwir zwar schon erwahnt und im Wesentlichen auch schon bewiesen, haben es aber nochnicht als einen Satz festgehalten. Der folgende Satz enthalt gleich eine weitere, gele-gentlich nutzliche, Charakterisierung analytischer Funktionen. In der Vorlesung hattenwir nur die wichtigste Teilaussage dieses Lemmas, namlich die Implikation von (c) nach(a) vorgefuhrt, hier wollen wir einen vollstandigen Beweis des Lemmas angeben.

Lemma 1.9 (Charakterisierung analytischer Funktionen)Seien I ⊆ R ein offenes Intervall, f : I → R eine unendlich oft differenzierbare

Funktion und x0 ∈ I. Dann sind die folgenden Aussagen aquivalent:

26

Page 27: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 20.4.2011

(a) Die Funktion f ist in x0 analytisch.

(b) Es gibt ein ε > 0 mit (x0−ε, x0+ε) ⊆ I und eine Potenzreihe T (x) =∑∞

n=0 an(x−x0)

n mit einem Konvergenzradius r ≥ ε so, dass f(x) = T (x) fur alle x ∈(x0 − ε, x0 + ε) gilt.

(c) Es gibt Konstanten M, q, ε > 0 mit (x0 − ε, x0 + ε) ⊆ I und |f (n)(x)| ≤ M · n! · qn

fur alle x ∈ (x0 − ε, x0 + ε), n ∈ N.

Beweis: (a)=⇒(b). Klar.

(b)=⇒(c). Wegen r > 0 existieren nach I.§13.Lemma 16.(b) Konstanten C, q > 0 mit|an| ≤ C/qn fur alle n ∈ N. Fur alle x ∈ (x0 − ε, x0 + ε) und alle n ∈ N folgt durchiterierte Anwendung von I.§14.Satz 5 die Gleichung

f (n)(x)

n!=

∞∑k=n

k!

n!(k − n)!ak(x− x0)

k−n =∞∑

k=n

(k

n

)ak(x− x0)

k−n

=∞∑

k=0

(n+ k

n

)an+k(x− x0)

k.

Wenden wir diese Formel speziell auf die geometrische Reihe 1/(1− x) =∑∞

n=0 xn fur

|x| < 1 an, so folgt fur jedes x ∈ R mit |x| < 1 und alle n ∈ N auch

∞∑k=0

(n+ k

n

)xk =

1

n!

(dn

dxn

1

1− x

)=

1

(1− x)n+1.

Setze s := min{q/2, ε}, also auch s/q < 1. Fur jedes x ∈ (x0− s, x0 + s) ⊆ (x0− ε, x0 +ε) ⊆ I und alle n ∈ N gilt dann

∣∣∣∣f (n)(x)

n!

∣∣∣∣ =

∣∣∣∣∣∞∑

k=0

(n+ k

n

)an+k(x− x0)

k

∣∣∣∣∣ ≤∞∑

k=0

(n+ k

n

)|an+k| · |x− x0|k

≤ C

qn

∞∑k=0

(n+ k

n

)(s

q

)k

=C

qn

(q

q − s

)n+1

,

also |f (n)(x)| ≤ A · n! · qn mit A := Cq/(q − s) > 0 und q := 1/(q − s) > 0.

(c)=⇒(a). Setzen wir δ := min{ε, 1/q}, so ist (x0 − δ, x0 + δ) ⊆ (x0 − ε, x0 + ε) ⊆ Iund qδ ≤ 1. Sei jetzt x ∈ I mit |x− x0| < δ gegeben. Wir wollen zeigen, dass dann dieTaylorreihe T von f zum Entwicklungspunkt x0 in x gegen T (x) = f(x) konvergiert.Sei also ein α > 0 gegeben. Es ist q|x − x0| < qδ ≤ 1, also ist ((q|x − x0|)n)n∈N eineNullfolge und es existiert ein n0 ∈ N mit (q|x−x0|)n < α/M fur alle n ≥ n0. Sei n ∈ Nmit n ≥ n0. Nach der Taylorformel I.§14.Satz 16 existiert ein ξ ∈ R zwischen x0 und

27

Page 28: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 20.4.2011

x, also auch ξ ∈ (x0 − ε, x0 + ε), mit∣∣∣∣∣n∑

k=0

f (k)(x0)

k!(x− x0)

k − f(x)

∣∣∣∣∣ =

∣∣∣∣f (n+1)(ξ)

(n+ 1)!(x− x0)

n+1

∣∣∣∣≤Mqn+1|x− x0|n+1 = M(q|x− x0|)n+1 < M · α

M= α.

Dies beweist

f(x) = limn→∞

n∑k=0

f (k)(x0)

k!(x− x0)

k =∞∑

n=0

f (n)(x0)

n!(x− x0)

n = T (x).

Insbesondere hat die Taylorreihe T einen Konvergenzradius r ≥ δ und konvergiert in(x0 − δ, x0 + δ) gegen f , d.h. die Funktion f ist in x0 analytisch.

Kombinieren wir dies mit unserem Lemma 8 uber Summen und Produkte von Po-tenzreihen, so ergibt sich sofort der folgende Satz uber algebraische Kombinationenanalytischer Funktionen.

Lemma 1.10 (Summen und Produkte analytischer Funktionen)Seien I ⊆ R ein offenes Intervall und f, g : I → R zwei unendlich oft differenzierbareFunktionen. Weiter sei c ∈ R eine Konstante.

(a) Sind f und g analytisch in x0 ∈ I, so sind auch f + g, cf , fg und f ′ analytischin x0.

(b) Sind f und g analytisch so sind auch die Funktionen f+g, cf , fg und f ′ analytisch.

Beweis: (a) Klar nach Lemma 9, Lemma 8 und I.§14.Satz 5.(b) Klar nach (a).

Damit sind beispielsweise f(x) = ex sin x oder g(x) = x cosx auf ganz R analytisch.Wir wollen Lemma 9 auch einmal dazu verwenden, um zu beweisen das der Logarith-mus ln : R>0 → R analytisch ist. In I.§14 haben wir gesehen, dass der Logarithmusdifferenzierbar mit ln′ x = 1/x fur alle x > 0 ist. Durch eine einfache Induktion folgtdann das der Logarithmus sogar unendlich oft differenzierbar ist, und das fur alle n ≥ 1,x > 0 stets

ln(n) x = (−1)n−1 (n− 1)!

xn

gilt. Ist also a > 0, so folgt fur alle x ∈ R mit x ≥ a und alle n ∈ N mit n ≥ 1 auch

| ln(n) x| = (n− 1)!

xn< n!

(1

a

)n

.

28

Page 29: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 20.4.2011

Sind also a, b ∈ R mit 0 < a < b und setzen wir M := max{| ln a|, | ln b|, 1} > 0und q := 1/a > 0, so ist | ln(n) x| ≤ M · n! · qn fur alle x ∈ [a, b], n ∈ N. Nach demLemma ist der Logarithmus damit eine analytische Funktion. An unserer Formel fur dieAbleitungen des Logarithmus konnen wir auch leicht die Taylorreihe des Logarithmus,etwa zum Entwicklungspunkt x0 = 1 ablesen. Es sind ln 1 = 0 und fur jedes n ≥ 1haben wir ln(n) 1 = (−1)n−1(n− 1)!, und die Taylorreihe wird damit zu

lnx =∞∑

n=1

(−1)n−1

n(x− 1)n.

Diese Potenzreihe hat den Konvergenzradius r = 1, aus der Definition einer ana-lytischen Funktion heraus wissen wir aber nur das es ein 0 < ε < 1 mit ln x =∑∞

n=1(−1)n−1/n (x − 1)n fur alle x ∈ R mit |x − 1| < ε gibt. Ublicherweise substi-tuiert man noch x+ 1 statt x und erhalt

ln(x+ 1) =∞∑

n=1

(−1)n−1

nxn fur |x| < ε.

Tatsachlich gilt diese Formel fur uberhaupt alle x ∈ R mit |x| < 1, dies bedarf abernoch einer Begrundung. Wir konnten direkt uber die Abschatzung des Restglieds inder Taylorformel gehen, im Fall des Logarithmus ist das sogar recht einfach. Es gibtaber einen noch einfacheren Weg, der eine der wichtigsten Eigenschaften analytischerFunktionen verwendet, den nun vorgestellten Identitatssatz.

Satz 1.11 (Identitatssatz)Seien I ⊆ R ein offenes Intervall, x0 ∈ I und f, g : I → R zwei analytische Funktionen.Dann sind die folgenden Aussagen aquivalent:

(a) Es ist f = g.

(b) Fur alle n ∈ N ist f (n)(x0) = g(n)(x0).

(c) Es gibt eine Folge (xn)n∈N in I\{x0} mit (xn)n∈N −→ x0 und f(xn) = g(xn) furalle n ∈ N.

Beweis: Dass aus (a) sowohl (b) als auch (c) folgen ist klar. Wir zeigen jetzt, dassAussage (c) auch Aussage (b) impliziert. Es gebe also eine gegen x0 konvergente Folge(xn)n∈N in I\{x0} mit f(xn) = g(xn) fur alle n ∈ N. Da die Funktionen f und g in x0

analytisch sind, haben ihre Taylorreihen

T (x) =∞∑

n=0

f (n)(x0)

n!(x− x0)

n beziehungsweise T (x) =∞∑

n=0

g(n)(x0)

n!(x− x0)

n

zum Entwicklungspunkt x0 positive Konvergenzradien r, r > 0 und es gibt ε, ε > 0 mitε ≤ r, ε ≤ r so, dass fur alle x ∈ R mit |x − x0| < ε stets x ∈ I und f(x) = T (x)

29

Page 30: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 20.4.2011

ist und fur alle x ∈ R mit |x − x0| < ε stets x ∈ I und g(x) = T (x) gilt. Setzen wiralso δ := min{ε, ε} > 0, so ist (x0 − δ, x0 + δ) ⊆ I und fur alle x ∈ I mit |x − x0| < δ

gelten f(x) = T (x) und g(x) = T (x). Da die Folge (xn)n∈N gegen x0 konvergiert, gibtes weiter ein n0 ∈ N mit |xn − x0| < δ fur alle n ∈ N mit n ≥ n0. Fur jedes n ∈ Nmit n ≥ n0 ist damit auch T (xn) = f(xn) = g(xn) = T (xn), und nach Lemma 7.(b)

stimmen die Koeffizienten der beiden Potenzreihen T und T uberein, d.h. fur jedesn ∈ N ist f (n)(x0) = g(n)(x0). Damit ist die Implikation von (c) nach (b) bewiesen.

Es verbleibt nur noch zu zeigen, das aus (b) auch (a) folgt, nehme also f (n)(x0) =g(n)(x0) fur alle n ∈ N an. Dann stimmt die Taylorreihe T von f und g zum Entwick-lungspunkt x0 uberein, und da f und g in x0 analytisch sind, gibt es wie oben einδ > 0 mit (x0 − δ, x0 + δ) ⊆ I und f(x) = T (x) = g(x) fur alle x ∈ (x0 − δ, x0 + δ).Angenommen es gibt ein x1 ∈ I mit x1 > x0 und f(x1) 6= g(x1). Dann setzen wir

x2 := inf{x ∈ I|x > x0 ∧ f(x) 6= g(x)}

und haben x0 < x0 + δ ≤ x2 ≤ x1, also insbesondere x2 ∈ I. Fur alle x ∈ I mitx0 ≤ x < x2 gilt f(x) = g(x), und mit der schob bewiesenen Implikation von (c) nach(b) folgt f (n)(x2) = g(n)(x2) fur alle n ∈ N. Da f und g auch in x2 analytisch sind,gibt es erneut auch ein δ′ > 0 mit (x2 − δ′, x2 + δ′) ⊆ I und f(x) = g(x) fur allex ∈ (x2 − δ′, x2 + δ′). Wegen x2 < x2 + δ′ existiert aber ein x ∈ I mit x2 < x < x2 + δ′

und f(x) 6= g(x), im Widerspruch zu x ∈ (x2− δ′, x2 + δ′). Dieser Widerspruch beweistf(x) = g(x) fur alle x ∈ I mit x > x0 und analog folgt auch f(x) = g(x) fur alle x ∈ Imit x < x0. Damit ist auch die Implikation von (b) nach (a) bewiesen.

Als eine direkte Folgerung aus dem Identitatssatz ergibt sich jetzt, das die Taylorreiheeiner analytischen Funktion solange gegen die Funktion konvergiert wie dies uberhauptnur moglich ist, also in dem Intervall in dem die Funktion definiert ist und die Taylor-reihe konvergiert.

Korollar 1.12: Seien I ⊆ R ein offenes Intervall, f : I → R eine analytische Funktion,x0 ∈ I und T bezeichne die Taylorreihe von f zum Entwicklungspunkt x0. Sei r > 0der Konvergenzradius von T . Dann gilt f(x) = T (x) fur alle x ∈ I ∩ (x0 − r, x0 + r).

Beweis: Die Menge J := I∩(x0−r, x0+r) ⊆ R ist ein offenes Intervall und nach Lemma6 sind T : J → R und f |J : J → R analytische Funktionen mit f (n)(x0) = T (n)(x0) furalle n ∈ N. Nach Satz 11 ist damit f(x) = T (x) fur alle x ∈ J .

Speziell angewandt auf das Beispiel des Logarithmus, folgt jetzt

ln(x+ 1) =∞∑

n=1

(−1)n−1

nxn fur |x| < 1.

Das die Reihe nicht auf noch großeren Intervallen konvergiert ist hier nicht weiterverwunderlich, der Logarithmus ist fur x ≤ 0 ja nicht mehr vorhanden. Betrachten wir

30

Page 31: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 20.4.2011

dagegen das Beispiel

1

1 + x2=

∞∑n=0

(−1)nx2n

aus der letzten Vorlesung, so hat die rechts stehende Reihe wieder den Konvergenz-radius r = 1, aber die Funktion 1/(1 + x2) gibt es auf ganz R. In Wahrheit gibt esaber auch hier einen Grund dafur das der Konvergenzradius nicht großer als 1 wer-den kann, schauen wir uns das ganze komplex an, so hat x2 + 1 Nullstellen in ±i, derKonvergenzradius kann also gar nicht großer sein. Um den Konvergenzradius von Tay-lorreihen zu verstehen, muss man sich immer die komplexe Funktion anschauen, grobgesprochen konvergiert die Taylorreihe solange die komplexe Funktion existiert. Wasdas genau bedeutet und wie man es beweist, wird aber erst in einem spateren Semesterbehandelt.

Wir kommen zu unseren analytischen Funktionen zuruck. Da wir schon wissendas der Logarithmus analytisch ist, ist damit auch seine Ableitung, also die Funktionf : (0,∞) → R;x 7→ 1/x, analytisch. Diese Tatsache kann man sich naturlich auchdirekt, und auch uber K = C uberlegen. Seien hierzu K ∈ {R,C} und z0 ∈ K mitz0 6= 0 gegeben. Fur alle z ∈ K\{0} gilt dann

1

z=

1

z0 + (z − z0)=

1

z0

· 1

1 + z−z0

z0

,

also ist fur alle z ∈ K mit |z − z0| < |z0| auch |z| = |z0 + z − z0| ≥ |z0| − |z − z0| > 0,|(z − z0)/z0| < 1 also

1

z=

1

z0

∞∑n=0

(−1)n

(z − z0

z0

)n

=∞∑

n=0

(−1)n

zn+10

(z − z0)n,

und 1/z ist fur |z − z0| < |z0| durch eine Potenzreihe dargestellt. Insbesondere istdie Funktion f : (0,∞) → R;x 7→ 1/x analytisch. Analog ist auch f : (−∞, 0) →R;x 7→ 1/x analytisch. Die hier angegebene explizite Formel fur 1/z wird sich baldals nutzlich herausstellen. Zu Beginn dieses Abschnitts hatten wir auch die Taylorreiheder Funktion esin x durch Einsetzen der Sinusreihe in die Exponentialreihe berechnet.Wir wollen uns jetzt uberlegen, dass dieses Einsetzen tatsachlich funktioniert. Zunachstmachen wir wieder die entsprechende Uberlegung fur allgemeine Potenzreihen.

Seien K ∈ {R,C} und f(z) =∑∞

n=0 an(z−z0)n eine Potenzreihe uber K mit einem

Konvergenzradius r > 0. Wir schreiben z1 := f(z0) = a0. Wenden wir die FormelLemma 8.(c) fur das Produkt von Potenzreihen iteriert an, so folgt fur alle n ∈ N mitn ≥ 1 und alle z ∈ Br(z0) die Gleichung

(f(z)− z1)n =

∞∑m=n

∑k1,...,kn≥1

k1+···+kn=m

ak1 · . . . · akn

(z − z0)m,

31

Page 32: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 20.4.2011

wobei die rechts stehende Potenzreihe mindestens den Konvergenzradius r hat. Seig(z) =

∑∞n=0 bn(z − z1)

n eine weitere Potenzreihe mit einem Konvergenzradius s > 0.Wenn wir zunachst rein formal die Potenzreihe f in die Reihe g einsetzen, so ergibtsich

g(f(z)) = b0 +∞∑

n=1

bn(f(z)− z1)n

= b0 +∞∑

n=1

bn

∞∑m=n

∑k1,...,kn≥1

k1+···+kn=m

ak1 · . . . · akn

(z − z0)m

= b0 +

∞∑m=1

∑1≤n≤m,k1,...,kn≥1

k1+···+kn=m

bnak1 · . . . · akn

(z − z0)m.

Vor allen der letzte Schritt in dieser Rechnung bedarf naturlich noch einer naherenBegrundung. Beachte das die eingeklammerte Summe nur endlich viele Summandenhat, das Ergebnis ist also auf jeden Fall eine wohldefinierte Potenzreihe uber K. Bevorwir zum Beweis kommen, dass die Rechnung zumindest fur z ausreichend nahe bei z0

funktioniert, brauchen wir noch eine kleine Vorbermerkung. Direkt nach Definition desKonvergenzradius einer Potenzreihe hat auch die reelle Potenzreihe

F (x) :=∞∑

n=1

|an|xn

den Konvergenzradius r und fur alle z ∈ Br(z0) gilt

|f(z)− z1| =

∣∣∣∣∣∞∑

n=1

an(z − z0)n

∣∣∣∣∣ ≤∞∑

n=1

|an| · |z − z0|n = F (|z − z0|).

Außerdem ist die Funktion F : [0, r) → R≥0;x 7→ F (x) offenbar monoton steigend.

Satz 1.13 (Einsetzen von Potenzreihen)Seien K ∈ {R,C} und f(z) =

∑∞n=0 an(z − z0)

n eine Potenzreihe uber K mit einemKonvergenzradius r > 0. Dann hat auch die Potenzreihe F (x) :=

∑∞n=1 |an|xn den

Konvergenzradius r. Weiter setze z1 := f(z0) = a0 und sei g(z) =∑∞

n=0 bn(z − z1)n

eine Potenzreihe uber K mit einem Konvergenzradius s > 0 und sei t := sup{q ∈R|0 < q < r, F (q) < s} ∈ R≥0 ∪ {∞}. Dann ist t > 0 und die Potenzreihe

h(z) := b0 +∞∑

n=1

∑1≤p≤n,k1,...,kp≥1

k1+···+kp=n

bpak1 . . . akp

(z − z0)n

32

Page 33: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 20.4.2011

hat einen Konvergenzradius t∗ ≥ t. Fur alle z ∈ K mit |z− z0| < t gilt h(z) = g(f(z)).

Beweis: Sei z ∈ K mit |z − z0| < t. Dann existiert ein t′ ∈ R mit 0 < t′ < r, F (t′) < sund |z − z0| < t′, also ist auch

|f(z)− z1| ≤ F (|z − z0|) ≤ F (t′) < s.

Weiter hat auch die reelle Potenzreihe G(x) :=∑∞

n=1 |bn|xn den Konvergenzradius s.Wir behaupten jetzt, das

∞∑n=1

∑1≤p≤n,k1,...,kp≥1

k1+···+kp=n

|bp| · |ak1| . . . |akp |

· |z − z0|n ≤ G(F (|z − z0|)) <∞

ist. Sei m ∈ N mit m ≥ 1. Dann gilt

m∑n=1

∑1≤p≤n,k1,...,kp≥1

k1+···+kp=n

|bp| · |ak1| . . . |akp |

· |z − z0|n

=m∑

p=1

|bp| ·

m∑n=p

∑k1,...,kp≥1

k1+···+kp=n

|ak1| . . . |akp |

|z − z0|n

≤m∑

p=1

|bp| ·

∞∑n=p

∑k1,...,kp≥1

k1+···+kp=n

|ak1| . . . |akp |

|z − z0|n

=

m∑p=1

|bp| · F (|z − z0|)p ≤ G(F (|z − z0|)),

also sind alle Partialsummen der Reihe durch G(F (|z − z0|)) beschrankt, und damitgilt dies auch fur die Reihe selbst. Damit ist diese Zwischenbehauptung bewiesen. Furjedes m ≥ 1 betrachten wir die Partialsummen

sm := b0 +m∑

n=1

bn(f(z)− z1)n und Sm := b0 +

m∑n=1

∑1≤p≤n,k1,...,kp≥1

k1+···+kp=n

bpak1 . . . akp

(z− z0)n

von g(f(z)) beziehungsweise h(z). Wegen |f(z) − z1| < s wissen wir bereits, dass(sm)m≥1 −→ g(f(z)) gilt. Wir zeigen nun, das (sm−Sm)m≥1 eine Nullfolge ist. Sei also

33

Page 34: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 20.4.2011

ε > 0 gegeben. Dann existiert ein m0 ∈ N mit

∞∑n=m

∑1≤p≤n,k1,...,kp≥1

k1+···+kp=n

|bp| · |ak1| . . . |akp |

· |z − z0|n < ε

fur alle m ∈ N mit m ≥ m0. Sei m ∈ N mit m ≥ m0 gegeben. Mit den Rechenregelnfur Reihen I.§7.Lemma 5 erhalten wir

sm = b0 +m∑

p=1

bp ·

∞∑n=p

∑k1,...,kp≥1

k1+···+kp=n

ak1 . . . akp

(z − z0)n

= b0 +∞∑

n=1

min{n,m}∑p=1

∑k1,...,kp≥1

k1+···+kp=n

bpak1 . . . akp

(z − z0)n

= Sm +∞∑

n=m+1

m∑p=1

∑k1,...,kp≥1

k1+···+kp=n

bpak1 . . . akp

(z − z0)n

und dies ergibt

|sm − Sm| ≤∞∑

n=m+1

m∑p=1

∑k1,...,kp≥1

k1+···+kp=n

|bp| · |ak1| . . . |akp |

|z − z0|n

≤∞∑

n=m+1

n∑p=1

∑k1,...,kp≥1

k1+···+kp=n

|bp| · |ak1| . . . |akp |

|z − z0|n < ε.

Damit ist (sm − Sm)m≥1 tatsachlich eine Nullfolge. Es folgt

g(f(z)) = limn→∞

sn = limn→∞

Sn = h(z).

Da die Potenzreihe h(z) insbesondere fur alle z ∈ Bt(z0) konvergiert, ist ihr Konver-genzradius auch mindestens t.

Als direkte Folgerung ergibt sich:

Korollar 1.14 (Hintereinanderausfuhrungen analytischer Funktionen)Seien I, J ⊆ R zwei offene Intervalle und f : I → J , g : J → R zwei analytische

Funktionen. Dann ist auch g ◦ f : I → R analytisch.

34

Page 35: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 20.4.2011

Beweis: Klar nach Lemma 9 und Satz 13.

Mit diesen Hilfsmitteln konnen wir jetzt auch leicht beweisen, dass jede Potenzfunktion

f : (0,∞) → R;x 7→ xα

fur einen reellen Exponenten α ∈ R analytisch ist. Fur α ∈ N ist dies naturlich klar, daes sich dann um ein sogar auf ganz R definiertes Polynom handelt. Fur x > 0 haben wirxα = eα ln x, und da wir schon wissen das der Logarithmus und die Exponentialfunktionanalytisch sind, folgt mit Korollar 14 das auch f analytisch ist. Setzen wir speziell α =1/n mit n ∈ N, n ≥ 1, so folgt das auch die Wurzelfunktion n

√: R>0 → R analytisch

ist. Als ein weiteres Korollar des Einsetzens von Potenzreihen in Potenzreihen konnenwir auch Quotienten von Potenzreihen behandeln. In der Vorlesung hatten wir diesenSatz nur verkurzt angegeben, hier wollen wir eine vollstandige Version aufschreiben.

Korollar 1.15 (Quotienten von Potenzreihen)Seien K ∈ {R,C}, z0 ∈ K und f(z) =

∑∞n=0 an(z − z0)

n, g(z) =∑∞

n=0 bn(z − z0)n

zwei Potenzreihen mit positiven Konvergenzradien rf , rg > 0. Es gelte g(z0) = b0 6= 0.Dann hat auch die Potenzreihe G(x) :=

∑∞n=1 |bn|xn den Konvergenzradius rg > 0 und

es ist s := sup{q ∈ R|0 < q < rg, G(q) < |b0|} > 0. Fur alle z ∈ K mit |z − z0| < s istg(z) 6= 0 und

1

g(z)=

1

b0+

∞∑n=1

∑1≤p≤n,k1,...,kp≥1

k1+···+kp=n

(−1)p bk1 . . . bkp

bp+10

(z − z0)n,

wobei diese Potenzreihe einen Konvergenzradius s′ ≥ s hat. Weiter ist auch r :=min{rf , s} > 0 und fur alle z ∈ K mit |z − z0| < r gilt

f(z)

g(z)=

∞∑n=0

an

b0+

∑1≤p≤n,k1,...,kp≥1

k1+···+kp≤n

(−1)pbk1 . . . bkp

an−k1−···−kp

bp+10

(z − z0)n,

wobei diese Potenzreihe einen Konvergenzradius r′ ≥ r hat.

Beweis: Wegen

1

z=

∞∑n=0

(−1)n

bn+10

(z − b0)n

fur z ∈ K mit |z − b0| < |b0| folgt die erste Aussage sofort aus Satz 13. Mit Lemma8.(c) folgt dann auch die zweite Aussage.

35

Page 36: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 20.4.2011

Ist also f(z) =∑∞

n=0 an(z − z0)n mit a0 6= 0, so haben wir explizit

1

f(z)=

1

a0

− a1

a20

(z − z0) +

(a2

1

a30

− a2

a20

)(z − z0)

2 −(a3

1

a40

− 2a1a2

a30

+a3

a20

)(z − z0)

3 + · · · .

Weiter ergibt sich

Korollar 1.16 (Quotienten analytischer Funktionen)Seien I ⊆ R ein offenes Intervall und f, g : I → R zwei analytische Funktionen mitg(x) 6= 0 fur alle x ∈ I. Dann ist auch f/g : I → R analytisch.

Beweis: Klar nach Korollar 15.

Die einzigen Grundfunktionen von denen wir noch nicht wissen ob sie analytischsind, sind die trigonometrischen Umkehrfunktionen. Wir wollen jetzt beweisen, dassdie Umkehrfunktion einer bijektiven analytischen Funktion wieder analytisch ist, so-lange ihre Ableitung nirgends Null wird. Auch diese Tatsache konnen wir wieder durchRechnen mit Potenzreihen einsehen. Wahrend wir alle bisherigen Satze uber Potenz-reihen fur die reelle und die komplexe Situation formuliert haben, beschranken wiruns diesmal ganz auf den reellen Fall. Der folgende Satz gilt zwar geeignet formuliertauch fur komplexe Potenzreihen, in unserem Beweis verwenden wir aber Aussagen diewir im letzten Semester nur reell bewiesen hatten. Betrachte eine reelle Potenzreihef(x) =

∑∞n=0 an(x − x0)

n mit f ′(x0) = a1 6= 0. Ausreichend nahe bei x0 ist f danninjektiv. Wir machen fur eine Umkehrfunktion g = f−1 nahe bei x1 := f(x0) = a0 denAnsatz g(x) =

∑∞n=0 bn(x− x1)

n, also b0 = g(x1) = x0. Nach Satz 13 ist nahe bei x1

f(g(x)) = x1 +∞∑

n=1

∑1≤p≤n,k1,...,kp≥1

k1+···+kp=n

apbk1 . . . bkp

(x− x1)n.

Andererseits muss f(g(x)) = x = x1 + (x − x1) sein, und ein Koeffizientenvergleichergibt a1b1 = 1, also b1 = 1/a1 und∑

1≤p≤n,k1,...,kp≥1k1+···+kp=n

apbk1 . . . bkp = 0

fur alle n ≥ 2. In der obigen Summe kommt bn nur fur ein ki = n vor, also wenn p = 1ist. Der einzige Summand in dem bn vorkommt, ist also a1bn, und wir erhalten

bn = − 1

a1

∑1<p≤n,k1,...,kp≥1

k1+···+kp=n

apbk1 . . . bkp

fur n > 1. Dies ist eine rekursive Gleichung fur die Koeffizienten b2, b3, . . . der Tay-lorreihe von g. Wir haben also einen eindeutigen Kandidaten fur die Potenzreihe g.

36

Page 37: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 20.4.2011

Das verbleibende Problem besteht darin, einzusehen das diese Kandidatenreihe einenpositiven Konvergenzradius hat. Die direkte Abschatzung ist recht muhsam, es gibtaber einen kleinen Trick der dieses Problem umgeht.

Satz 1.17 (Umkehrfunktionen von Potenzreihen)Sei f(x) =

∑∞n=0 an(x−x0)

n eine reelle Potenzreihe mit einem positiven Konvergenz-radius r > 0, und es gelte a1 6= 0. Setze x1 := f(x0) = a0 und definiere die Folge(bn)n∈N rekursiv durch b0 := x0, b1 := 1/a1 und

bn = − 1

a1

∑1<p≤n,k1,...,kp≥1

k1+···+kp=n

apbk1 . . . bkp

fur n ∈ N mit n > 1. Dann existieren ε, δ ∈ R mit 0 < ε ≤ r, δ > 0 und einoffenes Intervall J ⊆ R mit x1 ∈ J so, dass f |(x0 − ε, x0 + ε) : (x0 − ε, x0 + ε) → Jbijektiv ist, (x1 − δ, x1 + δ) ⊆ J gilt, die Potenzreihe g(x) :=

∑∞n=0 bn(x − x1)

n einenKonvergenzradius r′ ≥ δ hat und g(x) = f−1(x) fur alle x ∈ (x1 − δ, x1 + δ) gilt.

Beweis: Nach I.§13.Lemma 16.(b) existieren Konstanten q, C ∈ R mit C, q > 0 und|an| ≤ C/qn fur alle n ∈ N. Definiere jetzt a1 := |a1| und an := −C/qn fur n ≥ 2. Dannist |an| ≤ |an| fur alle n ∈ N mit n ≥ 1. Weiter hat die Potenzreihe

f(x) :=∞∑

n=1

anxn

den Konvergenzradius q und fur alle x ∈ R mit |x| < q gilt

f(x) = |a1|x−∞∑

n=2

C

qnxn = |a1|x− C

∞∑n=2

(x

q

)n

= |a1|x− C

(q

q − x− 1− x

q

)= |a1|x−

C

q· q

2 − q(q − x)− x(q − x)

q − x=|a1|q2x− (C + |a1|q)x2

q(q − x).

Fur x, y ∈ R mit |x| < q ist genau dann f(x) = y wenn

(C + |a1|q)x2 − q(|a1|q + y)x+ q2y = 0

beziehungsweise

x2 − q(|a1|q + y)

C + |a1|qx+

q2y

C + |a1|q= 0

gilt, und diese Gleichung konnen wir weiter zu

x =q

2(C + |a1|q)

(|a1|q + y ±

√|a1|2q2 − 2(2C + |a1|q)y + y2

)37

Page 38: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 20.4.2011

umschreiben. Wahle ein δ1 > 0 mit |a1|2q2− 2(2C + |a1|q)y+ y2 > 0 fur alle y ∈ R mit|y| < δ1. Dann ist

g : (−δ1, δ1) → R; y 7→ q

2(C + |a1|q)

(|a1|q + y −

√|a1|2q2 − 2(2C + |a1|q)y + y2

)eine analytische Funktion mit g(0) = 0, also existieren ein δ2 ∈ R mit 0 < δ2 ≤ δ1und eine Potenzreihe

∑∞n=0 bnx

n mit einem Konvergenzradius s ≥ δ2 so, dass g(y) =∑∞n=0 bny

n und |g(y)| < q fur alle y ∈ (−δ2, δ2) ist. Dann gilt f(g(x)) = x fur alle

x ∈ R mit |x| < δ2. Die Potenzreihe g kehrt also die Potenzreihe f um, und wie bereits

festgestellt sind damit b0 = 0, b1 = 1/a1 = 1/|a1| und

bn = − 1

|a1|∑

1<p≤n,k1,...,kp≥1k1+···+kp=n

apbk1 . . . bkp

fur alle n ∈ N mit n > 1. Wir zeigen jetzt durch Induktion nach n, das |bn| ≤ bn fur

alle n ∈ N mit n ≥ 1 gilt. Fur n = 1 ist dabei sogar |b1| = 1/|a1| = b1. Nun sei n ∈ Nmit n > 1 und nehme |bk| ≤ bk fur alle 1 ≤ k < n an. Dann folgt auch

|bn| =

∣∣∣∣∣∣∣∣1

a1

∑1<p≤n,k1,...,kp≥1

k1+···+kp=n

apbk1 . . . bkp

∣∣∣∣∣∣∣∣ ≤1

|a1|∑

1<p≤n,k1,...,kp≥1k1+···+kp=n

|ap| · |bk1| . . . |bkp |

≤ 1

|a1|∑

1<p≤n,k1,...,kp≥1k1+···+kp=n

|ap|bk1 . . . bkp = − 1

|a1|∑

1<p≤n,k1,...,kp≥1k1+···+kp=n

apbk1 . . . bkp = bn,

und per Induktion ist diese Behauptung bewiesen. Fur den Konvergenzradius r′ derPotenzreihe g folgt jetzt mit I.§13.Lemma 17

r′ =1

lim supn→∞

n√|bn|

≥ 1

lim supn→∞

n

√|bn|

= s > 0.

Damit konnen wir jetzt zum eigentlichen Beweis kommen. Wegen f ′(x0) 6= 0 liefert dieStetigkeit von f ′ ein ε > 0 mit ε ≤ r so, dass sign f ′(x) = sign f ′(x0) ∈ {−1, 1} fur allex ∈ (x0− ε, x0 + ε) gilt, und nach I.§14.Korollar 11 ist f |(x0− ε, x0 + ε) streng monotonsteigend oder streng monoton fallend, also insbesondere injektiv. Nach I.§13.Satz 15.(a)ist das Bild J := f((x0 − ε, x0 + ε)) ⊆ R ein Intervall, und da f streng monoton ist,ist J ein offenes Intervall. Insbesondere existiert nach Satz 13 ein δ > 0 mit δ ≤ r′,(x1 − δ, x1 + δ) ⊆ J , g((x1 − δ, x1 + δ)) ⊆ (x0 − ε, x0 + ε) und

f(g(x)) = x1 +∞∑

n=1

∑1≤p≤n,k1,...,kp≥1

k1+···+kp=n

apbk1 . . . bkp

(x− x1)n = x1 + x− x1 = x

38

Page 39: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 20.4.2011

fur alle x ∈ (x1 − δ, x1 + δ). Damit ist auch f−1(x) = g(x) fur x ∈ (x1 − δ, x1 + δ).

Damit folgt das Umkehrfunktionen analytischer Funktionen wieder analytisch sind,solange ihre Ableitung nirgends verschwindet. Das Beispiel f(x) = x3 zeigt dabei, dassletztere Bedingung tatsachlich benotigt wird.

Korollar 1.18 (Umkehrfunktionen analytischer Funktionen)Seien I, J ⊆ R zwei offene Intervalle und f : I → J eine bijektive, analytische

Funktion mit f ′(x) 6= 0 fur alle x ∈ I. Dann ist auch die Umkehrabbildung f−1 : J → Ieine analytische Funktion.

Beweis: Klar nach Satz 17 und Lemma 9.

Mit diesem Satz sind die Arcusfunktionen

arcsin : (−1, 1) →(−π

2,π

2

), arccos : (−1, 1) → (0, π), arctan : R →

(−π

2,π

2

)alle analytisch. Zusammenfassend haben wir eingesehen, dass jede Funktion die sich alseine explizite Formel in den Grundfunktionen schreiben laßt analytisch ist. Denn dieGrundfunktionen selbst sind analytisch, und Analytizitat ubertragt sich auf Summen,Vielfache, Produkte, Quotienten und Hintereinanderausfuhrungen.

1.4 Einige spezielle Taylorreihen

Als erstes Beispiel wollen wir die sogenannte binomische Reihe besprechen, die oft auchals Newtonsche Reihe bezeichnet wird. Sei α ∈ R. Dann wissen wir bereits, dass diePotenzfunktion

fα : R>0 → R;x 7→ xα

analytisch ist, und wir wollen ihre Taylorreihe zum Entwicklungspunkt x0 = 1 berech-nen. Fur jedes n ∈ N ist die n-te Ableitung von fα offenbar als

f (n)α (x) = α · (α− 1) · . . . · (α− n+ 1)xα−n

gegeben. Fur n = 0 mussen wir dieses leere Produkt wie ublich als 1 interpretieren.Als Koeffizienten unserer Taylorreihe ergeben sich

f(n)α (1)

n!=α · . . . · (α− n+ 1)

n!.

Es ist ublich fur diese Zahlen eine spezielle Notation einzufuhren. Fur n,m ∈ N mitn ≤ m haben wir (

m

n

)=

m!

n!(m− n)!=m(m− 1) . . . (m− n+ 1)

n!,

39

Page 40: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 20.4.2011

und dies legt es nahe fur alle n ∈ N und beliebiges α ∈ R den verallgemeinertenBinomialkoeffizienten (

α

n

):=

α · . . . · (α− n+ 1)

n!

einzufuhren. Fur n = 0 soll dies, wie schon bemerkt, gleich Eins sein. Fur α ∈ Nstimmen die verallgemeinerten Binomialkoeffizienten im Fall n ≤ α mit dem ublichenBinomialkoeffizienten uberein, und im Fall α < n wird der Ausdruck zu Null. DieTaylorreihe von fα schreibt sich damit als

xα =∞∑

n=0

n

)(x− 1)n.

Wegen xα = eα ln x und da die Taylorreihe des Logarithmus zum Entwicklungspunktx0 = 1 den Konvergenzradius r = 1 hat, und die Taylorreihe der Exponentialfunktionzu jedem Entwicklungspunkt den Konvergenzradius +∞ hat, ergibt Satz 13 das dieBinomialreihe mindestens den Konvergenzradius 1 hat. Substituieren wir noch x + 1fur x, so erhalten wir

(x+ 1)α =∞∑

n=0

n

)xn fur |x| < 1.

Wir kommen jetzt zu einem scheinbar komplizierteren Beispiel, dem Arcustangensarctan : R → R. Wir wissen bereits das der Arcustangens analytisch ist, und wollenseine Taylorreihe zum Entwicklungspunkt x0 = 0 bestimmen. Wegen arctan 0 = 0 hatdiese die Form

arctanx =∞∑

n=1

anxn

mit reellen Konstanten a1, a2, . . .. Gemaß I.§14.Satz 5 konnen wir Potenzreihen glied-weise ableiten und erhalten

∞∑n=0

(n+ 1)an+1xn =

d

dxarctanx =

1

1 + x2=

∞∑n=0

(−1)nx2n.

Dies ergibt an = 0 fur gerade n ∈ N und a2n+1 = (−1)n/(2n + 1) fur jedes n ∈ N. Dadiese Potenzreihe den Konvergenzradius 1 hat, folgt mit Korollar 12

arctanx =∞∑

n=0

(−1)n

2n+ 1x2n+1 fur |x| < 1.

Als wesentlich komplizierter stellt sich die Taylorreihe des Tangens heraus. Um dieseReihe uberhaupt in geschlossener Form hinzuschreiben, benotigen wir einige spezielleKonstanten, die sogenannten Bernoulli Zahlen. Diese werden ihrerseits uber die Tay-lorreihe einer geeigneten Hilfsfunktion eingefuhrt. Fur jedes z ∈ C\{0} ist

ez − 1

z=

1

z

∞∑n=1

zn

n!=

∞∑n=0

zn

(n+ 1)!,

40

Page 41: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 20.4.2011

d.h. setzen wir die links stehende Funktion durch den Wert 1 fur z = 0 fort, so haben wireine auf ganz C definierte Potenzreihe. Die Nullstellen dieser Funktion sind genau in denPunkten z ∈ C\{0} mit ez = 1. Schreiben wir z = x+ iy, so ist ez = ex(cos y+ i sin y),|ez| = ex also ist genau dann ez = 1 wenn x = 0 und cos y = 1, sin y = 0 ist, also wennz ∈ 2πiZ gilt. Mit Korollar 15 wollen wir jetzt den Kehrwert dieser Potenzreihe bilden.Dieser ergibt sich als

z

ez − 1=

∞∑n=0

Bnzn

n!

mit B0 = 1 und

Bn :=∑

1≤p≤n,k1,...,kp≥1k1+···+kp=n

(−1)p n!

(k1 + 1)! . . . (kp + 1)!∈ Q

fur n ≥ 1. Außerdem besagt das Korollar das der Konvergenzradius r der rechts ste-henden Reihe mindestens

r ≥ sup

{q ∈ R

∣∣∣∣eq − 1

q− 1 < 1

}≈ 1, 256431

ist. Tatsachlich ist r = 2π ≈ 6, 283185, aber dies wollen wir hier nicht beweisen. Mannennt die Zahlen Bn ∈ Q die Bernoulli Zahlen, genauer wird Bn die n-te Bernoulli Zahlgenannt. Fur jedes z ∈ C mit |z| < r ergibt Lemma 8.(c)

z =z

ez − 1· (ez − 1) =

(∞∑

n=0

Bn

n!zn

(∞∑

n=1

zn

n!

)=

∞∑n=1

[n−1∑k=0

Bk

k!(n− k)!

]zn,

und ein Koeffizientenvergleich liefert erneut B0 = 1 und

n−1∑k=0

Bk

k!(n− k)!= 0

fur n > 1. Letztere Bedingung konnen wir noch zu

n∑k=0

(n+ 1

k

)Bk = 0, also Bn = − 1

n+ 1

n−1∑k=0

(n+ 1

k

)Bk

fur n ≥ 1 umschreiben. Mit dieser Rekursionsformel erhalten wir

B0 = 1,

B1 = −B0/2 = −1/2,

B2 = −B0/3−B1 = −1/3 + 1/2 = 1/6,

B3 = −B0/4−B1 − (6/4)B2 = −1/4 + 1/2− 1/4 = 0,

B4 = −B0/5−B1 − 2B2 − 2B3 = −1/5 + 1/2− 1/3 = −1/30,

B5 = −B0/6−B1 − (5/2)B2 − (5/2)B4 = −1/6 + 1/2− 5/12 + 1/12 = 0,

B6 = −B0/7−B1 − 3B2 − 5B4 = −1/7 + 1/2− 1/2 + 1/6 = 1/42.

41

Page 42: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 27.4.2011

Als eine Ubungsaufgabe konnen Sie nachrechnen, dass fur jedes ungerade n > 1 stetsBn = 0 ist.

Vorlesung 4, Mittwoch 27.4.2011

Vor Ostern hatten wir mit der Bestimmung der Potenzreihenentwicklung des Tangenszum Entwicklungspunkt x0 = 0 begonnen. Wie schon bemerkt tauchen in dieser diesogenannten Bernoulli-Zahlen Bn auf, die wir als Koeffizienten in der Potenzreihenent-wicklung

z

ez − 1=

∞∑n=0

Bnzn

n!

erhalten hatten. Wir wissen auch das der Konvergenzradius r dieser Potenzreihe positivist. Was diese Funktion jetzt mit dem Tangens zu tun haben soll ist zwar nicht sofortersichtlich, wir werden es aber gleich sehen. In I.§13 hatten wir die Hyperbelfunktionen

sinh z =ez − e−z

2, cosh z =

ez + e−z

2, coth z =

cosh z

sinh z

eingefuhrt, und wir wollen jetzt eine Potenzreihenentwicklung des Cotangens Hyperbo-licus um den Entwicklungspunkt z0 = 0 berechnen, etwas genauer von f(z) = z coth zmit f(0) = 1. Fur z ∈ C mit z /∈ πiZ ist sinh z 6= 0 und

z coth z = zcosh z

sinh z= z

ez + e−z

ez − e−z= z +

2ze−z

ez − e−z= z +

2z

e2z − 1,

und fur z ∈ C mit 0 < |z| < r/2, beziehungsweise sogar fur 0 < |z| < π, folgt weiter

z coth z = z +∞∑

n=0

2nBn

n!zn =

∞∑n=0

22nB2n

(2n)!z2n.

Weiter konnen wir hieraus auch eine Formel fur den Cotangens herleiten

z cot z = iz coth(iz) =∞∑

n=0

(−1)n 22nB2n

(2n)!z2n.

Als letzten Schritt konnen wir aus dieser Formel die Taylorreihe des Tangens berechnen.Fur jedes z ∈ C mit z /∈ π

2Z ist namlich

cot(2z) =cos(2z)

sin(2z)=

cos2 z − sin2 z

2 sin z cos z=

1

2

(cos z

sin z− sin z

cos z

)=

1

2(cot z − tan z),

42

Page 43: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 27.4.2011

beziehungsweise tan z = cot z − 2 cot(2z). Fur z ∈ C mit |z| < r/4 ergibt sich

z tan z =∞∑

n=0

(−1)n 22nB2n

(2n)!z2n −

∞∑n=0

(−1)n 24nB2n

(2n)!z2n =

∞∑n=1

(−1)n 22n(1− 22n)B2n

(2n)!z2n,

und damit ist schließlich

tan z =∞∑

n=1

(−1)n−1 22n(22n − 1)B2n

(2n)!z2n−1,

also

tan z = 6B2z − 10B4z3 +

28

5B6z

5 + · · · = z +1

3z3 +

2

15z5 + · · · .

1.5 Das Pendel

Zum Abschluß dieses Kapitels wollen wir noch ein letztes Beispiel betrachten, dassogenannte mathematische Pendel.

φl

F

(x(t), y(t))

(t)

Wir haben das nebenstehend angedeutetePendel der Lange l > 0. Um ein eindimensio-nales Problem zu erhalten beschreiben wir diePosition des Pendels zum Zeitpunkt t durchden Winkel φ(t) den es zur y-Achse bildet.Unter idealisierenden Annahmen ist die Funk-tion φ zweifach differenzierbar und erfullt dieBedingung

φ′′(t) +g

lsinφ(t) = 0

fur alle t ∈ R, oder verkurzt φ′′ + ν sinφ = 0mit ν = g/l > 0. Dies ist eine sogenannte Differentialgleichung zweiter Ordnung,die Pendelgleichung, deren Losungen sich leider nicht als geschlossene Formel in denublichen Grundfunktionen ausdrucken lassen. Eine Moglichkeit dieses Problem zu um-gehen kennen Sie zur Genuge, man betrachtet den Fall

”kleiner Auslenkungen“. Das

quadratische Taylorpolynom des Sinus zum Entwicklungspunkt 0 ist T2(x) = x, undersetzen wir sinφ in der Pendelgleichung durch φ, so erhalten wir φ′′ + νφ = 0 mit derallgemeinen Losung

φ(t) = a cos(√ν t) + b sin(

√ν t),

wobei a, b ∈ R Konstanten sind. Alternativ kann man dies mittels der trigonometri-schen Additionstheoreme auch als Cosinusfunktion schreiben, aber wir wollen die obigeForm verwenden. Behandeln wir konkret den Fall das das Pendel zum Zeitpunkt t = 0eine Startauslenkung φ(0) = φ0 hat, und dann losgelassen wird, also φ′(0) = 0, so istφ(t) = φ0 cos(

√ν t). Insbesondere vollfuhrt unser Pendel eine periodische Bewegung

der Periodenlange T = 2π/√ν.

43

Page 44: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 27.4.2011

Wir wollen uns jetzt uberlegen was man im allgemeinen Fall, also wenn φ0 nicht als

”klein“ vorausgesetzt ist, noch sagen kann. Dann mussen wir wirklich die Gleichungφ′′ + ν sinφ = 0 betrachten. Zunachst wollen wir uns die Taylorentwicklung von φzum Entwicklungspunkt t0 = 0 anschauen. Da es rechnerisch angenehmer ist, verwen-den wir diesmal die Startbedingungen φ(0) = 0, φ′(0) = v/l, wir geben dem Pendelalso in der Ruhelage einen Schubs. Wir wollen hier das Taylorpolynom dritten Gra-des ausrechnen, in einer Ubungsaufgabe wird dies dann noch etwas fortgesetzt. Es istφ′′(0) = −ν sinφ(0) = 0, das quadratische Taylorpolynom ist also T2(t) = (v/l)t. Wasist nun das Taylorpolynom T3? Hierzu brauchen wir den Wert der dritten Ableitungφ′′′(0), was zunachst problematisch aussieht da wir ja weder φ noch φ′′′ konkret ken-nen. Wir konnen aber aus der Gleichung φ′′ = −ν sinφ eine Gleichung fur φ′′′ herleiten,indem wir beide Seiten unserer Differentialgleichung differenzieren, also

φ′′′ = (−ν sinφ)′ = −νφ′ cosφ

und insbesondere

φ′′′(0) = −νφ′(0) cosφ(0) = −gvl2

sowie T3(t) =v

lt− gv

6l2t3.

Die genaherte Pendelgleichung fur kleine Ausschlage hat bei den Startbedingungenφ(0) = 0, φ′(0) = v/l dagegen die Losung

φ(t) =v√gl

sin(√ν t) =

v

lt− gv

6l2t3 +

g2v

120l3t5 + · · ·

die Taylorpolynome dritter Ordnung stimmen also uberein. Derartige Rechnungen zurBestimmung von φ′′′(0) funktionieren naturlich bei beliebigen Startbedingungen, d.h.die Funktion φ ist unendlich oft differenzierbar, und ist t0 ∈ R, so legen φ(t0), φ

′(t0)die gesamte Taylorreihe zum Entwicklungspunkt t0 fest.

Wir wollen uns uberlegen, dass eine Losung der Gleichung φ′′+ν sinφ = 0 analytischist. Wir beginnen mit einer kleinen Uberlegung, ist φ : I → R eine auf einem offenenIntervall I ⊆ R definierte, zweifach differenzierbare Funktion mit φ′′ + ν sinφ = 0, sohaben wir (

1

2φ′

2

)′

= φ′φ′′ = −νφ′ sinφ = (ν cosφ)′,

und mit Lemma 1 folgt, dass es eine Konstante C ∈ R mit

1

2φ′

2=C

2+ ν cosφ, also φ′

2= C + 2ν cosφ

gibt. Um zu zeigen, dass φ analytisch ist, mussen wir nach Lemma 9 eine Ungleichungder Form

|φ(n)(t)| ≤ An!qn

mit Konstanten A, q > 0 fur alle n ∈ N und alle t nahe beim Entwicklungspunkt nach-weisen. Hierzu benotigen wir eine Ubersicht uber die n-ten Ableitungen der Funktion

44

Page 45: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 27.4.2011

φ, und es stellt sich heraus, dass es einfacher ist zunachst die geraden Ableitungenφ(2n) zu untersuchen. Wir behaupten, dass es fur jedes n ∈ N mit n ≥ 1 ein PolynomΦn von Grad hochstens n − 1 mit φ(2n) = Φn(cosφ) sinφ gibt. Fur n = 1 ist dies mitΦ1(x) = −ν wahr. Den allgemeinen Fall behandeln wir per vollstandiger Induktion.Auf die Durchfuhrung der Rechnung hatten wir in der Vorlesung verzichtet, hier wol-len wir sie ruhig einmal vorfuhren. Sei also n ∈ N mit n ≥ 1 und es sei Φn ein Polynomvon Grad hochstens n− 1 mit φ(2n) = Φn(cosφ) sinφ. Dann folgen

φ(2n+1) = Φn(cosφ)φ′ cosφ− Φ′n(cosφ)φ′ sin2 φ

und

φ(2(n+1)) = φ(2n+2) = −Φ′n(cosφ)φ′

2sinφ cosφ+ Φn(cosφ)φ′′ cosφ

− Φn(cosφ)φ′2sinφ+ Φ′′

n(cosφ)φ′2sin3 φ

− Φ′n(cosφ)φ′′ sin2 φ− 2Φ′

n(cosφ)φ′2sinφ cosφ

= −(3Φ′n(cosφ)(C + 2ν cosφ) cosφ+ νΦn(cosφ) cosφ+ Φn(cosφ)(C + 2ν cosφ)

− Φ′′n(cosφ)(C + 2ν cosφ)(1− cos2 φ)− νΦ′

n(cosφ)(1− cos2 φ)) sinφ

= Φn+1(cosφ) sinφ

mit

Φn+1(x) = −((C+3νx)Φn(x)+(3C−ν+6νx+νx2)Φ′n(x)−(C+2νx−Cx2−2νx3)Φ′′

n(x)).

Dann ist Φn+1 ein Polynom von Grad hochstens n und wir haben den Induktions-schritt durchgefuhrt. Per vollstandiger Induktion ist diese Zwischenbehauptung damitbewiesen. Insbesondere gilt fur alle n ≥ 1, t ∈ I stets

|φ(2n)(t)| = |Φn(cosφ(t)) sinφ(t)| ≤ |Φn(cosφ(t))| ≤ sup−1≤x≤1

|Φn(x)|,

wir mussen uns also nur das Wachstumsverhalten der Polynome Φn anschauen. Wirbenotigen eine Ungleichung

|Φn(x)| ≤ A(2n)!qn

fur alle n ≥ 1 und alle x ∈ [−1, 1], wobei A, q > 0 positive Konstanten sein sollen.Auf die Herleitung hatten wir in der Vorlesung wieder verzichtet, wollen es an dieserStelle aber durchfuhren. Zu diesem Zweck fuhren wir eine kleine Hilfsgroße ein, istp(x) = a0 + a1x+ · · ·+ anx

n ein Polynom von Grad hochstens n, so definieren wir

M(p) := |a0|+ |a1|+ · · ·+ |an| =n∑

k=0

|ak|.

Diese Großen haben die folgenden Eigenschaften

45

Page 46: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 27.4.2011

1. Fur jedes Polynom p ist supx∈[−1,1] |p(x)| ≤ M(p). Denn ist p(x) = a0 + a1x +· · ·+ anx

n, so ist fur jedes x ∈ R mit |x| ≤ 1 stets

|p(x)| =

∣∣∣∣∣n∑

k=0

akxk

∣∣∣∣∣ ≤n∑

k=0

|ak| · |x|k ≤n∑

k=0

|ak| = M(p).

Aufgrund dieser Eigenschaft interessieren wir uns uberhaupt fur M(p).

2. Sind p, q zwei Polynome und λ ∈ R, so gelten M(p + q) ≤ M(p) + M(q) undM(λp) = |λ|M(p). Denn schreiben wir p(x) = a0 + a1x+ · · ·+ anx

n und q(x) =b0 + b1x+ · · ·+ bnx

n, so ist

M(p+ q) =n∑

k=0

|ak + bk| ≤n∑

k=0

(|ak|+ |bk|) = M(p) +M(q)

und

M(λp) =n∑

k=0

|λak| =n∑

k=0

|λ| · |ak| = |λ|M(p).

3. Fur alle Polynome p, q ist auch M(pq) ≤ M(p)M(q). Schreiben wir namlichwieder p(x) = a0 + a1x + · · · + anx

n und q(x) = b0 + b1x + · · · + bmxm, so ist

p(x)q(x) = c0 + c1x + · · · + cn+mxn+m mit ck =

∑i+j=k aibj fur 0 ≤ k ≤ m + n.

Es folgt

M(pq) =n+m∑k=0

|ck| =n+m∑k=0

∣∣∣∣∣ ∑i+j=k

aibj

∣∣∣∣∣ ≤n+m∑k=0

∑i+j=k

|ai| · |bj|

=

(n∑

i=0

|ai|

(m∑

j=0

|bj|

)= M(p)M(q).

4. Ist schließlich p ein Polynom von Grad hochstens n ∈ N, so ist auch M(p′) ≤nM(p). Hierzu schreibe p(x) = a0 + a1x + · · · + anx

n, also p′(x) = a1 + 2a2x +· · ·+ nanx

n−1 und

M(p′) =n∑

k=1

|kak| ≤n∑

k=1

n|ak| ≤ nn∑

k=0

|ak| = nM(p).

Wenden wir diese Rechenregeln auf die Rekursionsformel fur das Polynom Φn+1 an, soergibt sich

M(Φn+1) ≤ ((|C|+ 3ν) + (3|C|+ 8ν)(n− 1) + (2|C|+ 4ν)(n− 1)(n− 2))M(Φn)

fur alle n ∈ N mit n ≥ 2. Fur n ≥ 3 konnen wir dies zu

M(Φn+1) ≤ (6|C|+ 15ν)(n− 1)(n− 2)M(Φn)

46

Page 47: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 27.4.2011

vereinfachen. Setze q0 := 6|C|+ 15ν > 0 und

A0 := max

{M(Φ1)

2q0,M(Φ2)

24q20

,M(Φ3)

720q30

}> 0.

Wir behaupten, dass dann M(Φn) ≤ A0(2n)! · qn0 fur alle n ∈ N mit n ≥ 1 gilt. Fur

n = 1, 2, 3 ist dies nach Definition von A0 klar. Nun sei n ∈ N mit n ≥ 3 und nehmeM(Φn) ≤ A0(2n)! · qn

0 an. Dann folgt auch

M(Φn+1) ≤ q0(n−1)(n−2)M(Φn) ≤ A0(2n)!·(2n+1)(2n+2)qn+10 = A0(2(n+1))!·qn+1

0 ,

und per vollstandiger Induktion ist auch diese Behauptung bewiesen. Kommen wir zurFormel φ′2 = C + 2ν cosφ zuruck, so folgen C + 2ν ≥ 0 und |φ′(t)| ≤

√C + 2ν fur alle

t ∈ I, die Ableitung von φ ist also beschrankt. Fur jedes n ∈ N mit n ≥ 1 folgt damitweiter

|φ(2n+1)(t)| = |Φn(cosφ(t))φ′(t) cosφ(t)− Φ′n(cosφ(t))φ′(t) sin2 φ(t)|

≤ (M(Φn) +M(Φ′n))|φ′(t)| ≤

√C + 2ν nM(Φn) ≤

√C + 2ν A0n(2n)!qn

0

≤√C + 2ν A0(2n+ 1)!qn

0 .

Nach diesen Vorbereitungen konnen wir jetzt einsehen das Losungen der Pendelglei-chung analytisch sind.

Satz 1.19: Seien I ⊆ R ein offenes Intervall, ν ∈ R mit ν > 0 und φ : I → R einezweifach differenzierbare Funktion mit φ′′ + ν sinφ = 0. Dann ist φ analytisch und esexistieren Konstanten A, q ∈ R mit A, q > 0 und |φ(n)(t)| ≤ An! · qn fur alle n ∈ N mitn ≥ 1 und alle t ∈ I.

Beweis: Wir ubernehmen die Bezeichnungen der obigen Diskussion und setzen q :=√q0 > 0 und

A := max

{A0,

√C + 2ν

q,A0

√C + 2ν

q

}> 0.

Seien n ∈ N mit n ≥ 1 und t ∈ I. Ist n gerade, also n = 2m fur ein m ∈ N\{0}, sohaben wir sofort |φ(n)(t)| = |φ(2m)(t)| ≤ A0(2m)! · qm

0 ≤ An! · qn. Nun sei n ungerade.Ist n = 1, so gilt |φ′(t)| ≤

√C + 2ν ≤ Aq. Ist dagegen n ≥ 3, so haben wir n = 2m+ 1

mit m ∈ N\{0} und es ergibt sich ebenfalls

|φ(n)(t)| = |φ(2m+1)(t)| ≤√C + 2ν A0(2m+ 1)!qm

0 ≤ An! · qn.

Dass φ analytisch ist, folgt jetzt aus Lemma 9.

Es gibt naturlich allgemeine Satze uber Differentialgleichungen die einem von vorn-herein garantieren das jede Losung von φ′′ + ν sinφ = 0 analytisch sein muss, aber

47

Page 48: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 27.4.2011

wie gesehen kann man sich dies auch ganz direkt uberlegen. Beachte das der Satz ins-besondere besagt, dass alle Ableitungen von φ auf dem gesamten Definitionsbereichbeschrankt sind. Auf die Funktion φ selbst muss dies nicht zutreffen, diese kann sehrwohl unbeschrankt sein. Die unbeschrankten Losungen sind sozusagen

”Pendelbewe-

gungen mit Uberschlag“. Als ein wichtiges Korollar des Satzes erhalten wir:

Korollar 1.20: Seien I ⊆ R ein offenes Intervall, ν ∈ R mit ν > 0 und φ, ψ : I → Rzwei zweifach differenzierbare Funktionen mit φ′′ + ν sinφ = ψ′′ + ν sinψ = 0. Es gebeein t0 ∈ I mit φ(t0) = ψ(t0) und φ′(t0) = ψ′(t0). Dann gilt bereits φ = ψ.

Beweis: Wir hatten zu Begin dieses Abschnitts gesehen, dass der Funktionswert unddie erste Ableitung im Punkt t0 bereits die gesamte Taylorreihe in t0 festlegen, es giltalso φ(n)(t0) = ψ(n)(t0) fur alle n ∈ N. Da φ und ψ nach Satz 19 analytisch sind, liefertder Identitatssatz Satz 11 auch φ = ψ.

In anderen Worten ist durch Startauslenkung und Startgeschwindigkeit die gesamtePendelbewegung bereits festgelegt, was man naturlich auch genau so erwartet. Auchdieses Korollar ist in Wahrheit nur ein Spezialfall allgemeiner Eindeutigkeitssatze uberdie Losungen gewohnlicher Differentialgleichungen.

Nachdem wir jetzt die allgemeinen Eigenschaften von Losungen der Pendelgleichungeingesehen haben, wollen wir jetzt an ihre genauere Beschreibung gehen. Wir geben unseine Startauslenkung φ0 ∈ R mit 0 < φ0 < π/2 vor, und es sei φ : R → R eine zweifachdifferenzierbare Funktion mit φ′′ + ν sinφ = 0 und φ(0) = φ0, φ

′(0) = 0. Wir wollenuns uberlegen das φ sich qualitativ wie die Losung fur kleine Auslenkungen verhalt,also beispielsweise periodisch ist. Zunachst haben wir die Gleichung φ′2 = C + 2ν cosφmit einer Konstanten C ∈ R. Werten wir diese zum Startzeitpunkt t = 0 aus, so ergibtsich C + 2ν cosφ0 = 0, also ist C = −2ν cosφ0 ∈ (−2ν, 0) und fur alle t ∈ R ist damit

1

2νφ′(t)2 = cosφ(t)− cosφ0.

ε t

φ (t)

φ ’(t)

t=

Insbesondere haben wir fur alle t ∈ R stetscosφ(t) ≥ cosφ0 > 0. Hieraus folgt nun auch|φ(t)| ≤ φ0 fur alle t ∈ R. Gibt es namlich eint ∈ R mit |φ(t)| > φ0, so gibt es nach dem Zwi-schenwertsatz I.§13.Satz 14 auch ein s ∈ R mitφ0 < φ(s) < π/2 oder −π/2 < φ(s) < −φ0,und in beiden Fallen ergibt sich der Widerspruchcosφ(s) < cosφ0. Also ist tatsachlich |φ(t)| ≤ φ0

fur alle t ∈ R. Wir werden uns in mehreren Schrit-ten uberlegen, dass φ eine

”Pendelbewegung“ ist.

Zunachst haben wir φ′′(0) = −ν sinφ0 < 0 und daφ′′ = −ν sinφ stetig ist, gibt es somit ein ε > 0 mit φ′′(t) < 0 fur alle t ∈ [−ε, ε].Nach I.§14.Korollar 11 ist φ′ auf dem Intervall [−ε, ε] streng monoton fallend. Fur alle

48

Page 49: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 27.4.2011

t ∈ (0, ε] ist damit auch φ′(t) < φ′(0) = 0, und wieder nach I.§14.Korollar 11 ist φ aufdem Intervall [0, ε] streng monoton fallend. Damit haben wir die Situation des oben-stehenden Bildes erreicht, das Pendel beginnt sich zur Ruhelage hin zu bewegen unddie Geschwindigkeit nimmt dabei zu, das negative Vorzeichen kommt zustande da wiruns in Richtung kleinerer Winkel bewegen.

Wir kommen jetzt zum zweiten Schritt und wollen einsehen, dass φ, wie unten linksgezeigt, eine positive Nullstelle hat. Wenn wir uns φ wirklich als Pendel denken ist diesnaturlich klar, irgendwann muss die Ruhelage erreicht sein, aber wir wollen es wirklichrein aus der Pendelgleichung ablesen. Wir behaupten also, das es ein t ∈ R mit t > 0und φ(t) = 0 gibt. Hierzu verwenden wir einen Widerspruchsbeweis, nehme also an dasφ(t) 6= 0 fur alle t > 0 ware. Wegen φ(0) = φ0 > 0 folgt mit dem ZwischenwertsatzI.§13.Satz 14 dann auch φ(t) > 0 fur alle t ∈ R mit t ≥ 0. Fur t ≥ 0 sind dann auch0 < φ(t) ≤ φ0, also φ′′(t) = − sinφ(t) < 0 und nach Korollar 5.(b) ist φ auf R≥0 striktkonkav. Damit gilt nach Satz 3.(a) auch φ(t) < φ(ε) + φ′(ε) · (t− ε) fur alle t > ε, d.h.die Funktion liegt unterhalb ihrer Tangente in t = ε.

0 t

φ (t)

φ ’(t)

t ε t

φ (t)

φ ’(t)

Diese Situation ist im Bild oben rechts zu sehen, und weil die Tangente die x-Achseschneidet muss auch φ dies tun. Dies konnen wir auch formal einsehen. Wegen φ′(ε) < 0ist ε− φ(ε)/φ′(ε) > ε und

0 < φ

(ε− φ(ε)

φ′(ε)

)< φ(ε)− φ′(ε)

φ(ε)

φ′(ε)= 0.

t

φ (t)

φ ’(t)

t0 2t0

Damit haben wir einen Widerspruch und somitmuss ein t > 0 mit φ(t) = 0 existieren. Die Funktionφ hat also tatsachlich eine Nullstelle und wir wollenjetzt eine kleinste solche konstruieren. Hierzu setzenwir

t0 := inf{t ∈ R|t > 0, φ(t) = 0} ∈ R≥0.

Dann ist auch φ(t0) = 0, denn fur jedes n ∈ N\{0}gibt es ein tn > 0 mit φ(tn) = 0 und t0 ≤ tn <t0 + 1/n, und damit sind auch (tn)n≥1 −→ t0 und

49

Page 50: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 27.4.2011

φ(t0) = limn→∞ φ(tn) = 0. Insbesondere ist t0 > 0. Im nachsten Schritt wollen wireinsehen, dass φ die obenstehend gezeigte Form hat. Fur 0 ≤ t < t0 gilt φ(t) 6= 0, alsowegen φ(0) > 0 sogar φ(t) > 0 und φ′′(t) = −ν sinφ(t) < 0. Damit ist φ′ zwischen 0und t0 streng monoton fallend, also auch φ′(t) < φ′(0) = 0 fur 0 < t ≤ t0 und auch φ istauf [0, t0] strend monoton fallend. Wir erwarten das φ nach Durchlaufen der Ruhelagespiegelbildlich auf die andere Seite des Pendels lauft. Spiegeln wir t ∈ R an t0, so ergibtsich 2t0−t, wir wollen also φ(2t0−t) = −φ(t) fur alle t ∈ R einsehen. Hierzu betrachtenwir die Hilfsfunktion

ψ : R → R; t 7→ −φ(2t0 − t).

Fur alle t ∈ R sind dann ψ′(t) = φ′(2t0−t) und ψ′′(t) = −φ′′(2t0−t) = ν sinφ(2t0−t) =−ν sin(−φ(2t0 − t)) = −ν sinψ(t), d.h. es ist ψ′′ + ν sinψ = 0. Außerdem haben wirψ(t0) = −φ(t0) = 0 = φ(t0) und ψ′(t0) = φ′(t0), d.h. nach Korollar 20 ist ψ = φ, unddies bedeutet gerade φ(2t0 − t) = −φ(t) fur alle t ∈ R.

Es folgt das φ auf [0, 2t0] strend monoton fallend ist mit φ(2t0) = −φ(0) = −φ0. Furt0 < t < 2t0 ist dabei φ′′(t) = −ν sinφ(t) > 0, d.h. φ′ ist auf [t0, 2t0] streng monotonsteigend. Außerdem haben wir φ′(2t0) = φ′(0) = 0.

φ (t)

t0 2t0 T=4t0

Wir kommen zum vierten Schritt, und wollendiesmal einsehen das φ die rechts gezeigte Ge-stalt hat. Nachdem das Pendel ganz nach links ge-kommen ist, also fur t = 2t0, sollte es jetzt wie-der in seine Startposition zuruckkehren, und zwarvollig symmetrisch zur bisherigen Bewegung. Dies-mal spiegeln wir also an 2t0 und wollen φ(4t0− t) =φ(t) fur alle t ∈ R haben. Hierzu betrachten wirfur t ∈ R die Hilfsfunktion ψ(t) := φ(4t0 − t) mitψ′(t) = −φ′(4t0 − t) und ψ′′(t) = φ′′(4t0 − t) =−ν sinφ(4t0 − t) = −ν sinψ(t) fur alle t ∈ R. We-gen ψ(2t0) = φ(2t0) und ψ′(2t0) = −φ′(2t0) = 0 = φ′(2t0) folgt hieraus wieder ψ = φund somit φ(4t0 − t) = φ(t) fur alle t ∈ R. Auf [2t0, 4t0] ist φ also streng monotonsteigend mit φ(4t0) = φ(0) = φ0 und φ′(4t0) = −φ′(0) = 0.

Schließlich behaupten wir das φ die Periode T := 4t0 > 0 hat, das also φ(T + t) =φ(t) fur alle t ∈ R gilt, und dies folgt wieder analog durch Betrachtung von ψ(t) :=φ(T+t). Damit haben wir auch ohne Kenntnis einer expliziten Losung eingesehen, dassφ eine periodische Schwingung mit den erwarteten Symmetrieeigenschaften ist. Waswir an dieser Stelle noch nicht konnen ist die Schwingungsperiode T auszurechnen,dies wird uns erst im nachsten Kapitel gelingen.

$Id: integral.tex,v 1.17 2011/09/16 16:38:04 hk Exp $

50

Page 51: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 27.4.2011

§2 Integralrechnung

In diesem Kapitel wollen wir die Integration reeller Funktionen f : [a, b] → R bespre-chen. Es gibt verschiedene Moglichkeiten den Integralbegriff informell einzufuhren. Diewohl wichtigste dieser Moglichkeiten ist die Interpretation des Integrals als eine

”kon-

tinuierliche Summe“. Aus dieser Richtung kommt auch das fur Integrale verwendeteSymbol

∫“ das sich aus einem gestreckt geschriebenen

”S“ fur

”Summe“ entwickelt

hat. Das Urbeispiel fur unsere”kontinuierlichen Summen“ ist der Begriff der Arbeit.

Wir denken uns ein sich bewegendes Objekt auf das zum Zeitpunkt t eine Kraft F (t)wirkt. Da wir nur reellwertige Funktionen behandeln wollen, nehmen wir an das dieseKraft immer dieselbe Richtung hat und daher als Zahl interpretiert werden kann. Au-ßerdem nehmen wir der Einfachheit halber an, dass das Objekt sich mit konstanter,zu Eins normierter, Geschwindigkeit bewegt, so das wir keinen Unterschied zwischenZeitabschnitten und in diesen zuruckgelegten Wegstucken machen mussen. Die von derwirkenden Kraft geleistete Arbeit von einem Zeitpunkt t = a bis zu einem Zeitpunktt = b, beziehungsweise genauer langs des in diesem Zeitabschnitt zuruckgelegten Wegs,ist dann die

”Summe“ uber die F (t) fur a ≤ t ≤ b. Dies ist keine Reihensumme im

Sinne des I.§7 des letzten Semesters, auf der mathematischen Seite brauchen wir alsoeine neue Definition.

Wir diskutieren zunachst einmal die anzustellende heuristische Uberlegung. Schau-en wir uns erst einmal den einfachsten Fall an, dass die wirkende Kraft F (t) = Fkonstant ist. Die Arbeit ist dann einfach

W = Kraft · zuruckgelegte Strecke,

also W = F · (b− a) da wir zwischen Zeitabschnitten und Strecken keinen Unterschiedmachen wollten.

t=a

t=b

t

F(t)

Den allgemeinen Fall einer sich zeitlich andern-den Kraft wollen wir auf diesen einfachen Fall

”zuruckfuhren“. Zu diesem Zweck denken wir uns

das Zeitintervall von a bis b in kleine Teilstucke[a, t1], [t1, t2], [t2, t3], . . ., [tn−1, b] zerteilt, also a =:t0 < t1 < t2 < . . . < tn−1 < tn := b. Auf je-dem dieser Teilabschnitte [ti−1, ti] approximierenwir die wirkende Kraft durch einen

”Mittelwert“

Fi, und tun so als wurde langs [ti−1, ti] konstantdiese Kraft Fi wirken. Dieses Teilstuckchen tragtdann zur Arbeit den Anteil Fi(ti− ti−1) bei, und durch Summation uber alle Teilstuckeerhalten wir eine Naherung

W ≈n∑

i=1

Fi(ti − ti−1)

der Arbeit W . Fuhren wir jetzt in irgendeinem Sinne den Grenzwert nach immer feinerwerden Zerteilungen durch, so sollten diese Naherung gegen die Arbeit W =

∫ b

aF (t) dt

51

Page 52: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 27.4.2011

konvergieren. Wir werden das Integral durch eine etwas formalere Version dieser Uber-legung definieren.

Zuvor schauen wir uns aber noch eine alternative Interpretation des Integrals an. Inder Naherungssumme fur W konnen wir jeden Summanden Fi(ti − ti−1) als die Flachedes Rechtecks der Breite ti−ti−1 und der Hohe Fi interpretieren. Damit wird die Flacheim Fall Fi < 0 mit einem Vorzeichen versehen.

Beim Grenzubergang zu immer feineren Zerteilungen entsteht dann die Flache unter-halb des Graphen von f . Dabei werden unter der x-Achse liegende Teile der Flachenegativ gezahlt. Eine weitere hiermit verwandte Interpretation des Integrals ist es Inte-gration als Mittelung zu interpretieren. Das arithmetische Mittel von Zahlen a1, . . . , an

ist bekanntlich (1/n)∑n

k=1 ak und beim Ubergang zu kontinuierlichen Summen wird

1

b− a

∫ b

a

F (t) dt

zum Mittel der Funktion F uber das Intervall [a, b]. Die Interpretation des Integral alseiner Flache ist fur unsere Zwecke nicht weiter wichtig, historisch war sie aber eine derMotivationen zur Einfuhrung des Integrals. Es gab auch noch eine zweite Grundmoti-vation eher rechnerischer Natur. Das Integral lost die einfachste Differentialgleichungy′(t) = f(t) erster Ordnung deren rechte Seite nicht von y abhangt, die Losung derGleichung mit y(a) = b ist y(t) = b +

∫ t

af(s) ds. Tatsachlich wird auch die Losung

allgemeinerer Differentialgleichungen oftmals als deren Integration bezeichnet. Als eineFolgerung ergibt sich die Berechnung von Integralen uber Stammfunktionen, die sichdann naturlich als die wichtigste Methode hierfur herausstellt. Trotzdem sollte mansich Stammfunktionen nicht als Bestandteil der Definition des Integrals vorstellen, siedienen zur Berechnung von Integralen aber nicht dazu zu sagen was Integrale sind.

2.1 Das Rieman Integral

Es gibt eine ganze Reihe verschiedener Integralbegriffe, diese unterscheiden sich nichtin den Werten von Integralen sondern darin welche Funktionen uberhaupt integrierbarsind. Wir wollen hier das sogenannte Rieman Integral diskutieren, da dieses recht nahean der Idee

”zerteilen und Grenzwert nach immer feineren Zerteilungen bilden“ liegt.

Wir beginnen mit einigen Grunddefinitionen.

52

Page 53: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 29.4.2011

Definition 2.1: Seien a, b ∈ R mit a < b. Eine Zerlegung von [a, b] ist ein Tupelα = (t0, t1, . . . , tn) reeller Zahlen mit a = t0 < t1 < . . . < tn = b. Meist schreiben wirZerlegungen nicht als Tupel, sondern in der Form

”a = t0 < . . . < tn = b“. Die Zahl n

nennen wir die Anzahl der Teilintervalle der Zerlegung und fur 1 ≤ i ≤ n ist [ti−1, ti]das i-te Teilintervall der Zerlegung. Schließlich heißt die Zahl

δ(α) := max1≤i≤n

(ti − ti−1),

d.h. die maximale Lange eines Teilintervalls der Zerlegung, die Feinheit der Zerlegung.

Wir fuhren noch eine kleine Variante des Zerlegungsbegriffs ein.

Definition 2.2: Seien a, b ∈ R mit a < b. Eine Zerteilung von [a, b] ist ein Paarζ = (t0, . . . , tn; s1, . . . , sn) bestehend aus einer Zerlegung (t0, . . . , tn) von [a, b] undPunkten si ∈ [ti−1, ti] fur 1 ≤ i ≤ n. Wir nennen α = (t0, . . . , tn) die zu ζ gehorendeZerlegung und δ(ζ) := δ(α) die Feinheit der Zerteilung ζ. Ist schließlich f : [a, b] → Reine Funktion, so definieren wir die zur Zerteilung ζ von [a, b] gehorende Riemansummevon f als

R(f ; ζ) :=n∑

i=1

f(si) · (ti − ti−1).

Vorlesung 5, Freitag 29.4.2011

Wir haben gerade die Konstruktion des Rieman-Integrals begonnen und hatten hierfurZerlegungen und Zerteilungen eines Intervalls sowie die zugehorigen Rieman-Summeneingefuhrt. Oft werden wir aquidistante Zerlegungen verwenden, d.h. Zerlegungen beidenen alle Teilintervalle dieselbe Lange haben. Ist n ≥ 1, so gibt es offenbar genau eineaquidistante Zerlegung von [a, b] in n Teilintervalle, namlich α = (t0, . . . , tn) mit

tk = a+ k · b− a

nfur 0 ≤ k ≤ n, also δ(α) =

b− a

n.

Sind α = (t0, . . . , tn), β = (s0, . . . , sm) zwei Zerlegungen von [a, b], so nennen wir βeine Verfeinerung von α, geschrieben als α ≤ β, wenn jeder Zerteilungspunkt aus αauch in β ist, wenn also {t0, . . . , tn} ⊆ {s0, . . . , sm} gilt. Dann ist offenbar δ(β) ≤ δ(α).Sind α, β zwei Zerlegungen von [a, b], so gibt es offenbar eine Zerlegung γ von [a, b] diefeiner als α und β ist. Wir konnen beispielsweise die Zerlegung α∪β = (r0, . . . , rk) mit{r0, . . . , rk} = {t0, . . . , tn}∪{s0, . . . , sm} bilden, bei der die Zerlegungspunkte von α undβ zusammengefasst und korrekt sortiert werden. Es ist k ≤ n+m−1. Beachte das

”α∪β“

53

Page 54: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 29.4.2011

keine mengentheoretische Vereinigung sondern ein kleiner Bezeichnungsmißbrauch ist.Es ist technisch hilfreich neben den Riemansummen noch einen mit diesen verwandtenBegriff einzufuhren, die sogenannten Ober- und Untersummen einer Zerlegung.

i

t ti−1 i

mi

M

Riemansumme R(f ; ζ) Zur Unter- und Obersumme

Definition 2.3: Seien a, b ∈ R mit a < b und f : [a, b] → R eine beschrankte Funktion.Sei α = (t0, . . . , tn) eine Zerlegung von [a, b]. Fur jedes 1 ≤ i ≤ n seien dann

mi := inf f([ti−1, ti]),

Mi := sup f([ti−1, ti]).

Die zur Zerlegung α gehorende Unter- beziehungsweise Obersumme von f sind dann

S(f ;α) :=n∑

i=1

mi · (ti − ti−1) (Untersumme),

S(f ;α) :=n∑

i=1

Mi · (ti − ti−1) (Obersumme).

Ist die Funktion f stetig, so sind Unter- und Obersummen nach I.§13.Satz 13 auchRiemansummen bezuglich der Zerlegung α, fur allgemeinere Funktionen muss dies nichtunbedingt der Fall seien.

Untersumme Obersumme

54

Page 55: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 29.4.2011

Wir wollen drei kleine Beispiele durchgehen. Zunachst nehme an, dass f : [a, b] → Reine konstante Funktion ist, etwa f(x) = c fur alle x ∈ [a, b]. Fur jede Zerlegungα = (t0, . . . , tn) ist dann offenbar

S(α) = S(α) =n∑

i=1

c(ti − ti−1) = c(b− a),

und auch jede Riemansumme dieser Funktion liefert denselben Wert. Als nachstesbetrachten wir die Funktion f : [a, b] → R;x 7→ x wobei a, b ∈ R mit a < b sind.Sei α = (t0, t1, . . . , tn) eine beliebige Zerlegung von [a, b]. Sei nun 1 ≤ i ≤ n, und wirwollen die Zahlen mi und Mi berechnen. Dabei ist mi der kleinste Funktionswert vonf(x) = x fur ti−1 ≤ x ≤ ti, und dies ist naturlich einfach der Wert an der linken Seitedes Intervalls, also mi = ti−1. Ebenso ist der großte Funktionswert von f(x) = x indiesem Intervall gleich dem Funktionswert an der rechten Seite, d.h. Mi = ti. Unter-und Obersumme bezuglich dieser Zerlegung ergeben sich als

S(α) =n∑

i=1

mi(ti − ti−1) =n∑

i=1

ti−1(ti − ti−1),

S(α) =n∑

i=1

Mi(ti − ti−1) =n∑

i=1

ti(ti − ti−1).

Es ist S(α) ≤ S(α) und wir wollen uns uberlegen, wie weit sich diese beiden Zahlenvoneinander unterscheiden. Hierzu betrachten wir die Differenz von Ober- und Unter-summe

S(α)− S(α) =n∑

i=1

(ti − ti−1)2.

Wie groß kann dies maximal werden? Um dies zu sehen ziehen wir den großtmoglichenWert der Abstande ti − ti−1 aus der Summe heraus, also

S(α)− S(α) =n∑

i=1

(ti − ti−1)2 ≤ max

1≤i≤n(ti − ti−1) ·

n∑i=1

(ti − ti−1) = δ(α) · (b− a).

Wie schon bemerkt sind die Ober- und die Untersumme beides auch Riemansummenbezuglich der gegebenen Zerlegung. Als eine weitere Riemansumme schauen wir unsdie Zerteilungspunkte si := (ti + ti−1)/2 fur 1 ≤ i ≤ n an. Ist dann ζ = (α; s1, . . . , sn),so ergibt sich die Riemansumme

R(ζ) =n∑

i=1

ti + ti−1

2(ti− ti−1) =

1

2

n∑i=1

(ti + ti−1)(ti− ti−1) =1

2

n∑i=1

(t2i − t2i−1) =b2 − a2

2.

Ziehen wir die Summe gleich im ersten Schritt auseinander, so folgt das die Rieman-summe auch

R(ζ) =S(α) + S(α)

2

55

Page 56: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 29.4.2011

das arithmetische Mittel von Unter- und Obersumme ist. Als ein zweites Beispiel neh-men wir eine etwas merkwurdige Funktion, die sich aber schon einfach behandeln laßt.Sei

f : [0, 1] → R;x 7→

{1, x ∈ Q,0, x /∈ Q,

die sogenannte Dirichlet Funktion. Sei α = (t0, . . . , tn) eine Zerlegung von [0, 1]. Sei1 ≤ i ≤ n. Wir behaupten das dann mi = 0 und Mi = 1 sind. Hierzu mussen wir unsnur klarmachen, dass es fur alle a, b ∈ R mit a < b stets eine rationale Zahl ζ ∈ Qund eine irrationale Zahl η ∈ R\Q mit ζ, η ∈ (a, b) gibt. Wir wollen dies als ein kleinesLemma formulieren.

Lemma 2.1: Seien a, b ∈ R mit a < b.

(a) Es gibt eine rationale Zahl q ∈ (a, b) zwischen a und b.

(b) Es gibt eine irrationale Zahl ξ ∈ (a, b) zwischen a und b.

Beweis: (a) Nach der archimedischen Eigenschaft I.§4.Lemma 4 der reellen Zahlengibt es ein n ∈ N mit n > 1/(b − a), also n ≥ 1 und 1/n < b − a. Sei k := [na] derganzzahlige Anteil von na, also k ∈ Z mit k ≤ na < k + 1. Dann ist q := (k + 1)/neine rationale Zahl mit

a =na

n<k + 1

n= q und q =

k + 1

n≤ na+ 1

n= a+

1

n< a+ (b− a) = b,

also q ∈ (a, b).(b) Als ein Beispiel in I.§2 hatten wir

√2 /∈ Q gezeigt. Nach (a) existiert eine rationale

Zahl 0 6= q ∈ (a/√

2, b/√

2), und weiter ist ξ := q√

2 ∈ (a, b) irrational.

Allgemein schreibt man fur jede reelle Zahl x ∈ R den ganzzahligen Anteil von x als

[x] := max{n ∈ Z|n ≤ x}

und bezeichnet dies als die sogenannte”Gauß-Klammer“. Kommen wir zum Beispiel der

Dirichlet Funktion und unserer Zerlegung α zuruck, so zeigt das Lemma tatsachlichmi = 0 und Mi = 1 fur alle 1 ≤ i ≤ n. Als Unter- und Obersummen ergeben sichS(α) = 0 und S(α) =

∑ni=1(ti − ti−1) = 1. Wir wollen jetzt ein einfaches Lemma uber

Rieman-, Ober- und Untersummen festhalten.

Lemma 2.2: Seien a, b ∈ R mit a < b und f : [a, b] → R eine beschrankte Funktion.

(a) Sind α, β zwei Zerlegungen von [a, b] mit α ≤ β, so gelten

S(f ;α) ≤ S(f ; β) und S(f ;α) ≥ S(f ; β).

(b) Sind α, β zwei Zerlegungen von [a, b], so gilt S(f ;α) ≤ S(f ; β).

56

Page 57: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 29.4.2011

(c) Ist ζ eine Zerteilung von [a, b] mit zugehoriger Zerlegung α, so ist

S(f ;α) ≤ R(f ; ζ) ≤ S(f ; ζ).

(d) Seien α eine Zerlegung von [a, b] und ε > 0. Dann existieren Zerteilungen ζ, ζ ′ von[a, b] mit zugehoriger Zerlegung α so, dass

S(f ;α)− ε < R(f ; ζ) ≤ S(f ;α) und S(f ;α) ≤ R(f ; ζ ′) < S(f ;α) + ε

gelten.

(e) Seien α, β zwei Zerlegungen von [a, b] und C ≥ 0 mit |f(x)| ≤ C fur alle x ∈ [a, b].Es bezeichne n die Anzahl der Teilintervalle der Zerlegung α. Dann gelten

S(f ; β) ≤ S(f ;α ∪ β) ≤ S(f ; β) + 2C(n− 1)δ(β)

undS(f ; β) ≥ S(f ;α ∪ β) ≥ S(f ; β)− 2C(n− 1)δ(β).

Beweis: (a) Seien α = (t0, . . . , tn) eine Zerlegung von [a, b] und t ∈ (a, b) ein neuerZerlegungspunkt, also ti−1 < t < ti fur ein 1 ≤ i ≤ n. Wir zeigen die Behauptungzunachst fur β = (t0, . . . , ti−1, t, ti, . . . , tn). Fur 1 ≤ j ≤ n schreibemj := inf f([tj−1, tj])und Mj := sup f([tj−1, tj]). Außerdem seien

m− := inf f([ti−1, t]) ≥ mi, m+ := inf f([t, ti]) ≥ mi

undM− := sup f([ti−1, t]) ≤Mi, M+ := sup f([t, ti]) ≤Mi.

Dann haben wir

S(f ; β) =i−1∑j=1

mj(tj − tj−1) +m−(t− ti−1) +m+(ti − t) +n∑

j=i+1

mj(tj − tj−1)

≥i−1∑j=1

mj(tj − tj−1) +mi(t− ti−1) +mi(ti − t) +n∑

j=i+1

mj(tj − tj−1)

=n∑

j=1

mj(tj − tj−1) = S(f ;α),

und analog folgt auch S(f ; β) ≤ S(f ;α). Damit ist die Behauptung in diesem Fallbewiesen. Ist β eine beliebige Verfeinerung von α, so entsteht β aus α durch sukzessivesHinzufugen einzelner Zerlegungspunkte, und die Behauptung folgt mit Induktion ausdem bereits bewiesenen Spezialfall.

57

Page 58: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 29.4.2011

(b) Ist α = (t0, . . . , tn) eine Zerlegung von [a, b], so ist

mi = inf f([ti−1, ti]) ≤ sup f([ti−1, ti]) = Mi

fur jedes 1 ≤ i ≤ n, also ist auch

S(f ;α) =n∑

i=1

mi(ti − ti−1) ≤n∑

i=1

Mi(ti − ti−1) = S(f ;α).

Sind also α, β zwei beliebige Zerlegungen von [a, b], so wahlen wir eine weitere Zerlegungγ von [a, b] mit γ ≥ α, β, und erhalten mit Teil (a) auch

S(f ;α) ≤ S(f ; γ) ≤ S(f ; γ) ≤ S(f ; β).

(c) Schreibe ζ = (t0, . . . , tn; s1, . . . , sn), also α = (t0, . . . , tn). Fur jedes 1 ≤ i ≤ n istdann wegen si ∈ [ti−1, ti]

mi = inf f([ti−1, ti]) ≤ f(si) ≤ sup f([ti−1, ti]) = Mi,

also haben wir

S(f ;α) =n∑

i=1

mi(ti−ti−1) ≤n∑

i=1

f(si)(ti−ti−1) = R(f ; ζ) ≤n∑

i=1

Mi(ti−ti−1) = S(f ;α).

(d) Sei α = (t0, . . . , tn). Fur jedes 1 ≤ i ≤ n setze mi := inf f([ti−1, ti]), Mi :=sup f([ti−1, ti]) und wahle si, s

′i ∈ [ti−1, ti] mit

Mi −ε

b− a< f(si) ≤Mi und mi ≤ f(si) < mi +

ε

b− a.

Wir erhalten die Zerteilungen ζ := (α; s1, . . . , sn), ζ ′ := (α; s′1, . . . , s′n) mit zugehoriger

Zerlegung α. Es gilt

R(f ; ζ) =n∑

i=1

f(si)(ti − ti−1) >n∑

i=1

(Mi −

ε

b− a

)· (ti − ti−1)

=n∑

i=1

Mi(ti − ti−1)−ε

b− a

n∑i=1

(ti − ti−1) = S(f ;α)− ε,

und analog folgt auch R(f ; ζ) < S(f ;α) + ε.(e) Die Ungleichungen auf der linken Seite sind jeweils nach (a) klar, wir mussen alsonur noch diejenigen auf der rechten Seite einsehen. Schreibe β = (s0, . . . , sm). Im Falln = 1 ist α = (a, b) und α ∪ β = β und die Behauptung ist in diesem Fall klar. Wirbehandeln jetzt den Fall n = 2. Dann ist α = (a, t, b) fur ein t ∈ (a, b). Ist dabeit ∈ {s0, . . . , sm}, so gilt wieder α ∪ β = β und die Aussage ist klar. Wir konnenalso t /∈ {s0, . . . , sm} annehmen und dann existiert ein eindeutiges 1 ≤ j ≤ m mit

58

Page 59: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 29.4.2011

t ∈ (sj−1, sj). Fur 1 ≤ i ≤ m setze mi := inf f([si−1, si]) und Mi := sup f([si−1, si])und weiter seien

m′ := inf f([sj−1, t]), m′′ := inf f([t, sj]) M

′ := sup f([sj−1, t]), M′′ := sup f([t, sj]),

also auch mj = min{m′,m′′} und Mj = max{M ′,M ′′}. Mit diesen Bezeichnungen istα ∪ β = (s0, . . . , sj−1, t, sj, . . . , sm) und

S(f ;α ∪ β)− S(f ; β) = m′(t− sj−1) +m′′(sj − t)−mj(sj − sj−1)

= (m′ −mj)(t− sj−1) + (m′′ −mj)(sj − t).

Ist mj = m′, so ist wegen m′′ ≤ C und mj ≥ −C auch

S(f ;α ∪ β)− S(f ; β) = (m′′ −mj)(sj − t) ≤ 2Cδ(β),

andernfalls ist mj = m′′ und S(f ;α∪β)−S(f ; β) ≤ 2Cδ(β) folgt analog. Ebenso ergibtsich S(f ;α ∪ β)− S(f ; β) ≥ −2Cδ(β). Damit ist die Aussage im Fall n = 2 bewiesen.Die allgemeine Aussage beweisen wir nun durch Induktion nach n.

Sei also n ∈ N mit n ≥ 3 gegeben, und die Behauptung gelte fur n − 1. Seiα = (t0, . . . , tn) und setze α′ := (t0, . . . , tn−2, tn) sowie β′ := β ∪ (a, tn−1, b). Mit derInduktionsannahme und dem schon erledigten Fall ergibt sich

S(f ;α ∪ β) = S(f ;α′ ∪ β′) ≤ S(f ; β′) + 2C(n− 2)δ(β′)

≤ S(f ; β) + 2Cδ(β) + 2C(n− 2)δ(β) = S(f ; β) + 2C(n− 1)δ(β)

und analog folgt auch S(f ;α ∪ β) ≥ S(f ; β) − 2C(n − 1)δ(β). Damit ist auch (e) perInduktion bewiesen.

Nach Teil (b) des Lemmas ist jede Untersumme kleiner als jede Obersumme. Insbe-sondere ist die Menge aller Untersummen nach oben beschrankt und die Menge allerObersummen ist nach unten beschrankt, d.h. wir konnen definieren:

Definition 2.4 (Das Rieman Integral)Seien a, b ∈ R mit a < b und sei f : [a, b] → R eine beschrankte Funktion. Dann

definieren wir das Riemansche Unter- beziehungsweise Oberintegral von f durch∫ b

a

f := sup {S(f ;α)|α ist Zerlegung von [a, b]} (Unterintegral)∫ b

a

f := inf{S(f ;α)

∣∣α ist Zerlegung von [a, b]}

(Oberintegral).

Weiter heißt die Funktion f Rieman-integrierbar wenn ihr Unter- und ihr Oberintegralgleich sind und in diesem Fall heißt∫ b

a

f :=

∫ b

a

f =

∫ b

a

f

59

Page 60: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 29.4.2011

das Rieman Integral von f .

Im allgemeinen Fall gilt nur∫ b

af ≤

∫ b

af . Meistens verwenden wir die alternative

Schreibweise ∫ b

a

f(x) dx :=

∫ b

a

f

und entsprechend fur das Unter- und Oberintegral. Das”x“ ist hier eine im Integral

gebundene formale Variable, beispielsweise analog zum Summationsindex in der Sum-menschreibweise. Diese Schreibweise ist vor allem praktisch, wenn wir der Funktiongar keinen eigenen Namen geben sondern nur eine die Abbildungsvorschrift beschrei-bende Formel hinschreiben. Beachte das das

”dx“ keinerlei eigenstandige inhaltliche

Bedeutung hat, syntaktisch dient es zum einen als sich schließende Klammer, mit demIntegralzeichen als die zugehorige sich offnende Klammer, und zum anderen gibt esan wonach integriert werden soll. Letzteres ist nur von Bedeutung wenn in der Formelnoch weitere Variablen vorkommen. Oft betrachtet man eine Funktion als Integrand dienicht nur auf dem Intervall [a, b] sondern auf einer großeren Menge definiert ist. Dannnennen wir f uber [a, b] Rieman-integrierbar wenn die Einschrankung f |[a, b] dies istund das Rieman-Integral dieser Einschrankung nennen wir das Rieman-Integral von fuber [a, b], wieder geschrieben als

∫ b

af(x) dx.

Zunachst behandeln wir zwei ganz einfache Beispiele. Ist f : [a, b] → R konstantgleich c ∈ R, so hatten wir schon gesehen, dass alle Unter- und alle Obersummen vonf gleich c(b−a) sind, damit sind auch das Ober- und das Unterintegral gleich c(b−a),d.h. konstante Funktionen sind Rieman-integrierbar mit∫ b

a

c dx = c(b− a).

Als zweites Beispiel schauen wir uns die Dirichlet-Funktion f : [0, 1] → R an, alsof(x) = 1 fur rationales x und f(x) = 0 fur irrationales x. Wir hatten gesehen, dass alleUntersummen gleich Null und alle Obersummen gleich Eins sind, d.h. es gelten∫ b

a

f(x) dx = 0 und

∫ 1

0

f(x) dx = 1,

und insbesondere ist die Funktion f nicht Rieman-integrierbar.Als ein etwas komplizierteres Beispiels betrachten wir jetzt die Funktion f : [a, b] →

R;x 7→ x, und behaupten das f Rieman-integrierbar mit∫ b

a

x dx =b2 − a2

2

ist. Ist α eine Zerlegung von [a, b], so wissen wir bereits das

S(f ;α) ≤ S(f ;α) + S(f ;α)

2=b2 − a2

2≤ S(f ;α)

60

Page 61: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 29.4.2011

und S(f ;α)− S(f ;α) ≤ (b− a)δ(α) sind. Hieraus folgt

b2 − a2

2−(b−a)δ(α) ≤ S(f ;α) ≤

∫ b

a

x dx ≤∫ b

a

x dx ≤ S(f ;α) ≤ b2 − a2

2+(b−a)δ(α).

Ist jetzt ε > 0 beliebig, so existiert eine Zerlegung α von [a, b] mit δ(α) ≤ ε/(b−a), zumBeispiel eine aquidistante Zerlegung von [a, b] in n Teilintervalle mit n ≥ (b − a)2/ε,und setzen wir diese in unsere Abschatzung ein so folgt

b2 − a2

2− ε ≤

∫ b

a

x dx ≤∫ b

a

x dx ≤ b2 − a2

2+ ε.

Damit haben wir ∫ b

a

x dx =

∫ b

a

x dx =b2 − a2

2,

und die Behauptung ist bewiesen. Entscheidend fur den hier gezeigten Nachweis derRieman-Integrierbarkeit in diesem Beispiel war, dass sich Ober- und Untersummen furgeeignete Zerlegungen beliebig nahe kamen. Dies ist ein allgemeines Phanomen, daswir im folgenden Lemma festhalten.

Lemma 2.3 (Charakterisierung Rieman-integrierbarer Funktionen)Seien a, b ∈ R mit a < b und f : [a, b] → R eine beschrankte Funktion. Dann sind diefolgenden Aussagen aquivalent:

(a) Die Funktion f ist Rieman-integrierbar.

(b) Fur jedes ε > 0 existiert eine Zerlegung α von [a, b] mit

S(f ;α)− S(f ;α) < ε.

(c) Fur jedes ε > 0 existiert ein δ > 0 so, dass fur alle Zerlegungen α, β von [a, b] mitδ(α) < δ und δ(β) < δ stets

S(f ;α)− S(f ; β) < ε

gilt.

(d) Es gibt eine reelle Zahl A ∈ R so, dass es fur jedes ε > 0 stets ein δ > 0 mit|R(f ; ζ)− A| < ε fur jede Zerteilung ζ von [a, b] mit δ(ζ) < δ gibt.

(e) Fur jedes ε > 0 existiert ein δ > 0 so, dass fur alle Zerteilungen ζ, ξ von [a, b] mitδ(ζ) < δ und δ(ξ) < δ stets |R(f ; ζ)−R(f ; ξ)| < ε gilt.

(f) Fur jede Folge (ζn)n∈N von Zerteilungen von [a, b] mit (δ(ζn))n∈N −→ 0 ist die Folge(R(f ; ζn))n∈N konvergent.

61

Page 62: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 29.4.2011

Ist f Rieman-integrierbar, so gilt in (d) stets A =∫ b

af(x) dx und in (f) sind alle diese

Folgen gegen∫ b

af(x) dx konvergent.

Beweis: (a)=⇒(b). Sei ε > 0 gegeben und setze A :=∫ b

af(x) dx. Da A das Unterin-

tegral von f uber [a, b] ist, existiert eine Zerlegung β1 von [a, b] mit S(f ; β1) > A− ε/2und da A auch das Oberintegral von f uber [a, b] ist, existiert ebenso eine Zerlegungβ2 von [a, b] mit S(f ; β2) < A+ ε/2. Wahle eine Zerlegung α von [a, b] mit α ≥ β1, β2.Nach Lemma 2.(a) gilt dann

S(f ;α)− S(f ;α) ≤ S(f ; β2)− S(f ; β1) < A+ε

2−(A− ε

2

)= ε.

(b)=⇒(c). Sei ε > 0. Dann existiert eine Zerlegung γ von [a, b] mit S(f ; γ)−S(f ; γ) <ε/2. Wahle ein C > 0 mit |f(x)| ≤ C fur alle x ∈ [a, b] und bezeichne n ≥ 1 die Anzahlder Teilintervalle von γ. Setze δ := ε/(8Cn). Seien α, β zwei Zerlegungen von [a, b] mitδ(α) < δ und δ(β) < δ. Nach Lemma 2.(a,e) gilt dann

S(f ;α)− S(f ; β) ≤ S(f ;α ∪ γ) + 2C(n− 1)δ(α)− (S(f ;α ∪ γ)− 2C(n− 1)δ(β))

≤ S(f ; γ)− S(f ; γ) + 4Cnδ <ε

2+ε

2= ε.

(c)=⇒(e). Sei ε > 0. Dann existiert ein δ > 0 mit S(f ;α) − S(f ; β) < ε fur alleZerlegungen α, β von [a, b] mit δ(α) < δ und δ(β) < β. Seien jetzt ζ, ξ zwei Zerteilungenvon [a, b] mit δ(ζ) < δ und δ(ξ) < δ. Bezeichne α die ζ unterliegende Zerlegung von[a, b] und β die ξ unterliegende Zerlegung von [a, b]. Dann gelten auch δ(α) = δ(ζ) < δund δ(β) = δ(ξ) < δ. Mit Lemma 2.(c) folgen

R(f ; ζ)−R(f, ξ) ≤ S(f ;α)− S(f ; β) < ε

und analog auch

−(R(f ; ζ)−R(f ; ξ)) = R(f ; ξ)−R(f ; ζ) < ε,

d.h. es ist |R(f ; ζ)−R(f ; ξ)| < ε.(e)=⇒(f). Sei (ζn)n∈N eine Folge von Zerteilungen von [a, b] mit (δ(ζn))n∈N −→ 0. Wirzeigen, dass die Folge (R(f ; ζn))n∈N eine Cauchyfolge ist. Sei also ε > 0 gegeben. Dannexistiert ein δ > 0 mit |R(f ; ζ) − R(f ; ξ)| < ε fur alle Zerteilungen ζ, ξ von [a, b] mitδ(ζ) < δ und δ(ξ) < δ. Weiter existiert ein n0 ∈ N mit δ(ζn) < δ fur alle n ≥ n0, d.h.fur n,m ≥ n0 ist stets |R(f ; ζn) − R(f ; ζm)| < ε. Damit ist (R(f ; ζn))n∈N tatsachlicheine Cauchyfolge und nach I.§6.Satz 14 auch konvergent.(f)=⇒(d). Wir zeigen zuerst, dass es ein A ∈ R gibt so, dass fur jede Folge (ζn)n∈N vonZerteilungen von [a, b] mit (δ(ζn))n∈N −→ 0 die Folge (R(f ; ζn))n∈N gegen A konvergiert.Angenommen dies ware nicht der Fall. Dann gibt es A′, A′′ ∈ R mit A′ 6= A′′ und Folgen(ζ ′n)n∈N, (ζ ′′n)n∈N von Zerteilungen von [a, b] mit

(δ(ζ ′n))n∈N −→ 0, (δ(ζ ′′n))n∈N −→ 0, (R(f ; ζ ′n))n∈N −→ A′ und (R(f ; ζ ′′n))n∈N −→ A′′.

62

Page 63: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 29.4.2011

Durch ζ2n := ζ ′n und ζ2n+1 := ζ ′′n fur jedes n ∈ N haben wir eine weitere Folge von Zertei-lungen von [a, b] und nach Aufgabe (21) des letzten Semesters ist auch (δ(ζn))n∈N −→ 0.Damit ist auch die Folge (R(f ; ζn))n∈N konvergent und erneut mit der Aufgabe (21)aus dem letzten Semester folgt der Widerspruch A′ = A′′.

Damit ist diese Zwischenbehauptung bewiesen. Wir behaupten jetzt, dass mit die-sem Wert von A die Aussage in (d) erfullt ist. Andernfalls existiert ein ε > 0 so,dass fur jedes δ > 0 eine Zerteilung ζ von [a, b] mit δ(ζ) < δ und |R(f ; ζ) − A| ≥ εexistiert. Insbesondere gibt es dann fur jedes n ≥ 1 eine Zerteilung ζn von [a, b] mitδ(ζn) < 1/n und |R(f ; ζn) − A| ≥ ε. Insbesondere ist (δ(ζn))n∈N −→ 0 und es ergibtsich der Widerspruch (R(f ; ζn))n∈N −→ A.(d)=⇒(a). Sei ε > 0. Dann existiert ein δ > 0 mit |R(f ; ζ) − A| < ε/2 fur jedeZerteilung ζ von [a, b] mit δ(ζ) < δ. Wahle eine Zerlegung α von [a, b] mit δ(α) < δ.Nach Lemma 2.(d) existieren Zerteilungen ζ, ζ ′ von [a, b] mit unterliegender Zerlegungα so, dass

S(f ;α)− ε

2< R(f ; ζ) ≤ S(f ;α) und S(f ;α) ≤ R(f ; ζ ′) < S(f ;α) +

ε

2

gelten. Wegen δ(ζ) = δ(ζ ′) = δ(α) < δ folgt

A− ε < R(f ; ζ ′)− ε

2< S(f ;α) ≤

∫ b

a

f(x) dx ≤∫ b

a

f(x) dx ≤ S(f ;α)

< R(f ; ζ) +ε

2< A+ ε.

Da dies fur jedes ε > 0 gilt, ist folglich∫ b

a

f(x) dx =

∫ b

a

f(x) dx = A,

d.h. f ist Rieman-integrierbar mit∫ b

af(x) dx = A.

Im Beweis der Implikation von (d) nach (a) haben wir insbesondere gezeigt, dass die

Konstante A in (d) gleich dem Rieman-Integral∫ b

af(x) dx ist. Außerdem wurde beim

Beweis von (f) nach (d) bewiesen, dass jede der Folgen (R(f ; ζn))n∈N aus (f) gegen das

A aus (d), also gegen∫ b

af(x) dx, konvergiert.

Die folgenden Aussagen sind allesamt Folgerungen aus dem eben bewiesenen Lemma,der Beweis wird eine Ubungsaufgabe sein.

Lemma 2.4: Seien a, b ∈ R mit a < b gegeben und sei f : [a, b] → R eine beschrankteFunktion. Dann gelten:

(a) Ist f Rieman-integrierbar und ist g : [a, b] → R eine weitere Funktion die sich nuran endlich vielen Stellen von f unterscheidet, so ist auch g Rieman-integrierbarmit

∫ b

ag(x) dx =

∫ b

af(x) dx.

63

Page 64: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 29.4.2011

(b) Ist f Rieman-integrierbar und sind c, d ∈ R mit a ≤ c < d ≤ b, so ist auch dieEinschrankung f |[c, d] von f auf [c, d] Rieman-integrierbar.

(c) Ist c ∈ (a, b), so ist f genau dann Rieman-integrierbar wenn die beiden Ein-schrankungen f |[a, c] und f |[c, b] Rieman-integrierbar sind, und in diesem Fallgilt ∫ b

a

f(x) dx =

∫ c

a

f(x) dx+

∫ b

c

f(x) dx.

Beweis: Dies ist wie schon bemerkt eine Ubungsaufgabe.

Weiter ergibt sich:

Lemma 2.5 (Grundeigenschaften des Rieman-Integrals)Seien a, b ∈ R mit a < b und seien f, g : [a, b] → R zwei Rieman-integrierbare Funktio-nen.

(a) Die Funktion f + g ist Rieman-integrierbar mit∫ b

a

(f(x) + g(x)) dx =

∫ b

a

f(x) dx+

∫ b

a

g(x) dx.

(b) Fur jedes c ∈ R ist die Funktion cf : [a, b] → R Rieman-integrierbar mit∫ b

a

cf(x) dx = c ·∫ b

a

f(x) dx.

(c) Gilt f(x) ≤ g(x) fur alle x ∈ [a, b], so ist auch∫ b

a

f(x) dx ≤∫ b

a

g(x) dx.

(d) Der Betrag |f | ist wieder Rieman-integrierbar mit∣∣∣∣∫ b

a

f(x) dx

∣∣∣∣ ≤ ∫ b

a

|f(x)| dx.

Beweis: (a) Ist (ζn)n∈N eine Folge von Zerteilungen von [a, b] mit (δ(ζn))n∈N −→ 0, sogelten nach Lemma 3

limn→∞

R(f ; ζn) =

∫ b

a

f(x) dx und limn→∞

R(g; ζn) =

∫ b

a

g(x) dx.

64

Page 65: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 29.4.2011

Fur jedes n ∈ N gilt offenbar R(f + g; ζn) = R(f ; ζn) + R(g; ζn) und mit den Grenz-wertsatzen fur Folgen I.§6.Satz 6 folgt auch

limn→∞

R(f + g; ζn) =

∫ b

a

f(x) dx+

∫ b

a

g(x) dx.

Mit Lemma 3 folgt die Behauptung.(b) Da fur jede Zerteilung ζ von [a, b] offenbar auch R(cf ; ζ) = cR(f ; ζ) gilt, folgt diesanalog zu (a).(c) Fur jede Zerteilung ζ = (t0, . . . , tn; s1, . . . , sn) von [a, b] gilt

R(f ; ζ) =n∑

k=1

f(sk)(tk − tk−1) ≤n∑

k=1

g(sk)(tk − tk−1) = R(g; ζ),

und mit Lemma 3 und den Ordnungsregeln fur die Folgenkonvergenz I.§6.Lemma 5.(a)folgt die Behauptung.(d) Sei ε > 0 gegeben. Nach Lemma 3 existiert eine Zerlegung α = (t0, . . . , tn) von[a, b] mit S(f ;α)−S(f ;α) < ε. Fur jedes 1 ≤ k ≤ n setze mk := inf f([tk−1, tk), Mk :=sup f([tk−1, tk]) und entsprechend fur den Betrag von f seien mk := inf |f |([tk−1, tk])undMk := sup |f |([tk−1, tk]). Wir behaupten dasMk−mk ≤Mk−mk fur alle 1 ≤ k ≤ ngilt.

Sei also 1 ≤ k ≤ n gegeben. Ist mk ≥ 0, so ist 0 ≤ mk ≤ f(x) ≤ Mk fur allex ∈ [tk−1, tk], also ist |f(x)| = f(x) fur x ∈ [tk−1, tk] und somit auch mk = mk,Mk = Mk und die Behauptung ist klar. Nun sei Mk ≤ 0. Dann haben wir fur allex ∈ [tk−1, tk] stets mk ≤ f(x) ≤ Mk ≤ 0, also auch |f(x)| = −f(x) und somitmk = −Mk, Mk = −mk und wir haben erneut Mk−mk = Mk−mk. Im verbleibendenFall ist mk < 0 < Mk. Fur alle x ∈ [tk−1, tk] ist dann wegen mk ≤ f(x) ≤ Mk stets0 ≤ |f(x)| ≤ max{Mk,−mk}, d.h. wir haben mk ≥ 0, Mk ≤ max{Mk,−mk} undsomit ist auch in diesem Fall

Mk −mk ≤ max{Mk,−mk} ≤Mk −mk.

Damit ist diese Zwischenbehauptung bewiesen, und es folgt

S(|f |;α)− S(|f |;α) =n∑

k=1

Mk(tk − tk−1)−n∑

k=1

mk(tk − tk−1)

=n∑

k=1

(Mk −mk)(tk − tk−1) ≤n∑

k=1

(Mk −mk)(tk − tk−1)

= S(f ;α)− S(f ;α) < ε.

Erneut nach Lemma 3 ist der Betrag |f | Rieman-integrierbar. Fur alle x ∈ [a, b] geltenf(x) ≤ |f(x)| und −f(x) ≤ |f(x)|, also haben wir nach (b,c) auch∫ b

a

f(x) dx ≤∫ b

a

|f(x)| dx und −∫ b

a

f(x) dx =

∫ b

a

(−f(x)) dx ≤∫ b

a

|f(x)| dx,

65

Page 66: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 29.4.2011

und folglich ist insgesamt auch∣∣∣∣∫ b

a

f(x) dx

∣∣∣∣ ≤ ∫ b

a

|f(x)| dx.

Damit ist das Lemma vollstandig bewiesen.

Die Ungleichung in Teil (d) des Lemmas wird manchmal auch als die Dreiecksunglei-chung fur Integrale bezeichnet. Bisher kennen wir nur recht wenige Beispiele Rieman-integrierbarer Funktionen. Als letztes Resultat in diesem Abschnitt wollen wir dies dra-stisch andern, und beweisen das jede stetige Funktion Rieman-integrierbar ist. Hierzubenotigen wir einige vorbereitende Beobachtungen. Sind D ⊆ R eine Menge reellerZahlen und f : D → R eine in einem Punkt a ∈ D stetige Funktion, so hatten wir inI.§13.Satz 7 gesehen, dass es fur jedes vorgegebene ε > 0 stets eine Konstante δ > 0gibt so, dass fur alle x ∈ D mit |x − a| < δ stets |f(x) − f(a)| < ε ist, dies war sogaraquivalent zur Stetigkeit in a. Ist f : D → R insgesamt stetig, so haben wir also furalle a ∈ D, ε > 0 ein passendes δ > 0 mit der obigen Eigenschaft, also als Formelgeschrieben

∀(a ∈ D)∀(ε > 0)∃(δ > 0)∀(x ∈ D) : |x− a| < δ =⇒ |f(x)− f(a)| < ε.

Dabei hangt δ = δ(a, ε) normalerweise sowohl vom Punkt a ∈ D als auch von ε > 0ab. Man nennt die Funktion gleichmaßig stetig, wenn man δ = δ(ε) unabhangig vomPunkt a wahlen kann, also

∀(ε > 0)∃(δ > 0)∀(x, y ∈ D) : |x− y| < δ =⇒ |f(x)− f(y)| < ε.

Wir wollen diesen Begriff hier nicht systematisch untersuchen und ihn nicht einmalexplizit definieren. Wir brauchen nur die grundlegende Tatsache das eine auf einembeschrankten, abgeschlossenen Intervall [a, b] definierte stetige Funktion automatischauch gleichmaßig stetig ist. Wir beweisen diese Aussage durch Zuruckfuhrung auf einallgemeines Uberdeckungslemma fur Intervalle. Zur spateren Verwendung in diesemSemester, beweisen wir das folgende Lemma gleich in einer recht allgemeinen Form.Wir werden eine kleine mengentheoretische Notation verwenden, die bisher noch nichtaufgetaucht ist, und jetzt eingefuhrt werden soll.

Wir kennen die Vereinigung A∪B zweier Mengen A und B, dies war die Menge allermathematischen Objekte die in A oder B liegen. Dies dehnen wir auf Vereinigungenvon mehr als zwei Mengen aus. Sind A1, . . . , An Mengen, so sei

n⋃i=1

Ai := A1 ∪ . . . ∪ An = {x|∃(1 ≤ i ≤ n) : x ∈ Ai}

die Menge aller mathematischen Objekte, die in mindestens einer diese Mengen liegen.Entsprechend sind dann auch Durchschnitte von mehr als zwei Mengen definiert.

66

Page 67: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 29.4.2011

Lemma 2.6 (Uberdeckungslemma fur Intervalle)Seien a, b ∈ R mit a < b und sei δ : [a, b] → R>0 eine Funktion. Dann existieren n ∈ Nund Punkte t1, . . . , tn ∈ [a, b] mit

[a, b] ⊆n⋃

i=1

(ti − δ(ti), ti + δ(ti)).

Beweis: Wir betrachten die Menge

M :=

{c ∈ [a, b]

∣∣∣∣∣∃(n ∈ N)∃(t1, . . . , tn ∈ [a, b]) : [a, c] ⊆n⋃

i=1

(ti − δ(ti), ti + δ(ti))

}.

Es ist a ∈ M und b ist eine obere Schranke von M , d.h. wir haben s := supM ∈[a, b]. Wegen [a, a + δ(a)) ∩ [a, b] ⊆ M ist s > a. Damit existiert ein d ∈ M mitd > max{s − δ(s), a}, und weiter existieren n ∈ N und t1, . . . , tn ∈ [a, b] mit [a, d] ⊆⋃n

i=1(ti− δ(ti), ti + δ(ti)). Setzen wir tn+1 := s ∈ [a, b], so ist damit auch [a, s+ δ(s)) ⊆⋃n+1i=1 (ti − δ(ti), ti + δ(ti)). Es folgen s = b und [a, b] ⊆

⋃n+1i=1 (ti − δ(ti), ti + δ(ti)).

Damit konnen wir jetzt die schon angekundigte gleichmaßige Stetigkeit von auf [a, b]definierten stetigen Funktionen nachweisen.

Lemma 2.7 (Gleichmaßige Stetigkeit auf Intervallen)Seien a, b ∈ R mit a < b und sei f : [a, b] → R eine stetige Funktion. Dann gibt es furjedes ε > 0 ein δ > 0 mit |f(x)− f(y)| < ε fur alle x, y ∈ [a, b] mit |x− y| < δ.

Beweis: Ist x ∈ [a, b], so ist f in x stetig, also existiert nach I.§13.Lemma 7 ein δ(x) > 0mit |f(y)− f(x)| < ε/2 fur alle y ∈ [a, b] mit |y − x| < δ(x). Nach Lemma 6 existierenweiter ein n ∈ N und Punkte x1, . . . , xn ∈ [a, b] mit

[a, b] ⊆n⋃

i=1

(xi −

δ(xi)

2, xi +

δ(xi)

2

),

und wir setzen

δ :=1

2min{δ(x1), . . . , δ(xn)} > 0.

Seien jetzt x, y ∈ [a, b] mit |y − x| < δ gegeben. Dann existiert ein 1 ≤ i ≤ n mit|x− xi| < δ(xi)/2. Damit ist auch

|y − xi| ≤ |y − x|+ |x− xi| < δ +δ(xi)

2≤ δ(xi)

und somit sind |f(y)− f(xi)| < ε/2 und |f(x)− f(xi)| < ε/2. Es folgt |f(y)− f(x)| ≤|f(x)− f(xi)|+ |f(y)− f(xi)| < ε.

67

Page 68: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 4.5.2011

Wir haben bereits gesehen, dass eine beschrankte Funktion genau dann Rieman-integrierbar ist, wenn sich ihre Ober- und Untersummen beliebig nahe kommen. Wirwerden jetzt die gleichmaßige Stetigkeit verwenden, um dies fur stetige Funktionenf : [a, b] → R nachzuweisen.

Satz 2.8 (Stetige Funktionen sind Rieman-integrierbar)Seien a, b ∈ R mit a < b und f : [a, b] → R eine stetige Funktion. Dann ist f auch

Rieman-integrierbar.

Beweis: Nach I.§13.Satz 13 ist f uberhaupt beschrankt. Sei ε > 0 gegeben. NachLemma 7 existiert ein δ > 0 mit |f(y) − f(x)| < ε/(2(b − a)) fur alle x, y ∈ [a, b] mit|y − x| < δ. Sei α = (t0, . . . , tn) eine Zerlegung von [a, b] mit δ(α) < δ. Sei 1 ≤ i ≤ n.Sei x ∈ [ti−1, ti]. Fur alle y ∈ [ti−1, ti] ist dann |y − x| ≤ ti − ti−1 ≤ δ(α) < δ, also|f(y)− f(x)| < ε/(2(b− a)) und somit f(y) ≤ f(x) + ε/(2(b− a)). Folglich ist

Mi := supy∈[ti−1,ti]

f(y) ≤ f(x) +ε

2(b− a).

Fur jedes x ∈ [ti−1, ti] ist damit f(x) ≥Mi − ε/(2(b− a)), also haben wir auch

mi := infx∈[ti−1,ti]

f(x) ≥Mi −ε

2(b− a), also Mi −mi ≤

ε

2(b− a).

Es folgt

S(f ;α)− S(f ;α) =n∑

i=1

(Mi −mi)(ti − ti−1) ≤n∑

i=1

ε

2(b− a)(ti − ti−1) =

ε

2< ε,

und nach Lemma 3 ist f auch Rieman-integrierbar.

2.2 Der Hauptsatz der Differential und Integralrechnung

Vorlesung 6, Mittwoch 4.5.2011

In der letzten Sitzung hatten wir unter anderem gezeigt, dass stetige Funktionen f :[a, b] → R immer Rieman-integrierbar sind. Da wir außer dem Rieman-Integral keinenweiteren Integralbegriff eingefuhrt haben, werden wir im Folgenden oft auch einfachvon

”integrierbaren Funktionen“ und ihrem

”Integral“ sprechen wenn wir

”Rieman-

integrierbare Funktionen“ und ihr”Rieman-Integral“ meinen. Aus der Integrierbarkeit

68

Page 69: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 4.5.2011

stetiger Funktionen folgt zusammen mit Lemma 4 auch die Integrierbarkeit”stuckweise

stetiger“ Funktionen. Schauen wir uns als ein Beispiel die Funktion

f : [−1, 1] → R;x 7→

{cosx, x ≤ 0,

x, x > 0

an. Zunachst ist die Einschrankung f |[−1, 0] stetig, also auch integrierbar. Weiter un-terscheidet sich f |[0, 1] nur im Nullpunkt von einer stetigen Funktion ist also ebenfallsintegrierbar. Insgesamt ist damit auch f selbst integrierbar. Derartige Argumente wer-den wir im Folgenden meist nicht explizit ausfuhren, und sie als bekannt ansehen.

Der sogenannte Hauptsatz der Differential und Integralrechnung stellt eine Ver-bindung zwischen Integration und Ableitungen her, und ermoglicht insbesondere dieBerechnung einer grossen Zahl von Integralen. Bevor wir den Hauptsatz formulierenist es bequem unsere Integralnotation ein klein wenig zu erweitern. Bisher haben wir∫ b

af(x) dx nur definiert wenn a < b gilt, in vielen Fallen ist diese Einschrankung aber

etwas unpraktisch. Daher erweitern wir den Integralbegriff jetzt auf beliebige Kombi-nationen von oberer und unterer Integrationsgrenze.

Definition 2.5: Seien I ⊆ R ein Intervall und a, b ∈ I mit a < b. Weiter sei f : I → Reine Funktion, die uber [a, b] Rieman-integrierbar ist. Dann definieren wir∫ a

b

f(x) dx := −∫ b

a

f(x) dx.

Außerdem setzen wir noch ∫ a

a

f(x) dx := 0

fur jedes a ∈ I.Fur a < b < c haben wir gemaß Lemma 4.(c) fur eine auf [a, c] Rieman-integrierbare

Funktion f ∫ c

a

f(x) dx =

∫ b

a

f(x) dx+

∫ c

b

f(x) dx.

Man kann sich leicht uberlegen, dass dies allgemein fur alle moglichen Anordnungenvon a, b, c gilt, der Beweis ist eine Fallunterscheidung bei der alle moglichen Situationeneinfach durchgegangen werden und auf den obigen Hauptfall zuruckgefuhrt werden.Wir wollen hier darauf verzichten dies vorzumachen. Auch die Aussagen des Lemma 5gelten großtenteils weiter. Teile (a,b) des Lemmas∫ b

a

(f(x) + g(x)) dx =

∫ b

a

f(x) dx+

∫ b

a

g(x) dx und

∫ b

a

cf(x) dx = c ·∫ b

a

f(x) dx

gelten bei beliebiger Anordnung von a, b weiter. Teil (c) nimmt die Form

f(x) ≤ g(x) fur alle x zwischen a und b

=⇒ sign(b− a)

∫ b

a

f(x) dx ≤ sign(b− a)

∫ b

a

g(x) dx

69

Page 70: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 4.5.2011

an und der letzte Teil (d) wird zu∣∣∣∣∫ b

a

f(x) dx

∣∣∣∣ ≤ sign(b− a)

∫ b

a

|f(x)| dx.

Sind I ⊆ R ein Intervall und f : I → R eine stetige Funktion, so ist∫ b

af(x) dx nach

Satz 8 fur alle a, b ∈ I definiert, und wir haben den nun zu formulierenden Hauptsatz.

Satz 2.9 (Hauptsatz der Differential und Integralrechnung)Seien I ⊆ R ein Intervall, a ∈ I und f : I → R eine stetige Funktion. Dann ist dieFunktion

F : I → R;x 7→∫ x

a

f(t) dt

differenzierbar mit Ableitung F ′ = f und es ist F (a) = 0. Weiter gilt∫ c

b

f(x) dx = F (c)− F (b)

fur alle b, c ∈ I.

Beweis: Wir beginnen mit der letzten Behauptung. Sind b, c ∈ I, so haben wir

F (c)− F (b) =

∫ c

a

f(x) dx−∫ b

a

f(x) dx

=

∫ b

a

f(x) dx+

∫ c

b

f(x) dx−∫ b

a

f(x) dx =

∫ c

b

f(x) dx.

Die Aussage F (a) =∫ a

af(x) dx = 0 ist klar. Es verbleibt also nur noch F ′ = f nach-

zuweisen. Sei x ∈ I gegeben. Sei ε > 0. Da f in x stetig ist, gibt es nach I.§13.Lemma7 ein δ > 0 mit |f(y) − f(x)| < ε/2 fur alle y ∈ I mit |y − x| < δ. Sei h ∈ R mit0 < |h| < δ und x + h ∈ I. Fur alle t ∈ R zwischen x und x + h sind auch t ∈ I und|t− x| ≤ |h| < δ, also |f(t)− f(x)| < ε/2. Mit Lemma 5 folgt∣∣∣∣F (x+ h)− F (x)

h− f(x)

∣∣∣∣ =1

|h|

∣∣∣∣∫ x+h

x

f(t) dt−∫ x+h

x

f(x) dt

∣∣∣∣=

1

|h|

∣∣∣∣∫ x+h

x

(f(t)− f(x)) dt

∣∣∣∣ ≤ sign(h)

|h|

∫ x+h

x

|f(t)− f(x)| dt

≤ sign(h)

|h|

∫ x+h

x

ε

2dx =

ε

2< ε.

Nach I.§13.Lemma 1.(f) zeigt dies

F ′(x) = limh→0

F (x+ h)− F (x)

h= f(x),

70

Page 71: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 4.5.2011

d.h. die Funktion F ist in x differenzierbar mit der Ableitung f(x).

Ist eine Funktion f gegeben so nennt man eine differenzierbare Funktion F mit F ′ = fauch eine Stammfunktion von f . Nach dem Hauptsatz Satz 9 hat jede stetige Funktioneine Stammfunktion. Insbesondere gibt es beispielsweise eine Stammfunktion F der aufganz R definierten Funktion f(x) = ex2

, namlich

F (x) =

∫ x

0

et2 dt.

In diesem Beispiel kann man beweisen, dass es nicht moglich ist die Funktion F alseine Formel in Termen der ublichen Grundfunktionen hinzuschreiben. Trotzdem gibtes die Stammfunktion F , man hat halt nur keine direkte Formel dafur.

Kommen wir zu allgemeinen stetigen Funktionen f zuruck, und wir wissen bereitsdas diese immer Stammfunktionen haben. Es gibt sogar immer mehrere Stammfunk-tionen, denn ist F eine Stammfunktion von f , so ist fur jede Konstante c auch F + ceine Stammfunktion von f . Mehr Stammfunktionen gibt es dann nicht, denn je zweiStammfunktionen einer Funktion f unterscheiden sich nach §1.Lemma 1 nur um eineadditive Konstante. Damit erhalten wir die folgende Aussage uber Stammfunktionenstetiger Funktionen.

Korollar 2.10 (Stammfunktionen stetiger Funktionen)Seien I ⊆ R ein Intervall und f : I → R eine stetige Funktion. Dann hat f eine

Stammfunktion. Sind F eine Stammfunktion von f und a ∈ I, so existiert eine Kon-stante c ∈ R mit F (x) =

∫ x

af(t) dt+ c fur alle x ∈ I. Fur jede Stammfunktion F von

f und alle a, b ∈ I gilt∫ b

af(x) dx = F (b)− F (a).

Beweis: Die erste Aussage gilt nach Satz 9 und die zweite folgt aus der Eindeutigkeitkeitvon Stammfunktionen bis auf eine additive Konstante. Sind schließlich F eine Stamm-funktion von f und a, b ∈ I, so existiert eine Konstante c ∈ R mit F (x) =

∫ x

af(t) dt+c

fur alle x ∈ I. Es folgt∫ b

a

f(x) dx =

∫ b

a

f(x) dx+ c− c = F (b)− F (a).

Wir konnen also unsere Liste von Ableitungen durchgehen und erhalten aus diesen For-meln fur Integrale. Starten wir einmal mit

∫ b

axn dx fur a, b ∈ R, n ∈ Z. Die Ableitung

einer Potenz xn ist nxn−1, und damit folgt∫ b

a

xn dx =bn+1 − an+1

n+ 1fur n 6= −1.

Im Fall n < 0 darf dabei 0 nicht zwischen a und b liegen, also sign(a) = sign(b) 6= 0.Diese Formel deckt nicht den Fall n = −1, also die Funktion 1/x ab, aber auch fur

71

Page 72: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 4.5.2011

diese kennen wir bereits eine Stammfunktion, namlich den Logarithmus. Fur n = −1und a, b > 0 haben wir also∫ b

a

dx

x= ln b− ln a = ln

(b

a

).

Die Beschrankung des moglichen Integrationsbereichs ist dabei notig, da der Logarith-mus ja nur fur positive Argumente existiert. Den Fall a, b < 0 kann man aber auchleicht behandeln, die Funktion x 7→ ln(−x) ist auf R<0 definiert und hat die Ableitung−1/(−x) = 1/x, also gilt fur a, b < 0∫ b

a

dx

x= ln(−b)− ln(−a) = ln

(−b−a

)= ln

(b

a

).

Allgemeine Potenzen, also xα mit einer reellen Zahl α, sind uberhaupt nur fur positivex definiert, und damit konnen wir auch nur Integrale im positiven Bereich bilden. DieFormel ist aber genauso wie diejenige fur xn∫ b

a

xα dx =bα+1 − aα+1

α+ 1fur α 6= −1, a, b > 0.

Die Ableitung einer Potenzfunktion αx war gerade lnα · αx, und dies ergibt∫ b

a

αx dx =αb − αa

lnαfur α > 0, α 6= 1.

Kommen wir nun zu den trigonometrischen Funktionen. Die Ableitung des Cosinus istminus Sinus, eine Stammfunktion von sinx ist damit − cosx, und somit∫ b

a

sin x dx = cos a− cos b.

Hier das Vorzeichen zu vergessen ist eine der ergiebigsten Fehlerquellen bei der konkre-ten Berechnung von Integralen. Dagegen ist der Cosinus die Ableitung des Sinus, undwir haben ∫ b

a

cosx dx = sin b− sin a.

Eine Stammfunktion des Tangens ist in unseren Listen dagegen nicht aufgetaucht,daher mussen wir die Behandlung von Tangens Integralen kurz zuruckstellen. Bei un-seren Ableitungen haben wir noch zwei weitere wichtige Funktionen, es sind arcsin′ x =1/√

1− x2 und arctan′ x = 1/(1 + x2), und damit∫ b

a

dx

1 + x2= arctan b− arctan a,

∫ b

a

dx√1− x2

= arcsin b− arcsin a

letzteres fur |a|, |b| < 1. Kommen wir zum Tangens. Es ist tan x = sinx/ cosx und hiersteht im Zahler abgesehen vom Vorzeichen gerade die Ableitung des Nenners. Diese

72

Page 73: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 4.5.2011

Situation kommt erstaunlich haufig vor und wir konnen sofort eine Stammfunktionhinschreiben. Ist f : I → R eine stetig differenzierbare Funktion mit f(x) > 0 fur allex ∈ I, so ist auch ln f differenzierbar mit

d

dxln(f(x)) =

f ′(x)

f(x)

also gilt ∫ b

a

f ′(x)

f(x)dx = ln(f(b))− ln(f(a)) = ln

(f(b)

f(a)

)fur alle a, b ∈ I. Fur eine negative Funktion ist entsprechend x 7→ ln(−f(x)) eineStammfunktion von f ′/f und es ergibt sich wieder die obige Formel. Man kann beideFalle zusammenfassen und dann ist x 7→ ln |f(x)| eine Stammfunktion von f ′/f . Wen-den wir dies speziell auf den Tangens an, so folgt fur alle a, b ∈ R mit |a|, |b| < π/2 dieGleichung∫ b

a

tan x dx = −∫ b

a

− sin x

cosxdx = −(ln(cos b)− ln(cos a))

= ln(cos a)− ln(cos b) = ln(cos a

cos b

).

Bisher haben wir konsequent nur Integrale∫ b

af(x) dx behandelt. Oft findet man auch

sogenannte unbestimmte Integrale, dies sind Ausdrucke der Form∫f(x) dx oder

∫f(x) dx+ C.

Gemeint ist hiermit einfach eine Stammfunktion der Funktion f . Welche der beiden obi-gen Formen man verwendet ist eine reine Geschmacksfrage, sie bedeuten beide dasselbe,namlich

”Stammfunktion“. Die zweite Variante mit dem expliziten

”C“ soll verdeut-

lichen das die Stammfunktion nur bis auf eine additive Konstante festgelegt ist. DasIntegral

∫ b

af(x) dx nennt man in diesem Zusammenhang dann auch ein bestimmtes

Integral.Die Schreibweisen

∫f(x) dx fur das unbestimmte und

∫ b

af(x) dx fur das bestimmte

Integral sehen zwar sehr ahnlich aus, inhaltlich unterscheiden sich diese beiden abergrundlegend voneinander. Das bestimmte Integral

∫ b

af(x) dx ist ein ganz reales Objekt,

namlich einfach eine reelle Zahl, und die sogenannte Integrationsvariable”x“ hat eine

rein formale Bedeutung. Wie beim Laufindex in der Summenschreibweise gibt es keinwirkliches

”x“, es kann kein

”x“ außerhalb des Integrals vorkommen. Außerdem kann

man es vollig willkurlich umbenennen∫ b

af(x) dx =

∫ b

af(y) dy =

∫ b

af(θ) dθ und so

weiter.Das unbestimmte Integral

∫f(x) dx ist dagegen gar kein wirkliches Objekt, sondern

nur eine Schreibweise, eben ein Synonym fur das Wort”Stammfunktion“. Nichtsdesto-

trotz ist es eine sehr verbreitete, und auch durchaus nutzliche, Schreibweise. Worauf

73

Page 74: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 4.5.2011

man etwas aufpassen muss ist, dass das Symbol”x“ hier eine vollig andere Funkti-

on als beim bestimmten Integral hat. Die Formel∫

cosx dx = sinx + C ist vollig inOrdnung und meint das sinx eine Stammfunktion von cosx ist,

”x“ steht hier also

fur das Argument der Funktion. Wenn man hier im Integral einen anderen Buchsta-ben verwendet, so muss man dies auch außerhalb des Integrals tun, also beispielsweise∫

cos y dy = sin y+C schreiben. Dies ist eine der wenigen Stellen an denen freie Varia-blen vorkommen die nicht strikt in einer Formel gebunden sind.

Huten sollten Sie sich dagegen vor dem in der Schule erstaunlich popularen Geredewie

”Aufleitung“,

”Integration ist die Umkehrung der Differentation“ und so weiter.

Diese Sprechweisen sind hochgradig irrefuhrend und betonen den falschen Aspekt. Dasssich Integrale uber Stammfunktion berechnen lassen ist eine, beziehungsweise die, Me-thode zu ihrer Berechnung, aber nicht die Definition eines Integrals, und zwar wederdie formale noch eine heuristische.

Spater werden Sie einmal Dinge wie Intergrale uber Flachen in der Ebene oder imRaum, Integrale uber Volumina im Raum, und so weiter kennenlernen. All diese Din-ge sind anschaulich direkte Verallgemeinerungen unseres eindimensionalen Integrals.Wenn Sie beispielsweise ein Integral uber eine Flache bilden wollen, zerlegen Sie halt dieFlache in kleine Rechtecke und nahern die Funktion durch Quader uber diesen Recht-ecken an. Dann hat man wieder Unter- und Obersummen und alles funktioniert wie imeindimensionalen Fall. Diese hoherdimensionalen Integrale sind also genau dasselbe wiedas normale, eindimensionale Integral, und wenn Sie letzteres verstanden haben bietendie anderen keine wirklich neuen Probleme. Die Vorstellung des Umkehrens der Diffe-rentation bricht dagegen zusammen, sie ist eben wirklich nur eine Rechentechnik imeindimensionalen Fall, und bei Integralen in mehreren Variablen gibt es nur bestimmteIntegrale. In anderen Worten dienen Stammfunktionen dazu Integrale zu berechnen,und nicht dazu um zu sagen was Integrale sind.

Wir konnen jetzt unsere obige Liste von Integralen auch in Termen unbestimmterIntegrale aufschreiben:∫

xn dx =xn+1

n+ 1,

∫dx

x= ln |x|,

∫xα dx =

xα+1

α+ 1,

∫αx dx =

αx

lnα,∫

sin x dx = − cosx,

∫cosx dx = sinx,

∫tan x dx = − ln | cosx|

und ∫dx√

1− x2= arcsinx,

∫dx

1 + x2= arctan x.

Die ersten beiden Teile von Lemma 5 werden zu∫f(x) + g(x) dx =

∫f(x) dx+

∫g(x) dx und

∫cf(x) dx = c

∫f(x) dx.

Wir wollen noch die Stammfunktionen der noch nicht behandelten Grundfunktio-nen berechnen, diese werden sich uber Anwendung von Aufgabe (12) ergeben. Sind

74

Page 75: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 4.5.2011

a, b, c, d ∈ R mit a < b und c < d und ist f : [a, b] → [c, d] eine streng monotonsteigende, bijektive Funktion, so sagt diese Aufgabe dass die Formel∫ b

a

f(x) dx+

∫ d

c

f−1(x) dx = bd− ac

gilt. Fur x ∈ [a, b] konnen wir diese Formel auf f |[a, x] anwenden und erhalten∫ x

a

f(t) dt+

∫ f(x)

c

f−1(t) dt = xf(x)− ac.

Fur x ∈ [c, d] konnen wir dies auf f−1(x) statt x anwenden, und es ergibt sich∫ f−1(x)

a

f(t) dt+

∫ x

c

f−1(t) dt = xf−1(x)− ac.

Dies zeigt

Lemma 2.11 (Stammfunktionen von Umkehrfunktionen)Seien I, J ⊆ R zwei Intervalle und f : I → J eine streng monoton steigende, bijektiveFunktion. Weiter sei F eine Stammfunktion von f . Dann ist

G : J → R;x 7→ xf−1(x)− F (f−1(x))

eine Stammfunktion von f−1.

Beweis: Klar nach der eben hergeleiteten Formel.

Gehen wir einige Beispiele durch:

1. Sind f = tan : (−π/2, π/2) → R mit F (x) = − ln(cosx), so wird

G(x) = x arctanx+ ln(cos(arctan x)),

und wegen

1 + x2 = 1 + tan2(arctanx) =1

cos2(arctanx), cos(arctanx) > 0

ist

cos(arctanx) =1√

1 + x2

fur alle x ∈ R. Dies ergibt∫arctanx dx = x arctanx− 1

2ln(1 + x2).

2. Diesmal sei f = sin : (−π/2, π/2) → (−1, 1) mit F (x) = − cosx, also∫arcsinx dx = x arcsinx+ cos(arcsin x) = x arcsinx+

√1− x2.

3. Als letztes Beispiel verwenden wir f = exp : R → R>0 mit F = f = exp. Es wird∫lnx dx = x lnx− exp(lnx) = x lnx− x.

75

Page 76: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 4.5.2011

2.3 Die Integrationsregeln

Wir haben nun schon einige Integrale berechnet und insbesondere die Stammfunktionender verschiedenen Grundfunktionen bestimmt. Das weitere Vorgehen zur Berechnungallgemeinerer Integrale ist ganz ahnlich wie es bei der Behandlung von Ableitungen imletzten Semester war. Dort hatten wir die Ableitungen der Grundfunktionen bestimmtund Rechenregeln fur Ableitungen hergeleitet, also die Produktregel, Quotientenregel,Kettenregel und so weiter, die es uns erlaubten die Ableitungen von aus den Grund-funktionen zusammengesetzten Funktionen zu berechnen. Fur Integrale werden wirentsprechende Integrationsregeln herleiten. Diese sind nicht ganz so vollstandig wiediejenigen fur Ableitungen und entsprechend ist die Berechnung von Integralen etwaskomplizierter als die von Ableitungen.

In gewissen Sinne reichen auch die Regeln fur Integrale vollig aus, es gibt einenAlgorithmus der zu einer durch Formeln gegebenen Funktion entscheiden kann ob auchdie Stammfunktion sich durch explizite Formeln beschreiben laßt und in diesem Falleine solche Formel bestimmt, den sogenannten Risch Algorithmus. Wenn man so willist die Berechnung von Stammfunktionen also ein triviales Problem, der Algorithmusist aber leider so aufwandig das er sich nicht vernunftig per Hand durchfuhren laßt.Fur Computer ist er kein Problem, und er ist in diversen Programmen implementiert.

Kommen wir jetzt zu den angekundigten Integrationsregeln, es ist einmal eine Regelfur Produkte, die sogenannte partielle Integration, und einmal eine Regel fur Hinterein-anderausfuhrungen, die sogenannte Substitutionsregel. Wir werden diese beiden Regelnaus den entsprechenden Ableitungsregeln herleiten. Dies ist einfach und fur uns volligausreichend, es gibt aber auch andere Zugange die etwas bessere Ergebnisse liefern.Wir beginnen mit der partiellen Integration.

Satz 2.12 (Partielle Integration)Seien I ⊆ R ein Intervall und f, g : I → R zwei stetig differenzierbare Funktionen.

Weiter seien a, b ∈ I. Dann gilt∫ b

a

f ′(x)g(x) dx = f(b)g(b)− f(a)g(a)−∫ b

a

f(x)g′(x) dx.

Beweis: Nach der Produktregel fur Ableitungen haben wir

(fg)′ = f ′g + fg′,

und mit dem Hauptsatz der Differential und Integralrechnung Satz 9 folgt

f(b)g(b)− f(a)g(a) =

∫ b

a

(fg)′(x) dx =

∫ b

a

(f ′(x)g(x) + f(x)g′(x)) dx

=

∫ b

a

f ′(x)g(x) dx+

∫ b

a

f(x)g′(x) dx.

76

Page 77: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 4.5.2011

Damit ist der Satz vollstandig bewiesen.

Da die Differenzen f(b)− f(a) in diesem Zusammenhang so haufig auftauchen, fuhrtman fur diese die Abkurzung

f

∣∣∣∣ba

:= f(b)− f(a)

ein. In der typischen Anwendung der partiellen Integration haben Sie ein Integral∫ b

a

f(x)g(x) dx

zu berechnen, und suchen erst eine Stammfunktion u(x) von f(x). Schreiben wir nochv := g, so haben wir u′ = f , und das obige Integral wird zu∫ b

a

u′v = u · v∣∣∣ba−∫ b

a

uv′.

Welcher der beiden Faktoren als u und welcher als v verwendet wird, hangt von derspeziellen Situation ab. Zum einen muss das Integral

∫uv′ irgendwie

”einfacher“ als

das ursprungliche Integral sein, und zum anderen mussen wir uberhaupt in der Lagesein, eine Stammfunktion des als u′ gewahlten Faktors zu finden.

Wenn wir wollen, konnen wir die Produktregel auch fur unbestimmte Integrale, alsofur Stammfunktionen formulieren. Wahlen wir irgendeinen Punkt a ∈ I, so haben wirfur jedes x ∈ I stets∫ x

a

f ′(t)g(t) dt = f(x)g(x)− f(a)g(a)−∫ x

a

f(t)g′(t) dt,

und da f(a)g(a) nur eine Konstante ist, konnen wir dies als∫f ′(x)g(x) dx = f(x)g(x)−

∫f(x)g′(x) dx

schreiben. Erinnern Sie sich hierzu daran, dass in der Notation des unbestimmtenIntegrals das

”x“ fur das Funktionsargument steht, also auch wie hier außerhalb des

Integrals auftauchen kann. Nehmen wir als ein Beispiel einmal∫x cosx dx

Hier ist die Wahl von u und v ziemlich naheliegend, durch Ableiten wird die Funktionx zu 1 und verschwindet somit, d.h. wir sollten wohl v(x) = x verwenden. Fur denanderen Faktor cos x sehen wir die Stammfunktion u(x) = sinx, und rechnen somit∫

x cosx dx = x sin x−∫

sin x dx = x sin x+ cosx.

77

Page 78: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 6.5.2011

Fur die bestimmten Integrale wird diese Rechnung zu∫ b

a

x cosx dx = b sin b− a sin a+ cos b− cos a.

Gelegentlich erfordert die Anwendung der partiellen Integration das wir den Integran-den etwas umformen, um ihn uberhaupt als Produkt zu schreiben. Ein einfaches solchesBeispiel ist die Stammfunktion des Logarithmus

∫lnx dx. Diese ist uns zwar schon be-

kannt, wir wollen sie aber noch einmal mittels partieller Integration berechnen. Hierschreiben wir ln x = 1 · lnx, nehmen x als Stammfunktion der konstanten Funktion 1,und leiten lnx zu 1/x ab. Damit wird erneut∫

lnx dx = x lnx−∫x · 1

xdx = x lnx− x.

Ein weiterer Typ der Anwendung der Produktregel wird durch das folgende Beispieldokumentiert, wir wollen

∫ex sin x dx rechnen. Diesmal wollen wir dies fur bestimmte

Integrale vorfuhren∫ b

a

ex sin x dx = eb sin b− ea sin a−∫ b

a

ex cosx dx

= eb sin b− ea sin a− eb cos b+ ea cos a−∫ b

a

ex sin x dx.

Hier scheinen wir zunachst nichts gewonnen zu haben, wir sind ja wieder bei demIntegral angelangt bei dem wir gestartet sind. Wir konnen dies aber auch als eineglucklicherweise sehr einfach zu losende Gleichung fur dieses Integral ansehen, dennbringen wir die beiden Integrale auf eine Seite so wird 2

∫ b

aex sin x dx = eb sin b −

ea sin a− eb cos b+ ea cos a und wir erhalten∫ b

a

ex sin x dx =1

2

(eb(sin b− cos b) + ea(cos a− sin a)

),

beziehungsweise ∫ex sin x dx =

1

2ex(sinx− cosx)

fur das unbestimmte Integral.

Vorlesung 7, Freitag 6.5.2011

In der letzten Sitzung hatten wir die partielle Integration besprochen und auch einigeBeispiele gerechnet. Dabei hatten wir die drei typischen Rechentechniken bei Anwen-dung der partiellen Integration gesehen, namlich:

78

Page 79: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 6.5.2011

1. Direktes Einsetzen, wie im Beispiel∫x cosx dx.

2. Trickreiches Herstellen einer Produktform, wie im Beispiel∫

lnx dx.

3. Herleiten einer Gleichung fur das gesuchte Integral durch in der Regel mehrfacheAnwendung der Produktregel wie im Beispiel

∫ex sin x dx.

Wir kommen jetzt zur zweiten und vielleicht noch wichtigeren Integrationsregel, diesogenannte Substitutionsregel, die man aus der Kettenregel gewinnen kann.

Satz 2.13 (Substitutionsregel)Seien I, J ⊆ R zwei Intervalle, ϕ : J → I eine stetig differenzierbare Funktion undf : I → R eine stetige Funktion. Dann gilt fur alle a, b ∈ J die Gleichung∫ b

a

f(ϕ(x))ϕ′(x) dx =

∫ ϕ(b)

ϕ(a)

f(x) dx.

Beweis: Sei F : I → R eine Stammfunktion von f . Dann gilt (F ◦ϕ)′ = (F ′ ◦ϕ) ·ϕ′ =(f ◦ ϕ) · ϕ′, und der Hauptsatz der Differential und Integralrechnung liefert∫ b

a

f(ϕ(x))ϕ′(x) dx = F (ϕ(b))− F (ϕ(a)) =

∫ ϕ(b)

ϕ(a)

f(x) dx.

Dabei wird der Hauptsatz zuerst auf F ◦ ϕ und dann noch einmal auf f selbst ange-wandt.

Einige einfache Anwendungen sind∫ b

a

xe−x2

dx = −1

2

∫ b

a

(−2x) · e−x2

dx = −1

2

∫ −b2

−a2

ex dx =e−a2 − e−b2

2,

oder ∫ b

a

cosxesin x dx =

∫ sin b

sin a

ex dx = esin b − esin a.

In diesen beiden Beispielen sieht man direkt welche Funktion man als ϕ wahlen sollte,da vor dem Exponentialterm im wesentlichen die Ableitung des Exponenten steht. Eineinfacher, aber besonders wichtiger, Spezialfall ist das Umskalieren des Arguments, unddies meint das die innere Funktion einfach ϕ(x) = ax + b mit a, b ∈ R, a 6= 0 ist. DieSubstitutionsregel erhalt dann die Form∫ v

u

f(ax+ b) dx =1

a

∫ v

u

f(ax+ b) · a dx =1

a

∫ av+b

au+b

f(x) dx.

Fur jedes α ∈ R\{0} erhalten wir damit beispielsweise∫ b

a

sinαx dx =1

α

∫ αb

αa

sin x dx =cosαa− cosαb

α

79

Page 80: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 6.5.2011

und ∫ b

a

cosαt dt =sinαb− sinαa

α.

Fur die unbestimmten Integrale schreibt sich dies als∫sinαx dx = − 1

αcosαx,

∫cosαx dx =

1

αsinαx.

Ein weiterer haufig auftretender Spezialfall sind Integranden der Form f · f ′. Wollenwir ff ′ = (g ◦ ϕ) · ϕ′ schreiben, so konnen wir ϕ = f verwenden und fur g nehmeg(x) = x. Dann haben wir∫ b

a

f(t)f ′(t) dt =

∫ f(b)

f(a)

x dx =1

2(f(b)2 − f(a)2),

und fur unbestimmte Integrale schreibt sich diese Formel als∫f(x)f ′(x) dx =

1

2f(x)2.

Beispielsweise ist damit ∫sin x cosx dx =

1

2sin2 x.

Alternativ konnen wir dies auch uber die trigonometrischen Additionstheoreme einse-hen ∫

sin x cosx dx =1

2

∫sin(2x) dx = −1

4cos(2x) = −1

4+

1

2sin2 x.

Uber diesen Weg lassen sich auch die beiden anderen Produkte von Sinus und Cosinusintegrieren∫

cos2 x dx =

∫1 + cos(2x)

2dx =

x

2+

1

4sin(2x) =

x

2+

1

2sin x cosx

und ∫sin2 x dx =

∫(1− cos2 x) dx = x−

∫cos2 x dx =

x

2− 1

2sin x cosx.

Oft muss zur Anwendung der Substitutionsregel der Integrand zuerst auf die Formf(ϕ(x))ϕ′(x) gebracht werden, wie etwa im folgenden Beispiel. Zu berechnen sei dasunbestimmte Integral ∫ √

a2 − x2 dx

mit einer reellen Konstanten a > 0. Um den Integranden in die Form der Substitu-tionsregel zu bringen, schreibt man dann x = a sin t, und macht die folgende formaleRechnung

dx

dt= a cos t =⇒ dx = a cos t dt.

80

Page 81: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 6.5.2011

Setzt man dies in das Integral ein, so wird∫ √a2 − x2 dx =

∫ √a2 − a2 sin2 t a cos t dt = a2

∫ √cos2 t cos t dt

= a2

∫cos2 t dt =

a2

2(t+ sin t cos t) =

a2

2(t+ sin t ·

√1− sin2 t)

=a2

2

(arcsin

(xa

)+x

a

√1− x2

a2

)=a2

2arcsin

(xa

)+

1

2x√a2 − x2.

Das Teilergebnis∫

cos2 t dt = (t+sin t cos t)/2 hatten wir dabei bereits oben eingesehen.Bevor wir uns klarmachen was diese Rechnung bedeutet und warum sie funktioniert,schauen wir erst einmal nach, ob uberhaupt das richtige Ergebnis herausgekommen ist.Hierzu rechnen wir die Ableitung(

a2 arcsin(xa

)+ x

√a2 − x2

)′=

a√1− x2

a2

+√a2 − x2 − x2

√a2 − x2

=a2

√a2 − x2

+√a2 − x2 − x2

√a2 − x2

= 2√a2 − x2,

und sehen, dass wir tatsachlich eine Stammfunktion von√a2 − x2 berechnet haben.

Uberlegen wir uns nun, wie die obige Rechnung gemeint ist. Wie schon fruher erwahnt,hat das Symbol

”dx“ in einem Integral eine rein formale Bedeutung, es legt zum einen

fest was die Integrationsvariable ist, und zum anderen beendet es den Integralterm. Ins-besondere wird das Paar

∫. . . dx“ syntaktisch wie eine offnende und eine schließende

Klammer behandelt. Es gibt kein reales Objekt dx. In heuristischen Uberlegungen wirddx oftmals als ein kleines Inkrement des Arguments x gedeutet, und dieser Standpunktkann zur Erklarung und Veranschaulichung gewisser Tatsachen durchaus von Nutzensein, aber wir wollen dies nicht verwenden. Insbesondere sind die obigen Rechnungenmit dx und dt nicht wirklich ernst gemeint.

Aber warum fuhren Sie dann zum korrekten Ergebnis? Die Antwort darauf wird dieSubstitutionsregel wie in Satz 13 sein, dies ist aber nicht unmittelbar klar. Uberlegenwir uns also einmal was in der obigen Rechnung geschah. Zu berechnen war ein Integral∫

f(x) dx.

Dann wurde x als eine Funktion von t geschrieben, also x = ϕ(t). Die anschließendeRechnung mit dx und dt wird dann zu

dx

dt= ϕ′(t) =⇒ dx = ϕ′(t) dt.

Daraufhin wurden x = ϕ(t), dx = ϕ′(t) dt in das zu berechnende Integral eingesetzt∫f(x) dx =

∫f(ϕ(t))ϕ′(t) dt

81

Page 82: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 6.5.2011

und rechts taucht hier genau der Integrand aus Satz 13 auf. Um zu sehen was es mitdem finalen Ruckeinsetzen von x fur t auf sich hat, sollte man noch die Integrati-onsgrenzen beachten. Wenn wir f uber [a, b] integrieren muss die rechte Seite uber[ϕ−1(a), ϕ−1(b)] integriert werden. Das unbestimmte Integral, also die Stammfunktion,entsteht indem die obere Integrationsgrenze als Funktionsargument t behandelt wird,und hierfur ϕ−1(x) eingesetzt wird, aber dies bedeutet gerade t als Funktion in x zuschreiben.

Die ganze dx, dt Rechnung ist also wirklich nur eine Notation fur die Anwendung derSubstitutionsregel Satz 13, und es wird in Wahrheit gar nicht mit dx und dt gerechnet.Trotzdem so zu tun macht die Rechnung aber in der Regel einfacher, und daher sollteman sich nicht scheuen diese Rechenmethode zu verwenden.

Ein anderes Beispiel ist das Integral∫dx

1 + ex.

Hier setzen wir t = ex an, und haben

dt

dx= ex = t =⇒ dx =

dt

t

also auch ∫dx

1 + ex=

∫dt

t(1 + t)

Um letzteres Integral zu berechnen, verwenden wir jetzt noch die sogenannte Partial-bruchzerlegung

1

t(t+ 1)=

1

t− 1

t+ 1,

und erhalten∫dx

1 + ex=

∫dt

t−∫

dt

1 + t= ln t− ln(1 + t) = x− ln(1 + ex).

Wegen

(x− ln(1 + ex))′ = 1− ex

1 + ex=

1

1 + ex

ist auch dieses Ergebnis wieder eine korrekte Stammfunktion. Diese Rechnung unter-scheidet sich etwas von unserem Vorgehen im vorigen Beispiel, da wir diesmal t alsFunktion von x und nicht x als Funktion von t schreiben. Dies ist in Wahrheit aberwieder genau dasselbe, anstelle von t = ex konnten wir genausogut x = ln t anset-zen. Insbesondere ist auch diese Rechentechnik wieder nur eine Schreibweise fur dieSubstitutionsregel des Satz 13. Trotzdem gibt es hier eine kleine Feinheit zu beachten.Substituieren wir t = ψ(x), so muss die Funktion ψ umkehrbar sein, wir mussen ja inder Lage sein dies zu x = ϕ(t) umzuschreiben. Streng genommen musste sogar ψ−1

wieder stetig differenzierbar sein, und wir mussten ψ′(x) > 0 oder ψ′(x) < 0 fur alle x

82

Page 83: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 6.5.2011

voraussetzen, aber diese Feinheit spielt in der Regel keine praktische Rolle. Wir wollennoch eine letzte kleine Anmerkung zur Substitutionsregel machen. Der letzte Schrittbei der Berechnung eines unbestimmten Integrals mittels der Substitutionsregel ist das

”Rucksubstituieren“ also das Ersetzen von t durch eine Funktion in x. Bei der Berech-

nung bestimmter Integrale ist dieses Einsetzen aber nicht notig. Zum Beispiel habenwir in unserem obigen Beispiel∫ ln 2

0

dx

1 + ex=

∫ 2

1

dt

t(t+ 1)= ln t

∣∣∣21− ln(1 + t)

∣∣∣21

= ln 2− ln 3 + ln 2 = ln

(4

3

).

Die Anderung der Grenzen bei Substitution ist dabei wie in Satz 13 angegeben, wennx von x = 0 bis x = ln 2 lauft, so durchlauft t = ex die Werte von t = e0 = 1 bist = eln 2 = 2.

Wir wollen nun noch ein allerletztes Beispiel unbestimmter Integrale besprechen,namlich die Integrale ∫

cos2n x dx

mit n ∈ N. Hierbei wird ein neues Phanomen auftreten, das wir bisher noch nichtgesehen haben, wir konnen das Integral nicht geschlossen ausrechnen, sondern werdennur eine Rekursionsformel fur diese Integrale herleiten. Im kleinen Fall n = 1, also∫

cos2 x dx haben wir bereits weiter oben∫cos2 x dx =

x

2+

1

2sin x cosx

gesehen. Nun nehme n > 1 an. Mit partieller Integration rechnen wir dann∫cos2n x dx = sinx cos2n−1 x+ (2n− 1)

∫sin2 x cos2n−2 x dx

= sinx cos2n−1 x+ (2n− 1)

∫cos2(n−1) x dx− (2n− 1)

∫cos2n x dx.

Diese Situation kennen wir schon, wir konnen diese Formel als eine Gleichung fur∫cos2n x dx auffassen, und diese durch∫

cos2n x dx =1

2nsin x cos2n−1 x+

(1− 1

2n

)∫cos2(n−1) x dx

auflosen. Dies ist leider keine explizite Formel, sondern nur eine Rekursionsformel furdiese Integrale. Kennen wir bereits das Integral

∫cos2(n−1) x dx fur n − 1 statt n, so

erlaubt es diese Formel auch das Integral∫

cos2n x dx fur n selbst auszurechnen. Da wirden Fall n = 1 kennen, konnen wir durch einmalige Anwendung der Formel

∫cos4 x dx

berechnen, durch nochmalige Anwendung kriegen wir∫

cos6 x dx, durch erneute An-wendung

∫cos8 x dx, und immer so weiter. Mit hinreichend viel Geduld konnen wir

also jedes der fraglichen Integrale berechnen.

83

Page 84: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 6.5.2011

Die Rekursionsformel erlaubt es uns immerhin die prinzipielle Gestalt des Integrals∫cos2n x dx zu erkennen. Wir starten fur

∫cos2 x dx mit einem linearen Term x/2

plus sinx cosx mal 1/2. In jedem weiteren Schritt kommt dann ein Vielfaches vonsin x cos2n−1 x = sinx cosx · cos2(n−1) x hinzu. Wegen cos2(n−1) x = (cos2 x)n−1 solltedas n-te Integral

∫cos2n x dx die Gestalt

”Linearer Teil“ + sinx · (

”Summe gerader Potenzen von cos x“)

haben. Diese Behauptung konnen wir noch etwas expliziter machen, und auch beweisen,wir behaupten, dass es fur jedes n ∈ N Zahlen An ∈ R und Polynome Φn von Gradn− 1 gibt so, dass ∫

cos2n x dx = Anx+ sinx cosx · Φn(cos2 x)

ist. Fur n = 1 ist dies klar mit A1 = 1/2 und Φ1(x) = 1/2. Ist nun n > 1, undwissen wir bereits das

∫cos2(n−1) x dx die obige Form hat, so haben wir mit unserer

Rekursionsformel auch∫cos2n x dx =

1

2nsin x cos2n−1 x+

(1− 1

2n

)∫cos2(n−1) x dx

=1

2nsin x cosx · (cos2 x)n−1 +

(1− 1

2n

)An−1x+

(1− 1

2n

)sin x cosxΦn−1(cos2 x)

= Anx+ sinx cosx · Φn(x)

wobei wir

An :=

(1− 1

2n

)An−1, Φn(x) :=

1

2nxn−1 +

(1− 1

2n

)Φn−1(x)

setzen. Per Induktion haben wir unsere Aussage damit bewiesen, und wir haben auchexplizite Rekursionsformeln fur die Zahlen An und die Polynome Φn. Die ersten dieserZahlen und Polynome sind

A1 = 12, Φ1(x) = 1

2,

A2 = 34A1 = 3

8, Φ2(x) = 1

4x+ 3

4Φ1(x) = 1

4x+ 3

8,

A3 = 56A2 = 5

16, Φ3(x) = 1

6x2 + 5

6Φ2(x) = 1

6x2 + 5

24x+ 5

16,

und fur unsere Integrale bedeutet dies∫cos2 x dx =

1

2x+

1

2sin x cosx,∫

cos4 x dx =3

8x+ sinx cosx

(1

4cos2 x+

3

8

),∫

cos6 x dx =5

16x+ sinx cosx ·

(1

6cos4 x+

5

24cos2 x+

5

16

).

84

Page 85: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 6.5.2011

2.4 Integration rationaler Funktionen

In diesem Abschnitt wollen wir die Integration rationaler Funktionen diskutieren. Eswird sich herausstellen das sich die Stammfunktionen rationaler Funktionen als expli-zite Formeln hinschreiben lassen, die sich aus rationalen Funktionen, Logarithmen undArcustangens Funktionen zusammensetzen. Viele der einfachen Beispiele kennen wirbereits, namlich∫

dx

x= ln |x|,

∫dx

xn= − 1

n− 1· 1

xn−1(n > 1),

∫dx

1 + x2= arctan x.

Wir werden im folgenden schrittweise immer kompliziertere Typen rationaler Funktio-nen behandeln, bis wir letztendlich alle rationalen Funktionen integrieren konnen. Injedem neuen Schritt werden wir die dabei zu berechnenden Integrale auf die bereitserledigten Falle des vorigen Schritts zuruckfuhren. Dabei starten wir mit den geradeeben aufgelisteten Integralen. Durch Umskalieren erhalten wir aus diesen fur a, b ∈ Rmit a 6= 0 die unbestimmten Integrale∫

dx

ax+ b=

1

aln |ax+ b| und

∫dx

(ax+ b)n= − 1

a(n− 1)· 1

(ax+ b)n−1(n > 1).

Wir kommen jetzt zum nachst komplizierteren Typ rationaler Funktionen, und als einBeispiel wollen wir das unbestimmte Integral∫

x3 − x2 + 2x+ 1

4x2 + 4x+ 1dx

berechnen. Die Berechnung dieses Integrals erfolgt in zwei Schritten, und im erstenSchritt wollen wir es in ein rationales Integral mit demselben Nenner umformen in demder Zahler kleineren Grad als der Nenner hat, also linear ist. Zu diesem Zweck mussenwir uns an die Ihnen schon aus Schulzeiten bekannte Polynomdivision erinnern. Sindzwei Polynome f, g uber K ∈ {R,C} gegeben, so wollen wir das Polynom g eventuellmit Rest durch f teilen. Formal bedeutet dies das wir ein Quotientenpolynom q uberK und ein Restpolynom r uber K suchen so, dass g = qf + r ist wobei der Grad vonr echt kleiner als der Grad von f ist grad(r) < grad(f). Nehmen wir hier den Zahlerg(x) = x3 − x2 + 2x+ 1 und den Nenner f(x) = 4x2 + 4x+ 1 des obigen Integrals, sorechnen wir

x3 − x2 + 2x+ 1 : 4x2 + 4x+ 1 = 14x− 1

2

−(x3 + x2 + 14x)

− 2x2 + 74x+ 1

− (−2x2 − 2x− 12)

154x+ 3

2,

und es ergeben sich Quotient und Rest als

q(x) =1

4x− 1

2, r(x) =

15

4x+

3

2.

85

Page 86: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 6.5.2011

Man kann leicht beweisen das es zu beliebig vorgegebenen Polynomen g, f mit f 6= 0stets eindeutig bestimmte Polynome q, r mit g = qf + r und grad(r) < grad(f) gibt.Dies erlaubt uns bereits eine erste Reduktion in der Integration rationaler Funktionen.Angenommen wir haben eine rationale Funktion f(x) = p(x)/q(x) mit Polynomen p, qwobei q 6= 0 ist. Wir wollen uns klarmachen das es ausreicht den Fall grad(p) < grad(q)zu behandeln. Teilen wir namlich den Zahler p mit Rest durch den Nenner q, schreibenalso p = fq + r mit Polynomen f, r, grad(r) < grad(q), so ist∫

p(x)

q(x)dx =

∫f(x)q(x) + r(x)

q(x)dx =

∫f(x) dx+

∫r(x)

q(x)dx.

Das linke Integral ist die Stammfunktion eines Polynoms, dieses konnen wir also leichtausrechnen und erhalten wieder ein Polynom. Das rechte Integral ist dagegen wiederdas Integral einer rationalen Funktion, aber diesmal ist der Zahlergrad echt kleiner alsder Nennergrad. In unserem Beispiel∫

x3 − x2 + 2x+ 1

4x2 + 4x+ 1dx

wird

x3 − x2 + 2x+ 1

4x2 + 4x+ 1=

(14x− 1

2

)· (4x2 + 4x+ 1) + 15

4x+ 3

2

4x2 + 4x+ 1=

1

4x− 1

2+

154x+ 3

2

4x2 + 4x+ 1

und unter Verwendung von 4x2 + 4x+ 1 = (2x+ 1)2 ist damit∫x3 − x2 + 2x+ 1

4x2 + 4x+ 1dx =

∫ (1

4x− 1

2

)dx+

∫ 154x+ 3

2

(2x+ 1)2dx =

x2

8−x

2+

∫ 154x+ 3

2

(2x+ 1)2dx.

Zur Bestimmung des rechts stehenden Integrals beachte ((2x+1)2)′ = 4(2x+1) = 8x+4.Steuern wir die Form f ′/f an, so wird∫ 15

4x+ 3

2

(2x+ 1)2dx =

15

4

∫x+ 2

5

(2x+ 1)2dx =

15

32

∫8x+ 4− 4

5

(2x+ 1)2dx

=15

32

(ln((2x+ 1)2)− 4

5

∫dx

(2x+ 1)2

)=

15

16ln |2x+ 1|+ 3

16· 1

2x+ 1,

also ist insgesamt∫x3 − x2 + 2x+ 1

4x2 + 4x+ 1dx =

x2

8− x

2+

15

16ln |2x+ 1|+ 3

16· 1

2x+ 1.

Diese Rechnungen legen eine weitere kleine Reduktion nahe. Ein von Null verschiedenesPolynom heißt bekanntlich normiert wenn sein hochster Koeffizient gleich Eins ist, esalso die Form xn+· · · hat. Wir konnen immer erreichen das der Nenner einer rationalenFunktion normiert ist, und durch Herausziehen der fuhrenden Konstante im Zahler

86

Page 87: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 11.5.2011

kann man sich auch auf den Fall beschranken das der Zahler normiert ist. Wir wollenjetzt ganz allgemein unbestimmte Integrale der Form∫

p(x)

(x− a)ndx

berechnen. Dabei sind n ∈ N und p ein beliebiges Polynom. Wir wissen schon, dass wiruns durch eventuelle Polynomdivision auf den Fall grad(p) < n beschranken konnenund wenn wir wollen konnen wir auch p als normiert voraussetzen. Diese Integrale kannman auf verschiedene Weisen berechnen. Die einfachste Methode besteht darin p(x) alsein Polynom in x − a zu schreiben, also ein Polynom p vom selben Grad wie p zufinden das p(x) = p(x− a) erfullt. Man kann p als eine explizite Formel hinschreiben,in I.§13.Lemma 18 haben wir dies sogar fur allgemeine Potenzreihen getan, es ist abermeist einfacher dies direkt zu rechnen. Wie wir solch ein Polynom p berechnen, wollenwir in der nachsten Vorlesung behandeln.

Vorlesung 8, Mittwoch 11.5.2011

Wir sind gerade mit der Integration rationaler Funktionen beschaftigt, und alsnachsten Schritt wollen wir Integrale der Form∫

p(x)

(x− a)ndx

berechnen. Wir haben bereits gesehen, dass wir uns durch Division mit Rest auf denFall grad(p) < n beschranken konnen. Als nachsten Schritt wollen wir den Zahlerp(x) in die Form p(x − a) umschreiben und als ein Beispiel hierzu wollen wir einmalp(x) = x3 + 2x2 + 1 als ein Polynom in x− 1 schreiben. Wegen

(x− 1)2 = x2 − 2x+ 1 =⇒ x2 = (x− 1)2 + 2x− 1

und(x− 1)3 = x3 − 3x2 + 3x− 1 =⇒ x3 = (x− 1)3 + 3x2 − 3x+ 1

ist dann

p(x) = x3 + 2x2 + 1 = (x− 1)3 + 5x2 − 3x+ 2

= (x− 1)3 + 5(x− 1)2 + 7x− 3 = (x− 1)3 + 5(x− 1)2 + 7(x− 1) + 4,

also ist p(x) = p(x− 1) mit p(x) = x3 + 5x2 + 7x+ 4.Kommen wir zum allgemeinen Fall zuruck, und nehme an wir haben schon das

Polynom p(x) = an−1xn−1 + · · ·+ a0 bestimmt. Dann ist

p(x)

(x− a)n=an−1(x− a)n−1 + an−2(x− a)n−2 + · · ·+ a0

(x− a)n

=an−1

x− a+

an−2

(x− a)2+ · · ·+ a0

(x− a)n,

87

Page 88: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 11.5.2011

ein erstes Beispiel der sogenannten Partialbruchzerlegung. Wie wir diese Funktion in-tegrieren konnen wissen wir bereits, und es ergibt sich∫

p(x)

(x− a)ndx = an−1 ln |x− a| − an−2

x− a− · · · − a0

(n− 1)(x− a)n−1.

Zum Beispiel ist damit∫x3 + 2x2 + 1

(x− 1)4dx = ln |x− 1| − 5

x− 1− 7

2(x− 1)2− 4

3(x− 1)3.

Es gibt auch noch einige alternative Rechenwege zum Herstellen der Partialbruchzer-legung von p(x)/(x− a)n. Man kann zum einen x = (x− a)+ a fur x in p(x) einsetzen.Außerdem kann man auch eine mehrfache Polynomdivision durch x − a durchfuhren.Im obigen Beispiel rechnet man

x3 + 2x2 + 1 : x− 1 = x2 + 3x+ 3−(x3 − x2)

3x2 + 1− (3x2 − 3x)

3x+ 1− (3x− 3)

4

x2 + 3x+ 3 : x− 1 = x+ 4−(x2 − x)

4x+ 3− (4x− 4)

7

man teilt also den Zahler x3 + 2x2 + 1 durch x− 1, dann teilt man den so erhaltenenQuotienten wieder durch x−1 und so weiter bis wir zu einer Konstanten kommen. Dieabschließende Divsion von x+ 4 durch x− 1 haben wir weggelassen, diese hat offenbarQuotient 1 und Rest 5. Wir erhalten

x3 + 2x2 + 1 = (x2 + 3x+ 3)(x− 1) + 4 =⇒ x3 + 2x2 + 1

(x− 1)4=x2 + 3x+ 3

(x− 1)3+

4

(x− 1)4,

x2 + 3x+ 3 = (x+ 4)(x− 1) + 7 =⇒ x2 + 3x+ 3

(x− 1)3=

x+ 4

(x− 1)2+

7

(x− 1)3,

x+ 4 = (x− 1) + 5 =⇒ x+ 4

(x− 1)2=

1

x− 1+

5

(x− 1)2,

und haben damit erneut

x3 + 2x2 + 1

(x− 1)4=

1

x− 1+

5

(x− 1)2+

7

(x− 1)3+

4

(x− 1)4.

Eine dritte Moglichkeit ist es die Partialbruchzerlegung mit Unbekannten anzusetzen

x3 + 2x2 + 1

(x− 1)4=

A

x− 1+

B

(x− 1)2+

C

(x− 1)3+

D

(x− 1)4,

88

Page 89: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 11.5.2011

und die rechte Seite auf den Hauptnenner zu bringen

A

x− 1+

B

(x− 1)2+

C

(x− 1)3+

D

(x− 1)4=A(x− 1)3 +B(x− 1)2 + C(x− 1) +D

(x− 1)4

=Ax3 + (B − 3A)x2 + (C − 2B + 3A)x+D − C +B − A

(x− 1)4.

Vergleichen der Koeffizienten im Zahler ergibt dann die Bedingungen

A = 1, B − 3A = 2 =⇒ B = 2 + 3A = 5, C − 2B + 3A = 0 =⇒ C = 2B − 3A = 7

undD − C +B − A = 1 =⇒ D = 1 + C −B + A = 4,

und wir haben erneut dasselbe Ergebnis. Insgesamt konnen wir jetzt also alle rationalenFunktionen der Form p(x)/(x− a)n integrieren.

Wir kommen jetzt zum nachstkomplizierteren Typ rationaler Funktionen und be-ginnen mit einer kleinen algebraischen Vorbemerkung. Angenommen wir haben einPolynom p 6= 0 uber K ∈ {R,C} und eine Nullstelle von p, also ein a ∈ K mitp(a) = 0. Dividieren wir dann p durch x−a, so erhalten wir Polynome q, r uber K mitp = q · (x − a) + r und grad(r) < grad(x − a) = 1. Damit ist grad(r) ≤ 0, d.h. r isteine Konstante und wegen

r = q(a) · (a− a) + r = p(a) = 0

ist sogar r = 0, d.h. p(x) = (x− a)q(x). Nullstellen kann man also aus einem Polynomherausziehen. Entweder ist jetzt q(a) 6= 0 oder a ist auch eine Nullstelle von q. Inletzterem Fall kann man auch aus q den Faktor x− a herausziehen und hat damit ausp sogar (x−a)2 herausgezogen. So fortfahrend erhalten wir schließlich n ∈ N mit n ≥ 1und ein Polynom q uber K mit p(x) = (x− a)nq(x) und q(a) 6= 0. Man nennt die Zahln dann die Vielfachheit der Nullstelle a von p. Alternativ kann man n auch uber dieAbleitungen von p berechnen, es ist p(k)(a) = 0 fur 0 ≤ k < n und p(n)(a) 6= 0.

Sei jetzt p 6= 0 ein beliebiges Polynom uber K ∈ {R,C}. Gibt es eine Nullstellea1 ∈ K von p, so konnen wir wie gesehen p(x) = (x − a1)

n1p1(x) mit p1(a1) 6= 0schreiben. Hat auch p1 eine Nullstelle a2 in K, so ist a2 6= a1 und wir konnen p1(x) =(x− a2)

n2p2(x) mit p2(a2) 6= 0 schreiben, also p(x) = (x− a1)n1(x− a2)

n2p2(x). Wegenp1(a1) 6= 0 ist auch p2(a1) 6= 0. So fortfahrend erhalten wir schließlich

p(x) = (x− a1)n1 · . . . · (x− ar)

nrq(x)

wobei a1, . . . , ar die verschiedenen Nullstellen von p sind, n1, . . . , nr ≥ 1 ihre Vielfach-heiten sind und q 6= 0 ein Polynom ist das in K keine Nullstellen mehr hat. Ist q eineKonstante, so sagen wir das p uber K in Linearfaktoren zerfallt.

Wir betrachten nun Stammfunktionen rationaler Funktionen f(x) = p(x)/q(x) beidenen der Nenner in mehrere Linearfaktoren zerfallt. Dabei konnen wir uns auf diefolgende Situation beschranken:

89

Page 90: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 11.5.2011

1. Der Grad des Zahlers p(x) ist kleiner als der Grad des Nenners q(x). Denn istdies nicht so, so konnen wir zuvor wie oben eine Polynomdivision machen underhalten ein Polynom plus eine rationale Funktion r(x)/q(x), deren Zahler einenkleineren Grad als q(x) hat.

2. Außerdem konnen wir annehmen das der Nenner normiert ist, also die Formq(x) = xn + · · · mit fuhrenden Koeffizienten 1 hat. Andernfalls konnen wir denBruch einfach passend erweitern.

Damit hat der Nenner die Form

q(x) = (x− a1)n1 · . . . · (x− ar)

nr ,

wobei a1, . . . , ar die verschiedenen Nullstellen des Polynoms q(x) sind. Die Exponen-ten n1, . . . , nr sind die jeweiligen Vielfachheiten der Nullstellen. Die Integration dieserFunktion fuhren wir jetzt uber die sogenannte Partialbruchzerlegung auf den schonbehandelten Fall p(x)/(x− a)n zuruck.

Lemma 2.14 (Partialbruchzerlegung)Seien K ∈ {R,C}, a1, . . . , ar ∈ K paarweise verschieden, n1, . . . , nr ≥ 1 naturliche

Zahlen, q(x) := (x− a1)n1 . . . (x− ar)

nr und p ein Polynom uber K mit grad(p) < n :=n1 + · · ·+ nr. Dann existieren eindeutig bestimmte Polynome p1, . . . , pr uber K mit

p(x)

q(x)=

p1(x)

(x− a1)n1+ · · ·+ pr(x)

(x− ar)nr

und grad(pi) < ni fur 1 ≤ i ≤ r.

Beweis: Betrachten wir die n1+· · ·+nr = n zu bestimmenden Koeffizienten der Polyno-me p1, . . . , pr als Unbekannte, so ergibt sich fur diese nach Ubergang zum Hauptnennerauf der rechten Seite und Koeffizientenvergleich mit p ein lineares Gleichungssystemaus n Gleichungen in n Unbekannten dessen rechte Seite die n Koeffizienten von p sind.Wir wollen uns uberlegen, dass das zugehorige homogene lineare Gleichungssystem nurdie triviale Losung hat. Seien also p1, . . . , pr Polynome uber K mit grad(pi) < ni fur1 ≤ i ≤ r und

∑ri=1 pi(x)/(x − ai)

ni = 0. Angenommen es gibt ein 1 ≤ i ≤ r mitpi 6= 0. Dann konnen wir pi(x) = (x− ai)

sh(x) mit s ∈ N und einem Polynom h uberK mit h(ai) 6= 0 schreiben. Dabei ist 0 ≤ s ≤ grad(pi) < ni und es ergibt sich derWiderspruch

0 = limx→ai

(x− ai)ni−s

r∑j=1

pj(x)

(x− aj)nj=∑

1≤j≤rj 6=i

limx→ai

(x− ai)ni−spj(x)

(x− aj)nj+ lim

x→ai

h(x)

= h(ai) 6= 0.

Dieser Widerspruch zeigt pi = 0 fur alle 1 ≤ i ≤ r. Mit dem Hauptsatz uber lineareGleichungssysteme I.§12.Satz 4 folgt jetzt die Behauptung.

90

Page 91: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 11.5.2011

Schreiben wir unsere rationale Funktion f in der Form

f(x) =p(x)

q(x)=

p1(x)

(x− a1)n1+ · · ·+ pr(x)

(x− ar)nr

wobei p1, . . . , pr Polynome mit grad pi < ni fur i = 1, . . . , r sind, so wird∫f(x) dx =

∫p1(x)

(x− a1)n1dx+ · · ·+

∫pr(x)

(x− ar)nrdx

und jeden der einzelnen Summanden haben wir bereits im vorigen Schritt berechnet.Naturlich ist es zur realen Ausfuhrung dieses Verfahrens wichtig, dass wir die Partial-bruchzerlegung tatsachlich berechnen konnen, und zur Beschreibung dieses Rechenver-fahrens wollen wir das Beispiel des unbestimmte Integrals∫

2x5 + 3x4 − 2x3 − x2 + x+ 1

x3 + x2 − x− 1dx

behandeln. Als ersten Schritt bringen wir den Zahler durch Polynomdivision auf Gradhochstens zwei. Die Rechnung zur Polynomdivision lassen wir diesmal weg, und notie-ren hier nur das Ergebnis

2x5 + 3x4 − 2x3 − x2 + x+ 1 = (2x2 + x− 1) · (x3 + x2 − x− 1) + 3x2 + x,

d.h. der Quotient ist 2x2 + x− 1 und der Rest ist 3x2 + x. Damit ist∫2x5 + 3x4 − 2x3 − x2 + x+ 1

x3 + x2 − x− 1dx =

2

3x3 +

1

2x2 − x+

∫3x2 + x

x3 + x2 − x− 1dx.

Der Nenner ist ein Produkt

x3 + x2 − x− 1 = (x2 − 1)(x+ 1) = (x− 1)(x+ 1)2,

und wir setzen die Partialbruchzerlegung in der Form

3x2 + x

x3 + x2 − x− 1=

A

x− 1+Bx+ C

(x+ 1)2

an. Bringen wir hier die rechte Seite der Gleichung auf den Hauptnenner, so erhaltenwir die Bedingung

3x2 + x

x3 + x2 − x− 1=A(x+ 1)2 + (Bx+ C)(x− 1)

x3 + x2 − x− 1

=(A+B)x2 + (2A−B + C)x+ A− C

x3 + x2 − x− 1.

91

Page 92: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 11.5.2011

Da beide Bruche denselben Nenner haben mussen die Zahler ubereinstimmen, und diesheißt das alle Koeffizienten jeweils gleich sind. Wir haben also drei Bedingungen an dieUnbekannten A,B,C

A+B = 3, 2A−B + C = 1, A− C = 0.

Dieses lineare Gleichungssystem kann man leicht direkt losen, es sind C = A, B = 3−A,also 1 = 2A − B + C = 2A − 3 + A + A = 4A − 3, und somit A = 1, B = 3 − A = 2und C = A = 1. Als unsere Partialbruchzerlegung ergibt sich somit

3x2 + x

x3 + x2 − x− 1=

1

x− 1+

2x+ 1

(x+ 1)2.

Folglich ist∫3x2 + x

x3 + x2 − x− 1dx =

∫dx

x− 1+

∫2x+ 1

(x+ 1)2dx = ln |x− 1|+ 2 ln |x+ 1|+ 1

x+ 1,

wobei wir den letzten Schritt mit der schon behandelten Methode zur Losung vonIntegralen

∫p(x)/(x− a)n dx gerechnet haben. Insgesamt ist damit∫

2x5 + 3x4 − 2x3 − x2 + x+ 1

x3 + x2 − x− 1dx =

2

3x3 +

1

2x2 − x+ ln |x− 1|+ 2 ln |x+ 1|+ 1

x+ 1.

Die Methode zur Berechnung der Partialbruchzerlegung lauft also in drei Schritten ab,

1. rechte Seite auf Hauptnenner bringen,

2. die entstehenden Koeffizienten im Zahler vergleichen,

3. und dann das entstehende lineare Gleichunssystem losen.

Diese Rechenmethode ist immer moglich, aber in der praktischen Durchfuhrung oftetwas muhsam. Im Spezialfall das unser Nenner keine mehrfachen Nullstellen hat, gibtes auch eine alternative, deutlich einfacherere Rechenmethode. Nehme also an, wirwollen die Partialbruchzerlegung von p(x)/q(x) berechnen, wobei der Nenner die Form

q(x) = (x− a1) · . . . · (x− an)

hat, und p ein Polynom von Grad kleiner als n ist. Unser Nenner soll also in Linear-faktoren zerfallen, aber keine mehrfachen Nullstellen haben. Die Zahler in der Partial-bruchzerlegung haben dann Grad 0, sind also Konstanten, die wir als

p(x)

(x− a1) · . . . · (x− an)=

A1

x− a1

+ · · ·+ An

x− an

ansetzen. Ist fur 1 ≤ i ≤ n nun

qi(x) := (x− a1) · . . . · (x− ai) · . . . · (x− an)

92

Page 93: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 11.5.2011

das Produkt aller Linearfaktoren mit Ausnahme des i-ten, so haben wir

A1

x− a1

+ · · ·+ An

x− an

=A1q1(x) + · · ·+ Anqn(x)

(x− a1) · . . . · (x− an).

Setzen wir nun x = ai ein, so ist qj(x) = qj(ai) = 0 fur 1 ≤ j ≤ n mit j 6= i, da unterden Faktoren des Produkts insbesondere ai − ai = 0 vorkommt, und wir erhalten dieGleichung

Ai ·∏

1≤j≤nj 6=i

(ai − aj) = Aiqi(ai) = A1q1(ai) + · · ·+ Anqn(ai) = p(ai).

Damit ergeben sich die Koeffizienten der Partialbruchzerlegung direkt als

Ai =p(ai)∏

1≤j≤nj 6=i

(ai − aj).

Hat der Nenner also keine mehrfachen Nullstellen, so mussen wir nichts ausmultipli-zieren und keine linearen Gleichungssysteme losen, sondern konnen die Partialbruch-zerlegung einfach hinschreiben. Rechnen wir als ein Beispiel zu dieser Methode derPartialbruchzerlegung die Funktion

f(x) =x2 − 7x+ 11

x3 − 2x2 − x+ 2.

Hier ist x3 − 2x2 − x + 2 = (x2 − 1)(x − 2) = (x + 1)(x − 1)(x − 2), und die Partial-bruchzerlegung hat die Form

f(x) =A

x+ 1+

B

x− 1+

C

x− 2.

Unsere obige Formel besagt

A =19

(−2) · (−3)=

19

6,

B =5

2 · (−1)= −5

2,

C =1

3 · 1=

1

3,

also

f(x) =x2 − 7x+ 11

x3 − 2x2 − x+ 2. =

19

6· 1

x+ 1− 5

2· 1

x− 1+

1

3· 1

x− 2.

Wir fassen noch einmal zusammen was wir bisher uber die Integration rationaler Funk-tionen gesehen haben. Gegeben sei also eine rationale Funktion f(x) = p(x)/q(x) mit

93

Page 94: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 11.5.2011

zwei Polynomen p und q, und wir wollen das unbestimmte Integral∫f(x) dx berechnen.

Wir nehmen an das der Nenner die Form

q(x) = (x− a1)n1 · . . . · (x− as)

ns

hat, d.h. q zerfallt vollstandig in Linearfaktoren und a1, . . . , as sind die Nullstellen vonq mit den zueghorigen Vielfachheiten n1, . . . , ns ≥ 1. Durch Polynomdivision p(x) =Q(x) · q(x) + r(x) wird

f(x) =p(x)

q(x)= Q(x) +

r(x)

p(x)

mit grad(r) < grad(p). Im nachsten Schritt fuhren wir die Partialbruchzerlegung

r(x)

p(x)=

r1(x)

(x− a1)n1+ · · ·+ rs(x)

(x− as)ns

durch, wobei die Zahler auf der rechten Seite grad(ri) < ni fur i = 1, . . . , s erfullen.Fur jedes 1 ≤ i ≤ s konnten wir dann weiter

ri(x)

(x− ai)ni=

ai1

x− ai

+ · · ·+ aini

(x− ai)ni=

ni∑j=1

aij

(x− ai)j

schreiben und haben insgesamt

f(x) = Q(x) +s∑

i=1

ni∑j=1

aij

(x− ai)j.

Als Stammfunktion ergibt sich∫f(x) dx =

∫Q(x) dx+

s∑i=1

ai1 ln |x− ai| −∑

1≤i≤sni>1

ni−1∑j=1

ai,j+1

j· 1

(x− ai)j,

also eine rationale Funktion plus eine Summe von Logarithmen. Damit konnen wir jederationale Funktion deren Nenner in Linearfaktoren zerfallt explizit integrieren.

Leider ist man damit noch nicht fertig, es gibt auch rationale Funktionen bei denender Nenner nicht in Linearfaktoren zerfallt, beispielsweise f(x) = 1/(x2 + 2). WelcheForm hat jetzt ein allgemeines normiertes, reelles Polynom? Der sogenannte Hauptsatzder Algebra besagt das uber den komplexen Zahlen uberhaupt jedes normierte Polynomin Linearfaktoren zerfallt. Haben wir also ein normiertes reelles Polynom p, so konnenwir

p(x) = (x− λ1) · . . . · (x− λn)

mit nicht notwendig verschiedenen λ1, . . . , λn ∈ C schreiben. Dabei ist fur x ∈ R

p(x) = p(x) = (x− λ1) · . . . · (x− λn),

94

Page 95: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 11.5.2011

bis auf Umordnung stimmen also λ1, . . . , λn mit λ1, . . . , λn uberein. Die komplexenNullstellen von p sind also entweder reell oder sie treten in komplex konjugierten Paarenauf. Wir konnen das obige Produkt somit auch in der Form

p(x) = (x− a1)n1 . . . (x− ar)

nr ((x− µ1)(x− µ1))m1 . . . ((x− µs)(x− µs))

ms

schreiben, wobei a1, . . . , ar die verschiedenen reellen Nullstellen von p sind. Fur jedesµ ∈ C\R ist

(x− µ) · (x− µ) = x2 − (µ+ µ)x+ µµ = x2 − 2 Re(µ)x+ |µ|2

ein reelles, normiertes quadratisches Polynom ohne reelle Nullstellen. Es folgt das jedesnormierte, reelle Polynom p die Form

p(x) = (x− a1)n1 · . . . · (x− ar)

nr · (x2 + b1x+ c1)m1 · . . . (x2 + bsx+ cs)

ms

hat, wobei a1, . . . , ar die verschiedenen reellen Nullstellen von p sind, n1, . . . , nr ≥ 1ihre Vielfachheiten sind, m1, . . . ,ms ≥ 1 naturliche Zahlen sind und x2 + bix + ci istfur 1 ≤ i ≤ s ein nullstellenfreies quadratisches Polynom, also 4ci − b2i > 0. Bis aufUmordnung ist diese Darstellung auch eindeutig. Auch in dieser Situation haben wirwieder eine Partialbruchzerlegung.

Lemma 2.15 (Reelle Partialbruchzerlegung)Seien r, s ∈ N, n1, . . . , nr,m1, . . . ,ms ≥ 1 naturliche Zahlen, a1, . . . , ar ∈ R paarweiseverschieden und b1, . . . , bs, c1, . . . , cs ∈ R mit 4ci − b2i > 0 fur 1 ≤ i ≤ s so, dass diePaare (b1, c1), . . . , (bs, cs) paarweise verschieden sind. Sei

q(x) := (x− a1)n1 · . . . · (x− ar)

nr · (x2 + b1x+ c1)m1 · . . . (x2 + bsx+ cs)

ms

und sei p ein reelles Polynom mit grad(p) < n := n1 + · · ·+nr +2(m1 + · · ·+ms). Dannexistieren eindeutig bestimmte reelle Polynome p1, . . . , pr, q1, . . . , qs mit grad(pi) < ni

fur 1 ≤ i ≤ r und grad(qi) < 2mi fur 1 ≤ i ≤ s so, dass

p(x)

q(x)=

r∑i=1

pi(x)

(x− ai)ni+

s∑i=1

qi(x)

(x2 + bix+ ci)mi

ist.

Beweis: Auch dies konnen wir als ein reelles lineares Gleichungssystem in n Glei-chungen und n Unbekannten auffassen. Erneut nach dem Hauptsatz I.§12.Satz 4 uberlineare Gleichungssysteme reicht es die Existenzaussage zu beweisen. Fur 1 ≤ i ≤ s seiµi ∈ C\R mit x2 + bix + ci = x2 − 2 Re(µi) + |µi|2. Nach Lemma 14 gibt es komplexe

Polynome p1, . . . , pr mit grad(pi) < ni fur 1 ≤ i ≤ r und h1, . . . , hs, h1, . . . , hs mit

grad(hi), grad(hi) < mi fur 1 ≤ i ≤ s so, dass

p(x)

q(x)=

r∑i=1

pi(x)

(x− ai)ni+

s∑i=1

hi(x)

(x− µi)mi+

s∑i=1

hi(x)

(x− µi)mi

=r∑

i=1

pi(x)

(x− ai)ni+

s∑i=1

hi(x)(x− µi)mi + hi(x)(x− µi)

mi

(x2 + bix+ ci)mi

95

Page 96: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 13.5.2011

gilt. Fur 1 ≤ i ≤ s ist qi(x) := hi(x)(x−µi)mi + hi(x)(x−µi)

mi ein komplexes Polynommit grad(qi) < 2mi. Diese Polynome erfullen die geforderte Gleichung und wir mussenuns nur noch uberlegen, dass sie reell sind. Fur x ∈ R\{a1, . . . , ar} haben wir

r∑i=1

pi(x)

(x− ai)ni+

s∑i=1

hi(x)

(x− µi)mi+

s∑i=1

hi(x)

(x− µi)mi=

(p(x)

q(x)

)=p(x)

q(x),

und da zwei komplexe Polynome die fur alle x ∈ R\{a1, . . . , ar} ubereinstimmen schongleich sind, folgt mit der Eindeutigkeit in Lemma 14 auch pi = pi fur 1 ≤ i ≤ r undhi = hi fur 1 ≤ i ≤ s. Fur alle x ∈ R sind damit pi(x) ∈ R und

qi(x) = hi(x)(x− µi)mi + hi(x)(x− µi)

mi = hi(x)(x− µi)mi + hi(x)(x− µi)

mi

= 2 Re(hi(x)(x− µi)mi) ∈ R

d.h. pi, qi sind reelle Polynome.

Vorlesung 9, Freitag 13.5.2011

In der letzten Vorlesung ist uns die Integration aller rationalen Funktionen gelungen,deren Nenner vollstandig in Linearfaktoren zerfallt. Damit konnen wir schließlich zumallgemeinen Fall f(x) = p(x)/q(x) vorstossen bei dem der Nenner neben Linearfaktorenauch quadratische Faktoren enthalt

q(x) = (x− a1)n1 · . . . · (x− ar)

nr · (x2 + b1x+ c1)m1 · . . . (x2 + bsx+ cs)

ms

wobei a1, . . . , ar die verschiedenen Nullstellen von p sind, n1, . . . , nr ≥ 1 ihre Vielfach-heiten sind und 4ci − b2i > 0 fur 1 ≤ i ≤ s gilt. Durch Division mit Rest konnen wirweiter grad(p) < grad(q) annehmen und haben dann bewiesen das es eine Partialbruch-zerlegung

p(x)

q(x)=

r∑i=1

pi(x)

(x− ai)ni+

s∑i=1

qi(x)

(x2 + bix+ ci)mi

mit Polynomen p1, . . . , pr, q1, . . . , qs gibt, die grad(pi) < ni fur 1 ≤ i ≤ r und grad(qi) <2mi fur 1 ≤ i ≤ s erfullen. Diese Partialbruchzerlegung kann man vollig analog zu unse-rem Vorgehen bei zerfallenden Nenner berechnen, also durch fortgesetzte Division mitRest oder durch Ansetzen der Polynome pi, qi mit unbekannten Koeffizienten. LetztereMethode kann man dabei noch mit der Technik des Einsetzens spezieller Werte mi-schen, die wir auch schon letztes Mal gesehen hatten. Als ein Beispiel behandeln wirdie rationale Funktion

f(x) =x4 − 2x3 + x+ 3

x5 − x4 + 4x3 − 4x2 + 4x− 4.

96

Page 97: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 13.5.2011

Der Nenner hat x = 1 als Nullstelle und bei Division ergibt sich

x5 − x4 + 4x3 − 4x2 + 4x− 4 : x− 1 = x4 + 4x2 + 4 = (x2 + 2)2

−(x5 − x4)

4x3 − 4x2

− (4x3 − 4x2)

4x− 4− (4x− 4)

0.

Die Partialbruchzerlegung von f setzen wir an als

f(x) =x4 − 2x3 + x+ 3

x5 − x4 + 4x3 − 4x2 + 4x− 4=

A

x− 1+

r(x)

(x2 + 2)2=A(x2 + 2)2 + (x− 1)r(x)

(x− 1)(x2 + 2)2

mit A ∈ R und einem reellen Polynom r mit grad(r) < 4. Einsetzen von x = 1 indie Zahler der rechten Seite und von f ergibt die Bedingung also 9A = 3 und somitA = 1/3 und

(x− 1)r(x) = x4 − 2x3 + x+ 3− 1

3(x4 + 4x2 + 4) =

2

3

(x4 − 3x3 − 2x2 +

3

2x+

5

2

).

Das Polynom r erhalten wir durch eine weitere Polynomdivision

x4 − 3x3 − 2x2 + 32x+ 5

2: x− 1 = x3 − 2x2 − 4x− 5

2

−(x4 − x3)

− 2x3 − 2x2

− (− 2x3 + 2x2)

− 4x2 + 32x

− (− 4x2 + 4x)

− 52x+ 5

2

−(− 5

2x+ 5

2

)0

also ist

r(x) =2

3

(x3 − 2x2 − 4x− 5

2

),

und insgesamt

f(x) =x4 − 2x3 + x+ 3

x5 − x4 + 4x3 − 4x2 + 4x− 4=

1

3· 1

x− 1+

2

3·x3 − 2x2 − 4x− 5

2

(x2 + 2)2.

Auch der nachste Rechenschritt ist rein algebraisch. Analog zu unserem Vorgehen imFall p(x)/(x− a)n fuhren wir eine weitere Polynomdivision aus

x3 − 2x2 − 4x− 52

: x2 + 2 = x− 2−(x3 + 2x)

− 2x2 − 6x− 52

− (−2x2 − 4)

− 6x+ 32

97

Page 98: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 13.5.2011

und somit ist

x3 − 2x2 − 4x− 52

(x2 + 2)2=

(x− 2)(x2 + 2)− 6x+ 32

(x2 + 2)2=

x− 2

x2 + 2− 3

2· 4x− 1

(x2 + 2)2.

Insgesamt haben wir damit unsere rationale Funktion f umgeschrieben als

f(x) =x4 − 2x3 + x+ 3

x5 − x4 + 4x3 − 4x2 + 4x− 4=

1

3· 1

x− 1+

2

3· x− 2

x2 + 2− 4x− 1

(x2 + 2)2.

Die Integration konnen wir noch nicht durchfuhren, da wir noch keine Stammfunktio-nen der hinteren beiden Summanden kennen.

Die eben verwendete Methode der Vereinfachung von (x3−2x2−4x−5/2)/(x2+2)2

durch Division mit Rest funktioniert naturlich auch allgemein, und zeigt das wir beigegebenen quadratischen Polynom x2 + ax + b mit 4b − a2 > 0, n ≥ 1 und einemPolynom p mit grad(p) < 2n durch fortgesetzte Polynomdivision stets

p(x)

(x2 + ax+ b)n=

n∑i=1

aix+ bi(x2 + ax+ b)i

mit a1, . . . , an, b1, . . . , bn ∈ R schreiben konnen, auch dies wird wieder als Partialbruch-zerlegung bezeichnet. Genau wie bei Linearfaktoren kann man anstelle der Polynomdi-vision die Partialbruchzerlegung auch mit Unbekannten ansetzen und die entstehendenGleichungen losen. Kombinieren wir die obige Formel mit der Partialbruchzerlegunggemaß Lemma 15, so erhalten wir die allgemeine Form reeller, rationaler Funktionen.Angenommen wir haben eine beliebige rationale Funktion f(x) = p(x)/q(x) gegeben.Wie oben konnen wir durch Erweiterung mit Konstanten und Polynomdivision anneh-men, dass der Nenner q(x) ein normiertes Polynom ist und der Grad des Zahlers echtkleiner als der Grad des Nenners ist. Das Polynom q(x) kann in der Form

q(x) = (x− a1)n1 · . . . · (x− ar)

nr · (x2 + b1x+ c1)m1 · . . . · (x2 + bsx+ cs)

ms

geschrieben werden. Die quadratischen Faktoren sollen dabei keine Nullstellen haben,also 4ci − b2i > 0 fur 1 ≤ i ≤ s. Ist eine solche Darstellung des Nenners gefunden, sohaben wir wieder eine Partialbruchzerlegung unserer rationalen Funktion, die diesmaldie Form

p(x)

q(x)=

r∑i=1

ni∑j=1

Aij

(x− ai)j+

s∑i=1

mi∑j=1

Bijx+ Cij

(x2 + bix+ ci)j

hat. Wie wir die Partialbruchzerlegung explizit bestimmen konnen, haben wir in denbisherigen Beispielen gesehen. Die Integration rationaler Funktionen ist damit zuruck-gefuhrt auf die Bestimmung des unbestimmten Integrals∫

Ax+B

(x2 + ax+ b)ndx

98

Page 99: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 13.5.2011

mit A,B, a, b ∈ R, ∆ := 4b − a2 > 0. Wir beginnen mit dem Fall das im Zahler eineEins steht, also A = 0, B = 1. Das allgemeine Vorgehen sieht man schon an einemeinfachen Beispiel ∫

dx

x2 + 2.

Um dieses Integral zu berechnen, muss man sich dann an die Formel∫dx/(1 + x2) =

arctanx erinnern, dieses Integral sieht ja sehr ahnlich aus. Tatsachlich konnen diesebeiden Integrale leicht aufeinander zuruckgefuhrt werden, es gilt namlich∫

dx

x2 + 2=

1

2

∫dx

( x√2)2 + 1

=1

2

√2 arctan

(x√2

).

Wir werden∫dx/(x2 + ax+ b)n allgemein auf die Berechnung von

∫dx/(x2 + 1)n und

eine Umskalierung zuruckfuhren. Seien wieder a, b ∈ R und n ≥ 1 mit ∆ := 4b−a2 > 0gegeben. Wir rechnen∫

dx

(x2 + ax+ b)n=

∫dx((

x+ a2

)2+ b− a2

4

)n =

∫dx((

x+ a2

)2+ ∆

4

)n

=4n

∆n

∫dx((

2√∆

(x+ a

2

))2

+ 1

)n ,

und verwenden die Substitution

t =2√∆

(x+

a

2

)=

2√∆x+

a√∆, dx =

√∆

2dt.

Damit ist ∫dx

(x2 + ax+ b)n=

4n√

2∆n

∫dt

(t2 + 1)n,

und wir kommen erst einmal nicht weiter. Um dieses letzte Integral auszuwerten,mussen wir zuerst die Stammfunktion von 1/(1 + x2)n berechnen. Hierzu verwendenwir die Substitution x = tan t, und es wird

dx

dt= 1 + tan2 t =⇒ dx = (1 + tan2 t) dt,

also ∫dx

(1 + x2)n=

∫dt

(1 + tan2 t)n−1.

Im Fall n = 1 erhalten wir damit die uns schon bekannte Stammfunktion∫dx

1 + x2=

∫dt = t = arctan x,

99

Page 100: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 13.5.2011

wir mussen also nur noch den Fall n > 1 betrachten. Hierzu erinnern wir uns an dieim vorigen Abschnitt hergeleitete Formel∫

cos2k x dx = Akx+ sinx cosx · Φk(cos2 x).

Explizit hatten wir fur k = 1, 2, 3 dabei

A1 =1

2, A2 =

3

8, A3 =

5

16

und

Φ1(x) =1

2, Φ2(x) =

1

4x+

3

8, Φ3(x) =

1

6x2 +

5

24x+

5

16.

Wegen

1 + tan2 t = 1 +sin2 t

cos2 t=

1

cos2 t

wird dann ∫dx

(1 + x2)n=

∫cos2(n−1) t dt = An−1t+ sin t cos t · Φn−1(cos2 t).

Diese Formel konnen wir noch etwas weiter auswerten, denn es sind

cos2 t =1

1 + tan2 t=

1

1 + x2, sin t cos t = tan t · cos2 t =

tan t

1 + tan2 t=

x

1 + x2,

und somit folgt∫dx

(1 + x2)n= An−1 arctanx+

x

1 + x2Φn−1

(1

1 + x2

).

Um hier n = 1 nicht als Sonderfall behandeln zu mussen setzen wir noch A0 := 1 undΦ0(x) := 0. Dann gilt diese Formel auch fur n = 1, und auch die Rekursionsformel furAn,Φn ist dann auch fur n = 1 gultig. Die Stammfunktion von 1/(1 + x2)n ist damitein Vielfaches des Arcus Tangens plus eine rationale Funktion. Die Zahlen A1, A2, A3

und die Polynome Φ1,Φ2,Φ3 haben wir oben hingeschrieben, und setzen wir ihre Wertein unsere Formel ein, so ergeben sich fur die kleinen Werte n = 1, 2, 3, 4 die explizitenFormeln∫

dx

1 + x2= arctanx,∫

dx

(1 + x2)2=

1

2arctanx+

1

2· x

1 + x2,∫

dx

(1 + x2)3=

3

8arctanx+

1

4

x

(1 + x2)2+

3

8· x

1 + x2,∫

dx

(1 + x2)4=

5

16arctanx+

1

6· x

(1 + x2)3+

5

24· x

(1 + x2)2+

5

16· x

1 + x2.

100

Page 101: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 13.5.2011

Damit konnen wir jetzt die Berechnung der unbestimmten Integrale∫dx/(x2+ax+b)n

zum Abschluß bringen. Wit hatten ∆ = 4b− a2 > 0 gesetzt, und

t =2√∆x+

a√∆

substituiert, und erhalten jetzt

1 + t2 =4

∆(x2 + ax+ b),

t

1 + t2=

√∆

4

2x+ a

x2 + ax+ b,

also∫dx

(x2 + ax+ b)n=

4n√

2∆n

∫dt

(t2 + 1)n

=4n√

2∆n

(An−1 arctan t+

t

1 + t2Φn−1

(1

1 + t2

))=

4nAn−1

√∆

2∆narctan

(2√∆x+

a√∆

)+

4n−1

2∆n−1

2x+ a

x2 + ax+ bΦn−1

(∆

4· 1

x2 + ax+ b

).

Wir konnen jetzt unsere expliziten Formeln fur An,Φn fur n = 0, 1, 2, 3 einsetzen, underhalten ∫

dx

x2 + ax+ b=

2√∆

arctan

(2x+ a√

),∫

dx

(x2 + ax+ b)2=

4

∆3/2arctan

(2x+ a√

)+

1

∆· 2x+ a

x2 + ax+ b,∫

dx

(x2 + ax+ b)3=

12

∆5/2arctan

(2x+ a√

)+

1

2∆· 2x+ a

(x2 + ax+ b)2+

3

∆2· 2x+ a

x2 + ax+ b,∫

dx

(x2 + ax+ b)4=

40

∆7/2arctan

(2x+ a√

)+

1

3∆· 2x+ a

(x2 + ax+ b)3+

5

3∆2· 2x+ a

(x2 + ax+ b)2

+10

∆3· 2x+ a

x2 + ax+ b.

Noch hohere Exponenten treten normalerweise gar nicht auf. Jetzt konnen wir auchdas allgemeine Integral ∫

Ax+B

(x2 + ax+ b)ndx

101

Page 102: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 13.5.2011

mit A 6= 0 behandeln. Beachte hierzu (x2 + ax+ b)′ = 2x+ a und rechne

∫Ax+B

(x2 + ax+ b)ndx =

A

2

∫2x+ 2B

A

(x2 + ax+ b)ndx

=A

2

∫2x+ a

(x2 + ax+ b)ndx+

2B − aA

2

∫dx

(x2 + ax+ b)n.

Im Fall n = 1 ist dies∫Ax+B

x2 + ax+ bdx =

A

2ln |x2 + ax+ b|+ 2B − aA√

∆arctan

(2x+ a√

),

da das erste Integral ja von der Form f ′/f ist. Im Fall n > 1 steht im Zahler des erstenIntegrals die Ableitung von x2+ax+b, und die Stammfunktion von (2x+a)/(x2+ax+b)n

ist damit einfach −1/[(n−1) ·(x2+ax+b)n−1]. Diese Beobachtung liefert die Gleichung∫Ax+B

(x2 + ax+ b)ndx =

2B − aA

2

∫dx

(x2 + ax+ b)n− A

2(n− 1)· 1

(x2 + ax+ b)n−1.

Das Integral auf der rechten Seite dieser Gleichung kennen wir dabei bereits, und damitist das gesamte Integral berechnet. Fur n = 1 haben wir bereits eine explizite Formel,und wir wollen jetzt noch die Formeln fur n = 2 und n = 3 hinschreiben:∫

Ax+B

(x2 + ax+ b)2dx =

2(2B − aA)

∆3/2arctan

(2x+ a√

)+

1

∆· (2B − aA)x+ aB − 2bA

x2 + ax+ b,∫

Ax+B

(x2 + ax+ b)3dx =

6(2B − aA)

∆5/2arctan

(2x+ a√

)+

1

2∆

(2B − aA)x+ aB − 2bA

(x2 + ax+ b)2+

3(2B − aA)

2∆2

2x+ a

x2 + ax+ b.

Diese beiden Formeln ergeben sich einfach durch Einsetzen der oben notierten Formelnfur∫dx/(x2 + ax + b)n fur n = 2, 3. Mit diesen Formeln ausgerustet kehren wir zum

Beispiel der rationalen Funktion

f(x) =x4 − 2x3 + x+ 3

x5 − x4 + 4x3 − 4x2 + 4x− 4=

1

3· 1

x− 1+

2

3· x− 2

x2 + 2− 4x− 1

(x2 + 2)2

zuruck. Mit den obigen Bezeichnung sind a = 0, b = 2 und ∆ = 4b−a2 = 8. Im Integralvon (x− 2)/(x2 + 2) haben wir n = 1, A = 1, B = −2, also∫

x− 2

x2 + 2dx =

1

2ln(x2 + 2)−

√2 arctan

(x√2

),

102

Page 103: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 13.5.2011

und fur (4x− 1)/(x2 + 2)2 sind n = 2, A = 4, B = −1 also∫4x− 1

(x2 + 2)2dx = −

√2

8arctan

(x√2

)− 1

4· x+ 8

x2 + 2,

und insgesamt ist∫x4 − 2x3 + x+ 3

x5 − x4 + 4x3 − 4x2 + 4x− 4

=1

3ln |x− 1|+ 1

3ln(x2 + 2)− 2

√2

3arctan

(x√2

)+

√2

8arctan

(x√2

)+

1

4· x+ 8

x2 + 2

=1

3ln |x− 1|+ 1

3ln(x2 + 2) +

1

4· x+ 8

x2 + 2− 13

24

√2 arctan

(x√2

).

Zum Abschluß dieses Abschnitts wollen wir noch ein letztes Beispiel rechnen, namlich∫x5 + 1

(x2 + x+ 1)3.

Wir beginnen mit den Polynomdivisionen

x5 + 1 : x2 + x+ 1 = x3 − x2 + 1−(x5 + x4 + x3)

− x4 − x3 + 1− (−x4 − x3 − x2)

x2 + 1− (x2 + x+ 1)

− x

x3 − x2 + 1 : x2 + x+ 1 = x− 2−(x3 + x2 + x)

− 2x2 − x+ 1− (−2x2 − 2x− 2)

x+ 3

und erhalten damit

x5 + 1

(x2 + x+ 1)3=

x3 − x2 + 1

(x2 + x+ 1)2− x

(x2 + x+ 1)3

=x− 2

x2 + x+ 1+

x+ 3

(x2 + x+ 1)2− x

(x2 + x+ 1)3.

Es sind a = b = 1 also ∆ = 4b− a2 = 3. Wir erhalten∫x− 2

x2 + x+ 1dx =

1

2ln(x2 + x+ 1)− 5√

3arctan

(2x+ 1√

3

),∫

x+ 3

(x2 + x+ 1)2dx =

10

9

√3 arctan

(2x+ 1√

3

)+

1

3· 5x+ 1

x2 + x+ 1,∫

x

(x2 + x+ 1)3dx = −2

9

√3 arctan

(2x+ 1√

3

)− 1

6· x+ 2

(x2 + x+ 1)2− 1

6· 2x+ 1

x2 + x+ 1

103

Page 104: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 13.5.2011

und als Gesamtergebnis ergibt sich∫x5 + 1

(x2 + x+ 1)3=

1

2ln(x2 + x+ 1) +

1

6· x+ 2

(x2 + x+ 1)2

+1

2· 4x+ 1

x2 + x+ 1− 1√

3arctan

(2x+ 1√

3

).

2.5 Erganzungen

Jede stetige Funktion hat eine Stammfunktion, wir haben aber schon bemerkt das dieseStammfunktionen sich im allgemeinen nicht durch Formeln in den Grundfunktionenausdrucken lassen. Einige dieser Stammfunktionen tauchen recht haufig auf und manfuhrt fur sie eigene Namen ein.

–1

–0.5

0

0.5

1

–4 –3 –2 –1 1 2 3 4

x

Ein besonders wichtiges Beispiel dieser Funktio-nen ist die fur alle x ∈ R definierte Funktion

erf(x) :=2√π

∫ x

0

e−t2 dt =1√π

∫ x

−x

e−t2 dt,

deren Graph nebenstehend gezeigt ist. Die multipli-kative Konstante 1/

√π ist dabei gerade so gewahlt

das limx→∞ erf(x) = 1 ist. Man bezeichnet erf(x)auch als die Fehlerfunktion, dieser Name kommtvon der Verwendung dieser Funktion im Zusam-menhang mit der Normalverteilung in der Wahr-scheinlichkeitsrechnung. Die gangigen Mathematik-programme und auch einige Taschenrechner konnendie Fehlerfunktion berechnen so das man sie genauwie die anderen Grundfunktionen verwenden kann.

Wir wollen uns kurz uberlegen das die Fehler-funktion analytisch ist und ihre Taylorreihe zumEntwicklungspunkt x0 = 0 berechnen. Wir fuhren diesen Tatsachen auf den folgendenallgemeinen Satz zuruck.

Satz 2.16: Sei f(x) =∑∞

n=0 an(x− x0)n eine reelle Potenzreihe mit positiven Konver-

genzradius r > 0. Dann gilt fur alle x ∈ R mit |x− x0| < r die Gleichung∫ x

x0

f(t) dt =∞∑

n=1

an−1

n(x− x0)

n

und die rechts stehende Potenzreihe hat wieder den Konvergenzradius r.

Beweis: Wir betrachten die Potenzreihe

F (x) :=∞∑

n=1

an−1

n(x− x0)

n.

104

Page 105: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 13.5.2011

Fur x ∈ R ist die Reihe∑∞

n=1 an−1(x−x0)n = (x−x0)

∑∞n=0 an(x−x0)

n genau dann kon-vergent wenn f(x) dies ist, und nach I.§13.Lemma 16 hat damit auch

∑∞n=1 an−1(x −

x0)n den Konvergenzradius r. Jetzt ergibt die Hadamardsche Formel fur den Kon-

vergenzradius I.§13.Satz 17 die Gleichung lim supn→∞n√|an−1| = 1/r und mit dem

Grenzwert ( n√n)n∈N −→ 1 folgt mit Aufgabe (29) aus dem letzten Semester

lim supn→∞

n

√∣∣∣an−1

n

∣∣∣ = lim supn→∞

n√|an−1|n√n

= limn→∞

1n√n· lim sup

n→∞

n√|an−1| =

1

r,

also hat auch F (x) nach I.§13.Satz 17 den Konvergenzradius r. Nach I.§14.Satz 5 giltfur alle x ∈ R mit |x− x0| < r

F ′(x) =∞∑

n=0

(n+ 1)an

n+ 1(x− x0)

n =∞∑

n=0

an(x− x0)n = f(x),

d.h. F ist eine Stammfunktion von f . Damit liefert Korollar 10 auch∫ x

x0

f(t) dt = F (x)− F (x0) = F (x) =∞∑

n=1

an−1

n(x− x0)

n

fur jedes x ∈ R mit |x− x0| < r.

Insbesondere haben wir damit

Korollar 2.17 (Stammfunktionen analytischer Funktionen)Seien I ⊆ R ein offenes Intervall und f : I → R eine analytische Funktion. Dann istauch jede Stammfunktion von f analytisch.

Beweis: Klar nach Satz 16 und §1.Lemma 9.

Damit ist die Fehlerfunktion erf : R → R analytisch. Wir konnen die Taylorreihezum Entwicklungspunkt x0 = 0 auch leicht explizit hinschreiben. Fur alle x ∈ R giltzunachst

ex =∞∑

n=0

xn

n!also auch e−x2

=∞∑

n=0

(−1)n

n!x2n

und Satz 16 liefert

erf(x) =2√π

∫ x

0

e−t2 dt =2√π

∞∑n=0

(−1)n

(2n+ 1) · n!x2n+1

wieder fur jedes x ∈ R. Nach Aufgabe (6) ist die Fehlerfunktion ungerade erf(−x) =−erf(x), was man naturlich auch leicht direkt sehen kann. Als ein Beispiel zur Ver-wendung der Fehlerfunktion wollen wir einmal das unbestimmte Integral der Funktion

105

Page 106: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 13.5.2011

e−x2/2/x2 berechnen. Mit partieller Integration ergibt sich

∫e−

12x2

x2dx = −e

− 12x2

x−∫e−

12x2

dx = −e− 1

2x2

x−∫e−

“x√2

”2

dx

= −e− 1

2x2

x−√π

2erf

(x√2

).

–1.5

–1

–0.5

0

0.5

1

1.5

–15 –10 –5 5 10 15

x

Wir wollen noch eine zweite solche Funktion dis-kutieren, den sogenannten Integralsinus

Si : R → R;x 7→∫ x

0

sin t

tdt (Integralsinus),

dessen Graph nebenstehend gezeigt ist. Auch derIntegralsinus ist wieder eine analytische Funktion.Fur alle x ∈ R haben wir

sin x

x=

∞∑n=0

(−1)n

(2n+ 1)!x2n

und damit ist auch

Si(x) =

∫ x

0

sin t

tdt =

∞∑n=0

(−1)n

(2n+ 1) · (2n+ 1)!x2n+1

fur jedes x ∈ R. Auch der Integralsinus ist also eineungerade Funktion Si(−x) = −Si(x). Es reicht alsoSi(x) fur x > 0 zu untersuchen. Fur x > 0 ist Si′(x) = sin(x)/x, fur 0 ≤ x ≤ π ist Si(x)also streng monoton steigend, fur π ≤ x ≤ 2π streng monoton fallend, fur 2π ≤ x ≤ 3πdann wieder streng monoton steigend und immer so weiter. Die Ausschlage werdendabei immer kleiner, und daher gibt es den Grenzwert limx→∞ Si(x) und wir habenSi(x) ≤ Si(π) fur x ≥ 0. Damit folgt auch

|Si(x)| ≤ Si(π) =

∫ π

0

sin x

xdx ≈ 1.85193705

fur alle x ∈ R und der Integralsinus ist beschrankt. Auch mit dem Integralsinus wollenwir zwei Beispiele rechnen. Zunachst ergibt

− cosx =

∫sin x dx =

∫x · sin x

xdx = xSi(x)−

∫Si(x) dx,

die Stammfunktion ∫Si(x) dx = cos x+ x · Si(x).

106

Page 107: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 18.5.2011

Fur die Stammfunktion des Integralsinus benotigen wir also keine neue Funktion. Alsein zweites Beispiel betrachte∫

cosx lnx dx = sinx lnx−∫

sin x

xdx = sinx lnx− Si(x).

Vorlesung 10, Mittwoch 18.5.2011

Nachdem wir in den letzten Vorlesungen hauptsachlich mit rechnerischen Fragenbeschaftigt waren, wollen wir zum Abschluss noch zwei eher theoretische Ergebnissefesthalten. Wir hatten schon zu Beginn dieses Kapitels erwahnt, dass man sich dasIntegral

1

b− a

∫ b

a

f(x) dx

auch als ein”arithmetisches Mittel“ der Funktionswerte f(x) fur a ≤ x ≤ b vorstellen

kann. Der sogenannte Mittelwertsatz der Integralrechnung gibt dieser Vorstellung eineexakte Form. Wir setzen alle betrachteten Funktionen als stetig voraus, das ist nichtdie allgemeinste Form des Satzes aber einfach zu beweisen.

Satz 2.18 (Mittelwertsatz der Integralrechnung)Seien a, b ∈ R mit a < b und f : [a, b] → R eine stetige Funktion. Dann gelten:

(a) Es gibt ein ξ ∈ [a, b] mit ∫ b

a

f(x) dx = f(ξ) · (b− a).

(b) Ist g : [a, b] → R eine stetige Funktion mit g(x) ≥ 0 fur alle x ∈ R, so existiertein ξ ∈ [a, b] mit ∫ b

a

f(x)g(x) dx = f(ξ) ·∫ b

a

g(x) dx.

Beweis: (b) Die Aussage ist klar wenn g = 0 ist, wir konnen also g 6= 0 annehmen und

nach Aufgabe (14) ist dann auch∫ b

ag(x) dx > 0. Setze

m := infx∈[a,b]

f(x) und M := supx∈[a,b]

f(x).

Nach I.§13.Satz 13 existieren x1, x2 ∈ [a, b] mit f(x1) = m und f(x2) = M . Fur jedesx ∈ [a, b] gilt m ≤ f(x) ≤ M und wegen g(x) ≥ 0 auch mg(x) ≤ f(x)g(x) ≤ Mg(x).Mit Lemma 5.(b,c) folgt

m

∫ b

a

g(x) dx =

∫ b

a

mg(x) dx ≤∫ b

a

f(x)g(x) dx ≤∫ b

a

Mg(x) dx = M

∫ b

a

g(x) dx,

107

Page 108: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 18.5.2011

also haben wir

f(x1) = m ≤∫ b

af(x)g(x) dx∫ b

ag(x) dx

≤M = f(x2).

Nach dem Zwischenwertsatz I.§13.Satz 14 existiert ein ξ zwischen x1 und x2 mit∫ b

af(x)g(x) dx∫ b

ag(x) dx

= f(ξ), also auch

∫ b

a

f(x)g(x) dx = f(ξ) ·∫ b

a

g(x) dx.

(a) Klar nach (b) wenn g die Funktion konstant Eins ist.

Als allerletzte Aussage wollen wir eine Variante der Taylor Formel I.§14.Satz 16herleiten in der eine Integraldarstellung des Fehlerterms angegeben wird. Der hier be-wiesene Satz benotigt etwas starkere Voraussetzungen als die Version aus dem erstenSemester, damals hatten wir nur gefordert das die Funktion f mindestens (n+ 1)-maldifferenzierbar ist, jetzt brauchen wir zusatzlich das die (n+1)-te Ableitung auch nochstetig ist.

Satz 2.19 (Taylorpolynom mit Integraldarstellung des Fehlers)Seien I ⊆ R ein Intervall, n ∈ N, a ∈ I und f : I → R eine (n + 1)-fach stetigdifferenzierbare Funktion. Dann gilt fur jedes x ∈ I die Taylor Formel

f(x) =n∑

k=0

f (k)(a)

k!(x− a)k +

1

n!

∫ x

a

f (n+1)(t) · (x− t)n dt.

Beweis: Wir beweisen diese Formel durch Induktion nach n. Im Induktionsanfangn = 0 haben wir nach Korollar 10

f(x)− f(a) =

∫ x

a

f ′(t) dt, also f(x) = f(a) +

∫ x

a

f ′(t) dt,

und die Aussage ist fur n = 0 bewiesen. Nun sei n ∈ N mit n ≥ 1 und

f(x) =n−1∑k=0

f (k)(a)

k!(x− a)k +

1

(n− 1)!

∫ x

a

f (n)(t) · (x− t)n−1 dt

fur alle x ∈ I. Mit partieller Integration erhalten wir fur jedes x ∈ I

1

(n− 1)!

∫ x

a

f (n)(t) · (x− t)n−1 dt = − 1

n!f (n)(t)(x− t)n

∣∣∣∣xa

+1

n!

∫ x

a

f (n+1)(t) · (x− t)n dt

=f (n)(a)

n!(x− a)n +

1

n!

∫ x

a

f (n+1)(t) · (x− t)n dt

108

Page 109: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 18.5.2011

und dies ergibt

f(x) =n−1∑k=0

f (k)(a)

k!(x− a)k +

f (n)(a)

n!(x− a)n +

1

n!

∫ x

a

f (n+1)(t) · (x− t)n dt

=n∑

k=0

f (k)(a)

k!(x− a)k +

1

n!

∫ x

a

f (n+1)(t) · (x− t)n dt.

Damit ist der Satz mit vollstandiger Induktion bewiesen.

Mit dieser Integralform der Taylorformel konnen wir mit Hilfe des Mittelwertsatzesder Integralrechnung auch den Lagrangeschen Fehlerterm aus dem ersten Semesterzuruckgewinnen. In der Situation der Taylorformel gibt es namlich nach Satz 18.(b)stets ein ξ zwischen a und x mit

1

n!

∫ x

a

f (n+1)(t) · (x− t)n dt =f (n+1)(ξ)

n!

∫ x

a

(x− t)n dt =f (n+1)(ξ)

(n+ 1)!(x− a)n+1,

und dies ist gerade die Fehlerdarstellung aus I.§14.Satz 16.

$Id: uneigentlich.tex,v 1.8 2011/09/09 11:11:55 hk Exp $

§3 Uneigentliche Integrale

Rieman-Integrierbarkeit und das Rieman-Integral wurden in §2 nur fur beschrankteFunktionen definiert die ihrerseits auf Intervallen der Form [a, b] definiert sind. Durcheinen weiteren Grenzubergang konnen wir dies nun auch auf unbeschrankte Funktionenund unbeschrankte Intervalle ausdehnen. Ein solches Beispiel kam bereits in Aufgabe(19) vor, dort wird gezeigt das die Periode T einer Losung der Pendelgleichung φ′′ +ν sinφ = 0 mit φ(0) = φ0 ∈ (0, π/2), φ′(0) = 0 durch das Integral

T =

√2

ν

φ0∫−φ0

dx√cosx− cosφ0

gegeben ist. Hier wird der Integrand an den Grenzen x = ±φ0 unbeschrankt, unddaher muss dieses Integral wie in der erwahnten Aufgabe als ein Grenzwert betrachtetwerden. Fur die exakte Definition sind einige Falle zu unterscheiden.

Definition 3.1 (An einer Grenze uneigentliche Rieman-Integrale)Seien a ∈ R, b ∈ R mit a < b und f : [a, b) → R eine Funktion die uber jedes Intervall

109

Page 110: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 18.5.2011

[a, x] mit x ∈ R, a < x < b Rieman-integrierbar ist. Gibt es dann den Grenzwert

c :=

∫ b

a

f(t) dt := limx→b

∫ x

a

f(t) dt ∈ R

in R, so wird dieser als das uneigentliche Rieman-Integral von f uber [a, b) bezeich-net. Ist dabei c ∈ R, so nennen wir die Funktion f uber [a, b) uneigentlich Rieman-integrierbar.

Fur Funktionen f : (a, b] → mit a ∈ R, b ∈ R, a < b werden diese Begriffe analogdefiniert.

Wie in §2 sprechen wir auch verkurzend vom”uneigentlichen Integral“ statt vom

”un-

eigentlichen Rieman-Integral“ und von”uneigentlicher Integrierbarkeit“ anstelle von

”uneigentlicher Rieman-Integrierbarkeit“. Noch kurzer bezeichnet man manchmal auch

einfach∫ b

af(t) dt als konvergent. Wir wollen ein erstes einfaches Beispiel besprechen.

Nehmen wir etwa das Integral∫ ∞

0

e−x dx.

Gemaß der Definition mussen wir erst ein-mal die bestimmten Integrale

∫ x

0e−t dt bil-

den, und dann den Grenzwert x→∞ aus-rechnen. In diesem Beispiel ist dies beidesleicht moglich. Fur jedes x > 0 ist zunachst∫ x

0

e−t dt = −e−t

∣∣∣∣x0

= 1− e−x,

und beispielsweise nach I.§13.Satz 21.(c) ist limx→∞ e−x = 0, also∫ ∞

0

e−x dx = limx→∞

∫ x

0

e−t dt = limx→∞

(1− e−x) = 1− limx→∞

e−x = 1.

Man kann dieses Ergebnis so interpretieren, dass die oben eingezeichnete sich uberdie ganze positive x-Achse erstreckende Flache, die endliche Gesamtflache 1 hat. Diesegeometrische Betrachtungsweise ist in Anwendungen aber eher selten von Nutzen.

Wir wollen noch einige weitere Beispiele uneigentlicher Integrale besprechen, undbeginnen mit dem Integral ∫ ∞

1

dx

fur beliebige Exponenten α ∈ R. Wir wollen wissen wann dieses Integral konvergiert.Fur jedes x ≥ 1 haben wir nun∫ x

1

dt

tα=

1

1− α· 1

tα−1

∣∣∣∣x1

=1

1− α

(1

xα−1− 1

)110

Page 111: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 18.5.2011

fur α 6= 1 und ∫ x

1

dt

t= ln x

fur α = 1. Was nun herauskommt hangt vom Wert von α ab. Ist α < 1, so haben wir1− α > 0 und

limx→∞

1

1− α

(1

xα−1− 1

)= lim

x→∞

1

1− α

(x1−α − 1

)= ∞.

Im Fall α = 1 ist limx→∞ lnx = ∞. Ist schließlich α > 1, also α− 1 > 0, so ist

limx→∞

xα−1 = ∞ =⇒ limx→∞

1

xα−1= 0

und somit

limx→∞

1

1− α

(1

xα−1− 1

)=

1

α− 1.

Diese Rechnung zeigt ∫ ∞

1

dx

xα=

{1

α−1, α > 1,

∞, α ≤ 1,

und insbesondere konvergiert das uneigentliche Integral genau dann wenn α > 1 ist.Als ein weiteres Beispiel betrachte ∫ 1

0

dx

mit einem Exponenten α ∈ R. Ist dabei α ≤ 0, so ist einfach∫ 1

0

dx

xα=

∫ 1

0

x−α dx =1

1− αx1−α

∣∣∣∣10

=1

1− α

ein ganz normales Rieman Integral. Nun kommen wir zum Fall α > 0. Fur jedes0 < x < 1 ist dann ∫ 1

x

dt

tα=

1

1− α· 1

tα−1

∣∣∣∣1x

=1

1− α

(1− 1

xα−1

)im Fall α 6= 1 und ∫ 1

x

dt

t= − lnx

im Fall α = 1. Ist α < 1, so ist

limx→0

1

1− α

(1− 1

xα−1

)= lim

x→0

1− x1−α

1− α=

1

1− α.

Im Fall α = 1 ist limx→0(− lnx) = ∞ und fur α > 1 haben wir

limx→0

1

1− α

(1− 1

xα−1

)= ∞.

111

Page 112: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 18.5.2011

Damit ist ∫ 1

0

dx

xα=

{1

1−α, α < 1,

∞, α ≥ 1.

Naturlich kann es auch passieren, das es uberhaupt keinen Grenzwert∫∞

0f(x) dx

gibt, etwa bei∫∞

0cosx dx. Man spricht dann manchmal auch davon das das Integral∫ b

af(x) dx divergent ist. Fur nicht negative Integranden ist die Lage etwas einfacher,

zumindest in R existiert immer ein uneigentliches Rieman-Integral einer solchen Funk-tion. Um dies einzusehen, seien a ∈ R, b ∈ R mit a < b und eine Funktion f : [a, b) → Rmit f(x) ≥ 0 fur jedes x ∈ [a, b) gegeben. Außerdem nehmen wir an, dass die Funktionf uber jedes Intervall [a, x] mit x ∈ (a, b) Rieman-integrierbar ist. Dann betrachten wirdie Funktion

F : [a, b) → R;x 7→∫ x

a

f(t) dt,

und behaupten das diese monoton steigend ist. Sind namlich x, y ∈ [a, b) mit x < ygegeben, so gilt nach §2.Lemma 4.(c) und §2.Lemma 5.(c) auch

F (y) =

∫ y

a

f(t) dt =

∫ x

a

f(t) dt+

∫ y

x

f(t) dt ≥∫ x

a

f(t) dt = F (x).

Nach §1.Lemma 2 existiert damit in R der Funktionsgrenzwert

limx→b

F (x) dx = sup{F (x)|x ∈ [a, b)} ∈ R≥0 ∪ {+∞},

und somit existiert in R das uneigentliche Rieman-Integral∫ b

a

f(x) dx = sup

{∫ x

a

f(t) dt

∣∣∣∣ x ∈ [a, b)

}∈ R≥0 ∪ {+∞}.

Insbesondere ist die Funktion f genau dann uber [a, b) uneigentlich Rieman-integrierbarwenn ∫ b

a

f(x) dx < +∞

gilt.Die Rechenregeln fur Integrale gelten entsprechend interpretiert auch fur uneigent-

liche Rieman-Integrale weiter. Wir formulieren im Folgenden die meisten Satz fur un-eigentliche Integrale auf Intervallen mit rechts offener Grenze, der links offene Fall istvollig analog und ist implizit immer mit gemeint auch wenn er nicht explizit erwahntwird. Insbesondere werden wir die Satze ohne weiteren Kommentar auch einfach aufden linksseitig offenen Fall anwenden.

Lemma 3.1 (Rechenregeln fur uneigentliche Rieman-Integrale)Seien a ∈ R und b ∈ R mit a < b gegeben. Dann gelten:

112

Page 113: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 18.5.2011

(a) Ist b ∈ R und ist f : [a, b] → R Rieman-integrierbar, so ist f auch uber [a, b)uneigentlich Rieman-integrierbar und das uneigentliche Rieman-Integral von fuber [a, b) stimmt mit dem Rieman-Integral

∫ b

af(x) dx uberein.

(b) Seien f, g : [a, b) → R zwei Funktionen die uber jedes Intervall [a, x] fur x ∈ (a, b)Rieman-integrierbar sind. Existieren dann die uneigentlichen Rieman-Integralevon f und g uber [a, b) in R und ist{∫ b

a

f(t) dt,

∫ b

a

g(t) dt

}6= {−∞,+∞},

so gilt auch ∫ b

a

(f(t) + g(t)) dt =

∫ b

a

f(t) dt+

∫ b

a

g(t) dt

in R. Sind f und g beide uber [a, b) uneigentlich Rieman-integrierbar, so auchf + g.

(c) Seien c ∈ R und f : [a, b) → R eine Funktion die uber jedes Intervall [a, x]fur x ∈ (a, b) Rieman-integrierbar ist. Existiert dann das uneigentliche Rieman-Integrale von f uber [a, b) in R, so existiert auch das uneigentliche Rieman-

Integral von cf uber [a, b) und ist c 6= 0 oder∫ b

af(t) dt /∈ {−∞,+∞}, so ist

auch ∫ b

a

(cf(t)) dt = c ·∫ b

a

f(t) dt.

(d) Sind f, g : [a, b) → R uber [a, b) uneigentlich Rieman-integrierbar und gilt f(x) ≤g(x) fur alle x ∈ [a, b), so ist auch∫ b

a

f(x) dx ≤∫ b

a

g(x) dx.

Beweis: (a) Da f Rieman-integrierbar ist, ist f insbesondere beschrankt es gibt alsoein C ≥ 0 mit |f(x)| ≤ C fur alle x ∈ [a, b]. Fur jedes x ∈ [a, b] ist damit auch∣∣∣∣∫ b

a

f(t) dt−∫ x

a

f(t) dt

∣∣∣∣ =

∣∣∣∣∫ b

x

f(t) dt

∣∣∣∣ ≤ ∫ b

x

|f(t)| dt ≤ C(b− x)

und dies ergibt

limx→b

∫ x

a

f(t) dt =

∫ b

a

f(t) dt.

(b) Klar nach I.§13.Satz 5.(a).(c) Klar nach I.§13.Satz 5.(b).(d) Klar nach §2.Lemma 5.(c) und I.§13.Lemma 2.(a).

113

Page 114: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 18.5.2011

Man kann die Voraussetzungen in den Teilen (b) und (c) des Lemmas auch so zu-sammenfassen, dass die rechte Seite der jeweiligen Gleichung uberhaupt definiert seinmuss, also nicht die Form ∞−∞ oder 0 · ∞ hat. Auch die partielle Integration laßtsich leicht auf uneigentliche Rieman-Integrale ubertragen.

Satz 3.2 (Partielle Integration fur uneigentliche Integrale)Seien a ∈ R, b ∈ R mit a < b und f, g : [a, b) → R zwei stetig differenzierbare

Funktionen. Weiter nehme an, dass das uneigentliche Rieman-Integral∫ b

af(x)g′(x) dx

und der Funktionsgrenzwert limx→b f(x)g(x) in R existieren. Ist dann(∫ b

a

f(x)g′(x) dx, limx→b

f(x)g(x)

)/∈ {(+∞,+∞), (−∞,−∞)},

so existiert auch das uneigentliche Rieman-Integral∫ b

a

f ′(x)g(x) dx = limx→b

f(x)g(x)− f(a)g(a)−∫ b

a

f(x)g′(x) dx

in R.

Beweis: Fur jedes x ∈ (a, b) gilt nach §2.Satz 12∫ x

a

f ′(t)g(t) dt = f(x)g(x)− f(a)g(a)−∫ x

a

f(t)g′(t) dt,

also folgt die Behauptung mit I.§13.Satz 5.(a,b).

Man kann die Voraussetzungen des Satzes auch so interpretieren das die partielle Inte-gration weiter moglich ist, solange nur die rechte Seite der Formel uberhaupt definiertist. Weiter konnen wir fur die partielle Integration auch wieder die Notation∫ b

a

u′(x)v(x) dx = u(x)v(x)

∣∣∣∣ba

−∫ b

a

u(x)v′(x) dx

verwenden wenn nur der erste Summand als

u(x)v(x)

∣∣∣∣ba

:= limx→b

u(x)v(x)− u(a)v(a)

interpretiert wird. Auch die Substitutionsregel kann man auf unbestimmte Integraleverallgemeinern, die exakte Formulierung ist aber etwas muhsam da es verschiede-ne Falle gibt je nachdem wie die Substitution das betrachtete Intervall abbildet. Aufdie Angabe des entsprechenden Satzes wollen wir hier daher verzichten. In den bisherbehandelten Beispielen konnten wir die Konvergenz uneigentlicher Rieman-Integralefeststellen da wir uber eine Stammfunktion des Integranden verfugten und dann nur

114

Page 115: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 18.5.2011

das Grenzverhalten dieser Stammfunktion untersuchen mussten. Wir wir sehen wer-den, kann man die Konvergenz uneigentlicher Rieman-Integrale manchmal auch dannfeststellen wenn man keine explizite Stammfunktion kennt. Ein solches Beispiel habenwir am Ende des letzten Paragraphen behandelt, wir hatten den Integralsinus

Si(x) =

∫ x

0

sin t

tdt

untersucht und gesehen das der Grenzwert limx→∞ Si(x) existiert. Damit ist sin(t)/tuber [0,∞) uneigentlich Rieman-integrierbar. Zur Berechnung des Grenzwerts fehlenuns hier leider die Hilfsmittel, es stellt sich heraus das∫ ∞

0

sin x

xdx = lim

x→∞Si(x) =

π

2

ist. Mit ahnlichen Uberlegungen wie in §2.5 konnte man sich auch uberlegen das bei-spielsweise das uneigentliche Rieman-Integral

∫∞0

cos(x)/(1+x2) dx konvergiert, es gibtaber einen einfacheren Weg den wir nun beschreiben wollen. Wir werden ein Existenz-kriterium fur uneigentliche Rieman-Integrale herleiten. Dieses ist im wesentlichen eineallgemeine Aussage uber Funktionsgrenzwerte, die wir zunachst explizit formulierenwollen.

Lemma 3.3 (Cauchy-Kriterium fur Funktionsgrenzwerte)Seien K ∈ {R,C}, a ∈ R, b ∈ R mit a < b und f : [a, b) → K eine Funktion. Dann

ist die Funktion f genau dann an der Stelle b konvergent, wenn es fur jedes ε > 0 eins ∈ (a, b) mit |f(x)− f(y)| < ε fur alle x, y ∈ (s, b) gibt.

Beweis: ”=⇒” Andernfalls existiert ein ε > 0 so, dass es fur jedes s ∈ (a, b) stets x, y ∈(s, b) mit |f(x)− f(y)| ≥ ε gibt. Wahle eine Folge (sn)n∈N in (a, b) mit (sn)n∈N −→ b.Fur jedes n ∈ N gibt es dann x2n, x2n+1 ∈ (sn, b) mit |f(x2n) − f(x2n+1)| ≥ ε. Wegensn < x2n, x2n+1 < b fur jedes n ∈ N gilt nach I.§6.Lemma 5.(b) und Aufgabe (21) ausdem letzten Semester auch (xn)n∈N −→ b. Also ist auch die Folge (f(xn))n∈N konvergentund nach I.§6.Lemma 13.(a) auch eine Cauchyfolge. Dies steht im Widerspruch zu|f(x2n)− f(x2n+1)| ≥ ε fur alle n ∈ N.”⇐=” Es reicht zu zeigen, dass fur jede gegen b konvergente Folge (xn)n∈N in [a, b) auchdie Folge (f(xn))n∈N konvergiert, denn dann mussen all diese Folgen nach Aufgabe(21) aus dem letzten Semester gegen denselben Wert konvergieren. Sei also (xn)n∈Neine gegen b konvergente Folge in [a, b). Nach I.§6.Satz 14 mussen wir nur zeigen das(f(xn))n∈N eine Cauchyfolge ist. Sei hierzu ε > 0 gegeben. Dann existiert ein s ∈ (a, b)mit |f(x) − f(y)| < ε fur alle x, y ∈ (s, b). Wegen (xn)n∈N −→ b gibt es weiter einn0 ∈ N mit xn > s fur alle n ≥ n0. Sind also n,m ∈ N mit n,m ≥ n0, so geltenxn, xm ∈ (s, b) und damit auch |f(xn)− f(xm)| < ε.

Da uneigentliche Rieman-Integrale spezielle Funktionsgrenzwerte sind, erhalten wirals ein Korollar auch ein Cauchy-Kriterium fur die Existenz uneigentlicher Rieman-Integrale.

115

Page 116: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 18.5.2011

Satz 3.4 (Cauchy-Kriterium fur uneigentliche Rieman-Integrale)Seien a ∈ R, b ∈ R mit a < b und f : [a, b) → R eine Funktion die uber jedes Intervall[a, x], x ∈ (a, b) Rieman-integrierbar ist. Dann ist das uneigentliche Rieman-Integral∫ b

af(x) dx genau dann konvergent wenn es fur jedes ε > 0 ein s ∈ (a, b) mit∣∣∣∣∫ v

u

f(x) dx

∣∣∣∣ < ε

fur alle u, v ∈ R mit s < u < v < b gibt.

Beweis: Klar nach Lemma 3.

Die Situation ist jetzt sehr ahnlich zu den Reihen∑∞

n=1 an die wir in I.§7 im letztenSemester behandelt hatten. Bei Reihen hatten wir verschiedene Methoden um Kon-vergenz festzustellen etwas das Wurzelkriterium, das Quotientenkriterium oder dasMajorantenkriterium. Fur die Konvergenz von Integralen gibt es nur noch ein Majo-rantenkriterium, und genau wie bei den Reihen bezieht sich dieses auf die absoluteKonvergenz uneigentlicher Integrale.

Definition 3.2: Seien a ∈ R und b ∈ R mit a < b. Eine Funktion f : [a, b) → Rheißt uber [a, b) absolut Rieman integrierbar, wenn |f | uber [a, b) uneigentlich Riemanintegrierbar ist.

Alternativ sagen wir dann auch das das uneigentliche Rieman-Integral∫ b

af(x) dx

absolut konvergiert. Wie bei Reihen sind absolut Rieman-integrierbare Funktionenauch uneigentlich Rieman-integrierbar und auch die Dreiecksungleichung fur Integraleubertragt sich dann auf den Fall uneigentlicher Rieman Integrale.

Lemma 3.5: Seien a ∈ R, b ∈ R mit a < b und f : [a, b) → R eine uber [a, b)absolut Rieman-integrierbare Funktion die uber jedes Intervall [a, x], x ∈ (a, b) Rieman-

integrierbar ist. Dann ist das uneigentliche Rieman-Integral∫ b

af(x) dx auch konvergent

mit ∣∣∣∣∫ b

a

f(x) dx

∣∣∣∣ ≤ ∫ b

a

|f(x)| dx.

Beweis: Sei ε > 0 gegeben. Da∫ b

a|f(t)| dt konvergiert gibt es nach Satz 4 ein s ∈ (a, b)

mit ∫ y

x

|f(t)| dt =

∣∣∣∣∫ y

x

|f(t)| dt∣∣∣∣ < ε

fur alle x, y ∈ (s, b) mit x < y. Fur x, y ∈ (s, b) mit x < y folgt dann mit Lemma 5.(d)auch ∣∣∣∣∫ y

x

f(t) dt

∣∣∣∣ ≤ ∫ y

x

|f(t)| dt < ε,

116

Page 117: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 18.5.2011

und erneut nach Satz 4 konvergiert∫ b

af(t) dt. Ebenfalls nach Lemma 5.(d) gilt fur jedes

x ∈ (a, b) stets ∣∣∣∣∫ x

a

f(t) dt

∣∣∣∣ ≤ ∫ x

a

|f(t)| dt

und mit I.§13.Lemma 1.(e), I.§13.Lemma 2.(a) folgt∣∣∣∣∫ b

a

f(x) dx

∣∣∣∣ =

∣∣∣∣limx→b

∫ x

a

f(t) dt

∣∣∣∣ = limx→b

∣∣∣∣∫ x

a

f(t) dt

∣∣∣∣ ≤ limx→b

∫ x

a

|f(t)| dt =

∫ b

a

|f(x)| dx.

Damit ist auch die Dreiecksungleichung fur uneigentliche Rieman-Integrale bewiesen.

Umgekehrt gibt es aber konvergente, uneigentliche Rieman-Integrale die nicht absolutkonvergent sind. Wir kennen auch schon ein solches Beispiel, das Integral∫ ∞

0

sin x

xdx

ist nicht absolut konvergent. Um dies einzusehen, beachte das fur x ∈ [π/3, 2π/3] stetssin x ≥

√3/2 und fur x ∈ [4π/3, 5π/3] stets | sin x| = − sin x ≥

√3/2 gilt. Fur jedes

n ∈ N haben wir damit auch∫ 2π(n+1)

2πn

∣∣∣∣sin xx∣∣∣∣ ≥ √

3

2(n+ 1),

also auch ∫ 2πn

0

∣∣∣∣sin xx∣∣∣∣ dx ≥ √

3

2

n∑k=1

1

k.

Die Divergenz der harmonischen Reihe liefert schließlich auch∫ ∞

0

∣∣∣∣sin xx∣∣∣∣ dx = +∞.

Das Majorantenkriterium fur uneigentliche Rieman-Integrale ist jetzt eine direkte Fol-gerung des vorigen Lemmas.

Satz 3.6 (Majorantenkriterium fur uneigentliche Rieman-Integrale)Seien a ∈ R, b ∈ R mit a < b, f : [a, b) → R eine Funktion die uber jedes Intervall[a, x] mit x ∈ (a, b) Rieman-integrierbar ist und g : [a, b) → R eine uber [a, b) unei-gentliche Rieman-integrierbare Funktion mit |f(x)| ≤ g(x) fur alle x ∈ [a, b). Dann istauch die Funktion f uber [a, b) absolut Rieman-integrierbar und somit auch uber [a, b)uneigentlich Rieman-integrierbar.

Beweis: Nach §2.Lemma 5.(d) ist auch |f | uber jedes Intervall [a, x] fur x ∈ (a, b)Rieman-integrierbar. Ist ε > 0, so gibt es nach dem Cauchy-Kriterium fur uneigentliche

117

Page 118: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 20.5.2011

Rieman-Integrierbarkeit Satz 4 ein s ∈ (a, b) mit∫ y

xg(t) dt < ε fur alle x, y ∈ (s, b) mit

x < y. Fur x, y ∈ R mit s < x < y < b folgt nach §2.Lemma 5.(c) auch∫ y

x

|f(t)| dt ≤∫ y

x

g(t) dt < ε,

und nach Satz 4 ist |f | uber [a, b) uneigentlich Rieman-integrierbar, d.h. f ist uber[a, b) absolut Rieman-integrierbar. Nach Lemma 5 ist f uber [a, b) auch uneigentlichRieman-integrierbar.

Wir wollen das Majorantenkriterium zur Diskussion einiger Beispiele verwenden. Wirbeginnen mit dem uneigentliche Rieman-Integral∫ ∞

0

cosx

1 + x2dx

und behaupten das dieses absolut konvergiert. Fur alle x ≥ 1 gilt∣∣∣∣ cosx

1 + x2

∣∣∣∣ =| cosx|1 + x2

<1

x2

und da wir schon wissen, dass das Integral∫∞

1dx/x2 konvergiert ist nach dem Ma-

jorantenkriterium auch das Integral∫∞

0cos(x)/(1 + x2) dx absolut konvergent. Das

unsere Majorante hier nur fur x ≥ 1 funktioniert spielt dabei keine Rolle, denn aus derKonvergenz von ∫ ∞

1

∣∣∣∣ cosx

1 + x2

∣∣∣∣ dx <∞

folgt auch die Konvergenz von∫ ∞

0

∣∣∣∣ cosx

1 + x2

∣∣∣∣ dx =

∫ 1

0

∣∣∣∣ cosx

1 + x2

∣∣∣∣ dx+

∫ ∞

1

∣∣∣∣ cosx

1 + x2

∣∣∣∣ dx.

Vorlesung 11, Freitag 20.5.2011

Am Ende der letzten Sitzung hatten wir das Majorantenkriterium fur die absolute,uneigentliche Rieman-Integrierbarkeit einer Funktion hergeleitet, und damit als einBeispiel aus ∫ ∞

1

dx

x2<∞ und

∣∣∣∣ cosx

1 + x2

∣∣∣∣ ≤ 1

x2fur x ≥ 1

auf die absolute Konvergenz des uneigentlichen Rieman Integrals∫ ∞

0

cosx

1 + x2dx

118

Page 119: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 20.5.2011

geschlossen. Beachte das es keine Rolle spielt das wir unseren Integranden nur fur x ≥ 1majorisieren, fur jedes x ≥ 1 gilt∫ x

0

cos t

1 + t2dt =

∫ 1

0

cos t

1 + t2dt+

∫ x

1

cos t

1 + t2dt,

also ist im Grenzwert∫ ∞

0

cosx

1 + x2dx =

∫ 1

0

cosx

1 + x2dx+

∫ ∞

1

cosx

1 + x2dx.

Solche Anfangsstucke kann man immer aus einem uneigentlichen Integral abspalten,wir werden dies im Folgenden gelegentlich tun auch ohne jedesmal gesondert daraufhinzuweisen.

Man kann das Majorantenkriterium auch mit den anderen Rechenregeln kombi-nieren um die Konvergenz auch nicht absolut konvergenter uneigentlicher Integraleeinzusehen. Als ein solches Beispiel wollen wir uns uberlegen, dass das uneigentlicheRieman-Integral ∫ ∞

0

sin(x2) dx

konvergiert. Substituieren wir zunachst s = t2, also dt = ds/(2√s), so ist fur jedes

x >√π/2

∫ x

0

sin(t2) dt =

∫ √π/2

0

sin(t2) dt+1

2

∫ x2

π/2

sin t√tdt

=

∫ √π/2

0

sin(t2) dt− 1

2

cos(x2)

x− 1

4

∫ x2

π/2

cos t

t3/2dt.

Analog zur obigen Uberlegung ist das uneigentliche Rieman-Intergral∫ ∞

π/2

cos t

t3/2dt

absolut konvergent, also auch konvergent. Nach I.§14.Lemma 14 ist auch

limx→∞

∫ x2

π/2

cos t

t3/2dt =

∫ ∞

π/2

cos t

t3/2dt,

und wegen limx→∞ cos(x2)/x = 0 ergibt sich insgesamt die Existenz des sogenanntenFresnel-Integrals ∫ ∞

0

sin(x2) dx =

∫ π/2

0

sin(t2) dt− 1

4

∫ ∞

π/2

cos t

t3/2dt.

119

Page 120: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 20.5.2011

Man kann beweisen, dass ∫ ∞

0

sin(x2) dx =1

2

√π

2

ist. Diese Beispiel zeigt auch das ein uneigentliches Rieman-Integral∫∞

af(x) dx ∈ R

existieren kann, selbst wenn die Funktion f(x) fur x −→ ∞ nicht gegen Null konver-giert. Das Fresnel-Integral ist aber nicht absolut konvergent. Zum Abschluß wollen wirjetzt noch beidseitig uneigentliche Rieman-Integrale diskutieren.

Definition 3.3: Seien a, b ∈ R mit a < b. Wahle irgendein c ∈ R zwischen a und b, d.h.a < c < b. Dann heißt eine Funktion f : (a, b) → R uber (a, b) uneigentlich Riemanintegrierbar wenn f uber (a, c] und uber [c, b) uneigentlich Rieman integrierbar ist. Indiesem Fall nennen wir∫ b

a

f(x) dx :=

∫ c

a

f(x) dx+

∫ b

c

f(x) dx

das uneigentliche Rieman Integral von f uber (a, b). Dieser Wert ist dann unabhangigvom speziell gewahlten c.

Anders gesagt ist ∫ b

a

f(x) dx = limx→a

∫ c

x

f(t) dt+ limx→b

∫ x

c

f(t) dt.

Die beiden Grenzwerte mussen hier einzeln gebildet werden, zum Beispiel reicht die Exi-stenz von limx→∞

∫ x

−xf(t) dt nicht aus, um die Existenz von

∫∞−∞ f(t) dt zu begrunden.

Ein erstes Beispiel dieser beidseitig uneigentlichen Integrale ist∫ ∞

−∞

dx

1 + x2= lim

x→−∞

∫ 0

x

dt

1 + t2+ lim

x→∞

∫ x

0

dt

1 + t2

= arctan(0)− limx→∞

arctan(x) + limx→∞

arctan(x)− arctan(0).

–1.5–1

–0.5

0.51

1.5

–4 –2 2 4

x

Arcus Tangens

Nun ist arctan(0) = 0. Die beiden Arcustangens Grenzwerte kennen wir auch, Siemussen sich nur an den Graphen des Arcustangens erinnern wobei die gestrichelten Li-nien bei y = ±π/2 verlaufen. Somit sind limx→−∞ arctanx = −π/2, limx→∞ arctanx =π/2, und wir haben insgesamt∫ ∞

−∞

dx

1 + x2= −

(−π

2

)+π

2= π.

120

Page 121: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 20.5.2011

Allgemein ist fur alle a, b ∈ R mit ∆ := 4b− a2 > 0 stets

∫ ∞

0

dx

x2 + ax+ b= lim

x→∞

∫ x

0

dt

t2 + at+ b

= limx→∞

2√∆

(arctan

(2x+ a√

)− arctan

(a√∆

))=

π√∆− 2√

∆arctan

(a√∆

)und analog auch ∫ 0

−∞

dx

x2 + ax+ b=

π√∆

+2√∆

arctan

(a√∆

),

also ist insgesamt ∫ +∞

−∞

dx

x2 + ax+ b=

2π√∆.

Ein drittes Beispiel ist das uneigentliche Integral

∫ 1

−1

dx√1− x2

= limx→−1

∫ 0

x

dt√1− t2

+ limx→∞

dt√1− t2

= arcsin(0)− limx→−1

arcsin(x) + limx→1

arcsinx− arcsin(0) = π

da arcsin(0) = 0, arcsin(−1) = −π/2 und arcsin(1) = π/2 sind.

Wissen wir bereits, dass eine Funktion f uber (a, b) uneigentlich Rieman integrierbarist, so konnen wir den Grenzwert auch simultan bilden, also oben zum Beispiel∫ ∞

−∞

dx

1 + x2= lim

x→∞

∫ x

−x

dt

1 + t2= lim

x→∞2 arctanx = π

rechnen. Dies funktioniert nicht wenn f uberhaupt nicht integrierbar ist, zum Beispielkonvergiert

∫∞−∞ x dx nicht obwohl

limx→∞

∫ x

−x

t dt = limx→∞

t2

2

∣∣∣∣x−x

= 0

gilt. Die in diesem Kapitel fur einseitig uneigentliche Integrale hergeleiteten Satze geltenentsprechend auch fur beidseitig uneigentliche Rieman-Integrale, und wir werden sieauch entsprechend verwenden.

$Id: norm.tex,v 1.10 2011/09/16 16:38:31 hk Exp $

121

Page 122: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 20.5.2011

§4 Funktionenfolgen und normierte Raume

In diesem Abschnitt wollen wir nicht mehr einzelne Funktionen sondern ganze Funk-tionenfolgen betrachten. In I.§6 hatten wir bereits Folgen in einer beliebigen Menge de-finiert, und eine Funktionenfolge ist einfach eine Folge in einer Menge von Funktionen.

Definition 4.1 (Funktionenfolgen)Seien M,N zwei Mengen. Dann schreiben wir

MN := {f |f ist eine Abbildung von N nach M}

fur die Menge aller Funktionen von N nach M . Eine Folge von Funktionen von N nachM ist eine Folge (fn)n∈N in der Menge MN .

In diesem Kapitel werden wir hauptsachlich an den beiden Fallen M = R oder M = Cinteressiert sein, wir betrachten also Folgen von reell oder komplexwertigen Funktionen.Ein einfaches Beispiel ist die Funktionenfolge (fn)n∈N wobei fur jedes n ∈ N

fn : R → R;x 7→ ne−nx

ist. Zumeist werden wir solche durch Formeln gegebenen Funktionenfolgen in derverkurzten Form fn(x) := ne−nx, x ∈ R hinschreiben, also als eine Formel in der nals Parameter vorkommt. Die Definitionsmenge M und die Zielmenge N mussen dabeiaber immer klar sein, oder notfalls explizit angegeben werden. Weitere Beispiele indieser Notation sind dann

fn(x) :=1

1 + x2n, fn(x) := sin(nx), fn(x) :=

(1 +

x

n

)n

jeweils als Abbildungen fn : R → R.

4.1 Punktweise Konvergenz

Wir wollen auch so etwas wie eine Konvergenz von Funktionenfolgen haben, und dereinfachste derartige Konvergenzbegriff ist die sogenannte punktweise Konvergenz.

Definition 4.2: Seien M eine Menge, K ∈ {R,C} und (fn)n∈N eine Folge von Funktio-nen von M nach K. Wir sagen, dass die Folge (fn)n∈N punktweise gegen eine Funktionf : M → K konvergiert, wenn

f(x) = limn→∞

fn(x)

fur jedes x ∈M gilt.

Wir nennen die Funktion f dann auch den punktweisen Grenzwert oder die punktweiseGrenzfunktion der Funktionenfolge (fn)n∈N. Gelegentlich spricht man auch verkurzend

122

Page 123: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 20.5.2011

einfach von der Grenzfunktion der Funktionenfolge (fn)n∈N. Gehen wir die obigen Bei-spiele einmal durch. Was ist

limn→∞

ne−nx?

Im Fall x > 0 ist dies klar, wir haben dann

limn→∞

ne−nx =1

xlim

n→∞nxe−nx = 0

nach I.§13.Satz 21.(c). Ist dagegen x ≤ 0, also e−nx ≥ 1 und ne−nx ≥ n fur alle n ∈ N,so ist limn→∞ ne−nx = ∞ nicht konvergent. Als Abbildungen von R nach R ist dieseFunktionenfolge also nicht punktweise konvergent. Auf (0,∞) konvergiert sie dagegenpunktweise gegen die Nullfunktion.

Als ein zweites Beispiel betrachten wir die durch

fn(x) = n√

1 + xn

fur n ≥ 1 gegebene Folge von Funktion von R>0 nach R. Hier tritt bei der Ermittlungdes Grenzwertes wieder eine Fallunterscheidung auf. Ist 0 < x ≤ 1, so haben wir1 ≤ fn(x) ≤ n

√2 fur jedes n ≥ 1, also ist wegen ( n

√2)n∈N −→ 1 auch limn→∞ fn(x) = 1.

Ist dagegen x > 1, so ist

x = n√xn < n

√1 + xn <

n√

2xn =n√

2x

fur jedes n ≥ 1, und es folgt limn→∞ fn(x) = x. Insgesamt ist also

limn→∞

fn(x) =

{1, x ≤ 1,

x, x > 1.

Hier haben wir also eine Folge von analytischen Funktionen, die gegen eine Funktionkonvergiert die nicht einmal mehr uberall differenzierbar ist.

Wir kommen zu einem weiteren Beispiel fur die punktweise Konvergenz von Funk-tionenfolgen, namlich die Folge

fn(x) =1

1 + x2n.

Um den punktweisen Grenzwert dieser Folge auszurechnen mussen wir den Grenzwert

limn→∞

1

1 + x2n

in Abhangigkeit von x berechnen. Hierzu mussen wir erneut einige verschiedene Fallefur x unterscheiden.

Fall 1 Ist |x| < 1, so gilt limn→∞ x2n = 0, also

limn→∞

1

1 + x2n=

1

1 + 0= 1.

123

Page 124: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 20.5.2011

Fall 2 Fur |x| = 1 ist x2n = (x2)n = 1 fur alle n ∈ N, also auch fn(x) = 1/2 fur allen ∈ N, und somit ist limn→∞ fn(x) = 1/2.

Fall 3 Ist schließlich |x| > 1, so ist limx→∞ x2n = limn→∞(x2)n = ∞, also

limn→∞

1

1 + x2n= 0.

Damit haben wir insgesamt

limn→∞

fn(x) = f(x) :=

1, |x| < 1,12, |x| = 1,

0, |x| > 1.

Diesmal ist die Funktionenfolge also auf ganz R punktweise konvergent, wenn auchgegen eine etwas merkwurdige Grenzfunktion. Insbesondere ist dies ein Beispiel einerFolge analytischer Funktionen, die punktweise gegen eine Grenzfunktion konvergiert,die nicht einmal mehr stetig ist.

Wir wollen auch noch ein gutartigeres Beispiel besprechen, die Funktionenfolge

fn(x) =(1 +

x

n

)n

.

Wegen

ln[(

1 +x

n

)n]= n · ln

(1 +

x

n

)= x ·

ln(1 + x

n

)− ln 1

xn

istlim

n→∞ln[(

1 +x

n

)n]= x · ln′(1) = x.

Damit folgt auch

limn→∞

(1 +

x

n

)n

= exp(

limn→∞

ln[(

1 +x

n

)n])= ex.

Also konvergiert die Funktionenfolge (fn)n∈N hier auf ganz R punktweise gegen dieExponentialfunktion. Wie uns diese Beispiele zeigen, vertragt sich die punktweise Kon-vergenz nicht gut mit Stetigkeit oder Differenzierbarkeit von Funktionen. Wir wollenuns jetzt anschauen wie es mit der Integrierbarkeit aussieht. Nehme an wir habena, b ∈ R mit a < b und eine Funktionenfolge fn : [a, b] → R Rieman-integrierbarerFunktionen fn gegeben. Weiter soll die Funktionenfolge (fn)n∈N punktweise gegen eineebenfalls integrierbare Funktion f : [a, b] → R konvergieren. Durch Integrieren erhaltenwir die Zahlenfolge (∫ b

a

fn(x) dx

)n∈N

und es stellt sich die Frage, wann diese Zahlenfolge gegen das Integral∫ b

af(x) dx kon-

vergiert? Auch dies wollen wir uns an einem Beispiel anschauen.

124

Page 125: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 20.5.2011

Sei n ∈ N mit n ≥ 1. Wir definieren dann eine Funk-tion fn : [0, 1] → R wie im nebenstehenden Bild, furx ≥ 1/n und fur x ≤ 1/(n + 1) soll fn(x) = 0 sein.Fur x zwischen 1/(n + 1) und 1/n soll der Graph vonfn ein Dreieck sein, dessen Spitze in der Mitte zwischen1/(n + 1) und 1/n liegt, und dessen Hohe cn so gewahltist, dass die Flache des Dreiecks gleich 1 ist. Auf dieseWeise ist sichergestellt, dass ∫ 1

0

fn(x) dx = 1

fur jedes n ∈ N mit n ≥ 1 gilt. Andererseits konvergiert die Funktionenfolge (fn)n≥1

punktweise gegen die Nullfunktion. Sei namlich ein 0 < x ≤ 1 gegeben. Nach derarchimedischen Eigenschaft der reellen Zahlen gibt es ein n0 ∈ N mit 1/n0 < x, undfur jedes n ∈ N mit n ≥ n0 ist damit auch 1/n ≤ 1/n0 < x, also fn(x) = 0. Die Folge(fn(x))n∈N ist also ab dem Index n0 konstant Null, und somit limn→∞ fn(x) = 0. Furx = 0 ist sogar fn(0) = 0 fur alle n ≥ 1. Somit gilt

limn→∞

fn(x) = 0

fur jedes 0 ≤ x ≤ 1, und unsere Funktionenfolge konvergiert punktweise gegen dieNullfunktion obwohl limn→∞

∫ 1

0fn(x) dx = 1 ist. Hier ist also∫ 1

0

limn→∞

fn(x) dx = 0 6= 1 = limn→∞

∫ 1

0

fn(x) dx.

Tatsachlich kann es sogar passieren, dass eine Folge Rieman-integrierbarer Funktionenpunktweise gegen eine beschrankte, aber nicht mehr Rieman-integrierbare Funktionkonvergiert. Um hierfur ein Beispiel zu konstruieren, ist es an der Zeit einen neuenmengentheoretischen Begriff einzufuhren.

Definition 4.3 (Abzahlbare Mengen)Eine Menge M heißt abzahlbar, wenn entweder M = ∅ ist oder es eine surjektiveAbbildung f : N →M gibt.

Eine nicht leere, abzahlbare Menge kann man also in der Form

M = {f(n)|n ∈ N} beziehungsweise M = {an|n ∈ N}

schreiben. Unmittelbar aus der Definition ergeben sich die folgenden Grundeigenschaf-ten abzahlbarer Mengen:

1. Sind M eine abzahlbare Menge und f : M → N eine surjektive Abbildung, soist auch die Menge N abzahlbar. Ist namlich M = ∅, so ist auch N = ∅ undandernfalls existiert eine surjektive Abbildung g : N →M und nach I.§3.Lemma2.(c) ist auch f ◦ g : N → N surjektiv. Damit ist N in beiden Fallen eineabzahlbare Menge.

125

Page 126: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 20.5.2011

2. Ist M eine abzahlbare Menge und N ⊆M eine Teilmenge, so ist auch N abzahl-bar. Dies ist klar wenn N = ∅ ist, wir konnen also N 6= ∅ annehmen und einElement y ∈ N wahlen. Dann ist

f : M → N ;x 7→

{x, x ∈ N,y, x /∈ N

eine surjektive Abbildung und nach Aussage (1) ist N wieder abzahlbar.

3. SindM,N zwei abzahlbare Mengen, so ist auch die VereinigungM∪N abzahlbar.Ist M = ∅ oder N = ∅, so ist M ∪N = N oder M ∪N = M und die Behauptungist klar. Andernfalls gibt es surjektive Abbildungen f : N →M , g : N → N , undwir erhalten die surjektive Abbildung

h : N →M ∪N ;n 7→

{f(

n2

), n ist gerade,

g(

n−12

), n ist ungerade,

d.h. auch in diesem Fall ist M ∪N abzahlbar.

4. Die Menge N × N ist abzahlbar. Dies ist klar, man kann N × N beispielsweisenach Diagonalen geordnet durchlaufen, dies haben wir schon in I.§7.3 bei derBesprechung des Cauchy-Produkts von Reihen gesehen.

5. Sind M,N zwei abzahlbare Mengen, so ist auch das cartesische Produkt M ×Nabzahlbar. IstM = ∅ oder N = ∅, so istM×N = ∅. Andernfalls gibt es surjektiveAbbildungen f : N →M , g : N → N , und damit ist auch

h : N× N →M ×N ; (n,m) 7→ (f(n), g(m))

eine surjektive Abbildung. Nach (4) und (1) ist damit auch M ×N abzahlbar.

6. Wir konnen Aussage (3) noch weiter verallgemeinern. Angenommen wir habeneine Indexmenge I und fur jeden Index i ∈ I eine Menge Mi gegeben. Dannkonnen wir die Vereinigung⋃

i∈I

Mi := {x|∃(i ∈ I) : x ∈Mi}

bilden, d.h. die Menge aller mathematischen Objekte die in einer der MengenMi, i ∈ I vorkommen. Sind dann die Indexmenge I abzahlbar und ist zusatzlichjede der Mengen Mi fur i ∈ I abzahlbar, so ist auch die Vereinigung

⋃i∈I Mi

abzahlbar. Um dies einzusehen, betrachten wir die Hilfsmenge

J := {i ∈ I|Mi 6= ∅}

und dann ist offenbar M :=⋃

i∈I Mi =⋃

i∈J Mi. Wegen J ⊆ I ist nach Aussage(2) auch die Menge J abzahlbar. Ist dabei J = ∅, so ist auch M = ∅ und ins-besondere ist M dann abzahlbar. Andernfalls existiert eine surjektive Abbildung

126

Page 127: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 20.5.2011

f : N → J . Weiter ist Mi fur jedes i ∈ J eine nicht leere, abzahlbare Menge, alsogibt es eine surjektive Abbildung gi : N → Mi. Wir behaupten jetzt, dass dannauch

h : N× N →M ; (n,m) 7→ gf(n)(m)

eine surjektive Abbildung ist. Sei namlich x ∈ M gegeben. Dann existiert eini ∈ J mit x ∈Mi und da gi surjektiv ist, existiert weiter einm ∈ N mit x = gi(m).Die Surjektivitat von f liefert ein n ∈ N mit i = f(n) und insgesamt ist damith(n,m) = gf(n)(m) = gi(m) = x. Nach den Aussagen (4) und (1) ist damit auchM abzahlbar.

Die zuletzt bewiesene Aussage wird oft als”abzahlbare Vereinigungen abzahlbarer

Mengen sind abzahlbar“ zusammengefasst. Die Menge N ist trivialerweise abzahlbarund ebenso ist auch

−N = {−n|n ∈ N}offenbar abzahlbar. Nach Aussage (3) sind damit auch die ganzen Zahlen

Z = N ∪ −N

abzahlbar. Weiter ergibt (1) das fur jedes q ∈ N mit q ≥ 1 die Menge{p

q

∣∣∣∣ p ∈ Z}

aller Bruche mit Nenner q abzahlbar ist, d.h. nach (6) ist auch die Menge

Q =⋃q≥1

{p

q

∣∣∣∣ p ∈ Z}

der rationalen Zahlen abzahlbar. Damit konnen wir jetzt recht explizit ein Beispieleiner Folge Rieman-integrierbarer Funktionen konstruieren, die punktweise gegen einenicht Rieman-integrierbare Funktion konvergiert. Wie eben gesehen ist Q abzahlbar,wir konnen also Q = {rn|n ∈ N} schreiben. Fur jedes n ∈ N betrachten wir dieFunktion

fn : [0, 1] → R;x 7→

{1, x ∈ {r1, r2, . . . , rn},0, x /∈ {r1, r2, . . . , rn}.

Dann ist fn an hochstens n + 1 vielen Stellen von der Nullfunktion verschieden, undinsbesondere Rieman-integrierbar. Wir behaupten jetzt, dass fur jedes x ∈ [0, 1] stets

limn→∞

fn(x) =

{1, x ∈ Q,0, x /∈ Q

gilt, die Funktionenfolge (fn)n∈N konvergiert also punktweise gegen die schon fruherbetrachtete Dirichlet-Funktion. Sei x ∈ [0, 1]. Ist x ∈ Q, so existiert ein n0 ∈ N mitx = rn0 und fur jedes n ≥ n0 ist damit fn(x) = 1, also auch (fn(x)) −→ 1. Ist dagegenx /∈ Q, also x 6= rn fur jedes n ∈ N, so ist fn(x) = 0 fur jedes n ∈ N, also (fn(x)) −→ 0.Wie wir schon wissen, ist die Dirichlet Funktion nicht Rieman-integrierbar.

127

Page 128: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 25.5.2011

4.2 Gleichmaßige Konvergenz

Wie wir an den Beispielen des letzten Abschnitts gesehen haben, ist die punktweiseKonvergenz von Funktionenfolgen fur viele Zwecke ein zu schwacher Konvergenzbe-griffs, punktweise Grenzwerte stetiger Funktionen mussten nicht einmal mehr stetigsein. In diesem Abschnitt wollen wir einen besseren Konvergenzbegriff fur Funktio-nenfolgen behandeln, bei dem derartige Effekte nicht mehr auftreten konnen. Was wirvermeiden wollen kann man gut am Beispiel der Funktionenfolge fn(x) = ne−nx sehen.Fur x > 0 konvergierte diese punktweise gegen die Nullfunktion. Bei naher an Null her-anruckenden x braucht man aber immer großere Werte von n bis ne−nx endlich kleinwird. Bei dem nun zu definierenden Konvergenzbegriff wird ein derartiges Verhaltenexplizit ausgeschlossen.

Definition 4.4 (Gleichmaßige Konvergenz von Funktionenfolgen)Seien K ∈ {R,C} und M eine Menge. Eine Folge (fn)n∈N von Funktionen von M nachK konvergiert dann gleichmaßig gegen eine Funktion f : M → K wenn es fur jedesε > 0 stets ein n0 ∈ N mit

|fn(x)− f(x)| < ε

fur alle n ∈ N mit n ≥ n0 und alle x ∈M gibt.

In Quantorenschreibweise wird dies zu

∀(ε > 0)∃(n0 ∈ N)∀(x ∈M)∀(n ≥ n0) : |fn(x)− f(x)| < ε.

Einige unserer Beispiele punktweiser Konvergenz aus dem vorigen Abschnitt sind inWahrheit auch gleichmaßig konvergent. Wir beginnen mit der Funktionenfolge

fn : [1,∞) → R;x 7→ ne−nx.

Beachte das wir diesmal diese Funktionen nur fur x ≥ 1 betrachten, dies ist ein we-sentlicher Unterschied zum Fall x > 0. Wir behaupten das die Funktionenfolge (fn)n∈Ngleichmaßig gegen die Nullfunktion konvergiert. Sei hierzu ein ε > 0 gegeben. Wegenne−n −→ 0 existiert dann ein n0 ∈ N mit ne−n < ε fur alle n ≥ n0. Sind also n ∈ Nmit n ≥ n0 und x ∈ R mit x ≥ 1 gegeben, so ist auch

|fn(x)| = ne−nx ≤ ne−n < ε.

Damit konvergiert die Funktionenfolge (fn)n∈N auf [1,∞) gleichmaßig gegen die Null-funktion.

Vorlesung 12, Mittwoch 25.5.2011

Am Ende der letzten Sitzung hatten wir den Begriff der gleichmaßigen Konvergenzeiner Funktionenfolge eingefuhrt, und wir wollen jetzt zwei weitere Beispiele hierzu

128

Page 129: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 25.5.2011

besprechen, ein konkretes Beispiel und eine allgemeinere Beispielklasse. Wir wollenmit der Funktionenfolge

fn : [a, b] → R;x 7→(1 +

x

n

)n

beginnen, wobei a, b ∈ R mit a < b vorgegeben sind. Schon im Abschnitt uber diepunktweise Konvergenz hatten wir eingesehen, dass diese Funktionenfolge punktwei-se gegen die Exponentialfunktion konvergiert. Wir wollen jetzt zusatzlich beweisen,dass die Konvergenz auf dem Intervall [a, b] sogar gleichmaßig ist. Wir folgen unseremVorgehen bei der Besprechung der punktweisen Konvergenz, nur mussen wir diesmaletwas genauere quantitative Betrachtungen anstellen. Zunachst gibt es ein n1 ∈ N mit1+a/n > 0 fur alle n ≥ n1 und fur n ≥ n1, x ∈ [a, b] ist dann auch 1+x/n ≥ 1+a/n > 0.Wir konnen also eine Funktionenfolge (gn)n≥n1 auf [a, b] durch

gn(x) := n ln(1 +

x

n

)definieren. Wir behaupten, dass diese Funktionenfolge auf [a, b] gleichmaßig gegen dieidentische Funktion konvergiert. Sei also ε > 0 gegeben. Wegen limx→1(1 − 1/x) = 0gibt es ein 0 < δ < 1 mit |1 − 1/x| < ε/(|a| + |b|) fur alle x ∈ R>0 mit |x − 1| < δ.Wieder nach der archimedischen Eigenschaft der reellen Zahlen gibt es eine naturlicheZahl n0 ∈ N mit

n0 > max

{|a|δ,|b|δ, n1

}.

Seien jetzt n ∈ N mit n ≥ n0 und x ∈ [a, b] gegeben. Dann haben wir

0 < 1− δ < 1− |a|n0

≤ 1− |a|n≤ 1 +

a

n≤ 1 +

x

n≤ 1 +

b

n≤ 1 +

|b|n≤ 1 +

|b|n0

< 1 + δ

und nach dem Mittelwertsatz I.§14.Satz 10.(a) existiert ein ξ zwischen 1 und 1 + x/nmit

gn(x) = n ln

(1 +

1

n

)= n · 1

ξ· xn

=x

ξ,

und somit ist wegen |x| ≤ |a|+ |b| und 1− δ < ξ < 1 + δ auch

|gn(x)− x| = |x| ·∣∣∣∣1ξ − 1

∣∣∣∣ < |x|ε|a|+ |b|

≤ ε.

Damit haben wir die gleichmaßige Konvergenz der Folge (gn)n≥n1 gegen die identischeFunktion eingesehen. Durch Anwendung der Exponentialfunktion konnen wir hierausauf unsere eigentliche Behauptung schließen. Zunachst gibt es namlich ein n2 ∈ N mitn2 ≥ n1 und |gn(x)− x| < 1 fur alle n ≥ n2, x ∈ [a, b], und damit ist auch

a− 1 ≤ x− 1 < gn(x) < x+ 1 ≤ b+ 1

129

Page 130: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 25.5.2011

fur alle n ≥ n2, x ∈ [a, b]. Sei wieder ε > 0 gegeben. Nach §2.Lemma 7 existiert einδ > 0 so, dass fur alle x, y ∈ [a − 1, b + 1] mit |x − y| < δ stets |ex − ey| < ε gilt.Mit der eben bewiesenen Hilfsaussage existiert weiter ein n3 ∈ N mit n3 ≥ n1 und|gn(x)− x| < δ fur alle n ≥ n3, x ∈ [a, b]. Setze n0 := max{n2, n3}. Sind dann n ≥ n0

und x ∈ [a, b], so haben wir x, gn(x) ∈ [a− 1, b+ 1] mit |gn(x)− x| < δ, also ist auch

∣∣∣(1 +x

n

)n

− ex∣∣∣ =

∣∣egn(x) − ex∣∣ < ε.

Damit ist die gleichmaßige Konvergenz der Funktionenfolge (fn)n∈N gegen die Expo-nentialfunktion auf [a, b] bewiesen.

Wir kommen zu einem letzten Beispiel, genauer zu einer recht großen Beispiel-klasse, zur gleichmaßigen Konvergenz. Wir starten mit einer vollig beliebigen, stetigenFunktion f : [0, 1] → R. Fur jedes n ∈ N ist dann

fn : [0, 1] → R;x 7→n∑

k=0

(n

k

)f

(k

n

)xk(1− x)n−k

ein Polynom mit grad(fn) ≤ n, genannt das n-te Bernstein-Polynom zur Funktion f .Die Bernstein Polynome fn stellen sich als Approximationen der stetigen Funktion fheraus, die Funktionenfolge (fn)n∈N konvergiert gleichmaßig gegen die Funktion f . Inder Vorlesung hatten wir auf die Verifikation dieser Tatsache verzichtet, hier wollenwir das Argument dagegen vollstandig ausfuhren. Wir schauen uns zunachst einigeeinfache, explizite Beispiele an. Sei zunachst f(x) = c konstant. Fur jedes n ∈ N ergibtsich dann fur alle x ∈ [0, 1]

fn(x) =n∑

k=0

(n

k

)f

(k

n

)xk(1− x)n−k = c

n∑k=0

(n

k

)xk(1− x)n−k = c(x+ 1− x)n = c,

d.h. es ist fn = f . Als ebenso einfach stellt sich die identische Funktion f(x) = xheraus. Fur diese rechnen wir fur n ∈ N mit n ≥ 1 und x ∈ [0, 1]

fn(x) =n∑

k=0

(n

k

)f

(k

n

)xk(1− x)n−k =

n∑k=0

(n

k

)k

nxk(1− x)n−k

=n∑

k=1

(n− 1

k − 1

)xk(1− x)n−k = x ·

n−1∑k=0

(n− 1

k

)xk(1− x)n−1−k = x,

d.h. fur n ≥ 1 gilt fn = f . Wir schauen uns auch noch den Fall eines quadratischenPolynoms f an, und zwar f(x) = x(1 − x). Fur n ∈ N mit n ≥ 2 und x ∈ [0, 1] gilt

130

Page 131: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 25.5.2011

dann

fn(x) =n∑

k=0

(n

k

)f

(k

n

)xk(1− x)n−k

=n∑

k=0

(n

k

)k

n· n− k

nxk(1− x)n−k =

n−1∑k=1

(n− 2

k − 1

)n− 1

nxk(1− x)n−k

=

(1− 1

n

)x(1− x)

n−2∑k=0

(n− 2

k

)xk(1− x)n−2−k =

(1− 1

n

)x(1− x),

also fn = (1− 1/n)f . Mit diesen Formeln konnen wir jetzt auch leicht berechnen wassich fur ein allgemeines quadratisches Polynom f(x) = ax2 + bx + c ergibt. Schreibenwir

f(x) = −ax(1− x) + (a+ b)x+ c

so folgt mit den schon bewiesenen Formeln fur jedes n ∈ N mit n ≥ 2 und jedesx ∈ [0, 1]

fn(x) = −a(

1− 1

n

)x(1− x) + (a+ b)x+ c =

(1− 1

n

)ax2 +

(an

+ b)x+ c,

also auch

f(x)− fn(x) =a

nx2 − a

nx =

a

nx(1− x), und somit |fn(x)− f(x)| ≤ |a|

n.

Damit ist die Folge (fn)n∈N der Bernstein Polynome eines quadratischen Polynoms fgleichmaßig konvergent gegen f . Dieses Ergebnis konnen wir jetzt auf beliebige stetigeFunktionen auf [0, 1] ausdehnen, und durch eine Umskalierung gilt die Aussage auchauf beliebigen Intervallen [a, b].

Satz 4.1 (Weierstraßscher Approximationssatz)Seien a, b ∈ R mit a < b und sei f : [a, b] → R eine stetige Funktion. Fur jedes n ∈ Nist dann das Bernstein Polynom

fn : [a, b] → R;x 7→ 1

(b− a)n

n∑k=0

(n

k

)f

((1− k

n

)a+

k

nb

)(x− a)k(b− x)n−k

ein Polynom mit grad(fn) ≤ n und die Folge (fn)n∈N konvergiert gleichmaßig gegen f .

Beweis: Zunachst behandeln wir den Fall a = 0, b = 1. Sei ε > 0 gegeben. Nach§2.Lemma 7 existiert ein δ > 0 mit |f(x) − f(y)| < ε/2 fur alle x, y ∈ [0, 1] mit|x − y| < δ. Nach I.§13.Satz 13 ist f auch beschrankt, es gibt also ein C > 0 mit

131

Page 132: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 25.5.2011

|f(x)| ≤ C fur alle x ∈ [0, 1]. Schließlich gibt es nach der archimedischen Eigenschaftder reellen Zahlen auch noch ein n0 ∈ N mit

n0 >4C

δ2εund n0 ≥ 2.

Wir zeigen jetzt, dass |fn(x) − f(x)| < ε fur alle n ≥ n0 und alle x ∈ [0, 1] ist. Seienalso n ∈ N mit n ≥ n0 und x ∈ [0, 1] gegeben. Dann ist

fn(x)− f(x) =n∑

k=0

(n

k

)f

(k

n

)xk(1− x)n−k −

n∑k=0

(n

k

)f(x)xk(1− x)n−k

=n∑

k=0

(n

k

)(f

(k

n

)− f(x)

)xk(1− x)n−k

und somit auch

|fn(x)− f(x)| ≤n∑

k=0

(n

k

) ∣∣∣∣f (kn)− f(x)

∣∣∣∣ xk(1− x)n−k.

Wir schreiben die Indexmenge {0, 1, . . . , n} als die disjunkte Vereinigung der beidenMengen

I :=

{k ∈ {0, . . . , n} :

∣∣∣∣x− k

n

∣∣∣∣ < δ

},

J :=

{k ∈ {0, . . . , n} :

∣∣∣∣x− k

n

∣∣∣∣ ≥ δ

}.

Fur k ∈ I haben wir |f(k/n)− f(x)| < ε/2, also ist∑k∈I

(n

k

) ∣∣∣∣f (kn)− f(x)

∣∣∣∣ xk(1− x)n−k ≤ ε

2

∑k∈I

(n

k

)xk(1− x)n−k

≤ ε

2

n∑k=0

(n

k

)xk(1− x)n−k =

ε

2.

Nun sei k ∈ J . Dann ist |x− k/n| ≥ δ und |f(k/n)− f(x)| ≤ |f(k/n)|+ |f(x)| ≤ 2C,also wegen (

x− k

n

)2

≥ δ2 auch

∣∣∣∣f (kn)− f(x)

∣∣∣∣ ≤ 2C ≤ 2C

δ2

(x− k

n

)2

,

und dies ergibt∑k∈J

(n

k

) ∣∣∣∣f (kn)− f(x)

∣∣∣∣ xk(1− x)n−k ≤ 2C

δ2

∑k∈J

(n

k

)(x− k

n

)2

xk(1− x)n−k

≤ 2C

δ2

n∑k=0

(n

k

)(x− k

n

)2

xk(1− x)n−k.

132

Page 133: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 25.5.2011

Die Summe auf der rechten Seite dieser Ungleichung ist jetzt gleich pn(x) wobei p(t) :=(x− t)2 = t2 − 2xt+ x2 ist. Daher ist diese Summe gleich

n∑k=0

(n

k

)(x− k

n

)2

xk(1− x)n−k =

(1− 1

n

)x2 +

(1

n− 2x

)x+ x2 =

1

nx(1− x) ≤ 1

n,

und es folgt ∑k∈J

(n

k

) ∣∣∣∣f (kn)− f(x)

∣∣∣∣ xk(1− x)n−k ≤ 2C

nδ2≤ 2C

n0δ2<ε

2.

Insgesamt ist damit

|fn(x)− f(x)| < ε

2+ε

2= ε.

Damit ist die gleichwertige Konvergenz von fn gegen f in diesem Fall bewiesen. Wirkommen zum allgemeinen Fall, seien also a, b ∈ R mit a < b und f : [a, b] → R einestetige Funktion. Wir erhalten die stetige Funktion

f : [0, 1] → R;x 7→ f((1− x)a+ xb)

und fur jedes n ∈ N ist das n-te Bernstein Polynom von f gegeben als

fn(x) =n∑

k=0

(n

k

)f

(k

n

)xk(1− x)n−k =

n∑k=0

(n

k

)f

((1− k

n

)a+

k

nb

)xk(1− x)n−k

= fn((1− x)a+ xb)

fur alle x ∈ [0, 1]. Ist nun ε > 0, so wissen wir bereits, dass es ein n0 ∈ N mit

|fn(x) − f(x)| < ε fur alle n ≥ n0, x ∈ [0, 1] gibt. Sind also n ∈ N mit n ≥ n0 undx ∈ [a, b], so schreibe x = (1− t)a+ tb fur ein t ∈ [0, 1] und erhalte

|fn(x)− f(x)| = |fn(t)− f(t)| < ε.

Damit ist (fn)n∈N auch in diesem Fall gleichmaßig konvergent gegen f .

Wir kommen jetzt zu einer ganzen Serie allgemeiner theoretischer Aussagen uber diegleichmaßige Konvergenz. In der Vorlesung wurden die Beweise dieser Aussagen nurteilweise skizziert, in diesem Skript sind dagegen alle Beweise vollstandig enthalten.Wir beginnen mit einem Cauchy-Kriterium fur die gleichmaßige Konvergenz.

Lemma 4.2 (Cauchy-Kriterium fur die gleichmaßige Konvergenz)Seien K ∈ {R,C}, M eine Menge und (fn)n∈N eine Funktionenfolge von Funktionen

von M nach K. Dann ist die Folge (fn)n∈N genau dann gleichmaßig konvergent gegeneine Funktion f : M → K wenn es fur jedes ε > 0 einen Index n0 ∈ N mit |fn(x) −fm(x)| < ε fur alle n,m ∈ N mit n,m ≥ n0 und alle x ∈M gibt.

133

Page 134: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 25.5.2011

Beweis: ”=⇒” Sei ε > 0. Dann existiert ein n0 ∈ N mit |fn(x) − f(x)| < ε/2 fur allen ∈ N mit n ≥ n0 und alle x ∈ M . Nun seien n,m ∈ N mit n,m ≥ n0 und x ∈ Mgegeben. Dann gilt

|fn(x)− fm(x)| ≤ |fn(x)− f(x)|+ |fm(x)− f(x)| < ε

2+ε

2= ε.

”⇐=” Sei x ∈M . Ist ε > 0, so existiert n0 ∈ N mit |fn(t)−fm(t)| < ε fur alle n,m ∈ Nmit n,m ≥ n0 und alle t ∈ M , also ist insbesondere |fn(x) − fm(x)| < ε fur allen,m ∈ N mit n,m ≥ n0. Damit ist (fn(x))n∈N eine Cauchyfolge, und nach I.§6.Satz 14existiert der Grenzwert

f(x) := limn→∞

fn(x).

Dies definiert eine Funktion f : M → K, und wir zeigen jetzt, dass die Funktionenfolge(fn)n∈N gleichmaßig gegen f konvergiert. Sei hierzu wieder ein ε > 0 gegeben. Danngibt es ein n0 ∈ N mit |fn(x)− fm(x)| < ε/2 fur alle n,m ≥ n0 und alle x ∈ M . Seienn ∈ N mit n ≥ n0 und x ∈M . Dann haben wir

|fn(x)− f(x)| =∣∣∣fn(x)− lim

m→∞fm(x)

∣∣∣ = limm→∞

|fn(x)− fm(x)| ≤ ε

2< ε.

Damit konvergiert die Folge (fn)n∈N gleichmaßig gegen f .

Die gleichmaßige Konvergenz hat wesentlich bessere Erhaltungseigenschaften als diepunktweise Konvergenz, von denen wir jetzt einige vorfuhren wollen. Wir beginnen miteiner Hilfsaussage uber gleichmaßig konvergente Folgen beschrankter Funktionen.

Lemma 4.3 (Gleichmaßige Grenzfunktionen beschrankter Funktionen)Seien K ∈ {R,C}, M eine Menge und (fn)n∈N eine Folge beschrankter Funktionen vonM nach K. Weiter konvergiere die Funktionenfolge (fn)n∈N gleichmaßig gegen eineFunktion f : M → K. Dann ist auch die Grenzfunktion f beschrankt.

Beweis: Es gibt ein n0 ∈ N mit |fn(x) − f(x)| < 1 fur alle n ≥ n0 und alle x ∈ M .Da fn0 beschrankt ist, gibt es weiter eine Konstante C ∈ R mit |fn0(x)| ≤ C fur allex ∈M . Fur jedes x ∈M folgt damit auch

|f(x)| ≤ |f(x)− fn0(x)|+ |fn0(x)| < 1 + C,

und somit ist auch f beschrankt.

Ebenso hat eine gleichmaßig konvergente Folge stetiger Funktionen wieder eine stetigeGrenzfunktion. Als Vorbereitung hierzu beweisen wir eine noch allgemeinere Aussageuber die Vertraglichkeit von gleichmaßiger Konvergenz mit Funktionsgrenzwerten.

Lemma 4.4: Seien K,L ∈ {R,C}, D ⊆ K und a ∈ K ein Haufungspunkt von D.Weiter sei (fn)n∈N eine Funktionenfolge von Funktionen D → L, die gleichmaßig gegen

134

Page 135: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 25.5.2011

eine Funktion f : D → L konvergiert. Fur jedes n ∈ N sei die Funktion fn an derStelle a konvergent gegen ein bn ∈ L. Dann ist die Folge (bn)n∈N in L konvergent undes existiert der Funktionsgrenzwert

limx→a

f(x) = limn→∞

bn.

Beweis: Wir zeigen zunachst, dass die Folge (bn)n∈N eine Cauchyfolge in L ist. Seihierzu ε > 0 gegeben. Nach Lemma 2 gibt es ein n0 ∈ N mit |fn(x)− fm(x)| < ε/2 furalle n,m ≥ n0 und alle x ∈ D. Mit den Rechenregeln fur Funktionsgrenzwerte, genauerI.§13.Satz 5.(a,b), I.§13.Lemma 1.(e) und I.§13.Lemma 2.(a), folgt fur alle n,m ≥ n0

auch

|bn − bm| =∣∣∣limx→a

fn(x)− limx→a

fm(x)∣∣∣ =

∣∣∣limx→a

(fn(x)− fm(x))∣∣∣

= limx→a

|fn(x)− fm(x)| ≤ ε

2< ε.

Damit ist (bn)n∈N eine Cauchyfolge in L und nach I.§6.Satz 14 ist (bn)n∈N in L kon-vergent. Sei b ∈ L der Grenzwert der Folge (bn)n∈N. Wir mussen jetzt zeigen, dass dieFunktion f an der Stelle a gegen b konvergiert, und hierzu wollen wir die Charakteri-sierung von Funktionsgrenzwerten aus I.§13.Lemma 1.(f) verwenden. Wir mussen unsalso wieder ein ε > 0 vorgeben. Es gibt n1 ∈ N mit |fn(x)− f(x)| < ε/3 fur alle n ≥ n1

und alle x ∈ D, sowie n2 ∈ N mit |bn−b| < ε/3 fur alle n ≥ n2. Setze n := max{n1, n2}.Da fn an der Stelle a gegen bn konvergiert, gibt es dann ein δ > 0 so, dass fur allex ∈ D mit 0 < |x− a| < δ im Fall a ∈ K beziehungsweise x > δ im Fall a = +∞ oderx < −δ im Fall a = −∞, stets |fn(x)− bn| < ε/3 gilt. Sei jetzt x ∈ D solch ein x. Dannhaben wir

|f(x)− b| ≤ |f(x)− fn(x)|+ |fn(x)− bn|+ |bn − b| < ε

3+ε

3+ε

3= ε.

Damit konvergiert f an der Stelle a gegen b.

In Kurzform konnen wir die Aussage des Lemmas als

limx→a

limn→∞

fn(x) = limn→∞

limx→a

fn(x)

schreiben, es handelt sich also um eine Aussage uber das sogenannte”Vertauschen

von Grenzprozessen“. Wie unsere Beispiele zur punktweisen Konvergenz gezeigt habenist solch ein Vertauschen keinesfalls immer moglich, man benotigt immer eine spezielleBegrundung. Die Problematik tritt schon bei sehr einfachen Beispielen deutlich hervor,haben wir zum Beispiel die doppelt indizierte Folge

a : N× N → R; (n,m) 7→

{1, n ≥ m,

0, n < m,

135

Page 136: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 25.5.2011

so gelten offenbar

limm→∞

anm = 0 fur alle n ∈ N und limn→∞

anm = 1 fur alle m ∈ N,

alsolim

n→∞lim

m→∞anm = 0 6= 1 = lim

m→∞lim

n→∞anm.

Mit unserem Lemma uber Funktionsgrenzwerte ausgerustet ist es jetzt leicht zu zei-gen, dass eine gleichmaßig konvergente Folge stetiger Funktionen auch einen stetigenGrenzwert hat.

Satz 4.5: Seien K ∈ {R,C}, D ⊆ K und (fn)n∈N eine Funktionenfolge von D nachK, die gleichmaßig gegen eine Funktion f : D → K konvergiert.

(a) Ist x0 ∈ D und ist fn fur jedes n ∈ N in x0 stetig, so ist auch f in x0 stetig.

(b) Ist fn fur jedes n ∈ N stetig, so ist auch die Grenzfunktion f stetig.

Beweis: (a) Ist x0 kein Haufungspunkt von D, so ist die Aussage trivial. Ist x0 dagegenein Haufungspunkt von D, so gilt limx→x0 fn(x) = fn(x0) fur jedes n ∈ N. Mit Lemma4 folgt damit auch

limx→x0

f(x) = limn→∞

fn(x0) = f(x0),

d.h. auch die Funktion f ist in x0 stetig.(b) Klar nach (a).

Als nachstes kommen wir zu Integrierbarkeit. Wir wollen einsehen das zum einen einegleichmaßig konvergente Folge Rieman-integrierbarer Funktionen auch eine Rieman-integrierbare Grenzfunktion hat und das zum anderen auch die Folge der Integrale un-serer Funktionenfolge gegen das Integral der Grenzfunktion konvergiert, bei gleichmaßi-ger Konvergenz sind Integration und der Limes miteinander vertauschbar.

Satz 4.6: Seien a, b ∈ R mit a < b und fn : [a, b] → R fur n ∈ N eine gleichmaßig gegeneine Funktion f : [a, b] → R konvergente Folge Rieman-integrierbarer Funktionen.Dann ist auch die Grenzfunktion f Rieman-integrierbar und es gilt∫ b

a

f(x) dx = limn→∞

∫ b

a

fn(x) dx.

Beweis: Zunachst ist f : [a, b] → R nach Lemma 3 uberhaupt beschrankt. Wir zeigenzuerst das die Funktion f Rieman-integrierbar ist. Sei hierzu ein ε > 0 gegeben. Dannexistiert ein n0 ∈ N mit

|fn(x)− f(x)| < ε

3(b− a)

136

Page 137: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 25.5.2011

fur alle n ≥ n0, x ∈ [a, b]. Da fn0 Rieman-integrierbar ist, gibt es nach §2.Lemma 3eine Zerlegung α = (t0, . . . , tr) von [a, b] mit S(fn0 ;α) − S(fn0 ;α) < ε/3. Fur jedes1 ≤ i ≤ r setzen wir

Mi := sup fn0([ti−1, ti]) und Mi := sup f([ti−1, ti])

und haben dann

S(fn0 ;α) =r∑

i=1

Mi(ti − ti−1) und S(f ;α) =r∑

i=1

Mi(ti − ti−1).

Sei 1 ≤ i ≤ r. Fur jedes x ∈ [ti−1, ti] ist dann

f(x) = fn0(x) + f(x)− fn0(x) ≤ fn0(x) + |fn0(x)− f(x)| < fn0(x) +ε

3(b− a)

≤ Mi +ε

3(b− a),

d.h. es gilt Mi ≤ Mi + ε/(3(b− a)). Daraus folgt

S(f ;α) =r∑

i=1

Mi(ti − ti−1) ≤r∑

i=1

(Mi +

ε

3(b− a)

)(ti − ti−1)

=r∑

i=1

Mi(ti − ti−1) +ε

3(b− a)

r∑i=1

(ti − ti−1) = S(fn0 ;α) +ε

3.

Analog ergibt sich auch S(f ;α) ≥ S(fn0 ;α)− ε/3 und insgesamt ist

S(f ;α)− S(f ;α) ≤ S(fn0 ;α) +ε

3− S(fn0 ;α) +

ε

3<ε

3+ε

3+ε

3= ε.

Wieder nach §2.Lemma 3 ist f Rieman-integrierbar.Wir kommen jetzt zur Aussage uber die Konvergenz der Integrale. Sei wieder ε > 0

gegeben. Dann existiert ein n0 ∈ N mit |fn(x) − f(x)| < ε/(2(b − a)) fur alle n ≥ n0

und alle x ∈ [a, b]. Sei n ∈ N mit n ≥ n0. Dann haben wir∣∣∣∣∫ b

a

fn(x) dx−∫ b

a

f(x) dx

∣∣∣∣ =

∣∣∣∣∫ b

a

(fn(x)− f(x)) dx

∣∣∣∣ ≤ ∫ b

a

|fn(x)− f(x)| dx

≤∫ b

a

ε

2(b− a)dx =

ε

2< ε.

Damit ist auch die Konvergenz von (∫ b

afn(x) dx)n∈N gegen

∫ b

af(x) dx bewiesen.

Als eine kleine Anwendung dieses Satzes wollen wir einsehen, dass eine stetige Funktionbereits durch ihre Momente eindeutig festgelegt ist. Sind a, b ∈ R mit a < b undf : [a, b] → R eine stetige Funktion, so bezeichnet man

Mn(f) :=

∫ b

a

xnf(x) dx

137

Page 138: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 25.5.2011

fur n ∈ N als das n-te Moment der Funktion f . Wir wollen einsehen, dass zwei stetigeFunktionen f, g auf [a, b] die dieselben Momente haben, also Mn(f) = Mn(g) fur allen ∈ N, bereits gleich sind.

Satz 4.7 (Momente stetiger Funktionen)Seien a, b ∈ R mit a < b und f, g : [a, b] → R zwei stetige Funktionen mit ubereinstim-menden Momenten, d.h. fur jedes n ∈ N gilt∫ b

a

xnf(x) dx =

∫ b

a

xng(x) dx.

Dann ist auch f = g.

Beweis: Wir betrachten die stetige Hilfsfunktion h := f − g, und fur jedes n ∈ N giltdann ∫ b

a

xnh(x) dx =

∫ b

a

xnf(x) dx−∫ b

a

xng(x) dx = 0.

Wir mussen h = 0 zeigen. Ist p : [a, b] → R ein Polynom, so konnen wir p(x) =∑nk=0 akx

k schreiben, und erhalten auch∫ b

a

p(x)h(x) dx =n∑

k=0

ak

∫ b

a

xkh(x) dx = 0.

Nach dem Weierstraßschen Approximationssatz Satz 1 gibt es eine Folge (pn)n∈N vonPolynomen, die auf [a, b] gleichmaßig gegen h konvergiert. Nach Aufgabe (31) konver-giert dann auch die Folge (pnh)n∈N auf [a, b] gleichmaßig gegen h2, und mit Satz 6folgt ∫ b

a

h(x)2 dx = limn→∞

∫ b

a

pn(x)h(x) dx = 0.

Nach Aufgabe (14) ist damit h2 = 0, und somit auch h = 0.

Kommen wir wieder zum Vertauschen von Integration und Konvergenz von Funktio-nenfolgen zuruck. Der Satz 6 trifft nur auf gewohnliche Rieman-Integrale im Sinne des§2 zu, aber leider nicht auf unbestimmte Rieman-Integrale. Um hierfur ein Beispiel zusehen, betrachten wir die folgende Funktionenfolge (fn)n≥1 von Funktionen von [1,∞)nach R. Fur n ≥ 1 und x ≥ 1 sei

fn(x) :=

{1x, n ≤ x ≤ 2n,

0, sonst.

Fur alle n ∈ N und alle x ≥ 1 gilt dann 0 ≤ fn(x) ≤ 1/n und damit konvergiertdie Funktionenfolge (fn)n≥1 auf [1,∞) gleichmaßig gegen die Nullfunktion. Fur jedesn ∈ N haben wir andererseits∫ ∞

1

fn(x) dx =

∫ 2n

n

dx

x= ln(2n)− ln(n) = ln 2,

138

Page 139: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 25.5.2011

also

limn→∞

∫ ∞

1

fn(x) dx = ln 2 6= 0 =

∫ ∞

1

limn→∞

fn(x) dx.

Unter einer kleinen Zusatzbedingung kann man Satz 6 auch auf uneigentliche Rieman-Integrale ubertragen. Unter dieser Zusatzbedingung braucht man dabei auch keinegleichmaßige Konvergenz auf dem gesamten Definitionsbereich, sondern es reicht nurdie gleichmaßige Konvergenz auf allen Intervallen [a, b], die im Definitionsbereich un-serer Funktionen enthalten sind. Dies fuhrt auf den Begriff der lokal gleichmaßigenKonvergenz von Funktionenfolgen.

Definition 4.5 (Lokal gleichmaßige Konvergenz von Funktionenfolgen)Seien I ⊆ R ein Intervall und (fn)n∈N eine Folge von Funktionen von I nach R. DieFolge (fn)n∈N heißt lokal gleichmaßig konvergent gegen eine Grenzfunktion f : I → Rwenn es fur jedes a ∈ I ein δ > 0 gibt so, dass die eingeschrankte Funktionenfolge(fn|I ∩ (a− δ, a+ δ))n∈N gleichmaßig gegen f |I ∩ (a− δ, a+ δ) konvergiert.

Dies ist tatsachlich zur eingangs gegebenen Formulierung aquivalent.

Lemma 4.8: Seien I ⊆ R ein Intervall mit mindestens zwei Punkten, (fn)n∈N eineFolge von Funktionen von I nach R und f : I → R eine Funktion. Dann ist dieFunktionenfolge (fn)n∈N genau dann lokal gleichmaßig konvergent gegen f , wenn furalle a, b ∈ R mit a < b und [a, b] ⊆ I die eingeschrankte Funktionenfolge (fn|[a, b])n∈Ngleichmaßig auf [a, b] gegen f |[a, b] konvergiert.

Beweis: ”⇐=” Sei a ∈ I. Da |I| > 1 ist, gibt es dann ein δ > 0 und b, c ∈ R mit b < cund I ∩ (a − δ, a + δ) ⊆ [b, c] ⊆ I. Da (fn|[b, c])n∈N auf [b, c] gleichmaßig gegen f |[b, c]konvergiert, ist dann auch (fn|I∩(a−δ, a+δ))n∈N gleichmaßig gegen f |I∩(a−δ, a+δ)konvergent.

”=⇒” Seien a, b ∈ R mit a < b und [a, b] ⊆ I gegeben. Wir mussen zeigen, dass(fn|[a, b])n∈N auf [a, b] gleichmaßig gegen f |[a, b] konvergiert. Sei hierzu ein ε > 0 ge-geben. Fur jedes x ∈ [a, b] ⊆ I gibt es ein δ(x) > 0 so, dass die Funktionenfolge(fn|I ∩ (x − δ(x), x + δ(x)))n∈N gleichmaßig gegen f |I ∩ (x − δ(x), x + δ(x)) kon-vergiert. Nach dem Uberdeckungslemma fur Intervalle §2.Lemma 6 existieren Punktet1, . . . , tm ∈ [a, b] ⊆ I mit

[a, b] ⊆m⋃

i=1

(ti − δ(ti), ti + δ(ti)).

Fur jedes 1 ≤ i ≤ m gibt es weiter ein ni ∈ N mit |fn(x) − f(x)| < ε fur allex ∈ I∩(ti−δ(ti), ti+δ(ti)) und alle n ∈ N mit n ≥ ni. Setze n0 := max{n1, . . . , nm} ∈ N.Seien n ∈ N mit n ≥ n0 und x ∈ [a, b] ⊆ I gegeben. Dann existiert ein 1 ≤ i ≤ m mitx ∈ (ti − δ(ti), ti + δ(ti)), also x ∈ I ∩ (ti − δ(ti), ti + δ(ti)) und wegen n ≥ n0 ≥ ni istdamit auch |fn(x)− f(x)| < ε.

139

Page 140: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 25.5.2011

Insbesondere stimmen damit fur auf Intervallen der Form [a, b] definierte Funktio-nenfolgen die Begriffe

”gleichmaßig konvergent“ und

”lokal gleichmaßig konvergent“

uberein. Auch ein Beispiel zur lokal gleichmaßigen Konvergenz haben wir bereits gese-hen, wir hatten zu Beginn dieser Vorlesung nachgerechnet, dass die Funktionenfolge

fn(x) =(1 +

x

n

)n

auf jedem Intervall [a, b] fur a, b ∈ R mit a < b gleichmaßig gegen die Exponential-funktion konvergiert, und nach dem eben bewiesenen Lemma bedeutet dies das dieseFolge auch auf ganz R lokal gleichmaßig gegen die Exponentialfunktion konvergentist. Wir kommen jetzt zu unserem angekundigten Satz uber die Konvergenz uneigent-licher Rieman-Integrale. Wir formulieren den Satz hier fur rechtsseitig uneigentlicheRieman-Integrale, er gilt dann entsprechend auch fur den linksseitig und beidseitiguneigentlichen Fall und wird auch so angewandt werden.

Satz 4.9: Seien a ∈ R, b ∈ R mit a < b und sei (fn)n∈N eine Folge von uneigentlichRieman-integrierbaren Funktionen von [a, b) nach R, die lokal gleichmaßig gegen eineGrenzfunktion f : [a, b) → R konvergiert. Weiter existiere eine uneigentlich Rieman-integrierbare Funktion g : [a, b) → R mit |fn(x)| ≤ g(x) fur alle n ∈ N und allex ∈ [a, b). Dann ist auch die Funktion f uneigentlich Rieman-integrierbar und es gilt∫ b

a

f(x) dx = limn→∞

∫ b

a

fn(x) dx.

Beweis: Sind c, d ∈ R mit c < d und [c, d] ⊆ [a, b), so konvergiert die Funktionenfolge(fn|[c, d])n∈N nach Lemma 8 auf [c, d] gleichmaßig gegen f |[c, d] und nach Satz 6 istf |[c, d] Rieman-integrierbar mit∫ d

c

f(x) dx = limn→∞

∫ d

c

fn(x) dx.

Weiter gilt auch |f(x)| = limn→∞ |fn(x)| ≤ g(x) fur alle x ∈ [a, b) und nach demMajorantenkriterium §3.Satz 6 ist f uber [a, b) absolut und uneigentlich integrierbar.Wir mussen also nur noch die Grenzwertaussage beweisen. Sei hierzu ε > 0 gegeben.Wegen

limx→b

∫ b

x

g(t) dt = limx→b

[∫ b

a

g(t) dt−∫ x

a

g(t) dt

]= 0,

existiert ein s ∈ R mit a < s < b und∫ b

s

g(t) dt <ε

3.

Nach §3.Lemma 5 und §3.Lemma 1.(d) sind damit auch∣∣∣∣∫ b

s

f(t) dt

∣∣∣∣ ≤ ∫ b

s

|f(t)| dt ≤∫ b

s

g(t) dt <ε

3

140

Page 141: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 25.5.2011

und ebenso ∣∣∣∣∫ b

s

fn(t) dt

∣∣∣∣ < ε

3

fur alle n ∈ N. Weiter existiert nach Satz 6 ein n0 ∈ N mit∣∣∣∣∫ s

a

fn(t) dt−∫ s

a

f(t) dt

∣∣∣∣ < ε

3

fur alle n ∈ N mit n ≥ n0. Fur jedes n ∈ N mit n ≥ n0 folgt damit auch∣∣∣∣∫ b

a

fn(t) dt−∫ b

a

f(t) dt

∣∣∣∣≤∣∣∣∣∫ s

a

fn(t) dt−∫ s

a

f(t) dt

∣∣∣∣+ ∣∣∣∣∫ b

s

fn(t) dt

∣∣∣∣+ ∣∣∣∣∫ b

s

f(t) dt

∣∣∣∣ < ε

3+ε

3+ε

3= ε.

Damit ist auch die Konvergenz der Folge (∫ b

afn(x) dx)n∈N gegen

∫ b

af(x) dx bewiesen.

Fur die Vertauschbarkeit von gleichmaßiger Konvergenz und uneigentlicher Integrationmuss also die gesamte Funktionenfolge durch eine uneigentlich Rieman-integrierbareFunktion g

”gedeckelt“ sein. Unser Eingangsbeispiel steht daher auch nicht im Wi-

derspruch zu diesem Satz, der Deckel g(x) = 1/x ist uber [1,∞) eben gerade nichtuneigentlich Rieman-integrierbar.

0

1

2

3

4

5

6

y

1 2 3 4

x

Als ein Beispiel fur diesen Satz wollen wir einmal dienebenstehend gezeigte Γ-Funktion

Γ(x) =

∫ ∞

0

tx−1e−t dt

fur x > 0 untersuchen. Schauen wir zunachst einmal,dass dieses Integral uberhaupt konvergiert, und hierzuwollen wir das Majorantenkriterium verwenden. Schonzur Vorbereitung auf die Anwendung des Satzes, wollenwir gleich eine Majorante finden, die gleichzeitig fur allex in einem Intervall [a, b] funktioniert. Seien also a, b ∈R mit 0 < a < b gegeben. Dann existiert eine naturlicheZahl n ∈ N mit b − 1 ≤ n und fur alle t ∈ R mit t ≥ 1und alle x ∈ [a, b] ist damit auch tx−1e−t ≤ tb−1e−t ≤tne−t. Durch n-fache partielle Integration, ergibt sichauch

∫∞1tne−t dt < ∞, fur t ≥ 1 haben wir also eine

Majorante. Fur t ∈ (0, 1], x ∈ [a, b] gilt weiter

tx−1e−t ≤ tx−1 ≤ ta−1 =1

t1−a

141

Page 142: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 25.5.2011

und wegen 1 − a < 1 ist∫ 1

0dt/t1−a < ∞. Wir erhalten die uneigentlich Rieman-

integrierbare Funktion

g : (0,∞) → R; t 7→

{tne−t, t ≥ 1,

1t1−a , 0 < t < 1

mit tx−1e−t ≤ g(t) fur alle t ∈ (0,∞), x ∈ [a, b]. Insbesondere ist das Γ(x) definierende,uneigentliche Rieman-Integral uberhaupt konvergent.

Die systematische Beschaftigung mit solchen”parameterabhangigen Integralen“ ist

erst fur das nachste Semester vorgesehen, hier wollen wir nur unseren Satz 9 ver-wenden, um die Stetigkeit der Γ-Funktion zu beweisen. Sei also (xn)n∈N eine Fol-ge in (0,∞), die gegen ein x > 0 konvergiert. Wir mussen zeigen, dass dann auch(Γ(xn))n∈N −→ Γ(x) gilt. Zunachst sind konvergente Folgen auch beschrankt, es gibtalso a, b ∈ R mit 0 < a < b und a ≤ xn ≤ b fur alle n ∈ N. Wie bereits gezeigt, gibtes somit auch einen uneigentlich Rieman-integrierbaren Deckel g : (0,∞) → R mittxn−1e−t ≤ g(t) fur alle t ∈ (0,∞) und alle n ∈ N. Wir zeigen jetzt, dass die Funktio-nenfolge (txn−1e−t)n∈N aufgefasst als Funktionen in t, auf (0,∞) lokal gleichmaßig gegentx−1e−t konvergiert. Seien hierzu α, β ∈ R mit 0 < α < β gegeben. Wegen (xn) −→ xkonvergiert (ln(t) · (xn − 1))n∈N fur t ∈ [α, β] auch gleichmaßig gegen ln(t) · (x − 1).Nach Aufgabe (31) konvergiert auch die Funktionenfolge (txn−1)n∈N = (eln(t)·(xn−1))n∈Nfur t ∈ [α, β] gleichmaßig gegen eln(t)·(x−1) = tx−1. Wieder nach Aufgabe (31) konver-giert dann schließlich auch die Funktionenfolge (txn−1e−t)n∈N fur t ∈ [α, β] gleichmaßiggegen tx−1e−t. Somit gilt

limn→∞

txn−1e−t = tx−1e−t

lokal gleichmaßig fur t ∈ (0,∞). Mit Satz 9 folgt schließlich die behauptete Stetigkeit

limn→∞

Γ(xn) = limn→∞

∫ ∞

0

txn−1e−t dt =

∫ ∞

0

tx−1e−t dt = Γ(x).

4.3 Gleichmaßige Konvergenz und Differenzierbarkeit

Im letzten Abschnitt haben wir gesehen, dass Stetigkeit, Integrierbarkeit sowie dasIntegral unter gleichmaßiger Konvergenz erhalten bleiben. Leider trifft dies nicht aufdie Differenzierbarkeit zu. In §4.1 hatten wir gesehen, dass die durch

fn(x) := n√

1 + xn

gegebene Folge von Funktionen von [0,∞) nach R punktweise gegen die Grenzfunktion

f(x) =

{1, x ≤ 1,

x, x > 1

konvergiert, die in x = 1 nicht differenzierbar ist. Die Konvergenz dieser Funktionen-folge ist sogar lokal gleichmaßig. Sei namlich a > 0 gegeben, und wir behaupten das

142

Page 143: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 27.5.2011

die Funktionenfolge auf [0, a] gleichmaßig gegen f konvergiert. Ist namlich x ∈ [0, a],so ist im Fall x ≤ 1

1 ≤ n√

1 + xn ≤ n√

2, also 0 ≤ fn(x)− f(x) ≤ n√

2− 1

und im Fall x > 1 haben wir

x ≤ n√

1 + xn ≤ n√

2x, also 0 ≤ fn(x)− f(x) ≤ (n√

2− 1)x ≤ (n√

2− 1)a,

und somit ist gleichmaßig fur x ∈ [0, a]

|fn(x)− f(x)| ≤ (n√

2− 1) ·max{1, a} −→ 0.

Damit konvergiert unsere Funktionenfolge tatsachlich lokal gleichmaßig.

Vorlesung 13, Freitag 27.5.2011

Wir sind weiter mit der Untersuchung der gleichmaßigen Konvergenz von Funktionen-folgen beschaftigt, und hatten am Ende der letzten Sitzung an einem Beispiel gesehen,dass der gleichmaßige Grenzwert einer Folge stetig differenzierbarer, sogar analytischer,Funktionen nicht mehr differenzierbar sein muss. Trotzdem gibt es fur diese Situationeinen hilfreichen Vertraglichkeitssatz, zu dessen Beweis wir zunachst eine Umformulie-rung von Satz 6 angeben.

Lemma 4.10: Seien I ⊆ R ein Intervall und (fn)n∈N eine Folge von stetigen Funktionenvon I nach R, die lokal gleichmaßig gegen eine Grenzfunktion f : I → R konvergiert.Weiter sei a ∈ I und fur jedes n ∈ N bezeichne

Fn : I → R;x 7→∫ x

a

fn(t) dt

die Stammfunktion von fn mit Fn(a) = 0. Dann ist auch f stetig und die Folge (Fn)n∈Nkonvergiert lokal gleichmaßig gegen die Funktion

F : I → R;x 7→∫ x

a

f(t) dt.

Beweis: Ist I = {a}, so sind alle Aussagen klar, wir konnen also annehmen, dass Imindestens zwei Punkte hat. Nach Satz 5.(b) ist f : I → R stetig. Seien b, c ∈ R mitb < c und [b, c] ⊆ I. Dann gibt es auch α, β ∈ R mit α < β, [b, c] ⊆ [α, β] ⊆ I unda ∈ [α, β]. Nach Lemma 8 konvergiert die Folge (fn|[α, β])n∈N gleichmaßig gegen die

143

Page 144: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 27.5.2011

Grenzfunktion f |[α, β]. Sei nun ein ε > 0 gegeben. Dann gibt es einen Index n0 ∈ Nmit

|fn(x)− f(x)| < ε

2(β − α)

fur alle n ∈ N mit n ≥ n0 und alle x ∈ [α, β]. Seien jetzt n ∈ N mit n ≥ n0 und x ∈ [b, c]gegeben. Fur alle t zwischen a und x ist dann wegen a, x ∈ [α, β] auch t ∈ [α, β], also|fn(t)− f(t)| < ε/(2(β − α)) und |x− a| ≤ β − α. Es folgt

|Fn(x)− F (x)| =∣∣∣∣∫ x

a

fn(t) dt−∫ x

a

f(t) dt

∣∣∣∣ ≤ ∫ x

a

|fn(t)− f(t)| dt ≤ ε|x− a|2(β − α)

< ε.

Damit ist die Funktionenfolge (Fn|[b, c])n∈N gleichmaßig konvergent gegen F |[b, c]. NachLemma 8 ist (Fn)n∈N lokal gleichmaßig konvergent gegen F .

Kombinieren wir dieses Lemma mit dem Hauptsatz der Differential und Integralrech-nung, so erhalten wir einen Satz uber das Ableiten gleichmaßig konvergenter Funktio-nenfolgen.

Satz 4.11: Seien I ⊆ R ein Intervall, (fn)n∈N eine Folge von stetig differenzierbarenFunktionen von I nach R und a ∈ I. Die Folge (f ′n)n∈N sei lokal gleichmaßig konvergentgegen eine Grenzfunktion g : I → R und zusatzlich sei die Folge (fn(a))n∈N konvergent.Dann ist auch die Funktionenfolge (fn)n∈N lokal gleichmaßig konvergent gegen eineGrenzfunktion f : I → R. Die Funktion f ist stetig differenzierbar mit f ′ = g.

Beweis: Nach dem Hauptsatz §2.Satz 9 gilt fur jedes x ∈ I, n ∈ N stets

fn(x) = fn(a) +

∫ x

a

f ′n(t) dt.

Nach Lemma 10 ist g stetig und∫ x

af ′n(t) dt konvergiert fur x ∈ I lokal gleichmaßig

gegen∫ x

ag(t) dt. Ist also b := limn→∞ fn(a), so konvergiert die Folge (fn)n∈N lokal

gleichmaßig gegen die Funktion

f : I → R;x 7→ b+

∫ x

a

g(t) dt.

Nach §2.Satz 9 ist f stetig differenzierbar mit f ′ = g.

Durch mehrfache Anwendung dieses Satzes ergibt sich dann auch eine entsprechendeAussage uber hohere Ableitungen.

Korollar 4.12: Seien I ⊆ R ein Intervall, p ∈ N mit p ≥ 1, (fn)n∈N eine Folge p-

fach stetig differenzierbarer Funktionen von I nach R und a ∈ I. Die Folge (f(p)n )n∈N

sei auf I lokal gleichmaßig konvergent und fur jedes 0 ≤ k < p sei auch die Folge(f

(k)n (a))n∈N konvergent. Dann konvergiert die Funktionenfolge (f

(k)n )n∈N fur jedes 0 ≤

144

Page 145: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 27.5.2011

k ≤ p lokal gleichmaßig gegen eine Grenzfunktion gk, die Funktion f := g0 ist p-fachstetig differenzierbar und fur jedes 0 ≤ k ≤ p gilt f (k) = gk.

Beweis: Dies folgt mit Satz 11 sofort durch Induktion nach p.

Insbesondere folgt dann auch eine analoge Aussage uber unendlich oft differenzierbareFunktionen

Korollar 4.13: Seien I ⊆ R ein Intervall und (fn)n∈N eine Folge unendlich oft differen-

zierbarer Funktionen von I nach R. Fur jedes p ∈ N sei die Funktionenfolge (f(p)n )n∈N

lokal gleichmaßig gegen eine Grenzfunktion gp : I → R konvergent. Dann ist die Funk-tion f := g0 unendlich oft differenzierbar und fur jedes p ∈ N gilt f (p) = gp.

Beweis: Klar nach Korollar 12.

Beispiele zu diesen Satzen wollen wir an dieser Stelle nicht diskutieren, dies wird inden Aufgaben (33) und (34) erledigt.

4.4 Funktionenreihen und gleichmaßige Konvergenz

Bisher haben wir alle Definitionen und Satze zur gleichmaßigen Konvergenz fur Funk-tionenfolgen formuliert, aber entsprechendes gilt dann auch fur Funktionsreihen. Wirmussen uns nur an unser Vorgehen in I.§7 im letzten Semester erinnern, dort hat-ten wir den Reihenbegriff uber die Partialsummen einer Reihe auf den Folgenbegriffzuruckgefuhrt. Genauso geht das auch fur Reihen von Funktionen. Angenommen wirhaben K ∈ {R,C}, eine Menge M und eine Folge von Funktionen fn : M → K furn ∈ N gegeben. Die Funktionsreihe

∑∞n=0 fn ist dann die Funktionenfolge die durch die

Partialsummen

sn(x) :=n∑

k=0

fk(x)

fur x ∈ M , n ∈ N definiert wird. Gleichmaßige Konvergenz einer Funktionenreihe be-deutet dann die gleichmaßige Konvergenz der Folge ihrer Partialsummen. Wir werdenalle im vorigen Abschnitt behandelten Begriffe und Satze uber diesen Mechanismusauch auf Reihen anwenden, auch ohne jedesmal wieder auf diesen Zusammenhang hin-zuweisen. Hervorheben wollen wir hier nur das Cauchy-Kriterium fur die gleichmaßigeKonvergenz Lemma 2, dieses nimmt fur K ∈ {R,C}, eine beliebige Menge M undFunktionen fn : M → K die folgende Form an:

∞∑n=0

fn gleichmaßig konvergent

⇐⇒ ∀(ε > 0)∃(n0 ∈ N)∀(m ≥ n ≥ n0)∀(x ∈M) :

∣∣∣∣∣m∑

k=n

fk(x)

∣∣∣∣∣ < ε.

145

Page 146: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 27.5.2011

Hiermit ergibt sich leicht das folgende einfache, aber erfreulich haufig anwendbare,Kriterium fur die gleichmaßige Konvergenz einer Funktionsreihe.

Lemma 4.14 (Weierstrass-Kriterium fur Funktionsreihen)Seien K ∈ {R,C}, M eine Menge und (fn)n∈N eine Folge von Funktionen von M nachK. Weiter sei

∑∞n=0 an eine konvergente, reelle Reihe mit |fn(x)| ≤ an fur alle n ∈ N

und alle x ∈M . Dann ist die Funktionenreihe∑∞

n=0 fn gleichmaßig konvergent.

Beweis: Sei ε > 0. Nach dem Cauchy-Kriterium fur Reihen I.§7.Satz 8 existiert einn0 ∈ N mit

∑mk=n ak < ε fur alle m ≥ n ≥ n0. Sind also n,m ∈ N mit m ≥ n ≥ n0 und

x ∈M , so haben wir ∣∣∣∣∣m∑

k=n

fk(x)

∣∣∣∣∣ ≤m∑

k=n

|fk(x)| ≤m∑

k=n

ak < ε.

Mit dem Cauchy-Kriterium fur die gleichmaßige Konvergenz von Funktionsreihen folgtdie Behauptung.

Auch die Beispiele zu den Funktionsreihen werden als Ubungsaufgaben behandelt.

4.5 Normierte Raume

Wir schauen uns noch einmal die Definition der gleichmaßigen Konvergenz einer Folgefn : M → K gegen eine Grenzfunktion f : M → K an. Gefordert war das es fur jedesε > 0 stets einen Index n0 ∈ N mit |fn(x)− f(x)| < ε fur alle n ≥ n0 und alle x ∈ Mgibt. Statt

”< ε“ kann man gleichwertig naturlich genau so gut

”≤ ε“ schreiben. Die

Bedingung fordert dann, das fur jedes n ≥ n0 stets

sup{|fn(x)− f(x)| : x ∈M} ≤ ε

gilt. Das hier auftretende Supremum nennt man auch die ∞-Norm, oder die Supre-mumsnorm, von fn − f . Allgemein schreiben wir fur K ∈ {R,C}, eine Menge M undeine beschrankte Funktion f : M → K

||f ||∞ := supx∈M

|f(x)| ∈ R≥0.

Im Randfall M = ∅ wird das Supremum dabei als Null interpretiert. Die Bedingungfur die gleichmaßige Konvergenz wird in dieser Schreibweise zu

∀(ε > 0)∃(n0 ∈ N)∀(n ≥ n0) : ||fn − f ||∞ < ε,

sie sieht formal also fast genau so aus wie unsere Definition der Folgenkonvergenz furreelle und komplexe Folgen in I.§6 des letzten Semesters. Bei der Einfuhrung der Fol-genkonvergenz hatten wir diese damals als den gemeinsamen Kern der meisten anderen

146

Page 147: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 27.5.2011

Grenzwertbegriffe angepriesen, und die eben gegebene Formulierung der gleichmaßigenKonvergenz erlaubt es uns auch die gleichmaßige Konvergenz als eine ganz gewohn-liche Folgenkonvergenz zu interpretieren. Wir mussen nur bereit sein anstelle von Roder C als Wertebereich auch Mengen von Funktionen zuzulassen. Wenn wir uns anunser Vorgehen in I.§6, I.§7 und I.§13 des letzten Semesters erinnern, so spielte es furviele der grundlegenden Aussagen keinerlei Rolle ob gerade R oder C betrachtet wur-de, wichtig waren nur die formalen Eigenschaften der jeweiligen Betragsfunktion. Wirwollen uns jetzt klarmachen das all diese Eigenschaften der Betragsfunktion auch aufunsere Supremumsnorm zutreffen.

Seien also K ∈ {R,C}, M eine Menge und f, g : M → K zwei beschrankteFunktionen. Fur jeden Skalar λ ∈ K haben wir dann auch die beschrankte Funkti-on λ · f : M → K und fur diese gilt

||λf ||∞ = supx∈M

|λf(x)| = supx∈M

(|λ| · |f(x)|) = |λ| supx∈M

|f(x)| = |λ| · ||f ||∞,

aus der Supremumsnorm konnen wir also Skalare herausziehen. Auch die Dreiecksun-gleichung ist fur die Supremumsnorm erfullt, fur jedes x ∈M gilt namlich

|f(x) + g(x)| ≤ |f(x)|+ |g(x)| ≤ ||f ||∞ + ||g||∞,

also ist auch||f + g||∞ = sup

x∈M|f(x) + g(x)| ≤ ||f ||∞ + ||g||∞.

Analog ergibt sich auch ||fg||∞ ≤ ||f ||∞||g||∞. Dies ist zwar etwas schlechter als dieentsprechende Eigenschaft |xy| = |x| · |y| des Betrags, dies spielt in der Regel aber keineRolle da die Betrage meist fur Abschatzungen verwendet werden. Benutzen wir jetztdiese Eigenschaften der Supremumsnorm, so kann man die Grundeigenschaften dergleichmaßigen Konvergenz genauso wie fur normale, skalarwertige Folgen behandeln.Dies legt die Vorstellung nahe, dass es eigentlich nur darauf ankommt einen Betrag zuhaben und fuhrt zur folgenden Definition:

Definition 4.6 (Normierte Raume)Seien K ∈ {R,C} und E ein Vektorraum uber K. Eine Norm || || auf E ist dann eineAbbildung || || : E → R≥0;u 7→ ||u|| mit den folgenden drei Eigenschaften:

(a) Fur jedes u ∈ E ist genau dann ||u|| = 0 wenn u = 0 ist.

(b) Fur jedes u ∈ E und jeden Skalar λ ∈ K ist ||λu|| = |λ| · ||u||.

(c) Fur alle u, v ∈ E gilt ||u+ v|| ≤ ||u||+ ||v||.

Ein normierter Raum ist dann ein Paar (E, || ||) bestehend aus einem Vektorraum Euber K und einer Norm || || auf E.

Die Eigenschaft (c) einer Norm wird wieder als die Dreiecksungleichung bezeichnet.Fur die Supremumsnorm betrachten wir den Vektorraum

B(M ;K) := {f : M → K|f ist beschrankt}

147

Page 148: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 27.5.2011

aller beschrankten Funktionen von M nach K, dies ist ein Untervektorraum des Vek-torraums KM aller Funktionen von M nach K, der in I.§11.1 im letzten Semestereingefuhrt wurde. Auf diesem Vektorraum ist || ||∞ eine Norm, wie wir schon obeneingesehen haben. Die erste Eigenschaft einer Norm hatten wir dabei nicht explizitgenannt, da diese fur die Supremumsnorm offensichtlich ist. Die multiplikative Eigen-schaft der Supremumsnorm wird vom allgemeinen Normbegriff nicht erfasst, in einemallgemeinen Vektorraum gibt es nun einmal kein Produkt von Vektoren.

In einem normierten Raum E gelten auch die Varianten der Dreiecksungleichungweiter, genau so wie wir sie fur den gewohnlichen reellen und komplexen Betrag einge-sehen hatten. Wie wollen diese ruhig einmal kurz wiederholen. Seien u, v ∈ E. Zunachstrechnen wir dann

||u|| = ||u− v + v|| ≤ ||u− v||+ ||v||, also auch ||u− v|| ≥ ||u|| − ||v||.

Weiter ist fur jeden Vektor w ∈ E stets || − w|| = ||(−1) · w|| = | − 1| · ||w|| = ||w||,also haben wir auch

−(||u|| − ||v||) = ||v|| − ||u|| ≤ ||v − u|| = ||u− v||,

und insgesamt folgt ∣∣||u|| − ||v||∣∣ ≤ ||u− v||.

Ein Hauptbeispiel fur die normierten Raume sind die Vektorraume Rn und Cn. SeienK ∈ {R,C} und n ∈ N mit n ≥ 1 gegeben. Wir konnen den Kn dann als den Vektor-raum der Funktionen der n-elementigen Menge {1, . . . , n} nach K interpretieren, underhalten die ∞-Norm auf dem Kn als

||x||∞ = max{|x1|, . . . , |xn|} = max1≤i≤n

|xi|.

Wir kennen auch schon eine zweite, vielleicht naturlichere, Norm auf dem Kn. Schonin I.§12.3 hatten wir die Lange eines Vektors u ∈ Rn als ||u||2 = |u| :=

√u · u definiert,

und in Koordinaten geschrieben bedeutet dies

||u||2 =√u2

1 + · · ·+ u2n =

(n∑

k=1

u2k

)1/2

.

Dies definiert tatsachlich eine Norm || ||2 auf dem Rn, genannt die euklidische Normoder auch die 2-Norm. Die ersten beiden Eigenschaften einer Norm sind dabei klar.Zum Nachweis der Dreiecksungleichung nehmen wir uns zwei Vektoren u, v ∈ Rn undbezeichnen mit φ den von ihnen eingeschlossenen Winkel. Mit der Beschreibung desSkalarprodukts aus I.§12.3 ergibt sich

||u+ v||22 = (u+ v) · (u+ v) = u · u+ 2u · v + v · v = ||u||22 + 2||u||2||v||2 cosφ+ ||v||22≤ ||u||22 + 2||u||2||v||2 + ||v||22 = (||u||2 + ||v||2)2,

148

Page 149: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 27.5.2011

also ist auch ||u+ v||2 ≤ ||u||2 + ||v||2. Im Fall K = R ist damit alles getan. Auch uberK = C konnen wir eine 2-Norm einfuhren, indem wir einfach die reelle Formel weiterverwenden, fur einen Vektor u ∈ Cn definieren wir die 2-Norm als

||u||2 :=

(n∑

k=1

|uk|2)1/2

.

Die ersten beiden Eigenschaften einer Norm sind dann wieder klar, und die Dreiecks-ungleichung ergibt sich durch Ruckfuhrung auf den reellen Fall, ist uk = xk + iyk, soist |uk|2 = x2

k + y2k, also ist die 2-Norm eines komplexen Vektors mit n Eintragen gleich

der 2-Norm des aus den Real- und Imaginarteilen gebildeten reellen Vektors mit 2nEintragen.

Alles was in den Paragraphen I.§6, I.§7 und I.§13 des letzten Semesters nur aus denEigenschaften des Betrags folgte, gilt auch fur allgemeine normierte Raume. Insbeson-dere haben wir:

1. Eine Folge (un)n∈N in E konvergiert gegen ein u ∈ E wenn

∀(ε > 0)∃(n0 ∈ N)∀(n ≥ n0) : ||un − u|| < ε

gilt. Damit ist die Folgenkonvergenz im Vektorraum B(M ;K) beispielsweise diegleichmaßige Konvergenz, die sich somit begrifflich in die gewohnliche Folgenkon-vergenz einordnet. Es gelten die Grundeigenschaften der Folgenkonvergenz, alsoDinge wie die Eindeutigkeit des Grenzwerts, die Rechenregeln fur Folgengrenz-werte und so weiter. Was im Allgemeinen nicht mehr gilt, ist alles was auf derAnordnung der reellen Zahlen beruhte.

2. Wir haben auch wieder Reihen als Folgen der Partialsummen, also

∞∑n=0

un = limn→∞

n∑k=0

uk

und absolut konvergente Reihen. Was aber nicht mehr allgemein wahr ist, ist dasabsolut konvergente Reihen auch konvergent sind. Dies folgte in I.§7 aus demCauchy-Kriterium fur die Konvergenz von Reihen, welches seinerseits aus demCauchy-Kriterium fur die Folgenkonvergenz folgte und dieses beruhte auf derAnordnung der reellen Zahlen, namlich auf dem I.§6.Satz 11 von Heine-Borel dasjede beschrankte reelle Folge eine konvergente Teilfolge besitzt. Auf diesen Punktwerden wir am Ende dieses Abschnitts noch einmal zuruck kommen.

3. Funktionsgrenzwerte wurden in I.§13 auf Folgengrenzwerte zuruckgefuhrt. Alsersten Schritt definiert man Haufungspunkte von beliebigen Teilmengen D ⊆ Eund sind a dann ein Haufungspunkt von D und f : D → F eine Funktion ineinen weiteren normierten Raum F , so ist wieder

limx→a

f(x) = w :⇐⇒{

Fur jede Folge (xn)n∈N in D\{a} mit(xn)n∈N −→ a ist auch (f(xn))n∈N −→ w.

149

Page 150: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 27.5.2011

Die Grundeigenschaften fur Funktionsgrenzwerte gelten dann weiter, insbeson-dere das ε-δ Kriterium

limx→a

f(x) = w⇐⇒∀(ε > 0)∃(δ > 0)∀(x ∈ D) :0 < ||x−a|| < δ=⇒||f(x)−w|| < ε.

4. Mit Funktionsgrenzwerten kann man dann wieder die Stetigkeit definieren, eswird wieder gefordert das in Haufungspunkten des Definitionsbereichs Funkti-onsgrenzwerte mit Funktionswerten ubereinstimmen. Genau wie in I.§13 kannman weiter zeigen, dass eine Funktion f : D → F in einem normierten Raum Fund definiert auf einer Teilmenge D ⊆ E eines anderen normierten Raums genaudann stetig ist, wenn fur jede in D konvergente Folge (xn)n∈N −→ x ∈ D auch(f(xn))n∈N −→ f(x) gilt.

Schauen wir uns einmal an, wie das alles im Rd und im Cd aussieht. Wir schreiben hierdie betrachtete Dimension als d weil wir n als Folgenindex verwenden wollen. Seien alsoK ∈ {R,C} und d ∈ N gegeben. Auf dem Vektorraum Kd verwenden wir die ∞-Norm

||u||∞ = max1≤i≤d

|ui|.

Fur eine Folge (un)n∈N ist offenbar genau dann (un)n∈N −→ u ∈ Kd wenn (un,i)n∈N −→ui fur jedes 1 ≤ i ≤ d gilt, wenn also alle Komponentenfolgen einzeln gegen die jeweiligeKomponente von u konvergieren. Sind E ein weiterer normierter Raum uber K, D ⊆ Eund f : D → Kd eine Funktion, so folgt weiter das f genau dann stetig ist wenn alleKomponentenfunktionen fi : D → K (1 ≤ i ≤ d) von f = (f1, . . . , fn) stetig sind. DaFolgenkonvergenz im Kd dasselbe wie komponentenweise Folgenkonvergenz ist, folgtsofort das die sogenannten Projektionen

pri : Kd → K;u 7→ ui

fur 1 ≤ i ≤ d, die einfach jeden Vektor auf seine i-te Komponente abbilden, stetigsind. Benutzen wir dann die aus I.§13 bekannten Tatsachen das Summen, Vielfache,Produkte und Hintereinanderausfuhrungen stetiger Funktionen wieder stetig sind, soergibt sich das jede durch Formeln in den Grundfunktionen gegebene Funktion Kd →Ks stetig ist. Wir wollen das einmal an einem konkreten Beispiel explizit vorfuhren.Nehmen wir etwa die auf der rechten Halbebene

H := {(x, y) ∈ R2|x > 0} ⊆ R2

definierte Funktion

f : H → R3; (x, y) 7→(y + ln(x),

sin(x2 + y)

x2 + y2 + 1,y

x− ln(x+ |y|)

).

Wie bemerkt bedeutet die Stetigkeit von f das alle drei Komponentenfunktionen stetigsind. Beginnen wir mit der ersten Komponente. Zunachst ist (x, y) 7→ y die Projek-tion auf die zweite Komponente, also stetig. Die Projektion auf die erste Komponen-te (x, y) 7→ x ist ebenso stetig und bei Hintereinanderausfuhrung mit dem stetigen

150

Page 151: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 27.5.2011

Logarithmus wird (x, y) 7→ lnx stetig. Damit ist die erste Komponente von f eineSummer zweier stetiger Funktionen, also stetig. In der zweiten Komponente geht allesanalog, zunachst sind (x, y) 7→ x2 + y und (x, y) 7→ x2 + y2 + 1 stetig, bei Hinter-einanderausfuhrung mit dem stetigen Sinus wird auch (x, y) 7→ sin(x2 + y) stetig, undschließlich ist die zweite Komponente der Quotient zweier stetiger Funktionen mit nichtverschwindenden Nenner, also stetig. Fur die dritte Komponente schließt man analog.

Durch Formeln gegebene Funktionen sind also unproblematisch. Bei komplizierterenFunktionen muss man sich, wie auch schon bei Funktionen in einer Variablen, denkonkreten Einzelfall anschauen. Als ein Beispiel hierfur nehmen wir einmal die Funktion

f : R2 → R; (x, y) 7→

{xy

x2+y2 , (x, y) 6= (0, 0),

0, (x, y) = (0, 0).

Diese Funktion ist in jeder einzelnen Variable, bei konstant gehaltenen zweiten Argu-ment, stetig. Insgesamt ist sie aber keine stetige Funktion, zum Beispiel haben wir diegegen (0, 0) konvergente Folge (1/n, 1/n)n∈N mit f(1/n, 1/n) = 1/2 fur alle n ∈ N. Furdie Stetigkeit reicht es also nicht aus, sich die Argumente einzeln anzuschauen.

Auch Funktionen die auf unendlich dimensionalen, normierten Raumen definiertsind, kommen durchaus vor. Wir wollen so etwas aber hier nicht systematisch untersu-chen, und uns mit einem kleinen Beispiel begnugen. Wir geben uns a, b ∈ R mit a < bvor, und betrachten den Vektorraum

C1[a, b] := {f : [a, b] → R|f ist stetig differenzierbar}

aller stetig differenzierbaren Funktionen auf [a, b]. Als Norm verwenden wir

||f ||1 := ||f ||∞ + ||f ′||∞.

Als eine kleine Ubungsaufgabe konnen Sie nachrechnen, dass dies wirklich eine Normist und das eine Folge (fn)n∈N genau dann in C1[a, b] gegen f : [a, b] → R konvergiert,wenn die Folge (fn)n∈N gleichmaßig gegen f konvergiert und die Folge der Ableitungen(f ′n)n∈N gleichmaßig gegen f ′ konvergiert. Weiter geben wir uns eine stetige FunktionL : R×R → R vor, die in diesem Zusammenhang gerne die Lagrange Funktion genanntwird. Ausgehend von diesen Daten, betrachten wir dann fur γ ∈ C1[a, b] die sogenannteWirkung

A(γ) :=

∫ b

a

L(γ(t), γ′(t)) dt.

Die Wirkung A ist dann eine Funktion

A : C1[a, b] → R,

und wir wollen einsehen, dass diese Funktion stetig ist. Wir mussen uns also eine Folge(γn)n∈N von stetig differenzierbaren Funktionen γn : [a, b] → R vorgeben, die in C1[a, b]gegen eine stetig differenzierbare Funktion γ : [a, b] → R konvergiert, d.h. (γn)n∈N

151

Page 152: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 27.5.2011

konvergiert gleichmaßig gegen γ und (γ′n)n∈N konvergiert gleichmaßig gegen γ′. Analogzu Aufgabe (31.b) konvergiert dann auch die Folge der Funktionen

L(γn(t), γ′n(t)) −→ L(γ(t), γ′(t))

fur t ∈ [a, b] gleichmaßig. Nach Satz 6 konvergiert dann schließlich auch

A(γn) =

∫ b

a

L(γn(t), γ′n(t)) dt −→∫ b

a

L(γ(t), γ′(t)) dt = A(γ).

Damit ist die Wirkung A tatsachlich eine stetige Funktion auf C1[a, b].Wir wollen noch auf einen wichtigen Unterschied zwischen dem endlichdimensio-

nalen und dem allgemeinen Fall hinweisen. Nach I.§12.2 ist jede lineare AbbildungT : Kn → Km durch eine m × n Matrix A uber K gegeben, d.h. es ist Tx = Ax furjedes x ∈ Kn. Insbesondere ist damit jede lineare Abbildung T : Kn → Km stetig.Fur allgemeine normierte Raume ist dies falsch, und auch hierfur wollen wir uns einBeispiel anschauen. Wir betrachten diesmal den Vektorraum

C[0, 1] := {f : [0, 1] → R|f ist stetig}

aller reellwertigen, stetigen Funktionen auf [0, 1] versehen mit der Supremumsnorm.Weiter nehmen wir wieder C1[0, 1], aber diesmal betrachten wir auch diesen Vektor-raum in der Supremumsnorm. Als lineare Abbildung nehmen wir das Ableiten

T =d

dx: C1[0, 1] → C[0, 1]; f 7→ f ′.

Wir behaupten das T nicht stetig ist, und hierzu mussen wir eine in C1[0, 1] konver-gente Folge (fn) angeben, deren Ableitungen Tfn = f ′n nicht gegen die Ableitung derGrenzfunktion konvergieren. Hierzu betrachte

fn(x) :=x3

nsin(nx

)mit fn(0) = 0. Wegen |fn(x)| ≤ x3/n ≤ 1/n fur alle x ∈ [0, 1], n ∈ N ist fn fur jedesn ∈ N stetig und die Folge (fn)n∈N konvergiert gleichmaßig gegen die Nullfunktion. Fur0 < x ≤ 1 ist weiter

f ′n(x) =3x2

nsin(nx

)− x cos

(nx

)und außerdem gilt

f ′n(0) = limx→0

x2

nsin(nx

)= 0.

Insbesondere ist fn differenzierbar und fur alle x ∈ [0, 1] gilt

|f ′n(x)| ≤(

1 +3

n

)x,

152

Page 153: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 1.6.2011

die Ableitung f ′n ist also wieder stetig. Damit ist die Funktionenfolge (fn)n∈N eineNullfolge in C1[0, 1]. Die Folge (f ′n)n∈N konvergiert aber nicht einmal punktweise, alsoerst recht nicht gleichmaßig. Allgemeine lineare Abbildungen sind also nicht unbedingtstetig. Man kann leicht sagen was genau die stetigen linearen Abbildungen sind.

Lemma 4.15 (Stetige lineare Abbildungen)Seien K ∈ {R,C} und E,F zwei normierte Raume uber K. Eine lineare AbbildungT : E → F ist genau dann stetig wenn es eine reelle Konstante C ≥ 0 mit ||Tu|| ≤C||u|| fur alle u ∈ E gibt.

Beweis: ”=⇒” Angenommen dies ware falsch. Dann gibt es fur jedes n ≥ 1 einenVektor un ∈ E mit ||Tun|| > n||un||, also insbesondere un 6= 0. Fur jedes n ≥ 1 folgtdamit auch ∣∣∣∣∣∣∣∣T ( un

n||un||

) ∣∣∣∣∣∣∣∣ > 1 aber

∣∣∣∣∣∣∣∣ un

n||un||

∣∣∣∣∣∣∣∣ =1

n,

d.h. (vn)n∈N := (un/(n||un||))n∈N ist eine Nullfolge in E, deren Bildfolge keine Nullfolgein F ist, im Widerspruch zur vorausgesetzten Stetigkeit von T .”⇐=” Sei (un)n∈N eine Folge in E, die gegen ein u ∈ E konvergiert. Wahle eine Kon-stante C ≥ 0 mit ||Tx|| ≤ C||x|| fur jedes x ∈ E. Wir mussen zeigen, dass die Folge(Tun)n∈N in F gegen Tu konvergiert. Sei also ε > 0 gegeben. Dann gibt es ein n0 ∈ Nmit ||un − u|| < ε/(C + 1) fur alle n ≥ n0. Fur n ≥ n0 folgt damit auch

||Tun − Tu|| = ||T (un − u)|| ≤ C||un − u|| ≤ Cε

C + 1< ε.

Damit konvergiert die Folge (Tun)n∈N tatsachlich gegen Tu.

Vorlesung 14, Mittwoch 1.6.2011

In der letzten Sitzung hatten wir den Begriff eines normierten Raums eingefuhrt,dies war ein reeller oder komplexer Vektorraum versehen mit einer Betragsfunktion.Wir haben auch schon einige Beispiele derartiger normierter Raume gesehen. In diesemSemester werden wir allgemeine normierte Raume nur gelegentlich am Rande erwahnen,wir werden fast ausschließlich am Rn und am Cn interessiert sein, meist sogar nur amRn. Im Rest dieses Kapitels wollen wir nur noch einige der grundlegenden Begriffe innormierten Raumen einfuhren.

Dabei beginnen wir mit dem Begriff des Haufungspunktes in einem normiertenRaum. In I.§6 hatten wir einen Punkt a einen Haufungspunkt einer Menge M ge-nannt, wenn es in M\{a} eine gegen a konvergente Folge gibt. Diese Definition war

153

Page 154: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 1.6.2011

hauptsachlich auf ihren Einsatz in der Definition von Funktionsgrenzwerten zugeschnit-ten. Fur allgemeinere Fragestellungen ist ein leicht modifizierter Begriff nutzlich, denwir nun einfuhren wollen.

Definition 4.7 (Beruhrpunkte einer Menge)Seien E ein normierter Raum und M ⊆ E eine Teilmenge. Ein Punkt a ∈ E heißtBeruhrpunkt von M wenn es eine Folge (xn)n∈N in M gibt, die gegen a konvergiert.

Der Unterschied zu Haufungspunkten ist hier das wir auch a selbst als Folgengliedzulassen. Insbesondere ist damit jeder Punkt a ∈ M auch Beruhrpunkt von M , wirkonnen ja einfach die Folge xn = a konstant a verwenden. Allgemein ist

a Beruhrpunkt von M ⇐⇒ a Haufungspunkt von M oder a ∈M.

In der Literatur werden die Begriffe”Haufungspunkt“ und

”Beruhrpunkt“ oft syn-

onym verwendet, die ublichen Bezeichnungsweisen gehen in diesem Punkt leider etwasdurcheinander. Weiter definieren wir jetzt

Definition 4.8 (Der Abschluss von Teilmengen)Seien E ein normierter Raum und M ⊆ E. Der Abschluß von M ist dann die MengeM aller Beruhrpunkte von M . Die Menge M heißt abgeschlossen wenn M = M ist.

In anderen Worten ist genau dann x ∈ M wenn es in M eine Folge (xn)n∈N mit(xn)n∈N −→ x gibt und M ist genau dann abgeschlossen wenn fur jede Folge (xn)n∈Nin M , die gegen ein x ∈ E konvergiert auch x ∈M ist.

Seien a, b ∈ R mit a < b gegeben und betrachte den normierten Raum E =B([a, b]; R) der beschrankten, reellwertigen Funktionen f : [a, b] → R in der Supre-mumsnorm. Wir wollen uns einige einfache Beispiele im Raum E anschauen. Da dieKonvergenz in E genau die gleichmaßige Konvergenz von Funktionenfolgen ist, sagtSatz 5 das die Menge C[a, b] der stetigen Funktionen f : [a, b] → R abgeschlossen inB([a, b]; R) ist. Ebenso besagt Satz 6 das die Menge R[a, b] der Rieman-integrierbarenFunktionen f : [a, b] → R abgeschlossen in B([a, b]; R) ist und das die Integration∫ b

a

: R[a, b] → R; f 7→∫ b

a

f(x) dx

eine stetige Abbildung ist. Auch den Weierstrasschen Approximationssatz Satz 1 kannman in diesem Rahmen interpretieren, ist P ⊆ C[a, b] die Menge aller Polynome f :[a, b] → R, so ist P = C[a, b]. Dagegen ist die Menge C1[a, b] der stetig differenzierbarenFunktionen f : [a, b] → R nicht abgeschlossen in B([a, b]; R), wir hatten ja ein Beispieleiner Folge stetig differenzierbarer Funktionen gesehen, die gleichmaßig gegen eine nichtdifferenzierbare Funktion konvergierte.

Bevor wir die Grundeigenschaften der Abschlußoperation angeben, wollen wir nochan eine kleine Bezeichnung aus dem letzten Semester erinnern, und diese auch gleichauf normierte Raume ausdehnen. Sind E ein normierter Raum, x ∈ E ein Punkt vonE und ε > 0 eine reelle Zahl, so nennen wir die Mengen

Bε(x) := {y ∈ E : ||y − x|| < ε} und Bε(x) := {y ∈ E : ||y − x|| ≤ ε}

154

Page 155: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 1.6.2011

die offene, beziehungsweise die abgeschlossene, Kugel mit Radius ε und Mittelpunktx. Das Wort

”Kugel“ darf man dabei nicht so wortlich nehmen, nur im R3 mit der

euklidischen Norm handelt es sich wirklich um Kugeln im engeren Sinne.Verwenden wir dagegen auf dem R2 die Ma-

ximumsnorm || ||∞ so sind die Kugeln eigent-lich Quadrate, und im R3 wieder mit der Ma-ximumsnorm sind es Wurfel. Noch ungewohn-ter sehen Kugeln bezuglich der Supremumsnormaus. Haben wir eine beschrankte Funktion f :[a, b] → R gegeben, so besteht die Kugel mitRadius ε > 0 und Mittelpunkt f bezuglich derSupremumsnorm aus all denjenigen Funktionen,deren Graph ganz in dem rechts angedeuteten

”Schlauch“ der Breite 2ε um den Graphen vonf herum liegt. In der Tat, die Bedingung daseine beschrankte Funktion g : [a, b] → R in derKugel Bε(f) liegt, lautet ||g − f ||∞ < ε, oderausgeschrieben

supx∈[a,b]

|f(x)− g(x)| < ε,

die Funktion g darf also um nicht mehr als ε von der Funktion f abweichen, und diesist gerade die obige

”Schlauchbedingung“.

Wir wollen jetzt einige der Grundeigenschaften fur den Abschluß von Mengen in ei-nem normierten Raum angeben, und anschließend werden wir ein paar Beispiele hierzubehandeln. Wir beweisen dieses Lemma zwar fur allgemeine normierte Raume, wirklichbrauchen werden wir es aber nur im Rn. In der Vorlesung wurde auf den Beweis diesesLemmas verzichtet.

Lemma 4.16 (Grundeigenschaften des Abschließens)Sei E ein normierter Raum. Dann gelten:

(a) Fur jede Teilmenge M ⊆ E ist M ⊆M und M ist abgeschlossen.

(b) Ist M ⊆ E, so ist M die kleinste M umfassende, abgeschlossene Teilmenge vonE, d.h. ist A ⊆ E abgeschlossen mit M ⊆ A, so ist auch M ⊆ A.

(c) Sind M ⊆ E und x ∈ E, so ist genau dann x ∈ M wenn fur jedes ε > 0 stetsM ∩Bε(x) 6= ∅ gilt.

(d) Sind M,N ⊆ E mit M ⊆ N , so ist auch M ⊆ N .

(e) Sind M,N ⊆ E, so gelten M ∪N = M ∪N und M ∩N ⊆M ∩N .

(f) Sind M,N ⊆ E abgeschlossen, so ist auch M ∪N abgeschlossen.

(g) Ist (Mi)i∈I eine Familie abgeschlossener Teilmengen von E, so ist auch⋂

i∈I Mi

abgeschlossen.

155

Page 156: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 1.6.2011

Beweis: (c) ”=⇒” Es gibt eine Folge (xn)n∈N in M , die gegen x konvergiert. Ist ε > 0,so gibt es also ein n0 ∈ N mit ||xn − x|| < ε fur alle n ≥ n0, und insbesondere istxn0 ∈M mit ||xn0 − x|| < ε, d.h. wir haben xn0 ∈M ∩Bε(x).”⇐=” Fur jedes n ≥ 1 ist M∩B1/n(x) 6= ∅, also gibt es ein xn ∈M mit ||xn−x|| < 1/n.Damit ist (xn)n∈N eine gegen x konvergente Folge in M .(a) Die Inklusion M ⊆ M haben wir bereits oben festgehalten. Es ist also nur zuzeigen, dass die Menge M abgeschlossen ist. Sei also x ∈ E ein Beruhrpunkt von M .Zu zeigen ist, dass dann auch x ∈M ist, das x also ein Beruhrpunkt von M selbst ist.Sei ε > 0. Nach (c) ist dann M ∩Bε(x) 6= ∅, also existiert ein y ∈M mit ||x− y|| < ε.Damit ist auch δ := ε − ||x − y|| > 0, und wieder nach (c) existiert ein z ∈ M mit||y − z|| < δ. Insgesamt ist damit auch

||z − x|| ≤ ||z − y||+ ||y − x|| < δ + ||x− y|| = ε.

Mit (c) folgt somit x ∈M .(b) Nach (a) ist M uberhaupt eine M umfassende, abgeschlossene Menge. Nun seiA ⊆ E eine abgeschlossene Menge mit M ⊆ A. Ist dann x ∈M , so existiert eine gegenx konvergente Folge (xn)n∈N in M ⊆ A, d.h. x ist auch ein Beruhrpunkt von A, undwir haben x ∈ A = A. Dies zeigt M ⊆ A.(d) Klar nach (a) und (b).(f) Sei (xn)n∈N eine Folge in M ∪ N , die gegen ein x ∈ E konvergiert. Dann gibt eseine Teilfolge (xnk

)k∈N von (xn)n∈N mit xnk∈ M fur alle k ∈ N oder xnk

∈ N fur allek ∈ N. Da auch (xnk

)k∈N −→ x ist, gilt damit auch x ∈ M oder x ∈ N , es ist alsox ∈M ∪N .(e) Wegen M ⊆M ∪N , N ⊆M ∪N , M ∩N ⊆M und M ∩N ⊆ N , sind nach (d) auchM ⊆M ∪N , N ⊆M ∪N , M ∩N ⊆M und M ∩N ⊆ N , also M ∪N ⊆M ∪N undM ∩N ⊆ M ∩N . Nach (f) ist auch M ∪N abgeschlossen mit M ∪N ⊆ M ∪N , d.h.nach (b) gilt auch M ∪N ⊆M ∪N . Insgesamt ist damit M ∪N = M ∪N bewiesen.(g) Sei (xn)n∈N eine gegen x ∈ E konvergente Folge in

⋂i∈I Mi. Fur jedes i ∈ I ist

(xn)n∈N dann auch eine Folge in Mi und wir haben x ∈Mi. Dies zeigt x ∈⋂

i∈I Mi.

Wir wollen einige weitere Beispiele abgeschlossener Mengen durchgehen.

1. Sind a, b ∈ R mit a < b, so ist das Intervall [a, b] ⊆ R abgeschlossen, ist namlich(xn)n∈N eine gegen x ∈ R konvergente Folge in [a, b], so ist wegen a ≤ xn ≤ bfur alle n ∈ N auch a ≤ x ≤ b, d.h. x ∈ [a, b]. Analog ergibt sich das auch alleIntervalle der Form [a,∞) und (−∞, a] abgeschlossen sind.

2. Sind E,F zwei normierte Raume, D ⊆ E abgeschlossen und f : D → F stetig,so ist fur jede abgeschlossene Menge A ⊆ F auch das Urbild f−1(A) ⊆ E abge-schlossen. Sei namlich (xn)n∈N eine Folge f−1(A) mit (xn)n∈N −→ x ∈ E. Wegenxn ∈ D fur alle n ∈ N und da D abgeschlossen ist, ist auch x ∈ D. Die Stetigkeitvon f ergibt dann (f(xn))n∈N −→ f(x) und wegen f(xn) ∈ A fur jedes n ∈ N istauch f(x) ∈ A. Damit ist auch x ∈ f−1(A).

156

Page 157: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 1.6.2011

3. Die MengeM := {(x, y) ∈ R2| sin2 x+ x cos(y) ≥ 1}

ist abgeschlossen im R2. In der Tat, die Funktion

f : R2 → R; (x, y) 7→ sin2 x+ x cos y

ist stetig und es gilt M = f−1([1,∞)). In dieser Weise kann man in solchenSituationen immer schließen, etwas verkurzend kann man sagen das durch

”≤“

und”≥“ definierte Mengen immer abgeschlossen sind.

4. Sind E ein normierter Raum, x ∈ E und r > 0, so ist die abgeschlossene Kugel

Br(x) = {y ∈ E : ||y − x|| ≤ r}

eine abgeschlossene Teilmenge von E. Sei namlich (yn)n∈N eine gegen y ∈ Ekonvergente Folge in Br(x), also ||yn − x|| ≤ r fur alle n ∈ N. Dann sind auch(yn−x)n∈N −→ y−x und (||yn−x||)n∈N −→ ||y−x||, es gilt also auch ||y−x|| ≤ rund somit y ∈ Br(x).

5. Seien a, b ∈ R mit a < b. Wir wissen schon, dass C[a, b] ⊆ B([a, b]; R) abgeschlos-sen ist und das fur die Menge P der Polynome P = C[a, b] gilt. Wegen

P ⊆ C1[a, b] ⊆ C[a, b] ist auch C[a, b] = P ⊆ C1[a, b] ⊆ C[a, b],

also C1[a, b] = C[a, b].

Fur eine Beziehung wie C1[a, b] = C[a, b] sagt man auch das C1[a, b] dicht in C[a, b]ist. Ist E ein normierter Raum so nennt man allgemein eine Teilmenge D ⊆ E dichtin E wenn D = E gilt. Weiter heißt der normierte Raum E separabel wenn er eineabzahlbare dichte Teilmenge besitzt. Nach Lemma 16.(c) ist eine Teilmenge D ⊆ Egenau dann dicht in E wenn fur jedes x ∈ E und jedes ε > 0 stets D ∩ Bε(x) 6= ∅ ist,es also y ∈ D mit ||x− y|| < ε gibt. Beispielsweise ist die Menge P der Polynome alsodicht in C[a, b]. Als eine Ubungsaufgabe konnen Sie sich uberlegen, dass C[a, b] sogarseparabel ist. Nach §2.Lemma 1 sind die Mengen Q der rationalen Zahlen und R\Qder irrationalen Zahlen beide dicht in R, insbesondere ist R separabel.

Seien wieder E ein normierter Raum und M ⊆ E eine Teilmenge. Nach Lemma16.(c) gilt fur einen Punkt x ∈ E genau dann x /∈M wenn es ein ε > 0 mit M∩Bε(x) =∅, also Bε(x) ⊆ E\M , gibt. Dies fuhrt uns auf die nachste Definition.

Definition 4.9 (Innere Punkte und offene Mengen)Seien E ein normierter Raum und M ⊆ E. Ein Punkt x ∈ M heißt ein innerer Punktvon M beziehungsweise M eine Umgebung von x wenn es ein ε > 0 mit Bε(x) ⊆ Mgibt. Weiter bezeichne M◦ ⊆ M die Menge aller inneren Punkte von M , genannt dasInnere von M . Schließlich heißt M offen wenn M◦ = M ist.

Ist also M ⊆ E, so ist fur x ∈ E genau dann x /∈ M wenn x ein innerer Punkt vonE\M ist, d.h. es gilt E\M = (E\M)◦. Wir wollen uns auch einige Beispiele offenerMengen anschauen.

157

Page 158: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 1.6.2011

1. Seien E ein normierter Raum, x ∈ E und ε > 0. Wir wollen einsehen, dass Bε(x)offen ist. Sei also y ∈ Bε(x), d.h. ||y− x|| < ε. Dann ist δ := ε− ||x− y|| > 0 undwir behaupten, dass Bδ(y) ⊆ Bε(x) gilt. Sei z ∈ Bδ(y), also ||y − z|| < δ. Dannist auch ||z − x|| ≤ ||z − y||+ ||y − x|| < δ + ||y − x|| = ε, d.h. z ∈ Bε(x). Damitist y ein innerer Punkt von Bε(x) und wir haben gezeigt das Bε(x) offen ist.

2. Seien E,F zwei normierte Raume, U ⊆ E offen und f : U → F eine stetigeAbbildung. Dann ist fur jede offene Menge V ⊆ F auch das Urbild f−1(V ) offenin E. Seien also V ⊆ F offen und x ∈ f−1(V ). Da U offen ist, existiert einε1 > 0 mit Bε1(x) ⊆ U , und da V in F offen ist existiert auch ein ε2 > 0 mitBε2(f(x)) ⊆ V . Da f stetig ist, gibt es weiter ein δ > 0 mit ||f(y) − f(x)|| < ε2fur alle y ∈ U mit ||y− x|| < δ. Setze jetzt ε := min{ε2, δ}. Sei y ∈ Bε(x). Wegen||y−x|| < ε ≤ ε1 ist dann y ∈ U und ||y−x|| < ε ≤ δ, d.h. ||f(y)−f(x)|| < ε2 undsomit f(y) ∈ Bε2(f(x)) ⊆ V also y ∈ f−1(V ). Dies zeigt Bε(x) ⊆ f−1(V ) unddamit ist x ein innerer Punkt von f−1(V ). Somit ist f−1(V ) eine offene Menge.

3. Sind a, b ∈ R mit a < b, so ist das Intervall (a, b) ⊆ R offen in R. Ist namlichx ∈ (a, b), so gilt mit ε := min{x− a, b− x} auch Bε(x) = (x− ε, x+ ε) ⊆ (a, b).Analog sind auch Intervalle der Form (a,∞) und (−∞, a) fur a ∈ R offen.

4. Die MengeU := {(x, y) ∈ R2| sin2 x+ x cos y > 1}

ist offen im R2 denn die Funktion f : R2 → R; (x, y) 7→ sin2 x + x cos y ist stetigund es gilt U = f−1((1,∞)). Diese Uberlegung ist naturlich vollig analog zurentsprechenden Eigenschaft abgeschlossener Mengen, und kann in allen ahnlichenSitution angewandt. Erneut kann man dies verkurzt so aussprechen das durch

”<“

und”>“ definierte Mengen offen sind.

Analog zu den Eigenschaften abgeschlossener Mengen haben wir auch entsprechendeEigenschaften offener Mengen.

Lemma 4.17 (Grundeigenschaften offener Mengen)Sei E ein normierter Raum. Dann gelten:

(a) Fur jede Teilmenge M ⊆ E gelten

M = E\(E\M)◦ und M◦ = E\E\M.

(b) Fur jedes M ⊆ E ist M◦ offen und es gilt M◦ ⊆M .

(c) Ist M ⊆ E, so ist M◦ die großte in M enthaltene offene Teilmenge von E, d.h.ist U ⊆ E offen mit U ⊆M so ist auch U ⊆M◦.

(d) Eine Menge M ⊆ E ist genau dann offen wenn E\M abgeschlossen ist.

(e) Sind M,N ⊆ E mit M ⊆ N , so ist auch M◦ ⊆ N◦.

158

Page 159: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 1.6.2011

(f) Sind M,N ⊆ E, so gelten M◦ ∪N◦ ⊆ (M ∪N)◦ und (M ∩N)◦ = M◦ ∩N◦.

(g) Sind U, V ⊆ E offen, so ist auch U ∩ V offen.

(h) Ist (Ui)i∈I eine Familie offener Teilmengen von E, so ist auch⋃

i∈I Ui offen.

Beweis: (a) Sei M ⊆ E. Wir wissen bereits das E\M = (E\M)◦ gilt, und hierausfolgt

M = E\(E\M) = E\(E\M)◦.

Wenden wir dies auf das Komplement E\M an, so ergibt sich

E\M = E\(E\(E\M))◦ = E\M◦,

d.h.M◦ = E\(E\M◦) = E\E\M.

(d) Mit (a) folgt

M offen ⇐⇒M◦ = M ⇐⇒ E\E\M = M ⇐⇒ E\M = E\M⇐⇒ E\M abgeschlossen.

(b) Nach (a) und Lemma 16.(a) ist E\M◦ = E\M abgeschlossen, d.h. nach (d) ist M◦

offen. Die Aussage M◦ ⊆M ist klar.(c) Sei U ⊆ E offen mit U ⊆ M . Nach (d) ist E\U abgeschlossen mit E\M ⊆ E\U ,d.h. nach Lemma 16.(b) gilt E\M ⊆ E\U und (a) ergibt U ⊆ E\E\M = M◦.(e) Klar nach (b) und (c).(f) Wegen M,N ⊆ M ∪ N ist nach (e) auch M◦, N◦ ⊆ (M ∪ N)◦, also M◦ ∪ N◦ ⊆(M ∪N)◦. Nach (a) und Lemma 16.(e) haben wir weiter

(M ∩N)◦ = E\E\(M ∩N) = E\E\M ∪ E\N = E\(E\M ∪ E\N)

= E\E\M ∩ E\E\N = M◦ ∩N◦.

(g) Nach (f) ist (U ∩ V )◦ = U◦ ∩ V ◦ = U ∩ V , d.h. U ∩ V ist offen.(h) Fur jedes i ∈ I ist E\Ui nach (d) abgeschlossen und nach Lemma 16.(g) ist auch

E\⋃i∈I

Ui =⋂i∈I

(E\Ui)

abgeschlossen, d.h.⋃

i∈I Ui ist offen.

Offene und abgeschlossene Mengen sind also komplementar zueinander. Auf der an-deren Seite sind

”offen“ und

”abgeschlossen“ aber kein Gegensatzpaar, es gibt sowohl

Mengen die offen aber nicht abgeschlossen sind, Mengen die abgeschlossen aber nichtoffen sind, Mengen die offen und abgeschlossen sind und Mengen die weder offen noch

159

Page 160: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 1.6.2011

abgeschlossen sind. Alle Kombinationen von offen/abgeschlossen sind also moglich, einUmstand der gelegentlich als

”Mengen sind keine Turen“ formuliert wird.

Im Zusammenhang mit offenen und abgeschlossenen Mengen gibt es noch einendritten Grundbegriff, den sogenannten Rand einer Menge.

Definition 4.10 (Der Rand einer Menge)Seien E ein normierter Raum und M ⊆ E eine Teilmenge. Dann heißt die Menge

∂M := M\M◦

der Rand von M .

In anderen Worten ist fur einen Punkt x ∈ E genau dann x ∈ ∂M wenn fur jedesε > 0 stets

Bε(x) ∩M 6= ∅ und Bε(x) 6⊆M

gelten, d.h. jede Kugel mit Mittelpunkt x trifft sowohl M als auch das Komplementvon M .

Lemma 4.18 (Grundeigenschaften des Randes)Seien E ein normierter Raum und M ⊆ E eine Teilmenge.

(a) Der Rand ∂M von M ist abgeschlossen.

(b) Ist M offen, so ist ∂M = M\M und ist M abgeschlossen, so ist ∂M = M\M◦.

(c) Der Raum E ist die disjunkte Vereinigung E = M◦ ∪ ∂M ∪ (E\M).

Beweis: (a) Wegen ∂M = M ∩ (E\M◦) ist dies klar nach Lemma 16.(a,g) und Lemma17.(b).(b) Klar.(c) Es sind ∂M ∩M◦ ⊆ (E\M◦) ∩M◦ = ∅, ∂M ∩ (E\M) ⊆ M ∩ (E\M) = ∅ undM◦ ∩ (E\M) ⊆M ∩ (E\M) = ∅, die drei Mengen sind also disjunkt. Weiter ist

E\(M◦ ∪ (E\M)) = (E\M◦) ∩ (E\(E\M)) = M\M◦ = ∂M

und damit ist E auch die Vereinigung der drei Mengen.

Zum Abschluß wollen wir noch einen letzten Begriff einfuhren. Wir hatten bemerktdas all die Aussagen uber Folgen, Reihen und Stetigkeit aus dem letzten Semester auchin normierten Raumen gelten, solange sie nicht auf der Ordnungsstruktur der reellenZahlen beruhten. Insbesondere ist das Cauchy-Kriterium fur die Folgenkonvergenz ineinem allgemeinen normierten Raum nicht mehr gultig, denn dieses beruhte auf derTatsache das jede beschrankte, reelle Zahlenfolge eine konvergente Teilfolge besitzt.Man interessiert sich nun besonders fur diejenigen normierten Raume in denen dasCauchy-Kriterium dann doch zutrifft, und diesen geben wir jetzt einen Namen.

160

Page 161: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 1.6.2011

Definition 4.11 (Vollstandige normierte Raume)Ein normierter Raum E heißt vollstandig, oder ein Banachraum, wenn jede Cauchyfolgein E konvergiert. Alternativ nennen wir dann auch die Norm || || von E vollstandig.

Viele wichtige normierte Raume sind vollstandig, zum Beispiel:

1. Fur K ∈ {R,C} ist der Betrag | | eine vollstandige Norm auf K. Dies ist geradedas ursprungliche Cauchy-Kriterium I.§6.Satz 14.

2. Sind K ∈ {R,C} und d ∈ N mit d ≥ 1, so ist auch der Kd in der Norm || ||∞vollstandig. Sei namlich (xn)n∈N eine Cauchyfolge in Kd. Ist 1 ≤ i ≤ d, so giltfur alle n,m ∈ N stets |xn,i − xm,i| ≤ ||xn − xm||∞, also ist auch (xn,i)n∈N eineCauchyfolge in K und nach I.§6.Satz 14 existiert xi ∈ K mit (xn,i)n∈N −→ xi.Damit ist aber auch (xn)n∈N −→ x := (x1, . . . , xd) ∈ Kd.

3. Nach dem Cauchy-Kriterium fur die gleichmaßige Konvergenz Lemma 2 und Lem-ma 3 ist B(M ;K) fur K ∈ {R,C} und jede Menge M vollstandig.

Wir wollen noch ein kleines Lemma uber vollstandige normierte Raume beweisen. Imletzten Semester hatten wir in I.§7 eingesehen, dass eine absolut konvergente Reiheauch konvergent ist. Der Beweis dieser Tatsache beruhte auf dem Cauchy-Kriteriumfur Reihen das seinerseits wiederum auf dem Cauchy-Kriterium fur Folgen beruhte. Ineinen vollstandigen normierten Raum wird also auch jede absolut konvergente Reihekonvergieren. Tatsachlich ist diese Bedingung sogar aquivalent zur Vollstandigkeit desnormierten Raums.

Lemma 4.19: Sei E ein normierter Raum. Dann gelten:

(a) Der normierte Raum E ist genau dann vollstandig wenn in E jede absolut konver-gente Reihe auch konvergent ist.

(b) Ist F ≤ E ein vollstandiger Teilraum, also ein Untervektorraum der bezuglich desin E gegebenen Betrags vollstandig ist, so ist F in E abgeschlossen.

(c) Ist E vollstandig und ist F ≤ E ein abgeschlossener Teilraum, so ist auch Fvollstandig.

Beweis: (a) ”=⇒” Analog zum Beweis von I.§7.Lemma 10.”⇐=” Sei (xn)n∈N eine Cauchyfolge in E. Dann gibt es ein n0 ∈ N mit ||xn − xm|| ≤ 1fur alle n,m ≥ n0. Ist jetzt k ≥ 1 und ist nk−1 schon definiert, so gibt es ein nk ∈ N mitnk > nk−1 und ||xn − xm|| ≤ 1/2k fur alle n,m ≥ nk. Dies definiert uns eine Teilfolge(xnk

)k∈N von (xn)n∈N. Sind k ∈ N und p, q ∈ N mit p, q ≥ k, so gelten auch np, nq ≥ nk

und somit ||xnp − xnq || ≤ 1/2k.Wir definieren jetzt auch noch eine Reihe in E. Setze hierzu y0 := xn0 und yk :=

xnk− xnk−1

fur k ≥ 1. Fur k ≥ 1 gilt dann

||yk|| = ||xnk− xnk−1

|| ≤ 1

2k−1, also

∞∑k=0

||yk|| ≤ ||xn0||+∞∑

k=0

1

2k<∞,

161

Page 162: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 1.6.2011

d.h. die Reihe∑∞

k=0 yk ist absolut konvergent, und damit auch konvergent nach unsererAnnahme. Nach Konstruktion sind die Partialsummen dieser Reihe gegeben als

k∑l=0

yl =k∑

l=1

(xnl− xnl−1

) + xn0 = xnk,

d.h. die Folge (xnk)k∈N konvergiert in E. Die Cauchyfolge (xn)n∈N hat also eine konver-

gente Teilfolge und ist damit nach I.§6.Lemma 13.(c) selbst konvergent.(b) Sei (xn)n∈N eine Folge in F mit (xn)n∈N −→ x ∈ E. Dann ist (xn)n∈N nachI.§6.Lemma 13.(a) auch eine Cauchyfolge und da F vollstandig ist, existiert ein y ∈ Fmit (xn)n∈N −→ y. Die Eindeutigkeit des Grenzwerts liefert damit x = y ∈ F . Somitist F abgeschlossen in E.(c) Sei (xn)n∈N eine Cauchyfolge in F . Da E vollstandig ist existiert ein x ∈ E mit(xn)n∈N −→ x und da F abgeschlossen ist, ist sogar x ∈ F . Damit ist die Cauchyfolge(xn)n∈N auch in F konvergent.

Mit diesem Lemma konnen wir einige weitere Beispiele behandeln. Seien wieder a, b ∈R mit a < b gegeben. Wir haben schon eingesehen, dass der Vektorraum B([a, b]; R) inder Supremumsnorm vollstandig ist. Weiter wissen wir auch, dass der Teilraum C[a, b]der stetigen Funktionen auf [a, b] in B([a, b]; R) abgeschlossen ist, und nach dem Lemmaist somit auch C[a, b] vollstandig. Dagegen sind die stetig differenzierbaren FunktionenC1[a, b] nicht abgeschlossen in B([a, b]; R), und nach dem Lemma kann C1[a, b] damitnicht vollstandig sein.

$Id: jordan.tex,v 1.9 2011/09/19 05:29:28 hk Exp $

§5 Eigenwerte und die Jordansche Normalform

Nachdem wir nun den ersten analytischen Abschnitt beendet haben, kommen wirjetzt zur linearen Algebra. In diesen Kapiteln werden wir nur die unmittelbar ein-zusehenden Aussagen wirklich beweisen, fur die Beweise der meisten komplizierterenAussagen fehlen uns leider die notwendigen Hilfsmittel. Wir beginnen mit dem grund-legenden Begriff der Eigenwerte einer linearen Abbildung, der sich als das zentraleHilfsmittel der folgenden Kapitel herausstellen wird.

5.1 Eigenwerte und Eigenvektoren

Definition 5.1: Sei V ein Vektorraum uber K ∈ {R,C}. Ein Endomorphismus vonV ist eine lineare Abbildung T : V → V . Sei nun T ein Endomorphismus von V . Ist

162

Page 163: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 1.6.2011

λ ∈ K so, heißt ein Vektor v ∈ V ein Eigenvektor zu λ wenn

Tv = λ · v

gilt. Weiter heißt λ ein Eigenwert von T wenn es einen von Null verschiedenen Eigen-vektor zu λ gibt.

Beachte das der Nullvektor zu jedem λ ∈ K ein Eigenvektor ist, mit dieser Festlegungwird die Menge aller Eigenvektoren zu beliebigen λ ∈ K ein Untervektorraum werden,wie wir etwas weiter unten sehen werden. Wir betrachten zunachst einige Beispiele.

1. Zunachst sei

T : R2 → R2; (x, y) 7→ (2x, 3y),

x- und y-Achse werden also unabhangig voneinander umskaliert. Fur jedes t ∈ Rsind dann

T (t, 0) = (2t, 0) = 2 · (t, 0) und T (0, t) = (0, 3t) = 3 · (0, t).

Damit hat T zumindest die beiden Eigenwerte λ = 2 und λ = 3 und die Eigen-vektoren fur λ = 2 sind die Elemente der x-Achse und die fur λ = 3 die Elementeder y-Achse. Mehr Eigenwerte gibt es nicht. Denn nehmen wir uns einen Vektorv ∈ R2, der weder auf der x- noch auf der y-Achse liegt, so ist v = (x, y) mitx, y 6= 0 und somit ist

Tv = T (x, y) = (2x, 3y)

kein Vielfaches von v = (x, y), d.h. v ist kein Eigenvektor.

2. Als nachstes Beispiel wollen wir die Scherung

T : R2 → R2; (x, y) 7→ (x+ 2y, y)

betrachten. Fur jedes x ∈ R gilt dabei

T (x, 0) = (x, 0),

d.h. λ = 1 ist ein Eigenwert von T mit den Elementen der x-Achse als Eigenvek-toren. In diesem Beispiel gibt es keine weiteren Eigenwerte oder Eigenvektoren.Denn ist v ∈ R2 nicht auf der x-Achse, so ist v = (x, y) mit y 6= 0. Dann istT (x, y) = (x + 2y, y) kein Vielfaches von v = (x, y). Hier haben wir also genaueinen Eigenwert λ = 1.

3. Es kann auch passieren, dass es uberhaupt keine Eigenwerte gibt. Sei etwa T :R2 → R2 eine Drehung um einen Winkel 0 < ϕ < π. Dann wird offenbar keinvon Null verschiedener Vektor auf einen Vielfachen abgebildet, und somit gibt esin diesem Beispiel keine Eigenwerte.

163

Page 164: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 1.6.2011

4. Als ein letztes Beispiel betrachten wir den Vektorraum V = C∞(R) aller un-endlich oft differenzierbaren Funktionen von R nach R. Als lineare Abbildungnehmen wir das Ableiten

T =d

dx: C∞(R) → C∞(R); f 7→ f ′.

Was sind nun die Eigenwerte von T? Die Eigenvektoren zu einer reellen Zahlλ ∈ R sind diejenigen unendlich oft differenzierbaren Funktionen f : R → R mit

λf = Tf = f ′,

und ganz zu Beginn dieses Semesters am Anfang von §1 hatten wir schon gesehen,dass dies genau die Funktionen der Form f(x) = Ceλx mit C ∈ R sind. Damitist uberhaupt jede reelle Zahl λ ein Eigenwert von T und die Eigenvektoren zuλ sind genau die angegebenen Funktionen.

Wie schon oben bemerkt, bildet die Menge aller Eigenvektoren zu einem Eigenwertstets einen von Null verschiedenen Untervektorraum von V . Hierzu werden wir denBegriff des Kerns einer linearen Abbildung T aus I.§11 verwenden, dieser war derUntervektorraum aller Vektoren x mit Tx = 0.

Lemma 5.1 (Eigenraume linearer Abbildungen)Seien K ∈ {R,C}, V ein Vektorraum uber K und T ein Endomorphismus von V . Furjedes λ ∈ K ist dann die Menge

Eλ(T ) := {v ∈ V |Tv = λv}

der Eigenvektoren von T zu λ ein Untervektorraum von V , genannt der zu λ gehorigeEigenraum. Es ist Eλ(T ) = Kern(λ− T ).

Beweis: Fur v ∈ E ist genau dann v ∈ Eλ(T ) wenn Tv = λv, also wenn (λ− T )v = 0,gilt. Damit ist Eλ(T ) = Kern(λ − T ) und dies ist nach I.§11.Lemma 9.(e) auch einUntervektorraum.

Wie im letzten Semester ist”λ−T“ eine verkurzte Schreibweise fur die lineare Abbil-

dung λ · idV −T . Ist unser Vektorraum V endlich erzeugt, so hatten wir in I.§11.Lemma11 gesehen, dass auch jeder Untervektorraum U von V endlich erzeugt ist, und somiteine Dimension dimU ≤ dimV besitzt. Wenden wir dies auf die Eigenraume einesEndomorphismus an, so ergibt sich die sogenannte geometrische Vielfachheit eines Ei-genwerts.

Definition 5.2 (Geometrische Vielfachheit eines Eigenwerts)Seien K ∈ {R,C}, V ein endlich erzeugter Vektorraum uber K, T ein Endomorphismusvon V und λ ∈ K ein Eigenwert von K. Dann heißt die Dimension dimEλ(T ) diegeometrische Vielfachheit des Eigenwerts λ.

164

Page 165: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 3.6.2011

5.2 Eigenwerte von Matrizen

Seien K ∈ {R,C} und n ∈ N mit n ≥ 1. In I.§12 hatten wir gesehen das die Endomor-phismen des Kn alle die Form TAx := Ax mit einer n × n-Matrix A uber K haben.Wir ubertragen die Sprechweisen des vorigen Abschnitts dann auf die Matrix A, d.h.Eigenwerte, Eigenvektoren, Eigenraume und geometrische Vielfachheiten von A sinddiejenigen von TA. Im reellen Fall K = R konnen wir uns A auch als komplexe Matrixdenken und dann von den komplexen Eigenwerten von A reden. Wie berechnet mannun die Eigenwerte und Eigenvektoren einer Matrix A? Fur jede Zahl λ ∈ K bestehendie Aquivalenzen

λ ist ein Eigenwert von A ⇐⇒ Es gibt ein 0 6= x ∈ Kn mit Ax = λx

⇐⇒ Es gibt ein 0 6= x ∈ Kn mit λx− Ax = 0

⇐⇒ Das homogene lineare Gleichungssystem

(λ− A)x = 0 hat eine nicht triviale Losung

⇐⇒ Die Matrix λ− A ist nicht regular

⇐⇒ det(λ− A) = 0.

Die erhaltene Bedingung det(λ − A) = 0 fassen wir nun als eine Gleichung fur dengesuchten Eigenwert λ auf. Damit sind die Eigenwerte λ der Matrix A die Losungender Gleichung det(λ − A) = 0, und diese wird als die charakteristische Gleichung derMatrix A bezeichnet.

Vorlesung 15, Freitag 3.6.2011

Wir sind gerade mit der Untersuchung der Eigenwerte einer reellen oder komplexenn × n-Matrix A beschaftigt, und hatten gesehen, dass diese genau die Losungen dersogenannten charakteristischen Gleichung

det(λ− A) = 0

sind. Als ein Beispiel wollen wir einmal die Eigenwerte und Eigenvektoren der 3 × 3Matrix

A =

−9 4 −8−11 6 −8

8 −4 7

165

Page 166: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 3.6.2011

berechnen. Die charakteristische Gleichung ist dann∣∣∣∣∣∣λ+ 9 −4 811 λ− 6 8−8 4 λ− 7

∣∣∣∣∣∣ =

∣∣∣∣∣∣λ+ 9 −4 82− λ λ− 2 0λ+ 1 0 λ+ 1

∣∣∣∣∣∣ =

∣∣∣∣∣∣λ+ 5 4 8

0 λ− 2 0λ+ 1 0 λ+ 1

∣∣∣∣∣∣= (λ− 2)

∣∣∣∣ λ+ 5 8λ+ 1 λ+ 1

∣∣∣∣ = (λ− 2)((λ+ 1)(λ+ 5)− 8(λ+ 1))

= (λ− 2)(λ+ 1)(λ− 3)!= 0.

Diese Gleichung hat genau die drei Losungen λ = −1, λ = 2 und λ = 3 und diessind damit auch die Eigenwerte von A. Wir wollen jetzt auch noch die zugehorigenEigenraume berechnen. Starten wir mit dem Eigenwert λ = −1. Wir hatten gesehen,dass die Eigenvektoren zu einem Eigenwert λ von A genau die Losungen x des homoge-nen linearen Gleichungssystems (λ−A)x = 0 sind. Die Matrix λ−A hatten wir schonzur Berechnung der charakteristischen Gleichung hingeschrieben, und hier mussen wirnur λ = −1 einsetzen, um zu unseren linearen Gleichungssystem zu kommen. Die Ei-genvektoren zum Eigenwert λ = −1 sind damit die Losungen des homogenen linearenGleichungssystems

8x − 4y + 8z = 011x − 7y + 8z = 0−8x + 4y − 8z = 0

Losen wir dieses Gleichungssystem uber das Gaußsche Eliminationsverfahren 8 −4 811 −7 8−8 4 −8

8 −4 80 −3

2−3

0 0 0

,

so ergibt sich die Losung als

3

2y = −3z =⇒ y = −2z und 8x = 4y − 8z = −16z =⇒ x = −2z.

Wir erhalten damit beispielsweise mit z = 1 den Eigenvektor

u =

−2−2

1

,

und tatsachlich gilt

Au =

−9 4 −8−11 6 −8

8 −4 7

·

−2−2

1

=

22

−1

= −u.

Das explizite Aufstellen des homogenen linearen Gleichungssystems (λ − A)x = 0 istdabei gar nicht notig, denn wir schreiben anschließend ja sowieso nur seine Koeffizi-entenmatrix hin, und diese ist einfach die Matrix λ − A, die wir zur Bestimmung der

166

Page 167: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 3.6.2011

charakteristischen Gleichung bereits berechnet haben, und in ihr konnen wir den Wertfur λ einfach einsetzen. Beispielsweise wird die Rechnung fur den Eigenwert λ = 2 zu

11 −4 811 −4 8−8 4 −5

11 −4 80 0 00 12

11911

11 −4 80 4 30 0 0

mit den Losungen

y = −3

4z, 11x = 4y − 8z = −11z =⇒ x = −z

und fur z = 4 haben wir den Eigenvektor

v =

−4−3

4

zum Eigenwert λ = 2. Da die Rechnung fur λ = 3 nichts neues bringt, notieren wirhier nur als Ergebnis den Eigenvektor

w =

−1−1

1

zum Eigenwert λ = 3. In diesem Beispiel haben wir also drei verschiedene Eigenwerteund jeder dieser Eigenwerte hat einen eindimensionalen Eigenraum. Dies reprasentiertin gewisser Weise den Normalfall. Eine zufallig herausgegriffene n × n Matrix hat nverschiedene (komplexe) Eigenwerte, die alle einen eindimensionalen Eigenraum haben.Dies ist aber nur der Normalfall und keinesfalls die einzige Moglichkeit. Wir wollen nochein zweites Beispiel rechnen, in dem die Verhaltnisse etwas komplizierter liegen werden,die 4× 4 Matrix

A =

−3 −6 22 −4−6 −7 28 −6−2 −2 7 −2

6 10 −38 7

.

167

Page 168: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 3.6.2011

Die charakteristische Gleichung dieser Matrix ergibt sich als∣∣∣∣∣∣∣∣λ+ 3 6 −22 4

6 λ+ 7 −28 62 2 λ− 7 2−6 −10 38 λ− 7

∣∣∣∣∣∣∣∣ =

∣∣∣∣∣∣∣∣λ+ 3 3− λ −22 1− λ

6 λ+ 1 −18 02 0 λ− 7 0−6 −4 38 λ− 1

∣∣∣∣∣∣∣∣=

∣∣∣∣∣∣∣∣λ+ 3 3− λ −22 1− λ

6 λ+ 1 −18 02 0 λ− 7 0

λ− 3 −λ− 1 16 0

∣∣∣∣∣∣∣∣ = (λ− 1) ·

∣∣∣∣∣∣6 λ+ 1 −282 0 λ− 7

λ− 3 −λ− 1 16

∣∣∣∣∣∣= (λ− 1) ·

∣∣∣∣∣∣6 λ+ 1 −282 0 λ− 7

λ+ 3 0 −12

∣∣∣∣∣∣ = −(λ− 1)(λ+ 1) ·∣∣∣∣ 2 λ− 7λ+ 3 −12

∣∣∣∣= −(λ− 1)(λ+ 1)(−24− (λ− 7)(λ+ 3)) = (λ− 1)(λ+ 1)(λ2 − 4λ+ 3)

!= 0.

Damit haben wir bereits zwei Eigenwerte namlich λ = 1 und λ = −1. Um zu schauenwelche es sonst noch gibt, mussen wir die quadratische Gleichung λ2−4λ+3 = 0 losen,und erhalten die Eigenwerte

λ = 2±√

4− 3 = 2± 1 also λ = 1 oder λ = 3.

Dies gibt uns also nur noch einen weiteren Eigenwert λ = 3, und insgesamt haben wirdiesmal 3 verschiedene Eigenwerte gefunden. Wir wollen jetzt auch noch den Eigenraumzum Eigenwert λ = 1 ausrechnen.

4 6 −22 46 8 −28 62 2 −6 2

−6 −10 38 −6

1 1 −3 12 3 −11 23 4 −14 3

−3 −5 19 −3

1 1 −3 10 1 −5 00 1 −5 00 −2 10 0

→ 1 1 −3 10 1 −5 0

Nennen wir die beiden freien Variablen u und v, so wird

y = 5u und x = −y + 3u− v = −2u− v.

Hier sind beim Gauss Verfahren die unteren zwei Zeilen verschwunden, also zu Nullgeworden, und der Losungsraum ist somit 4 − 2 = 2 dimensional. Eine Basis desLosungsraums erhalten wir indem wir fur den ersten Basisvektor u = 1 und v =0, und fur den zweiten Basisvektor dann u = 0 und v = 1 setzen. Dies ergibt denzweidimensionalen Eigenraum

E1(A) =

⟨−2

510

,

−1

001

⟩.

168

Page 169: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 3.6.2011

Bei der Berechnung der Eigenraume zu den beiden anderen Eigenwerten λ = −1 undλ = 3 passiert nichts neues, und wir notieren hier nur die Eigenvektoren

v =

−1−1

02

fur λ = −1 und w =

−3−4−1

5

fur λ = 3.

In diesem Beispiel hatten wir also nur drei Eigenwerte bei einer 4× 4 Matrix und einerder drei Eigenraume war zweidimensional.

Bei unserer 3 × 3 Matrix war die linke Seite der charakteristischen Gleichung einPolynom von Grad 3 in λ, wahrend wir bei der 4 × 4 Matrix links ein Polynom in λvon Grad 4 hatten. Wir wollen uns jetzt klarmachen, dass die linke Seite der charak-teristischen Gleichung det(λ−A) = 0 immer ein normiertes Polynom von Grad n in λist, das sogenannte charakteristische Polynom der Matrix A. Insbesondere folgt daraus,dass eine n× n Matrix hochstens n verschiedene Eigenwerte haben kann.

Satz 5.2 (Das charakteristische Polynom)Seien K ∈ {R,C} und A eine n× n Matrix uber K. Dann ist

χA(x) := det(x− A)

ein normiertes Polynom uber K von Grad n, das sogenannte charakteristische Polynomder Matrix A. Fur n ≥ 2 gilt dabei

χA(x) = xn − tr(A)xn−1 + · · ·+ (−1)n det(A),

wobei

tr(A) := a11 + a22 + · · ·+ ann

die sogenannte Spur der Matrix A = (aij) ist.

Beweis: Schreiben wir

δij :=

{1, i = j,

0, i 6= j,

so ist x−A die Matrix (δijx−aij)1≤i,j≤n. Mit der Leipnitz Formel fur die Determinantefolgt

χA(x) =∑π∈Sn

(−1)π(δ1,π(1)x− a1,π(1)) · . . . · (δn,π(n)x− an,π(n)),

und dies ist ein Polynom von Grad hochstens n. Terme mit xn treten nur auf, wennbeim Ausmultiplizieren des obigen Produkts immer δi,π(i)x gewahlt wird, und damithaben wir nur einen von Null verschiedenen Term mit xn, namlich denjenigen zu π =(1, 2, . . . , n) und dieser wird xn. Die Terme mit xn−1 entstehen wenn im obigen Produktin genau n− 1 der Faktoren das δi,π(i)x gewahlt wird. Dies kann also nur ungleich Null

169

Page 170: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 3.6.2011

werden, wenn π(i) = i fur alle bis auf ein i gilt, und dies kommt wieder nur beiπ = (1, 2, . . . , n) vor. Die Terme mit xn−1 sind also

n∑i=1

(−aii) · xn−1 = − tr(A)xn−1.

Schließlich ist das absolute Glied gleich

χA(0) = det(−A) = (−1)n detA.

Fur die anderen Koeffizienten des charakteristischen Polynoms gibt es zwar auch For-meln, aber diese sind etwas komplizierter und fur praktische Zwecke auch nicht weiterwichtig. Wir wollen nun einmal die charakteristischen Polynome unserer bisherigenBeispiele durchgehen.

1. Die Abbildung T (x, y) = (2x, 3y) hat bezuglich der Standardbasis e1, e2 die Ma-trix

A =

(2 00 3

)=⇒ χA(x) =

∣∣∣∣ x− 2 00 x− 3

∣∣∣∣ = (x− 2)(x− 3) = x2 − 5x+ 6.

Beachte das sich hier auch die Formel des Satz 2 bestatigt. Das absolute Glied 6ist die Determinante von A und die Spur ist hier trA = 2 + 3 = 5.

2. Die Scherung T (x, y) = (x+ 2y, y) hat die Matrix

A =

(1 20 1

)=⇒ χA(x) =

∣∣∣∣ x− 1 −20 x− 1

∣∣∣∣ = (x− 1)2 = x2 − 2x+ 1.

3. Nun betrachten wir die Drehung T um einen Winkel 0 < φ < π im R2. Die Matrixvon T hatten wir in Abschnitt I.§12.2 im letzten Semester hergeleitet, namlich

A =

(cosφ − sinφsinφ cosφ

).

Das charakteristische Polynom ergibt sich als

χA(x) =

∣∣∣∣ x− cosφ sinφ− sinφ x− cosφ

∣∣∣∣ = (x− cosφ)2 + sin2 φ = x2 − 2 cos(φ)x+ 1.

Wir hatten bereits festgehalten, dass diese Drehung keine reellen Eigenwerte be-sitzt, und dies bestatigt sich erneut uber die charakteristische Gleichung λ2 −2 cos(φ)λ+ 1 = 0, die wegen

λ = cosφ±√

cos2 φ− 1 und cos2 φ− 1 < 0

170

Page 171: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 3.6.2011

keine reellen Losungen besitzt. Es gibt aber sehr wohl zwei komplexe Eigenwerte,namlich

λ = cosφ± i√

1− cos2 φ = cosφ± i

√sin2 φ = cosφ± i sinφ = e±iφ.

4. Bei der 3× 3 Matrix

A =

−9 4 −8−11 6 −8

8 −4 7

von oben ist das charakteristische Polynom einfach die linke Seite der charakte-ristischen Gleichung mit

”λ“ ersetzt durch

”x“, also

χA(x) = (x− 2)(x+ 1)(x− 3) = x3 − 4x2 + x+ 6.

Beachte das beim zweithochsten Koeffizienten hier wieder die Spur −9+6+7 = 4steht.

5. Bei der 4× 4 Matrix

A =

−3 −6 22 −4−6 −7 28 −6−2 −2 7 −2

6 10 −38 7

ergibt sich das charakteristische Polynom ebenso als

χA(x) = (x−1)(x+1)(x2−4x+3) = (x−1)2(x+1)(x−3) = x4−4x3+2x2+4x−3,

und auch diesmal ist trA = −3− 7 + 7 + 7 = 4.

Dass die Eigenwerte einer n×n-Matrix A gerade die Nullstellen ihres charakteristischenPolynoms χA sind, erlaubt es die sogenannte algebraische Vielfachheit eines Eigenwertseinzufuhren.

Definition 5.3 (Algebraische Vielfachheit von Eigenwerten)Seien K ∈ {R,C}, n ∈ N mit n ≥ 1 und A eine n×n-Matrix uber K. Die algebraischeVielfachheit eines Eigenwerts λ ∈ K von A ist die Vielfachheit der Nullstelle λ descharakteristischen Polynoms χA.

Ist also m die algebraische Vielfachheit des Eigenwerts λ, so konnen wir

χA(x) = (x− λ)mp(x)

schreiben, wobei p ein Polynom mit p(λ) 6= 0 ist. Besonders ubersichtlich ist die Lageim komplexen Fall K = C. Wie wir schon in §2.4 festgehalten hatten, zerfallt uber denkomplexen Zahlen jedes Polynom in Linearfaktoren. Ist also A ∈ Cn×n, so konnen wir

χA(x) = (x− λ1)m1 · . . . · (x− λr)

mr

171

Page 172: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 3.6.2011

mit paarweise verschiedenen λ1, . . . , λr ∈ C schreiben und dann sind λ1, . . . , λr genaudie Eigenwerte von A und fur jedes 1 ≤ i ≤ r ist mi die algebraische Vielfachheit vonλi. Insbesondere ist die Summe m1 + · · · + mr = n der algebraischen Vielfachheitengenau n. Eine weitere Sprechweise ist in diesem Zusammenhang ublich, man sagt das

λ1, . . . , λ1︸ ︷︷ ︸m1 mal

, . . . , λr, . . . , λr︸ ︷︷ ︸mr mal

und alle Umordnungen hiervon die”mit Vielfachheiten aufgezahlten Eigenwerte“ von

A sind. Beachte das wir all dies auch auf die komplexen Eigenwerte einer reellen Matrixanwenden konnen.

Die algebraische Vielfachheit eines Eigenwerts kann von der fruher eingefuhrtengeometrischen Vielfachheit verschieden sein. In unserem Beispiel einer Scherung hattenwir den Eigenwert λ = 1 mit der algebraischen Vielfachheit 2 aber die geometrischeVielfachheit dieses Eigenwerts ist 1 da der Eigenraum aus der eindimensionalen x-Achsebestand. Es gibt aber einen Zusammenhang zwischen den beiden Vielfachheiten, denwir uns nun uberlegen wollen. Seien also K ∈ {R,C}, eine naturliche Zahl n ∈ N mitn ≥ 1 und eine n × n-Matrix A ∈ Kn×n gegeben. Dann haben wir schon fruher dieMatrix A mit der linearen Abbildung

TA : Kn → Kn;x 7→ Ax

identifiziert. Sind explizit A = (aij)1≤i,j≤n und bezeichnet e1, . . . , en wie im letztenSemester die Standardbasis des Kn, so haben wir

TAei =n∑

j=1

ajiej,

die Spalten von A sind gerade die Bilder TAei der Standardbasis. Anstelle der Stan-dardbasis konnen wir auch eine andere Basis u1, . . . , un des Kn betrachten. Ein Vektorv ∈ Kn hat dann bezuglich dieser anderen Basis Koordinaten x1, . . . , xn, die durch dieGleichung

v =n∑

i=1

xiui

gegeben sind. Aus I.§11.4 des letzten Semesters wissen wir auch wie diese neuen Koor-dinaten x1, . . . , xn mit den Koordinaten v1, . . . , vn bezuglich der Standardbasis zusam-menhangen. Wir mussen die Matrix S bilden, deren Spalten gerade die Basisvektorenu1, . . . , un sind, diese Matrix hatten wir als die Transformationsmatrix von der Basisu1, . . . , un zur Standardbasis e1, . . . , en bezeichnet, und der Zusammenhang zwischenden Koordinaten bezuglich der beiden Basen ist dann durch v1

...vn

= S ·

x1...xn

172

Page 173: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 3.6.2011

gegeben, durch Multiplikation mit der Transformationsmatrix S werden also die Koor-dinaten eines Vektors bezuglich der Basis u1, . . . , un in diejenigen bezuglich der Stan-dardbasis uberfuhrt. Nach I.§11.Satz 8 ist die Matrix S invertierbar und die InverseS−1 ist die Transformationsmatrix von der Standardbasis e1, . . . , en zur neuen Basisu1, . . . , un. Um diesen Zusammenhang formaler zu fassen, hatten wir die Koordinaten-abbildung

Ψ : Kn → Kn;x 7→n∑

i=1

xiui

eingefuhrt, und dann galt Ψ(x) = Sx fur x ∈ Kn. Kommen wir wieder zu unsererMatrix A zuruck, und schauen uns an wie die lineare Abbildung TA in den Koordinatenbezuglich der neuen Basis aussieht. Sei also v ∈ Kn und bezeichne x1, . . . , xn dieKoordinaten von v bezuglich der Basis u1, . . . , un, also v = Ψ(x) = Sx. Dann istTAv = ASx und drucken wir diesen Vektor wieder in Koordinaten bezuglich der Basisu1, . . . , un aus, so erhalten wir die Koordinaten

Ψ−1(TAv) = Ψ−1(ASx) = S−1ASx.

Bezuglich der neuen Basis ist die lineare Abbildung TA also durch die Matrix S−1ASgegeben. Die so erhaltenen Matrizen B = S−1AS nennt man konjugiert oder ahnlichzur Matrix A. Wie die obige Uberlegung zeigt, sind die Spalten von S−1AS genaudie Koordinaten der Bilder der Basisvektoren u1, . . . , un unter TA bezuglich der Basisu1, . . . , un. Beim Ubergang zu dieser ahnlichen Matrix andert sich das charakteristischePolynom nicht, nach dem Determinanten-Multiplikationssatz I.§10.Satz 5 ist

χS−1AS(x)=det(x−S−1AS) = det(S−1(x−A)S) = det(S)−1 det(x−A) det(S) = χA(x).

Damit konnen wir jetzt den Zusammenhang zwischen den algebraischen und den geo-metrischen Vielfachheiten eines Eigenwerts von A herstellen.

Lemma 5.3: Seien K ∈ {R,C}, n ∈ N mit n ≥ 1, A ∈ Kn×n und λ ∈ K ein Eigenwertvon A. Bezeichne m die algebraische und t die geometrische Vielfachheit des Eigenwertsλ von A. Dann ist t ≤ m.

Beweis: Nach I.§11.Lemma 11 existiert eine Basis u1, . . . , un des Kn mit Eλ(A) =〈u1, . . . , ut〉. Ist B die Matrix von TA bezuglich der Basis u1, . . . , un, so hat B wegenAui = λui fur i = 1, . . . , t die Form

B =

(λEt ∗

B′

)mit einer (n− t)× (n− t)-Matrix B′ und mit Aufgabe (43) aus dem vorigen Semesterfolgt

χA(x) = χB(x) = (x− λ)tχB′(x)

und insbesondere hat die Nullstelle λ von χA mindestens die Vielfachheit t, d.h. m ≥ t.

173

Page 174: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 3.6.2011

Wir hatten bereits eingesehen, dass eine n × n-Matrix hochstens n viele Eigenwertehaben kann. Wir wollen zum Abschluß dieses Abschnitts noch eine konzeptionellereBegrundung dieser Tatsache angeben.

Lemma 5.4 (Lineare Unabhangigkeit von Eigenvektoren)Seien K ∈ {R,C}, V ein Vektorraum uber K und T ein Endomorphismus von V .Weiter seien λ1, . . . , λr paarweise verschiedene Eigenwerte von T und fur 1 ≤ i ≤ rsei 0 6= vi ∈ Eλi

(T ) ein von Null verschiedener Eigenvektor zum Eigenwert λi. Dannsind die Vektoren v1, . . . , vr linear unabhangig.

Beweis: Angenommen die Vektoren v1, . . . , vr waren linear abhangig. Dann gibt esSkalare µ1, . . . , µr ∈ K mit s := |{1 ≤ i ≤ r|µi 6= 0}| ≥ 1, d.h. nicht alle der µ1, . . . , µr

sind gleich Null, so das∑r

i=1 µivi = 0 ist. Wir wahlen diese so, dass s minimal ist.Wahle weiter ein 1 ≤ i ≤ r mit µi 6= 0. Es ist

0 = T

(r∑

j=1

µjvj

)=

r∑j=1

µjTvj =r∑

j=1

λjµjvj

und auchr∑

j=1

λiµjvj = λi

r∑j=1

µjvj = 0.

Ziehen wir diese beiden Gleichungen voneinander ab, so ergibt sich∑1≤j≤r

j 6=i

(λj − λi)µjvj = 0,

und die minimale Wahl von s liefert, dass (λj − λi)µj = 0 fur alle 1 ≤ j ≤ r mit j 6= iist. Fur 1 ≤ j ≤ r mit j 6= i ist aber auch λj 6= λi, also ist sogar µj = 0. Dies ergibt

µivi =r∑

j=1

µjvj = 0

im Widerspruch zu µi 6= 0 und vi 6= 0.

5.3 Diagonalisierbare und halbeinfache Matrizen

Definition 5.4: Seien K ∈ {R,C}, V ein endlich erzeugter Vektorraum uber K und Tein Endomorphismus von V . Dann heißt T diagonalisierbar, wenn es eine aus Eigen-vektoren von T bestehende Basis von V gibt.

Eine n× n-Matrix A uber K heißt dann diagonalisierbar wenn die lineare AbbildungTA diagonalisierbar ist. Wir wollen uns jetzt uberlegen was Diagonalisierbarkeit fur

174

Page 175: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 3.6.2011

die Matrix A bedeutet. Nehme also an es gibt eine aus Eigenvektoren u1, . . . , un vonA bestehende Basis des Kn. Bezeichne S die Transformationsmatrix von der Basisu1, . . . , un zur Standardbasis, also die Matrix deren Spalten die Vektoren u1, . . . , un

sind. Wir hatten gesehen, dass die Matrix von TA bezuglich der Basis u1, . . . , un genaudie zu A ahnliche Matrix S−1AS ist. Bezeichnen wir fur 1 ≤ i ≤ n den zu ui gehorendenEigenwert von A mit λi, also Aui = λiui, so ist damit

S−1AS =

λ1

. . .

λn

.

Gibt es umgekehrt eine invertierbare n×n-Matrix S fur die S−1AS eine Diagonalmatrixetwa mit den Eintragen λ1, . . . , λn ist, so bilden die Spalten u1, . . . , un eine Basis desKn und fur 1 ≤ i ≤ n gilt Aui = λiui, d.h. u1, . . . , un sind Eigenvektoren von A undsomit ist A diagonalisierbar. Damit ist eine n×n-Matrix A genau dann diagonalisierbarwenn sie zu einer Diagonalmatrix ahnlich ist.

Nehmen wir als ein Beispiel wieder einmal die schon gerechnete 3× 3 Matrix

A =

−9 4 −8−11 6 −8

8 −4 7

.

Hier hatten wir drei verschiedene Eigenwerte

λ1 = −1, λ2 = 2, λ3 = 3

und zu diesen hatten wir auch bereits die Eigenvektoren

u1 =

−2−2

1

, u2 =

−4−3

4

, u3 =

−1−1

1

.

berechnet. Nach Lemma 4 sind u1, u2, u3 linear unabhangig, also eine Basis des R3.Damit ist A diagonalisierbar. Die Transformationsmatrix S von der Basis u1, u2, u3 zurStandardbasis des R3 entsteht durch Nebeneinanderschreiben dieser drei Spalten ineiner Matrix, also

S =

−2 −4 −1−2 −3 −1

1 4 1

mit der Inversen S−1 =

−1 0 −1−1 1 0

5 −4 2

.

Mit diesen Matrizen gilt nun tatsachlich

S−1AS =

−1 0 −1−1 1 0

5 −4 2

·

−9 4 −8−11 6 −8

8 −4 7

·

−2 −4 −1−2 −3 −1

1 4 1

=

1 0 1−2 2 015 −12 6

·

−2 −4 −1−2 −3 −1

1 4 1

=

−1 0 00 2 00 0 3

.

175

Page 176: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 3.6.2011

Wir formulieren und beweisen nun den Hauptsatz uber diagonalisierbare Matrizen.

Satz 5.5 (Kennzeichnung diagonalisierbarer Matrizen)Sei K ∈ {R,C} und sei A eine n × n Matrix uber K. Weiter seien λ1, . . . , λr dieverschiedenen Eigenwerte von A, und fur 1 ≤ i ≤ r seien ni die algebraische Vielfach-heit von λi und di die geometrische Vielfachheit von λi. Dann ist die Matrix A genaudann diagonalisierbar wenn das charakteristische Polynom χA uber K in Linearfakto-ren zerfallt, wenn also χA(x) = (x − λ1)

n1 · . . . · (x − λr)nr gilt, und wenn ni = di fur

jedes 1 ≤ i ≤ r ist.

Beweis: ”=⇒” Sei u1, . . . , un eine aus Eigenvektoren von A bestehende Basis des Kn

und fur 1 ≤ i ≤ n sei µi ∈ K der Eigenwert von A mit Aui = µiui. Dann ist A ahnlichzur Diagonalmatrix mit den Eintragen µ1, . . . , µn, also ist χA(x) = (x− µ1) · . . . · (x−µn). Damit sind µ1, . . . , µn die mit Vielfachheit aufgezahlten Eigenwerte von A, also{λ1, . . . , λr} = {µ1, . . . , µn} und fur jedes 1 ≤ i ≤ r ist ni = |{1 ≤ j ≤ n|µj = λi}|.Insbesondere ist χA(x) = (x− λ1)

n1 . . . (x− λr)nr . Fur 1 ≤ i ≤ r ist schließlich

Eλi(A) = 〈uj|1 ≤ j ≤ n, µj = λi〉

und somit auch di = dimEλi(A) = ni.

”⇐=” Fur jedes 1 ≤ i ≤ r wahle eine Basis ui1, . . . , ui,dides Eigenraums Eλi

(A). Dannsind auch die Vektoren uij (1 ≤ i ≤ r, 1 ≤ j ≤ di) linear unabhangig. Seien namlichSkalare αij ∈ K fur 1 ≤ i ≤ r, 1 ≤ j ≤ di mit

r∑i=1

di∑j=1

αijuij = 0

gegeben. Fur jedes 1 ≤ i ≤ r ist dann vi :=∑di

j=1 αijuij ∈ Eλi(A) und es gilt

∑ri=1 vi =

0. Nach Lemma 4 ist∑di

j=1 αijuij = vi = 0 fur jedes 1 ≤ i ≤ r, also auch αij = 0 furalle 1 ≤ i ≤ r, 1 ≤ j ≤ di. Wegen d1 + · · ·+ dr = n1 + · · ·+ nr = n sind die Vektorenuij (1 ≤ i ≤ r, 1 ≤ j ≤ di) eine aus Eigenvektoren von A bestehende Basis des Kn,d.h. A ist diagonalisierbar.

Wie schon bemerkt hat eine n × n-Matrix im Normalfall n verschiedene komplexeEigenwerte, und wir wollen uns nun uberlegen das eine solche Matrix weiter auchimmer diagonalisierbar ist. Damit sind die uber C diagonalisierbaren Matrizen derRegelfall.

Korollar 5.6: Seien K ∈ {R,C}, n ∈ N mit n ≥ 1 und A eine n × n-Matrix uber Kdie n verschiedene Eigenwerte besitzt. Dann ist A diagonalisierbar.

Beweis: Sind λ1, . . . , λn die Eigenwerte von A, m1, . . . ,mn ihre algebraischen Vielfach-heiten und d1, . . . , dn ihre geometrischen Vielfachheiten, so gilt 1 ≤ di ≤ mi fur jedes1 ≤ i ≤ n. Wegen grad(χA) = n sind auch χA(x) = (x − λ1) · . . . · (x − λn) und

176

Page 177: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 3.6.2011

m1 + · · · + mn = n, also ist mi = di = 1 fur alle 1 ≤ i ≤ n. Nach Satz 5 ist Adiagonalisierbar.

Bei einer n × n-Matrix A mit n verschiedenen Eigenwerten ist die Berechnung derdiagonalisierenden Basis, beziehungsweise gleichwertig der zu dieser Basis gehorendenTransformationsmatrix, besonders einfach. Man bestimmt zu jedem der n Eigenwerteeinen von Null verschiedenen Eigenvektor, dann sind diese n Vektoren nach Lemma 4automatisch linear unabhangig und somit eine Basis des Kn. Schreibt man die n Vekto-ren dann als Spalten in eine Matrix S, so haben wir die gesuchte Transformationsmatrixgefunden.

Wir wollen ein kleines Beispiel zur Anwendung der Diagonalisierung von Matri-zen rechnen. Die sogenannten Fibonacci Zahlen sind die wie folgt rekursiv definiertenZahlen

f0 := 0, f1 := 1 und fn := fn−1 + fn−2 fur n ≥ 2,

alsof2 = 1, f3 = 2, f4 = 3, f5 = 5, f6 = 8, f7 = 13

und so weiter. Wir wollen eine geschlossene Formel fur die n-te Fibonacci-Zahl herleiten.Hierzu betrachten wir fur jedes n ∈ N den Vektor

un :=

(fn+1

fn

)und die Fibonacci-Matrix F :=

(1 11 0

).

Fur jedes n ∈ N ist dann

Fun =

(1 11 0

)·(fn+1

fn

)=

(fn + fn+1

fn+1

)=

(fn+2

fn+1

)= un+1,

und insbesondere gilt F nu0 = un fur jedes n ∈ N. Um die Fibonacci Zahlen fn zuberechnen mussen wir die Vektoren un = F nu0 bestimmen und hierfur benotigen wirdie Potenzen von F . Um wiederum diese Potenzen von F zu berechnen, wollen wir Fdiagonalisieren. Das charakteristische Polynom ist

χF (x) =

∣∣∣∣ x− 1 −1−1 x

∣∣∣∣ = x2 − x− 1

mit den Nullstellen x = (1±√

5)/2. Wir haben also zwei verschiedene Eigenwerte

λ =1−

√5

2und µ =

1 +√

5

2.

Es sind λµ = −1 und

λ− 1 =1−

√5

2− 1 = −1 +

√5

2= −µ.

177

Page 178: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 3.6.2011

Zur Bestimmung des Eigenraums zum Eigenwert λ rechnen wir

−µ −1−1 λ

−→ 1 −λµ 1

−→ 1 −λ0 1 + λµ

und wir erhalten den Eigenvektor

v =

(λ1

).

Fur µ ist dagegen µ− 1 = −λ und somit

−λ −1−1 µ

−→ 1 −µλ 1

−→ 1 −µ0 1 + λµ

und diesmal erhalten wir den Eigenvektor

w =

(µ1

).

Die Transformationsmatrix von der Basis v, w zur Standardbasis e1, e2 ist

S =

(λ µ1 1

)mit S−1 =

1

λ− µ

(1 −µ

−1 λ

)=

1√5

(−1 µ

1 −λ

).

Dann ergibt sich

S−1FS =

µ

)=⇒ S−1F nS =

(λn

µn

),

und somit ist

F n =1√5

(λ µ1 1

)(λn

µn

)(−1 µ

1 −λ

)=

1√5

(λn+1 µn+1

λn µn

)(−1 µ

1 −λ

)=

1√5

(µn+1 − λn+1 λµ(λn − µn)µn − λn λµ(λn−1 − µn−1)

)=

1√5

(µn+1 − λn+1 µn − λn

µn − λn µn−1 − λn−1

).

Damit erhalten wir schließlich(fn+1

fn

)= un = F nu0 =

1√5

(µn+1 − λn+1 µn − λn

µn − λn µn−1 − λn−1

)·(

10

)und es folgt

fn =1√5

[(1 +

√5

2

)n

(1−

√5

2

)n].

178

Page 179: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 3.6.2011

Der Teil dieser Uberlegung der mit diagonalisierbaren Matrizen zu tun hat ist damitbeendet. Man kann die obige Formel auch noch in eine ganzzahlige Form umschreiben.Fur σ ∈ {−1, 1} ist namlich

(1 + σ√

5)n =∑2k≤n

(n

2k

)5k + σ

√5∑

2k+1≤n

(n

2k + 1

)5k

also

(1 +√

5)n − (1−√

5)n = 2√

5

[n−12 ]∑

k=0

(n

2k + 1

)5k

und somit ist

fn =1

2n−1

[n−12 ]∑

k=0

(n

2k + 1

)5k.

Fur reelle Matrizen gibt es jetzt noch eine kleine Erweiterung diagonalisierbarer Ma-trizen. Eine reelle Matrix ist insbesondere auch eine komplexe Matrix und ist sie alskomplexe Matrix diagonalisierbar, so nennen wir sie halbeinfach.

Definition 5.5 (Halbeinfache Matrizen)Eine reelle n×n-Matrix heißt halbeinfach wenn sie uber den komplexen Zahlen diago-nalisierbar ist.

Fur komplexe Matrizen verwenden wir”halbeinfach“ als ein Synonym fur

”diago-

nalisierbar“, diese Konvention erspart gelegentlich einige Fallunterscheidungen. Zurnaheren Untersuchung des Zusammenhangs zwischen reellen und komplexen Matrizenbrauchen wir eine kleine Vorbemerkung. Sind n,m ∈ N mit n,m ≥ 1 und

A =

a11 · · · a1n...

. . ....

am1 · · · amn

∈ Cm×n, so setzen wir A :=

a11 · · · a1n...

. . ....

am1 · · · amn

.

Fur A,B ∈ Cm×n, λ ∈ C sind dann A+B = A + B und λA = λA und sind auchr ∈ N mit r ≥ 1, A ∈ Cm×n, B ∈ Cn×r, so ist auch AB = AB. Fur eine reelle MatrixA ∈ Rm×n ist A = A.

Seien nun n ∈ N mit n ≥ 1 und A ∈ Rn×n. Weiter sei λ ∈ C\R ein komplexer, abernicht reeller, Eigenwert von A. Sei v ∈ Eλ(A) ein zugehoriger Eigenvektor. Dann folgtaus Av = λv auch

Av = Av = Av = λv = λv,

d.h. auch die komplex Konjugierte λ von λ ist ein komplexer Eigenwert von A und v

ein zugehoriger Eigenvektor. Wegen λ = λ folgt weiter

Eλ(A) = {v|v ∈ Eλ(A)}.

179

Page 180: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 3.6.2011

Insbesondere haben die beiden konjugierten Eigenwerte λ und λ uber C dieselbe geome-trische Vielfachheit, und da das charakteristische Polynom χA reell ist, haben sie auchdieselbe algebraische Vielfachheit. Wahle nun 0 6= w ∈ Eλ(A). Dann ist w ∈ Eλ(A)und wegen λ 6= λ sind w,w nach Lemma 4 linear unabhangig. Damit sind auch diebeiden Vektoren

u :=1

2(w + w) und v :=

1

2i(w − w)

linear unabhangig, und wegen

u =1

2(w + w) = u und v = − 1

2i(w − w) = v

sind u, v ∈ Rn reelle Vektoren. Schreiben wir λ = reit = r cos t + ir sin t in Polarkoor-dinaten, so sind

Au =1

2(Aw+Aw) =

1

2(λw+λw) =

r cos t

2(w+w)−r sin t

2i(w−w) = (r cos t)u−(r sin t)v

und

Av =1

2i(Aw − Aw) =

1

2i(λw − λw) =

r cos t

2i(w − w) +

r sin t

2(w + w)

= (r sin t)u+ (r cos t)v,

bezuglich der Basis v, u hat TA eingeschrankt auf 〈u, v〉 = 〈w,w〉 also die Form

TA|〈w,w〉 =

(r cos t −r sin tr sin t r cos t

).

Dies ist eine Drehmatrix zum Drehwinkel t gestreckt um den Faktor r, und solcheMatrizen beziehungsweise die zugehorigen linearen Abbildungen bezeichnet man alsDrehstreckungen. Fassen wir jetzt die nicht reellen Eigenwerte von A in komplex kon-jugierten Paaren zusammen, so ergibt sich das eine halbeinfache reelle Matrix bezuglicheiner geeigneten Transformationsmatrix S die Form

S−1AS =

D1

. . .

Dr

λ1

. . .

λs

hat, wobei λ1, . . . , λs die mit Vielfachheiten aufgezahlten reellen Eigenwerte von Asind, und die Matrizen D1, . . . , Dr Drehstreckungsmatrizen sind. Dabei ist r die halbeAnzahl der mit Vielfachheit aufgezahlten nicht reellen Eigenwerte von A und ist µi deri-te dieser Eigenwerte, so ist Di die Drehstreckung deren Drehanteil das Argument derkomplexen Zahl µi ist und deren Streckungsanteil der Betrag |µi| ist.

180

Page 181: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 8.6.2011

5.4 Die Jordansche Normalform

Vorlesung 16, Mittwoch 8.6.2011

Wir hatten bereits erwahnt, dass eine n × n Matrix im Normalfall n verschiedenekomplexe Eigenwerte hat und uber den komplexen Zahlen diagonalisierbar ist. Leiderkommen einen durchaus auch Matrizen unter, die nicht zu diesem Normalfall gehorenund auch nicht diagonalisierbar sind. Fur solche Matrizen kann man trotzdem nocheine Basis finden, bezuglich derer die transformierte Matrix fast in Diagonalform ist,es tritt nur eine zusatzliche Nebendiagonale mit Nullen und Einsen auf.

Definition 5.6: Das n× n Jordankastchen zum Eigenwert λ ∈ C ist die n× n Matrix

J :=

λ 1

λ 1. . . . . .

λ 1λ

,

wobei die leeren Eintrage wie immer fur Nullen stehen. Eine Matrix A ist in JordanNormalform, wenn sie die Gestalt

A =

J1

. . .

Jr

mit Jordankastchen J1, . . . , Jr hat.

Beispiele fur Matrizen in Jordan Normalform sind2 1 0 0 00 2 1 0 00 0 2 0 00 0 0 5 10 0 0 0 5

und

2 1 0 0 0 00 2 0 0 0 00 0 2 1 0 00 0 0 2 0 00 0 0 0 2 00 0 0 0 0 3

.

Im ersten Beispiel haben wir zwei Jordankastchen2 1

2 12

5 15

181

Page 182: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 8.6.2011

ein 3 × 3 Kastchen zum Eigenwert 2 und ein 2 × 2 Kastchen zum Eigenwert 2. Imzweiten Beispiel haben wir sogar vier einzelne Jordan Kastchen

A =

2 12

2 12

2

3

zwei 2× 2 Kastchen zum Eigenwert 2, dann ein 1× 1 Kastchen wieder zum Eigenwert2 und schließlich ein 1 × 1 Kastchen zum Eigenwert 3. Beachte das in der Diagonalejedes einzelnen Kastchens immer derselbe Eigenwert stehen muss, zum Beispiel ist dieMatrix

2 1

22 1

3

��

��

��

��@

@@

@@

@@

@@

nicht in Jordan Normalform. Uber den komplexen Zahlen laßt sich jede Matrix aufJordansche Normalform transformieren, im reellen Fall mussen wir verlangen das samt-liche Eigenwerte reell sind.

Satz 5.7 (Existenz der Jordanschen Normalform)Seien K ∈ {R,C}, n ∈ N mit n ≥ 1 und A eine n× n-Matrix deren charakteristischesPolynom uber K in Linearfaktoren zerfallt. Dann gibt es eine invertierbare n×n MatrixS uber K so, dass die transformierte Matrix S−1AS in Jordan Normalform ist.

Den recht komplizierten Beweis dieses Satzes wollen wir hier nicht vorfuhren. Woranwir interessiert sind ist die praktische Durchfuhrung der Transformation auf JordanNormalform. Wir denken uns also wir hatten eine n × n Matrix A vorgegeben, undwir suchen eine Basis u1, . . . , un des Cn bezuglich derer die Matrix A in JordanscherNormalform ist. Gleichwertig hierzu ist es eine invertierbare n× n Matrix S zu suchenso, dass die transformierte Matrix S−1AS in Jordanscher Normalform ist. Dies ist genaudasselbe rechnerische Problem, die Spalten einer solchen Matrix S bilden die gesuchteBasis des Cn und umgekehrt. Den reellen Fall muss man nicht gesondert behandeln, istA eine reelle Matrix die keine nicht reellen Eigenwerte in C hat, so wird unser Verfahrenauch eine reelle Basis des Rn beziehungsweise eine reelle Transformationsmatrix Sliefern.

Wir werden eine Folge immer komplizierter werdender Beispiele durchrechnen, unddas Rechenverfahren so nach und nach kennenlernen, ehe wir es dann einmal formal

182

Page 183: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 8.6.2011

beschreiben. Wir beginnen mit dem Beispiel der folgenden 2× 2 Matrix

A :=

(5 8

−2 −3

).

Die Jordan Normalform von A besteht entweder aus einem 2 × 2 Kastchen oder auszwei 1 × 1 Kastchen, und in beiden Fallen sind die auftretenden komplexen Zahlenauf den Diagonalen der Jordankastchen gerade die Eigenwerte von A. Um diese zuberechnen, bestimmen wir erst einmal das charakteristische Polynom von A

χA(x) =

∣∣∣∣ x− 5 −82 x+ 3

∣∣∣∣ = (x− 5)(x+ 3) + 16 = x2 − 2x+ 1 = (x− 1)2.

Wir haben also nur einen einzigen Eigenwert λ = 1. Da A keine Streckung ist, muss diegesuchte Jordan Normalform damit ein 2 × 2 Jordankastchen zum Eigenwert 1 sein.Nennen wir die gesuchte Basis des C2 jetzt u1, u2, so muss die Matrix der linearenAbbildung A bezuglich der Basis u1, u2 gerade das Kastchen

B :=

(1 10 1

)sein d.h. die Bedingungen an u1 und u2 sind Au1 = u1 und Au2 = u1+u2. Insbesonderesoll u1 einfach ein Eigenvektor von A zum Eigenwert λ = 1 sein, und diese konnen wirdurch Losen des homogenen linearen Gleichungssystems (A− 1)x = 0 berechnen. Wiewir gleich sehen werden, ist es nutzlich das Gaußsche Eliminationsverfahren gleich miteiner unbestimmten, allgemeinen rechten Seite durchzufuhren. Wegen

N := A− 1 =

(4 8

−2 −4

),

haben wir die Rechnung

4 8 y1

−2 −4 y2−→ 4 8 y1

0 0 12y1 + y2,

und die Losung der Eigenvektorgleichung N

(xy

)= 0 berechnet sich durch

4x+ 8y = 0 =⇒ x = −2y.

Als Eigenvektor verwenden wir die Losung mit y = 2, also

u1 :=

(−4

2

).

Wie kommen wir jetzt an den zweiten Basisvektor u2? Wir haben die Bedingung Au2 =u1 + u2, und diese schreiben wir zu Nu2 = (A − 1)u2 = Au2 − u2 = u1 um, d.h. der

183

Page 184: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 8.6.2011

zweite Basisvektor u2 ergibt sich als Losung des linearen Gleichungssystems Nu2 = u1.Die linke Seite dieses Gleichungssystems ist wieder die Matrix N = A − 1, die auchschon bei der Berechnung von u1 aufgetreten ist. Da wir dieses Gleichungssystem schonmit allgemeiner rechter Seite (y1, y2) umgeformt haben, mussen wir nur noch y1 = −4und y2 = 2 einsetzen, und erhalten

N

(xy

)!=

(−4

2

)=

(y1

y2

)=⇒ 4x+8y = y1 = −4 =⇒ x =

1

4(−4−8y) = −1−2y,

und setzen wir etwa y = 1 ein, so ergibt sich eine Losung

u2 :=

(−3

1

).

Zum Abschluß wollen wir nun noch verifizieren, dass unsere Rechnung tatsachlich einkorrektes Ergebnis geliefert hat. Wir haben

Au1 =

(5 8

−2 −3

)·(−4

2

)=

(−4

2

)= u1,

Au2 =

(5 8

−2 −3

)·(−3

1

)=

(−7

3

)=

(−4

2

)+

(−3

1

)= u1 + u2,

d.h. bezuglich der Basis u1, u2 ist A tatsachlich das Jordankastchen B. Die Transfor-mationsmatrix S von der Basis u1, u2 zur kanonischen Basis e1, e2 ist jetzt die Matrix

S =

(−4 −3

2 1

)mit der Inversen S−1 =

1

2

(1 3

−2 −4

).

Es muss jetzt S−1AS = B gelten, und tatsachlich ist

S−1AS =1

2

(1 3

−2 −4

)·(

5 8−2 −3

)·(−4 −3

2 1

)=

1

2

(−1 −1−2 −4

)·(−4 −3

2 1

)=

1

2

(2 20 2

)= B.

Nachdem wir im Beispiel einer 2× 2 Matrix die Jordansche Normalform noch aus demStand heraus berechnet haben, ist es fur die Behandlung großerer Matrizen hilfreich,sich vorher einen ersten Rechenplan zu uberlegen. Zu diesem Zweck halten wir zunachsteinige Kleinigkeiten uber Matrizen in Jordanscher Normalform fest. Ist J ein n × nJordankastchen zum Eigenwert λ ∈ C, so ist

χJ(x) =

∣∣∣∣∣∣∣∣∣∣∣

x− λ −1x− λ −1

. . . . . .

x− λ −1x− λ

∣∣∣∣∣∣∣∣∣∣∣= (x− λ)n

184

Page 185: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 8.6.2011

d.h. λ ist der einzige Eigenwert von J und λ hat die algebraische Vielfachheit n. DerEigenraum zum Eigenwert λ ist dagegen Eλ(J) = 〈e1〉 der vom ersten kanonischenBasisvektor erzeugte Teilraum, und insbesondere hat λ die geometrische Vielfachheit1. Ist A eine allgemeine Matrix in Jordan Normalform

A =

J1

. . .

Jr

mit Jordankastchen J1, . . . , Jr, so sei Ji fur 1 ≤ i ≤ r das ni × ni Jordankastchen zumEigenwert λi ∈ C, und dann ist

χA(x) = (x− λ1)n1 · . . . · (x− λr)

nr ,

und ist λ ∈ {λ1, . . . , λr} einer der Eigenwerte von A, so hat λ die algebraische Viel-fachheit

aλ =∑

1≤i≤rλi=λ

ni

und die geometrische Vielfachheit

dλ = |{1 ≤ i ≤ r : λi = λ}|.

Die ersten Rechenschritte zur Bestimmung der Jordanschen Normalform einer MatrixA sind damit:

1. Bestimme die komplexen Eigenwerte λ1, . . . , λr von A. Dies sind dann genau diein den verschiedenen Jordankastchen zu A auftretenden Eigenwerte.

2. Fur jeden Eigenwert λ von A ist die Gesamtgroße aller Jordankastchen zumEigenwert λ gleich der algebraischen Vielfachheit des Eigenwerts λ von A.

3. Ist λ ein Eigenwert von A, so ist die Anzahl der Jordankastchen zum Eigenwertλ gleich der geometrischen Vielfachheit des Eigenwerts λ von A.

Wir wollen jetzt das Beispiel der 3× 3 Matrix

A :=

1 1 −30 1 11 0 4

behandeln. Zuerst brauchen wir dann die Eigenwerte von A und ihre algebraischenVielfachheiten, wir rechnen also das charakteristische Polynom von A aus

χA(x) =

∣∣∣∣∣∣x− 1 −1 3

0 x− 1 −1−1 0 x− 4

∣∣∣∣∣∣ = (x− 1)

∣∣∣∣ x− 1 −10 x− 4

∣∣∣∣− ∣∣∣∣ −1 30 x− 4

∣∣∣∣= (x− 1)2(x− 4)− 1 + 3(x− 1) = (x2 − 2x+ 1)(x− 4) + 3x− 4

= x3 − 6x2 + 12x− 8.

185

Page 186: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 8.6.2011

Hier ist x = 2 eine Nullstelle. Die Ableitung ist 3x2− 12x+ 12 und x = 2 ist auch eineNullstelle der Ableitung. Die zweite Ableitung wird 6x − 12 erneut mit der Nullstellex = 2, d.h. der Eigenwert λ = 2 hat die algebraische Vielfachheit 3. Damit gilt χA(x) =(x−2)3 und die Jordansche Normalform von A wird nur Jordankastchen zum Eigenwert2 haben. Um ihre Anzahl zu bestimmen berechnen wir den Eigenraum E2(A) und damitinsbesondere die geometrische Vielfachheit des Eigenwerts 2. Hierzu mussen wir dashomogene lineare Gleichungssystem Nx = 0 mit der Koeffizientenmatrix

N := A− 2 =

−1 1 −30 −1 11 0 2

losen. Wie im 2×2 Beispiel losen wir das lineare Gleichungssystem gleich mit allgemei-ner rechter Seite, also Nx = y, dies wird sich als nutzlich erweisen. Wir fuhren wiederdas Gaußsche Eliminationsverfahren durch

−1 1 −3 y1

0 −1 1 y2

1 0 2 y3

−→−1 1 −3 y1

0 −1 1 y2

0 1 −1 y1 + y3

−→−1 1 −3 y1

0 −1 1 y2

0 0 0 y1 + y2 + y3.

Fur unsere Eigenvektoren haben wir damit die Gleichung

y = z, x = y − 3z = −2z,

d.h. die geometrische Vielfachheit von λ = 2 ist d2 = 1, und der Eigenraum E2(A) wirderzeugt vom Eigenvektor

u1 :=

−211

.

Insbesondere besteht die Jordansche Normalform zu A nur aus einem einzelnen 3× 3Kastchen mit Eigenwert 2. Als den ersten Vektor der zugehorigen Basis konnen wirunseren Eigenvektor u1 verwenden, aber wie finden wir die anderen beiden Basisvek-toren? Dass die transformierte Matrix zu A bezuglich der gesuchten Basis u1, u2, u3

ein 3 × 3 Jordankastchen mit Eigenwert 2 ist, bedeutet das die Matrix der linearenAbbildung f(x) = A · x bezuglich der Basis u1, u2, u3 gleich

B =

2 1 00 2 10 0 2

ist. Die Spalten der Matrix B sind die Koeffizienten der Bilder f(ui) = Aui (i = 1, 2, 3)geschrieben als Linearkombinationen in u1, u2, u3, d.h. wir haben die folgenden dreiBedingungen an die gesuchte Basis u1, u2, u3:

Au1 = 2u1, Au2 = 2u2 + u1 und Au3 = 2u3 + u2.

186

Page 187: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 8.6.2011

Die Bedingung Au1 = 2u1 besagt einfach das u1 ein Eigenvektor zum Eigenwert λ = 2sein soll. Die Bedingung fur u2 schreiben wir noch etwas um

Au2 = 2u2 + u1 ⇐⇒ Au2 − 2u2 = u1 ⇐⇒ (A− 2)u2 = u1 ⇐⇒ Nu2 = u1,

und dies ist einfach ein lineares Gleichungssystem fur u2 dessen rechte Seite der schonberechnete Eigenvektor u1 ist. Die Koeffizientenmatrix ist die Matrix N , also genaudieselbe die schon bei der Berechnung des Eigenraums E2(A) auftrat. Aus diesemGrund haben wir die Gauß Elimination oben mit einer unbestimmten rechten Seitedurchgefuhrt, wir konnen jetzt einfach die Komponenten von u1 fur die Unbekannteny1, y2, y3 einsetzen. Fur unser lineares Gleichungssystem

Nu2 = N

xyz

!= u1 =

−211

,

mussen wir oben y1 = −2, y2 = 1 und y3 = 1 einsetzen. Die Gleichungen werden zu

−1 1 −3 −20 −1 1 1

mit den Losungen

y = −1 + z und x = −(−2− y + 3z) = 2 + y − 3z = 1− 2z,

und wir verwenden die Losung mit z = 0, also

u2 =

1−1

0

.

Fur den dritten Basisvektor u3 konnen wir die Bedingung Au3 = 2u3 +u2 vollig analogzu Nu3 = u2 umschreiben, und da wir u2 schon berechnet haben konnen wir in derobigen Stufenform y1 = 1, y2 = −1 und y3 = 0 einsetzen, und erhalten

y = 1 + z, x = −(1− y + 3z) = 1− y − 3z = −4z.

Wahlen wir wieder die Losung mit z = 0, so haben wir

u3 =

010

.

Damit sind wir eigentlich fertig, aber vorsichtshalber wollen wir das Ergebnis nocheinmal uberprufen, also nachrechnen das bezuglich der Basis u1, u2, u3 tatsachlich ein

187

Page 188: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 8.6.2011

Jordankastchen vorliegt.

Au1 =

1 1 −30 1 11 0 4

−211

=

−422

= 2u1,

Au2 =

1 1 −30 1 11 0 4

1−1

0

=

0−1

1

= 2

1−1

0

+

−422

= 2u2 + u1,

Au3 =

1 1 −30 1 11 0 4

010

=

110

= 2

010

+

1−1

0

= 2u3 + u2.

Die Rechnung hat also wirklich funktioniert, bezuglich der Basis u1, u2, u3 ist A inJordan Normalform. Testen wir auch noch einmal die Transformationsmatrix, d.h. dieMatrix deren Spalten unsere drei Basisvektoren sind

S =

−2 1 01 −1 11 0 0

mit der Inversen S−1 =

0 0 11 0 21 1 1

.

Die transformierte Matrix ist dann wie erwartet

S−1AS =

0 0 11 0 21 1 1

1 1 −30 1 11 0 4

−2 1 01 −1 11 0 0

=

1 0 43 1 52 2 2

−2 1 01 −1 11 0 0

=

2 1 00 2 10 0 2

.

Die gesuchte Basis ist bei weitem nicht eindeutig, es gibt normalerweise sehr viele Basenbezuglich derer die Matrix A auf Jordan Normalform transformiert wird. Dementspre-chend tauchen in der Rechnung sehr viele lineare Gleichungssysteme mit nicht eindeu-tigen Losungen auf, und in diesen Situationen konnen wir uns immer vollig willkurlichirgendeine Losung herausgreifen. Im eben gerechneten Beispiel ist die Rechnung im we-sentlichen wie in unseren vorigen 2× 2 Beispiel abgelaufen. Im allgemeinen Fall tretenaber noch einige zusatzliche Probleme auf, die in diesen beiden Beispielen noch nichtvorgekommen sind. Ein einfaches Beispiel hierfur ist die 3× 3 Matrix

A =

2 2 −20 1 10 −1 3

.

Zunachst lauft alles wie im vorigen Beispiel ab

χA(x) =

∣∣∣∣∣∣2 2 −20 1 10 −1 3

∣∣∣∣∣∣ = (x− 2)

∣∣∣∣ x− 1 −11 x− 3

∣∣∣∣ = (x− 2)((x− 1)(x− 3) + 1)

= (x− 2)(x2 − 4x+ 4) = (x− 2)3,

188

Page 189: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 8.6.2011

und

N = A− 2 =

0 2 −20 −1 10 −1 1

und das Eliminationsverfahren wird zu

0 2 −2 y1

0 −1 1 y2

0 −1 1 y3

−→0 2 −2 y1

0 0 0 y2 + 12y1

0 0 0 y3 + 12y1

Der Eigenraum zum Eigenwert 2 ist diesmal also zweidimensional und ist gegebendurch die Gleichung y = z. Die geometrische Vielfachheit ist hier also d2 = 2 und alseine Basis des Eigenraums erhalten wir die beiden Vektoren

v11 :=

100

, v12 :=

011

.

Diesmal gibt es also zwei Jordankastchen, und da die Gesamtgroße 3 ist, muss es sichum ein 2× 2 und ein 1× 1 Kastchen handeln. Wir suchen also eine Basis u1, u2, u3 so,dass die Matrix A sich zu

B =

2 1 00 2 00 0 2

transformiert, d.h.

Au1 = 2u1,Au2 = 2u2 + u1 ⇐⇒ Nu2 = u1 undAu3 = 2u3.

Die Vektoren u1 und u3 sollen also im Eigenraum E2(A) liegen, d.h. wir haben u1, u3 ∈〈v11, v12〉, aber wir konnen keine beliebigen Eigenvektoren fur u1, u3 verwenden. Wirmussen dafur sorgen, dass die Gleichung Nu2 = u1 losbar bleibt. Machen wir fur u1

den Ansatz

u1 = t1v11 + t2v12 =

t1t2t2

,

mit t1, t2 ∈ C, so ist die rechte Seite der Gleichung Nu2 = u1 gegeben durch y1 = t1,y2 = y3 = t2, und setzen wir dies in die oben hergeleitete allgemeine Stufenform ein,so erhalten wir eine Bedingung

t2 +1

2t1 = 0.

Dies losen wir mit t1 = 2 und t2 = −1, d.h. es wird

u1 = 2v11 − v12 =

2−1−1

,

189

Page 190: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 8.6.2011

und fur u3 haben wir weitgehend freie Wahl, wir mussen nur irgendeinen von u1 linearunabhangigen Eigenvektor nehmen, etwa

u3 := v11 =

100

.

Den letzten Basisvektor u2 erhalten wir als Losung von

N

xyz

!= u1 =

2−1−1

.

In unserer obigen Stufenform haben wir also y1 = 2, y2 = y3 = −1 und die Gleichungwird zu

2y − 2z = 2 ⇐⇒ y = 1 + z.

Wir wahlen die Losung mit x = z = 0, also

u2 :=

010

.

Damit haben wir die gesuchte Basis u1, u2, u3 gefunden. Machen wir noch ein letztesMal den Test

Au1 =

2 2 −20 1 10 −1 3

2−1−1

=

4−2−2

= 2u1,

Au2 =

2 2 −20 1 10 −1 3

010

=

21

−1

= 2

010

+

2−1−1

= 2u2 + u1,

Au3 =

2 2 −20 1 10 −1 3

100

=

200

= 2u3.

Die Matrix bezuglich der Basis u1, u2, u3 ist also wirklich

B =

2 1 00 2 00 0 2

.

Die nachstkompliziertere Situation tritt bei 3× 3 Matrizen schon nicht mehr auf, undwir betrachten als ein Beispiel die folgende 4× 4 Matrix

A :=

4 −8 −11 181 −7 −13 19

−2 10 16 −22−1 3 4 −5

.

190

Page 191: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 8.6.2011

Zum charakteristischen Polynom haben wir inzwischen genug Beispiele gerechnet, unddaher wollen wir hier einfach das Ergebnis χA(x) = (x− 2)4 notieren. Wir mussen alsowieder die Matrix

N := A− 2 =

2 −8 −11 181 −9 −13 19

−2 10 14 −22−1 3 4 −7

betrachten, und fuhren die Gauß Elimination durch

2 −8 −11 18 y1

1 −9 −13 19 y2

−2 10 14 −22 y3

−1 3 4 −7 y4

−→

2 8 −11 18 y1

0 −5 −152

10 y2 − 12y1

0 2 3 −4 y3 + y1

0 −1 −32

2 y4 + 12y1

−→

2 8 −11 18 y1

0 −5 −152

10 y2 − 12y1

0 2 3 −4 y3 + y1

0 −1 −32

2 y4 + 12y1

−→

2 −8 −11 18 y1

0 −5 −152

10 y2 − 12y1

0 0 0 0 y3 + 25y2 + 4

5y1

0 0 0 0 y4 − 15y2 + 3

5y1

−→

2 −8 −11 18 y1

0 −10 −15 20 2y2 − y1

0 0 0 0 5y3 + 2y2 + 4y1

0 0 0 0 5y4 − y2 + 3y1

Fur den Eigenraum haben wir die Gleichungen

y = − 1

10(15u−20v) = −3

2u+2v und x =

1

2(8y+11u−18v) =

1

2(−u−2v) = −1

2u−v,

d.h. der Eigenraum, hat die Basis

v11 =

−1−3

20

, v12 =

−1

201

.

Die geometrische Vielfachheit des Eigenwerts 2 ist also d2 = 2 und wir haben zweiJordankastchen. Im Gegensatz zum vorigen Beispiel wissen wir aber noch nicht wiegroß diese Jordankastchen sind, es handelt sich entweder um zwei 2× 2 Kastchen oderum ein 3× 3 und ein 1× 1 Kastchen. Wir mussen also eines der beiden Ziele

2 12

2 12

Au1 = 2u1,Au2 = 2u2 + u1,Au3 = 2u3,Au4 = 2u4 + u3

oder

2 1

2 12

2

Au1 = 2u1,Au2 = 2u2 + u1,Au3 = 2u3 + u2,Au4 = 2u4

ansteuern. Es stellt sich heraus, dass wir einfach so weiter rechnen konnen wie imvorigen Beispiel, welcher der beiden Falle hier vorliegt wird sich ganz automatisch

191

Page 192: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 8.6.2011

ergeben. Wir betrachten also einen allgemeinen Eigenvektor

u :=

y1

y2

y3

y4

:= t1v11 + t2v12 =

−t2 − t12t2 − 3t1

2t1t2

mit t1, t2 ∈ C, und fragen wann Nx = u losbar ist. In unser oben hergeleiteten Stufen-form

2 −8 −11 18 y1

0 −10 −15 20 2y2 − y1

0 0 0 0 5y3 + 2y2 + 4y1

0 0 0 0 5y4 − y2 + 3y1

mussen also die rechten Seiten der beiden unteren, nur aus Nullen bestehenden, Zeilenebenfalls gleich Null sein. Wegen

5y3 + 2y2 + 4y1 = 10t1 + 4t2 − 6t1 − 4t2 − 4t1 = 0,

5y4 − y2 + 3y1 = 5t2 − 2t2 + 3t1 − 3t2 − 3t1 = 0

ist dies unabhangig von t1 und t2 immer der Fall, die Gleichung Nx = u ist also furuberhaupt jeden Eigenvektor u losbar. Der Teilraum aller u ∈ E2(A) fur die Nx = ulosbar ist, hat damit die Dimension 2, und hieraus folgt das unsere Jordan Normalformaus zwei 2 × 2 Kastchen besteht, wie wir gleich sehen werden. Die gesuchte Basisu1, u2, u3, u4 erhalten wir, indem wir als u1, u3 irgendeine Basis des Eigenraums nehmenund u2, u4 durch Losen der linearen Gleichungssysteme Nu2 = u1 und Nu4 = u3

festlegen. Wir konnen einfach

u1 := v11 =

−1−3

20

, u3 := v12 =

−1

201

verwenden. Der Vektor u2 ergibt sich als Losung von Nu2 = u1, wir haben also

2 −8 −11 18 −10 −10 −15 20 −5

=⇒ y = − 110

(−5 + 15u− 20v) = 12− 3

2u+ 2v,

x = 12(−1 + 8y + 11u− 18v) = 3

2− 1

2u− v

und verwenden die Losung mit u = v = 1, also

u2 =

0111

.

Der Vektor u4 ergibt sich ebenso durch Losen von Nu4 = u3

2 −8 −11 18 −10 −10 −15 20 5

=⇒ y = − 110

(5 + 15u− 20v) = −12− 3

2u+ 2v,

x = 12(−1 + 8y + 11u− 18v) = −5

2− 1

2u− v

192

Page 193: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 8.6.2011

und verwenden wir wieder u = v = 1, so wird

u4 =

−4

011

.

Bezuglich der Basis u1, u2, u3, u4 ist A jetzt in der Jordan Normalform

B =

2 1 0 00 2 0 00 0 2 10 0 0 2

.

Auf den Test wollen wir diesmal verzichten. Damit haben wir alle Phanomene, dieuberhaupt auftreten konnen, bereits gesehen, und werden als nachstes den allgemeinenAlgorithmus zum Auffinden der Transformation auf Jordan Normalform beschreiben.Dabei werden keine neuen Rechenschritte auftreten, wir mussen nur alles zusammen-fassen, was wir in den Beispielen bereits gesehen haben.

Gegeben: Eine komplexe n× n Matrix A (die Eintrage von A durfen naturlich auchalle reell sein).

Gesucht: Eine Basis u1, . . . , un des Cn bezuglich derer A in Jordan Normalform ist, be-ziehungsweise aquivalent eine invertierbare, komplexe n×n Matrix S so, dass S−1AS inJordan Normalform ist. Die Spalten solch einer Matrix sind gerade die Basis u1, . . . , un

und ungekehrt. Ist A reell und hat nur reelle Eigenwerte, so wird das Verfahren eineBasis des Rn und entsprechend eine reelle Transformationsmatrix S liefern.

Verfahren: Wir fuhren die folgenden Rechenschritte durch:

(1) Berechne die verschiedenen komplexen Eigenwerte λ1, . . . , λt von A und ihre alge-braischen Vielfachheiten a1, . . . , at. Dies kann man beispielsweise durch Berech-nung des charakteristischen Polynoms mit anschließender Nullstellensuche tun.

(2) Gehe der Reihe nach die Eigenwerte λ = λi (i = 1, . . . , t) durch, und fuhre furjeden von diesen die folgenden Schritte (3.1) bis (3.13) durch. Dabei wird der i-teEigenwert λi stets ai viele Vektoren zur Basis beitragen.

(3.1) Bilde die Matrix N = A − λ, und fuhre auf ihr das Gaußsche Eliminationsver-fahren mit unbestimmter rechter Seite (y1, . . . , yn) durch.

(3.2) Verwende die nicht verschwindenden r oberen Zeilen der in Schritt (3.1) erhalte-nen Stufenform um die allgemeine Losung der Gleichung Nx = y zu berechnen.Die unteren Zeilen bei denen alle Matrixeintrage Null sind und wir nur eine rechteSeite haben werden dabei ignoriert.

193

Page 194: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 8.6.2011

(3.3) Verwende das Ergebnis von (3.2) um eine Basis v11, . . . , v1dides Eigenraums

Eλ(A) zu berechnen, dieser ist ja der Losungsraum des homogenen linearen Glei-chungssystems Nx = 0. Die Zahl di ist dabei die geometrische Vielfachheit desEigenwerts λ = λi.

(3.4) Ist die in (3.3) berechnete geometrische Vielfachheit di von λ gleich der alge-braischen Vielfachheit ai, so nehme die Vektoren v11, . . . , v1di

als Ergebnis vonSchritt (3).

(3.5) Andernfalls bilde den Vektor

u := t1v11 + · · ·+ tdiv1di

und bezeichne seine Eintrage als y1, . . . , yn. Setze diese Werte in die rechten Seitender unteren n− r Zeilen der in (3.1) erhaltenen Stufenform ein. Dies gibt ein ho-mogenes lineares Gleichungssystem mit n−r Gleichungen fur die di Unbekanntent1, . . . , tdi

.

(3.6) Lose das Gleichungssystem aus (3.5). Ist dann T1, . . . , Ts1 eine Basis des Losungs-raums, so bilde fur jedes Tj = (t1, . . . , tn) den zugehorigen Vektor u1j = t1v11 +· · ·+ tdi

v1di. Weiter wahle unter den v11, . . . , v1di

genau l1 := di−s1 Vektoren aus,so dass keine von Null verschiedene Linearkombination der ausgewahlten Vekto-ren eine Losung des Gleichungssystem aus (3.5) ist. Dies ist immer moglich.

(3.7) Die in (3.6) gewahlten Vektoren sind dann genau die Basiselemente die den 1×1Jordankastchen zum Eigenwert λ entsprechen. Die restlichen s1 Jordankastchenzu λ haben alle eine Große mindestens 2. Fur jedes 1 ≤ j ≤ s1 benutze jetzt dasErgebnis von (3.2) um einen Vektor v2j mit Nv2j = u1j zu berechnen.

(3.8) Haben wir jetzt genug Vektoren beisammen, ist also 2s1 + l1 = ai, so fuge dieVektoren v21, u11, . . . , v2s1 , u1s1 zu den in (3.6) gewahlten Vektoren hinzu, unddiese alle sind dann das Ergebnis von Schritt (3).

(3.9) Andernfalls bilde wie in (3.5) den Vektor u := t1v21 + · · ·+ ts1v2s1 und bezeichneseine Eintrage als y1, . . . , yn. Einsetzen in die unteren n−r rechten Seiten in (3.1)gibt ein homogenes lineares Gleichungssystem mit n − r Gleichungen fur die s1

Unbekannten t1, . . . , ts1 .

(3.10) Lose das Gleichungssystem aus (3.9) und berechne eine Basis T1, . . . , Ts2 seinesLosungsraums. Fur jedes Tj = (t1, . . . , ts1) bilde den Vektor u2j = t1v21 + · · · +ts1v2s1 . Weiter wahle unter den Vektoren v21, . . . , v2s1 genau l2 := s1−s2 Vektorenaus so, dass keine von Null verschiedene Linearkombination der ausgewahltenVektoren eine Losung des Gleichungssystems aus (3.9) ist.

(3.11) Fur jeden der in (3.10) gewahlten l2 Vektoren v2k fuge v2k und Nv2k zu denbisher in (3.7) zusammengestellten Basisvektoren hinzu. Diese entsprechen dann

194

Page 195: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 10.6.2011

den l2 Jordankastchen der Große 2 × 2. Die restlichen s2 Jordankastchen zu λhaben alle eine Große mindestens 3. Fur jedes 1 ≤ j ≤ s2 benutze jetzt dasErgebnis von (3.2) um einen Vektor v3j mit Nv3j = u2j zu berechnen.

(3.12) Haben wir jetzt genug Vektoren beisammen, ist also 3s2 +2l2 + l1 = ai, so fugedie Vektoren v31, u21, Nu21, . . . , v3s2 , u2s2 , Nu2s2 zu den bisher gewahlten Basis-vektoren hinzu, und dies ist das Ergebnis von Schritt (3).

(3.13) Andernfalls wiederhole die Schritte (3.9) bis (3.12) entsprechend bis wir ai Vek-toren beisammen haben. Die in (3.11) und (3.12) hinzuzufugenden Ketten werdendabei bei jedem Schritt um eins langer, da wir ja die Basiselemente zu immergroßeren Jordankastchen zusammenstellen. Die Abbruchbedingung in (3.12) hatauf Stufe q die Form qsq−1 + (q − 1)lq−1 + · · ·+ 2l2 + l1 = ai.

(4) Fasse alle in Schritt (3) fur i = 1, . . . , t gefundenen Vektoren zu einer Basis zu-sammen, und ordne diese noch nach Eigenwerten und Große der jeweiligen Jor-dankastchen.

Vorlesung 17, Freitag 10.6.2011

Nachdem wir am Ende der letzten Sitzung das allgemeine Verfahren zur Transforma-tion auf Jordansche Normalform angegeben hatten, wollen wir dieses zum Abschluß aneinem weiteren konkreten Beispiel durchgehen, und betrachten die Matrix

A :=

2 3 2 2 3 00 1 0 −2 −1 1

−1 −2 −1 5 −1 −42 8 8 −4 6 7

−1 −3 −3 3 0 −34 12 12 −12 8 14

.

Wir werden hier das allgemeine Verfahren durchfuhren, und der Deutlichkeit halberimmer angeben bei welchem Schritt wir gerade sind.

Schritt 1 Zuerst mussen wir die Eigenwerte von A und ihre algebraischen Vielfach-heiten bestimmen. Die Berechnung des charakteristisches Polynom haben wir schon anmehreren Beispielen gesehen so, dass wir diesmal nur das Ergebnis

χA(x) = x6 − 12x5 + 60x4 − 160x3 + 240x2 − 192x+ 64 = (x− 2)6

angeben. Mit den Bezeichungen des Algorithmus ist also t = 1, λ1 = 2 und a1 = 6.Wir haben also wieder nur Jordankastchen zum Eigenwert λ1 = 2.

195

Page 196: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 10.6.2011

Schritt 3.1 Nun bilden wir wieder die Matrix N := A − 2 und fuhren die Gauß-Elimination mit allgemeiner rechter Seite durch. Da wir dies inzwischen oft genuggemacht haben, geben wir hier nur das Ergebnis an:

−1 −2 −3 5 −1 −4 y3

0 −1 0 −2 −1 1 y2

0 0 2 −4 0 3 y1 + 3y2

0 0 0 0 0 0 y4 + 2y3 + y2 − y1

0 0 0 0 0 0 y5 − y3 − y2

0 0 0 0 0 0 y6 + 4y3 + 4y2

Schritt 3.2 Wir haben hier r = 3 Zeilen, die nicht nur aus Nullen bestehen. Die Losungdes aus den oberen drei Zeilen bestehenden Systems wird

x3 =1

2(y1 + 3y2 + 4x4 − 3x6) =

1

2y1 +

3

2y2 + 2x4 −

3

2x6,

x2 = −(y2 + 2x4 + x5 − x6) = −y2 − 2x4 − x5 + x6,

x1 = −(y3 + 2x2 + 3x3 − 5x4 + x5 + 4x6)

= −y3 + 2y2 + 4x4 + 2x5 − 2x6 −3

2y1 −

9

2y2 − 6x4 +

9

2x6 + 5x4 − x5 − 4x6

= −3

2y1 −

5

2y2 − y3 + 3x4 + x5 −

3

2x6.

Dabei sind x4, x5, x6 die frei bleibenden Variablen.

Schritt 3.3 Als nachster Schritt wird dann wieder der Eigenraum E2(A) bestimmt.Dieser ist die Losungsmenge von Nx = 0 wir mussen also nur y1 = y2 = y3 = y4 =y5 = y6 = 0 in die Formel aus (3.2) einsetzen, und erhalten die Basis

v11 :=

3

−22100

, v12 :=

1

−10010

, v13 :=

−3

2−3

002

.

Diese drei Vektoren sind dabei gerade durch die Festlegungen x4 = 1, x5 = x6 = 0fur v11, x5 = 1, x4 = x6 = 0 fur v12 und x6 = 2, x4 = x5 = 0 fur v13 entstanden. Diegeometrische Vielfachheit ist hier also d1 = 3, und wir haben somit drei Jordankastchen.Da d1 = 3 < 6 = a1 ist, sind wir mit Schritt 3 noch nicht fertig.

Schritt 3.5 Als nachstes mussen wir die Vektoren zweiter Stufe berechnen, und bildenden Vektor

u := t1v11 + t2v12 + t3v13 =

3t1 + t2 − 3t3−2t1 − t2 + 2t3

2t1 − 3t3t1t22t3

.

196

Page 197: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 10.6.2011

Setzen wir fur y1 bis y6 die sechs Eintrage dieses Vektors ein, also y1 = 3t1 + t2 − 3t3,y2 = −2t1 − t2 + 2t3, y3 = 2t1 − 3t3, y4 = t1, y5 = t2 und y6 = 2t3, so wird unsereStufenform damit zu

−1 −2 −3 5 −1 −4 2t1 − 3t30 −1 0 −2 −1 1 −2t1 − t2 + 2t30 0 2 −4 0 3 −3t1 − 2t2 + 3t30 0 0 0 0 0 −t3 − 2t20 0 0 0 0 0 2t2 + t30 0 0 0 0 0 −2t3 − 4t2.

Das durch die rechten Seiten der drei unteren Zeilen gegebene homogene lineare Glei-chungssystem besteht hier also effektiv nur aus der einen Gleichung t3 = −2t2 da dieanderen Zeilen nur Vielfache hiervon sind.

Schritt 3.6 Die Dimension des Losungsraums des homogenen linearen Gleichungs-systems aus (3.5) ist hier also s1 = 2, und eine Basis des Losungsraums bilden diebeiden Vektoren T1 = (1, 0, 0) und T2 = (0, 1,−2). Wir haben l1 = d1 − s1 = 1 Jor-dankastchen der Große 1 × 1. Wir mussen also nur einen unter den drei Vektorenv11, v12, v13 auswahlen. Der Vektor v11 entspricht dabei t1 = 1, t2 = t3 = 0, er lost alsot3 = −2t2 und darf daher nicht gewahlt werden. Wir entscheiden uns fur den Vektorv12. Dieser ist also der Basisvektor zu einem 1× 1 Jordan Kastchen, und wir setzen

u6 := v12 =

1

−10010

.

Wir nennen diesen Basisvektor gleich u6 um uns das abschließende Sortieren in Schritt(4) zu sparen. Das ist in diesen Rechnungen immer moglich, da man zu jedem Zeitpunktdie Anzahlen der jeweiligen Jordankastchen kennt.

Schritt 3.7 Es verbleiben s1 = 2 Jordankastchen von Große mindestens 2. Wir bildenjetzt die Vektoren

u11 := v11 =

6

−44200

und u12 := v12 − 2v13 =

7

−5601

−4

.

Die beiden Vektoren zweiter Stufe kriegen wir indem wir die Gleichungen Nv21 = u11

und Nv22 = u12 losen. Dies geschieht wieder durch Einsetzen in die Losungsformel aus

197

Page 198: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 10.6.2011

Schritt (3.2), und wir notieren hier nur die Ergebnisse

v21 :=

−3

4−3

000

und v22 :=

−4

5−4

000

.

Die drei freien Parameter x4, x5, x6 haben wir dabei alle auf Null gesetzt.

Schritt 3.8 Es ist jetzt 2s1 + l1 = 5 < 6 = a1, wir mussen also noch weiter machen.

Schritt 3.9 Wir brauchen noch einen Vektor dritter Stufe, und hierzu setzen wir wieder

u := t1v21 + t2v22 =

−3t1 − 4t24t1 + 5t2−3t1 − 4t2

000

.

Einsetzen in die Stufenform gibt

−1 −2 −3 5 −1 −4 −3t1 − 4t20 −1 0 −2 −1 1 4t1 + 5t20 0 2 −4 0 3 9t1 + 11t20 0 0 0 0 0 t1 + t20 0 0 0 0 0 −t1 − t20 0 0 0 0 0 4t1 + 4t2.

Wir haben also erwartungsgemaß eine Bedingung t2 = −t1.

Schritt 3.10 Der Losungsraum von t2 = −t1 hat die Dimension s2 = 1 mit BasisvektorT1 = (1,−1). Damit wird

u21 := v21 − v22 =

1

−11000

.

Weiter mussen wir l2 := s1 − s2 = 1 der Vektoren v21, v22 auswahlen, wobei beideVektoren moglich sind. Wir entscheiden uns fur v21.

198

Page 199: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 10.6.2011

Schritt 3.11 Mit dem in (3.10) gewahlten Basisvektor konnen wir nun das 2×2 JordanKastchen angeben. Wie oben numerieren wir gleich korrekt und setzen

u5 := v21 =

−3

4−3

000

und u4 := Nu5 = Nv21 = u11 =

6

−44200

.

Das 2 × 2 Kastchen haben wir damit fertig gestellt. Es verbleiben s2 = 1 Kastchender Große mindestens 3. Mit der Losungsformel aus (3.2) erhalten wir eine Losung vonNv31 = u21 als

v31 =

01

−1000

.

Schritt 3.12 Jetzt ist 3s2 + 2l2 + l1 = 6 = a1, wir sind also am letzten Schrittangekommen. Damit konnen wir die Basis vervollstandigen

u3 := v31 =

01

−1000

, u2 := Nu3 = Nv31 = u21 =

1

−11000

und

u1 := Nu2 = Nu21 = Nv21 −Nv22 = u11 − u12 =

−1

1−2

2−1

4

.

Damit ist Schritt (3) abgeschlossen und in Schritt (4) ist nichts mehr zu tun da wir dieBasisvektoren schon passend durchnumeriert haben. Insgesamt haben wir damit diegesuchte Basis u1, u2, u3, u4, u5, u6 konstruiert.

Beispiele in denen mehr als nur ein Eigenwert auftaucht werden als Ubungsaufgabenbehandelt. Diese stellen rechnerisch keinerlei neue Probleme, man fuhrt die obige Rech-nung nur so oft durch wie es verschiedene Eigenwerte gibt, und fasst alle erhaltenenTeilbasen in einer Gesamtbasis zusammen.

Es gibt eine Vielfalt von Anwendungen der Transformation auf Jordansche Nor-malform, nur leider kommen diese großtenteils nicht mehr in diesem Semester vor. Wir

199

Page 200: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 10.6.2011

werden bald einige eher theoretischen Anwendungen vorfuhren, die wir teilweise in die-sem Semester auch noch verwenden werden. Um zumindest einen Eindruck vom Einsatzder Jordanschen Normalform in konkreten Problemen zu geben, wollen wir jetzt dieLosung sogenannter homogener, linearer Differentialgleichungssysteme mit konstantenKoeffizienten besprechen. Eine systematische Diskussion derartiger Fragen wird erstim nachsten Semester stattfinden, hier geht es nur um einen ersten Uberblick. Gegebenist ein Intervall I ⊆ R und wir wollen differenzierbare Funktionen y1, . . . , yn : I → Rbestimmen, deren Ableitungen als Linearkombinationen der Funktionen y1, . . . , yn ge-geben sind, also

y′1 = a11y1 + a12y2 + · · · + a1nyn

y′2 = a21y1 + a22y2 + · · · + a2nyn...

......

...y′n = an1y1 + an2y2 + · · · + annyn,

dabei sind die aij fur 1 ≤ i, j ≤ n vorgegebene, reelle Konstanten. Schreiben wir

y :=

y1...yn

und A :=

a11 · · · a1n...

. . ....

an1 · · · ann

,

so konnen wir dieses Differentialgleichungssystem in der Matrixform y′ = Ay schrei-ben. Dabei soll die Ableitung eines Vektors einfach die Ableitung jeder einzelnen Kom-ponente bedeuten. Wir transformieren die Koeffizientenmatrix A jetzt auf Jordan-sche Normalform, d.h. wir berechnen wie gesehen eine invertierbare Matrix S so, dassB := S−1AS in Jordanscher Normalform ist. Dann ist auch A = SBS−1, also mussunsere Losung y die Gleichung

y′ = SBS−1y erfullen, also auch (S−1y)′ = S−1y′ = BS−1y.

Die transformierte Funktion z := S−1y erfullt also z′ = Bz wobei B in JordanscherNormalform ist. Fur eine solche Differentialgleichung kann man die Losungen z explizithinschreiben, und dann wird y = Sz eine Losung der Ausgangsgleichung.

Wie angekundigt, wollen wir zum Abschluß dieses Abschnitts noch einige theo-retische Folgerungen aus der Existenz der Jordanschen Normalform festhalten. Wirbeginnen mit

Korollar 5.8 (Summe und Produkt der Eigenwerte)Sei A eine komplexe n× n Matrix und bezeichne λ1, . . . , λn ihre mit Vielfachheit auf-gezahlten Eigenwerte. Dann gelten

λ1 + · · ·+ λn = tr(A) und

λ1 · . . . · λn = det(A).

200

Page 201: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 10.6.2011

Beweis: Ist A in Jordanscher Normalform so sind beide Aussagen klar denn die Spurist die Summe der Diagonaleintrage und die Determinante ist nach I.§10.Lemma 4 dasProdukt der Diagonaleintrage. Im allgemeinen Fall gibt es eine zu A ahnliche MatrixB in Jordanscher Normalform. Wegen χB = χA sind dann λ1, . . . , λn auch die mitVielfachheit aufgezahlten Eigenwerte von B und nach Satz 2 gelten auch detB = detAund trB = trA. Da wir die Behauptung fur B schon eingesehen haben, gilt sie somitauch fur A.

Weiter konnen wir unser Verfahren zur Bestimmung der Jordanschen Normalformverwenden ein weiteres Kriterium fur die Diagonalisierbarkeit einer Matrix herzuleiten.Eine Matrix A ist genau dann diagonalisierbar wenn in ihrer Jordanschen Normalformnur 1 × 1-Kastchen vorkommen. In der Notation des Verfahrens zur Berechnung derNormalform bedeutet dies s1 = 0 fur jeden Eigenwert λ von A, und dies heißt weiterdas fur jedes x ∈ Cn aus (A − λ)x ∈ Eλ(A) schon (A − λ)x = 0 folgt. Außerdem ist(A − λ)x ∈ Eλ(A) gleichwertig zu (A − λ)2x = 0, wir brauchen also Kern(A − λ)2 ⊆Kern(A− λ). Dies zeigt:

Lemma 5.9 (Kriterium fur Diagonalisierbarkeit)Seien K ∈ {R,C} und A eine quadratische Matrix uber K. Dann ist A genau danndiagonalisierbar wenn χA uber K in Linearfaktoren zerfallt und

Kern(A− λ)2 ⊆ Kern(A− λ)

fur jeden Eigenwert λ von A gilt.

Zum Abschluß wollen wir noch eine letzte Umformulierung des Satzes uber die Jordan-sche Normalform angeben, und die sogenannte Jordan-Zerlegung einer reellen oderkomplexen Matrix beschreiben. Hier werden wir keinen vollstandigen Beweis vorfuhren,da dieser Hilfsmittel erfordert die wir nicht behandelt haben. Angenommen wir habeneine Matrix

J =

λ1 ε1

λ2 ε2. . . . . .

λn−1 εn−1

λn

in Jordanscher Normalform gegeben, also ε1, . . . , εn−1 ∈ {0, 1} und fur jedes 1 ≤ i < nmit εi = 1 ist auch λi = λi+1. Wir teilen J jetzt in Haupt- und Nebendiagonale auf,also J = H +N mit

H =

λ1 0

λ2 0. . . . . .

λn−1 0λn

und N =

0 ε1

0 ε2. . . . . .

0 εn−1

0

.

201

Page 202: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 10.6.2011

Wir behaupten das dann HN = NH und Nn = 0 gelten. Wir beginnen mit der erstenAussage. Seien 1 ≤ i, j ≤ n gegeben. Dann gilt im Fall j 6= i + 1 stets (HN)ij =(NH)ij = 0 und im verbleibenden Fall j = i+ 1 haben wir

(HN)ij − (NH)ij = λiεi − λi+1εi = (λi − λi+1)εi = 0,

da εi = 0 oder λi = λi+1 gilt. Damit ist HN = NH eingesehen. Fur die zweite AussageNn = 0 muss man nur beobachten das die k-te Potenz Nk fur k ≥ 1 hochstens von Nullverschiedene Eintrage auf der k-ten Nebendiagonalen haben kann, und insbesonderemussNn = 0 sein. Solche Matrizen bei denen eine Potenz zu Null wird, sind ausreichendwichtig einen eigenen Namen zu erhalten.

Definition 5.7 (Nilpotente Matrizen)Eine quadratische Matrix A uber K ∈ {R,C} heißt nilpotent wenn es ein k ∈ N mitAk = 0 gibt.

Unsere obige Uberlegung zeigt in dieser Sprache, dass man jede in Jordanscher Nor-malform vorliegende Matrix A ∈ Cn×n als eine Summe A = H + N aus einer Diago-nalmatrix H und einer nilpotenten Matrix N schreiben kann, wobei HN = NH ist.Kommen wir jetzt zu einer allgemeinen, komplexen n× n-Matrix A. Dann gibt es eineinvertierbare Matrix S ∈ Cn×n so, dass S−1AS in Jordanscher Normalform ist, undwie bereits gesehen, konnen wir S−1AS = H+N wie oben schreiben. Damit wird auch

A = S(H +N)S−1 = SHS−1 + SNS−1,

und fur die beiden Summanden gilt wieder

(SHS−1) · (SNS−1) = SHNS−1 = SNHS−1 = (SNS−1) · (SHS−1).

Weiter ist analog (SNS−1)n = SNnS−1 = 0, und damit ist auch SNS−1 nilpotent.Schließlich ist SHS−1 zu einer Diagonalmatrix ahnlich, also diagonalisierbar. Damithaben wir eingesehen, dass jede komplexe n× n-Matrix A sich als Summe A = H +Naus einer diagonalisierbaren Matrix H und einer nilpotenten Matrix N schreiben laßtwobei auch HN = NH ist. Was wir nicht beweisen wollen, ist die Tatsache das dieseZerlegung eindeutig ist. Im Licht unserer Herleitung ist dies hochgradig uberraschend,die Transformationsmatrix S auf Jordansche Normalform ist bei weitem nicht eindeutigfestgelegt, in unserem Verfahren zu ihrer Berechnung wurden ja an zahllosen Stellenvollig willkurlich Losungen linearer Gleichungssysteme ausgewahlt. Trotzdem sind Hund N eindeutig bestimmt.

Tatsachlich erwartet uns hier noch eine zweite Uberraschung. Angenommen unsereMatrix A ist reell. Sind dann auch alle Eigenwerte von A reell, so wissen wir das auch dieTransformationsmatrix S reell ist, und damit sind H und N reell. Es stellt sich heraus,dass H und N in Wahrheit auch dann reell sind, wenn A nicht-reelle Eigenwerte hat.Die Matrix H ist dann zwar nicht unbedingt uber den reellen Zahlen diagonalisierbar,aber uber den komplexen Zahlen, und solche Matrizen hatten wir halbeinfach genannt.

202

Page 203: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 10.6.2011

Auch dies wollen wir nicht beweisen, sondern nur zum Abschluß den Satz uber dieJordan-Zerlegung angeben.

Satz 5.10 (Jordan Zerlegung)Seien K ∈ {R,C}, n ∈ N mit n ≥ 1 und A eine n×n-Matrix uber K. Dann existiereneine eindeutig bestimmte halbeinfache Matrix H ∈ Kn×n und eine eindeutig bestimmtenilpotente Matrix N ∈ Kn×n mit HN = NH und A = H +N .

$Id: quadrat.tex,v 1.11 2011/09/19 14:56:09 hk Exp $

§6 Symmetrische und hermitesche Matrizen

Wahrend wir im letzten Kapitel noch allgemeine, quadratische Matrizen uber Rund C behandelt hatten, wollen wir jetzt eine spezielle Sorte von Matrizen naher un-tersuchen, die sogenannten symmetrischen beziehungsweise hermiteschen Matrizen. Diesymmetrischen Matrizen sind dabei der reelle Fall und die hermiteschen der komplexeFall. Wir beginnen reell, und wollen zunachst einmal begrunden warum symmetrischeMatrizen uberhaupt von Interesse sind. In I.§12.3 hatten wir das reelle Skalarproduktfur x, y ∈ Rn als

x · y = xty

eingefuhrt. Das Symbol”t“ steht dabei fur das Bilden der Transponierten, wie in I.§9.2

eingefuhrt. Haben wir weiter eine n×n-Matrix A uber R, so ergibt sich fur alle x, y ∈ Rn

die Gleichung

(Ax) · y = (Ax)ty = xtAty = x · (Aty),

man kann eine Matrix im Skalarprodukt also auf die andere Seite bringen, solange siedabei nur transponiert wird. Von besonderen Interesse sind damit die Matrizen A mitAt = A, denn diese erfullen (Ax) · y = x · (Ay) fur alle x, y ∈ Rn. Dies sind genaudie symmetrischen Matrizen. Wir werden uns hauptsachlich fur reelle, symmetrischeMatrizen interessieren, definieren kann man den Begriff aber auch im komplexen Fall.

Definition 6.1 (Symmetrische Matrizen)Seien K ∈ {R,C} und n ∈ N mit n ≥ 1 gegeben. Dann heißt eine Matrix A ∈ Kn×n

symmetrisch wenn At = A gilt.

Wie schon bemerkt, ist fur komplexe Matrizen ein etwas anderer Begriff von großeremInteresse. Im komplexen Fall verhielt sich das oben definierte Skalarprodukt etwasmerkwurdig, es konnten beispielsweise von Null verschiedene Vektoren auf sich selbstsenkrecht stehen. In der Mathematik wird auch diese Moglichkeit durchaus betrachtet,aber dies ist eine Richtung die wir hier nicht verfolgen wollen. Es gibt glucklicherweiseauch eine kleine Modifikation der Definition des Skalarprodukts im komplexen Fall, die

203

Page 204: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 10.6.2011

all diese Probleme vermeidet. Sind x, y ∈ Cn, so bezeichnen wir

x · y := xty =n∑

j=1

xiyj

als das hermitesche Skalarprodukt von x und y. Dieses hermitesche Skalarprodukterfullt ahnliche Rechenregeln wie das gewohnliche Skalarprodukt:

1. Fur alle x, y, z ∈ Cn sind (x+ y) · z = x · z + y · z und x · (y + z) = x · y + x · z.

2. Fur alle x, y ∈ Cn, λ ∈ C sind (λx) · y = λx · y und x · (λy) = λx · y.

3. Fur alle x, y ∈ Cn gilt y · x = x · y.

4. Fur jedes 0 6= x ∈ Cn ist x · x =∑n

i=1 |xi|2 ∈ R>0.

Da wir uns im Folgenden eigentlich nur fur das hermitesche Skalarprodukt im Cn in-teressieren werden, lassen wir den Zusatz

”hermitesch“ meist weg und sprechen einfach

von dem komplexen Skalarprodukt. Ist nun zusatzlich A eine komplexe n× n Matrix,so haben wir fur alle x, y ∈ Cn stets

(Ax) · y = (Ax)t · y = xtAty = xtAty = x · (At

y).

Schreiben wir also

A∗ := At= At,

so wird

(Ax) · y = x · (A∗y)

fur alle x, y ∈ Cn. Ist insbesondere A∗ = A, so haben wir auch fur das hermitescheSkalarprodukt die Gleichung (Ax) · y = x · (Ay) fur alle x, y ∈ Cn. Diese Beobachtungfuhrt uns auf die folgende Definition.

Definition 6.2 (Hermitesche Matrizen)Sei n ∈ N mit n ≥ 1. Eine Matrix A ∈ Cn×n heißt hermitesch wenn A∗ = A gilt.

Die hermiteschen Matrizen spielen also fur das komplexe Skalarprodukt dieselbe Rolledie die symmetrischen Matrizen fur das reelle Skalarprodukt spielen. Fur eine reelle

Matrix A ∈ Rn×n ist A = A und somit auch A∗ = At

= At, d.h. A ist genau dannsymmetrisch wenn A als komplexe Matrix hermitesch ist. Die hermiteschen Matrizensind somit der

”allgemeine Fall“. Wir wollen noch eine letzte Anmerkung zur Notation

machen. Wir schreiben fur die Konjugation und ∗ fur die konjugiert-transponierteMatrix. Wird anstelle dessen die komplexe Konjugation mit dem Symbol ∗ bezeich-net, so wird fur die konjugiert-transponierte Matrix von A oft die Bezeichnung A†

verwendet.

204

Page 205: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 10.6.2011

6.1 Pra-Hilbertraume

Bevor wir mit der eigentlichen Untersuchung symmetrischer und hermitescher Ma-trizen beginnen, betrachten wir erst einmal die zugehorigen reellen beziehungsweisekomplexen Skalarprodukte und wollen diese in ihren allgemeinen begrifflichen Rahmeneinordnen. Die Ergebnisse dieses Abschnitts werden wir sowohl fur den Hauptsatz ubersymmetrische und hermitesche Matrizen verwenden, als auch spater in diesem Semesterbei der Behandlung des Gradienten eines Skalarfelds. Wir beginnen mit dem Begriffeines abstrakten Skalarprodukts auf einem Vektorraum.

Definition 6.3 (Prahilbertraume)Sei K ∈ {R,C} und sei H ein Vektorraum uber K. Ein Skalarprodukt auf H ist eineAbbildung

〈 | 〉 : H ×H → K,

die die folgenden Bedingungen erfullt:

(a) Das Skalarprodukt ist in der ersten Variablen linear, d.h. fur alle x, y, z ∈ H undalle λ ∈ K gelten 〈x+ y|z〉 = 〈x|z〉+ 〈y|z〉 und 〈λx|y〉 = λ〈x|y〉.

(b) Das Skalarprodukt ist in der zweiten Variable antilinear, d.h. fur alle x, y, z ∈ Hund alle λ ∈ K gelten 〈x|y + z〉 = 〈x|y〉+ 〈x|z〉 und 〈x|λy〉 = λ〈x|y〉 (im reellenFall K = R ist dies gleichbedeutend zur Linearitat).

(c) Das Skalarprodukt ist hermitesch, d.h. fur alle x, y ∈ H gilt 〈y|x〉 = 〈x|y〉 (imreellen Fall ist dies die Symmetrie 〈y|x〉 = 〈x|y〉).

(d) Das Skalarprodukt ist positiv definit, d.h. fur alle x ∈ H\{0} gilt 〈x|x〉 > 0 (nachEigenschaft (c) ist 〈x|x〉 ∈ R, dies ist also eine sinnvolle Forderung).

Ein Prahilbertraum uber K ist dann ein mit einem Skalarprodukt versehener Vektor-raum uber K.

Weshalb hier die Vorsilbe”Pra“ verwendet wird, werden wir noch sehen. Wir kennen

naturlich bereits Beispiele von Prahilbertraumen, nahmlich den Rn und den Cn mitihren jeweiligen Skalarprodukten. Diese beiden Beispiele, und ihre Untervektorraume,werden auch die einzigen Beispiele von Prahilbertraumen sein, die fur uns in diesemSemester von Bedeutung sind. Haben wir jetzt einen Prahilbertraum H uber K = Roder K = C, so ist fur jeden Vektor x ∈ H das Skalarprodukt 〈x|x〉 ∈ R≥0, und wirkonnen die sogenannte Norm des Vektors x als

||x|| :=√〈x|x〉

definieren. Zunachst ist dies nur eine Name, es ist nicht unmittelbar klar das dieswirklich eine Norm im Sinne von §4.5 ist. Was wir wissen ist ||x|| > 0 fur x ∈ H mitx 6= 0 und fur x ∈ H und jeden reellen beziehungsweise komplexen Skalar λ ist auch

||λx|| =√〈λx|λx〉 =

√λλ〈x|x〉 =

√|λ|2〈x|x〉 = |λ|

√〈x|x〉 = |λ| · ||x||.

205

Page 206: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 22.6.2011

Nicht so offensichtlich ist aber die Dreiecksungleichung. Um diese herzuleiten, beweisenwir nun die sogenannte Cauchy-Schwartz Ungleichung.

Satz 6.1 (Cauchy-Schwartz Ungleichung)Sei H ein Prahilbertraum uber K ∈ {R,C}. Dann gilt fur alle x, y ∈ H die sogenannteCauchy-Schwartz Ungleichung

|〈x|y〉| ≤ ||x|| · ||y||

und sind x, y linear unabhangig so gilt sogar |〈x|y〉| < ||x|| · ||y||.

Beweis: Wir zeigen zunachst die zweite Aussage. Seien x, y ∈ H linear unabhangig.Fur jedes t ∈ R ist dann x+ ty 6= 0, also auch

0 < 〈x+ ty|x+ ty〉 = 〈x|x〉+ t〈x|y〉+ t〈y|x〉+ t2〈y|y〉 = ||y||2t2 + 2tRe(〈x|y〉) + ||x||2.

Das diese quadratische Funktion in t keine reelle Nullstelle besitzt, bedeutet

4||x||2||y||2 − 4 Re(〈x|y〉)2 > 0, also |Re(〈x|y〉)| < ||x|| · ||y||.

Im reellen Fall K = R sind wir damit bereits fertig. Im komplexen Fall K = C setzenwir λ := 〈x|y〉 und u := λx mit 〈u|y〉 = 〈x|y〉〈x|y〉 = |〈x|y〉|2 und ||u|| = |〈x|y〉|||x||,und da auch u, y linear unabhangig sind ergibt sich

|〈x|y〉|2 = |Re(〈u|y〉)| < ||u|| · ||y|| = |〈x|y〉| · ||x|| · ||y||,

also wieder |〈x|y〉| < ||x|| · ||y||. Fur linear unabhangige x, y ist damit alles bewiesen.Schließlich seien x, y ∈ H linear abhangig. Ist y = 0, so gilt |〈x|y〉| = 0 = ||x|| · ||y||.

Ist andererseits y 6= 0, so existiert ein Skalar λ ∈ K mit x = λy, und somit ist wieder

|〈x|y〉| = |〈λy|y〉| = |λ〈y|y〉| = |λ| · ||y||2 = ||λy|| · ||y|| = ||x|| · ||y||.

Vorlesung 18, Mittwoch 22.6.2011

Am Ende der letzten Sitzung hatten wir einen Prahilbertraum H als einen reellenoder komplexen Vektorraum H eingefuhrt, der mit einem Skalarprodukt 〈 | 〉 versehenist. Dieses Skalarprodukt erlaubte es uns die Norm eines Vektors x als ||x|| :=

√〈x|x〉

einzufuhren, und wir werden gleich sehen, dass dies wirklich eine Norm im Sinne von§4.5 ist. Hierzu werden wir die ebenfalls schon bewiesene Cauchy-Schwartz Ungleichung

|〈x|y〉| ≤ ||x|| · ||y||

206

Page 207: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 22.6.2011

verwenden. Dabei hatten wir gesehen das in dieser Ungleichung genau dann die Gleich-heit gilt wenn die beiden Vektoren x und y linear abhangig sind. Im reellen Fall kannman dies noch etwas weiter ausfuhren. Es gilt ja auch

〈x|y〉 ≤ |〈x|y〉| ≤ ||x|| · ||y||

und gilt hier sogar die Gleichheit, so ist auch |〈x|y〉| = ||x|| · ||y|| also sind x, y linearabhangig und wir haben y = 0 oder x = λy mit λ ≥ 0. Kommen wir zum allgemeinenFall zuruck und beweisen die Dreiecksungleichung fur unsere Norm.

Korollar 6.2 (Prahilbertraume sind normierte Raume)Ist H ein Prahilbertraum so ist || || eine Norm auf H.

Beweis: Die ersten beiden Eigenschaften einer Norm haben wir bereits fruher einge-sehen, es ist also nur noch die Dreiecksungleichung zu zeigen. Fur x, y ∈ H habenwir

||x+ y||2 = 〈x+ y|x+ y〉 = ||x||2 + 2 Re(〈x|y〉) + ||y||2

≤ ||x||2 + 2||x|| · ||y||+ ||y||2 = (||x||+ ||y||)2,

und somit ist auch ||x+ y|| ≤ ||x||+ ||y||.

In einem Prahilbertraum konnen wir also auch samtliche auf normierte Raume an-wendbaren Begriffe verwenden. Dies erlaubt es insbesondere endlich zu sagen was einHilbertraum ist.

Definition 6.4: Ein Hilbertraum ist ein Prahilbertraum dessen Norm vollstandig ist.

Wie wir bald sehen werden ist jeder endlich erzeugte Prahilbertraum auch ein Hilber-traum, und insbesondere sind auch Rn und Cn mit dem jeweiligen gewohnlichen Skalar-produkt Hilbertraume. Tatsachlich werden wir hauptsachlich diese beiden betrachten.Um auch einmal einen nicht endlich erzeugten Hilbertraum zu sehen, schauen wir unsdie Menge

`2 :=

{(xn)n∈N ∈ KN

∣∣∣∣∣∞∑

n=0

|xn|2 <∞

}aller quadratisch summierbaren Folgen in K ∈ {R,C} an. Offenbar sind 0 ∈ `2 undλx ∈ `2 fur x ∈ `2 und λ ∈ K. Seien jetzt x, y ∈ `2. Fur jedes n ∈ N ist dann nachKorollar 2

n∑k=0

|xk + yk|2 ≤

( n∑k=0

|xk|2)1/2

+

(n∑

k=0

|yk|2)1/2

2

( ∞∑k=0

|xk|2)1/2

+

(∞∑

k=0

|yk|2)1/2

2

<∞,

207

Page 208: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 22.6.2011

und somit ist x + y ∈ `2. Damit ist `2 ein Vektorraum uber K. Seien wieder x, y ∈`2. Nach dem Cauchy Kriterium fur Reihen I.§7.Satz 8 existieren n1, n2 ∈ N mit∑m

k=n |xk|2 < ε fur m ≥ n ≥ n1 und∑m

k=n |yk|2 < ε fur m ≥ n ≥ n2. Setzen0 := max{n1, n2}. Fur alle n,m ∈ N mit m ≥ n ≥ n0 gilt dann nach Satz 1∣∣∣∣∣

m∑k=n

xkyk

∣∣∣∣∣ ≤(

m∑k=n

|xk|2)1/2( m∑

k=n

|yk|2)1/2

< ε,

d.h. nach I.§7.Satz 8 ist die Reihe

〈x|y〉 :=∞∑

n=0

xnyn

konvergent. Analog zum Rn beziehungsweise Cn definiert diese Reihe uns ein Skalarpro-dukt auf `2, und somit haben wir `2 zu einem Prahilbertraum gemacht, dessen Normals

||x||2 =√〈x|x〉 =

(∞∑

n=0

|xn|2)1/2

gegeben ist. Wir behaupten, dass `2 sogar ein Hilbertraum ist. Sei also (xn)n∈N eineCauchyfolge in `2. Ist k ∈ N, so gilt fur alle n,m ∈ N auch

|xnk − xm

k | =√|xn

k − xmk |2 ≤ ||xn − xm||2,

d.h. (xnk)n∈N ist eine Cauchyfolge in K und somit existiert xk := limn→∞ xn

k ∈ K. Seiε > 0 gegeben. Dann existiert ein n0 ∈ N mit ||xn − xm||2 < ε/2 fur alle n,m ≥ n0. Sein ∈ N mit n ≥ n0. Fur jedes p ∈ N gilt

p∑k=0

|xnk−xk|2 = lim

m→∞

p∑k=0

|xnk−xm

k |2 ≤ lim supm→∞

∞∑k=0

|xnk−xm

k |2 = lim supm→∞

||xn−xm||22 ≤ε2

4

und damit ist auch∞∑

k=0

|xnk − xk|2 ≤

ε2

4<∞,

also xn − x ∈ `2 und ||xn − x||2 ≤ ε/2 < ε. Insbesondere existiert uberhaupt ein n ∈ Nmit xn − x ∈ `2 und damit ist x = xn − (xn − x) ∈ `2. Folglich konvergiert die Folge(xn)n∈N in `2 gegen x. Damit ist `2 ein Hilbertraum.

Wir wollen uns auch noch ein Beispiel eines Prahilbertraums anschauen, der keinHilbertraum ist. Hierzu seien a, b ∈ R mit a < b und betrachte den VektorraumH := C[a, b] der stetigen Funktionen f : [a, b] → R. Fur x, y ∈ H definieren wirdas Skalarprodukt als

〈x|y〉 :=

∫ b

a

x(t)y(t) dt.

208

Page 209: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 22.6.2011

Die ersten drei Eigenschaften eines Skalarprodukts folgen aus der Linearitat des Inte-grals §2.Lemma 5.(a,b) und der Kommutativitat der Multiplikation. Auch die letzteEigenschaft eines Skalarprodukt konnen wir leicht einsehen, ist x : [a, b] → R stetigund x 6= 0, so ist auch x2 : [a, b] → R stetig mit x2 6= 0 und x2(t) = x(t)2 ≥ 0 fur jedest ∈ [a, b], also ist nach §2.Lemma 5.(c) und Aufgabe (14) auch

〈x|x〉 =

∫ b

a

x(t)2 dt > 0.

Als Norm ergibt sich

||x||2 :=

(∫ b

a

x(t)2 dt

)1/2

.

Wir behaupten das dieser Prahilbertraum nicht vollstandig ist, und hierzu mussen wireine divergente Cauchyfolge in H produzieren. Setze hierzu M := (a + b)/2 ∈ (a, b)und fur jedes n ≥ 1 seien

an := M − b− a

2nund bn := M +

b− a

2n, also a ≤ an < M < bn ≤ b.

b t

xn(t)

a an bn

Weiter betrachten wir die stetige Funktion

xn : [a, b] → R; t 7→

0, t ≤ an,n(t−an)

b−a, an ≤ t ≤ bn,

1, bn ≤ t ≤ b

und ihre beiden Einschrankungen x−n := xn|[a,M ], x+n :=

xn|[M, b]. Wir haben∫ M

a

xn(t)2 dt =n2

(b− a)2

∫ b−a2n

0

t2 dt =b− a

24n

und wegen xn(2M − t) = 0 fur bn ≤ t ≤ b sowie

xn(2M − t) =n(2M − an − t)

b− a=n(2(M − an)− (t− an)

b− a= 1− n(t− an)

b− a= 1− xn(t)

fur M ≤ t ≤ bn gilt 1− xn(t) = xn(2M − t) fur alle t ∈ [M, b], also ist auch∫ b

M

(xn(t)− 1)2 dt =

∫ b

M

xn(2M − t)2 dt =

∫ M

a

xn(t)2 dt =b− a

24n,

und dies bedeutet

||x−n ||2 = ||x+n − 1||2 =

√b− a

24n−→ 0.

209

Page 210: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 22.6.2011

Also konvergiert die Folge (x−n )n∈N in C[a,M ] gegen die Funktion konstant 0 und(x+

n )n∈N in C[M, b] gegen die Funktion konstant 1, jeweils bezuglich der Norm || ||2.Fur alle n,m ∈ N mit m ≥ n folgen weiter

||x−n − x−m||2 ≤ ||x−n ||2 + ||x−m||2 ≤√b− a

6n

und

||x+n − x+

m||2 ≤ ||x+n − 1||2 + ||x+

m − 1||2 ≤√b− a

6n

also insgesamt

||xn − xm||2 = (||x−n − x−m||22 + ||x+n − x+

m||22)1/2 ≤√b− a

3n,

und damit ist (xn)n∈N eine Cauchyfolge in C[a, b]. Die Folge (xn)n∈N ist aber in C[a, b]nicht konvergent. Wegen ||x|[a,M ]||2 ≤ ||x||2 und ||x|[M, b]||2 ≤ ||x||2 fur jedes x ∈C[a, b] sind namlich die beiden linearen Abbildungen

C[a, b] → C[a,M ];x 7→ x|[a,M ] und C[a, b] → C[M, b];x 7→ x|[M, b]

nach §4.Lemma 15 stetig, ware also (xn)n∈N gegen ein x ∈ C[a, b] konvergent, so konver-gierte (x−n )n∈N gegen x|[a,M ] und (x+

n )n∈N gegen x|[M, b], also hatten wir x|[a,M ] = 0und x|[M, b] = 1, ein Widerspruch. Damit ist C[a, b] nur ein Prahilbertraum aber keinHilbertraum.

Wir kommen jetzt zur allgemeinen Theorie zuruck und fuhren diverse Orthogona-litatsbegriffe ein.

Definition 6.5 (Orthogonalitat)Sei H ein Prahilbertraum. Zwei Vektoren x, y ∈ H heißen senkrecht aufeinander oderorthogonal zueinander, geschrieben als x ⊥ y, wenn 〈x|y〉 = 0 ist. Ein Tupel x1, . . . , xn

von Vektoren aus H heißt ein Orthogonalsystem wenn xi ⊥ xj fur alle 1 ≤ i, j ≤ nmit i 6= j gilt, und es heißt ein Orthonormalsystem wenn es ein Orthogonalsystem mit||xi|| = 1 fur alle 1 ≤ i ≤ n ist. Eine Basis x1, . . . , xn des Vektorraums H heißt eineOrthogonalbasis wenn x1, . . . , xn ein Orthogonalsystem ist und eine Orthonormalbasiswenn x1, . . . , xn ein Orthonormalsystem ist.

Eine Basis x1, . . . , xn von H war definitionsgemaß ein linear unabhangiges Erzeugen-densystem von H. Um zu uberprufen ob ein Tupel x1, . . . , xn eine Orthogonalbasis vonH bildet, mussen also im Prinzip drei Bedingungen uberpruft werden. Diese drei Be-dingungen sind nicht unabhangig voneinander, wir werden jetzt zeigen das ein aus vonNull verschiedenen Vektoren bestehendes Orthogonalsystem automatisch auch linearunabhangig ist.

Lemma 6.3: Seien H ein Prahilbertraum und u1, . . . , un ∈ H\{0} ein Orthogonalsy-stem. Dann sind die Vektoren u1, . . . , un linear unabhangig.

210

Page 211: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 22.6.2011

Beweis: Seien λ1, . . . , λn ∈ K mit∑n

i=1 λiui = 0. Ist 1 ≤ j ≤ n, so folgt

0 =

⟨ n∑i=1

λiui

∣∣∣∣uj

⟩=

n∑i=1

λi〈ui|uj〉 = λj||uj||2

und somit λj = 0 da ||uj|| 6= 0 ist.

Haben wir also von Null verschiedene Vektoren x1, . . . , xn in H, die sowohl ein Or-thogonalsystem von H als auch ein Erzeugendensystem von H sind, so ist x1, . . . , xn

bereits eine Orthogonalbasis von H. Diese Beobachtung kann man noch etwas weiterausdehnen. Ist der Prahilbertraum H endlich erzeugt und ist n = dimH, so ist einOrthogonalsystem v1, . . . , vn ∈ H\{0} nach dem Lemma linear unabhangig und nachI.§11.Korollar 7.(b) ist v1, . . . , vn bereits eine Orthogonalbasis von H. Stimmt also dieAnzahl der Vektoren, so reicht es die Orthogonalitat der Vektoren zu uberprufen unddas sie alle von Null verschieden sind, und dann liegt bereits eine Orthogonalbasis vor.

Wir wollen jetzt einsehen, dass jeder endlich erzeugte Prahilbertraum stets eineOrthonormalbasis besitzt. Wir werden dies durch Angabe eines Rechenverfahrens zurBestimmung einer solchen Basis tun. Starten wir mit einer Basis v1, . . . , vn von H,so konnen wir aus dieser auch eine Orthonormalbasis von H gewinnen. Die hierfurzustandige Rechenmethode ist die sogenannte Gram-Schmidt Orthonormalisierung,und diese kann man etwas allgemeiner als eigentlich notig auch auf beliebige linearunabhangige Vektoren anwenden.

Gegeben: Linear unabhangige Vektoren v1, . . . , vn in einem Prahilbertraum H.

Gesucht: Eine Orthonormalbasis u1, . . . , un des Aufspanns 〈v1, . . . , vn〉.

Verfahren: Die Rechnung lauft in den folgenden Schritten ab:

1. Setze w1 := v1.

2. Ist 1 < i ≤ n und haben wir w1, . . . , wi−1 schon berechnet, so setze

wi = vi −i−1∑j=1

〈vi|wj〉||wj||2

· wj.

3. Haben wir w1, . . . , wn berechnet, so setze schließlich ui := wi/||wi|| fur alle 1 ≤i ≤ n.

Dabei ist automatisch sichergestellt das keiner der Vektoren w1, . . . , wn jemals Nullwerden kann. Passiert dies doch, so sind wir in Wahrheit mit linear abhangigen Vekto-ren v1, . . . , vn gestartet. Um zu beweisen das die Gram-Schmidt Orthonormalisierungfunktioniert, zeigen wir durch Induktion nach i das die Vektoren w1, . . . , wi fur jedes1 ≤ i ≤ n eine Orthogonalbasis von 〈v1, . . . , vi〉 bilden, also insbesondere alle vonNull verschieden sind. Wegen v1 6= 0 ist dies fur i = 1 klar. Ist jetzt 1 < i ≤ n

211

Page 212: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 22.6.2011

und bilden die Vektoren w1, . . . , wi−1 bereits eine Orthogonalbasis von 〈v1, . . . , vi−1〉,so ist insbesondere w1, . . . , wi−1 6= 0 und wi ist uberhaupt sinnvoll definiert. Wegenw1, . . . , wi−1 ∈ 〈v1, . . . , vi−1〉 ist auch wi ∈ 〈v1, . . . , vi〉. Da die Vektoren v1, . . . , vi linearunabhangig sind, ist nach I.§11.Lemma 3.(a) auch

vi /∈ 〈v1, . . . , vi−1〉 = 〈w1, . . . , wi−1〉,

also ist wi /∈ 〈w1, . . . , wi−1〉 und insbesondere wi 6= 0. Fur jedes 1 ≤ j < i haben wir

〈wi|wj〉 = 〈vi|wj〉 −i−1∑k=1

〈vi|wk〉||wk||2

〈wk|wj〉 = 〈vi|wj〉 −〈vi|wj〉||wj||2

||wj||2 = 0,

d.h. w1, . . . , wi sind i = dim〈v1, . . . , vi〉 viele, von Null verschiedene, paarweise ortho-gonale Vektoren aus 〈v1, . . . , vi〉, und somit eine Orthogonalbasis von 〈v1, . . . , vi〉.

Per Induktion ist damit w1, . . . , wn eine Orthogonalbasis von 〈v1, . . . , vn〉, und damitist u1, . . . , un eine Orthonormalbasis dieses Vektorraums.

Wir wollen einige Beispiele zum Orthonormalisierungsverfahren rechnen, der Ein-fachheit halber im Rn mit dem gewohnlichen Skalarprodukt. Wir beginnen mit derfolgenden Basis des R2

v1 =

(−1

2

), v2 =

(11

).

Dann bilden wir

w1 := v1 =

(−1

2

), w1 · w1 = 5,

w2 := v2 −v2 · w1

w1 · w1

· w1 = v2 −1

5v1 =

(11

)− 1

5

(−1

2

)=

(6535

).

Diese Vektoren mussen wir nur noch normieren und erhalten die gesuchte Orthonor-malbasis des R2

u1 =w1

|w1|=

(− 1√

52√5

), w2 · w2 =

36

25+

9

25=

9

5, u2 =

w2

|w2|=

√5

3w2 =

(2√5

1√5

).

Wir rechnen jetzt auch noch ein dreidimensionales Beispiel

v1 =

110

, v2 =

011

, v3 =

10

−2

.

Dann rechnen wir

w1 := v1 =

110

, w1 · w1 = 2, w2 := v2 −1

2w1 =

−1212

1

, w2 · w2 =3

2,

w3 := v3 −1

2w1 +

5

3w2 =

−1313

−13

, w3 · w3 =1

3.

212

Page 213: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 22.6.2011

Die gesuchte Orthonormalbasis erhalten wir durch Normierung

u1 =1√2w1 =

1√2

1√2

0

, u2 =

√2√3w2 =

− 1√6

1√6

2√6

, u3 =√

3w3 =

− 1√3

1√3

− 1√3

.

Wir haben eingesehen das jeder endlich erzeugte Prahilbertraum stets eine Orthonor-malbasis besitzt, wissen aber noch nicht weshalb dies uberhaupt wunschenswert ist.Daher werden wir im nachsten Satz einige der Eigenschaften von Orthonormalbasenfesthalten.

Satz 6.4 (Eigenschaften von Orthonormalbasen)Seien H ein Prahilbertraum uber K ∈ {R,C} und u1, . . . , un eine Orthonormalbasisvon H.

(a) Fur jedes x ∈ H gilt x =∑n

i=1〈x|ui〉ui.

(b) Fur alle x, y ∈ H gilt die sogenannte Parseval Identitat

〈x|y〉 =n∑

i=1

〈x|ui〉〈y|ui〉.

(c) Fur jedes x ∈ H gilt die sogenante Besselsche Identitat

||x||2 =n∑

i=1

|〈x|ui〉|2.

(d) Eine Folge (xk)k∈N ist in H genau dann gegen ein x ∈ H konvergent, wenn furjedes 1 ≤ i ≤ n die Folge (〈xk|ui〉)k∈N gegen 〈x|ui〉 konvergiert.

Beweis: (a) Da u1, . . . , un eine Basis von H ist, existieren λ1, . . . , λn ∈ K mit x =∑ni=1 λiui. Fur jedes 1 ≤ i ≤ n folgt

〈x|ui〉 =n∑

j=1

λj〈uj|ui〉 = λi,

also ist x =∑n

i=1 λiui =∑n

i=1〈x|ui〉ui.(b) Mit (a) ergibt sich

〈x|y〉 =

⟨ n∑i=1

〈x|ui〉ui

∣∣∣∣ n∑j=1

〈y|uj〉uj

⟩=

∑1≤i,j≤n

〈x|ui〉〈y|uj〉〈ui|uj〉 =n∑

i=1

〈x|ui〉〈y|ui〉.

(c) Mit (c) folgt

||x||2 = 〈x|x〉 =n∑

i=1

〈x|ui〉〈x|ui〉 =n∑

i=1

|〈x|ui〉|2.

213

Page 214: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 22.6.2011

(d) ”=⇒” Sei 1 ≤ i ≤ n. Fur jedes k ∈ N gilt dann nach (c)

|〈xk|ui〉 − 〈x|ui〉| = |〈xk − x|ui〉| ≤ ||xk − x||2 −→ 0,

und somit ist (〈xk|ui〉)k∈N −→ 〈x|ui〉.”⇐=” Wieder nach (c) ist fur jedes k ∈ N

||xk − x||2 =

√√√√ n∑i=1

|〈xk − x|ui〉|2 =

√√√√ n∑i=1

|〈xk|ui〉 − 〈x|ui〉|2,

also ist auch

limn→∞

||xk − x||2 =

√√√√ n∑i=1

∣∣∣ limk→∞

(〈xk|ui〉 − 〈x|ui〉)∣∣∣2 = 0,

und dies zeigt (xk)k∈N −→ x in H.

Damit konnen wir jetzt auch leicht die schon angekundigte Tatsache beweisen, dasendlich erzeugte Prahilbertraume immer vollstandig sind.

Korollar 6.5: Jeder endlich erzeugte Prahilbertraum ist vollstandig und besitzt eineOrthonormalbasis.

Beweis: Sei H ein endlich erzeugter Prahilbertraum uber K ∈ {R,C}. Dann wissen wirbereits das H eine Orthonormalbasis u1, . . . , un besitzt. Sei (xk)k∈N eine Cauchyfolgein H. Ist 1 ≤ i ≤ n, so gilt fur alle k, l ∈ N nach Lemma 4.(c) stets

|〈xk|ui〉 − 〈xl|ui〉| = |〈xk − xl|ui〉| ≤ ||xk − xl||2,

d.h. auch (〈xk|ui〉)k∈N ist eine Cauchyfolge in K. Nach I.§6.Satz 14 existiert in K derGrenzwert λi := limk→∞〈xk|ui〉. Setzen wir x :=

∑ni=1 λiui ∈ H, so ist nach Lemma

4.(a) auch 〈x|ui〉 = λi fur jedes 1 ≤ i ≤ n, und nach Lemma 4.(d) konvergiert dieFolge (xk)k∈N in H gegen x. Damit ist jede Cauchyfolge in H konvergent und H istvollstandig.

Seien H ein Prahilbertraum und U ein endlich erzeugter Untervektorraum mit Or-thonormalbasis u1, . . . , un. Fur jedes x ∈ U gilt dann x =

∑ni=1〈x|ui〉ui. Diese Summe

hat auch im Fall x /∈ U eine wichtige Bedeutung. Um diese zu sehen, sei x ∈ H undsetze y :=

∑ni=1〈x|ui〉ui ∈ U . Wir behaupten das dann 〈x − y|u〉 = 0 fur jedes u ∈ U

gilt. Dies ist klar, fur jedes 1 ≤ i ≤ n gilt nach Lemma 4.(a) 〈y|ui〉 = 〈x|ui〉, also〈x − y|ui〉 = 〈x|ui〉 − 〈y|ui〉 = 0, und ist u ∈ U beliebig, so existieren λ1, . . . , λn ∈ Kmit u =

∑ni=1 λiui, also 〈x− y|u〉 =

∑ni=1 λi〈x− y|ui〉 = 0. Wir sagen hierzu auch das

der Vektor x− y ∈ H senkrecht auf dem Teilraum U steht.

214

Page 215: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 22.6.2011

Definition 6.6: Seien H ein Prahilbertraum und U ≤ H ein Untervektorraum. EinVektor v ∈ H heißt senkrecht auf U , geschrieben als v ⊥ U , wenn v auf jedem Vektoru ∈ U senkrecht steht, wenn also 〈v|u〉 = 0 fur jedes u ∈ U gilt.

Sei H wieder ein Prahilbertraum und sei U ≤ H ein Untervektorraum. Seien x ∈ Hund y ∈ U ein Vektor mit x−y ⊥ U . Man sagt dann auch das y der Lotfußpunkt von xauf U ist. Dieser ist zugleich der eindeutig bestimmte Punkt auf U dessen Abstand zu xminimal ist. Um dies einzusehen, verwenden wir den sogenannten Satz des Pythagorasin H

∀(u, v ∈ H) : u ⊥ v =⇒ ||u+ v||22 = ||u||22 + ||v||22.

Dies ist leicht zu sehen

||u+ v||22 = 〈u+ v|u+ v〉 = ||u||22 + 2 Re(〈u|v〉) + ||v||22 = ||u||22 + ||v||22.

Ist jetzt y 6= u ∈ U , so gelten auch 0 6= y − u ∈ U und somit x− y ⊥ y − u also liefertder Satz des Pythagoras

||x− u||22 = ||x− y + y − u||22 = ||x− y||22 + ||y − u||22 > ||x− y||22

und somit ist auch ||x− u||2 > ||x− y||2. Damit ist der Lotfußpunkt y tatsachlich dereindeutige Punkt von U dessen Abstand zu x minimal ist. Mit diesen Beobachtungenergibt sich der folgende Satz.

Satz 6.6 (Orthogonalprojektionen)Seien H ein Prahilbertraum und U ein endlich erzeugter Untervektorraum mit Ortho-normalbasis u1, . . . , un. Dann ist

P : H → U ;x 7→n∑

i=1

〈x|ui〉ui

eine von der speziell gewahlten Orthonormalbasis unabhangige, stetige, lineare Abbil-dung, genannt die Orthogonalprojektion auf U . Fur jedes x ∈ H ist Px ∈ U dereindeutige Vektor mit x− Px ⊥ U und auch der eindeutige Vektor mit

||x− Px||2 = min{||x− y||2|y ∈ U}.

Weiter gilt fur jedes x ∈ H die Bessel-Ungleichung

n∑i=1

|〈x|ui〉|2 ≤ ||x||22

und genau dann ist∑n

i=1 |〈x|ui〉|2 = ||x||22 wenn x ∈ U ist.

Beweis: Sei x ∈ H. Wir haben bereits eingesehen, dass x−Px ⊥ U gilt und das ||x−Px||2 < ||x− y||2 fur jedes y ∈ U\{Px} gilt. Insbesondere erfullt Px die angegebenenBedingungen. Ist umgekehrt y ∈ U mit ||x − y||2 ≤ ||x − u||2 fur jedes u ∈ U , so ist

215

Page 216: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 22.6.2011

insbesondere ||x− y||2 ≤ ||x− Px||2, also y = Px. Ist y ∈ U mit x− y ⊥ U , so habenwir oben auch ||x− y||2 ≤ ||x− u||2 fur jedes u ∈ U eingesehen, und damit ist wiedery = Px. Insbesondere ist Px von der speziell gewahlten Orthonormalbasis u1, . . . , un

unabhangig.

Sei wieder x ∈ H. Wegen x − Px ⊥ U gilt fur jedes 1 ≤ i ≤ n stets x − Px ⊥ ui

und damit auch

〈x|ui〉 = 〈x− Px|ui〉+ 〈Px|ui〉 = 〈Px|ui〉.

Wegen x− Px ⊥ Px folgt mit dem Satz des Pythagoras und Lemma 4.(a,c)

n∑i=1

|〈x|ui〉|2 =n∑

i=1

|〈Px|ui〉|2 = ||Px||22 ≤ ||Px||22 + ||x− Px||22 = ||x||22,

es gilt also die Besselsche Ungleichung. Dabei liegt genau dann Gleichheit vor wenn||x − Px||2 = 0 gilt, wenn also x = Px ist. Gilt also die Gleichheit in der BesselschenUngleichung, so ist x = Px ∈ U und ist umgekehrt x ∈ U , so gilt die Gleichheit inder Besselschen Ungleichung nach Lemma 4.(c). Die Abbildung P ist offenbar linearund weiter zeigt die obige Ungleichung auch ||Px||2 ≤ ||x||2 fur jedes x ∈ H, d.h.P : H → U ist nach §4.Lemma 15 stetig.

Wir wollen zwei Beispiele zu den Orthogonalprojektionen rechnen. Wir setzen

v1 :=

1

−121

, v2 :=

11

−11

und x :=

0110

und betrachten den zweidimensionalen Untervektorraum U = 〈v1, v2〉 des R4. Wir wol-len den Lotfußpunkt von x auf U und den Abstand von x zur Ebene U berechnen.Hierzu bestimmen wir zunachst uber die Gram-Schmdit Orthonormalisierung eine Or-thonormalbasis u1, u2 von U . Es sind w1 = v1, ||w1|| =

√7, 〈v2|w1〉 = −1 und somit

w2 = v2 +1

7w1 =

1

7

8

−8−5

8

mit ||w2|| =1

7

√217,

und wir erhalten die Orthonormalbasis

u1 =1√7

1

−121

, u2 =1√217

8

−8−5

8

216

Page 217: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 22.6.2011

von U . Die Projektion Px von x auf U wird zu

〈x|u1〉 =1√7, 〈x|u2〉 = − 13√

217also Px =

1√7u1 −

13√217

u2 =1

217

−73

73127−73

.

Um jetzt den Abstand von x zur Ebene U zu berechnen, bilde

x− Px =1

217

73

1449073

,

und wir erhalten

min{||x− y|| : y ∈ U} = ||x− Px|| = 1

217

√39494.

Wir wollen nun eine weitere kleine Anwendung der Orthogonalprojektionen vorrechnen,die Berechnung der sogenannten Ausgleichsgerade. Hierbei handelt es sich um dasfolgende Problem. Es seien n Punkte

(x1, y1), . . . , (xn, yn)

in der Ebene gegeben. Meist denkt man sich diese Punkte als Meßergebnisse, d.h. dieMessung mit xi als Eingabewert hat yi als Ausgabewert. Gesucht ist eine lineare Funk-tion y = f(x) = ax+b, die diese Messungen moglichst gut annahert. Zur Interpretationvon

”moglichst gut“ gibt es dabei viele verschiedene Moglichkeiten. Fur jedes 1 ≤ i ≤ n

ist der Fehler beim i-ten Punkt so etwas wie yi − (axi + b), und eine erste Idee ist esden Gesamtfehler durch Addition all dieser Einzelfehler zu bilden. Das ist aber lei-der nicht sinnvoll, denn auf diese Art konnen Fehler bei denen die Ausgleichsgeradeweit oberhalb des Meßwerts liegt durch Fehler bei denen sie weit unterhalb liegt wie-der ausgeglichen werden. Man konnte anstellen dessen die Betrage |yi − (axi + b)| furi = 1, . . . , n summieren. Das ware durchaus sinnvoll, ist aber nicht ganz das was furdie Berechnung der Ausgleichsgerade ublicherweise getan wird.

Anstelle der Betrage werden die Quadrate der Einzelfehler addiert. Der Vorteildieser Fehlerbildung ist das großere Fehler starker als kleinere registriert werden, washaufig erwunscht ist. Wir wollen also, dass der Fehler im quadratischen Mittel√√√√ n∑

i=1

(yi − (axi + b))2

moglichst klein wird.

217

Page 218: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 24.6.2011

–0.8

–0.6

–0.4

–0.2

0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2

x –1

–0.8

–0.6

–0.4

–0.2

00.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2

x

Die beiden obigen Beispiele von Ausgleichsgeraden sind zehn beziehungsweise zwanzigMeßpunkte, die als yi = xi/2− 1 plus eine zufallige Storung gewahlt wurden. Fur dieAusgleichgeraden ergab sich dabei a = 0.428, b = −0.8848 beziehungseise a = 0.477,b = −0.95. Wie berechnet man die optimalen a und b? Um dies zu sehen, fuhren wirdie Vektoren

x :=

x1...xn

, y :=

y1...yn

und j :=

1...1

ein. Mit dem Standard Skalarprodukt 〈v|w〉 := v ·w auf dem Rn wird der quadratischeFehler zu (

n∑i=1

(yi − axi − b)2

)1/2

= ||y − ax− bj|| = ||y − (ax+ bj)||,

gesucht sind also a, b ∈ R fur die ||y− (ax+ bj)|| minimal wird. In anderen Worten sollax+ bj der dem Punkt y ∈ Rn nachstgelegene Punkt der Ebene U := 〈x, j〉 sein, d.h.

PUy = ax+ bj

soll die Orthogonalprojektion von y auf U sein. Wie dies zu einer expliziten Formelfur die Koeffizienten a, b der Ausgleichsgeraden fuhrt, werden wir uns in der nachstenVorlesung uberlegen.

Vorlesung 19, Freitag 24.6.2011

218

Page 219: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 24.6.2011

Wir sind gerade mit der Diskussion der sogenannten Ausgleichsgerade zu gegebenenMeßwerten (x1, y1), . . . , (xn, yn) beschaftigt. Diese Ausgleichsgerade sollte diejenige Ge-rade y = ax+ b sein, fur die der im quadratischen Mittel gebildete Gesamtfehler

σ :=

(n∑

i=1

(yi − (axi + b))2

)1/2

minimal wird. Durch Einfuhrung der drei n-dimensionalen Vektoren

x :=

x1...xn

, y :=

y1...yn

und j :=

1...1

konnten wir den Fehler als Norm

σ = ||y − (ax+ bj)||

schreiben. Setzen wir dabei voraus, dass nicht alle der x1, . . . , xn gleich sind, was keinewesentliche Einschrankung ist, so sind x und j linear unabhangig und U := 〈x, j〉ist eine Ebene im Rn. Die Punkte der Form ax + bj mit a, b ∈ R sind dann genaudie Punkte der Ebene U , wir konnen die geforderte Minimalitat des Fehlers σ also sointerpretieren, das u = ax+ bj derjenige Punkt auf U ist der minimalen Abstand zumPunkt y ∈ Rn hat. In anderen Worten soll also ax + bj die Orthogonalprojektion vony auf die Ebene U sein.

Da die konkreten Formeln nichts mit dem Rn zu tun haben, wollen wir jetzt ganzallgemein die Orthogonalprojektion auf eine Ebene in einem Prahilbertraum H berech-nen. Seien also U = 〈v1, v2〉 eine Ebene und x ∈ H. Wir wissen bereits wie sich dieOrthogonalprojektion berechnen laßt, ist u1, u2 eine Orthonormalbasis von U , so wirddie Orthogonalprojektion zu PUx = 〈x|u1〉u1 +〈x|u2〉u2. Wir brauchen also eine Ortho-normalbasis von U , und hierzu benutzen wir die Gram Schmidt Orthonormalisierung

w1 := v1, w2 := v2 −〈v1|v2〉||v1||2

v1 =1

||v1||2(||v1||2v2 − 〈v1|v2〉v1).

Dabei gilt

||w2||2 =1

||v1||4(||v1||4||v2||2− 2||v1||2〈v1|v2〉2 + 〈v1|v2〉2||v1||2) =

||v1||2||v2||2 − 〈v1|v2〉2

||v1||2.

219

Page 220: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 24.6.2011

Mit der Orthogonalbasis ui = wi/||wi|| (i = 1, 2) ist also

PU(x) = 〈u1|x〉u1 + 〈u2|x〉u2 =〈w1|x〉||w1||2

w1 +〈w2|x〉||w2||2

w2

=〈v1|x〉||v1||2

v1 +〈v2 − 〈v1|v2〉

||v1||2 v1|x〉||w2||2

(v2 −

〈v1|v2〉||v1||2

v1

)=〈v1|x〉||v1||2

v1 +||v1||2〈v2|x〉 − 〈v1|v2〉〈v1|x〉

||v1||2· ||v1||2

||v1||2||v2||2 − 〈v1|v2〉2

(v2 −

〈v1|v2〉||v1||2

v1

)=〈v1|x〉||v1||2||v2||2 − 〈v1|x〉〈v1|v2〉2 − ||v1||2〈v2|x〉〈v1|v2〉+ 〈v1|v2〉2〈v1|x〉

||v1||2(||v1||2||v2||2 − 〈v1|v2〉2)v1

+||v1||2〈v2|x〉 − 〈v1|v2〉〈v1|x〉||v1||2||v2||2 − 〈v1|v2〉2

v2 = av1 + bv2

mit

a :=〈v1|x〉||v2||2 − 〈v2|x〉〈v1|v2〉||v1||2||v2||2 − 〈v1|v2〉2

, b :=〈v2|x〉||v1||2 − 〈v1|x〉〈v1|v2〉||v1||2||v2||2 − 〈v1|v2〉2

.

Fur die Ausgleichsgerade mussen wir v1 = x, v2 = j und y fur x einsetzen, und erhalten

a =n (∑n

i=1 xiyi)− (∑n

i=1 xi) (∑n

i=1 yi)

n (∑n

i=1 x2i )− (

∑ni=1 xi)

2 ,

b =(∑n

i=1 x2i ) (∑n

i=1 yi)− (∑n

i=1 xi) (∑n

i=1 xiyi)

n (∑n

i=1 x2i )− (

∑ni=1 xi)

2 .

Dies ist die Formel fur die Ausgleichsgerade. Diese Formel ist zwar schon recht kom-pliziert, aber geometrisch gesehen wird hier einfach nur ein Lotfußpunkt bestimmt.

6.2 Symmetrische und hermitesche Matrizen

Wir kommen jetzt zu den symmetrischen Matrizen uber R beziehungsweise den hermi-teschen Matrizen uber C zuruck. Wir hatten bereits gesehen, dass diese bezuglich desjeweiligen Skalarprodukts im Rn beziehungsweise Cn die Gleichung 〈Ax|y〉 = 〈x|Ay〉fur alle Vektoren x, y erfullen. Dabei verwenden wir jetzt die im vorigen Abschnitteingefuhrte Schreibweise fur das Skalarprodukt. Im folgenden Satz werden wir die we-sentlichen Eigenschaften derartiger Matrizen herleiten. Beachte dabei das wir den kom-plexen Fall als den allgemeinen Fall auffassen konnen, eine reelle, symmetrische Matrixist als komplexe Matrix hermitesch.

Satz 6.7 (Hauptsatz uber symmetrische und hermitesche Matrizen)Seien K = R und A eine symmetrische n× n-Matrix uber R oder K = C und A einehermitesche n× n-Matrix uber C. Dann gelten:

(a) Die Matrix A ist diagonalisierbar und hat nur reelle Eigenwerte.

220

Page 221: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 24.6.2011

(b) Sind λ, µ zwei verschiedene Eigenwerte von A und u ∈ Eλ(A), v ∈ Eµ(A) zu-gehorige Eigenvektoren, so ist 〈u|v〉 = 0.

(c) Es gibt eine aus Eigenvektoren von A bestehende Orthonormalbasis des Kn.

Beweis: Sei λ ∈ C ein Eigenwert von A. Dann gibt es einen Vektor u ∈ Cn mit Au = λuund u 6= 0. Da die Matrix A in beiden Fallen hermitesch ist, folgt

λ||u||2 = λ〈u|u〉 = 〈λu|u〉 = 〈Au|u〉 = 〈u|Au〉 = 〈u|λu〉 = λ||u||2,

also λ = λ und somit λ ∈ R. Damit sind alle Eigenwerte von A reell und insbesonderezerfallt das charakteristische Polynom χA uber K in Linearfaktoren. Sind λ, µ ∈ R zweiverschiedene Eigenwerte von A mit zugehorigen Eigenvektoren u, v, so rechnen wir

λ〈u|v〉 = 〈λu|v〉 = 〈Au|v〉 = 〈u|Av〉 = 〈u|µv〉 = µ〈u|v〉

also (λ− µ)〈u|v〉 = 0 und wegen λ 6= µ folgt 〈u|v〉 = 0.Nun zeigen wir, dass die Matrix A uberK diagonalisierbar ist, und hierzu wollen wir

§5.Lemma 9 verwenden. Sei also λ ∈ R ein Eigenwert von A. Dann ist auch (A−λ)∗ =A∗ − λ = A− λ, d.h. auch A− λ ist im Fall K = R symmetrisch und im Fall K = Chermitesch. Sei u ∈ Kern(A− λ)2, also (A− λ)2u = 0. Dann haben wir auch

||(A− λ)u||2 = 〈(A− λ)u|(A− λ)u〉 = 〈u|(A− λ)2u〉 = 0,

also ist (A−λ)u = 0 und somit u ∈ Kern(A−λ). Dies zeigt Kern(A−λ)2 ⊆ Kern(A−λ).Nach §5.Lemma 9 ist A diagonalisierbar, es gibt also eine aus Eigenvektoren von Abestehende Basis des Kn. Bezeichnet λ1, . . . , λr die verschiedenen Eigenwerte von Aund ist ni fur jedes 1 ≤ i ≤ r die geometrische Vielfachheit von λi, so gibt es also eineBasis

v11, . . . , v1,n1 , . . . , vr1, . . . , vr,nr

des Kn so, dass vij ∈ Eλi(A) fur 1 ≤ i ≤ r, 1 ≤ j ≤ ni gilt. Ist 1 ≤ i ≤ r, so

ist vi1, . . . , vi,nieine Basis des Eigenraums Eλi

(A) und durch Gram-Schmidt Ortho-normalisierung erhalten wir eine Orthonormalbasis ui1, . . . , ui,ni

von Eλi(A). Damit ist

auchu11, . . . , u1,n1 , . . . , ur1, . . . , ur,nr

eine aus Eigenvektoren bestehende Basis des Kn mit ||uij|| = 1 fur alle 1 ≤ i ≤ r,1 ≤ j ≤ ni. Wir behaupten das es sich sogar um eine Orthonormalbasis des Kn

handelt. Ist 1 ≤ i ≤ r und sind 1 ≤ k, l ≤ ni mit k 6= l, so ist 〈uik|uil〉 = 0, und sind1 ≤ i, j ≤ r mit i 6= j, 1 ≤ k ≤ ni, 1 ≤ l ≤ nj so ist wegen λi 6= λj, uik ∈ Eλi

(A),ujl ∈ Eλj

(A) ebenfalls 〈uik|ujl〉 = 0.

Es gibt nicht nur eine aus Eigenvektoren bestehende Orthonormalbasis des Kn, wirkonnen auch eine berechnen. Die Berechnung einer solchen Orthonormalbasis des Kn

221

Page 222: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 24.6.2011

ist mit uns schon bekannten Rechenverfahren einfach moglich. Die Rechnung lauft inden folgenden Schritten ab:

Gegeben: Eine symmetrische oder hermitesche n× n Matrix A.

Gesucht: Eine aus Eigenvektoren von A bestehende Orthonormalbasis des Kn.

Verfahren: Die Rechnung lauft in den folgenden Schritten ab:

1. Berechne die Eigenwerte λ1, . . . , λs von A. Diese sind alle reell.

2. Fur jeden Eigenwert λ = λi (1 ≤ i ≤ s) lose das homogene lineare Gleichungs-system (λ−A)x = 0 und bestimme eine Basis vi1, . . . , vini

seines Losungsraums.Anders gesagt soll eine Basis des Eigenraums Eλ(A) berechnet werden. Dies kannman beispielsweise wie ublich durch Gauß Elimination tun.

3. Wende auf jede der in Schritt (2) gefundenen Basen vi1, . . . , vini(1 ≤ i ≤ n) der

jeweiligen Eigenraume das Gram Schmidtsche Orthonormalisierungsverfahren an,und erhalte eine Orthonormalbasis ui1, . . . , uini

des Eigenraums Eλi(A).

4. Setze die in Schritt (3) fur λ = λi, i = 1, . . . , s gefundenen Basen zu einerOrthonormalbasis

u11, . . . , u1n1 , . . . , us1, . . . , usrs

des Kn zusammen. Dies ist die gesuchte Orthonormalbasis u1, . . . , un.

Da dieses Verfahren sich nur aus uns schon bekannten Einzelschritten zusammensetzt,wollen wir hier nur ein Beispiel rechnen, namlich die symmetrische Matrix

A =

9 −1 −1 1

−1 9 1 −1−1 1 9 −1

1 −1 −1 9

.

Wir suchen eine aus Eigenvektoren von A bestehende Orthonormalbasis des R4. ZurBestimmung der Eigenwerte berechnen wir das charakteristische Polynom

χA(x) =

∣∣∣∣∣∣∣∣x− 9 1 1 −1

1 x− 9 −1 11 −1 x− 9 1−1 1 1 x− 9

∣∣∣∣∣∣∣∣222

Page 223: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 24.6.2011

=

∣∣∣∣∣∣∣∣x− 9 1 1 −1

0 x− 8 0 x− 80 0 x− 8 x− 8−1 1 1 x− 9

∣∣∣∣∣∣∣∣ =

∣∣∣∣∣∣∣∣x− 9 x− 8 x− 8 −1

0 x− 8 0 x− 80 0 x− 8 x− 8−1 0 0 x− 9

∣∣∣∣∣∣∣∣= (x− 8)2

∣∣∣∣∣∣∣∣x− 9 x− 8 x− 8 −1

0 1 0 10 0 1 1−1 0 0 x− 9

∣∣∣∣∣∣∣∣ = (x− 8)2

∣∣∣∣∣∣∣∣x− 9 x− 8 x− 8 15− 2x

0 1 0 00 0 1 0−1 0 0 x− 9

∣∣∣∣∣∣∣∣= (x− 8)2

(x− 9)

∣∣∣∣∣∣1 0 00 1 00 0 x− 9

∣∣∣∣∣∣+∣∣∣∣∣∣x− 8 x− 8 15− 2x

1 0 00 1 0

∣∣∣∣∣∣

= (x− 8)2

((x− 9)2 −

∣∣∣∣ x− 8 15− 2x1 0

∣∣∣∣) = (x− 8)2((x− 9)2 + 15− 2x)

= (x− 8)2(x2 − 20x+ 96) = (x− 8)3(x− 12).

Wir haben also zwei Eigenwerte λ1 = 8 und λ2 = 12. Beginnen wir mit λ = 12. DieGauß Elimination lauft dann als

3 1 1 −11 3 −1 11 −1 3 1

−1 1 1 3

−1 1 1 31 3 −1 11 −1 3 13 1 1 −1

−1 1 1 30 4 0 40 0 4 40 4 4 8

−1 1 1 30 4 0 40 0 4 40 0 4 4

Die Losungsmenge ist also gegeben durch

u = −v, y = −v, x = y + u+ 3v = v

und somit

E12(A) =

⟨1

−1−1

1

⟩.

Zur Orthonormalisierung muss dieser Basisvektor nur normiert werden, also

u4 :=

12

−12

−1212

.

Dass wir nur einen Eigenvektor zu normieren haben, ist glucklicherweise der Normalfall,wir bereits mehrfach erwahnt hat eine zufallig gewahlte Matrix in der Regel lauterverschiedene Eigenwerte, die damit alle einen eindimensionalen Eigenraum haben. Furλ = 8 ergibt sich fur den Eigenraum dagegen

−1 1 1 −11 −1 −1 11 −1 −1 1

−1 1 1 −1

−→ −1 1 1 − 1 =⇒ x = y + u− v.

223

Page 224: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 24.6.2011

Eine Basis des Eigenraums E8(A) ist gegeben durch

v1 =

1100

, v2 =

1010

, v3 =

−1

001

.

Hier sind wir also im untypischen Fall und mussen noch etwas weiter rechnen. Auf dieVektoren v1, v2, v3 mussen wir nun die Gram Schmidt Orthonormalisierung anwenden.Diesmal suchen wir dabei keine Orthonormalbasis des gesamten R4 sondern nur eineOrthormalbasis des von v1, v2, v3 aufgespannten Teilraums. Wir rechnen

w1 := v1 =

1100

, w1 · w1 = 2, w2 = v2 −1

2w1 =

12

−12

10

, w2 · w2 =3

2,

w3 = v3 +1

2w1 +

1

3w2 =

−1

31313

1

, w3 · w3 =4

3

und normieren

u1 =

1√2

1√2

00

, u2 =

√2√3w2 =

1√6

− 1√6

2√6

0

, u3 =

√3

2w3 =

− 1

2√

31

2√

31

2√

33

2√

3

.

Damit haben wir die gesuchte Orthonormalbasis des R4 berechnet.Wir wollen den Satz 7 noch ein klein wenig umformulieren und ihn in Termen von

Matrizen angeben. Hierzu benotigen wir einen weiteren kleinen Begriff.

Definition 6.7 (Orthogonale und unitare Matrizen)Sei n ∈ N mit n ≥ 1. Eine reelle n×n-Matrix A heißt orthogonal wenn AAt = AtA = 1gilt, d.h. wenn A invertierbar mit A−1 = At ist. Eine komplexe n × n-Matrix A heißtunitar wenn AA∗ = A∗A = 1 ist, d.h. wenn A invertierbar mit A−1 = A∗ ist.

Eine reelle n× n-Matrix A ist offenbar genau dann orthogonal wenn sie als komplexeMatrix unitar ist, in diesem Sinne sind unitare Matrizen der allgemeine Fall. NachI.§10.Korollar 11 ist eine Matrix A ∈ Rn×n auch genau dann orthogonal wenn AAt = 1oder AtA = 1 gilt, denn dann ist A bereits invertierbar und durch Multiplikation mitA−1 von links oder rechts folgt A−1 = At. Entsprechend ist eine komplexe MatrixA ∈ Cn×n bereits unitar wenn AA∗ = 1 oder A∗A = 1 gilt. Beachte weiter das Agenau dann orthogonal beziehungsweise unitar ist wenn die transponierte Matrix At

dies ist. Im reellen Fall K = R ist dies trivial. Im komplexen Fall beachte (At)∗ = A,

224

Page 225: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 24.6.2011

also (At)∗At = AAt = AA∗ und analog At(At)∗ = A∗A, also ist genau dann (At)∗At =At(At)∗ = 1 wenn AA∗ = A∗A = 1 ist, wenn also A unitar ist. Wir stellen jetztden Zusammenhang zwischen orthogonalen beziehungsweise unitaren Matrizen undOrthonormalbasen her.

Lemma 6.8 (Charakterisierung orthogonaler und unitarer Matrizen)Seien K ∈ {R,C}, n ∈ N mit n ≥ 1 und A ∈ Kn×n. Dann sind die folgenden Aussagenaquivalent:

(a) Es ist K = R und A ist orthogonal oder K = C und A ist unitar.

(b) Fur alle x, y ∈ Kn gilt 〈Ax|Ay〉 = 〈x|y〉.

(c) Die Spalten von A bilden eine Orthonormalbasis des Kn.

(d) Die Zeilen von A bilden eine Orthonormalbasis des Kn.

Beweis: (a)=⇒(b). Es reicht den Fall K = C zu behandeln, die reellen Matrizen sinddann ein Spezialfall. Seien also x, y ∈ Cn. Dann gilt

〈Ax|Ay〉 = (Ax)tAy = xtAtAy = xtA∗Ay = xty = 〈x|y〉.

(b)=⇒(c). Bezeichne u1, . . . , un die Spalten von A, d.h. fur 1 ≤ i ≤ n ist ui = Aei

wenn e1, . . . , en wie immer die Standardbasis des Kn ist. Fur 1 ≤ i, j ≤ n mit i 6= jgilt dann

〈ui|uj〉 = 〈Aei|Aej〉 = 〈ei|ej〉 = 0

und fur 1 ≤ i ≤ n ist auch

||ui||2 =√〈ui|ui〉 =

√〈Aei|Aei〉 =

√〈ei|ei〉 = 1.

Damit ist u1, . . . , un eine Orthonormalbasis des Kn.(c)=⇒(a). Seien wieder u1, . . . , un die Spalten von A = (aij)1≤i,j≤n. Fur 1 ≤ i, j ≤ nist dann

(A∗A)ij =n∑

k=1

akiakj = utjui = 〈uj|ui〉 = δij,

also ist A∗A = 1. Wie bereits bemerkt, folgt hieraus das A im reellen Fall orthogonalund im komplexen Fall unitar ist.(a)⇐⇒(d). Die Zeilen von A sind die Spalten von At, also sind die Zeilen von A genaudann eine Orthonormalbasis des Kn wenn At orthogonal beziehungsweise unitar ist,und wie schon angemerkt ist dies genau dann der Fall wenn A orthogonal beziehungs-weise unitar ist.

Ist also u1, . . . , un eine Orthonormalbasis des Kn, so ist die TransformationsmatrixS von der Basis u1, . . . , un zur Standardbasis des Kd, d.h. die Matrix deren Spalten

225

Page 226: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 24.6.2011

u1, . . . , un sind, im reellen Fall orthogonal und im komplexen Fall unitar. Damit istS−1 = S∗. Ist also weiter A eine n × n-Matrix uber K, so wird die ahnliche Matrixbezuglich der Basis u1, . . . , un zu S−1AS = S∗AS. Unser Satz 7 wird zu

Korollar 6.9: Seien K ∈ {R,C}, n ∈ N mit n ≥ 1 und A ∈ Kn×n symmetrisch imFall K = R und hermitesch im Fall K = C Dann existiert fur K = R eine orthogonaleMatrix S ∈ Rn×n und fur K = C eine unitare Matrix S ∈ Cn×n mit

StAS =

λ1

. . .

λn

fur K = R und S∗AS =

λ1

. . .

λn

fur K = C

wobei λ1, . . . , λn die mit Vielfachheit aufgezahlten Eigenwerte von A sind.

Beweis: Klar nach Satz 7.

Im unserem oben gerechneten Beispiel einer 4×4-Matrix ist S die orthogonale Matrix

S =1

6

3√

2√

6 −√

3 3

3√

2 −√

6√

3 −3

0 2√

6√

3 −3

0 0 3√

3 3

mit StAS =

8

88

12

.

6.3 Quadratische Funktionen und die Hauptachsentransfor-mation

Wir wollen die bisher vorgestellte Theorie nun zur Untersuchung quadratischer Funk-tionen in mehreren Variablen nutzen, also Funktionen wie beispielsweise

f(x, y) = x2 + y2 − xy − x− y + 1.

Allgemein ist eine quadratische Funktion in n Variablen eine Funktion der Form

f : Rn → R;x 7→∑

1≤i,j≤n

aijxixj +n∑

i=1

bixi + c

mit Konstanten aij, bi, c ∈ R (1 ≤ i, j ≤ n). Fur n = 2 sieht die allgemeine quadratischeFunktionen also ausgeschrieben wie folgt aus

a11x2 + a12xy + a21yx+ a22y

2 + b1x+ b2y + c.

226

Page 227: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 24.6.2011

10

20

30

40

–4–2

24 y

–4–224

x

Fur unsere obige Beispielfunktion konntenwir etwa a11 = a22 = c = 1, a12 = b1 = b2 = −1und a21 = 0 setzen. Da die definierende Sum-menformel etwas unhandlich ist, geht man nunzu einer Matrixbeschreibung der quadratischenFunktion f uber. Hierzu setzt man

A :=

a11 · · · a1n...

. . ....

an1 · · · ann

und b :=

b1...bn

und hat fur jedes x ∈ Rn

∑1≤i,j≤n

aijxixj =n∑

j=1

(n∑

i=1

aijxi

)xj

=n∑

j=1

(Atx)jxj = (Atx) · y

und∑n

i=1 bixi = b · x. Die quadratische Funk-tion f in n Variablen konnen wir damit in derkompakten Form

f(x) = (Atx) · x+ b · x+ c

schreiben. Fur 1 ≤ i, j ≤ n mit i 6= j taucht das Produkt xixj zweimal auf, einmal alsaijxixj und ein anderes Mal als ajixjxi = ajixixj. Diese beiden Summanden konnenwir zusammenfassen und als

aijxixj + ajixjxi = (aij + aji)xixj =aij + aji

2xixj +

aij + aji

2xjxi

schreiben. Diese neuen Koeffizienten (aij + aji)/2 sind symmetrisch in i und j. Damitkonnen wir immer erreichen, dass die Matrix A symmetrisch ist. In unserer Beispiel-funktion werden

A =

(1 −1

2

−12

1

)und b =

(−1−1

).

Die offizielle Definition einer quadratischen Funktion wird jetzt zu:

Definition 6.8: Sei n ∈ N. Eine quadratische Funktion in n Variablen ist eine Funktionder Form

f : Rn → R;x 7→ (Ax) · x+ b · x+ c

wobei A eine symmetrische n× n Matrix uber R ist, b ∈ Rn ein Vektor ist und c ∈ Reine reelle Zahl ist. Ist dabei b = 0 und c = 0, so nennt man f auch eine quadratischeForm.

227

Page 228: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 24.6.2011

Zum besseren Verstandnis von f ist es hilfreich sich die Niveaumengen

Mt := {x ∈ Rn|f(x) = t}

fur verschiedene Werte von t anzuschauen. Fur unsere Beispielfunktion f(x, y) = x2 +y2 − xy − x− y + 1 haben diese Mengen die Form

0.5

1

1.5

2

y

0.5 1 1.5 2

x

0.5

1

1.5

2

y

0.5 1 1.5 2

x

Niveaumengen Die Niveaumenge f(x, y) = 1

Wie Sie sehen sind die Niveaumengen hier allesamt Ellipsen. Fur die Niveaumenge M1

haben wir auch die beiden Hauptachsen der Ellipse eingezeichnet, d.h. die Achsen aufdenen die Ellipse minimalen oder maximalen Abstand von ihrem Schwerpunkt hat.Als Hauptachsentransformation bezeichnet man jetzt die Koordinatentransformationbei der der Nullpunkt des Koordinatensystems in den Schwerpunkt der Ellipse gelegtwird und die beiden Hauptachsen der Ellipse als Koordinatenachsen verwendet werden.Bezuglich eines Koordinatensystem mit Schwerpunkt im Nullpunkt bei dem die beidenHauptachsen die Koordinatenachsen sind, hat eine Ellipse mit den Halbradien a, b > 0die Form

a

bx2

a2+y2

b2= 1.

Wir suchen also ein Koordinatensystem in dem unsere Niveaumenge M1 diese Formannimmt. Insbesondere konnen wir dann auch die beiden Halbradien unserer Ellipse

228

Page 229: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 24.6.2011

berechnen. Es stellt sich heraus, dass man dann auch fur allgemeinere quadratischeFunktionen eine

”Hauptachsentransformation“ durchfuhren kann, dass das ganze also

im Allgemeinen mit Ellipsen eigentlich nichts zu tun hat.Kommen wir also zur allgemeinen Situation

f(x) = (Ax) · x+ b · x+ c

in n Variablen zuruck. Als erstes Ziel wollen wir den Nullpunkt unserer angestrebtenHauptachsentransformation finden. Wir untersuchen dazu erst einmal wie sich das Ver-schieben des Nullpunkts auf die quadratische Funktion auswirkt. Nehmen wir einmalan wir legen den Nullpunkt in den Punkt u ∈ Rn. Sei x ∈ Rn. Denken wir uns xbezuglich des neuen Koordinatenursprungs u, so sind die Koordinaten von x bezuglichdes alten Nullpunkts gleich x+ u. Setzen wir dies in die quadratische Funktion ein, sowird

f(x+ u) = (A(x+ u)) · (x+ u) + b · (x+ u) + c = (Ax+Au) · (x+ u) + b · (x+ u) + c

= (Ax) · x+ (Ax) · u+ (Au) · x+ (Au) · u+ b · x+ b · u+ c

= (Ax) · x+ (2Au+ b) · x+ c+ (Au) · u+ b · u.

Setzen wir also

b′ := 2Au+ b und c′ := c+ (Au) · u+ b · u = f(u),

so wird

f(x) := f(x+ u) = (Ax) · x+ b′ · x+ c′.

Wie mussen wir u wahlen damit f moglichst einfach wird? Hier gibt es zwei moglicheFalle, die wir gleich durchgehen werden.Fall 1. Es ist b ∈ BildA. Dann konnen wir ein u ∈ Rn mit

Au = −1

2b =⇒ b′ = 2Au+ b = 0

wahlen und haben den linearen Anteil eliminiert.Fall 2. Es ist b /∈ BildA. Dann zerlegen wir den Vektor b in eine Summe b = b1 + b2mit einem Teil b1 ∈ Bild(A) und einem Vektor b2 der senkrecht auf dem Bild von Asteht, d.h. b1 ist die Orthogonalprojektion von b auf das Bild von A. Wegen b /∈ BildAist b1 6= b, also b2 6= 0. In diesem Fall wahlen wir u ∈ Rn mit

Au = −1

2b1 =⇒ b′ = 2Au+ b = b2,

und wir haben den linearen Anteil senkrecht zum Bild von A gemacht. Weiter ver-einfachen konnen wir in diesem Fall leider nicht, zumindest nicht durch Wahl desKoordinatenursprungs.

229

Page 230: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 24.6.2011

Untersuchen wir einmal die Situation in unserem Beispiel f(x, y) = x2 + y2 − xy −x− y + 1. Hier ist die Matrix A invertierbar mit

A =

(1 −1

2

−12

1

)=⇒ A−1 =

4

3

(1 1

212

1

)und fur den Nullpunkt u erhalten wir

u = −1

2A−1b = −2

3

(1 1

212

1

)(−1−1

)=

(11

).

Der Vektor u ist also tatsachlich genau der Mittelpunkt unserer Ellipse, wie man imobigen Bild der Niveaumenge M1 tatsachlich sehen kann. Wegen f(u) = 0 wird damit

f(x) = (Ax) · x beziehungsweise f(x, y) = x2 + y2 − xy.

Bei der Transformation auf die Hauptachsen der Ellipse als Koordinatenachsen bleibtder Nullpunkt unverandert. Da der konstante Term keine Rolle spielt, mussen wir alsonur noch eine quadratische Form

f(x) = (Ax) · x

mit einer symmetrischen n × n Matrix A betrachten. Nach Korollar 9 existiert eineorthogonale n× n Matrix S mit

StAS =

λ1

. . .

λn

=: D

wobei λ1, . . . , λn die Eigenwerte von A sind. Diese Matrix existiert nicht nur, son-dern wir hatten auch gesehen wie man sie ausrechnen kann. Die Matrix S ist dieTransformationsmatrix von einer aus Eigenvektoren von A bestehenden Orthonormal-basis u1, . . . , un zur Standardbasis des Rn, d.h. die Matrix deren Spalten die Vektorenu1, . . . , un sind. Bezeichnet x Koordinaten bezuglich der Basis u1, . . . , un, so ist Sx derentsprechende Vektor in den Standardkoordinaten. In diesen transformierten Koordi-naten wird die quadratische Form also zu

f(x) := f(Sx) = (ASx) · (Sx) = (StASx) · x = (Dx) · x = λ1x21 + · · ·+ λnx

2n.

An dieser Formel sehen wir insbesondere das die geometrische Form der quadratischenFunktion von den Vorzeichen der Eigenwerte der Matrix A bestimmt wird. Nehmenwir einmal das zweidimensionale Beispiel f(x, y) = λ1x

2 + λ2y2.

230

Page 231: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 24.6.2011

–2

0

2x

–3 –2 –1 0 1 2 3

y

0

2

4

6

8

10

12

14

16

18

–3–2

–10

12

3

x

–3

–2

–1

0

1

2

3

y

–8

–6

–4

–2

0

2

4

6

8

λ1, λ2 > 0 λ1 · λ2 < 0

Sind beide Eigenwerte λ1, λ2 positiv, so haben wir bis auf Skalierungen der x- undy-Achse das Rotationparaboloid f(x, y) = x2 + y2. Sind λ1, λ2 beide negativ, so liegtanalog ein nach unten geoffnetes Rotationsparaboloid vor. Haben λ1 und λ2 verschiede-ne Vorzeichen, also λ1λ2 < 0, so hat unsere Funktion nach Umskalieren und eventuellenSpiegeln an der Diagonalen die Form von f(x, y) = x2 − y2, ist also eine Sattelflache.

Wir setzen jetzt das Beispiel der quadratischen Funktion f(x, y) = x2 + y2 − xy −x− y+1 fort. Wir hatten bereits gesehen, dass wir u = (1, 1) als Koordinatenursprung

nehmen sollten, und das dann f(x, y) = f(x + 1, y + 1) = x2 + y2 − xy ist. Nachunserer eben angestellten Uberlegung erfordert die Berechnung der Hauptachsen dieBestimmung einer aus Eigenvektoren von A bestehenden Orthonormalbasis des R2.Rechnen wir dies einmal fur unsere quadratische Form f(x, y) = x2 + y2 − xy durch.Das charakteristische Polynom wird zu

A =

(1 −1

2

−12

1

)=⇒ χA(x) = x2 − tr(A)x+ det(A) = x2 − 2x+

3

4

und die Eigenwerte sind damit

λ = 1±√

1− 3

4= 1± 1

2, also λ1 =

1

2und λ2 =

3

2.

Die Berechnung von Eigenvektoren liefert

fur λ =1

2

12−1

2

−12

12

=⇒ x = y und fur λ =3

2

−12−1

2

−12−1

2

=⇒ x = −y,

also

v1 =

(11

), v2 =

(−1

1

)und normiert u1 =

(12

√2

12

√2

), u2 =

(−1

2

√2

12

√2

).

231

Page 232: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 24.6.2011

Wir verwenden jetzt ein Koordinatensystem mit Ursprung in u = (1, 1) und den Ko-ordinatenachsen u1, u2, die wir eben ausgerechnet haben. Ist dann S die Transforma-tionsmatrix

S :=

(12

√2 −1

2

√2

12

√2 1

2

√2

),

so entspricht der Punkt x im neuen Koordinatensystem dem Punkt Sx + u im altenKoordinatensystem, und wir haben mit f(x) = f(Sx+ u) nun

f(x, y) = λ1x2 + λ2y

2 =1

2x2 +

3

2y2.

Damit haben wir die Hauptachsentransformation in diesem Beispiel durchgefuhrt. Ander obigen Formel kann man auch noch die Radien der beiden Hauptachsen unsererEllipse f(x, y) = 1 ablesen. Es ist ja

f(x, y) =x2

a2+y2

b2mit a :=

√2 und b :=

√2

3=

1

3

√6

der kleinere Radius der Ellipse ist also b =√

6/3 und der große ist a =√

2. Damithaben wir zum einen die Hauptachsentransformation fur die quadratische Funktionf(x, y) = x2 + y2 − xy − x − y + 1 durchgefuhrt und zum anderen die beiden Halb-radien der durch f(x, y) = 1 gegebenen Ellipse ausgerechnet. Letzterer geometrischerAspekt spielt fur uns keine große Rolle, das Entscheidende ist die Bestimmung des zurHauptachsentransformation verwendeten Koordinatensystems.

Wie schon gesehen, funktioniert unser Vorgehen in diesem Beispiel allgemein umjede quadratische Form auf die Gestalt f(x) = λ1x

21 + · · · + λnx

2n zu transformieren.

Damit ist der folgende Satz uber die Hauptachsentransformation im Fall b ∈ Bild(A)bereits bewiesen.

Satz 6.10 (Hauptachsentransformation quadratischer Funktionen)Seien A eine symmetrische n × n Matrix uber R, b ∈ Rn und c ∈ R. Seien λ1, . . . , λn

die mit Vielfachheit aufgezahlten Eigenwerte von A, wobei im Fall r := rang(A) < ndie Numerierung mit λ1, . . . , λr 6= 0 und λr+1 = · · · = λn = 0 erfolge. Dann existierenein Punkt u ∈ Rn und eine orthogonale n× n Matrix S so, dass entweder

f(Sx+ u) = λ1x21 + · · ·+ λnx

2n + f(u)

fur alle x ∈ Rn ist, oder es ist r < n und es existiert eine reelle Zahl µ > 0 mit

f(Sx+ u) = λ1x21 + · · ·+ λrx

2r + µxr+1 + f(u)

fur alle x ∈ Rn.

Der Beweis des Satzes ist noch nicht ganz vollstandig, uns fehlt noch die Behandlung desFall 2, also wenn b /∈ Bild(A) ist. Bevor wir auch diese Situation allgemein behandeln,

232

Page 233: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 24.6.2011

wollen wir erst einmal ein dreidimensionales Beispiel hierzu rechnen. Wir betrachtendie quadratische Funktion

f(x, y, z) = x2 + y2 + z2 −√

2xy +√

2yz + x+ y − 1

In der Vektordarstellung haben wir dann f(x) = (Ax) · x+ b · x+ c mit

A =

1 −12

√2 0

−12

√2 1 1

2

√2

0 12

√2 1

, b =

110

und c = −1.

Es stellt sich heraus, dass es genau wie im schon behandelten Fall 1 sinnvoll ist, zunachsteinmal die Eigenwerte von A zu berechnen. Das charakteristische Polynom ergibt sichals

χA(x) =

∣∣∣∣∣∣x− 1 1

2

√2 0

12

√2 x− 1 −1

2

√2

0 −12

√2 x− 1

∣∣∣∣∣∣= (x− 1)

∣∣∣∣ x− 1 −12

√2

−12

√2 x− 1

∣∣∣∣− 1

2

√2

∣∣∣∣ 12

√2 0

−12

√2 x− 1

∣∣∣∣= (x− 1)

(x2 − 2x+

1

2

)− 1

2(x− 1) = x(x− 1)(x− 2),

und wir haben die drei Eigenwerte λ1 = 1, λ2 = 2 und λ3 = 0. Als nachsten Schrittbestimmen wir eine aus Eigenvektoren von A bestehende Orthonormalbasis des R3.Hierzu suchen wir zunachst einmal Eigenvektoren fur die von Null verschiedenen Ei-genwerte. Fur λ1 = 1 ist die Rechnung

0 12

√2 0

12

√2 0 −1

2

√2

0 −12

√2 0

−→12

√2 0 −1

2

√2

0 12

√2 0

0 −12

√2 0

−→ 1 0 −10 1 0

also y = 0, x = z mit dem normierten Eigenvektor

u1 =

12

√2

012

√2

.

Fur λ2 = 2 haben wir

1 12

√2 0

12

√2 1 −1

2

√2

0 −12

√2 1

−→1 1

2

√2 0

0 12

−12

√2

0 −12

√2 1

−→1 1√

20

0 1 −√

2

233

Page 234: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 29.6.2011

also y =√

2z, x = −(√

2/2)y = −z mit dem normierten Eigenvektor

u2 =

−12

12

√2

12

.

Das Bild von A wird jetzt von den beiden Vektoren u1, u2 aufgespannt, und wir mussennun die Orthogonalprojektion des Vektors b auf dieses Bild berechnen, also

b · u1 =1

2

√2 und b · u2 =

1

2(√

2− 1),

und die Orthogonalprojektion b1 von b wird

b1 := (b · u1)u1 + (b · u2)u2 =1

2

√2u1 +

1

2(√

2− 1)u2 =

14(3−

√2)

14(2−

√2)

14(1 +

√2)

.

Die Zerlegung von b hat jetzt die Form

b = b1 + b2 mit b2 := b− b1 =

14(1 +

√2)√

24

(1 +√

2)

−14(1 +

√2)

.

Wegen b2 6= 0 zeigt diese Rechnung insbesondere das b /∈ Bild(A) ist, wir sind also imobigen Fall 2. An dieser Stelle kommen wir jetzt zum noch nicht behandelten Teil desSatz 10, und diesen wollen wir in der nachsten Sitzung behandeln.

Vorlesung 20, Mittwoch 29.6.2011

Wir sind gerade mit der Hauptachsentransformation quadratischer Funktionen f(x) =(Ax) ·x+b ·x+c beschaftigt. Im Fall einer quadratischen Form f(x) = (Ax) ·x konntenwir dabei eine orthognale Matrix S finden fur die StAS = D eine Diagonalmatrix ist,und bezuglich der durch die Spalten von S gebildeten Orthonormalbasis des Rn hattef die Form f(Sx) =

∑ni=1 λix

2i wobei λ1, . . . , λn die Eigenwerte von A sind. Ist auch

ein linearer Term vorhanden, so war die Situation etwas komplizierter. Es traten zweiverschiedene Falle auf, entweder ist b im Bild von A, und durch Wahl eines Nullpunkts umit Au = −b/2 konnten wir den linearen Term zum verschwinden bringen. Andernfallshatten wir b = b1 + b2 als Summe mit b1 ∈ Bild(A), b2 ⊥ Bild(A) geschrieben, unddurch Wahl eines Nullpunkts u mit Au = −b1/2 konnte der Vektor b durch b2 ersetztwerden. Konkret hatten wir mit den Rechnungen zum Beispiel

f(x, y, z) = x2 + y2 + z2 −√

2xy +√

2yz + x+ y − 1

234

Page 235: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 29.6.2011

begonnen. Die Matrix A hat die drei Eigenwerte λ1 = 1, λ2 = 2 und λ3 = 0. Alsnormierte Eigenvektoren zu den ersten beiden Eigenwerten hatten sich

u1 =

12

√2

012

√2

, u2 =

−12

12

√2

12

ergeben. Dann ist u1, u2 eine Orthonormalbasis des Bildes von A und wir konnten dieOrthogonalprojektion b1 von b auf das Bild sowie den Vektor b2 als

b1 = (b · u1)u1 + (b · u2)u2 =

14(3−

√2)

14(2−

√2)

14(1 +

√2)

und b2 = b− b1 =

14(1 +

√2)√

24

(1 +√

2)

−14(1 +

√2)

berechnen. Beachte das b 6= b1 insbesondere b /∈ Bild(A) bedeutet, wir sind also imobigen Fall 2. Im nachsten Schritt berechnen wir einen passenden Nullpunkt u undhierfur suchen wir einen Vektor u mit Au = −b1/2. Zur Bestimmung von u mussenwir erfreulicherweise kein lineares Gleichungssystem mehr losen, wir haben schon allenotigen Daten beisammen. Die Vektoren u1, u2 sind ja Eigenvektoren von A mit Au1 =λ1u1 und Au2 = λ2u2, d.h. wir haben auch

b1 = (b · u1)u1 + (b · u2)u2 =b · u1

λ1

(λ1u1) +b · u2

λ2

(λ2u2) =b · u1

λ1

Au1 +b · u2

λ2

Au2

= A ·(b · u1

λ1

u1 +b · u2

λ2

u2

).

Folglich konnen wir als Losung von Au = −b1/2 beispielsweise

u := −1

2

(b · u1

λ1

u1 +b · u2

λ2

u2

)= −1

2

(1

2

√2u1 +

1

4(√

2− 1)u2

)=

− 116

(5−√

2)

− 116

(2−√

2)

− 116

(3 +√

2)

verwenden. Mit u als Koordinatenursprung ist dann wegen

f(u) =1

32(2√

2− 39)

auch

f(x) = (Ax) · x+ b2 · x+1

32(2√

2− 39).

Jetzt kommen wir erst einmal nicht weiter, und mussen uns uberlegen wie man inder Situation des Fall 2 weitermacht. Da die Matrix A symmetrisch ist, haben wir furalle x ∈ Rn und alle y ∈ KernA stets (Ax) · y = x · (Ay) = 0, d.h. Bild und Kernvon A stehen senkrecht aufeinander. Dies konnen wir auch leicht in Satz 7 ablesen, istu1, . . . , un eine aus Eigenvektoren bestehende Orthonormalbasis, so ist das Bild gleichdem Erzeugnis der Eigenvektoren ui zu von Null verschiedenen Eigenwerten und der

235

Page 236: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 29.6.2011

Kern ist der Eigenraum zu λ = 0 also das Erzeugnis der restlichen ui. Haben wir alsof(x) = (Ax) · x+ b · x+ c mit b 6= 0 senkrecht auf dem Bild von A, so ist auch Ab = 0.In anderen Worten ist b ein Eigenvektor zum Eigenwert 0 von A. Es gibt nun wiedereine orthogonale Matrix S mit

D := StAS =

λ1

. . .

λn

,

wobei λ1, . . . , λn die Eigenwerte von A sind. Dabei numerieren wir die Eigenwer-te von A so durch, dass die ersten r := rangA Eigenwerte von Null verschiedensind λ1, . . . , λr 6= 0 wahrend die hinteren n − r Eigenwerte alle gleich Null sindλr+1 = · · · = λn = 0. Bei der Berechnung des zum Eigenwert 0 gehorenden Teilsder aus Eigenvektoren von A bestehenden Orthonormalbasis des Rn, hatten wir zu-erst eine Basis vr+1, . . . , vn dieses Eigenraums bestimmt, und auf diese dann das GramSchmidtsche Orthonormalisierungsverfahren angewandt. Wegen Ab = 0, b 6= 0 konnenwir die Basis dann mit vr+1 = b wahlen, und es wird ur+1 = vr+1/||vr+1|| = b/||b||.Damit ist b = µur+1 mit µ := ||b||. Es folgt

f(x) := f(Sx) = (ASx) · (Sx) + b · (Sx) + c = (StASx) · x+ (Stb) · x+ c

= (Dx) · x+ (Stb) · x+ c

fur alle x ∈ R. Dabei gilt Ser+1 = ur+1, also auch

Stb = µStur+1 = µS−1ur+1 = µer+1.

Insgesamt ist somit

f(x1, . . . , xn) = λ1x21 + · · ·+ λrx

2r + µxr+1 + c.

Damit haben wir auch endlich den zweiten Fall in Satz 10 begrundet. Wenden wir dieseinmal auf unser Beispiel an. Wir brauchen noch einen Eigenvektor zum Eigenwert 0,und hierfur konnen wir unseren schon berechneten Vektor b2 verwenden. Es ist

||b2||2 =1

16(12 + 8

√2) =

1

4(3 + 2

√2) =

1

4(1 +

√2)2 =⇒ µ := ||b2|| =

1

2(1 +

√2)

also wird

u3 =b2||b2||

=

12

12

√2

−12

und die endgultige orthogonale Matrix ist

S =

12

√2 −1

212

0 12

√2 1

2

√2

12

√2 1

2−1

2

.

236

Page 237: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 29.6.2011

Fur die transformierte Funktion f(x) = f(Sx+ u) ist damit

f(x, y, z) = x2 + 2y2 +1

2(1 +

√2)z +

1

32(2√

2− 39).

Das Verfahren zur Berechnung der Hauptachsentransformation lauft wie folgt ab:

Gegeben: Eine quadratische Funktion f(x) = (Ax)·x+b·x+cmit einer symmetrischenn× n Matrix A, einem Vektor b ∈ Rn und einer Zahl c ∈ R.

Gesucht: Ein Koordinatenursprung u ∈ Rn und eine Orthonormalbasis u1, . . . , un desRn so, dass die Formeln des Satz 10 gelten wenn S die orthogonale Matrix ist derenSpalten die Vektoren u1, . . . , un sind.

Verfahren: Die Rechnung lauft in den folgenden Schritten ab.

1. Berechne die Eigenwerte λ1, . . . , λn von A aufgezahlt entsprechend ihrer jewei-ligen Vielfachheit. Die Numerierung erfolge so, dass λ1, . . . , λr 6= 0 und λr+1 =. . . = λn = 0 ist, wobei r := rang(A) der Rang von A ist. Dabei muss r nicht extraausgerechnet werden, sondern ergibt sich durch Zahlen der Eigenwerte ungleichNull.

2. Berechne fur jeden der von Null verschiedenen Eigenwerte λ von A eine Ortho-normalbasis des Eigenraums Eλ(A). Dies geschieht wieder indem zuerst durchLosen des homogenen linearen Gleichungssystems (A− λ)x = 0 irgendeine Basisvon Eλ(A) berechnet wird, und dann auf diese die Gram Schmidt Orthonorma-lisierung angewandt wird.

3. Fasse die in Schritt (2) berechneten Orthonormalbasen zu einer Orthonormalbasisu1, . . . , ur des Bildes von A zusammen.

4. Berechne b∗ := (b · u1)u1 + · · ·+ (b · ur)ur und verwende

u := −1

2

(b · u1

λ1

u1 + · · ·+ b · ur

λr

ur

)als den Koordinatenursprung.

5. Ist r < n, so lose das homogene lineare Gleichungssystem Ax = 0 um eine Basisv1, . . . , vn−r des Kerns von A zu erhalten. Im Fall b 6= b∗ wahle die Basis mitv1 = b− b∗ und setze µ := ||b− b∗||. Weiter wende die Gram Schmidt Orthonor-malisierung auf v1, . . . , vn−r an, und bezeichne die erhaltene Orthonormalbasisdes Kerns von A mit ur+1, . . . , un.

6. Der Koordinatenursprung ist der in Schritt (4) berechnete Punkt u und die ausden Hauptachsen bestehende Orthonormalbasis entsteht durch Zusammensetzender in den Schritten (3) und (5) berechneten Teilbasen, also u1, . . . , un. Im Fallb = b∗ sind wir dann im ersten Fall von Satz 10 und fur b 6= b∗ sind wir im zweitenFall mit dem in (5) berechneten µ.

237

Page 238: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 29.6.2011

Den besonders wichtigen Spezialfall quadratischer Formen wollen wir noch gesondertfesthalten.

Korollar 6.11 (Hauptachsentransformation quadratischer Formen)Sei A eine reelle, symmetrische n×n-Matrix und bezeichne λ1, . . . , λn die mit Vielfach-heit aufgezahlten Eigenwerte von A. Sei f(x) := (Ax) ·x die zu A gehorige quadratischeForm. Dann existiert eine orthogonale n× n-Matrix S mit

f(Sx) = λ1x21 + · · ·+ λnx

2n

fur alle x ∈ Rn.

Beweis: In der Notation von Satz 10 sind b = 0 und c = 0. Dann sind wir in Fall 1und konnen u = 0 als Koordinatenursprung verwenden. Insbesondere ist f(u) = 0 undalles folgt aus Satz 10.

6.4 Definite Matrizen

Zu jeder symmetrischen Matrix A ∈ Rn×n gehort eine quadratische Form f(x) = (Ax) ·x, mit der wir uns im letzten Abschnitt ausgiebig beschaftigt haben. Man kann nochetwas weiter gehen und eine Art

”Skalarprodukt“ einfuhren, indem wir fur x, y ∈ Rn

einfach

〈x|y〉A := (Ax) · y

definieren. Die meisten Eigenschaften eines Skalarprodukts sind dann erfullt, fur allex, y, z ∈ Rn und alle λ ∈ R haben wir

〈x+ y|z〉A = (A(x+ y)) · z = (Ax+ Ay) · z = (Ax) · z + (Ay) · z = 〈x|z〉A + 〈y|z〉A〈x|y + z〉A = (Ax) · (y + z) = (Ax) · y + (Ax) · z = 〈x|y〉A + 〈x|z〉A,〈λx|y〉A = (A(λx)) · y = (λAx) · y = λ((Ax) · y) = λ〈x|y〉A,〈x|λy〉A = (Ax) · (λy) = λ((Ax) · y) = λ〈x|y〉A und

〈y|x〉A = (Ay) · x = y · (Ax) = (Ax) · y = 〈x|y〉A.

Wir nennen die Matrix A positiv definit wenn 〈 | 〉A tatsachlich ein Skalarproduktist, wenn also auch (Ax) · x > 0 fur alle 0 6= x ∈ Rn gilt. In anderen Worten soll diequadratische Form f die Bedingung f(x) > 0 fur alle 0 6= x ∈ Rn erfullen.

Ahnliche Uberlegungen kann man auch im komplexen Fall anstellen. Ist A ∈ Cn×n

eine hermitesche Matrix, so konnen wir genau wie im reellen Fall ein Skalarprodukt〈x|y〉A := (Ax) · y definieren, und dieses erfullt fur alle x, y, z ∈ Cn und alle λ ∈ C die

238

Page 239: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 29.6.2011

Gleichungen

〈x+ y|z〉A = (A(x+ y)) · z = (Ax+ Ay) · z = (Ax) · z + (Ay) · z = 〈x|z〉A + 〈y|z〉A〈x|y + z〉A = (Ax) · (y + z) = (Ax) · y + (Ax) · z = 〈x|y〉A + 〈x|z〉A,〈λx|y〉A = (A(λx)) · y = (λAx) · y = λ((Ax) · y) = λ〈x|y〉A,〈x|λy〉A = (Ax) · (λy) = λ((Ax) · y) = λ〈x|y〉A und

〈y|x〉A = (Ay) · x = y · (Ax) = (Ax) · y = 〈x|y〉A.

Auch in diesem Fall nennen wir die Matrix A positiv definit wenn 〈 | 〉A ein Skalar-produkt ist. Dies fuhrt uns auf die folgende Definition.

Definition 6.9: Sei A eine symmetrische n×nMatrix uberK = R oder eine hermiteschen× n Matrix uber K = C. Dann heißt A

1. positiv definit wenn (Ax) · x > 0 fur alle 0 6= x ∈ Kn ist,

2. negativ definit wenn (Ax) · x < 0 fur alle 0 6= x ∈ Kn ist,

3. positiv semidefinit wenn (Ax) · x ≥ 0 fur alle x ∈ Kn ist,

4. negativ semidefinit wenn (Ax) · x ≤ 0 fur alle x ∈ Kn ist und

5. indefinit wenn A weder positiv semidefinit noch negativ semidefinit ist.

Dass die Matrix A indefinit ist, bedeutet also das es Vektoren x, y ∈ Kn mit (Ax)·x > 0und (Ay) · y < 0 gibt. Man kann die Definitheit einer Matrix an ihren Eigenwertenablesen.

Satz 6.12 (Charakterisierung definiter Matrizen uber Eigenwerte)Sei A eine symmetrische n×n Matrix uber K = R oder eine hermitesche n×n Matrixuber K = C. Bezeichne λ1, . . . , λn ∈ R die mit Vielfachheit aufgezahlten Eigenwertevon A. Dann ist A genau dann

1. positiv definit wenn λ1, . . . , λn > 0 ist,

2. negativ definit wenn λ1, . . . , λn < 0 ist,

3. positiv semidefinit wenn λ1, . . . , λn ≥ 0 ist,

4. negativ semidefinit wenn λ1, . . . , λn ≤ 0 ist und

5. indefinit wenn es 1 ≤ i, j ≤ n mit λi > 0 und λj < 0 gibt-

Beweis: Nach Korollar 9 existiert im reellen Fall eine orthogonale Matrix S ∈ Rn×n

und im komplexen Fall eine unitare Matrix S ∈ Cn×n mit

D := S∗AS =

λ1

. . .

λn

.

239

Page 240: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 29.6.2011

Wir behaupten das A dasselbe”Defininiheitsverhalten“ wie D hat, also genau dann

positiv definit, negativ definit, positiv semidefinit, negativ semidefinit oder indefinit istwenn D dies ist. Da S insbesondere invertierbar ist, ist namlich jeder Vektor y ∈ Kn

von der Form y = Sx mit x ∈ Kn, und fur jedes x ∈ Kn gilt weiter

(ASx) · (Sx) = (S∗ASx) · x = (Dx) · x,

und die Zwischenbehauptung ist eingesehen. Fur alle x ∈ Kn gilt nun

(Dx) · x =n∑

i=1

λi|xi|2,

und damit sind alle Aussagen klar.

Wir wollen jetzt zeigen das die Determinante einer positiv definiten Matrix stets positivist. Etwas allgemeiner trifft dies sogar auf alle quadratischen Unterdeterminanten zu.

Lemma 6.13 (Determinanten positiv definiter Matrizen)Seien K ∈ {R,C}, n ∈ N mit n ≥ 1 und A = (aij)1≤i,j≤n ∈ Kn×n eine positiv definiteMatrix. Weiter seien 1 ≤ r ≤ n und Indizes 1 ≤ k1 < k2 < . . . < kr ≤ n gegeben. Danngilt ∣∣∣∣∣∣∣

ak1,k1 · · · ak1,kr

.... . .

...akr,k1 · · · akr,kr

∣∣∣∣∣∣∣ > 0.

Beweis: Wir zeigen zunachst das detA > 0 ist. Nach Satz 12 sind die mit Vielfachheitaufgezahlten Eigenwerte λ1, . . . , λn > 0 von A alle positiv und nach §5.Korollar 8 ist

detA = λ1 · . . . · λn > 0.

Nun sei eine Untermatrix

B :=

ak1,k1 · · · ak1,kr

.... . .

...akr,k1 · · · akr,kr

von A gegeben. Wir behaupten das dann auch B positiv definit ist. Sei hierzu 0 6= x ∈Kr gegeben, und definiere den Vektor x′ ∈ Kn durch Auffullen der fehlenden Stellenmit Nullen, also x′ki

:= xi fur 1 ≤ i ≤ r und x′i := 0 fur i ∈ {1, . . . , n}\{k1, . . . , kr}.Dann ist auch x′ 6= 0 und (Bx) · x = (Ax′) · x′ > 0. Damit ist B positiv definit, undwie bereits gezeigt folgt hieraus auch detB > 0.

Zum Rechnen mit kleineren konkreten Matrizen kann Satz 12 etwas muhsam sein,da wir zu seiner Anwendung ja erst einmal die Eigenwerte von A ausrechnen mussen.

240

Page 241: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 29.6.2011

Manchmal praktischer ist eine Umkehrung des vorigen Lemmas, die wir nun formulierenwollen.

Satz 6.14 (Determinantenkriterium fur positive Definitheit)Sei A = (aij)1≤i,j≤n eine symmetrische n × n Matrix uber R. Dann ist A genau dannpositiv definit, wenn

a11 > 0,

∣∣∣∣ a11 a12

a21 a22

∣∣∣∣ > 0,

∣∣∣∣∣∣a11 a12 a13

a21 a22 a23

a31 a32 a33

∣∣∣∣∣∣ > 0, . . . und

∣∣∣∣∣∣∣a11 · · · a1n...

. . ....

an1 · · · ann

∣∣∣∣∣∣∣ > 0

gelten.

Auf einen Beweis dieses Satzes wollen wir verzichten. Beispielsweise haben wir damitfur symmetrische 2× 2 Matrizen(

a bb d

)positiv definit ⇐⇒ a > 0 und ad− b2 > 0.

Das Determinantenkriterium ist in der Literatur unter eine Vielfalt von Namen zufinden, gangige Bezeichnungen sind

”Hadamard Kriterium“,

”Frobenius Kriterium“

und”Jakobi Kriterium“. Rechnen wir einige Beispiele:

1. Sei

A =

(1 22 3

).

Dann ist a11 = 1 > 0 aber detA = −1 < 0, d.h. A ist nicht positiv definit.

2. Sei

A :=

1 2 12 5 21 2 −3

.

Diesmal haben wir

a11 = 1 > 0,

∣∣∣∣ 1 22 5

∣∣∣∣ > 0, aber

∣∣∣∣∣∣1 2 12 5 21 2 −3

∣∣∣∣∣∣ =

∣∣∣∣∣∣1 2 10 1 00 0 −4

∣∣∣∣∣∣ = −4,

d.h. auch diese Matrix ist nicht positiv definit.

3. Schließlich sei

A =

1 −2 1−2 5 −2

1 −2 3

.

Diesmal haben wir

a11 = 1 > 0,

∣∣∣∣ 1 −2−2 5

∣∣∣∣ = 1 > 0 und

∣∣∣∣∣∣1 −2 1

−2 5 −21 −2 3

∣∣∣∣∣∣ =

∣∣∣∣∣∣1 −2 10 1 00 0 2

∣∣∣∣∣∣ = 2 > 0,

d.h. die Matrix A ist positiv definit.

241

Page 242: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 29.6.2011

$Id: orthogonal.tex,v 1.7 2011/09/19 20:20:53 hk Exp $

§7 Orthogonale und unitare Matrizen

Bereits in §6.2 hatten wir den Begriff einer orthogonalen Matrix im reellen Fall undeiner unitaren Matrix im komplexen Fall eingefuhrt. Wir hatten auch verschiedeneBeschreibungen fur die Orthogonalitat einer Matrix A gesehen

A ist orthogonal ⇐⇒ AtA = 1

⇐⇒ AAt = 1

⇐⇒ Die Spalten von A sind eine Orthonormalbasis des Rn

⇐⇒ Fur alle x, y ∈ Rn gilt (Ax) · (Ay) = x · y

und entsprechend im komplexen Fall

A ist unitar ⇐⇒ A∗A = 1

⇐⇒ AA∗ = 1

⇐⇒ Die Spalten von A sind eine Orthonormalbasis des Cn

⇐⇒ Fur alle x, y ∈ Cn gilt (Ax) · (Ay) = x · y.

In diesem Abschnitt interessiert uns vor allem der letztgenannte Aspekt. Mit x = yfolgt fur eine orthogonale beziehungsweise unitare n× n Matrix A auch

||Ax|| =√

(Ax) · (Ax) =√x · x = ||x||

fur jedes x im Rn beziehungsweise Cn, d.h. die Matrix A erhalt die Lange von Vektoren.Weiter folgt, dass eine orthogonale Matrix A auch den Winkel φ zwischen Vektorenx, y ∈ Rn erhalt, denn dieser bestimmt sich ja durch die Formel

x · y = ||x|| · ||y|| cosφ,

und da A Lange und Skalarprodukt nicht andert, haben wir auch

(Ax) · (Ay) = ||Ax|| · ||Ay|| cosφ.

Orthogonale Matrizen sind also die linearen Abbildungen, die Langen und Winkel erhal-ten. Nehmen wir Verschiebungen hinzu, so ergeben sich die sogenannten Bewegungen,dies sind die Abbildungen der Form

f : Rn → Rn;x 7→ Ax+ u

242

Page 243: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 29.6.2011

mit einer orthogonalen n × n Matrix A und einem Vektor u ∈ Rn. Wir halten zweiGrundtatsachen uber orthogonale und unitare Matrizen fest:

Satz 7.1 (Eigenwerte und Determinante orthogonaler und unitarer Matrizen)Sei A eine orthogonale n× n Matrix uber K = R oder eine unitare n× n Matrix uberK = C. Dann gelten:

(a) Ist λ ∈ C ein komplexer Eigenwert von A, so ist |λ| = 1.

(b) Ist K = R so gilt detA = 1 oder detA = −1.

(c) Ist K = C so gilt | detA| = 1.

(d) Ist K = R und ist die Dimension n ungerade und detA = 1, so ist 1 ein Eigenwertvon A.

(e) Ist K = R und ist die Dimension n gerade und detA = −1, so ist 1 ein Eigenwertvon A.

Beweis: (a) Da eine orthogonale Matrix als komplexe Matrix unitar ist, konnen wiruns auf den Fall K = C beschranken. Sei 0 6= u ∈ Cn ein Eigenvektor zu λ, alsoAu = λu. Dann erhalten wir

||u|| = ||Au|| = ||λu|| = |λ| · ||u||,

also wegen ||u|| 6= 0 auch |λ| = 1.(c) Es gilt

| detA |2 = det(A) · detA = det(A) det(A) = det(A) det(At) = det(A) det(A∗)

= det(AA∗) = 1,

also ist auch | detA | = 1.(b) Da A als komplexe Matrix unitar ist, gilt nach (c) zunachst | detA | = 1 und wegendetA ∈ R ist detA ∈ {−1, 1}.(d,e) Es ist

χA(1) = det(1− A) = det(AAt − A) = det(A) det(At − 1) = det(A) det(A− 1)

= (−1)n det(A) det(1− A) = (−1)n det(A)χA(1).

In den beiden Fallen”n ungerade, detA = 1“ und

”n gerade, detA = −1“ ist

(−1)n detA = −1, also χA(1) = −χA(1), und dies bedeutet χA(1) = 0, d.h. 1 istein Eigenwert von A.

Die Bewegungen f(x) = Ax + u bei denen A eine orthogonale Matrix mit detA = 1ist nennt man auch eigentliche Bewegungen. Dies sind diejenigen Bewegungen, die

243

Page 244: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 29.6.2011

sich tatsachlich physikalisch realisieren lassen. Die Bewegungen mit detA = −1 habenimmer einen Spiegelungsanteil. Wir fuhren jetzt eine Bezeichnung fur die Menge allerorthogonalen beziehungsweise unitaren Matrizen ein. Hierzu sei n ∈ N mit n ≥ 1gegeben. Dann seien

OnR := {A ∈ Rn×n|A ist orthogonal} (Orthogonale Gruppe),

SOnR := {A ∈ OnR| detA = 1} (Spezielle orthogonale Gruppe),

UnC := {A ∈ Cn×n|A ist unitar} (Unitare Gruppe),

SUnC := {A ∈ UnC| detA = 1} (Spezielle unitare Gruppe).

Oft verwendete alternativen Schreibweisen fur diese Mengen sind O(n) = OnR fur dieorthogonale Gruppe, SO(n) = SOnR fur die spezielle orthogonale Gruppe, U(n) =UnC fur die unitare Gruppe und SU(n) = SUnC fur die spezielle unitare Gruppe.Das Wort

”Gruppe“ hatten wir schon einmal in I.§10.1 im Zusammenhang mit der

symmetrischen Gruppe bei der Einfuhrung von Determinanten verwendet. Genau wiedamals wollen wir hier keine abstrakte Definition einer Gruppe geben, gemeint ist dasProdukte und Inverse von Elementen aus einer Mengen OnR, SOnR, UnC, SUnC wiederin der entsprechenden Menge sind. In der Vorlesung wurde dies nur mitgeteilt, aberan dieser Stelle wollen wir es kurz vorrechnen. Angenommen A,B ∈ OnR sind zweiorthogonale Matrizen derselben Große. Dann ist auch das Produkt AB invertierbarmit

(AB)−1 = B−1A−1 = BtAt = (AB)t,

d.h. es ist auch AB ∈ OnR. Außerdem ist auch

(A−1)−1 = A = Att = (A−1)t,

d.h. A−1 ∈ OnR. Fur die unitare Gruppe UnC ist die Rechnung analog und die Aus-sagen uber die beiden speziellen Gruppen SOnR und SUnC folgen dann aus den Ei-genschaften der Determinante. Sind beispielsweise A,B ∈ SOnR, so wissen wir bereitsAB,A−1 ∈ OnR und zusatzlich sind

det(AB) = det(A) det(B) = 1 und det(A−1) =1

detA= 1,

also AB,A−1 ∈ SOnR.

7.1 Spiegelungen

Wir werden jetzt einen speziellen Typ orthogonaler Abbildungen untersuchen, die Spie-gelung an einer Hyperebene. Im zweidimensionalen Fall n = 2 sind dies Geradenspie-gelungen und im dreidimensionalen Fall n = 3 handelt es sich um Ebenenspiegelungen.Da die Dimension fur diese Uberlegungen keine Rolle spielt, wollen wir hier gleich denn-dimensionalen Fall behandeln, und eine Hyperebene des Rn war dann definitions-gemaß ein (n − 1)-dimensionaler affiner Teilraum des Rn. Im letzten Semester hatten

244

Page 245: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 29.6.2011

wir im Abschnitt I.§12.3 bereits eine auch hier nutzliche Beschreibung von Hyperebenenkennengelernt. Jede solche Hyperebene E ließ sich in Hessescher Normalform als

E = {x ∈ Rn|u · x = c}

schreiben, wobei c ∈ R ist und u ein senkrecht auf E stehender Vektor der Lange||u|| = 1 ist, ein sogenannter Normalenvektor auf E. Da wir hier an orthogonalenMatrizen, also an linearen Abbildungen, interessiert sind, brauchen wir Hyperebenendurch den Nullpunkt, also c = 0.

u

u

E

x

x’

Sx

λ

Eine Hyperebene durch den Nullpunkt laßtsich somit in der Form

E = {x ∈ Rn|u · x = 0}

beschreiben, wobei u ein Normalenvektor aufE ist. Wir wollen die Spiegelung S an der Hy-perebene E berechnen. Sei also x ∈ Rn. Dannschreiben wir

x = x′ + λu

mit einem Vektor x′ ∈ E und einem λ ∈ R.Beim Spiegeln an E bleibt der Anteil x′ vonx in E erhalten wahrend der zu E senkrechteAnteil λu zu −λu wird, d.h. insgesamt wird der Punkt x auf Sx = x′ − λu abgebildet.Den zu u parallelen Anteil λu hatten wir auch bereits im I.§12.3 des letzten Semestersausgerechnet, wegen ||u|| = 1 ist λ = u ·x, also λu = (u ·x)u. Fur das Bild von x unterder Spiegelung folgt die Spiegelungsformel

Sx = x′ − λu = x′ + λu− 2λu = x− 2λu = x− 2(u · x)u.

Damit haben wir die Spiegelung an E berechnet. Auch als Matrix bezuglich der kano-nischen Basis des Rn laßt sich S leicht berechnen, es ist ja

Sx = x− 2(u · x)u = x− 2u(u · x) = x− 2uutx = (1− 2uut)x,

als Matrix ist alsoS = 1− 2uut.

Beachte dabei das das Produkt eines Spaltenvektors mit n Eintragen und eines Zeilen-vektors mit n Eintragen eine n× n-Matrix ist. Wir wollen zwei Beispiele rechnen. Seig die Gerade

g :=

⟨(3

−4

)⟩=

{(3t

−4t

)∣∣∣∣ t ∈ R}

245

Page 246: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 29.6.2011

im R2. Senkrecht auf dem Richtungsvektor steht beispielsweise

v =

(43

)und normiert u =

v

||v||=

1

5v =

( 4535

).

Fur die Spiegelungsmatrix ergibt sich

S = 1−2uut = 1− 2

25vvt = 1− 2

25

(43

)·(4 3) = 1− 2

25

(16 1212 9

)=

(− 7

25−24

25

−2425

725

).

Als ein zweites Beispiel betrachte die Ebene

E := {(x, y, z) ∈ R3|x+ 2y − 2z = 0}

im R3. Dann steht der Vektor v = (1, 2,−2) senkrecht auf E, und wegen ||v|| = 3 ist

u :=1

3v =

1

3

12

−2

ein Normalenvektor von E. Als die Spiegelungsmatrix an der Ebene E ergibt sich

S = 1− 2uut = 1− 2

9

1 2 −22 4 −4

−2 −4 4

=1

9

7 −4 4−4 1 8

4 8 1

.

Die Formel fur Spiegelungen an Ebenen die nicht durch den Nullpunkt gehen laßt sichauf unsere Spiegelungsformel zuruckfuhren. Angenommen die Hyperebene E ⊆ Rn istin Hessescher Normalform als

E = {x ∈ Rn|u · x = c}

gegeben, wobei u ein Normalenvektor auf E ist und c ∈ R ist. Wahle dann irgendeinenPunkt x0 ∈ E, also u · x0 = c. Die Spiegelung kann man dann realisieren, indemzuerst x0 nach 0 verschoben wird, dann an der zu E parallelen Hyperebene durch0 gespiegelt wird, und anschließend 0 wieder nach x0 zuruckgeschoben wird. Die zuE parallele Hyperebene durch 0 hat dabei auch den Normalenvektor u. Wie siehtdas als Formel aus? Sei x ∈ Rn. Beim Verschieben geht x auf x − x0, und beimSpiegeln an der parallelen Hyperebene geht dieser Punkt auf x−x0−2(u · (x−x0))u =x− x0 − 2(u · x)u+ 2(u · x0)u = x− x0 − 2(u · x)u+ 2cu. Dann wird zuruckgeschobenund als Spiegelung ergibt sich

Scx = x− (u · x)u+ 2cu = Sx+ 2cu,

wobei S = 1−2uut ist. Wir wollen nun einen Satz angeben der die besondere Bedeutungvon Spiegelungen fur die orthogonale Gruppe herausstellt, uberhaupt jede orthogonaleMatrix laßt sich als ein Produkt von Spiegelungen schreiben.

246

Page 247: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 29.6.2011

Satz 7.2: Jede orthogonale n × n Matrix laßt sich als ein Produkt von hochstens nSpiegelungen schreiben.

Auf einen Beweis mussen wir hie leider verzichten. Beachten wir das eine Spiegelungoffenbar die Determinante −1 hat, so hat ein Produkt einer geraden Anzahl von Spiege-lungen die Determinante 1 und ein Produkt einer ungeraden Anzahl von Spiegelungenhat die Determinante −1. Schauen wir uns einmal an was der Satz fur die Ebene n = 2sagt. Nach dem Satz ist jede orthogonale 2× 2 Matrix entweder eine Spiegelung oderdas Produkt von zwei Spiegelungen. Produkte von zwei Spiegelungen im R2 stellen sichals Drehungen heraus, d.h. jede orthogonale 2× 2-Matrix ist eine Spiegelung oder eineDrehung.

Fur unitare Matrizen gibt es einen ahnlichen Satz, anstelle von Spiegelungen mussman aber auch die etwas allgemeineren

”Quasispiegelungen“ erlauben. Diese Dinge

wollen wir hier aber nicht naher ausfuhren.

7.2 Drehungen

Die wohl wichtigste Sorte othogonaler Matrizen sind die Drehungen. Wir werden dieseim zwei und im dreidimensionalen Fall behandeln. In Dimension 2 kennen wir uns dabeibereits bestens aus, die Drehung um einen Winkel φ wird durch die Matrix

D(φ) =

(cosφ − sinφsinφ cosφ

)beschrieben, wie wir schon in Abschnitt I.§12.2 im letzten Semester eingesehen haben.Im zweidimensionalen Fall kennen wir damit bereits alle orthogonalen Matrizen, es giltnamlich, wie schon oben angedeutet:

Satz 7.3 (Orthogonale 2× 2 Matrizen)Ist A eine orthogonale 2× 2 Matrix, so ist A im Fall detA = 1 eine Drehung und imFall detA = −1 eine Spiegelung.

Beweis: Auf den folgenden Beweis hatten wir in der Vorlesung verzichtet. Sei

A =

(a bc d

)∈ O2R.

Zunachst nehmen wir ad− bc = detA = 1 an. Dann ist A invertierbar mit(a cb d

)= At = A−1 =

(d −b

−c a

)es mussen also a = d und c = −b gelten. Damit wird 1 = ad − bc = a2 + b2, es gibtalso einen Winkel φ mit a = cos(−φ) = cosφ und b = sin(−φ) = − sinφ. Folglich sindauch d = a = cosφ und c = −b = sinφ und wir haben A = D(φ). Damit ist der FalldetA = 1 vollstandig behandelt.

247

Page 248: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 1.7.2011

Nun nehme ad− bc = detA = −1 an. In diesem Fall haben wir(a cb d

)= At = A−1 =

(−d bc −a

)also d = −a und c = b sowie−1 = ad−bc = −a2−b2, also ist wieder c2+d2 = a2+b2 = 1.Somit gibt es einen Winkel φ mit c = sin(2φ) und d = cos(2φ), also auch a = − cos(2φ)und b = sin(2φ). Ist nun

u =

(cosφsinφ

), so ist Su = 1− 2uut = 1− 2

(cos2 φ sinφ cosφ

sinφ cosφ sin2 φ

)=

(− cos(2φ) sin(2φ)

sin(2φ) cos(2φ)

)= A

also ist A die Spiegelung an R · u.

Vorlesung 21, Freitag 1.7.2011

φ

uWir wollen uns jetzt mit Drehungen im drei-dimensionalen Raum beschaftigen. Hier reichtes zur Beschreibung einer Drehung nicht mehraus, einen Winkel anzugeben. Neben demWinkel benotigen wir auch noch die Drehach-se, also die Ursprungsgerade um die herumdie Drehung stattfindet. Die Achse sei dabeidurch einen Vektor u der Lange 1 gegeben.Es seien also ein u ∈ R3 mit ||u|| = 1 und einWinkel φ ∈ R gegeben. Wir wollen die Dre-hung Du(φ) mit Drehachse in Richtung vonu und Drehwinkel φ berechnen. Sei x ∈ R3

und wir mussen das Bild Du(φ)x von x un-ter unserer Drehung bestimmen. Ist x ∈ 〈u〉,liegt x also auf der Drehachse, so ist sofortDu(φ)x = x, wir konnen also x /∈ 〈u〉 annehmen. Unsere Strategie ist es zu einer an-deren Orthonormalbasis u1, u2, u3 des R3 uberzugehen, in der Du(φ) eine moglichsteinfache Gestalt hat. Es ist naheliegend diese Basis mit der Drehachse selbst zu be-ginnen, also u1 := u. Den zweiten Basisvektor u2 wahlen wor jetzt zum Argument x

248

Page 249: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 1.7.2011

passend. Den Punkt x selbst konnen wir leider nicht verwenden, da dieser weder nor-miert noch senkrecht zu u ist. Dies ist aber kein großes Problem, wir wenden einfachdie uns schon bekannte Gram Schmidt Orthonormalisierung auf u, x an, d.h. wir setzen

y := x− (u · x)u und u2 :=y

||y||.

Zur Bestimmung des dritten Basisvektors verwenden wir das in I.§12.4 eingefuhrteVektorprodukt, der Vektor u1 × u2 steht senkrecht auf u1 und u2 und hat die Lange

||u1 × u2|| = (||u1||2 · ||u2||2 − (u1 · u2)2)1/2 = 1.

Die Orthonormalbasis wird somit vervollstandigt durch

u3 := u1 × u2 =1

||y||u× (x− (u · x)u) =

u× x

||y||

da u× u = 0 ist. Beachte außerdem das die Basis u1, u2, u3 dann positiv orientiert ist,der Umlaufsinn unseres Drehwinkels ist also bezuglich dieser Basis genau derselbe wiebezuglich der Standardbasis. Bezuglich der Basis u1, u2, u3 wird x jetzt zu

x = (u · x)u+ y = (u · x)u1 + ||y||u2 =

u · x||y||0

.

In dieser Basis berechnet sich das Bild von x unter unserer Drehung als

Du(φ)x =

1 0 00 cosφ − sinφ0 sinφ cosφ

u · x||y||0

=

u · x||y|| cosφ||y|| sinφ

.

Bezuglich der Standardbasis haben wir damit das Ergebnis

Du(φ)x = (u · x)u1 + ||y|| cos(φ)u2 + ||y|| sin(φ)u3 = (u · x)u+ cos(φ)y + sin(φ)u× x

= (u · x)u+ cos(φ)x− (u · x) cos(φ)u+ sin(φ)(u× x)

= cos(φ)x+ (1− cosφ)(u · x)u+ sin(φ)(u× x).

Dies ist bereits eine fur praktische Zwecke nutzliche Drehungsformel. Wir konnen dieFormel auch noch in Matrixform umschreiben, hierzu mussen wir uns nur uberlegenwie die Matrix der linearen Abbildung f(x) = u×x aussieht. Dies ist schnell berechnet

u× e1 =

u1

u2

u3

×

100

=

0u3

−u2

, u× e2 =

u1

u2

u3

×

010

=

−u3

0u1

,

u× e3 =

u1

u2

u3

×

001

=

u2

−u1

0

,

249

Page 250: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 1.7.2011

die Matrix von f ist also

u :=

0 −u3 u2

u3 0 −u1

−u2 u1 0

.

Die Drehmatrix wird damit insgesamt zu

Du(φ) = cosφ+ (1− cosφ)uut + sin(φ)u.

Damit konnen wir nun Drehmatrizen berechnen. Wir konnen den Drehwinkel φ auchdirekt aus der Matrix Du(φ) ablesen, es ist ja tr u = 0, truut = u2

1 + u22 + u2

3 = 1 undsomit

trDu(φ) = 3 cosφ+ 1− cosφ = 1 + 2 cosφ.

Auch die von u aufgespannte Gerade konnen wir an der Matrix Du(φ) ablesen. Es istja (uut)t = uut aber ut = −u, also

Du(φ) +Du(φ)t = 2 cosφ+ 2(1− cosφ)uut = trDu(φ)− 1 + 2(1− cosφ)uut.

Ist also φ kein Vielfaches von 2π, so ist cosφ 6= 1 und es folgt

〈u〉 = Bild(Du(φ) +Du(φ)t − tr(Du(φ)) + 1).

Ist φ dagegen ein Vielfaches von 2π, also cosφ = 1, so findet uberhaupt keine Drehungstatt, und daher ist es nicht uberraschend das wir keine Drehachse bestimmen konnen.Beachte ubrigens das die Formel fur die Drehachse nur den Teilraum 〈u〉 liefert, abernicht u selbst, d.h. wir konnen auf diese Weise nicht zwischen u und −u unterscheiden.Wenn man aber φ und ±u kennt, so ist ein leichtes durch Einsetzen in die Matrixformder Drehformel abzulesen welchen der beiden wir nehmen mussen.

Wir wollen die Matrixformel einmal auf das Beispiel von Drehungen um u =(1/

√3)(1, 1, 1) anwenden. Es gelten

uut =1

3

111

· (1, 1, 1) =1

3

1 1 11 1 11 1 1

und u =1√3

0 −1 11 0 −1

−1 1 0

.

Die Drehung um u mit dem Winkel φ wird damit zu

Du(φ) = cosφ+ (1− cosφ)uut + sin(φ)u

=1

3

1 + 2 cosφ 1− cosφ−√

3 sinφ 1− cosφ+√

3 sinφ

1− cosφ+√

3 sinφ 1 + 2 cosφ 1− cosφ−√

3 sinφ

1− cosφ−√

3 sinφ 1− cosφ+√

3 sinφ 1 + 2 cosφ

.

In zwei Dimensionen sind Drehungen und Spiegelungen die einzigen orthogonalen Ma-trizen. In drei Dimensionen ist es auch noch moglich alle auftretenden Typen ortho-gonaler Matrizen aufzulisten, und wie im zweidimensionalen Fall sind die Drehungengenau die orthogonalen Matrizen mit Determinante 1.

Satz 7.4 (Orthogonale 3× 3 Matrizen)Sei A eine orthogonale 3× 3 Matrix.

250

Page 251: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 1.7.2011

(a) Ist detA = 1, so ist A eine Drehung um den Winkel

φ = arccos

(tr(A)− 1

2

)mit der Drehachse Bild(A+ At − tr(A) + 1).

(b) Ist detA = −1, so ist A ein Spiegelung oder das Produkt einer Spiegelung undeiner Drehung wobei die Drehachse senkrecht auf der Spiegelungsebene steht.

Beweis: (a) Nach Satz 1.(d) ist 1 ein Eigenwert von A, es gibt also ein u ∈ R3 mit||u|| = 1 und Au = u. Weiter betrachten wir die Ebene E := {x ∈ R3|u · x = 0} zumNormalenvektor u. Fur jedes x ∈ E gilt auch

u · (Ax) = (Au) · (Ax) = u · x = 0, also Ax ∈ E.

Damit ist A|E eine lineare Abbildung, und es bezeichne B die Matrix dieser Abbildungbezuglich einer Orthonormalbasis von E. Dann istB ∈ SO2R, also istA|E eine Drehungin E um einen Winkel φ. Damit ist A = Du(φ). Die Formeln fur Drehwinkel undDrehachse folgen aus unseren obigen Uberlegungen.(b) Wir haben (−A)−1 = −A−1 = −At = (−A)t, d.h. auch −A ist orthogonal mitdet(−A) = − detA = 1. Also ist −A ∈ SO3R nach (a) eine Drehung. Insbesondereexistiert ein Vektor u ∈ R3 mit ||u|| = 1 und −Au = u, also Au = −u und u ist einEigenvektor zum Eigenwert −1 von A. Fur jeden zu u senkrechten Vektor x folgt damitauch u · (Ax) = −(Au) · (Ax) = −u · x = 0, d.h. A erhalt die zu u senkrechte EbeneE. Damit ist A|E orthogonal mit Determinante 1, also eine Drehung. Es konnen jetztzwei Falle auftreten, entweder ist A|E die identische Abbildung, und dann ist A dieSpiegelung Su an der Ebene E oder A|E ist die Drehung um einen Winkel φ und dannist A das Produkt A = Du(φ)Su der Drehung Du(φ) mit der Spiegelung Su.

Produkte von Spiegelungen und Drehungen nennt man gelegentlich auch Drehspiege-lungen. Diese spielen fur uns keine Rolle, und daher wollen wir sie auch nicht untersu-chen. Der Satz besagt insbesondere das

SO3R = {Du(φ)|u ∈ R3, φ ∈ R, ||u|| = 1}

die Menge aller Drehungen um Achsen durch den Nullpunkt ist, daher nennt manSO3R auch die Drehgruppe. Ab Dimension 4 werden die Verhaltnisse komplizierter, esgibt dann auch orthogonale Matrizen mit Determinante 1 die keine Drehungen sind.Da auch dies fur uns keine Rolle spielt, wollen wir dies hier nicht naher ausfuhren.Zusammen mit Satz 2 besagt der eben bewiesen Satz, dass Drehungen im R3 genau dieProdukte von zwei Spiegelungen sind. Dies kann man auch leicht explizit sehen. Seienu, v ∈ R3 mit ||u|| = ||v|| = 1. Wir konnen u, v ∈ R3 als linear unabhangig annehmen,

251

Page 252: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 1.7.2011

denn sonst ist Su = Sv und somit SuSv = 1. Wegen SuSv ∈ SO3R muss SuSv eineDrehung mit SuSv 6= 1 sein. Die Ebenen an denen gespiegelt wird sind

Eu := {x ∈ R3|u · x = 0} und Ev := {x ∈ R3|u · v = 0}

mit Eu 6= Ev und ihr Schnitt g := Eu ∩ Ev ist eine Gerade die von SuSv punktweisefixiert wird, dies meint SuSvx = x fur alle x ∈ g. Insbesondere muss g die Drehachsesein. Explizit ist

g = {x ∈ R3|x ⊥ u und x ⊥ v} = 〈u× v〉.

Zur Bestimmung des Drehwinkels φ wollen wir die Formel aus Satz 4 verwenden. Be-achte hierzu das fur je zwei Vektoren x, y ∈ Rn stets

tr(xyt) =n∑

i=1

xiyi = x · y

gilt, also ergibt sich wegen

SuSv = (1− 2uut)(1− 2vvt) = 1− 2(uut + vvt) + 4(u · v)uvt

der Drehwinkel φ als

cosφ =1

2(tr(SuSv)− 1) =

1

2(3− 2||u||2 − 2||v||2 + 4(u · v)2 − 1) = 2(u · v)2 − 1.

Bezeichnet ψ den Winkel zwischen u und v, so ist u · v = ||u|| · ||v|| cosψ = cosψ, also

cosφ = 2 cos2 ψ − 1 = cos(2ψ).

Als Drehachse von SuSv haben wir also 〈u × v〉 und der Drehwinkel ist das Doppeltedes Winkels zwischen u und v.

Zum Abschluß wollen wir noch eine eine weitere Beschreibung von Drehungen be-sprechen, die sogenannten Eulerwinkel. Wir hatten bereits mehrfach die Drehungenum die x-Achse verwendet, und entsprechend haben auch die Drehungen um y- undz-Achse eine sehr einfache Form, namlich

D1(φ) :=

1 0 00 cosφ − sinφ0 sinφ cosφ

, D2(φ) :=

cosφ 0 − sinφ0 1 0

sinφ 0 cosφ

,

D3(φ) :=

cosφ − sinφ 0sinφ cosφ 0

0 0 1

.

Aus diesen drei speziellen Drehungen kann man alle anderen Drehungen zusammen-setzen, d.h. zu einer beliebigen Drehmatrix A gibt es immer drei Winkel α, β, γ, die

252

Page 253: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 1.7.2011

sogenannten Euler Winkel von A, so, dass

A = D1(α)D2(β)D3(γ) = cos β cos γ − cos β sin γ − sin β− sinα sin β cos γ + cosα sin γ sinα sin β sin γ + cosα cos γ − sinα cos βcosα sin β cos γ + sinα sin γ − cosα sin β sin γ + sinα cos γ cosα cos β

gilt. Aus dieser Formel lassen sich die Euler Winkel bei gegebener Matrix A berechnen.Aus dem Eintrag a13 ergibt sich β durch sin β = −a13 und wegen |a13| ≤ 1 kann β auf|β| ≤ π/2 also β = − arcsin(a13) normiert werden. Dann wird

1 = a211 + a2

12 + a213 also a2

11 + a212 = 1− a2

13 = 1− sin2 β = cos2 β

also auch (a11

cos β

)2

+

(a12

cos β

)2

= 1

und somit erhalten wir einen bis auf Vielfache von 2π eindeutigen Winkel γ mit a11 =cos β cos γ und a12 = − cos β sin γ. Analog ist auch α bis auf Vielfache von 2π eindeutigfestgelegt. Wir wollen dies einmal am Beispiel der Drehmatrix

D =1

3

2 −1 22 2 −1

−1 2 2

vorfuhren. Es ist − sin β = 2/3, also insbesondere sin β < 0. Damit ist −π/2 < β <0. Außerdem ist cos2 β = 1 − sin2 β = 5/9, also cos β =

√5/3. Explizit ist β =

− arcsin(2/3). Wegen −1/3 = − cos β sin γ = −(√

5/3) sin γ ist sin γ = 1/√

5 undweiter 2/3 = cos β cos γ = (

√5/3) cos γ, d.h. cos γ = 2/

√5. Also ist 0 < γ < π/2 und

γ = arcsin(1/√

5). Analog folgt α = γ = arcsin(1/√

5).

$Id: mdiffb.tex,v 1.9 2011/09/21 11:24:36 hk Exp $

§8 Differentialrechnung im Rn

In diesem Kapitel wollen wir die Differentialrechung fur Funktionen mehrerer Varia-blen behandeln. Wir beginnen mit einem vorbereitenden Abschnitt uber die Topologiedes Rn, dies meint die Untersuchung von Folgen, stetigen Funktionen und ahnlichenBegriffen im Rn. Den Hauptteil dieses Themenkreises haben wir bereits in §4.5 furallgemeine normierte Raume behandelt. Auf dem Rn hatten wir die vollstandige Norm

||x||∞ := max{|x1|, . . . , |xn|}

253

Page 254: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 1.7.2011

eingefuhrt und diese verwendet um konvergente Folgen, stetige Funktionen und soweiter zu definieren. Insbesondere hatten wir gesehen das jede durch Formeln in denGrundfunktionen gegebene Funktion stetig ist. Schon an dieser Stelle drangt sich einenaheliegende Frage auf. In §6.1 hatten wir eingesehen das das Standardskalarproduktden Rn zu einem Hilbertraum macht und wir damit auch die vollstandige Norm

||x||2 :=√x · x = (x2

1 + · · ·+ x2n)1/2

haben, bezuglich derer wir ebenfalls konvergente Folgen, stetige Funktionen und soweiter definieren konnen. Wir mussen zeigen das beide Normen zu denselben Begriffenfuhren. Wir werden sogar mehr einsehen, und zeigen das uberhaupt jede Norm aufdem Rn dieselben konvergenten Folgen, dieselben stetigen Funktionen, und so weiter,definiert. Den allgemeinen Teil dieser Uberlegungen, der sich nicht spezifisch auf denRn bezieht, werden wir uns fur allgemeine normierte Raume uberlegen.

8.1 Kompakte Mengen

Die Ergebnisse dieses Abschnitts werden wir in der Vorlesung nicht beweisen, sondernsie nur vorstellen. Hier sind auch (oder werden auch) die vollstandigen Beweise an-gegeben. Eines unserer bei theoretischen Uberlegungen wichtigen Hilfsmittel war derI.§6.Satz 11 von Heine Borel, der besagte das jede beschrankte reelle oder komplexeFolge eine konvergente Teilfolge besitzt. Im reellen Fall konnen wir gleichwertig sagen,dass jede Folge in einem Intervall der Form [a, b] stets eine konvergente Teilfolge be-sitzt, deren Grenzwert dann naturlich wieder in [a, b] ist. Hierzu sagt man dann auchdas die Menge [a, b] kompakt ist, und dies laßt sich nun leicht auf allgemeine normierteRaume ubertragen.

Definition 8.1: Sei E ein normierter Raum. Eine Menge C ⊆ E heißt kompakt wenn esfur jede Folge (xn)n∈N in C stets eine Teilfolge (xnk

)k∈N und ein x ∈ C mit (xnk)k∈N −→

x gibt.

Mit dieser Definition besagt I.§6.Satz 11 also das das Intervall [a, b] fur alle a, b ∈ R mita < b stets kompakt ist. In Teil I hatten wir den Satz von Heine Borel beispielsweisedazu verwendet um zu beweisen das Cauchyfolgen in R immer konvergent sind unddas stetige Funktionen f : [a, b] → R immer beschrankt sind und ihr Maximum undMinimum annehmen. All diese Dinge lassen sich mit weitgehend denselben Beweisennun auch auf allgemeine kompakte Mengen ubertragen, und das folgende Lemma haltdie wichtigsten dieser unmittelbaren Folgerungen fest.

Lemma 8.1 (Grundeigenschaften kompakter Mengen)Seien E ein normierter Raum und C ⊆ E eine kompakte Menge.

(a) Die Menge C ist abgeschlossen und beschrankt.

(b) Ist (xn)n∈N eine Cauchyfolge mit xn ∈ C fur alle n ∈ N, so ist die Folge (xn)n∈Nkonvergent mit limn→∞ xn ∈ C.

254

Page 255: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 1.7.2011

(c) Ist A ⊆ E abgeschlossen mit A ⊆ C, so ist auch A kompakt.

(d) Ist f : C → R eine stetige Funktion, so ist f beschrankt. Ist C 6= ∅, so existierenx1, x2 ∈ C mit f(x1) ≤ f(x) ≤ f(x2) fur alle x ∈ C.

(e) Sind F ein weiterer normierter Raum und f : C → F stetig, so ist auch das Bildf(C) ⊆ F kompakt.

Beweis: (b) Da C kompakt ist gibt es ein x ∈ C und eine Teilfolge (xnk)k∈N von (xn)n∈N

mit (xnk)k∈N −→ x. Nach I.§6.Lemma 13.(c) (Erinnern Sie sich daran das wir in §4.5

festgehalten hatten das sich diese Aussagen aus Teil I auch auf allgemeine normierteRaume ubertragen) gilt dann auch (xn)n∈N −→ x, d.h. die Folge (xn)n∈N ist konvergentmit limn→∞ xn = x ∈ C.(a) Ware C nicht beschrankt, so existierte fur jedes n ∈ N ein xn ∈ C mit ||xn|| ≥n. Da C kompakt ist, enthalt (xn)n∈N eine konvergente Teilfolge (xnk

)k∈N mit x :=limk→∞ xnk

∈ C. Dann ist aber auch (||xnk||)k∈N −→ ||x|| und die Folge (||xnk

||)k∈N istinsbesondere beschrankt, im Widerspruch zu ||xnk

|| ≥ nk ≥ k fur jedes k ∈ N. Also istC beschrankt.

Sei (xn)n∈N eine Folge in C mit (xn)n∈N −→ x ∈ E. Dann ist (xn)n∈N insbesondereeine Cauchyfolge und nach (b) gilt auch x ∈ C. Damit ist C ⊆ E abgeschlossen.(c) Sei (xn)n∈N eine Folge in A ⊆ C. Dann existieren ein x ∈ C und eine Teilfolge(xnk

)k∈N von (xn)n∈N mit (xnk)k∈N −→ x. Damit ist aber auch x ∈ A = A, und somit

ist auch A kompakt.(d) Angenommen die Funktion f ware unbeschrankt. Dann gibt es fur jedes n ∈ Nein xn ∈ C mit |f(xn)| ≥ n. Da C kompakt ist, existieren weiter ein x ∈ C und eineTeilfolge (xnk

)k∈N von (xn)n∈N mit (xnk)k∈N −→ x. Da die Funktion f stetig ist, ist

somit auch|f(x)| =

∣∣∣f ( limk→∞

xnk

)∣∣∣ =∣∣∣ limk→∞

f(xnk)∣∣∣ = lim

k→∞|f(xnk

)|,

und insbesondere ist (|f(xnk)|)k∈N beschrankt, im Widerspruch zu |f(xnk

)| ≥ nk ≥ kfur jedes k ∈ N.

Wir zeigen jetzt, das die Funktion f ein Maximum hat, die Aussage uber das Mi-nimum folgt dann analog. Setze s := sup{f(x)|x ∈ C} ∈ R. Fur jedes n ∈ N gibt esdann ein xn ∈ C mit

f(xn) > s− 1

n,

und da C kompakt ist, gibt es wieder ein x ∈ C und eine Teilfolge (xnk)k∈N von (xn)n∈N

mit (xnk)k∈N −→ x. Da f stetig ist, ist damit auch

f(x) = limk→∞

f(xnk),

und wegen

s− 1

nk

< f(xnk) ≤ s

255

Page 256: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 1.7.2011

fur jedes k ∈ N folgt auch f(x) = s.(e) Sei (yn)n∈N eine Folge in f(C). Dann gibt es fur jedes n ∈ N ein xn ∈ C mityn = f(xn) und da C kompakt ist, gibt es weiter ein x ∈ C und eine Teilfolge (xnk

)k∈Nvon (xn)n∈N mit (xnk

)k∈N −→ x. Da die Funktion f stetig ist, ist damit auch

(ynk)k∈N = (f(xnk

))k∈N −→ f(x) ∈ f(C).

Damit ist auch f(C) ⊆ F kompakt.

Wenn Sie etwas in der Literatur herumschauen, werden Sie schnell merken das es nebender von uns verwendeten Definition kompakter Mengen noch einige alternative Defini-tionen gibt. Der folgende Satz soll zeigen, dass all diese verschiedenen Definitionen furnormierte Raume zueinander aquivalent sind. Dies dient hauptsachlich der begrifflichenEinordnung, wir werden den Satz in diesem Semester nicht mehr verwenden.

Satz 8.2 (Charakterisierung kompakter Mengen)Seien E ein normierter Raum und C ⊆ E eine Teilmenge. Dann sind die folgendenAussagen aquivalent:

(a) Die Menge C ist kompakt.

(b) Jede Cauchyfolge (xn)n∈N in C ist konvergent mit limx→∞ xn ∈ C und fur jedesε > 0 gibt es endlich viele Punkte x1, . . . , xn ∈ C mit C ⊆

⋃ni=1Bε(xi).

(c) Fur jede Familie (Ui)i∈I offener Teilmengen von E mit C ⊆⋃

i∈I Ui existiert eineendliche Teilmenge J ⊆ I mit C ⊆

⋃i∈J Ui.

(d) Fur jede Familie (Ai)i∈I abgeschlossener Teilmengen von E die die BedingungC∩⋂

i∈J Ai 6= ∅ fur alle endlichen Teilmengen J ⊆ I erfullt ist auch C∩⋂

i∈I Ai 6=∅.

(e) Fur jede Folge (An)n∈N abgeschlossener Teilmengen von E mit C ∩An 6= ∅ fur allen ∈ N und C ∩ An+1 ⊆ C ∩ An fur alle n ∈ N ist auch C ∩

⋂n∈NAn 6= ∅.

Beweis: (a)=⇒(b). Die Aussage uber Cauchyfolgen gilt nach Lemma 1.(b). Die zweiteAussage beweisen wir per Widerspruchsbeweis. Angenommen es gibt ein ε > 0 so, dassfur alle x1, . . . , xn ∈ C stets C 6⊆

⋃ni=1Bε(xi) ist, d.h. fur alle x1, . . . , xn ∈ C gibt es

immer ein x ∈ C mit ||x−xi|| ≥ ε fur alle 1 ≤ i ≤ n. Insbesondere ist dann C 6= ∅ undwir wahlen ein beliebiges x0 ∈ C. Ist jetzt n ∈ N und haben wir bereits x0, . . . , xn ∈ Cgewahlt, so gibt es nach unserer Annahme ein xn+1 ∈ C mit ||xn+1 − xi|| ≥ ε furi = 0, . . . , n. Induktiv definiert dies eine Folge (xn)n∈N in C mit ||xn − xm|| ≥ ε furalle n,m ∈ N mit n 6= m. Dann ist keine Teilfolge von (xn)n∈N eine Cauchyfolge undinsbesondere enthalt (xn)n∈N keine konvergente Teilfolge. Dies ist ein Widerspruch zurvorausgesetzten Kompaktheit der Menge C.

256

Page 257: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 1.7.2011

(b)=⇒(c). Auch diese Aussage beweisen wir durch einen Widerspruchsbeweis. Ange-nommen es gibt eine Familie (Ui)i∈I offener Teilmengen von E mit C ⊆

⋃i∈I Ui so,

dass fur jede endliche Teilmenge J ⊆ I stets C 6⊆⋃

i∈J Ui ist. Nach unserer Annahme

gibt es y1, . . . , yt ∈ C mit C ⊆⋃t

i=1B1/2(yi). Gabe es jetzt fur jedes 1 ≤ i ≤ t stetseine endliche Teilmenge Ji ⊆ I mit C ∩ B1/2(yi) ⊆

⋃j∈J Uj, so hatten wir auch die

endliche Teilmenge J :=⋃t

i=1 Ji ⊆ I mit

C ⊆t⋃

i=1

(C ∩B1/2(yi)) ⊆t⋃

i=1

⋃j∈Ji

Uj =⋃j∈J

Uj,

im Widerspruch zu unserer Annahme. Also muss es einen Index 1 ≤ i ≤ t geben so,dass fur jede endliche Teilmenge J ⊆ I stets C ∩ B1/2(yi) 6⊆

⋃j∈J Uj ist. Wir setzen

x0 := yi ∈ C.Nun sei n ∈ N und der Punkt xn ∈ C sei bereits konstruiert so, dass fur jede

endliche Teilmenge J ⊆ I stets C ∩ B1/2n+1(xn) 6⊆⋃

j∈J Uj ist. Es existieren endlich

viele Punkte y1, . . . , yt ∈ C mit C ⊆⋃t

i=1B1/2n+2(yi) und setzen wir

T := {1 ≤ i ≤ t|B1/2n+2(yi) ∩B1/2n+1(xn) 6= ∅},

so ist auch C ∩ B1/2n+1(xn) ⊆⋃

i∈T (C ∩ B1/2n+2(yi)). Analog zur obigen Uberle-gung muss es ein i ∈ T geben so, dass fur jede endliche Teilmenge J ⊆ I stetsC ∩ B1/2n+2(yi) 6⊆

⋃j∈J Uj ist, und wir setzen xn+1 := yi ∈ C. Wegen i ∈ T existiert

ein x ∈ B1/2n+2(xn+1) ∩B1/2n+1(xn), und somit ist auch

||xn+1 − xn|| ≤ ||xn+1 − x||+ ||xn − x|| < 1

2n+2+

1

2n+1<

1

2n.

Induktiv wird somit eine Folge (xn)n∈N in C definiert, und wir behaupten das dieseeine Cauchyfolge ist. Sei namlich ε > 0 gegeben. Dann existiert ein n0 ∈ N mit n0 ≥ 1und 1/2n0−1 < ε. Fur alle n,m ∈ N mit m > n ≥ n0 folgt dann auch

||xm − xn|| ≤m−1∑k=n

||xk+1 − xk|| ≤m−1∑k=n

1

2k=

2m−n − 1

2m−1<

1

2n−1≤ 1

2n0−1< ε.

Damit ist (xn)n∈N eine Cauchyfolge und nach unserer Annahme existiert ein x ∈ C mitlimn→∞ xn = x. Weiter existiert ein i ∈ I mit x ∈ Ui und da Ui offen ist gibt es auchein ε > 0 mit Bε(x) ⊆ Ui. Wahle ein n ∈ N mit ||x − xn|| < ε/2 und 1/2n+1 < ε/2.Dann ist

B1/2n+1(xn) ∩ C ⊆ Bε(x) ⊆ Ui

im Widerspruch zur Wahl von xn.(c)=⇒(d). Fur jedes i ∈ I ist die Menge Ui := E\Ai ⊆ E offen und fur jede endlicheTeilmenge J ⊆ I gilt wegen C∩

⋂j∈J Aj 6= ∅ auch C 6⊆

⋃j∈J Uj. Dies ergibt C 6⊆

⋃i∈I Ui

und dies bedeutet C ∩⋂

i∈I Ai 6= ∅.

257

Page 258: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 1.7.2011

(d)=⇒(e). Klar.(e)=⇒(a). Sei (xn)n∈N eine Folge in C. Fur jedes n ∈ N betrachten wir dann dieabgeschlossene Menge

An := {xk|k ∈ N, k ≥ n} ⊆ E.

Dann ist auch ∅ 6= {xk|k ∈ N, k ≥ n} ⊆ C ∩ An und An+1 ⊆ An fur jedes n ∈ N. Esfolgt C ∩

⋂n∈NAn 6= ∅ und wir wahlen ein x ∈ C mit x ∈ An fur jedes n ∈ N. Sind

dann n ∈ N und ε > 0 so gibt es stets ein m ∈ N mit m ≥ n und ||xm− x|| < ε. Damitkonnen wir rekursiv eine Teilfolge (xnk

)k∈N von (xn)n∈N mit ||xnk− x|| < 1/k fur jedes

k ∈ N definieren. Insbesondere ist

limk→∞

xnk= x ∈ C.

Damit ist der Satz vollstandig bewiesen.

Von besonderem Interesse ist die Eigenschaft in Aussage (c) des Satzes, dass sichalso eine kompakte Menge durch endlich viele Kugeln von beliebig kleinen Radiusuberdecken laßt. Derartige Mengen erhalten einen eigenen Namen und wir definieren:

Definition 8.2 (Prakompakte und relativ kompakte Mengen)Sei E ein normierter Raum. Eine Menge C ⊆ E heißt prakompakt wenn es fur jedesε > 0 Punkte x1, . . . , xn ∈ C mit C ⊆

⋃ni=1Bε(xi) gibt und sie heißt relativ kompakt

wenn es eine kompakte Menge C ′ ⊆ E mit C ⊆ C ′ gibt.

Wie schon der Satz nahelegt, gibt es einen engen Zusammenhang zwischen prakom-pakten und relativ kompakten Mengen. An dieser Stelle wollen wir nur die unmittelbarersichtlichen Eigenschaften prakompakter und relativ kompakter Mengen zusammen-stellen.

Lemma 8.3 (Grundeigenschaften prakompakter Mengen)Sei E ein normierter Raum.

(a) Eine Teilmenge C ⊆ E ist genau dann prakompakt wenn es fur jedes ε > 0 stetsendlich viele Punkte x1, . . . , xn ∈ E mit C ⊆

⋃ni=1Bε(xi) gibt.

(b) Ist C ⊆ E prakompakt, so ist auch jede Teilmenge A ⊆ C prakompakt.

(c) Ist C ⊆ E prakompakt, so ist auch C ⊆ E prakompakt.

(d) Ist C ⊆ E prakompakt, so ist C auch beschrankt.

(e) Eine Menge C ⊆ E ist genau dann relativ kompakt wenn C kompakt ist.

(f) Ist C ⊆ E relativ kompakt, so ist C auch prakompakt.

(g) Ist E vollstandig, so ist eine Menge C ⊆ E genau dann relativ kompakt wenn sieprakompakt ist.

258

Page 259: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 1.7.2011

Beweis: (a) ”=⇒” Klar.”⇐=” Sei ε > 0. Dann gibt es nach unserer Annahme endlich viele Punkte x1, . . . , xn ∈E mit C ⊆

⋃ni=1Bε/2(xi), und durch Weglassen uberflussiger Punkte konnen wir auch

Bε/2(xi) ∩ C 6= ∅ fur jedes 1 ≤ i ≤ n annehmen. Fur jedes 1 ≤ i ≤ n wahlen wir danneinen Punkt yi ∈ Bε/2(xi) ∩ C, also insbesondere yi ∈ C. Wir behaupten, dass dannauch C ⊆

⋃ni=1Bε(yi) gilt. Sei also ein Punkt x ∈ C gegeben. Wegen C ⊆

⋃ni=1Bε/2(xi)

existiert dann ein 1 ≤ i ≤ n mit ||x− xi|| < ε/2. Damit folgt auch

||x− yi|| ≤ ||x− xi||+ ||xi − yi|| <ε

2+ε

2= ε also x ∈ Bε(yi).

Dies zeigt C ⊆⋃n

i=1Bε(yi).(b) Klar nach (a).(c) Sei ε > 0 gegeben. Dann existieren x1, . . . , xn ∈ C mit C ⊆

⋃ni=1Bε/2(xi), und wir

behaupten das dann auch C ⊆⋃n

i=1Bε(xi) ist. Sei also x ∈ C. Dann ist Bε/2(x)∩C 6= ∅,also existiert ein Punkt y ∈ C mit ||x − y|| < ε/2. Wegen C ⊆

⋃ni=1Bε/2(xi) existiert

weiter ein 1 ≤ i ≤ n mit ||y − xi|| < ε/2 und insgesamt ist damit

||x− xi|| ≤ ||x− y||+ ||y − xi|| <ε

2+ε

2= ε,

also x ∈ Bε(xi). Dies zeigt C ⊆⋃n

i=1Bε(xi).(d) Es gibt x1, . . . , xn ∈ C mit C ⊆

⋃ni=1B1(xi). Wir erhalten die Konstante

M := 1 + max{||x1||, . . . , ||xn||},

und behaupten das ||x|| ≤ M fur jedes x ∈ C gilt. Sei also x ∈ C gegeben. WegenC ⊆

⋃ni=1B1(xi) existiert dann ein 1 ≤ i ≤ n mit ||x− xi|| < 1 und es folgt

||x|| ≤ ||x− xi||+ ||xi|| < 1 + ||xi|| ≤M.

(e) ”=⇒” Wahle eine kompakte Menge C ′ ⊆ E mit C ⊆ C ′. Nach Lemma 1.(a) ist C ′

abgeschlossen, also ist auch C ⊆ C ′ und nach Lemma 1.(c) ist C kompakt.”⇐=” Klar wegen C ⊆ C.(f) Wahle eine kompakte Menge C ′ ⊆ E mit C ⊆ C ′. Nach Satz 2 ist C ′ prakompaktund nach (b) ist auch C prakompakt.(g) ”=⇒” Klar nach (f).”⇐=” Nach (c) ist auch der Abschluss C prakompakt. Sei nun (xn)n∈N eine Cauchyfolgein C. Da die Norm von E vollstandig ist, ist (xn)n∈N auch konvergent. Da C außerdemabgeschlossen ist, haben wir auch limn→∞ xn ∈ C. Nach Satz 2 ist C kompakt unddamit ist C relativ kompakt.

Wir sind in diesem Semester nur an den kompakten Mengen im Rn interessiert, unddiese lassen sich erfreulich einfach beschreiben. Wie schon bemerkt sind Intervalle derForm [a, b] kompakt, dies ist im wesentlichen unser ursprunglicher Satz von Heine

259

Page 260: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 1.7.2011

Borel I.§6.Satz 11. Durch n-fache komponentenweise Anwendung dieses Satzes erhaltenwir die n-dimensionale Version des Satzes von Heine Borel. Wie eingangs erwahntverwenden wir auf dem Rn die Norm || ||∞, im nachsten Abschnitt werden wir danneinsehen das dies keine Rolle spielt und der Satz von der konkreten Norm auf dem Rn

unabhangig ist.

Satz 8.4 (Satz von Heine Borel im Rn)Eine Teilmenge C ⊆ Rn ist genau dann kompakt wenn sie abgeschlossen und beschranktist.

Beweis: ”=⇒” Klar nach Lemma 1.(a).”⇐=” Sei (xk)k∈N eine Folge in C. Da C beschrankt ist, existiert ein r > 0 mit ||x||∞ ≤ rfur alle x ∈ C. Insbesondere gilt fur alle x ∈ C und alle 1 ≤ i ≤ n auch |xi| ≤ ||x||∞ ≤r, es ist also C ⊆ [−r, r]n. Durch n-fache Anwendung des eindimensionalen Satzesvon Heine-Borel I.§6.Satz 11 erhalten wir eine Teilfolge (xkl

)l∈N von (xk)k∈N und fur1 ≤ i ≤ n reelle Zahlen yi ∈ R mit (xkl,i)l∈N −→ yi. Ist also y := (yi)1≤i≤n ∈ Rn, so ist(xkl

)l∈N −→ y. Da C abgeschlossen ist, gilt auch y ∈ C = C.

Beispielsweise sind die abgeschlossenen Normkugeln

Br(x) = [x1 − r, x1 + r]× · · · × [xn − r, xn + r]

fur r > 0, x ∈ Rn abgeschlossen und beschrankt und damit kompakt. Auch die euklidi-schen Kugeln sind abgeschlossen und beschrankt, also kompakt. Dies ist wirklich einespezifische Eigenschaft des Rn, in allgemeinen normierten Raumen mussen die abge-schlossenen Kugeln nicht mehr kompakt sein. Man kan sogar zeigen, dass dies in nichtendlich erzeugten normierten Raumen niemals der Fall ist.

8.2 Zwei Anwendungen des Kompaktheitsbegriffs

In diesem Abschnitt wollen wir zwei kleine Anwendungen kompakter Mengen im Rn

vorfuhren, zum einen werden wir die schon erwahnte Gleichwertigkeit aller Normenauf dem Rn beweisen und zum anderen werden wir den Fundamentalsatz der Algebra,das also jedes nicht konstante, komplexe Polynom eine komplexe Nullstelle hat, be-weisen. Wir beginnen mit dem Normen im Rn. Sind zwei beliebige Normen auf demRn gegeben, so wollen wir einsehen das diese dieselben konvergenten Folgen, dieselbenstetigen Funktionen, dieselben offenen Mengen und so weiter definieren. Als Definiti-on der Gleichwertigkeit oder Aquivalenz von Normen ist dies aber etwas unhandlich,und glucklicherweise stellt sich heraus das es ausreicht nur eine dieser Bedingungenzu fordern. Dabei entscheiden wir uns, recht willkurlich, fur die offenen Mengen unddefinieren daher:

Definition 8.3 (Aquivalenz von Normen)Sei E ein Vektorraum uber K ∈ {R,C}. Zwei Normen || ||1, || ||2 auf E heißen aqui-valent, wenn jede Teilmenge U ⊆ E genau dann bezuglich || ||1 offen ist, wenn siebezuglich || ||2 offen ist.

260

Page 261: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 1.7.2011

Nun muss man beweisen, dass das Ubereinstimmen der offenen Mengen alles anderenach sich zieht. In der Vorlesung hatten wir dieses Lemma nur in skizzierter Form ange-geben, und erst recht nicht bewiesen, hier wollen wir aber alles vollstandig behandeln.

Lemma 8.5: Seien E ein Vektorraum uber K ∈ {R,C} und || ||1, || ||2 zwei Normenauf E.

(a) Die folgenden Aussagen sind aquivalent:

1. Die Normen || ||1 und || ||2 sind aquivalent.

2. Eine Menge A ⊆ E ist genau dann bezuglich || ||1 abgeschlossen wenn siebezuglich || ||2 abgeschlossen ist.

3. Eine Menge A ⊆ E ist genau dann bezuglich || ||1 beschrankt wenn siebezuglich || ||2 beschrankt ist.

4. Fur jede Teilmenge M ⊆ E stimmen das Innere M◦ bezuglich || ||1 und|| ||2 uberein.

5. Fur jede Teilmenge M ⊆ E stimmen der Abschluss M bezuglich || ||1 und|| ||2 uberein.

6. Sind (xn)n∈N eine Folge in E und x ∈ E so ist (xn)n∈N genau dann bezuglich|| ||1 gegen x konvergent wenn (xn)n∈N bezuglich || ||2 gegen x konvergentist.

7. Es gibt Konstanten c1, c2 > 0 mit ||x||1 ≤ c1||x||2 und ||x||2 ≤ c2||x||1 furalle x ∈ E.

(b) Seien die Normen || ||1 und || ||2 aquivalent. Dann gelten:

1. Fur jede Teilmenge M ⊆ E stimmen der Rand ∂M bezuglich || ||1 und || ||2uberein.

2. Eine Folge (xn)n∈N ist genau dann eine Cauchyfolge bezuglich || ||1 wennsie eine Cauchyfolge bezuglich || ||2 ist.

3. Genau dann ist || ||1 vollstandig wenn || ||2 vollstandig ist.

4. Eine Teilmenge C ⊆ E ist genau dann bezuglich || ||1 kompakt wenn siebezuglich || ||2 kompakt ist.

Beweis: (a) (1)=⇒(6). Seien (xn)n∈N eine Folge in E und x ∈ E. Sei (xn)n∈N bezuglich

|| ||1 gegen x konvergent. Sei ε > 0. Dann ist B|| ||2ε (x) offen bezuglich || ||2, also auch

bezuglich || ||1 und somit existiert ein δ > 0 mit

B|| ||1δ (x) ⊆ B|| ||2

ε (x).

261

Page 262: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 1.7.2011

Da die Folge (xn)n∈N bezuglich || ||1 gegen x konvergiert, existiert ein n0 ∈ N mit||xn − x||1 < δ fur jedes n ∈ N mit n ≥ n0. Ist also n ∈ N mit n ≥ n0, so ist

xn ∈ B|| ||1δ (x) ⊆ B|| ||2

ε (x),

also ist auch ||xn−x||2 < ε. Dies beweist die Konvergenz von (xn)n∈N gegen x bezuglich|| ||2. Analog impliziert die Konvergenz von (xn)n∈N gegen x bezuglich || ||2 auch dieKonvergenz von (xn)n∈N gegen x bezuglich || ||1.(6)=⇒(3). Sei M ⊆ E eine Teilmenge. Nehme an das M bezuglich || ||1 beschranktist, d.h. es gibt ein r ≥ 0 mit ||x||1 ≤ r fur alle x ∈M . AngenommenM ware nicht auchbezuglich || ||2 beschrankt. Dann gibt es fur jedes n ∈ N ein xn ∈M mit ||xn||2 ≥ n2.Wir betrachten nun die Folge (xn/n)n∈N in E. Wegen∣∣∣∣∣∣∣∣xn

n

∣∣∣∣∣∣∣∣1

=||xn||1n

≤ r

n

fur jedes n ∈ N ist diese bezuglich || ||1 eine Nullfolge. Andererseits gilt∣∣∣∣∣∣∣∣xn

n

∣∣∣∣∣∣∣∣2

=||xn||2n

≥ n

fur jedes n ∈ N, d.h. bezuglich || ||2 ist diese Folge nicht beschrankt und insbesondereauch nicht konvergent. Dies steht im Widerspruch zu (6) und somit muss M auchbezuglich || ||2 beschrankt sein. Analog impliziert die Beschranktheit von M bezuglich|| ||2 auch die Beschranktheit bezuglich || ||1.(3)=⇒(7). Die abgeschlossene Kugel B

|| ||11 (0) ist beschrankt bezuglich || ||1, also auch

bezuglich || ||2, und somit existiert eine Konstante c2 > 0 mit ||x||2 ≤ c2 fur alle x ∈ Emit ||x||1 ≤ 1. Sei nun 0 6= x ∈ E. Dann ist∣∣∣∣∣∣∣∣ x

||x||1

∣∣∣∣∣∣∣∣1

=||x||1||x||1

= 1, also auch||x||2||x||1

=

∣∣∣∣∣∣∣∣ x

||x||1

∣∣∣∣∣∣∣∣2

≤ c2,

d.h. wir haben ||x||2 ≤ c2||x||1. Fur x = 0 gilt dies trivialerweise ebenfalls. Analogexistiert auch ein c1 > 0 mit ||x||1 ≤ c1||x||2 fur alle x ∈ E.(7)=⇒(4). Sei M ⊆ E eine Teilmenge. Wir mussen zeigen das ein Punkt x ∈M genaudann ein innerer Punkt von M bezuglich || ||1 ist, wenn x ein innerer Punkt von Mbezuglich || ||2 ist. Nehme zunachst an, dass x ein innerer Punkt von M bezuglich

|| ||1 ist, d.h. es gibt ein ε > 0 mit B|| ||1ε (x) ⊆ M . Setze nun δ := ε/c1 > 0. Sei

y ∈ B|| ||2δ (x), also ||y − x||2 < δ. Dann folgt auch ||y − x||1 ≤ c1||y − x||2 < c1δ = ε,

also y ∈ B|| ||1ε (x) ⊆ M , also y ∈ M . Folglich ist B

|| ||2δ (x) ⊆ M und damit ist x auch

bezuglich || ||2 ein innerer Punkt von M . Ist x umgekehrt als innerer Punkt von Mbezuglich || ||2 vorausgesetzt, so folgt analog das x auch ein innerer Punkt von Mbezuglich || ||1 ist.(4)=⇒(5). Klar nach §4.Lemma 17.(a).

262

Page 263: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 6.7.2011

(5)=⇒(2). Klar da eine Menge genau dann abgeschlossen ist wenn sie mit ihremAbschluß ubereinstimmt.(2)=⇒(1). Klar da eine Menge U ⊆ E nach §4.Lemma 17.(d) genau dann offen istwenn ihr Komplement E\U abgeschlossen ist.(b) Nun seien || ||1 und || ||2 als aquivalent vorausgesetzt.(1) Dies ist wegen ∂M = M\M◦ klar nach (a).(2) Sei (xn)n∈N eine Folge in E. Zunachst nehmen wir an, dass (xn)n∈N bezuglich || ||1eine Cauchyfolge ist. Nach (a) existiert eine Konstante c > 0 mit ||x||2 ≤ c||x||1 furalle x ∈ E. Sei ε > 0. Dann existiert ein n0 ∈ N mit ||xn − xm||1 < ε/c fur allen,m ≥ n0. Sind also n,m ∈ N mit n,m ≥ n0, so haben wir auch ||xn− xm||2 ≤ c||xn−xm||1 < ε, d.h. (xn)n∈N ist auch eine Cauchyfolge bezuglich || ||2. Ist umgekehrt (xn)n∈Neine Cauchyfolge bezuglich || ||2, so folgt analog das (xn)n∈N auch eine Cauchyfolgebezuglich || ||1 ist.(3) Klar nach (2) und (a).(4) Klar nach (a).

Vorlesung 22, Mittwoch 6.7.2011

Am Ende der letzten Sitzung hatten wir die Aquivalenz von Normen || ||1 und || ||2in einem Vektorraum E eingefuhrt. Diese ist beispielsweise genau dann gegeben, wennman die beiden Normen gegeneinander abschatzen kann, wenn also fur jedes x ∈ Estets

||x||1 ≤ c1||x||2 und ||x||2 ≤ c2||x||1mit reellen Konstanten c1, c2 > 0 gilt. Als ein Beispiel wollen wir uns einmal uberlegendas die beiden Normen || ||∞ und || ||2 im Rn aquivalent sind. Hierzu wollen wir dieCharakterisierung (a.7) des Lemmas verwenden. Sei x ∈ Rn. Es gibt ein 1 ≤ i ≤ n mit||x||∞ = |xi|, und damit ist

||x||∞ = |xi| =√x2

i ≤ (x21 + · · ·+ x2

n)1/2 = ||x||2.

Umgekehrt rechnen wir

||x||2 = (x21 + · · ·+ x2

n)1/2 ≤√n||x||2∞ =

√n||x||∞.

Nach dem Lemma sind die euklidische und die ∞-Norm auf dem Rn damit aquivalent.Allgemeiner zeigen wir jetzt:

Satz 8.6 (Alle Normen im Rn sind aquivalent.)Sei n ∈ N mit n ≥ 1. Dann sind je zwei Normen auf dem Rn aquivalent.

263

Page 264: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 6.7.2011

Beweis: Es reicht zu zeigen, dass jede Norm || || auf dem Rn zu || ||∞ aquivalent ist.Zunachst gilt fur jedes x ∈ Rn

||x|| = ||x1e1 + · · ·+ xnen|| ≤ |x1| · ||e1||+ · · ·+ |xn| · ||en|| ≤M ||x||∞

mit M := ||e1|| + · · · + ||en|| > 0. Aus dieser Ungleichung folgt bereits das die Norm|| || bezuglich || ||∞ stetig ist, denn fur alle x, y ∈ Rn haben wir∣∣||x|| − ||y||

∣∣ ≤ ||x− y|| ≤M ||x− y||∞.

Nach Satz 4 ist die Menge

C := {x ∈ Rn : ||x||∞ = 1}

kompakt und nach Lemma 1.(d) nimmt || || auf C das Minimum an, es gibt also eineKonstante A > 0 mit ||x|| ≥ A fur alle x ∈ Rn mit ||x||∞ = 1. Sei jetzt 0 6= x ∈ Rn.Dann ist x/||x||∞ ∈ C, also folgt

||x||||x||∞

=

∣∣∣∣∣∣∣∣ x

||x||∞

∣∣∣∣∣∣∣∣ ≥ A,

d.h. ||x||∞ ≤ (1/A)||x||. Fur x = 0 gilt dies trivialerweise und nach Lemma 5 sind diebeiden Normen aquivalent.

Als eine zweite Anwendung wollen wir jetzt den Fundamentalsatz der Algebra bewei-sen. Bei der Integration rationaler Funktionen in §2.4 hatten wir diesen Satz zur Her-leitung der allgemeinen reellen Partialbruchzerlegung verwendet, wir hatten benotigtdas jedes normierte Polynom p uber den komplexen Zahlen sich als ein Produkt

p(x) = (x− z1) · . . . · (x− zn)

schreiben ließ, wobei z1, . . . , zn dann die komplexen Nullstellen des Polynoms sind.Ebenfalls schon in §2.4 hatten wir durch schrittweises Herausziehen einzelner Nullstel-len eingesehen, dass es ausreicht zu zeigen das jedes nicht konstante, komplexe Polynomeine komplexe Nullstelle besitzt. In §5 hatten wir den Fundamentalsatz verwendet umeinzusehen das eine reelle oder komplexe n×n-Matrix mit Vielfachheiten gezahlt immergenau n komplexe Eigenwerte hat. Auf den Beweis des Hauptsatzes hatten wir dabeijeweils verzichtet, unter Verweis auf das Fehlen der dafur notwendigen Hilfsmittel. Mitdem Begriff der Kompaktheit ausgerustet hat sich dies jetzt geandert, und wir konnenden Hauptsatz recht einfach beweisen.

Satz 8.7 (Fundamentalsatz der Algebra)Jedes komplexe Polynom p mit grad(p) ≥ 1 hat eine Nullstelle.

Beweis: Schreibe p(z) =∑n

k=0 akzk mit an 6= 0. Wir setzen

µ := inf{|p(z)| : z ∈ C}.

264

Page 265: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 6.7.2011

Nach I.§6.Lemma 7 existiert ein r1 > 0 mit

|p(z)| > |an|2|z|n

fur alle z ∈ C mit |z| ≥ r1. Weiter wahle ein r2 > 0 mit |an|rn2/2 > µ und setze

r0 := max{r1, r2} > 0. Fur jedes z ∈ C mit |z| ≥ r0 ist dann

|p(z)| > |an|2|z|n ≥ |an|

2rn2 > µ,

also ist auchµ = inf{|p(z)| : z ∈ Br0(0)}.

Da |p| stetig ist und Br0(0) kompakt ist, existiert nach Lemma 1.(d) ein z0 ∈ C mit|p(z0)| = µ. Wir mussen also nur zeigen das µ = 0 ist.

Angenommen es ware µ > 0. Dann betrachten wir das Polynom

q(z) :=p(z + z0)

p(z0)

mit grad(q) = n, q(0) = 1 und

|q(z)| = |p(z + z0)|µ

≥ 1

fur alle z ∈ C. Es gibt ein 1 ≤ k ≤ n so, dass q die Form

q(z) = 1 + bkzk +

n∑i=k+1

bizi

mit bk 6= 0 hat. Wegen | − bk/|bk|| = 1 gibt es weiter einen Winkel θ ∈ R mit eikθbk =−|bk|. Wegen

limr→0

(1− rk|bk|) = 1 > 0 und limr→0

(|bk| −

n−k∑j=1

|bk+j|rj

)= |bk| > 0

existiert ein r > 0 mit 1−rk|bk| > 0 und |bk|−∑n−k

i=1 |bk+i|ri > 0. Setze z := reiθ. Dannist

|q(z)| =

∣∣∣∣∣1− |bk|rk +n−k∑j=1

bk+jrk+jei(k+j)θ

∣∣∣∣∣ ≤ |1− |bk|rk|+n−k∑j=1

|bk+j|rk+j

= 1− |bk|rk +n−k∑j=1

|bk+j|rk+j = 1− rk

(|bk| −

n−k∑j=1

|bk+j|rj

)< 1

im Widerspruch zu |q(z)| ≥ 1. Dieser Widerspruch beweist µ = 0 und somit hat p eineNullstelle.

265

Page 266: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 6.7.2011

8.3 Konvexe und zusammenhangende Mengen

Wir fuhren zwei weitere wichtige geometrische Begriffe ein. Sind p, q ∈ E zwei Punktein einem Vektorraum E, so bezeichnen wir die Verbindungsstrecke von p und q mit

[p, q] := {p+ t(q − p)|t ∈ [0, 1]} = {(1− t)p+ tq|0 ≤ t ≤ 1}.

Definition 8.4 (Konvexe Mengen)Sei E ein Vektorraum. Eine Teilmenge C ⊆ E heißt konvex, wenn fur je zwei Punktep, q ∈ C stets auch [p, q] ⊆ C ist, d.h. C enthalt mit je zwei Punkten auch derenVerbindungsstrecke.

Beispielsweise sind offene und abgeschlossene Kugeln in einem normierten Raum kon-vex. Sei namlich || || eine Norm auf dem Vektorraum E. Weiter seien der Mittelpunktz ∈ E und ein Radius r > 0 gegeben. Sind dann p, q ∈ Br(z), so gilt fur jedes 0 ≤ t ≤ 1auch

||(1− t)p+ tq − z|| = ||(1− t)p+ tq − (1− t)z − tz|| ≤ (1− t)||p− z||+ t||q − z||≤ (1− t)t+ tr = r,

also ist auch (1−t)p+tq ∈ Br(z) und wir haben [p, q] ⊆ Br(z) eingesehen. Damit ist dieabgeschlossene Kugel Br(z) konvex und analog ist auch die offene Kugel Br(z) konvex.Eine weitreichende Verallgemeinerung konvexer Mengen sind die zusammenhangendenMengen.

Definition 8.5 (Zusammenhangende Mengen)Sei E ein normierter Raum. Eine Teilmenge C ⊆ E heißt zusammenhangend wenn furje zwei offene Mengen U, V ⊆ E mit C ⊆ U ∪ V und U ∩ V ∩ C = ∅ stets U ∩ C = ∅oder V ∩ C = ∅ ist.

In anderen Worten ist eine Menge C ⊆ E nicht zusammenhangend wenn es offeneMengen U, V ⊆ E mit U ∩ C 6= ∅, V ∩ C 6= ∅, U ∩ V ∩ C = ∅ und C ⊆ U ∪ V gibt,wenn man C also in zwei

”getrennte“ Teile zerlegen kann. Das folgende Lemma listet

einige der wichtigsten Eigenschaften zusammenhangender Mengen auf.

Lemma 8.8 (Grundeigenschaften zusammenhangender Mengen)Sei E ein normierter Raum.

(a) Sind C1, C2 ⊆ E zusammenhangend mit C1 ∩ C2 6= ∅, so ist auch C1 ∪ C2 ⊆ Ezusammenhangend.

(b) Sind C ⊆ E zusammenhangend, F ein weiterer normierter Raum und f : C → Fstetig, so ist auch das Bild f(C) ⊆ F zusammenhangend.

(c) Sind C ⊆ E zusammenhangend und M ⊆ E eine Teilmenge mit C ⊆ M ⊆ C, soist auch M zusammenhangend.

266

Page 267: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 6.7.2011

Beweis: (a) Seien U, V ⊆ E offen mit C1 ∪ C2 ⊆ U ∪ V und (C1 ∪ C2) ∩ U ∩ V = ∅.Wegen C1 ∩ C2 6= ∅ existiert ein x ∈ C1 ∩ C2 und wegen x ∈ C1 ∪ C2 ⊆ U ∪ V konnenwir nach eventuellen Vertauschen von U und V auch x ∈ U annehmen. Insbesondereist C1 ∩ U 6= ∅ und C2 ∩ U 6= ∅. Fur i = 1, 2 ist wegen Ci ⊆ C1 ∪ C2 ⊆ U ∪ V ,Ci ∩ U ∩ V ⊆ (C1 ∪ C2) ∩ U ∩ V = ∅ und U ∩ Ci 6= ∅ stets Ci ∩ V = ∅ da Ci

zusammenhangend ist. Somit ist auch (C1 ∪ C2) ∩ V = (C1 ∩ V ) ∪ (C2 ∩ V ) = ∅. Alsoist auch C1 ∪ C2 zusammenhangend.(b) Seien V1, V2 ⊆ F offen mit f(C) ⊆ V1 ∪ V2 und f(C) ∩ V1 ∩ V2 = ∅. Sei i ∈ {1, 2}.Sei x ∈ f−1(Vi). Dann ist f(x) ∈ Vi also existiert ein εx > 0 mit Bεx(f(x)) ⊆ Vi.Da f stetig ist, gibt es weiter ein δx > 0 mit ||f(y) − f(x)|| < εx fur alle y ∈ C mit||y − x|| < δx. Nach §4.Lemma 17.(h) ist die Menge

Ui :=⋃

x∈f−1(Vi)

Bδx(x) ⊆ E

offen. Wir behaupten das dann C ∩ Ui = f−1(Vi) ist. Ist x ∈ f−1(Vi), so haben wirsofort x ∈ Bδx(x)∩C ⊆ Ui ∩C. Nun sei umgekehrt y ∈ C ∩Ui gegeben. Wegen y ∈ Ui

existiert dann ein x ∈ f−1(Vi) mit y ∈ Bδx(x), also ist y ∈ C mit ||y − x|| < δx, d.h.||f(y)− f(x)|| < εx und somit f(y) ∈ Bεx(f(x)) ⊆ Vi. Dies zeigt y ∈ f−1(Vi) und dieseZwischenbehauptung ist bewiesen. Es folgen

C = f−1(f(C)) ⊆ f−1(V1 ∪ V2) = f−1(V1) ∪ f−1(V2) ⊆ U1 ∪ U2

sowie

C ∩ U1 ∩ U2 = f−1(V1) ∩ f−1(V2) = f−1(V1 ∩ V2) = f−1(V1 ∩ V2 ∩ f(C)) = ∅,

und da C zusammenhangend ist folgt f−1(V1) = C∩U1 = ∅ oder f−1(V2) = C∩U2 = ∅,d.h. f(C) ∩ V1 = ∅ oder f(C) ∩ V2 = ∅. Also ist auch f(C) zusammenhangend.(c) Seien U1, U2 ⊆ E offen mit M ⊆ U1 ∪ U2 und M ∩ U1 ∩ U2 = ∅. Dann ist auchC ⊆M ⊆ U1∪U2 und C∩U1∩U2 ⊆M ∩U1∩U2 = ∅, also C∩U1 = ∅ oder C∩U2 = ∅.Sei i ∈ {1, 2} mit C ∩Ui = ∅. Dann ist C ⊆ E\Ui und da E\Ui nach §4.Lemma 17.(d)abgeschlossen ist, ergibt §4.Lemma 16.(b) auch C ⊆ E\Ui, d.h. M ∩ Ui ⊆ C ∩ Ui = ∅.Also ist auch M zusammenhangend.

Wir werden hauptsachlich an offenen, zusammenhangenden Mengen im Rn interessiertsein, und fur offene Mengen gibt es eine aquivalente Beschreibung zusammenhangen-der Mengen, die auch intuitiv einsichtiger ist als die allgemeine Definition des Zu-sammenhangs. Diese Beschreibung beruht letztlich auf der folgenden Bestimmung derzusammenhangenden Teilmengen von R.

Lemma 8.9 (Bestimmung der zusammenhangenden Teilmengen von R)Die zusammenhangenden Teilmengen von R sind genau die Intervalle.

Beweis: ”=⇒” Sei C ⊆ R zusammenhangend. Wir mussen zeigen das C ein Intervallist. Im Fall C = ∅ ist dies klar, wir konnen also C 6= ∅ annehmen. Hierzu zeigen wir

267

Page 268: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 6.7.2011

zunachst das fur je zwei x, y ∈ C mit x < y auch [x, y] ⊆ C ist. Andernfalls gibt esx, y ∈ C mit x < y und z ∈ (x, y) mit z /∈ C. Dann sind die Mengen U := (z,∞) ⊆ Rund V := (−∞, z) ⊆ R offen mit x ∈ V ∩C und y ∈ U ∩C. Außerdem sind U ∩V = ∅und wegen z /∈ C ist auch C ⊆ U ∪ V , d.h. C ist nicht zusammenhangend und wirhaben einen Widerspruch erhalten. Damit ist diese Zwischenbehauptung bewiesen. Nunsetzen wir

a := inf C ∈ R ∪ {−∞} und b := supC ∈ R ∪ {+∞}

und behaupten das (a, b) ⊆ C ⊆ [a, b] ist. Dabei ist C ⊆ [a, b] klar. Ist x ∈ (a, b), sogibt es y, z ∈ C mit a ≤ y < x < z ≤ b und somit ist auch x ∈ C. Folglich gilt auch(a, b) ⊆ C. Damit ist C ein Intervall.”⇐=” Sei C ⊆ R ein Intervall. Angenommen C ware nicht zusammenhangend. Danngibt es offene Mengen U, V ⊆ R mit C∩U 6= ∅, C∩V 6= ∅, C ⊆ U∪V und C∩U∩V = ∅.Wahle a ∈ U ∩ C und b ∈ V ∩ C. Wegen C ∩ U ∩ V = ∅ ist a 6= b, also konnen wirdurch eventuelles Vertauschen von U und V auch a < b annehmen. Da C ein Intervallist, gilt [a, b] ⊆ C ⊆ U ∪ V und wegen C ∩ U ∩ V = ∅ ist die Funktion

f : [a, b] → R;x 7→

{1, x ∈ V,0, x ∈ U

wohldefiniert. Da U und V offen sind, ist f nach I.§13.Lemma 8.(d) stetig. Es geltenf(a) = 0 und f(b) = 1, also existiert nach dem Zwischenwertsatz I.§13.Satz 14 einx ∈ (a, b) mit f(x) = 1/2, im Widerspruch zur Definition von f . Dieser Widerspruchbeweist das f zusammenhangend ist.

Damit kommen wir jetzt zur angekundigten Kennzeichnung der zusammenhangenden,offenen Teilmengen im Rn, und allgemeiner in einem normierten Raum. Wir werdenzeigen, dass eine offene Menge genau dann zusammenhangend ist, wenn sich je zweiihrer Punkte durch einen Streckenzug innerhalb der Menge verbinden lassen.

p

q

U

U U

Zusammenhangend Nicht zusammenhangend

Lemma 8.10 (Zusammenhangende offene Mengen)Sei E ein normierter Raum.

268

Page 269: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 6.7.2011

(a) Jede konvexe Menge C ⊆ E ist zusammenhangend.

(b) Eine offene Menge U ⊆ E in E ist genau dann zusammenhangend, wenn sich jezwei Punkte p, q ∈ U durch einen Streckenzug in U verbinden lassen, es soll alsop = p0, p1, . . . , pr = q in U geben so, dass [pi−1, pi] ⊆ U fur jedes 1 ≤ i ≤ r gilt.

Beweis: Sind p, q ∈ E so ist die Abbildung

f : [0, 1] → E; t 7→ (1− t)p+ tq

stetig denn fur alle t, s ∈ [0, 1] gilt

||f(t)− f(s)|| = ||(s− t)p+ (t− s)q|| = |t− s| · ||q − p||.

Da das Intervall [0, 1] nach Lemma 9 zusammenhangend ist, ist nach Lemma 8.(b) auch[p, q] = f([0, 1]) zusammenhangend.(a) Angenommen C ware nicht zusammenhangend. Dann gibt es offene Mengen U, V ⊆E mit C ⊆ U ∪ V , C ∩ U ∩ V = ∅ und C ∩ U 6= ∅, C ∩ V 6= ∅. Wahle p ∈ C ∩ U undq ∈ C ∩ V . Da C konvex ist, gilt [p, q] ⊆ C ⊆ U ∪ V , [p, q] ∩ U ∩ V ⊆ C ∩ U ∩ V = ∅und p ∈ [p, q]∩U , q ∈ [p, q]∩V im Widerspruch zum Zusammenhang von [p, q]. Damitist C zusammenhangend.(b) ”=⇒” Seien p, q ∈ U . Wir definieren die Menge

V :=

x ∈ U∣∣∣∣∣∣

Es gibt n ∈ N und p0, . . . , pn ∈ U mitp0 = p, pn = x und [pi−1, pi] ⊆ U furalle 1 ≤ i ≤ n

⊆ U

mit p ∈ V und behaupten das V ⊆ E offen ist. Sei x ∈ V . Dann existieren p0, . . . , pn ∈U mit p0 = p, pn = x und [pi−1, pi] ⊆ U fur jedes 1 ≤ i ≤ n. Da U offen ist, gibt esweiter ein ε > 0 mit Bε(x) ⊆ U . Da die Kugel Bε(x) konvex ist, ist fur jedes y ∈ Bε(x)auch [x, y] ⊆ Bε(x) ⊆ U , also y ∈ V . Dies zeigt Bε(x) ⊆ V , und somit ist V offen.

Weiter sei W := U\V , und wir behaupten das auch W offen ist. Sei namlich x ∈ W .Wieder da U offen ist existiert ein ε > 0 mit Bε(x) ⊆ U . Ware nun Bε(x) ∩ V 6= ∅, soexistiert ein y ∈ V ∩ Bε(x). Wahle n ∈ N und p0, . . . , pn ∈ U mit p0 = p, pn = y und[pi−1, pi] ⊆ U fur 1 ≤ i ≤ n. Da Bε(x) konvex ist, gilt aber auch [y, x] ⊆ Bε(x) ⊆ U ,also ist auch x ∈ V , im Widerspruch zu x ∈ W . Dies zeigt Bε(x) ⊆ W und somit istauch W offen. Wegen V ∩W = ∅, U = V ∪W und p ∈ V ergibt der Zusammenhang vonU auch W = ∅ also V = U . Insbesondere ist q ∈ V und somit existiert ein Streckenzugvon p nach q in U .”⇐=” Angenommen U ware nicht zusammenhangend. Dann gibt es offene MengenV,W ⊆ E mit U ⊆ V ∪ W , U ∩ V ∩ W = ∅ und U ∩ V 6= ∅, U ∩ W 6= ∅. Wahlep ∈ U ∩ V und q ∈ U ∩W . Nach unserer Annahme gibt es n ∈ N und p0, . . . , pn ∈ Umit p0 = p, pn = q und [pi−1, pi] ⊆ U fur jedes 1 ≤ i ≤ n. Es ist p0 = p ∈ V .Sei nun 1 ≤ i ≤ n und es gelte pi−1 ∈ V . Dann haben wir pi−1 ∈ [pi−1, pi] ∩ V ,

269

Page 270: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 6.7.2011

[pi−1, pi] ⊆ U ⊆ V ∪W und [pi−1, pi] ∩ V ∩W ⊆ U ∩ V ∩W = ∅ und da [pi−1, pi]zusammenhangend ist muss [pi−1, pi]∩W = ∅, also pi ∈ [pi−1, pi] ⊆ V und somit pi ∈ V .Induktiv folgt damit letztlich q = pn ∈ V im Widerspruch zur Annahme q ∈ W . Alsoist U zusammenhangend.

8.4 Kurven und Richtungsableitungen

Als Vorbereitung auf Ableitungen in mehreren Variablen wollen wir erst einmal Kurvenim Rn behandeln wobei n ∈ N mit n ≥ 1 ist. Eine Kurve im Rn ist dabei einfach eineAbbildung

f : I → Rn

wobei I ⊆ R ein Intervall ist. Graphisch werden Kurven ublicherweise durch Angabeder Bildmenge {f(t)|t ∈ I} und nicht durch ihren Graphen dargestellt, wie etwa in denfolgenden Beispielen.

–1

–0.5

0.5

1

–1 –0.5 0.5 1

–1

–0.5

0.5

1

–1 –0.50.5 1–1

1

f(t) =

(sin(2t)sin(3t)

)f(t) =

sin(t)sin(2t)sin(3t)

Eine solche Kurve hat die Form

f(t) =

f1(t)...

fn(t)

wobei die Komponentenfunktionen

f1, . . . , fn : I → R

270

Page 271: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 6.7.2011

gewohnliche reellwertige Funktionen von R nach R sind. Wir nennen eine auf einemIntervall I ⊆ R definierte Kurve f : I → Rn differenzierbar, wenn alle ihre Komponen-tenfunktionen fi : I → R fur i = 1, . . . , n differenzierbar sind und stetig differenzierbarwenn all ihre Komponentenfunktionen stetig differenzierbar sind. Die Ableitung von fin einem Punkt t ∈ I wird dann als der Vektor

f ′(t) :=

f ′1(t)...

f ′n(t)

∈ Rn

definiert. Man nennt den Vektor f ′(t) dann auch den Tangentialvektor an die Kurve fzum Zeitpunkt t beziehungsweise an den Punkt f(t). Um zu sehen, dass dieser Vektortatsachlich tangential an die Kurve ist, schreiben wir alle Ableitungen der Komponen-tenfunktionen als Grenzwerte

f ′i(t) = limh→0

fi(t+ h)− fi(t)

h, i = 1, . . . , n.

Da der Funktionsgrenzwert von Vektoren wie schon in §4.5 gesehen einfach der Vektorbestehend aus den Grenzwerten der Komponentenfunktionen ist, konnen wir dann auch

f ′(t) = limh→0

1

h

f1(t+ h)

...fn(t+ h)

f1(t)...

fn(t)

= lim

h→0

1

h(f(t+ h)− f(t))

schreiben. Diesem Grenzwert entnehmen wir zwei Folgerungen. Zum einen ist die Ab-leitung f ′(t) einer Kurve wieder eine Anderungsrate, ist beispielsweise f(t) die Bahn-kurve eines Masseteilchens, so ist f ′(t) die Anderungsrate dieser Bahnkurve, also dieGeschwindigkeit des Teilchens als Vektor. Außerdem ist f ′(t) der Grenzwert von Se-kanten an die Kurve, also wirklich tangential an die Kurve.

Nehmen wir beispielsweise einmal die Kurve

f : R → R2; t 7→(

sin(2t)sin(3t)

)aus dem obigen Beispiel. Die beiden Komponentenfunktionen sind hier

f1(t) = sin(2t) und f2(t) = sin(3t)

mit den Ableitungenf ′1(t) = 2 cos(2t), f ′2(t) = 3 cos(3t),

und der Tangentenvektor wird zu

f ′(t) =

(2 cos(2t)3 cos(3t)

).

271

Page 272: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 6.7.2011

Rechnerisch stellt uns dies also vor keine neuen Probleme. Auch die Integration vonKurven laßt sich durch Zuruckgehen auf die Komponentenfunktionen definieren.

Definition 8.6: Seien n ∈ N mit n ≥ 1 und a, b ∈ R mit a < b. Eine Kurve f :[a, b] → Rn heißt Rieman-integrierbar wenn jede Komponentenfunktion fi : [a, b] → Rfur 1 ≤ i ≤ n Rieman-integrierbar ist. In diesem Fall definieren wir∫ b

a

f(t) dt :=

(∫ b

a

fi(t) dt

)1≤i≤n

∈ Rn.

Ist f : [a, b] → Rn eine Rieman-integrierbare Kurve, so kann man das Integral auchwieder als einen Grenzwert von Riemansummen beschreiben. Fur eine Zerteilung ζ =(t0, . . . , tm; s1, . . . , sm) von [a, b] definieren wir die Riemansumme

R(f ; ζ) :=m∑

i=1

(ti − ti−1) · f(si) ∈ Rn.

Ist (ζk)k∈N eine Folge von Zerteilungen von [a, b] mit (δ(ζk))k∈N −→ 0, so gilt nach§2.Lemma 3 fur jedes 1 ≤ i ≤ n

limk→∞

R(fi; ζk) =

∫ b

a

fi(t) dt

und damit folgt auch

limk→∞

R(f ; ζk) = limk→∞

(R(fi; ζk))1≤i≤n =

(∫ b

a

fi(t) dt

)1≤i≤n

=

∫ b

a

f(t) dt.

Auch fur dieses Integral haben wir eine Dreiecksungleichung, die wir der Einfachheithalber nur fur stetige Kurven formulieren und beweisen.

Lemma 8.11 (Dreiecksungleichung fur Integrale von Kurven)Seien n ∈ N mit n ≥ 1, a, b ∈ R mit a < b und f : [a, b] → Rn stetig. Dann gilt furjede Norm || || auf dem Rn die Dreiecksungleichung∣∣∣∣∣∣∣∣ ∫ b

a

f(t) dt

∣∣∣∣∣∣∣∣ ≤ ∫ b

a

||f(t)|| dt.

Beweis: Nach §2.Satz 8 sind f und ||f || Rieman-integrierbar. Sei (ζk)k∈N eine Folgevon Zerteilungen von [a, b] mit (δ(ζk))k∈N −→ 0. Fur jedes k ∈ N gilt dann mit ζk =(t0, . . . , tm; s1, . . . , sm)

||R(f ; ζk)|| =∣∣∣∣∣∣∣∣ m∑

i=1

(ti − ti−1)f(si)

∣∣∣∣∣∣∣∣ ≤ m∑i=1

||f(si)||(ti − ti−1) = R(||f ||; ζk).

272

Page 273: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 6.7.2011

Es folgt∣∣∣∣∣∣∣∣ ∫ b

a

f(t) dt

∣∣∣∣∣∣∣∣ =

∣∣∣∣∣∣∣∣ limk→∞

R(f ; ζk)

∣∣∣∣∣∣∣∣ = limk→∞

||R(f ; ζk)|| ≤ limk→∞

R(||f ||; ζk) =

∫ b

a

||f(t)|| dt.

Damit ist auch diese Form der Dreiecksungleichung bewiesen.

Damit erhalten wir auch eine Version des Mittelwertsatzes.

Lemma 8.12: Seien n ∈ N mit n ≥ 1, a, b ∈ R mit a < b und f : [a, b] → Rn einestetig differenzierbare Funktion. Dann gilt fur jede Norm || || auf dem Rn

||f(b)− f(a)|| ≤ (b− a) · supt∈[a,b]

||f ′(t)||.

Beweis: Durch komponentenweise Anwendung von §2.Satz 9 erhalten wir

f(b)− f(a) =

∫ b

a

f ′(t) dt.

Setzen wir also M := sup{||f ′|| : t ∈ [a, b]}, so ergibt Lemma 11

||f(b)− f(a)|| =∣∣∣∣∣∣∣∣ ∫ b

a

f ′(t) dt

∣∣∣∣∣∣∣∣ ≤ ∫ b

a

||f ′(t)|| dt ≤∫ b

a

M dt = (b− a)M.

Tatsachlich gilt das Lemma auch unter der schwacheren Voraussetzung das f stetigund auf (a, b) differenzierbar ist, der Beweis fur eine allgemeine Norm erfordert dannaber ein zusatzliches Hilfsmittel das wir hier nicht zur Verfugung haben. Dieses Lem-ma ist ein Ersatz fur den eindimensionalen Mittelwertsatz, man hat eben nur nocheine

”Mittelwertungleichung“ wie im Lemma. Es gibt fur Kurven tatsachlich keinen

Mittelwertsatz wie wir ihn fur Funktionen in einer Variablen gewohnt sind, man kannzwar auf jede einzelne Komponente den gewohnlichen Mittelwertsatz I.§14.Satz 10 an-wenden, allerdings erhalten wir dabei n verschiedene Zwischenstellen in (a, b), fur jedeKomponente eine.

Wir wollen jetzt zu den sogenannten Richtungsableitungen kommen, und erinnernzunachst an die in §1.2 eingefuhrten partiellen Ableitungen. Wir hatten wieder n ∈ Nmit n ≥ 1, eine Menge U ⊆ Rn und eine reellwertige Funktion f : U → R. Um diei-te partielle Ableitung von f in einem Punkt a ∈ U zu definieren, hatten wir alleArgumente xj fur j 6= i konstant auf xj = aj gesetzt, und die dadurch entstehendeeindimensionale Funktion von xi = x wurde in x = ai abgeleitet

∂f

∂xi

∣∣∣∣a

=d

dx

∣∣∣∣x=ai

f(a1, . . . , ai−1, x, ai+1, . . . , an).

273

Page 274: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 6.7.2011

Diese Definition war dabei nur fur diejenigen Punkte a ∈ U sinnvoll bei denen dasobige Argument fur x nahe bei ai uberhaupt im Definitionsbereich U liegt. Um dieseProblematik zu vermeiden, betrachten wir im folgenden nur auf offenen Mengen U ⊆ Rn

definierte Funktionen, denn dann gibt es fur a ∈ U ein ε > 0 so, dass fur jeden Punktx ∈ Rn mit ||x− a||∞ < ε stets auch x ∈ U ist, d.h. fur x ∈ R mit |x− ai| < ε ist

(a1, . . . , ai−1, x, ai+1, . . . , an) ∈ U.

Beachte das wir diesen Punkt unter Verwendung der Standardbasis e1, . . . , en des Rn

auch als

(a1, . . . , ai−1, x, ai+1, . . . , an) = a+ tei

schreiben konnen wobei t = x− ai ist. Die partielle Ableitung wird in dieser Notationzu

∂f

∂xi

∣∣∣∣a

=d

dt

∣∣∣∣t=0

f(a+ tei).

Die partiellen Ableitungen einer Funktion f entstehen durch Ableiten nach einer derKoordinatenachsen, und die nun einzufuhrenden Richtungsableitungen verallgemeinerndies indem langs einer beliebigen Richtung abgeleitet wird. Bei dieser Gelegenheit kannman dann auch gleich vektorwertige Funktionen f zulassen.

Definition 8.7 (Richtungsableitungen)Seien n,m ∈ N mit n,m ≥ 1, U ⊆ Rn offen, x ∈ U und f : U → Rm eine Funktion.Weiter sei v ∈ Rn ein Vektor. Die Richtungsableitung von f in Richtung v im Punkt xist dann der Vektor

∂vf(x) :=d

dt

∣∣∣∣t=0

f(x+ tv),

d.h. wir bilden die Kurve h(t) := f(x+ tv) und leiten diese in t = 0 ab. Existiert dieseAbleitung, so nennt man f im Punkt x in Richtung v differenzierbar. Leider gibt eskeine allgemein ubliche Schreibweise fur die Richtungsableitung, statt

”∂vf(x)“ konnen

Ihnen beispielsweise auch die Schreibweisen

∂vf(x) =∂f

∂v(x) = Dvf(x),

und diverse andere Varianten begegnen.

Die partiellen Ableitungen sind dann die Richtungsableitungen in Richtung der ka-nonischen Basisvektoren e1, . . . , en des Rn. Insbesondere sind damit die partiellen Ab-leitungen auf vektorwertige Funktionen f : U → Rm verallgemeinert, konkret ist furf(x) = (f1(x), . . . , fm(x)) dabei

∂f

∂xi

∣∣∣∣a

=

(∂fj

∂xi

∣∣∣∣a

)1≤j≤m

,

274

Page 275: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 6.7.2011

was wir meist als Spaltenvektor auffassen werden. Wir wollen zwei Beispiele rechnen.Zunachst sei

f(x, y) = x2 + y2 + sinx und v =

(11

).

Es ist

f

((xy

)+ t

(11

))= f(x+ t, y + t) = (x+ t)2 + (y + t)2 + sin(x+ t),

und leiten wir dies nach t ab, so ergibt sich fur die Richtungsableitung in Richtung vim Punkt (x, y)

∂vf(x, y) = 2(x+ t) + 2(y + t) + cos(x+ t)

∣∣∣∣t=0

= 2x+ 2y + cosx,

wobei wir die in diesem Zusammenhang ubliche Schreibweise

h(t)

∣∣∣∣t=t0

:= h(t0)

verwenden. Als ein zweites Beispiel nehmen wir die Funktion

f : U := {(x, y) ∈ R2|y > 0} → R2;

(xy

)7→(xyxy

)und die Richtung v :=

(12

).

Diesmal rechnen wir

f(x+ t, y + 2t) =

(2t2 + (2x+ y)t+ xy

x+ty+2t

),

also

∂vf(x, y) =

(4t+ 2x+ y

y−2x(y+2t)2

) ∣∣∣∣∣t=0

=

(2x+ y

y−2xy2

).

Als ein etwas komplizierteres Beispiel denken wir uns Rn×n = Rn2und wollen die

Richtungsableitungen der Determinante det : Rn×n → R berechnen. Als Punkt in demabgeleitet wird, wollen wir die n× n-Einheitsmatrix En verwenden. Sei A ∈ Rn×n diebetrachtete Richtung. Fur jedes t ∈ R\{0} gilt dann nach §5.Satz 2

det(En + tA) = tn det

(1

t+ A

)= tnχ−A

(1

t

)= 1 + tr(A)t+ · · ·+ det(A)tn,

und die Ableitung in t = 0 wird zu

∂A det(En) = tr(A).

275

Page 276: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 6.7.2011

Auch die Richtunsableitungen sind damit rechnerisch unproblematisch. An dieser Stellewollen wir auch noch kurz die Interpretation der partiellen Ableitungen als Tangen-tenvektoren erwahnen. Angenommen wir haben n ∈ N mit n ≥ 1 und eine Funktionf : U → R auf einer offenen Menge U ⊆ Rn. Weiter sei x ∈ U ein Punkt, in dem allepartiellen Ableitungen

∂f

∂x1

(x), . . . ,∂f

∂xn

(x)

existieren. Fur jedes 1 ≤ i ≤ n haben wir dann die Kurve

gi : I → Rn+1; t 7→ (x+ tei, f(x+ tei)) =

x1...

xi + t...xn

f(x1, . . . , xi + t, . . . , xn)

,

die den Graphen von f in Richtung der i-ten Koordinatenachse durchlauft. Dabeiist I = (−ε, ε) ein ausreichend kleines, offenes Intervall um den Punkt 0. Da dieseKurve ganz im Graphen von f verlauft sind die Tangentenvektoren der Kurve gi auchtangential am Graphen von f . Der Tangentialvektor in t = 0 berechnet sich zu

g′i(0) =

0...1...0

∂f∂xi

(x)

,

und wir erhalten n Vektoren10...0

∂f∂x1

(x)

, . . . ,

0...01

∂f∂x1

(x)

im Rn+1. Diese Vektoren sind offenbar linear unabhangig, und erzeugen eine Hyperebe-ne im Rn+1. Diese Hyperebene ist die sogenannte Tangentialebene an die Funktion f imPunkt x ∈ U . Dabei unterscheidet man ublicherweise nicht zwischen diesem Teilraumdes Rn+1 und dem durch (x, f(x)) gehenden, verschobenen, affinen Teilraum des Rn+1.Besonders anschaulich ist dies im Fall n = 2 zweier Variablen. Dann ist der Graph vonf eine Flache im R3 und die Tangentialebene ist eine wirkliche Ebene, namlich⟨ 1

0∂f∂x

(x, y)

,

01

∂f∂y

(x, y)

276

Page 277: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 6.7.2011

beziehungsweise xy

f(x, y)

+

⟨ 10

∂f∂x

(x, y)

,

01

∂f∂y

(x, y)

⟩ .Nehmen wir als ein Beispiel einmal die Funktion

f : R2 → R; (x, y) 7→ sin(xy) + x2 − y2.

Die partiellen Ableitungen sind dann

∂f

∂x(x, y) = y cos(xy) + 2x und

∂f

∂y(x, y) = x cos(xy)− 2y

und die Tangentialebene wird zu xy

sin(xy) + x2 − y2

+

⟨ 10

y cos(xy) + 2x

,

01

x cos(xy)− 2y

⟩ .Beispielsweise ist die Tangentialebene bei (x, y) = (1/3, π) gleich⟨ 1

0π2

+ 23

,

01

16− 2π

⟩ .

–4

–2

0

2

4

t

–20

24

68

s

–60

–40

–20

0

20

–4

–2

0

2

4

6

t

–4

–2

0

2

4

6

s

–30

–20

–10

0

10

20

30

(x, y) =(

13, π)

(x, y) = (1, 1)

277

Page 278: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 6.7.2011

8.5 Die totale Ableitung

Wir kommen jetzt zur Ableitung von Funktionen f : Rn → Rm. Bei der Einfuhrungder eindimensionalen Ableitung in I.§14 hatten wir die drei Interpretationen des eindi-mensionalen Ableitungsbegriffs erwahnt:

1. Die Ableitung als Anderungsrate, wie zum Beispiel die Beschleunigung als Ande-rungsrate der Geschwindigkeit.

2. Die geometrische Interpretation der Ableitung als Tangentensteigung.

3. Schließlich konnten wir die Ableitung auch noch als eine lineare Approximationder Funktion auffassen.

Die ersten beiden dieser Interpretation sind uns auch in diesem Kapitel bereits wieder-begegnet, die Ableitung einer Kurve konnten wir sowohl als vektorielle Anderungsra-te deuten, als auch geometrisch als einen Tangentenvektor auffassen. Fur Funktionenf : Rn → R haben wir im vorigen Abschnitt die eindimensionale Tangente zu einerTangentialebene verallgemeinert. Als der wichtigste Standpunkt wird sich nun unseredritte Interpretation herausstellen, diese fuhrt direkt zum allgemeinen Ableitungsbe-griff.

Definition 8.8 (Die totale Ableitung)Seien n,m ∈ N mit n,m ≥ 1, U ⊆ Rn offen und f : U → Rm eine Funktion. Wir nennenf in einem Punkt x0 ∈ U differenzierbar, wenn es eine lineare Abbildung T : Rn → Rm

gibt so, dass fur jeden Vektor h ∈ Rn mit x0 + h ∈ U stets

f(x0 + h) = f(x0) + Th+ τ(h)

gilt, wobei der Approximationsfehler τ : U − x0 → Rm die Bedingung

limh→0

||τ(h)||||h||

= 0

erfullt.

Da alle Normen im Rn beziehungsweise Rm aquivalent sind, kommt es auf die hierkonkret verwendeten Normen nicht an. Wir wollen also genau wie im eindimensionalenFall die Funktion f lokal als

f(x0 + h) = Linearer Teil + Fehler

schreiben, wobei der Fehler τ(h) zu ||h|| proportional ist und wir die Proportionalitats-konstante beliebig klein machen konnen. Wollen wir die Fehlerfunktion τ nicht explizitbenennen, so kann man in der Definition aquivalent auch

limh→0

||f(x+ h)− f(x)− Th||||h||

= 0

278

Page 279: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 6.7.2011

schreiben. Beachte das dieser Grenzwert immer sinnvoll ist, da die Menge U offen istgibt es namlich einen Radius ε > 0 mit Bε(x0) ⊆ U , d.h. τ(h) ist fur jedes h ∈ Rn mit||h|| < ε definiert. Verwenden wir im Rm die Norm || ||∞ so sehen wir sofort das dieFunktion f genau dann in einem Punkt x ∈ U differenzierbar ist, wenn samtliche Kom-ponentenfunktionen f1, . . . , fm : U → R im Punkt x differenzierbar sind. In Aussagenuber Differenzierbarkeit kann man sich daher meist auf den Fall m = 1 reellwertigerFunktionen beschranken. Insbesondere ist damit eine Kurve f : I → Rn definiert aufeinem offenen Intervall I ⊆ R genau dann in t ∈ I im Sinne der obigen Definitiondifferenzierbar wenn sie es im Sinne des vorigen Abschnitts ist. Bald werden wir sehendas auch die Ableitungen in einem geeigneten Sinn

”ubereinstimmen“.

Wir wollen uns ein paar einfache einleitende Beispiele anschauen.

1. Konstante Funktionen sind trivialerweise in jedem Punkt ihres Definitionsbe-reichs differenzierbar, wobei fur die lineare Abbildung T stets T = 0 verwendetwerden kann.

2. Sei f : R2 → R; (x, y) 7→ xy. Schreibe x0 = (a, b) und h = (u, v). Dann ist

f(x0 + h) = f(a+ u, b+ v) = (a+ u) · (b+ v) = ab+ av + bu+ uv

= f(a, b) + T (u, v) + τ(u, v)

mit der linearen Abbildung T (u, v) := av + bu und dem Fehler τ(u, v) = uv. Fur(u, v) 6= (0, 0) haben wir dabei

|τ(u, v)|||(u, v)||∞

=|u| · |v|

max{|u|, |v|}= min{|u|, |v|} ≤ ||(u, v)||∞,

und somit gilt

limh→0

|τ(h)|||h||∞

= 0.

Damit ist f differenzierbar, bezuglich der linearen Abbildung T (u, v) = av + bu.

3. Ist n,m ∈ N mit n,m ≥ 1, f : Rn → Rm linear und x0 ∈ Rn, so gilt fur jedesh ∈ Rn auch f(x0 +h) = f(x0)+ f(h), also ist f in x0 differenzierbar mit T = f .

4. Seien jetzt p, q, r ∈ N mit p, q, r ≥ 1 und betrachte die Matrixmultiplikation

µ : Rp×q × Rq×r → Rp×r; (A,B) 7→ A ·B.

Dabei denken wir uns Rp×q × Rq×r = Rpq+qr und Rp×r = Rpr, indem die Matri-xeintrage in irgendeiner festen Reihenfolge in einen entsprechend grossen Vektorgeschrieben werden. Wir wollen die Differenzierbarkeit von µ in einem Punkt(A,B) ∈ Rp×q×Rq×r untersuchen. Als Vektor h nehme h = (X, Y ) ∈ Rp×q×Rq×r.Es ist

µ((A,B)+(X, Y )) = µ(A+X,B+Y ) = (A+X)·(B+Y ) = AB+AY+XB+XY

= µ(A,B) + T (X, Y ) + τ(X, Y )

279

Page 280: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 6.7.2011

mit T (X, Y ) = AY + XB und dem Fehler τ(X, Y ) = XY . Fur (X, Y ) 6= (0, 0)gelten offenbar

||(X, Y )||∞ = max{||X||∞, ||Y ||∞} und ||XY ||∞ ≤ q||X||∞||Y ||∞,

also folgt analog zum ersten Beispiel

||τ(X, Y )||∞||(X, Y )||∞

≤ qmin{||X||∞, ||Y ||∞},

also limh→0 ||τ(h)||∞/||h||∞ = 0. Damit ist µ bezuglich des obigen T in (A,B)differenzierbar.

5. Zwei Spezialfalle des eben gerechneten Beispiels werden wichtig sein. Sei wiedern ∈ N mit n ≥ 1 gegeben. Zum einen ist die Abbildung

f : R× Rn → Rn; (λ, u) 7→ λu

in jedem Punkt (λ, x) ∈ R×Rn differenzierbar mit zugehoriger linearer AbbildungT (θ, u) = λu+ θx. Zum anderen ist das Skalarprodukt

〈 | 〉 : Rn × Rn → R

in jedem Punkt (x, y) ∈ Rn × Rn differenzierbar mit zugehoriger linearer Abbil-dung T (u, v) = 〈x|v〉+ 〈u|y〉.

Wir kommen jetzt zu einigen theoretischen Tatsachen, die uns letztlich auch die Be-handlung interessanterer Beispiele erlauben werden. Beachte das wir bisher nur vonder

”Differenzierbarkeit“ der Funktion f im Punkt x0 sprechen, nicht aber von der

entsprechenden Ableitung. Diese soll die lineare Abbildung T in der Definition derDifferenzierbarkeit sein, wir wissen aber bisher noch nicht ob diese eindeutig festgelegtist. All dies wird im folgenden Lemma geklart.

Lemma 8.13: Seien n ∈ N mit n ≥ 1, U ⊆ Rn offen und f : U → Rm eine in einemPunkt x ∈ U differenzierbare Funktion. Dann gelten:

(a) Die Funktion f ist in x auch stetig.

(b) Es gibt genau eine lineare Abbildung T =: f ′(x) : Rn → Rm mit

limh→0

||f(x+ h)− f(x)− Th||||h||

= 0.

(c) Fur jeden Vektor v ∈ Rn existiert die Richtungsableitung von f in Richtung v imPunkt x und es ist ∂vf(x) = f ′(x)v.

280

Page 281: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 6.7.2011

Beweis: Es gibt eine lineare Abbildung T : Rn → Rm so, dass fur alle h ∈ Rn mitx+ h ∈ U stets

f(x+ h) = f(x) + Th+ τ(h) mit limh→0

||τ(h)||||h||

= 0 gilt.

(a) Wegen

limh→0

||τ(h)|| = limh→0

||τ(h)||||h||

· ||h|| = 0 ist limh→0

τ(h) = 0.

Da die lineare Abbildung T : Rn → Rm stetig ist (jede Komponente von T ist ja einelineare Formel in x1, . . . , xn), folgt somit auch

limh→0

f(x+ h) = limh→0

(f(x) + Th+ τ(h)) = f(x),

d.h. f ist in x stetig.(c) Sei 0 6= v ∈ Rn. Dann gibt es ein ε > 0 mit x + tv ∈ U fur alle t ∈ (−ε, ε) und furjedes t ∈ (−ε, ε) ist

f(x+tv) =f(x)+T (tv)+τ(tv) =f(x)+tTv+τ(tv),undf(x+ tv)− f(x)

t= Tv+

τ(tv)

t.

Dabei gilt

limt→0

∣∣∣∣∣∣∣∣τ(tv)t∣∣∣∣∣∣∣∣ = lim

t→0

||τ(tv)||||tv||

· ||v|| = limh→0

||τ(h)||||h||

· ||v|| = 0,

und somit ist

∂vf(x) = limt→0

f(x+ tv)− f(x)

t= lim

t→0

(Tv +

τ(tv)

t

)= Tv.

(b) Klar nach (c).

Die in Teil (a) des Beweises verwendete Stetigkeit linearer Abbildungen T : Rn → Rm

kann man naturlich auch direkter einsehen, tatsachlich ist sogar jede lineare AbbildungT : Rn → E in einen beliebigen normierten Raum E stetig. Setzen wir namlich

C := ||Te1||+ · · ·+ ||Ten|| ≥ 0,

so gilt fur jedes x ∈ Rn stets

||Tx|| =∣∣∣∣∣∣∣∣ n∑

i=1

xiTei

∣∣∣∣∣∣∣∣ ≤ n∑i=1

|xi| · ||Tei|| ≤

(n∑

i=1

||Tei||

)||x||∞ = C||x||∞,

und nach §4.Lemma 15 ist T stetig.

281

Page 282: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Mittwoch 6.7.2011

Wir werden die Ableitung f ′(x) einer Funktion f in einem Punkt x jetzt als einelineare Abbildung f ′(x) : Rn → Rm definieren. Dass die Ableitung von f in x da-mit selbst eine Funktion ist, fuhrt zu einigen Schreibweisen die zunachst ungewohntausschauen. Beispielsweise wird ein Ausdruck f ′(x)(u) bedeuten

”Wende die lineare

Abbildung f ′(x) : Rn → Rm auf den Vektor u ∈ Rn an“. Da bei der Anwendunglinearer Abbildungen die Klammern um das Argument meistens weggelassen werden,werden wir dies oft auch in der kurzeren Form f ′(x)u = f ′(x)(u) schreiben. Erinnernwir uns daran das wir in I.§12.2 eingesehen hatten, dass man jede lineare AbbildungRn → Rm auch als eine m × n-Matrix interpretieren kann, so konnen wir uns auchdie Ableitung f ′(x) als eine solche m × n-Matrix denken, dies ist dann die gleich zudefinierende Jacobi-Matrix.

Definition 8.9 (Die Jacobi-Matrix)Seien n,m ∈ N mit n,m ≥ 1, U ⊆ Rn offen und f : U → Rm eine in einem Punktx ∈ U differenzierbare Funktion. Dann ist die lineare Abbildung T : Rn → Rm mit

limh→0

||f(x+ h)− f(x)− Th||||h||

= 0

eindeutig bestimmt, und heißt die Ableitung, oder totale Ableitung, von f in x, ge-schrieben als f ′(x). Weiter gibt es nach I.§12.2 eine eindeutig bestimmte m×n-MatrixJ mit

f ′(x)h = Jh

fur jedes h ∈ Rn genannt die Jacobi-Matrix von f in x. Auch fur die Jacobi-Matrixverwenden wir das Symbol f ′(x).

Unsere oben behandelten Beispiele konnen wir in dieser Notation auch in der folgendenForm schreiben:

1. Ist f : U → Rm konstant, so ist f ′(x) = 0 fur jedes x ∈ U .

2. Ist f : R2 → R; (x, y) 7→ xy die Multiplikation, so gilt

f ′(x, y)(u, v) = xv + yu

fur alle x, y, u, v ∈ R.

3. Ist f : Rn → Rm linear, so gilt f ′(x) = f fur jedes x ∈ Rn.

4. Ist µ : Rp×q × Rq×r → Rp×r; (A,B) 7→ AB die Matrixmultiplikation, so gilt

µ′(A,B)(X, Y ) = AY +XB

fur alle A,X ∈ Rp×q, B, Y ∈ Rq×r.

282

Page 283: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

Als nachsten Schritt wollen wir die Jacobi-Matrix explizit berechnen. Erinnern Sie sichhierzu daran, dass die Matrix A = (aij)1≤i≤m,1≤j≤n einer linearen Abbildung T : Rn →Rm durch die Bedingungen

Tej =m∑

i=1

aijej

fur 1 ≤ j ≤ n festgelegt ist, d.h. die Spalten von A sind die Bilder der Standardbasisunter T .

Lemma 8.14 (Bestimmung der Jacobi-Matrix)Seien n,m ∈ N mit n,m ≥ 1, U ⊆ Rn offen und f : U → Rm eine in einem Punktx ∈ U differenzierbare Abbildung. Dann existieren in x auch samtliche partiellen Ab-leitungen der Komponenten von f und die Jacobi-Matrix f ′(x) ∈ Rm×n ist gegebenals

f ′(x) =

∂f1

∂x1(x) · · · ∂f1

∂xn(x)

.... . .

...∂fm

∂x1(x) · · · ∂fm

∂xn(x)

.

Beweis: Nach Lemma 13.(c) existiert fur jedes 1 ≤ j ≤ n die Richtungsableitung

∂f

∂xj

(x) = ∂ej(f)(x) = f ′(x)ej,

d.h. die Spalten der Jacobi-Matrix sind die partiellen Ableitungen von f in x wiebehauptet.

Vorlesung 23, Freitag 8.7.2011

In der letzten Sitzung hatten wir die totale Ableitung einer Funktion f : U → Rm ein-gefuhrt, wobei U ⊆ Rn eine offene Menge ist. In einem Punkt x ∈ U war die Ableitungf ′(x) eine lineare Abbildung Rn → Rm, die explizit durch die Richtungsableitungen

f ′(x)v = ∂vf(x)

fur v ∈ Rn gegeben war. Beschreiben wir die lineare Abbildung f ′(x) durch eine Matrix,so erhielten wir die Jacobi-Matrix J von f an der Stelle x. Wir hatten gesehen das dieEintrage der Jacobi-Matrix gerade die partiellen Ableitungen von f in x sind, in deri-ten Spalte von J stehen die Ableitungen der Komponenten von f nach xi.

Mit dieser Beobachtung stehen wir kurz davor die Ableitung auch kompliziertererFunktionen ausrechnen zu konnen. Eine wichtige Zutat fehlt uns allerdings noch, wir

283

Page 284: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

haben noch kein vernunftiges Kriterium die Differenzierbarkeit einer Funktion f nach-zuweisen. Prinzipiell konnten wir naturlich hierzu die Definition verwenden, diese laßtsich allerdings oft nicht direkt nachweisen. Wie sich herausstellt sind Funktionen derensamtliche Komponenten durch Formeln in den Grundfunktionen gegeben sind immerdifferenzierbar. Fur partielle Ableitungen wissen wir dies schon, und das folgende Lem-ma erlaubt es uns diese Tatsache auf die allgemeine Differenzierbarkeit auszudehnen.

Lemma 8.15 (Hinreichendes Kriterium fur Differenzierbarkeit)Seien n,m ∈ N mit n,m ≥ 1, U ⊆ Rn offen und f : U → Rm eine Funktion, derensamtliche partielle Ableitungen ∂fj/∂xi fur 1 ≤ j ≤ m, 1 ≤ i ≤ n in ganz U existieren.Weiter sei x ∈ U und die partiellen Ableitungen ∂fj/∂xi seien fur alle 1 ≤ j ≤ m,1 ≤ i ≤ n in x stetig. Dann ist f in x auch differenzierbar.

Beweis: Wir konnen m = 1 annehmen und verwenden auf dem Rn die Norm || ||∞.Sei ε > 0 gegeben. Da U offen ist und die partiellen Ableitungen von f in x alle stetigsind, gibt es ein δ > 0 mit Bδ(x) ⊆ U und∣∣∣∣ ∂f∂xi

(y)− ∂f

∂xi

(x)

∣∣∣∣ < ε

n

fur alle y ∈ Rn mit ||y − x||∞ < δ. Sei 0 6= h ∈ Rn mit ||h||∞ < δ. Dann schreiben wir

f(x+ h)− f(x) =n∑

i=1

[f

(x+

i∑j=1

hjej

)− f

(x+

i−1∑j=1

hjej

)],

und fur jedes 1 ≤ i ≤ n existiert nach dem Mittelwertsatz ein ξi ∈ (0, 1) mit

f

(x+

i∑j=1

hjej

)− f

(x+

i−1∑j=1

hjej

)=∂f

∂xi

(x+

i−1∑j=1

hjej + ξihiei

)hi.

Es folgt

f(x+ h)− f(x)−n∑

i=1

∂f

∂xi

(x)hi =n∑

i=1

[∂f

∂xi

(x+

i−1∑j=1

hjej + ξihiei

)− ∂f

∂xi

(x)

]· hi,

und fur jedes 1 ≤ i ≤ n gilt dabei wegen∣∣∣∣∣∣∣∣(x+

i−1∑j=1

hjej + ξihiei

)− x

∣∣∣∣∣∣∣∣∞

= max{|h1|, . . . , |hi−1|, ξi|hi|} ≤ ||h||∞ < δ

stets ∣∣∣∣∣ ∂f∂xi

(x+

i−1∑j=1

hjej + ξihiei

)− ∂f

∂xi

(x)

∣∣∣∣∣ < ε

n.

284

Page 285: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

Insgesamt ist ∣∣∣∣∣f(x+ h)− f(x)−n∑

i=1

∂f

∂xi

(x)hi

∣∣∣∣∣ <n∑

i=1

ε

n|hi| ≤ ε||h||∞,

und somit ∣∣∣∣f(x+ h)− f(x)−n∑

i=1

∂f∂xi

(x)hi

∣∣∣∣||h||∞

< ε.

Dies beweist die Differenzierbarkeit von f in x.

Beachte das die Existenz der partiellen Ableitungen auf ganz U eigentlich nicht ge-braucht wird, es reicht diese in einer kleinen Umgebung von x vorauszusetzen. Istnamlich V ⊆ Rn eine weitere offene Menge mit x ∈ V ⊆ U , so ist eine Funktionf : U → Rm genau dann in x differenzierbar wenn die Einschrankung f |V auf V diesist, und in diesem Fall gilt (f |V )′(x) = f ′(x). Dies ist klar, da die entsprechende Aus-sage fur Funktionsgrenzwerte wahr ist. Man sagt hierzu auch, dass Differenzierbarkeitund die Ableitung lokale Begriffe sind.

Ausgerustet mit unserem Kriterium konnen wir weitere Beispiele behandeln. Seietwa

f : R3 → R3;

xyz

7→

sin x+y1+z2

sin(xyz)− cos(2z)x cos(y)

.

Die partiellen Ableitungen sind dann

∂f1

∂x= cos x

1+z2 ,∂f1

∂y= 1

1+z2 ,∂f1

∂z= −2(sin x+y)z

(1+z2)2,

∂f2

∂x= yz cos(xyz), ∂f2

∂y= xz cos(xyz), ∂f2

∂z= xy cos(xyz) + 2 sin(2z),

∂f3

∂x= cos y, ∂f3

∂y= −x sin y, ∂f3

∂z= 0.

Diese sind allesamt stetig, und als totale Ableitung erhalten wir

f ′(x, y, z) =

cos x1+z2

11+z2 −2(sin x+y)z

(1+z2)2

yz cos(xyz) xz cos(xyz) xy cos(xyz) + 2 sin(2z)cos y x sin y 0

.

Mit derselben Argumentation sind wie schon bemerkt alle durch Formeln in den Grund-funktionen definierten Funktionen differenzierbar. Als zweites Beispiel nehmen wir dieDeterminante

det : Rn×n → R.

Diese ist durch die Leipnitz-Formel

det(x) =∑π∈Sn

(−1)πx1π(1) · . . . · xnπ(n)

285

Page 286: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

gegeben und somit uberall differenzierbar. Die Ableitung in der Einheitsmatrix berech-net sich als

det ′(1)A = ∂A det(1) = tr(A)

fur jede n× n-Matrix A, d.h.det ′(1) = tr .

Wir wollen noch eine weitere Anmerkung zur Jacobi-Matrix machen. Angenommen wirhaben ein offenes Intervall I ⊆ R und eine Kurve f : I → Rn. Dann konnen wir die Ab-leitung f ′(t) einmal wie im vorigen Abschnitt als Tangentialvektor interpretieren, oderalternativ als lineare Abbildung R → Rn. Wir hangen diese beiden nun zusammen?Der Satz uber die Jacobi-Matrix sagt das die Jacobi-Matrix gleich dem Tangentialvek-tor ist, und damit ist f ′(t) als lineare Abbildung einfach die Multiplikation mit demTangentialvektor. Umgekehrt ist der Tangentialvektor dann auch gleich der totalenAbleitung angewandt auf 1, d.h.

f ′(t)︸︷︷︸als Tangentialvektor

= f ′(t)(1)︸ ︷︷ ︸als totale Ableitung

.

Wir wollen auch noch eine weitere Folgerung aus Lemma 15 festhalten.

Definition 8.10 (Differenzierbarkeit und stetige Differenzierbarkeit)Seien n,m ∈ N mit n,m ≥ 1, U ⊆ Rn offen und f : U → Rm eine Funktion. Dannheißt f differenzierbar wenn f in jedem Punkt x ∈ U differenzierbar ist und f heißtstetig differenzierbar wenn zusatzlich die Ableitung

f ′ : U → Rm×n

stetig ist.

Dabei fassen wir f ′(x) als die Jacobi-Matrix auf. Da eine Abbildung in einen Rd

genau dann stetig ist wenn samtliche Komponentenfunktionen stetig sind, und dieKomponenten der Jacobi-Matrix nach Lemma 14 genau die partiellen Ableitungensind, ergibt sich mit Lemma 15 auch

f : U → Rm ist stetig differenzierbar ⇐⇒

Fur alle 1 ≤ i ≤ n, 1 ≤ j ≤ mexistiert die partielle Ableitung∂fj

∂xiin U und ist stetig.

Genau wie bei der eindimensionalen Ableitung gibt es auch wieder einen ganzen Satzan Ableitungsregeln, die wir nun behandeln wollen. Da es bei Vektoren keine Divisiongibt, erwarten wir Verallgemeinerungen von Summen-, Vielfachen-, Ketten-, Produkt-und Umkehrregel. Das Analogon der Produktregel wird sich dabei als ein Spezialfallder Kettenregel herausstellen.

Lemma 8.16 (Summen und Vielfachenregel fur Ableitungen)Seien n,m ∈ N mit n,m ≥ 1, U ⊆ Rn offen und f, g : U → Rm zwei in einem Punkt

286

Page 287: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

x ∈ U differenzierbare Funktionen. Weiter sei c ∈ R eine Konstante. Dann sind auchdie Funktionen f + g und cf in x differenzierbar mit den Ableitungen

(f + g)′(x) = f ′(x) + g′(x) und (cf)′(x) = cf ′(x).

Beweis: Fur jedes 0 6= h ∈ Rn mit x+ h ∈ U gelten

||(f + g)(x+ h)− (f + g)(x)− (f ′(x) + g′(x))h||||h||

≤ ||f(x+ h)− f(x)− f ′(x)h||||h||

+||g(x+ h)− g(x)− g′(x)h||

||h||

und||(cf)(x+ h)− (cf)(x)− cf ′(x)h||

||h||= |c| ||f(x+ h)− f(x)− f ′(x)h||

||h||,

und da die jeweiligen rechten Seiten fur h→ 0 gegen 0 konvergieren, folgen auch

limh→0

||(f + g)(x+ h)− (f + g)(x)− (f ′(x) + g′(x))h||||h||

= 0

und

limh→0

||(cf)(x+ h)− (cf)(x)− cf ′(x)h||||h||

= 0.

Damit sind beide Behauptungen bewiesen.

Fur kommen jetzt zur Kettenregel, also zur Ableitung der Hintereinanderausfuhrungzweier Funktionen. Denken wir an die Interpretation der Ableitung als eine lineareApproximation, so ist zu erwarten das die lineare Approximation einer Hintereinan-derausfuhrung einfach die Hintereinanderausfuhrung der linearen Approximationen derEinzelfunktionen ist, und dies wird die Kettenregel sein. Der Beweis der Kettenregelist etwas komplizierter

Satz 8.17 (Kettenregel fur Ableitungen)Seien n,m, d ∈ N mit n,m, d ≥ 1, U ⊆ Rn, V ⊆ Rm offen, f : U → V eine in x ∈ Udifferenzierbare Funktion und g : V → Rd eine in f(x) differenzierbare Funktion. Dannist die Hintereinanderausfuhrung g ◦ f : U → Rd in x differenzierbar mit

(g ◦ f)′(x) = g′(f(x)) ◦ f ′(x).

Beweis: Setze T := g′(f(x)) ◦ f ′(x). Wahle ein α > 0 mit Bα(f(x)) ⊆ V und schreibe

g(f(x) + h) = g(f(x)) + g′(f(x))h+ τ(h)

287

Page 288: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

fur alle h ∈ Rm mit ||h|| < α. Dann ist limh→0 ||τ(h)||/||h|| = 0. Da f in x nach Lemma13.(a) stetig ist, existiert weiter ein β > 0 mit Bβ(x) ⊆ U und ||f(y) − f(x)|| < αfur alle y ∈ Rn mit ||y − x|| < β, also f(Bβ(x)) ⊆ Bα(f(x)). Fur jedes h ∈ Rn mit0 < ||h|| < β haben wir dann

g(f(x+ h)) = g(f(x)) + g′(f(x))(f(x+ h)− f(x)) + τ(f(x+ h)− f(x))

und weiter ist damit

||g(f(x+ h))− g(f(x))− Th||||h||

=||g′(f(x))(f(x+ h)− f(x)− f ′(x)h) + τ(f(x+ h)− f(x))||

||h||.

Da die linearen Abbildungen f ′(x) : Rn → Rm und g′(f(x)) : Rm → Rd stetig sind,gibt es nach §4.Lemma 15 Konstanten A,C ≥ 0 mit ||f ′(x)u|| ≤ A||u|| fur alle u ∈ Rn

und ||g′(f(x))u|| ≤ C||u|| fur jeden Vektor u ∈ Rm. Die Stetigkeit dieser Abbildungenist dabei klar da sie beide durch Multiplikation mit einer Matrix gegeben sind. Somitfolgt weiter

||g(f(x+ h))− g(f(x))− Th||||h||

≤ C||f(x+ h)− f(x)− f ′(x)h||

||h||+||τ(f(x+ h)− f(x))||

||h||.

Sei jetzt ε > 0 gegeben. Dann existiert ein δ1 > 0 mit δ1 ≤ α und ||τ(u)||/||u|| <ε/(2(A+ 1)) fur alle u ∈ Rm mit 0 < ||u|| < δ1 und wegen

limh→0

||f(x+ h)− f(x)− f ′(x)h||||h||

= 0

existiert weiter ein δ2 > 0 mit δ2 ≤ β und

||f(x+ h)− f(x)− f ′(x)h||||h||

< min

2C + 1, 1

}

fur alle h ∈ Rn mit 0 < ||h|| < δ2. Die Stetigkeit von f in x gemaß Lemma 13.(a)liefert schließlich ein δ3 > 0 mit δ3 ≤ β und ||f(x+h)− f(x)|| < δ1 fur alle h ∈ Rn mit||h|| < δ3. Setze δ := min{δ2, δ3}, also auch 0 < δ ≤ β. Sei h ∈ Rn mit 0 < ||h|| < δ.

288

Page 289: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

Dann ist wegen ||f(x+ h)− f(x)|| < δ1 auch

||g(f(x+ h))− g(f(x))− Th||||h||

≤ C||f(x+ h)− f(x)− f ′(x)h||

||h||+||τ(f(x+ h)− f(x))||

||h||

<Cε

2C + 1+

ε

2(A+ 1)

||f(x+ h)− f(x)||||h||

2+

ε

2(A+ 1)

(||f(x+ h)− f(x)− f ′(x)h||

||h||+||f ′(x)h||||h||

)<ε

2+

ε

2(A+ 1)(1 + A) = ε.

Dies beweist

limh→0

||g(f(x+ h))− g(f(x))− Th||||h||

= 0,

d.h. g ◦ f ist in x differenzierbar mit (g ◦ f)′(x) = T .

Wenn wir die Kettenregel fur die Jacobi-Matrizen ausschreiben, so mussen wir unsnur daran erinnern das die Hintereinanderausfuhrung linearer Abbildungen der Multi-plikation von Matrizen entspricht, und damit nimmt die Kettenregel die Form

∂(gj ◦ f)

∂xi

(x) =m∑

k=1

∂gj

∂xk

(f(x)) · ∂fk

∂xi

(x)

an. Als ein Beispiel seien U ⊆ Rn offen und f : U → R eine in jedem Punkt von x ∈ Udifferenzierbare Funktion. Weiter seien I ⊆ R ein Intervall und x : I → U eine in jedemPunkt t ∈ I differenzierbare Kurve. Wir bilden dann die reelle Funktion

F : I → R; t 7→ f(x1(t), . . . , xn(t))

und wollen die Ableitung von F berechnen. Diese ergibt sich durch die Kettenregel als

F ′(t) =

(∂f

∂x1

(x(t)), . . . ,∂f

∂xn

(x(t))

x′1(t)...

x′n(t)

=n∑

i=1

∂f

∂xi

(x(t))x′i(t).

Nehmen wir beispielsweise ganz konkret die Funktion f(x, y) = xy fur (x, y) ∈ R2 mitx > 0, so sind die partiellen Ableitungen

∂f

∂x= yxy−1 und

∂f

∂y= ln(x)xy

289

Page 290: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

also wird beispielsweise fur F (x) = xx = f(x, x)

F ′(x) =∂f

∂x(x, x) +

∂f

∂y(x, x) = xxx−1 + ln(x)xx = (1 + lnx)xx,

wie wir auch im letzten Semester schon einmal uber die Formel F (x) = ex ln x gerechnethatten.

Oftmals wird die eben hergeleitete Formel auch in Termen sogenannter Differenti-alformen formuliert. Fur 1 ≤ i ≤ n bezeichne dxi : Rn → R die lineare Abbildung

dxi(u1, . . . , un) = ui.

Dann ist in der obigen Situation

df(x) := f ′(x) =n∑

i=1

∂f

∂xi

dxi,

und dies ist eine sogenannte 1-Form. Der Vorteil dieser Schreibweise ist es, die obigeFormel symbolisch als

dF

dt=

n∑i=1

∂f

∂xi

· dxi

dt

schreiben zu konnen, was sich gut merken laßt da man die Differentialform einfachsymbolisch durch dt teilen muss. Beachte das die dxi hier keine

”infinitesimalen Großen“

sind, die es in der Mathematik ja gar nicht gibt, sondern ganz konkrete Linearformen.Wir kommen jetzt zu den Produktregeln. So etwas wie

”die Produktregel“ gibt es

nicht, da es kein allgemeines Produkt von Vektoren gibt. Es gibt aber diverse Variantenvon Produktregeln, von denen wir zwei hier angeben wollen.

Lemma 8.18 (Produktregeln fur Ableitungen)Seien n,m ∈ N mit n,m ≥ 1, U ⊆ Rn offen und f, g : U → Rm zwei Funktionen diein einem Punkt x ∈ U differenzierbar sind. Weiter sei auch die reellwertige Funktionλ : U → R in x differenzierbar. Dann gelten:

(a) Die Funktion λ · f ist in x differenzierbar und fur jedes u ∈ Rn gilt

(λ · f)′(x)u = (λ′(x)u) · f(x) + λ(x) · f ′(x)u.

(b) Das Skalarprodukt 〈f |g〉 : U → R ist in x differenzierbar und fur jedes u ∈ Rn gilt

〈f |g〉′(x)u = 〈f ′(x)u|g(x)〉+ 〈f(x)|g′(x)u〉.

Beweis: (a) Die Funktion

M : R× Rm → Rm; (t, v) 7→ tv

290

Page 291: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

ist nach einem der obigen Beispiele in jedem Punkt (t, v) ∈ R×Rm differenzierbar mit

M ′(t, v)(s, u) = tu+ sv.

Wegen λ · f = M ◦ (λ, f) ergibt die Kettenregel die Differenzierbarkeit von λ · f in xund fur jedes u ∈ Rn gilt

(λ · f)′(x)u = M ′(λ(x), f(x))(λ′(x)u, f ′(x)u) = λ(x)f ′(x)u+ (λ′(x)u)f(x).

(b) Ebenfalls nach einem fruheren Beispiel ist das Skalarprodukt

〈 | 〉 : Rm × Rm → R

un jedem Punkt (v1, v2) ∈ Rm × Rm differenzierbar mit

〈 | 〉′(v1, v2)(u1, u2) = 〈v1|u2〉+ 〈u1|v2〉

fur alle u1, u2 ∈ Rm. Wegen 〈f |g〉 = 〈 | 〉 ◦ (f, g) ergibt die Kettenregel die Differen-zierbarkeit von 〈f |g〉 in x und fur jedes u ∈ Rn gilt

〈f |g〉′(x)u = 〈 | 〉′(f(x), g(x))(f ′(x)u, g′(x)u) = 〈f(x)|g′(x)u〉+ 〈f ′(x)u|g(x)〉.

Damit sind beide Aussagen des Lemmas bewiesen.

Nach diesem Schema kann man leicht weitere Produktregeln beweisen, etwa fur dasProdukt von Matrixfunktionen, fur das Vektorprodukt im R3 und so weiter. Jetzt habenwir die meisten der eindimensionalen Ableitungsregeln auf den mehrdimensionalen Fallverallgemeinert. Es fehlt nur die Quotientenregel, aber diese ist fur vektorwertige Funk-tionen auch nicht sinnvoll, und die Regel uber die Ableitung von Umkehrfunktionen.Letztere laßt sich auch auf den mehrdimensionalen Fall verallgemeinern, dabei wird derBeweis allerdings wesentlich komplizierter. Im eindimensionalen Fall brauchten wir furdie Differenzierbarkeit der Umkehrfunktion f−1 in einem Punkt f(x) die Bedingungf ′(x) 6= 0. In mehreren Dimesionen werden wir ebenfalls eine Bedingung brauchenaber f ′(x) 6= 0 reicht nicht mehr aus. Erinnern Sie sich daran das die Ableitung f ′(x)die lineare Naherung an f im Punkt x ist und damit erscheint es plausibel das dielineare Naherung der Umkehrfunktion f−1 im Punkt f(x) einfach die Umkehrfunktionvon f ′(x) sein sollte. Insbesondere muss die lineare Abbildung f ′(x) invertierbar sein,und fassen wir f ′(x) als Jacobi-Matrix auf, so bedeutet die Invertierbarkeit geradedet f ′(x) 6= 0. Es stellt sich heraus das all dies tatsachlich wahr ist, nur ist der Beweisleider deutlich komplizierter als im eindimensionalen Fall. Da uns insbesondere einwichtiges Hilfsmittel fur diesen Beweis fehlt, wollen wir auf einen Beweis des folgendenSatzes verzichten.

Satz 8.19 (Satz uber Umkehrfunktionen)Seien n ∈ N mit n ≥ 1, U ⊆ Rn offen und f : U → Rn eine stetig differenzierbareFunktion. Sei x0 ∈ U mit det f ′(x0) 6= 0. Dann gibt es offene Mengen V,W ⊆ Rn mit

291

Page 292: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

x0 ∈ V ⊆ U und f(x0) ∈ W so, dass f |V : V → W bijektiv ist und die Umkehrfunktion(f |V )−1 : W → V wieder stetig differenzierbar ist.

Aus diesem, hier nicht bewiesenen Satz, konnen wir jetzt leicht die Umkehrregel folgern.

Korollar 8.20 (Umkehrregel fur Ableitungen)Seien n ∈ N mit n ≥ 1, U, V ⊆ Rn offen und f : U → V eine bijektive, stetig differen-zierbare Funktion mit det f ′(x) 6= 0 fur jedes x ∈ U . Dann ist auch die Umkehrabbildungf−1 : V → U stetig differenzierbar und fur jedes y ∈ V gilt

(f−1)′(y) = f ′(f−1(y))−1.

Beweis: Sei y ∈ V . Nach Satz 19 gibt es dann offene Mengen U ′, V ′ ⊆ Rn mit f−1(y) ∈U ′ ⊆ U und y ∈ V ′ so, dass f |U ′ : U ′ → V ′ bijektiv ist und (f |U ′)−1 : V ′ → U ′ stetigdifferenzierbar ist. Insbesondere ist V ′ = f(U ′) ⊆ V und somit ist f−1|V ′ = (f |U ′)−1

stetig differenzierbar. Damit ist f−1 insgesamt stetig differenzierbar. Wegen f−1 ◦ f =idU und f ◦ f−1 = idV ergibt die Kettenregel Satz 17 auch

(f−1)′(f(x)) ◦ f ′(x) = id′U(x) = idRn und f ′(f−1(y)) ◦ (f−1)′(y) = id′V (y) = idRn

fur alle x ∈ U , y ∈ V . Fur jedes y ∈ V ist damit (f−1)′(y) = f ′(f−1(y))−1.

Auch der Mittelwertsatz laßt sich auf den Fall mehrerer Variablen verallgemeinern, wirbrauchen dafur aber noch eine bisher nicht behandelte Schreibweise. Seien E,F zweinormierte Raume uber K ∈ {R,C} und T : E → F eine stetige lineare Abbildung.Nach §4.Lemma 15 gibt es dann eine Konstante C ≥ 0 mit ||Tu|| ≤ C||u|| fur alleu ∈ E. Die minimale hierbei auftretende Konstante bezeichnen wir als die Norm derlinearen Abbildung T , d.h. wir definieren

||T || := inf{C ≥ 0|∀(u ∈ Rn) : ||Tu|| ≤ C||u||}.

Dies ist nicht nur ein Infimum sondern sogar ein Minimum, d.h. es gilt ||Tu|| ≤ ||T ||·||u||fur jedes u ∈ E. Dies ist leicht zu sehen, ist u ∈ E so gibt es fur jedes ε > 0 ein C ≥ 0mit C < ||T ||+ ε/(1 + ||u||) und ||Tv|| ≤ C||v|| fur alle v ∈ E, also insbesondere

||Tu|| ≤ C||u|| ≤(||T ||+ ε

1 + ||u||

)||u|| < ||T || · ||u||+ ε,

und somit muss auch ||Tu|| ≤ ||T || · ||u|| sein. Dies definiert uns tatsachlich eineNorm auf dem Vektorraum L(E,F ) aller stetigen linearen Abbildungen von E nachF . Zunachst ist offenbar ||0|| = 0 und ist umgekehrt T : E → F eine stetige, lineareAbbildung mit ||T || = 0, so gilt ||Tu|| ≤ ||T || · ||u|| = 0, also Tu = 0, fur jedes u ∈ E,

292

Page 293: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

und dies bedeutet T = 0. Sind T, S : E → F zwei stetige lineare Abbildungen, so giltfur jedes u ∈ E auch

||(T +S)u|| = ||Tu+Su|| ≤ ||Tu||+ ||Su|| ≤ ||T || · ||u||+ ||S|| · ||u|| = (||T ||+ ||S||)||u||,

d.h. T +S ist stetig mit ||T +S|| ≤ ||T ||+ ||S||. Sind schließlich T : E → F stetig undlinear und c ∈ K eine Konstante, so ist im Fall c = 0 trivialerweise ||cT || = 0 = |c|·||T ||und im Fall c 6= 0 ist fur jedes C ≥ 0 genau dann |c|·||Tu|| = ||cTu|| = ||(cT )u|| ≤ C||u||fur alle u ∈ E wenn ||Tu|| ≤ (C/|c|)||u|| fur alle u ∈ E ist, wenn also ||T || ≤ C/|c| gilt,also ist

||cT || = inf

{C ≥ 0

∣∣∣∣||T || ≤ C

|c|

}= |c| · ||T ||.

Also ist || || tatsachlich eine Norm auf L(E,F ). Mit diesem Begriff ausgestattet konnenwir jetzt die Mittelwertungleichung formulieren und beweisen.

Lemma 8.21 (Mittelwertungleichung)Seien n,m ∈ N mit n,m ≥ 1, U ⊆ Rn offen und f : U → Rm eine stetig differenzierbareFunktion. Weiter seien p, q ∈ U mit [p, q] ⊆ U . Dann gilt

||f(q)− f(p)|| ≤

(sup

x∈[p,q]

||f ′(x)||

)· ||q − p||.

Beweis: Schreibe M := sup{||f ′(x)|| : x ∈ [p, q]}. Die Kurve

c : [0, 1] → R; t 7→ (1− t)p+ tq

ist stetig differenzierbar mit c′(t) = q − p fur jedes t ∈ [0, 1]. Also ist nach der Ketten-regel Satz 17 auch f ◦ c eine stetig differenzierbare Kurve mit

(f ◦ c)′(t) = f ′(c(t))(q − p)

fur jedes t ∈ [0, 1], also auch

||(f ◦ c)′(t)|| = ||f ′(c(t))(q − p)|| ≤ ||f ′(c(t))|| · ||q − p|| ≤M ||q − p||

da c(t) ∈ [p, q] ist. Die Behauptung folgt nun mit Lemma 12.

Wie schon in Lemma 12 laßt sich die Voraussetzung des Lemmas abschwachen, es reichtdas f differenzierbar ist und ||f ′(x)|| fur x ∈ [p, q] beschrankt ist. Außerdem beachte daswir im Rn und Rm beliebige Normen verwenden konnen und auf der Menge L(Rn,Rm)der linearen Abbildungen von Rn nach Rm dann die oben eingefuhrte Norm linearerAbbildungen verwenden mussen. Eine unmittelbare Folgerung des Mittelwertsatzes istdie Charakterisierung der konstanten Funktionen uber ihre Ableitung.

293

Page 294: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

Korollar 8.22: Seien n ∈ N mit n ≥ 1, U ⊆ Rn offen und zusammenhangend undf : U → Rm eine differenzierbare Funktion mit f ′(x) = 0 fur jedes x ∈ U . Dann ist fkonstant.

Beweis: Wir mussen zeigen das f(p) = f(q) fur alle p, q ∈ U gilt. Seien also p, q ∈ Ugegeben. Da die offene Menge U zusammenhangend ist, gibt es nach Lemma 10 Punktep0, . . . , pr ∈ U mit p0 = p und pr = q so, dass [pi−1, pi] ⊆ U fur jedes 1 ≤ i ≤ n gilt.Fur jedes 1 ≤ i ≤ n ist damit nach Lemma 21 auch ||f(pi) − f(pi−1)|| = 0, alsof(pi) = f(pi−1). Dies ergibt f(p) = f(p0) = f(p1) = · · · = f(pr) = f(q).

8.6 Reellwertige Funktionen

Wir wollen uns jetzt auf den Spezialfall differenzierbarer Funktionen f : U → R kon-zentrieren, wobei U ⊆ Rn eine offene Menge ist. Diese Funktionen werden manchmalauch als Skalarfelder bezeichnet. Die Ableitung von f wird dann eine 1×n Matrix, diewir durch Transponieren als einen Vektor interpretieren konnen.

Definition 8.11 (Der Gradient)Seien n ∈ N mit n ≥ 1, U ⊆ Rn offen und f : U → R in x ∈ U differenzierbar. DerGradient von f in x ist dann der Vektor

grad f(x) :=

∂f∂x1

(x)...

∂f∂xn

(x)

= f ′(x)t.

Alternativ wird oftmals auch die Schreibweise ∇f(x) = grad f(x) fur den Gradientenverwendet.

–4–2

02

4t –4

–2

0

2

4

s

0

10

20

30

40

50

60

70

In dieser Situation wird die Ableitung von f inx zu

f ′(x)u = f ′(x)ttu = f ′(x)t · u = grad f(x) · u

fur alle u ∈ Rn, die Ableitung ist also das Skalarpro-dukt mit dem Gradienten. Wie wir sehen werden,hat der Gradient zumindest im Fall grad f(x) 6= 0auch eine direkte geometrische Bedeutung, er zeigtimmer in die Richtung des starksten Anstiegs derFunktion f . Bevor wir dies begrunden, wollen wiruns das Phanomen an einigen Beispielen anschau-en. Wir beginnen mit der Funktion f(x, y) = x2+y2

und dem Punkt (x, y) = (1, 1).

294

Page 295: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

Der Punkt (x, y) = (1, 1) liegt hier in der Mitte des oben rechts gezeigten Graphenund die Gradientenrichtung ist durch die etwas dicker eingezeichnete Linie angedeutet.In diesem Graphen scheint die Gradientenrichtung tatsachlich die Richtung maximalenAnstiegs fur die Funktion f zu sein. Schauen wir uns zwei weitere Beispiele diesmalmit der Funktion

f(x, y) = x sin y + y cosx

an.

–4

–2

0

2

4

t–4

–2

0

2

4

s

–5

0

5

–4–2

02

4

t

–4

–2

0

2

4

s

–8

–6

–4

–2

0

2

4

6

(x, y) = (1, 1) (x, y) = (0, 1)

Im linken Graphen scheint die Gradientenrichtung nicht die Richtung maximalen An-stiegs zu sein, etwas weiter links vom Gradienten geht es viel starker nach oben. Dies istkein Widerspruch, die

”Richtung maximalen Anstiegs“ ist rein lokal gemeint. Schaut

man sich nur eine kleine Umgebung von (x, y) = (1, 1) an, so geht es in Gradientenrich-tung am starksten nach oben, dass es etwas weiter links noch besser geht ist eine globaleTatsache die auf den Gradienten keinen Einfluss hat. Nehmen wir wie im rechten Gra-phen dagegen den Startpunkt (x, y) = (0, 1) weiter links, so lauft die Gradientenkurvewirklich uber den Gipfel links von (x, y) = (1, 1).

Wir haben jetzt an einigen Beispielen gesehen, dass der Gradient grad f(x), soferner nicht gerade Null ist, in die Richtung des starksten Anstiegs der Funktion f zeigt.Wir wollen uns diese Tatsache nun kurz klarmachen. Seien dazu eine offene MengeU ⊆ Rn, ein Punkt x ∈ U und eine in x differenzierbare Funktion f : U → R gegeben.Wir nehmen grad f(x) 6= 0 an. Fur ausreichend kleine h ∈ Rn gilt dann

f(x+ h) = f(x) + f ′(x)h+ τ(h) = f(x) + grad f(x) · h+ τ(h)

295

Page 296: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

wobei der Fehler τ(h) im Vergleich zum linearen Term klein ist. Ist nun φ der Winkelzwischen grad f(x) und h, so konnen wir dies weiter als

f(x+ h) = f(x) + || grad f(x)|| · ||h|| · cosφ+ τ(h)

schreiben. Der Winkel φ ist dabei im Bereich zwischen Null und π und cosφ variiertzwischen 1 und −1. Der dominierende, lineare Anteil steigt damit am starksten wenncosφ = 1 also φ = 0 ist, d.h. wenn h = c grad f(x) mit c > 0 ein positives Vielfachesdes Gradienten ist. Diese Uberlegung zeigt die schon angekundigte Tatsache:

Der Gradient zeigt in die Richtung des starksten Anstiegs der Funktion f .

Außerdem sehen wir dass der Betrag des Gradienten gerade die Rate dieses Anstiegsangibt. Fur grad f(x) = 0 konnen wir dagegen ohne weitere Informationen nichts rech-tes sagen. Fur reellwertige Funktionen erhalten wir einen Mittelwertsatz und nicht nureine Mittelwertungleichung wie im vektorwertigen Fall.

Lemma 8.23 (Mittelwertsatz fur reellwertige Funktionen)Seien n ∈ N mit n ≥ 1, U ⊆ Rn offen, f : U → R eine differenzierbare Funktion undp, q ∈ U mit p 6= q und [p, q] ⊆ U . Dann existiert ein ξ ∈ [p, q] mit ξ 6= p, q und

f(q)− f(p) = grad f(ξ) · (q − p).

Beweis: Wir betrachten die Hilfsfunktion

g : [0, 1] → R; t 7→ f((1− t)p+ tq).

Nach der Kettenregel Satz 17 ist g differenzierbar mit

g′(t) = f ′((1− t)p+ tq)(q − p) = grad f((1− t)p+ tq) · (q − p)

fur alle t ∈ [0, 1]. Der eindimensionale Mittelwertsatz I.§14.Satz 10 liefert ein s ∈ (0, 1)mit g′(s) = g(1)− g(0) = f(q)− f(p), und setzen wir ξ := (1− s)p+ sq ∈ [p, q]\{p, q},so ist damit f(q)− f(p) = grad f(ξ) · (q − p).

Wir wenden uns jetzt dem Problem der Bestimmung der Maxima und Minima einerFunktion f : Rn → R zu. Wir beginnen mit einigen Definitionen.

Definition 8.12 (Lokale Extrema)Seien n ∈ N mit n ≥ 1, U ⊆ Rn offen und f : U → R eine Abbildung. Ein Punkt x ∈ Uheißt ein lokales Maximum (Minimum) von f , wenn es ein ε > 0 mit Bε(x) ⊆ U undf(y) ≤ f(x) (f(y) ≥ f(x)) fur alle y ∈ Bε(x) gibt. Weiter heißt x ein lokales Extremumvon f wenn x ein lokales Maximum oder ein lokales Minimum von f ist.

Schließlich heißt x ∈ U ein kritischer Punkt von f wenn f in x differenzierbar istund grad f(x) = 0 gilt.

296

Page 297: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

Um bei einer reellen Funktion f : [a, b] → R Maximum und Minimum zu suchen,bestimmt man zuerst die Nullstellen der Ableitung f ′, und vergleicht dann die Funk-tionswerte in diesen Ableitungsnullstellen miteinander und mit den Funktionswertenf(a), f(b) am Rand des Intervalls. Der großte der so erhaltenen Werte ist das Maxi-mum von f auf [a, b] und der kleinste ist das Minimum. Dabei ist es nicht notig zuentscheiden, welche der Nullstellen von f ′ lokale Maxima, lokale Minima oder keinesvon beiden sind, das simple Einsetzen und Vergleichen ist rechnerisch viel einfacher.

Bei Funktionen in mehreren Variablen funktioniert im wesentlichen derselbe Re-chenweg, nur werden die rechnerischen Details etwas aufwendiger. Zuerst machen wiruns klar, dass lokale Extrema einer differenzierbaren Funktion immer kritische Punktesind.

Satz 8.24: Seien n ∈ N mit n ≥ 1, U ⊆ Rn offen und f : U → R eine Funktion. Istdann x ∈ U ein lokales Extremum von f und ist f in x differenzierbar, so ist x auchein kritischer Punkt von f .

Beweis: Setze v := grad f(x) ∈ Rn und betrachte die Funktion

g : (−ε, ε) → R; t 7→ f(x+ tv),

wobei ε > 0 mit x+ tv ∈ U fur alle t ∈ R mit |t| < ε gewahlt ist. Dann hat g in t = 0ein lokales Extremum, also

0 = g′(0) = ∂vf(x) = f ′(x)v = v · v = ||v||2,

und somit ist grad f(x) = v = 0.

In geometrischen Termen ist dies die simple Tatsache, dass die Tangentialebene ineinem lokalen Extremum waagerecht ist. Der Satz gibt uns eine Methode Kandidatenfur lokale Extrema zu berechnen indem wir nach kritischen Punkten suchen. Allerdingsist nicht jeder kritische Punkt ein lokales Extremum, beispielsweise hat f(x, y) = x2−y2

einen kritischen Punkt in (x, y) = (0, 0) aber dort ist kein lokales Extremum. Wieman entscheidet ob ein kritischer Punkt ein lokales Extremum ist, werden wir spaterbehandeln.

Fur die Berechnung globaler Extrema tritt dieses Problem nicht auf, und wir wollenuns jetzt ein Rechenverfahren fur globale Extrema uberlegen. Gegeben seien eine offeneMenge U ⊆ Rn, eine differenzierbare Funktion f : U → R und eine abgeschlosseneTeilmenge M ⊆ U . Wir wollen die großten beziehungsweise kleinsten Werte von f aufder Menge M finden. Nehmen wir einmal an, es gibt uberhaupt ein globales Maximumvon f auf M , also einen Punkt x ∈ M mit f(x) ≥ f(y) fur alle y ∈ M . Dann konnenzwei verschiedene Falle auftreten.

297

Page 298: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

M

x

M

x

x ∈M◦ =⇒lokales Extremum x ∈ ∂M , x muss keinlokales Extremum sein.

Ist x ein innerer Punkt von M , also Bε(x) ⊆ M fur einen kleinen Radius ε > 0, so istinsbesondere f(x) ≥ f(y) fur alle y ∈ Bε(x) ⊆M , d.h. x ist auch ein lokales Maximumvon f , und nach Satz 24 insbesondere ein kritischer Punkt von f . Ist x dagegen aufdem Rand von M so konnen wir nichts weiter sagen, jede Kugel Bε(x) enthalt auchPunkte y außerhalb M und wir wissen nicht ob fur diese auch f(x) ≥ f(y) ist. Indiesem Fall ist x aber zumindest ein globales Maximum von f auf dem Rand ∂M vonM . Die Kandidaten fur das globale Maximum x sind also zum einen die kritischenPunkte von f in M◦ und zum anderen die globalen Maxima von f auf ∂M .

Diese Uberlegung funktioniert nur, wenn es uberhaupt ein globales Maximum x ∈M von f gibt, und um dies sicherzustellen kann man beispielsweise fordern das dieMenge M kompakt ist. Analoges gilt naturlich auch fur globale Minima von f auf M .Damit haben wir das folgende Rechenverfahren begrundet:

Gegeben: Eine offene Menge U ⊆ Rn, eine differenzierbare Funktion f : U → Rund eine abgeschlossene Menge M ⊆ U auf der f ein globales Maximum (Minimum)besitzt.

Gesucht: Das globale Maximum (Minimum) von f auf M also ein x ∈M mit f(x) ≥f(y) (f(x) ≤ f(y)) fur alle y ∈M .

Verfahren: Die Rechnung lauft in den folgenden Schritten ab.

1. Bestimme alle kritischen Punkte x ∈M◦ von f im Inneren von M .

2. Bestimme die Funktionswerte der in Schritt (1) berechneten kritischen Punkte,und suche unter diesen den großten beziehungsweise kleinsten Wert heraus.

3. Bestimme das Maximum beziehungsweise Minimum von f auf dem Rand ∂Mvon M , und vergleiche es mit dem in Schritt (2) gefundenen Wert. Je nach demErgebnis dieses Vergleichs ist das Maximum, beziehungsweise Minimum, dannder in Schritt (2) oder Schritt (3) gefundene Wert.

Die kritischen Punkte sind diejenigen Punkte in denen alle partiellen Ableitungenverschwinden, zu ihrer Berechnung mussen wir also jede der partiellen Ableitungen∂f/∂xi = 0 setzen, und erhalten n Gleichungen fur unsere n Unbekannten. Rechen-schritt (3) kann dagegen sehr aufwendig werden, wie wir bald an unseren Beispielensehen werden.

298

Page 299: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

00.5

11.5

2

x0.5

11.5

2

y

–1

0

1

2

3

4

Als ein Beispiel betrachten wir die Funktion

f : R2 → R; (x, y) 7→ x2y + y2 − 2y − xy

und wollen Maxima und Minima auf dem Quadrat

M := [0, 2]× [0, 2] = {(x, y) ∈ R2|0 ≤ x, y ≤ 2}

bestimmen. Zuerst suchen wir die kritischen Punkteim Inneren

M◦ = (0, 2)× (0, 2) = {(x, y) ∈ R2|0 < x, y < 2}

von M . Dass (x, y) ein kritischer Punkt von f ist,bedeutet

grad f(x, y) =

( ∂f∂x

(x, y)∂f∂y

(x, y)

)!= 0.

wir mussen also die beiden partiellen Ableitungen von f gleich Null setzen. Es gelten

∂f

∂x= 2xy − y = (2x− 1)y,

∂f

∂y= x2 + 2y − 2− x = x2 − x+ 2(y − 1).

Die Losungen von ∂f/∂x = 0 in M◦ sind die Punkte (1/2, y) mit 0 < y < 1, da dieLosungen mit y = 0 auf dem Rand von M liegen. Setzen wir x = 1/2 in die zweiteGleichung ein, so wird diese zu

2(y − 1)− 1

4= 0 =⇒ y = 1 +

1

8=

9

8.

Wir haben also nur einen einzigen kritischen Punkt (x, y) = (1/2, 9/8) in M◦ und derFunktionswert in diesem Punkt ist

f

(1

2,9

8

)=

1

4· 9

8+

81

64− 9

4− 1

2· 9

8=

18 + 81− 144− 36

64= −81

64.

Der Rand von M besteht aus den vier begrenzenden Strecken

∂M = [0, 2]× {0, 2} ∪ {0, 2} × [0, 2],

und wir berechnen

f(t, 0) = 0, min = 0, max = 0,

f(t, 2) = 2t2 − 2t = 2t(t− 1), min = −1

2, max = 4,

f(0, t) = t2 − 2t, min = −1, max = 0,

f(2, t) = t2, min = 0, max = 4.

299

Page 300: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

Wir haben also ein eindeutiges globales Minimum bei

(x, y) =

(1

2,9

8

)mit f(x, y) = −81

64

und auch ein eindeutiges globale Maximum bei

(x, y) = (2, 2) mit f(x, y) = 4.

An diesen Beispiel konnen wir zwei Dinge beobachten. Zum einen bedeutet die Suchenach den kritischen Punkten das Losen von n Gleichungen in n Unbekannten, man mussja die n partiellen Ableitungen gleich Null setzen. Zum anderen ist das Berechnen vonMaximum und Minimum auf dem Rand selbst wieder ein globales Maximum/MinimumProblem, aber normalerweise eine Dimension kleiner. Je nachdem wie kompliziert derRand ∂M von M ist, kann dieser Teil der Rechnung den großten Teil der Arbeitverursachen.

Wir wollen ein zweites Beispiel rechnen. Diesmal betrachten wir die Funktion

f(x, y, z) := x2 + 4y2 − 2xyz + sin(πz)

auf der kompakten Menge M := [0, 3]3. Wir berechnen

∂f

∂x= 2x− 2yz,

∂f

∂y= 8y − 2xz,

∂f

∂z= −2xy + π cos(πz).

Zur Bestimmung der kritischen Punkte (x, y, z) ∈M◦ = (0, 3)3 rechnen wir

∂f

∂x= 0 =⇒ x = yz,

und Einsetzen in die zweite Gleichung gibt

∂f

∂y= 8y − 2xz = 8y − 2yz2 = 2y(4− z2)

!= 0.

Wegen y, z > 0 ist z2 = 4 und z = 2, x = 2y, also ergibt die dritte Gleichung

∂f

∂z= −2xy + π cos(πz) = π − 4y2 !

= 0 =⇒ y =1

2

√π, x = 2y =

√π.

Damit haben wir einen eindeutigen kritischen Punkt (x, y, z) ∈M◦ mit Funktionswert

f

(√π,

1

2

√π, 2

)= π + π − 2π + sin(2π) = 0.

300

Page 301: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

Der Rand ∂M des Wurfels M setzt sich diesmal aus sechs Seitenflachen zusammen,und auf diesen Seitenflachen haben wir die Werte

f(0, y, z) = 4y2 + sin(πz), f(3, y, z) = 9 + 4y2 − 6yz + sin(πz),f(x, 0, z) = x2 + sin(πz), f(x, 3, z) = 36 + x2 − 6xz + sin(πz),f(x, y, 0) = x2 + 4y2, f(x, y, 3) = x2 + 4y2 − 6xy.

Fur die drei links stehenden Seiten haben wir ein eindeutiges Maximum f(3, 3, 0) =45 und ein eindeutiges Minimum f(0, 0, 3/2) = −1. Betrachte jetzt die Hilfsfunktiong(t, z) = λt2 − 6tz + sin(πz) fur 0 ≤ t, z ≤ 3, λ ∈ {1, 4}. Bei fixierten z ist dies einenach oben geoffnete Parabel mit ∂g/∂t(t, z) = 2λt− 6z, also Scheitel in t = 3z/λ. DieFunktionswerte an den Randern und im Scheitelpunkt sind

g(0, z) = sin(πz), g

(3z

λ, z

)= sin(πz)− 9

λz2, g(3, z) = 9λ− 18z + sin(πz).

Im Fall 3z/λ ≤ 3, also z ≤ λ, ist dann

min0≤t≤3

g(t, z) = sin(πz)− 9

λz2 und max

0≤t≤3g(t, z) = max{sin(πz), 9λ− 18z + sin(πz)}

=

{9λ− 18z + sin(πz), 0 ≤ z ≤ λ

2,

sin(πz), λ2≤ z ≤ λ,

wahrend im Fall z ≥ λ stets

min0≤t≤3

g(t, z) = 9λ− 18z + sin(πz) und max0≤t≤3

g(t, z) = sin(πz)

ist. Damit ist

min0≤y,z≤3

f(3, y, z) = 9 + min0≤z≤3

(sin(πz)− 9

4z2

).

–20

–15

–10

–5

00.5 1 1.5 2 2.5 3

z

Um das rechts stehende Minimum zu berechnen, bildenwir

d

dz

(sin(πz)− 9

4z2

)= π cos(πz)− 9

2z.

Die Ableitung ist also zunachst positiv hat dann eineeindeutige Nullstelle und ist anschließend negativ. Da-mit ist sin(πz) − (9/4)z2, wie auch im nebenstehendenGraph gezeigt, zunachst monoton steigend, hat dann einMaximum und ist anschließend monoton fallend. Das Mi-nimum wird also in einem der beiden Randpunkte z = 0oder z = 3 angenommen, und wir erhalten

min0≤z≤3

(sin(πz)− 9

4z2

)= min

{0,−81

4

}= −81

4,

301

Page 302: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

also insgesamt

min0≤y,z≤3

f(3, y, z) = 9− 81

4= −45

4.

Wegend

dz(9λ− 18z + sin(πz)) = π cos(πz)− 18 < 0

ist z 7→ 9λ− 18z + sin(πz) monoton fallend, also

max0≤z≤λ/2

(9λ− 18z + sin(πz)) = 9λ.

Im Fall λ = 4 haben wir damit

max0≤t,z≤3

g(t, z) = 36,

und somit istmax

0≤y,z≤3f(3, y, z) = 9 + max

0≤t,z≤3g(t, z) = 45.

Wir kommen nun zu f(x, 3, z), setzen also λ = 1. Analog zur obigen Rechnung habenwir

min0≤z≤1

(sin(πz)− 9z2) = min{0,−9} = −9

und somitmin0≤t≤30≤z≤1

g(t, z) = −9.

Weiter istmin0≤t≤31≤z≤3

g(t, z) = min1≤z≤3

(9− 18z + sin(πz)) = 9− 54 = −45,

also insgesamt

min0≤t,z≤3

g(t, z) = −45 und min0≤x,z≤3

f(x, 3, z) = 36− 45 = −9.

Weiter sindmax

0≤t,z≤3g(t, z) = 9 und max

0≤x,z≤3f(x, 3, z) = 36 + 9 = 45.

Den letzten Term f(x, y, 3) mussen wir nicht mehr betrachten da er keine kritischenPunkte im Inneren hat, und sein Rand schon durch die anderen funf Seitenflachenabgedeckt ist. Insgesamt haben wir eindeutige Maxima und Minima

min(x,y,z)∈M

f(x, y, z) = −45

4angenommen in (x, y, z) =

(3,

9

4, 3

)und

max(x,y,z)∈M

f(x, y, z) = 45 angenommen in (x, y, z) = (3, 3, 0).

302

Page 303: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

–2

–1

0

1

2

x

–2

–1

0

1

2

y

–2

–1

0

1

2Die Rechnung in diesem Beispiel war schon rechtaufwendig, der Rand besteht aus sechs Teilen undin einigen davon haben wir seinerseits wieder auf-wendige, zweidimensionale Optimierungsaufgabenzu rechnen. Wir wollen noch ein letztes Beispielrechnen in dem die Funktion f auf einer nicht kom-pakten Menge maximiert werden soll. Um zu sehenob auch dieses Beispiel von unserem Rechenverfah-ren erfasst wird, mussen wir begrunden das es uber-haupt ein globales Maximum gibt, dies werden wiraber erst als letzten Schritt am Ende der Rechnungdurchfuhren. Sei

f : R2 → R; (x, y) 7→ (3x+ 4y)e−x2−y2

.

Zunachst bestimmen wir die kritischen Punkte

∂f

∂x= (3− 6x2 − 8xy)e−x2−y2

,

∂f

∂y= (4− 8y2 − 6xy)e−x2−y2

.

Wir haben also zwei Gleichungen, und die erste liefert

x 6= 0 und y =3− 6x2

8x.

Setzen wir dies in die zweite Gleichung ein, so wird

0 = 4− 89− 36x2 + 36x4

64x2− 9− 18x2

4=

32x2 − 9 + 36x2 − 36x4 − 18x2 + 36x4

8x2

=50x2 − 9

8x2,

also

x = ± 3

5√

2= ± 3

10

√2 und y = ±

3− 6·950

8 · 35√

2

= ±2

5

√2.

Die Funktionswerte in diesen Punkten sind

f

(± 3

10

√2,±3

5

√2

)= ±5

2

√2e−1/2 ≈ ±2, 1444.

Diese sind tatsachlich das im Graphen ersichtliche Maximum und Minimum, aber wirwollen noch begrunden warum die Rechnung funktioniert obwohl M = R2 nicht kom-pakt ist. Hierzu beachten wir

limx2+y2→∞

f(x, y) = 0,

303

Page 304: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

und f(−1, 0) < 0, f(1, 0) > 0. Wahlen wir also r > 0 groß genug, so ist

maxx∈R2

f(x) = maxx∈Br(0)

f(x)

und da der Kreis Br(0) kompakt ist, muss es ein globales Maximum geben.

$Id: mtaylor.tex,v 1.5 2011/09/21 13:36:24 hk Exp $

§9 Ableitungen hoherer Ordnung

Schon in §1.2 hatten wir partielle Ableitungen hoherer Ordnung eingefuhrt undeine Funktionen f : U → R definiert auf einer offenen Menge U ⊆ Rn wurde r-fachpartiell differenzierbar genannt wenn alle partiellen Ableitungen der Funktion f biszur Ordnung r auf ganz U existieren. Diesen Begriff konnen wir auf vektorwertigeFunktionen f : U → Rm verallgemeinern indem wir eine solche Funktion r-fach partielldifferenzierbar nennen wenn dies auf alle Komponenten fj fur 1 ≤ j ≤ m zutrifft. Sindzusatzlich diese samtlichen Ableitungen auch noch stetig, so nennen wir f dann r-fach stetig partiell differenzierbar. In dieser Terminologie haben wir im letzten Kapitelgezeigt, dass eine Funktion f : U → Rm genau dann stetig differenzierbar ist wennsie stetig partiell differenzierbar ist. Auch mehrfache Differenzierbarkeit konnen wirinduktiv definieren. Fur eine differenzierbare Funktion f : U → Rm mit U ⊆ Rn offenist die Ableitung eine Funktion

f ′ : U → Rm×n = Rmn.

Ist auch diese differenzierbar so nennen wir f zweifach differenzierbar und haben einezweite Ableitung

f ′′ : U → Rmn2

.

So fortfahrend ergibt sich:

Definition 9.1 (Hohere Ableitungen)Seien n,m ∈ N mit n,m ≥ 1, U ⊆ Rn offen und f : U → Rm eine Funktion. Weitersei r ∈ N mit r ≥ 2 und die (r− 1)-fache Differenzierbarkeit von f sowie die (r− 1)-teAbleitung f (r−1) : U → Rmnr−1

seien bereits definiert. Wir nennen f dann in einemPunkt x ∈ U r-fach differenzierbar wenn f (r − 1)-fach differenzierbar ist und f (r−1)

in x differenzierbar ist. Die r-te Ableitung von f in x definieren wir in diesem Fall als

f (r)(x) := (f (r−1))′(x) ∈ Rmnr

.

Ist f dann in jedem Punkt x ∈ U stets r-fach differenzierbar, so heißt f eine r-fachdifferenzierbare Abbildung und die obige Formel definiert eine Funktion f (r) : U →

304

Page 305: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

Rmnr, genannt die r-te Ableitung von f . Schlieslich heißt f r-fach stetig differenzierbar

wenn f r-fach differenzierbar ist und die r-te Ableitung f (r) stetig ist.

Nach §8.Lemma 14 sind die Komponenten von f ′ gerade die partiellen Ableitung∂fj/∂xi. Eine weitere Anwendung dieses Lemmas liefert das das Komponenten vonf ′′ = (f ′)′ die partiellen Ableitungen

∂xi

(∂fk

∂xj

)=

∂2f

∂xi∂xj

(1 ≤ k ≤ m, 1 ≤ i, j ≤ n)

zweiter Ordnung sind. So fortfahrend sind die Komponenten von f (r) die partiellenAbleitungen r-ter Ordnung. Fur die erste Ableitung r = 1 wissen wir aus §8 auch dasstetige Differenzierbarkeit gleichwertig zu stetiger partieller Differenzierbarkeit ist, undwenden wir diese Tatsache mehrfach an, so ergibt sich das folgende Lemma.

Lemma 9.1: Seien n,m, r ∈ N mit n,m, r ≥ 1, U ⊆ Rn offen und f : U → Rm eineFunktion. Dann ist f genau dann r-fach stetig differenzierbar wenn f r-fach stetigpartiell differenzierbar ist.

Beweis: Klar durch iterierte Anwendung des entsprechenden Resultats fur r = 1.

Wahrend r-fache Differenzierbarkeit also ein etwas diffiziler Begriff ist, ist die r-fachestetige Differenzierbarkeit vergleichsweise einfach zu entscheiden, man muss sich nurdie partiellen Ableitungen bis zu r-ter Ordnung anschauen. Um mit diesen hoherenpartiellen Ableitungen gut umgehen zu konnen, mussen wir wissen das diese fur aus-reichend gutartige Funktionen nicht von der Reihenfolge abhangen in der die partiellenAbleitungen ausgefuhrt werden. Fur zu allgemeine Funktionen ist dies falsch, wie wirschon in der allerersten Aufgabe (1) dieses Semesters gesehen haben. Wir werden sehendas die zweifache Differenzierbarkeit ausreicht um das Vertauschen zweifacher partiellerAbleitungen zu ermoglichen.

Hierzu beginnen wir mit einer Vorbemerkung. Seien n ∈ N mit n ≥ 1, eine offeneMenge U ⊆ Rn und eine differenzierbare Funktion f : U → R gegeben. Die Ableitungvon f ist dann als Jacobi-Matrix interpretiert

f ′(x) =

(∂f

∂x1

(x), . . . ,∂f

∂xn

(x)

)fur jedes x ∈ U . Ist f jetzt in einem Punkt x ∈ U sogar zweifach differenzierbar,so ist die Ableitung f ′′(x) eine lineare Abbildung f ′′(x) : Rn → Rn. Haben wir alsozwei Vektoren u, v ∈ Rn, so ist f ′′(x)(u) ∈ Rn aufgefasst als Zeilenvektor, und wirkonnen f ′′(x)(u)v ∈ R bilden. Wir benotigen eine etwas konkretere Beschreibung dieserAbbildung. Hierzu fuhren wir die lineare Abbildung φ : R1×n → R;w 7→ wv ein, underhalten mit der Kettenregel §8.Satz 17 und wegen φ′(y) = φ fur jedes y ∈ R1×n auch

f ′′(x)(u)v = φ(f ′′(x)u) = φ′(f ′(x))(f ′′(x)u) = (φ′(f ′(x)) ◦ f ′′(x))u = (φ ◦ f ′)′(x)u.

305

Page 306: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

Fur jedes y ∈ U gilt dabei

(φ ◦ f ′)(y) = φ(f ′(y)) = f ′(y)v =n∑

i=1

∂f

∂xi

(y)vi,

also wird

f ′′(x)(u)v = (φ ◦ f ′)′(x)u =n∑

j=1

∂xj

∣∣∣∣x

(n∑

i=1

∂f

∂xi

vi

)uj =

∑1≤i,j≤n

∂2f

∂xj∂xi

(x)viuj.

Fuhren wir also die n× n-Matrix

H :=

∂2f∂x2

1(x) · · · ∂2f

∂xn∂x1(x)

.... . .

...∂2f

∂xn∂x1(x) · · · ∂2f

∂x2n(x)

ein, so haben wir

(Hu) · v =∑

1≤i,j≤n

∂2f

∂xj∂xi

(x)viuj = f ′′(x)(u)v.

Die Matrix H wird uns spater noch einmal begegnen, daher wollen wir ihr hier nochkeinen eigenen Namen geben. Dass die Reihenfolge der zweiten partiellen Ableitungenkeine Rolle spielt, bedeutet genau das die Matrix H symmetrisch ist. Weiter habenwir zu Beginn des §6 gesehen, dass H genau dann symmetrisch ist, wenn (Hu) · v =u·(Hv) = (Hv)·u fur alle u, v ∈ Rn gilt, d.h. die Vertauschbarkeit der zweiten partiellenAbleitungen bedeutet das

f ′′(x)(u)v = f ′′(x)(v)u

fur alle u, v ∈ Rn gilt. Mit dieser Beobachtung sind wir zum Beweis des nachsten Satzesbereit.

Satz 9.2 (Lemma von Schwarz)Seien n ∈ N mit n ≥ 1, U ⊆ Rn offen und f : U → R eine differenzierbare Funktion.Weiter sei f in einem Punkt x ∈ U zweifach differenzierbar. Dann gilt

∂2f

∂xi∂xj

(x) =∂2f

∂xj∂xi

(x)

fur alle 1 ≤ i, j ≤ n.

Beweis: Wir weisen dies in der eingangs hergeleiteten Form nach. Seien also u, v ∈ Rn

gegeben. Wir behaupten das dann

f ′′(x)(v)u = lims↓0

f(x+ su+ sv)− f(x+ su)− f(x+ sv) + f(x)

s2

306

Page 307: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

gilt. Sei also ε > 0 vorgegeben. Die zweifache Differenzierbarkeit von f in x bedeutetdas es ein δ1 > 0 mit Bδ1(x) ⊆ U gibt so, dass wir fur alle h ∈ Rn mit ||h|| < δ1

f ′(x+ h) = f ′(x) + f ′′(x)h+ τ(h)

haben, wobei limh→0 ||τ(h)||/||h|| = 0 ist. Insbesondere existiert ein δ2 > 0 mit δ2 ≤ δ1und

||τ(h)||||h||

1 + ||u||(2||u||+ ||v||)fur alle h ∈ Rn mit 0 < ||h|| < δ2, also

||τ(h)|| ≤ ε||h||1 + ||u||(2||u||+ ||v||)

fur alle h ∈ Rn mit ||h|| < δ2. Setze δ := δ2/(1 + ||u|| + ||v||) > 0. Sei jetzt s ∈ R mit0 < s < δ gegeben. Fur jedes 0 ≤ t ≤ 1 sind dann

||tsu+ sv|| ≤ s(t||u||+ ||v||) ≤ s(||u||+ ||v||) ≤ δ(||u||+ ||v||) < δ2 ≤ δ1

und ||tsu|| = ts||u|| ≤ s||u|| ≤ s(||u|| + ||v||) < δ2 ≤ δ1, und insbesondere x + tsu +sv, x+ tsu ∈ Bδ1(x) ⊆ U . Damit ist die reelle Funktion

g : [0, 1] → R; t 7→ f(x+ tsu+ sv)− f(x+ tsu)

wohldefiniert, und nach der Kettenregel §8.Satz 17 ist g differenzierbar mit

g′(t) = s(f ′(x+ tsu+ sv)− f ′(x+ tsu)

)u

fur alle t ∈ [0, 1]. Nach dem Mittelwertsatz I.§14.Satz 10 existiert ein ξ ∈ (0, 1) mit

f(x+ su+ sv)− f(x+ su)− f(x+ sv) + f(x) = g(1)− g(0)

= g′(ξ) = s(f ′(x+ ξsu+ sv)− f ′(x+ ξsu)

)u.

Weiter sind ||ξsu + sv|| ≤ ξs||u|| + s||v|| ≤ s(||u|| + ||v||) < δ2 ≤ δ1 und ||ξsu|| =ξs||u|| ≤ ξs||u||+ s||v|| < δ2 ≤ δ1, also haben wir

f ′(x+ ξsu+ sv)− f ′(x) = sf ′′(x)(ξu+ v) + τ(ξsu+ sv),

f ′(x+ ξsu)− f ′(x) = sf ′′(x)(ξu) + τ(ξsu),

und dies ergibt

f ′(x+ ξsu+ sv)− f ′(x+ ξsu) = (f ′(x+ ξsu+ sv)− f ′(x))− (f ′(x+ ξsu)− f ′(x))

= sf ′′(x)(v) + τ(ξsu+ sv)− τ(ξsu).

Setzen wir dies in die obige Formel ein, so folgt weiter

f(x+su+sv)−f(x+su)−f(x+sv)+f(x) = s2f ′′(x)(v)u+sτ(ξsu+sv)u−sτ(ξsu)u.

307

Page 308: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

Damit ist schließlich∣∣∣∣∣∣∣∣f(x+ su+ sv)− f(x+ su)− f(x+ sv) + f(x)

s2− f ′′(x)(v)u

∣∣∣∣∣∣∣∣=

∣∣∣∣∣∣∣∣τ(ξsu+ sv)u

s− τ(ξsu)u

s

∣∣∣∣∣∣∣∣ ≤ ||τ(ξsu+ sv)u||s

+||τ(ξsu)u||

s

≤(||τ(ξsu+ sv)||

s+||τ(ξsu)||

s

)||u|| ≤ (2||u||+ ||v||) ε||u||

1 + ||u||(2||u||+ ||v||)< ε.

Somit ist tatsachlich

f ′′(x)(v)u = lims↓0

f(x+ su+ sv)− f(x+ su)− f(x+ sv) + f(x)

s2.

Die rechte Seite dieser Gleichung andert sich nicht bei Vertauschen von u und v, d.h.wir haben f ′′(x)(v)u = f ′′(x)(u)v fur alle u, v ∈ Rn, und dies war zu zeigen.

Durch mehrfache Anwendung des Lemmas kann man einen allgemeinen Vertauschungs-satz fur partielle Ableitungen beweisen. Zunachst kann man vektorwertige Funktionenbehandeln indem Satz 2 auf jede einzelne Komponentenfunktion angewandt wird. Einallgemeines Vertauschen einer p-fachen partiellen Ableitung kann man durch mehre-re Vertauschungen direkt aufeinanderfolgender partieller Ableitungen erreichen, unddass diese Einzelschritte moglich sind wissen wir bereits. Verwenden wir zusatzlich dasp-fache stetige Differenzierbarkeit gleichwertig zu p-facher partieller, stetiger Differen-zierbarkeit ist, so ergibt sich das folgende allgemeine Vertauschungslemma fur partielleAbleitungen.

Korollar 9.3 (Vertauschbarkeit partieller Ableitungen)Seien n,m ∈ N mit n,m ≥ 1, U ⊆ Rn offen, p ∈ N mit p ≥ 1 und f : U → Rm einep-fach stetig differenzierbare Funktion. Dann kann man die die Reihenfolge partiellerAbleitungen bis zu Ordnung p beliebig umordnen, d.h. sind 1 ≤ r ≤ p, 1 ≤ i1, . . . , ir ≤ nund ist π ∈ Sr eine Permutation, so gilt

∂rf

∂xi1 · · · ∂xir

(x) =∂rf

∂xiπ(1)· · · ∂xiπ(r)

(x)

fur alle x ∈ U .

Beweis: Wie schon gesehen folgt dies durch iterierte Anwendung von Satz 2.

Bei uns sind die Voraussetzungen des Korollars eigentlich immer erfullt, ist die Funkti-on f durch explizite Formeln aus den Grundfunktionen zusammengesetzt, so existierenalle partiellen Ableitungen beliebiger Ordnung und sind auch stetig, also lassen sichpartielle Ableitungen in dieser Situation nach dem Satz beliebig umordnen.

308

Page 309: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

9.1 Multiindizes

Wir haben schon fruher mehrfache partielle Ableitungen nach derselben Variable in

”Potenzschreibweise“ zusammengefasst, also beispielsweise

∂2f

∂x∂x=∂2f

∂x2,

∂3f

∂y∂y∂y=∂3f

∂y3,

∂3f

∂x∂y∂y=

∂3f

∂x∂y2, . . .

Sind die Voraussetzungen des Korollar 3 erfullt, so konnen wir diese Schreibweise mitdem Umordnen partieller Ableitungen kombinieren, beispielsweise

∂3f

∂x∂y∂x=

∂3f

∂x∂x∂y=

∂3f

∂x2∂y.

Damit konnen wir unter den Voraussetzungen von Korollar 3 die hoheren partiellenAbleitungen einer Funktion f immer in Standardform

∂k1+···+krf

∂xk1i1· · · ∂xkr

ir

mit 1 ≤ i1 < i2 < . . . < ir ≤ n schreiben. Lassen wir hier auch nullte Potenzen zu, sokonnen wir diese Schreibweise noch etwas weiter vereinfachen zu

∂k1+···+knf

∂xk11 · · · ∂xkn

n

.

Dabei bedeutet eine nullfache partielle Ableitung ∂x0i naturlich einfach nur gar nicht

abzuleiten. Fur eine Funktion f(x, y, z) in drei Variablen ist etwa

∂4f

∂x∂z∂x∂z=

∂4f

∂x2∂z2=

∂4f

∂x2∂y0∂z2.

Um diese Schreibweise zu systematisieren werden nun die sogenannten Multiindizeseingefuhrt. Ein Multiindex ist einfach ein Tupel

α = (α1, . . . , αn)

naturlicher Zahlen, d.h. α1, . . . , αn ∈ N. Fur eine Funktion f in n Variablen schreibenwir dann

∂α1+···+αnf

∂xα:=

∂α1+···+αnf

∂xα11 · · · ∂xαn

n

.

Damit ist die Notation schon fast wie im eindimensionalen Fall, nur der Ausdruck

”α1 + · · ·+αn“ stort noch etwas. Auch diese Unschonheit konnen wir durch Einfuhrung

einer weiteren Abkurzung umgehen, wir setzen fur jeden Multiindex α der Lange neinfach

|α| := α1 + · · ·+ αn,

309

Page 310: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

und konnen die obige partielle Ableitung dann als

∂|α|f

∂xα

schreiben. Zwei weitere Schreibweisen sind hilfreich

α! := α1! · . . . · αn!, (x− a)α := (x1 − a1)α1 · . . . · (xn − an)αn

fur jeden Multiindex α und alle a, x ∈ Rn. Beispielsweise sind

α = (2, 0, 1) : |α| = 3, α! = 2, (x− a)α = (x1 − a1)2(x3 − a3),

∂|α|fxα = ∂3f

∂x2∂z,

β = (2, 3) : |β| = 5, β! = 12, (x− a)β = (x1 − a1)2(x2 − a2)

3, ∂|β|f∂xβ = ∂5f

∂x2∂y3

Fur zwei Multiindizes α, β gleicher Lange n konnen wir noch

α+ β := (α1 + β1, . . . , αn + βn), α ≤ β :⇐⇒ α1 ≤ β1 ∧ . . . ∧ αn ≤ βn

definieren, und im Fall α ≤ β sei auch noch

β − α := (β1 − α1, . . . , βn − αn).

Die Fakultatsschreibweise α! wird sich zur Formulierung der Taylorformel als nutz-lich erweisen. Die Taylorformel wird wieder von Taylorpolynomen handeln, und dahermussen wir jetzt auch noch Polynome in mehreren Variablen einfuhren. Ein Polynomin einer Variablen ist ja einfach eine Funktion der Form

p(x) = a0 + a1x+ a2x2 + · · · ,

also

”konstanter Term“ +

”linearer Term“ +

”quadratischer Term“ + · · ·

Genauso soll es fur Polynome in mehreren Variablen sein. Was dabei ein konstanterTerm ist, ist wieder klar. Aber schon die Bedeutung des linearen Terms erfordert eineAnpassung, wir haben ja nicht nur eine Variable

”x“ zu berucksichtigen, sondern gleich

n Stuck x1, . . . , xn. Der lineare Term des Polynoms soll dann die Form a1x1+ · · ·+anxn

haben. Was der quadratische Term werden soll ist schon etwas feinsinniger. Man istzunachst versucht nur a1x

21+· · ·+anx

2n anzusetzen, aber das ist nicht ausreichend. Zum

Beispiel soll das Produkt von zwei Polynomen ja sicherlich ein Polynom sein, und damitbrauchen wir beispielsweise Zweierprodukte xixj von Variablen. Der quadratische Termsoll dann eine Summe von Vielfachen all dieser Zweierprodukte sein. Die Quadratefallen dann ebenfalls unter diese Zweierprodukte, es ist ja x2

i = xixi. Entsprechendgeht es weiter fur die Terme hoherer Ordnung, und ein Polynom in n Variablen wirddamit eine Funktion der Form

p(x1, . . . , xn) = a0 + a11x1 + · · ·+ a1nxn

+a211x21 + a212x1x2 + · · ·+ a21nx1xn + a221x2x1 + · · ·+ a2nnx

2n

+a3111x31 + a3112x

21x2 + · · ·+ a3nnnx

3m + · · ·

310

Page 311: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

Da diese Art Polynome hinzuschreiben aber hoffnungslos unubersichtlich ist, erinnernwir uns wieder an die Multiindex Notation

xα = xα11 · . . . · xαn

n ,

und schreiben den obigen Ausdruck in der Form

p(x) = p(x1, . . . , xn) =∑|α|≤N

aαxα

wobei fur jeden Multiindex α mit |α| ≤ N die Konstante aα ∈ R als ein Koeffizientvon f bezeichnet wird. Konkrete Beispiele solcher Polynome sind

f(x, y) = 2 + x+ y2 + 3yx− 7x3, g(x, y, z) = xyz + 2x2z2 − y5, . . .

Der Grad eines Monoms xα = xα1 · · ·xαn

n wird als α1 + · · ·+ αn = |α| definiert, also alsdie Summe aller auftretenden Exponenten. Dann bezeichnet die Zahl

”N“ gerade den

maximal auftretenden Grad, und das minimale mogliche N nennt man den Grad desPolynoms, d.h. der Grad eines Polynoms ist der großte Grad eines mit Koeffizient 6= 0auftretenden Monoms. Beispielsweise

x7 − y2z4 + xyz hat Grad 7,x3y3z + x2y2z3 − xy hat Grad 7 = 3 + 3 + 1 = 2 + 2 + 3.

Polynome in mehreren Variablen sind unendlich oft differenzierbar und es ist auchleicht ihre Ableitungen auszurechnen. Der Ubersichtlichkeit halber erinnern wir unserst einmal an Ableitungen eines Polynoms in einer Variablen

(xk)′ = kxk−1, (xk)′′ = k(k − 1)xk−2, . . . , (xk)(l) = k(k − 1) · · · (k − l + 1)xk−l

=k(k − 1) · · · (k − l + 1)(k − l) · · · 1

(k − l) · · · 1xk−l =

k!

(k − l)!xk−l

fur l ≤ k und (xk)(l) = 0 fur l > k. Fur je zwei Multiindizes α, β der Lange n mit α ≤ βfolgt damit

∂|α|xβ

∂xα=

β1!

(β1 − α1)!xβ1−α1

1 · . . . · βn!

(βn − αn)!xβn−αn

n

=β1! · . . . · βn!

(β1 − α1)! · . . . · (βn − αn)!xβ1−α1

1 xβn−αnn =

β!

(β − α)!xβ−α.

Im Fall α 6≤ β ist dagegen αi > βi fur ein 1 ≤ i ≤ n und somit ist ∂xβ/∂xα = 0.

311

Page 312: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

9.2 Die Taylor Entwicklung in mehreren Variablen

Wir wollen jetzt die Taylorformel auf den Fall von Funktionen in mehreren Variablenubertragen. Wir kennen zwei Varianten der eindimensionalen Taylorformel, einmal dieDarstellung mit Lagrangeschen Restglied aus I.§14.Satz 16 und zum anderen die Va-riante mit einer Integraldarstellung des Approximationsfehlers aus §2.Satz 19. BeideVarianten lassen sich auf den n-dimensionalen Fall ubertragen. Tatsachlich werden wirdie Taylorformel in n Variablen durch Ruckfuhrung auf den Fall einer Variable herlei-ten.

Wir schauen uns zunachst einmal an wie man das macht. Seien also n ∈ N mitn ≥ 1, eine offene Menge U ⊆ Rn, eine Funktion f : U → R und ein Entwicklungspunktx0 ∈ U gegeben. Wir wollen das Taylorpolynom p-ten Grades behandeln, wobei p ∈ Nmit p ≥ 1 ist, und hierzu setzen wir voraus das f mindestens (p + 1)-fach stetigdifferenzierbar ist. Da U offen ist, finden wir einen Radius r > 0 mit Br(x0) ⊆ U . Seix ∈ Br(x0). Dann betrachten wir die Hilfsfunktion

h : [0, 1] → R; t 7→ f(x0 + t(x− x0))

mit h(0) = f(x0) und h(1) = f(x). Auf diese Funktion wollen wir die eindimensio-nale Taylorformel mit dem Entwicklungspunkt t0 = 0 anwenden. Hierzu mussen wirzunachst einmal die ersten p Ableitungen von h berechnen. Mit der Kettenregel habenwir

h′(t) =n∑

i=1

∂f

∂xi

(x0 + t(x− x0)) · (xi − x0,i),

h′′(t) =∑

1≤i,j≤n

∂2f

∂xi∂xj

(x0 + t(x− x0)) · (xi − x0,i)(xj − x0,j),

h′′′(t) =∑

1≤i1,i2,i3≤n

∂3f

∂xi1∂xi2∂xi3

(x0 + t(x− x0)) · (xi1 − x0,i1)(xi2 − x0,i2)(xi3 − x0,i3),

und so fortfahrend ergibt sich die k-te Ableitung fur 1 ≤ k ≤ p+ 1 als

h(k)(t) =∑

1≤i1,...,ik≤n

∂kf

∂xi1 . . . ∂xik

(x0 + t(x− x0)) · (xi1 − x0,i1) . . . (xik − x0,ik),

jeweils fur alle t ∈ [0, 1]. Jeder Summand (i1, . . . , in) definiert einen Multiindex α durch

αj := Anzahl der 1 ≤ q ≤ k mit iq = j

mit |α| = k und der entsprechende Summand nimmt dann die Form

∂|α|f

∂xα(x0 + t(x− x0)) · (x− x0)

α

an. Leider konnen verschiedene Indizes zum selben Multiindex fuhren, und jeder Mul-tiindex α mit |α| = k tritt in der Summe zur Berechnung von h(k)(t) so oft auf, wie

312

Page 313: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

es zu ihm passende Multiindizes gibt. Dies Zahl konnen wir leicht ermitteln. Zunachsteinmal wahlen wir irgendeine passende Indexkombination und alle anderen ergebensich dann durch Permutationen dieser k Indizes. Fur diese Permutationen gibt es nachI.§10.Lemma 1 genau k! Moglichkeiten. Allerdings konnen verschiedene Permutationenzu den selben Indizes fuhren, namlich dann wenn sie nur Indizes mit gleichem Wertvertauschen. Da es fur 1 ≤ j ≤ n stets αj viele Indizes mit Wert j gibt, tritt dies genau

α1! · . . . · αn! = α!

oft auf. Die Anzahl der zu α passenden Multiindizes ist also k!/α! und somit wird

h(k)(t) =∑|α|=k

k!

α!

∂kf

∂xα(x0 + t(x− x0)) · (x− x0)

α

fur jedes t ∈ [0, 1]. Das p-te Taylorpolynom von h zum Entwicklungspunkt t0 = 0 istalso

Tph(t) =

p∑k=0

h(k)(0)

k!tk =

∑|α|≤p

1

α!

∂|α|f

∂xα(x0) · (x− x0)

αt|α|.

Werten wir dieses Polynom in t = 1 aus, so ergibt sich das Taylorpolynom der Funktionf , also:

Definition 9.2 (Taylorpolynom in n Variablen)Seien n, p ∈ N mit n, p ≥ 1, U ⊆ Rn offen, a ∈ U und f : U → R eine p-fach stetigdifferenzierbare Funktion. Das p-te Taylorpolynom von f mit Entwicklungspunkt a istdann das Polynom

Tpf(x) :=∑|α|≤p

1

α!· ∂

|α|f

∂xα(a) · (x− a)α.

In anderen Worten ist das Taylorpolynom Tpf das Polynom von Grad hochstens pdessen samtliche partiellen Ableitungen bis zu Ordnung p in a mit denen von f uber-einstimmen. Beispielsweise haben wir im Fall n = p = 2 und dem Entwicklungspunkta = 0 das quadratische Taylorpolynom

T (x, y) = f(0) +∂f

∂x(0)x+

∂f

∂y(0)y +

1

2

∂2f

∂x2(0)x2 +

1

2

∂2f

∂y2(0)y2 +

∂2f

∂x∂y(0)xy.

Rechnen wir als ein Beispiel einmal das quadratische Taylorpolynom der Funktion

f(x, y) = (3x+ 4y)e−x2−y2

313

Page 314: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

aus. Alle relevanten partiellen Ableitungen haben wir bereits berechnet

∂f

∂x= (3− 6x2 − 8xy)e−x2−y2

,

∂f

∂y= (4− 8y2 − 6xy)e−x2−y2

,

∂2f

∂x2= (−18x− 8y + 12x3 + 16x2y)e−x2−y2

,

∂2f

∂y∂x= (−8x− 6y + 12x2y + 16xy2)e−x2−y2

,

∂2f

∂x∂y= (−6y − 8x+ 16xy2 + 12x2y)e−x2−y2

,

∂2f

∂y2= (−6x− 24y + 16y3 + 12xy2)e−x2−y2

,

und damit gelten

f(0, 0) = 0,∂f

∂x(0, 0) = 3,

∂f

∂y(0, 0) = 4,

und die vier partiellen Ableitungen zweiter Ordnung sind alle Null. Das quadratischeTaylorpolynom mit Entwicklungspunkt Null ist damit

T2f(x, y) = 3x+ 4y.

Fur das Taylorpolynom dritten Grades mussten wir jetzt schon vier partielle Ableitun-gen dritter Ordnung ausrechnen, dann funf fur das Polynom vierter Ordnung, und soweiter. Die Rechnungen werden viel einfacher wenn wir uns an §1 erinnern, dort hattenwir gesehen wie sich die Berechnung von Taylorpolynomen in einer Variablen durch dieVerwendung von Potenzreihen beschleunigen ließ. Dieses Vorgehen funktioniert auchbei Taylorpolynomen in mehreren Variablen. Erinnern wir uns an die Potenzreihe

et = 1 + t+t2

2+ · · · ,

so wird

f(x, y) = (3x+ 4y)e−x2−y2

= (3x+ 4y) · (1− x2 − y2 + · · · )= 3x+ 4y − 3x3 − 3xy2 − 4x2y − 4y3 + · · ·

und dies ist das dritte Taylorpolynom zum Entwicklunspunkt 0. Wie im eindimensio-nalen Fall approximieren die Taylorpolynome die gegebene Funktion, und zwar umsobesser je hoher der Grad des Taylorpolynoms ist. Es gibt auch wieder eine Formel, dieden Approximationsfehler explizit angibt.

Satz 9.4 (Taylorformel im Rn)Seien n, p ∈ N mit n, p ≥ 1, U ⊆ Rn offen und f : U → R sei (p + 1)-fach stetig

314

Page 315: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

differenzierbar. Seien weiter a ∈ U und r > 0 mit Br(a) ⊆ U . Dann gilt fur jedesx ∈ Br(a) die Taylorformel

f(x) =∑|α|≤p

1

α!· ∂

|α|f

∂xα(a) · (x− a)α + τ(x− a)

wobei τ(h) fur ||h|| ≤ r der Approximationsfehler ist. Fur ||h|| ≤ r ist dann

τ(h) = (p+ 1)∑

|α|=p+1

1

α!

[∫ 1

0

(1− t)p∂p+1f

∂xα(a+ th) dt

]· hα

und es gibt ein ξ ∈ (0, 1) mit

τ(h) =∑

|α|=p+1

1

α!

∂p+1f

∂xα(a+ ξh)hα.

Beweis: Beide Aussagen folgen sofort durch Anwendung der eindimensionalen Taylor-formeln I.§14.Satz 16 und §2.Satz 19 auf die oben besprochene Hilfsfunktion h.

Aus diesen Formeln kann man auch leicht die Großenordnung des Approximations-fehlers in Abhangigkeit von h bestimmen. Da f als (p + 1)-fach stetig differenzierbarvorausgesetzt ist, sind alle partiellen Ableitungen ∂p+1f/∂xα fur |α| = p+1 stetig, alsoauf der kompakten Menge Br(a) nach §8.Lemma 1.(d) beschrankt, d.h.

A := max|α|=p+1

supx∈Br(a)

∣∣∣∣∂p+1f

∂xα(x)

∣∣∣∣ <∞

ist endlich. Weiter behaupten wir das fur alle m, r ∈ N mit m ≥ 1 stets∑α∈Nm

|α|=r

1

α!=mr

r!

ist. Dies kann man beispielsweise durch Induktion nach m einsehen. Fur m = 1 ist dieFormel klar. Sei nun weiter m ∈ N mit m ≥ 1 und fur jedes r ∈ N gelte die Formel. Seir ∈ N. Fur jedes α ∈ Nm+1 mit |α| = r ist 0 ≤ αm+1 ≤ r und schreiben wir α = (β, k)so sind damit 0 ≤ k ≤ r und |β| = r − k. Mit der binomischen Formel I.§4.Lemma 5und der Induktionsannahme folgt damit

∑α∈Nm+1

|α|=r

1

α!=

r∑k=0

1

k!

∑α∈Nm

|α|=r−k

1

α!=

r∑k=0

mr−k

k!(r − k)!=

1

r!

r∑k=0

(r

k

)mr−k =

(m+ 1)r

r!.

315

Page 316: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

Per vollstandiger Induktion ist diese Behauptung damit bewiesen. In der Situation derTaylorformel erhalten wir fur h ∈ Br(0) ein ξ ∈ (0, 1) mit

τ(h) =∑

|α|=p+1

1

α!

∂p+1f

∂xα(a+ ξh)hα

und wegen a+ ξh ∈ Br(a) ist damit

|τ(h)| ≤∑

|α|=p+1

1

α!

∣∣∣∣∂p+1f

∂xα(a+ ξh)

∣∣∣∣ · |hα| ≤ A||h||p+1∞

∑|α|=p+1

1

α!=

Anp+1

(p+ 1)!||h||p+1

∞ .

Setzen wir also

C :=np+1

(p+ 1)!max|α|=p+1

supx∈Br(a)

∣∣∣∣∂p+1f

∂xα(x)

∣∣∣∣ ,so ist |τ(h)| ≤ C||h||p+1

∞ fur alle h ∈ Br(0). Verwenden wir das in §1.2 eingefuhrteLandau Symbol, so schreibt sich die Taylorformel damit als

f(x) =∑|α|≤p

1

α!· ∂

|α|f

∂xα(a) · (x− a)α +O(||x− a||p+1

∞ ).

9.3 Lokale Extrema

Seien wieder U ⊆ Rn eine offene Menge und f : U → R eine dreimal stetig differenzier-bare Funktion. In §8.Satz 24 hatten wir gesehen, dass jedes lokale Extremum a ∈ Uvon f auch ein kritischer Punkt von f ist, das also grad f(a) = 0 gilt. Ausgerustet mitder Taylorentwicklung des Satz 4 konnen wir nun auch die Frage untersuchen, wannein kritischer Punkt umgekehrt ein lokales Extremum ist. Sei also a ∈ U ein kritischerPunkt von f . Das quadratische Taylorpolynom von f mit Entwicklungspunkt a hatdann wegen ∂f/∂xi(a) = 0 fur i = 1, . . . , n die Form

T2(x) = f(a) +∑|α|=2

1

α!

∂2

∂xα(a)(x− a)α

= f(a) +n∑

i=1

1

2

∂2f

∂x2i

(a)(xi − ai)2 +

∑1≤i<j≤n

∂2f

∂xi∂xj

(a)(xi − ai)(xj − aj)

= f(a) +1

2

∑1≤i,j≤n

∂2f

∂xi∂xj

(a)(x− ai)(x− aj).

Dies ist nun eine quadratische Funktion im Sinne des §6.3, und kann daher in Matrix-form als

T2(x) = f(a) +1

2(H(x− a)) · (x− a)

316

Page 317: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

geschrieben werden, wobei H die aus den zweiten partiellen Ableitungen gebildeten× n Matrix ist. Die Matrix H wird dann auch als die Hesse Matrix von f im Punkta bezeichnet:

Definition 9.3 (Die Hesse-Matrix)Seien U ⊆ Rn offen, f : U → R eine zweifach differenzierbare Funktion und a ∈ U . DieHesse Matrix H von f in a ist dann die Matrix

H =

∂2f∂x2

1(a) · · · ∂2f

∂x1∂xn(a)

.... . .

...∂2f

∂xn∂x1(a) · · · ∂2f

∂x2n(a)

.

Nach Satz 2 ist die Hesse Matrix H symmetrisch, tatsachlich wurde Satz 2 bewiesenindem die Symmetrie von H nachgewiesen wurde. Kommen wir zu unserem kritischenPunkt a ∈ U zuruck. Nahe bei a haben wir dann

f(x) = f(a) +1

2(H(x− a)) · (x− a) + τ,

wobei wir den Approximationsfehler τ ausreichend nahe bei a erst einmal ignorierenwerden. Als symmetrische Matrix hat die Hesse Matrix H nach §6.Satz 7 nur reelleEigenwerte λ1, . . . , λn und bezuglich eines geeigneten Koordinatensystems konnen wirnach dem Satz §6.Korollar 11 uber die Hauptachsentransformation auch

f(x) = f(a) +n∑

i=1

λi(xi − ai)2 + τ

schreiben. An dieser Darstellung ist direkt ersichtlich ob in a ein lokales Extremumvorliegt.

–2

0

2x

–3 –2 –1 0 1 2 3

y

0

2

4

6

8

10

12

14

16

18

–3–2

–10

12

3

x

–3

–2

–1

0

1

2

3

y

–8

–6

–4

–2

0

2

4

6

8

–1–0.500.51x

–1

0

y

–2

–1.5

–1

–0.5

0

x2 + y2 x2 − y2 −x2 − y2

317

Page 318: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

Sind alle Eigenwerte λ1, . . . , λn > 0, so sieht T2 im wesentlichen wie ein nach obengeoffnetes Paraboloid aus, und wir haben ein lokales Minimum. Im Fall λ1, . . . , λn < 0haben wir entsprechend ein nach unten geoffnetes Paraboloid und ein lokales Maximum.Gibt es Eigenwerte λi > 0, λj < 0, so hat f wie die Sattelflache in der Mitte in auberhaupt kein lokales Extremum.

Nach §6.Satz 12 bedeutet λ1, . . . , λn > 0 genau das die Hesse Matrix H positiv de-finit ist, der Fall λ1, . . . , λn < 0 bedeutet das H negativ definit ist und bei Eigenwertenmit verschiedenen Vorzeichen ist H indefinit. Dies fuhrt auf den gleich folgenden Satzuber lokale Extrema. In unserer bisherigen Argumentation haben wir die quadratischeTaylorentwicklung verwendet und mussten dafur dreifache stetige Differenzierbarkeitvoraussetzen. Tatsachlich gilt der Satz auch wenn die Funktion nur als zweifach ste-tig differenzierbar vorausgesetzt wird, wir mussen unseren Beweis aber ein klein wenigabandern.

Zunachst benotigen wir eine kleine Vorbemerkung uber positiv definite Matrizen.Wir betrachten die Menge

S := {A ∈ Rn×n|At = A}

aller symmetrischen n × n-Matrizen uber R als Untervektorraum des Rn×n. Wir be-haupten das die Menge P+ aller positiv definiten n × n-Matrizen uber R eine offeneTeilmenge von S ist. Die Stetigkeit der Determinante ergibt, dass die Menge

Pk :=

a11 · · · a1n

.... . .

...an1 · · · ann

:

∣∣∣∣∣∣∣a11 · · · a1k...

. . ....

ak1 · · · akk

∣∣∣∣∣∣∣ > 0

fur jedes 1 ≤ k ≤ n offen in S ist, und nach §4.Lemma 17.(g) und §6.Satz 14 ist damitauch

P+ :=n⋂

k=1

Pk

offen in S. Weiter ist damit auch die Menge

P− := {A ∈ S|A ist negativ definit} = {A ∈ S| − A ∈ P+}

aller negativ definiten Matrizen offen in S. Damit kommen wir zu unserem Satz uberlokale Extrema einer zweifach stetig differenzierbaren Funktion.

Satz 9.5 (Kriterium fur lokale Extrema)Seien n ∈ N mit n ≥ 1, U ⊆ Rn offen, f : U → R eine zweifach stetig differenzierbareFunktion und a ∈ U ein kritischer Punkt von f , also grad f(a) = 0. Sei H die HesseMatrix von f in a.

(a) Ist H positiv definit, so hat f in a ein lokales Minimum.

(b) Ist H negativ definit, so hat f in a ein lokales Maximum.

318

Page 319: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

(c) Ist H indefinit, so hat f in a kein lokales Extremum.

Beweis: Wahle einen Radius r > 0 mit Br(0) ⊆ R. Da wir voraussetzen das die zweitenpartiellen Ableitungen von f stetig sind, ist auch die Hesse-Matrix H : U → Rn×n alsFunktion von x ∈ U eine stetige Funktion.(a) Da die Menge der positiv definiten Matrizen offen in der Menge aller symmetrischenMatrizen ist gibt es ein δ > 0 mit δ ≤ r so, dass fur jedes x ∈ U mit ||x− a|| < δ auchdie Hesse-Matrix H(x) positiv definit ist. Sei jetzt h ∈ Rn mit 0 < ||h|| < δ gegeben.Nach Satz 4 gibt es ein ξ ∈ (0, 1) mit

f(a+ h) = f(a) + (H(a+ ξh)h) · h,

und wegen ||a+ ξh− a|| = ξ||h|| < δ ist H(a+ ξh) positiv definit und somit

f(a+ h) = f(a) + (H(a+ ξh)h) · h > f(a).

Also ist f(x) > f(a) fur alle a 6= x ∈ Bδ(a) und somit hat f in a ein lokales Minimum.(b) Analog zu (a).(c) Es gibt Vektoren u1, u2 ∈ Rn mit ||u1|| = ||u2|| = 1, (Hu1) ·u1 > 0 und (Hu2) ·u2 <0. Sei i ∈ {1, 2}. Da die Abbildung A 7→ (Aui) · ui stetig ist, gibt es ein δi > 0 mitδi ≤ r so, dass |(H(x)ui) · ui − (Hui) · ui| < |(Hui) · ui| fur alle x ∈ Bδ(a) ist und dannist auch sign((H(x)ui) · ui) = sign((Hui) · ui) fur alle x ∈ Bδ(a).

Setze δ := min{δ1, δ2} > 0. Sei t ∈ (0, δ). Sei i ∈ {1, 2}. Dann ist ||tui|| = t < δ ≤ r,also existiert nach Satz 4 ein ξ ∈ (0, 1) mit

f(a+ tui) = f(a) + t2(H(a+ ξtui)ui) · ui

und wegen ||ξtui|| = ξt ≤ t < δi ist sign((H(a + ξtui)ui) · ui) = sign((Hui) · ui). Dieszeigt f(a+tu1) > f(a) und f(a+tu2) < f(a). Damit hat f in a kein lokales Extremum.

Beachte das die Fallunterscheidung im Satz nicht vollstandig ist, es gibt symmetrischeMatrizen H, die weder positiv definit, negativ definit noch indefinit sind. Dies passiertwenn H den Eigenwert 0 hat, also nicht invertierbar ist. In dieser Situation sagt derSatz nichts aus, und man muss sich den jeweils vorliegenden Spezialfall anschauen. Wirrechnen jetzt einige Beispiele.

Zunachst sei f die schon mehrfach betrachtete Funktion

f(x, y) = x2y + y2 − 2y − xy.

Alle relevanten Ableitungen hatten wir bereits fruher ausgerechnet

∂f

∂x= 2xy − y,

∂f

∂y= x2 − x+ 2y − 2,

∂2f

∂x2= 2y,

∂2f

∂x∂y= 2x− 1,

∂2f

∂y2= 2.

Wir hatten auch bereits alle kritischen Punkte von f berechnet, und genau drei solchegefunden. Gehen wir diese drei kritischen Punkte einmal durch:

319

Page 320: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

1. Der Punkt (x, y) = (1/2, 9/8). Die Hesse Matrix in diesem Punkt ist

H =

(∂2f∂x2

(12, 9

8

)∂2f∂x∂y

(12, 9

8

)∂2f∂x∂y

(12, 9

8

)∂2f∂y2

(12, 9

8

) ) =

(94

00 2

).

Diese Matrix ist positiv definit, wir haben also ein lokales Minimum.

2. Der Punkt (x, y) = (−1, 0). Diesmal wird die Hesse Matrix zu

H =

(0 −2

−2 2

).

Da der Eintrag links oben Null ist, ist H weder positiv noch negativ definit. Umzu entscheiden ob H indefinit ist, berechnen wir die Eigenwerte von H

χH(x) = x2 − 2x− 4 =⇒ λ = 1±√

1 + 4 = 1±√

5.

Wegen 1−√

5 < 0, 1 +√

5 > 0 ist die Hesse Matrix H indefinit, und in (x, y) =(−1, 0) ist kein lokales Extremum.

3. Der letzte kritische Punkt ist (x, y) = (2, 0). Diesmal gilt

H =

(0 33 2

).

Wir rechnen wieder

χH(x) = x2 − 2x− 9 =⇒ λ = 1±√

1 + 9 = 1±√

10

und wegen 1−√

10 < 0, 1 +√

10 > 0 haben wir wieder kein lokales Extremum.

Wir wollen noch ein allerletztes Beispiel rechnen, namlich die ebenfalls schon in §8behandelte Funktion

f(x, y, z) = x2 + 4y2 − 2xyz + sin(πz).

Die relevanten partiellen Ableitungen sind

∂f∂x

= 2x− 2yz, ∂f∂y

= 8y − 2xz, ∂f∂z

= −2xy + π cos(πz),∂2f∂x2 = 2, ∂2f

∂x∂y= −2z, ∂2f

∂x∂z= −2y,

∂2f∂y2 = 8, ∂2f

∂y∂z= −2x, ∂2f

∂z2 = −π2 sin(πz).

In einem Beispiel in §8 hatten wir bereits ausgerechnet, dass es nur einen kritischenPunkt (x, y, z) mit y 6= 0 gibt, namlich

(x, y, z) =

(√π,

1

2

√π, 2

).

320

Page 321: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

Die Hesse Matrix von f in diesem kritischen Punkt ist

H =

2 −4 −√π

−4 8 −2√π

−√π −2

√π 0

.

Wegen ∣∣∣∣ 2 −4−4 8

∣∣∣∣ = 0

ist H nach dem Determinanten Kriterium §6.Satz 14 nicht positiv definit. Die MatrixH kann auch nicht negativ definit sein, und wegen

detH =

∣∣∣∣∣∣2 −4 −

√π

−4 8 −2√π

−√π −2

√π 0

∣∣∣∣∣∣ = π

∣∣∣∣∣∣2 −4 1

−4 8 21 2 0

∣∣∣∣∣∣ = π

∣∣∣∣∣∣2 −4 1

−8 16 01 2 0

∣∣∣∣∣∣= π

∣∣∣∣ −8 161 2

∣∣∣∣ = −32π

ist H invertierbar. Damit ist H indefinit und es liegt kein lokales Extremum vor. Diekritischen Punkte (x, 0, z) sind durch die Gleichungen

2x = 0, −2xz = 0 und π cos(πz) = 0

gegeben, also

(x, y, z) =

(0, 0,

1

2+ n

)mit n ∈ Z.

Wegen

sin(π

2+ nπ

)= (−1)n sin

π

2= (−1)n

wird die Hesse Matrix in diesem kritischen Punkt zu

H =

2 −(2n+ 1) 0−(2n+ 1) 8 0

0 0 (−1)n+1π2

.

Dabei gilt∣∣∣∣ 2 −(2n+ 1)−(2n+ 1) 8

∣∣∣∣ = 16− (2n+ 1)2 = −4

(n2 + n− 15

4

).

Die Nullstellen von x2 + x− 15/4 sind

−1

2+

√1

4+

15

4= −1

2± 2 also x = −5

2und x =

3

2.

321

Page 322: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

Die Matrix H ist damit invertierbar und somit positiv definit oder indefinit. Weiter istnach dem Determinanten Kriterium §6.Satz 14

H ist positiv definit ⇐⇒ n2 + n− 15

4< 0 und (−1)n+1π > 0

⇐⇒ n ∈ {−2,−1, 0, 1} und n ungerade

⇐⇒ n = ±1.

In den kritischen Punkten

(x, y, z) =

(0, 0,−1

2

)und (x, y, z) =

(0, 0,

3

2

)hat f also ein lokales Minimum und in den anderen kritischen Punkten liegt kein lokalesExtremum vor.

322

Page 323: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Index

A∗, 204χA, siehe charakteristisches Polynom⋃

, 126∂

∂xi, 12

δ(α), 53∂f∂xi|a, 12

∂f∂xi|x=a, 12

Dif , 12∂if , 12

∂rf∂xir ···∂xi1

, 15

∂vf(x), 274Dxi

f , 12∂xif , 12

1-Form, 290f |ba, 77fi, 12fxi

, 12Γ, siehe Gammafunktion[x], 56∫

, 59|| ||∞, 146∫

, 59∫, 59

M , 154M◦, 157MN , 122∂M , 160∇, 294|| ||, 147|| ||2, 148, 149⊥, 210, 215〈 | 〉, 205|| ||∞, 148abgeschlossene

Kugel, 155, 157, 260, 266Menge, 154, 155, 158, 160, 261

Ableitung, 282

linksseitig, 7rechtsseitig, 7

Abschluß, 154–158, 261abzahlbar, 125–127, 157Ahnliche Matrix, 173, 175Aquivalenz von Normen, 260, 261, 263antilinear, 205Approximationsfehler, 11, 278, 315Ausgleichsgerade, 217–220

Banachraum, 161Bε(x), 154Bε(x), 154Beruhrpunkt, 154Bernoulli Zahlen, 40–42Bernstein Polynom, 130, 131Besselsche

Identitat, 213Ungleichung, 215

Bewegung, 242eigentlich, 243

Binomialkoeffizient, 40Binomische Reihe, 39–40B(M ;K), 147Bn, 41

Cauchy Kriterium, 161fur die gleichmaßige Konvergenz, 133,

145fur Funktionsgrenzwerte, 115fur uneigentliche Integrale, 116

Cauchy-Schwartz Ungleichung, 206Cauchyfolge, 161, 261charakteristische Gleichung, 165charakteristisches Polynom, 169, 173, 176

Determinantenkriterium, 241diagonalisierbar, 174, 176, 179, 201, 220Diagonalmatrix, 175

323

Page 324: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

dichte Teilmenge, 157Differentialform, 290Differenzenquotient, 5Dirichlet Funktion, 56, 60, 127Drehachse, 248, 251Drehgruppe, 251Drehmatrix, 250Drehspiegelung, 251Drehstreckung, 180Drehung, 163, 170, 180, 247–251Drehungsformel, 249Drehwinkel, 248, 251Dreiecksungleichung, 207, 272

fur die Supremumsnorm, 147fur Integrale, 66, 116fur Normen, 147–148

Eigenraum, 164, 179Eigenvektor, 163, 164, 174, 222Eigenwert, 163, 164, 171, 173, 174, 176,

185, 200, 220, 226, 232, 238, 239,243

komplex, 179Einsetzen von Potenzreihen, 31–33Eλ(T ), 164Endomorphismus, 162Entwicklungspunkt, 11, 20, 21, 313erf(x), 104euklidische Norm, 148Eulerwinkel, 252–253Exponentialfunktion, 2

Fehlerfunktion, 104–106Feinheit, 53Fibonacci Zahlen, 177–179Fresnel Integral, 119–120Frobenius Kriterium, 241Funktion

analytisch, 21, 22, 26–30, 34, 36, 39,47, 105

beschrankt, 134differenzierbar, 278, 280, 283, 284, 286,

287, 290, 294, 296, 306in eine Richtung differenzierbar, 274

konkav, 3, 5konstant, 1, 294konvex, 2–5, 7, 9–10monoton, 6partiell differenzierbar, 12, 15, 283, 284r-fach differenzierbar, 304r-fach partiell differenzierbar, 15r-fach stetig differenzierbar, 305, 308,

315r-fach stetig partiell differenzierbar, 305stetig, 136, 138stetig differenzierbar, 286, 291–293strikt konkav, 3strikt konvex, 2

Funktionenfolge, 122Funktionsgrenzwert, 135Funktionsreihen, 145–146

Gammafunktion, 141–142Gauß Klammer, 56Gleichmaßige Stetigkeit, 66–67grad f , 294Gradient, 294Gram-Schmidt Orthonormalisierung, sie-

he OrthonormalisierungGraph, 3, 276Grenzfunktion, 122, 134, 136, 140, 143–145Gruppe

orthogonale, 244spezielle orthogonale, 244spezielle unitare, 244unitare, 244

Hadamard Kriterium, 241halbeinfach, 179, 180, 203Harmonische Reihe, 117Hauptachsentransformation, 228, 232, 238,

317Berechnung, 237–238

Hauptsatzder Algebra, 94, 264der Differential und Integralrechnung,

70hermitesche Matrix, 204, 220, 222, 226, 239

324

Page 325: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

Hesse Matrix, 317, 318Hilbertraum, 207Hohere

Ableitungen, 304–305partielle Ableitungen, 15, 305, 309

Hyperbelfunktionen, 42

Identitatssatz, 29indefinit, 239, 319innerer Punkt, 157Inneres einer Menge, 157–159, 261Integral, 60, 63, 64

absolut konvergent, 116divergent, 112konvergent, 110uneigentlich, 110, 120

Integralsinus, 106–107, 115integrierbar, 59–64, 68, 136

absolut, 116, 117uneigentlich, 110, 116, 120, 140

Jacobi Matrix, 282, 283, 289Jakobi Kriterium, 241Jordan Zerlegung, 203Jordankastchen, 181, 185Jordansche Normalform, 181, 182, 185

Berechnung, 193–195

Kettenregel, 287, 289Koeffizientenvergleich, 23kompakt, 254–256, 258, 260, 261, 298Komponentenfunktionen, 270, 279konkave

Funktion, siehe Funktion, konkavKonvergenz von Funktionenfolgen

gleichmaßig, 128, 133, 134, 136, 139,146–147, 149, 161

lokal gleichmaßig, 139, 140, 143–145punktweise, 122

Konvergenzradius, 21, 22konvexe

Funktion, siehe Funktion, konvexMenge, 266, 269

kritischer Punkt, 296, 297, 316, 318

Kurve, 270differenzierbar, 271integrierbar, 272

`2, 207Landau Symbol, 18, 316Lemma von Schwarz, 306Linearfaktoren, 89, 94, 171, 176lokal, 22, 285, 295lokales

Extremum, 296, 297, 319Maximum, 296, 318Minimum, 296, 318

Lotfußpunkt, 215

Majorantenkriterium, 117–120Mathematisches Pendel, 43, 109Mittelwertsatz, 1, 107, 273, 293, 296Mittelwertungleichung, 293Momente, 137, 138Monotonie

der Ableitung, 9des Differenzenquotienten, 6

Multiindex, 309

negativ definit, 239, 318negativ semidefinit, 239Newtonsche Reihe, siehe Binomische Rei-

henilpotent, 202, 203Niveaumengen, 228Norm, 147, 205, 207, 261

einer linearen Abbildung, 292vollstandig, 161, 207, 261

Normierter Raum, 147, 207vollstandig, 161, 214, 258

Normiertes Polynom, 86Nullstelle, 89, 95

Oberintegral, 59Obersumme, 54offene

Kugel, 155, 158, 266Menge, 157–159, 260, 269

325

Page 326: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

O(n), 244OnR, 244Orthogonalbasis, 210orthogonale Matrix, 224, 225, 242–243, 247

2× 2, 2473× 3, 250

Orthogonalprojektion, 215auf eine Ebene, 219

Orthogonalsystem, 210Orthonormalbasis, 210, 213–215, 221, 222,

225Orthonormalisierung, 211

Berechnung, 211Orthonormalsystem, 210

Parseval Identitat, 213Partialbruchzerlegung, 82, 88–93, 95, 98partielle Ableitungen, 12–15, 274, 276–277Partielle Integration, 76–78, 114Pendelgleichung, 43, 47, 48, 109Polynomdivision, 85–86, 90positiv definit, 239–241, 318

Skalarprodukt, 205positiv semidefinit, 239Potenzreihe, 20, 22–24, 27, 32–33, 37, 104,

314Prahilbertraum, 205–207, 210, 213–215prakompakt, 258Produktregel, 290

quadratischeForm, 227, 238Funktion, 226, 227, 232, 316

Rand, 160, 261Rekursionsformel, 83, 84relativ kompakt, 258R(f ; ζ), 53Richtung des starksten Anstiegs, 294–296Richtungsableitung, 274, 280

der Determinante, 275Rieman Integral, siehe IntegralRieman integrierbar, siehe integrierbarRiemansumme, 53, 54, 272

S, 54S, 54Satz des Pythagoras, 215Satz von Heine-Borel, 149, 260Scherung, 163, 170, 172schwingende Saite, 15–18Sekante, 1, 3, 5, 9senkrecht, 210, 215separabel, 157Si(x), 106Skalarfeld, 294Skalarprodukt, 148, 203, 205, 238

hermitesch, 204, 205SO(n), 244SOnR, 244Spiegelung, 245–247, 251Spiegelungsformel, 245Spiegelungsmatrix, 245Spur, 169, 200, 275, 286Stammfunktion, 71, 75, 105, 143

des Logarithmus, 75rationaler Funktionen, 89–91, 93–94trigonometrischer Funktionen, 72–73,

75, 83–84von (Ax+B)/(x2 + ax+ b)n, 101–102von 1/(1 + x2)n, 99–100von 1/(x2 + ax+ b)n, 101von 1/x, 72von αx, 72von f · f ′, 80von f ′/f , 72–73von p(x)/(x− a)n, 87–89von xn, 71von xα, 72von Potenzreihen, 104

Stetigkeit, 150–152linearer Abbildungen, 153

Substitutionsregel, 79–83, 114Summenregel, 287SU(n), 244SUnC, 244Supremumsnorm, 146–147, 154symmetrische Matrix, 203, 220, 222, 226,

326

Page 327: Inhaltsverzeichnis - math.uni-kiel.de · 1.1 Konvexe und konkave Funktionen Wir wollen im nun folgenden Abschnitt eine weitere wichtige Klasse reeller Funktio-nen einf¨uhren und

Mathematik fur Physiker II, SS 2011 Freitag 8.7.2011

232, 238, 239, 241

Tangente, 1, 9Tangentialebene, 276, 297Tangentialvektor, 271, 276, 286Taylor Formel, 108, 315, 316Taylorpolynom, 11, 17, 313Taylorreihe, 20–22, 30

der Fehlerfunktion, 105der Potenzfunktion, 40der Umkehrfunktion, 37des Arcustangens, 40des Integralsinus, 106des Logarithmus, 29–30des Tangens, 43einer Hintereinanderausfuhrung, 32von 1/z, 31von Quotienten, 35–36

totale Ableitung, 282der Determinante, 286

tr(A), 169

Uberdeckungslemma, 67, 139Umgebung, 157Umkehrfunktion, 37, 39, 75, 292Umkehrregel, 292Umskalieren, 79–80U(n), 244Unbestimmtes Integral, 73–74, 77UnC, 244Uneigentlich Rieman integrierbar, siehe in-

tegrierbar, uneigentlichUneigentliches Rieman Integral, siehe In-

tegral, uneigentlichunitare Matrix, 224, 225, 242–243∞-Norm, siehe SupremumsnormUnterintegral, 59Untersumme, 54Urbild, 156, 158

Verbindungsstrecke, 266Verfeinerung, 53Vertauschbarkeit partieller Ableitungen, 306,

308

Vertauschen von Grenzprozessen, 135–136,138–140, 144–145

Vielfachenregel, 287Vielfachheit, 89

algebraische, 171, 173, 176, 180, 185geometrische, 164, 173, 176, 180, 185

Weierstraß Kriterium, 146Weierstraßcher Approximationssatz, 131, 138,

154Wellengleichung, 18Winkel, 148, 242Wirkung, 151

Zerlegung, 53, 56, 57, 61aqudistant, 53

Zerteilung, 53, 57, 61zusammenhangend, 266–267, 269

327