Kapitel 8 Differentialrechnung - uni-hamburg.de...Kapitel 8 Differentialrechnung In diesem etwas...

78
Kapitel 8 Differentialrechnung In diesem etwas l¨ angerem Kapitel wollen wir zun¨ achst den Raum n metrisieren und normieren. Dies f¨ uhrt zum Begriff des Banachraumes. Wir wollen dann die Differentialrechnung in diesem allgemeinen Kontext einf¨ uhren, vgl. Walter[18] auch . Es zeigt sich, dass dies gerade die allgemeine Struktur ist, die erlaubt Beweise ohne Referenz auf Basen und Koordinatendarstellungen der zu untersuchenden Abbildungen durchzuf¨ uhren. Dieses Kapitel ist Grundlage der Theorie partieller Differentialgleichungen, genauso wie Grundlage der Differentialgeometrie und der komplexen Analysis. Insofern handelt es sich um ein zentrales Thema der Analysis. Viele unserer Betrachtungen ¨ ubertragen sich auf die Differentialrechnung im n und komplexe Banachr¨ aume, aus Zeitgr¨ unden wollen wir hier nur die R¨ aume n und reelle Banachr¨ aume betrachten. Inhaltsangabe 8.1 Der Raum n als Banachraum ............. 26 8.2 Kurven im Raum ..................... 34 8.2.1 Elementare Eigenschaften ................ 35 8.2.2 Transformationen ..................... 43 8.3 Ableitungen ......................... 44 8.4 Mittelwertsatz und Anwendungen ........... 59 8.5 ohere Ableitungen .................... 62 8.6 Taylorpolynome und Taylorreihen ........... 66 8.7 Differenzierbare Abbildungen .............. 73 8.8 Multilineare Abbildungen ................ 78 8.9 Der Fixpunktsatz von Banach .............. 80 8.10 Der Satz ¨ uber implizite Funktionen .......... 83 8.11 Extrema mit Nebenbedingungen ............ 92 25

Transcript of Kapitel 8 Differentialrechnung - uni-hamburg.de...Kapitel 8 Differentialrechnung In diesem etwas...

  • Kapitel 8

    Differentialrechnung

    In diesem etwas längerem Kapitel wollen wir zunächst den Raum Rnmetrisieren und normieren. Dies führt zum Begriff des Banachraumes. Wirwollen dann die Differentialrechnung in diesem allgemeinen Kontext einführen,vgl. Walter[18] auch . Es zeigt sich, dass dies gerade die allgemeine Strukturist, die erlaubt Beweise ohne Referenz auf Basen und Koordinatendarstellungender zu untersuchenden Abbildungen durchzuführen. Dieses Kapitel istGrundlage der Theorie partieller Differentialgleichungen, genauso wieGrundlage der Differentialgeometrie und der komplexen Analysis. Insofernhandelt es sich um ein zentrales Thema der Analysis. Viele unsererBetrachtungen übertragen sich auf die Differentialrechnung im Cn undkomplexe Banachräume, aus Zeitgründen wollen wir hier nur die Räume Rnund reelle Banachräume betrachten.

    Inhaltsangabe8.1 Der Raum Rn als Banachraum . . . . . . . . . . . . . 268.2 Kurven im Raum . . . . . . . . . . . . . . . . . . . . . 34

    8.2.1 Elementare Eigenschaften . . . . . . . . . . . . . . . . 35

    8.2.2 Transformationen . . . . . . . . . . . . . . . . . . . . . 43

    8.3 Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . 44

    8.4 Mittelwertsatz und Anwendungen . . . . . . . . . . . 59

    8.5 Höhere Ableitungen . . . . . . . . . . . . . . . . . . . . 62

    8.6 Taylorpolynome und Taylorreihen . . . . . . . . . . . 66

    8.7 Differenzierbare Abbildungen . . . . . . . . . . . . . . 73

    8.8 Multilineare Abbildungen . . . . . . . . . . . . . . . . 78

    8.9 Der Fixpunktsatz von Banach . . . . . . . . . . . . . . 80

    8.10 Der Satz über implizite Funktionen . . . . . . . . . . 83

    8.11 Extrema mit Nebenbedingungen . . . . . . . . . . . . 92

    25

  • 26 KAPITEL 8. DIFFERENTIALRECHNUNG

    8.12 Parameterabhängige Integrale . . . . . . . . . . . . . . 96

    8.1 Der Raum Rn als BanachraumDefinition 8.1.1 (Rn)Die Menge aller geordneten n-Tupel reeller Zahlen

    x1x2...xn

    ∣∣∣ xj ∈ R

    wird als Rn bezeichnet.Die Räume Rn sind Ihnen aus der Linearen Algebra vertraut. Es sind dies endlichdimensionale Vektorräume. Als solche besitzen sie eine Basis, die Standardein-heitsvektoren wollen wir mit e1, . . . , en bezeichnen. Der Vektor x entspricht dannder Summe

    x =

    n∑

    i=1

    xiei.

    Wir werden später oft eine Schreibweise benötigen, die wir schon heute festlegenwollen: ist x ∈ Rn, so steht x̂i für den Vektor

    x̂i ∈ Rn−1 : x̂i =

    x1...

    xi−1xi+1

    ...xn

    .

    Die Abbildung x 7→ x̂i ist eine lineare Abbildung, sogar ein Projektor auf denUnterraum, der von den Basisvektoren e1, . . . , ei−1, ei+1, . . .en aufgespannt wird.Aus der Sicht der Analysis ist neben der Struktur des linearen Raumes einemetrische Struktur von Bedeutung.

    Auf den Räumen Rn kann man auf verschiedene Weise jeweils eine Metrikdefinieren, einige Möglichkeiten dafür zeigt die folgende Definition.

  • 8.1. DER RAUM RN ALS BANACHRAUM 27Definition 8.1.2 (Metrik in Rn)Sind x,y ∈ Rn, so setzen wir für p ∈ [1,∞)

    dp(x,y) =p

    √√√√

    n∑

    i=1

    |xi − yi|p

    undd∞(x,y) = max

    {

    |xi − yi|∣∣∣ i = 1, . . . , n

    }

    .

    Lemma 8.1.3 (Metriken in Rn)Für p ∈ [1,∞] ist dp : Rn ×Rn → R+ eine Metrik.Beweis. Wir beweisen dies nur für die beiden wichtigsten Fälle p = 2, p = ∞vollständig. Für die anderen Fälle verweisen wir auf die Literatur, z.B. Alt [1].Wir müssen die Eigenschaften einer Metrik (M1), (M2) und (M3) nachweisen.Wir beginnen mit (M1). Offenkundig ist dp(x,y) ≥ 0 für alle p ∈ [0,∞] unddp(x,x) = 0 ist ebenso offensichtlich. Falls dp(x,y) = 0, so ist für alle i = 1, . . . , nauch |xi − yi| = 0 und deshalb x = y.Um (M2) zu zeigen beachten wir, dass alle Terme symmetrisch in x,y sind unddaher gilt dp(x,y) = dp(y,x).

    Schließlich müssen wir noch die Dreiecksungleichung beweisen. Für p = ∞ istdies einfach

    d∞(x, z) = max{

    |xi − zi|∣∣∣ i = 1, . . . , n

    }

    ≤ max{

    |xi − yi| + |yi − zi|∣∣∣ i = 1 . . . , n

    }

    ≤ max{

    |xi − yi|∣∣∣ i = 1 . . . , n

    }

    + max{

    |yi − zi|∣∣∣ i = 1 . . . , n

    }

    = d∞(x,y) + d∞(y, z)

    Den Fall p = 2 wollen wir nach den folgenden Überlegungen noch ausführen.

    In R oder C wird die Metrik durch den Betrag induziert. Hier, im höherdimen-sionalen Raum, gibt es eine verwandte Struktur.

  • 28 KAPITEL 8. DIFFERENTIALRECHNUNG

    Definition 8.1.4 (Norm)Sei V ein linearer Raum über R. Eine Abbildung von V nach R+ heißt Norm,wenn sie folgende Eigenschaften besitzt:

    (N1) ‖x‖ = 0 ⇐⇒ x = 0;

    (N2) ‖λx‖ = |λ| ‖x‖ für λ ∈ R, x ∈ Rn;(N3) ‖x + y‖ ≤ ‖x‖ + ‖y‖ für alle x,y ∈ Rn.

    Auch dieser Begriff ist Ihnen aus der Vorlesung Lineare Algebra bekannt, derZusammenhang mit einem inneren Produkt wird dort für gewisse Normen herge-stellt.

    Definition 8.1.5 (Skalarprodukt)Auf einem linearen Raum V über R nennen wir eine Abbildung

    V × V → R : (x,y) 7→ 〈x,y〉Vmit den Eigenschaften

    (SP1) 〈x,x〉V ≥ 0 und 〈x,x〉V = 0 genau dann, wenn x = 0.

    (SP2) 〈x + y, z〉V = 〈x, z〉V + 〈y, z〉V ;

    (SP3) 〈x,y〉V = 〈y,x〉V ;

    (SP4) 〈λx,y〉V = λ〈x,y〉Vein Skalarprodukt oder auch ein inneres Produkt auf V .

    Beispiel 8.1.6 (Normen und Skalarprodukte)1. Auf den Räumen Rn findet man die Abbildung

    (x,y) 7→ 〈x,y〉Rn = 〈 n∑i=1

    xiei,

    n∑

    i=1

    yiei

    〉Rn = n∑i=1 xiyi.Die Eigenschaften eines Skalarproduktes weist man leicht nach.

    2. Es sei [a, b] ⊂ R kompakt. Auf dem Raum C([a, b];R) findet man einSkalarprodukt durch

    (f, g) 7→b∫

    a

    f(x)g(x) dx.

  • 8.1. DER RAUM RN ALS BANACHRAUM 29Auf einem Raum mit Skalarprodukt erhält man auf einfache Weise eine Norm.

    Satz 8.1.7 (Skalarprodukt auf dem Rn)Ist 〈·, ·〉V ein Skalarprodukt auf einem linearen Raum V über R, so ist

    ‖x‖ =√

    〈x,x〉V

    eine Norm auf V und es gilt die Cauchy-Schwarzsche Ungleichung (CSU)

    |〈x,y〉V | ≤ ‖x‖‖y‖.

    Beweis. Wir müssen die Eigenschaften (N1-3) nachprüfen. (N1) folgt sofort aus(SP1). Für (N2) setzen wir

    ‖λx‖ =√

    〈λx, λx〉V =√

    λ2〈x,x〉V = |λ|‖x‖.Es bleibt die sogenannte Dreiecksungleichung (N3). Wir betrachten für λ ∈ R

    ‖x + λy‖2 = 〈x + λy,x + λy〉V = ‖x‖2 + 2λ‖x‖‖y‖ + λ2‖y‖2.Ist y 6= 0, so ist dies eine quadratische Funktion in λ mit positivem Koeffizientenbei λ2. Die Funktion besitzt ein eindeutiges Minimum bei

    λ = −〈x,y〉V‖y‖2 .

    Es gilt dann

    0 ≤∥∥∥∥x − 〈x,y〉V‖y‖2 y

    ∥∥∥∥

    2

    =

    x − 〈x,y〉V‖y‖2 y,x −〈x,y〉V‖y‖2 y

    V

    .

    Durch Auswerten dieses Ausdrucks ergibt sich

    0 ≤ ‖x‖2 − 2〈x,y〉2V

    ‖y‖2 +〈x,y〉2V‖y‖2 = ‖x‖

    2 − 〈x,y〉2V

    ‖y‖2 .

    Damit hat man〈x,y〉2V ≤ ‖x‖2‖y‖2

    oder durch Wurzelziehen|〈x,y〉V | ≤ ‖x‖‖y‖.

    Damit haben wir die Cauchy-Schwarzsche1 Ungleichung. Um (N3) zu beweisenbetrachten wir nun

    ‖x + y‖2 = 〈x + y,x + y〉V= ‖x‖2 + 2〈x,y〉V + ‖y‖2 ≤ ‖x‖2 + 2‖x‖‖y‖ + ‖y‖2 = (‖x‖ + ‖y‖)2.

    1Hermann Amandus Schwarz (25.1.1843-30.11.1921) studierte zunächst Chemie und wech-selte unter dem Einfluss von Karl Weierstraß zur Mathematik. Nach Promotion (1864), Habi-litation (1867) wurde er schließlich Professor für Mathematik an der ETH Zürich, schließlichwurde er 1892 Nachfolger von Weierstraß an der Berliner Universität. Seine Hauptarbeitsgebietewaren konforme Abbildungen, Minimalflächen und Arbeiten zur Potentialtheorie, Funktionen-theorie (Schwarz’sches Spiegelungsprinzip) und Variationsrechnung.

  • 30 KAPITEL 8. DIFFERENTIALRECHNUNG

    Damit ist (Wurzelziehen!)

    ‖x + y‖ ≤ ‖x‖ + ‖y‖.

    Also ist ‖ · ‖ eine Norm auf V .

    Weitere Beispiele für Normen finden sich leicht:

    Beispiel 8.1.8 (Normen)1. Auf Rn finden wir

    ‖x‖p = p√√√√

    n∑

    i=1

    |xi|p

    bzw.‖x‖∞ = max

    {

    |xi|∣∣∣ i = 1, . . . , n

    }

    .

    2. Auf dem Vektorraum C([a, b],R) definiert man eine Norm durch‖f‖ = max

    {

    |f(x)|∣∣∣ x ∈ [a, b]

    }

    .

    3. Auf R([a, b],R) aus Satz 7.2.20 finden wir mit‖[f ]‖ =

    b∫

    a

    [|f |](x)dx.

    eine Norm.Natürlich müssen wir in jedem Fall (N1-3) überprüfen. Wir machen dies in denÜbungen.

    Eine wichtige Abschätzung für die verschiedenen Normen auf dem Rn gibt unsdas folgende Lemma.

    Lemma 8.1.9 (Vergleich zweier Normen)Für x ∈ Rn gilt

    ‖x‖∞ ≤ ‖x‖2 ≤√n‖x‖∞.

  • 8.1. DER RAUM RN ALS BANACHRAUM 31Beweis.

    ‖x‖∞ = max{|xi| | i = 1, . . . , n}= max{

    |xi|2 | i = 1, . . . , n}

    √√√√

    n∑

    i=1

    |xi|2

    ≤√

    nmax{|xi|2 | i = 1, . . . , n}=

    √n‖x‖∞.

    Satz 8.1.10 (Metrik und Norm)Ist V ein linearer Raum, ‖ · ‖ eine Norm auf V , so wird durch

    d(x,y) = ‖x − y‖

    eine Metrik auf V × V definiert.

    Beweis. Natürlich ist d ≥ 0 und d(x,y) = 0 genau dann, wenn x = y. Wegen(N2) ist ‖ − x‖ = ‖x‖ und damit d(x,y) = d(y,x). Die letzte Eigenschaft einerMetrik schließt man leicht mittels

    d(x, z) = ‖x − z‖ = ‖x − y + y − z‖ ≤ ‖x − y‖ + ‖y − z‖ = d(x,y) + d(y, z).

    Korollar 8.1.11 (2-Norm, Vollständigkeit)‖ · ‖2 ist eine Norm auf Rn und d2 eine Metrik auf Rn ×Rn. Mit dieser Metrikwird Rn zum vollständigen metrischen Raum.Beweis. Alle Eigenschaften bis auf die Vollständigkeit sind geklärt. Angenom-men {xm}m∈N ist eine Cauchy-Folge bezüglich d2, so bedeutet dies, dass zu jedemε > 0 ein N ∈ N existiert, so dass für j, k > N gilt

    ‖xj − xk‖2 ≤ ε.

    Dann gilt für jede Koordinate i = 1, . . . , n , dass die Folge {xi,m}m∈N eine Cauchy-Folge ist, denn für j, k > N gilt nach Lemma 8.1.9, dass

    |xi,j − xi,k| ≤ ε,

  • 32 KAPITEL 8. DIFFERENTIALRECHNUNG

    und damit konvergiert diese Folge gegen einen Wert xi,0. Damit konvergiert dieFolge xm gegen x0, also in Kurzform

    x0 =

    x1,0x2,0...

    xn.0

    =

    limm→∞ x1,mlimm→∞ x2,m

    ...limm→∞ xn,m

    .

    Es ist (mit Lemma 8.1.9) leicht nachzuprüfen, dass die Konvergenz im Sinne derMetrik d2 vorliegt.

    Wir wollen im folgenden den metrischen Raum (Rn, d2) betrachten, sollte eineandere Metrik gemeint sein, wollen wir das explizit angeben. Die folgenden Über-legungen zeigen, dass ein Wechsel der Norm im Regelfall keine Veränderung derBegriffe bringt, wir formulieren dies explizit für die Kompaktheit.

    Definition 8.1.12 (Äquivalenz von Normen)Zwei Normen ‖ · ‖a, ‖ · ‖b auf einem linearen Raum V heißen äquivalent, wennes Zahlen 0 < m < M gibt, so dass für alle x ∈ V gilt

    m‖x‖a ≤ ‖x‖b ≤M‖x‖a.

    Lemma 8.1.13 (Äquivalenz von Normen)1. Äquivalenz von Normen ist eine Äquivalenzrelation.

    2. Je zwei Normen auf dem Rn sind äquivalent.Beweis. Siehe Übungen.

    Definition 8.1.14 (Banachraum)1. Ist (V, ‖ · ‖V ) ein normierter linearer Raum, der bezüglich der Metrik

    dV (x, y) = ‖x− y‖V

    vollständig ist, so nennen wir (V, ‖ · ‖V ) einen Banachraum2.

    2. Ist (V, ‖ · ‖V ) ein Banachraum und gibt es ein Skalarprodukt 〈·, ·〉V auf Vmit

    ‖v‖2V = 〈v, v〉Vfür alle v ∈ V , so nennen wir den Raum (V, 〈·, ·〉V ) einen Hilbertraum3.

  • 8.1. DER RAUM RN ALS BANACHRAUM 33Wir haben in der Analysis I den Begriff der Kompaktheit in metrischen Räumen

    kennen gelernt und auch kompakte Mengen in R mit dem Satz 4.1.13 charakteri-siert, wobei im Beweis der Satz von Bolzano-Weierstraß (Satz 2.5.12) eine großeRolle spielte. Wir beweisen nun eine Version des Satzes von Bolzano-Weierstraßfür den Rn und auch eine entsprechende Charakterisierung kompakter Mengen.Definition 8.1.15 (Beschränktheit)(a) Eine Menge A in einem normierten linearen Raum (V, ‖·‖) heißt beschränkt,wenn es eine Konstante K > 0 gibt, so dass für alle a ∈ A gilt ‖a‖ ≤ K.(b) Eine Folge {xm}m∈N heißt beschränkt, wenn die zugrunde liegende Menge

    X ={

    xm

    ∣∣∣ m ∈ N}

    beschränkt ist.

    Bemerkung 8.1.16 (Beschränktheit im Rn)1. Eine Menge A ⊂ Rn ist genau dann beschränkt, wenn es eine Kugel BK(0)

    bezüglich der Metrik d2 gibt mit A ⊂ BK(0).

    2. Der Begriff der Beschränktheit im Rn hängt nicht von der Wahl der Normab.

    Bemerkung 8.1.17 (Kompaktheit und Einheitskugel)Die abgeschlossene Einheitskugel in nicht-endlich dimensionalen Banachräumenist beschränkt, aber nicht kompakt. Insofern gilt die nachfolgende Aussage nurin endlich dimensionalen Räumen.

    Satz 8.1.18 (Bolzano-Weierstraß)Eine beschränkte Folge in Rn hat eine konvergente Teilfolge.Beweis. Diesen Beweis erhält man direkt aus dem Beweis von Satz 2.5.12

    3Stefan Banach (30.3.1892-31.8.1945), polnischer Mathematiker. Er war der Begründer derTheorie linearer, normierter Räume und ihren linearen Abbildungen. Seine Arbeiten sind dieGrundlage der modernen Funktionalanalysis. Er und seine Schüler zeigten viele Anwendungender Funktionalanalysis auf.

    3David Hilbert (23.1.1862-14.2.1943) war einer der bedeutendsten deutschen Mathematikerund einer der bedeutendsten Mathematiker seiner Zeit. Er befasste sich mit vielen Aspektender Mathematik und stellte diese auf neue Grundlagen. Er hat auch über seine Schüler großenEinfluss auf die Entwicklung der Mathematik ausgeübt.

  • 34 KAPITEL 8. DIFFERENTIALRECHNUNG

    Satz 8.1.19 (Heine-Borel)Eine Menge in Rn ist genau dann kompakt, wenn sie beschränkt und abge-schlossen ist.

    Beweis. Der Beweis von Satz 4.1.13 kann wörtlich übertragen werden.

    Bemerkung 8.1.20 (Kompaktheit, Beschränktheit, Norm)Der Begriff der Kompaktheit im Rn hängt nicht von der Norm ab, denn

    1. die offenen Mengen bezüglich verschiedener Normen sind die gleichen.

    2. wie bereits bemerkt hängt der Begriff der Beschränktheit nicht von derWahl der Norm ab.

    Ein weiterer wichtiger Begriff ist der Begriff des Zusammenhangs. Wir wollen die-sen nun definieren und dann ein paar einfache Konsequenzen herleiten.

    Definition 8.1.21 (Zusammenhang)Es sei (X, dX) ein metrischer Raum. Eine Menge U ⊂ X heißt zusam-menhängend, wenn es keine nichtleeren und offenen Mengen V,W ⊂ X gibt, sodass V ∩U 6= ∅ 6= W ∩U , (V ∩U) ∩ (W ∩U) = ∅ und (U ∩ V )∪ (U ∩W ) = Uist.

    Satz 8.1.22 (Zwischenwertsatz)Ist (X, dX) ein metrischer Raum und U ⊂ X zusammenhängend, f : U → Rstetig, x,y ∈ U . Dann gibt es zu jedem w ∈ [f(x), f(y)] bzw. w ∈ [f(y), f(x)]ein u ∈ U mit f(u) = w.

    Beweis. Sei w wie angegeben, setze

    V ={

    z ∈ U∣∣∣ f(z) > w

    }

    undW =

    {

    z ∈ U∣∣∣ f(z) < w

    }

    .

    V,W sind beide offen (Satz 4.2.6) im metrischen Raum (U, d2), disjunkt undnichtleer (x ∈ V und y ∈ W oder umgekehrt). Gibt es kein u mit f(u) = w, soist

    U = (U ∩ V ) ∪ (U ∩W )im Widerspruch zur Voraussetzung, dass U zusammenhängend ist.

    8.2 Kurven im Raum

    In diesem Abschnitt interessieren wir uns für Abbildungen R→ Rn.

  • 8.2. KURVEN IM RAUM 35

    8.2.1 Elementare Eigenschaften

    Definition 8.2.1 (Kurve)Es sei I ⊂ R ein Intervall, (V, ‖ ·‖V ) ein normierter linearer Raum über R. Einestetige Abbildung γ : I → V heißt Kurve in V .

    Ist V endlich dimensional, so kann man eine Kurve als Vektor von Funktionen

    γ(x) =

    γ1(x)...

    γn(x)

    auffassen. In diesem Fall ist die Definition der Differenzierbarkeit besonders ein-fach.

    Definition 8.2.2 (Kurve, differenzierbar)1. Eine Kurve γ : [0, 1] → Rn heißt differenzierbar, wenn alle Funktionenγ1, . . . , γn differenzierbar sind.

    2. Die Kurve heißt stetig differenzierbar, wenn alle Funktionen γ1, . . . , γnstetig differenzierbar sind.

    Beispiel 8.2.3 (Geraden und andere Kurven)1. Das einfachste Beispiel ist das einer Geraden in Rn. Dazu sei ein Punkt

    a ∈ Rn gegeben und ein Vektor v ∈ Rn. Dann istg(t) = a + t · v : R→ Rn

    eine stetig differenzierbare Kurve, die geometrisch eine Gerade darstellt.

    2. Sei r > 0 und

    k(t) =

    (r cos(t)r sin(t)

    )

    eine stetig differenzierbare Kurve. Sie hat folgende Eigenschaften: k(2π) =k(0) und ‖k(t)‖ = r für alle r ∈ R+. Damit definiert diese Kurve eineKreislinie im R2 mit Radius r.

  • 36 KAPITEL 8. DIFFERENTIALRECHNUNG

    Beispiel 8.2.4 (Geraden und andere Kurven)3. Nun definieren wir eine Schraubenlinie im R3 durch

    s : R→ R3 : t 7→ r cos(t)r sin(t)rt

    .

    Die Projektion auf die ersten beiden Komponenten

    p : R3 → R2 : x 7→ ( x1x2

    )

    bildet die Linie auf einen Kreis mit Radius r ab, die Abbildung s ist jedochinjektiv.

    4. Es sei V = C([a, b];R) und (V, ‖ · ‖∞) der Banachraum der stetigen Funk-tionen auf [a, b]. Wir betrachten die Kurve

    γ : [a, b] → V : t 7→ γ(t) ∈ C([a, b];R),wobei wir setzen

    γ(t)(x) = etx.

    Man überzeuge sich, dass die Abbildung t→ γ(t) stetig ist.

    Definition 8.2.5 (Kurve, stetig differenzierbar)Es sei γ : I → Rn eine stetig differenzierbare Kurve. Dann heißt der Vektor

    v(t) =

    γ′1(t)...

    γ′n(t)

    der Tangentialvektor an γ im Punkt γ(t).

    Bemerkung 8.2.6 (Tangentialvektor und Differenzenquotient)Wie in der Differentialrechnung auf R kann man den Tangentialvektor alsGrenzwert eines Differenzenquotienten auffassen. Formal sieht er genauso auswie in der Analysis I für Funktionen R→ R:

    v(t) =1

    h(f(t+ h) − f(t)) .

    Wir sehen an dieser Betrachtung, dass diese Definition auch in allgemeinerenSituationen verwendet werden kann.

  • 8.2. KURVEN IM RAUM 37

    Definition 8.2.7 (Differenzierbare Kurve im Banachraum)Es sei (V, ‖ · ‖V ) ein Banachraum, I ⊂ R ein offenes Intervall und γ : I → Veine Kurve, t0 ∈ I. Gibt es eine lineare Abbildung v : R→ V mit

    limh→0

    1

    h‖γ(t0 + h) − γ(t0) − v(h)‖V = 0,

    so nennen wir die Kurve im Punkt t0 differenzierbar.

    Bemerkung 8.2.8 (Lineare Abbildungen)Der Raum der linearen Abbildungen

    L(R;V ) = {v : R→ V ∣∣∣ v ist linear}ist als linearer Raum isomorph zu V . Damit wird L(R;V ) in natürlicher Weisezum Banachraum.

    Definition 8.2.9 (Stetig differenzierbare Kurve im Banachraum)Es sei γ : I → V eine Kurve, wobei I ⊂ R ein offenes Intervall ist und (V, ‖ ·‖V )ein Banachraum. γ heißt stetig differenzierbar, wenn γ in jedem Punkt t ∈ Idifferenzierbar ist und die Abbildung

    I → L(R;V ) : t 7→ γ′(t)stetig ist.

    Lemma 8.2.10 (Eindeutigkeit der Ableitung)Ist γ im Punkt t0 differenzierbar, so ist die Ableitung eindeutig bestimmt.

    Beweis. Angenommen v1, v2 seien zwei Ableitungen, so gilt

    limh→0

    1

    h‖γ(t0 + h) − γ(t0) − hvi‖V = 0.

    Dann ist

    limh→0

    1

    h‖γ(t0 + h) − γ(t0) − hv1 − γ(t0 + h) + γ(t0) + hv2‖V = 0.

    Also ist

    limh→0

    1

    h‖hv1 − hv2‖V = lim

    h→0‖v1 − v2‖V = ‖v1 − v2‖V = 0.

    Es sei [a, b] ein Intervall in R und Z eine Zerlegung des Intervalls. Wir wollen dies

  • 38 KAPITEL 8. DIFFERENTIALRECHNUNG

    Abbildung 8.1: Approximation des Tangentialvektors durch Differentialquotien-ten

    nutzen um eine Approximation der Kurve zu definieren.

    Definition 8.2.11 (Polygonzug)Es sei (V, ‖ · ‖V ) ein Banachraum und γ : [a, b] → V eine Kurve und Z = {ζ0 <· · · < ζm} eine Zerlegung des Intervalls. Wir definieren

    pZ(x) =

    γ(ζi) +x− ζiζi+1 − ζi

    (γ(ζi+1) − γ(ζi)), für x ∈ (ζi, ζi+1)γ(x), für x ∈ Z.

    pZ heißt der Polygonzug zur Zerlegung Z.

    Die Länge eines Polygonzuges ist einfach die addierte Länge der einzelnen Gera-denstücke.

    Definition 8.2.12 (Länge)Die Länge des Polygonzuges p ist gegeben durch

    L(pZ) =

    m−1∑

    j=0

    ‖γ(ζj+1) − γ(ζj)‖V .

  • 8.2. KURVEN IM RAUM 39

    Abbildung 8.2: Approximation einer Kurve durch einen Polygonzug

    Definition 8.2.13 (rektifizierbar)Gegeben sei eine Kurve γ : [a, b] → V , wobei (V, ‖ · ‖V ) ein Banachraum sei. Ist

    L(γ) = sup{

    L(pZ)∣∣∣ Z ist Zerlegung von [a, b]

    }

    0 gibt, so dass für alle t1, t2 ∈ I gilt

    ‖γ(t2) − γ(t1)‖V ≤M |t1 − t2|.

  • 40 KAPITEL 8. DIFFERENTIALRECHNUNG

    Satz 8.2.15 (Kriterium für Rektifizierbarkeit)Sei (V, 〈·, ·〉V ) ein Banachraum.

    1. Ist γ : I → V Lipschitz stetig, so ist die Kurve rektifizierbar.

    2. Ist γ : [a, b] → V stetig differenzierbar, so ist die Kurve γ rektifizierbarund

    L(γ) =

    b∫

    a

    ‖γ′(x)‖V dx.

    Beweis. Im ersten Fall sei Z eine beliebige Zerlegung von [a, b], dann ist

    L(pZ) =

    m−1∑

    j=0

    ‖γ(ζj+1) − γ(ζj)‖V ≤m−1∑

    j=0

    M |ζj+1 − ζj| = M(b− a).

    Also ist das Supremum über alle Zerlegungen höchstens M(b − a). Die zweiteAussage beweisen wir wie folgt. Da γ stetig differenzierbar ist, ist die Abbildung[a, b] → V : t 7→ γ′(t) stetig, das Bild γ′([a, b]) ist kompakt, daher beschränkt,und es existiert eine Zahl M > 0 mit

    |γ′(t)| < M, t ∈ [a, b].

    Dann ist γ Lipschitz stetig mit Konstante M und damit rektifizierbar.

    Es bleibt noch zu zeigen, dass die Länge der Kurve durch das angegebene Integralgegeben ist.

    Wir beweisen zunächst eine wichtige Aussage:

    ∀ε>0

    ∃δ>0 : |x− x′| < δ,x′′ ∈ (x, x′)(oder x′′ ∈ (x′, x))

    ⇒ ‖ 1x− x′ (γ(x)−γ(x

    ′))−γ′(x′′)‖V < ε.

    (8.1)

    γ′ ist stetig auf (a, b) und stetig fortsetzbar auf [a, b] und damit gleichmäßig stetigauf [a, b]. Daher gibt es zu jedem ε > 0 ein δ > 0, so dass |x− x′| < δ impliziert‖γ′(x) − γ′(x′)‖V < ε2 .Nach Definition der Ableitung v = γ′(t) gilt

    limh→0

    ‖γ(t+ h) − γ(t) − hv‖ = 0.

    Insbesondere gibt es zu ε > 0 ein H > 0, so dass −Ht < h < Ht, h 6= 0 impliziert∥∥∥∥

    γ(t+ h) − γ(t)h

    − v∥∥∥∥<ε

    2.

  • 8.2. KURVEN IM RAUM 41

    Insbesondere ergibt sich für v′ = γ′(t+ h′) mit h′ ∈ (0, h)∥∥∥∥

    γ(t+ h) − γ(t)h

    − v′ + v′ − v∥∥∥∥≤ ε

    2+ε

    2= ε.

    Die Mengen der Form (t−Ht, t+Ht) überdecken [a, b] und daher gibt es ti, Hi,i = 1, . . . , K mit (ti − Hi, ti + Hi) überdecken [a, b]. Sei δ die Lebesgue-Zahlzu dieser Überdeckung. Die Funktion ‖γ′‖V : [a, b] → R ist stetig und damitRiemann integrierbar. Daher gibt es zu gegebenem ε > 0 ein δ1 > 0, so dass fürjede Zerlegung Z = {ζ0 < ζ1 < · · · < ζm} mit Feinheit ∆(Z) < δ1 gilt

    ∣∣∣∣∣∣

    R(‖γ′‖V ,Z) −b∫

    a

    ‖γ′(x)‖V dx

    ∣∣∣∣∣∣

    2.

    Ferner gibt es nach Gleichung (8.1) ein δ2 > 0, so dass für jede Zerlegung Z mitFeinheit ∆(Z) < δ2 und x ∈ (ζj, ζj+1) folgt

    ‖γ′(x) − 1ζj+1 − ζj

    (γ(ζj+1) − γ(ζj))‖V <ε

    2(b− a) .

    Es gilt dann

    ‖γ′(x)‖V (ζj+1 − ζj) − ‖γ(ζi+1) − γ(ζi)‖V ≤ε

    2(b− a)(ζj+1 − ζj).

    Sei δ = min{δ1, δ2} und Z = {ζ0 < · · · < ζm} eine Zerlegung mit Feinheit∆(Z) < δ und zugehörigem Polygonzug pZ. Dann ist

    ∣∣∣∣∣∣

    b∫

    a

    ‖γ′(x)‖V dx− L(p)

    ∣∣∣∣∣∣

    ∣∣∣∣∣∣

    b∫

    a

    ‖γ′(x)‖V dx− R(‖γ′‖,Z)

    ∣∣∣∣∣∣

    + |R(‖γ′‖,Z) − L(p)|

    2+

    ∣∣∣∣∣

    m−1∑

    j=0

    (‖γ′(ξj)‖V (ζj+1 − ζj) − ‖γ′(ζi+1) − γ′(ζi)‖V )∣∣∣∣∣

    ≤ ε2

    +

    m−1∑

    j=0

    ε

    2(b− a)(ζj+1 − ζj)

    2+

    ε

    2(b− a)

    m−1∑

    j=0

    (ζj+1 − ζj)

    = ε.

    Damit ist der Beweis erbracht.

  • 42 KAPITEL 8. DIFFERENTIALRECHNUNG

    Bemerkung 8.2.16 (Kurvenlänge und Norm)Die Länge einer Kurve hängt von der Wahl der Norm ab, die Rektifizierbarkeitnicht, in dem Sinne, dass für zwei äquivalente Normen ‖ · ‖1, ‖ · ‖2 eine Kurveγ genau dann bzgl. ‖ · ‖1 rektifizierbar ist, wenn sie bzgl. ‖ · ‖2 rektifizierbar ist.

    Als Anwendung betrachten wir die Länge des Kreisbogens.

    Satz 8.2.17 (Kreisbogen)Es sei r > 0

    γ : [0, 2π] → R2 : t 7→ ( r cos(t)r sin(t)

    )

    der Kreisbogen mit Radius r im (R2, ‖ · ‖2). Dann ist L(γ) = 2πr.Beweis. Es ist γ stetig differenzierbar, also ist γ rektifizierbar und es gilt

    L(γ) =

    2π∫

    0

    ‖γ′(s)‖2 ds =2π∫

    0

    r√

    (cos2(t) + sin2(t)) dt = 2πr.

    Es stellt sich die Frage, ob diese Länge ein Charakteristikum der Punktmengeim Raum V ist oder von der gewählten Kurve abhängt. Dieser Frage gehen wirim nächsten Abschnitt nach. Davor noch zwei Begriffe.

    Definition 8.2.18 (Spur)Wir unterscheiden die Kurve γ und ihr Bild, d.h. die Punktmenge

    {

    γ(t)∣∣∣ t ∈ [a, b]

    }

    in V , letzteres bezeichnen wir als die Spur der Kurve.

    Definition 8.2.19 (Wegelängenfunktion)Zu einer rektifizierbaren Kurve und zu t ∈ [a, b] schreiben wir

    Lt(γ) = L(γ|[a,t])

    für die Länge der Kurve γ eingeschränkt auf das Teilintervall [0, t]. Wir bezei-chen Lt(γ) als die Wegelängenfunktion.

    Wir beachten die einfache Bemerkung, dass die Rektifizierbarkeit von γ die vonγ|[a,t] impliziert.

    Aufgabe 8.2.20 (Stetigkeit der Wegelängenfunktion)Zeigen Sie, dass die Wegelängenfunktion einer rektifizierbaren Kurve stetig ist.

  • 8.2. KURVEN IM RAUM 43

    8.2.2 Transformationen

    Wir wollen das Verhalten einer Kurve bzw. des Tangentialvektors unter soge-nannten Parametertransformationen untersuchen. Wir betrachten dabei folgendegrundlegende Situation:

    Es sei γ : [a, b] → V eine Kurve, ϕ : [c, d] → [a, b] eine stetige, bijektive Abbil-dung. Dann ist natürlich

    γ ◦ ϕ : [c, d] → Rneine Kurve.

    Definition 8.2.21 (Parametertransformation)Wir sagen die Kurve γ ◦ ϕ geht durch die Parametertransformation ϕ aus derKurve γ hervor. Sind die Abbildungen ϕ und ϕ−1 beide stetig differenzierbar,so sprechen wir von einer C1-Parametertransformation.

    Lemma 8.2.22 (Parametertransformation)Ist ϕ eine C1-Parametertransformation, so ist ϕ′(t) 6= 0 für alle t ∈ [c, d].

    Beweis. Es gilt ϕ ◦ϕ−1 = 1l auf [a, b], wobei 1l für die Abbildung 1l(x) = x steht.Dann ist nach der Kettenregel

    1 = (ϕ ◦ ϕ−1)′(t) = ϕ′(ϕ−1(t))(ϕ−1)′(t).

    Also ist sowohl ϕ′ wie auch (ϕ−1)′ nirgends Null.

    Daher hat ϕ′ ein konstantes Vorzeichen auf [c, d].

    Definition 8.2.23 (Parametertransformation und Orientierung)Die C1-Parametertransformation heißt orientierungserhaltend, wenn ϕ′ > 0 ist,im anderen Fall nennt man sie orientierungsumkehrend.

    Wir betrachten zunächst das Verhalten der Tangentialvektoren unter Parameter-transformationen. Ist γ : [a, b] → V eine Kurve, ϕ eine C1-Parametertransfor-mation, ϕ : [c, d] → [a, b] bijektiv, so ist

    (γ ◦ ϕ)′(t) = γ′(ϕ)ϕ′(t).

    Daran sieht man, dass die Richtung der Tangentialvektoren unter C1-Parameter-transformationen erhalten bleibt.

    Satz 8.2.24 (Invarianz der Länge)Ist γ eine stetig differenzierbare Kurve, ϕ eine C1-Parametertransformation, soist L(γ) = L(γ ◦ ϕ).

  • 44 KAPITEL 8. DIFFERENTIALRECHNUNG

    Beweis. Dies folgt sofort aus der Substitutionsregel:

    L(γ ◦ ϕ) =d∫

    c

    ‖(γ ◦ ϕ)′(s)‖V ds

    =

    d∫

    c

    ‖γ′(ϕ(s))ϕ′(s)‖V ds

    =

    d∫

    c

    ‖γ′(ϕ(s))‖V |ϕ′(s)| ds

    = ±d∫

    c

    ‖γ′(ϕ(s))‖Vϕ′(s) ds

    = ±ϕ(d)∫

    ϕ(c)

    ‖γ′(t)‖V dt

    =

    b∫

    a

    ‖γ′(t)‖V dt

    8.3 Ableitungen

    Wir wollen in diesem Abschnitt den Begriff der Ableitung einer auf einer offe-nen Teilmenge eines Banachraumes definierten, reellwertigen Funktion einführenund gleichzeitig den Begriff der partiellen Ableitung für Funktionen, die auf Teil-mengen eines Banachraumes V definiert sind. Dies ist etwas komplizierter als derBegriff der Ableitung für Funktionen einer einzigen reellen Variablen. Funktionenf : V → R treten bei der Beschreibung von Vorgängen in der Natur, Technikund Wissenschaft in mannigfacher Weise auf. Daher ist der nun zu definieren-de Begriff zentral für die Anwendungen der Mathematik in anderen Fächern. Ichmöchte wegen dieser Wichtigkeit einige Beispiele von solchen Funktionen aus ver-schiedenen Bereichen angeben.

  • 8.3. ABLEITUNGEN 45

    Beispiel 8.3.1 (Extremalprobleme in mehreren Veränderlichen)1. (Metereologie) Eine Abbildung T : R3 → R, die jedem Punkt der Atmo-

    sphäre die Temperatur an diesem Punkt zuordnet. Gleiches gilt für Druckp, Luftfeuchtigkeit etc..

    2. (Geographie) Die Abbildung, die jedem Punkt auf der Landkarte (R2) dieHöhe über NN zuordnet.

    3. (Chemische Industrie) Die Abbildung T : R3 → R, die jedem Punkt ineinem mit einem reagierenden Gemisch gefüllten Tank die Temperaturzuordnet. Die Kenntnis dieser Funktion ist für die Sicherheit chemischerAnlagen von extrem hoher Wichtigkeit, obwohl man diese Funktion imRegelfall nicht messen kann. Typischerweise misst man Temperaturen nuram Rand des Tanks oder an wenigen ausgewählten Punkten.

    4. (Physik) Die Dichte eines Stoffes als Funktion vom Ort, ist z.B. für dasTrägheitsmoment wichtig.

    5. (Biologie) Permeabilität einer Grenzschicht in Abhängigkeit vom Ort aufder Grenzschicht.

    6. (Medizin) Gewebedichte in Abhängigkeit vom Ort im menschlichenKörper. Z.B. spielt dies bei der Bekämpfung von Tumoren mit Hyper-thermie eine große Rolle.

    7. (Wirtschaft) Inflationsrate als Funktion von Leitzinsen, Exporten, Im-portpreisen, Geldmenge.

    8. (Flugzeugbau) Auftrieb in Abhängigkeit von Fluggeschwindigkeit, Luft-druck und Lufttemperatur (die ihrerseits von Ort und Zeit abhängig ist).

    9. (Fahrzeugentwicklung) Luftwiderstand eines Fahrzeugs als Funktion derFahrzeugform, in diesem Fall ist die Funktion in natürlicher Weise aufeinem nicht endlich dimensionalen Banachraum, dem Raum der Formen,definiert.

    Der Begriff der Stetigkeit für solche Funktionen ist uns bekannt, da wir ja diesenBegriff im Kontext metrischer Räume kennengelernt haben und wie oben darge-stellt der Banachraum V auch ein metrischer Raum ist.

  • 46 KAPITEL 8. DIFFERENTIALRECHNUNG

    Definition 8.3.2 (Differenzierbarkeit)Es sei (V, ‖ · ‖V ) ein Banachraum U ⊂ V eine offene Menge, f : U → R sei eineAbbildung, x0 ∈ U . f heißt differenzierbar im Punkt x0, wenn es eine stetige,lineare Abbildung ℓ : V → R gibt, so dass

    lim‖h‖→0

    1

    ‖h‖V(f(x0 + h) − f(x0) − ℓ(h)) = 0

    ist.

    Die Bedingung besagt, dass für eine beliebige Folge von Vektoren {hm}m∈N mithm ∈ V mit limm→∞ hm = 0 gilt

    limm→∞

    1

    ‖hm‖V(f(x0 + hm) − f(x0) − ℓ(hm)) = 0. (8.2)

    Folgen und deren Grenzwerte sind uns in beliebigen metrischen Räumen bekannt,damit auch der Limes h → 0, der, wie gerade erläutert, über solche Folgen de-finiert wird. Man beachte dabei natürlich, dass es (wegen der Offenheit von U)für x0 ∈ U und limm→∞ hm = 0 ein N ∈ N gibt, so dass für k > N der Vektorx0 + hk ∈ U ist.

    Bemerkung 8.3.3 (Approximation durch lineare Abbildungen)Oft wird die Bedingung auch so formuliert, vgl. Satz 5.1.9: f ist im Punkt x0differenzierbar, wenn es eine stetige lineare Abbildung ℓ : V → R gibt, so dassfür die Funktion

    R(h) = f(x0 + h) − f(x0) − ℓ(h)gilt

    limh→0

    1

    ‖h‖VR(h) = 0.

    Diese Bedingung ist offensichtlich äquivalent zu der in der in der Definitionangegebenen Bedingung.

    Satz 8.3.4 (Eindeutigkeit der Ableitung)Gibt es eine lineare Abbildung ℓ, die der Bedingung (8.2) genügt, so ist sieeindeutig.

    Beweis. Angenommen wir hätten zwei solche Abbildungen ℓ1, ℓ2. Dann ist

    0 = limm→∞

    1

    ‖hm‖2(f(x0 + hm) − f(x0) − ℓ2(hm))

    − limm→∞

    1

    ‖hm‖V(f(x0 + hm) − f(x0) − ℓ1(hm))

    = limm→∞

    1

    ‖hm‖V(ℓ1(hm) − ℓ2(hm)).

  • 8.3. ABLEITUNGEN 47

    Angenommen ℓ1 6= ℓ2. Dann gibt es ein h ∈ V , ‖h‖V = 1 mit ℓ1(h) 6= ℓ2(h).Dann ist aber für t > 0, t ∈ R

    0 = limt→0

    1

    t(ℓ1(th) − ℓ2(th)) = lim

    t→0

    1

    t(t(ℓ1(h) − ℓ2(h))) = ℓ1(h) − ℓ2(h) 6= 0.

    Dieser Widerspruch impliziert die Eindeutigkeit der linearen Abbildung.

    Definition 8.3.5 (Differential)Existiert eine lineare Abbildung, die der Bedingung (8.2) genügt, so heißt dieseAbbildung die Linearisierung oder auch das Differential von f an der Stelle x0.Wir schreiben dafür Df(x0) (oder auch df(x0)).

    Bemerkung 8.3.6 (Ableitung und Basiswechsel)1. Man beachte, dass Df(x0) eine lineare Abbildung ist, die Punkte x ∈ V

    auf Werte in R abbildet. Dafür schreiben wirDf(x0)(x) = w ∈ R.

    2. Die Linearisierung einer Abbildung an einer Stelle hängt nicht von derWahl der Basis in unserem Vektorraum ab. Allerdings hängt die Darstel-lung als Matrix bezüglich der Basis (für endlich dimensionales f) sehrwohl davon ab.

    Lemma 8.3.7Gegeben sei eine im Punkt x0 ∈ U , U ⊂ Rn offen, differenzierbare Funktion f ,B = {ei | i = 1, . . . , n} sei die übliche Basis. Die 1 × n-Matrix

    (Df(x0)(e1) Df(x0)(e

    2) . . . Df(x0)(en))

    stellt die Ableitung von f im Punkt x0 bezüglich B dar.

    Beweis. Es besteht der übliche Zusammenhang

    Df(x0)(x) = Df(x0)

    (n∑

    i=1

    xiei

    )

    =

    n∑

    i=1

    xiDf(x0)(ei)

    = (Df(x0)(e1) Df(x0)(e

    2) . . . Df(x0)(en))

    x1x2...xn

    .

  • 48 KAPITEL 8. DIFFERENTIALRECHNUNG

    Bemerkung 8.3.8Es ist naheliegend die affin lineare Abbildung

    A : x 7→ f(x0) +Df(x0)(x − x0)

    zu betrachten. Die Differenz R(x − x0) = Ax − f(x) verschwindet mit x → x0sogar noch nach Division durch ‖x − x0‖2, in diesem Sinne approximiert dieAbbildung A die Funktion f .

    Beispiel 8.3.91. Lineare Abbildungen f : Rn → R sind in jedem Punkt x0 ∈ Rn differen-

    zierbar, es gilt Df(x0) = f , denn

    f(x0 + h) − f(x0) − f(h) = 0.

    2. Ist (V, ‖ · ‖) ein Banachraum, so sind stetige lineare Abbildungen V → Vdifferenzierbar.

    3. Ist (V, 〈·, ·〉V ) ein Hilbertraum und A : V → V eine stetige lineare Abbil-dung, so ist

    f(x) = 〈x, Ax〉Vin jedem Punkt differenzierbar, die Linearisierung ist

    Df(x0)(h) = 〈h, Ax0〉V + 〈x0, Ah〉V .

    Zur Begründung betrachten wir

    〈x + h, A(x + h)〉V = 〈x, Ax〉V + 〈h, Ax〉V + 〈x, Ah〉V + 〈h, Ah〉V .

    In diesem Fall ist

    |R(h)| = |〈h, Ah〉V | ≤ ‖h‖V ‖Ah‖V

    und|R(h)|‖h‖V

    ≤ ‖Ah‖V → 0

    mit h → 0.Ist A zusätzlich symmetrisch, d.h. AT = A, so ist

    Df(x0)(h) = 2〈Ax0,h〉V .

  • 8.3. ABLEITUNGEN 49

    Eine wichtige Eigenschaft differenzierbarer Funktionen ist bereits aus der eindi-mensionalen Analysis bekannt. Wir beginnen mit einem Hilfssatz.

    Satz 8.3.10 (Stetigkeit differenzierbarer skalarer Abbildungen)Ist (V, ‖ · ‖V ) ein Banachraum und U ⊂ V offen, f : U → R eine im Punkt x0differenzierbare Funktion, so ist f im Punkt x0 stetig.

    Beweis. Sei ε > 0 gegeben. Für h ∈ V gilt

    f(x0 + h) + f(x0) = Df(x0)(h) + R(h).

    Wegen limh→0|R(h)|‖h‖V

    = 0 gibt es ein δ1 > 0, so dass ‖h‖V < δ1 impliziert

    |R(h)|‖h‖V

    2.

    Dann ist

    |R(h)| < ε2‖h‖V .

    Da Df(x) eine stetige lineare Abbildung ist, gibt es ein δ2 > 0, so dass

    ‖h‖V < δ2 impliziert |Df(x0)(h)| <ε

    2.

    Dann ist aber

    |f(x0 + h) − f(x0)| ≤ |Df(x0)(h)| + |R(h)| ≤ 2ε

    2= ε,

    solange nur ‖h‖V ≤ max{δ1, δ2, 1}.Wir stellen nun die Frage, wie man eine Funktion auf Differenzierbarkeit te-

    stet und wie man im Fall der Differenzierbarkeit die Linearisierung oder auch dieAbleitung berechnet.

  • 50 KAPITEL 8. DIFFERENTIALRECHNUNG

    Definition 8.3.11 (Richtungsableitung)Es (V, ‖ · ‖V ) ein Banachraum und U ⊂ V sei offen, f : U → R sei eineAbbildung. Es sei x0 ∈ U und a ∈ Rn. Wir betrachten die Abbildung

    fx0,a : R→ R : t 7→ f(x0 + ta).Ist diese Funktion im Punkt t = 0 differenzierbar, so sagen wir, dass die Rich-tungsableitung von f im Punkt x0 in Richtung a existiert und den Wert f

    ′x0,a

    (0)hat. Wir bezeichnen diese mit ∂af(x0).Ist V = Rn, so werden die Richtungsableitungen in Richtung der Vektoren derStandardbasis als partielle Ableitungen bezeichnet, als Symbol schreiben wir

    ∂xif(x0) = ∂eif(x0)

    dafür schreiben wir auch kurz ∂if(x0). Existieren die partiellen Ableitungen vonf , so sagen wir, f ist partiell differenzierbar.

    Sind alle partiellen Ableitungen stetig, so sprechen wir von einer stetig partielldifferenzierbaren Funktion.

    Aus unserer bisherigen Diskussion folgt der Satz:

    Satz 8.3.12 (Differenzierbarkeit und Darstellung der Ableitung)Ist U ⊂ Rn offen, f : U → Rn in x0 differenzierbar, so ist f im Punkt x0 partielldifferenzierbar und es existieren alle Richtungsableitungen und die Linearisie-rung von f hat die Darstellung

    Df(x0)(h) =

    n∑

    i=1

    ∂xif(x0)hi.

    Damit hat man eine Strategie die Ableitung einer Funktion f : Rn → R zu be-stimmen: man bestimme alle partiellen Ableitungen im Punkt x0 und verifizieredann, ob die durch die damit gebildete 1×n-Matrix definierte lineare Abbildungdie Bedingung an die Ableitung erfüllt.Zunächst jedoch ein Beispiel an dem man erkennt, dass diese Strategie nicht im-mer erfolgreich ist.

  • 8.3. ABLEITUNGEN 51

    Beispiel 8.3.13 (Partielle Differenzierbarkeit und Differenzierbarkeit)Es sei f : R2 → R definiert durch

    f(x1, x2) =

    0, falls

    (x1x2

    )

    =

    (00

    )

    x21x2x21 + x

    22

    , sonst.

    Ist 0 6= a =(a1a2

    )

    ∈ R2, so ist mit f0,a(t) = f(ta)f(ta) − f(0) = f(ta) = t a

    21a2

    a21 + a22

    = tf(a)

    und

    limt=0

    1

    t(f(ta) − f(0) − f(a)t) = 0.

    Also ist die Richtungsableitung in Richtung a durch f(a) gegeben. Da auf denKoordinatenachsen die Funktion verschwindet, sind die beiden partiellen Ab-leitungen 0. Als einzige lineare Abbildung kommt damit die Nullabbildung alsAbleitung in Frage. Damit ist, will man die Differenzierbarkeit von f in 0 nach-prüfen, zu untersuchen

    limx→0

    1

    ‖x‖x21x2‖x‖2 = limx→0

    x21x2‖x‖3 .

    Wählen wir nun eine Folge von Vektoren {xm}m∈N mit xm = ( xmxm ) für allem ∈ N und xm → 0 für m→ ∞. Dann ergibt sich

    1

    ‖xm‖(f(xm, xm) − f(0) − 0) = lim

    xm→0

    x3m2√

    2|xm|36= 0.

    Damit ist f nicht differenzierbar. Eine Veranschaulichung der Funktion f zeigtdie Abbildung 8.3.

    Einer der zentralen Sätze der Theorie besagt nun, dass im Fall stetig partiell dif-ferenzierbarer Funktionen die oben genannte Strategie erfolgreich ist.

    Satz 8.3.14 (Stetige Partielle Differenzierbarkeit und Differenzierbarkeit)Ist U ⊂ Rn offen und f : U → R im Punkt eine Abbildung, so dass auf einerUmgebung V von x0 alle partiellen Ableitungen von f existieren und f imPunkt x0 stetig partiell differenzierbar ist, so ist f im Punkt x0 differenzierbar.

    Beweis. Sei h ∈ Rn, so dass x0 +h ∈ V ist und γ(t) sei der Polygonzug, der aus

  • 52 KAPITEL 8. DIFFERENTIALRECHNUNG

    Abbildung 8.3: Eine partiell differenzierbare, nicht differenzierbare Funktion

    Parallelen zu den Koordinatenachsen aufgebaut ist, d.h.

    γ :

    [

    0,n∑

    i=1

    |hi|]

    → Rn : ( i−1∑j=1

    |hj|,i∑

    j=1

    |hj|) ∋ t 7→ x0+i−1∑

    j=1

    hjej+sgn(hi)(t−

    i−1∑

    j=1

    |hj|)ei.

    Setze für j ≥ 1 xi = xi−1+hiei. Dies sind genau die Eckpunkte des Polygonzuges.Das Prinzip der vorgestellten Konstruktion wird vielleicht aus der Abbildung 8.4deutlich. Dann ist

    f(x0 + h) − f(x0) =n∑

    j=1

    (f(xj) − f(xj−1)) .

    Längs des Geradenstücks zwischen je zwei solchen Punkten betrachten wir füri = 0, . . . , n− 1

    fxi,ei+1 : R→ R.Es gilt f(xi) = fxi,ei+1(0) und f(xi+1) = fxi,ei+1(hi+1). Dann ist (Mittelwertsatz)für i = 0, . . . , n− 1

    f(xi+1) − f(xi) = f ′xi,ei+1(ξi)hi+1= ∂ei+1f(xi + ξie

    i+1)hi.

    Nun schreiben wir

    f(x0 + h) − f(x0) =n−1∑

    j=0

    ∂ei+1f(xi + ξiei+1)hi+1.

  • 8.3. ABLEITUNGEN 53

    e

    e

    e

    x x

    x

    x = x +h

    1

    2

    3

    0 1

    2

    0

    h

    h e

    h e3

    1h e1

    2

    3

    2

    3

    Abbildung 8.4: Der verbindende Polygonzug und die wesentlichen Punkte.

    Dann ist

    f(x0+h)−f(x0) =n−1∑

    j=0

    (∂ei+1(f(xi + ξie

    i+1) − ∂ei+1f(x0))hi+1+

    n−1∑

    j=0

    ∂ei+1f(x0)hi+1.

    Wir bezeichnen mit

    R(h) =

    n−1∑

    j=0

    (∂ei+1(f(xi + ξie

    i+1) − ∂ei+1f(x0))hi+1.

    Nun gilt wegen der Stetigkeit der partiellen Ableitungen und der Tatsache, dasshi

    ‖h‖2für h → 0 beschränkt ist, dass

    limh→0

    R(h)

    ‖h||2= 0.

    Satz 8.3.15 (Ableitung und Richtungsableitung)Sei (V, ‖ · ‖V ) ein Banachraum, U ⊂ V offen, f : U → R im Punkt x0 ∈ Udifferenzierbar. Dann existiert für alle a ∈ V die Richtungsableitung ∂af(x0)und es gilt

    ∂af(x0) = Df(x0)(a).

  • 54 KAPITEL 8. DIFFERENTIALRECHNUNG

    Beweis. Folgt sofort aus der Definition.

    Satz 8.3.16 (Norm und Skalarprodukt)Eine Norm ‖ · ‖V auf einem Banachraum V wird genau dann von einem Skalar-produkt induziert, wenn die Norm der sogenannte Parallelogrammgleichung

    ‖x + y‖2V + ‖x − y‖2V = 2‖x‖2V + 2‖y‖2V

    genügt.

    Beweis. Gegeben sei ein Skalarprodukt mit zugehöriger Norm auf V . Dann ist

    ‖x + y‖2V + ‖x − y‖2V = 〈x + y,x + y〉V + 〈x − y,x− y〉V= 2〈x,x〉V + 2〈y,y〉V= 2‖x‖2V + 2‖y‖2V .

    Für die Umkehrung setzen wir (in einem komplexen Banachraum)

    〈x,y〉V =1

    4

    ((‖x + y‖2V + ‖x − y‖2V

    )+ i(‖x + iy‖2V + ‖x − iy‖2V

    )).

    Dann kann man alle Eigenschaften eines Skalarproduktes nachprüfen.

    Satz 8.3.17 (Orthogonales Komplement)Es sei (V, 〈·, ·〉V ) ein Hilbertraum und U ⊂ V ein abgeschlossener, linearerUnterraum von V , d.h. U ist ein linearer Unterraum und Ū = U . Dann gibt eseinen abgeschlossenen, linearen Unterraum W ⊂ V mit

    U ⊕W = V

    und für alle u ∈ U und alle w ∈W gilt

    〈u,w〉V = 0

    oder auch in Kurzform W = U⊥.

    Beweis. Sei U ein abgeschlossener Unterraum und

    U⊥ ={

    x ∈ V∣∣∣ 〈u,x〉V = 0 für alle u ∈ U

    }

    .

    Dann istU⊥ =

    u∈U

    {

    x ∈ V∣∣∣ 〈u,x〉V = 0

    }

    .

    Jede Menge{

    x ∈ V∣∣∣ 〈u,x〉V = 0

    }

    ist abgeschlossen, der Schnitt also abgeschlos-

    sen. Jede dieser Mengen ist offenkundig ein Unterraum, daher gilt dies auch für

  • 8.3. ABLEITUNGEN 55

    den Schnitt. Wir wollen noch zeigen, dass U⊥ ein Komplementärraum zu U ist.Offenkundig ist U ∩ U⊥ = {0}, denn für ū ∈ U ∩ U⊥ ist 〈ū, ū〉V = 0 und daherū = 0. Wir müssen noch zeigen, dass U + U⊥ = V ist. Ist x0 ∈ V , betrachte

    d = infy∈U

    ‖x0 − y‖V .

    Dazu gibt es ein y0 ∈ U mit

    ‖x0 − y0‖V = d.

    Um die Existenz zu zeigen betrachten mir eine minimierende Folge

    {yn} ⊂ U mit limn→∞

    ‖x0 − yn‖V = d.

    Diese Folge ist eine Cauchyfolge, denn betrachten wir die Parallelogrammglei-chung mit

    x = x0 − yn, y = x0 − ymund erhalten

    4

    ∥∥∥∥x0 −

    1

    2(yn + ym)

    ∥∥∥∥

    2

    V

    + ‖ym − yn‖2V = 2(‖x0 − yn‖2V + ‖x0 − ym‖2V

    ).

    Mit n,m → ∞ konvergiert die rechte Seite gegen 4d2, also auch die linke Seite.Da 1

    2(yn + ym) ∈ U ist der erste Ausdruck größer oder gleich 4d2 und der zweite

    Ausdruck konvergiert gegen 0. Also ist {yn}n∈N eine Cauchyfolge und der Grenz-wert existiert wegen der Vollständigkeit von V . Gäbe es zwei Elemente y0,y1 inU mit minimalem Abstand zu x0, so hätte die quadratische Abbildung

    f : R→ R : t 7→ ‖x0 − y0 + t(y1 − y0)‖2Vzwei Minima bei t = 0, t = 1 und wäre damit konstant, also y1 − y0 = 0.Nun ist klar, dass x0 = x0 + (y0 − x0). Wir müssen also noch zeigen, dassy0 − x0 ∈ U⊥ liegt. Sei u ∈ U , dann ist

    q(t) = 〈x0 − y0 + tu,x0 − y0 + tu〉HV ≥ 0,

    quadratisch in t und hat bei t = 0 ein einziges Minimum. Also ist q′(0) = 0, d.h.

    0 = q′(0) = 〈x0 − y0,u〉V + 〈u,x0 − y0〉V .

    Also ist Re〈x0 −y0,u〉V = 0. Im reellen Fall sind wir damit fertig, im komplexenFall beachte man

    q(it) ∈ Rund auf gleiche Weise folgt d

    dtq(it)|t=0 = 0 und Im〈x0 − y0,u〉V = 0.

  • 56 KAPITEL 8. DIFFERENTIALRECHNUNG

    Definition 8.3.18 (Komplementärraum)Der Raum W aus dem vorigen Satz wird als Komplementärraum (zu U) be-zeichnet.

    Aufgabe 8.3.19 (Komplementärraum)Zeigen Sie W⊥ = U oder auch (U⊥)⊥ = U .

    Lemma 8.3.20 (Riesz)Es sei (V, 〈·, ·〉V ) ein Hilbertraum. Zu einer stetigen linearen Abbildung ℓ : V →R gibt es einen eindeutig bestimmten Vektor y ∈ V , so dass für alle x ∈ V gilt:

    ℓ(x) = 〈y,x〉V .

    Beweis. Ist ℓ = 0, so ist nichts zu zeigen. Ist ℓ 6= 0, so ist U = ker ℓ ein ab-geschlossener linearer Unterraum, wobei die Abgeschlossenheit als Urbild einerabgeschlossenen Menge unter einer stetigen Abbildung (Satz 4.2.6) gegeben istund die Tatsache eines linearen Unterraums als Kern einer linearen Abbildunggegeben ist. Dann ist V = U⊕U⊥. Da die Kodimension von U den Wert 1 hat, istdimU⊥ = 1. Daher gibt es einen Vektor 0 6= ȳ ∈ U⊥, der diesen Raum erzeugt.Für diesen Vektor gilt für alle z ∈ ker(ℓ)

    〈ȳ, z〉V = 0.〈ȳ, ȳ〉V 6= 0 und damit ist die Gleichung

    〈cȳ, ȳ〉 = ℓ(ȳ)lösbar. Setze

    y = cȳ.

    Jedes x ∈ V hat eine Darstellung x = u + w mit u ∈ ker(ℓ), w = αȳ. Alsoerhalten wir

    〈y,x〉V = 〈y,u + αȳ〉V = α〈y, ȳ〉V = αℓ(ȳ) = ℓ(u + αȳ) = ℓ(x).

    Definition 8.3.21 (Gradient)Sei (V, 〈·, ·〉V ) ein Hilbertraum. Ist U ⊂ V offen und f : U → R im Punktx0 ∈ U differenzierbar, so heißt der Vektor y ∈ V mit

    Df(x0)(x) = 〈y,x〉V

    der Gradient von f im Punkt x0. Wir schreiben dafür auch ∇f(x0).

  • 8.3. ABLEITUNGEN 57

    Lemma 8.3.22 (Gradient, Darstellung)Ist (V, ‖ · ‖) = (Rn, ‖ · ‖2), so gilt

    ∇f(x0) =

    ∂f

    ∂x1(x0)

    ∂f

    ∂x2(x0)

    ...

    ∂f

    ∂xn(x0)

    .

    Beweis. Folgt sofort aus unserer Definition des Skalarproduktes.

    Bemerkung 8.3.23 (Gradient und Ableitung)Man beachte, dass es verschiedene Skalarprodukte gibt und diese Darstellungdes Gradienten vom Skalarprodukt abhängt. Nur die Linearisierung ist durchf und den Punkt festgelegt, die Ableitung in Koordinaten hängt von der Wahlder Basis und der Gradient vom gewählten Skalarprodukt ab.

    Obwohl die Ableitung die natürliche Konstruktion ist, wird oft in praktischenRechnungen der Gradient herangezogen. Wir formulieren die wichtigen Aussagenin beiden Varianten. Der Gradient hat mehrere Anwendungen, die wir gleich be-trachten wollen. Wir erinnern an die Definition von Extrema (Definition 5.3.1)aus der Analysis I.

    Satz 8.3.24 (Extremalstellen)Es sei (V, ‖·‖V ) ein Banachraum. Ist U ⊂ V offen und f : U → R differenzierbar,so verschwindet Df(x0) an jeder Extremalstelle x0.

    Beweis. Wir betrachten oBdA Maxima. Sei x0 ein lokales Maximum der Funk-tion f . Dann hat für jedes a ∈ V die Funktion

    fx0,a : R→ Rein lokales Maximum im Punkt 0, daher verschwindet die Ableitung. Damit istfür alle a ∈ V die Richtungsableitung ∂af(x0) = 0 und damit ist die Ableitung0.

    Definition 8.3.25 (Niveaumenge)Sei U ⊂ V offen, f : U → R differenzierbar und w ∈ R. Wir definieren dieNiveaumenge von f zum Niveau w als

    Nf(w) = f−1(w).

  • 58 KAPITEL 8. DIFFERENTIALRECHNUNG

    Bemerkung 8.3.26 (Niveaumengen)Die Bestimmung und Charakterisierung von Niveaumengen ist eine wichtigeAufgabe, die Untersuchung dieses Problems hat viele Entwicklungen in der Ma-thematik angestoßen. Wir wollen zunächst zeigen, dass (im Hilbertraum) derGradient senkrecht auf der Niveaumenge steht. Da aber die Niveaumenge keinlinearer Unterraum ist, wollen wir eine etwas andere Formulierung wählen umdiesen Sachverhalt auszudrücken. Wir werden später sehen, wie man diesenSachverhalt sachgemäß formuliert.

    Satz 8.3.27 (Niveaumengen und Tangentialvektoren)Sei U ⊂ V offen, f : U → R differenzierbar, w ∈ R und Nf(w) die Niveau-menge. Ist γ : R → U eine differenzierbare Kurve mit γ(t) ∈ Nf(w) für allet ∈ (−ε, ε) für eine Zahl ε > 0. Sei γ′(0) = v der Tangentialvektor an γ imPunkt 0, so gilt

    Df(γ(0))(γ′(0)) = 0.

    Ist (V, ‖ · ‖V ) ein Hilbertraum, so gilt

    〈∇f(γ(0)),v〉V = 0.

    Beweis. Wir betrachten die Funktion g : R → R : t 7→ f(γ(t)). Diese ist diffe-renzierbar und auf (−ε, ε) konstant. Also ist

    0 = g′(0) = Df(γ(0))γ′(0) = 〈∇f(γ(0)),v〉.

    Die zuletzt genutzte Formel ist eine verallgemeinerte Kettenregel, die wir nochbegründen wollen.

    Satz 8.3.28 (Kettenregel)Es sei (V, ‖ · ‖V ) ein Banachraum. Ist U ⊂ V offen, γ : I → U eine stetigdifferenzierbare Kurve und f : U → R im Punkt x0 = γ(t0) differenzierbar, soist f ◦ γ im Punkt t0 differenzierbar und es gilt

    (f ◦ γ)′(t0) = Df(x0)(γ′(t0)).

    Beweis. Aufgrund der Differenzierbarkeit von f, γ haben wir Darstellungen

    f(x0 + h) = f(x0) + ℓ(h) +R(h)

    γ(t0 + h) = γ(t0) + hv + R̃(h).

    mit|R̃(h)||h| → 0 mit h → 0 und

    |R(h)|‖h‖V

    → 0 mit h → 0. Dann ist mit v = γ′(t0)

  • 8.4. MITTELWERTSATZ UND ANWENDUNGEN 59

    und ℓ = Df(x0)

    1

    |h| |f ◦ γ(t0 + h) − f ◦ γ(t0) − hℓ(v)| =

    =1

    |h|∣∣∣f(γ(t0) + hv + R̃(h)) − f(γ(t0)) − ℓ(hv)

    ∣∣∣

    =1

    |h|∣∣∣f(γ(t0)) + ℓ(hv + R̃(h)) +R(hv + R̃(h)) − f(γ(t0)) − ℓ(hv)

    ∣∣∣

    ≤ 1|h| |ℓ(R̃(h))| +1

    |h| |R(hv + R̃(h))|

    =

    ∣∣∣∣∣ℓ

    (

    R̃(h)

    |h|

    )∣∣∣∣∣+R(hv + R̃(h))

    ‖hv + R̃(h)‖V‖hv + R̃(h)‖V

    |h| .

    Da ℓ stetig ist folgt aus‖R(h)‖2

    |h| → 0 auch die Konvergenz

    limh→0

    ∣∣∣∣∣ℓ

    (

    R̃(h)

    |h|

    )∣∣∣∣∣= 0.

    Der zweite Faktor im zweiten Term ist beschränkt, der erste konvergiert gegen 0,damit konvergiert der Ausdruck

    1

    |h| |f ◦ γ(t0 + h) − f ◦ γ(t0) − hℓ(v)|

    mit h→ 0 gegen 0 also ist ℓ(v) die Ableitung von f ◦ γ in t0.

    8.4 Mittelwertsatz und Anwendungen

    Aus der Analysis I erinnern wir uns an den Mittelwertsatz der Differentialrech-nung Satz 5.3.7, der besagt, dass die Differenz zweier Funktionswerte eine Dar-stellung als Produkt aus der Differenz der Argumente und der Ableitung an einerZwischenstelle hat, also

    f(b) − f(a) = f ′(ξ)(b− a) mit ξ ∈ (a, b).

    Die Verallgemeinerung dieses Satzes für höherdimensionale Räume sieht ähnlichaus, ist aber im Detail etwas anders.

    Definition 8.4.1 (Dualraum)Ist (V, ‖ · ‖V ) ein Banachraum, so bezeichnen wir mit V ′ den Dualraum von V ,wobei

    V ′ ={

    ℓ : V → R ∣∣∣ ℓ ist stetig und linear} .

  • 60 KAPITEL 8. DIFFERENTIALRECHNUNG

    Lemma 8.4.2 (Eigenschaften des Dualraumes)Der Dualraum ist ein normierter linearer Raum, dessen Norm durch

    ‖ℓ‖V ′ = sup{

    |ℓ(x)∣∣∣ ‖x‖V = 1

    }

    .

    definiert ist. Mit dieser Norm gilt für jedes x ∈ V

    |ℓ(x)| ≤ ‖ℓ‖V ′‖x‖V .

    V ′ wird mit dieser Norm zum Banachraum.

    Beweis. Offensichtlich ist ‖ · ‖V ′ eine Norm. Ist x ∈ V , so ist x = ‖x‖V x‖x‖V unddamit gilt

    |ℓ(x)| =∣∣∣∣ℓ

    (

    ‖x‖Vx

    ‖x‖V

    )∣∣∣∣

    = ‖x‖V∣∣∣∣ℓ

    (x

    ‖x‖V

    )∣∣∣∣

    ≤ ‖ℓ‖V ′‖x‖V .Wir betrachten eine Folge {ℓn}n∈N, die bezüglich der eben definierten Norm eineCauchyfolge ist. Dann ist wegen

    |ℓn(x) − ℓm(x)| ≤ ‖ℓn − ℓm‖V ′‖x‖Vfür jedes x ∈ V die Folge {ℓn(x)}n∈N eine Cauchyfolge inR und daher konvergent.Setze ℓ(x) = limn→∞ ℓn(x). ℓ ist offensichtlich linear. Aus einem typischen ε/3-Argument folgt die Stetigkeit von ℓ. Dann folgt auch sofort, dass limn→∞ ℓn =ℓ.

    Satz 8.4.3 (Mittelwertsatz)Es sei U ⊂ V offen und x, y ∈ U seien Punkte, so dass die Verbindungstrecke,d.h. die Menge

    S(x,y) ={

    x + t(y − x)∣∣∣ t ∈ [0, 1]

    }

    in U enthalten ist. Ferner sei f : U → R differenzierbar. Dann gilt: Es gibt einξ ∈ S(x,y) mit

    f(y) − f(x) = Df(ξ)(y − x).

    Beweis. Wir betrachten die Funktion

    g(t) = f(x + t(y − x)).Diese Funktion g : [0, 1] → R ist stetig, auf (0, 1) differenzierbar und

    g(0) = f(x), g(1) = f(y).

  • 8.4. MITTELWERTSATZ UND ANWENDUNGEN 61

    Daher gibt es ein ζ ∈ (0, 1) mit

    g′(ζ) = f(y) − f(x).

    Die Ableitung errechnet sich zu

    g′(ξ) = Df(x + ξ(y − x))(y − x).

    Aus dem eben bewiesenen Satz folgt sofort die Abschätzung

    |f(y) − f(x)| ≤ sup{

    ‖Df(z)‖V ′∣∣∣ z ∈ S(x,y)

    }

    ‖y − x‖V .

    Daraus kann man nun sofort eine Schranke für f herleiten, falls U eine beschränk-te, offene Menge ist und die Norm ‖Df(x)‖V ′ auf U beschränkt ist.

    Definition 8.4.4 (Gebiete)Es sei (V, ‖ · ‖V ) ein Banachraum.

    1. Eine zusammenhängende, offene Teilmenge von V heißt Gebiet. Ein Ge-biet U heißt beschränkt, wenn es ein R > 0 gibt mit U ⊂ BR(0).

    2. Ist U ⊂ V eine Menge, so dass für je zwei Punkte x,y ∈ U S(x,y) ⊂ Ugilt, so nennt man U konvex.

    3. Eine Menge U ⊂ V heißt wegezusammenhängend, wenn es zu je zweiPunkten x, y ∈ U eine Kurve γ : [a, b] → U gibt, mit γ(a) = x, γ(b) = y.

    Aufgabe 8.4.5 (Wegezusammenhängende Gebiete)1. Konvexe Gebiete sind wegezusammenhängend.

    2. Wegezusammenhängende Mengen sind zusammenhängend.

    3. Die Umkehrung der letzten Aussage gilt i.A. nicht.

    Bemerkung 8.4.6 (Gebiete und Zusammenhang)Es ist oft wesentlich leichter zu beweisen, dass eine Menge wegezusam-menhängend ist, als dass sie zusammenhängend ist.

    Satz 8.4.7 (Beschränktheit)Ist U ⊂ V ein beschränktes, konvexes Gebiet und f : U → R stetig differen-zierbar mit beschränkter Ableitung, so ist f auf U beschränkt, genauer gilt: IstR > 0 mit U ⊂ BR(0), ‖Df(x)‖V ≤M für alle x ∈ U , so ist für x0 ∈ U

    |f(x)| ≤ |f(x0)| +MK.

  • 62 KAPITEL 8. DIFFERENTIALRECHNUNG

    Beweis. Es gilt für ein geeignetes z ∈ S(x,x0)f(x) − f(x0) = Df(z)(x− x0).

    Damit ist mit ‖x − x0‖V < 2R und ‖Df(z)‖V < M|f(x)| ≤ |f(x0)| +M‖x − x0‖V ≤ |f(x0)| +MK.

    Satz 8.4.8 (Integration längs Kurven)U ⊂ V sei wegezusammenhängend, ferner gebe es zu je zwei Punkten x,y ∈ Ueine C1 Kurve γ : [a, b] → U mit γ(a) = x, γ(b) = y. Dann ist

    f(y) − f(x) =b∫

    a

    Df(γ(t))(γ′(t)) dt.

    Im Hilbertraum kann man dafür schreiben

    b∫

    a

    〈∇f(γ(t)), γ′(t)〉 dt.

    Definition 8.4.9 (Linienintegral)Das Integral

    b∫

    a

    Df(γ(t))γ′(t) dt

    heißt das Linienintegral des Differentials von f längs der Kurve γ.

    Beweis. Der Satz ist eine direkte Anwendung der Kettenregel.

    8.5 Höhere Ableitungen, der Satz von Schwarz

    und multilineare Abbildungen

    Hat man eine Funktion f : U → R, die partiell differenzierbar ist, so ist für a ∈ V∂af : U → R

    wiederum eine reellwertige Funktion und man kann fragen, ob diese FunktionRichtungsableitungen besitzt. Insbesondere können wir für x0 ∈ U und b ∈ Vnach der Existenz von

    ∂b (∂af(x0))

  • 8.5. HÖHERE ABLEITUNGEN 63

    fragen. Man kann diesen Prozess iterieren und nach für eine endliche Anzahl vonVektoren a1, a2, . . . , ar die Existenz der iterierten Richtungsableitung

    ∂ar . . . ∂a1f(x0)

    und eventuell deren Eigenschaften untersuchen.Wir beginnen mit einer einfachen Aussage.

    Satz 8.5.1 (Schwarz)Es sei (V, ‖ · ‖V ) ein Banachraum. U ⊂ V offen, f : U → R sei ste-tig. Es seien a,b ∈ V . Existieren für alle x ∈ U die Richtungsableitungen∂af(x), ∂bf(x), ∂a∂bf(x), ∂b∂af(x) und sind die Abbildungen

    x 7→ ∂af(x), x 7→ ∂af(x), x 7→ ∂b∂af(x), x 7→ ∂a∂bf(x)

    stetig, so gilt für alle x ∈ U die Gleichheit

    ∂b∂af(x) = ∂a∂bf(x).

    Bemerkung 8.5.2 (Partielle Ableitungen höherer Ordnung)1. Im Rn haben wir die den Standardeinheitsvektoren zugeordneten Rich-

    tungsableitungen als partielle Ableitungen bezeichnet. Insofern besagt un-ser Satz in diesem Kontext, dass die Stetigkeit der ersten partiellen Ablei-tungen und die Existenz und Stetigkeit der zweiten partiellen Ableitungenimpliziert, dass die Reihenfolge keine Rolle spielt.

    2. Im Rn kann man tatsächlich etwas mehr beweisen, nämlich: Aus der Ste-tigkeit der partiellen Ableitungen ∂if , ∂jf und

    ∂2f

    ∂xi∂xjim Punkt x0 folgt

    die Existenz der partiellen Ableitung ∂2f(x0)∂xj ∂xi

    und die im Satz behauptete

    Gleichheit. Einen Beweis dieser Bemerkung findet man z.B. bei Königs-berger [14].

    Beweis. Wir betrachten für festes a, b ∈ V, x0 ∈ U und festes h, k ∈ R denfolgenden Ausdruck

    A(h, k) = f(x0 + ha + kb) − f(x0 + kb) − f(x0 + ha) + f(x0).Mit

    g(h, k) = f(x0 + ha + kb) − f(x0 + kb)hat A die Gestalt

    A(h, k) = g(h, k) − g(h, 0).Für festes h ist g(h, ·) eine differenzierbare Funktion der Veränderlichen k unddaher gilt: Es gibt ein k̂(h) mit

    A(h, k) = ∂kg(h, k̂(h))k.

  • 64 KAPITEL 8. DIFFERENTIALRECHNUNG

    Damit ist

    A(h, k) =(

    ∂bf(x0 + ha + k̂(h)b) − ∂bf(x0 + k̂(h)b))

    k.

    Betrachten wir nun die rechte Seite für fixiertes k̂(h) als Funktion von h in derersten Komponente, so gibt es ein ĥ mit

    A(h, k) = ∂a∂bf(x0 + ĥa + k̂(h)b)kh.

    Natürlich erhält man auf gleiche Weise (indem man einfach a und b und entspre-chend h und k vertauscht

    A(h, k) = ∂b∂af(x0 + ĥ(k)a + k̂b)kh.

    Also ist∂a∂bf(x0 + ĥa + k̂(h)b) = ∂b∂af(x0 + ĥa + k̂(h)b).

    Mit den Grenzwerten h→ 0, k → 0 folgt das Resultat.

    Korollar 8.5.3 (Höhere partielle Ableitungen und Permutationen)Ist eine Funktion f : Rn → R k-mal stetig partiell differenzierbar, dann gilt fürjede Permutation π ∈ S(n)

    ∂eik . . . ∂ei1f(x0) = ∂eiπ(k) . . . ∂eiπ(1)f(x0).

    Beweis. Folgt sofort aus dem Satz von Schwarz.Höheren Ableitungen kann man multilineare Abbildungen zuordnen, wir wol-

    len dies am Beispiel zweiter Ableitungen beschreiben, da diese eine besondereRolle spielen werden, auf den allgemeinen Fall kommen wir noch zurück.

    Definition 8.5.4 (Bilineare Abbildung)Eine Abbildung B : V × V → R mit D(B) = V × V und B(x,y) ist für jeweilsfestes x, bzw. festes y linear in der anderen Komponente, heißt bilinear. Ent-sprechend heißt eine Abbildung m : V × · · · × V

    ︸ ︷︷ ︸

    k−mal

    → R k-linear, wenn M in jederKomponente bei festgehaltenen anderen Einträgen linear ist. Eine Abbildungheißt multilinear, falls sie k-linear für ein k ∈ N ist. Mit Mk(V ;R) bezeichnenwir die Menge der k-linearen stetigen Abbildungen, also

    Mk(V ;R) = {m : V × · · · × V ∣∣∣ m ist k-linear und stetig} .Wir wollen zweiten Ableitungen eine bilineare stetige Abbildung zuordnen, daaber df : V → V ′ ist, ist an dieser Stelle noch nicht klar, was eine zweite Ab-leitung sein könnte. Dies wird später im Detail untersucht werden, hier wollen

  • 8.5. HÖHERE ABLEITUNGEN 65

    wir eine spezielle Situation betrachten. Wir beginnen mit einem Banachraum(V, ‖ · ‖V ) einer offenen Teilmenge U ⊂ V .Wir betrachten für v ∈ V die Richtungsableitung als Abbildung

    V → R : x 7→ ∂vf(x).Wir fassen dies als reellwertige Funktion auf V auf. Wir setzen voraus, dass dieseFunktion differenzierbar ist. Dann können wir für x0 ∈ U und u ∈ V wieder dieRichtungsableitung

    ∂u∂vf(x0)

    bilden. Sind f und ∂vf in x0 differenzierbar, so ist die Abbildung

    (u,v) 7→ ∂u∂vf(x0)

    bilinear. Wir wollen nun im endlichdimensionalen Fall, (V, ‖ · ‖V ) = (Rn, ‖ ·‖2), eine Darstellung dieser bilinearen Abbildung bezüglich der Standardbasisangeben. Es ergibt sich

    ∂vf(x) =

    n∑

    i=1

    ∂eif(x)vi.

    Davon die Richtungsableitung in Richtung u ergibt sich zu

    ∂u∂vf(x) =n∑

    i=1

    ∂u∂eif(x)vi.

    Dies ergibt

    ∂u∂vf(x) =

    n∑

    i=1

    n∑

    j=1

    (uj∂ej∂eif(x)) vi.

    Da∂ej∂eif(x) = ∂ei∂ejf(x)

    ist, kann man dies schreiben als

    n∑

    i=1

    n∑

    j=1

    ∂ei∂ejf(x)ujvi

    oder auch als〈u, Av〉

    mit

    A =

    ∂2f(x0)

    ∂x21. . .

    ∂2f(x0)

    ∂x1∂xn...

    ...∂2f(x0)

    ∂xn∂x1. . .

    ∂2f(x0)

    ∂x2n.

  • 66 KAPITEL 8. DIFFERENTIALRECHNUNG

    Definition 8.5.5 (Hesse-Matrix)Die Matrix A heißt Hesse-Matrix4von f , wir schreiben dafür auch Hess(f)(x0).

    Die Hesse-Matrix ist nach dem Satz von Schwarz, wenn alle partiellen und allezweiten partiellen Ableitungen stetig sind, symmetrisch. Im allgemeinen Banach-raum gibt es natürlich unter den entsprechenden Voraussetzungen eine stetigebilineare Abbildung, die die Rolle der Hesse-Matrix übernimmt, auch darauf wer-den wir nochmals zurückkommen.

    8.6 Taylorpolynome und Taylorreihen

    Für differenzierbare FunktionenR→ R hatten wir eine Approximation durch Po-lynome untersucht und sind dabei auf das Taylorpolynom bzw. auf die Taylorreihegestoßen. Eine ähnliche Konstruktion gibt es auch für Funktionen f : V → R.Wir sprechen zunächst über Polynome in mehreren Veränderlichen, dann überdas Taylorpolynom einer hinreichend oft differenzierbaren Funktion. Wir begin-nen mit der Definition eines Polynoms.

    Definition 8.6.1 (Polynom)1. Eine Funktion f : Rn → R heißt Polynom, falls f eine Darstellung der

    Form

    f(x) =

    k1∑

    i1=0

    k2∑

    i2=0

    · · ·kn∑

    in=0

    ai1i2...inxi11 x

    i22 · · ·xinn

    hat. Der Grad des Polynoms ist gegeben durch

    grad(f) = max{

    i1 + i2 + · · ·+ in∣∣∣ ai1i2...in 6= 0

    }

    .

    2. Sei (V, ‖ · ‖V ) ein Banachraum. Eine Abbildung

    v 7→m∑

    k=0

    mk(v,v, ·,v),

    wobei mk ∈MK(V ;R) ist, nennen wir ein Polynom.Aufgabe 8.6.2Zeigen Sie, dass die beiden Begriffe für reellwertige Abbildungen Rn → R zu-sammenfallen.

    4Ludwig Otto Hesse (22.4.1811-4.8.1874) stammt aus Königsberg, dem heutigen Kalinin-grad, und war Professor in Halle, Heidelberg und München. Seine wichtigsten mathematischenArbeiten betreffen Algebra, Analysis und analytische Geometrie.

  • 8.6. TAYLORPOLYNOME UND TAYLORREIHEN 67

    Wir wollen nun für Polynome auf Rn eine etwas einfachere Notation einführen,die jedoch auch etwas weniger anschaulich ist.

    Definition 8.6.3 (Multiindex)Ein Element α ∈ Zn mit αi ≥ 0 für alle i heißt Multiindex. Für einen Multiindexα definieren wir α! =

    ∏ni=1 αi! und für x ∈ Rn setzen wir

    xα =

    n∏

    i=1

    xαii .

    Wir definieren die Länge eines Multiindex α durch

    |α| =n∑

    i=1

    αi.

    Damit nimmt die allgemeine Gestalt eines Polynomes vom Grad k auf V = Rndie Form

    P (x) =∑

    |α|≤k

    aαxα

    an.

    Definition 8.6.4 (α-te partielle Ableitung)Ist α ein Multiindex, so setzen wir

    dαf(x0) =∂|α|

    ∂xα11 . . . ∂xαnn

    f(x0).

    Definition 8.6.5Sei U ⊂ Rn ein Gebiet. Wir definieren

    Ck(U ;R) = {f ∈ C(U ;R) ∣∣∣ f ist k-mal stetig partiell differenzierbar} .

  • 68 KAPITEL 8. DIFFERENTIALRECHNUNG

    Satz 8.6.6 (Vorbereitung Taylor)Es sei U ⊂ Rn offen, f ∈ Ck(U ;R) und x0 ∈ U , ξ ∈ Rn mit S(x0,x0 + ξ) ∈ U .Wir setzen für t ∈ [0, 1]

    g(t) = f(x0 + tξ).

    Dann ist g : [0, 1] → R stetig und auf (0, 1) k-mal stetig differenzierbar, und esgilt für j = 1, . . . , k

    g(j)(t) =∑

    |α|=j

    j!

    α!dαf(x0 + tξ)ξ

    α.

    Beweis. Wir beweisen durch Induktion über j. Im Fall j = 1 erhalten wir genaudie Richtungableitung in Richtung ξ.

    g′(t) =d

    dtfx0,ξ(t) = Df(x0 + tξ)ξ =

    n∑

    i=1

    ∂eif(x0 + tξ)ξi =∑

    |α|=1

    dαf(x0 + tξ)ξα.

    Damit ist der erste Schritt getan.

    Der Induktionsschritt beruht auf der Einsicht, dass

    g(j+1)(t) =d

    dtg(j)(t)

    =d

    dt

    |α|=j

    j!

    α!dαf(x0 + tξ)ξ

    α

    =

    n∑

    i=1

    ∂ei

    |α|=j

    j!

    α!dαf(x0 + tξ)ξ

    α

    ξi

    =∑

    |β|=j+1

    τβdβf(x0 + tξ)ξ

    β,

    wobei wir noch τβ bestimmen müssen. Nun, ein der Koeffizient von dαf(x0+ξ)ξ

    α

    trägt zu τβ bei, wenn α und β bis auf eine Komponente übereinstimmen. DieSumme aller dieser Koeffizienten liefert genau τβ . Wir setzen β

    ′ = (β1 − 1, β2 −

  • 8.6. TAYLORPOLYNOME UND TAYLORREIHEN 69

    1, . . . , βn − 1).

    τβ =

    n∑

    r=1

    j!∏

    i6=r βi!(βr − 1)

    =n∑

    r=1

    j!

    (β ′)!∏

    i6=r βi

    =n∑

    r=1

    j!βrβ!

    =n∑

    r=1

    βrj!

    β!

    = |β| j!β!

    = (j + 1)j!

    β!

    =(j + 1)!

    β!.

    Damit können wir nun aus der Taylorformel im Falle n = 1 direkt eine Tay-lorformel für f : U → R, U ⊂ Rn herleiten.Satz 8.6.7 (Restglied)Sei U ⊂ Rn offen, f ∈ Cm+1(U ;R) und x0 ∈ U , ξ ∈ Rn, so dass S(x0,x0 +ξ) ⊂U . Dann ist gibt es ein θ ∈ (0, 1), so dass gilt

    f(x0 + ξ) = f(x0) +

    m∑

    j=1

    |α|=j

    1

    α!

    ∂|α|

    ∂xαf(x0)ξ

    α +∑

    |α|=m+1

    ∂|α|

    ∂xαf(x0 + θξ)ξ

    α.

    Beweis. Wir setzeng : [0, 1] → R : t 7→ f

    x,ξ(t).

    g : [0, 1] → R ist (m + 1)-mal stetig differenzierbar, daher gilt die Taylorformelaus Satz 7.3.1. Dies gibt uns für ein θ ∈ (0, 1) eine Darstellung von g(1) in derForm

    g(1) = g(0) +

    m∑

    j=1

    1

    j!g(j)(0)1j +

    1

    (m+ 1)!g(m+1)(θ)1m+1.

    Einsetzen der Darstellungen aus Satz 8.6.6 ergibt den folgenden Ausdruck

    f(x0 + ξ) = f(x0) +m∑

    j=1

    1

    α!

    ∂|α|

    ∂xαf(x0)ξ

    α +∑

    |α|=m+1

    1

    α!

    ∂|α|

    ∂xαf(x0 + θξ)ξ

    α.

  • 70 KAPITEL 8. DIFFERENTIALRECHNUNG

    Dies ist der gewünschte Ausdruck.

    Definition 8.6.8 (Taylorpolynom)Das Polynom

    f(x0) +

    m∑

    j=1

    |α|=j

    1

    α!

    ∂|α|

    ∂xαf(x0)ξ

    α

    heißt Taylorpolynom von f vom Grad höchstens m im Punkt x0.

    Korollar 8.6.9 (Charakterisierung Taylorpolynom)Sei U ⊂ Rn offen und x0 ∈ U , δ > 0, so dass

    Bδ(x0) ⊂ U.

    Für f ∈ Cm+1(U ;R) und dem Taylorpolynom Pf,x0,m+1(ξ) von f vom Gradhöchstens m+ 1 im Entwicklungspunkt x0 und ‖ξ‖2 < δ gilt dann

    f(x0 + ξ) = Pf,x0,m+1(ξ) + o(‖ξ‖m+12 ) für ξ → 0.

    Beweis. Wir wissen

    f(x0 + ξ) = Pf,x0,m+1(ξ) −∑

    |α|=m+1

    1

    α!

    ∂|α|

    ∂xαf(x0)ξ

    α +∑

    |α|=m+1

    1

    α!

    ∂|α|

    ∂xαf(x0 + θξ)ξ

    α

    = Pf,x0,m+1(ξ) +R(ξ),

    wobei aufgrund der Stetigkeit der m+ 1-ten Ableitungen gilt

    limξ→0

    (∂|α|

    ∂xαf(x0 + θξ) −

    ∂|α|

    ∂xαf(x0)

    )

    = 0.

    Da

    |ξα| ≤ ‖ξ‖|α|2gilt für |α| = m+ 1

    |ξα|‖ξ‖m+12

    ≤ ‖ξ‖m+12

    ‖ξ‖m+12= 1,

    und damit ist

    limξ→0

    R(ξ)

    ‖ξ‖m+12= 0.

    Dies war zu zeigen.

  • 8.6. TAYLORPOLYNOME UND TAYLORREIHEN 71

    Bemerkung 8.6.10 (Bestapproximierende)Das Taylorpolynom für Funktionen auf R stellt unter allen Polynomen glei-chen Grades jenes dar, welches die Funktion f nahe dem Entwicklungspunktam besten approximiert. Wir erinnern: Das Differential ist unter den linearenAbbildungen, das Taylorpolynom zweiten Grades unter allen quadratischen Ab-bildungen und das Taylorpolynom m-ten Grades eben unter allen Polynomenm-ten Grades die beste Approximation. Diese Überlegung überträgt sich aufFunktionen und approximierende Polynome m-ten Grades auf dem Rn.

    Ist eine Funktion unendlich oft differenzierbar, so kann man für jeden Grad einTaylorpolynom angeben. Insgesamt hat man die folgende Definition.

    Definition 8.6.11 (Taylorreihe)Seien U ⊂ Rn offen, f : U → R beliebig oft stetig partiell differenzierbar (d.h.f ∈ Cm(U ;R) für alle m ∈ N). Die Taylorreihe von f im Punkt x0 ist

    T(f,x0)(ξ) =

    ∞∑

    k=0

    |α|=k

    1

    α!

    ∂|α|

    ∂xαf(x0)ξ

    α.

    Wir wollen die oben angegebene Abschätzung nutzen um hinreichende Bedin-gungen für lokale Extrema anzugeben. Wir wissen, dass das Verschwinden derAbleitung notwendig ist. Das Taylorpolynom zweiten Grades hat die Form:

    Pf,x0,2(ξ) = f(x0) + ∂e1f(x0)ξ1 + · · ·+ ∂enf(x0)ξn+

    1

    2

    ∂2

    ∂x12f(x0)ξ

    21 + · · ·+

    1

    2

    ∂2

    ∂xn2f(x0)ξ

    2n

    +∂2

    ∂x1∂x2f(x0)ξ1ξ2 +

    ∂2

    ∂x1∂x3f(x0)ξ1ξ3 + · · ·+

    ∂2

    ∂xn−1∂xnf(x0)ξn−1ξn

    = f(x0) + 〈∇f(x0), ξ〉 + 〈ξ,Hess(f)(x0)ξ〉2.

    Definition 8.6.12 (Positiv definit)Eine symmetrische Matrix heißt

    1. positiv (negativ) definit, wenn für alle x ∈ Rn, x 6= 0 gilt〈x, Ax〉 > 0 (〈x, Ax〉 < 0).

    2. positiv (negativ) semidefinit , wenn für alle x ∈ Rn, x 6= 0 gilt〈x, Ax〉 ≥ 0 (〈x, Ax〉 ≤ 0).

    3. indefinit, falls es x,y ∈ Rn gibt mit〈x, Ax〉 < 0 < 〈y, Ay〉.

  • 72 KAPITEL 8. DIFFERENTIALRECHNUNG

    Unter Verwendung der Hesse-Matrix gelingt es uns Extremalstellen zu charakte-risieren.

    Satz 8.6.13 (Hinreichende Bedingung)Sei U ⊂ Rn offen, f : U → R zweimal stetig partiell differenzierbar, sei x0 ∈ Umit ∇f(x0) = 0. Dann gilt:

    1. Ist Hess(f)(x0) positiv (negativ) definit, so liegt ein lokales Minimum(Maximum) vor.

    2. Ist Hess(f)(x0) indefinit, so ist Hess(f)(x0) keine lokale Extremwertstelle.

    3. Ist x0 lokale Extremwertstelle, so ist Hess(f)(x0) im Falle eines Minimumspositiv semidefinit, im Falle eines Maximums negativ semidefinit.

    Beweis. Aus dem Korollar 8.6.9 ergibt sich eine Darstellung der Funktion f mit-tels des quadratischen Taylorpolynoms in Form von

    f(x0 + h) = f(x0) = 〈∇f(x0),h〉 +1

    2〈h,Hess(f)(x0)h〉 +R2(h)

    wobei

    limh→0

    R2(h)

    ‖h‖22= 0

    ist. Daher finden wir zu ε > 0 ein δ > 0, so dass ‖h‖2 ≤ δ impliziert

    |R2(h)| < ε‖h‖22. (8.3)

    Wir beweisen nun die einzelnen Aussagen, dabei ist der Beweis des zweiten Fallesin der ersten Aussage identisch mit dem des ersten Falles und wir beschränkenuns auf diesen.(1) Wir setzen A = Hess(f)(x0) und betrachten die Funktion

    ψ : Rn → R : h 7→ 〈h, Ah〉.Da A positiv definit ist, hat ψ ein Minimumm bei h = 0 mit dem Wert 0. Wirwollen untersuchen wie schnell ψ(h) gegen Null konvergiert. Aus Beispiel 8.3.9,zweiter Teil, wissen wir, dass ψ differenzierbar ist, als solches ist ψ stetig (Satz8.3.10). Die Menge

    Sn−1 ={

    x ∈ Rn ∣∣∣ ‖x‖2 = 1}ist abgeschlossen (da das Komplement offenkundig offen ist) und beschränkt(nach Definition), also kompakt. Damit ist ψ(Sn−1) nach Satz 4.3.5 kompaktin R. Da 0 /∈ ψ(Sn−1) ist, gibt es ein h0 ∈ Sn−1 mit

    0 < ψ(h0) ≤ ψ(h) für alle h ∈ Sn−1.

  • 8.7. DIFFERENZIERBARE ABBILDUNGEN 73

    (Setze µ = inf ψ(Sn−1), da ψ(Sn−1) kompakt ist, ist µ ∈ ψ(Sn−1) und damit gibtes ein h0 mit ψ(h0) = µ.) Dann ist für 0 6= ‖h‖2 < δ

    0 < µ ≤ ψ((

    1

    ‖h‖2

    )

    h

    )

    =

    (1

    ‖h‖2

    )2

    ψ(h)

    alsoµ‖h‖22 ≤ ψ(h).

    Ist ε < µ so folgt für 0 6= ‖h‖2 < δ

    f(x0 + h) = f(x0) + ψ(h) +R2(h)

    ≥ f(x0) + µ‖h‖22 − ε‖h‖22= f(x0) + (µ− ε)‖h‖22> f(x0).

    Damit hat f bei x0 ein isoliertes lokales Minimum.

    (2) Ist A indefinit, so gibt es h1,h2 ∈ Sn−1 mit

    ψ(h1) < 0 < ψ(h2).

    Wir betrachten nun die Funktion

    fx0,h1(t)

    bzw.fx0,h2(t)

    für t nahe 0. Sei ε < min{|ψ(h1)|, ψ(h2)} und δ > 0 das in Gleichung (8.3)definierte δ = δ(ε). Dann ist für |t| < δ, und h ∈ Sn−1

    fx0,h(t) = f(x0) + t2ψ(h) +R(th)

    und damit

    f(x0) + t2ψ(h) − εt2 < fx0,h(t) < f(x0) + t2ψ(h) + εt2.

    Damit ist für t 6= 0 und h = h1 die Funktion fx0,h1(t) < 0 und für h = h2 dieFunktion fx0,h2(t) > 0. Also hat f im Punkt x0 kein lokales Extremum.(3) Folgt sofort aus (2).

    8.7 Differenzierbare Abbildungen

    Wir beginnen nun Abbildungen von Rn → Rm oder allgemeiner von V → W ,wobei V,W Banachräume sind, zu betrachten. Im Fall eines endlich dimensionalen

  • 74 KAPITEL 8. DIFFERENTIALRECHNUNG

    Bildraumes wird die Abbildung als Vektor von Abbildungen angesehen, d.h. seiU ⊂ V offen

    f : U → Rm : x 7→

    f1(x)f2(x)

    ...fm(x)

    ,

    wobei für i = 1, . . . , m die Funktion fi : U → R abbildet. Wir führen den Begriffder Differenzierbarkeit sofort im allgemeinen Kontext ein.

    Definition 8.7.1 (Differenzierbarkeit)Es seien (V, ‖ ·‖V ), (W, ‖ ·‖W ) Banachräume, ferner sei U ⊂ V offen, f : U →Weine Abbildung. Die Abbildung f heißt im Punkt x0 ∈ U differenzierbar, wennes eine stetige lineare Abbildung L : V → W gibt, so dass

    lim‖h‖V →0

    1

    ‖h‖V(f(x0 + h) − f(x0) − L(h)) = 0.

    L wird als Differential Df(x0) von f im Punkt x0 bezeichnet.

    Wiederum hat man die Eindeutigkeit von L.

    Satz 8.7.2 (Eindeutigkeit der Ableitung)Gibt es eine lineare Abbildung wie in der Definition 8.7.1 angegeben, so ist dieseeindeutig.

    Beweis. Der Beweis ist eine wörtliche Wiederholung des Beweises von Satz8.3.4.

    Satz 8.7.3 (Charakterisierung der Differenzierbarkeit)Sei U ⊂ V offen, f : U → Rm ist im Punkt x0 genau dann differenzierbar, wennjede Funktion fi : U → R im Punkt x0 differenzierbar ist. Das Differentialerhält man als Vektor der Differentiale ℓi der Funktionen fi.

    Beweis. Angenommen f ist im Punkt x0 differenzierbar, so ist

    lim‖h‖V →0

    1

    ‖h‖V(f(x0 + h) − f(x) − L(h)) = 0.

    Dann gilt aber für jede Komponente fi, i = 1, . . . , m

    lim‖h‖V →0

    1

    ‖h‖V(fi(x0 + h) − fi(x0) − (Lh)i) = 0.

    Setzen wir ℓi(h) = (Lh)i, so zeigt diese Gleichung, dass ℓi das Differential von fiist.

  • 8.7. DIFFERENZIERBARE ABBILDUNGEN 75

    Andererseits, hat man Differentiale ℓi von fi im Punkt x0, so hat man auch,

    dass L =

    ℓ1...ℓm

    die obige Gleichung erfüllt und sich als Differential von von f

    ergibt.

    Satz 8.7.4 (Stetigkeit differenzierbarer Abbildungen)Ist die Abbildung f : U → V im Punkt x0 differenzierbar, so ist sie im Punktx0 stetig.

    Beweis. Der Beweis ist eine wörtliche Wiederholung des Beweises von Satz8.3.10.

    Definition 8.7.5 (Jacobimatrix)Wählt man eine Basis in den Räumen Rn,Rm aus, so wird dadurch dem Diffe-rential eine Matrix zugeordnet. Bestehen diese Basen jeweils aus den Standard-einheitsvektoren, so ist zugehörige Matrix gegeben durch die ersten partiellenAbleitungen der Komponentenfunktionen

    ∂e1f1(x0) . . . ∂enf1(x0)...

    . . ....

    ∂e1fm(x0) . . . ∂enfm(x0)

    und wird als Jacobimatrix bezeichnet. Wir schreiben dafür f ′(x0).

    Wir benötigen nun ein weiteres Konzept aus der Linearen Algebra, den Begriffder Norm einer linearen Abbildung (oder auch einer Matrix). Wir verallgemei-nern das Konzept der Norm im Dualraum V ′.

    Definition 8.7.6 (Norm für lineare Abbildungen)Es seien (V, ‖ · ‖V ), (W, ‖ · ‖W ) Banachräume. Die Menge

    {

    L : V → W∣∣∣ L ist stetig und linear

    }

    werde mit L(V ;W ) bezeichnet. Wir definieren für L ∈ L(V ;W ) die Norm

    ‖L‖L(V ;W ) = sup{

    ‖Lx‖W∣∣∣ ‖x‖V ≤ 1

    }

    .

    Wir nennen L auch Operator und ‖ · ‖L(V ;W ) Operatornorm.

  • 76 KAPITEL 8. DIFFERENTIALRECHNUNG

    Aufgabe 8.7.7 (Norm für stetigen linearen Abbildungen)‖ · ‖L(V ;W ) ist eine Norm auf dem Raum aller stetigen linearen AbbildungenV → W , damit gilt

    ‖Lv‖W ≤ ‖L‖L(V ;W )‖v‖V .

    Satz 8.7.8 (Banachraum von Operatoren)(L(V ;W ), ‖ · ‖L(V ;W )) ist ein Banachraum.

    Beweis. Wir folgen dem Beweis, dass (V ′, ‖ · ‖V ′) ein Banachraum ist. Offen-sichtlich ist L(V ;W ) ein linearer Raum. Die Vollständigkeit wird wie im Fall derVollständigkeit von V ′ gezeigt.

    Damit können wir die Ableitung Df einer Abbildung f : U → W mit U ⊂ Voffen, (V, ‖ · ‖V ), (W, ‖ · ‖W ) Banachräume als Abbildung

    Df : U → L(V ;W )

    auffassen.

    Definition 8.7.9 (Stetig differenzierbar, höhere Ableitungen)Sind (V, ‖ · ‖V ), (W, ‖ · ‖W ) Banachräume, U ⊂ V offen und f : V →W sei diffe-renzierbar. Ist Df : U → L(V ;W ) stetig, so nennen wir f stetig differenzierbar.Ist Df : U → L(V ;W ) differenzierbar, so sprechen wir von einer zweimal dif-ferenzierbaren Abbildung. Die zweite Ableitung D2f(x0) ist nun ein Elementin L(V ;L(V ;W )), D2f : U → L(V ;L(V ;W )). Dies kann nun iteriert werdenund wir können von k-fach differenzierbaren Abbildungen sprechen, beachteDkf : U → L(U ;Lk−1(V ;W )), wobei wir iterativ definieren

    L1(V ;W ) = L(V ;W ), für k ≥ 2 : Lk(V ;W ) = L(V ;Lk−1(V ;W )).

    Es wird eine wichtige Aufgabe sein, die Räume Lk(V ;W ) richtig zu interpretie-ren. Wir haben folgende wichtige Rechenregeln.

    Satz 8.7.10 (Kettenregel)Es seien (V, ‖ · ‖V ), (W, ‖ · ‖W ), (Z, ‖ · ‖Z) Banachräume, U ⊂ V , Y ⊂ Wseien offene Teilmengen, f : U → V sei im Punkt x0 ∈ U differenzierbar,f(x0) = y0 ∈ Y und g : Y → Z sei in y0 differenzierbar. Dann gibt es ein δ > 0,so dass g ◦ f auf Bδ(x0) definiert ist und g ◦ f ist im Punkt x0 differenzierbarund es gilt für h ∈ V

    D(g ◦ f)(x0)h = Dg(y0)Df(x0)h.

    Beweis. Der Beweis folgt dem von Satz 8.3.28 praktisch wörtlich.

  • 8.7. DIFFERENZIERBARE ABBILDUNGEN 77

    Satz 8.7.11 (Allgemeiner Mittelwertsatz)Es seien (V, ‖ · ‖V ), (W, ‖ · ‖) Banachräume und U ⊂ Rn offen, f : U → Wstetig differenzierbar, es seien x,y ∈ U , so dass S(x,y) ⊂ U . Dann gilt mit

    M = sup{

    ‖Df(x + t(y − x))‖L(V ;W )∣∣∣ t ∈ [0, 1]

    }

    ‖f(y) − f(x)‖W ≤M‖x − y‖V .

    Bevor wir den Beweis beginnen formulieren wir noch ein Resultat, das aus demBeweis von Satz 8.2.15 folgt.

    Lemma 8.7.12 (Lipschitzstetigkeit von Kurven)Ist γ : [a, b] → V eine differenzierbare Kurve mit ‖γ′(t)‖V ≤ M für alle t ∈ (a, b),dann ist

    ‖γ(b) − γ(a)‖V ≤M(b− a).

    Wir beweisen zunächst das Lemma.

    Beweis. Sei ε > 0 gegeben, δ > 0 so gewählt wie im Beweis von Satz 8.2.15 überdas Kriterium der Rektifizierbarkeit angegeben. Nun folgt für |t − t′| < δ und ξzwischen t, t′, dass ∥

    ∥∥∥

    γ(t) − γ(t′)t− t′ − γ

    ′(ξ)

    ∥∥∥∥

    V

    < ε.

    Ist a = t0 < · · · < tn = b eine Zerlegung von [a, b] der Feinheit ∆ < δ undM = sup

    {

    ‖γ′(t)‖V∣∣∣ t ∈ [a, b]

    }

    , so gilt für ξi ∈ (ti, ti+1)

    ‖γ(b) − γ(a)‖V =∥∥∥∥∥

    n−1∑

    i=0

    γ(ti+1) − γ(ti)∥∥∥∥∥

    V

    ≤n−1∑

    i=0

    ‖γ(ti+1) − γ(ti)‖V

    =

    n−1∑

    i=0

    ‖γ(ti+1) − γ(ti) − γ′(ξi)(ti+1 − ti) + γ′(ξi)(ti+1 − ti)‖V

    ≤n−1∑

    i=0

    (‖γ(ti+1) − γ(ti) − γ′(ξi)(ti+1 − ti)‖V + ‖γ′(ξi)(ti+1 − ti)‖V )

    ≤n−1∑

    i=0

    |ti+1 − ti|∥∥∥∥

    γ(ti+1) − γ(ti)ti+1 − ti

    − γ′(ξi)∥∥∥∥

    V

    +n−1∑

    i=0

    ‖γ′(ξi)‖V (ti+1 − ti)

    ≤n−1∑

    i=0

    ε(ti+1 − ti) +Mn−1∑

    i=0

    (ti+1 − ti)

    = ε(b− a) +M(b − a).

  • 78 KAPITEL 8. DIFFERENTIALRECHNUNG

    Da dies für alle ε > 0 gilt, folgt

    ‖γ(b) − γ(a)‖V ≤M(b− a).

    Wir kommen nun zum Beweis des eigentlichen Satzes.

    Beweis von Satz 8.7.11. Wir betrachten für ξ = y − x die Hilfsfunktion

    G(t) = f(x0 + tξ) : [0, 1] → W.

    G : R→W ist differenzierbar, die Ableitung ist (Begründung wie zuvor)G′(t)h = Df(x0 + tξ)hξ.

    Nun ist nach Lemma 8.7.12 für ein τ ∈ (0, 1)

    ‖G(1) −G(0)‖W ≤ sup{

    ‖G′(τ)‖W∣∣∣ τ ∈ [0, 1]

    }

    ,

    wegen der Kompaktheit von [0, 1] und der Stetigkeit von ‖G′‖W gibt es ein τ0 ∈[0, 1] mit

    ‖G(1) −G(0)‖W ≤ ‖G′(τ0)‖W .

    Also haben wir

    ‖f(x0 + ξ) − f(x0)‖W ≤ ‖Df(x + τξ)‖L(V ;W )‖ξ‖V .

    Daraus folgt die Aussage.

    Korollar 8.7.13 (Konstante Abbildung)Sind (V, ‖ · ‖V ) und (W, ‖ · ‖W ) Banachräume, U ⊂ V offen und f : U → Wdifferenzierbar, Dfv = 0 für alle v ∈ U , dann ist f konstant.

    8.8 Multilineare Abbildungen

    In diesem Abschnitt wollen wir die iterierten linearen Abbildungen, d.h. die Ele-mente in Lk(V ;W ), mit multilinearen Abbildungen identifizieren.

  • 8.8. MULTILINEARE ABBILDUNGEN 79

    Definition 8.8.1 (Multilineare Abbildungen)Es seien (V j, ‖ · ‖Vj ), (W, ‖ · ‖W ), j = 1, . . . , k Banachräume, wir setzen

    V = V1 × · · · × Vk.

    Man beachte, dass V auf natürliche Weise zum Banachraum wird. Eine Abbil-dung

    M : V → Wheißt k-linear von V nach W , wenn M in jeder Komponente linear ist. Eine Ab-bildung heißt multilinear, wenn es ein k ∈ N gibt, so dass die Abbildung k-linearist. Mk(V ;W ) bezeichnen wir die Menge der stetigen, k-linearen Abbildungen.

    Satz 8.8.2 (Stetigkeit)Eine k-lineare Abbildung

    Mk : Vk →W

    ist genau dann stetig, wenn es eine positive reelle Konstante K gibt mit

    ‖Mk(v1, . . . ,vk)‖W ≤ K‖v1‖V · · · · · ‖vk‖V .

    Beweis. Wir wissen aus den Übungen, dass für lienare Abbildungen Stetigkeitbei 0 und Stetigkeit äquivalent sind. Diese Aussage überträgt sich sofort auf mul-tilineare Abbildungen. Aus der angegebenen Bedingung folgt aber die Stetigkeitin 0 sofort.Aus der Stetigkeit in 0 folgt auch die Existenz dieser Konstanten. Wir werdendies in den Übungen nochmals nachprüfen.

    Nun sei (V, ‖ · ‖V ) ein Banachraum. Der zentrale Satz dieses Abschnitts iden-tifiziert die Elemente aus Lk(V ;W ) mit k-linearen Abbildungen. Dazu noch eineVorüberlegung:

    E : V × L(V ;W ) : (v,L) 7→ Lvist linear in jeder Komponente und stetig, denn wir haben gesehen, dass

    ‖Ev‖W ≤ ‖L‖L(V ;W )‖vV .Ist nun A : V → L(V ;W ) stetig und linear, v ∈ V , so ist A(v) ∈ L(V ;W ) undwir können die stetige und lineare Abbildung

    ṽ 7→ A(v)(ṽ)betrachten. Damit haben wir eine Abbildung

    B(v, ṽ) = A(v)(ṽ).

    Nun ist B bilinear und wegen

    ‖B(v, ṽ)‖W = ‖A(v)(ṽ)‖W ≤ ‖A(v)‖L(V ;W )‖ṽ‖V ≤ ‖A‖L(V ;L(V ;W ))‖v‖V ‖ṽ‖V

  • 80 KAPITEL 8. DIFFERENTIALRECHNUNG

    stetig, also haben wir eine Abbildung

    L2(V ;W ) → M2(V ;W ).

    Da für festes v ∈ V und eine gegebene bilineare Abbildung M2 ∈M2(V ;W ) gilt

    L(V ;W ) ∋ M2(v, ·) : V →W

    und damit v 7→ M2(v, ·) eine Abbildung in L(V ;L(V ;W )) ist, die durch obigeKonstruktion auf M2 abgebildet wird. Also sind M

    2(V ;W ) und L2(V ;W ) kano-nisch isomorph. Durch Induktion beweist man den folgenden Satz.

    Satz 8.8.3 (Isomorphie)Die Räume Lk(V ;W ) und Mk(V ;W ) sind kanonisch isomorph (als Ba-nachräume).

    8.9 Der Fixpunktsatz von Banach

    In diesem kurzen Abschnitt wollen wir nur einen Satz beweisen, der allerdings sobedeutend ist, dass wir ihm einen ganzen Abschnitt widmen wollen. Dieser Satzwird oft als Fixpunktsatz von Banach zitiert.

    Satz 8.9.1 (Banach)Sei (X, d) ein vollständiger metrischer Raum, T : X → X eine Abbildung, dieüberall definiert sei, so dass es ein 0 ≤ θ < 1 gibt, so dass für je zwei Punktex, y ∈ X gilt

    d(Tx, Ty) ≤ θd(x, y).Dann gibt es genau einen Punkt x0 ∈ X mit der Eigenschaft

    Tx0 = x0.

    Definition 8.9.2 (Fixpunkt)1. Ein Punkt mit der Eigenschaft Tx0 = x0 heißt Fixpunkt der AbbildungT .

    2. Eine Abbildung mit der im Satz angegebenen Eigenschaft d(Tx, Ty) ≤θd(x, y) wird als Kontraktion bezeichnet, die Zahl 0 ≤ θ < 1 als Kontrak-tionszahl.

    Beweis. Wir beweisen den Fixpunktsatz von Banach in drei Schritten, zunächstzeigen wir die Eindeutigkeit des Fixpunktes, dann identifizieren wir den

    ”verdächti-

    gen“ Punkt, danach zeigen wir, dass dieser Punkt tatsächlich ein Fixpunkt ist.