Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen...

137
Differential- und Integralrechnung MSE SS 2012 H. Egger und M. Schlottbom 18. Juli 2012

Transcript of Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen...

Page 1: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

Differential- und Integralrechnung MSE

SS 2012

H. Egger und M. Schlottbom

18. Juli 2012

Page 2: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

2

Page 3: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

Inhaltsverzeichnis

1 Differentialrechnung in einer Variablen 1

1.1 Die Ableitung reeller Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Rechenregeln für die Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.3 Differenzierbarkeit von Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . 6

1.4 Extrema und Mittelwertsätze . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.5 Höhere Ableitungen, Kurvendiskussion . . . . . . . . . . . . . . . . . . . . . . . 10

1.6 Taylorentwicklung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

1.7 Interpolation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

1.8 Fixpunkt- und Newtonverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2 Integralrechnung in einer Variablen 27

2.1 Das Riemann-Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2.2 Hauptsatz der Differential- und Integralrechnung . . . . . . . . . . . . . . . . . . 32

2.3 Wichtige Integrationstechniken . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

2.4 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

2.5 Numerische Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

3 Anwendungen der Integralrechnung 49

3.1 Kurven und Kurvenintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

3.2 Mantelfläche und Volumen von Rotationskörpern . . . . . . . . . . . . . . . . . 55

Page 4: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

ii INHALTSVERZEICHNIS

4 Differentialrechnung in mehreren Variablen 59

4.1 Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

4.2 Differenzierbarkeit von Funktionen mehrerer Variablen . . . . . . . . . . . . . . 63

4.3 Rechenregeln für Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

4.4 Höhere Ableitungen, Satz von Schwarz . . . . . . . . . . . . . . . . . . . . . . . 70

5 Anwendungen der Differentialrechnung 75

5.1 Elementare Differentialoperatoren . . . . . . . . . . . . . . . . . . . . . . . . . . 75

5.2 Mittelwertsatz, Satz von Taylor, Kurvenintegrale . . . . . . . . . . . . . . . . . 78

5.3 Extrema von Funktionen mehrerer Veränderlicher . . . . . . . . . . . . . . . . . 83

5.4 Hauptsätze über Implizite und Inverse Funktionen . . . . . . . . . . . . . . . . . 93

6 Integration in mehreren Dimensionen 101

6.1 Integralbegriff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

6.2 Eigenschaften, Kriterien für Integrierbarkeit . . . . . . . . . . . . . . . . . . . . 103

6.3 Das Integral über allgemeinere Mengen . . . . . . . . . . . . . . . . . . . . . . . 105

6.4 Parameterabhängige Integrale, Satz von Fubini . . . . . . . . . . . . . . . . . . . 107

6.5 Integration über Normalbereiche . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

6.6 Transformationssatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

7 Integralsätze 117

7.1 Kurvenintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

7.2 Sätze von Green und Gauß in 2D . . . . . . . . . . . . . . . . . . . . . . . . . . 120

7.3 Oberflächenintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

7.4 Sätze von Gauß und Stokes in 3D . . . . . . . . . . . . . . . . . . . . . . . . . . 127

Page 5: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

INHALTSVERZEICHNIS iii

Vorbermerkungen

Als Grundlage für die Vorbereitung dieser Vorlesung dienten die Bücher

• R. Ansorge und H.-J. Oberle: Mathematik für Ingenieure, Band 1, 3te Auflage, Wiley-VCF, 2000.

• K. Meyberg und P. Vachenhauer: Höhere Mathematik, Band 1, Springer, 1999.

Reichliches Übungsmaterial kann in den Bänden

• Ansorge, Oberle, Übungsaufgaben

• Viele Autoren, Mathematik, Spektrum, 2010.

gefunden werden. Als weiterführende Literatur zu den Themenbereichen Analysis, Lineare Al-gebra und Numerik sei auf die Bücher

• Königsberger, Analysis,

• Fischer, Lineare Algebra,

• W. Dahmen und A. Reusken: Numerische Mathematik, 2te Auflage, Springer, 2008.

verwiesen.

Im folgenden Skript werden die grundlegenden Begriffe und Aussagen der Differential- und Inte-gralrechnung in einer und mehreren Dimensionen behandelt. Theoretische Resultate werden anBeispielen veranschaulicht, und die tatsächliche Durchführung komplexer Rechnungen mittelsnumerischer Methoden wird anhand verschiedener Aufgabenstellungen behandelt.

Page 6: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

iv INHALTSVERZEICHNIS

Page 7: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

1 Differentialrechnung in einer Variablen

1.1 Die Ableitung reeller Funktionen

Motivation. Für stetige Funktionen gilt f(x) → f(x0) für x → x0. Die Funktion f lässt sichalso in der Nähe von x0 durch die konstante Funktion x 7→ f(x0) (ein Polynom 0-ten Grades)approximieren. Wir schreiben hierfür auch kurz

f(x) ≈ f(x0) für x ≈ x0.

Um auch das Änderungsverhalten von f(x) bei Veränderung von x abzubilden, kann manfolgenden verbesserten Ansatz wählen:

f(x) ≈ f(x0) + c (x− x0) für x ≈ x0.

Der Parameter c ist dabei so zu bestimmen, dass die Funktion f in der Nähe von x0 gut durchdas Polynom ersten Grades f(x0) + c (x− x0) angenähert wird. Für fixes x 6= x0 könnte man cetwa durch den Differenzenquotienten

c(x) :=f(x)− f(x0)

x− x0

festlegen. Die resultierende affin-lineare Funktion ist eine Sekante an den Funktionsgraphenvon f . Um für x ≈ x0 gute Näherungen zu erhalten, sollte man auch x ≈ x0 verwenden. Diesführt im Grenzfall auf den Begriff der Ableitung.

Approximationen einer reellen Funktion

Page 8: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

2 Differentialrechnung in einer Variablen

1.1. Definition (Ableitung). (i) Sei f : (a, b)→ R und x0 ∈ (a, b). Falls der Grenzwert

limx→x0

f(x)− f(x0)

x− x0

=: f ′(x0)

existiert, so heißt die Funktion f im Punkt x0 differenzierbar und f ′(x0) heißt Ableitung derFunktion f an der Stelle x0.

(ii) Existiert die Ableitung f ′(x0) für alle x0 ∈ (a, b), so heißt f differenzierbar auf (a, b)(oder einfach nur differenzierbar). Die Funktion f ′ : (a, b)→ R, x 7→ f ′(x) heißt Ableitungs-funktion oder kurz Ableitung von f .

1.2. Bemerkungen. (a) Die Ableitung f ′(x0) ist der Limes der Differenzenquotienten c(x) fürx→ x0 und wird als Differentialquotient bezeichnet.

(b) Als Symbol für die Ableitung verwendet man auch dfdx

(x0) oder ddxf(x)|x=x0 .

(c) Der Ausdruck f ′(x0)dx ≈ f(x0 + dx)− f(x0) beschreibt den Funktionszuwachs bei Verän-derung von x und wird als totales Differential bezeichnet.

(d) Mit h = x− x0 und c = f ′(x0) gilt

limh→0

f(x0 + h)− f(x0)− c hh

= 0.

Eine Funktion f : (a, b) → R ist genau dann differenzierbar in x0, wenn es eine Zahl c ∈ Rgibt, sodass obiger Grenzwert gleich Null ist; dies Bedeutet, dass sich die Differenz d(h) :=f(x0 + h) − f(x0) gut durch die lineare Funktion l(h) := ch beschreiben lässt. Die Ableitungliefert also eine Linearisierung von f um x0.

1.3. Beispiele. (a) Wir betrachten die konstante Funktion f : R → R, x 7→ c für ein c ∈ R.Dann ist

f(x)− f(x0)

x− x0

=c− cx− x0

= 0x→x0−−−→ 0.

Also ist jede konstante Funktion differenzierbar auf ganz R mit Ableitung f ′(x) = 0 für alle x.

(b) Betrachte f : R→ R, x 7→ x. Dann ist

f(x)− f(x0)

x− x0

=x− x0

x− x0

= 1x→x0−−−→ 1.

Somit ist f ′(x0) = 1 für jedes x0 ∈ R. Ähnlich zeige man, dass jede affin-lineare Funktionf : x 7→ ax+ b differenzierbar mit Ableitung f ′(x) = a ist.

(c) Sei f : R→ R gegeben durch x 7→ x2. Dann gilt

f(x0 + h)− f(x0)

h=

(x0 + h)2 − x20

h=

2x0h+ h2

h

h→0−−→ 2x0.

Page 9: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

1.1 Die Ableitung reeller Funktionen 3

Also ist f in jedem Punkt x0 ∈ R differenzierbar und f ′(x0) = 2x0.

(d) Für die Exponentialfunktion exp : R→ R, x 7→ exp(x) gilt

exp(x+ h)− exp(x)

h=

exp(x)(exp(h)− 1)

h= exp(x)

∞∑k=1

1

k!hk−1 h→0−−→ exp(x).

Hier wurde verwendet, dass die Potenzreihe auf R konvergiert und aufgrund der Stetigkeit gegen1 konvergiert (siehe Übung). Also ist die Exponentialfunktion auf ganz R differenzierbar, undes gilt exp′(x) = exp(x).

Die Differenzierbarkeit einer Funktion zieht auch deren Stetigkeit nach sich.

1.4. Satz. Sei f : (a, b)→ R differenzierbar in x0 ∈ (a, b). Dann ist f auch stetig in x0.

Beweis. Nach Definition der Differenzierbarkeit gilt

f(x) = f(x0) + f(x)− f(x0)− f ′(x0)(x− x0)︸ ︷︷ ︸→0

+ f ′(x0)(x− x0)︸ ︷︷ ︸→0

x→x0−−−→ f(x0).

Wie das folgende Beispiel zeigt, gilt die Umkehrung nicht.

1.5. Beispiel (Betragsfunktion). Wir betrachten die Betragsfunktion f : R → R, x 7→ |x|.Für x0 = 0 gilt

f(x0 + h)− f(x0)

h=|h|h

=

{1 für h > 0,−1 für h < 0.

Also existiert kein Grenzwert der Differenzenquotienten für h → 0 und die Betragsfunktionist in x0 = 0 daher nicht differenzierbar. Das Beispiel zeigt sogar, dass eine differenzierbareFunktionen keinen Knick haben kann, also in diesem Sinne glatt ist.

1.6. Bemerkung (Einseitige Differenzierbarkeit). Existieren die einseitigen Grenzwerte

limx↗x0

f(x)− f(x0)

x− x0

bzw. limx↘x0

f(x)− f(x0)

x− x0

so heißt f links- bzw. rechtsseitig differenzierbar in x0. Die Betragsfunktion ist also in x0 sowohlvon links als auch von rechts differenzierbar. Man kann zeigen: Eine Funktion ist differenzierbarin x0 genau dann, wenn sie links- und rechtsseitig differenzierbar ist und die entsprechendenGrenzwerte (Ableitungen) übereinstimmen.

Page 10: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

4 Differentialrechnung in einer Variablen

1.2 Rechenregeln für die Ableitung

Die folgenden Regeln erlauben, die Ableitungen zusammengesetzter Funktionen aus Ableitun-gen ihrer Bestandteile zu ermitteln.

1.7. Satz. Seien f, g : (a, b)→ R differenzierbar im Punkt x0 ∈ (a, b). Dann gelten für dieAbleitungen die folgenden Rechenregeln:

(a) Linearität: Die Funktion (αf + βg) : (a, b) → R, x 7→ αf(x) + βg(x) ist für alleα, β ∈ R differenzierbar in x0 mit

(αf + βg)′(x0) = αf ′(x0) + βg′(x0).

(b) Produktregel: Das Produkt f · g : (a, b)→ R, x 7→ f(x)g(x) ist differenzierbar in x0

mit(f · g)′(x0) = f ′(x0)g(x0) + f(x0)g′(x0).

(c) Quotientenregel: Falls g(x0) 6= 0 ist, dann ist f/g : x 7→ f(x)/g(x) in einer Umge-bung von x0 wohldefiniert und in x0 differenzierbar mit

(f/g)′(x0) =f ′(x0)g(x0)− f(x0)g′(x0)

g(x0)2.

(d) Kettenregel: Es gelte f(a, b) ⊂ (c, d) und h : (c, d)→ R, y 7→ h(y) sei differenzierbarim Punkt y0 = f(x0). Dann ist die Hintereinanderausführung h ◦ f : (a, b) → R,x 7→ h(f(x)) differenzierbar in x0 und es gilt

(h ◦ f)′(x0) = h′(f(x0))f ′(x0) = h′(y0)f ′(x0).

Hier wird mit AB das Matrix-Matrix Produkt bezeichnet!

(e) Umkehrfunktion: Ist f streng monoton auf (a, b) und f ′(x0) 6= 0, so ist die Um-kehrfunktion f−1 : f(a, b) → (a, b), f(x) 7→ x streng monoton und differenzierbar ander Stelle f(x0) mit

(f−1)′(f(x0)) =1

f ′(x0).

Beweis. (a) und (b), siehe Übung.(c) Da f und g in x0 auch stetig sind, gilt

f(x)g(x)− f(x0)

g(x0)

x− x0

=f(x)− f(x0)

x− x0

1

g(x)+

f(x0)

g(x)g(x0)

g(x0)− g(x)

x− x0

x→x0−−−→ f ′(x0)

g(x0)− f(x0)g′(x0)

g(x0)2.

Page 11: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

1.2 Rechenregeln für die Ableitung 5

(d) Definiere für y0 = f(x0)

d : (c, d)→ R, y 7→

{h(y)−h(y0)

y−y0 , y 6= y0,

h′(y0), y = y0.

Dann ist d stetig in y0 und h(y)− h(y0) = d(y)(y − y0). Wegen der Stetigkeit von f gilt weitery = f(x)→ y0 falls x→ x0. Also

h(f(x))− h(f(x0))

x− x0

=d(y)(f(x)− f(x0))

x− x0

x→x0−−−→ h′(f(x0))f ′(x0)

(e) folgt aus (d) durch Differenzieren von x = f−1(f(x)); siehe Übung.

Wir veranschaulichen die Anwendung obiger Regeln anhand einiger kurzer Beispiele.

1.8. Beispiele. (a) Für jedes n ∈ N gilt (xn)′ = nxn−1. Dies folgt aus der Produktregel mittelsvollständiger Induktion.

(b) Für ein Polynom p(x) =∑n

k=0 akxk gilt p′(x) =

∑nk=1 akkx

k−1. Polynome sind also auf ganzR differenzierbar und ihre Ableitungen sind wieder Polynome mit vermindertem Grad.

(c) Sei f : R→ R, x 7→ sin(x) cos(x). Dann gilt nach der Produktregel

f ′(x) = cos(x)2 − sin(x)2 sin2 + cos2=1= 1− 2 sin(x)2.

(d) Die Tangensfunktion tan : (−π/2, π/2)→ R, x 7→ tan(x) := sin(x)cos(x)

ist nach der Quotienten-regel differenzierbar mit

tan′(x) =cos(x) cos(x) + sin(x) sin(x)

cos(x)2=

1

cos(x)2.

(e) Die Funktion f : R → R, x 7→ exp(x)2 lässt sich als Hintereinanderausführung f = ((·)2 ◦exp) schreiben. Sie ist nach der Kettenregel differenzierbar auf ganz R und es gilt

f ′(x) = ((·)2)′(exp(x)) exp′(x) = 2 exp(x) exp(x) = 2 exp(x)2.

Unter Ausnutzung der Potenzregeln könnte man die Funktion auch umschreiben in f(x) =exp(2x) und als Hintereinanderausführung f = exp ◦(2·) betrachten. Mit der Kettenregel erhältman also

f ′(x) = (exp′)(2x)(2·)′(x) = exp(2x)2 = 2 exp(x)2.

(f) Da ln(y) = exp−1(y) gilt nach den Regeln für die Ableitung der Umkehrfunktion

ln′(y) = (exp−1)′(y)y=exp(x)

=1

exp(x)=

1

y, y > 0.

(g) Die Potenzen xα sind für x > 0 und α ∈ R definiert durch xα := exp(α ln(x)). Fürf : (0,∞)→ R, x 7→ xα gilt mit Ketten- und Produktregel

f ′(x0) =d

dx(exp(α ln(x)))|x=x0 = exp′(α ln(x)))α

1

x= αxα−1.

Page 12: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

6 Differentialrechnung in einer Variablen

1.3 Differenzierbarkeit von Potenzreihen

Wir haben in vorigem Beispiel gesehen, dass Polynome auf ganz R differenzierbar sind undihre Ableitung durch gliedweises Differenzieren bestimmt werden kann. Weiter oben habenwir Potenzreihen als Verallgemeinerung von Polynomen betrachtet und dazu verwendet, umelementare Funktionen (z.b. exp, sin, ...) zu definieren. Potenzreihen sind innerhalb des Kon-vergenzkreises stetig und, wie der folgende Satz zeigt, sogar differenzierbar.

1.9. Satz. Die Potenzreihe P (x) :=∑∞

k=0 ak(x−x0)k konvergiere für |x−x0| < R absolut.Dann ist P für jedes x mit |x− x0| < R differenzierbar. Weiters gilt

P ′(x) =∞∑k=1

akk(x− x0)k−1

und die Potenzreihe für die Ableitung konvergiert wiederum absolut für |x− x0| < R.

Beweis. Siehe Königsberger I, S. 159. Nach dem Wurzelkriterium gilt lim supk→∞k√|ak| ≤

1/R und somit auch lim supk→∞k√k|ak| = lim supk→∞

k√|ak| ≤ 1/R, was die Konvergenz der

Potenzreihe für die Ableitung belegt.

1.10. Beispiel. Durch gliedweises Differenzieren erhält man

exp′(x) =∞∑k=1

1

k!kxk−1 =

∞∑k=1

1

(k − 1)!xk−1 =

∞∑k=0

1

kxk = exp(x).

In ähnlicher Weise zeigt man über Potenzreihen die Formeln sin′(x) = cos(x), cos′(x) = − sin(x)sowie sinh′(x) = cosh(x), cosh′(x) = sinh(x); siehe Übung.

1.11. Beispiel. Die Funktionen sin, cos, tan sowie die Hyperbelfunktionen sinh(x) = ex−e−x

2,

cosh(x) = ex+e−x

2sind auf Teilintervallen von R streng monoton und daher invertierbar. Die

folgenden Formeln ergeben sich durch Differenzieren der Potenzreihen sowie durch Anwendender Rechenregeln für Ableitungen; siehe Übung.

f(x) f ′(x) f−1(y) (f−1)′(y)sin(x) cos(x) arcsin(y) 1√

1−y2(Arcus-Sinus)

cos(x) − sin(x) arccos(y) −1√1−y2

(Arcus-Cosinus)

tan(x) 1 + tan(x)2 arctan(y) 11+y2

(Arcus-Tangens)sinh(x) cosh(x) arsinh(y) 1√

y2+1(Area-Sinus hyperbolicus)

cosh(x) sinh(x) arcosh(y) 1√y2−1

(Area-Cosinus hyperbolicus)

Page 13: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

1.4 Extrema und Mittelwertsätze 7

1.4 Extrema und Mittelwertsätze

Wir beschäftigen uns im kommenden Abschnitt mit der Suche nach Extremalstellen von Funk-tionen einer Variablen. Hierzu benötigen wir folgende

1.12. Definition. Eine Funktion f : D ⊂ R → R besitzt in x0 ∈ D ein lokales Maximum(Minimum; Extremum), wenn es ein δ > 0 gibt, sodass

f(x0) ≥ f(x) (f(x0) ≤ f(x)) für alle x ∈ D mit |x− x0| < δ.

Gelten die Ungleichungen mit > bzw < für x 6= x0, dann spricht man von striktem lokalemExtremum. Ein Extremum heißt global, wenn die Ungleichung für alle x ∈ D gilt.

Eine einfache Charakterisierung lokaler Extremstellen im inneren des Definitionsgebietes bietetder folgende Satz:

1.13. Notwendiges Kriterium für lokales Extremum: Die Funktion f : (a, b) → Rbesitze in x0 ∈ (a, b) ein lokales Extremum und sei dort differenzierbar. Dann gilt f ′(x0) = 0.

Beweis. Sei x0 Stelle eines lokalen Minimums ist. Für h > 0 hinreichend klein erhält man,dass f(x0+h)−f(x)

h≥ 0 und daher f ′(x0) ≥ 0. Für h < 0 gilt andererseits f(x0+h)−f(x0)

h≤ 0 und

daher f ′(x0) ≤ 0. Also ist f ′(x0) = 0. Die Aussage für das Maximum folgt analog.

1.14. Bemerkungen. (a) Die Aussage gilt auch für allgemeinere Definitionsmenge D ⊂ Rund f : D → R, falls x0 ein innerer Punkt von D ist. Dann gibt es nämlich ein Intervall(a, b) ⊂ D mit x0 ∈ (a, b) und wir können f auf (a, b) einschränken.

(b) Die Funktion f : [0, 1] → R, x 7→ x besitzt bei x = 0 ein lokales (und globales) Minimum.Es gilt aber f ′(0) = 1. Man beachte, dass x = 0 hier kein innerer Punkt der Menge [0, 1] ist.Lokale Extrema können also auch am Rand liegen!

(c) Die Funktion f : R → R, x 7→ x3 besitzt keine lokalen Extrema, aber f ′(0) = 3x2|x=0 = 0.Die Bedingung f ′(x0) = 0 ist also notwendig, aber nicht hinreichend, für das Vorliegeneines lokalen Extremums!

(d) Die Betragsfunktion | · | : R → R, x 7→ |x| besitzt bei x0 = 0 ein lokales (sogar globales)Minimum. Sie ist dort aber nicht differenzierbar! Differenzierbarkeit ist also nicht notwendigfür das Vorliegen eines lokalen Extremums.

Aus dem notwendigen Kriterium für Extgremalstellen kann man flgende Sachverhalte herleiten.

Page 14: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

8 Differentialrechnung in einer Variablen

1.15. Mittelwertsätze.Sei f : [a, b]→ R stetig auf [a, b] und differenzierbar auf (a, b). Dann gilt:

(a) Satz von Rolle:Ist f(a) = f(b). Dann gibt es ein ξ ∈ (a, b) mit f ′(ξ) = 0.

(b) Erster Mittelwertsatz:Es gibt ein ξ ∈ (a, b) mit f ′(ξ) = f(b)−f(a)

b−a .

(c) Zweiter Mittelwertsatz:Ist weiters g : [a, b]→ R stetig auf [a, b] und differenzierbar auf (a, b) mit g′(x) 6= 0 für allex ∈ (a, b). Dann existiert ein ξ ∈ (a, b) mit f ′(ξ)

g′(ξ)= f(b)−f(a)

g(b)−g(a).

Beweis. (a) Falls f konstant ist, gilt f ′(x) = 0 für alle x ∈ (a, b). Andernfalls gibt es einx ∈ (a, b) mit f(x) 6= f(a). Nach dem Satz vom Maximum und Minimum nimmt f auf [a, b]seine Extremwerte an, und für ein Extremum ξ gilt somit f(ξ) 6= f(a) = f(b) und somitξ ∈ (a, b). Die notwendige Bedingung erster Ordnung liefert die Aussage.(b) Man wende den Satz von Rolle auf g(x) := f(x)− f(b)−f(a)

b−a (x− a) an.(c) siehe Übung.

Satz von Rolle Mittelwertsatz

1.16. Bemerkung (Verallgemeinerter Satz von Rolle). (i) Ist f(a) = f(c) = f(b) füra < c < b und f stetig differenzierbar auf (a, b), dann gibt es Stellen ξ1 ∈ (a, c) und ξ2 ∈ (c, b)mit f ′(ξ1) = f ′(ξ2) = 0. Ist nun f sogar zweimal stetig differenzierbar, dann folgt aus dem Satzvon Rolle auf die Ableitung angewendet, dass es ein ξ ∈ (ξ1, ξ2) ⊂ (a, b) gibt, mit f ′′(ξ) = 0.

(ii) Mit vollständiger Induktion zeigt man folgenden Sachverhalt: Sei f : (a, b)→ R n-mal stetigdifferenzierbar und f(xi) = 0 für (n+ 1) Stellen a ≤ x0 < x1 < . . . < xn ≤ b. Dann gibt es einξ ∈ (a, b) mit f (n)(ξ) = 0.

Wir werden die Mittelwertsätze hauptsächlich als theoretisches Hilfsmittel gebrauchen, umweitere Aussagen herzuleiten. Als erste Folgerungen erhalten wir

Page 15: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

1.4 Extrema und Mittelwertsätze 9

1.17. Kriterien für Monotonie. Sei f : (a, b)→ R differenzierbar. Dann gilt:

(a) f ist monoton steigend (monoton fallend) genau dann, wenn f ′(x) ≥ 0 (bzw f ′(x) ≤ 0)für alle x ∈ (a, b) gilt.

(b) Ist f ′(x) > 0 (f ′(x) < 0) für alle x ∈ (a, b), dann ist f streng monoton steigend (fallend).

(c) f ′(x) = 0 für alle x ∈ (a, b) ist äquivalent zu f(x) = c für ein c ∈ R.

Beweis. (a) ⇒: Aus f(x + h) ≥ f(x) und f(x − h) ≤ f(x) für h > 0 (monoton wachsend)folgt f(x+h)−f(x)

h≥ 0 für alle h 6= 0. Die Ungleichung gilt dann auch für den Grenzwert f ′(x).

(a)⇐ (Umkehrschluss): Angenommen f(x+h) < f(x) für ein h > 0 (nicht monoton wachsend).Dann gibt es nach dem Mittelwertsatz ein x0 ∈ (x, x+ h) mit f ′(x0) = f(x0+h)−f(x0)

h< 0.

(b) Folgt aus dem Satz von Rolle; siehe Übung. (c) Folgt aus (a) mit ≤ und ≥.

1.18. Beispiele zur Monotonie. (a) Es gilt (exp)′(x) = exp(x) > 0 für alle x ∈ R. Nachvorhergehendem Satz ist die Exponentialfunktion also streng monoton wachsend auf ganz Rund besitzt nach den Rechenregeln für die Ableitung eine streng monoton wachsende Umkehr-funktion, nämlich die Logarithmusfunktion. Deren Ableitung wurde oben bereits berechnet.

(b) Die Funktion f : R→ R, x 7→ 11+x2

hat positiven Nenner und ist nach der Quotientenregelsomit differenzierbar auf ganz R mit

f ′(x) =0− 2x

(1 + x2)2= − 2x

(1 + x2)2.

Also ist f streng monoton wachsend für x < 0 und streng monoton fallend für x > 0. Bei x = 0besitzt sie folglich ein globales Maximum. Dieses ist natürlich auch lokales Maximum und esgilt f ′(0) = 0, was aus der Stetigkeit von f ′ und dem Zwischenwertsatz folgt.

Die Mittelwertsätze erlauben auch Aussagen über Grenzwerte stetiger Funktionen zu machen.Mit folgendem Resultat kann man Grenzwerte der Form “ 0

0”, “ ±∞±∞ ” oder auch “0 ·∞” berechnen.

1.19. Regel von L’Hospital Seien −∞ ≤ a < b ≤ ∞, f, g : (a, b) → R differenzierbarund g′(x) 6= 0 für alle x ∈ (a, b). Erfüllen die Grenzwerte

limx↘a

f(x) = limx↘a

g(x) ∈ {0,±∞},

dann gilt

limx↘a

f(x)

g(x)= lim

x↘a

f ′(x)

g′(x)∈ R ∪ {±∞}

falls der rechte Grenzwert (zumindest als uneigentlicher Limes) existiert.Eine entsprechende Aussage gilt auch für den linksseitigen Grenzwert x↗ b.

Page 16: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

10 Differentialrechnung in einer Variablen

Beweis. Fall 1 (a ∈ R und limx↘a f(x) = 0): Definiert man f(a) = g(a) = 0, dann sind fürjedes x ∈ (a, b) die Funktionen f und g auf [a, x] stetig. Aus dem ersten Mittelwertsatz folgt,dass g(x) 6= 0 ist, und der zweite Mittelwertsatz liefert die Behauptung. Die anderen Fällekönnen ähnlich behandelt werden; siehe Übung.

1.20. Beispiel. limx→0 sin(x) = limx→0 x = 0. Anwenden der Regel von L’Hospital liefert

limx→0

sin(x)

xL′Hos.

= limx→0

cos(x)

1= 1.

In ähnlicher Weise berechnet man Grenwerte für exp(x)−1x

oder cos(x)−1x2

. Ein weiteres Beispielfindet sich am Ende des folgenden Abschnittes über Kurvendiskussion.

Das gleiche Ergebnis könnte man auch erhalt, wenn man mit der Potenzreihendarstellung derSinusfunktion arbeitet. Es gilt

limx→0

sin(x)

x= lim

x→0

x− x3

3!+ . . .

x= lim

x→01− x2

3!+ . . . = 1.

Das gliedweise Dividieren ist hier erlaubt, weil alle Reihen absolut konvergieren!

1.5 Höhere Ableitungen, Kurvendiskussion

1.21. Definition. Sei f : (a, b)→ R differenzierbar auf (a, b).

(a) Ist die Abbildung f ′ : (a, b)→ R, x 7→ f ′(x) stetig, so nennt man f stetig differenzierbar.

(b) Existiert der Grenzwert

limx→x0

f ′(x)− f ′(x0)

x− x0

=: f ′′(x0),

so heißt f zweimal differenzierbar in x0. (Insbesondere ist dann f ′ stetig in x0!)

1.22. Bemerkung. Über Rekursion f (k)(x) := ddxf (k−1)(x), f (0)(x) := f(x) kann man Ablei-

tungen beliebiger Ordnung definieren. Die Menge der auf (a, b) k-fach stetig differenzierbarenFunktionen wird dann mit Ck(a, b) bezeichnet; C∞(a, b) ist die Menge der beliebig (unendlich)oft stetig differenzierbaren Funktionen.

1.23. Beispiele. Die Funktionen exp, sin, cos, xn (n ∈ N) sind auf R beliebig oft stetig diffe-renzierbar. Ebenso sind die Funktionen ln(x), xα auf (0,∞) beliebig oft stetig differenzierbar.

Page 17: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

1.5 Höhere Ableitungen, Kurvendiskussion 11

Mit Hilfe der zweiten Ableitung erhalten wir ein

1.24. Hinreichendes Kriterium für lokale Extrema: Die Funktion f : (a, b) → R seiin x0 ∈ (a, b) zweimal differenzierbar und erfülle f ′(x0) = 0 Kriterium erster Ordnung).Ist f ′′(x0) > 0 (f ′′(x0) < 0), so ist x0 Stelle eines strikten lokalen Minimums (Maximums).

Beweis. Falls f ′′(x0) > 0 ist, gilt

limh↘0

f ′(x0 + h)− f ′(x0)

h> 0 und lim

h↘0

f ′(x0 − h)− f ′(x0)

−h> 0,

woraus mit der Stetigkeit von f ′ in x0 folgt, dass f ′(x) < 0 für x ∈ (x0 − δ, x0) und f ′(x) > 0für x ∈ (x0, x0 + δ) für ein hinreichend kleines δ > 0. Also ist f dort streng monoton fallendbzw wachsend, woraus die Aussage für das Minimum folgt. Die Behauptung für das Maximumwird analog gezeigt.

1.25. Bemerkung. Das Vorzeichen der zweiten Ableitung liefert eine Aussage über die Krüm-mung des Graphen einer Funktion. Die Punkte x ∈ (a, b), in denen f ′′(x) > 0 (f ′′(x) < 0) ist,heißen Punkte positiver (negativer) Krümmung. Man veranschauliche sich die Begriffe anhandder Skizze zum folgenden Beispiel.

1.26. Definition (Wendepunkt). Die Funktion f : (a, b) → R sei differenzierbar auf(a, b). Ein lokales Extremum x0 der Ableitung f ′ : (a, b)→ R heißt Wendepunkt von f .

1.27. Bemerkung. Falls f in x0 zweimal differenzierbar ist, so ist ein notwendiges Kriteriumfür das Vorliegen eines Wendepunktes, dass f ′′(x0) = 0 ist. Falls f in x0 dreimal differenzierbarist, dann ist hinreichend für das Vorligen eines Wendepunktes, wenn zusätzlich f ′′′(x0) 6= 0 gilt.

Beispiel (Kurvendiskusion)

Die vorgestellten Begriffe und Aussagen sollen nun kurz anhand eines konkreten Beispiels ver-anschaulicht werden: Wir betrachten hierzu die Funktion f : R→ R, x 7→ x2−1

x2+1.

Stetigkeit: Der Nenner ist stets positiv, und daher die Funktion f als Quotient stetiger Funk-tionen stetig.

Nullstellen: f(x) = 0 gilt genau für x = ±1.

Grenzwerte: Für x→ ±∞ gilt nach zweifachem Anwenden der Regel von L’Hospital

limx→±∞

x2 − 1

x2 + 1= lim

x→±∞

2x

2x= lim

x→∞

2

2= 1.

Page 18: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

12 Differentialrechnung in einer Variablen

Das hätte man natürlich auch durch Erweitern des Bruches herausfinden können.

Differenzierbarkeit: Als Verknüpfung differenzierbarer Funktionen ist f nach dem Quotien-tenkriterium differenzierbar auf ganz R und es gilt

f ′(x) =2x(x2 + 1)− (x2 − 1)2x

(x2 + 1)2=

4x

(x2 + 1)2.

Man sieht relativ leicht, dass f sogar beliebig oft (stetig) differenzierbar ist.

Monotonie: Da f ′(x) > 0 für x > 0 und f ′(x) < 0 für x < 0, ist f streng monoton fallend fürx < 0 und streng monoton wachsend für x > 0. Aus der Grenzwertbetrachtung folgt insbeson-dere, dass f(x) ≤ 1 für alle x ∈ R gilt.

Extrema: Da f ′(x) = 0 genau dann wenn x = 0 gilt, ist x = 0 einzig mögliche Stelle eineslokalen Extremums. Aufgrund des Monotonieverhaltens folgt, dass x0 Stelle des globalen Mi-nimums ist. Dies lässt sich auch durch Berechnen der zweiten Ableitung überprüfen. Für diesegilt

f ′′(x) =d

dx

4x

(x2 + 1)2=

4(x2 + 1)2 − 4x(x2 + 1)2x

(x2 + 1)4=

4− 4x2

(x2 + 1)3.

Insbesondere gilt f ′′(0) > 0, was bestätigt, dass x = 0 Stelle eines lokalen Minimums ist. Wei-ters gilt f(0) = −1 und somit f(x) ≥ −1 für alle x ∈ R.Wendepunkte: f ′′(x) = 0 ist genau für x = ±1 erfüllt. Für |x| < 1 ist f ′′(x) > 0 und fhat positive Krümmung. Für |x| > 1 gilt f ′′(x) < 0, d.h., f hat negative Krümmung. Somitsind x = ±1 Wendepunkte von f . Vorliegen der Wendepunkte ließe sich auch über die dritteAbleitung überprüfen.

Symmetrie: Die Funktion f ist symmetrisch bezüglich 0, d.h., f(x) = f(−x) für alle x ∈ R.

Mit Hilfe der Nullstellen, des Minimums, der Wendepunkte, sowie der Grenzwerte bei ±∞ lässtsich die Funktion f wie folgt skizzieren

Skizze des Funktionsgraphen der Funktion f(x) = x2−1x2+1

.

Page 19: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

1.6 Taylorentwicklung 13

1.6 Taylorentwicklung

Zur Approximation einer Funktion f : x 7→ f(x) in der Nähe eines Punktes x0 haben wir bisherdie konstante Funktion T0f(x;x0) : x 7→ f(x0) sowie die lineare Funktion T1f(x;x0) : x 7→f(x0) + f ′(x0)(x − x0) betrachtet. Wie der folgende Satz zeigt, lassen sich glatte Funktionendurch Polynome höhrer Ordnung noch besser approximieren.

1.28. Satz von Taylor. Sei f ∈ Cn(a, b) (n-mal stetig differenzierbar). Dann ist durch

Tnf(x;x0) =∑n

k=0

1

k!f (k)(x0)(x− x0)k

= f(x0) + f ′(x0)(x− x0) +1

2!f ′′(x0)(x− x0)2 + . . .+

1

n!f (n)(x0)(x− x0)n

das Taylorpolynom n-ter Ordnung von f im Punkt x0 definiert. Für das Restglied (denFehler in der Approximation) Rn(x;x0) = f(x)− Tnf(x;x0) gilt

limx→x0

Rn(x;x0)

(x− x0)n= 0.

Ist f auf (a, b) sogar n+ 1-mal differenzierbar, so lässt sich das Restglied ausdrücken durch

Rn(x;x0) =1

(n+ 1)!f (n+1)(ξ)(x− x0)n+1 für eine Zwischenstelle ξ.

Beweis. Für n = 0 gilt R0(x;x0) = f(x)− f(x0)x→x0−−−→ 0 aufgrund der Stetigkeit von f . Ist f

differenzierbar, so erhält man aus dem Mittelwertsatz

f(x)− f(x0) = f ′(ξ)(x− x0) für ein ξ ∈ (x0, x) bzw. ξ ∈ (x, x0),

woraus die Restglieddarstellung für den Fall n = 0 folgt.Für n = 1 gilt mit obiger Überlegung

R1(x;x0) = f(x)− f(x0)− f ′(x0)(x− x0) = (f ′(ξx)− f ′(x0))(x− x0).

Es gilt ξx → x0 mit x→ x0 und somit auch R1(x;x0)(x−x0)

= f ′(ξx)−f ′(x0)x→x0−−−→ 0, wenn f ′ stetig ist.

Der Beweis der Lagrange’schen Restglieddarstellung, und die Aussage für allgemeines n erfolgtin ähnlicher Weise über die Mittelwertsätze; siehe z.B. Ansorge/Oberle I, Kap. 10.

1.29. Beispiele. (a) Für die Exponentialfunktion f : R→ R, x 7→ exp(x) gilt f (n)(x) = exp(x)für alle n ∈ N und x ∈ R. Mit x0 = 0 folgt

T0f(x; 0) = 1, T1f(x; 0) = 1 + x, T2f(x; 0) = 1 + x+x2

2, . . .

Page 20: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

14 Differentialrechnung in einer Variablen

Das Taylorpolynom Tnf(x; 0) stimmt hier mit den ersten n+1 Gliedern der Potenzreihe überein.Dass dies kein Zufall ist, wird in den Bemerkungen zur Taylorreihe am Ende des Abschnitteserläutert.

(b) Sei f : (0,∞) → R, x 7→ ln(x). Dann gilt f ′(x) = 1/x = x−1 und f ′′(x) = −x−2. Mittelsvollständiger Induktion zeigt man, dass f (n)(x) = (−1)n(n−1)!x−n ist. Mit Entwicklungspunktx0 = 1 erhält man die Taylorpolynome

T0f(x; 1) = 0, T1f(x; 1) = x− 1, T2f(x; 1) = x− 1− (x− 1)2

2, . . .

Um die Approximationsgüte der Taylorpolynome etwas einfacher beschreiben zu können, führenwir die folgende Notation ein.

1.30. Definition (Landau Symbole). Sei φ : (−a, a)→ R und k ∈ N0. Wir definieren

φ(h) = o(hk) :⇔ limh→0

φ(h)

hk= 0

φ(h) = O(hk) :⇔ |φ(h)| ≤ C|hk|, für ein C > 0 und alle h ∈ (−a, a).

Die Definition lässt sich auf vektorwertige Funktionen φ verallgemeinern.Man sagt φ ist klein “o” von hk bzw groß “O” von hk. Dies bedeutet, dass φ für h → 0schneller als hk bzw zumindest so schnell wie hk gegen 0 strebt.

1.31. Beispiele: (a) Für die Funktion φ(h) = 2h+ h2 gilt φ(h) = o(1) sowie φ(h) = O(h). DieFunktion geht mit h→ 0 schneller als 1 und so schnell wie h gegen 0.

(b) Eine Funktion f : R→ R ist stetig in x0, genau dann wenn f(x)− f(x0) = o(1) gilt.

(c) Eine Funktion f : R→ R ist differenzierbar in x0, genau dann, wenn

f(x)− f(x0)− f ′(x0)(x− x0) = o((x− x0)).

Insbesondere gilt dann auch f(x)− f(x0)− f ′(x0)(x− x0) = O(x− x0).

1.32. Folgerung. Unter den Bedingungen des Satzes von Taylor gilt die Fehlerabschätzung

f(x)− Tnf(x;x0) = o((x− x0)n).

Weiters ist Tnf(x;x0) das einzige Polynom, welches dieser Abschätzung genügt. Ist f ∈Cn+1(a, b), so gilt sogar

f(x)− Tnf(x;x0) = O((x− x0)n+1).

Page 21: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

1.6 Taylorentwicklung 15

1.33. Beispiel. Gesucht ist eine polynomiale Approximation p der Exponentialfunktion f :x 7→ exp(x) auf dem Intervall (−1, 1) welche genauer als 0.001 ist, also | exp(x)− p(x)| ≤ 0.001für alle x ∈ (−1, 1).Lösung: Aus dem Satz von Taylor folgt mit exp(n)(x) = exp(x) und exp(0) = 1, dass

exp(x) = 1 + x+x2

2!+ . . .+

xn

n!+

1

(n+ 1)!exp(ξ)xn+1,

für ein ξ ∈ (−1, 1). Für den Approximationsfehler auf (−1, 1) gilt demnach

|f(x)− Tnf(x; 0)| = |Rn(x; 0)| = | exp(ξ)

(n+ 1)!xn+1| ≤ exp(1)

(n+ 1)!≤ 3

(n+ 1)!.

Da 7! = 5040 folgt, dass |f(x)− T6f(x)| ≤ 37!≤ 0.001 gilt. Das Taylorpolynom

T6f(x; 0) = 1 + x+x2

2+ . . .+

x6

6!

erfüllt also die Anforderung.

1.34. Bemerkung (Taylorreihe). Für beliebig oft differenzierbare Funktionen heißt

Tf(x;x0) :=∞∑k=0

1

k!f (k)(x0)(x− x0)k

die Taylorreihe der Funktion f im Punkt x0. Es gilt:

(a) Die Taylorreihe ist eine Potenzreihe mit Konvergenzradius ≥ 0.

(b) Konvergiert die Reihe für ein x 6= x0, so kann sie dort mit f(x) übereinstimmen oder auchnicht; siehe unten.

(c) Ist die Funktion f(x) selbst über eine Potenzreihe definiert, so stimmt diese mit der Taylor-reihe überein (Identitätssatz). Potenzreihen lassen scih also gut durch Polynome approximieren.

Beweise hierfür und weitergehende Aussagen findet man z.B. in Königsberger I.

Zur Veranschaulichung des Sachverhaltes (b) mögen folgende Beispiele dienen:

(i) Die Taylorentwicklung der Exponentialfunktion bei x0 = 0 lautet

Tf(x; 0) = 1 + x+x2

2+x3

3!+ . . .

Sie stimmt also gerade mit der Potenzreihe der Exponentialfunktion überein.

(ii) Die Funktion f : R→ R definiert durch

f(x) =

{exp(−1/x2) für x 6= 0,0 für x = 0,

ist stetig auf R und sogar beliebig oft stetig differenzierbar mit f (n)(0) = 0 für alle n; sieheÜbung. Es folgt, dass Tf(x; 0) ≡ 0 ist. Die Taylorreihe konvergiert also für alle x, stimmt aberfür x 6= 0 nicht mit der Funktion f(x) überein.

Page 22: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

16 Differentialrechnung in einer Variablen

1.7 Interpolation

Bemerkung zur Konstruktion der Taylorpolynome: Das Taylorpolynom n-ter Ordnunglässt sich formal auch wie folgt bestimmen: Gesucht ist eine Polynomfunktion

pn(x) = a0 + a1(x− x0) + . . .+ an(x− x0)n

welche die Funktion f(x) in der Nähe von x0 approximiert.

Um die n + 1 Parameter a0, . . . , an zu bestimmen, verlangen wir, dass das Polynom und seineersten n Ableitungen an der Stelle x0 mit der Funktion f und deren Ableitungen übereinstimmt,also

pn(x0) = a0!

= f(x0)

p′n(x0) = a1!

= f ′(x0)

p′′n(x0) = a22!

= f ′′(x0). . .

p(n)n (x0) = ann!

!= f (n)(x0).

Als Resultat dieser Konstruktion erhält man gerade das Taylorpolynom pn(x) = Tnf(x;x0).

Alternativ lassen sich die Koeffizienten des Polynoms auch durch andere Bedingungen festlegen.

Polynominterpolation

1.35. Definition. Seien f : (a, b)→ R und Werte xi ∈ (a, b) für i = 0, . . . , n gegeben. EinePolynomfunktion p : R→ R mit

p(xi) = f(xi), i = 0, . . . , n

heißt Interpolationspolynom von f für die Stützstellen {xi : i = 0, . . . , n}.

Da an das Interpolationspollynom n + 1 Bedingungen gestellt werden, macht es Sinn, geradePolynome p(x) = a0 + a1x + . . . + anx

n vom Grad n zu betrachten. Diese haben n + 1 freiwählbare Koeffizienten ai. Unter relativ einfachen Bedingungen an die Stützstellen kann dannein eindeutiges Interpolationspolynom gefunden werden.

1.36. Satz. Die Stützstellen {xi : i = 0, . . . , n} seien paarweise verschieden, d.h. xi 6= xjfür i 6= j. Dann existiert ein eindeutiges Interpolationspolynom pn(x) vom Grad n welchesmit f an allen Stützstellen übereinstimmt, also pn(xi) = f(xi) für i = 0, . . . , n erfüllt.

Page 23: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

1.7 Interpolation 17

Beweis. Der Beweis ist konstruktiv: Wir definieren die Lagrangepolynome

Li(x;x0, . . . , xn) :=n∏

j=0,j 6=i

x− xjxi − xj

, i = 0, . . . , n.

Da die Stützstellen paarweise verschieden sind, ergibt dies n+ 1 Polynome vom Grad n, welchewegen Li(xi) = 1 und Li(xj) = 0 für i 6= j linear unabhängig sind (Übung!). Aus den In-terpolationsbedingungen pn(xi) = f(xi) und den Eigenschaften der Lagrangepolynome erhältman

pn(xi) =n∑j=0

ajLj(xi;x0, . . . , xn) = ai!

= f(xi), i = 0, . . . , n

was die Koeffizienten ai, i = 0, . . . , n des gesuchten Interpolationspolynoms eindeutig festlegt.Dies zeigt sowohl die Existenz als auch die Eindeutigkeit des Interpolationspolynomes.

1.37. Variante des Beweises. Die Interpolationsbedingungen führen auf das folgende lineareGleichungssystem für die Koeffizienten ai

1 x0 x20 . . . xn0

1 x1 x21 . . . xn1

......

... . . . ...1 xn x2

n . . . xnn

a0

a1...an

=

f(x0)f(x1)

...f(xn)

.

Das Koeffizientenschema A heißt Vandermonde Matrix zu den Stützstellen {xi : i = 0, . . . , n}.Man kann mittels vollständiger Induktion zeigen, dass det(A) =

∏0≤i<j≤n(xi − xj) gilt; siehe

Übung zur Vandermonde-Determinante. Man sieht, dass det(A) 6= 0 genau dann gilt, wenn dieStützstellen paarweise verschieden sind. Genau dann ist also die Interpolationsaufgabe für jedesWahl von Stützwerten fi eindeutig lösbar .

1.38. Bemerkung. Zur Berechnung des Interpolationspolynoms verwendet man in der Praxisdie Verfahren von Newton oder Aitken-Neville, welche das Lösen eines Gleichungssystems um-gehen. Die Konstruktion über Lagrangepolynome hat vor allem theoretische Bedeutung. FürDetails hierzu siehe z.B. Dahmen/Reusken, Kap 8.

1.39. Beispiel. Wir wollen die Exponentialfunktion auf dem Intervall [0, 1] durch Interpolati-onspolynome verschiedener Ordnung mit äquidistanten Stützstellen approximieren:(a) Das Interpolationspolynom 0-ter Ordnung für die Funktion f(x) = exp(x) mit Stützstellex0 = 0 lautet p0(x) = f(x0). Dieses stimmt gerade mit dem Taylorpolynom 0ter Ordnung mitEntwicklungspunkt x0 überein.(b) Das Interpolationspolynom 1-ter Ordung mit Stützstellen x0 = 0, x1 = 1 lautet p1(x) =1 + (e− 1)x. Das entsprechende Taylorpolynom wäre T1f(x; 0) = 1 + x.(c) Die Koeffizienten a0, a1, a2 des Interpolationspolynoms p2(x) = a0 + a1x + a2x

2 zweiter

Page 24: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

18 Differentialrechnung in einer Variablen

Ordnung für die Stützstellen x0 = 0, x1 = 1/2, x2 = 1 betsimmt man über die Interpolations-bedingungen

p2(0; 0, 1/2, 1) = a0!

= exp(0) = 1, =⇒ a0 = 1,

p2(1/2; 0, 1/2, 1) = a0 + a1/2 + a2/4!

= exp(1/2) =√e,

p2(1; 0, 1/2, 1) = a0 + a1 + a2!

= exp(1) = e.

Hieraus erhält man a0 = 1, a1 = 4√e−e−3, a2 = 2e−4

√e+2. Zm Vergleich: das entsprechende

Taylorpolynom wäre T2f(x;x0) = 1 + x+ x2.

1.40. Bemerkung (Identitätssatz). Stimmen zwei Polynomfunktionen pn(x), qn(x) vomGrad ≤ n and zumindest n+1 verschiedenen Stellen xi, i = 0, . . . , n überein, so gilt p(x) = q(x)für alle x. Als Konsequenz erhält man: Ist f(x) eine Polynomfunktion der Ordnung n, sostimmen das Interpolationspolynom pm(x;x0, . . . , xm) sowie das Taylorpolynom Tmf(x;x0) derOrdnung m ≥ n mit der Funktion f(x) überein; siehe Übung.

Polynomiale Approximationen der Exponentialfunktion

Wir wollen uns noch kurz damit beschäftigen, wie gut eine Funktion f durch Interpolations-polynome approximiert werden kann. Ganz ähnlich wie bei der Taylorentwicklung zeigt manfolgendes Resultat.

1.41. Satz (Interpolationsfehler). Sei f ∈ Cn+1(a, b) und a < x0 < . . . < xn < bgegeben. Dann gibt es ein ξ ∈ (x0, xn) sodass gilt:

f(x)− p(x) =1

(n+ 1)!f (n+1)(ξ)(x− x0)(x− x1) · · · (x− xn).

Insbesondere gilt für jedes x ∈ [x0, xn] die Fehlerabschätzung f(x)− p(x) = O((x0 − xn)n).

Beweis. Der Beweis beruht hier auf dem verallgemeinerten Satz von Rolle; siehe Dahmen/ReuskenKap 8.2. Die Approximationsordnung ist im wesentlichen dieselbe wie beim Taylorpolynom desentsprechenden Grades.

Page 25: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

1.7 Interpolation 19

1.42. Beispiel. Wir betrachten die Interpolationspolynome für die Exponentialfunktion ausvorigem Beispiel. Es gilt

|f(x)− p1(x; 0, 1)| = |12

exp(ξ)(x− 0)(x− 1)| ≤ 12e1

4≤ e

8, ∀x ∈ [0, 1]

bzw

|f(x)− p2(x; 0, 1/2, 1)| = | 13!

exp(ξ)(x− 0)(x− 1/2)(x− 1)| ≤ 16e1

8≤ e

48, ∀x ∈ [0, 1].

Man beachte, dass in den Fehlerabschätzungen für die Interpolations- bzw Taylorpolynomejeweils von hinreichender Differenzierbarkeit der zu approximierenden Funktion f ausgegangenwurde. Zum Abschluss des Kapitels stellen wir noch eine Alternative vor, welche es erlaubt,auch weniger glatte Funktionen gut zu approximieren.

Splineinterpolation

Sei wie zuvor a < x0 < x1 < . . . < xn < b und f : (a, b) → R zumindest einmal stetigdifferenzierbar. Wir approximieren die Funktion f durch einen Polygonzug s1(x;x0, x1, . . . , xnder wie folgt definiert ist

s1(x;x0, x1, . . . , xn) =x− xi−1

xi − xi−1

f(xi) +xi − xxi − xi−1

f(xi−1), i = 1, . . . , n.

Man überzeugt sich leicht, dass s1(x;x0, . . . , xn) stetig und stückweise linear ist und die Funk-tion f an den Stützstellen interpoliert.

Wir können also auf jedem Teilintervall [xi−1, xi] die Interpolationsfehlerabschätzung anwenden,und erhalten

f(x)− s1(x;x0, x1, . . . , xn) = O((xi − xi−1)2) für x ∈ [xi−1, xi].

Wählt man hinreichend viele Stützstellen, kann man (xi − xi−1) und somit den Fehler derApproximation beliebig klein machen.

1.43. Beispiel. Gesucht ist die stückweise lineare, stetige Funktion s1(x; 0, 1/2, 1) welche dieExponentialfunktion an den Stellen x0 = 0, x1 = 1/2 und x2 = 1 interpoliert.Lösung: Für die beiden Teilintervalle erhält man

s1(x; 0, 1/2, 1) =

{1− 2(

√e− 1)x, 0 ≤ x ≤ 1/2,

2√e− e+ 2x(e−

√e), 1/2 < x ≤ 1.

Die Funktionen auf den Teilintervallen ergeben sich als lineare Interpolationspolynome wie inobigem Abschnitt.

Page 26: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

20 Differentialrechnung in einer Variablen

Interpolation der Exponentialfunktion durch Polygonzüge (stetige, stückweise lineare Splines).

1.44. Bemerkung: Die Funktion s(x;x0, x1, . . . , xn) nennt man einen stückweise linearen C0

stetigen Spline. In ähnlicher Weise kann man auch stückweise quadratische, kubische, ... Splinesmit C1, C2, ... Stetigkeit konstruieren. Die Berechnung dieser Splines erfolgt über Lösungvon linearen Gleichungssystemen, oder durch rekursive Algorithmen (B-Splines). Für weitersMaterial, siehe z.B. Dahmen/Reusken Kap 8.4.

1.8 Fixpunkt- und Newtonverfahren

Motivation. Gesucht ist eine Lösung einer nichtlinearen Gleichung

f(x) = y,

wobei f : R → R hinreichend glatt angenommen wird. Im Allgemeinen wird sich eine Lösungder Gleichung nicht in expliziter Form angeben lassen. Wir stellen daher im folgenden kurzzwei Methoden vor, mit deren Hilfe beliebig gute Näherungen für eine Lösung mit einfachenRechenoperationen gefunden werden können.

Fixpunktiteration

Durch elementare Umformung lässt sich die Gleichung f(x) = y in folgende Form bringen:

x = x+ g(x)(y − f(x)) =: φ(x).

Hier kann g : R→ R noch frei gewählt werden. Falls g(x) 6= 0 für alle x ∈ R ist, dann ist jedeLösung der ersten Gleichung auch Lösung der zweiten, und umgekehrt. Die beiden Problemesind also äquivalent. Die Gleichung f(x) = y ist also äquivalent zur Fixpunktgleichung

x = φ(x),

Page 27: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

1.8 Fixpunkt- und Newtonverfahren 21

wobei φ durch φ(x) = x+ g(x)(y− f(x)) definiert ist. Eine Lösung dieser Gleichung heißt dannFixpunkt der Funktion φ.

Nichtlineare Gleichung und eine äquivalente Fixpunktgleichung sowie die zugehörigeFixpunktiteration.

Zur numerischen Lösung von Fixpunktgleichungen bietet sich folgendes einfache Verfahren an

xn+1 = φ(xn) für n ≥ 0, (1.1)

wobei der Startwert x0 gegeben sei. Falls φ stetig ist und die erzeugte Folge konvergiert, liegtklarerweise ein Fixpunkt vor, denn aus xn → x folgt wegen der Stetigkeit φ(xn) → φ(x) undwegen der Konstruktion

x = limn→∞

xn+1 = limn→∞

φ(xn) = φ(x).

Der folgende Satz gibt Kriterien, die garantieren, dass die erzeugte Folge tatsächlich konvergiertund somit ein Fixpunkt überhaupt existiert.

1.45. Banach’scher Fixpunktsatz.

Es mögen folgende Voraussetzungen gelten:

(i) D ⊂ R ist abgeschlossen

(ii) φ : D → R ist eine Selbstabbildung, d.h., φ(D) ⊂ D;

(iii) φ ist eine Kontraktion, d.h., es gibt ein L < 1, so dass

|φ(x)− φ(y)| < L|x− y| für alle x, y ∈ D.

Dann gilt:

(a) Die Fixpunktgleichung x = φ(x) besitzt genau einen Fixpunkt x∗ = φ(x∗) in D.

(b) Für jeden Startwert x0 ∈ D konvergiert die durch (1.1) erzeugte Folge gegen x∗.

(c) Es gilt die Fehlerabschätzung

|xn − x| ≤ L1−L |xn − xn−1| ≤ Ln

1−L |x1 − x0|.

Page 28: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

22 Differentialrechnung in einer Variablen

Beweis: (b) Sei x0 ∈ D gegeben. Wegen (ii) gilt (mit vollständiger Induktion) dass xn ∈ D für allen ≥ 0; die Iteration erzeugt also eine Folge in D. Weiters gilt wegen (iii) für jedes n ≥ 0 dass

|xn+1 − xn| = |φ(xn)− φ(xn−1)| ≤ L|xn − xn−1|,

und durch mehrmaliges Anwenden erhält man

|xn+k+1 − xn+k| ≤ Lk|xn+1 − xn|.

Wir zeigen nun hiermit, dass die Folge {xn} eine Cauchy-Folge ist: Für jedes m > n gilt

|xm − xn| = |(xm − xm−1) + (xm−1 − xm−2) + . . .+ (xn+1 − xn)|

≤m−n−1∑k=0

|xn+k+1 − xn+k| ≤m−n−1∑k=0

Lk|xn+1 − xn|

≤ |xn+1 − xn|∞∑k=0

Lk ≤ 1

1− L|xn+1 − xn| ≤

L

(1− L)|xn − xn−1|.

Nochmaliges Anwenden obiger Abschätzungen liefert

|xm − xn| ≤Ln

1− L|x1 − x0|.

Da 0 < L < 1 ist, konvergiert Ln

1−L gegen 0 wenn n → ∞. Zu jedem ε > 0 kann man daher einN ∈ N finden, sodass Ln

1−L < ε gilt für alle n ≥ N . Mit obiger Abschätzung folgt also, dass {xn} eineCauchy-Folge ist, und wegen der Vollständigkeit von R existiert der Grenzwert x∗ := limn→∞ xn ∈ R,und es gilt x∗ ∈ D, da wegen (i) D abgeschlossen ist. Somit ist die Existenz eines Fixpunktes gezeigtund die Konvergenz der Fixpunktiteration gezeigt.

(a) Existenz ist schon gezeigt. Falls x∗∗ ein weiterer Fixpunkt ist, gilt wegen (iii)

|x∗ − x∗∗| = |φ(x∗)− φ(x∗∗)| ≤ L|x∗ − x∗∗|,

also (1− L)|x∗ − x∗∗| ≤ 0, woraus mit L < 1 x∗ = x∗∗ folgt. Der Fixpunkt ist also eindeutig.

(c) Aus obiger Abschätzung und der Konvergenz der Folge folgt mit (iii) weiters

|xn − x∗| = limm→∞

|xn − xm| ≤L

1− L|xn − xn−1|.

Die zweite Abschätzung wurde bereits oben gezeigt.

Die zentrale Voraussetzung im Banach’schen Fixpunktsatz war die Kontraktionseigenschaft vonφ. Wir geben daher noch ein kurzes Kriterium an, welches die Überprüfung der Kontraktivitäterleichtert.

1.46. Bemerkung. (i) Falls f : [a, b] → R differenzierbar ist, dann gibt es nach dem Mittel-wertsatz ein ξ ∈ (a, b) mit

|f(x)− f(y)||x− y|

= |f ′(ξ)| ≤ supξ∈(a,b)

|f ′(ξ)| =: L.

Page 29: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

1.8 Fixpunkt- und Newtonverfahren 23

Die Abbildung f ist also jedenfalls eine Kontraktion, falls die Ableitung von f hinreichend kleinist. Man kann zeigen, dass für differenzierbares f diese Bedingung auch notwendig ist.

(ii) Der Banach’sche Fixpunktsatz liefert neben der Aussage über Existenz und Eindeutigkeiteines Fixpunktes auch gleich ein numerisches Verfahren, um diesen zu finden bzw. beliebiggenau zu approximieren. Die geschieht z.B. mit einem einfachen Programm der Form

function x=banachfps(f,x0,eps)x=x0;for i=1:maxit

xold = x;x = f(xold);if norm(x-xold)<eps, break; end

end

In der Praxis sollte man unter Zuhilfenahme der Fehlerabschätzungen bessere Abbruchbedin-gungen verwenden!

(iii) Ein iteratives Verfahren mit

|xn+1 − x∗| ≤ L|xn − x∗| für ein L < 1,

heißt linear konvergent (n+ 1-ter Fehler hängt linear vom Fehler im n-ten Schritt ab).

1.47. Beispiel. Gesucht ist eine Lösung von x = cos(x) in der Nähe von x0 = 0.Lösung: Mit Skizze sieht man, dass nur eine Lösung existiert und diese in D = [0, 1] liegt.Wir definieren φ : [0, 1]→ R, x 7→ cos(x) und überprüfen die Voraussetzungen des B-FPS:

(i) D = [0, 1] is abgeschlossen.

(ii) Da cos auf [0, 1] monoton fallend ist, gilt φ([0, 1]) = [cos(1), cos(0)] ⊂ [0, 1], was (ii) zeigt.

(iii) Nach dem Mittelwertsatz gibt für jedes x, y ∈ [0, 1] ein ξ ∈ (x, y) mit

| cos(x)− cos(y)| = | cos′(ξ)||x− y| ≤ maxξ∈[0,1]

| sin(ξ)||x− y| = sin(1)|x− y|,

was zeigt dass φ eine Kontraktion mit Konstante L = sin(1) ≤ 0.85 ist.

Nach dem Banach’schen Fixpunktsatz existiert also eine eindeutige Lösung x∗ mit x∗ = cos(x∗)im Intervall [0, 1]. Um diese mit Genauigkeit 0.01 zu berechnen, genügt es n Iterationen derFixpunktiteration durchzuführen, wobei n so zu wählen ist, dass

|xn − x∗| ≤Ln

1− L|x1 − x0| ≤ 0.85n · 10 · 1

!

≤ 0.01.

Durch Logarithmieren erhält man (Logarithmusfunktion ist monoton wachsend!)

n log(0.85) + log(10) + log(1)!

≤ log(0.01),

Page 30: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

24 Differentialrechnung in einer Variablen

was für n ≥ (log(0.01)− log(10))/ log(0.85) ≈ 42.5 erfüllt ist.

Mit Startwert x0 = 0 erhält man für die ersten Iterierten:

n 1 2 3 4 5 6 7 8xn 1.0000 0.5403 0.8576 0.6543 0.7935 0.7014 0.7640 0.7221

|xn − x∗| 0.2609 0.1988 0.1185 0.0848 0.0544 0.0377 0.0249 0.0170

und x45 ≈ 0.7390851 stimmt sogar auf mehr als sieben Stellen mit x∗ überein.

Bemerkung: Es gilt cos(x) − x|x=0 = 1 > 0 und cos(x) − x|x=1 ≈ 0.5 − 1 < 0. Nach demZwischenwertsatz gibt es eine Stelle ξ mit cos(ξ)− ξ = 0, was die Existenz der Lösung liefert.Eindeutigkeit könnte man dann auch über Monotonie zeigen.

1.48. Bemerkung. Der vorhergehende Satz gilt wörtlich für den Fall, dass D ⊂ V eine abge-schlossene Teilmenge eines vollständigen normierten Raumes (V, ‖ · ‖) (=Banachraum) ist, undφ : D → D eine Selbstabbildung auf D ist. Man braucht im Beweis lediglich | · | durch ‖ · ‖ zuersetzen. Die Tatsache, dass jede Cauchy-Folge in einem Banachraum wieder einen Grenzwertbesitzt, ist der wesentliche Punkt, um die Existenz eines Fixpunktes zu zeigen. Als Banachräu-me hatten wir schon kennengelernt: Rn mit einer beliebigen Vektornorm ‖ · ‖, aber auch denRaum der stetigen Funktionen C[a, b] mit der Supremumsnorm ‖f‖∞ := supx∈[a,b] |f(x)|. Derletzte Fall wird später im Rahmen von Differentialgleichungen wichtig werden.

Das Newton-Verfahren

Gesucht ist wiederum eine Lösung der Gleichung f(x) = y in der Nähe des Punktes x0. Ausder Approximation von f durch das Taylorpolynom erdzrt Ordnung bei x0 erhält man

y = f(x) ≈ f(x0) + f ′(x0)(x− x0).

Als Näherungswert für die Lösung x bietet sich die Lösung der linearisierten Gleichung

y = f(x0) + f ′(x0)(x− x0)

an, was die Näherungx1 := x0 + f ′(x0)−1(y − f(x0))

liefert. Die Näherung lässt sich verbessern, indem man dasselbe Vorgehen nochmals auf dieLinearisierung um den Punkt x1 anwendet, und durch Iterieren ergibt sich die Vorschrift

xn+1 := xn + f ′(xn)−1(y − f(xn)) für n ≥ 0.

Page 31: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

1.8 Fixpunkt- und Newtonverfahren 25

Grafische Darstellung des Newtonverfahrens.

Die Konvergenz des Newtonverfahrens sichert der folgende Satz.

1.49. Newtonverfahren. Seien f : [a, b] → R zweimal stetig differenzierbar, x∗ ∈ (a, b)Lösung von f(x∗) = y und f ′(x∗) 6= 0. Dann konvergiert das Newtonverfahren

xn+1 = xn + f ′(xn)−1(y − f(xn)), n ≥ 0

lokal quadratisch gegen die Lösung x∗, d.h., es gilt

|xn+1 − x∗| ≤ C|xn − x∗|2 für alle n ≥ 0

für alle Startwerte x0 mit |x0 − x∗| hinreichend klein.

Beweis: Sei 0 < c1 ≤ |f ′(x∗)| und c2 := maxx∈[a,b] |f ′′(x)| und definiere c := c12c2

> 0. Dann gilt füralle x ∈ [x∗ − c, x∗ + c], dass

|f ′(x)− f ′(x∗)| MWS= |f ′′(ξ)(x− x∗)| ≤ c2|x− x∗| ≤ c2

c1

2c2=c1

2,

und somit |f ′(x)| ≥ c1/2 > 0.

Als nächstes zeigen wir, dass für x0 ∈ [x∗ − c, x∗ + c] auch xn ∈ [x∗ − c, x∗ + c] für alle n ∈ N0

gilt. Für ein beliebiges n ∈ N0 gelte xn ∈ [x∗ − c, x∗ + c] und somit f ′(xn) 6= 0. Dann folgt aus derTaylorentwicklung

y = f(x∗) = f(xn) + f ′(xn)(x∗ − xn) +1

2f ′′(ξ)(x∗ − xn)2,

für ein ξ ∈ [x∗ − c, x∗ + c]. Subtrahiert man f(xn) und dividiert durch f ′(xn), so erhält man aus derVorschrift für die Newtoniteration

xn+1 − xn = f ′(xn)−1(y − f(xn)

)= x∗ − xn +

1

2f ′(xn)−1f ′′(ξ)(x∗ − xn)2,

woraus weiters folgt, dass

|xn+1 − x∗| = |(xn+1 − xn) + (xn − x∗)| =1

2|f ′(xn)−1||f ′′(ξ)||x∗ − xn|2

≤ c2

c1|x∗ − xn|2 ≤

|x∗ − xn|2

≤ c

2.

Page 32: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

26 Differentialrechnung in einer Variablen

Das zeigt zum einen, dass xn+1 ∈ [x∗− c, x∗+ c] und somit die Newtoniteration wohldefiniert ist; zumanderen folgt, dass |xn− x∗| ≤ 1

2n |x0− x∗|, was die Konvergenz zeigt. Die quadratische Fehlerabschät-zung folgt aus der ersten Abschätzung.

1.50. Bemerkungen. (i) Konvergenz kann nur für Startwerte x0 hinreichend nahe bei x∗garamtiert werden! Hinreichende Bedingungen dafür kann man aus dem Beweis ablesen. Ist diex0-nahe-bei-x∗ Bedingung verletzt, kann das Newton-Verfahren auch divergieren!

(ii) Das Resultat gilt wörtlich, wenn f nur einmal differenzierbar ist und die Ableitung f ′

Lipschitzstetig ist.

(iii) Ist f ′ nur stetig, dann konvergiert das Newtonverfahren zumindest lokal superlinear, d.h.,

|xn+1 − x∗| ≤ Cn|xn − x∗| mit Cnn→∞−−−→ 0.

(vi) Der Beweis lässt sich fast wörtlich auf nichtlineare Gleichungssysteme F (x) = y mit F :Rn → Rn übertragen. Hierzu später mehr im Rahmen von Funktionen mehrerer Variablen.

1.51. Beispiel. Man zeige, dass die Lösung der Gleichung f(x) := cos(x) − x = 0 mit Hilfedes Newton-Verfahrens beliebig genau approximiert werden kann.

Lösung: Es gilt f ′(x) = − sin(x) − 1, also c1 := 1 ≤ |f ′(x)| ≤ 2 für x ∈ [0, 1]. Weiters giltf ′′(x) = − cos(x), also c2 := maxx |f ′′(x)| = 1. Mit obigen Überlegungen sieht man, dass dasNewtonverfahren für Startwerte in [1/4, 1] konvergiert. Wir wählen vorerst x0 = 0. Dann gilt

x1 = x0 + f ′(x0)−1(y − f(x0)) = 0 + (−1)−1(0− (1− 0)) = 1.

x1 liegt dann im Konvergenzbereich des Newtonverfahrens, und dieses konvergiert quadratischgegen die Lösung. Für die ersten Iterierten erhält man

n 1 2 3 4 5xn 1.00000 0.75036 0.73911 0.73908 0.73908

|xn − x∗| 0.26091 0.01127 0.000027 1.7e-10 0.00000

Nach nur 3 Iterationen stimmt das Ergebnis auf 5 Stellen genau und nach 5 Iterationen ist dieGenauigkeit ca 20 Stellen, also genauer als der Rundungsfehler!

1.52. Bemerkung. (i) Wie obiges Beispiel illustriert, bedeutet quadratische Konvergenz, dasssich in die Anzahl der korrekten Stellen in jedem Schritt in etwa verdoppelt! Das Newtonverfah-ren konvergiert also viel schneller als die weiter oben betrachtete Banach’sche Fixpunktiteration.

(ii) Man beachte trotzdem, dass sich auch das Newtonverfahren als Fixpunktiteration für dieGleichung

x = x+ f ′(x)−1(y − f(x)) =: φ(x)

darstellen lässt. Die Konvergenz des Newtonverfahrens lässt sich dann auch mit dem Ba-nach’schen Fixpunktsatz nachweisen. Die quadratische Konvergenz zeigt man explizit wie oben.

Page 33: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

2 Integralrechnung in einer Variablen

Im folgenden Abschnitt beschäftigen wir uns mit der Berechnung von Flächen,unter dem Gra-phen von Funktionen. Wir werden sehen, dass sich solche “Integrale” bequem mit Hilfe vonStammfunktionen berechnen lassen. Das Integrieren, also das bilden von Stammfunktionen,entspricht dabei gerade der Umkehrung des Differenzierens.

2.1 Das Riemann-Integral

Sei f : [a, b] → R eine beschränkte Funktion. Gesucht ist die Fläche If (a, b) unter dem Funk-tionsgraphen (einer Kurve) graph(f) = {(x, f(x)) : a ≤ x ≤ b}. Zur näherungsweisen Berech-nung kann man versuchen, die Fläche durch einfach zu berechnende Flächen zu approximieren.Dies geschieht durch Zerlegung des Intervalls [a, b] in Teilintervalle und durch geeignete Appro-ximation der Funktion f auf den Teilintervallen; siehe Skizze.

2.1. Definition (Zerlegung). Eine Menge Z = {a = x0 < x1 < . . . < xn = b} heißt Zer-legung des Intervalls [a, b] und ‖Z‖ := max1≤i≤n |xi−xi−1| heißt die Feinheit der Zerlegung.Mit Z bzw. Z[a, b] wird die Menge aller Zerlegungen von [a, b] bezeichnet.

Die oben beschriebene Approximation der Fläche unter einer Kurve durch Rechtecksflächenführt nun in natürlicher Weise auf folgenden Begriff.

2.2. Definition (Riemannsummen) Jede Summe der Form

Rf (Z) :=n∑i=1

f(ξi)(xi − xi−1), xi−1 ≤ ξi ≤ xi,

heißt Riemannsumme zur Zerlegung Z mit Stützstellen ξi. Weiters heißen

Uf (Z) =n∑i=1

inf f([xi−1, xi])(xi − xi−1) und Of (Z) =n∑i=1

sup f([xi−1, xi])(xi − xi−1)

Unter- bzw. Obersumme von f bezüglich der Zerlegung Z.

Page 34: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

28 Integralrechnung in einer Variablen

Approximationen einer reellen Funktion durch Riemannsummen.

Man überzeugt sich relativ leicht von folgenden Sachverhalten. Vergleiche hierzu auch die Skizze.

2.3. Bemerkung. (a) Für jede fixe Zerlegung Z und jede Riemannsumme Rf (Z) gilt

Uf (Z) ≤ Rf (Z) ≤ Of (Z),

d.h., Ober- und Untersumme liefern Schranken an Riemannsummen zur selben Zerlegung.

(b) Ist Z1 ⊂ Z2, d.h., die Zerlegung Z2 ist feiner als Z1, dann gilt

Uf (Z1) ≤ Uf (Z2) und Of (Z1) ≥ Of (Z2).

(c) Für beschränkte Funktionen f : [a, b] → R gibt es nach Definition Konstanten m ≤ Msodass m ≤ f(x) ≤M für alle x ∈ [a, b] gilt. Hieraus folgt

m(b− a) ≤ Uf (Z1) ≤ Of (Z2) ≤M(b− a)

für beliebige Zerlegungen Z1, Z2 von [a, b]. Insbesondere sind die Ober- und Untersummen füralle Zerlegungen gleichmäßig nach oben und unten beschränkt.

(d) Für unbeschränkte Funktionen f ist entweder die Ober- oder die Untersumme unbeschränkt!

2.4. Definition (Riemannintegral).Sei f : [a, b]→ R beschränkt. Die (wohl-definierten) Grenzwerte

Uf := sup{Uf (Z) : Z ∈ Z[a, b]} und Of := inf{Of (Z) : Z ∈ Z[a, b]}

heißen Riemann’sches Unter- bzw Oberintegral. Falls Of = Uf gilt, dann heißt∫ b

a

f(x)dx := Of = Uf

(Riemann) Integral von f über [a, b] und f heißt (Riemann-, R-) integrierbar (über [a, b]).

Page 35: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

2.1 Das Riemann-Integral 29

2.5. Beispiele. (a) Sei f : [a, b] → R, x 7→ c die konstante Funktion mit Wert c ∈ R. Danngilt für jede Zerlegung von [a, b] in n Teilintervalle

Uf (Z) = Of (Z) =n∑i=1

c(xi − xi−1) = c(b− a) =

∫ b

a

c dx.

(b) Sei f : [a, b] → R die lineare Funktion definiert durch f(x) = x und Zn = {0, 1n, 2n, . . . , 1}

eine Folge von feiner werdenden Zerlegungen mit ‖Zn‖ = 1n. Dann gilt

Uf (Zn) =n∑i=1

i− 1

n

1

n=

n−1∑i=0

i

n2=n(n− 1)

2

1

n2=

1

2− 1

2n,

Of (Zn) =n∑i=1

i

n

1

n=n(n+ 1)

2

1

n2=

1

2+

1

2n.

Nach dem Riemann Kriterium (siehe unten) ist f integrierbar und es gilt∫ 1

0f(x) dx = 1/2.

(c) Für die Heaviside-Funktion

f : [−1, 1]→ R, x 7→{

0 für x ≤ 0,1 für x > 0,

erhält man Uf (Z) ≤ Of (Z) ≤ Uf (Z) + ‖Z‖ für jede Zerlegung Z ∈ Z[−1, 1]; siehe Skize.Folglich ist die Funktion Riemann-integrierbar. Weiters sieht man leicht, dass Uf (Z) ≤ 1 sowieOf (z) ≥ 1 gilt, und daher

∫ 1

−1f(x) dx = 1 ist.

(d) Für die Sprungfunktion

f : [0, 1]→ R, x 7→{

1 für x ∈ Q,0 für x 6∈ Q,

gilt Uf (Z) = 0 und Of (Z) = 1 für jede Zerlegung Z ∈ Z[0, 1], da es in jedem Intervall [xi−1, xi]sowohl rationale als auch irrationale Zahlen gibt. Die Sprungfunktion ist daher nicht Riemann-integrierbar.(e) Die Funktion

f : [0, 1]→ R, x 7→{

1/ 4√x für x > 0,

0 für x = 0,

ist unbeschränkt. Für jede Zerlegung Z ∈ Z[0, 1] gilt daher Of (Z) =∞. Unbeschränkte Funk-tionen sind somit nicht R-integrierbar. Wir werden später sehen, dass die Fläche unter derKurve trotzdem beschränkt ist und das Integral über f als uneigentliches Integral definieren.

Den Nachweis der Integrierbarkeit erleichtern die folgenden Aussagen:

Page 36: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

30 Integralrechnung in einer Variablen

2.6. Satz (Kriterien für Integrierbarkeit).

(a) Riemann Kriterium:Eine Funktion f : [a, b] → R ist genau dann R-integrierbar über [a, b], wenn es für jedesε > 0 eine Zerlegung Z ∈ Z[a, b] gibt mit Of (Z)− Uf (Z) < ε.

(b) Hinreichendes Kriterium:Ist f : [a, b]→ R (1) monoton oder (2) stetig, dann ist f R-integrierbar.

Beweis: (a) siehe Ansorge/Oberle I, Satz 13.2.1.

(b1) Sei f : [a, b] → R monoton wachsend. Dann gilt für jede äquidistante Zerlegung Zn = {a + ih :0 ≤ i ≤ n} mit Feinheit h = (b− a)/n dass

Of (Zn)− Uf (Zn) =n∑i=1

[f(xi)− f(xi−1)](xi − xi−1)

=n∑i=1

[f(xi)− f(xi−1)]h = [f(b)− f(a)](b− a)/n.

Die Differenz geht mit n→∞ gegen 0 und das Riemann’schen Kriterium liefert die Behauptung.

(b2) Die stetige Funktion f ist auf der kompakten Menge [a, b] gleichmäßig stetig, d.h.,

∀ε > 0 ∃δ > 0 ∀|x− y| < δ : |f(x)− f(y)| < ε.

Für jede beliebige Zerlegung Z ∈ Z[a, b] mit ‖Z‖ < δ folgt somit

Of (Z)− Uf (Z) =

n∑i=1

[sup f([xi − xi−1])− inf f([xi, xi−1])] (xi − xi−1) ≤ ε (b− a).

Die Integrierbarkeit folgt dann wiederum mit dem Riemann Kriterium.

2.7. Bemerkung. (a) Nach dem Riemann Kriterium genügt zum Nachweis der Integrierbarkeitzu zeigen, dass, Of (Zn)− Uf (Zn)→ 0 für eine Folge von Zerlegungen {Zn}.(b) Falls f integrierbar ist, dann existiert dem Riemann-Kriterium eine Folge (Zn)n∈N vonZerlegungen mit 0 ≤ Of (Zn)− Uf (Zn) ≤ 1/n. Hieraus folgt

limn→∞

Uf (Zn) = limn→∞

Of (Zn) =

∫ b

a

f(x)dx.

Da für jede Riemannsumme bezüglich Zn auch Uf (Zn) ≤ Rf (Zn) ≤ Of (Zn) gilt, folgt weiters∫ b

a

f(x)dx = limn→∞

Rf (Zn)

für diese Folge von Zerlegungen. Die Formel gilt sogar für jede Folge von Zerlegungen (Zn)n∈Nmit ‖Zn‖ → 0, und wir schreiben daher auch∫ b

a

f(x)dx = lim‖Z‖→0

Rf (Z).

Page 37: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

2.1 Das Riemann-Integral 31

Das Riemann-Integral stimmt also mit dem Grenzwert der Riemannsummen Rf (Z) überein,wenn die Feinheit der Zerlegungen Z gegen 0 geht. Insbesondere ist der Grenzwert der Rie-mannsummen unabhängig von der Wahl der Zerlegungen und der Stützstellen.

Der folgende Satz gibt einen Überblick über elementare Eigenschaften des R-Integrals, welchesich unmittelbar aus den entsprechenden Eigenschaften der Ober- und Untersumme ergeben.

2.8. Satz (Eigenschaften des Integrals).Seien f, g : [a, b]→ R integrierbar. Dann gilt:(a) Additivität bzgl des Integrationsgebietes:∫ b

a

f(x) dx =

∫ c

a

f(x) dx+

∫ b

c

f(x) dx für jedes a < c < b.

Man definiert dann sinngemäß∫ a

b

f(x); dx := −∫ b

a

f(x) und∫ a

a

f(x) dx := 0.

(b) Linearität bezüglich der Integranden:∫ b

a

αf(x) + g(x) dx = α

∫ b

a

f(x) dx+

∫ b

a

g(x) dx für jedes α ∈ R.

(c) Positivität: Falls f(x) ≥ 0 für alle x ∈ [a, b], dann gilt∫ baf(x) dx ≥ 0.

(d) Obere und untere Schranken:

(b− a) inf f([a, b]) ≤∫ b

a

f(x) dx ≤ (b− a) sup f([a, b]).

(e) Betrag, Max, Min, Produkt, Quotient: Die Funktionen

max(f, g) : x 7→ max(f(x), g(x)), min(f, g) : x 7→ min(f(x), g(x))

f · g : x 7→ f(x)g(x), |f | : [a, b]→ R, x 7→ |f(x)|

sind wieder integrierbar über [a, b]. Gilt |g(x)| ≥ C > 0 für alle x ∈ [a, b], dann ist auch

f/g : [a, b]→ R, x 7→ f(x)/g(x) integrierbar.

(f) Abschätzung für den Betrag:∣∣∣ ∫ b

a

f(x) dx∣∣∣ ≤ ∫ b

a

|f(x)|dx ≤ (b− a) sup{|f(x)| : a ≤ x ≤ b}.

Page 38: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

32 Integralrechnung in einer Variablen

Beweis: Wir skizzieren das generelle Vorgehen am Beweis der ersten Aussage von (e): Nach demRiemann-Kriterium existiert für jedes n ∈ N eine Zerlegung Zn mit Of (Zn) − Uf (Zn) < 1/n undOg(Zn)− Ug(Zn) < 1/n. Wie man anhand einer Skizze leicht sieht, gilt für jedes Intervall [xk−1, xk]

supx∈[xk−1,xk]

max{f(x), g(x)} − infx∈[xk−1,xk]

max{f(x), g(x)}

≤ max{

supx∈[xk−1,xk]

f(x)− infx∈[xk−1,xk]

f(x), supx∈[xk−1,xk]

g(x)− infx∈[xk−1,xk]

g(x)}.

Mit Summation über alle Intervalle folgt

Omax(f,g)(Zn)− Umax(f,g) ≤ (Of (Zn)− Uf (Zn)) + (Og(Zn)− Ug(Zn)) ≤ 2/n,

was mit dem Riemann-Kriterium die integrierbarkeit von max(f, g) zeigt.Man veranschauliche sich die restlichen Behauptungen grafisch. Sie folgen aus Eigenschaften der Ober-bzw Untersummen, dem Riemann-Kriterium, und den Aussagen über Grenzwerte von Folgen.

2.9. Bemerkung. Zusammen mit dem hinreichenden Kriterium für Integrierbarkeit zeigt dieAdditivität bezüglich des Integrationsgebietes, dass auch stückweise stetige (oder monotone)beschränkte Funktionen mit endlich vielen Sprungstellen integrierbar sind. Seien a = x0 < x1 <. . . < xn = b die Sprungstellen. Dann erhält man∫ b

a

f(x) dx =n∑i=1

∫ xi

xi−1

f(x) dx.

Da f nach Annahme auf den Intervallen [xi−1, xi] stetig fortsetzbar ist, folgt die Existenzder Integrale auf der rechte Seite. Sind Zi Zerlegungen der Teilintervalle [xi−1, xi], dann istZ =

⋃i Zi eine Zerlegung von [a, b]. Somit folgt aus Integrierbarkeit über Teilintervallen auch

die Integrierbarkeit über [a, b].

2.2 Hauptsatz der Differential- und Integralrechnung

Die Berechnung von Integralen wird wesentlich durch die folgenden Resultate erleichtert, welchezeigen, dass Integration als Umkehrung der Differentiation verstanden werden kann.

2.10. Definition und Satz.(a) Eine differenzierbare Funktion F : [a, b]→ R heißt Stammfunktion zu f : [a, b]→ R,falls F ′(x) = f(x) für alle x ∈ [a, b] gilt.

(b) Ist F (x) Stammfunktion von f(x), dann auch jede Funktion G(x) = F (x) + c mit c ∈ Rund jede Stammfunktion hat diese Form.

Beweis: Aus F ′(x) = f(x) = G′(x) folgt F ′(x) − G′(x) = 0 also ist F (x) − G(x) konstant. Stamm-funktionen sind also (nur) bis auf Konstante eindeutig bestimmt.

Page 39: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

2.2 Hauptsatz der Differential- und Integralrechnung 33

2.11. Hauptsatz der Differential- und Integralrechnung.

Sei f : [a, b]→ R stetig und somit integrierbar über [a, b]. Dann gilt:

1. Hauptsatz: F : [a, b]→ R, x 7→∫ xaf(t) dt ist eine Stammfunktion von f , d.h.,

F ′(x) =d

dx

∫ x

a

f(t) dt = f(x) ∀x ∈ [a, b].

Stammfunktionen lassen sich also durch Integration bestimmen.

2. Hauptsatz: Ist F : [a, b]→ R eine Stammfunktion von f , so gilt∫ b

a

f(x) dx =

∫ x

a

F ′(t)dt = F (b)− F (a) =: F (x)|ba.

Integrale lassen sich also mittels Stammfunktion berechnen.

Mittelwertsatz der Integralrechnung: Es gibt ein ξ ∈ (a, b) mit∫ b

a

f(x) dx = f(ξ)(b− a).

Die Fläche unter dem Graph einer Funktion lässt sich als Rechtecksfläche darstellen.

Beweis: (a) (Skizze!) Nach Definition von F gilt

F (x+ h)− F (x) =

∫ x+h

xf(t) dt =

∫ x+h

x(f(t)− f(x)) dt+ f(x)h.

Da f in x stetig ist, gibt es für jedes ε > 0 ein δ > 0 sodass |f(t)− f(x)| < ε für alle t mit |t− x| < δ.Somit folgt

|F (x+ h)− F (x)− f(x)h| ≤ εh für alle |h| < δ.

Da ε beliebig war, folgt, dass |F (x+ h)− F (x)− f(x)h|/|h| → 0 mit h→ 0. Also ist F differenziebarin x mit F ′(x) = f(x).

(b) Nach (a) und dem Satz über Stammfunktionen lässt sich jede Stammfunktion als F (x) =∫ xa f(t) dt+

c mit c ∈ R schreiben. Mit x = a folgt c = F (a) und mit x = b folgt daraus die Behauptung.

(c) Folgt aus (b) und dem 1. Mittelwertsatz der Differentialrechnung angewendet auf F (x), denn∫ b

af(x) dx = F (b)− F (a)

MWS= F ′(ξ)(b− a) = f(ξ)(b− a).

2.12. Bemerkung. Ist f : [a, b] → R unstetig in x0 ∈ (a, b), dann besitzt die FunktionF (x) :=

∫ xaf(t) dt in x0 einen Knick, und ist daher i.a. in x0 nicht differenzierbar (jedoch

von links und von rechts differenzierbar). Der Begriff der Stammfunktion sowie der Hauptsatzlässt sich hiermit sinngemäß auf stückweise stetige Funktionen f übertragen. Wir nennen diezugehörigen Stammfunktionen F dann stückweise stetig differenzierbar.

Page 40: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

34 Integralrechnung in einer Variablen

Hauptsatz für stückweise stetige Funktionen.

2.13. Bemerkung (Unbestimmte Integrale).Sei F eine Stammfunktion zu f . Dann heißt

∫f(x) dx = F (x) + C, C ∈ R,

unbestimmtes Integral von f ; dies bezeichnet die Gesamtheit aller Stammfunktionen. DurchWahl der Integrationskonstanten C erhält man dann spezielle Stammfunkionen.

Die Gültigkeit der folgenden Integrationsformeln lässt sich mit Hilfe des Hauptsatzes einfachdurch Differenzieren nachrechnen.

∫xn dx = 1

n+1xn+1 + C (n 6= −1),∫

1xdx = ln |x|+ C (x 6= 0),∫eaxdx =

1

aeax + C (a 6= 0),∫

bxdx =1

ln bbx + C (b > 0, b 6= 1),∫

sin(ax) dx = − 1a

cos(ax) + C (a 6= 0),∫cos(ax) dx = 1

asin(ax) + C (a 6= 0),∫

sinh(ax) dx = 1a

cosh(ax) + C (a 6= 0),∫cosh(ax) dx = 1

asinh(ax) + C (a 6= 0),

Page 41: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

2.3 Wichtige Integrationstechniken 35

∫1√

1− x2dx = arcsin(x) + C (|x| < 1),∫

1√1 + x2

dx = ln(x+√

1 + x2) + C,∫1

1− x2dx = 1

2ln |1+x

1−x |+ C (|x| 6= 1),∫1

1 + x2dx = arctan(x) + C.

Aus der Linearität des Integrals sowie den Stammfunktionen für die Monome xn erhält mansofort die folgende Regel für die Integration von Polynomen:∫

a0 + a1x+ . . .+ anxn dx = a0x+ a1

x2

2+ . . .+ an

xn+1

n+ 1+ C.

Diese und weitere Integrationsformel findet man auch in gängigen Formelsammlungen.

2.3 Wichtige Integrationstechniken

Neben den elementaren Eigenschaften des Integrals, welche schon weiter oben besprochen wur-den, sind folgende Regeln hilfreich für das Berechnen von Integralen.

2.14. Satz (Integrationsregeln).

(a) Partielle Integration:Seien g, h : [a, b]→ R stetig differenzierbar. Dann gilt∫ b

a

g(t)h′(t) dt = g(t)h(t)∣∣∣ba−∫ b

a

g′(t)h(t) dt.

(b) Substitutionsregel:Seien s : [a, b]→ [c, d] stetig differenzierbar und g : [c, d]→ R stetig. Dann gilt∫ b

a

g(s(t))s′(t) dt =

∫ s(b)

s(a)

g(s) ds.

Beweis: (a) Nach der Produktregel für das Differenzieren gilt

(gh)′(t) = g′(t)h(t) + g(t)h′(t).

Page 42: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

36 Integralrechnung in einer Variablen

Wendet man den Hauptsatz der Integralrechnung auf F (t) = g(t)h(t) an, so erhält man

g(t)h(t)∣∣ba

= F (t)|ba =

∫ b

aF ′(t)dt =

∫ b

ag′(t)h(t) + g(t)h′(t)dt =

∫ b

ag′(t)h(t)dt+

∫ b

ag(t)h′(t)dt.

Die Aussage folgt dann durch Umordnen der Terme.

(b) Sei G eine Stammfunktion zu g und F (t) := G(s(t)). Dann gilt nach der Kettenregel

d

dtF (t) =

d

dtG(s(t)) = G′(s(t))s′(t) = g(s(t))s′(t).

Anwenden des Hauptsatzes liefert∫ s(b)

x(a)g(s)ds = G(s)

∣∣s(b)s(a)

= F (s(t))∣∣ba

=

∫ b

aF ′(t)dt =

∫ b

ag(h(t))h′(t)dt.

2.15. Bemerkung. (a) Die Substitutionsregel lässt sich wie folgt merken: Durch Differenzierenerält man

ds

dt= s′(t) bzw. formal ds = s′(t)dt.

Ebenso könnte man die Taylorformel verwenden: ds = s(t + dt)− s(t) ≈ s′(t)dt. Diese Formelbeschreibt also, wie sich die Größe eine kleines Intervalls in der Riemannsumme durch dieSubstitution verändert.

(b) Aus den Integrationsregeln erhält man auch wieder Formeln für unbestimmte Integrale:∫g(x)h′(x) dx = g(x)h(x)−

∫g′(x)h(x) dx+ C

und ∫g(s(t))s′(t)dt = G(s(t)) + C,

wobei, wie im Beweis, G eine Stammfunktion zu g ist.

2.16. Beispiele zur partiellen Integration.

(a) Mit∫exdx = ex + C und d

dxx = 1 erhält man mittels partieller Integration∫

xexdx = xex −∫

1exdx+ C1 = (x− 1)ex + C2.

(b) Wir wenden die Formel der partiellen Integration mit g(x) = ln(x) und h(x) = 1 an. Danngilt ∫

ln(x)dx =

∫ln(x) · 1 dx = ln(x)x−

∫1xx dx+ C1 = (ln(x)− 1)x+ C2.

Page 43: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

2.3 Wichtige Integrationstechniken 37

(c) Für g(x) = sin(x) und h(x) = − cos(x) gilt g′(x) = cos(x) und h′(x) = sin(x). Die Regelder partiellen Integration liefert dann∫

sin2(x)dx =

∫sin(x)︸ ︷︷ ︸g(x)

sin(x)︸ ︷︷ ︸h′(x)

dx = − sin(x)︸ ︷︷ ︸g(x)

cos(x)︸ ︷︷ ︸h(x)

−∫

cos(x)(− cos(x))dx+ C1.

Ersetzt man cos2(x) = 1− sin2(x), dann erhält man durch einfaches Umstellen

2

∫sin2(x)dx = − sin(x) cos(x) +

∫1dx+ C2 = − sin(x) cos(x) + x+ C2,

woraus sich die Stammfunktion∫

sin2(x)dx = 12[x− sin(x) cos(x)] + C ergibt.

2.17. Beispiele zur Substitutionsregel.

(a) Wendet man die Substitutionsregel mit s(t) = a+ b− t an, so erhält man∫ a

b

f(s)ds =

∫ s(b)

s(a)

f(s)ds =

∫ b

a

f(s+ b− t)(−1)dt = −∫ b

a

f(t)dt,

wobei man die letzte Gleichheit durch Betrachten der Riemannsummen sieht.

(b) Zur Berechnung des Integrals∫ √

1− ( sa)2ds setzen wir s(t) = −a cos(t). Mit der Substitu-

tionsregel und s′(t) = a sin(t) folgt∫ a

−a

√1− (

s

a)2ds =

∫ s(π)

s(0)

√1− (

s

a)2ds =

∫ π

0

√1− cos2(t)(a sin(t)) dt.

Mit dem Satz von Pythagoras folgt 1− cos2(t) = sin2(t) und da sin(t) ≥ 0 für 0 ≤ t ≤ π folgt√1− cos2(t) = sin(t) und weiters∫ a

−a

√1− (

s

a)2ds =

∫ π

0

sin(t)a sin(t) dt = a

∫ π

0

sin2(t)dt.

Das letzte Integral wurde oben mit partieller Integration bestimmt.

(c) Wir versuchen, das Integral∫e√sds mittels Substitution zu berechnen. Mit der Substituti-

onsregel folgt ∫ s(b)

s(a)

e√sds =

∫ b

a

e√s(t)s′(t)dt = (∗).

Man sieht, dass die Wahl s(t) = t2 die Integration wesentlich vereinfacht. Für 0 ≤ a ≤ ist√s(t) =

√t2 = |t| = t für alle a ≤ t ≤ b und wir erhalten

(∗) =

∫ b

a

et2t dt = s

∫ b

a

ett dt.

Dieses Integral wurde oben schon mit partieller Integration berechnet.Achtung: Falls a ≤ b ≤ 0 wäre, müsste man

√t2 = |t| = −t verwenden. Falls a < 0 und b > 0

ist, könnte man das Integral zuerst aufteilen in∫ baf(x)dx =

∫ 0

af(x)dx +

∫ b0f(x)dx und beide

Terme entsprechend behandeln.

Page 44: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

38 Integralrechnung in einer Variablen

Bemerkung: Integration rationaler Funktionen – Partialbruchzerlegung

Wir haben bereits Stammfunktionen für einfache rationale Funktionen kennengelernt, nämlich∫1

xdx = ln |x|+C,

∫1

xndx =

1

1− n1

xn−1+C (n > 1) und

∫1

x2 + 1dx = arctan(x)+C.

Die Fälle∫

1/(x− a)ndx und∫

1/(x2 + ax+ b)ndx mit x2 + ax+ b > 0 für alle x kann man mitSubstitution und partieller Integration auf obige zurückführen.

Wir werden jetzt untersuchen, wie diese Formeln dazu verwendet werden können, um Stamm-funktionen für allgemeine rationale Funkionen

f(x) =a0 + a1x+ . . .+ anx

n

b0 + b1x+ . . .+ bmxm

zu finden. Dabei geht man wie folgt vor:

Schritt 1: Durch Polynomdivision kann man jede rationale Funktion auf die Form

f(x) = r(x) +p(x)

q(x)

bringen, wobei r, p, q Polynome sind und der Grad von p echt kleiner als der Grad von q. Z.B.erhält man durch Erweitern und Kürzen (Polynomdivision)

x2 + 1

x2 − 1=x2 − 1 + 2

x2 − 1= 1 +

2

x2 − 1.

Die Integration des Polynoms r(x) wurde oben schon behandelt und die Integration des ratio-nalen Termes p(x)/q(x) wird jetzt beschrieben.

Schritt 2: Nach dem Hauptsatz der Algebra lässt sich jedes reelle Polynom q(x) in Elemen-tarfaktoren zerlegen, d.h., es gilt

q(x) = c(x− x1)k1 · · · (x− xn1)kn1 (x2 + c1x+ d1)l1 · · · (x2 + cn2x+ dn2)

ln2 .

(Auf die quadratischen Faktoren kommt man, wenn man zuerst das Polynom in komplexeLinearfaktoren zerlegt, und dann komplex-konjugierte Terme kombiniert). Die quadratischenTerme besitzen keine reellen Nullstellen und sind daher strikt positiv.

Schritt 3 (Partialbruchzerlegung): Für den Quotienten p/q machen wir folgenden Ansatz:

p(x)

q(x)=

n1∑j=1

[ αj1x− xj

+ . . .+αjkj

(x− xj)kj]

+

n2∑j=1

[ βj1 + γj1x

x2 + cjx+ dj+ . . .+

βjkj + γjkjx

(x2 + cjx+ dj)kj

].

Page 45: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

2.4 Uneigentliche Integrale 39

Um die Koeffizienten αjk, βjk und γjk zu bestimmen, bringt man die Terme auf gemeinsamenNenner und führt einen Koeffizientenvergleich durch. Dieser Ansatz führt tatsächlich immerzum Ziel, siehe Ansorge/Oberle I Kap 13.4.

Schritt 4: Die Stammfunktion von pqfindet man dann durch Integration der einzelnen Terme.

Achtung: Der Hauptsatz der Differential- und Integralrechnung ist nur auf Teilintervallenanwendbar, wo q(x) keine Nullstellen besitzt und somit p/q beschränkt und stetig ist!

Stammfunktionen für die einzelnen Terme kann man mittels Substitution und Partialbruchzer-legung sowie auf die bereits bekannten Formeln zurückführen.

2.18. Beispiel. Gesucht ist eine Stammfunktion zu f(x) = 1−xx2(x2+1)

.Lösung: Die rationale Funktion lässt sich nicht weiter kürzen und der Nenner ist bereitsfaktorisiert. Wir machen also den Ansatz

1− xx2(x2 + 1)

=a1

x+a2

x2+b1 + b2x

x2 + 1.

Durch Multiplikation mit x2(x2 + 1) erhalten wir hieraus

1− x = a1x(x2 + 1) + a2(x2 + 1) + b1x2 + b2x

3.

Ein Vergleich der Koeffizienten vor x0, x1, . . . auf beiden Seiten liefert nun x0: 1 = a2, x1:−1 = a1, x2: 0 = a2 + b1, x3: 0 = a1 + b2. Auflösen dieser Gleichungen führt auf a2 = 1,a1 = −1, b1 = −1, b2 = 1, also

1− xx2(x2 + 1)

= −1

x+

1

x2+

x− 1

x2 + 1.

Mit obigen Formel für die einzelnen Terme erhält man schließlich∫1− x

x2(x2 + 1)dx = −

∫1

xdx+

∫1

x2dx+

1

2

∫2x

x2 + 1dx−

∫1

x2 + 1dx

= − ln |x| − 1

x+

1

2ln(x2 + 1)− arctan(x) + C,

wobei die letzte Gleichheit aus den bereits bekannten Stammfunktionen folgt.

Das obige Vorgehen zeigt, wie man für rationale Funktionen per Hand Stammfunktionen findenkann. In der Praxis wird man dazu jedoch häufig symbolische Programmpakete wie Mathe-matica oder Maple verwenden.

2.4 Uneigentliche Integrale

Bei der Definition des Riemann-Integrals wurde vorausgesetzt, dass der Integrationsbereichbeschränkt (kompakt) und die zu integrierende Funktion beschränkt ist. Wir werden nun denIntegralbegriff erweitern, um auch andere Fälle behandeln zu können.

Page 46: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

40 Integralrechnung in einer Variablen

2.19. Definition (Uneigentliches Riemann-Integral)

(a) Die Funktion f : (a, b] → R sei für jedes hinreichend kleine ε > 0 über [a + ε, b]R-integrierbar. Falls existent, heißt der Grenzwert∫ b

a

f(x)dx := limε↘0

∫ b

a+ε

f(x)dx

uneigentliches Riemann-Integral von f über (a, b] und f heißt uneigentlich R-integrierbar.In gleicher Weise definiert man das uneigentliche Integral für Funktionen f : [a, b)→ R, dieüber jedem Intervall [a, b− ε] integrierbar sind.(b) Die Funktion f : (−∞, b] → R sei für jedes hinreichend große A auf [−A, b] R-Integrierbar. Falls existent, heißt der Grenzwert∫ b

−∞f(x)dx := lim

−A→−∞

∫ b

−Af(x)dx

uneigentliches Riemann-Integral von f über (−∞, b] und f heißt uneigentlich R-integrierbar.Gleiches gilt für Funktionen f : [a,∞) → R, die über jedem Intervall [a,B] R-integrierbarsind.

2.20. Bemerkung. (a) Den Fall f : (a, b) → R mit zwei problematischen Grenzen kann manmittels ∫ b

a

f(x)dx :=

∫ c

a

f(x)dx+

∫ b

c

f(x)dx

auf obige Fälle zurückführen. Die linken bzw. rechten Grenzwerte sind dabei getrennt vonein-ander zu berechnen – im Unterschied zum “Cauchy’schen Hauptwert”; siehe Beispiel (c).

(b) Der Fall, dass die Funktion f : [a, b] → R in x0 ∈ (a, b) eine Singularität besitzt, kannebenfalls durch Teilen des Integrationsgebietes in [a, x0] und [x0, b] auf obige Fälle reduziertwerden; vgl. Bsp (d) unten.

(c) Sei D ⊂ R ein Intervall. Funktionen f : D → R die auf allen kompakten (beschränkt, ab-geschlossen) Teilinterintervallen von D R-integrierbar sind, heißen lokal integrierbar. In obigerDefinition kann man also “integrierbar auf [a + ε, b] für jedes ε” bzw “integrierbar auf [−A, b]für jedes A hinreichend groß” durch “lokal integrierbar” ersetzen.

2.21. Beispiele. (a) Wir betrachten die Funktion f : (0, 1] → R, x 7→ x−2/3, welche auf (0, 1]unbeschränkt und daher nicht (eigentlich) R-integrierbar ist. Für ε > 0 erhalten wir∫ 1

ε

x−2/3dx = 3x1/3∣∣∣1x=ε

= 3− 3ε1/3.

Für ε→ 0 konvergiert das Integral gegen 3; die Funktion f ist also uneigentlich R-integrierbar.Man kann zeigen, dass das Integral wiederum gerade der Fläche unter der Kurve entspricht,

Page 47: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

2.4 Uneigentliche Integrale 41

die beschränkt bleibt, obwohl die Funktion f unbeschränkt ist.

(b) Das Integral über die Exponentialfunktion ist∫ 0

−Aexp(x)dx = exp(x)

∣∣0x=−A = 1− exp(−A).

Für −A→ −∞ konvergiert das Integral gegen 1. Die Exponentialfunktion ist also über (−∞, 0]

uneigentlich R-Integrierbar mit∫ 0

−∞ exp(x)dx = 1, was gerade wieder der Fläche unter derKurve entspricht.

(c) Für die Funktion f : (−1, 1)→ R, x 7→ x1−x2 und 0 < B < 1 gilt∫ B

0

2x

1− x2dx = − ln(1− x2)|Bx=0 = − ln(1−B2).

Der Grenzwert für B → 1 existiert nicht; die Funktion ist also auf [0, 1) nicht uneigentlichintegrierbar, und folglich auch nicht über (−1, 1). Nähert man sich der linken und rechtenGrenze allerdings in gleicher Weise an, erhält man∫ B

−Bf(x)dx = ln(1−B2)− ln(1−B2) = 0.

Der zugehörige Grenzwert für B → 1 heißt Cauchy’scher Hauptwert (man schreibt dafür etwaCHW-

∫ 1

−1f(x)dx = 0). Dieser kann existieren, obwohl die Funktion f nicht uneigentlich R-

integrierbar ist!

(d) Die Funktion

f : [−1, 1]→ R, x 7→{x−2/3 x 6= 0,0 x = 0

besitzt in x0 = 0 eine Singularität. Nach (a) existiert das uneigentliche Integral∫ 1

0x−2/3dx.

Wegen (−x)−2/3 = ((−x)2)1/3 = (x2)1/3 = x−2/3 existiert auch das uneigentliche Integral∫ 0

−1x−2/3dx =

∫ 1

0x−2/3dx = 3. Somit ist f auf [−1, 1] uneigentlich R-integrierbar mit∫ 1

−1

x−2/3dx =

∫ 0

−1

x−2/3dx+

∫ 1

0

x−2/3dx = 6.

Die Existenz uneigentlicher Integrale kann ähnlich wie die die Konvergenz von Reihen überprüftwerden. Aufgrund der Definition über Riemannsummen ist dies nicht verwunderlich.

2.22. Definition Sei f : [a,∞)→ R lokal integrierbar. Dann gilt:

(a) Cauchy-Kriterium: Das uneigentliche Integral∫∞af(x)dx existiert genau dann,

wenn∀ε > 0 ∃N > a ∀x1, x2 ≥ N :

∣∣ ∫ x2

x1

f(x)dx∣∣ < ε.

Page 48: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

42 Integralrechnung in einer Variablen

(b) Absolute Konvergenz: Existiert das uneigentliche Integral∫∞a|f(x)|dx, so existiert

auch∫∞af(x)dx.

(c) Majorantenkriterium: Gilt |f(x)| ≤ g(x) für alle x ∈ [a,∞) und existiert das unei-gentliche Integral

∫∞ag(x)dx, dann ist auch |f | uneigentlich R-integrierbar.

(d) Minorantenkriterium: Gilt f(x) ≥ g(x) ≥ 0 für alle x ∈ [a,∞), und ist g nichtuneigentlich R-integrierbar auf [a,∞), dann existiert auch das uneigentliche Integral von fnicht.

Der Beweis dieser Aussagen erfolgt wie bei Reihen. Man spricht aufgrund der Ähnlichkeit auchvon Konvergenz der (uneigentlichen) Integrale. Der Zusammenhang wird noch klarer, wennman als Ober- bzw Unterfunktionen in (c) bzw (d) Treppenfunktionen wählt:

2.23. Bemerkung. (Konvergenz von uneigentlichen Integralen und Reihen)(a) Gegeben sei eine Folge (ak)k≥0 und eine Funktion f : [0,∞)→ R mit

|f(x)| ≥ |ak| für alle x ∈ [k, k + 1], k ≥ 0.

Falls das uneigentliche Integral∫∞

0|f(x)|dx existiert, dann konvergiert die Reihe

∑∞k=0 |ak| und

es gilt∑∞

k=0 |ak| ≤∫∞

0|f(x)|dx.

(b) Gilt umgekehrt

|f(x)| ≤ |ak| für alle x ∈ [k, k + 1], k ≥ 0,

und konvergiert die Reihe∑∞

k=0 |ak|, dann existiert auch das uneigentliche Integral∫∞

0|f(x)|dx

und es gilt∫∞

0|f(x)|dx ≤

∑∞k=0 |ak|.

Konvergenz von Reihen und uneigentlichen Integralen.

Im Fall (a) ist |f | eine Majorante für die stückweise konstante Funktion mit Werten ak auf demIntervall [k, k + 1], und im anderen Fall eine Minorante.

Page 49: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

2.5 Numerische Integration 43

2.24. Beispiele: (a) Die Funktion f : [1,∞), x 7→ cos(x)/x2 ist stetig und somit auf jedemkompakten Teilintervall von [1,∞) R-integrierbar. Weiters gilt |f(x)| ≤ 1/x2 sowie∫ ∞

1

1

x2dx = lim

B→∞

∫ B

1

1

x2dx = lim

B→∞−1

x|Bx=1 = lim

B→∞−1/B + 1 = 1.

Nach dem Majorantenkriterium ist f also uneigentlich R-integrierbar.

(b) Die Funktion f : [0,∞)→ R, x 7→ sin(x)/x ist ebenfalls stetig. Mittel partieller Integrationerhält man ∫ x2

x1

sin(x)

xdx = −cos(x)

x

∣∣x2x1−∫ x2

x1

cos(x)

x2dx.

Durch elementares Abschätzen erhält man weiters

|∫ x2

x1

sin(x)

xdx| ≤ 1

x1

+1

x2

+

∫ x2

x1

1

x2dx =

2

x1

→ 0 (x1 →∞).

Nach dem Cauchy-Kriterium ist die Funktion sin(x)/x also uneigentlich R-Integrierbar. Mankann zeigen, dass

∫∞0

sin(x)/xdx = π/2 gilt. Die Funktion ist allerdings nicht absolut uneigent-lich integrierbar, denn∫ nπ

0

∣∣∣sin(x)

x

∣∣∣dx =n∑k=1

∫ kπ

(k−1)π

∣∣∣sin(x)

x

∣∣∣dx ≥ n∑k=1

∫ kπ−π/4

(k−1)π+π/4

∣∣∣sin(x)

x

∣∣∣dx≥

n∑k=1

1√2

1

kπ − π/4π

2≥ 1

2√

2

n∑k=1

1

k.

Lässt man die n und somit die obere Grenze gegen ∞ gehen, divergiert also das Integral überden Betrag.

2.5 Numerische Integration

Motivation: Die Definition des Integrals über Riemannsummen∫ b

a

f(x)dx = lim‖Z‖→0

Rf (Z) = limmaxk |xk−xk−1|→0

n∑k=1

f(ξk)(xk − xk−1), ξk ∈ [xk−1, xk]

liefert auch gleich eine Methode, um Integrale numerisch zu berechnen. Hierzu unterteilt mandas Integrationsgebiet in Intervalle [xk−1, xk], 1 ≤ k ≤ n und wählt geeignete Stützstellenξk. Aufgrund der Definition des Integrals wissen wir bereits, dass In(f ; a, b) gegen

∫ baf(x)dx

konvergiert, wenn die Feinheit maxk |xk − xk−1| der Zerlegung gegen 0 konvergiert.

Page 50: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

44 Integralrechnung in einer Variablen

Durch Aufteilen des Integrationsgebietes [a, b] in Teilintervalle [xk−1, xk] kann man etwas allge-meiner summierte Quadraturformeln definieren, und zwar∫ b

a

f(x)dx =n∑k=1

∫ xk

xk−1

f(x)dx ≈xk∑xk−1

Ih(f ;xk−1, xk)

wobei die (lokale) Quadraturformel Ih(f ;xk−1, xk) eine Näherung für des Integral∫ xkxk−1

f(x)dx

über das kte Teilintervall sein soll.

Konstruktion lokaler Quadraturformeln

Wir werden jetzt anhand von Beispielen diskutieren, wie man zu guten lokalen Quadraturfor-meln Ih(f ;xk−1, xk) kommt und Fehlerabschätzungen für diese herleitet. Hierzu bezeichnen wirim Folgenden mit h := xk − xk−1 die Länge des Integrationsgebietes.

2.25. Linksseitige Rechtecksregel: Zur Approximation des Integrals verwenden wir∫ xk

xk−1

f(x)dx ≈ hf(xk−1) =: LRh(f ;xk−1;xk).

Mit dem Mittelwertsatz erhält man

|∫ xk

xk−1

f(x)dx− LRh(f ;xk−1, xk)| = |∫ xk

xk−1

f(x)− f(xk−1)dx|

≤∫ xk

xk−1

| f(x)− f(xk−1)︸ ︷︷ ︸=f ′(ξx)(ξx−xk−1)

|dx ≤ h2 maxxk−1≤ξ≤xk

|f ′(x)|

Falls f auf [xk−1, xk] stetig differenzierbar ist, gilt also für den lokalen Integrationsfehler

|∫ xk

xk−1

f(x)dx− Ih(f ;xk−1, xk)| = O(h2).

2.26. Rechtsseitige Rechtecksregel: Wählt man als Approximation∫ xk

xk−1

f(x)dx ≈ hf(xxk) =: RRh(f ;xk−1, xk)

so gilt für den lokalen Integrationsfehler wiederum

|∫ xk

xk−1

f(x)dx−Rh(f ;xk−1, xk)| ≤ h2 maxxk−1≤ξ≤xk

|f ′(ξ)| = O(h2).

Page 51: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

2.5 Numerische Integration 45

2.27. Mittelpunktsregel: Zur Approximations des Integrals wählen wir das Rechteck, dessenHöhe durch den Funktionswert in der Mitte des Intervalls bestimmt ist. Dies führt auf∫ xk

xk−1

f(x)dx ≈ hf(xk−1+xk2

) =: MPh(f ;xk−1, xk)

Dann gilt für den Fehler (siehe Übung)

|∫ xk

xk−1

f(x)dx−MPh(f ;xk−1, xk)| ≤ h3 maxxk−1≤ξ≤xk

|f ′′(ξ)| = O(h3).

Die Mittelpunktsregel liefert also eine um eine Ordnung in h bessere Approximation für dasIntegral als die einseitigen Rechtecksregeln.

2.28. Trapezregel: Zur Approximation des Integrals kann neben einer Rechtecks- auch eineTrapezfläche verwenden. Fordert man, dass das Trapez an den Endpunkten xk−1 und xk durchden Funktionsgraphen geht, erhält man die Formel∫ xk

xk−1

f(x)dx ≈ h

2(f(xk−1 + f(xk)) =: Th(f ;xk−1, xk).

Mit Taylorentwicklung und Mittelwertsatz zeigt man auch hier wiederum

|∫ xk

xk−1

f(x)dx− Th(f ;xk−1, xk)| ≤ h3 maxxk−1≤ξ≤xk

|f ′′(ξ)| = O(h3).

Bei der Konstruktion der Trapezregel sind wir formal wie folgt vorgegangen:

(i) die Funktion f(x) wird durch ein Polynom p(x) (z.B. Interpolationspolynom) approxi-miert;

(ii) zur Approximation des Integrals∫ xkxk−1

f(x)dx verwendet man das Integral∫ xkxk−1

p(x)dx

des Integrationspolynoms; dieses kann explizit berechnet werden.

2.29. Newton-Cotes Formeln: Wählt man p als Interpolationspolynom vom Grad n mitäquidistanten Stützstellen ξj = xk−1 + j h

n, so erhält man die sogenannten Newton-Cotes For-

meln.

Für n = 1 etwa lautet das Interpolationspolynom p1(x) = f(xk−1) + x−xk−1

xk−xk−1(f(xk)− f(xk−1)).

Durch Integration erhält man∫ xk

xk−1

p1(x)dx =h

2[f(xk−1) + f(xk)]

was gerade wieder der Trapezregel entspricht.

Page 52: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

46 Integralrechnung in einer Variablen

Aus der Konstruktion ist klar, dass auch im Fall n > 1 nur Funktionswerte f(xk−1 + αjh),αj = j

n, 0 ≤ j ≤ n eine Rolle spielen und die Quadraturformeln die Form∫ xk

xk−1

f(x)dx ≈ hn∑j=0

βjf(xk−1 + αjh) =: NCn(f ;xk−1, xk)

besitzen. Dabei heißen αj = jn, 0 ≤ j ≤ n die Stützstellen und βj, 0 ≤ j ≤ n die Integrations-

gewichte.

Einige Formeln für n ≥ 1 und die zugehörigen Fehlerabschätzungen sind in folgender Tabellezusammengefasst:

n αj βj∣∣ ∫ fdx−NCn(f)

∣∣Trapezregel 1 0, 1 1

2, 1

2O(h3)

SimpsonRegel 2 0, 12, 1 1

6, 2

3, 1

6O(h5)

38-Regel 3 0, 1

3, 2

3, 1 1

8, 3

8, 3

8, 1

8O(h5)

Milne-Regel 4 0, 14, 1

2, 3

4, 1 7

90, 16

45, 2

15, 16

45, 7

90O(h7)

Tabelle 2.1: Stützstellen αj, Integrationsgewichte βj und Approximationsordnung einiger ge-bräuchlicher Newton-Cotes Formeln.

Die Abschätzungen des Quadraturfehlers basieren dabei auf den entsprechenden Interpolati-onsfehlerabschätzungen, denn∣∣ ∫ xk

xk−1

f(x)dx−NCn(f ;xk−1, xk)∣∣ ≤ ∫ xk

xk−1

|f(x)− pn(x)|︸ ︷︷ ︸≤Chn+1

dx ≤ Chn+2

wobei die Konstante C mit maxxk−1≤ξ≤xk |fn+1(ξ)| zusammenhängt. Der um 1 erhöhte Genau-igkeitsgrad der Formel für n gerade lässt sich mit Symmetrieargumenten erklären.

2.30. Bemerkung. (i) Nach Konstruktion kann man mit der Newton-Cotes Formel NCn Po-lynome f vom Grad ≤ n exakt integrieren! Man sagt: die Formeln besitzen Exaktheitsgrad n.Die Integrationsgewichte βj wurden dabei gerade so gewählt, dass dies zutrifft (=Interpolati-onsbedingungen).

(ii) Wir haben bereits gesehen, dass Interpolationspolynome höherer Ordnung unter Umständenstarke Oszillationen aufweisen können. Dies hat auch Einfluss auf die Güte der Newton-CotesFormeln von höherem Grad. Insbesondere werden bei diesen manche Integrationsgewichte ne-gativ, was Einfluss auf die Stabilität der Formeln hat. In der Praxis verwendet man daher eherFormeln niedriger Ordnung und relativ kleine lokalen Integrationsintervalle (=kleines h).

Bei den Newton-Cotes Formeln wurden die Stützstellen äquidistant gewählt. Durch geschickteWahl der (n + 1) Stützstellen αj kann man versuchen, den Exaktheitsgrad noch weiter zuerhöhen. Dies ist tatsächlich möglich:

Page 53: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

2.5 Numerische Integration 47

2.31. Gauß-Quadraturformeln: Hier wählt man zuerst die Stützstellen αj als Nullstellendes n + 1ten Legendrepolynoms, und anschließend die Integrationsgewichte βj um maximalenExaktheitsgrad zu erhalten (= lineares Gleichungssystem lösen). Dies führt auf folgende For-meln

n αj βj∣∣ ∫ fdx−Gn(f)

∣∣0 1

21 O(h3)

1 12−√

112, 1

2+√

112

12, 1

2O(h5)

2 12−√

320, 1

2, 1

2+√

320

518, 4

9, 5

18O(h7)

Tabelle 2.2: Stützstellen αj, Integrationsgewichte βj und Approximationsordnung einiger Gauß-Formeln. Die Gauß-Formel Gn besitzt dabei n+ 1 Stützstellen und hat Exaktheitsgrad 2n+ 1.Außerdem sind alle Integrationsgewichte positiv.

Fehlerabschätzung für summierte Integrationsregeln

Zur numerischen Integration einer Funktion über einem großen Intervall [a, b] zerlegt man, wiebei der Riemannsumme, zuerst das Intervall [a, b] in Teilintervalle [xk−1, xk] und wendet aufjedem Teilintervall eine lokale Integrationsformel an.

Verwendet man N äquidistante Intervalle [xk−1, xk] der Länge h = (b− a)/N so erhält man fürden globalen Integrationsfehler

∣∣ N∑k=1

∫ xk

xk−1

f(x)− Ih(f ;xk−1, xk)∣∣ ≤ N∑

k=1

∣∣ ∫ xk

xk−1

f(x)− Ih(f ;xk−1, xk∣∣︸ ︷︷ ︸

=O(hn+2)

= O(Nhn+2) = O(hn+1),

wobei hier n der Exaktheitsgrad der lokalen Integrationsformel Ih ist und N = b−ah≈ h−1

verwendet wurde. Durch das Aufsummieren der lokalen Fehler verliert man also wieder eineOrdnung.

Die numerische Integration mit der Trapezregel kann man etwa wie folgt realisieren:

% Teste numerische Quadratur für Integration von exp(x)function quadratur

a=0; b=1;f = @(x) exp(x);stamm = @(x) exp(x);exact = stamm(b)-stamm(a);

Page 54: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

48 Integralrechnung in einer Variablen

fprintf(’h: trapez\n’)for N=[2,4,8,16,32]

h = (b-a)/N;x = 0:h:1-h;

% trapezregelloc = h * ( 0.5*f(x+0*h) + 0.5*f(x+1*h) );glob = sum(loc);

fehler = abs( exact - glob);fprintf(’%f: %f\n’,h,fehler)

end

Ein ähnlicher Code wurde dazu verwendet, um die Werte für folgende Tabelle zu erzeugen.

h Trapez Simpson 3/80.500000 0.0356493 3.70135e-05 1.6464e-050.250000 0.00894008 2.32624e-06 1.0341e-060.125000 0.00223676 1.45593e-07 6.47113e-080.062500 0.0005593 9.10273e-09 4.04571e-090.031250 0.000139832 5.6897e-10 2.52876e-10Ordnung O(h2) O(h4) O(h4)

Tabelle 2.3: Numerischer Approximation von∫ 1

0exp(x)dx mittels Newton-Cotes Formeln.

Page 55: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

3 Anwendungen der Integralrechnung

3.1 Kurven und Kurvenintegrale

3.1. Definition (Kurve). (a) Eine stetige Funktion γ : [a, b] → Rn, t 7→ γ(t) =(γ1(t), . . . , γn(t))> heißt Kurve im Rn. Falls γ(a) = γ(b), heißt die Kurve γ geschlos-sen.

(b) Sind die Koordinatenfunktionen γi : [a, b]→ R, t 7→ γi(t) stetig differenzierbar, so heißtdie Kurve γ differenzierbar bzw C1.

(c) Eine C1-Kurve γ : [a, b]→ R heißt glatt, wenn γ′(t) 6= 0 für alle t ∈ [a, b] gilt.

Ebene und räumliche Kurven.

3.2. Bemerkung. (i) Als Kurve (Spur) bezeichnet man auch denWertebereich γ([a, b]) ⊂ Rn; γheißt auch Parameterdarstellung oder Parametrisierung der Kurve. Man beachte, dass verschie-dene Parametrisierungen für ein und dieselbe Kurve (Punktmenge) verwendet werden können.

(ii) Sinnvollerweise heißen γ(a) und γ(b) Anfangs- bzw Endpunkt der Kurve γ. Diese sind vonder gewählten Parametrisierung γ abhängig.

(iii) Vergrößert man den Parameter t, so durchläuft man die Kurve in einer bestimmten Artund Weise. Die Parametrisierung γ legt also eine Durchlaufrichtung (Orientierung) fest.

(iv) Wir werden in Beispielen sehen, dass glatte Kurven einen “glatten” Kurvenverlauf haben,

Page 56: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

50 Anwendungen der Integralrechnung

dass C1-Kurven nicht notwendigerweise glatt sind, und umgekehrt, nicht glatte Parametrisie-rungen einen glatten Verlauf haben können.

(v) Gibt es eine Zerlegung Z von [a, b], sodass γ auf allen Teilintervallen [xk−1, xk] stetig diffe-renzierbar bzw glatt ist, so heißt die Kurve γ stückweise C1 bzw stückweise glatt.

(vi) Sind die Koordinatenfunktionen mehrfach differenzierbar, so heißt die Kurve γ entspre-chend oft differenzierbar.

3.3. Beispiele. (a) Die Kurve γ : [0, 2π], t 7→ (cos t, sin t)> beschreibt einen Kreis im R2.Durch Differenzieren der Koordinatenfunktionen erhält man γ′(t) = (− sin t, cos t), also ist γeine C1-Kurve. Weiters gilt ‖γ′(t)‖2 =

√sin2 t+ cos2 t = 1 6= 0, d.h., die Kurve ist glatt.

(b) Die Kurve γ : [0, π]→ R, t 7→ (cos t, sin t, t)> beschreibt eine Schraubenlinie in R3. Auch indiesem Fall ist γ differenzierbar und glatt.

(c) Sei f : [a, b] → R stetig. Dann ist γ : [a, b] → R2, t 7→ (t, f(t))> eine Kurve im R2. Ist fstetig differenzierbar, dann auch γ und weiters ist γ glatt.

3.4. Umparametrisierung: Sei γ : [a, b]→ Rn eine Kurve und h : [α, β]→ [a, b] eine stetige,bijektive und streng monoton wachsende Funktion. Dann heißt

γ ◦ h : [α, β]→ R, t 7→ γ(h(t))

eine (orientierungserhaltende) Umparametrisierung der Kurve. Man beachte, dass γ([a, b]) =(γ ◦ h)([α, β]) gilt, d.h., der Wertebereich der Kurve wird durch Umparametrisierung nichtverändert. Ebenso bleiben Anfangs- und Endpunkt und somit der Umlaufsinn (Orientierung)der Kurve erhalten. Ist γ eine C1-Kurve und h eine C1 Funktion, dann ist auch γ ◦ h wiedereine C1-Kurve, was aus der Kettenregel folgt.

Länge einer Kurve

Als nächstes beschäftigen wir uns mit der Frage nach der Länge einer Kurve.

3.5. Zu jeder Zerlegung Z = {a = t0 < t1 < . . . < tN = b} des Intervalls [a, b] definieren wireinen Polygonzug, indem wir die Punkte γ(tk) durch Geradenstücke verbinden.

Approximationen einer Kurve durch einen Polygonzug.

Page 57: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

3.1 Kurven und Kurvenintegrale 51

Die Länge des Polygonzuges lässt sich einfach berechnen durch

L(Z) =n∑k=1

‖γ(tk)− γ(tk−1)‖2,

wobei ‖v‖2 =√∑

i v2i die Euklid’sche Norm eines Vektors v bezeichnet. Da die gerade Verbin-

dung zwischen zwei Punkten die kürzest mögliche ist, sieht man, dass für jede Zerlegung Z dieLänge L(Z) des Polygonzuges kleiner oder gleich der Länge der Kurve γ ist.

3.6. Definition und Satz (Länge der Kurve). (a) Ist {L(Z) : Z ∈ Z[a, b]} nach obenbeschränkt, dann heißt

L(γ) := supZ∈Z[a,b]

L(Z) = lim‖Z‖→0

L(Z)

Länge der Kurve γ, und γ heißt rektifizierbar.

(b) Jede C1-Kurve γ : [a, b]→ R ist rektifizierbar und es gilt

L(γ) =

∫ b

a

‖γ′(t)‖2dt.

(c) Die Länge einer Kurve ist unabhängig von der Parametrisierung, d.h. L(γ) = L(γ ◦ h)für jede zulässige Umparametrisierung h.

Beweis: (b) Für jede Zerlegung Z gilt L(Z) =∑N

k=1 ‖γ(tk)−γ(tk−1)‖2. Mit Hilfe des Mittelwertsatzeszeigt man, dass

‖γ(tk)− γ(tk−1)‖2 = ‖γ′(τk)‖2(tk − tk−1)

für ein τk ∈ (tk−1, tk) gilt. Somit entspricht L(Z) gerade einer Riemannsumme für das eindimensionaleIntegral

∫ ba ‖γ

′(t)‖2dt und die Konvergenz der Riemannsumme gegen das Integral folgt aus der Stetig-keit der Abbildung t 7→ ‖γ′(t)‖2.(c) Sei γ : [a, b]→ Rn eine C1 Kurve und h : [α, β]→ [a, b] eine streng monotone C1-Umparametrisierung.Dann gilt nach der Kettenregel

(γ ◦ h)′(t) = γ′(h(t))h′(t),

und mit der Substitutionsregel folgt

L(γ ◦ h) =

∫ β

α‖(γ ◦ h)′(t)‖2dt =

∫ β

α‖γ′(h(t))‖2h′(t)dt =

∫ h(β)

h(α)‖γ′(h)‖2dh = L(γ).

Man beachte, dass hier die Positivität von h′(t) verwendet wurde!

3.7. Beispiele. (a) Die Länge des Halbkreisbogens γ : [0, π] → R2, t 7→ (cos(t), sin(t))> istgegeben durch

L(γ) =

∫ π

0

‖(− sin t, cos t)‖2dt =

∫ π

0

1 dt = π.

Page 58: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

52 Anwendungen der Integralrechnung

(b) Die Länge der Schraubenlinie γ : [0, 1]→ R3, t 7→ (cos t, sin t, t)> ist

L(γ) =

∫ 1

0

‖(− sin t, cos t, 1)‖2dt =

∫ 1

0

√sin2 t+ cos2 t+ 1dt =

√2.

(c) Der Graph der Funktion f : [0, 1] → R, x 7→√x lässt sich als Kurve γ : [0, 1] → R2,

t 7→ (t2, t)> darstellen. Es gilt ‖γ′(t)‖2 =√

4t2 + 1 und somit

L(γ) =

∫ 1

0

√4t2 + 1 =

1

2

∫ 2

0

√s2 + 1ds =

1

4

(x√x2 + 1 + arsinh(x)

)∣∣20

=

√5

2− ln(

√5− 2)

4.

Das gleiche Ergebnis würde man erhalten, wenn man die Parametrisierung γ : [0, 1] → R2,t 7→ (t,

√t) verwenden würde.

Bogenlänge, Tangente, Krümmung.

(a) Die Funktion s : [a, b] → R, τ 7→∫ τa‖γ′(t)‖2dt heißt Bogenlänge (Bogenlängenfunktion).

Diese ist streng monoton und stetig differenzierbar mit

s′(τ) = ‖γ′(t)‖2.

Die Funktion s−1 : [0, L(γ)9→ [a, b] ist ebenfall streng monoton und differenzierbar, und kannzur Umparametrisierung der Kurve verwendet werden. Die Kurve

γ ◦ s−1 : [0, L(γ)]→ Rn, t 7→ γ(s−1(t))

heißt Bogenlängenparametrisierung oder natürliche Parametrisierung der Kurve, und es gilt

‖(γ ◦ s−1)′(t)‖2 = ‖γ′(s−1(t))1

s′(s−1(t))‖2 = ‖γ′(s)‖2/‖γ′(s)‖2 = 1.

(b) Sei γ : [a, b] → R2 eine C1-Kurve. Dann heißt γ′(t), t ∈ [a, b] Tangentialenvektor andie Kurve γ in γ(t) und T (t) = γ′(t)

‖γ′(t)‖ heißt Tangentialeneinheitsvektor. Liegt die Kurve inBogenlängen-Parametrisierung vor, so ist T (s) = γ′(s).

Bogenlänge, Tangentialvektor, Krümmung.

Page 59: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

3.1 Kurven und Kurvenintegrale 53

(c) Der Betrag ‖γ′(t)‖2 ist ein Maß dafür, wie schnell die Kurve durchlaufen wird. In Bogen-längenparametrisierung gilt

‖ ddt

(γ ◦ s−1)(t)‖ = ‖γ′(s−1(t))(s−1)′(t)‖ = ‖γ′(s−1(t))‖ 1

‖γ′(s−1(t))‖= 1,

d.h., die Kurve mit konstanter Geschwindigkeit 1 durchlaufen.

(d) Wird eine C2-Kurve γ : [a, b] → Rn mit konstanter Geschwindigkeit durchlaufen, also‖γ′(s)‖2 = c, dann erhält man durch Differenzieren

0 =d

dsc2 =

d

ds‖γ′(s)‖2

2 =d

ds(γ′1(s)2 + γ′2(s)2)

= 2(γ′′1 (s)γ′1(s) + γ′′2 (s)γ′2(s)) = 2 γ′′(s)γ′(s).

Der Vektor γ′′(s) ist also stets orthogonal zum Tangentialvektor γ′(s) und N(s) := γ′′(s)‖γ′′(s)‖2 heißt

Hauptnormalenvektor der Kurve γ im Punkt γ(s).

(e) Für eine ebene C2-Kurve γ : [a, b]→ R2 heißt die Größe

κ(t) :=γ′1(t)γ′′2 (t)− γ′2(t)γ′′1 (t)

‖γ′(t)‖3

Krümmung der Kurve. Der Betrage |κ(t)| der Krümmung entspricht dem inversen des Krüm-mungsradius, d.h., des Radius des Schmiegekreises. Liegt γ in Bogenlängenparametrisierungvor, so gilt

|κ(s)| = ‖γ′′(s)‖.

Auch diese Größe wird wieder als Krümmung bezeichnet.

(f) Das begleitende Zweibein (T (s), N(s)) spannt bei räumlichen Kurven die sogenannte Schmie-geebene an die Kurve γ im Punkt γ(s) auf.

Kurvenintegral 1. Art

Das Integral, das zur Berechnung der Länge einer Kurve verwendet wird, lässt sich auch schrei-ben als

L(γ) =

∫ b

a

‖γ′(t)‖2dt =

∫ b

a

1 ‖γ′(t)‖2dt.

Die Interpretation hierfür ist, dass wir die konstante 1 Funktion entlang der Kurve integrieren.Ein solches Integral beschreibt etwa neben der Länge auch die Masse eines Drahtstückes dasdie Form der Kurve und eine konstante Dichte 1 besitzt. Um Massen von Kurvenstücken mitallgemeinerer Dichteverteilung zu berechnen, verwendet man folgende Konstruktion.

Page 60: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

54 Anwendungen der Integralrechnung

3.8. Definition und Satz (Kurvenintegral 1. Art).

(a) Sei f : D ⊂ Rn → R stetig, und γ : [a, b]→ Rn eine (stückweise) C1-Kurve. Dann heißt∫γ

f(x)ds :=

∫ b

a

f(γ(t))‖γ′(t)‖2dt

Kurven- bzw. Linienintegral 1. Art der Funktion f längs der Kurve γ. (b) Das Kurveninte-gral 1. Art ist unabhängig von der Parametrisierung der Kurve γ.

Die Aussage (b) folgt genauso, wie die Parameterunabhängigkeit der Kurvenlänge; siehe Übung.

3.9. Bemerkung. Das Bogenlängenelement ds = ‖γ′(t)dt‖ beschreibt die Länge des Bogen-stückes das bei Veränderung des Parameters t um dt durchlaufen wird. Anstelle von

∫γf(x)ds

finded man auch die Schreibweise∫γf(x)dγ.

Kurvenintegrale 1. Art haben vielseitige Anwendungen, z.B. in der Mechanik.

3.10. Beispiel (Masse). Eine Schraubenfeder der Form γ : [0, 1] → R3, t 7→ (cos t, sin t, t)>

wurde aus einem Block Metall mit Dichteverteilung ρ(x, y, z) = (2− z)/√

2 gefräst. Die Masseder Feder ist dann gegeben durch

M :=

∫γ

ρds =

∫ 1

0

ρ(γ(t))‖γ′(t)‖2dt =

∫ 1

0

(2− t)/√

2√

2dt = 2t− t2

2

∣∣10

=3

2.

3.11. Beispiel (Schwerpunkt). Der Schwerpunkt eines durch eine Kurve γ : [a, b] → Rn

beschriebenen Objektes mit Dichte ρ : Rn → R ergibt sich durch ~S = (S1, . . . , Sn)> mit

Si :=1

M

∫γ

xiρ(x)ds =1

M

∫ b

a

γi(t)ρ(γ(t))‖γ′(t)‖2dt,

wobei die Masse M :=∫γρds wie in vorigem Beispiel zu berechnen ist. Für die Schraubenfeder

aus obigem Beispiel erhält man

S2 = 23

∫ 1

0

sin(t)2−t√2

√2dt = 2

3

∫ 1

0

sin(t)(2− t)dt

= 23

[t cos(t)− 2 cos(t)− sin(t)

∣∣10

]≈ 0.412.

Ähnlich berechnet man die anderen Komponenten und erhält ~S ≈ (0.867, 0.412, 0.444)>.

Page 61: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

3.2 Mantelfläche und Volumen von Rotationskörpern 55

3.12. Beispiel (Trägheitsmoment). Das Trägheitsmoment eines Massenpunktes mit Massem der in einem festen Abstand r um eine Drehachse rotiert, ist durch Θ = mr2 gegeben.Rotieren alle Punkte eines durch eine Kurve γ beschriebenen Körpers der Dichte ρ um einenPunkt ~p, so erhält man durch Aufsummieren

Θ =

∫γ

ρ(~x)‖~x− ~p‖22ds =

∫ b

a

ρ(γ(t))‖γ(t)− ~p‖22‖γ′(t)‖2dt.

Lassen wir die Schraubenfeder aus obigem Beispiel um den ~0-Punkt rotieren, erhalten wir fürderenTrägheitsmoment

Θ =

∫ 1

0

(2− t)/√

2‖(cos(t), sin(t), t)‖22

√2dt =

∫ 1

0

(2− t)(1 + t2)dt =23

12.

3.13. Beispiel (Arbeit). Nach den elementaren Gesetzen der Mechanik, ist die Arbeit dA dieaufgebracht werden muss, um ein Objekt ein kleines Stück ~dx gegen eine Kraft ~F zu bewegendurch

dA = ~F · ~dxgegeben. Bewegt man das Objekt in kleinen Stücken entlang einer Kurve γ, dann ist ~dx =γ′(t)dt. Durch Aufsummieren erhält man

A =

∫ b

a

~F (γ(t)) · γ′(t)dt =:

∫γ

~F · ~dx.

Dieser Ausdruck wird als Kurvenintegral 2. Art bezeichnet und später im Rahmen von Funk-tionen mehrerer Veränderlicher genauer behandelt. Definiert man

~F (γ(t)) · γ′(t)

‖γ′(t)‖=: f(γ(t)),

so lassen sich Kurvenintegrale 2. Art wieder auf solche erster Art zurückführen.

3.2 Mantelfläche und Volumen von Rotationskörpern

Die Fläche A = r2π des Kreises mit Radius r wurde weiter oben bereits durch Integrationberechnet. Ebenso wurde der Umfang des Kreises U = 2rπ als Länge der Kreiskurve γ :[0, 2π]→ R2, t 7→ (cos t, sin t)> berechnet. Für einen Zylinder mit Radius r und Höhe h erhältman hiermit die Formeln

V = r2πh und M = 2rπh

für das Volumen und die Mantelfläche. Im folgenden werden diese Formeln auf allgemeineRotationskörper der Form

R = {(x, y, z) : 0 ≤ z ≤ h, 0 ≤ x2 + y2 ≤ r(z)2}

verallgemeinert.

Page 62: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

56 Anwendungen der Integralrechnung

3.14. Volumen: Zur Bestimmung des Volumens V eines Rotationskörpers R, welcher durcheine Radiusfunktion r : [0, h]→ R beschrieben wird, geht man wie folgt vor: Für jede ZerlegungZ des Intervalls [0, h], das von z durchlaufen wird, sind

Ur(Z) :=n∑k=1

inf r([zk−1, zk])2π(hk − hk−1)

und

Or(Z) :=n∑k=1

sup r([zk−1, zk])2π(hk − hk−1)

die Volumina von Zylinderstapeln die zur Gänze innerhalb von R liegen bzw. R zur Gänzeenthalten. Anschaulicherweise gilt somit für das Volumen V des Rotationskörpers

Ur(Z) ≤ V ≤ Or(Z).

Nach den Kriterien für Integrierbarkeit konvergieren für stetige Radiusfunktion r die Ober- undUntersummen mit ‖Z‖ → 0 gegen den gleichen Grenzwert

lim‖Z‖→0

Ur(Z) = lim‖Z‖→0

Or(Z) =

∫ h

0

r(z)2πdz =: V.

Volumen von Rotationskörpern.

3.15. Oberfläche: Sei Z wieder eine Zerlegung von [0, h]. Um die Fläche dM des Mantelstückes{(x, y, z) : zk−1 ≤ z ≤ zk, x

2 + y2 = r(z)2} zu berechnen, unterteilen wir den umschließen-den Kreisbogen der Länge 2r(z)π in N kleine Stücke dl, wodurch die Mantelfläche dM in Nrechteckförmige Flächen der Größe

dR ≈√

1 + r′(z)2dzdl

zerlegt wird; siehe Skizze. Summiert man auf, so erhält man

dM =∑i

dR = 2πr(z)√

1 + r′(z)2dz.

Page 63: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

3.2 Mantelfläche und Volumen von Rotationskörpern 57

Addiert man die Flächen Mantelstücke dM zusammen, und lässt man die Feinheit der ZerlegungZ gegen 0 gehen, so erhält man als Formel für die Mantelfläche

M =

∫ h

0

2πr(z)√

1 + r′(z)2dz.

Für einen Zylinder mit konstantem Radius r erhält man insbesondere wieder M = 2rπh, wasmit der bekannten Formel übereinstimmt.

Mantelfläche von Rotationskörpern.

3.16. Rotationskörper. Die positive stetige Funktion r : [a, b] → R beschreibe einenRotationskörper R := {(x, y, z) ∈ R3 : a ≤ z ≤ b, x2 + y2 ≤ r(z)2}. Dann sind durch

V = π

∫ b

a

r(z)2dz und M = 2π

∫ b

a

r(z)√

1 + r′(z)2dz

das Volumen sowie die Mantelfläche von R gegeben.

3.17. Beispiel. Gesucht sind Volumen und Oberfläche der Einheitskugel

K = {(x, y, z) : −1 ≤ z ≤ 1, x2 + y2 ≤ 1− z2}.Nach obigen Überlegungen gilt mit r(z) =

√1− z2

V =

∫ 1

−1

(1− z2)πdz = π(z − z3

3)∣∣1−1

= 2π(1− 1

3) =

3.

Weiters folgt mit r′(z) = − z√1−z2 dass

M = 2π

∫ 1

−1

√1 +

z2

1− z2

√1− z2dz = 2π

∫ 1

−1

1dz = 4π.

Man vergleiche mit den bekannten Formeln V = 4R3π3

und O = 4R2π.

3.18. Bemerkung. Beschreibt die Funktion r(z) einen Parabel oder Ellipsenbogen, so sprichtman von Rotationsparaboloid bzw -ellipsoid. Die entsprechenden Volumina und Oberflächenberechnet man ähnlich wie bei der Kugel.

Page 64: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

58 Anwendungen der Integralrechnung

Page 65: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

4 Differentialrechnung in mehreren Variablen

Im folgenden werden wir die Begriffe der Stetigkeit und des Differenzierens, sowie elementareErgebnisse der Differentialrechnung auf Funktionen mehrerer Variablen verallgemeinern.

4.1 Stetigkeit

4.1. Definition (Stetigkeit). (i) Eine Funktion

f : D ⊂ Rn → Rm,

x1...xn

7→f1(x1, . . . , xn)

...fm(x1, . . . , xn)

heißt stetig in x ∈ D, falls für alle ε > 0 ein δ > 0 existiert, sodass

‖x− x‖Rn < δ =⇒ ‖f(x)− f(x)‖Rm < ε.

Hierbei seien ‖ · ‖Rm , ‖ · ‖Rn zwei beliebige Vektornormen auf Rm bzw. Rn. f heißt wiederstetig (auf D), wenn f stetig in allen x ∈ D ist.

(ii) Funktionen f : D ⊂ Rn → Rn heißen auch Vektorfelder.

4.2. Bemerkungen. (i) Der Begriff der Stetigkeit ist unabhängig von der Wahl der Normen.Dies beruht auf der Äquivalenz von Normen auf endlich dimensionalen Vektorräumen, d.h., fürje zwei Normen ‖ · ‖∗ und ‖ · ‖∗∗ gibt es Konstanten c, C > 0 sodass c‖x‖∗ ≤ ‖x‖∗∗ ≤ C‖x‖∗für alle x gilt. Zur Überprüfung der Stetigkeit kann man also beliebige Normen wählen. Wennnicht zwingend erforderlich, werden wir für verschiedene Normen dasselbe Symbol verwenden.

(ii) Für n = 2 oder n = 3 werden wir anstelle von (x1, x2) bzw (x1, x2, x3) meist (x, y) und(x, y, z) verwenden.

(iii) Erfolgt die Definition der Funktionen im Text, werden wir meist f : (x, y)→ (f1(x, y), f2(x, y))schreiben ohne das Transponiert-Zeichen zu verwenden.

Page 66: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

60 Differentialrechnung in mehreren Variablen

Die folgenden äquivalenten Charakterisierungen erlauben oftmals eine einfachere Überprüfungder Stetigkeit. Sie folgen im Wesentlichen wie im Falle von Funktionen einer Variablen.

4.3. Satz. Eine Funktion f : D ⊂ Rn → Rm ist genau dann stetig in x ∈ D, wenn gilt:

(a) Folgenkriterium: für jede Vektorfolge (xk)k∈N in D gilt

xk → x =⇒ f(xk)→ f(x).

(b) Stetige Komponenten: alle Koordinatenfunktionen fi : D → R sind stetig in x.

Beweisskizze: (a) Man vergleiche mit dem Folgenkriterium für Funktionen einer Variablen.

(b) Man beachte: Ein Vektorfolge konvergiert genau dann, wenn jede Koordinate konvergiert.

4.4. Bemerkungen.

(i) Das Folgenkriterium eignet sich besonders gut dazu, um Stetigkeit zu widerlegen. Hierzugenügt es nämlich eine Folge anzugeben, sodass xk → x konvergiert, aber f(xk) 6→ f(x) gilt.Siehe hierzu auch das folgende Beispiel.

(ii) Aufgrund von Aussage (b) des Satzes genügt es im wesentlichem, den Fallm = 1 zu betrach-ten. Wir werden deshalb häufig nur reellwertige Funktionen mehrerer Variablen behandeln.

Achtung: Auch wenn viele Eigenschaften stetiger Funktionen mehrerer Variablen ähnlich wiedie von Funktionen einer Variablen folgen, genügt für Stetigkeit einer Funktion mehrerer Va-riablen nicht, dass sie bezüglich jeder einzelnen Variablen stetig ist!

4.5. Beispiele. (i) Die Funktion f : R2 → R, (x, y) 7→ xy ist stetig auf ganz R2, denn

|xy − xy| ≤ |(x− x)||y|+ |x||(y − y)| ≤ (|x|+ |y|)‖(x, y)− (x, y)‖ ≤ C‖(x− x, y − y)‖.

Aus Konvergenz der Argumente folgt somit die Konvergenz der Funktionswerte.

(ii) Die Funktion

g : R2 → R, (x, y) 7→{ xy

x2+y2(x, y) 6= (0, 0),

12

(x, y) = (0, 0),

ist nicht stetig in (0, 0). Für die Folge (xk, yk) = (1/k, 1/k) gilt zwar

limk→∞

g(xk, yk) =1/k2

2/k2=

1

2,

aber für die Folge (xk, yk) = (1/k, 2/k) gilt

limk→∞

g(xk, yk) =2/k2

5/k2=

2

5.

Page 67: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

4.1 Stetigkeit 61

Das Folgenkriterium ist also nicht (für alle Folgen) erfüllt. Andererseits sieht man leicht, dassfür jeden Vektor (v, w) die Funktion

h(t) = g(x+ tv, y + tw)

stetig ist; insbesondere ist g bezüglich der ersten und zweiten Variablen stetig.

(iii) Die Funktion F : R2 → R2, (x, y) 7→ (f(x, y), g(x, y)) ist nicht stetig, da die zweiteKoordinatenfunktion nicht stetig ist.

Mit dem Folgenkriterium zeigt man leicht:

(iv) Die Koordinatenfunktionen (·)i : x 7→ xi sind stetig; siehe Übung.

(v) Die konstante Funktion f : x 7→ b, b ∈ Rm ist stetig; siehe Übung.

Wegen Aussage (b) des vorigen Satzes lassen sich viele Aussagen über stetige Funktionen einerVariablen relativ leicht verallgemeinern. Insbesondere gelten die folgenden Regeln, welche denNachweis der Stetigkeit erheblich erleichtern.

4.6. Satz (Rechenregeln für stetige Funktionen).(a) Sei D ⊂ Rn und f : D → Rm, g : D → Rm stetig. Dann sind auch

f + g : D → Rm, x 7→ f(x) + g(x)

f · g : D → Rm, x 7→ f(x) · g(x) =m∑i=1

fi(x)gi(x)

αf : D → R, x 7→ αf(x), α ∈ R stetig.

(b) Ist g : D → R mit g(x) 6= 0 für alle x ∈ D , so ist auch

f/g : D → E, x 7→ (f1(x)/g(x), . . . , fm(x)/g(x))> stetig.

(c) Ist E ⊂ Rp, g : E → Rn stetig mit g(E) ⊂ D, so ist die Hintereinanderausführung

f ◦ g : E → Rm, x 7→ f(g(x)) stetig.

Beweis: Es genügt die Aussagen für die Koordinatenfunktionen zu überprüfen.

Bemerkung: Hier und im Folgenden wird mit x · y das Euklid’sche Skalarprodukt von zweiVektoren bezeichnet. Für das Matrix-Vektor Produkt Ax und as Matrix-Matrix Produkt ABwird kein Punkt verwendet.

4.7. Beispiele. (i) Sei b ∈ Rn und A ∈ Rn×n regulär. Dann ist

f : Rn → Rn, x 7→ Ax+ b

Page 68: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

62 Differentialrechnung in mehreren Variablen

stetig. Die Funktionen fi(x) =∑n

j=1Aijxj sind nämlich Summe stetiger Funktionen Aij ·xj dereinzelnen Variablen. Alternativ könnte man auch verwenden, dass

‖f(xn)− f(x)‖ = ‖Axn + b− Ax− b‖ = ‖A · (xn − x)‖ ≤ ‖A‖‖xn − x‖

ist. Aus Konvergenz von xn → x folgt also Konvergenz von f(xn)→ f(x). Weiters ist f bijektivmit Umkehrabbildung

f−1 : Rn → Rn, x 7→ A−1(x− b)

die wieder stetig ist. Stetige Abbildungen mit stetiger Inversen heißen Homöomorphismus.

(ii) Die Funktion f : R2\(0, 0) 7→ R, (x, y) 7→ xy2

x2+y2ist stetig. Wie zuvor mittels Folgenkriterium

gezeigt, kann der Funktion kein “vernünftiger” Wert bei (0, 0) zugeordnet werden. Sie ist alsonicht auf ganz R2 stetig fortsetzbar.

(iii) Die Funktion f : R2 → R, (x, y) 7→ sin(x cos y) ist als Hintereinanderausführung stetigerFunktionen stetig.

(iv) Die Abbildung

f : (0,∞)× [0, 2π)→ R2 \ {(0, 0)}, (r, φ) 7→ (r cosφ, r sinφ).

besitzt stetige Koordinatenfunktionen und ist daher stetig. Man überlegt sich relativ leicht,dass f auch bijektiv ist. Die (ebenfalls stetige; siehe Übung) Inverse f−1 (oder auch f) heißtPolarkoordinatentransformation; sie bildet einen Punkt (x, y) der Zahlenebene auf seine Polar-koordinaten (r, φ) ab; siehe Skizze.

Auch die Sätze über Maximum und Minimum lassen sich auf Funktionen mehrerer Variablenverallgemeinern. Natürlich macht hier nur der Fall m = 1 Sinn!

4.8. Satz (Maximum, Minimum, Zwischenwertsatz).

(a) Sei D ⊂ Rn kompakt (=abgeschlossen und beschränkt) und f : D → R stetig. Dann istauch f(D) ⊂ R beschränkt und f nimmt auf D sein Maximum und Minimum an, d.h., esgibt x, x ∈ D mit

f(x) = minx∈D

f(x) = infx∈D

f(x) sowie f(x) = maxx∈D

f(x) = supx∈D

f(x).

(b) Sei f : D ⊂ Rn → R stetig. Weiters seien a, b ∈ D zwei Punkte mit f(a) < f(b) die sichmit einer Kurve (z.B Geraden), die zur Gänze in D liegt, verbinden lassen. Dann nimmt fin D jeden Wert y ∈ [f(a), f(b)] an, d.h.

∀y ∈ [f(a), f(b)] ∃ξ ∈ D : f(ξ) = y.

Beweis: Die Aussagen folgen im wesentlich wie für Funktionen einer Variablen; siehe Übung.

Page 69: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

4.2 Differenzierbarkeit von Funktionen mehrerer Variablen 63

4.9. Beispiel. Die Funktion f : R2, (x, y) 7→ sin(x cos y) ist stetig und nimmt daher aufD = [0, 1] × [0, 1] Minimum und Maximum an. Für (x, y) ∈ D gilt 0 ≤ x cos y ≤ 1 und somit0 ≤ sin(x cos y) ≤ sin(1). Weiters gilt f(0, y) = 0 für alle 0 ≤ y ≤ 1 und f(1, 0) = sin(1). Somitwurden auch Stellen gefunden an denen Minimum und Maximum angenommen werden. Nachdem Zwischenwertsatz existiert auch eine Lösung (x, y) zur Gleichung f(x, y) = sin(1)/2.

4.2 Differenzierbarkeit von Funktionen mehrerer Variablen

Die Differenzierbarkeit einer Funktion einer Variablen ist eng mit der Approximierbarkeit durchlineare Funktionen verknüpft; siehe hierzu auch die Taylorentwicklung. Eine direkte Verallge-meinerung dieser Idee führt auf folgenden Begriff.

4.10. Definition (Differenzierbarkeit). Sei D ⊂ Rn offen. Eine Funktion f : D → Rm

heißt differenzierbar im Punkt x ∈ D, falls es eine lineare Abbildung L : Rn → Rm gibt,sodass

lim‖h‖→0

f(x+ h)− f(x)− L(h)

‖h‖= 0

gilt. Die lineare Abbilung L heißt Differential von f an der Stelle x und wird mit df(x)bezeichnet. Sie ist eindeutig definiert und unabhängig von der Wahl der Norm. f heißtdifferenzierbar (auf D) wenn f in jedem x ∈ D differenzierbar ist.

4.11. Bemerkungen. (i) Das Differential df(x) heißt auch totales bzw. vollständiges Differen-tial oder Linearisierung und man spricht von totaler bzw. vollständiger Differenzierbarkeit.

(ii) Die lineare Abbildung L aus obiger Definition wird auch Fréchet- bzw. (totale) Ableitungvon f an der Stelle x genannt und mit dem Symbol f ′(x) bezeichnet. Wir halten uns an dieNotation von Königsberger 2, und werden das Symbol f ′(x) für die Matrixdarstellung von df(x)verwenden. Zur Erinnerung: jede lineare Abbildung L besitzt eine eindeutige Matrixdarstellungbezüglich der Einheitsbasis; siehe hierzu auch weiter unten.

Die totale Differenzierbarkeit ist eine starke Eigenschaft und zieht bereits Stetigkeit nach sich,d.h., unstetige Funktionen lassen sich nicht gut durch lineare Funktionen approximieren.

4.12. Satz. Sei f : D ⊂ Rn → Rm in x (total) differenzierbar. Dann ist f in x stetig.

Beweis. Wegen der Differenzierbarkeit und der Stetigkeit von L gilt

lim‖h‖→0

(f(x+ h)− f(x)) = lim‖h‖→0

‖h‖ Lh‖h‖

= lim‖h‖→0

Lh = 0.

Page 70: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

64 Differentialrechnung in mehreren Variablen

Zum Nachweis der Differenzierbarkeit braucht man einen Kandidaten für die Linearisierung(Ableitung) L. Im Folgenden werden wir sehen, wie man mit den bisherigen Mitteln so einenKandidaten finden kann.

Partielle Ableitungen

Bei der Definition des Differentials df(x) darf das Inkrement h in beliebiger Weise gegen 0gehen. Legt man sich auf Richtungen h = tv mit v fix und t 6= 0 fest, so erhält man:

4.13. Definition.

(a) Richtungsableitung: Sei v ∈ Rn, v 6= 0. Falls existent, so heißt der Grenzwert

∂vf(x) = limt→0

f(x+ tv)− f(x)

t

Richtungsableitung von f an der Stelle x in Richtung v; diese wird auch mit ∂f∂v

(x) bezeichnet.Die Funktion f heißt dann im Punkt x (Richtungs-) differenzierbar in Richtung h.

(b) Partielle Ableitung: Die Richtungsableitung in Richtung des k-ten Einheitsvektorsek heißt k-te partielle Ableitung von f an der Stelle x und wird mit

∂kf(x) :=∂f

∂ek(x) = lim

t→0

f(x+ tek)− f(x)

t

= limt→0

f(x1, . . . , xk + t, . . . , xn)− f(x1, . . . , xn)

t

bezeichnet. Es werden auch die Schreibweisen ∂xkf(x) bzw ∂f∂xk

(x) verwendet.

(c) Existieren alle partiellen Ableitungen, so heißt f in x partiell differenzierbar. Die Matrix

f ′(x) :=

f ′1(x)...

f ′m(x)

:=

∂1f1(x) . . . ∂nf1(x)... . . . ...

∂1fm(x) . . . ∂nfm(x)

heißt Jacobi- bzw Funktionalmatrix von f . Es wird auch das Symbol Jf(x) verwendet.Man gebe Acht auf die Dimensionen der Jacobimatrix!

(d) Sind alle partiellen Ableitungen ∂ifj : D → R (bzw f ′ : D ⊂ Rn → Rm×n, x 7→ f ′(x))stetig bezüglich x , so heißt f stetig (partiell) differenzierbar. Man schreibt kurz: f ∈ C1.

4.14. Bemerkung: Zur Berechnung der partiellen Ableitung nach xk betrachtet man alleanderen Variablen xj, j 6= k als fixe Parameter, d.h., man differenziert die Funktion

g(xk) := f(x1, . . . , xk, . . . , xn)

Page 71: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

4.2 Differenzierbarkeit von Funktionen mehrerer Variablen 65

welche nur von einer Variablen abhängt. Das Wissen über Differentiation von Funktionen ei-ner Variablen kann auf die Funktion g und somit zur Berechnung der partiellen Ableitungenangewendet werden.

4.15. Beispiele. (i) Wir betrachten die Funktion

f : R2 → R2,

(xy

)7→(

xyx+ y

)und definieren f1(x, y) = xy, f2(x, y) = x+ y. Dann gilt

∂xf1(x, y) = y, ∂yf1(x, y) = x, ∂xf2(x, y) = 1, ∂yf2(x, y) = 1.

Die Jacobimatrix ist dann

f ′(x, y) =

(∂xf1(x, y) ∂yf1(x, y)∂xf2(x, y) ∂yf2(x, y)

)=

(y x1 1

).

Da alle partiellen Ableitungen stetig sind, ist f stetig differenzierbar.

(ii) Für die Funktion f aus Beispiel (i) suchen wir die Richtungsableitung in Richtung v =(1, 1)>. Es gilt

∂vf1(x, y) = limt→0

f1(x+ t, y + t)− f1(x, y)

t= lim

t→0

(x+ t)(y + t)− xyt

= x+ y.

Ähnlich berechnet man die Richtungsableitung der zweiten Komponente und erhält

∂vf(x, y) =

(∂vf1(x, y)∂vf2(x, y)

)=

(x+ y

2

).

(iii) Für die Funktion f : R2 → R, (x, y) 7→ sin(x cos y) gilt:

∂xf(x, y) = cos(x cos y) · cos(y) und ∂yf(x, y) = cos(x cos y) · (−x sin y).

Für die partielle Ableitung nach x ist hier cos y als Konstante zu betrachten, und für dieAbleitung nach y ist x als Parameter zu behandeln! Die Jacobimatrix ist daher gegeben durchden Zeilenvektor

f ′(x, y) =(

cos(x cos y) · cos(y),−x cos(x cos y) · sin y).

Als Hintereinanderausführung stetiger Funktionen sind die partiellen Ableitungen wieder stetigin (x, y) und somit f ∈ C1.

Wie das folgende Beispiel belegt, brauchen partiell differenzierbare Funktionen nicht total dif-ferenzierbar, ja nicht einmal stetig zu sein.

Page 72: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

66 Differentialrechnung in mehreren Variablen

4.16. Beispiel (Partielle Differenzierbarkeit 6⇒ Stetigkeit, Differenzierbarkeit).Wir betrachten die Funktion

f : R2 → R, (x, y) 7→

{x2yx2+y2

(x, y) 6= (0, 0),

0 (x, y) = (0, 0).

Für jede Richtung h ∈ Rn gilt

1

t

(f(0 + th)− f(0)

)=

1

t

t3h21h2

t2h21 + t2h2

2

=h2

1h2

h21 + h2

2

.

Das Ergebnis ändert sich nicht, wenn man t → 0 gehen lässt. Somit ist f in (0, 0) in jedeRichtung differenzierbar. Allerdings gilt

f(1/k, 1/k2) =1/k4

1/k2 + 1/k4= k2.

Die Funktion ist also nach dem Folgenkriterium nicht stetig in (0, 0), und folglich auch nichttotal differenzierbar in (0, 0)!

Kriterium für Differenzierbarkeit

Den Zusammenhang zwischen totaler und partieller Differenzierbarkeit klärt der folgende Satz.

4.17. Satz.

(a) Hauptkriterium für Differenzierbarkeit: Ist f : D ⊂ Rn → Rm in einer UmgebungUε(x) = {x : ‖x− x‖ < ε}, ε > 0, von x stetig partiell differenzierbar, dann ist f in x auchtotal differenzierbar.

(b) Totale vs. partielle Ableitung: Ist f in x total differenzierbar, dann ist f auchpartiell differenzierbar (und in jede Richtung differenzierbar) und es gilt

df(x)v = f ′(x) · v = ∂vf(x) =∑

ivi∂xif(x) ∀v ∈ Rn.

Richtungsableitungen lassen sich durch Multiplikation der Jacobimatrix mit der Richtungberechnen.

Beweis. (a) Wir betrachten nur den Fall n = 2 und m = 1. Es gilt

f(x, y)− f(x, y) = [f(x, y)− f(x, y)] + [f(x, y)− f(x, y)] = (I) + (II).

Aufgrund der partiellen Differenzierbarkeit können wir die beiden Ausdrücke abschätzen durch

(I) + (II) = ∂xf(x, y)(x− x) + o(|x− x|) + ∂yf(x, y)(y − y) + o(|y − y|).

Page 73: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

4.2 Differenzierbarkeit von Funktionen mehrerer Variablen 67

Da die partiellen Ableitungen stetig sind, gilt weiters

∂xf(x, y) = ∂f(x, y) + o(|y − y|0).

Fasst man alles zusammen, so erhält man mit f ′(x, y)·(x−x, y−y) = ∂xf(x, y)(x−x)+∂yf(x, y)(y−y)

f(x, y)− f(x, y)− f ′(x, y) · (x− x, y − y)>

|x− x|+ |y − y|=|x− x|o(|y − y|0) + o(|x− x|) + o(|y − y|)

|x− x|+ |y − y|= o(|x− x|0) + o(|y − y|0)

was die Differenzierbarkeit von f zeigt.

(b) In der Definition der totalen Differenzierbarkeit wähle man h = tv; siehe Übung.

4.18. Beispiel. (i) Die Jacobimatrix der Funktion f : R2 → R, (x, y) 7→ sin(xy) ist gegebendurch

f ′(x, y) =(∂xf(x, y), ∂yf(x, y)

)=(y cos(xy), x cos(xy)

).

Die partiellen Ableitungen sind stetig auf R2 und daher ist f überall total differenzierbar. DieAbleitung in Richtung v = (1, 1)> ist gegeben durch

∂vf(x, y) = f ′(x, y) · v = (x+ y) cos(xy).

Wir überprüfen dies durch Einsetzen in die Definition der Richtungsableitung:

∂vf(x, y) = limt→0

sin((x+ t)(y + t))− sin(xy)

t= lim

t→0

sin(xy + tx+ ty + t2)− sin(xy)

tL’Hospital

= limt→0

cos(xy) · (x+ y + 2t) = (x+ y) cos(xy).

(ii) Wir betrachten die Polarkoordinatenabbildung

f : D = [0,∞)× [0, 2π)→ R2,

(rφ

)7→(x(r, φ)y(r, φ)

):=

(r cosφr sinφ

).

Die partiellen Ableitungen sind gegeben durch

∂rx(r, φ) = cosφ, ∂φx(r, φ) = −r sinφ, ∂ry(r, φ) = sinφ, ∂φy(r, φ) = r cosφ.

Diese sind allesamt stetig und somit ist f auf dem Definitionsbereich stetig und total differen-zierbar. Die Linearisierung (das Differential) von f an der Stelle (r, φ) ist gegeben durch

df(r, φ) :

(drdφ

)7→(

cosφ −r sinφsinφ r cosφ

)(drdφ

)=

(cosφ · dr − r sinφ · dφsinφ · dr + r cosφ · dφ

).

Dies ist eine lineare Abbildung von R2 nach R2!

(iii) Die Funktion

f : R2 → R2, (x, y) 7→

{x2y2

x2+y2(x, y) 6= 0,

0 (x, y) = 0

Page 74: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

68 Differentialrechnung in mehreren Variablen

besitzt in (x, y) 6= (0, 0) die partiellen Ableitungen ∂xf(x, y) = 2xy4

(x2+y2)2und ∂yf(x, y) = 2yx4

(x2+y2)2

und somit ist f für (x, y) 6= (0, 0) stetig und total differenzierbar. Für (x, y) = (0, 0) undRichtung (v, w) erhält man

∂(v,w)f(0, 0) = limt→0

f(tv, tw)− f(0, 0)

t= lim

t→0

1

t

t4v2w2

t2(v2 + w2)= 0.

Also ist f auch in (0, 0) partiell differenzierbar mit Jacobimatrix f ′(0, 0) = (0, 0). Die partiellenAbleitungen sind aber nicht stetig in (0, 0)!Wir überprüfen nun die totale Differenzierbarkeit in (0, 0) und wählen als Norm die EuklidscheNorm. Es gilt

f(v, w)− f(0, 0)− f ′(0, 0) · (v, w)>

‖(v, w)‖2

=v2w2

(v2 + w2)3/2≤ (v2 + w2)2

(v2 + w2)3/2= (v2 + w2)1/2,

und dieser Ausdruck konvergiert gegen 0 für (v, w)→ 0. Daher ist f in (0, 0) total differenzierbarmit Ableitung (0, 0).

(v) Die Identitätsabbildung id : Rn → Rn, x 7→ x ist differenzierbar mit Ableitung

id′(x) = E, Einheitsmatrix.

4.3 Rechenregeln für Ableitungen

Aus den Resultaten für Funktionen einer Variablen ergeben sich sofort die folgenden Regeln fürAbleitungen allgemeiner Funktionen. Ähnliche Regeln lassen sich auch sofort für die Differen-tiale hinschreiben; siehe Übung.

4.19. Satz (Regeln für die Ableitung).

(a) Linearität: Für differenzierbare Funktionen f, g : D ⊂ Rn → Rm gilt

(f + g)′(x) = f ′(x) + g′(x) und (αf)′(x) = αf ′(x), α ∈ R.

(b) Produktregeln: Sind f, g : D ⊂ Rn → Rm differenzierbar, dann ist

(f · g)′(x) = g(x)>f ′(x) + f(x)>g′(x).

Ist h : D ⊂ Rn → R differenzierbar, dann gilt weiters

(hf)′(x) = h(x)f ′(x) + f(x)h′(x).

(c) Kettenregel: Seien f : D ⊂ Rn → Rm und g : E ⊂ Rp → Rn differenzierbar mitg(E) ⊂ D. Dann gilt

(f ◦ g)′(x) = f ′(g(x)) g′(x).

Page 75: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

4.3 Rechenregeln für Ableitungen 69

(d) Quotientenregel: Seien f : D ⊂ Rn → Rm und g : D ⊂ Rn → R differenzierbar undg(x) 6= 0. Dann ist(1

g

)′(x) = − g

′(x)

g(x)2und

(fg

)′(x) =

g(x)f ′(x)− f(x)g′(x)

g(x)2.

Insbesondere sind die entsprechend verknüpften Funktionen wieder (total) differenzierbar.

Achtung auf die Dimensionen: Hier ist x ·y das Euklid’sche Skalarprodukt zweier Vektoren.Das Produkt zweier Matrizen AB wird ohne Punkt dargestellt.

Beweis: Wir rechnen zunächste die Darstellung der Ableitung für die erste Aussage von (b) nach:

∂xk(f> · g)(x) = ∂xk

n∑i=1

fi(x)gi(x) =

n∑i=1

∂xkfi(x)gi(x) + fi(x)∂xkgi(x)

= [g1(x), . . . , gn(x)] · [∂xkf1(x), . . . , ∂xkfn(x)]> + [f1(x), . . . , fn(x)] · [∂xkg1(x), . . . , ∂xkgn(x)]>.

Das Resultat folgt durch spaltenweises Aneinanderreihen der partiellen Ableitungen.

Als nächstes zeigen wir noch die Formel für die Kenntenregel (c) für den Fall m = 1, n = 2, p = 2:Nach Definition der partiellen Ableitung gilt

∂x(f ◦ g)(x, y) = limt→0

f(g1(x+ t, y), g2(x+ t, y))− f(g1(x, y), g2(x, y))

t.

Wegen der Differenzierbarkeit von g folgt

gi(x+ t, y) = gi(x, y) + t∂xgi(x, y) + o(t), i = 1, 2.

Definiert man ui := gi(x, y) und vi := ∂xgi(x, y), so erhält man

∂x(f ◦ g)(x, y) = limt→0

f(u1 + tv1 + o(t), u2 + tv2 + o(t))− f(u1, u2)

t(∗)= lim

t→0

f(u1 + tv1, u2 + tv2)− f(u1, u2)

t

= ∂(v1,v2)f(u1, u2) = f ′(u1, u2)(v1, v2)>.

Einsetzen der Formel für ui und vi liefert das Resultat. Der Nachweis, dass (∗) tatsächlich stimmt,folgt ähnlich wie beim Hauptkriterium.Die anderen Aussagen folgen in ähnlicher Weise; siehe Übung. Zum Nachweis der Differenzierbarkeitkann man ggf. wieder das Hauptkriterium verwenden.

4.20. Beispiele.

(i) Für gegebene Matrizen A,B ∈ Rm×n und Vektoren a, b ∈ Rm sind die Abbildungen f : x 7→Ax+a, g : x 7→ Bx+ b stetig differenzierbar mit Ableitung f ′(x) = A, g′(x) = B; siehe Übung.Mit demselben Argument sieht man:

(f + g)′(x) = ((A+B)x+ (a+ b))′(x) = A+B = f ′(x) + g′(x)

Page 76: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

70 Differentialrechnung in mehreren Variablen

(ii) Sei A ∈ Rn×n. Nach der Produktregel und (i) ist die Funktion f : Rn → R, x 7→ x>Ax =x>(Ax) differenzierbar mit Ableitung

f ′(x) = (Ax)>E + x>A = x>(A> + A).

Ist A symmetrisch, also A> = A, dann gilt f ′(x) = 2x>A; man vergleiche mit g(t) = at2 mitAbleitung g′(t) = 2ta.

(iii) Für die Funktion g : R2 → R2, x 7→ sin(x)(sin(y), cos(y)) =: h(x)f(y) gilt

(h(x)f(y))′ = sin(x)

(0 cos(y)0 − sin(y)

)+

(sin(y)cos(y)

)(cos(x), 0

)=

(cosx sin y sinx cos ycosx cos y − sinx sin y

).

Durch Ausmultiplizieren erhält man andererseits g(x, y) = (sinx sin y, sinx cos y). Die partiellenAbleitungen sind dann

∂xg1(x, y) = cos x sin y, ∂yg1(x, y) = sinx cos y,

∂xg2(x, y) = cos x cos y, ∂yg2(x, y) = − sinx sin y.

Der Vergleich bestätigt die zweite Aussage von (b).

(iv) Sei g : D = [0,∞)× [0, 2π]→ R2, (r, φ)→ (r cosφ, r sinφ) die Polarkoordinatenabblidung,und f : R2 → R, (x, y) 7→ x2 + y2. Dann ist nach der Kettenregel

(f ◦ g)′(r, φ) = f ′(g(r, φ)) g′(r, φ) =(2r cosφ 2r sinφ

)(cosφ −r sinφsinφ r cosφ

)=(2r cos2 φ+ 2r sin2 φ −2r2 cosφ sinφ+ 2r2 sinφ cosφ,

)=(2r, 0

).

Andererseits ist h = (f ◦ g) : D → R gegeben durch h(r, φ) = r2 cos2 φ + r2 sin2 φ = r2. Diepartiellen Ableitungen sind demnach

∂rh(r, φ) = 2r und ∂φh(r, φ) = 0.

In Übereinstimmung mit der Kettenregel gilt also h′(r, φ) = (f ◦ g)′(r, φ) = f ′(g(r, φ)) g′(r, φ).

4.4 Höhere Ableitungen, Satz von Schwarz

Wir haben bereits die Stetigkeit der partiellen Ableitungen ∂xifj : D ⊂ Rn → R als Funktionenauf D betrachtet. Natürlich kann man auch wieder nach Differenzierbarkeit der partiellen Ab-leitunen (Ableitungsfunktionen) fragen. Wir erläutern die Begriffe anhand zweiter Ableitungenvon reellwertigen Funktionen.

Page 77: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

4.4 Höhere Ableitungen, Satz von Schwarz 71

4.21. Definition

(i) Sei f : D ⊂ Rn → R partiell differenzierbar nach xk. Falls existent, heißt der Ausdruck

∂xj∂xkf(x) = limt→0

∂xkf(x+ tej)− ∂xkf(x)

t

zweite partielle Ableitung von f nach xk und xj. Man schreibt hierfür auch ∂2f∂xj∂xk

(x) oder

fxkxj(x) bzw (fxk)xj(x). Anstelle von ∂xi∂xif und ∂2f∂xi∂xi

verwendet man auch ∂2xf bzw ∂2

∂x2i.

(ii) Sind die zweiten partiellen Ableitungen allesamt stetig, so heißt f zweimal stetig diffe-renzierbar, kurz: f ∈ C2.

(iii) Die Matrix

Hf(x) :=

∂2x1f(x) . . . ∂x1∂xnf(x)

... . . ....

∂xn∂x1f(x) . . . ∂2xnf(x)

aller zweiten partiellen Ableitungen heißt Hessematrix.

(iv) In ähnlicher Weise definiert man höhere Ableitungen. Ableitungen vektorwertiger Funk-tionen werden wieder komponentenweise definiert.

4.22. Beispiele.

(i) Wir betrachten die Funktion f : R2 → R, (x, y) 7→ xy. Dann sind die ersten partiellenAbleitungen gegeben durch

∂xf(x, y) = y und ∂yf(x, y) = x

und für die zweiten partiellen Ableitungen erhält man

∂2xf(x, y) = 0, ∂y∂xf(x, y) = 1, ∂x∂yf(x, y) = 1, ∂2

yf(x, y) = 0.

Die zweiten partiellen Ableitungen sind stetig, also f ∈ C2. Weiters beachte man, dass diegemischten Ableitungen ∂x∂yf und ∂y∂xf übereinstimmen.

(ii) Wir bestimmen alle dritten partiellen Ableitungen der Funktion f : R2 → R, (x, y) 7→xy sin(y). Die ersten Ableitungen sind

∂xf(x, y) = y sin(y) und ∂yf(x, y) = x sin y + xy cos y.

Die zweiten partiellen Ableitungen sind dann

∂2xf(x, y) = 0, ∂y∂xf(x, y) = sin y + y cos y

∂x∂yf(x, y) = sin y + y cos y, ∂2yf(x, y) = 2x cos y − xy sin y.

Page 78: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

72 Differentialrechnung in mehreren Variablen

Für die dritten partiellen Ableitungen erhält man

∂3xf(x, y) = 0, ∂y∂

2xf(x, y) = 0,

∂x∂y∂xf(x, y) = 0, ∂2y∂xf(x, y) = 2 cos y − y sin y,

∂2x∂yf(x, y) = 0, ∂y∂x∂yf(x, y) = 2 cos y − y sin y,

∂x∂2yf(x, y) = 2 cos y − y sin y, ∂3

yf(x, y) = −3x sin y − xy cos y.

Alle Ableitungen sind wiederum stetig, also f ∈ C3. Bei genauerem Hinsehen erkennt manweiters, dass alle Ableitungen bei denen gleich oft nach y und x abgeleitet wird unabhängigvon der Reihenfolge der Ableitungen übereinstimmen.

In den vorhergehenden Beispielen stimmten die gemischten partiellen Ableitungen unabhängigvon der Differentiationsreihenfolge überein. Das folgende Beispiel zeigt, dass dies im Allgemei-nen nicht der Fall ist.

4.23. Beispiel. Wir betrachten die Funktion

f : R2 → R, (x, y) 7→

{xy x

2−y2x2+y2

(x, y) 6= (0, 0),

0 (x, y) = (0, 0).

Diese besitzt die partiellen Ableitungen

∂xf(x, y) =

{y x

2−y2x2+y2

+ 4x2y3

(x2+y2)2(x, y) 6= (0, 0),

0 (x, y) = (0, 0),

sowie

∂yf(x, y) =

{xx

2−y2x2+y2

+ 4y2x3

(x2+y2)2(x, y) 6= (0, 0),

0 (x, y) = (0, 0),

Insbesondere gilt also∂xf(0, y) = −y sowie ∂yf(x, 0) = x.

Für die zweiten partiellen Ableitungen im Punkt (0, 0) erhält man dann

∂x∂yf(0, 0) = −1 sowie ∂y∂xf(0, 0) = 1.

Die gemischten zweiten Ableitungen stimmen hier also im Punkt (0, 0) nicht überein.

Wann man tatsächlich die Aleitungsreihenfolge vertauschen darf, klärt der folgende

Page 79: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

4.4 Höhere Ableitungen, Satz von Schwarz 73

4.24. Satz von Schwarz.

(i) Sei D offen und f : D ⊂ R2 → R zweimal stetig differenzierbar. Dann ist für alle x ∈ D

∂xi∂xjf(x) = ∂xj∂xif(x), i, j ∈ {1, . . . , n}.

Hieraus folgt, dass die Hessematrix Hf(x) symmetrisch ist.

(ii) Ist f sogar n-mal stetig differenzierbar, so darf die Differentiationsreihenfolge bei allenn-ten Ableitungen vertauscht werden.

Beweis: siehe Königsberger, 2.

4.25. Bemerkung. Auch der Begriff des Differentials lässt sich auf höhere Ordnungen erwei-tern. Das Differential an der Stelle x definiert eine lineare Abbildung

df(x) : Rn → R, h 7→ df(x)h = f ′(x)h.

Die Menge aller linearen Abbildungen von Rn nach Rn bezeichnen wir mit L(Rn;Rn). Dies istein Vektorraum der mit dem Raum der Matrizen Rn×n identifiziert werden kann. Betrachtetman nun das Differential als Funktion von x, so erhält man eine Abbildung

df : D ⊂ Rn → L(Rn;Rn), x 7→ df(x).

Wir definieren dann das zweite Differential d2f(x) := d(df)(x) als die lineare Abbildung L :Rn → L(Rn;Rn) welche

lim‖v‖→0

df(x+ v)− df(x)− Lv‖v‖

= 0

erfüllt. Der Grenzwert ist im Sinne linearer Abbildungen zu verstehen, d.h.,

Für alle h ∈ Rn: lim‖v‖→0

df(x+ v)h− df(x)h− (Lv)h

‖v‖= 0.

Die Abbildung L = d2f(x) ist linear bezüglich h und v, also bilinear, und lässt sich mittels derzweiten partiellen Ableitungen darstellen. Es gilt

(Lv)(h) = d2f(x)(v, h) =∑

i

∑jvihj∂xj∂xif(x) = h>Hf(x) v.

Differentiale höherer Ordnung werden rekursiv definiert und sind multilineare Abbildungen,d.h., linear bezüglich jeder komponente (Richtung); Mehr hierzu findet man in Königsberger 2.

Page 80: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

74 Differentialrechnung in mehreren Variablen

Page 81: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

5 Anwendungen der Differentialrechnung

5.1 Elementare Differentialoperatoren

Die Ableitung ddxf einer differenzierbaren Funktion f : R → R erhält man formal, indem man

ddx

auf f anwendet. Die Abbildung

d

dx: C1(D)→ C0(D), f 7→ df

dx

ordnet also jeder stetig differenzierbaren Funktion ihre Ableitungsfunktion zu; diese Abbildungnennt man einen Differentialoperator.

5.1. Definition

(i) Seien f : D ⊂ Rn → R, g : D ⊂ Rn → Rn und h : D ⊂ R3 → R3 differenzierbar. Dannheißen die Ausdrücke

grad f(x) :=

∂x1f(x)...

∂xnf(x)

, div g(x) := ∂x1g1(x) + . . .+ ∂xngn(x)

und

roth(x) :=

∂yh3(x)− ∂zh2(x)∂zh1(x)− ∂xh3(x)∂xh2(x)− ∂yh1(x)

.

Gradient, Divergenz bzw Rotation von f . Die Vektorwertigen Funktionen g und h heißenVektorvelder.

(ii) Für differenzierbare Funktionen f : D ⊂ R2 → R und g : D ⊂ R2 → R2 definieren wirdie Rotation als

~rotf(x) :=

(∂yf(x)−∂xf(x)

)bzw rot g := ∂xg2(x)− ∂yg1(x).

Page 82: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

76 Anwendungen der Differentialrechnung

(ii) Für zweimal differenzierbares f : D ⊂ Rn → R heißt

∆f(x) := ∂2x1f(x) + . . .+ ∂2

xnf(x)

Laplace von f an der Stelle x.

5.2. Bemerkungen. (i) Der Vektor ∇ := (∂x1 , . . . , ∂xn)> der partiellen Ableitungsoperatorenheißt Nabla-Operator. Durch formales Anwenden erhält man

grad f = ∇f, div f = ∇ · g, roth = ∇× h.

Hierbei wird ∇ wie ein einfacher Vektor behandelt, im zweiten Schritt wird mit v ·w =∑

i viwidas Skalarprodukt zweier Vektoren bezeichnet und im dritten Schritt das Kreuzprodukt v×w :=(v2w3 − v3w2, v3w1 − v1w3, v1w2 − v2w1)> verwendet.

(ii) Ausdrücke L der FormLf(x) =

∑i

ai∂xif(x)

heißen linearer Differentialoperator 1. Ordnung mit konstanten Koeffizienten. Kommen Ablei-tungen bis zur n-ten Ordnung vor, so spricht man von einem Differentialoperator n-ter Ord-nung. Differentialoperatoren ordnen differenzierbaren Funktionen bestimmte KombinationenIhrer Ableitungen zu.

5.3. Bemerkungen: (i) Die Formeln für die Rotationen im zweidimensionalen ergeben sichals Spezialfälle des drei-dimensionalen Falles, wenn man die Rotation von h = (0, 0, f)> bzwh = (g1, g2, 0)> berechnet; siehe Übung.

(ii) Formal gilt ∆f = ∇ · (∇f) = div(grad f), wie man leicht nachrechnet.

(iii) Die Hessematrix lässt sich formal darstellen als Hf(x) = ∇∇>f(x) und es gilt ∆f(x) =spurHf(x), wobei spurA =

∑iAii die Spur (=Summe der Diagonalelemente) einer quadrati-

schen Matrix A bezeichnet.

(vi) Für zweimal stetig differenzierbare Funktionen f : D ⊂ R3 → R bzw g : D ⊂ R3 → R3 gilt

div(rot f)(x) = 0 sowie rot(grad f)(x) = 0;

siehe Übung. Diese und ähnliche Regeln werden später noch Verwendung finden.

5.4. Bedeutung von Gradient, Divergenz und Rotation

Wir erläutern noch kurz die Bedeutung dieser Ausdrücke und erwähnen kurz Anwendungsbei-spiele. Man betrachte hierzu auch jeweils graphische Darstellungen geeigneter Funktionen!

Page 83: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

5.1 Elementare Differentialoperatoren 77

(i) Gradient = Richtung des steilsten Anstiegs. Der Gradient wird u.a. dazu verwendet,um Ableitungen darzustellen: Für differenzierbares f : D ⊂ Rn → R gilt nämlich

gradf(x) = ∇f(x) =

∂x1f(x)...

∂xnf(x)

= f ′(x)>.

Für Richtungsableitungen erhält man also folgende Darstellung

∂vf(x) = f ′(x)v = (grad f)>v = 〈grad f(x), v〉,

wobei 〈·, ·〉 das Euklid’sche Skalarprodukt ist. Manipuliert man diesen Ausdruck formal weiter,erhält man

∂vf(x) = 〈∇f(x), v〉 = (v · ∇)f(x)

wobei v ·∇ =∑

i vi∂xi formal zu verstehen ist. Der Differentialoperator der Richtungsableitunglässt sich also schreiben als

∂v = v · ∇Wir werden später noch sehen, dass der Gradient auch noch eine geometrische Bedeutungbesitzt: ∇f(x) ist zeigt nämlich gerade in Richtung des steilsten Anstiegs des FunktionsgraphenGraph(f) = {(x, f(x)) ∈ Rn+1 : x ∈ D} (das wird weiter unten im Rahmen von Optimierungunter Nebenbedingungen gezeigt). Weiters gilt: Falls f entlang einer Kurve γ konstant ist (γheißt dann Isolinie), dann gilt

0 =d

dtf(γ(t)) = f ′(γ(t))γ′(t) = 〈∇f(γ(t)), γ′(t)〉.

Beachtet man noch, dass der Vektor γ′(t) tangential an die Kurve γ(t) liegt, so folgt, dass derGradient von f immer senkrecht auf den Isolinien von f steht.

(ii) Divergenz = Quellenstärke. Sei g : D ⊂ Rn → Rn ein differenzierbares Vektorfeld.Dann beschreibt div g die Quellenstärke des Feldes g. Als Beispiel erwähnen wir das Gauß’scheGesetz der Elektrostatik: divE = q/ε0. Dieses besagt, dass die elektrischen Ladungen Quellendes elektrischen Feldes E sind. Genauer: Die Quellenstärke des E-Feldes ist proportional zurLadungsdichte q. Mehr dazu später im Rahmen des Gauß’schen Integralsatzes.

(iii) Rotation = Wirbelstärke. Für ein Vektorfeld h : D ⊂ Rn → Rn, n = 2, 3 bezeichnetroth(x) die Wirbelstärke. Die Maxwell’schen Gleichungen besagen

rotE = −dBdt

und rotH =dD

dt.

Hierbei ist E das elektrische Feld, B die magnetische Induktion, H das magnetische Feld, undD das dielektrische Verschiebungsfeld. Die Maxwell’schen Gleichungen koppeln also elektrischeund magnetische Feldgrößen. Die erste Gleichung besagt, dass ein zeitlich veränderliches B-Feldein rotierendes E-Feld nach sich zieht. Die zweite Gleichung beschreibt zeitlich veränderlicheverschiebungsfelder als Wirbelstärke des H-Feldes. Mehr zur Bedeutung der Rotation kommtspäter im Rahmen des Stokes’schen Integralsatzes.

Page 84: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

78 Anwendungen der Differentialrechnung

5.2 Mittelwertsatz, Satz von Taylor, Kurvenintegrale

Als nächstes werden wir einige zentrale Sätze der Differentialrechnung einer Variablen auf denmehrdimensionalen Fall erweitern. Zunächst zitieren wir den Mittelwertsatz und den darausresultierenden Schrankensatz.

5.5. Satz.

(i) Mittelwertsatz: Sei f : D ⊂ Rn → R differenzierbar und für a, b ∈ D liege auch dieVerbindungsstrecke [a; b] := {x = (1 − t)a + tb : 0 ≤ t ≤ 1} zur Gänze in D. Dann gibt esein ξ ∈ [a; b] sodass

f(b)− f(a) = f ′(ξ)(b− a).

(ii) Schrankensatz: Ist f sogar stetig differenzierbar, so gilt

‖f(b)− f(a)‖ ≤ C‖b− a‖ mit C = maxξ∈[a;b]

|||f ′(ξ)||| ,

wobei |||A||| := supx 6=0‖Ax‖‖x‖ die zur Vektornorm ‖ · ‖ zugeordnete Matrixnorm ist.

(iii) Hauptsatz für Kurvenintegrale. Sei f : D ⊂ Rn → R differenzierbar und γ :[a, b]→ Rn eine stetig differenzierbare Kurve mit Spur in D. Dann gilt

f(γ(b))− f(γ(a)) =

∫ b

a

f ′(γ(t)) γ′(t)dt.

Beweis: (i) Wir betrachten die Funktion g : [0, 1] → R, t 7→ f((1 − t)a + tb) = (f ◦ h)(t) mith(t) = (1− t)a+ tb. Dann gilt

f(b)− f(a) = g(1)− g(0)MWS

= g′(tξ) = (f ◦ h)′(tξ) = f ′(h(tξ))h′(tξ) = f ′(ξ)(b− a),

wobei wir ξ = (1− tξ)a+ tξb gewählt haben.

(ii) Nach Definition der Matrixnorm |||·||| und dem Mittelwertsatz gilt

‖f(b)− f(a)‖ = ‖f ′(ξ)(b− a)‖ ≤∣∣∣∣∣∣f ′(ξ)∣∣∣∣∣∣ ‖b− a‖.

Man braucht dann |||f ′(ξ)||| nur noch durch das Maximum über alle möglichen ξ abschätzen. Da f ′

stetig ist und die Verbindungsstrecke [a; b] kompakt, wird das Maximum auch angenommen.

(iii) Folgt durch Anwenden des Hauptsatzes der Differential- und Integralrechnung auf die FunktionF (t) := f(γ(t)) und der Kettenregel.

5.6. Beispiele.(i) Wir betrachten die Funktion f : R2 → R, (x, y) 7→ sin(x + y) mit f ′(x, y) = (cos(x +

Page 85: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

5.2 Mittelwertsatz, Satz von Taylor, Kurvenintegrale 79

y), cos(x+ y)). Für a = (0, 0) und b = (π/4, π/4) folgt

1 = f(b)− f(a)MWS= f ′(t, t) · (b− a)

= cos(2t)π/2 =: h(t), 0 < t < π/4.

Für t = 0 ist dir rechte Seite h(0) = π/2 > 1, und für t = π/4 ist h(π/4) = 0. Die Existenzeines geeigneten t folgt aus dem Zwischenwertsatz für die stetige Funktion h.(ii) Sei f wie in (i) und γ : [0, 1]→ Rn, t 7→ a+ t(b− a). Dann gilt nach (iii)

|f(π/4, π/4)− f(0, 0)| = |f(γ(1))− f(γ(0))| = |∫ 1

0

f ′(γ(t)) · γ′(t)dt|

≤∫ 1

0

‖f ′(γ(t))‖2‖γ′(t)‖2dt ≤ maxξ∈[a;b]

‖f ′(ξ)‖2‖b− a‖2.

Aus der Formel für den Integralzuwachs folgt also wiederum der Schrankensatz.

Bemerkungen zu: Gradientenfelder, Wegunabhängigkeit, Potential.

(i) Sei g : D ⊂ Rn → Rn stetig (ein stetiges Vektorfeld) und γ : [a, b] → Rn eine stetigdifferenzierbare Kurve mit Spur in D. Dann heißt∫

γ

g · ~ds :=

∫ b

a

g(γ(t)) · γ′(t)dt

Kurvenintegral 2-ter Art des Vektorfeldes g längs γ. ~ds = γ(t+ dt)− γ(t) ≈ γ′(t)dt bezeichnethier das vektorielle Bogenelement längs der Kruve γ, welches tangential an die Kurve liegt.

(ii) Falls g ein Gradientenfeld ist, d.h., g(x) = ∇f(x) für ein stetig differenzierbares f : D ⊂Rn → R gilt, dann gilt ∫

γ

g · ~ds = f(γ(b))− f(γ(a)).

Das Kurvenintegral hängt dann nur von Anfangs- und Endpunkt der Kurve ab; es ist alsowegunabhängig. Die Funktion f spielt die Rolle der Stammfunktion und heißt Potential zu g.

(iii) Ist g(x) = ∇f(x) ein Gradientenfeld und f sogar zweimals stetig differenzierbar, dann folgtaus dem Satz von Schwarz:

∂xigj(x) = ∂xi∂xjf(x)SvS.= ∂xj∂xif(x) = ∂xjgi(x).

Diese Integrabilitätsbedingungen sind notwendig für die Existenz eines Potentials f . Für n = 2bzw n = 3 können die Bedingungen auch kurz als

rot g(x) = 0

geschrieben werden (man beachte hierzu auch die Regel: rot(∇f(x)) = 0; siehe Übung).(iv) Die Frage, wann tatsächlich ein Potential gefunden werden kann, beantwortet das Lemma

Page 86: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

80 Anwendungen der Differentialrechnung

von Poincaré; siehe hierzu MSE 3.(v) Falls ein Potential existiert, lässt es sich wie folgt finden. Wegen g1 = ∂1f(x) folgt, dass fdie Gestalt

f(x1, . . . , xn) =

∫g1(x1, . . . , xn)dx1 + c(x2, . . . , xn)

besitzen muss. Dies überprüft man durch Nachrechnen. Das Gleiche kann man durch Integrationbezüglich der anderen Variablen xk machen, und erhält somit verschiedene Darstellungen der“Stammfunktion” f . Durch Vergleich lässt sich f bis auf Konstante bestimmen.

Der Satz von Taylor in mehreren Dimensionen

Der Mittelwertsatz besagt, dass

f(x+ h) = f(x) + f ′(ξ)h = f(x) +O(‖h‖).Wie bei Funktionen einer Variablen lässt sich also die Funktion g(h) := f(x + h) in der Nähevon x durch die konstante Funktion c : h 7→ f(x) approximieren.

Wie bei Funktionen einer Variablen macht es wieder Sinn, auch Approximationen höhererOrdnung (=Polynome) zu betrachten. Zur Herleitung einer entsprechenden Formel geht manwie folgt vor: Die Funktion

g(t) := f(x+ th)

ist eine Funktion einer Variablen t. Der Satz von Taylor in einer Dimension liefert dann

g(1) = g(0) + g′(0) + . . .+1

n!g(n)(0) +

1

(n+ 1)!g(n+1)(τ).

Weiters gilt

g′(0) = limt→0

g(t)− g(0)

t= lim

t→0

f(x+ th)− f(x)

t= ∂hf(x) = df(x)(h).

Mittels Induktion erhält man

g′′(0) = d2f(x)(h, h), . . . , g(m)(0) = dmf(x)(h, . . . , h).

Dies liefert eine Verallgemeinerung des Satzes von Taylor für Funktionen mehrerer Variablen.

5.7. Satz von Taylor.(i) Sei f : D ⊂ Rn → R eine Cm Funktion und die Strecke [x;x+ h] ⊂ D. Dann gilt

f(x+ h) = f(x) + df(x)(h) + . . .+1

m!dmf(x)(h, . . . , h) +Rm+1(f ;h).

Das Restglied erfüllt die Abschätzung Rm+1(f ;h) = o(‖h‖m).

(ii) Ist f sogar (m+ 1)-mal stetig differenzierbar, so gilt die Darstellung

Rn+1(f ;h) =1

(m+ 1)!dm+1f(x+ τh)(h, . . . , h) mit einem τ ∈ (0, 1).

Page 87: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

5.2 Mittelwertsatz, Satz von Taylor, Kurvenintegrale 81

5.8. Bemerkung. (i) Die Aussage lässt sich auch schreiben als

f(x+ h) = f(x) + ∂hf(x) + . . .+1

n!∂nhf(x) +

1

(n+ 1)!∂n+1h f(x+ τh).

Hierzu genügt beteits, dass f hinreichend oft richtungsdifferenzierbar in Richtung h ist.

(ii) Die erstenm Glieder der rechten Seiten definieren das Taylorpolynom m-ter Ordnung; dieseswird wie zuvor mit Tmf(x+ h;x) bezeichnet. Der Satz von Taylor besagt also

f(x+ h) = Tmf(x+ h;x) + o(‖h‖m).

Falls f in Cm+1 ist, dann erfüllt das Restglied sogar die Abschätzung O(‖h‖m+1). Das Tay-lorpolynom stell folglich (für hinreichend glatte Funktionen!) eine gute Approximation für dieFunktion f dar; man vergleiche hierzu auch den Mittelwertsatz.

Zur Veranschaulichung wollen wir kurz noch die praktisch wichtigen Fälle m = 0, 1, 2 etwasgenauer betrachten:

Konstante Approximation: Für m = 0 erhalten wir

f(x+ h) = f(x) + o(‖h‖)

was sofort aus der Stetigkeit von f folgt. Die konstante Funktion h 7→ f(x) ist für kleine heine Approximation 0-ter Ordnung für die Funktion h 7→ f(x+h). Ist f in C1, dann liefert derMittelwertsatz die Restgliedabschätzung

f(x+ h) = f(x) + f ′(ξ) · h für ein ξ ∈ [x;x+ h].

Das Restglied ist hier also O(‖h‖) klein.

Lineare Approximation: Für m = 1 gilt wegen der Differenzierbarkeit

f(x+ h) = f(x) + df(x)(h) + o(‖h‖) = f(x) + f ′(x)h+ o(‖h‖)= f(x) + h · ∇f(x) + o(‖h‖).

Hier ist wieder x · y das innere Produkt zweier Vektoren. Das Taylorpolynom 1-ter Ordnungentspricht der affin-linearen Approximation der Funktion h 7→ f(x+h) in der Nähe von h = 0.Für C2 Funktionen lässt sich das Restglied abschätzen durch

R2(f ;h) =1

2d2f(ξ)(h, h) =

1

2h>Hf(ξ)h = O(‖h‖2).

Die lineare Approximation ist also um eine Ordnung besser als die konstante Näherung.

Page 88: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

82 Anwendungen der Differentialrechnung

Quadratische Approximation: Für m = 2 erhalten wir

f(x+ h) = f(x) + df(x)(h) +1

2!d2f(x)(h, h) + o(‖h‖2)

= f(x) + h · ∇f(x) +1

2!h>Hf(x)h+ o(‖h‖2).

Das Taylorpolynom 2-ter Ordnung definiert eine quadratische Funktion welche sich an denGraphen der Funktion f anschmiegt. T2(f ;h) heißt deswegen auch Schmiegequadrik. Für C3

Funktionen ist der Fehler O(‖h‖3) klein.

5.9. Beispiel. Gesucht sind die Taylorpolynome 1-ter und 2-ter Ordnung für die Funktion

f : R2 → R, (x, y) 7→ 1 + x+ xy + x2y2 + xy3

an der Stelle (x, y) = (1, 1).

Lösung: Partielles Differenzieren liefert

∂xf(x, y) = 1 + y + 2xy2 + y3, ∂yf(x, y) = x+ 2x2y + 3xy2

sowie∂2xf(x, y) = 2y2, ∂x∂yf(x, y) = 1 + 4xy + 3y2, ∂2

yf(x, y) = 2x2 + 6xy.

Wegen des Satzes von Schwarz gilt weiters ∂y∂xf(x, y) = ∂x∂yf(x, y). Also erhält man

f(1, 1) = 5, ∇f(1, 1) =

(56

)und Hf(1, 1) =

(2 77 8

).

Für (x, y) = (1, 1) und mit h = (x− 1, y − 1)> erhält man also

T1f((x, y; 1, 1) = f(1, 1) + (x− 1, y − 1)∇f(1, 1) +O(‖(x− 1, y − 1)‖2)

= 5 + 5(x− 1) + 6(y − 1) +O(‖h‖2)

und für Ordnung m = 2 erhält man

T2f(x, y; 1, 1) = T1f(x, y; 1, 1) +1

2!(x− 1, x− 1)tHf(0, 0) (x− 1, y − 1)> +O(‖(x− 1, y − 1)‖3)

= 5 + 5(x− 1) + 6(y − 1) + (x− 1)2 + 7(x− 1)(y − 1) + 4(y − 1)2 + Rest.

Graph der Funktion f(x, y) = 1 + y + 2xy2 + y3 sowie Taylorapproximationen 1-ter und 2-terOrdnung im Punkt (1, 1).

Page 89: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

5.3 Extrema von Funktionen mehrerer Veränderlicher 83

5.3 Extrema von Funktionen mehrerer Veränderlicher

Wir beschäftigen uns im Folgenden mit Extremalproblemen der Form

minx∈D

f(x).

Gesucht ist hier also die Stelle eines Minimums für die Zielfunktion f : D ⊂ Rn im Zulässig-keitsbereich D. Das Auffinden eines Maximums kann als Minimieren von −f(x) geschriebenwerden und in beiden Fällen spricht man von einem Extremal- oder Optimierungsproblem.

Falls D = Rn ist, spricht man von freier Optimierung; ansonsten von restringierter Optimie-rung. Lässt sich die Menge D als D = {x ∈ Rn : g(x) = 0} schreiben, so spricht man vonGleichungsnebenbedingungen; im Falle D = {x : g(x) ≤ 0} von Ungleichungsnebenbedingungen;hierbei ist g : Rn → Rm eine im allgemeinen vektorwertige Funktion.

Wir werden sehen, dass die Suche nach Extremalstellen einer Zielfunktion f : Rn → R ganzähnlich wie bei Funktionen einer Variablen abläuft. Zur Erinnerung:

(i) Eine Punkt x ∈ D heißt Stelle eines lokalen Minimums (Maximums) von f , wenn

f(x) ≤ f(x) (bzw f(x) ≥ f(x)) für alle x ∈ D : ‖x− x‖ < ε

und hinreichend kleines ε > 0 gilt. Der Funktionswert f(x) heißt lokales Minimum/ Ma-ximum. Beide Fällen nennt man lokales Extremum (lokale Extremstelle).

(ii) Gelten die Ungleichungen für x 6= x mit < (>), dann heißt das Extremum strikt. Ist dieBedingung für alle x ∈ D erfüllt, so heißt das Extremum global.

Für die folgenden Betrachtungen werden auch einige Begriffe über Mengen D ⊂ Rn benötigt,die wir zur Erinnerung kurz anführen:

(i) x heißt innerer Punkt von D, wenn jede ε-Umgebung Uε(x) = {x ∈ Rn : ‖x − x‖ < ε}für hinreichend kleine ε > 0 zur Gänze in D liegt. Die Menge aller inneren Punkte von Dheißt Inneres von D und wird mit D bezeichnet. D heißt offen, wenn D = D ist.

(ii) D heißt abgeschlossen, wenn zu jeder konvergenten Folge (xn) inD auch der Grenzwert x =limn xn in D liegt. Jeder Grenzwert einer konvergenten Folge in D heißt Häufungspunktvon D. Die Menge aller Häufungspunkte von D heißt Abschluss von D und wird mit Dbezeichnet. D heißt abgeschlossen, wenn D = D gilt.

(iii) Die Menge ∂D = D \ D heißt Rand von D.

(iv) Eine Menge D ⊂ Rn heißt kompakt, wenn jede Folge in D eine konvergente Teilfolgebesitzt. Für D ⊂ Rn ist dies genau dann der Fall, wenn D abgeschlossen und beschränktist.

Page 90: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

84 Anwendungen der Differentialrechnung

Notwendige und hinreichende Bedingungen für Extremalstellen

Der folgende Satz fasst wesentliche Aussagen über Extremstellen zusammen. Diese sollten fürFunktionen einer Variablen schon von früher bekannt sein.

5.10. Satz (Extremstellen).

(i) Existenz von Maximum/Minimum.Ist f : D ⊂ Rn → R stetig und D kompakt, so existieren in D Stellen eines globalenMinimums und Maximums.

(ii) Notwendige Bedingung erster Ordnung:Ist f differenzierbar und besitzt f in einem inneren Punkt x ∈ D eine lokale Extremstelle,dann ist

∇f(x) = 0 (bzw. f ′(x) = 0).

Punkte an denen der Gradient verschwindet, heißen stationäre Punkte.

(iii) Notwendige Bedingung 2. Ordnung:Sei f ∈ C2 und x ∈ D Stelle eines lokalen Minimums (Maximums). Dann gilt

v>Hf(x) v ≥ 0 (v>Hf(x) v ≤ 0) für alle v 6= 0.

(iv) Hinreichende Bedingung 2. Ordnung:Sei f zweimal differenzierbar. Falls x stationär ist und

v>Hf(x) v > 0 (v>Hf(x)v < 0) für alle v 6= 0

gilt, so ist x Stelle eines strikten lokalen Minimums (Maximums).

Beweis. (i) Die Aussage ist gerade der Satz über Maximum und Minimum stetiger Funktionen.(ii) Wir zeigen, dass x nicht Stelle eines lokalen Extremums ist, wenn ∇f(x) 6= 0. Mit h = −∇f(x) 6= 0gilt nämlich für alle t > 0 nach dem Satz von Taylor

f(x+ th) = f(x) + f ′(x)th+R1(th)

= f(x)− t‖∇‖2 +R1(th),

wobei wegen R1(th) = o(th) für jedes c die Abschätzung ‖R1(th)‖ ≤ c‖th‖ für hinreichend kleines tgilt. Mit c = 1

2‖∇f(x)‖ erhalten wir dann

f(x+ th) ≤ f(x)− t2‖∇f(x)‖2 < f(x),

was zeigt, dass x nicht Stelle eines lokalen Minimums ist. Für h = t∇f(x) zeigt man genau so, dass xnicht Stelle eines lokalen Maximums ist.

Page 91: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

5.3 Extrema von Funktionen mehrerer Veränderlicher 85

(iii) Wir wissen bereits, dass ∇f(x) = 0 gelten muss. Angenommen, es gäbe ein v mit v>Hf(x)v < 0,dann folgt mit Taylor

f(x+ tv) = f(x) + tv>∇f(x) +t2

2v>Hf(x)v +R2(tv)

wobei R2(tv) = o(‖tv‖2) erfüllt. Mit ∇f(x) = 0 und ähnlich wie bei (ii) zeigt man, dass dann fürhinreichend kleines t > 0

f(x+ tv) ≤ f(x)− t2

4v>Hf(x)v < f(x)

gilt, also x nicht Stelle eines lokalen Minimums sein kann. Die Aussage für das Maximum folgt analog.(iv) Für x in der Umgebung von x gilt mit Taylor

f(x) = f(x) + (x− x)>∇f(x) +1

2(x− x)>Hf(x)(x− x) +R2(x− x).

Der zweite Term auf der Rechten Seite verschwindet wegen ∇f(x) = 0, der dritte ist nach Vorausset-zung echt größer Null, wenn x 6= x, und das Restglied kann durch ‖R2(x−x)‖ ≤ 1

4(x−x)>Hf(x)(x−x)abgeschätzt werden, wenn ‖x− x‖ hinreichend klein gewählt wird. Somit folgt

f(x) ≥ f(x) +1

4(x− x)>Hf(x)(x− x) > f(x),

für alle x 6= x mit ‖x− x‖ hinreichend klein.

5.11. Bemerkungen. (i) Eine Matrix A ∈ Rn×n mit v>Av > 0 (< 0) für alle v 6= 0 heißtpositiv (negativ) definit. Gelten die Ungleichungen mit ≥ bzw ≤, dann heißt A positiv (negativ)semi-definit. Eine symmetrische (diagonalisierbare) Matrix ist genau dann positiv (negativ,semi-) definit, wenn alle Eigenwerte größer (kleiner, -gleich) Null sind.

(ii) Der obige Satz charakterisiert nur Extremstellen im Inneren D der zulässigen Menge. DaD = Rn offen ist, sind freie Optimierungsprobleme damit im Wesentlichen behandelt. Aussagenüber Extremstellen am Rand ∂D werden weiter unten gemacht.

5.12. Beispiel. Wir suchen lokale und globale Extremstellen der Funktion f : D ⊂ R2 → R,x 7→ x2 + 2xy + 2y2 auf dem Quadrat D = (−1, 1)2.

Lösung: (i) Wir suchen zunächst nach stationären Punkte, also nach Lösungen der Gleichung∇f(x, y) = 0. Dies entspricht der Forderung

∂xf(x, y) = 2x+ 2y!

= 0 und ∂yf(x, y) = 2x+ 4y!

= 0,

woraus (x, y) = (0, 0) folgt. Dies ist somit der einzige Kandidat für eine Extremstelle.(ii) Für die Hessematrix erhält man

Hf (x, y) =

(2 22 4

),

Page 92: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

86 Anwendungen der Differentialrechnung

und die Eigenwerte von Hf(0, 0) sind λ1,2 = 3±√

5 > 0. Also ist Hf(0, 0) positiv definit und(0, 0) Stelle eines strikten lokalen Minimums.(iii) Für alle (x, y) gilt weiters

f(x, y) = (x+ y)2 + y2 ≥ 0 = f(0, 0).

Somit ist (0, 0) sogar (einzige) Stelle des globalen Minimums.(iv) f besitzt auf D kein (lokales) Maximum. Da D offen ist, müsste dieses nämlich auchstationärer Punkt sein. Dies wird auch dadurch belegt, dass 0 ≤ f(x, y) < 5 für alle (x, y) ∈ Dgilt aber sup(x,y)∈D f(x, y) = 5 ist.

5.13. Beispiel. Die Betragsfunktion f : x 7→ ‖x‖2 ist stetig. Wegen f(0) = 0 und f(x) > 0 füralle x ∈ Rn \ {0} liegt das strikte (globale) Minimum bei x = 0. Für x 6= 0 ist f(x) = ‖x‖2 =√x>x differenzierbar mit ∇f(x) = x

‖x‖2 . Es existieren also keine weiteren stationären Punkteund folglich auch keine weiteren Extrema.

5.14. Beispiel. Gesucht ist die Lösung des freien Optimierungsproblems

f(x, y) := xy sin y → min x, y ∈ R.

Lösung: Die Bedingungen für stationäre Punkte sind

∂xf(x, y) = y sin y!

= 0 und ∂yf(x, y) = x sin y + xy cos y!

= 0.

Aus der ersten Gleichung folgt y = 0 oder y = nπ mit n ∈ Z. Einsetzen in die zweite Gleichungliefert

S := {(0, nπ) : n ∈ Z \ {0}} ∪ {(x, 0) : x ∈ R}

als Menge der stationären Punkte. Zur weiteren Klassifikation berechnen wir die Hessematrix

Hf(x, y) =

(0 sin y + y cos y

sin y + y cos y 2x cos y − xy sin y

)und Hf(0, nπ) =

(0 (−1)nnπ

(−1)nnπ 0

).

Die Eigenwerte zu Hf(0, nπ) sind λ1,2 = ±nπ; für n 6= 0 liegen also weder lokale Minima nochMaxima vor. Für die übrigen stationären Punkte gilt Hf(x, 0) = 0 und f(x, 0) = 0. Weitersgilt (siehe auch grafische Darstellung) für hinreichend kleine |t| > 0, |s| > 0

f(x+ t, 0 + s) > 0 falls x > 0, f(x+ t, 0 + s) < 0 falls x < 0.

Somit handelt es sich bei den Punkten (x, 0) für x > 0 um lokale Minima und für x < 0 umlokale Maxima. Der Punkt (0, 0) ist keine lokale Extremstelle.Weiters gilt f(x, π/2) = π/2x. Die Funktion ist also nach oben und unten unbeschränkt undbesitzt daher keine globalen Extrema.

Page 93: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

5.3 Extrema von Funktionen mehrerer Veränderlicher 87

5.15. Beispiel. Sei A ∈ Rn×n, b ∈ Rn und c ∈ R. Wir suchen nach Extrema der quadratischenFunktion f : x 7→ x>Ax+ b>x+ c. Es gilt

∇f(x) = (A> + A)x+ b und Hf(x) = A> + A.

Man zeigt relativ leicht: Falls A positiv definit ist dann auch A> + A; insbesondere ist dannA> + A auch regulär. Dann existiert genau ein stationärer Punkt x = −(A>A)−1b und dieserist Stelle des globalen Minimums. Weitere Extrema gibt es nicht.

Extremalprobleme mit Nebenbedingungen

Als nächstes betrachten wir Optimierungsprobleme mit Gleichungsnebenbedingungen, d.h.,Probleme der Form

min f(x), sodass g(x) = 0.

Das Minimierungsproblem lässt sich auch als minx∈D f(x) mit D = {x : g(x) = 0} schreiben.Im Allgemeinen wird g eine vektorwertige Funktion sein, d.h., g(x) = 0 sind eigentlich mNebenbedingungen. Als Daumenregel: Jede Nebenbedingung legt eine Variable fest; es solltealso immer m < n gelten.

5.16. Beispiele. (i) Wir betrachten das Problem

min(x,y,z)∈R3

f(x, y, z), sodass x+ y + z = 1.

Die Nebenbedingung ist äquivalent zu z = 1 − x − y und Einsetzen in die Funktion f liefertdas freie Optimierungsproblem

min(x,y)∈R2

f(x, y, 1− x− y).

Das Eliminieren von Variablen durch Auflösen der Nebenbedingungen ist jedoch nicht immerso leicht möglich!

(ii) Gesucht ist der Punkt (x, y) auf der Kreislinie {x2 + y2 = 1} welcher minimalen Abstandzum Punkt (1, 1) besitzt.Der Abstand ist genau dann minimal, wenn auch das Quadrat des Abstandes (x−1)2 +(y−1)2

minimal ist. Die Aufgabe lässt sich also wie folgt formulieren:

min(x,y)∈R2

(x− 1)2 + (y − 1)2, sodass g(x, y) := x2 + y2 = 1.

(iii) Gesucht ist der Quader [0, b]× [0, h]× [0, t] mit festem Volumen V = bht = 1 und minimalerOberfläche.Die Oberfläche ist gegeben durch f : R3 → R, (b, t, h) 7→ 2bt+2bh+2th. Weiters müssen Breite,Höhe und Tiefe jeweils ≥ 0 sein. Die Aufgabe lässt sich also wie folgt formulieren:

min(b,h,t)∈R3

f(b, h, t), sodass bth = 1 und b, t, h ≥ 0.

Es handelt sich also um ein Problem mit Gleichungs- und Ungleichungsnebenbedingungen.

Page 94: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

88 Anwendungen der Differentialrechnung

Lagrangeformalismus

Wir betrachten im Folgenden nur Probleme mit Gleichungsnebenbedingungen und definierendie sogenannte Lagrangefunktion

L(x, λ) := f(x) +∑m

i=1λigi(x)

in welcher wir einfach die Nebenbedingungen zur Zielfunktion dazuzählen. Man macht leichtfolgende Beobachtungen:

(i) Für alle zulässigen Punkte x ∈ D = {x : g(x) = 0} und jeden Lagrange Parameter λ ∈ Rm

stimmt L(x, λ) mit f(x) überein.

(ii) Falls man ein λ findet, sodass

minx∈Rn

L(x, λ) = minx∈D

f(x)

gilt, dann kann man das restringierte Minimierungsproblem minx∈D f(x) durch Betrachtendes freien Optimierungsproblemes minx∈Rn L(x, λ) lösen.

Wir werden uns jetzt damit beschäftigen, wie man ein geeignetes λ und den zugehörigen Mini-mierer x finden kann.

5.17. Bemerkung (Notwendige Bedingungen). Falls f und g jeweils stetig differenzierbarsind, dann erhält man für vorgegebenes λ als notwendige Bedingung für die Minimierung derLagrangefunktion L(x, λ)

∇xL(x, λ) = ∇xf(x) +∑m

i=1λi∇xgi(x)

!= 0.

Weiters wollen wir aber auch noch, dass der Minimierer x zulässig ist, also dass

∇λL(x, λ) = g(x)!

= 0

gilt. Zusammen ergibt das n + m Gleichungen für die n + m Unbekannte (x, λ). Diese könnteman auch wieder kurz als ∇L(x, λ) = 0 schreiben. Wir haben also das restringierte Minimie-rungsproblem in ein nichtlineares Gleichungssystem umgewandelt.

Als Anwendungen des Lagrangeformalismus betrachten wir zunächst einige Beispiele.

5.18. Beispiel. Gesucht ist das Minimum der Funktion f(x, y, z) = x2 +y2 +z2 auf der MengeD = {(x, y, z) : x+ y + z = 1}.(i) Die Lagrangefunktion lautet hier

L(x, y, z;λ) = x2 + y2 + z2 + λ(x+ y + z − 1).

Page 95: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

5.3 Extrema von Funktionen mehrerer Veränderlicher 89

Ableiten der Lagrangefunktion liefert die notwendigen Bedingungen

∂xL(x, y, z, λ) = 2x+ λ!

= 0,

∂yL(x, y, z, λ) = 2y + λ!

= 0,

∂zL(x, y, z, λ) = 2z + λ!

= 0,

∂λL(x, y, z, λ) = x+ y + z − 1!

= 0.

Die Lösung dieses (hier linearen) Gleichungssystems ist (x, y, z, λ) = (13, 1

3, 1

3,−2

3).

(ii) Als Alternative können wir hier die Variable z unter Verwendung der Nebenbedingung eli-minieren. Die Minimierung von f über D ist dann äquivalent zum freien Optimierungsproblem

min(x,y)∈R2

f(x, y, 1− x− y) = min(x,y)∈R2

x2 + y2 + (1− x− y)2 = min(x,y)∈R2

f(x, y).

Die notwendigen Bedingungen für ein Minimum sind

∂xf(x, y) = 4x+ 2y − 2!

= 0 und ∂xf(x, y) = 2x+ 4y − 2!

= 0,

was x = 13und y = 1

3liefert. Aus der Nebenbedingung folgt dann auch wieder z = 1/3.

Das Minimum konnte hier also tatsächlich mithilfe des Lagrangeformalismus gefunden werden.

5.19. Beispiel. Wir suchen den Punkte (x, y) auf dem Einheitskreis mit minimalem Abstandzu (1, 1).Dies entspricht (siehe oben) dem restringierten Optimierungsproblem

min(x,y)∈R2

(x− 1)2 + (y − 1)2, sodass x2 + y2 = 1 gilt.

Die Lagrangefunktion lautet hier L(x, y, λ) = (x−1)2 +(y−1)2 +λ(x2 +y2−1). Als notwendigeBedingungen erhalten wir

∂xL(x, y, λ) = 2x− 2 + 2xλ!

= 0,

∂yL(x, y, λ) = 2y − 2 + 2yλ!

= 0,

∂λL(x, y, λ) = x2 + y2 − 1!

= 0.

Aus den ersten beiden Gleichungen erhält man durch Quadrieren und Zusammenzählen

(x2 + y2)(1 + λ)2 = 2.

Unter Verwendung der dritten Gleichung folgt dann

(1 + λ)2 = 2 bzw λ = −1±√

2.

Page 96: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

90 Anwendungen der Differentialrechnung

Hieraus erhält man

(x, y, λ) ∈ {(−1√

2,−1√

2,−1−

√2),( 1√

2,

1√2,−1 +

√2)}

als Kandidaten für das Minimum.Da f(x, y) = (x − 1)2 + (y − y)2 eine stetige Funktion ist und D = {(x, y) : x2 + y2 = 1}eine kompakte Menge, folgt, dass Minimum und Maximum existieren. Durch Einsetzen oderauch grafisches Überprüfen sieht man, dass (x, y) = (1/

√2, 1/√

2) der Punkt am Einheitskreismit minimalem Abstand von (1, 1) ist; (x, y) = (−1/

√2,−1/

√2) ist hingegen der Punkt mit

maximalem Abstand.Der Lagrangeformalismus hat also wiederum zum Ziel geführt.

Wir gehen noch kurz der Frage nach, unter welchen Bedingungen man die Existenz eines geeig-nete Lagrangeparameters λ garantieren kann, und leiten noch kurz hinreichende Bedingungenfür das Vorliegen eines Minimums bzw Maximums her.

5.20. Satz. Seien f : Rn → R und g : Rn → Rm, m < n, stetig differenzierbar und x seiStelle eines lokalen Extremums für die Funktion f(x) unter der Nebenbedingung g(x) = 0.Dann gilt:

(i) Existenz von Lagrangemultiplikatoren: Falls die Jacobimatrix g′(x) der Neben-bedingung maximalen Rang (= m) besitzt, dann existiert ein Lagrangemultiplikatorλ ∈ Rm sodass ∇xL(x, λ) = 0 gilt. Insbesondere ist (x, λ) Lösung der notwendigenBedingungen ∇L(x, λ)

!= 0 für die Lagrangefunktion.

Sind f und g sogar zweimal stetig differenzierbar, dann gelten:

(ii) Notwendige Bedingungen zweiter Ordnung:Ist x Stelle eines lokalen Minimums und λ Lagrangemultiplikator nach (i). Dann gilt

y>HxL(x, λ)y ≥ 0 für alle y ∈ Tg(x)

wobeiTg(x) := {y : g′(x) · y = 0}

den Tangentialraum der Nebenbedingung bezeichnet und HxL debn Teil der Hesse-matrix mit den zweiten Ableitungen nach x beschreibt.

(iii) Hinreichende Bedingungen zweiter Ordnung:Ist (x, λ) stationärer Punkt der Lagrangefunktion L(x, λ), und gilt

y>HxL(x, λ)y > 0 für alle y ∈ Tg(x), y 6= 0,

dann ist x strikte lokale Minimalstelle von f unter der Nebenbedingung g(x) = 0.

Mit ≤ oder < hat man wieder die entsprechenden Bedingungen für ein Maximum.

Page 97: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

5.3 Extrema von Funktionen mehrerer Veränderlicher 91

Der Beweis dieser Aussagen beruht auf folgendem Argument: Mithilfe der Nebenbedingung eli-miniert man einige der Variablen und überführt damit das restringierte Minimierungsproblemauf ein freies. Die Aussagen folgen dann aus den bekannten Sätzen für lokale Extrema. Das Auf-lösen der Nebenbedingungen wird demnächst im Rahmen des Satzes über implizite Funktionenbehandelt. Zur Illustration der Vorgehensweise betrachten wir nochmals obige Beispiele.

5.21. Beispiel. Gesucht ist wieder das Minimum der Funktion f(x, y, z) = x2 + y2 + z2 unterder Nebenbedingung g(x, y, z) = x+y+z−1 = 0. Es gilt g′(x, y, z) = (1, 1, 1) und diese Matrixbesitzt vollen Rang, nämlich 1. Der Tangentialraum ist dann

Tg(x, y, z) = {(a, b, c) : g′(x, y, z) (a, b, c)> = a+ b+ c = 0} = {(a, b,−a− b) : a, b ∈ R}.

Weiters gilt HxL(x, y, z, λ) = 2E woraus

(a, b, c)HxL(x, y, z)(a, b, c)> = 2a2 + 2b2 + 2c2 = 2‖(a, b, c)‖22

für alle (a, b, c) 6= 0 folgt, insbesondere also auch für die Vektoren aus dem Tangentialraum.Jeder stationäre Punkt der Lagrangefunktion L(x, y, z, λ) = f(x, y, z) + λg(x, y, z) ist somitStelle eines strikten lokalen Minimums von f unter der Nebenbedingung g(x, y, z) = 0.

5.22. Beispiel. Wie weiter oben gezeigt, sind (x, y, λ) = (±1/√

2,±1/√

2,−1 ∓√

2) die sta-tionären Punkte für die Lagrangefunktion L(x, y, λ) = f(x, y) +λg(x, y) = (x−1)2 + (y−1)2 +λ(x2 + y2 − 1). Hier gilt

g′(x, y) = (2x, 2y) 6= 0 für alle zulässigen (x, y) mit g(x, y) = 0,

woraus ebenso die Existenz eines Lagrangemultiplikators folgt! Der Tangentialraum ist hier

Tg(±1/√

2,±1/√

2) = {(a, b) : a/√

2 + b/√

2 = 0} = {(a,−a) : a ∈ R}

und die Hessematrix der Lagrangefunktion ist HxL(±1/√

2,±1/√

2, 1 ±√

2) = ±2√

2E. Imersten Fall liegt also ein Maximum vor, und im zweiten ein Minimum.

5.23. Beispiel (Gradient als Richtung des steilsten Anstiegs).Sei h : D ⊂ Rn → R stetig differenzierbar. Dann gilt

h(x+ tv) = h(x) + th′(x) v + o(t‖v‖) = h(x) + tv · ∇h(x) + o(t‖v‖).

Ist ‖v‖ = 1, dann beschreibt die Funktion f(v) := v · ∇h(x) wie stark sich die Funktionh verändert wenn man das Argument x in Richtung v verändert. Die Richtung des steilstenAnstiegs lässt sich durch folgendes Problem beschreiben:

maxv∈Rn

v · ∇h(x), sodass ‖v‖2 = 1.

Page 98: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

92 Anwendungen der Differentialrechnung

Die entsprechende Lagrangefunktion ist L(v, λ) = v · ∇h(x) + λ(v · v− 1). Differenzieren liefertdie notwendigen Bedingungen

∇vL(v, λ) = ∇h(x) + 2λv!

= 0

∇λL(v, λ) = v · v − 1!

= 0.

Die erste Gleichung besagt, dass v = − 12λ∇h(x) ein Vielfaches von ∇h(x) ist. Zusammen mit

der Normierungsbedingung erhält man die stationären Punkte

v = ± ∇h(x)

‖∇h(x)‖, λ = ∓1

2‖∇h(x)‖.

Die Hessematrix der Lagrangefunktion ist hierHvL(v, λ) = 2λE. Diese ist im ersten Fall negativdefinit, und im zweiten Fall positiv definit. Also ist v = ∇h(x)

‖∇h(x)‖ Richtung des steilsten Anstiegs,und v = − ∇h(x)

‖∇h(x)‖ die Richtung des steilsten Abstiegs. Man veranschauliche sich hierzu auchentsprechende Funktionsgraphen.

Allgemeinere Nebenbedingungen

Wir wollen noch kurz erläutern, wie sich obige Resultate dazu verwenden lassen, um auchmanche Probleme mit Ungleichungsrestriktionen zu behandeln.

5.24. Beispiel. (i) Wir suchen lokale und globale Extremstellen der Funktion f : D ⊂ R2 → R,x 7→ x2 + 2xy + 2y2; diesmal auf dem abgeschlossenen Quadrat D = [−1, 1]2.

Lösung: (i) Da D kompakt ist und f stetig, existieren die globalen Extrema!(ii) Wie bereits zuvor gezeigt, gibt es im Inneren D von D nur ein globales Minimum bei (0, 0),und sonst keine weiteren lokalen Extrema.(iii) Als nächstes suchen wir nach Extremstellen am Rand. Hierzu unterteilen wir ∂D in dieoffenen Teilstücke

∂D1 = {(x,−1) : −1 < x < 1}, ∂D2 = {(1, y) : −1 < y ≤ 1},∂D3 = {(x, 1) : −1 < x < 1}, ∂D4 = {(−1, y) : −1 < y < 1}

und die Eckpunkte(−1,−1), (1,−1), (1, 1), (−1, 1).

Auf den einzelnen Teilstücken bzw. Punkten suchen wir jetzt nacheinander nach lokalen Ex-tremstellen:(a) Entlang des Randstückes ∂D1 hat die Funktion f die Gestalt

f(x,−1) = x2 − 2x+ 2 =: g1(x).

Ableiten der Funktion g1 nach x liefert

g′1(x) = ∂xf(x, 1) = 2x− 2!

= 0,

Page 99: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

5.4 Hauptsätze über Implizite und Inverse Funktionen 93

als notwendige Bedingung für ein Extremum am Rand. Die Ableitung entlang des Randesist für −1 < x < 1 immer kleiner 0, d.h., f kann auf ∂D1 kein lokales Extremum besitzen.(Wir haben hier die Nebenbedingung y = −1 explizit eliminiert. Man könnte aber auch denLagrangeformalismus verwenden.)(b) Für das Teilstück ∂D2 definieren wir g2(y) = f(1, y). Aus

g′2(y) = ∂yf(1, y) = 2 + 4y!

= 0

erhalten wir (x, y) = (1,−1/2) als Kandidaten für ein lokales Extremum. Wegen g′′2(y) =∂2yf(1, y) = 4 > 0 kann es sich nur um ein lokales Minimum handeln mit f(1,−1/2) = 1/2.

Allerdings gilt∂(−1,0)f(1,−1/2) = −∂xf(1,−1/2) = −1,

also nimmt f in Richtung (−1, 0) (die ins Innere von D zeigt) ab, woraus f(1 − t,−1/2) <f(1,−1/2) für hinreichend kleines t > 0 folgt. (1,−1/2) ist daher keine lokale Extremstelle.(c) Analog verfährt man mit den anderen Randstücken, und findet auch dort keine lokalenExtremstellen.(d) Als letztes überprüfen wir die Eckpunkte. Hier gilt

f(−1,−1) = 5, f(1,−1) = 1, f(1, 1) = 5, f(−1, 1) = 1.

Wegen f(1− t,−1) = t2 + 1 > 1 und f(1,−1 + t) = 1−2t < 1 liegt bei (1,−1) weder Minimumnoch Maximum vor. Gleiches gilt für (−1, 1). Die Punkte (1, 1) und (−1,−1) müssen hingegenStellen des globalen Maximums sein, das ja wegen Stetigkeit von f und Kompaktheit von Dexistiert.

Zusammenfassend haben wir also: (0, 0) ist Stelle des globalen Minimums und ±(1, 1) ist dieStelle eines globalen Maximums.

5.4 Hauptsätze über Implizite und Inverse Funktionen

In Satz 1.45 haben wir gesehen unter welchen Bedingungen eine Funktion, die nur von einerreellen Variablen abhängt, einen Fixpunkt besitzt. Diesen Satz verallgemeinern wir nun aufFunktionen von mehreren Variablen.

5.25. Satz (Banach’scher Fixpunktsatz). Es mögen folgende Voraussetzungen gelten:

(i) D ⊂ Rn ist abgeschlossen

(ii) φ : D → Rn ist eine Selbstabbildung, d.h., φ(D) ⊂ D;

(iii) φ ist eine Kontraktion, d.h., es gibt ein L < 1, so dass

‖φ(x)− φ(y)‖ < L‖x− y‖ für alle x, y ∈ D.

Page 100: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

94 Anwendungen der Differentialrechnung

Dann gilt:

(a) Die Fixpunktgleichung x = φ(x) besitzt genau einen Fixpunkt x∗ = φ(x∗) in D.

(b) Für jeden Startwert x0 ∈ D konvergiert die durch (1.1) erzeugte Folge xn gegen x∗.

(c) Es gilt die Fehlerabschätzung

‖xn − x∗‖ ≤ L1−L‖xn − xn−1‖ ≤ Ln

1−L‖x1 − x0‖.

Beweis: Vollkommen analog zum Beweis von Satz 1.45. Man ersetze lediglich | · | durch ‖ · ‖.

5.26. Beispiel. Bevor wir ein Beispiel diskutieren wollen wir eine weitere Matrixnorm einführen(|||·|||1 ≡ Spaltenbetragssummennorm bzw |||·|||∞ ≡ Zeilenbetragssummennorm kennen wir schon).Sei A ∈ Rn×n eine Matrix. Mit λM = max(σ(A>A)) bezeichnen wir dem größten Eigenwert vonA>A. Dann gilt (Übung) |||A|||2 =

√λM .

Wir betrachten das folgende Gleichungssystem

x =1

3

(x3 − y3 + 1

)y =

1

3

(x3 + y3 − 1

)auf D := {(x, y) ∈ R2 : |x|, |y| ≤ 1

2} = [−1

2, 1

2]2. Wir definieren

φ : D → R2,

(xy

)7→ 1

3

(x3 − y3 + 1x3 + y3 − 1

).

Offenbar ist D abgeschlossen. φ ist eine Selbstabbildung, denn

φ1(x, y) =1

3

(x3 − y3 + 1

)≤ 1

3

(2

8+ 1)≤ 1

2

φ1(x, y) =1

3

(x3 − y3 + 1

)≥ 1

3

(− 2

8+ 1)

=1

4

φ2(x, y) =1

3

(x3 + y3 − 1

)≤ 1

3

(2

8− 1)≤ −1

4

φ2(x, y) =1

3

(x3 + y3 − 1

)≥ 1

3

(− 2

8− 1)

=−1

2.

φ ist stetig differenzierbar mit

φ′(x, y) =

(x2 −y2

x2 y2

), φ′(x, y)>φ′(x, y) =

(2x4 00 2y4

), |||φ′(x, y)|||2 ≤

1

2√

2.

Der BFPsatz liefert die Existenz eines eindeutigen Fixpunktes (x∗, y∗) ∈ D, der Lösung unseresGleichungssystems ist. Mit x0 = y0 = 1/2 ergibt sich x7 = 0.3609, y7 = −0.3296 mit Fehler‖x7 − x∗‖2 ≤ L

1−L‖x7 − x6‖2 ≤ 4.0196 · 10−06 mit L = 1/√

8.

Page 101: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

5.4 Hauptsätze über Implizite und Inverse Funktionen 95

Der folgende Satz gibt hinreichende Bedingungen für die Existenz einer Umkehrfunktion, sowiederen Ableitung. Man vergleiche mit Satz 1.7 e). Er besagt, dass eine stetig differenzierbareFunktion f in einer Umgebung eines Punktes x invertierbar ist, falls f ′(x) invertierbar ist.

5.27. Satz (Inverse Funktion). Sei D ⊂ Rn offen. Weiter sei f : D ⊂ Rn → Rn stetigdifferenzierbar. Für ein a ∈ D gelte det(f ′(a)) 6= 0. Dann gelten für b := f(a):

(i) Es existieren Umgebungen U, V ⊂ Rn von a bzw b, sodass f|U : U → V bijektiv ist.

(ii) Die Umkehrfunktion f−1 : V → U ist stetig differenzierbar mit

(f−1)′(y) = (f ′(x))−1, wobei y = f(x).

Beweis: i) Idee: Für y “nah“ bei b wollen wir die eindeutige Lösung der Gleichung f(x) = y finden.Dies soll mit dem Banach’schen Fixpunktsatz geschehen. Wir betrachten für r > 0 (wird weiter untenfestgelegt)

φ : Ur(a)→ Rn, φ(x) := x+ f ′(a)−1(y − f(x)).

Dann ist φ stetig differenzierbar mit

φ′(x) = E − f ′(a)−1f ′(x), φ′(a) = 0.

Da φ′ stetig ist, existiert also ein r > 0 mit∣∣∣∣∣∣φ′(x)∣∣∣∣∣∣ ≤ 1

2für alle x ∈ Ur(a). (5.1)

Sei im Folgenden y ∈ Ur(b) mit r = r/(2∣∣∣∣∣∣f ′(a)−1

∣∣∣∣∣∣). Wir verifizieren nun die Voraussetzungen desFixpunktsatzes.

a) Ur(a) ist offensichtlich abgeschlossen.b) Kontraktion: Aus dem Mittelwertsatz und (5.1) erhalten wir für alle x, x ∈ Ur(a), dass

‖φ(x)− φ(x)‖ ≤ supx∈Ur(a)

∣∣∣∣∣∣φ′(ξ)∣∣∣∣∣∣ ‖x− x‖ ≤ 1

2‖x− x‖. (5.2)

c) Selbstabbildung: Wir müssen zeigen, dass φ(x) ∈ Ur(a) für alle x ∈ Ur(a): Mit (5.2) erhalten wir

‖φ(x)− a‖ ≤ ‖φ(x)− φ(a)‖+ ‖φ(a)− a‖ ≤ 1

2‖x− a‖+ ‖f ′(a)−1(y − b)‖ < r

2+∣∣∣∣∣∣f ′(a)−1

∣∣∣∣∣∣ r ≤ r.Aus dem Banach’schen Fixpunktsatz und der letzten Abschätzung folgt also

∀y ∈ Ur(b) ∃! x ∈ Ur(a) : f(x) = y.

ii) Um zu zeigen, dass f ′(x) ∈ Rn×n invertierbar ist für alle x ∈ Ur(a), berechnen wir Kern(f ′(x)). Seiw ∈ Rn mit f ′(x)w = 0. Dann folgt

‖w‖ = ‖(E − f ′(a)−1f ′(x))w‖ = ‖φ′(x)w‖(5.1)≤ 1

2‖w‖, also w = 0.

Page 102: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

96 Anwendungen der Differentialrechnung

Man rechnet nun noch nach, dass für y = f(x) gilt

lim‖h‖→0

f−1(y + h)− f−1(y)− f ′(x)−1h

‖h‖= 0.

Die Stetigkeit von x 7→ f ′(x)−1 folgt aus Cramer’s Regel.

5.28. Bemerkung. Die folgende Beobachtung ist nützlich im Beweis vom impliziten Funktio-nensatz weiter unten. In vorigem Beweis haben wir jede Vektornorm zugelassen. Wählen wirspeziell die ∞-Norm, so sind die in i) konstruierten Mengen Ur(a) und Ur(b) offene Quader.

Die Fixpunktfunktion φ aus vorherigem Beweis hat große Ähnlichkeit mit der Iterationsvor-schrift des Newtonverfahrens, vgl. Satz 1.49. Eine Verallgemeinerung dieses Verfahrens aufFunktionen mehrerer Variablen lautet.

5.29. Newtonverfahren. Seien f : D ⊂ Rn → Rn stetig differenzierbar und f ′ : D →Rn×n Lipschitz-stetig. Sei x∗ ∈ D Lösung von f(x∗) = y und det(f ′(x∗)) 6= 0. Dann konver-giert das Newtonverfahren

xn+1 = xn + f ′(xn)−1(y − f(xn)), n ≥ 0

lokal quadratisch gegen die Lösung x∗, d.h., es gilt

‖xn+1 − x∗‖ ≤ C‖xn − x∗‖2 für alle n ≥ 0

für alle Startwerte x0 mit ‖x0 − x∗‖ hinreichend klein.

Beweis: Basis des Beweises ist die folgende Abschätzung

‖xn+1 − x∗‖ = ‖xn − x∗ + f ′(xn)−1(f(x∗)− f(xn))‖ = ‖f ′(xn)−1(f ′(xn)(xn − x∗) + f(x∗)− f(xn)︸ ︷︷ ︸

MWS= f ′(ξ)(x∗−xn)

)‖

≤∣∣∣∣∣∣f ′(xn)−1

∣∣∣∣∣∣ ∣∣∣∣∣∣f ′(xn)− f ′(ξ)∣∣∣∣∣∣ ‖xn − x∗‖

≤ CL‖xn − x∗‖2,

wobei L die Lipschitz-Konstante von f ′ ist. Die Konstante C stammt von der Stetigkeit von x 7→f ′(x)−1 für ‖x − x∗‖ hinreichend klein, vgl. Satz über die inverse Funktion. Die Konvergenz und dieWohldefiniertheit des Verfahrens folgen jetzt wie im eindimensionalen Fall.

Mithilfe obiger Sätze können wir Gleichungen der Form f(x) = y lösen. Im nächsten Schrittwollen wir Gleichungen der Form f(x, y) = 0 betrachten. Die Variable x kann hier z.B. phy-sikalische Parameter eines Systems beschreiben und y den Zustand dieses Systems. Nehmenwir an, das zu jedem x genau ein y gehört, dass vorherige Gleichung erfüllt, so erhalten wireine implizit definierte Funktion g(x) := y mit f(x, g(x)) = 0. Bedingungen, wann solch eineFunktion g existiert, gibt der folgende Satz.

Page 103: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

5.4 Hauptsätze über Implizite und Inverse Funktionen 97

5.30. Satz über implizite Funktionen. Seien A ⊂ Rm und B ⊂ Rn offene Mengen und

f : A×B → Rn, (x, y) 7→ f(x, y)

eine stetig differenzierbare Funktion. Weiter sei (a, b) ∈ A×B mit

f(a, b) = 0, und det(f ′y(a, b)) 6= 0,

wobei f ′y(x, y) = (∂y1f(x, y), . . . , ∂ynf(x, y)) ∈ Rn×n die Ableitung von f bzgl. der y-Variablen im Punkt (x, y) ist. Dann existieren offene Umgebungen U ⊂ A von a und V ⊂ Bvon b und eine stetig differenzierbare Funktion g : U → V mit den Eigenschaften

(i) f(x, g(x)) = 0 für alle x ∈ U .(ii) Aus (x, y) ∈ U × V mit f(x, y) = 0 folgt y = g(x).

(iii) Die Ableitung von g ist gegeben durch

g′(x) = −f ′y(x, g(x))−1f ′x(x, g(x)) ∈ Rn×m,

wobei f ′x(x, y) = (∂x1f(x, y), . . . , ∂xmf(x, y)) ∈ Rn×m die Ableitung von f bzgl. der x-Variablen im Punkt (x, y) ist.

Beweis: Die Idee ist, den Satz über die inverse Funktion auf die Hilfsfunktion

G : A×B → Rm+n, (x, y) 7→(

xf(x, y)

)anzuwenden. G ist stetig differenzierbar mit

G′ =(G′x G′y

)=

(Em 0f ′x f ′y

), (5.3)

hierbei sind Em ∈ Rm×m die Einheitsmatrix und 0 ∈ Rm×n die Nullmatrix. Weiter gilt

G(a, b) =

(a

f(a, b)

)=

(a0

), und det(G′(a, b)) = det(f ′y(a, b)) 6= 0.

Nach dem Satz über die inverse Funktion gibt es also offene Umgebungen O 3 (a, b) und W 3 (a, 0),so dass G|O : O → W , bijektiv ist und die Umkehrfunktion H stetig differenzierbar ist. Wir wählennun geeignet offene Quader Qa, Qb aus mit (a, b) ∈ Qa×Qb ⊂ O und Qa×{0} ⊂W (vgl. Skizze! bzw.Bemerkung 5.28) und setzen U = Qa und V = Qb. Wir betrachten nun die stetig differenzierbarenFunktionen

ϕ : Rm → Rm+n, x 7→(x0

), und πy : Rm+n → Rn,

(xy

)7→ y,

und definieren die stetig differenzierbare Funktion

g : U → V, x 7→ πy(H(ϕ(x))).

Page 104: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

98 Anwendungen der Differentialrechnung

Aussagen i) und ii) folgen aus: Für x ∈ U und y ∈ V gilt

f(x, y) = 0⇔ G(x, y) = ϕ(x)⇔(xy

)Def. von G

= H(ϕ(x))⇔ y = g(x).

Wir leiten nun die Formel für g′ her: Wegen (x, 0)> = G(x, g(x)) liefert die Kettenregel und (5.3)(Em0

)= G′x(x, g(x)) +G′y(x, g(x))g′(x) =

(Em

f ′x(x, g(x))

)+

(0

f ′y(x, g(x))

)g′(x).

Aus der zweiten Zeile lesen wir ab, dass f ′y(x, g(x))g′(x) = −f ′x(x, g(x)).

5.31. Beispiel. (i) Wir betrachten die Punkte (x, y) ∈ R2 auf dem Rand des Einheitskreises.Diese erfüllen die Gleichung

x2 + y2 = 1.

Wir wollen nun feststellen, ob wir y in Abhängigkeit von x ausdrücken können (Durch Umfor-men erkennt man hier schon die Lösung!). Wir definieren

f : R2 → R, (x, y) 7→ x2 + y2 − 1, (a, b) ∈ R2.

Es gilt f ′x(x, y) = 2x und f ′y(x, y) = 2y. Die Voraussetzung det(f ′y(a, b)) = 2b 6= 0 bedeutetb 6= 0; wir nehmen b > 0 an. Der implizite Funktionensatz besagt, dass es nun Umgebungen Uvon a und V von b sowie eine stetig differenzierbare Funktion g : U → V gibt, so dass

x2 + g(x)2 − 1 = 0.

Hier: U = (−1, 1), V = (0, 2), g(x) =√

1− x2, da b > 0. Außerdem gilt

g′(x) =−x√1− x2

= −f′x(x, g(x))

f ′y(x, g(x))= − 2x

2g(x).

(ii) Wir betrachten die stetig differenzierbare Funktion

f(x, y) = y3 + y − x2 != 0.

Mit x = 0 = y gilt f(x, y) = 0. Für die Ableitungen gilt

f ′x(x, y) = −2x, f ′y(x, y) = 3y2 + 1, det(f ′y(0, 0)) = 1.

Gemäß dem impliziten Funktionensatz existieren offene Umgebungen U und V von 0 und einestetig differenzierbare Funktion g : U → V mit f(x, g(x)) = 0 für alle x ∈ U . Weiter gilt

g′(x) = −f ′y(x, y)−1f ′x(x, g(x)) =2x

3g(x)2 + 1.

(iii) Wir betrachten die stetig differenzierbare Funktion

f(x1, x2, y) = x1 + x2 + y − ex1x2y != 0.

Page 105: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

5.4 Hauptsätze über Implizite und Inverse Funktionen 99

Mit (x1, x2) = (0, 12) und y = 1

2gilt f(x1, x2, y) = 0. Für die Ableitungen gilt

f ′x(x1, x2, y) =(

1− x2yex1x2y 1− x1ye

x1x2y), f ′y(x, y) = 1− x1x2e

x1x2y, det(f ′y(0,12)) = 1.

Gemäß dem impliziten Funktionensatz existieren offene Umgebungen U und V von (0, 12) bzw

12und eine stetig differenzierbare Funktion g : U → V mit f(x1, x2, g(x1, x2)) = 0 für alle

(x1, x2) ∈ U . Weiter gilt

g′(x1, x2) = −f ′y(x1, x2, y)−1f ′x(x1, x2, g(x1, g2))

=1

x1x2ex1x2g(x1,x2) − 1

(1− x2g(x1, x2)ex1x2g(x1,x2) 1− x1g(x1, x2)ex1x2g(x1,x2)

).

Bemerkung (Lagrange-Multiplikatoren).

Wir begeben uns in die Situation von Satz 5.20. Angenommen z = (x; y) ∈ Rn mit x ∈ Rn−m

und y ∈ Rm sei ein lokales Extremum von f : Rn → R unter der Nebenbedingung g(z) = 0,wobei g : Rn → Rm. Wir ordnen dabei die Variablen so an, dass

g′(z) =(g′x(z) g′y(z)

), mit g′y(z) ∈ Rm×m und det(g′y(z)) 6= 0.

Der implizite Funktionensatz liefert uns offene Umgebungen U ⊂ Rn−m und V ⊂ Rm von xbzw y und eine C1-Funktion G : U → V mit g(x,G(x)) = 0 und

G′(x) = −g′y(x,G(x))−1g′x(x,G(x)) ∈ Rm×n−m.

Nun hat f genau dann ein lokales Extremum in z = (x, y) unter der Nebenbedingung g(z) = 0,wenn h : U → R, x 7→ f(x,G(x)) eines in x hat. Differentiation mittels Kettenregel liefert

0 = h′(x) = f ′x(x, y) + f ′y(x, y)G′(x) = f ′x(x, y)− f ′y(x, y)g′y(x)−1g′x(x).

Mit λ> := −f ′y(x, y)g′y(x)−1 ∈ R1×m, folgt also

L′z(z, λ) = (f ′x(z) + λ>g′x(z) f ′y(z) + λ>g′y(z)) = 0,

sowie insbesondere L′λ(z, λ) = g(z) = g(x, G(x)) = 0. Für die notwendigen und hinreichendenBedingungen zweiter Ordnung differenziere man h ein weiteres Mal; siehe Übung.

Page 106: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

100 Anwendungen der Differentialrechnung

Page 107: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

6 Integration in mehreren Dimensionen

6.1 Integralbegriff

Im folgenden werden wir den Begriff des Riemann-Integrals auf Funktionen mehrerer Veränder-licher verallgemeinnern. Für eine Funktion f : D ⊂ R2 → R soll das Integral

∫Df(x, y)d(x, y)

dabei das Volumen unter dem Graphen der Funktion beschreiben.

Wir betrachten zunächst nur einfache Gebiete der Form

Q = [a1, b1]× . . .× [an, bn].

Diese nenn man Quader (in Anlehnung an den ein-dimensionalen Fall auch Intervall) in Rn.Sind Zi([ai, bi] Zerlegungen der Intervalle [ai, bi], so nennt man

Z(Q) := Z1([a1, b1])× . . .× Zn([an, bn])

eine Zerlegung des Quaders Q. Die Menge aller Zerlegungen des Quaders Q wird wieder mitZ(Q) bezeichnet. Die Feinheit der Zerlegung ist einfach als

‖Z(Q)‖ := max1≤i≤n

‖Zi([ai, bi])‖

definiert. Das Volumen eines Quaders Q ist gegeben durch

vol(Q) = (b1 − a1) · . . . · (bn − an).

Um zu verdeutlichen, dass es sich um ein 2-dimensionales Volumen (=Fläche) handelt, werdenwir auch vol 2D(Q) schreiben. Eine Zerlegung Z(Q) definiert eine Aufteilung der Menge Qin Teilquader Qi. Zur Veranschaulichung der Begriffe wird in folgender Abbildung kurz derzweidimensionale Fall skizziert.

Page 108: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

102 Integration in mehreren Dimensionen

Zerlegung, Feinheit, Teilquader, Volumen für einen zweidimensionalen Quader.

Bei der Definition des Integrals gehen wir nun exakt wie im eindimensionalen Fall vor.

6.1. Definition. Sei f : Q ⊂ Rn → R beschränkt.

(a) Für eine Zerlegung Z(Q) des Quaders Q definieren wir die Riemann’sche Unter bzw.Obersumme durch

Uf (Z) :=∑i

inf f(Qi) vol(Qi) und Of (Z) :=∑i

sup f(Qi) vol(Qi),

wobei die Summe über alle durch die Zerlegung definierten Teilquader Qi läuft.

(b) Die (existierenden!) Grenzwerte

Uf := supZ∈Z

Uf (Z) und Of := infZ∈Z

Of (Z)

heißen Riemann’sches Unter- bzw. Oberintegral.

(c) Stimmen für eine Funktion f Unter- und Oberintegral überein, so heißt die Zahl∫Q

f(x)dx := Of = Uf

Riemannintegral von f über Q; die Funktion f heißt über Q Riemann-integrierbar.

Wie im eindimensionalen liefern Ober- und Unterintegral wiederum obere bzw. untere Schran-ken für das Integral. Bei feiner werdenden Zerlegungen nähern sich die Schranken von obenbzw unten einander an. Man beachte, dass wiederum

Uf (Z1) ≤ Of (Z2)

für alle Zerlegungen Z1, Z2 von Q gilt. Hiermit folgt, dass für integrierbare Funktionen nebenden Ober- und Untersummen auch beliebige Riemannsummen

Rf (Z) =∑i

f(ξi) vol(Qi), ξi ∈ Qi

Page 109: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

6.2 Eigenschaften, Kriterien für Integrierbarkeit 103

gegen das Integral konvergieren, wenn die Feinheit der Zerlegungen gegen 0 geht.

Im folgenden Beispiel berechnen wir das Integral einer einfachen Funktion durch Anwenden derDefinition.

6.2. Beispiel. Gesucht ist∫

[0,1]2xy d(x, y).

Lösung: Wir berechnen für eine Folge (Zn) von feiner werdenden Zerlegungen die Ober- undUntersummen Of (Zn) und Uf (Zn), und zeigen das die beiden Ausdrücke gegen einen gemein-samen Grenzwert konvergieren.

Für n ∈ N sei h = 1/n und Zn([0, 1]) := {ih : 0 ≤ i ≤ n} eine Zerlegung des Intervalls [0, 1].Wir definieren Zn := Zn([0, 1]2) := Z1([0, 1]) × Z1([0, 1]), was eine Zerlegung des Quadrates[0, 1]2 in lauter gleichgroße Teil-Quadrate Qij = [(i − 1)h, ih] × [(j − 1)h, jh], 1 ≤ i, j ≤ nbeschreibt.

Für diese Zerlegungen gilt mit f(x, y) := xy

Uf (Zn) :=∑i,j

inf f(Qij) vol(Qij) =n∑

i,j=1

(j − 1)h · (i− 1)h · h2

Of (Zn) :=∑i,j

sup f(Qij) vol(Qij) =n∑

i,j=1

ih · jh · h2.

Mithilfe der Summationsformel von Gauß erhält man weiter

Of (Zn)− Uf (Zn) =h4

4(n2(1 + n)2︸ ︷︷ ︸

=n4+2n3+n2

)− h4

4(n2 − 2n3 + n4) =

1

n

n→∞→ 0.

Die Ober- und Untersummen konvergieren also gegen den gemeinsamen Grenzwert∫Q

xy d(x, y) = limn→∞

Of (Zn) = limn→∞

n2 + n4

4n4=

1

4.

6.2 Eigenschaften, Kriterien für Integrierbarkeit

Die folgenden Eigenschaften des Integrals ergeben sich sofort wieder aus der Definition sowieden Rechenregeln für Grenzwerte. Vergleiche auch die entsprechenden Aussagen für Integralein einer Dimension.

Page 110: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

104 Integration in mehreren Dimensionen

6.3. Satz. Seien f, g : Q ⊂ Rn → R Riemann-integrierbar. Dann gilt

(a) Linearität:∫Q

αf(x) + g(x)dx = α

∫Q

f(x)dx+

∫Q

g(x)dx für alle α ∈ R.

(b) Monotonie und Positivität: Ist f(x) ≤ g(x) für alle x, dann folgt∫Q

f(x)dx ≤∫Q

g(x)dx.

Insbesondere folgt aus g(x) ≥ 0 die Positivität des Integrals.

(c) Mittelwertsatz: Ist f stetig, dann existiert ein ξ ∈ Q mit∫Q

f(x)dx = f(ξ) vol(Q).

(d) Addititivät bzgl des Integrationsgebietes: Ist Q =⋃Qi eine disjunkte Zerlegung

von Q, d.h., Qi ∩ Qj = ∅ für i 6= j, dann gilt∫Q

f(x)dx =∑i

∫Qi

f(x)dx.

Beweis: (a) und (b) folgen unmittelbar aus den Rechenregeln für Grenzwerte. Für (c) betrachtet mandie Zerlegung Z = {a1, b1} × . . .× {an, bn}. Dann ist

inf f(Q) vol(Q) = Uf (Z) ≤ Uf =

∫Qf(x)dx = Of ≤ Of (Z) = sup f(Q) vol(Q).

Die stetige Funktion f nimmt auf der kompakten Menge Q ihr Maximum und Minimum an; d.h, esgilt inf f(Q) = f(xmin) und sup f(Q) = f(xmax). Wegen des Zwischenwertsatzes wird auch jeder Wertdazwischen angenommen, woraus die Behauptung folgt.

Um die Integrierbarkeit von Funktionen nicht Fall für Fall nachweisen zu müssen, können wirwieder relativ einfache Charakterisierungen für integrierbare Funktionen geben.

6.4. Satz. (a) Riemann-Kriterium: Eine Funktion f : Q ⊂ Rn → R ist genau dannintegrierbar, wenn es für jedes ε > 0 eine Zerlegung Z gibt, sodass

0 ≤ Of (Z)− Uf (Z) < ε.

(b) Hinreichende Bedingung: Ist f : Q ⊂ Rn → R stetig auf Q, dann auch integrierbar.

(c) Notwendige Bedingung: Ist f Riemann-integrierbar, dann auch beschränkt.

Page 111: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

6.3 Das Integral über allgemeinere Mengen 105

Der Beweis dieser Aussagen folgt wie im Eindimensionalen.

6.3 Das Integral über allgemeinere Mengen

Um den Integrationsbegriff auf allgemeinere Gebiete zu auszudehnen, bedient man sich derfolgenden Konstruktion: Sei Q ⊂ Rn ein Quader und D ⊂ Q. Dann lässt sich jede Funktionf : D → R mittels

f : Q→ R, x 7→{f(x) x ∈ D,0 x 6∈ D

zu einer Funktion auf Q fortsetzen.

6.5. Definition und Satz. (i) Eine Funktion f : D → R heißt integrierbar auf D, wennihre Fortsetzung f integrierbar auf Q ist. In diesem Fall definiert man∫

D

f(x)dx :=

∫Q

f(x)dx.

(ii) Das Integral ist unabhängig vom der Gestalt des umgebenden Quader Q.

Die Fortsetzung durch 0 führt typischerweise zu Unstetigkeiten. Man stellt sich die Frage, obauf D stetige Funktionen trotzdem R-integrierbar sind. Um diese Frage zu klären, benötigenwir noch einige Begriffe.

6.6. Definition. (i) Eine Menge D ⊂ Rn heißt messbar, wenn ihre charakteristische Funk-tion

χD : Q→ R, x 7→{

1 x ∈ D,0 x 6∈ D

R-integrierbar ist. In diesem Fall heißt

vol(D) :=

∫D

1dx =

∫Q

χD(x)dx Volumen von D.

(ii) Eine messbare Menge D ⊂ Rn mit vol(D) = 0 heißt Null-Menge.

Achtung: Unter vol(D) ist hier das n-dimensionale Volumen der Menge D zu verstehen!

6.7. Bemerkung. Wir fassen einige Aussagen zu diesen Begriffen ohne Beweis zusammen.

(i) Quadersummen S =⋃ni=1Qi sind messbar. Falls das Innere Qi der Quader disjunkt ist (was

ohne Beschränkung der Allgemeinheit angenommen werden kann), so gilt vol(S) =∑

i vol(Qi).

Page 112: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

106 Integration in mehreren Dimensionen

Dies entspricht der Additivität bezgl. des Integrationsgebietes.

(ii) D ist genau dann messbar, wenn für jedes ε > 0 Quadersummen U ⊂ D und O ⊃ D mitvol(O)− vol(U) < ε existieren; siehe Skizze.

(iii) Offene und abgeschlossene (beschränkte) Mengen können durch Quadersummen approxi-miert werden und sind daher messbar.

(iv) Eine beschränkte Menge D ist genau dann messbar, wenn ihr Rand eine Nullmenge ist.

(v) Die Spur einer rektifizierbaren (endlich langen) Kurve γ : [a, b] → R2 ist eine zweidimen-sionale Nullmenge, d.h., vol 2D(γ) = 0. Mengen, deren Rand durch eine rektifizierbare Kurvebeschrieben wird sind also messbar. Die Länge der Kurve könnte man als eindimensionlaesVolumen L(γ) = vol 1D(γ) charakterisieren; dieses ist natürlich i.a. nicht gleich null!

Zur Veranschaulichung der Aussagen betrachte man folgende Skizze.

Überdeckung durch Quadersummen.

Der folgende Satz liefert nun die gesuchte Charakterisierung integrierbarer Funktionen aufmessbaren Mengen.

6.8. Satz (Kriterien für Integrierbarkeit).

(i) f : Q ⊂ Rn → R ist genau dann R-integrierbar, wenn f beschränkt und die Menge{x ∈ Q : f unstetig in x} eine Nullmenge ist.

(ii) SeiD messbar und f : D → R stetig aufD fortsetzbar. Dann ist f Riemann-integrierbar.

Nachdem der Begriff der Integrierbarkeit nun hinreichend geklärt ist, wenden wir uns der Fragezu, wie Integrale tatsächlich berechnet werden können. Im folgenden Abschnitt werden wir se-hen, dass in den meisten Fällen Integrieren über mehrdimensionale Bereiche auf das Integrierenin einer Dimension zurückgeführt werden kann.

Page 113: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

6.4 Parameterabhängige Integrale, Satz von Fubini 107

6.4 Parameterabhängige Integrale, Satz von Fubini

Wir betrachten als nächstes die Integration von Funktionen f : R2 → R bezüglich einer Varia-blen. Die zweite Variable wird dabei, ähnlich wie beim partiellen Differenzieren, zunächst alsParameter behandelt. Aus dem Wissen über das R-Integral aus einer Dimension erhält manrelativ leicht das folgende Resultat.

6.9. Satz. Sei f : [a, b]× [c, d]→ R stetig. Dann gilt:

(a) Stetigkeit: Die durch das parameterabhängige Integral definierte Funktion

F : [c, d]→ R, y 7→ F (y) :=

∫ b

a

f(x, y)dx ist stetig auf [c, d].

(b) Vertauschbarkeit der Integrationsreihenfolge (Fubini):∫ d

c

(∫ b

a

f(x, y)dx)dy =

∫ b

a

(∫ d

c

f(x, y)dy)dx =

∫[a,b]×[c,d]

f(x, y)d(x, y).

Ist f darüberhinaus stetig differenzierbar nach y, so gilt weiters:

(c) Differenzierbarkeit: F : [c, d]→ R ist stetig differenzierbar mit

F ′(y) =d

dyF (y) =

d

dy

∫ b

a

f(x, y)dx =

∫ b

a

∂yf(x, y)dx.

6.10. Bemerkungen. (i) Zur Veranschaulichung der Gültigkeit des Satzes betrachte manentsprechende Aussagen für Summen bzw. Riemannsummen. Der Satz von Fubini leitet sichetwa ab aus∑

i,jf(ξi, ηj)(xi − xi−i)(yj − yj−1) =

∑i

(∑jf(ξi, ηj)(yj − yj−1)

)(xi − xi−1)

=∑

j

(∑if(ξi, ηj)(xi − xi−1)

)(yj − yj−1).

(ii) Die Aussagen lassen sich auf den mehrdimensionalen Fall verallgemeinern.

(iii) Für die mehrdimensionale Integration ist vor allem der Satz von Fubini von Bedeutung.Dieser erlaubt die Berechnung von mehrdimensionalen Integralen durch sukzessive eindimen-sionale Integration! Falls f : Q ⊂ Rn → R stetig und somit integrierbar ist, dann gilt∫

Q

f(x)dx =

∫ b1

a1

· · ·∫ bn

an

f(x1, . . . , xn)dxn · · · dx1

Falls f nicht stetig sondern nur R-integrierbar ist, muss die Existenz der Teilintegrale∫ baf(x, y)dx

bzw∫ dcf(x, y)dy für alle x bzw y unter Umständen extra gefordert werden; siehe Übung.

Page 114: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

108 Integration in mehreren Dimensionen

(iv) Aussage (c) besagt, dass bei hinreichend glatter Funktion f die Reihenfolge von Integrationund Differentiation vertauscht werden darf.

Satz von Fubini

6.11. Beispiel. Weiter oben haben wir bereits∫

[0,1]2xy d(x, y) = 1/4 berechnet. Mit Fubini

erhält man∫[0,1]2

xyd(x, y) =

∫ 1

0

∫ 1

0

xydxdy =

∫ 1

0

x2

2y∣∣1x=0

dy =

∫ 1

0

y

2dy =

y2

4

∣∣1y=0

=1

4.

6.12. Beispiel. Die Funktion g : [0, 1] → R, x 7→ x ist stetig und daher auch f : [0, 1]2 → Rdefiniert durch f(x, t) = g(x) exp(−tx).

(a) Satz 6.9 besagt, dass F (t) =∫ 1

0f(x, t)dx stetig ist. Durch Nachrechnen sieht man, dass

F (t) =

∫ 1

0

f(x, t)dx =

∫ 1

0

x exp(−tx)dx =1− exp(−t)− t exp(−t)

t2

gilt. Die Funktion F ist offensichtlich stetig in t 6= 0 und mit der Regel von L’Hospital folgt

limt→0

1− exp(−t)− t exp(−t)t2

= limt→0

exp(−t)2

=1

2.

Dies zeigt auf anderem Wege, dass F auch stetig in t = 0 ist.

(b) Nach dem Satz von Fubini gilt∫ 1

0

(∫ 1

0

x exp(−tx)dx)dt =

∫ 1

0

(∫ 1

0

x exp(−tx)dt)dx =

∫ 1

0

− exp(−tx)|1t=0dx

=

∫ 1

0

1− exp(−x)dx = x+ exp(−x)|1x=0 = 1 +1

e− 1 =

1

e.

Die direkte Berechnung des ersten Integrals wäre hier schwieriger.

(c) Eine Funktion u : [0, 1]→ R, welche die Differentialgleichung

u′(t) = g(t)− cu(t)

Page 115: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

6.5 Integration über Normalbereiche 109

erfüllt, ist durch

u(t) =

∫ t

0

exp(−c(t− s))g(s)ds

gegeben. Mit der Leibnizregel siehe unten erhält man

d

dtu(t) = g(t) · 1 +

∫ t

0

[− c exp(−(t− s))g(s)]ds = g(t)− cu(t).

Alternativ könnte man u auch schreiben als

u(t) = exp(−ct)∫ t

0

exp(cs)g(s)ds,

und mit Produktregel und Hauptsatz der Diff. und Int. Rechnung erhält man wiederum

d

dtu(t) = −c exp(−ct)

∫ t

0

exp(cs)g(s)ds+ exp(−ct) exp(ct)g(t) = −cu(t) + g(t).

6.5 Integration über Normalbereiche

Der vorhergehende Abschnitt klärt die praktische Integration auf mehrdimensionalen Quaderndurch sukzessive eindimensionale Integration. Wir werden nun dieses Vorgehen auf allgemeinereIntegrationsgebiete ausdehnen. In der Praxis hat man es oftmals mit Gebieten der folgendenForm zu tun.

6.13. Definition (Normalbereich). Eine Menge D ⊂ Rn heißt Normalbereich, wenn sich D(nach eventueller Änderung der Reihenfolge der Variablen) beschreiben lässt als

D = {x ∈ Rn : a1 ≤ x1 ≤ b1 ∧ a2(x1) ≤ x2 ≤ a2(x2) ∧∧ an(x1, . . . , xn−1) ≤ xn ≤ bn(x1, . . . , xn−1)}

mit geeigneten stetigen Funktionen ai, bi, i = 2, . . . , n.

6.14. Beispiele. (i) Der Einheitskreis K = {(x, y) : x2 + y2 ≤ 1} lässt sich schreiben als

K = {(x, y) : −1 ≤ x ≤ 1 ∧ −√

1− x2 ≤ y ≤√

1− x2}.

Alternativ könnt man auch −1 ≤ y ≤ 1 vorgeben und x durch eine Funktion von y beschränken.

(ii) Der Kegel K = {(x, y, z) : x2 + y2 ≤ (1− z)2, 0 ≤ z ≤ 1} lässt sich schreiben als

K = {(x, y, z) : 0 ≤ z ≤ 1 ∧ z − 1 ≤ y ≤ 1− z ∧ −√

(1− z)2 − y2 ≤ x ≤√

(1− z)2 − y2}.

Es handelt sich also wieder um einen Normalbereich.

(iii) Das Dreieck T = {(x, y) : 0 ≤ x ≤ 1, 0 ≤ y ≤ 1 − x} ist ein Normalbereich. Durchelementares Umrechnen sieht man, dass sich das Dreieck auch als T = {(x, y) : 0 ≤ y ≤ 1, 0 ≤x ≤ 1− y} darstellen lässt.

Page 116: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

110 Integration in mehreren Dimensionen

Normalbereiche.

Die Sätze über parameterabhängige Integrale über Quader führen nun auf folgende Aussagenfür Normalbereiche. Wir geben wieder nur den zweidimensionalen Fall explizit an.

6.15. Satz. Sei D = {(x, y) : a ≤ x ≤ b ∧ g(x) ≤ y ≤ h(x)} ein Normalbereich.

Ist f : D ⊂ R2 → R stetig, dann gilt

(a) Stetigkeit: Die Funktion F : [a, b]→ R, x 7→∫ h(x)

g(x)f(x, y)dy ist stetig.

(b) Fubini: ∫D

f(x, y)d(x, y) =

∫ b

a

∫ h(x)

g(x)

f(x, y) dy dx.

Sind g, h sogar stetig differenzierbar und ∂xf stetig, so gilt weiters

(c) Leibnizregel:

d

dx

∫ h(x)

g(x)

f(x, y)dy =

∫ h(x)

g(x)

∂xf(x, y)dy + h′(x)f(x, h(x))− g′(x)f(x, g(x)).

Beweis: (a) Die Stetigkeit ergibt sich wie bei den parameterabhängigen Integralen zuvor. (b) Aus derStetigkeit von F folgt zunächst die Integrierbarkeit. Die Gleichheit weist man über Riemann-Summennach. (c) Durch F (x, y) :=

∫ ya f(x, t)dt wird (eine von x abhängige) Stammfunktion von f definiert

und es gilt∫ h(x)g(x) f(x, t)dt = F (x, h(x))−F (x, g(x)). Durch Differentiation und Kettenregel erhält man

formal

d

dx

∫ h(x)

g(x)f(x, t)dt =

d

dx

(F (x, h(x))− F (x, g(x))

)= ∂xF (x, h(x))− ∂xF (x, g(x)) + ∂yF (x, h(x))h′(x))− ∂yF (x, g(x))g′(x).

Die Aussage folgt dann mit ∂yF = f und ∂xF (x, y) = ∂x∫ ya f(x, t)dt laut Regel für Parameterintegrale.

6.16. Bemerkung. Obige Aussagen lassen sich wieder sinngemäß auf den mehrdimensionalenFall erweitern. Das Integral einer stetigen Funktion über einen n-timensionalen NormalbereichD lässt sich also mittels∫

D

f(x)dx =

∫ b

a

∫ b2(x1)

a2(x1)

· · ·∫ bn(x1,...,xn−1)

an(x1,...,xn−1)

f(x1, . . . , xn)dxndxn−1 · · · dx1

durch sukzessive eindimensionale Integration berechnen.

Page 117: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

6.6 Transformationssatz 111

6.17. Beispiel. Für die Fläche des Einheitskreises K = {(x, y) : −1 ≤ x ≤ 1 ∧ −√

1− x2 ≤y ≤√

1− x2}gilt

vol(K) =

∫K

1d(x, y) =

∫ 1

−1

∫ √1−x2

−√

1−x21 dy dx =

∫ 1

−1

2√

1− x2dx

x=cos t= 2

∫ 0

π

√1− cos2 t(− sin(t))dt = 2

∫ π

0

sin2 tdt = π.

6.18. Beispiel. Bezeichne T = {(x, y) : 0 ≤ x ≤ 1, 0 ≤ y ≤ 1−x} ein rechtwinkeliges Dreieck.Gesucht ist das Integral der Funktion f(x, y) = (x+ y)2 über T . Da f stetig auf T und T = Tkompakt ist, gilt nach Fubini∫

T

f(x, y)d(x, y) =

∫ 1

0

∫ 1−x

0

(x+ y)2dydx =

∫ 1

0

13(x+ y)3|y=1−x

y=0 dx

= 13

∫ 1

0

1− x3dx = 13(x− x4

4)|x=1x=0 = 1

3(1− 1

4) = 1

4.

Die alternative Darstellung T = {(x, y) : 0 ≤ y ≤ 1, 0 ≤ x ≤ 1 − y} des Dreiecks undVertauschen der Integrationsreihenfolge führt auf∫

T

f(x, y)d(x, y) =

∫ 1

0

∫ 1−y

0

(x+ y)2dxdy = . . . = 14.

6.6 Transformationssatz

Eine wesentliche Rechenregel zur Bestimmung von Integralen in einer Dimension war die Sub-stitutionsregel ∫ φ(b)

φ(a)

f(x)dxx=φ(t)

=

∫ b

a

f(φ(t))φ′(t)dt.

Zur Erinnerung sei erwähnt, dass diese direkt aus der Kettenregel für die Differentiation unddem Hauptsatz der Differential- und Integralrechnung folgte. Durch die Transformation wirdein Streckenstück dt ≈ tn − tn−1 auf

dx ≈ xn − xn−1 = φ(tn)− φ(tn−1) ≈ φ′(τ)(tn − tn−1) ≈ φ′(τ)dt

abgebildet. Man beachte, dass für monoton fallendes φ die Ableitung φ′ stets kleiner als Null ist,also xn < xn−1. Die Zerlegung {x1, . . . , xn} wird also in Umgekehrter Reihenfolge durchlaufen.

Kümmert man sich bei der Integration (den Riemannsummen) nicht um die Orientierung undbezeichnet mit [a; b] die Strecke {t : t = a + s(b − a), s ∈ [0, 1]}, so kann man die Substituti-onsregel auch schreiben als ∫

φ([a;b])

f(x)dx =

∫[a;b]

f(φ(t))|φ′(t)|dt.

Page 118: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

112 Integration in mehreren Dimensionen

Die formale Regel dx = |φ′|dt beschreibt dann, wie sich die Länge eines Streckenstück dt durchdie Transformation x = φ(t) verändert.

Wir betrachten nun die Transformation eines mehrdimensionalen Integrationsbereiches.

6.19. Definition. Sei U ⊂ Rn offen und zusammenhängend. Eine stetig differenzierbareAbbildung φ : U ⊂ Rn → φ(U) ⊂ Rn heißt (reguläre) Koordinatentransformation,wenn φ injektiv und detφ′(x) 6= 0 für alle x ∈ U ist.

Die Regularitätsbedingung detφ′(x) 6= 0 bewirkt, dass eine Menge mit positivem Volumendurch die Transformation nicht auf eine Nullmenge zusammengeschrumpft werden kann. Diefolgenden Beispiele von Koordinatentransformationen werden häufig verwendet.

6.20. Polarkoordinatentransformation. Die Abbildung φ : (0,∞) × (0, 2π) → R2 \ A,(r, ϕ) 7→ (r cosϕ, r sinϕ) ist stetig differenzierbar mit

detφ′(r, φ) = det

(cosϕ −r sinϕsinϕ r cosϕ

)= r cos2 ϕ+ r sin2 ϕ = 1.

Weiters überzeugt man sich leicht graphisch, dass φ : (0,∞) × (0, 2π) → R2 \ A bijektiv ist;wobei A = {(x, 0) ∈ R2 : x ≥ 0} eine Nullmenge ist.

6.21. Kugelkoordinaten. Die Abbildung φ : (0,∞)× (0, 2π)× (−π/2, π/2)→ R3, (r, ϕ, θ) 7→(r cosϕ cos θ, r sinϕ cos θ, r sin θ) verallgemeinert die Polarkoordinatendarstellung auf den drei-dimensionalen Fall. Man sieht wiederum, dass die Zuordnung von Radius, Polar- und Höhen-winkel auf den zugehörigen Punkt in R3 \ A bijektiv ist. Weiters gilt

detφ′(r, ϕ, θ) = det

cosϕ cos θ −r sinϕ cos θ −r sinϕ cos θsinϕ sin θ r cosϕ sin θ r sinϕ cos θ

cos θ 0 −r sin θ

= −r2 sin θ.

Für den erlaubten Parameterbereich ist r2 sin θ > 0.

Alternativ könnte man auch die Abbildung φ : (0,∞) × (0, 2π) × (−π/2, π/2) → R3 mitφ(r, ϕ, θ) = (r cosϕ sin θ, r sinϕ sin θ, cos θ) verwenden. In diesem Fall ist det φ(r, ϕ, θ) = r2 cos θ.

6.22. Zylinderkoordinaten. Eine weitere Möglichkeit Punkte in R3 darzustellen besteht dar-in, die (x, y) Komponenten auf Polarkoordinaten zu transformieren und die z Komponentegleichzulassen. Man erhält die Abbildung φ : (0,∞) × (0, 2π) × R → R3 \ A, (r, φ, z) 7→(r cosφ, r sinφ, z); hierbei ist A = {(x, 0, z) ∈ R3 : x ≥ 0}. Für die Funktionaldeterminanteerhält man hier detφ′(r, φ, z) = r; siehe Übung.

Page 119: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

6.6 Transformationssatz 113

Ganz ähnlich wie bei der Substitutionsregel dx = x′(t)dt in einer Dimension ändert sich auchbei Koordinatentransformationen das Volumen, d.h. volφ(D) 6= volD. Wir betrachten hierzuein paar einfache Beispiele.

6.23. Transformation durch Skalierung. Die Skalierung

φ(x, y) = (ax, by)> =

(a 00 b

)(xy

)ist wegen detφ′(x, y) = ab für a, b 6= 0 eine reguläre Koordinatentransformation. Durch sie wirddas Quadrat Q = [0, 1]× [0, 1] auf das Rechteck [0; a]× [0; b] abgebildet. Es gilt

volφ(Q) = |ab| = | detφ′(x, y)| volQ.

6.24. Affin-lineare Transformation. Als nächstes betrachten wir die Transformation

φ : Rn → Rn, x 7→ A · x+ b,

wobeiA ∈ Rn×n regulär sei. Diese bildet den EinheitswürfelQ = [0, 1]n auf ein Parallelepiped (in2D ein Parallelogramm) φ(Q) = {Ax+b : x ∈ Q} ab, dessen Kanten durch die SpaltenvektorenA·i der Matrix A aufgespannt werden. Nach den Überlegungen zur Determinante in MSE 1 istdas Volumen dieses Parallelepiped gegeben durch

volφ(Q) = | det(AE)]| = | detA|| detE| = | detφ′(x)| volQ.

6.25. Allgemeine Koordinatentransformationen. Für eine allgemeine Koordinatentrans-formation erhält man mit dem Satz von Taylor die affin-lineare Approximation

φ(x) ≈ φ(x) + φ′(x)(x− x) = φ∗(x).

Für den durch φ transformierten Würfel Q gilt dann mit obiger Überlegung

volφ(Q) ≈ φ∗(Q) = | det(φ∗)′(x)| volQ = | detφ′(x)| volQ.

Die Änderung des Volumens eines kleinen Würfels um den Punkt x durch eine reguläre Koordi-natentransformation φ lässt sich also durch die Linearisierung der Koordinatentransformationbeschreiben.

Volumenänderung bei Koordinatentransformationen

Page 120: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

114 Integration in mehreren Dimensionen

Mithilfe von Koordinatentransformationen können wir nun folgende Verallgemeinerung der Sub-stitutionsregel auf mehrdimensionale Integrale formulieren.

6.26. Transformationssatz. Sei φ : U ⊂ Rn → Rn eine reguläre Koordinatentransforma-tion und f : φ(D) ⊂ φ(U)→ R stetig mit D ⊂ U kompakt. Dann gilt∫

φ(D)

f(x)dx =

∫D

f(φ(y))| detφ′(y)|dy.

Beweisskizze. (i) Mit f und φ ist auch f ◦ φ stetig und wegen stetiger Differenzierbarkeit von φ istschließlich f(φ(y))|detφ′(y)| stetig und daher über dem kompakten (messbaren) Bereich D integrier-bar.(ii) Aus den Eigenschaften von φ und der Messbarkeit von D folgt die Messbarkeit von φ(D); sieheÜbung. Die beiden Integrale sind also wohldefiniert.(iii) Zu zeigen bleibt die Gleichheit der Integrale. Sei Z = {Qi} eine Überdeckung der Menge D mitQuadern mit Feinheit ‖Z‖ = maxi volQi. Durch die Abbildung φ erhält man hieraus eine Zerlegungφ(Z) einer Überdeckung der Menge φ(D) in quaderähnliche Gebiete φ(Qi). Wegen der Stetigkeit vonφ gilt ‖φ(Z)‖ = maxi volφ(Qi) ≤ C maxi volQi = C‖Z‖; siehe Skizze. Wie in der Definition desRiemann-Integrals bezeichnen wir mit f Fortsetzung der Funktion f mit 0. Wegen der Existenz derbeiden Integrale gilt∫

Df(φ(y))| detφ′(y)|dy = lim

‖Z‖→0

∑i

(f ◦ φ)(ηi)|det φ′(ηi)| volQi

sowie ∫φ(D)

f(x)dx = lim‖φ(Z)‖→0

∑i

f(ξi) volφ(Qi).

Wählt man xi = φ(ηi) dann stimmen die Funktionswerte in den Riemannsummen bereits überein. DieTransformation der Volumen unter volφ(Qi) ≈ | detφ′| volQi unter Parametertransformation wurdeoben erläutert.

Volumen, Masse und Trägheitsmoment

Die folgenden Beispiele sollen die Anwendung des Satzes von Fubini sowie der Transformati-onsformel zur Integralberechnung veranschaulichen.

6.27. Beispiel (Volumen). Mithilfe der Formel

volD :=

∫D

1dx

lässt sich das Volumen von Körpern mittels Integration bestimmen. Für die Kugel K ={(x, y, z) : x2 + y2 + z2 ≤ R2} mit Radius R erhalten wir durch Transformation auf Ku-

Page 121: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

6.6 Transformationssatz 115

gelkoordinaten (x, y, z) = φ(r, ϕ, θ) = (r cosϕ sin θ, r sinϕ sin θ, r sin θ) das Volumen

volK =

∫K

1d(x, y, z) =

∫ R

0

∫ 2π

0

∫ π

0

1 · r2 sin θdθ dϕ dr

=

∫ R

0

∫ 2π

0

r2(− cos θ)|θ=πθ=0dϕ dr =

∫ R

0

r24πdr =4πR3

3.

6.28. Beispiel (Masse). Wir betrachten einen Körper, der das Volumen D einnimmt undan der Stelle x die Dichte ρ(x) besitzt. Ein kleiner Würfel Qi besitzt dann etwa die MasseMi ≈ ρ(xi) volQi mit xi ∈ Qi. Durch Aufsummieren erhält man als Formel für die Masse

M =

∫D

ρ(x)dx.

In einem zylinderförmigen Silo der Höhe H und Radius R wird Heu gelagert. Unter dem eigenenGewicht wird das Heu am Boden komprimiert, sodass sich eine Dichteverteilung ρ(x, y, z) =H − z ergibt. Die Gesamtmasse des Heus im völlig gefüllten Silo ist

M =

∫Silo

ρ(x, y, z)d(x, y, z) =

∫ H

0

∫ R

0

∫ 2π

0

ρ(r cosϕ, r sinϕ, z)rdϕ dr dz

=

∫ H

0

∫ R

0

(H − z)2πrdr dz =

∫ H

0

(H − z)R2πdz

= −(H − z)2

2R2π|Hz=0 =

π

2H2R2.

6.29. Beispiel (Schwerpunkt). Der Schwerpunkt eines Körpers mit Dichteverteilung ρ, derdas Volume D belegt, ist gegeben durch S = (S1, . . . , Sn) mit

Si =1

M

∫D

ρ(x)xidx.

Die Halbkreisscheibe H = {(x, y) : x2 + y2 ≤ 1 ∧ y ≥ 0} = {(r cosϕ, r sinϕ) : 0 ≤ r ≤ 1, 0 ≤ϕ ≤ π} mit konstanter Dichte ρ = 1 besitzt die Masse M = π

2und den Schwerpunkt

MS1 =

∫H

1 · xd(x, y) =

∫ 1

0

∫ π

0

r cosϕ · rdϕ dr =

∫ 1

0

r2 sinϕ|ϕ=πϕ=0dr = 0,

MS2 =

∫H

1 · yd(x, y) =

∫ 1

0

∫ π

0

r sinϕ · rdϕ dr

=

∫ 1

0

r2(− cosϕ)|ϕ=πϕ=0dr = 2

r3

3|r=1r=0 =

2

3,

also gilt S = (0, 43π

) ≈ (0, 0.42).

Page 122: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

116 Integration in mehreren Dimensionen

6.30. Beispiel (Trägheitsmoment). Das Trägheitsmoment eines Körpers der Dichte ρ imVolumen D ⊂ R3 bei Rotation um eine Achse a ist gegeben durch

Θ =

∫D

ρ(x)dist(x, a)2dx,

wobei dist(a, x) den Abstand des Punktes x von der Drehachse a bezeichnet. Man erhält dieseFormel formal durch Aufsummieren der Trägheitsmomente kleiner Massenstücke. Das Träg-heitsmoment eines Zylinders Z = {(x, y, z) : x2 + y2 ≤ R2, 0 ≤ z ≤ H} konstanter Dichteρ = 1 bei Rotation um die z-Achse ist dann

Θ =

∫Z

1 · (x2 + y2)d(x, y, z) =

∫ H

0

∫ R

0

∫ 2π

0

(r2 cos2 ϕ+ r2 sin2 ϕ) · rdϕ dr dz

=

∫ H

0

2πr4

4|Rr=0 dz =

2πHR4

4.

Bei Verdoppelung der Höher verdoppelt sich das Trägheitsmoment, eine Verdopplung des Ra-dius führt hingegen zu einer Ver-16-fachung desselben!

Page 123: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

7 Integralsätze

Der Hauptsatz der Differential- und Integralrechnung∫ b

a

f ′(x)dx = f(b)− f(a)

stellt einen Zusammenhang zwischen dem Integral über die Ableitung einer Funktion auf einemGebiet D = (a, b) und den Funktionswerten am Rand ∂D = {a, b} her. Die folgenden Resultateverallgemeinern diesen Sachverhalt auf mehrere Dimensionen.

An die Stelle der Ableitung treten im mehrdimensionalen verschiedene Differentialoperatoren1. Ordnung, insbesondere div und rot. Die Funktionswerte am Rand werden durch Integralgeüber den Rand (=Kurve in 2D, Fläche in 3D) ersetzt.

Als Vorbereitung auf die Integralsätze in zwei Dimensionen wiederholen wir zunächst die Defi-nition von Kurvenintegralen und führen neue Notationen ein.

7.1 Kurvenintegrale

Im folgenden sei γ : [a, b]→ R2 eine stetig differenzierbare Kurve mit Spur γ([a, b]) ⊂ U und Ueine offene Menge in R2. Weiters sei f : U ⊂ R2 → R2 ein stetig differenzierbares Vektorfeld.

Das Kurvenintegral (2. Art) von f längs γ ist definiert durch∫γ

f(x) · ~ds :=

∫ b

a

f(γ(t)) · γ′(t)dt.

x · y =∑

i xiyi stell hier wieder das Skalarprodukt zweier Vektoren dar. Man beachte auch dieformale Ähnlichkeit zur Substitutionsregel mit x = γ(t) und ds = γ(t + dt) − γ(t) ≈ γ′(t)dt!.Mithilfe des Tangenteneinheitsvektors

τ(x) := T (t) :=γ′(t)

‖γ′(t)‖

Page 124: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

118 Integralsätze

lässt sich das Kurvenintegral 2. Art in ein Integral erster Art umschreiben, und zwar∫γ

f(x) · ~ds =

∫γ

f(x) · τ(x)ds.

Das Skalarprodukt f(x) ·τ(x) stellt dabei den Anteil von f dar, der parallel zum Kurvenverlaufgeht; siehe Skize.

Bemerkung: Man beachte, dass die Richtung des Tangenteneinheitsvektors τ von der Orien-tierung der Kurve abhängt. Im Gegensatz zum Kurvenintegral 1. Art ist also das (Vorzeichendes) Kurvenintegral 2. Art von der Orientierung (Parametrisierung) der Kurve abhängig.

Kurven lassen sich zur Darstellung des Randes ∂D eines Integrationsgebietes D verwenden.

7.1. Definition. Der Rand ∂D eines beschränkten Gebietes D lasse sich durch Kurven-stücke γi[ai, bi]→ R2 darstellen. Dann heißt der Rand ∂D (eigentlich die Parametrisierungdurch die Kurvenstücke γi)

(i) positiv orientiert, falls D beim Durchlaufen des Randes stets links von der Kurven-stücken γi liegt.

(ii) stückweise glatt, falls die Kurvenstücke γi glatt sind.

Für stetiges f : D ⊂ R2 → R2 bzw g : D ⊂ R2 → R definieren wir die

(iii) Randintegrale:∫∂D

f(x) · τ(x)ds :=∑

i

∫γi

f(x) · ~ds und∫∂D

g(x)ds :=∑

i

∫γi

g(x)ds.

Randparametrisierung, Durchlaufsinn, Tangential- und Normalvektor.

7.2. Bemerkung. (i) Um die Abhängigkeit von der Ortsvariablen zu betonen schreibt manauch ds(x). Da ∂D eine geschlossene Kurve ist, schreibt man auch

∮∂D

statt∫∂D

.

(ii) Das Randintegral∫∂Df(x)·τ(x) ds(x) heißt Integral von f längs ∂D oder auch Zirkulation

Page 125: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

7.1 Kurvenintegrale 119

von f . Im Falle dass f für das Geschwindigkeitsfeld (Strömungsmechanik) oder das elektrischeoder magnetische Feld (Elektrodynamik) steht hat die Zirkulation eine physikalische Bedeutung.

(iii) Dreht man den Tangenteneinheitsvektor τ um 90◦ erhält man den (bei positiv orientiertemRand) den nach außen gerichteten Normaleneinheitsvektor

n(x) := τ(x)⊥ = (τ2(x),−τ1(x))>.

Auch der Normalenvektor ist Abhängig von der Orientierung des Randes, welche vorgibt wasinnerhalb oder außerhalb des Randes liegt!

(iv) Wie beim Kurvenintegral zweiter Art kann man das Integral∫∂D

f(x) · n(x)ds

welches den gesamten (Normalen-) Fluss des Feldes f über den Rand ∂D berschreibt. In ähn-licher Weise kann man auch

∫∂Df(x)× n(x)ds definieren. Solche Integrale kommen in Anwen-

dungen, z.B. der Strömungsmechanik oder Elektrotechnik, häufig vor.

7.3. Bemerkung. Zur Erinnerung zitieren wir nochmals den folgenden Satz über Kurveninte-grale, der direkt aus dem Hauptsatz der Differential- und Integralrechnung folgt:

(i) Sei φ : U ⊂ R2 → R stetig differenzierbar, und γ : [a, b] → R2 eine C1 Kurve mit Graphγ([a, b]) ⊂ U . Dann gilt∫

γ

∇φ(x) · ~ds =

∫γ

∇φ(x) · τ(x) ds = φ(b)− φ(a).

Das Kurvenintegral über ein Gradientenfeld ist also unabhängig davon, wie der Weg der zwi-schen φ(a) und φ(b) zurückgelegt wird!

(ii) Sei D ⊂ U durch eine geschlossene Kurve γ = ∂D berandet. Dann gilt∮∂Df(x)·τ(x) ds = 0.

Gradientenfelder haben also keine Zirkulation.

Die folgende Aussage über die Existenz einer Stammfunktion wird im Rahmen von Differenti-algleichungen gezeigt:

7.4. Lemma von Poincaré. Das Gebiet D ⊂ U sei einfach zusammenhängend (ohneLöcher) und f : D ⊂ R2 → R2 stetig differenzierbar mit

rot f = ∂1f2 − ∂2f1 = 0.

Dann gibt es eine C2-Funktion φ : D ⊂ R→ R mit f = ∇φ.

Dass die Bedingung rot f = 0 notwendig für die Existenz eines Potentials ist, folgt bereits ausdem Satz von Schwarz angewendet auf rot∇φ!

Page 126: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

120 Integralsätze

7.2 Sätze von Green und Gauß in 2D

Wir klären nun den Zusammenhang zwischen der Zirkulationeines Vektorfeldes am Rand ∂Dund der Wirbelstärke rot f des Feldes im Gebiet D. Weiters stellen wir auch eine Verbindungzwischen dem Normalenfluss über den Rand ∂D und der Quellenstärke div f in D her. DieAussagen folgen mehr oder weniger direkt aus dem Hauptsatzes der Differential- und Inte-gralrechnung und stellen Verallgemeinerungen dieses Satzes auf den merhdimensionalen Falldar.

Im Folgenden sei D ⊂ R2 in beschränktes Gebiet mit positiv orientiertem stückweise glattemRand ∂D. Wir nehmen an, dass sich D in endlich viele Normalbereiche zerlegen lässt. Weiterssei f : R2 → R2 hinreichend glatt, z.B. in einer offenen Umgebung U ⊃ D stetig differenzierbar.

7.5. Integralsatz von Green. Unter obigen Voraussetzungen an D und f gilt∫∂D

f(x) · τ(x)ds =

∫D

rot f(x)dx

Die Zirkulation von f um ∂D entspricht also gerade der gesamten Wirbelstärke in D.

Beweis: Wir führen den Beweis nur für den Fall, dass D ein Normalbereich der Form D = {(x, y) :a ≤ x ≤ b, g(x) ≤ y ≤ h(x)} ist. Mithilfe der Definition rot f = ∂xf2 − ∂yf1 und dem Satz von Fubinierhalten wir ∫

Drot f(x, y)d(x, y) =

∫ b

a

∫ h(x)

g(x)∂xf2(x, y)− ∂yf1(x, y)dy dx.

Wir berechnen zuerst die inneren Integrale. Nach dem Hauptsatz der Differential- und Integralrechnungerhalten wir für den zweiten Term∫ h(x)

g(x)∂yf1(x, y)dy = f1(x, h(x))− f1(x, g(x)),

und mithilfe der Leibnitzregel folgt für den ersten Teil∫ h(x)

g(x)∂xf2(x, y)dy =

d

dx

∫ h(x)

g(x)f2(x, y)dy − f2(x, h(x))h′(x) + f2(x, g(x))g′(x)

Integriert man den ersten Teil auf der rechten Seite nach x so erhält man weiters∫ b

a

d

dx

∫ h(x)

g(x)f1(x, y)dy dx =

∫ h(b)

g(b)f1(b, y)dy −

∫ h(a)

g(a)f1(a, y)dy.

Somit folgt∫D

rot f(x, y)d(x, y) =

∫ h(b)

g(b)f1(b, y)dy −

∫ h(a)

g(a)f1(a, y)dy +

∫ b

af1(x, h(x))− f1(x, g(x))dx

+

∫ b

af2(x, g(x))g′(x)− f2(x, h(x))h′(x)dx

Page 127: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

7.2 Sätze von Green und Gauß in 2D 121

Das doppelte Gebietsintegral wurde hiermit auf ein einfaches Integral reduziert. Wir zeigen nun dieÜbereinstimmung mit dem Randintegral: Hierzu wählen wir die folgende Darstellung des Randes ∂Ddurch Kurvenstücke

γ1 : [a, b]→ R2, γ1(t) =(t, g(t))

)>,

γ2 : [g(b), h(b)]→ R2, γ2(t) = (b, t)>,

γ3 : [a, b]→ R2, γ3(t) =(a+ b− t, h(a+ b− t)

)>,

γ4 : [g(a), h(a)]→ R2, γ4(t) =(a, g(a) + h(a)− t

)>.

Dann gilt ∫γ1

f(x) · d~γ =

∫ b

af(γ(t)) · γ′(t)dt =

∫ b

af1(t, g(t)) + f2(t, g(t))g′(t)dt.

In ähnlicher Weise erhält man∫γ2

f(x) · d~γ =

∫ h(b)

g(b)f2(b, t)dt∫

γ3

f(x) · d~γ = −∫ b

af1(t, h(t)) + f2(t, h(t)h′(t) dt∫

γ4

f(x) · d~γ = −∫ h(a)

g(a)f2(a, t)dt.

Die negativen Vorzeichen beim dritten und vierten Integral stammen von Substitutionen (a + b −t) → t bzw h(a) + h(b) − t → t; siehe Übung. Der Fall, dass D die Vereinigung von endlich vielenNormalbereichen ist, wird durch Anwenden des Satzes auf die einzelnen Normalbereiche gezeigt. Hierbeiverwendet man, dass Integrale über Kurvenstücke im Inneren von D zweimal mit unterschiedlichemUmaufsinn durchlaufen werden und daher wegfallen.

Zerteilung in Normalbereiche und Auslöschung der inneren Integrale.

7.6. Bemerkung. Sei γ eine beliebige Kurve, welche vom Punkt x := γ(a) nach x = γ(b)

verläuft. Dann ist φ(x) :=∫γf(x) · ~ds eine Stammfunktion (ein Potential) für f , es gilt also:

f(x) = ∇φ(x). Die Unabhängigkeit der Stammfunktion von der Wahl der Kurve folgt aus demSatz von Green; siehe Übung. Dieser liefert also die Grundlage für den Beweis des Lemma’svon Poincaré im zweidimensionalen Fall.

Page 128: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

122 Integralsätze

7.7. Beispiel. Gesucht ist die Zirkulation des Vektorfeldes f(x, y) = (y cos(xy)+y, x cos(xy)−x) längs des Einheitskreises γ : [0, 2π]→ R2, t 7→ (cos t, sin t).Lösung: (a) Die direkte Berechnung des Kurvenintegrals ist kompliziert.(b) Man überprüft relativ leicht, dass für φ(x, y) = sin(xy)

∂xφ(x, y) = y cos(xy) und ∂yφ(x, y) = x cos(xy)

gilt. Das Kurvenintegral lässt sich also schreiben als∮γ

f(x, y) · ~ds =

∮γ

∇φ(x, y) · ~ds+

∮γ

(y,−x) ~ds.

Nach dem Hauptsatz üvber Kurvenintegrale verschwindet der erste Teil und man erhält∮γ

f(x, y) · ~ds =

∮γ

(y,−x) ~ds =

∫ 2π

0

(sin t,− cos t) · (− sin t, cos t)dt = −2π.

(c) Nach dem Satz von Green gilt mit D = {(x, y) : x2 + y2 = 1}∮γ

f(x, y) · ~ds =

∮∂D

f(x, y) · τ(x, y) ds =

∫D

rot f(x, y)d(x, y)

=

∫ 2π

0

∫ 1

0

−2drdφ = −2π.

Durch einfache Manipulation ergibts sich aus dem Satz von Green sofort der

7.8. Satz von Gauß. Seien D und f wie im Satz von Green. Dann gilt∫D

div f(x)dx =

∫∂D

f(x) · n(x)ds.

Die gesamte Quellenstärke von f in D entspricht dem Normalenfluss fon f über den Rand.

Achtung: Es kommt hier auf die Orientierung des Randes an; n(x) muss nach außen zeigen!

Beweis: Man wende den Satz von Green auf die Funktion f(x) = (f2(x),−f1(x)) an; siehe Übung.

7.9. Beispiel. Die Funktion φ(x, y) = − log√x2 + y2 beschreibt das Potential eines Feldes

f(x, y) = −∇φ(x, y), das durch eine Quelle im Punkt (0, 0) hervorgerufen wird. Man zeige,dass der Gesamtfluss des Feldes über den Rand des Gebietes D = {(x, y) : x2 + y2 = r2}unabhängig vom Radius r des Gebietes ist.Lösung: (a) Als Parametrisierung des Randes wählen wir γ : [0, 2π]→ R2, t 7→ (r cos t, r sin t).Die direkte Berechnung des Kurvenintegrals liefert dann∮

∂D

f(x, y) · n(x, y)ds =

∫ 2π

0

(r cos t, r sin t)

r2· (r cos t, r sin t)dt = 2π.

Page 129: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

7.3 Oberflächenintegrale 123

Das Integral ist also unabhängig vom Radius des Kreises durch den der Fluss berechnet wird.(b) Wie bereits früher gezeigt wurde, gilt für die betrachtete Funktion div f(x, y) = 0 für(x, y) 6= (0, 0). Nach dem Satz von Gauß gilt dann∮

∂D(R)

f(x, y) · n(x, y)ds−∮∂D(r)

f(x, y) · n(x, y)ds =

∫D(R)\D(r)

div f(x, y)d(x, y) = 0,

was die Behauptung ebenfalls zeigt.

7.10. Bemerkung. Durch Wahl einer speziellen Funktionen f und Anwenden eines der obigenIntegralsätze erhält man verschiedene Formeln zur Bestimmung des Flächeninhaltes- So folgtmit der Wahl f(x, y) = (x, y) etwa

vol(D) =

∫D

1 d(x, y) =1

2

∫∂D

(x, y) · n(x, y)ds =1

2

∫∂D

(x,−y) · τ(x, y)ds.

7.3 Oberflächenintegrale

Um Integralsätze für den drei-dimensionalen Fall herleiten zu können, müssen wir uns nochmit Integralen über Oberflächen im 3D beschäftigen, welche zur Beschreibung des Randes vonVolumen benötigt werden. Die Konstruktion erfolgt völlig analog zum Integral über Kurvenbzw Integralen über Flächen in zwei Dimensionen.

7.11. Definition. Sei D ⊂ R2 ein Gebiet p : D ⊂ R2 → R3, (u, v) 7→ p(u, v) eine stetigdifferenzierbare Abbildung mit

∂up(u, v) und ∂vp(u, v) linear unabhängig für alle (u, v) ∈ D.

Dann heißt p eine Parametrisierung der Fläche S = {(x, y, z) = p(u, v) : (u, v) ∈ D}.

7.12. Bemerkung. (i) Die Bedingung an die partiellen Ableitungen ∂up, ∂vp garantiert, dassS wirklich eine Fläche mit positivem 2-dimensionalem FLächeninhalt darstellt fall vol 2D 6= 0war (und nicht nur eine Linie oder einen Punkt).

(ii) Die Vektoren ∂up(u, v) und ∂vp(u, v) liegen tangential an die Fläche S und spannen dieTangentialebene im Punkt p(u, v) and die Fläche S auf.

(iii) Für fixes v bzw u sind

γv(u) = p(u, v) und γu(v) = p(u, v)

jeweils Kurven in R3 welche auf der Fläche S verlaufen. Aus γ′v(u) = ∂up(u, v) und γ′u(v) =∂vp(u, v) sieht man wiederum, dass die Vektoren ∂up und ∂vp tangential an die Fläche liegen.

Page 130: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

124 Integralsätze

(iv) Der Vektor n(u, v) = ∂up(u, v) × ∂vp(u, v) steht normal auf die Fläche, und n(u, v) :=n(u, v)/‖n(u, v)‖ ist der Normaleneinheitsvektor an die Fläche S im Punkt p(u, v).

Oberfläche, Tangentialebene, Normalvektor.

7.13. Beispiele. (a) Die Abbildung p : [0, 2π]× [0, 1]→ R3, (φ, z) 7→ (cosφ, sinφ, z) beschreibtden Mantel eines Zylinders mit Radius 1 und Höhe 1. Die beiden Vektoren

∂φp(r, φ) = (− sinφ, cosφ, 0)> und ∂zp(r, φ) = (0, 0, 1)>

stehen senkrecht aufeinander und liegen tangential an den Zylinder im Punkt p(φ, z).

n(φ, r) = ∂φp(r, φ)× ∂zp(r, φ) = (− sinφ, cosφ, 0)> × (0, 0, 1)> = (cosφ, sinφ, 0)>

steht in jedem Punkt p(φ, z) = (cosφ, sinφ, z) senkrecht auf den Zylindermantel.

(b) Jede stetig differenzierbaren Funktion f : D ⊂ R, (u, v) 7→ f(u, v) definiert mittels

p(u, v) = (u, v, f(u, v))>

die Parametrisierung einer Fläche. Es gilt

∂up(u, v) = (1, 0, ∂uf(u, v))> und ∂vp(u, v) = (0, 1, ∂vf(u, v))>;

die Bedingung an die Nicht-Degeneriertheit der Tangentialvektoren ist somit immer erfüllt.

(c) Der Rand ∂G eines Normalbereiches G ⊂ R3 lässt sich als (disjunkte) Vereinigung vonparametrisierten Flächenstücken darstellen.

Wie bei der Länge von Kurven definieren wir nun den Flächeninhalt von Oberflächen als Grenz-wert geeigneter Approximationen. Zur Erinnerung: Die Länge ds eines Kurvenstückes bei Ver-änderung des Parameters um dt war durch ds ≈ ‖γ′(t)‖dt gegeben. Mit ähnlichen Überlegungenzeigt man, dass eine Veränderung (du, dv) der Parameterwerte (u, v) der Fläche auf ein Flä-chenstück der Größe

dS = ‖∂up(u, v)× ∂vp(u, v)‖dudv

Page 131: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

7.3 Oberflächenintegrale 125

führt.

Über die üblichen Grenzwerteprozesse erhalten wir nun folgende Formel für den Flächeninhaltvon parametrisierten Oberflächen.

7.14. Definition/Satz. Sei S eine Fläche mit Parametrisierung p : D ⊂ R2 → R3. Dannist durch das integral

|S| :=∫S

φ(x)dS :=

∫D

‖∂up(u, v)× ∂vp(u, v)‖d(u, v)

der Flächeninhalt |S| = vol 2D(S) der Fläche S bestimmt.

7.15. Beispiele. (i) Für den Zylinder mit Höhe h und Radius r erhalten wir mittels Parame-trisierung p : [0, 2π]× [0, h]→ R3, (u, v) 7→ (r cosφ, r sinφ, z)> und Satz von Fubini

|S| =∫D

‖(−r sinφ, r cosφ, 0)× (0, 0, 1)‖d(r, φ)

=

∫ 2π

0

∫ h

0

‖(r cosφ, r sinφ, 0‖dz dφ = 2πrh.

(ii) Die Oberfläche O = {(x, y, z) : x2 + y2 + z2 = 1 ∧ z ≥ 0} der oberen Halbkugel ist Graphder Funktion z(x, y) =

√1− x2 − y2 über dem Definitionsbereich D = {(x, y) : x2 + y2 ≤ 1}.

Für die Parametrisierung p(x, y) = (x, y, z(x, y))> gilt

∂xp(x, y) = (1, 0, −x√1−x2−y2

)> und ∂yp(x, y) = (1, 0, −y√1−x2−y2

)>.

Durch Transformation auf Polarkoordinaten erhält man dann

|O| =∫D

‖(1, 0, −x√1− x2 − y2

)> × (1, 0,−y√

1− x2 − y2)‖d(x, y)

=

∫ 2π

0

∫ 1

0

‖(1, 0, −r cosφ√1−r2 )× (0, 1, −r sinφ√

1−r2 )‖r dr dφ

=

∫ 2π

0

∫ 1

0

‖( r cosφ√1−r2 ,

r sinφ√1−r2 , 1)‖r dr dφ

= 2π

∫ 1

0

r√1−r2dr = −2π

√1− r2|1r=0 = 2π.

Zur Erinnerung: Die Oberfläche der ganzen Kugel Kugel mit Radius r ist 4r2π.

Wie bei Kurven definieren wir nun Oberflächenintegrale von FUnktionen und Vektorfeldernüber die parametrisierte Flächen S.

Page 132: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

126 Integralsätze

7.16. Definition. Sei φ : U ⊂ R3 → R bzw f : U ⊂ R3 → R3 stetige Funktion und S ⊂ Ueine Fläche mit Parametrisierung p : D ⊂ R2 → R3. Dann heißen∫

S

φ(x)dS :=

∫D

φ(p(u, v))‖∂up(u, v)× ∂vp(u, v)‖d(u, v)

und ∫S

f(x) · n(x)dS : =

∫D

f(p(u, v)) · n(p(u, v))‖∂up(u, v)× ∂vp(u, v)‖d(u, v)

Oberlfächenintegral 1. Art bzw 2. Art. Hierbei ist

n(x) :=∂up(u, v)× ∂vp(u, v)

‖∂up(u, v)× ∂vp(u, v)‖

der Einheitsnormalenvektor an die Fläche S im Punkt x = p(u, v).

7.17. Bemerkungen. (i) Wie beim Kurvenintegral zeigt man, dass das Oberflächenintegral 1.Art unabhängig von der Parametrisierung der Fläche S ist.

(ii) Für φ ≡ 1 liefert das Oberflächenintegral 1. Art wieder die Formel für den Flächeninhalt.

(iii) Die Größe ‖∂up(u, v) × ∂vp(u, v)‖d(u, v) beschreibt die Größe eines Flächenelements dasdurch Abbildung des Parameterbereiches [u, u+ du]× [v, v+ dv] erhalten wird. Man vergleichehierzu auch die Formel | detφ′(x, y, z)|d(x, y, z) für das Volumenelement die bei der Transfor-mationsformel für Volumenintegrale verwendet wird.

(iv) Achtung: Der Normalenvektor sowie das Vorzeichen des Kurvenintegrals 2. Art hängenvon der Orientierung der Fläche S bzw der Parametrisierung ab. Vertauscht man die Reihen-folge der Variablen u, v, so dreht sich z.B. die Orientierung um!

(v) Die Größe ∫S

f(x) · n(x)dS

beschreibt den Fluss des Vektorfeldes f durch die Oberfläche S in Richtung des Norma-lenvektors n(x).

(vi) Die Formel für das Oberflächenintegral 2. Art lässt sich vereinfachen zu∫S

f(x) · n(x)dS =

∫D

f(p(u, v)) · (∂up(u, v)× ∂vp(u, v))d(u, v).

Wie beim Kurvenintegral braucht also der Normalenvektor hier nicht normiert werden.

7.18. Beispiel. Wir bestimmen den Fluss des Feldes f(x, y, z) = (x, y, z) durch die OberflächeS = {(x, y, z) : x2 + y2 + z2 = 1 ∧ z ≥ 0} der oberen Halbkugel.

Page 133: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

7.4 Sätze von Gauß und Stokes in 3D 127

Lösung. Wir parametrisieren die Fläche S durch

p : D = {(x, y) : x2 + y2 ≤ 1} → R3, (x, y) 7→ (x, y,√

1− x2 − y2).

Hiermit erhält man

∂xp(x, y) =

10−x√

1−x2−y2

, ∂yp(x, y) =

01−y√

1−x2−y2

und ∂xp× ∂yp =

x√

1−x2−y2y√

1−x2−y2

1

.

Nach Definition des Oberflächenintegrals gilt dann∫S

f · n dS =

∫{x2+y2≤1}

x2√1− x2 − y2

+y2√

1− x2 − y2+√

1− x2 − y2d(x, y)

=

∫{x2+y2≤1}

1√1− x2 − y2

d(x, y) = (∗).

Mittels Transformation auf Polarkoordinaten erhält man weiters

(∗) =

∫ 2π

0

∫ 1

0

1√1− r2

rdr dφ = −2π√

1− r2|1r=0 = 2π.

Das Ganze hätte man hier allerdings aus einfacher haben können: Man sieht relativ leicht, dassder Normalvektor auf der Oberfläche der Einheitskugel gegeben ist durch n(x, y, z) = (x, y, z).Für das Integral erhält man also∫

S

f · n dS =

∫S

(x, y, z) · (x, y, z)dS = |S| = 2π,

wobei wir im letzten Schritt x2 + y2 + z2 = 1 verwendet haben.

7.4 Sätze von Gauß und Stokes in 3D

Der Satz von Gauß lieferte in 2D den Zusammenhang zwischen dem Fluss eines Vektorfeldesüber die Oberfläche eines Gebietes mit der gesammten Quellenstärke (Divergenz) des Feldesinnerhald des Gebietes. Die Aussage lässt sich praktisch wörtlich auf den dreidimensionalenFall verallgemeinern.

Im folgenden sei G eine beschränktes Gebiet dessen Rand sich durch disjunkte parametrisierteFlächenstücke Si darstellen läst. Dann definieren wir analog zum zwei-dimensionalen Fall∫

∂G

φ(x)dS :=∑

i

∫Si

φ(x)dS und∫∂G

f(x) · n(x)dS :=∑

i

∫Si

f(x) · n(x)dS.

Page 134: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

128 Integralsätze

Wir nehmen weiters an, dass die Parametrisierung der Flächenstücke Si so gewählt ist, dass derNormaleneinheitsvektor n stets nach außen zeigt. Weiters lasse sich G in Normalbereiche Gi

zerlegen. Um hevorzuheben, dass über eine geschlossene Oberfläche integriert wird schreibenwir wieder

∮∂G

anstelle von∫∂G

.

7.19. Satz von Gauß. Sei U ⊃ G eine offene Menge und f : U ⊂ R3 → R3 ein stetigdifferenzierbares Vektorfeld. Dann gilt∫

G

div f(x)dx =

∮∂G

f(x) · n(x)dS,

d.h., die Summe der Quellen in G entspricht dem Fluss über den Rand ∂G.

Achtung: Es kommt wieder auf die Orientierung (Richtung des Normalenvektors n) an!

Beweis: Wir skizzieren nur den Beweis nur für den Fall, dass G ein Würfel ist. Dann erhält man mitFubini und Hauptsatz der Differential- und Integralrechnung∫

Gdiv f(x)dx =

∫ b1

a1

∫ b2

a2

∫ b3

a3

∂xf1(x, y, z) + ∂yf2(x, y, z) + ∂zf3(x, y, z)dz dy dx

=

∫ b2

a2

∫ b3

a3

f1(b1, y, z)− f1(a1, y, z)dy dz +

∫ b1

a1

∫ b3

a3

f2(x, b2, z)− f2(x, a2, z)dx dz

+

∫ b1

a1

∫ b2

a2

f3(x, y, b3)− f3(x, y, a3)dx dy

womit das Voluimsintegral auf Doppelintegrale zurückgeführt ist. Um Gleichheit mit dem Randintegralzu zeigen, unterteilt man den Rand des Würfels in 6 Flächen Si und verwendet z.B. für die untereFläche S1 die Parametrisierung

p1(x, y) = (x, y, a3) und n(x, y, z) = (0, 0,−1)>.

Dann erhält man für das Oberflächenintegral∫S1

f(x) · n(x)dS =

∫ b1

a1

∫ b2

a2

−f3(x, y, a3)dy dx

und diesen Term findet man auch im Volumsintegral vor. Die Integrale über die restlichen Seiten lieferndie anderen Beiträge.

7.20. Beispiel. Wir wollen den Normalenfluss des Vektorfeldes f(x, y, z) = (x, y, z) über denRand der Einheitskugel K = {(x, y, z) : x2 + y2 + z2 = 1} berechnen.(a) Als Parametrisierung des Randes wählen wir

p : [0, 2π]× [0, π]→ R3, (φ, θ) 7→ (cosφ cos θ, sinφ cos θ, sin θ).

Hieraus folgt

pφ(φ, θ) = (− sinφ cos θ, cosφ cos θ, 0)>, pθ(φ, θ) = (− cosφ sin θ,− sinφ sin θ, cos θ)>

Page 135: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

7.4 Sätze von Gauß und Stokes in 3D 129

und weiterspφ(φ, θ)× pθ(φ, θ) = − sin θ(cosφ cos θ, sinφ cos θ, sin θ)>.

Mittels Skizze sieht man relativ leicht, dass pφ × pθ hier ins Innere der Kugel zeigt; zur Be-rechnung des Flusses aus der Einheitskugel müssen wir also das Vorzeichen umdrehen underhalten∫

∂K

f(x, y, z) · n(x, y, z)dS

=

∫[0,2π]×[0,π]

(cosφ cos θ, sinφ cos θ, sin θ) · sin θ(cosφ cos θ, sinφ cos θ, sin θ)>d(φ, θ)

=

∫ 2π

0

∫ π

0

sin θdθ dφ =

∫ 2π

0

− cos θ∣∣πθ=0

= 4π.

(b) Durch Anwenden des Satzes von Gauß erhalten wir hier wesentlich einfacher∫∂K

f(x, y, z) · n(x, y, z)dS =

∫K

div f(x, y, z)dx =

∫K

3dx = 34π

3= 4π.

(c) Der Vollständigkeit halber sei erwähnt, dass auch das Oberflächenintegral hier einfacherberechnet werden kann: Man sieht nämlich relativ leicht, dass n(x, y, z) = (x, y, z) der äußereEinheitsnormalenvektor auf der Einheitskugel ist. Wegen x2 + y2 + z2 = 1 auf ∂K gilt dann∫

∂K

f(x, y, z) · n(x, y, z)dS =

∫∂K

(x, y, z) · (x, y, z) · n(x, y, z)dS = |∂K| = 4π.

Green’sche Formeln. Als Folgerung aus dem Satz von Gauß erhalten wir Formeln für diepartielle Integration in mehreren Dimensionen. Zunächst überprüft man leicht, dass für ~f :Rn → Rn und g : Rn → R folgende Produktregel der Differentiation gilt

div(g ~f)(x) = g(x) div ~f(x) +∇g(x) · ~f(x).

Für vernünftige Gebiete D ⊂ Rn erhält man durch Anwenden des Satzes von Gauß auf F (x) =

g(x)~f(x) dann∫D

∇g(x) · ~f(x) dx = −∫D

g(x) div ~f(x) dx+

∫∂D

g(x)~f(x) · n(x) ds.

In einer Dimension entwpricht dies gerade der Formel der partiellen Integration.

Für den Fall ~f(x) = ∇u(x) erhält man die erste Green’sche Identität, nämlich∫D

g(x)∆u(x) dx = −∫D

∇g(x) · ∇v(x) dx+

∫∂D

g(x)∂nu(x) ds,

wobei hier ∂nu(x) = ∇u(x) · n(x) die Normalenableitung von u (= Richtungsableitung inRichtung des äußeren Normaleneinheitsvektors) ist.

Page 136: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

130 Integralsätze

Vertauscht man die Rolle von u und g und subtrahiert die resultierenden Gleichungen voneinander, so ergibt sich die zweite Green’sche Identität∫

D

g(x)∆u(x)− u(x)∆g(x) dx =

∫∂D

g(x)∂nu(x)− u(x)∂ng(x) ds.

Diese und ähnliche Regeln finden bei der Modellierung und der Behandlung von partiellenDifferentialgleichungen häufig Verwendung; mehr dazu in MSE 4.

Satz von Stokes.

Der Satz von Green stellete für ebene Flächen einen Zusammenhang zwischen dem Flächen-integral über die Rotation und deZirkulation eines Vektorfeldes her. Wir erweitern nun diesenSatz nun auf gekrümmte Oberflächen in 3D.

7.21. Satz von Stokes. Sei f : U ⊂ R3 → R3 ein stetig differenzierbares Vektorfeld undS ⊂ U eine Fläche in U mit Parametrisierung p : D ⊂ R2 → R3. Weiters lasse sich derRand ∂S = p(∂D) als stückweise glatte Kurve darstellen. Dann gilt∫

S

rot f(x) · n(x)dS =

∮∂S

f(x) · τ(x)ds.

Hierbei bezeichnet n den Normalenvektor auf die Fläche S und τ den Tangentialvektor andie Kurve γ welche den Rand ∂S parametrisiert. Der Umlaufsinn der Randkurve γ sei sogewählt, dass n(γ(t))× γ′(t) ins Innere der Fläche zeigt (rechte Hand Regel!).

Beweis. Der Beweis ist etwas länglich, verwendet aber ähnliche Ideen wie beim Satz von Green in 2D;siehe z.B. Heuser 2.

7.22. Bemerkung. Der Satz von Stokes stellt wie der Satz von Green in 2D einen Zusammen-hang zwischen der Rotation eines Vektorfeldes auf einer Fläche S und der Zirkulation um denRand der Fläche ∂S her. Für eine ebene Fläche S = D×{0} mit D ⊂ R2 und mit n = (0, 0, 1)erhält man ∫

S

rot 3D(f1, f2, f3) · ndS =

∫D

rot 2D(f1, f2)d(x, y)

sowie ∫∂S

f · τds3D =

∫∂D

(f1, f2) · (τ1, τ2)ds2D.

Wir haben hier Subindizes verwendet, um die zwei- bzw. drei-dimensionalen Rotations-Opteratorund die entsprechenden Kurvenintegrale zu unterscheiden. Der Satz von Green in 2D folgt alsoals Spezialfall aus dem Satz von Stokes in 3D.

Anstelle eines Beweises, verifizieren wir nun den Satz von Stokes anhand eines Beispiels.

Page 137: Scriptum: Mathematische Grundlagen MSE€¦ · INHALTSVERZEICHNIS iii Vorbermerkungen AlsGrundlagefürdieVorbereitungdieserVorlesungdientendieBücher R. Ansorge und H.-J. Oberle:

7.4 Sätze von Gauß und Stokes in 3D 131

7.23. Beispiel.Gesucht ist der Gesamtfluss der Rotation des Vektorfeldes f(x, y, z) = (−y, x,−z)durch die Fläche

S = {(x, y, z) : x2 + y2 ≤ 1 ∧ z = a(x2 + y2)}

in Richtung der positiven z-Achse.Lösung. (i) Als Parametrisierung der Fläche S wählen wir

p : D = {(x, y) : x2 + y2 ≤ 1} → R3, p(x, y) = (x, y, a(x2 + y2)).

Hiermit folgt

∂xp =

1,0

2ax

, ∂yp =

0,1

2ay

, und ∂xp× ∂yp =

−2ax,−2ay

1

.

Der Normalenvektor zeigt bereits in die richtige Richtung (nach oben). Mittels Transformationauf Polarkoordinaten erhält man weiters∫

S

rot f · n dS =

∫D

(0, 0, 2) · (−2ax,−2ay, 1)d(x, y)

= 2

∫ 2π

0

∫ 1

0

rdr dφ = 2π.

Dar Gesamtfluss hängt also nicht von a ab, was nach dem Satz von Stokes klar ist, da ja dieFläche S für jedes a denselben Rand hat.(ii) Parametrisiert man den Rand ∂S mittels γ : [0, 2π], t 7→ (cos t, sin t, 0), wo erhält man fürdie Zirkulation des Feldes∫

∂S

f · τds =

∫ 2π

0

(− sin t, cos t, 0) · (− sin t, cos t, 0)dt =

∫ 2π

0

1dt = 2π.

Wie nach dem Satz von Stokes zu erwarten, stimmt die Zirkulation des Feldes um ∂S mit demFluss durch die Fläche S überein.

Die Korrektheit der Orientierung der Randkurve sieht man leicht mit der Rechten-Hand-Regel.Alternativ berechnen wir

n(γ(t))× γ′(t) =

−2a cos t−2a sin t

1

× (− sin t, cos t, 0)

=(− cos t, sin t,−2a

).

Dieser Vektor zeigt (wie gewünscht) ins Innere von S; die Randkurve war also richtig zurAusrichtung der Fläche orientiert.