Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist...

158
Analysis Vorlesung an der Fachhochschule Heilbronn (Stand: 3. März 2006) Prof. Dr. V. Stahl Copyright 2003 by Volker Stahl. All rights reserved.

Transcript of Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist...

Page 1: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

Analysis

Vorlesung an derFachhochschule Heilbronn

(Stand: 3. März 2006)

Prof. Dr. V. Stahl

Copyright 2003 by Volker Stahl. All rights reserved.

Page 2: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

Das Unendliche hat wie keine andere Frage von jeher so tief das Gemütdes Menschen bewegt.Das Unendliche hat wie kaum eine andere Idee auf den Verstand so anre-gend und fruchtbar gewirkt.Das Unendliche ist aber auch wie kein anderer Begriff so der Aufklärungbedürftig.

(D. Hilbert)

2

Page 3: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

Inhaltsverzeichnis

1 Grenzwerte von Folgen 51.1 Unendlichkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.2 Nullfolgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101.3 Konvergenz und Grenzwert einer Folge . . . . . . . . . . . . . . . . 171.4 Divergente Folgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191.5 Rechenregeln für Grenzwerte konvergenter Folgen . . . . . . . . . . 25

2 Grenzwerte von Funktionen und Stetigkeit 282.1 Grenzwert einer Funktion . . . . . . . . . . . . . . . . . . . . . . . . 292.2 Rechenregeln für Grenzwerte von Funktionen . . . . . . . . . . . . . 352.3 Uneigentliche Grenzwerte und Grenzwerte bei Unendlich . . . . . . . 372.4 Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 392.5 Eigenschaften stetiger Funktionen . . . . . . . . . . . . . . . . . . . 42

3 Differentialrechnung 453.1 Differenzierbarkeit und Ableitung . . . . . . . . . . . . . . . . . . . 453.2 Berechnung der Ableitung . . . . . . . . . . . . . . . . . . . . . . . 543.3 Linearisierung und Newton Verfahren . . . . . . . . . . . . . . . . . 583.4 Differentialnotation . . . . . . . . . . . . . . . . . . . . . . . . . . . 663.5 Höhere Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

3.5.1 Extremwertberechnung . . . . . . . . . . . . . . . . . . . . . 683.5.2 Taylor Polynome . . . . . . . . . . . . . . . . . . . . . . . . 69

3.6 Einfache Differentialgleichungen . . . . . . . . . . . . . . . . . . . . 793.7 Partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . 87

3.7.1 Gradient . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 873.7.2 Extremwertberechnung und Gradientenabstieg . . . . . . . . 923.7.3 Maschinelles Lernen und neuronale Netze . . . . . . . . . . . 953.7.4 Tangentialebenen . . . . . . . . . . . . . . . . . . . . . . . . 1013.7.5 Mehrdimensionales Newton Verfahren . . . . . . . . . . . . . 1043.7.6 Mehrstellige Taylor Polynome zweiten Grades . . . . . . . . 1093.7.7 Ausgleichsrechnung . . . . . . . . . . . . . . . . . . . . . . 113

4 Integralrechnung 1214.1 Herleitung des Integrals durch Flächenberechnung . . . . . . . . . . 1224.2 Interpretation der Integralschreibweise als unendliche Summe . . . . 1284.3 Integrationsregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130

4.3.1 Elementare Integrationsregeln . . . . . . . . . . . . . . . . . 1304.3.2 Integration durch Substitution . . . . . . . . . . . . . . . . . 1324.3.3 Produkt Integration . . . . . . . . . . . . . . . . . . . . . . . 134

4.4 Integration rationaler Funktionen . . . . . . . . . . . . . . . . . . . . 1374.4.1 Polynomdivision . . . . . . . . . . . . . . . . . . . . . . . . 1384.4.2 Partialbruchzerlegung . . . . . . . . . . . . . . . . . . . . . 138

3

Page 4: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

5 Fourier Transformation 1445.1 Funktionen sind Vektoren . . . . . . . . . . . . . . . . . . . . . . . . 1445.2 Fourier Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148

4

Page 5: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 5

1 Grenzwerte von Folgen

Definition 1.1 (Folge)Eine Folge über einer Menge A ist eine Funktion f ∈ N→ A.

In der Analysis sind vor allem reelle Folgen, d.h. Folgen über der MengeR von Inter-esse. Um solche Folgen von anderen Funktionen zu unterscheiden, verwendet man imallgemeinen nicht den für Funktionen üblichen Buchstabenf sonderna.

Definition 1.2 (Reelle Folge)Eine reelle Folge ist eine Funktion a ∈ N→ R.

Wir werden uns mit reellen Folgen noch eine ganze Weile beschäftigen, daher zunächstein paar in der Literatur übliche Vereinfachungen der Notation:

Notation 1.3

• Da in diesem Skript fast alle Folgen reelle Folgen sind, lassen wir dasWort “reelle” einfach weg. Wenn also ab sofort die Rede von einer Fol-ge ist, ist immer eine reelle Folge gemeint.

• Für den Funktionswert einer Folge a ∈ N → R an einer Stelle n ∈ Nschreibt man statt a(n) einfach an.

• Wenn keine Mißverständnisse zu befürchten sind, kann man eine Folgeauch dadurch beschreiben, dass man ihre Funktionswerte an der Stelle1, 2, 3, . . . in spitzen Klammern und durch Kommas getrennt aufzählt,d.h.

a = 〈a1, a2, a3, . . .〉.

Die Zahlen an, n = 1, 2, 3, . . . heißen auch Glieder der Folge a.

Beispiel 1.4 Seia ∈ N→ R definiert durch

a(n) = n2.

Man schreibt dafür auchan = n2

odera = 〈1, 4, 9, . . .〉.

1.1 Unendlichkeit

Von besonderem Interesse in der Analysis ist, wie sich die Gliederan einer Folgeverhalten, wennn immer größer wird. Hierzu ein paar Beispiele, siehe Bild 1.1:

Beispiel 1.5

Page 6: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 6

� �

� �

������� �� ������������

������� �!#" !!%$'&

(�)*�+-,/.1032145�6798;:=<?> 6

Abbildung 1.1: Folgen aus Beispiel 1.5

Page 7: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 7

(1) Sei

an =1n

, d.h. a =⟨

1,12,13,14, . . .

⟩.

Dann nähert sichan immer mehr an0 an, je größern wird. Hiervon kannman sich überzeugen, indem man fürn sehr große Zahlen einsetzt undan

einfach ausrechnet, z.B.

a10000 = 0.0001 ≈ 0.

(2) Sei

an =n

n + 1, d.h. a =

⟨12,23,34, . . .

⟩Dann nähert sichan immer mehr an1 an, je größern wird. Auch hierüberzeugt man sich dadurch, dass man fürn große Zahlen einsetzt. So istz.B.

a10000 = 0.9999 ≈ 1.

(3) Seian = n2, d.h. a = 〈1, 4, 9, 16, . . .〉

Dann wird an immer größer, je größern wird. Man sagt dann auchan

strebt gegen unendlich.

(4) Seian = −(2n), d.h. a = 〈−2,−4,−8,−16, . . .〉

Dann wirdan immer kleiner (negativer), je größern wird. Man sagt dannauchan strebt gegen minus unendlich.

(5) Seian = (−1)n, d.h. a = 〈−1, 1,−1, 1, . . .〉

In diesem Beispiel nähert sichan keiner bestimmten Zahl an und strebtauch nicht gegen unendlich.

(6) Sei

an = sin(n), d.h. a = 〈0.84, 0.91, 0.14, −0.76, −0.96, . . .〉

Wie im vorigen Beispiel nähert sichan auch hier keiner bestimmten Zahlan und strebt auch nicht gegen unendlich.

Im dritten Beispiel sind wir dem Begriff “unendlich” begegnet. Für “unendlich” wirdallgemein das Symbol∞ verwendet. Aber was ist∞ eigentlich genau? Zunächst stelltman sich unter∞ eine “Zahl” vor, die ziemlich groß ist, genauer gesagt größer als jedereelle Zahl. Damit ist zumindest schon mal klar, dass∞ selbst keine reelle Zahl seinkann, d.h.∞ 6∈ R. Man kann aber∞ einfach mal zuR dazunehmen und sehen wasdabei rauskommt. Das ist im Prinzip nichts anderes als was wir getan haben als wirPolynome und komplexe Zahlen konstruiert haben.

Page 8: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 8

• Im Fall von Polynomen haben wir eine neue Zahlx zu R dazugenommen, dieAddition und Multiplikation entsprechend erweitert und den Ring der Polynomemit reellen KoeffizientenR[x] erhalten.

• Im Fall von komplexen Zahlen haben wir eine neue Zahlj zuR dazugenommen.Diesmal haben wir aber gesagt, dassj eine bestimmte Eigenschaft erfüllen soll,nämlichj2 = −1. Nach entsprechender Erweiterung der Addition und Multipli-kation ist die MengeC der komplexen Zahlen herausgekommen.

Machen wir nun das Selbe mit∞, beginnen also bei der MengeR∪{∞} und erweiterndie Addition und Multiplikation auf den Fall dass ein Element∞ ist. Genaugenommenmüßte man die erweiterten Funktionen durch ein neues Symbol ersetzen, aber wie beiPolynomen und komplexen Zahlen machen wir’s uns auch diesmal mit der Notationeinfach. Für die Addition ist es naheliegend zu definieren dass

x +∞ = ∞∞+ x = ∞

für alle x ∈ R. Dies gilt insbesondere auch für negative reelle Zahlenx, da∞ inunserer Vorstellung so groß ist, dass es gar nichts ausmacht wenn man was abzieht.Schwieriger ist die Erweiterung der Multiplikation. Eine positive Zahl mal∞ solltenaheliegenderweise natürlich wieder∞ sein aber was ist z.B.−1 ×∞? Wie im Fallder Polynome und komplexen Zahlen stellen wir fest, dass wir unsere AusgangsmengeR ∪ {∞} weiter ergänzen müssen um eine neue Zahl, diekleiner ist als alle anderenreellen Zahlen. Auch diesmal denkt man sich kein neues Symbol für diese Zahl aus,sondern beschreibt sie einfach als das Ergebnis von−1×∞, kurz−∞. Somit sind wirbei der Menge

R = R ∪ {∞,−∞}

angekommen. Damit können wir Addition und Multiplikation aufR in naheliegenderWeise wie folgt für allex ∈ R erweitern:

• Addition

x +∞ = ∞+ x = ∞x +−∞ = −∞+ x = −∞

∞+∞ = ∞−∞+−∞ = −∞

• Multiplikation

x×∞ = ∞× x ={

∞ falls x > 0−∞ falls x < 0

x×−∞ = −∞× x ={−∞ falls x > 0∞ falls x < 0

∞×∞ = −∞×−∞ = ∞∞×−∞ = −∞×∞ = −∞

Page 9: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 9

Unklar ist allerdings, wie die Funktionen in folgenden Fällen erweitert werden sollen:

∞+−∞, −∞+∞,

0×∞, ∞× 0,

0×−∞, −∞× 0.

Man könnte nun hergehen und noch eine neue Zahl zuR dazunehmen, die für dieseSpezialfälle herhalten muss. Dies Lösung wird z.B. im IEEE Standard 754 für Gleit-kommazahlen gewählt. Die Bedeutung dieser Zahl ist “undefiniert”, im IEEE Standardwird sie ingenieursmäßig mit NaN für “not a number” bezeichnet. Diese Erweiterungist in der Rechnerarithmetik sinnvoll, da sie programmtechnisch die Fehlerbehandlungvereinfacht. In der Mathematik ist sie jedoch wenig hilfreich und macht die Dinge nurkomplizierter, vor allem wenn’s um Relationen geht: Ist z.B. NaN≤ 23? Man findetsich also besser damit ab, dass die erweiterte Addition und Multiplikation aufR parti-elle Funktionen sind, genauso wie z.B. die Division aufR. Letztere erweitert man aufR durch

1∞

=1−∞

= 0

und wie üblich für allex, y ∈ R, y 6= 0

x

y= x× 1

y.

Damit bleiben∞∞

,∞−∞

,−∞∞

,−∞−∞

undefiniert.Zum Schluß erweitert man noch die Subtraktion aufR, indem man für allex, y ∈ Rfestlegt dass

x− y = x + (−1)× y.

Undefiniert bleiben somit

∞−∞ und −∞−−∞.

Alle Eigenschaften, die wir von der Addition und Multiplikation aufR kennen wie

• Assoziativität,

• Kommutativität,

• Distributivität,

• neutrales Element0 der Addition und

• neutrales Element1 der Multiplikation

übertragen sich auf die erweiterte Addition und Multiplikation aufR. Voraussetzungist allerdings, dass die dabei auftretenden Operationen alle definiert sind! Dies führtbei der Distributivität leicht zu Fehlern:

Page 10: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 10

Beispiel 1.6 Wendet man zur Berechnung von

∞(5 + (−3))

verbotenerweise das Distributivitätsgesetz an, erhält man

∞(5 + (−3)) = (∞× 5) +∞× (−3) =∞+−∞,

was nicht definiert ist, obwohl natürlich

∞(5 + (−3)) =∞× 2 =∞.

Zu beachten ist auch, dass∞ weder ein additives noch ein multiplikatives Inverses hat.

1.2 Nullfolgen

Kommen wir auf Beispiel 1.5 zurück. Wir haben dort im Wesentlichen drei Möglich-keiten gesehen, was passieren kann wennn immer größer wird:

• an nähert sich immer mehr einer bestimmten Zahl an, z.B. (1) und (2).

• an strebt gegen∞ oder gegen−∞, z.B. (3) und (4).

• an macht keins von beidem, z.B. (5) und (6).

Diese drei Fälle werden nun genauer betrachtet: Im ersten Fall spricht man vonkon-vergentenFolgen, im zweiten Fall vonbestimmt divergentenFolgen und im dritten Fallvonunbestimmt divergentenFolgen.Zunächst betrachten wir den Spezialfall einer Folge, die sich mit wachsendemn immermehr0 annähert, wie im Beispielan = 1/n. Solche Folgen heißen Nullfolgen. Ver-sucht man genauer zu beschreiben was gemeint ist, wenn man sagt dass sichan immermehr an0 annähert, so stellt man fest, dass es sich um zwei Eigenschaften handelt:

• an kommt0 beliebig nahe, d.h.

für jedes noch so kleineε ∈ R, ε > 0gibt es einN ∈ N so dass

|aN | < ε

Durch |aN | < ε wird ausgedrückt, dassaN zwischen+ε und−ε liegen muss.Würde man die Betragsstriche weglassen, wäre die Eigenschaft schon erfülltwennaN ≤ 0 wäre, was natürlich nicht unseren Vorstellungen entspricht.

Diese Eigenschaft reicht jedoch noch nicht aus. Sie würde z.B. von der Folgean = n−1 erfüllt, weil für jedesε > 0 die WahlN = 1 der Forderung|aN | < εgenügt, da jaaN = 0. Andererseits entspricht diese Folgean nicht dem, was wiruns vorstellen, wenn wir sagen, dass sich eine Folge immer mehr an0 annähert.

Page 11: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 11

• Deshalb fordert man zusätzlich dass|an| kleiner alsε bleiben muss für allen, dienoch nachN kommen. Es gibt also einen PunktN , ab dem alle Glieder der Folgefür alle Ewigkeit zwischen+ε und−ε bleiben, siehe Bild 1.2. Statt|aN | < εstellt man daher die strengere Forderung, dass

für allen ≥ N gilt, dass

|an| < ε

Zusammenfassend erhält man die Definition einer Nullfolge:

Definition 1.7 (Nullfolge)Eine Folge an heißt Nullfolge wenn gilt:

für jedes ε ∈ R, ε > 0gibt es ein N ∈ N so dass

für alle n ≥ N gilt, dass|an| < ε

Notation 1.8Ist an eine Nullfolge, sagt man “an strebt gegen 0” oder “an konvergiertgegen 0 für n gegen∞” und schreibt

an → 0 für n→∞

oder einfachan → 0.

Man sagt auch “der Limes von an für n gegen∞ ist 0” und schreibt

limn→∞

an = 0.

Beispiel 1.9 Nullfolgen sind z.B.

an =1√

n− 10

an =sin(n)

n

an =(−1)n

n

an ={

n2 falls n < 10001/n falls n ≥ 1000

Page 12: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 12

���

� �

� �

Abbildung 1.2: Beispiel einer Nullfolge. Egal wie eng derε-Streifen ist, es gibt immereinN ab dem die Glieder der Folge in demε-Streifen bleiben.

Page 13: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 13

Keine Nullfolgen sind hingegen

an =1√n− 10

an =tan(n)

n

an =(−2)n

n

an ={

n2 falls n > 10001/n falls n ≤ 1000

Wie prüft man von einer gegebenen Folge, ob sie eine Nullfolge ist? Zuerst sollte maneinfach die Folgengliederan für ein paar große Zahlenn ausrechnen oder sich dieFolge z.B. von Maple graphisch darstellen lassen. Dadurch erhält man oft schon einenziemlich sicheren Verdacht ob es sich um eine Nullfolge handelt oder nicht. Ein exakterBeweis würde z.B. wie folgt aussehen.

Beispiel 1.10 Zu zeigen:Die Folgean = 1/n ist eine Nullfolge. Der Beweis gehtin folgenden Schritten vor sich:

• Einsetzen der Definition von Nullfolge.

Zu zeigen: Für alle ε > 0 existiert einN so dass für allen ≥ N gilt|an| < ε.

• Elimination von “für alleε > 0”. Sei ε > 0 beliebig aber fest.

Zu zeigen:Es existiert einN so dass für allen ≥ N gilt |an| < ε.

• Einsetzen der Definition vonan.

Zu zeigen:Es existiert einN so dass für allen ≥ N gilt |1/n| < ε.

• Umformen und vereinfachen. Die Betragsstriche kann man weglassen, dan ∈ N und somit|1/n| = 1/n. Dann formt man die Ungleichung umdurch Multiplizieren vonn und Dividieren durchε.

Zu zeigen:Es existiert einN so dass für allen ≥ N gilt n > 1/ε.

• Berechnen einesN , so dass für allen ≥ N gilt n > 1/ε. DiesesN hängtnatürlich vonε ab. In diesem einfachen Fall muss man nurN als eine be-liebige natürliche Zahl größer1/ε wählen, z.B.

N = d1/ε + 1e,

dann sind natürlichN , N + 1, N + 2, usw. alle größer als1/ε.

• Verifizieren an einem Beispiel. Seiε = 0.1, dann istN = 11. Es müssenalso|a11|, |a12|, usw. alle kleiner als0.1 sein. Dies testet man an ein paarBeispielen:

|a11| = 0.091, |a12| = 0.083, |a13| = 0.077, . . .

Page 14: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 14

Beispiel 1.11 Zu zeigen:Die Folge

an =sin(n + 3)

n + 5

ist eine Nullfolge. Der Beweis geht in folgenden Schritten vor sich:

• Einsetzen der Definition von Nullfolge.

Zu zeigen: Für alle ε > 0 existiert einN so dass für allen ≥ N gilt|an| < ε.

• Elimination von “für alleε > 0”. Sei ε > 0 beliebig aber fest.

Zu zeigen:Es existiert einN so dass für allen ≥ N gilt |an| < ε.

• Berechnen einesN , das diese Eigenschaft erfüllt. Der Ansatz, der hier zumZiel führt, ist zu versuchen die Ungleichung

|an| < ε

nachn aufzulösen, d.h. auf die Form

n > f(ε)

zu bringen. Wenn dies gelingt, muss man nur noch z.B.

N = df(ε) + 1e

wählen und damit gilt für allen > N dass|an| < ε.

• Leider kann man jedoch die Ungleichung|an| < ε nicht nachn auflösen.Man kann aber versuchen,|an| dadurch zu vereinfachen, dass man es nachoben abschätzt, d.h. einen einfacheren Ausdruckan sucht mit

an ≥ |an|.

Jedesn, welchesan < ε erfüllt, erfüllt dann auch|an| < ε. Wenn an

hinreichend einfach ist, kann man die Ungleichung

an < ε

auf die Formn > f(ε)

bringen und z.B.N = df(ε) + 1e

wählen.

Page 15: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 15

• Abschätzen von|an| durch einen einfacheren Ausdruckan ≥ |an|.

|an| =∣∣∣∣ sin(n + 3)

n + 5

∣∣∣∣=| sin(n + 3)||n + 5|

=| sin(n + 3)|

n + 5

≤ 1n + 5

≤ 1n

Somit ist alsoan = 1/n.

• Die Bedingung1/n < ε

läßt sich nun in die gewünschte Form

n > 1/ε

bringen. Für jedesn > 1/ε gilt also 1/n < ε und da1/n ≥ |an| auch|an| < ε. Wählt man nun

N = d1/ε + 1e

so ist für allen ≥ N die Bedingung|an| < ε erfüllt.

• Verifizieren an einem Beispiel. Ist z.B.ε = 0.1, so istN = 11. Wenn wiruns nicht verrechnet haben, muss also|an| < 0.1 sein für allen ≥ 11. Diesprüft man wieder an ein paar Beispielen:

|a11| = 0.062, |a12| = 0.038, |a13| = 0.016, . . .

Solche Beweise sind natürlich ziemlich aufwändig. Um sich zu überzeugen, dass eineFolge eine Nullfolge ist, macht man sich daher ein paar Eigenschaften von Nullfolgenzunutze, die Gegenstand der folgenden Theoreme sind:

Theorem 1.12Sei bn eine Nullfolge und gilt für eine Folge an dass

an = bn

für alle n ab einem bestimmten N , dann ist auch an eine Nullfolge.

Beispiel 1.13 Um zu zeigen, dass die kompliziert aussehende Folge

an ={

n2 falls n < 10001/n falls n ≥ 1000

Page 16: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 16

eine Nullfolge ist, genügt es unter Verwendung von Theorem 1.12 zu zeigen dassdie Folge

bn = 1/n

eine Nullfolge ist, siehe Beispiel 1.10.

Theorem 1.12 kann noch etwas verallgemeinert werden:

Theorem 1.14Ist bn eine Nullfolge und gilt für eine Folge an dass

|an| ≤ |bn|

für alle n ab einem bestimmten N , dann ist auch an eine Nullfolge.

Beispiel 1.15 Den Beweis, dass

an =sin(n + 3)

n + 5

eine Nullfolge ist, hätten wir unter Verwendung von Theorem 1.14 billiger habenkönnen. Dasin(n + 3) unabhängig vonn immer nur Werte zwischen1 und−1annimmt gilt für die Folge

bn =1

n + 5

dass|an| ≤ |bn| für alle n. Es hätte also genügt, zu zeigen dass die viel einfa-chere Folgebn eine Nullfolge ist und Theorem 1.14 anzuwenden.

Theorem 1.16Sind an und bn Nullfolgen, dann auch die Folgen

an + bn, an − bn, anbn, akn, can

für alle k ∈ N und c ∈ R.

Beispiel 1.17 Um zu zeigen, dass die Folge

an = −3 (sin(n)/n)3 −√

1/n

eine Nullfolge ist, genügt es unter Verwendung von Theorem 1.16 zu zeigendasssin(n)/n und1/n Nullfolgen sind. Unter Verwendung von Theorem 1.14und der Abschätzung

| sin(n)/n| ≤ |1/n|

ist man schon fertig, wenn man zeigt dass1/n eine Nullfolge ist, siehe Beispiel1.10.

Page 17: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 17

Zum Schluß noch eine Klasse besonders wichtiger Nullfolgen:

Theorem 1.18Für alle q ∈ R mit |q| < 1 ist an = qn eine Nullfolge.

Beweis.

• Zu zeigen:Für alleε > 0 existiert einN ∈ N so dass für allen ≥ N gilt|qn| < ε.

• Seiε > 0 beliebig aber fest.

Zu zeigen:Es existiert einN ∈ N so dass für allen ≥ N gilt |qn| < ε.

• Der Fallq = 0 ist trivial und kann ausgeschlossen werden. Durch Umfor-mung1 erhält man eine Bedingung fürn so dass|qn| < ε.

|qn| < ε

|q|n < ε

n log(|q|) < log(ε)n > log(ε)/ log(|q|)

Wählt man alsoN = dlog(ε)/ log(|q|) + 1e

so gilt für allen ≥ N , dass|qn| < ε.

1.3 Konvergenz und Grenzwert einer Folge

Eine Nullfolgean ist eine Folge, die gegen0 konvergiert fürn → ∞. Eine direkteVerallgemeinerung hiervon sind Folgen, die sich mit wachsendemn nicht der Zahl0annähern sondern einer anderen Zahla ∈ R.

Beispiel 1.19 Die Folgean = 5 + 1/n nähert sich für großen immer mehr derZahl a = 5 an.

Beispiel 1.20 Ein triviales Beispiel ist die Folgean = 7. Auch für diese Folgekann man sagen, dass sie sich für großen immer mehr der Zahla = 7 annähert,obwohl sie genau genommen schon immer dort war.

Solche Folgen nennt man konvergente Folgen mit Grenzwerta. Sie sind dadurch cha-rakterisiert, dass für jedes noch so kleineε > 0 alle Gliederan ab einem bestimmtenPunktN nur noch zwischena+ε unda−ε liegen. Formal ausgedrückt klingt das dannschon ziemlich kompliziert.

1Zu beachten ist, dasslog(|q|) eine negative Zahl ist weil|q| < 1. Bei der Division durchlog(|q|) imletzten Schritt kehrt sich daher die Ungleichung um.

Page 18: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 18

Definition 1.21 (Konvergenz und Grenzwert von Folgen)Die Folge an heißt konvergent wenn gilt:

es gibt ein a ∈ R so dass esfür jedes ε ∈ R, ε > 0

ein N ∈ N gibt, so dassfür alle n ≥ N gilt, dass|an − a| < ε

Die Zahl a heißt Grenzwert der Folge an.

Vergleicht man diese Definition mit Definition 1.7 stellt man fest, dassan eine kon-vergente Folge mit Grenzwerta ist genau dann wenn die Folgean − a eine Nullfolgeist.

Notation 1.22In Anlehnung an die Notation für Nullfolgen drückt man aus, dass eine Folgean gegen den Grenzwert a konvergiert, indem man schreibt

limn→∞

an = a

oderan → a für n→∞

oder ganz einfachan → a.

Wenn man weiß, wie man beweist dass eine Folge eine Nullfolge ist, kann man auchzeigen dass eine Folge gegen einen Grenzwert konvergiert.

Beispiel 1.23 Sei

an =3n+1 + 2n

3n + 1,

siehe Bild 1.3. Zunächst setzt man große Zahlen fürn ein um auf diese Weise zuerraten was der Grenzwert vonan ist. Daa5 = 3.12, a10 = 3.02, a20 = 3.00entsteht der Verdacht, dass

limn→∞

an = 3.

Um dies zu beweisen, bleibt zu zeigen dass die Folgean − 3 eine Nullfolge ist.Durch Umformen erhält man

an − 3 =3n+1 + 2n

3n + 1− 3

=3n+1 + 2n − 3n+1 − 3

3n + 1

=2n − 33n + 1

Page 19: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 19

�����

���

������������������� � ���

Abbildung 1.3: Konvergente Folge aus Beispiel 1.23 mit Grenzwert3.

An dieser Stelle kann man nun informell argumentieren, dass man für großeWerte vonn die−3 im Zähler und die+1 im Nenner weglassen kann, da dieseim Vergleich zu2n bzw. 3n vernachlässigbar klein sind. Somit nähert sichan

immer mehr2n/3n = (2/3)n an, was wiederum nach Theorem 1.18 eine Null-folge ist. Ein exakter Beweis für diesen letzten Schritt wird später gegeben unterVerwendung von Rechenregeln für konvergente Folgen.

1.4 Divergente Folgen

Nicht alle Folgen konvergieren gegen einen Grenzwert. Diese nennt man divergenteFolgen und unterscheidet zwei Fälle:

• Bestimmtdivergente Folgen streben mit wachsendemn gegen+∞ oder gegen−∞, wie es z.B. bei der Folge

an = n2

der Fall ist, siehe Bild 1.4.

• Unbestimmtdivergente Folgen sind alle anderen, d.h. Folgen, die weder konver-gent noch bestimmt divergent sind, wie z.B. die Folge

an = (−1)n.

Diese beiden neuen Begriffe werden nun exakt definiert.

Page 20: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 20

�������

Abbildung 1.4: Bestimmt divergente Folge mit uneigentlichem Grenzwert∞.

Definition 1.24 (Bestimmt divergent, uneigentlicher Grenzwert)an heißt bestimmt divergent mit dem uneigentlichen Grenzwert∞wenn gilt:

für jede Schranke K ∈ Rgibt es ein N ∈ N so dass

für alle n ≥ N gilt, dassan > K.

an heißt bestimmt divergent mit dem uneigentlichen Grenzwert −∞ wenngilt:

für jede Schranke K ∈ Rgibt es ein N ∈ N so dass

für alle n ≥ N gilt, dassan < K.

Wie bei konvergenten Folgen werden hier also zwei Dinge zum Ausdruck gebracht:

• Die Glieder vonan werden irgend wann einmal größer (kleiner) als jede vorabgewählte, noch so große (kleine) SchrankeK.

• Die Glieder vonan bleiben danach auch für immer größer (kleiner) alsK.

Page 21: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 21

Beispiel 1.25 Die Folge

an ={

2n falls n gerade0 falls n ungerade

ist also keine bestimmt divergente Folge weil die zweite Bedingung nicht erfülltist!

Beispiel 1.26 Die Folgean = (−2)n

ist ebenfalls keine bestimmt divergente Folge, da sie weder den uneigentlichenGrenzwert∞ noch−∞ hat sondern immer hin und her springt. Andererseits ist

an = 2n

eine bestimmt divergente Folge mit uneigentlichem Grenzwert∞ und

an = −(2n)

eine bestimmt divergente Folge mit uneigentlichem Grenzwert−∞.

Notation 1.27Für eine bestimmt divergente Folge an mit uneigentlichem Grenzwert∞ sagtman auch, dass sie gegen∞ strebt und schreibt

an →∞ für n→∞

oderlim

n→∞an =∞.

Für eine bestimmt divergente Folge an mit uneigentlichem Grenzwert −∞sagt man auch, dass sie gegen −∞ strebt und schreibt

an → −∞ für n→∞

oderlim

n→∞an = −∞.

Bemerkung. Wenn man die Definition einer konvergenten Folge mit der einer be-stimmt divergenten Folge vergleicht, stellt man fest, dass eine bestimmt diver-gente Folge ebennicht nur ein Spezialfall einer konvergenten Folge mit Grenz-wert+∞ oder−∞ ist. Dies liegt daran, dass|an −∞| für jedesan ∈ R gleich∞ ist, und somit

|an −∞| < ε

für keinε ∈ R erfüllt wäre. Trotzdem sagt man von bestimmt divergenten Folgenoft, dass sie gegen+∞ oder−∞ “konvergieren”, obwohl das genau genommennatürlich nicht korrekt ist.

Page 22: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 22

Wie beweist man dass eine Folge bestimmt divergent ist? Hierzu zwei Beispiele:

Beispiel 1.28 Zu zeigen:Die Folge

an = n2 − 3

ist bestimmt divergent mit Grenzwert∞.

• Einsetzen der Definition von “bestimmt divergent”.

Zu zeigen:Für alleK ∈ R existiert einN ∈ N so dass für allen ≥ N giltan > K.

• Elimination von “für alleK ∈ R”: Sei K ∈ R beliebig aber fest.

Zu zeigen:Es existiert einN ∈ N so dass für allen ≥ N gilt an > K.

• Einsetzen der Definition vonan:

Zu zeigen:Es existiert einN ∈ N so dass für allen ≥ N gilt

n2 − 3 > K.

• Berechnen einesN , das diese Eigenschaft erfüllt. DiesesN wird natürlichvonK abhängen. Hierzu löst man die obenstehende Ungleichung zunächstnachn auf. Man erhält

n >√

K − 3

falls K − 3 ≥ 0 undn beliebig sonst.

• Folglich gilt z.B. für die Wahl

N =⌈√

max{0,K − 3}+ 1⌉

dass für allen ≥ N die Bedingungn2 − 3 > K erfüllt ist.

• Verifizieren an einem Beispiel. Sei z.B.K = 1000, dann istN = 33.Wenn wir uns nicht verrechnet haben, müßte dannan > 1000 sein für allen ≥ 33. Dies prüft man wieder an ein paar Beispielen:

a33 = 1086, a34 = 1153, a35 = 1222, . . .

Beispiel 1.29 Zu zeigen: Die Folge

an = 3n− n sin(5n)

ist bestimmt divergent mit uneigentlichem Grenzwert∞.

• Einsetzen der Definition von “bestimmt divergent”.

Zu zeigen:Für alleK ∈ R existiert einN ∈ N so dass für allen ≥ N giltan > K.

• Elimination von “für alleK ∈ R”: Sei K ∈ R beliebig aber fest.

Zu zeigen:Es existiert einN ∈ N so dass für allen ≥ N gilt an > K.

Page 23: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 23

• Einsetzen vonan:

Zu zeigen:Es existiert einN ∈ N so dass für allen ≥ N gilt

3n− n sin(5n) > K.

• Berechnen einesN , das diese Eigenschaft erfüllt. Hierzu müßte man dieobenstehende Ungleichung wieder nachn auflösen, d.h. auf die Form

n > f(K)

bringen, was aber schwierig ist. Man kann aber versuchen,an dadurchzu vereinfachen, dass man es nach unten abschätzt, d.h. einen einfacherenAusdruckan mit

an ≤ an

sucht mitan > K.

Jedesn welchesan > K erfüllt, erfüllt dann auchan > K. Wenn an

hinreichend einfach ist, kann man die Ungleichungan > K auf die Form

n > f(K)

bringen und z.B.

N =⌈f(K) + 1

⌉wählen.

• Abschätzen vonan nach unten durch einen Ausdruckan ≤ an:

an = 3n− n sin(5n)= n(3− sin(5n))≥ n(3− 1)= 2n.

Somit ist alsoan = 2n.

• Die Bedingung2n > K läßt sich nun auf die Form

n > K/2

bringen. Wählt man nun

N = dK/2 + 1e

so ist für allen ≥ N die Bedingung

an > K

erfüllt.

Page 24: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 24

• Verifizieren an einem Beispiel. Sei z.B.K = 1000, dann erhält manN =501. Es muss alsoan > 1000 sein für allen ≥ 501. Dies prüft man wiederan ein paar Beispielen:

a501 = 1960.4, a502 = 1439.7, a503 = 1012.0 . . .

Wie im Fall von konvergenten Folgen sind solche Beweise natürlich schwierig. Glück-licherweise gibt’s aber auch bei bestimmt divergenten Folgen ein paar Theoreme, dieeinem das Leben einfacher machen:

Theorem 1.30an →∞ genau dann wenn −an → −∞.

Wenn wir’s also mit einer bestimmt divergenten Folgean mit uneigentlichem Grenz-wert−∞ zu tun haben, können wir das Problem immer auf eine bestimmt divergenteFolge mit uneigentlichem Grenzwert∞ reduzieren, indem wir einfach zur Folge−an

übergehen. Im Folgenden formulieren wir daher alle Theoreme nur noch für den unei-gentlichen Grenzwert∞, der Fall−∞ ist analog.

Theorem 1.31Wenn an → ∞ und bn = an für alle n ab einem bestimmten N , dann giltauch bn →∞.

Theorem 1.32Wenn an → ∞ und bn ≥ an für alle n ab einem bestimmten N , dann gilt

auch bn →∞.

Der Beweis in Beispiel 1.29 wäre unter Verwendung von Theorem 1.32 viel einfachergewesen: Da2n→∞ undn(3− sin(5n)) ≥ 2n für allen ∈ N, gilt n(3− sin(5n))→∞.

Theorem 1.33Wenn an →∞ dann gilt für alle c ∈ R auch an + c→∞.

Theorem 1.34Wenn an →∞ dann gilt für alle c ∈ R \ {0}

c an →{

∞ falls c > 0−∞ falls c < 0.

Page 25: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 25

Theorem 1.35Wenn an →∞ und bn →∞ dann gilt auch

an + bn → ∞ undanbn → ∞.

Zum Schluß noch die Definition von unbestimmt divergenten Folgen:

Definition 1.36 (Unbestimmt divergent)an heißt unbestimmt divergent, wenn an weder konvergent noch bestimmt

divergent ist.

Damit ist klar, dass jede Folgean entweder

• konvergent mit Grenzwerta ∈ R ist,

• bestimmt divergent mit uneigentlichem Grenzwert+∞ oder−∞ ist oder

• unbestimmt divergent ist.

1.5 Rechenregeln für Grenzwerte konvergenter Folgen

Für die Praxis am Wichtigsten sind die konvergenten Folgen, da diese auch der Differential-und Integralrechnung zugrunde liegen. Um nicht nur nachzuweisen, dass eine Folgekonvergent ist, sondern auch deren Grenzwert auszurechnen, hilft einem das folgendeTheorem:

Theorem 1.37 (Rechenregeln für Grenzwerte konvergenter Folgen)Seien an und bn konvergente Folgen mit an → a und bn → b und λ ∈ R.

Dann gilt

an + bn → a + b

an − bn → a− b

λan → λa

anbn → ab

an/bn → a/b falls b 6= 0 und bn 6= 0 für alle n.

Grafisch läßt sich Theorem 1.37 durch ein kommutatives Diagramm für den Fall derAddition wie folgt darstellen:

an, bn+−−−−→ an + bn

lim

y ylim

a, b −−−−→+

a + b

Page 26: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 26

Besonders überraschend ist Theorem 1.37 eigentlich nicht — umso wichtiger ist jedochfestzuhalten, dass es ausdrücklich nur für konvergente Folgen gilt. Es gilt analog auchfür bestimmt divergente Folgen sofern man nicht auf undefinierte Ausdrücke wie z.B.∞−∞, 0×∞ oder∞/∞ stößt.

Beispiel 1.38 Kehren wir zurück zu Beispiel 1.23. Dort war zu zeigen, dass

2n − 33n + 1

→ 0

ist. Man wäre versucht, an dieser Stelle Theorem 1.37 auf die Folgen2n − 3und3n + 1 anzuwenden. Das klappt aber nicht, weil beides keine konvergentensondern bestimmt divergente Folgen sind und man auf den undefinierten Aus-druck∞/∞ stoßen würde. Der Trick ist, zuerst Zähler und Nenner durch3n zudividieren:

2n − 33n + 1

=(2/3)n − 1/3n−1

1 + 1/3n.

In diesem Term treten überall konvergente Folgen auf:

(2/3)n → 01/3n−1 → 0

1/3n → 0

Wiederholte Anwendung von Theorem 1.37 ergibt nun

(2/3)n − 1/3n−1 → 0− 0 = 01 + 1/3n → 1 + 0 = 1

(2/3)n − 1/3n−1

1 + 1/3n→ 0− 0

1 + 0=

01

= 0.

Verallgemeinert man Beispiel 1.38, so folgt in gleicher Weise für den Quotienten vonzwei Polynomen gleichen Grades folgendes Theorem:

Theorem 1.39Sei

an =pknk + pk−1n

k−1 + . . . + p1n + p0

qknk + qk−1nk−1 + . . . + q1n + q0

mit pk 6= 0, qk 6= 0. Dann gilt

an →pk

qk.

Anschaulich heißt das, dass die Termepknk und qknk im Vergleich zu den Termenniedrigerer Potenz so stark wachsen, dass man letztere vernachlässigen und dann mitnk kürzen kann.

Page 27: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 27

Man kann dieses Theorem noch weiter verallgemeinern auf den Fall wenn Zählerpoly-nom und Nennerpolynom unterschiedlichen Grad haben:

Theorem 1.40Sei

an =pknk + pk−1n

k−1 + . . . + p1n + p0

qrnr + qr−1nr−1 + . . . + q1n + q0

mit pk 6= 0, qr 6= 0. Dann sind 3 Fälle zu unterscheiden:

• Ist k > r dann dominiert das Zählerpolynom, d.h.

an →{

∞ falls pk/qr > 0−∞ falls pk/qr < 0

• Ist k < r dann dominiert das Nennerpolynom, d.h.

an → 0.

• Ist k = r dann gilt wie in Theorem 1.39

an →pk

qr.

Abschließend noch zwei weitere, intuitiv recht naheliegende Rechenregel für Grenz-werte konvergenter Folgen:

Theorem 1.41Sei an eine Nullfolge.

• Wenn an > 0 ab einem bestimmten N , dann gilt 1/an →∞.

• Wenn an < 0 ab einem bestimmten N , dann gilt 1/an → −∞.

Theorem 1.42 (Sandwich Theorem)Wenn an und bn gegen einen gemeinsamen Grenzwert g konvergieren, d.h.

an → g

bn → g

und wenn für eine Folge cn gilt

an ≤ cn ≤ bn

ab einem bestimmten N , dann gilt auch

cn → g.

Page 28: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 28

2 Grenzwerte von Funktionen und Stetigkeit

Ist f ∈ R → R eine Funktion undan ∈ N → R eine Folge, so ist die Kompositionf(an) ∈ N→ R wiederum eine Folge.

Beispiel 2.1 Sei

an =n

n + 1f(x) = x sin(x)

dann erhält man durch Komposition die Folge

f(an) =n

n + 1sin(

n

n + 1

).

In diesem Kapitel betrachten wir folgende Fragen:

• Angenommenan ist eine konvergente Folge, ist dannf(an) auch eine konver-gente Folge?

• Angenommenan → a, unter welcher Bedingung gilt dannf(an)→ f(a)?

Die oben genannten Fragen lassen sich durch folgendes Diagramm veranschaulichen:

anf−−−−→ f(an)

lim

y ylim?

a −−−−→f

f(a)

Erfüllt eine Funktionf diese beiden Bedingungen für alle konvergenten Folgenan,dann heißt sie stetig. In der Welt des Ingenieurs sind eigentlich alle Funktionen stetig.Das ist auch der Grund weshalb ab und zu mal was einstürzt. Interessant sind alsovor allem die Ausnahmefunktionen, die nicht stetig sind und die es einem deshalb oftschwer machen.Wie “einfach” stetige Funktionen sind, merkt man z.B. wenn man versucht ein Pro-gramm zu schreiben, das die Nullstellen einer reellen Funktion berechnet (oder zu-mindest sinnvoll approximiert). Fast jedes Programm, das von sich behauptet, diesesProblem zu lösen, wird an Funktionen der Art

f(x) ={

0 falls x =√

π/e1 sonst.

kläglich scheitern. Man sieht also, dass das Nullstellenproblem durchaus schwierigist. Viel einfacher hingegen wird es, wenn man von den zu verarbeitenden Funktio-nen verlangt, dass sie stetig sind, da solche Funktionen keine Sprünge haben. StetigeFunktionen sind also aus zwei Gründen wichtig:

Page 29: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 29

• Die “meisten” in der Natur vorkommenden Funktionen sind tatsächlich stetig.

• Ingenieursprobleme wie Nullstellensuche oder Extremwertsuche sind nur fürstetige Funktionen algorithmisch einfach lösbar.

Notation 2.2Um mit der Notation den allgemeinen Konventionen zu folgen, bezeichnenwir Folgen ab sofort mit xn und nicht mehr wie bisher mit an. Grenzwertewerden mit x bezeichnet.

2.1 Grenzwert einer Funktion

Zunächst ein paar Beispiele und Gegenbeispiele wann aus

limn→∞

xn = x

folgt dasslim

n→∞f(xn) = f(x).

Beispiel 2.3 Sei xn = 1/n + 2 eine Folge undf(x) = x2 eine Funktion. Of-fensichtlich istxn eine konvergente Folge mit Grenzwertx = 2, d.h.xn → 2.Betrachten wir nun die Folgef(xn):

f(xn) = (1/n + 2)2

= 1/n2 + 4/n + 4.

Man sieht sofort, dass auchf(xn) eine konvergente Folge ist und den Grenzwert4 besitzt. Andererseits ist aber auchf(x) = 4, d.h. es gilt

limn→∞

f(xn) = f(x).

Beispiel 2.4 Seixn = 1/n die klassische Folge mit Grenzwertx = 0 und

f(x) ={

1 falls x 6= 0−1 falls x = 0

Offensichtlich istf(x) = f(0) = −1.

Für die Kompositionf(xn) gilt

f(xn) ={

1 falls 1/n 6= 0−1 falls 1/n = 0

Da aber1/n 6= 0 für allen, ist

f(xn) = 1

Page 30: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 30

für allen und somit natürlich auch

limn→∞

f(xn) = 1.

Also liegt hier eine Ausnahmefall mit

limn→∞

f(xn) 6= f(x)

vor.

Beispiel 2.5 Sei wiederxn = 1/n mit Grenzwertx = 0. Diesmal schauen wir dieFunktion

f(x) = sin(x)/x

an. Zunächst fällt auf, dassf(x) gar nicht definiert ist, da ja eine Division durchNull auftreten würde! Betrachten wir trotzdem wieder die Komposition, d.h. dieFolge

f(xn) = sin(xn)/xn

= n sin(1/n).

Es ist fraglich, wie sich die Funktionswerte vonf verhalten, wenn die Argumen-te xn immer näher auf die Stelle zulaufen, wof undefiniert ist. Diese Ambiva-lenz zeigt sich auch darin, dass einerseitsn gegen∞ strebt, andererseits abersin(1/n) gegen0 und es ist keinesfalls klar wer das Rennen machen wird. Setztman fürn versuchsweise große Zahlen ein, erhält man

f(x5) = 0.993, f(x10) = 0.998, f(x20) = 0.9996, . . .

Es entsteht also der Verdacht, dass

limn→∞

f(xn) = 1.

Wir werden später zeigen dass dies auch tatsächlich der Fall ist.

Beispiel 2.6 Sei noch einmalxn = 1/n mit Grenzwertx = 0 und

f(x) ={

1/x falls x > 00 falls x ≤ 0

Es giltf(x) = 0. Durch Komposition erhält man die Folge

f(xn) ={

n falls 1/n > 00 falls 1/n ≤ 0

Da aber1/n > 0 für n ∈ N, gilt

f(xn) = n.

Dies ist eine bestimmt divergente Folge mit uneigentlichem Grenzwert∞, es giltalso wiederum

limn→∞

f(xn) 6= f(x).

Page 31: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 31

Beispiel 2.7 Seienxn = 1/n, yn = −1/n zwei konvergente Folgen mit Grenzwertx = y = 0 und

f(x) = sign(x).

Man prüft leicht nach, dass

f(xn) = 1f(yn) = −1

und somit

limn→∞

f(xn) = 1

limn→∞

f(yn) = −1.

Andererseits ist aber natürlich

f(x) = f(y) = 0.

Es gibt also konvergente Folgenxn mit Grenzwertx und Funktionenf , für die dieFolgef(xn)

• gegenf(x) konvergiert

• gegen einen Grenzwert6= f(x) konvergiert oder

• divergiert.

Im letzten Beispiel sieht man sogar, dass es Folgenxn, yn gibt mit gleichem Grenzwertx = y, für die aber die Folgenf(xn) und f(yn) gegen unterschiedliche Grenzwertekonvergieren. Es kann also alles mögliche passieren wenn man eine Funktion auf einekonvergente Folge loslässt. Daher macht es Sinn, den “normalen” Fällen einen Namenzu geben.

Definition 2.8 (Grenzwert einer Funktion)Eine Funktion f ∈ D → R hat an der Stelle x einen Grenzwert, wenn

es ein G ∈ R gibt so dassfür jede Folge xn gilt

wenn xn → x, xn ∈ D und xn 6= x für alle n ∈ Ndann f(xn)→ G.

Diesen Grenzwert G nennt man auch Grenzwert der Funktion f bei x.

Anschaulich liest sich das wie folgt: Wenn man mit denx-Werten irgendwie auf denPunktx zuläuft und die zugehörigen Funktionswerte dabei immer auf den selben PunktG zulaufen, dann hat die Funktion den GrenzwertG bei x. Die wichtigsten Beispielebzw. Gegenbeispiele hierzu sind prototypisch in Bild 2.1 und 2.2 dargestellt.

Page 32: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 32

��

��

��

� ��������������� ������� ��!���"#��$�%'&(*),+ � -�.�/103254�6 2�0

Abbildung 2.1: Beispiele wof an der Stellex den GrenzwertG hat.

�� �� ������� ������������� �����������������

Abbildung 2.2: Beispiele wof an der Stellex keinenGrenzwert hat.

Beispiel 2.9

• In Beispiel 2.3 hatf an der Stellex = 2 den Grenzwert4. Jede Folgexn

mit Grenzwertx = 2 erfüllt in diesem Beispiel die Bedingungf(xn)→ 4.

• In Beispiel 2.4 hatf an der Stellex = 0 den Grenzwert1. Für jede Folgexn mit Grenzwertx = 0 undxn 6= 0 für alle n ∈ N gilt f(xn) = 1 undsomit natürlich auchf(xn)→ 1.

• In Beispiel 2.5 hatf an der Stellex = 0 den Grenzwert1. Dies wird erstspäter noch gezeigt. Für die im Beispiel gewählte Folgexn = 1/n gilt zwarf(xn)→ 1, es ist aber gar nicht klar, ob dies auch für alle anderen gegen0konvergenten Folgen mitxn 6= 0 gelten würde.

• In Beispiel 2.6 hatf an der Stellex = 0 keinen Grenzwert. Es wurde eineFolge gefunden, die die geforderten Eigenschaftenxn → x, xn ∈ D undxn 6= x für allen ∈ N erfüllt, für die aberf(xn) keinen reellen Grenzwerthat.

• In Beispiel 2.7 hatf an der Stellex = 0 ebenfalls keinen Grenzwert. Hierwurden zwei Folgenxn, yn gefunden, die die geforderten Eigenschaftenerfüllen und für dief(xn) undf(yn) zu verschiedenen Grenzwerten kon-vergieren.

Page 33: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 33

Notation 2.10Um auszudrücken, dass f ∈ D → R den Grenzwert G an der Stelle x hat,schreibt man auch

limx→x

f(x) = G

oderf(x)→ G für x→ x.

Es ist meistens einfacher von einer Funktionf zu zeigen, dass sie beix keinen Grenz-wert hat als anders herum.

Beispiel 2.11 Seif ∈ R \ {0} → R,

f(x) = cos(1/x)

und x = 0. Zu zeigen:f hat keinen Grenzwert beix. Man kann dies dadurchzeigen, dass man eine Folgexn konstruiert mitxn → 0, für die die Folgef(xn)nicht konvergiert. Eine solche Folge ist z.B.

xn =1

nπ.

Offensichtlich giltxn → 0. Betrachtet man die Folgef(xn), so erhält man

f(xn) = cos(1/xn)= cos(nπ)

={

1 falls n gerade−1 falls n ungerade

Diese Folge hat natürlich keinen Grenzwert, also hatf keinen Grenzwert bei0.

Beispiel 2.12 Man hätte den Beweis im vorigen Beispiel auch so führen können,dass man zwei Folgenxn, yn mit xn → 0 undyn → 0 sucht, für dief(xn) undf(yn) gegen unterschiedliche Grenzwerte konvergieren. Solche Folgen wärenz.B.

xn =1

2nπ

yn =1

(2n + 1)π.

Page 34: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 34

Hier erhält man

f(xn) = cos(1/xn)= cos(2nπ)= 1

f(yn) = cos(1/yn)= cos((2n + 1)π)= cos(2nπ + π)= cos(π)= −1.

Damit gilt

f(xn) → 1f(yn) → −1

und somit hatf keinen Grenzwert bei0.

Der Beweis, dass eine Funktionf einen Grenzwert beix hat, ist im Allgemeinen rechtschwierig.

Beispiel 2.13 Seif(x) = x2 + 1 undx = 0.Zu zeigen:f hat an der Stellex = 0 einen Grenzwert.

• Zunächst versucht man den GrenzwertG zu erraten, indem manf in derNähe vonx auswertet. Man stellt schnell fest, dass das eigentlich nurG = 1sein kann.

• Einsetzen der Grenzwert Definition von Funktionen.Zu zeigen:Für jede Folgexn gilt: Wennxn → 0 undxn 6= 0 für alle n,dannx2

n + 1→ 1.

• Seixn eine beliebige aber fest gewählte Folge.Zu zeigen:Wennxn → 0 undxn 6= 0 für allen, dannx2

n + 1→ 1.

• Annahme: xn → 0 undxn 6= 0 für allen.Zu zeigen:x2

n + 1→ 1.

• Einsetzen der Grenzwert Definition von Folgen.Annahme: Für alle ε > 0 existiert einN so dass für allen ≥ N gilt|xn| < ε.Zu zeigen:Für alleε′ existiert einN ′ so dass für allen′ ≥ N ′ gilt |x2

n′ +1− 1| < ε′.

• Vereinfachen: Die Bedingung|x2n′ + 1− 1| < ε′ ist äquivalent zu|xn′ | <√

ε′.Zu zeigen:Für alleε′ existiert einN ′ so dass für allen′ ≥ N ′ gilt |xn′ | <√

ε′.

Page 35: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 35

• Elimination von “für alleε′”: Sei ε′ beliebig aber fest.Zu zeigen:Es existiert einN ′ so dass für allen′ ≥ N ′ gilt |xn′ | <

√ε′.

• Laut Annahme existiert für alleε > 0 ein N so dass für allen ≥ N gilt|xn| < ε, also auch für die spezielle Wahl

ε =√

ε′.

Damit erhält man die Aussage: Es existiert einN so dass für allen ≥ Ngilt |xn| <

√ε′. Man muss nun nur noch die Variablen umbenennen und

hat das gewünschte Resultat: Es existiert einN ′ so dass für allen′ ≥ N ′

gilt |xn′ | <√

ε′.

Beispiel 2.14 Sei

f(x) ={

3 falls x 6= 25 falls x = 2.

Zu zeigen:f hat einen Grenzwert beix = 2.

• Durch Auswerten vonf in der Nähe vonx = 2 stellt man fest, dass derGrenzwertG nur3 sein kann, obwohlf(x) = 5. Funktionswert und Grenz-wert vonf stimmen also an der Stellex nicht überein!

• Einsetzen der Grenzwert Definition von Funktionen.Zu zeigen:Für jede Folgexn gilt: Wennxn → 2 undxn 6= 2 für alle n,dannf(xn)→ 3.

• Seixn eine beliebige aber fest gewählte Folge.Zu zeigen:Wennxn → 2 undxn 6= 2 für allen, dannf(xn)→ 3.

• Annahme: xn → 2 undxn 6= 2 für allen.Zu zeigen:f(xn)→ 3.

• Aus der Annahme dassxn 6= 2 für alle n, folgt f(xn) = 3 für alle n.Das heißt,f(xn) ist eine konstante Folge, und damit ist bereits klar, dassf(xn)→ 3.

2.2 Rechenregeln für Grenzwerte von Funktionen

Ähnlich wie man mit Grenzwerten von konvergenten Folgen rechnen kann, kann mandies auch mit Grenzwerten von Funktionen an einer Stellex.

Page 36: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 36

Theorem 2.15 (Rechenregeln für Grenzwerte von Funktionen)Seien f, g ∈ D → R, x ∈ R und

limx→x

f(x) = F

limx→x

g(x) = G

mit F,G ∈ R. Dann gilt

limx→x

(f(x) + g(x)

)= F + G

limx→x

(f(x)− g(x)

)= F −G

limx→x

(f(x)g(x)

)= FG

limx→x

(f(x)/g(x)

)= F/G falls G 6= 0

limx→x

cf(x) = cF für alle c ∈ R.

Beispiel 2.16 Um den Grenzwert der Funktion

f(x) =3x− 12x + 2

an der Stellex = 1 zu berechnen, berechnet man

limx→1

3x− 1 = 2

limx→1

2x + 2 = 4

und erhält dann unter Anwendung von Theorem 2.15

limx→1

3x− 12x + 2

= 1/2.

Beispiel 2.17 Zu berechnen ist der Grenzwert von

f(x) =1− x

1−√

x

an der Stellex = 1. Hier ist Theorem 2.15 nicht direkt anwendbar, denn derNenner hat den Grenzwert Null:

limx→1

1−√

x = 0.

Der Trick ist hier, zuerst Zähler und Nenner mit1 +√

x zu erweitern:

1− x

1−√

x=

(1− x)(1 +√

x)(1−

√x)(1 +

√x)

=(1− x)(1 +

√x)

1− x

= 1 +√

x.

Page 37: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 37

Offensichtlich giltlimx→1

1 +√

x = 2,

also

limx→1

1− x

1−√

x= 2.

2.3 Uneigentliche Grenzwerte und Grenzwerte bei Unendlich

Der Definition des Grenzwerts einer Funktion lässt sich ohne große Änderungen ver-allgemeinern auf den Fall wo

• der GrenwertG unendlich ist bzw.

• die Stellex, an der der Grenzwert berechnet werden soll im Unendlichen liegt.

Im ersten Fall spricht man von einem uneigentlichen Grenzwert.

Beispiel 2.18 Seif(x) = 1/x2 undxn eine Folge mitxn → 0 undxn 6= 0 für allen. Dann divergiert die Folge der Funktionswertef(xn) bestimmt gegen∞. Mansagt daherf(x) hat bei0 den uneigentlichen Grenzwert∞.

Analog zu Definition 2.21 wird der uneigentliche Grenzwert einer Funktion wie folgtdefiniert:

Definition 2.19 (Uneigentlicher Grenzwert einer Funktion)Eine Funktion f ∈ D → R hat an der Stelle x den uneigentlichen Grenzwert∞ wenn

für jede Folge xn giltwenn xn → x, xn ∈ D und xn 6= x für alle n ∈ Ndann f(xn)→∞.

Man schreibt dannlimx→x

f(x) =∞

Der uneigentliche Grenzwert−∞ ist in gleicher Weise definiert.

Beispiel 2.20 Seif(x) = 1/x. Dann hatf(x) keinen (uneigentlichen) Grenzwertbei x = 0, denn je nachdem ob man von rechts oder links kommt, läuft manentweder gegen∞ oder gegen−∞. Schickt man hingegenx nach unendlich,dann laufen die Funktionswerte auf0 zu. Man sagt daherf(x) hat beix = ∞den Grenzwert0.

Analog zu Definition 2.21 wird der Grenzwert einer Funktion beix = ±∞ wie folgtdefiniert:

Page 38: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 38

Definition 2.21 (Grenzwert einer Funktion bei±∞)Eine Funktion f ∈ D → R hat an der Stelle x = ±∞ einen Grenzwert,

wenn

es ein G ∈ R gibt so dassfür jede Folge xn gilt

wenn xn → x und xn ∈ D für alle n ∈ Ndann f(xn)→ G.

Man schreibt dann

limx→∞

f(x) = G bzw. limx→−∞

f(x) = G.

Der Vollständigkeit halber sei noch erwähnt, dass es natürlich auch die Kombinationaus beidem gibt, nämlich uneigentliche Grenzwerte bei unendlich.

Angenommen eine Funktion ist an der Stellex ∈ R nicht definiert, hat dort aberwenigstens einen Grenzwert. Dann spart man sich oft lästige Ausnahmebehandlungen,wenn man die Funktion an der Stellex einfach durch ihren Grenzwert erweitert. Nichtsanderes haben wir in Kapitel 1.1 getan, als wir die Addition und Multiplikation vonunendlichen Zahlen definiert haben.

Beispiel 2.22 Die Funktion

f(x) =sin(x)

x

ist für x = 0 undx = ∞ nicht definiert. Da jedoch die entsprechenden Grenz-werte existieren, ist es sinnvoll die Funktion zu erweitern durch

f(0) = 1f(∞) = 0

f(−∞) = 0.

Beispiel 2.23 Die Funktionf(x) = sin(x)

hat beix = ∞ keinen (uneigentlichen) Grenzwert. Folglich gibt’s auch keinesinnvolle Möglichkeitf an der Stelle∞ zu erweitern.

Beispiel 2.24 Für

f(x) =1x2

existiert beix = 0 der uneigentliche Grenzwert∞. Die Erweiterung durch

f(0) =∞

ist somit naheliegend.

Page 39: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 39

Beispiel 2.25 Andererseits hat

f(x) =1x

keinen (uneigentlichen) Grenzwert beix = 0. Folglich gibt’s auch keine nahe-liegende Möglichkeit, die Funktion dort zu erweitern.

2.4 Stetigkeit

Im vorigen Kapitel haben wir uns damit beschäftigt wannf einen GrenzwertG an derStellex hat. In aller Regel ist dann

f(x) = G,

d.h. derGrenzwertvon f an der Stellex stimmt mit demFunktionswertvon f an derStellex überein. In diesem Fall ist der rechte Pfeil des eingangs gezeigten Diagramms

xnf−−−−→ f(xn)

lim

y ylim?

x −−−−→f

f(x)

zulässig, d.h. es ist egal ob man

• zuerst den Grenzwertx der Folgexn berechnet und dannf auf x anwendet oder

• zuerst alle Folgenglieder durchf abbildet und dann den Grenzwert dieser Folgef(xn) bestimmt.

Man sagt dannf ist stetig an der Stellex.

Definition 2.26 (Stetigkeit)f ∈ D → R heißt stetig an der Stelle x ∈ D wenn

limx→x

f(x) = f(x).

Merkregel 2.27Um an der Stelle x stetig zu sein muss f ∈ D → R also drei Bedingungenerfüllen:

• f muss an der Stelle x definiert sein, d.h. x ∈ D.

• f muss einen Grenzwert bei x haben und

• dieser Grenzwert muss gleich dem Funktionswert von f an der Stelle xsein.

Page 40: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 40

��

��

��

� ��������������� ������� ��!���"#��$�%'&(*),+ � -�.�/103254�6 2�0

Abbildung 2.3: Im linken Bild hatf an der Stellex einen Grenzwert und ist stetig. Immittleren und rechten Bild hatf an der Stellex zwar einen Grenzwert, ist dort abernicht stetig.

�� �� ������� ������������� �����������������

Abbildung 2.4: Beispiele wof an der Stellex keinen Grenzwert hat und folglich auchnicht stetig ist.

Page 41: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 41

Der Beweis, dass eine Funktion stetig an einem bestimmten Punkt ist, ist meistens rechtschwierig. Zum Glück gibt’s aber ein paar Eigenschaften von stetigen Funktionen, diesolche Beweise einfach machen.

Theorem 2.28 (Stetigkeitssatz)Sind f(x) und g(x) stetig an der Stelle x, dann auch

f(x) + g(x),f(x)− g(x),f(x)g(x),f(x)/g(x) falls g(x) 6= 0.

Die meisten Funktionen, mit denen wir uns beschäftigen, sind nicht nur an einem be-sonders ausgewählten Punkt stetig sondern fast überall.

Definition 2.29f(x) heißt stetig in einer Menge M ⊆ R wenn f(x) stetig ist an jeder Stellex ∈M .

Als Konsequenz aus Theorem 2.28 kann man ganze Klassen von stetigen Funktionenidentifizieren:

• Polynomfunktionen sind überall stetig, d.h. an jedem Punktx ∈ R.

• Rationale Funktionen, d.h. Funktionen vom Typ

f(x) = p(x)/q(x)

wobeip(x) undq(x) Polynome sind, sind überall stetig, außer möglicherweisean den Punktenx wo q(x) = 0.

• Weiterhin sind alle handelsüblichen Funktionen wiesin(x), cos(x), ex überallstetig.

• Die Wurzelfunktion ist stetig inR+0 .

• Die Logarithmusfunktion ist stetig inR+.

• Die Funktionf(x) = 1/x ist stetig inR \ {0}.

Noch mehr stetige Funktionen lassen sich durch folgendes Theorem erschließen:

Theorem 2.30 (Stetigkeit verketteter Funktionen)Ist g(x) stetig an der Stelle x und f(x) stetig an der Stelle g(x), dann ist

auch f(g(x)) stetig an der Stelle x.

Als Konsequenz aus Theorem 2.30 folgt, dass z.B.f(x) = sin(x2 + 3) überall stetigist, usw.

Page 42: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 42

Merkregel 2.31Eine Funktion f ∈ D → R ist stetig bei x wenn keine der folgenden Aus-nahmen eintritt:

• x 6∈ D. Dies ist meistens auf Nullstellen im Nenner zurückzuführen.Aufpassen muss man auch wenn z.B. eine Logarithmus oder Wurzel-funktion im Spiel ist.

• f hat eine Sprungstelle oder einen Ausreißer bei x. Sprünge werdenmeistens durch Fallunterscheidungen verursacht.

Allerdings muss man oft genau hinschauen.

Beispiel 2.32 Folgende Funktionen sind stetig beix = 0, obwohl sie auf den erstenBlick nicht so aussehen.

f(x) = |x|

f(x) ={

x/x falls x 6= 01 sonst.

f(x) ={

sin(x)/x falls x 6= 01 falls x = 0

Beispiel 2.33 Nicht stetig beix = 0 ist andererseits z.B.

f(x) = sin(x)/x,

da diese beix = 0 nicht definiert ist. Auch die Funktion

f(x) ={

sin(x)/x falls x 6= 02 falls x = 0

ist nicht stetig beix = 0, da sie dort einen Sprung hat.

Merkregel 2.34Eine Funktion ist stetig in einem Intervall, wenn man die Funktion in demIntervall ohne abzusetzen zeichnen kann.

2.5 Eigenschaften stetiger Funktionen

Wie eingangs erwähnt sind Ingenieursprobleme meistens nur für stetige Funktionenalgorithmisch einfach lösbar. Die Eigenschaften stetiger Funktionen, die hierbei zumTragen kommen, sind wie folgt zusammengefaßt.

Page 43: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 43

Theorem 2.35Sei f(x) stetig im Intervall [a, b]. Dann gelten folgende Eigenschaften:

Beschränktheit. f ist beschränkt in [a, b], d.h. es gibt eine Zahl K ∈ R sodass

|f(x)| < K

für alle x ∈ [a, b].

Zwischenwerte. f nimmt in [a, b] jeden Wert zwischen f(a) und f(b) an,d.h. für jedes y zwischen f(a) und f(b) existiert ein x ∈ [a, b] so dassf(x) = y.

Nullstellen. Ein Spezialfall hiervon ist der Zwischenwert 0. Istsign(f(a)) 6= sign(f(b)) dann hat f(x) eine Nullstelle in [a, b].

Extremwerte. f besitzt in [a, b] ein Maximum und ein Minimum, d.h. esgibt xmax, xmin ∈ [a, b] so dass

f(xmax) ≥ f(x)f(xmin) ≤ f(x)

für alle x ∈ [a, b].

Die Beschränktheit spielt eine wichtige Rolle wenn man mit Gleitkommazahlen arbei-tet, da mit diesen nur ein endlicher Zahlenbereich darstellbar ist.Um z.B. die Nullstelle einer stetigen Funktion in einem Intervall[a, b] zu berechnenkann man, wenn man weiß dasssign(f(a)) 6= sign(f(b)), die sehr einfachen Methodeder Intervallhalbierung anwenden. Dieses Verfahren liefert einem eine beliebig genaueApproximation an eine Nullstelle. Die Genauigkeit kann man durch einen zusätzlichenParameterε vorgeben. Für nicht stetige Funktionen wäre nicht garantiert, dass das Ver-fahren funktioniert!

Intervallhalbierungsverfahren zur Berechnungeiner Nullstelle einer stetigen Funktion

Input: a ∈ R, b ∈ Rf ∈ R→ R mit sign(f(a)) 6= sign(f(b))Abbruchkriteriumε > 0.

Output: x ∈ R mit f(x) = 0 für einx ∈ [x− ε/2, x + ε/2].

while |a− b| > εc = (a + b)/2if sign(f(a)) = sign(f(c)) thena = celseb = c

return(a + b)/2 .

Um ähnlich einfache Algorithmen für die Extremwerte vonf im Intervall [a, b] ange-

Page 44: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 44

ben zu können, reicht Stetigkeit noch nicht aus:f muss zusätzlich noch differenzierbarsein, die Eigenschaft um die’s im nächsten Kapitel geht. Istf nicht nur stetig sondernsogar differenzierbar, kann man außerdem schnellere Verfahren zur Nullstellenberech-nung angeben als das Intervallhalbierungsverfahren. Das Beste kommt also erst noch...

Page 45: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 45

���������

��� ����

���������

���������

�! "�#

Abbildung 3.1: Sekante vonf(x) zwischenx0 undx1.

3 Differentialrechnung

In der Differentialrechnung geht es im Wesentlichen darum auszurechnen, wie steileine Funktion in einem bestimmten Punkt steigt oder fällt. Diese Information ist fürzahllose Ingenieursprobleme relevant. Als Beispiel sei die Extremwertberechung ge-nannt, mit der man Optimierungsaufgaben lösen kann, die in der Praxis eine zentra-le Rolle spielen. Eine andere Anwendung ist die Vereinfachung einer kompliziertenFunktion, indem man sie durch eine Gerade oder ein Polynom mit niedrigem Gradapproximiert. Viele Probleme werden erst nach einer solchen Vereinfachung praktischhandhabbar. Dieses Prinzip kommt z.B. beim Newton Verfahren zur Lösung nichtli-nearer Gleichungssysteme zum Einsatz.

3.1 Differenzierbarkeit und Ableitung

Die Sekante einer Funktionf(x) zwischenx0 undx1 ist die Gerade, welche die Punkte(x0, f(x0)

)und

(x1, f(x1)

)verbindet. Die Steigung dieser Gerade heißt Sekantenstei-

gung, siehe Bild 3.1.

Definition 3.1 (Sekantensteigung)Die mittlere Steigung (oder Sekantensteigung) einer Funktion f ∈ D → Rin einem Intervall [x0, x1] ⊆ D ist definiert als

m =f(x1)− f(x0)

x1 − x0.

Oft interessiert weniger die mittlere Steigung vonf in einem Intervall als viel mehr dieSteigung vonf in exakt einem Punkt. Diese Steigung nennt man Tangentensteigung

Page 46: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 46

��������

����� ����

��������

Abbildung 3.2: Übergang von der Sekante zwischenx undx + h zur Tangente beix.

von f . Es scheint naheliegend, die Tangentensteigung vonf im Punktx0 dadurch zubestimmen, dass man die Sekantensteigung vonf im Intervall [x0, x1] berechnet, wo-bei manx1 sehr nah beix0 wählt. Die Tangentensteigung im Punktx0 lässt sich alsodurch den Grenzwert

limx1→x0

f(x1)− f(x0)x1 − x0

definieren. Um das ganze etwas leichter lesbar zu machen, führt man eine Neue Varia-ble

h = x1 − x0

ein und ersetztx1 durchx1 = x0 + h.

Schreibt man nun nochx stattx0, erhält man die folgende Definition der Tangenten-steigung, siehe Bild 3.2.

Definition 3.2 (Tangentensteigung)Die Tangentensteigung einer Funktion f ∈ D → R an der Stelle x ist defi-niert als

f ′(x) = limh→0

f(x + h)− f(x)h

falls der Grenzwert existiert und undefiniert sonst.

Anschaulich bedeutet eine positive Tangentensteigung an der Stellex, dass die Funk-tion f im Punkt x steigt. Eine negative Tangentensteigung bedeutet, dassf fällt undwenn die Tangentensteigung Null ist, dann istf im Punkt x eben. Wennf also ein

Page 47: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 47

�� ��

�������� ���������� ����������������� �"!$#���!%� &"'�(�&

)+*�,%- ."/10�.32�/�4 45 ,%- 07698+*�:�,%;=<>,�:�*

?�@�A%B�CD�E�C3F�D1G�GH9I @�J�A%K=L>A�J�@

MN OP

Abbildung 3.3: Geometrische Bedeutung der Tangentensteigung.

lokales Extremum beix hat, dann ist die Tangentensteigung beix gleich Null. Ande-rerseits kann es aber durchaus sein, dass die Tangentensteigung beix gleich Null istohne dassf dort ein lokales Extremum hätte, siehe Bild 3.3.

Die Frage ist nun, unter welchen Bedingungen man von der Tangentensteigungvonf in einem Punktx sprechen kann, d.h. wann der Grenzwert

limh→0

f(x + h)− f(x)h

existiert. Für ein festesx betrachtet man hierzu die Funktiong ∈ D \ {0} → R,

g(h) =f(x + h)− f(x)

h,

die ja nichts anderes ist als die Sekantensteigung vonf im Intervall [x, x+h]. Es stelltsich also die Frage wanng einen Grenzwert an der Stelleh = 0 hat. Beim Grenzüber-gangh→ 0 wird der Nenner des Bruchs

f(x + h)− f(x)h

Null. Damit überhaupt eine reelle Zahl rauskommen kann, muss daher auch der ZählerNull werden, d.h. es muss gelten

limh→0

f(x + h)− f(x) = 0

Page 48: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 48

bzw.limh→0

f(x + h) = f(x).

Dies kann man äquivalent schreiben durch

limx→x

f(x) = f(x),

was nichts anderes bedeutet, als dassf an der Stellex stetig ist.

• Eine notwendigeVoraussetzung dafür dassf differenzierbar beix ist, ist alsodassf stetig ist beix.

• Stetigkeit vonf an der Stellex ist aber noch nichthinreichend, wie folgendesBeispiel zeigt:

Beispiel 3.3 Seif(x) = |x| undx = 0. Dann istf stetig beix und

g(h) =f(x + h)− f(x)

h

=|0 + h| − |0|

h

=|h|h

={

sign(h) falls h 6= 0undefiniert fallsh = 0.

Offensichtlich hatg(h) keinen Grenzwert an der Stelleh = 0, dag(h) dort einenSprung hat.�

Beispiel 3.4 Ein Beispiel wo der Grenzwert existiert istf(x) = x2 und x = 5.Hier ist

g(h) =f(x + h)− f(x)

h

=(5 + h)2 − 52

h

=25 + 10h + h2 − 25

h

=10h + h2

h= 10 + h.

Damit giltlimh→0

g(h) = 10. �

Page 49: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 49

Beispiel 3.5 Seif(x) = 1/x undx 6= 0. Dann ist

g(h) =f(x + h)− f(x)

h

=1/(x + h)− 1/x

h

=x− (x + h)hx(x + h)

=−h

hx(x + h)

= − 1x2 + xh

und damit

limh→0

g(h) = − 1x2

. �

Beispiel 3.6 Zum Schluss noch ein ganz einfaches Beispiel — die konstante Funk-tion f(x) = k für eink ∈ R. Für beliebigesx gilt hier

g(h) =f(x + h)− f(x)

h

=k − k

h

=0h

= 0

und somit ganz unabhängig vonk oderx

limh→0

g(h) = 0. �

Es gibt also Funktionenf und Punktex, für die der Grenzwert

limh→0

g(h)

existiert, und wiederum andere, wo er nicht existiert. Im ersten Fall sagt man dassfdifferenzierbar an der Stellex ist.

Definition 3.7 (Differenzierbarkeit)Eine Funktion f ∈ D → R heißt differenzierbar an der Stelle x wenn dieFunktion

g(h) =f(x + h)− f(x)

h

einen Grenzwert an der Stelle h = 0 hat.f heißt differenzierbar, wenn f differenzierbar an jeder Stelle x ∈ D ist.

Page 50: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 50

��

��

��

� ��������������� ������� ��!���"#��$�%'&(*),+ � -�.�/103254�6 2�0

�� �� ������� ������������� �����������������

Abbildung 3.4: Nur die Funktion im Bild links oben ist differenzierbar an der Stellex.Alle anderen sind an der Stellex nicht stetig und folglich auch nicht differenzierbar.

�� �� �������� �������������������������� "!$#�%'&

Abbildung 3.5: Beispiele von Funktionen, die an der Stellex zwar stetig sind aber nichtdifferenzierbar.

Page 51: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 51

������������� ��� ����������� ����

���� �������� �� !

"�#$�%�& '($ #)�*+$�,.-/

021�1�354�6�7�8�9:�;<7�3 7>=@?BA(CEDFHG =

Abbildung 3.6: Einteilung der Menge der Funktionen nach Differenzierbarkeit, Stetig-keit und Existenz eines Grenzwerts.

Beispiel 3.8 Die Funktionf(x) = |x| in Beispiel 3.3 ist nicht differenzierbar an derStellex = 0. Andererseits ist die Funktionf(x) = x2 in Beispiel 3.4 differen-zierbar für allex und die Funktionf(x) = 1/x in Beispiel 3.5 ist differenzierbarfür alle x 6= 0. �

Zusammenfassend gilt also dass die Existenz eines Grenzwerts an der Stellex einenotwendige Voraussetzung für Stetigkeit an der Stellex ist und Stetigkeit an der Stellex wiederum eine notwendige Voraussetzung für Differenzierbarkeit an der Stellex,siehe Bild 3.6.

Definition 3.9 (Ableitung)Ist f ∈ D → R differenzierbar an der Stelle x, dann heißt der Grenzwert

f ′(x) = limh→0

f(x + h)− f(x)h

Ableitung von f an der Stelle x.

Beispiel 3.10

• In Beispiel 3.4 ist die Ableitung vonf(x) = x2 an der Stellex = 5 gleich10.

• In Beispiel 3.5 ist die Ableitung vonf(x) = 1/x an der Stellex 6= 0 gleich−1/x2.

• In Beispiel 3.6 ist die Ableitung vonf(x) = k an der Stellex gleich0. �

Definition 3.11 (Ableitungsfunktion)Sei f ∈ D → R eine differenzierbare Funktion. Die Funktion f ′ ∈ D →R, die jedem x ∈ D die Ableitung von f an der Stelle x zuordnet, heißtAbleitungsfunktion (oder kurz Ableitung) von f .

Page 52: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 52

Beispiel 3.12 Die Ableitungsfunktion der Funktionf ∈ R→ R

f(x) = x2

lässt sich wie folgt berechnen:

f ′(x) = limh→0

f(x + h)− f(x)h

= limh→0

(x + h)2 − x2

h

= limh→0

x2 + 2xh + h2 − x2

h

= limh→0

2xh + h2

h= lim

h→02x + h

= 2x

Da der Grenzwert für allex ∈ R existiert, istf(x) differenzierbar. Stattx kannman nun wie üblich wieder einfachx schreiben und erhält die Ableitungsfunkti-on

f ′(x) = 2x. �

Beispiel 3.13 Wie in Beispiel 3.3 gezeigt, ist die Betragsfunktion nicht differenzier-bar beix = 0. Nimmt man diesen Punkt aus, so lässt sich die Ableitungsfunktionvon

f ∈ R \ {0} → R, f(x) = |x|

wie folgt für x 6= 0 berechnen:

f ′(x) = limh→0

f(x + h)− f(x)h

= limh→0

|x + h| − |x|h

={

limh→0((x + h)− x)/h falls x > 0limh→0(−(x + h) + x)/h falls x < 0

={

limh→0 h/h falls x > 0limh→0−h/h falls x < 0

={

1 falls x > 0−1 falls x < 0

= sign(x).

Damit erhält man

f ′ ∈ R \ {0} → R, f ′(x) = sign(x). �

Page 53: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 53

Beispiel 3.14 Wie in Beispiel 3.5 gezeigt, ist die Ableitung von

f ∈ R \ {0} → R, f(x) = 1/x

die Funktionf ′ ∈ R \ {0} → R, f ′(x) = −1/x2. �

Beispiel 3.15 Wie in Beispiel 3.6 gezeigt, ist die Ableitung von

f ∈ R→ R, f(x) = k

die Funktionf ′ ∈ R→ R, f ′(x) = 0. �

Merkregel 3.16Die Ableitungsfunktion f ′ einer differenzierbaren Funktion f liefert zu je-dem x die Tangentensteigung von f an der Stelle x.

Page 54: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 54

3.2 Berechnung der Ableitung

Ähnlich wie im vorigen Kapitel die Ableitung der Funktionenx2, 1/x, |x| berechnetwurden, lässt sich dies auch für andere elementare Funktionen durchführen. Nachfol-gend eine kurze Zusammenstellung. Zu beachten ist dass der Definitionsbereich ent-sprechend gewählt werden muss.

Theorem 3.17 (Ableitung elementarer Funktionen)

f(x) = k f ′(x) = 0

f(x) = xa f ′(x) = axa−1, a ∈ Rf(x) = sin(x) f ′(x) = cos(x)f(x) = cos(x) f ′(x) = − sin(x)

f(x) = tan(x) f ′(x) = 1 + tan(x)2

f(x) = ex f ′(x) = ex

f(x) = ln(x) f ′(x) = 1/x

f(x) = arcsin(x) f ′(x) =1√

1− x2

f(x) = arccos(x) f ′(x) = − 1√1− x2

f(x) = arctan(x) f ′(x) =1

1 + x2

Die Ableitung komplizierterer Funktionen lässt sich mit Hilfe von nachfolgendemTheorem berechnen.

Theorem 3.18 (Summen-, Produkt-, Quotientenregel)Seien f, g ∈ D → R differenzierbar und c ∈ R. Dann gilt(

cf(x))′

= cf ′(x)(f(x) + g(x)

)′= f ′(x) + g′(x)(

f(x)g(x))′

= f ′(x)g(x) + f(x)g′(x)(f(x)g(x)

)′=

f ′(x)g(x)− f(x)g′(x)g(x)2

Beweis. Fürh→ 0 gilt

f ′(x) =f(x + h)− f(x)

h

Page 55: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 55

und folglichf(x + h) = f(x) + f ′(x)h.

Damit rechnet man wie folgt:(cf(x)

)′= lim

h→0

cf(x + h)− cf(x)h

= c limh→0

f(x + h)− f(x)h

= cf ′(x)(f(x) + g(x)

)′= lim

h→0

(f(x + h) + g(x + h))− (f(x) + g(x))h

= limh→0

f(x + h)− f(x) + g(x + h)− g(x)h

= limh→0

f(x + h)− f(x)h

+ limh→0

g(x + h)− g(x)h

= f ′(x) + g′(x)(f(x)g(x)

)′= lim

h→0

f(x + h)g(x + h)− f(x)g(x)h

= limh→0

(f(x) + f ′(x)h)(g(x) + g′(x)h)− f(x)g(x)h

= limh→0

f ′(x)g(x)h + f(x)g′(x)h + f ′(x)g′(x)h2

h

= limh→0

f ′(x)g(x) + f(x)g′(x) + f ′(x)g′(x)h

= f ′(x)g(x) + f(x)g′(x)(f(x)g(x)

)′= lim

h→0

1h

(f(x + h)g(x + h)

− f(x)g(x)

)= lim

h→0

f(x + h)g(x)− g(x + h)f(x)hg(x + h)g(x)

= limh→0

(f(x) + f ′(x)h)g(x)− (g(x) + g′(x)h)f(x)h(g(x) + g′(x)h)g(x)

= limh→0

f ′(x)g(x)− g′(x)f(x)(g(x)2 + hg′(x)g(x)

=f ′(x)g(x)− g′(x)f(x)

g(x)2

Beispiel 3.19 Unter Verwendung von Theorem 3.18 lässt sich die Ableitung der

Page 56: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 56

Tangens Funktion wie folgt berechnen:

tan(x)′ =(

sin(x)cos(x)

)′=

cos(x) cos(x) + sin(x) sin(x)cos(x)2

=1

cos(x)2. �

Man liest oft, dass die Ableitung eine lineare Operation sei. Dies ist wie folgt zuverstehen: Sei∆ die Funktion, die jeder aufD ⊆ R differenzierbaren Funktion ihreAbleitung zuordnet. Dann ist nach Theorem 3.18

∆(cf) = c∆(f)∆(f + g) = ∆(f) + ∆(g).

Dies sind jedoch nichts anderes als die beiden Linearitätsbedingungen für die Funktion∆.

Mit Hilfe von Theorem 3.18 kann man Summen, Produkte und Quotienten vonFunktionen ableiten. Um die Komposition zweier Funktionen ableiten zu können, brauchtman aber noch ein weiteres Theorem, die sog. Kettenregel.

Theorem 3.20 (Kettenregel)Seien f, g differenzierbare Funktionen. Dann gilt(

f(g(x)

))′= g′(x) f ′(g(x)).

Beweis. (f(g(x)

))= lim

h→0

f(g(x + h)− f(g(x)

)h

= limh→0

f(g(x) + g′(x)h

)− f

(g(x)

)h

= limh→0

f(g(x)

)+ f ′

(g(x)

)g′(x)h− f

(g(x)

)h

= f ′(g(x)

)g′(x)

Merkregel 3.21Bei zusammengesetzten Funktionen f(g(x)) nennt man g auch innere Funk-tion und f äußere Funktion. Die Kettenregel merkt man sich daher einfachals “innere Ableitung mal äußere Ableitung”.

Page 57: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 57

Beispiel 3.22 Gegeben sei die Funktionsin(3x + 2). Dies ist eine zusammenge-setzte Funktion bestehend aus

f(x) = sin(x)g(x) = 3x + 2

f(g(x)) = sin(3x + 2).

Zunächst berechnet man die Ableitung der inneren Funktiong und der äußerenFunktionf .

f ′(x) = cos(x)g′(x) = 3.

Mitf ′(g(x)) = cos(3x + 2)

erhält man somit nach Theorem 3.20(sin(3x + 2)

)′ = g′(x) f ′(g(x))= 3 cos(3x + 2). �

Beispiel 3.23 Gegeben sei die Funktionsin(x)2. Hier sind die Teilfunktionen

f(x) = x2

g(x) = sin(x)f(g(x)) = sin(x)2.

Die Ableitung vonf undg ergibt

f ′(x) = 2x

g′(x) = cos(x).

Mitf ′(g(x)) = 2 sin(x)

erhält man nach Theorem 3.20 also(sin(x)2

)′ = cos(x) 2 sin(x)= 2 sin(x) cos(x). �

Page 58: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 58

3.3 Linearisierung und Newton Verfahren

Die meisten Funktionen, die in der Natur vorkommen sind nichtlinear. Der Umgang mitnichtlinearen Funktionen ist aber viel schwieriger als mit linearen. So ist z.B. das Pro-blem der Nullstellensuche für affin lineare Funktionen trivial, für nichtlineare jedochextrem schwierig. Es ist im Allgemeinen schon extrem aufwändig von einer nichtlinea-ren Funktion zu entscheiden ob sie überhaupt eine Nullstelle hat.Der große Trick beim Umgang mit einer nichtlinearen Funktion ist, sie durch eineGerade möglichst gut zu approximieren und dann mit der Geraden zu arbeiten. Mei-stens interessiert man sich für eine Funktion sowieso nur in der Nähe eines bestimmtenPunktes, und so sucht man eine affin lineare Funktion, die die nichtlineare Funktionin der Nähe dieses Punktes besonders gut approximiert. Diese affin lineare Funktionist natürlich nichts anderes als die Tangente. Das Ersetzen einer nichtlinearen Funk-tion durch ihre Tangente in einem bestimmten Punkt nennt man auch Linearisierung.Durch Linearisierung wird also ein schwieriges Problem vereinfacht – der Preis dafürsind Approximationsfehler aber die kann man oft in Kauf nehmen, abschätzen odersogar beheben.

Theorem 3.24 (Tangentengleichung)Sei f differenzierbar im Punkt x. Dann ist die Tangente `(x) an f(x) im

Punkt x gegeben durch

`(x) = f(x) + f ′(x)(x− x).

Beweis. Um die Gleichung der Tangente`(x) anf(x) im Punktx zu berechnen stelltman zunächst die Bedingungen auf, die`(x) erfüllen muss:

• `(x) ist eine affin lineare Funktion mit Steigungf ′(x), d.h.

`′(x) = f ′(x).

• `(x) berührtf(x) im Punktx, d.h.

`(x) = f(x).

Die allgemeine Geradengleichung ist

`(x) = ax + b.

Zu berechnen sind also die Parametera und b, welche durch die beiden obengenannten Bedingungen bestimmt sind. Aus`′(x) = a für allex und der Bedin-gung`′(x) = f ′(x) erhält man

a = f ′(x).

Aus `(x) = f(x) und`(x) = ax + b erhält man

ax + b = f(x)b = f(x)− ax

= f(x)− f ′(x)x.

Page 59: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 59

Zusammengefaßt also

`(x) = ax + b

= f ′(x)x + f(x)− f ′(x)x= f(x) + f ′(x)(x− x). �

Die Tangente(x) anf(x) im Punktx wird auch Linearisierung vonf(x) im Punktxgenannt.

Beispiel 3.25 Die Linearisierung vonf(x) = sin(x) bei x = 0 ist

`(x) = f(x) + f ′(x)(x− x)= sin(x) + cos(x)(x− x)= sin(0) + cos(0)(x− 0)= x.

In Bild 3.7 sieht man, dass die affin lineare Funktion`(x) = x und die Sinus-funktion in der Nähe vonx = 0 recht gut übereinstimmen.�

Beispiel 3.26 Die Linearisierung vonf(x) = ln(x) bei x = 1 ist

`(x) = f(x) + f ′(x)(x− x)

= ln(x) +1x

(x− x)

= ln(1) + x− 1= x− 1.

In Bild 3.8 sieht man, dass die affin lineare Funktion`(x) = x − 1 und dieLogarithmusfunktion in der Nähe vonx = 1 recht gut übereinstimmen.�

Beispiel 3.27 Die Linearisierung vonf(x) = x2 bei x = 1 ist

`(x) = f(x) + f ′(x)(x− x)= x2 + 2x(x− x)= 1 + 2(x− 1)= 2x− 1.

In Bild 3.9 sieht man, dass die lineare Funktion`(x) = 2x− 1 und die Funktionf(x) = x2 in der Nähe vonx = 1 recht gut übereinstimmen.�

Linearisierung ist auch die Grundlage des Newton Verfahrens zur Berechnung der Null-stelle einer nichtlinearen Funktionf : Man beginnt mit einer Näherungx der Nullstellevon f und linearisiertf im Punktx. Als nächstes berechnet man die Nullstellex1 derso erhaltenen linearen Funktion`. Da ` eine Approximation anf ist, ist auch zu er-warten, dassx1 eine gute Näherung an die Nullstelle vonf ist. Nun wird f wieder

Page 60: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 60

���������

� �������������������

Abbildung 3.7: Linearisierung vonf(x) = sin(x) bei x = 0.

0.5 1 1.5 2

1

-1

����������� �

�������������������

Abbildung 3.8: Linearisierung vonf(x) = ln(x) bei x = 1.

�����������

� �

�����������������

Abbildung 3.9: Linearisierung vonf(x) = x2 bei x = 1.

Page 61: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 61

���������

����

���������

��� ��� ���

Abbildung 3.10: Newton Verfahren.

linearisiert, diesmal aber beix1, die Nullstelle dieser Linearisierung berechnet, usw.siehe Bild 3.10.Die Iterationsvorschrift für das Newton Verfahren wird nun wie folgt hergeleitet: Ge-mäß Theorem 3.24 ist die Linearisierung vonf im Punktx gegeben durch

`1(x) = f(x) + f ′(x)(x− x)

Wenn nicht gerade unglücklicherweisef ′(x) = 0 ist, hat diese Gerade eine Nullstellex1:

`1(x1) = f(x) + f ′(x)(x1 − x)= 0

x1 = x− f(x)f ′(x)

.

Die Linearisierung vonf im Punktx1 ist

`2(x) = f(x1) + f ′(x1)(x− x1)

mit der Nullstelle

x2 = x1 −f(x1)f ′(x1)

.

Allgemein kann man somit dien+1-te Näherungxn+1 an die Nullstelle vonf aus dern-ten Näherungxn berechnen. Die Vorgehensweise zu Linearisieren und die Nullstelleder Tangente zu berechnen, heißt Newton Verfahren.

Page 62: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 62

Definition 3.28Das Newton Verfahren mit Startwert x ist die Berechnung der Folge

x1 = x

xn+1 = xn −f(xn)f ′(xn)

, n = 1, 2, . . .

Das erste Glied x1 dieser Folge heißt Startwert des Newton Verfahrens.

Das Newton Verfahren liefert also eine Folge reeller Zahlenxn und die Frage ist, obdiese Folge tatsächlich gegen eine Nullstelle vonf konvergiert. Die Antwort ist allesandere als trivial. Grob gesagt gilt, dass wenn der Startwertx hinreichend nahe beider Nullstelle vonf liegt, die Folgexn tatsächlich gegen die Nullstelle konvergiert.Es gibt exakt formulierte Bedingungen für die Konvergenz des Newton Verfahrens,die in der Praxis aber schwer nachprüfbar sind. Ein eleganter Ausweg bietet hier dieIntervallarithmetik, die jedoch den Rahmen dieser Vorlesung sprengen würde.

Beispiel 3.29 Gesucht ist die Nullstelle der Funktion

f(x) = x3 + x− 1.

Als Startnäherung ist der Wertx = 1 gegeben. Zunächst berechnet man dieAbleitung

f ′(x) = 3x2 + 1.

Mit dem Newton Verfahren erhält man

x1 = x− f(x)f ′(x)

= 1− 14

= 0.75

x2 = x1 −f(x1)f ′(x1)

= 0.75− 0.1722.689

= 0.686

x3 = x2 −f(x2)f ′(x2)

= 0.686− 0.008832.412

= 0.682

...

Man sieht, dass sich die Folgexn immer mehr der tatsächlichen Nullstelle0.682328 . . .nähert.�

Beispiel 3.30 Das Newton Verfahren klappt offensichtlich dann nicht, wennf ′(xn) =0 für einn ist, da man dann eine Division durch Null kriegt. Abgesehen von die-sem Spezialfall gibt’s aber noch viele andere Beispiele, wo die Folgexn nichtgegen eine Nullstelle vonf konvergiert. Nehmen wir z.B. die Funktion

f(x) = arctan(x),

die eine Nullstelle beix = 0 hat. Beginnt man aber das Newton Verfahren mitdem Startwertx = 2, so erhält man eine unbestimmt divergente Folge, siehe

Page 63: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 63

�� ������

���� ��

���������

��������

������

Abbildung 3.11: Newton Verfahren divergiert, siehe Beispiel 3.30.

Bild 3.11. Zunächst die Ableitung derarctan Funktion:

f ′(x) =1

1 + x2.

Damit ist

x1 = x− f(x)f ′(x)

= 2− 1.1070.2

= −3.536

x2 = x1 −f(x1)f ′(x1)

= −3.536− −1.2960.0741

= 13.951

x3 = x2 −f(x2)f ′(x2)

= 13.951− 1.4990.00511

= −279.344

...

Beispiel 3.31 Im vorigen Beispiel sind diexn immer weiter von der Nullstelleweggelaufen. Was auch passieren kann, ist dass man in einen Zyklus läuft, d.h.dass sich die Werte ständig wiederholen. Sei

f(x) = −x4 + 3x2 + 2

und x = 1. Diese Funktion hat zwei reelle Nullstellen bei±1.8872. Um dasNewton Verfahren anzuwenden, berechnet man zunächst die Ableitung

f ′(x) = −4x3 + 6x.

Page 64: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 64

��������� � �����

�������

���������

Abbildung 3.12: Newton Verfahren läuft in einen Zyklus, siehe Beispiel 3.31.

Hieraus ergeben sich die Werte

x1 = x− f(x)f ′(x)

= 1− 42

= −1

x2 = x1 −f(x1)f ′(x1)

= −1− 4−2

= 1 = x.

Damit istx3 = −1, x4 = 1, usw., d.h. die Folgexn divergiert, siehe Bild 3.12.�

Beispiel 3.32 Hätte man im vorigen Beispiel stattx = 1 den Startwertx = 0.6 ge-nommen, wäre man asymptotisch ebenfalls in einen Zyklus gelaufen. Die erstenGlieder der Folge sind

x = 0.6 x1 = −0.478x2 = 0.605 x3 = −0.475x4 = 0.609 x5 = −0.473x6 = 0.613 x7 = −0.470

......

x2n ≈ 0.633 x2n+1 ≈ −0.460

Es gibt auch Beispiele von Funktionen, wo man in Zyklen der Länge 3 oder jederbeliebigen anderen Länge läuft. Man erhält in diesen Fällen immer unbestimmtdivergente Folgenxn. �

Beispiel 3.33 Hätte man im vorigen Beispiel den Startwertx = 2 genommen, wäre

Page 65: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 65

die Folgexn sehr schnell gegen die Nullstelle1.8872 konvergiert:

x = 2.0x1 = 1.9x2 = 1.8874x3 = 1.8872

...

Abgesehen von der Konvergenz ist ein weiteres Problem beim Newton Verfahren dasAbbruchkriterium. Wie lang muss man Iterieren um bis auf einen vorgegebenen Fehlerε genau bei der Nullstellex von f zu liegen? Genauer gesagt, wie groß mussn sein,damit

|xn − x| < ε?

Auch für diese Frage gibt es Kriterien, die in der Praxis aber schwierig auszuwertensind. Oft wählt man daher als Abbruchkriterium

|f(xn)| < ε,

was aber natürlich nichts darüber aussagt wie nahexn an der Nullstellex von f ist.Wie beim Konvergenzproblem bietet auch hier die Intervallarithmetik eine Lösung.Abschließend noch ein Vergleich zwischen dem Newton Verfahren und der früher vor-gestellten Intervallhalbierung:

• Für das Newton Verfahren mussf differenzierbar sein, für die Intervallhalbie-rung genügt Stetigkeit.

• Startbedingung: Die Intervallhalbierung benötigt zwei Startwertea, b so dasssign(f(a)) 6= sign(f(b)). Für das Newton Verfahren genügt ein Startwert.

• Die Intervallhalbierung konvergiert immer, das Newton Verfahren nicht.

• Die Intervallhalbierung ist im Allgemeinen langsamer als das Newton Verfahren.Vor allem wenn man bereits nahe an der Nullstelle ist, konvergiert das NewtonVerfahren sehr schnell. Da man in Ingenieursproblemen oft bereits eine guteNäherungslösung kennt, ist das Newton Verfahren von größerer praktischer Re-levanz als die Intervallhalbierung.

Sowohl Intervallhalbierung als auch Newton Verfahren finden nureineNullstelle vonf . Es kann aber durchaus sein, dassf mehrere Nullstellen hat. Ein wesentlich schwie-rigeres Problem ist also,alle Nullstellen vonf zu finden. Auch dieses Problem kannmit Intervallarithmetik gelöst werden.

Page 66: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 66

3.4 Differentialnotation

Die Ableitung vonf an der Stellex wurde definiert durch den Grenzwert

f ′(x) = limh→0

f(x + h)− f(x)h

.

Salop ausgedrückt kann man auch sagen, dass für unendlich kleinesh gilt

f ′(x) =f(x + h)− f(x)

h.

Eine unendlich kleine Zahl ist natürlich keine reelle Zahl! Diese neuen Zahlen wer-den Differentiale genannt und durch ein vorangestelltesd gekennzeichnet. Rechnenmit Differentialen wird auch Infinitessimalrechnung genannt. Dah ursprünglich einIntervall auf derx-Achse bezeichnet hat, schreibt man statth normalerweisedx, d.h.

f ′(x) =f(x + dx)− f(x)

dx.

Wennf an der Stellex stetig ist, dann ist Der Wert

f(x + dx)− f(x)

natürlich ebenfalls unendlich klein und wird mitdf(x) bezeichnet. Damit hat man

f ′(x) =df(x)dx

.

Notation 3.34Die Ableitung wird unter Verwendung der Differentialschreibweise auch oftmit

f ′(x) =df(x)dx

oder

f ′(x) =d

dxf(x)

bezeichnet.

Page 67: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 67

3.5 Höhere Ableitungen

Ist die Ableitungf ′(x) einer differenzierbaren Funktionf(x) wieder differenzierbar,so kann man diese ein zweites Mal ableiten. Man erhält dadurch die zweite Ableitungf ′′(x). Wiederholt man diesen Prozeßn mal, erhält man dien-te Ableitungf (n)(x)vonf(x). Existiert einen-te Ableitung, sagt man auchf(x) ist n mal differenzierbar.

Notation 3.35Die n-te Ableitung von f(x) wird mit f (n)(x) bezeichnet.

Beispiel 3.36 Seif(x) = sin(x). Dann ist

f ′(x) = cos(x)f ′′(x) = − sin(x)f ′′′(x) = − cos(x)f ′′′′(x) = sin(x)

...

f (n)(x) = f (n mod 4)(x). �

Beispiel 3.37 Seif(x) = xn. Dann ist

f ′(x) = nxn−1

f ′′(x) = n(n− 1)xn−2

f ′′′(x) = n(n− 1)(n− 2)xn−3

...

f (n)(x) = n!x0 = n!f (n+1)(x) = 0f (n+2)(x) = 0

... �

Beispiel 3.38 Seif(x) = x−1. Dann ist

f ′(x) = −x−2

f ′′(x) = 2x−3

f ′′′(x) = −6x−4

f ′′′′(x) = 24x−5

...

f (n)(x) = (−1)n n!xn+1

Page 68: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 68

3.5.1 Extremwertberechnung

Wennf(x) bei x einen lokalen Extremwert hat, dann istf ′(x) = 0.

Beispiel 3.39 Die Funktionf(x) = x2 + 2x

hat ein Minimum beix = −1. Folglich ist

f ′(x) = 2x + 2

an der Stellex = −1 gleich0. �

Andersherum kann man jedoch nicht argumentieren: Es ist durchaus möglich, dassf ′(x) = 0 aberf(x) keinen lokalen Extremwert beix hat.

Beispiel 3.40 Sei

f(x) = x3

f ′(x) = 3x2

undx = 0. Dann istf ′(x) = 0 aberf hat keinen Extremwert fürx = 0. �

Ist jedoch zusätzlich zuf ′(x) = 0 auchf ′′(x) 6= 0 erfüllt, dann kann man schließendassf ein lokales Extremum beix hat. Genauer gesagt, hatf ein lokales Maximumbei x wennf ′′(x) < 0 und ein lokales Minimum wennf ′′(x) > 0. Ist f ′′(x) = 0,kann man keine Aussage treffen.

Beispiel 3.41 In Beispiel 3.39 ist

f ′′(x) = 2,

d.h.f ′′(x) > 0 und daher hatf ein lokales Minimum beix. �

Beispiel 3.42 In Beispiel 3.40 ist

f ′′(x) = 6x,

d.h.f ′′(x) = 0. Aus diesen Ergebnissen kann man noch nicht schließen obf beix einen Extremwert hat oder nicht. Es wird oft fälschlicherweise behauptet, dassf ′′(x) = 0 bedeutet, dassf einen Wendepunkt beix hat. Dies trifft in diesemBeispiel zu, im nächsten jedoch nicht.�

Beispiel 3.43 Sei

f(x) = x4

f ′(x) = 4x3

f ′′(x) = 12x2

und x = 0. Offensichtlich istf ′(x) = 0 undf ′′(x) = 0. Trotzdem hatf an derStellex ein lokales Minimum! ed

Page 69: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 69

Merkregel 3.44

• Ist f ′(x) = 0 und f ′′(x) > 0 dann hat f bei x ein lokales Minimum.

• Ist f ′(x) = 0 und f ′′(x) < 0 dann hat f bei x ein lokales Maximum.

• Ist f ′(x) = 0 und f ′′(x) = 0 dann kann f bei x ein lokales Maximum,ein lokales Minimum oder keins von beidem haben.

• Ist f ′(x) 6= 0 dann hat f kein lokales Extremum bei x.

3.5.2 Taylor Polynome

In Kapitel 3.3 wurde gezeigt, wie man eine Funktion in der Nähe eines Punktes linea-risieren, d.h. durch ihre Tangente approximieren kann. Die Tangente ist eine Funktionder Form

`(x) = ax + b

und somit ein Polynom vom Grad 1. Manchmal ist die Linearisierung eine zu grobeApproximation und es stellt sich die Frage ob man die Funktion in der Nähe vonxnicht genauer approximieren kann, indem man Polynome höheren Grades verwendet.Im Vergleich zu allgemeinen Funktionen bilden Polynome eine Klasse von Funktio-nen, die noch relativ einfach handhabbar ist. So ist z.B. die Berechnung der Nullstel-len oder Extremwerte von Polynomen viel einfacher als von allgemeinen nichtlinearenFunktionen. Indem man also eine Funktion durch ein Polynom approximiert, kann mandas zugrundeliegende Problem oft erheblich vereinfachen bzw. einer Lösung überhaupterst zugänglich machen. Weiterhin kann man durch die Wahl des Grades des Polynomssteuern wie genau die Approximation in der Nähe vonx sein soll.

Gesucht ist also ein Polynomp(x) vom Gradn, das sich einer gegebenen Funktionf(x) in der Nähe eines Punktesx möglichst gut annähert. Um dieses Polynom zubestimmen muss man natürlich exakt festlegen, was mit einer “guten Annäherung”gemeint ist. Im Spezialfall der Linearisierung wurde gefordert

p(x) = f(x)p′(x) = f ′(x),

d.h. Funktionswert und erste Ableitung sollten am Punktx übereinstimmen. Durchdiese beiden Bedingungen konnten die Parametera0 und a1 der Linearisierung, d.h.des Polynoms ersten Grades

p(x) = a0 + a1x

berechnet werden. Ein Polynomn-ten Grades

p(x) = a0 + a1x + a2x2 + . . . + anxn

hatn + 1 Parametera0, a1, a2, . . . , an zu deren Berechnung mann + 1 Bedingungenaufstellen muss. In direkter Verallgemeinerung zur Vorgehensweise bei der Berech-nung der Linearisierung wird gefordert, dass Funktionswert und alle Ableitungen biszurn-ten Ableitung an der Stellex übereinstimmen.

Page 70: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 70

Definition 3.45Sei f(x) an der Stelle x n mal differenzierbar. Das Taylor Polynom p(x)vom Grad n der Funktion f(x) zum Entwicklungspunkt x ist das Polynomn-ten Grades, welches die Bedingungen

p(x) = f(x)p′(x) = f ′(x)p′′(x) = f ′′(x)

...p(n)(x) = f (n)(x)

erfüllt.

Beispiel 3.46 Zu berechnen ist das Taylor Polynom vom Grad 3 der Funktionf(x) = ln(x) zum Entwicklungspunktx = 2. Die allgemeine Gleichung ei-nes Polynoms vom Grad 3 ist

p(x) = a0 + a1x + a2x2 + a3x

3.

Zu berechnen sind also die vier Koeffizientena0, a1, a2 unda3 anhand der vierBedingungen

p(2) = f(2)p′(2) = f ′(2)p′′(2) = f ′′(2)p′′′(2) = f ′′′(2).

Zunächst werden die Ableitungen berechnet:

p(x) = a3x3 + a2x

2 + a1x + a0 f(x) = ln(x)

p′(x) = 3a3x2 + 2a2x + a1 f ′(x) = 1/x

p′′(x) = 6a3x + 2a2 f ′′(x) = −1/x2

p′′′(x) = 6a3 f ′′′(x) = 2/x3

Indem man fürx den Wertx = 2 einsetzt erhält man ein lineares Gleichungssy-stem mit den Unbekanntena3, a2, a1 unda0:

8a3 + 4a2 + 2a1 + a0 = ln(2)12a3 + 4a2 + a1 = 1/2

12a3 + 2a2 = −1/46a3 = 1/4.

Page 71: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 71

����������� ������

��

���

����������� �!�"$#&%(' �*)+� #-,. �/� ,0 � . # �.21 � ,

3 4 5 6 7

Abbildung 3.13: Taylor Polynom vom Grad 3 der Funktionf(x) = ln(x) zum Ent-wicklungspunktx = 2.

Die Lösung, die man z.B. mit dem Gauß Algorithmus berechnen kann, ist

a0 = −11/6 + ln(2)a1 = 3/2a2 = −3/8a3 = 1/24.

Somit ist

p(x) = −116

+ ln(2) +32x− 3

8x2 +

124

x3

das Taylor Polynom vom Grad 3 der Funktionf(x) = ln(x) zum Entwicklungs-punktx = 2. In der Tat sieht man in Bild 3.13, dass sich dieses Polynom und dieFunktionf(x) = ln(x) für x ≈ 2 sehr ähnlich sind.�

Die Berechnung des Taylor Polynoms vom Gradn läuft also auf ein lineares Glei-chungssystems mitn + 1 Unbekanntena0, a1, a2, . . . , an hinaus. Durch einen einfa-chen Trick lässt sich der Aufwand zur Lösung dieses Gleichungssystems vermeidenund man kann das Taylor Polynom sofort hinschreiben: Verschiebt man das Polynom

p(x) = a0 + a1x + a2x2 + . . . + anxn

um x nach rechts, bekommt man die Form

p(x) = a0 + a1(x− x) + a2(x− x)2 + . . . + an(x− x)n.

Natürlich erhält man hierbei andere Werte für die Koeffizientena0, a1, a2, . . . , an –diese lassen sich jedoch viel einfacher berechnen. Zur Herleitung der entsprechenden

Page 72: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 72

Formeln werden zunächst dien-ten Ableitungen vonp(x) berechnet:

p(x) = a0 + a1(x− x) + a2(x− x)2 + a3(x− x)3 + . . . + an(x− x)n

p′(x) = a1 + 2a2(x− x) + 3a3(x− x)2 + . . . + nan(x− x)n−1

p′′(x) = 2a2 + 6a3(x− x) + . . . + n(n− 1)an(x− x)n−2

p′′′(x) = 6a3 + . . . + n(n− 1)(n− 2)an(x− x)n−3

...

p(n)(x) = n!an

Wertet man diese Polynome an der Stellex aus, fallen alle Summanden außer demersten weg und man erhält die einfachen Gleichungen

p(x) = a0

p′(x) = a1

p′′(x) = 2a2

p′′′(x) = 6a3

...

p(n)(x) = n!an.

Setzt man nun die Bedingungen

p(x) = f(x)p′(x) = f ′(x)p′′(x) = f ′′(x)p′′′(x) = f ′′′(x)

...

p(n)(x) = f (n)(x)

ein und löst nach den Koeffizientenai auf, erhält man

a0 = f(x)a1 = f ′(x)

a2 =12f ′′(x)

a3 =16f ′′′(x)

...

an =1n!

f (n)(x).

Page 73: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 73

Damit ist das Taylor Polynom

p(x) = f(x) + f ′(x)(x− x) +12f ′′(x)(x− x)2

+16f ′′′(x)(x− x)3 + . . . +

1n!

f (n)(x)(x− x)n

= f(x) +n∑

i=1

f (i)(x)i!

(x− x)i.

Theorem 3.47Sei f(x) an der Stelle x n mal differenzierbar. Das Taylor Polynom p(x) vomGrad n der Funktion f(x) zum Entwicklungspunkt x lässt sich schreiben als

p(x) = f(x) +n∑

i=1

f (i)(x)i!

(x− x)i.

Beispiel 3.48 Wie in Beispiel 3.46 soll das Taylor Polynom vom Grad 3 der Funk-tion f(x) = ln(x) zum Entwicklungspunktx = 2 berechnet werden, diesmalaber unter Verwendung der gerade hergeleiteten Formel

p(x) = f(x) +n∑

i=1

f (i)(x)i!

(x− x)i.

Die Ableitungen vonf(x) an der Stellex = 2 wurden bereits berechnet:

f(2) = ln(2)f ′(2) = 1/2f ′′(2) = −1/4f ′′′(2) = 1/4.

Damit erhält man das Taylor Polynom

p(x) = ln(2) +12(x− 2)− 1

8(x− 2)2 +

124

(x− 2)3.

Multipliziert man dieses Polynom aus erhält man das selbe Ergebnis wie in Bei-spiel 3.46.

p(x) = −116

+ ln(2) +32x− 3

8x2 +

124

x3. �

Viele Taylor Polynome haben eine sehr regelmäßige Form. Hierzu ein paar Beispiele:

Page 74: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 74

� � �

���

��� ������������ �

����� ����� �"!# � #%$ !!'&�( � )

Abbildung 3.14: Taylor Polynom vom Grad 5 der Funktionf(x) = sin(x) zum Ent-wicklungspunktx = 0.

Beispiel 3.49 Das Taylor Polynom der Funktionf(x) = sin(x) zum Entwicklungs-punktx = 0 berechnet man wie folgt:

f(0) = sin(0) = 0f ′(0) = cos(0) = 1f ′′(0) = − sin(0) = 0f ′′′(0) = − cos(0) = −1f ′′′′(0) = sin(0) = 0

......

Somit ist

p(x) = 0 +11!

(x− 0)1 +02!

(x− 0)2 +−13!

(x− 0)3 +04!

(x− 0)4 + . . .

= x− 13!

x3 +15!

x5 − 17!

x7 +19!

x9 + . . .

Je höher man den Grad dieses Polynoms wählt, d.h. je mehr Terme man hinzu-nimmt, desto enger nähert sich das Polynom an die Sinusfunktion an, siehe Bild3.14. �

Beispiel 3.50 Für die Funktionf(x) = cos(x) undx = 0 gilt

f(0) = cos(0) = 1f ′(0) = − sin(0) = 0f ′′(0) = − cos(0) = −1f ′′′(0) = sin(0) = 0f ′′′′(0) = cos(0) = 1

......

Page 75: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 75

und somit

p(x) = 1 +01!

(x− 0)1 +−12!

(x− 0)2 +03!

(x− 0)3 +14!

(x− 0)4 + . . .

= 1− 12!

x2 +14!

x4 − 16!

x6 +18!

x8 . . . �

Beispiel 3.51 Für die Funktionf(x) = ex undx = 0 gilt

f(0) = e0 = 1

f ′(0) = e0 = 1

f ′′(0) = e0 = 1...

...

und somit

p(x) = 1 +11!

(x− 0)1 +12!

(x− 0)2 +13!

(x− 0)3 +14!

(x− 0)4 + . . .

= 1 +11!

x +12!

x2 +13!

x3 +14!

x4 . . . �

Beispiel 3.52 Fasst man die vorhergehenden 3 Beispiele zusammen, so lässt sichnun verstehen weshalb die Exponentialfunktion für komplexe Argumente durch

ejx = cos(x) + j sin(x)

erweitert wurde. Es gilt nämlich fürx = 0

ejx = 1 +11!

(jx) +12!

(jx)2 +13!

(jx)3 +14!

(jx)4 +15!

(jx)5 . . .

= 1 + j11!

x− 12!

x2 − j13!

x3 +14!

x4 + j15!

x5 . . .

= 1− 12!

x2 +14!

x4 + . . . + j

(11!

x− 13!

x3 +15!

x5 . . .

)= cos(x) + j sin(x). �

Wählt man den Grad des Taylor Polynomsp(x) von f(x) zum Entwicklungspunktxsehr hoch, so scheint sichp(x) immer mehr anf(x) anzunähern, auch wennx und xweiter auseinander liegen. Man würde also erwarten, dass für allex gilt

f(x) = limn→∞

f(x) +n∑

i=1

f (i)(x)i!

(x− x)i.

Dies ist tatsächlich der Fall bei der Sinus-, Cosinus-, und Exponentialfunktion, d.h. es

Page 76: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 76

gilt für alle x ∈ R

sin(x) = limn→∞

n∑i=1

(−1)i

(2i− 1)!x2i−1

cos(x) = limn→∞

1 +n∑

i=1

(−1)i

(2i)!x2i

ex = limn→∞

1 +n∑

i=1

1i!

xi.

Im Allgemeinen ist jedoch gar nicht klar, ob der Grenzwert überhaupt existiert!

Definition 3.53 (Taylor Reihe)Sei f an der Stelle x beliebig oft differenzierbar. Für jedes x ∈ R heißt dieFolge

pn(x) = f(x) +n∑

i=1

f (i)(x)i!

(x− x)i

Taylor Reihe von f zum Entwicklungspunkt x an der Stelle x.

Ob die Taylor Reihe einen Grenzwert hat, hängt von der Funktionf , vom Entwick-lungspunktx und von der Stellex ab.

Beispiel 3.54 Abschließend noch ein Beispiel wo die Taylor Reihe nicht konver-giert. Seif(x) = ln(x) undx = 1. Für die Ableitungen erhält man

f(1) = 0f ′(1) = 1f ′′(1) = −1/2f ′′′(1) = 1/3f ′′′′(1) = −1/4

...

und somit ist das Taylor Polynom vom Gradn vonln(x) zum Entwicklungspunktx = 1

pn(x) = (x− 1)− (x− 1)2

2+

(x− 1)3

3− (x− 1)4

4

+ . . . + (−1)n+1 (x− 1)n

n.

Man würde nun erwarten, dasspn(x) die Funktionln(x) immer noch gut appro-ximiert wenn man mitx etwas weiter vom Entwicklungspunktx = 1 wegliegt,falls man den Gradn hinreichend hoch wählt. Ist z.B.x = 1.5 so nähert sich der

Page 77: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 77

����������� � ���� ������� ���������� ����

!�"�#�$�%&�' "(�)�* #�+�,�%(�-�*�.�/�0 *�1�2(

354�6�798;:�<=4>6�7

?@A

B

C�DEGF

H

I

Abbildung 3.15: Divergenz der Taylor Reihe vonf(x) = ln(x) zum Entwicklungs-punktx = 1 für x > 2.

Wert des Taylor Polynoms mit wachsendem Grad dem Wert des Logarithmusln(1.5) = 0.405 an:

p1(1.5) = 0.5, p2(1.5) = 0.375, p3(1.5) = 0.417, p5(1.5) = 0.407, . . .

Fürx = 3 nähert sich aber der Wert des Taylor Polynoms in keinster Weise demLogarithmusln(3) ≈ 1.1 an:

p1(3) = 2, p5(3) = 5.07, p10(3) = −64.82, p50(3) = −0.15× 1014, . . .

Die zugehörige Taylor Reihe

pn(x) =n∑

i=1

(−1)i+1 (x− 1)i

i

hat für x = 3 offensichtlich keinen Grenzwert. In der Tat besitzt sie nur danneinen Grenzwert wenn|x− 1| ≤ 1 und es gilt

ln(x) = limn→∞

n∑i=1

(−1)i+1 (x− 1)i

i

für allex mit 0 < x ≤ 2. �

Das Patentrezept, dass man den Grad des Taylor Polynoms nur hinreichend hoch-schrauben muss um gute Approximationen zu bekommen funktioniert im Allgemeinenalso nur in der Nähe des Entwicklungspunktes. Wenn man weiter vom Entwicklungs-punkt wegliegt, können sich Taylor Polynome mit zunehmendem Grad immer weiter

Page 78: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 78

von der Zielfunktion entfernen so dass man mit einer simplen Linearisierung dann so-gar besser fährt.

Merkregel 3.55Berechnung von Taylor Polynomen.

Gegeben: Funktion f ∈ D → R, die n mal differenzierbar ist bei x.

Gesucht: Polynom p ∈ R[x] vom Grad n, das möglichst ähnlich ist zu f inder Nähe von x.

Ansatz:

p(x) = a0 + a1(x− x) + a2(x− x)2 + . . . + an(x− x)n.

Bedingungen: n + 1 lineare Gleichungen für die n + 1 unbekannten Koef-fizienten a0, a1, a2, . . . , an

p(x) = f(x)p′(x) = f ′(x)p′′(x) = f ′′(x)

...p(n)(x) = f (n)(x).

Lösung:

a0 = f(x)a1 = f ′(x)a2 = 1/2! f ′′(x)

...an = 1/n! f (n)(x)

und somit

p(x) = f(x) +n∑

i=1

f (i)(x)i!

(x− x)i.

Page 79: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 79

3.6 Einfache Differentialgleichungen

Eine Differentialgleichung (DGL) ist eine Gleichung, die eine unbekannte Funktionf(x) sowie deren Ableitungen enthält. Gesucht ist eine (bzw. alle) Funktionen, die dieDGL erfüllen.

Beispiel 3.56 Eine DGL ist z.B.

f ′′(x) + 4f(x) = 0.

Die Funktionf(x) = sin(2x)

ist Lösung dieser DGL, wie man durch Einsetzen prüfen kann:

f ′′(x) + 4f(x) = (sin(2x))′′ + 4 sin(2x)= −4 sin(2x) + 4 sin(2x)= 0

Eine andere Lösungsfunktion ist

f(x) = cos(2x). �

Man kann sich natürlich beliebig komplizierte DGL überlegen, z.B.√|f ′′(x)|ef(x) − x2f ′(x) = 0.

Für die meisten solcher Gleichungen existiert keine Lösungsfunktion, die sich durcheinen Funktionsterm unter Verwendung von Standardfunktionen beschreiben lässt. Esgibt auch keinen Algorithmus, der von einer beliebigen DGL die Lösungsfunktion be-rechnen könnte. Meistens ist man auf approximative, numerische Verfahren angewie-sen. Andererseits gibt es jedoch auch Klassen von DGL mit spezieller Struktur, die sicheinfach lösen lassen und die in der Praxis recht häufig auftreten. Im folgenden beschäf-tigen wir uns mit einer solchen Klasse, den linearen homogenen DGL mit konstantenKoeffizienten. Diese Klasse ist deshalb besonders wichtig, weil u.a. mechanische undelektrische Schwingungen durch solche DGL beschrieben werden.

Definition 3.57Eine DGL der Form

anf (n)(x) + . . . + a1f′(x) + a0f(x) = 0

mit a0, a1, . . . , an ∈ R heißt lineare homogene DGL der Ordnung n mitkonstanten Koeffizienten.

Auf der linken Seite steht eine Linearkombination der Ableitungen vonf(x), daherdas Wort “linear”. Die höchste auftretende Ableitung bestimmt die Ordnung der DGL.Auf der rechten Seite steht0, daher das Wort “homogen”. Im allgemeinen Fall könnte

Page 80: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 80

rechts auch eine vonx abhängige Funktion stehen, was die Sache ziemlich erschwerenwürde. Die Koeffizientena0, a1, . . . , an sind konstant – dies ist ein besonders einfacherSpezialfall da man auch hier beliebige Funktionen hätte einsetzen können. Eine DGLzweiter Ordnung dieser Art ist in Beispiel 3.56 genannt.

Bevor wir uns mit Lösungsverfahren beschäftigen, überlegen wir zunächst wel-chen Gewinn wir aus dieser speziellen Struktur der DGL ziehen können.

• Offensichtlich istf(x) = 0 eine — wenn auch nicht sehr interessante — Lösungder DGL.

• Angenommen man hat eine Lösungf(x) gefunden. Dann ist für beliebigesc ∈ Rauch die Funktion

g(x) = cf(x)

eine Lösung. Aufgrund der Linearität der Ableitung gilt

g′(x) = cf ′(x), g′′(x) = cf ′′(x), . . . g(n)(x) = cf (n)(x)

und damit

ang(n)(x) + . . . + a1g′(x) + a0g(x)

= ancf (n)(x) + . . . + a1cf′(x) + a0cf(x)

= c(anf (n)(x) + . . . + a1f

′(x) + a0f(x))

= c0= 0.

• Angenommen man hat zwei Lösungsfunktionenf(x) undg(x) gefunden. Dannist auch

h(x) = f(x) + g(x)

eine Lösung. Aufgrund der Linearität der Ableitung gilt

h′(x) = f ′(x) + g′(x), h′′(x) = f ′′(x) + g′′(x), . . .

und damit

anh(n)(x) + . . . + a1h′(x) + a0h(x)

= an

(f (n)(x) + g(n)(x)

). . . + a1

(f ′(x) + g′(x)

)+ a0

(f(x) + g(x)

)= anf (n)(x) + . . . + a1f

′(x) + a0f(x) +ang(n)(x) + . . . + a1g

′(x) + a0g(x)= 0 + 0= 0.

Man kann also sagen dass jede Linearkombination von Lösungsfunktionen wie-der eine Lösungsfunktion ist. Damit stellt sich die Aufgabe eine Basis für denRaum aller Lösungen zu finden, d.h. linear voneinander unabhängige Lösungen,aus denen sich alle Lösungen kombinieren lassen.

Page 81: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 81

DGL erster Ordnung. Eine lineare DGL erster Ordnung mit konstanten Koeffizien-ten hat die Form

a1f′(x) + a0f(x) = 0, a1 6= 0

bzw.f ′(x) = −a0

a1f(x).

Anschaulich bedeutet das nichts anderes als dass die Steigung vonf(x) proportionalzu f(x) ist. Solche Funktionen beschreiben z.B. Wachstumsprozesse, wobeif(x) dieAnzahl von Lebewesen zum Zeitpunktx ist. Unter optimalen Bedingungen ist die Zu-nahme von Lebewesen pro Zeiteinheitf ′(x) proportional zu ihrer Anzahlf(x), was zuexponentiellem Wachstum führt.

Beispiel 3.58 Ein anderes Beispiel kommt aus der Elektrotechnik. Ein Kondensa-tor mit KapazitätC wird über einen WiderstandR entladen. Die Ladung desKondensators zum Zeitpunktt ist

Q(t) = CU(t).

Differenzieren auf beiden Seiten ergibt

Q′(t) = CU ′(t).

Der Entladestrom istI(t) = −Q′(t) = U(t)/R.

Gleichsetzen ergibt die lineare homogene DGL erster Ordnung

−CU ′(t) = U(t)/R.

Die Lösung einer linearen homogene DGL erhält man durch den Ansatz

f(x) = eλx,

wobei λ einzunächst unbekannter Parameter ist, der wie folgt berechnet wird. Diffe-renzieren ergibt

f ′(x) = λeλx.

Einsetzen in die DGLa1f

′(x) + a0f(x)

ergibta1λeλx + a0e

λx = 0.

Dividieren durcheλx, das ja nie Null sein kann, ergibt

a1λ + a0 = 0

und somitλ = −a0

a1.

Page 82: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 82

Eine Lösung der DGL ist somit

f(x) = e−a0a1

x.

Aufgrund der eingangs gestellten Überlegungen ist somit auch

f(x) = ce−a0a1

x

eine Lösung der DGL für beliebigesc. Tatsächlich sind dies auch schonalle Lösungen.Ist der Funktionswert vonf z.B. an der Stellex = 0 gegeben, so folgt durch Einsetzen

f(0) = c.

Die Lösungsfunktion ist dann

f(x) = f(0)e−a0a1

x.

Beispiel 3.59 Um U(t) aus Beispiel 3.58 zu berechnen, beginnt man mit dem An-satz

U(t) = eλt.

Setzt manU ′(t) = λeλt

in die DGL−CU ′(t) = U(t)/R

ein, erhält man−Cλeλt = eλt/R

und nach Kürzen−Cλ = 1/R.

Damit ist

λ = − 1RC

undU(t) = ae−t/(RC)

eine Lösung für beliebigesa. Ist die Spannung zum Zeitpunktt = 0 gegeben,dann ist die Lösungsfunktion eindeutig bestimmt durch

U(t) = U(0)e−t/(RC). �

Page 83: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 83

DGL zweiter Ordnung. Eine lineare DGL zweiter Ordnung mit konstanten Koeffi-zienten hat die Form

a2f′′(x) + a1f

′(x) + a0f(x) = 0, a2 6= 0.

Auch hier erhält man eine Lösung mit dem Ansatz

f(x) = eλx.

Die Ableitungen sind

f ′(x) = λeλx

f ′′(x) = λ2eλx.

Einsetzen in die DGL ergibt

a2λ2eλx + a1λeλx + a0e

λx = 0.

Nach Division miteλx erhält man das Polynom zweiten Grades

a2λ2 + a1λ + a0 = 0.

Je nachdem ob dieses Polynom zwei, eine doppelte oder ein Paar konjugiert komplexerNullstellen hat, unterscheidet man drei Fälle.

• Zwei reelle Nullstellen.Ist die Diskriminante positiv, dann sind die Nullstellennach der Mitternachtsformel

λ1/2 =−a1 ±

√a21 − 4a2a0

2a2.

Somit sindf1(x) = eλ1x undf2(x) = eλ2x

Lösungen und folglich auch

f(x) = c1eλ1x + c2e

λ2x

für beliebigec1, c2.

• Eine doppelte Nullstelle.Ist die Diskriminante Null, dann ist die einzige Null-stelle

λ = − a1

2a2

und somitf1(x) = eλx

Lösungsfunktion. In diesem Spezialfall ist jedoch auch

f2(x) = xf1(x)

Page 84: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 84

Lösungsfunktion, wie man durch Einsetzen nachprüft: Die Ableitungen vonf2(x)sind

f ′2(x) = f1(x) + xf ′1(x)f ′′2 (x) = 2f ′1(x) + xf ′′1 (x).

Damit ist

a2f′′2 (x) + a1f

′2(x) + a0f2(x)

= a2(2f ′1(x) + xf ′′1 (x)) + a1(f1(x) + xf ′1(x)) + a0xf1(x)= x(a2f

′′1 (x) + a1f

′1(x) + a0f1(x)︸ ︷︷ ︸

=0

) + 2a2f′1(x) + a1f1(x)

= 2a2λeλx + a1eλx

=(−2a2

a1

2a2+ a1

)eλx

= 0

Somit istf(x) = c1e

λx + c2xeλx

für beliebigec1, c2 Lösung der DGL.

• Ein konjugiert komplexes Nullstellenpaar.Eine komplexe Nullstelle ist in die-sem Fall

λ = − a1

2a2︸ ︷︷ ︸u

+j

√−a2

1 + 4a2a0

2a2︸ ︷︷ ︸v

.

Man erhält damit zunächst eine komplexe Lösungsfunktion

eλx = e(u+jv)x

= euxejvx

= eux cos(vx)︸ ︷︷ ︸fre

+j eux sin(vx)︸ ︷︷ ︸fim

Somit gilt

a2(fre + jfim)′′ + a1(fre + jfim)′ + a0(fre + jfim)= a2(f ′′re + jf ′′im) + a1(f ′re + jf ′im) + a0(fre + jfim)= a2f

′′re + a1f

′re + a0fre + j

(a2f

′′im + a1f

′im + a0fim

)= 0.

Folglich ist sowohlfre als auchfim eine Lösungsfunktion der DGL und damit

f(x) = c1fre(x) + c2fim(x)= eux(c1 cos(vx) + c2 sin(vx))

Lösungsfunktion für beliebigec1, c2. Je nachdem obu positiv oder negativ ist,handelt es sich um eine exponentiell ansteigende oder abklingende Schwingung.

Page 85: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 85

In allen Fällen wurde somit eine Lösungsfunktion berechnet, die zwei Freiheitsgradec1, c2 hat. Diese lassen sich bestimmen, wenn man die Anfangswerte der Funktionf(0)bzw. f ′(0) kennt, was bei praktischen Anwendungen meistens der Fall ist. WeitereLösungsfunktionen gibt es nicht.

Beispiel 3.60 An einer Feder mit FederkonstanteD hängt ein Gewicht mit Massem. Die Auslenkung der Feder zum Zeitpunktt wird mit s(t) beschrieben. DieGeschwindigkeit des Massestücks ist somits′(t), die Beschleunigungs′′(t). DerZusammenhang zwischen Auslenkung und Beschleunigung ist durch die Kräf-tegleichung

ms′′(t) + Ds(t) = 0

beschrieben. Hinzu kommt eine Reibungskraft, die entgegen der Bewegungs-richtung des Massestücks wirkt und proportional zur Geschwindigkeit sei mitProportionalitätsfaktorr. Damit erhält man die DGL

ms′′(t) + rs′(t) + Ds(t) = 0.

Mit dem Ansatzs(t) = eλt

erhält man nach Einsetzen in die DGL und Kürzen miteλt das Polynom

mλ2 + rλ + D = 0.

Angenommen die Diskriminante ist negativ, d.h.

r2 − 4Dm < 0.

Dies ist immer dann der Fall, wenn die Reibungskraft im Verhältnis zur Feder-kraft gering ist. Die Nullstellen des Polynoms sind somit konjugiert komplex.Eine Nullstelle ist

λ =−r + j

√4Dm− r2

2m.

Realteil und Imaginärteil voneλt sind daher

sre(t) = eρt cos(ωt)sim(t) = eρt sin(ωt)

mit

ρ = − r

2m, ω =

√4Dm− r2

2m.

Die allgemeine Lösung ist somit

s(t) = eρt(c1 cos(ωt) + c2 sin(ωt)).

Qualitativ sieht man, dass die Schwingung umso schneller abklingt, je größerder Reibungskoeffizientr und je kleiner die Massem ist. Andererseits ist dieFrequenz der Schwingung umso größer, je größerD und je kleinerm ist.

Page 86: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 86

Angenommen zum Zeitpunktt = 0 ist die Auslenkung0 und die Geschwin-digkeit1, d.h.

s(0) = 0, s′(0) = 1.

Setzt mant = 0 in die allgemeine Lösung ein, erhält man mits(0) = 0

0 = c1.

Weiterhin ist

s′(t) = ρeρt(c1 cos(ωt) + c2 sin(ωt)) + eρtω(−c1 sin(ωt) + c2 cos(ωt)).

Setzt man auf beiden Seitent = 0 ein, erhält man mits′(0) = 1

1 = ρc1 + ωc2

= ωc2

und damit

c2 =1ω

.

Die Lösungsfunktion ist somit

s(t) =eρt

ωsin(ωt). �

Page 87: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 87

3.7 Partielle Ableitungen

Bisher haben wir uns ausschließlich mit der Ableitung von einstelligen Funktionen aufR beschäftigt. In diesem Kapitel wird der Begriff der Ableitung auf mehrstellige Funk-tionenf ∈ Rn → R verallgemeinert. Auch hier soll die Ableitung dem entsprechenwas man anschaulich unter der Steigung versteht.

3.7.1 Gradient

Bei einer einstelligen Funktionf(x) ist unmittelbar klar, was mit der Steigung an ei-nem bestimmten Punkt gemeint ist. Bei einer mehrstelligen Funktion ist dies nicht sooffensichtlich. Stellt man sich z.B. eine zweistellige Funktionf(x, y) als ein Gebirgevor, und fragt sich wie steil das Gebirge an einem bestimmten Punkt ist, so hängt dieAntwort davon ab in welcher Richtung man gehen möchte. Geht man z.B. am Bergentlang, so ist die Steigung Null, geht man hingegen auf den Gipfel zu, ist die Steigungpositiv. Besonders einfach ist die Steigung inx- undy-Richtung zu berechnen. Hierzuein Beispiel: Sei

f(x, y) = x2y + x sin(y).

• Die Steigung inx-Richtung erhält man, indem many als Konstante betrachtetund aus der zweistelligen Funktionf(x, y) eine einstellige Funktionf(x) macht,die man wie gewohnt ableiten kann. Dies nennt man auch partielle Ableitung vonf nachx und schreibt

∂xf(x, y) = 2xy + sin(y).

• In gleicher Weise erhält man die Steigung iny-Richtung, indem manx als Kon-stante betrachtet und aus der zweistelligen Funktionf(x, y) eine einstellige Funk-tion f(y) macht, die man wieder ganz normal ableitet. Man erhält somit die par-tielle Ableitung vonf nachy und schreibt

∂yf(x, y) = x2 + x cos(y).

Allgemein kann man von einern-stelligen Funktion die partielle Ableitungen nachjeder Variablen berechnen.

Page 88: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 88

Definition 3.61 partielle AbleitungDie partielle Ableitung einer n-stelligen Funktion f(x1, x2, . . . , xn) nach xi

erhält man indem man alle Variablen außer xi als Konstanten betrachtet unddie so entstehende einstellige Funktion f(xi) ableitet. Man schreibt hierfür

∂xif(x1, x2, . . . , xn).

Die exakte Definition ist

∂xif(x1, x2, . . . , xn) =

limh→0

f(x1, . . . , xi + h, . . . , xn)− f(x1, . . . , xi, . . . , xn)h

.

Definition 3.62 GradientDer Gradient einer n-stelligen Funktion f(x1, x2, . . . , xn) ist der n-dimensionale Zeilenvektor bestehend aus den partiellen Ableitungen

∇f =(

∂f

∂x1,

∂f

∂x2, . . . ,

∂f

∂xn

).

Im vorhergehenden Beispiel ist also

∇f(x, y) =(2xy + sin(y), x2 + x cos(y)

).

Der Gradient einer Funktion hat ein paar sehr nützliche Eigenschaften:

• Hatf am Punkt(x1, x2, . . . , xn) einen lokalen Extremwert, sind dort alle partiel-len Ableitungen Null und der Gradient somit der Nullvektor. Die Extremwertbe-rechnung von mehrstelligen Funktionen wird also analog zur Extremwertberech-nung von einstelligen Funktionen dadurch bewerkstelligt, dass man die gemein-samen Nullstellen aller partiellen Ableitungen berechnet. Wie bei einstelligenFunktionen gilt auch hier, dass ein verschwindender Gradient eine notwendigeBedingung für ein lokales Extremum ist aber keine hinreichende! Ein Punkt, andem der Gradient verschwindet heißt auch stationärer Punkt. Es gibt also auchstationäre Punkte, die keine lokalen Extremwerte vonf sind.

• Für jeden Punkt(x1, x2, . . . , xn) zeigt der Gradientenvektor in die Richtung dessteilsten Anstiegs vonf im Punkt(x1, x2, . . . , xn), siehe Bild 3.16. Man kannein (lokales) Maximum somit auch iterativ berechnen, indem man bei einemPunkt(x1, x2, . . . , xn) beginnt, dort den Gradientenvektor berechnet, ein kleinesStück in Richtung dieses Vektors läuft, dort den neuen Gradientenvektor berech-net und so weiter. Analog kann man ein lokales Minimum berechnen indem manin entgegengesetzter Richtung des Gradienten läuft. Verfahren dieser Art heißenGradientenabstiegsverfahren.

Page 89: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 89

������� ���

���� �������������� ����

�!#"�$&%�'

Abbildung 3.16: Der Gradient∇f(x, y) zeigt in die Richtung des steilsten Anstiegsvonf im Punkt(x, y).

• Möchte man die Steigung vonf im Punkt(x1, x2, . . . , xn) nicht nur in Rich-tung der Koordinaten wissen sondern in Richtung eines beliebig vorgegebenenVektors~r, so erhält man diese durch

∇f(x1, x2, . . . , xn)~r

||~r||.

Im Spezialfall wenn~r = ~ei der i-te Einheitsvektor ist, d.h. der Vektor dessenRichtung diei-te Koordinate ist, erhält man wie erwartet diei-te partielle Ablei-tung:

∇f~ei

||~ei||=

(∂f

∂x1,

∂f

∂x2, . . . ,

∂f

∂xi, . . . ,

∂f

∂xn

)

00...1...0

=

∂xif.

Page 90: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 90

Beispiel 3.63 Seif(x, y) = x2 + y2. Die partiellen Ableitungen sind

∂xf(x, y) = 2x

∂yf(x, y) = 2y.

und somit∇f(x, y) = (2x, 2y) .

• Betrachtet man das Schaubild, so sieht man dassf an der Stelle(0, 0) einMinimum hat und in der Tat ist der Gradient dort gleich dem Nullvektor,d.h.

∇f(0, 0) = (0, 0) .

• Der Gradient im Punkt(1, 2) ist

∇f(1, 2) = (2, 4) .

und somit istf im Punkt (1, 2) am steilsten wenn man in Richtung desVektors

~r =(

24

)läuft. Die Steigung in dieser Richtung ist

∇f(1, 2)~r

||~r||= ∇f(1, 2)

∇f(1, 2)T

||∇f(1, 2)||

=∇f(1, 2)∇f(1, 2)T

||∇f(1, 2)||

=||∇f(1, 2)||2

||∇f(1, 2)||= ||∇f(1, 2)||=√

20≈ 4.47.

• Die Steigung im Punkt(1, 2) in alle anderen Richtungen ist kleiner. Soerhält man z.B. für die Richtung

~r =(

34

)nur eine Steigung von

∇f(1, 2)~r

||~r||= (2, 4)

(3/54/5

)= 22/5= 4.4.

Page 91: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 91

In Richtung des Vektors

~r =(

2−1

)ist f an der Stelle(1, 2) sogar eben und man erhält

∇f(1, 2)~r

||~r||= (2, 4)

(2/√

5−1/√

5

)= 0. �

Beispiel 3.64 Seif(x, y, z) = sin(xy) + z2. Die partiellen Ableitungen sind

∂xf(x, y, z) = y cos(xy)

∂yf(x, y, z) = x cos(xy)

∂zf(x, y, z) = 2z.

und somit∇f(x, y, z) = (y cos(xy), x cos(xy), 2z) .

• f hat an der Stelle(π, 1/2, 0) einen stationären Punkt, da

∇f(π, 1/2, 0) = (0, 0, 0) .

Es ist jedoch zunächst unklar, ob es sich hierbei auch um einen lokalenExtremwert handelt.

• Der Gradient im Punkt(1, π, 2) ist

∇f(1, π, 2) = (−π,−1, 4)

und somit istf im Punkt(1, π, 2) am steilsten, wenn man in Richtung desVektors

~r =

−π−1

4

läuft. Die Steigung in dieser Richtung ist

∇f(1, π, 2)~r

||~r||= ∇f(1, π, 2)

∇f(1, π, 2)T

||∇f(1, π, 2)||

=||∇f(1, π, 2)||2

||∇f(1, π, 2)||= ||∇f(1, π, 2)||

=√

π2 + 17≈ 5.18.

Page 92: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 92

• Die Steigung im Punkt(1, π, 2) in alle anderen Richtungen ist kleiner. Soerhält man z.B. für die Richtung

~r =

34−5

nur eine Steigung von

∇f(1, π, 2)~r

||~r||= (−π,−1, 4)

3/√

504/√

50−5/√

50

=−3π − 24√

50≈ −4.73 �

Merkregel 3.65

• Der Gradient von f(x1, x2, . . . , xn) ist der Vektor

∇f =(

∂f

∂x1,

∂f

∂x2, . . . ,

∂f

∂xn

).

• Der Gradient von f an der Stelle (x1, x2, . . . , xn) zeigt in die Richtungdes steilsten Anstiegs von f .

• Hat f an der Stelle (x1, x2, . . . , xn) ein lokales Extremum, so ist derGradient dort gleich dem Nullvektor.

• Die Steigung von f an der Stelle (x1, x2, . . . , xn) in Richtung der i-tenKoordinate ergibt sich aus der partiellen Ableitung von f nach xi

∂xif(x1, x2, . . . , xn).

• Die Steigung von f an der Stelle (x1, x2, . . . , xn) in Richtung einesbeliebigen Vektors ~r ist

∇f(x1, x2, . . . , xn)~r

||~r||.

3.7.2 Extremwertberechnung und Gradientenabstieg

Hat eine einstellige Funktionf ∈ R → R an der Stellex einen lokalen Extrem-wert, dann giltf ′(x) = 0, siehe Kapitel 3.5.1. Dies lässt sich unter Verwendung vonpartiellen Ableitungen nun wie folgt verallgemeinern: Hat einen-stellige Funktion

Page 93: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 93

f ∈ Rn → R an der Stelle(x1, . . . , xn) einen lokalen Extremwert, dann sind dortalle partiellen Ableitungen Null, d.h.

∂xif(x1, . . . , xn) = 0 für alle i = 1, . . . , n.

Unter Verwendung des Gradienten kann man hierfür auch einfach schreiben

∇f(x1, . . . , xn) = ~0.

Die lokalen Extremwerte einern-stelligen Funktion können somit als Lösung des (i.a.nichtlinearen) Gleichungssystems

∂x1f(x1, x2, . . . , xn) = 0

∂x2f(x1, x2, . . . , xn) = 0

...∂

∂xnf(x1, x2, . . . , xn) = 0.

mit n Gleichungen undn Unbekannten berechnet werden. Ob die einzelnen Lösun-gen Hochpunkte, Tiefpunkte oder Sattelpunkte sind, kann unter Verwendung höhererpartieller Ableitungen entschieden werden.

Beispiel 3.66 Seif(x, y) = x2 + 2x cos(y) + y2.

Gesucht werden die stationären Punkte vonf , d.h die Punkte wo

∇f(x, y) = ~0.

Die partiellen Ableitungen vonf sind

∂xf(x, y) = 2x + 2 cos(y)

∂yf(x, y) = −2x sin(y) + 2y.

Man hat somit ein nichtlineares Gleichungssystem mit zwei Unbekanntenx, y.Es existiert nur eine einzige Lösungx = −1, y = 0. Wie man aus dem Schaubilderkennt, ist dies ein Tiefpunkt.�

Da die Lösung eines nichtlinearen Gleichungssystems in der Regel ein sehr schwierigesProblem ist, wendet man zur Berechnung lokaler Extremwerte oft andere Verfahren an.Man nützt hierbei aus, dass der Gradient vonf im Punkt~p = (x1, . . . , xn) in die Rich-tung des steilsten Anstiegs vonf an dieser Stelle zeigt. Bewegt man~p also ein kleines

Page 94: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 94

Stück in die Richtung, in die der Gradient zeigt, wirdf dabei größer. Ausgehend vomStartpunkt~p(0) erhält man somit den Punkt

~p(1) = ~p(0) + α∇f(~p(0)).

Hierbei istα ein Parameter, mit dem man die Schrittweite einstellen kann. Istα hinrei-chend klein, und∇f(~p(1)) 6= ~0 so gilt

f(~p(1)) > f(~p(0)).

Berechnet man an der neuen Stelle~p(1) wiederum den Gradienten und wiederholt die-sen Vorgang, erhält man eine Folge von Vektoren

~p(i+1) = ~p(i) + α∇f(~p(i)).

Ist∇f(~p(i)) 6= ~0 undα hinreichend klein, dann gilt

f(~p(i+1)) > f(~p(i)),

d.h. die Funktionswerte werden immer größer. Dieses Verfahren nennt man Gradien-tenaufstieg. Um ein lokales Minimum vonf zu suchen, geht man in entgegengesetzterRichtung des Gradienten und erhält das Gradientenabstiegsverfahren

~p(i+1) = ~p(i) − α∇f(~p(i)).

Beispiel 3.67 Sei wie im vorigen Beispiel

f(x, y) = x2 + 2x cos(y) + y2

mit∇f(x, y) =

(2x + 2 cos(y),−2x sin(y) + 2y

).

Diesmal soll das lokale Minimum vonf mit dem Gradientenabstiegsverfahrenausgehend von

~p(0) = (1, 1)

und Schrittweiteα = 0.25 berechnet werden.

~p(1) = ~p(0) − α∇f(~p(0))= (1, 1)− 0.25(3.0806, 0.317058)= (0.229849, 0.920735)

~p(2) = ~p(1) − α∇f(~p(1))= (0.229849, 0.920735)− 0.25(1.67017, 1.47553)= (−0.187693, 0.551853)

~p(3) = (−0.519624, 0.226726)~p(4) = (−0.747016, 0.0549603)~p(5) = (−0.872753, 0.00696238)

...

Die Folge~p(i) konvergiert tatsächlich gegen den Punkt(−1, 0). �

Page 95: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 95

Das große Problem bei solchen Gradientenverfahren ist die Konvergenz. Hätte man imvorigen Beispiel die Schrittweiteα = 1.0 gewählt, dann wäre das Verfahren nicht kon-vergiert. Bei vielen Optimierungsproblemen ist jedochf wie im vorigen Beispiel nachunten beschränkt. In diesem Fall konvergiert das Gradientenabstiegsverfahren fallsαhinreichend klein ist. Ein solchesα kann man z.B. dadurch bestimmen, dass man miteinem beliebigen Wert fürα beginnt undα kleiner macht fallsf(~p(i+1)) ≥ f(~p(i)) fürein i. Damit das Verfahren nicht zu langsam wird, sollte man dann aber auchα wiedererhöhen wennf(~p(i+1)) < f(~p(i)).

3.7.3 Maschinelles Lernen und neuronale Netze

Der Mensch lernt – wenn überhaupt – dann vorwiegend aus Beispielen. Insbesondereunbewusste Fähigkeiten wie Erkennen von Objekten, Verstehen von Sprache, Motorik,usw. werden in einem Alter gelernt, wo der Mensch noch gar keinen Zugang zu an-deren Wissensquellen hat. Darüber wie menschliches Lernen funktioniert, weiss manbei weitem nicht genug um es in Algorithmen packen und im Rechner implementie-ren zu können. Gradientenabstiegsverfahren bieten jedoch die Möglichkeit, dass auchMaschinen Beispielen “verallgemeinern” können. Technisch gesehen stellt sich dasProblem wie folgt: Von einem unbekannten System, welches Inputs~x ∈ Rn bekommtund outputsy ∈ R liefert, ist eine endliche Stichprobe von Input/Output Paaren

~x(s), y(s), s = 1, 2, . . .

gegeben. Gesucht ist eine einfache Funktionf ∈ Rn → R so dass

f(~x(s)

)≈ y(s) für alles.

Der etwas vage Begriff einer “einfachen Funktion” wird dadurch konkretisiert, dassmanf bis auf einige Parameter vorgibt, also z.B.

f(~x, ~w) = w1 sin(w2x1 + w3) + w4x1x2.

Das Problem ist dadurch reduziert auf die Berechnung passender Parameter~w. DieWahl einer geeigneten parametrischen Funktionf(~x, ~w) ist oft schwierig. Häufig hatman jedoch Hintergrundwissen über die zugrundeliegende Anwendung, die einem hier-bei hilft. Ein neuronales Netz ist eine spezielle parametrische Funktion, die sich in derPraxis bei vielen Anwendungen bewährt hat. Das in diesem Abschnitt vorgestellte Ver-fahren ist aber im Prinzip für beliebige (differenzierbare) Funktionen anwendbar. Effi-zientere Verfahren für parametrische Funktionen mit besonders einfacher Struktur sindin Kapitel 3.7.7 beschrieben.

Die Forderung

f(~x(s), ~w

)≈ y(s)

kann man konkretisieren, indem man den quadratischen Fehler

e(s)(~w) =(f(~x(s), ~w

)− y(s)

)2

Page 96: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 96

��� ��� ����

� ���� ��� ���

�������

��� ��!"# $ %'&()+*�,�-/.$ )10 )

243�57698;:2 3=<

>@?BA9CED>GFHI@JLKMN O�P�Q R

N/S N

Abbildung 3.17: Neuronales Netz

simultan für alle Stichprobenelementes = 1, 2, . . . minimiert. Die praktische Vorge-hensweise ist, dass man reihum ein Stichprobenelements nach dem anderen nimmtund die Gewichte~w ein kleines bisschen so abändert, dasse(s)(~w) kleiner wird. Diebeste Richtung, in die man~w ändern muss, ist entgegen dem Gradienten vone(s)(~w),also

~w ← ~w − α∇e(s)(~w)

wobeiα die Schrittweite angibt. Die Berechnung von~w nach diesem Verfahren wirdoft als “Lernen” bezeichnet. Man nennt dannα auch Lerngeschwindigkeit.

Im Folgenden wird dieses Lernverfahren für den Spezialfall wennf(~x, ~w) einneuronales Netz ist, genauer beschrieben. In der Literatur firmiert dieses Verfahrenunter dem Begriff Backpropagation Algorithmus. Einem neuronalen Netz liegt das inBild 3.17 dargestellte Berechnungsmodell zugrunde.Die grauen Kreise stellen Neuronen dar. Es gibtm Neuronen auf der Zwischenschicht(hidden layer) und ein Neuron auf der Ausgabeschicht (output layer).2 Ein Neuronhat mehrere Eingänge und einen Ausgang. Es berechnet eine gewichtete Summe überseine Eingänge, wendet auf das Ergebnis die Sigmoid Funktion

σ(x) =1

1 + e−x

an und gibt diesen Wert aus. Wie im Bild dargestellt wird jedem Neuron noch derkonstante Wert 1 zugeführt. Um die Formeln zu vereinfachen wird dieser mitx0 bzw.mit h0 bezeichnet. Der Gewichtsvektor~w setzt sich zusammen aus den Gewichten derZwischenschicht

wHjk, j = 0, . . . ,m k = 0, . . . , n

2Allgemein können solche Netze mehrere Output Neuronen haben. Die Verallgemeinerung ist nichtschwierig.

Page 97: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 97

und den Gewichten des Ausgabeneurons

wO` , ` = 0, . . . ,m.

Der Ausgabewerty = f(~x(s), ~w),

den das neuronale Netz mit Inputx(s) liefert, wird wie folgt berechnet:

hj =n∑

k=0

wHjkx

(s)k

hj = σ(hj), j = 1, . . . ,m

y =m∑

`=0

wO` h`

y = σ(y).

Um das Lernverfahren~w ← ~w − α∇e(~w)

zu formulieren, muss man die partiellen Ableitungen von

e(s)(~w) = (f(~x(s), ~w)− y(s))2

nach den GewichtenwOj undwH

jk berechnen.

Im Lauf der Berechnung stößt man auf die Ableitung der Sigmoid Funktion, diesich wie folgt auf eine recht einfache Form bringen lässt:

σ′(x) =−1(−e−x)(1 + e−x)2

=e−x

(1 + e−x)2

=1 + e−x − 1(1 + e−x)2

=1 + e−x

(1 + e−x)2− 1

(1 + e−x)2

=1

1 + e−x− 1

(1 + e−x)2

=1

1 + e−x

(1− 1

1 + e−x

)= σ(x)(1− σ(x)).

Page 98: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 98

Ableitung nach den Gewichten der Ausgabeschicht. Die partiellen Ableitungennach den GewichtenwO

j der Ausgabeschicht sind nun

∂wOj

e(s)(~w) =∂

∂wOj

(y − y(s))2

= 2(y − y(s))∂

∂wOj

y

Für die innere Ableitung berechnet man

∂wOj

y =∂

∂wOj

σ(y)

= σ′(y)∂

∂wOj

y

= σ(y)(1− σ(y))hj

= y(1− y)hj

Zusammen ergibt dies

∂wOj

e(s)(~w) = 2(y − y(s))y(1− y)hj , j = 0, . . . ,m.

Ableitung nach den Gewichten der Zwischenschicht. Die partiellen Ableitungennach den GewichtenwH

jk der Zwischenschicht sind

∂wHjk

e(s)(~w) =∂

∂wHjk

(y − y(s))2

= 2(y − y(s))∂

∂wHjk

y

Für die innere Ableitung berechnet man

∂wHjk

y =∂

∂wHjk

σ(y)

= σ′(y)∂

∂wHjk

y

= σ(y)(1− σ(y))∂

∂wHjk

m∑`=0

wO` h`

= y(1− y)m∑

`=0

wO`

∂wHjk

h`

Der Ausgabewerth` des`-ten Neurons auf der Zwischenschicht ändert sich natürlichnicht, wenn man an den GewichtenwH

jk desj-ten Neurons auf der Zwischenschicht

Page 99: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 99

dreht undj 6= ` ist. Daher ist

∂wHjk

h` = 0 falls ` 6= j.

Von der Summe über= 0, . . . ,m bleibt also nur der eine Summand mit` = j übrigund es gilt

∂wHjk

y = y(1− y)wOj

∂wHjk

hj

= y(1− y)wOj

∂wHjk

σ(hj)

= y(1− y)wOj σ′(hj)

∂wHjk

hj

= y(1− y)wOj σ(hj)(1− σ(hj))

∂wHjk

n∑k=0

wHjkx

(s)k

= y(1− y)wOj hj(1− hj)wH

jkx(s)k

Somit hat man die partiellen Ableitungen

∂wOj

e(s)(~w) = 2(y − y(s))y(1− y)hj

∂wHjk

e(s)(~w) = 2(y − y(s))y(1− y)wOj hj(1− hj)wH

jkx(s)k

=∂

∂wOj

e(s)(~w)wOj (1− hj)wH

jkx(s)k

für j = 0, . . . ,m undk = 0, . . . , n. Da der Term für die Ableitung nach den Gewichtender Ausgabeschicht wieder bei im Term für die Ableitung nach den Gewichten der Zwi-schenschicht auftritt, nennt man das Verfahren “Backpropagation Algorithmus”. Genaudieser Umstand hat ihm aber Kritik von den Physiologen eingebracht: Neuronen sindüber Axone verbunden, die Signale nur in eine Richtung transportieren können, beimLernen müssen aber partielle Ableitungen vom Ausgabeneuron an die Zwischenschichtgeschickt werden.

Page 100: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 100

Das Lernverfahren für neuronale Netze lässt sich nun wie folgt formulieren:

Backpropagation Algorithmus

Input: GewichtewHjk, wO

j , j = 0, . . . ,m, k = 0, . . . , nLernstichprobenelementex(s), y(s), s = 1, 2, . . .Lerngeschwindigkeitα > 0

Output: Verbesserte GewichtewHjk, wO

j .

Iteriere über Lernstichprobe.

for s = 1, 2, . . .

Berechne Zwischenschichthj .

x0 = 1, h0 = 1for j = 1, 2, . . . ,m

hj = 0for k = 0, 1, . . . , n

hj = hj + wHjkx

(s)k

hj = σ(hj)

Berechne Ausgabeschichty.

y = 0for ` = 0, 1, . . . ,m

y = y + wO` h`

y = σ(y)

Berechne partielle Ableitungen vone(~w).

e = 2(y − y(s))y(1− y)for j = 0, 1, . . . ,m

∆wOj = ehj

for k = 0, 1, . . . , n

∆wHjk = ∆wO

j wOj (1− hj)wH

jkx(s)k

Neue Gewichte.

for j = 0, 1, . . . ,mwO

j = wOj − α∆wO

j

for k = 0, 1, . . . , nwH

jk = wHjk − α∆wH

jk

Page 101: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 101

3.7.4 Tangentialebenen

In Kapitel 3.3 haben wir den Begriff der Linearisierung kennen gelernt. Die Idee hierbeiist, eine Funktionf(x) in der Nähe eines Punktesx durch eine affin lineare Funktion`(x) zu approximieren, welche die Bedingungen

`(x) = f(x)`′(x) = f ′(x)

erfüllt. Die Lösung ist die Tangente

`(x) = f(x) + f ′(x)(x− x).

Das selbe Prinzip lässt sich auch für zweistellige Funktionen anwenden. Die Lineari-sierung vonf(x, y) im Punkt(x, y) ist hierbei eine zweistellige affin lineare Funktion`(x, y), welche in naheliegender Erweiterung des einstelligen Falls die Bedingungen

`(x, y) = f(x, y)∂

∂x`(x, y) =

∂xf(x, y)

∂y`(x, y) =

∂yf(x, y)

erfüllt. Wie man leicht nachrechnet ist die Lösung die Tangentialebene

`(x, y) = f(x, y) +∂

∂xf(x, y)(x− x) +

∂yf(x, y)(y − y).

Für allgemeinen-stelligen Funktionen ist die Linearisierung vonf(x1, x2, . . . , xn) imPunkt(x1, x2, . . . , xn) die n-stellige affin lineare Funktion(x1, x2, . . . , xn), welchedie Bedingungen

`(x1, x2, . . . , xn) = f(x1, x2, . . . , xn)∂

∂x1`(x1, x2, . . . , xn) =

∂x1f(x1, x2, . . . , xn)

∂x2`(x1, x2, . . . , xn) =

∂x2f(x1, x2, . . . , xn)

...∂

∂xn`(x1, x2, . . . , xn) =

∂xnf(x1, x2, . . . , xn)

erfüllt. Die Lösung ist die Tangentialebene

`(x1, x2, . . . , xn) = f(x1, x2, . . . , xn) +n∑

i=1

∂xif(x1, x2, . . . , xn)(xi − xi).

Page 102: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 102

Beispiel 3.68 Gesucht ist die Linearisierung von

f(x, y) = x2 + y2

an der Stelle(x, y) = (1, 2). Hierzu werden zunächst die partiellen Ableitungenvonf berechnet:

∂xf(x, y) = 2x

∂yf(x, y) = 2y

Durch Auswerten an der Stelle(1, 2) erhält man

f(1, 2) = 5∂

∂xf(1, 2) = 2

∂yf(1, 2) = 4.

Somit ist die Tangentialebene anf(x, y) im Punkt(2, 3) gegeben durch

`(x, y) = f(1, 2) +∂

∂xf(1, 2)(x− 1) +

∂yf(1, 2)(y − 2)

= 5 + 2(x− 1) + 4(y − 2)= −5 + 2x + 4y.

Man kann sich diesen Sachverhalt mit Maple durch den Befehl

plot3d({x^2+y^2, -5+2*x+4*y}, x=-5..5, y=-5..5);

veranschaulichen, siehe Bild 3.18.�

Beispiel 3.69 Gesucht ist die Linearisierung von

f(x, y, z) = x2 sin(yz) + 3z

an der Stelle(x, y, z) = (1, 0,−2). Hierzu werden zunächst die partiellen Ab-leitungen vonf berechnet:

∂xf(x, y, z) = 2x sin(yz)

∂yf(x, y, z) = x2z cos(yz)

∂zf(x, y, z) = x2y cos(yz) + 3

Page 103: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 103

Abbildung 3.18: Tangentialebene anf(x) = x2 + y2 im Punkt(1, 2).

Durch Auswerten an der Stelle(1, 0,−2) erhält man

f(1, 0,−2) = −6∂

∂xf(1, 0,−2) = 0

∂yf(1, 0,−2) = −2

∂zf(1, 0,−2) = 3.

Somit ist die Tangentialebene anf(x, y, z) im Punkt(1, 0,−2) gegeben durch

`(x, y, z) = f(1, 0,−2) +∂

∂xf(1, 0,−2)(x− 1) +

∂yf(1, 0,−2)(y − 0) +

∂zf(1, 0,−2)(z + 2)

= −6 + 0(x− 1)− 2(y − 0) + 3(z + 2)= 3z − 2y. �

Page 104: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 104

Merkregel 3.70Die Linearisierung von f(x1, x2, . . . , xn) im Punkt (x1, x2, . . . , xn) ist dieaffin lineare Funktion

`(x1, x2, . . . , xn) = f(x1, x2, . . . , xn)+n∑

i=1

∂xif(x1, x2, . . . , xn)(xi−xi).

Diese Funktion ist die Tangentialebene an f im Punkt (x1, x2, . . . , xn).

Bemerkung. Unter Verwendung der Vektor Schreibweise und des Gradienten kannman die Linearisierung auch kompakt schreiben als

`(~x) = f(~x) +∇f(~x)(~x− ~x).

3.7.5 Mehrdimensionales Newton Verfahren

Im vorigen Kapitel haben wir den Begriff der Linearisierung von einstelligen Funktio-nen auf mehrstellige Funktionen erweitert. Eine wichtige Anwendung von Linearisie-rungen ist das Newton Verfahren, das wir nun ebenfalls auf mehrstellige Funktionen er-weitern werden. In Kapitel 3.3 haben wir das Newton Verfahren zur Berechnung einerNullstelle einer einstelligen Funktion kennen gelernt, d.h. einer Lösung der Gleichung

f(x) = 0.

Im mehrstelligen Fall geht es darum, eine gemeinsame Nullstelle vonn Funktionen inn Variablen zu finden, d.h. eine Lösung des Gleichungssystems

f1(x1, x2, . . . , xn) = 0f2(x1, x2, . . . , xn) = 0

...

fn(x1, x2, . . . , xn) = 0.

Beispiel 3.71 Sei

f1(x, y) = x2 + y2 − 4f2(x, y) = xy − 1.

Gesucht ist eine Lösung des Gleichungssystems

f1(x, y) = 0f2(x, y) = 0,

d.h. ein Punkt(x, y) so dass

x2 + y2 − 4 = 0xy − 1 = 0.

Page 105: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 105

In Maple kann man sich die Lösungsmenge jeder einzelnen Gleichung anschau-en mit

with(plots);implicitplot(x^2+y^2-4=0, x=-3..3, y=-3..3);implicitplot(x*y-1=0, x=-3..3, y=-3..3);

Die gemeinsamen Lösungen ist dann die Schnittmenge beider Lösungsmengen:

implicitplot({x^2+y^2-4=0, x*y-1=0}, x=-3..3, y=-3..3);

Man erkennt, dass vier Lösungen existieren:

(1.93, 0.52), (−1.93,−0.52), (0.52, 1.93), (−0.52,−1.93).

Die exakten Lösungen sindx = ±√

2±√

3, y = 1/x. �

Wenn die Funktionenf1, f2, . . . , fn affin linear wären, so könnte man dieses Problemz.B. mit dem Gauß Algorithmus lösen. Im Folgenden lassen wir jedoch allgemeinenichtlineare Funktionen zu, von denen lediglich gefordert ist, dass alle partiellen Ab-leitungen existieren. Dadurch wird das Problem erheblich schwieriger — anders alsbei linearen Systemen existiert noch nicht einmal ein einfaches Kriterium um zu ent-scheiden ob Lösungen existieren bzw. wie viele. Die Vorgehensweise zur Lösung einessolchen nichtlinearen Gleichungssystems nach dem Newton Verfahren ist die selbe wieim einstelligen Fall:

Schritt 1 (Startwert): Wähle eine Näherungslösung(x1, x2, . . . , xn).

Schritt 2 (Linearisieren): Berechne zu jeder Funktion

fi(x1, x2, . . . , xn), i = 1, 2, . . . , n

die Linearisierung`i(x1, x2, . . . , xn)

am Punkt(x1, x2, . . . , xn).

Schritt 3 (Lösen): Anstatt des ursprünglichen nichtlinearen Gleichungssystems löstman nun das linearisierte System

`1(x1, x2, . . . , xn) = 0`2(x1, x2, . . . , xn) = 0

...

`n(x1, x2, . . . , xn) = 0

z.B. mit dem Gauß Algorithmus.

Page 106: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 106

Schritt 4 (Iterieren): Nehme die Lösung dieses linearen Gleichungssystems als neueNäherungslösung(x1, x2, . . . , xn) und gehe zuSchritt 2.

Man erhält somit eine Folge von Näherungslösungen und wie im eindimensionalen Fallist leider durchaus nicht garantiert, dass diese Folge auch konvergiert. Ist man mit demStartwert jedoch hinreichend nahe an einer Lösung, so tritt tatsächlich Konvergenz zuder Lösung ein. Ein großer Vorteil des Newton Verfahrens ist, dass man sich dann sehrschnell der Lösung nähert.

Beispiel 3.72 Wir suchen nun eine Lösung des Gleichungssystems von Beispiel3.71 mit dem Newton Verfahren. Daf1 undf2 in jeder Iteration linearisiert wer-den müssen, berechnen wir zunächst vorab die partiellen Ableitungen:

∂xf1(x, y) = 2x

∂yf1(x, y) = 2y

∂xf2(x, y) = y

∂yf2(x, y) = x

Erste Iteration. Als Startnäherung wird der Punkt(x, y) = (2, 1) gewählt. DieLinearisierungen vonf1 undf2 bei (2, 1) sind

`1(x, y) = f1(2, 1) +∂

∂xf1(2, 1)(x− 2) +

∂yf1(2, 1)(y − 1)

= 1 + 4(x− 2) + 2(y − 1)= −9 + 4x + 2y

`2(x, y) = f2(2, 1) +∂

∂xf2(2, 1)(x− 2) +

∂yf2(2, 1)(y − 1)

= 1 + 1(x− 2) + 2(y − 1)= −3 + x + 2y.

Als nächstes muss das lineare Gleichungssystem

`1(x, y) = 0`2(x, y) = 0

gelöst werden, d.h. in diesem Fall

4x + 2y = 9x + 2y = 3.

Die Lösung istx = 2, y = 1/2.

Zweite Iteration. Mit der neuen Näherung(x, y) = (2, 1/2) beginnt man nundie nächste Iteration des Newton Verfahrens. Die Linearisierungen vonf1

Page 107: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 107

undf2 bei (2, 1/2) sind

`1(x, y)

= f1(2, 1/2) +∂

∂xf1(2, 1/2)(x− 2) +

∂yf1(2, 1/2)(y − 1/2)

= 1/4 + 4(x− 2) + 1(y − 1/2)= −33/4 + 4x + y

`2(x, y)

= f2(2, 1/2) +∂

∂xf2(2, 1/2)(x− 2) +

∂yf2(2, 1/2)(y − 1/2)

= 0 + 1/2(x− 2) + 2(y − 1/2)= −2 + 1/2x + 2y.

Das zu lösende lineare Gleichungssystem

`1(x, y) = 0`2(x, y) = 0

ist nun

4x + y = 33/41/2x + 2y = 2.

Die Lösung istx = 29/15 ≈ 1.93, y = 31/60 ≈ 0.52. Damit ist man nachnur zwei Iterationen schon sehr nah bei einer Lösung des ursprünglichennichtlinearen Gleichungssystems.�

Das eindimensionale Newton Verfahren ließ sich kompakt in der Form

xn+1 = xn −f(xn)f ′(xn)

schreiben. Eine ähnliche Notation ist auch für das mehrstellige Newton Verfahren mög-lich. Hierzu wird zunächst die vektorielle Schreibweise eingeführt:

~f(~x) =

f1(x1, x2, . . . , xn)f2(x1, x2, . . . , xn)

...fn(x1, x2, . . . , xn)

.

Zu lösen ist also das Gleichungssystem

~f(~x) = ~0.

Als nächstes werden die partiellen Ableitungen vonf1, f2, . . . , fn zu einer Matrix zu-sammengefaßt. Diese Matrix heißt Jacobi Matrix von~f .

Page 108: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 108

Definition 3.73 (Jacobi Matrix)Die Jacobi Matrix von ~f ist

J~f (~x) =

∇f1(~x)∇f2(~x)

...∇fn(~x)

=

∂x1f1(~x) ∂

∂x2f1(~x) . . . ∂

∂xnf1(~x)

∂∂x1

f2(~x) ∂∂x2

f2(~x) . . . ∂∂xn

f2(~x)...

.... . .

...∂

∂x1fn(~x) ∂

∂x2fn(~x) . . . ∂

∂xnfn(~x)

.

Die i-te Zeile der Jacobi Matrix ist also nichts anderes als der Gradient vonfi. DieLinearisierung i(~x) von fi(~x) an der Stelle~p lässt sich unter Verwendung des Gradi-enten schreiben als

`i(~x) = fi(~p) +∇fi(~p)(~x− ~p).

Faßt man nun auch die Linearisierungen zu einem Vektor zusammen, erhält man

~(~x) =

`1(~x)`2(~x)

...`n(~x)

=

f1(~p) +∇f1(~p)(~x− ~p)f2(~p) +∇f2(~p)(~x− ~p)

...fn(~p) +∇fn(~p)(~x− ~p)

=

f1(~p)f2(~p)

...fn(~p)

+

∇fi(~p)∇f2(~p)

...∇fn(~p)

(~x− ~p)

= ~f(~p) + J~f (~p)(~x− ~p).

Das lineare Gleichungssystem~(~x) = ~0

Page 109: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 109

lässt sich nun unter Verwendung der inversen Jacobi Matrix wie folgt auflösen:

~f(~p) + J~f (~p)(~x− ~p) = ~0

J~f (~p)(~x− ~p) = −~f(~p)

~x− ~p = −(J~f (~p)

)−1~f(~p)

~x = ~p−(J~f (~p)

)−1~f(~p).

Damit lässtt sich die Iterationsvorschrift des mehrstelligen Newton Verfahrens kompaktschreiben durch

~xn+1 = ~xn −(J~f (~xn)

)−1~f(~xn).

Vergleicht man diese Vorschrift mit dem eindimensionalen Newton Verfahren

xn+1 = xn −f(xn)f ′(xn)

so stellt man fest, dass lediglich die Division durchf ′(xn) durch die Multiplikation

mit(J~f (~xn)

)−1

ersetzt wurde. Die Bedingung, dassf ′(xn) 6= 0 ist, entspricht im

mehrdimensionalen Fall der Bedingung, dass die Jacobi Matrix regulär ist.

3.7.6 Mehrstellige Taylor Polynome zweiten Grades

Taylor Polynome lassen sich nicht nur wie in Kapitel 3.5.2 gezeigt für einstellige Funk-tionenf ∈ Rn → R berechnen sondern völlig analog auch für mehrstellige Funktio-nenf ∈ Rn → R. Da die Anzahl der Koeffizienten eines Polynoms sehr stark mitdem Grad wächst, beschränken wir uns auf Polynome mitn Variablen vom Grad zwei.Beginnen wir mit dem einfachsten Falln = 2. Solch ein Polynom hat die allgemeineForm

p(x, y) = a0 + a1x + a2y + a3x2 + a4y

2 + a5xy.

Die Koeffizientena0, . . . , a5 sollen nun so berechnet werden, dassp(x, y) eine guteApproximation anf(x, y) in der Nähe des Punktes(x, y) ist. Wie im eindimensionalenFall wird die Berechnung der Koeffizienten einfacher wenn man von dem Ansatz

p(x, y) = a0 + a1(x− x) + a2(y− y) + a3(x− x)2 + a4(y− y)2 + a5(x− x)(y− y)

ausgeht. Für dieses Polynom werden folgende Bedingungen gefordert:

p(x, y) = f(x, y)px(x, y) = fx(x, y)py(x, y) = fy(x, y)

pxx(x, y) = fxx(x, y)pyy(x, y) = fyy(x, y)pxy(x, y) = fxy(x, y)pyx(x, y) = fyx(x, y).

Page 110: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 110

Die Indizes an den Funktionen drücken hierbei partielle Ableitungen aus, also z.B.

fy(x, y) =∂

∂yf(x, y)

bzw.

fxy(x, y) =∂

∂x

∂yf(x, y).

Wenn man genau nachzählt, stellt man fest dass man nur 6 unbekannte Koeffizientena0, . . . a5 hat aber 7 Gleichungen! Das System ist trotzdem immer eindeutig lösbar,denn die letzte Gleichung ist redundant. Es gilt nämlichfxy = fyx und pxy = pyx,d.h. ob man zuerst nachx und dann nachy ableitet oder umgekehrt ist egal:

Theorem 3.74Für alle zweimal partiell differenzierbare Funktionen f ∈ R2 → R gilt

∂x

∂yf(x, y) =

∂y

∂xf(x, y).

Beweis. Seif ∈ R2 → R zweimal partiell differenzierbar. Dann gilt

∂x

∂yf(x, y)

=∂

∂xfy(x, y)

=fy(x + dx, y)− fy(x, y)

dx

=1dx

(f(x + dx, y + dy)− f(x + dx, y)

dy− f(x, y + dy)− f(x, y)

dy

)=

f(x + dx, y + dy)− f(x + dx, y)− f(x, y + dy) + f(x, y)dxdy

=f(x + dx, y + dy)− f(x, y + dy)− f(x + dx, y) + f(x, y)

dxdy

=1dy

(f(x + dx, y + dy)− f(x, y + dy)

dx− f(x + dx, y)− f(x, y)

dx

)=

fx(x, y + dy)− fx(x, y)dy

=∂

∂y

∂xf(x, y)

Page 111: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 111

Lassen wir die letzte Gleichung also einfach weg und machen uns an die Lösung. Zu-nächst die partiellen Ableitungen vonp(x, y):

p(x, y) = a0 + a1(x− x) + a2(y − y) +a3(x− x)2 + a4(y − y)2 + a5(x− x)(y − y)

px(x, y) = a1 + 2a3(x− x) + a5(y − y)py(x, y) = a2 + 2a4(y − y) + a5(x− x)

pxx(x, y) = 2a3

pyy(x, y) = 2a4

pxy(x, y) = a5.

Auswerten an der Stellex = x undy = y ergibt

p(x, y) = a0

px(x, y) = a1

py(x, y) = a2

pxx(x, y) = 2a3

pyy(x, y) = 2a4

pxy(x, y) = a5.

Aus den Bedingungen wird somit

f(x, y) = a0

fx(x, y) = a1

fy(x, y) = a2

fxx(x, y) = 2a3

fyy(x, y) = 2a4

fxy(x, y) = a5.

Löst man diese Gleichungen nach den unbekanntenai auf, erhält man

a0 = f(x, y)a1 = fx(x, y)a2 = fy(x, y)

a3 =12fxx(x, y)

a4 =12fyy(x, y)

a5 = fxy(x, y).

Das Taylor Polynom vonf(x, y) zum Entwicklungspunktx, y ist also

p(x, y) = f(x, y) + fx(x, y)(x− x) + fy(x, y)(y − y) +12fxx(x, y)(x− x)2 +

12fyy(x, y)(y − y)2 + fxy(x, y)(x− x)(y − y).

Page 112: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 112

Um das ganze optisch etwas aufzubereiten erinnern wir uns an die Tatsache dass

fxy(x, y) = fyx(x, y)

Damit gilt

p(x, y) = f(x, y) + fx(x, y)(x− x) + fy(x, y)(y − y) +12

(fxx(x, y)(x− x)2 + fyy(x, y)(y − y)2 +

fxy(x, y)(x− x)(y − y) + fyx(x, y)(x− x)(y − y))

= f(x, y)︸ ︷︷ ︸f(~c)

+(fx(x, y), fy(x, y)

)︸ ︷︷ ︸∇f(~c)

(x− xy − y

)︸ ︷︷ ︸

~x− ~c

+

12(x− x, y − y

)︸ ︷︷ ︸(~x− ~c)T

(fxx(x, y) fxy(x, y)fyx(x, y) fyy(x, y)

)︸ ︷︷ ︸

Hf (~c)

(x− xy − y

)︸ ︷︷ ︸

~x− ~c

= f(~c) +∇f(~c)(~x− ~c) +12(~x− ~c)T Hf (~c)(~x− ~c)

wobei

~x =(

xy

), ~c =

(xy

)und Hf (~c) =

(fxx(~c) fxy(~c)fyx(~c) fyy(~c)

)die Hesse Matrix vonf an der Stelle~c ist. Da die Reihenfolge der partiellen Ableitun-gen keine Rolle spielt, ist die Hesse Matrix immer symmetrisch.

In der oben hergeleiteten Form lässt sich das Taylor Polynom zweiten Gradesunmittelbar aufn-stellige Funktionen verallgemeinern:

Page 113: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 113

Merkregel 3.75Das Taylor Polynom zweiten Grades p ∈ Rn → R von f ∈ Rn → R zumEntwicklungspunkt ~c ∈ Rn ist

p(~x) = f(~c) +∇f(~c)(~x− ~c) +12(~x− ~c)T Hf (~c)(~x− ~c)

wobei

∇f(~c) =(

∂x1f(~c),

∂x2f(~c), . . . ,

∂xnf(~c)

)

Hf (~c) =

∂2

∂x1x1f(~c)

∂2

∂x1x2f(~c) . . .

∂2

∂x1xnf(~c)

∂2

∂x2x1f(~c)

∂2

∂x2x2f(~c) . . .

∂2

∂x2xnf(~c)

......

. . ....

∂2

∂xnx1f(~c)

∂2

∂xnx2f(~c) . . .

∂2

∂xnxnf(~c)

.

3.7.7 Ausgleichsrechnung

In der Praxis werden häufig Probleme folgender Art gestellt:

� � ����������

��� ������������������ ������

�! "�#�$

Abbildung 3.19: Unbekanntes System als Funktion modelliert.

Von einem unbekannten System mit einem Input und einem Output (siehe Bild 3.19)sind folgende Messwerte gegeben:

Page 114: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 114

i x(i) y(i)

1 −2 −32 1 −23 4 14 7 4

-2 2 4 6

-2

2

4

Gesucht ist eine einfache Funktionf ∈ R→ R so dass

f(x(i)) ≈ y(i) für alle Messwertei

wobei der Fehler möglichst klein sein soll.

Das Problem ist in dieser Form natürlich nicht eindeutig lösbar. Es ist nicht klar,was man unter einer “einfachen” Funktion oder einem “möglichst kleinen Fehler” zuverstehen hat. Letzteres wird in der Regel dadurch konkretisiert, dass man fordert, dassder mittlere quadratische Fehler

4∑i=1

(f(x(i))− y(i)

)2

minimal sein soll. Als “einfache” Funktionen werden in der Regel Polynome mit nied-rigem Grad herangezogen, also z.B.

f(x) = ax + b.

Gesucht sind dann die Parametera undb so dass

4∑i=1

(ax(i) + b− y(i)

)2

minimal ist. In dieser Form ist das Problem eindeutig lösbar und man erhält

a = 0.8, b = −2, f(x) = 0.8x− 2.

Diese Funktion nennt man auch Ausgleichsgerade, siehe Bild 3.20 links.

Eine genauere Approximation kann man erreichen, wenn man ein Polynom höhe-ren Grades nimmt, z.B.

f(x) = ax2 + bx + c.

die Lösung ist in diesem Fall

a = 0.056, b = 0.52, c = −2.28, f(x) = 0.056x2 + 0.52x− 2.28.

Page 115: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 115

��

-2 2 4 6

-2

2

4

-2 2 4 6

-2

2

4

� �

Abbildung 3.20: Ausgleichsgerade und Ausgleichsparabel

Diese Funktion nennt man auch Ausgleichsparabel, siehe Bild 3.20 rechts.

Man kann das beschriebene Problem also immer auf die Berechnung von Parame-tern reduzieren, die die Gleichungen

f(x(i)) = y(i)

mit möglichst kleinem Fehler erfüllen. Da es in der Regel mehr Gleichungen als Un-bekannte gibt, liegt ein überbestimmtes Gleichungssystem vor. Im Folgenden wird ge-zeigt, wie man diese Parameter berechnen kann. Überraschenderweise kann man dasProblem immer auf ein überbestimmteslinearesGleichungssystem reduzieren, selbstwennf(x) nichtlinear ist. Die einzige Voraussetzung ist, dassf(x) die Form

f(x) = a1f1(x) + a2f2(x) + . . . + anfn(x)

hat, wobei die Funktionenfi(x) beliebig nichtlinear sein dürfen. Im oben betrachtetenSpezialfall wennf(x) ein Polynom ist, ist

f1(x) = 1, f2(x) = x, . . . , fn(x) = xn−1.

Das Verfahren funktioniert übrigens völlig analog wenn man Systeme mit mehrerenInputs hat, d.h.

f(~x) = a1f1(~x) + a2f2(~x) + . . . + anfn(~x).

Man kann die gefundene Funktionf(~x) als Modell des unbekannten Systems betrach-ten. Die Ausgleichsrechnung ist also ein Instrument, mit dem man einfache mathe-matische Modelle von komplexen Systemen konstruieren kann, von denen lediglichMesswerte bekannt sind.

Und nun zur Berechnung der Parameterai. Im allgemeinsten Fall hat man Messwer-te

~x(i) ∈ Rn, y(i) ∈ R, i = 1, . . . ,m

Page 116: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 116

und eine parametrische Funktion

y = a1f1(~x) + a2f2(~x) + . . . + anfn(~x).

wobei diefj(~x) ∈ Rn → R fest gewählte Funktionen sind. Im allgemeinen hat manmehr Messwerte als unbekannte Parameter, d.h.m > n. Setzt man die Messwerte indie Gleichung ein, erhält man ein überbestimmteslinearesGleichungssystem mit denUnbekanntena1, . . . , an:

y(1) = a1f1

(~x(1)

)+ a2f2

(~x(1)

)+ . . . + anfn

(~x(1)

)y(2) = a1f1

(~x(2)

)+ a2f2

(~x(2)

)+ . . . + anfn

(~x(2)

)...

y(m) = a1f1

(~x(m)

)+ a2f2

(~x(m)

)+ . . . + anfn

(~x(m)

).

Dies lässt sich etwas kompakter in vektorieller Schreibweise darstellen:y(1)

y(2)

...y(m)

︸ ︷︷ ︸

~b

=

f1

(~x(1)

)f2

(~x(1)

). . . fn

(~x(1)

)f1

(~x(2)

)f2

(~x(2)

). . . fn

(~x(2)

)...

......

...f1

(~x(m)

)f2

(~x(m)

). . . fn

(~x(m)

)

︸ ︷︷ ︸A

a1

a2

...an

︸ ︷︷ ︸

~x

Um die Notation zu vereinfachen, verwenden wir ab dieser Stelle wieder die in derlinearen Algebra üblichen Symbole. Im Folgenden ist alsoA ∈ Rm×n die Koeffizien-tenmatrix,~b ∈ Rm die rechte Seite und~x ∈ Rn ist der gesuchte Parametervektor. Dadas lineare Gleichungssystem mehr Gleichungen als Unbekannte hat (überbestimm-tes LGS), ist es im allgemeinen nicht lösbar. Man sucht daher nach der Lösung mitminimalem quadratischen Fehler, d.h. den Vektor~x ∈ Rn, für den

||A~x−~b||2

minimal ist. Sei~r = A~x−~b.

Genau genommen müsste man~r(~x) schreiben, da ja~r von~x abhängt. Behalten wir daseinfach im Kopf und sparen uns die Schreiberei. Gesucht ist also das Minimum derFunktione ∈ Rn → R mit

e(~x) = ||A~x−~b||2

= ||~r||2

=m∑

i=1

r2i

Am Minimum müssen alle partiellen Ableitungen vone Null sein, d.h.

∂xje(~x) = 0 j = 1, . . . , n.

Page 117: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 117

Allgemein lässt sich die partielle Ableitung vone nachxj wie folgt berechnen:

∂xje(~x) =

∂xj

m∑i=1

r2i

=m∑

i=1

∂xjr2i

=m∑

i=1

2ri∂

∂xjri.

Eine kleine Nebenrechnug für die innere Ableitung:

ri = (A~x− b)i

= ai1x1 + ai2x2 + . . . + ainxn − bi

∂xjri =

∂xjai1x1 + ai2x2 + . . . + ainxn − bi

= aij

Damit ist

∂xje(~x) =

m∑i=1

2riaij

= 0

Den Faktor 2 kann man auf beiden Seite kürzen und erhältm∑

i=1

aijri = 0

bzw. vektoriell geschrieben

(a1j , a2j , . . . , amj)~r = 0.

Schreibt man diese Gleichung fürj = 1, . . . ,m untereinander, erhält man

(a11, a21, . . . , am1)~r = 0(a12, a22, . . . , am2)~r = 0

...

(a1n, a2n, . . . , amn)~r = 0

Dies lässt sich wieder zusammenfassen zua11 a21 . . . am1

a12 a22 . . . am2

......

......

a12 a22 . . . amn

︸ ︷︷ ︸

AT

~r = ~0

Page 118: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 118

Bei genauem Hinschauen erkennt man, dass die Matrix auf der linken Seite gleichAT

ist. Erinnert man sich dann noch, dass

~r = A~x−~b

ist, erhält man die GleichungAT (A~x−~b) = ~0.

Umformen ergibt das lineare Gleichungssystem

AT A~x = AT~b.

Diese Gleichungen heißen auch Normalgleichungen. Es ist ein LGS mitn Gleichungenundn Unbekannten, denn

AT A ∈ Rn×n, AT~b ∈ Rn.

Ist alsoAT A regulär, hat das LGS genau eine Lösung. Diese Lösung muss ein globalesMinimum sein, da~e beliebig groß wird, wenn die Komponenten von~x gegen unendlichgehen. Die Regularität vonAT A ist erfüllt wenn die Anzahl der linear unabhängigenZeilen vonA mindestens so groß ist wie die Anzahl der linear unabhängigen Spalten.Liegen die Messwerte also nicht gerade besonders ungünstig (z.B. aufeinander), dannhat das Ausgleichsproblem eine eindeutige Lösung.

Bemerkung. Mit etwas Mut schreibt man direkt

∂~xA~x−~b = AT

∂~x||A~x−~b||2 = 2AT (A~x−~b).

Man erkennt, dass das im Prinzip genau die Kettenregel in vektorieller Form ist.

Für das eingangs beschriebene Problem der Berechnung der Ausgleichsparabel erhältman das überbestimmte LGS

1 −2 41 1 11 4 161 7 49

︸ ︷︷ ︸

A

abc

︸ ︷︷ ︸

~x

=

−3−214

.

︸ ︷︷ ︸~b

Die Normalgleichungen sind 4 10 7010 70 40070 400 2674

︸ ︷︷ ︸

AT A

abc

︸ ︷︷ ︸

~x

=

036198

︸ ︷︷ ︸

AT~b

mit der Lösunga = −2.28, b = 0.522, c = 0.0556

Page 119: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 119

Bemerkung. Dass die Koeffizientenmatrix der Normalgleichungen symmetrisch ist,ist kein Zufall. Allgemein gilt

(AT A)T = AT AT T= AT A.

Man kann sich daher Aufwand bei der Berechnung vonAT A sparen und au-ßerdem spezielle Algorithmen wie z.B. die Cholesky Zerlegung für die Lösunglinearer Gleichungssysteme mit symmetrischer Koeffizientenmatrix anwenden.Da bei der Berechnung vonAT A unter Umständen große Rundungsfehler auftre-ten, gibt es auch Verfahren, die das Ausgleichsproblem lösen ohneAT A explizitzu berechnen. Erwähnt sei in diesem Zusammenhang die QR Zerlegung.

Beispiel 3.76 Zum Schluss noch ein Beispiel aus der Praxis. Farben lassn sich alsLinearkombination der drei Grundfarben rot, grün und blau beschreiben. Bei dengängigen Bildformaten werden daher für jeden Pixel drei Zahlenr, g, b angege-ben, die bestimmen wie stark die jeweiligen Grundfarben präsent sind. Möchteman ein Farbbild auf einem Grauwertdrucker ausgeben, müssen die Farben inGrauwerte umgerechnet werden, d.h. man sucht eine Funktion

y = f(r, g, b)

wobeiy der entsprechende Grauwert einer Farbe mit rot/grün/blau Anteilr, g, bist. Um diese Funktion zu ermitteln kann man sich Beispiele von Farben aussu-chen und festlegen, in welchen Grauwert diese konvertiert werden sollen. Manerhält auf diese Weise Daten

r(i), g(i), b(i), y(i), i = 1, . . . ,m.

Legt man einen quadratischen Zusammenhang zwischen Farben und Grauwertenzugrunde, erhält man den Ansatz

y = a1 + a2r + a3g + a4b + a5r2 + a6g

2 + a7b2 + a8rg + a9rb + a10gb.

Die Koeffizientena1, . . . , a10 lassen sich nun wie oben beschrieben mit der Aus-gleichsrechnung bestimmen.

Farbdrucker verwenden i.a. nicht dier, g, b Codierung sondern4 Wertec,m, y, k zur Beschreibung einer Farbe. Es handelt sich um eine subtraktiveFarbmischung ausc (cyan),m (magenta) undy (yellow). Der zusätzliche Pa-rameterk gibt die Helligkeit an. Diese redundante Codierung hat einen rein öko-nomischen Grund: Schwarze Tinte ist billiger als farbige und so mischt man mandunklen Farben etwas schwarz bei und kann damit teure Farbtinte sparen. Für dieUmrechung von(r, g, b) nach(c,m, y, k) braucht man nun4 Funktionen:

c = fc(r, g, b)m = fm(r, g, b)y = fy(r, g, b)k = fk(r, g, b)

Page 120: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 120

Liegen Messwerte vor, kann man jede einzelne Funktion separat durch Aus-gleichsrechnung bestimmen. Die Modellierung eines Systems

f ∈ Rn → Rm

lässt sich also einfach zurückführen aufm Systeme

f ∈ Rn → R. �

Page 121: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 121

4 Integralrechnung

Im vorigen Kapitel haben wir uns damit beschäftigt zu einer gegebenen Funktionf(x)die Ableitungf ′(x) zu finden. In diesem Kapitel geht’s um das umgekehrte Problem:Gegeben ist eine Funktionf(x) und gesucht ist eine FunktionF (x), deren AbleitungF ′(x) gleichf(x) ist. Eine solche FunktionF (x) heißt Stammfunktion vonf(x). Istz.B.

f(x) = x2

so ist

F (x) =13x3

eine Stammfunktion vonf(x), denn

F ′(x) =13

3x2 = x2 = f(x).

Andererseits ist aber auch

F (x) =13x3 + 7

eine Stammfunktion vonf(x), denn auch hier giltF ′(x) = f(x). Der Grund ist, dassdie Konstante 7 bei der Ableitung vonF sang und klanglos verschwindet.Allgemein gilt, dass wennF (x) eine Stammfunktion vonf(x) ist, auchF (x) + c eineStammfunktion vonf(x) ist für jede beliebige Konstantec ∈ R. Während also eineFunktion immer nur eine eindeutig bestimmte Ableitung hat, gibt es mehrere verschie-dene Stammfunktionen, die sich durch eine additive Konstante unterscheiden.

Definition 4.1 (Stammfunktion, unbestimmtes Integral)Eine differenzierbare Funktion F ∈ D → R heißt Stammfunktion oder un-bestimmtes Integral einer Funktion f ∈ D → R wenn F ′(x) = f(x) für allex ∈ R.

Theorem 4.2Ist F (x) eine Stammfunktion von f(x) dann ist für jedes c ∈ R auch F (x)+ceine Stammfunktion von f(x).

Page 122: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 122

Beispiel 4.3 Funktionen mit einer zugehörigen Stammfunktion sind z.B.

f(x) = k F (x) = kx

f(x) = xn, n 6= −1 F (x) =xn+1

n + 1f(x) = 1/x F (x) = ln(|x|)f(x) = ex F (x) = ex

f(x) = sin(x) F (x) = − cos(x)f(x) = cos(x) F (x) = sin(x)

f(x) = |x| F (x) ={

x2/2 falls x ≥ 0−x2/2 falls x < 0

Wie erwähnt ist mitF (x) auch jede FunktionF (x)+ c für beliebigesc ∈ R eineStammfunktion vonf .

4.1 Herleitung des Integrals durch Flächenberechnung

Viele Ingenieursprobleme laufen auf die Berechnung einer Stammfunktion hinaus. Alseinführendes Beispiel betrachten wir hierzu die Berechnung einer FlächeA(x) untereiner Kurvef(x) zwischenx = 0 undx = x, siehe Bild 4.1.Betrachten wir zunächst den einfachen Spezialfallx = 0. Dann ist der FlächeninhaltoffensichtlichA(x) = 0. Da man nunA(x) zumindest an einer Stellex kennt, kannman sich als nächstes fragen, welchen WertA(x) an der Stellex = x + h annimmt.Gemäß Bild 4.1 kann manA(x + h) wie folgt eingrenzen:

A(x + h) ≥ A(x) + hf(x)A(x + h) ≤ A(x) + hf(x + h).

Für den Flächenzuwachs zwischenx undx + h gilt also

A(x + h)−A(x) ≥ hf(x)A(x + h)−A(x) ≤ hf(x + h).

Nach Division durchh erhält man

A(x + h)−A(x)h

≥ f(x)

A(x + h)−A(x)h

≤ f(x + h).

Als nächstes führt man auf beiden Seiten den Grenzübergangh→ 0 durch. Wennf ander Stellex stetig ist, so gilt

limh→0

f(x + h) = f(x)

Page 123: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 123

��

�������

�� ����

����������

�������� ��!

"�#�$�%&�' "�(

)+*�,-/.

0+1�23/4

5687:9

;<8=:>

?�@�ABDC

Abbildung 4.1: Berechnung des Flächeninhalts unter einer Kurvef(x) zwischenx = 0undx = x

Page 124: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 124

und somit

limh→0

A(x + h)−A(x)h

≥ f(x)

limh→0

A(x + h)−A(x)h

≤ f(x).

Hieraus folgt

limh→0

A(x + h)−A(x)h

= f(x).

Der Ausdruck auf der linken Seite ist nichts anderes als die Ableitung vonA an derStellex, d.h.

A′(x) = f(x).

Da dies für beliebigex gilt, muss die FunktionA allgemein die Bedingung

A′(x) = f(x)

erfüllen, d.h.A ist eine Stammfunktion vonf . Damit istA aber nur bis auf eine additiveKonstante genau bestimmt! Sei nunF eine beliebige Stammfunktion vonf . Dann ist

A(x) = F (x) + c

für einen noch zu bestimmenden Wertc. Um c zu berechnen führt man die anfangserwähnte Zusatzbedingung

A(0) = 0

ins Feld und erhält

A(0) = F (0) + c = 0,

d.h.c = −F (0).

Somit istA(x) = F (x)− F (0).

Beispiel 4.4 Gesucht ist der Flächeninhalt unter der Funktionf(x) = ex zwischenx = 0 undx = 1. Eine Stammfunktion vonf(x) ist z.B.

F (x) = ex.

Die Funktion, die den Flächeninhalt unterf zwischen0 und x beschreibt, istsomit

A(x) = F (x)− F (0)= ex − e0

= ex − 1.

Somit ist der gesuchte Flächeninhalt

A(1) = e− 1.

Page 125: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 125

Beispiel 4.5 Hätte man im vorigen Beispiel mit einer andern Stammfunktion ge-rechnet, z.B.

F (x) = ex + 3,

so wäre man zum selben Ergebnis gekommen:

A(x) = F (x)− F (0)= ex + 3− (e0 + 3)= ex + 3− e0 − 3= ex − 1,

d.h.A(1) = e− 1.

Beispiel 4.6 Zu beachten ist, dass nach dieser Methode der Flächenberechnung Flä-cheninhalte unter derx-Achse negativ gezählt werden. Der Flächeninhalt unterder Funktionf(x) = x − 1 zwischenx = 0 undx = 1 ist daher negativ! EineStammfunktion vonf(x) ist z.B.

F (x) = x2/2− x

und somit

A(x) = F (x)− F (0)= x2/2− x.

A(1) = 1/2− 1= −1/2.

Beispiel 4.7 Gesucht ist der Flächeninhalt unter der Funktionf(x) = sin(x) zwi-schenx = 0 undx = 2π. Eine Stammfunktion vonf(x) ist z.B.

F (x) = − cos(x).

Der Flächeninhalt ist somit

A(x) = F (x)− F (0)= − cos(x) + cos(0)= 1− cos(x).

A(2π) = 1− cos(2π)= 1− 1= 0.

Dies liegt daran, dass der positive Flächeninhalt über derx-Achse zwischenx =0 undx = π gleich groß ist wie der negative Flächeninhalt unter derx-Achsezwischenx = π undx = 2π, siehe Bild 4.2.

Page 126: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 126

���������

� � ��������������������� �!�"

Abbildung 4.2: Fläche unter der Sinusfunktion zwischen0 und2π ist Null.

�������

�� � �

��������� ��������� �!������"�

Abbildung 4.3: Berechnung des Flächeninhalts unter einer Kurvef(x) zwischenx =x0 undx = x1

Um den Flächeninhalt unter einer Kurvef(x) zwischen zwei Punktenx = x0 undx = x1 zu berechnen, kann man so vorgehen, dass man zuerst den FlächeninhaltA(x1)zwischenx = 0 und x = x1 berechnet und von diesem den FlächeninhaltA(x0)zwischenx = 0 und x = x0 subtrahiert, siehe Bild 4.3. Mit Hilfe einer beliebigenStammfunktionF (x) von f(x), läßt sich der Flächeninhalt zwischenx = x0 undx = x1 somit wie folgt berechnen:

A(x1)−A(x0) =(F (x1)− F (0)

)−(F (x0)− F (0)

)= F (x1)− F (x0).

Page 127: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 127

Notation 4.8Häufig verwendet man ∫

f(x)dx

als Bezeichnung für eine Stammfunktion von f . Man nennt dies auch unbe-stimmtes Integral von f , weil diese Funktion nur bis auf eine additive Kon-stante genau bestimmt ist.

Ist F ∈ D → R eine Stammfunktion von f ∈ D → R und [x0, x1] ⊆ D soschreibt man ∫ x1

x0

f(x)dx =[F (x)

]x1

x0

= F (x1)− F (x0)

Man nennt dies bestimmtes Integral von f zwischen x0 und x1, da dieserWert unabhängig davon ist, welche Stammfunktion von f verwendet wird.Die Zahlen x0 und x1 werden auch Integrationsgrenzen genannt.

Theorem 4.9Für jede Stammfunktion F ∈ D → R von f ∈ D → R und jedes Intervall[x0, x1] ⊆ D ist der Flächeninhalt unter der Kurve f(x) zwischen x0 und x1

durch das bestimmte Integral

F (x1)− F (x0) =∫ x1

x0

f(x)dx

gegeben. Dabei ist darauf zu achten, dass der Flächeninhalt unter der x-Achsenegativ gerechnet wird.

Bemerkung. Genau genommen beschreibt der Ausdruck∫

f(x)dx die Menge allerStammfunktionen vonf(x), also z.B.∫

x2dx ={

x3

3+ c | c ∈ R

}.

Häufig schreibt man als Abkürzung dafür auch∫x2dx =

x3

3+ c

und nenntc Integrationskonstante. Um Schreibaufwand zu sparen läßt man dieIntegrationskonstante manchmal einfach weg und schreibt∫

x2dx =x3

3

obwohl dies genau genommen nicht richtig ist.

Page 128: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 128

Beispiel 4.10 Zur Berechnung des bestimmten Integrals∫ 5

1

x2dx

sucht man zunächst eine Stammfunktion vonf(x) = x2. Diese ist z.B.

F (x) = x3/3.

Damit erhält man ∫ 5

1

x2dx =[x3/3

]51

= 125/3− 1/3= 124/3.

Beispiel 4.11 SeiD = R \ {0} und

f ∈ D → R, f(x) = 1/x2.

Eine Stammfunktion vonf ist z.B.

F ∈ D → R, F (x) = −1/x.

Somit berechnet man z.B.∫ 1

−1

1/x2dx =[− 1/x

]1−1

= −1− (−1)= −2.

Am Schaubild vonf im Intervall [−1, 1] erkennt man jedoch, dass der Flächen-inhalt unmöglich negativ sein kann — in der Tat ist er sogar unendlich groß. DerFehler ist hier, dass

[−1, 1] 6⊆ D,

was aber von Theorem 4.9 gefordert ist. Man darf also nicht so ohne Weiteresüber Definitionslücken wegintegrieren!

4.2 Interpretation der Integralschreibweise als unendliche Summe

Kommen wir auf das Problem der Flächenberechnung zurück. Unter Umgehung einerStammfunktion könnte man die Fläche unterf(x) zwischenx0 undx1 näherungsweiseauch dadurch berechnen, dass man das Intervall[x0, x1] in n Streifen der Breite

∆x =x1 − x0

n

Page 129: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 129

�������

����� �����������

����������� �

!#"�$�%

&�')(+* ,-�.0/

Abbildung 4.4: Berechnung des Flächeninhalts unter einer Kurvef(x) zwischenx =x0 undx = x1

zerlegt, deren Grenzen an den Punkten

x(i) = x0 + i∆x, i = 0, 2, . . . , n

liegen, siehe Bild 4.4. Wenn die Streifen hinreichend schmal sind, kann man deni-tenStreifen näherungsweise durch ein Rechteck approximieren mit dem Flächeninhalt

A(i) = f(x(i))∆x.

Summiert man die Flächeninhalte aller Rechtecke auf, erhält man

A(x1)−A(x0) ≈n−1∑i=0

A(i)

=n−1∑i=0

f(x(i))∆x.

Für großen erhält man hierdurch eine sehr gute Näherung an den exakten Flächeninhaltund es gilt

A(x1)−A(x0) = limn→∞

n−1∑i=0

f(x(i))∆x.

In diesem Ausdruck liegt die Schreibweise für das Integral begründet. Beim Grenz-übergang wird aus dem Summenzeichen (Σ ist der griechische Buchstabe für “S”) einIntegralzeichen (

∫ist letztlich auch nichts anderes als ein “S”) und∆x wird immer

kleiner und schließlich ein Differentialdx. Somit erhält man

limn→∞

n−1∑i=0

f(x(i))∆x =∫ x1

x0

f(x)dx.

Page 130: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 130

4.3 Integrationsregeln

Die Berechnung einer Stammfunktion ist wesentlich schwieriger als die Berechnungder Ableitung. Glücklicherweise muss man heute Stammfunktionen nicht mehr vonHand ausrechnen sondern kann hierzu Maple oder ähnliche Programmen benutzen.Möchte man z.B. eine Stammfunktion vonsin(x)2 berechnen, gibt man

> int(sin(x)^2,x);

ein und erhält

> 1/2 x - 1/2 sin(x) cos(x)

Ohne Weiteres wäre man auf dieses Ergebnis wahrscheinlich nicht gekommen, mankann es aber leicht verifizieren indem man1/2x− 1/2 sin(x) cos(x) ableitet und fest-stellt, dass tatsächlichsin(x)2 rauskommt.

Auch wenn einem der Rechner das Problem der Berechnung einer Stammfunktionoder eines bestimmten Integrals abnimmt, sollte man doch wenigstens eine ungefähreVorstellung haben welche Verfahren dahinterstecken. Oft ist es ziemlich überraschendwelche Stammfunktionen herauskommen: So ist z.B.∫

11 + x2

dx = arctan(x).

In diesem Kapitel wird gezeigt, dass man dies nicht einfach glauben muss sonderntatsächlich auch nachrechnen kann.

4.3.1 Elementare Integrationsregeln

• Bei der Ableitung darf man einen konstanten Faktor herausziehen, d.h.(cf(x)

)′= cf ′(x).

Gleiches gilt auch beim Integral:∫c f(x)dx = c

∫f(x)dx.

Beispiel 4.12 ∫5x2dx = 5

x3

3

= 5∫

x2dx.

• Eine Summe wird abgeleitet indem man die Summanden jeweils für sich ableitet,d.h. (

f(x) + g(x))′

= f ′(x) + g′(x).

Gleiches gilt auch beim Integral:∫ (f(x) + g(x)

)dx =

∫f(x)dx +

∫g(x)dx.

Page 131: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 131

Beispiel 4.13∫(sin(x) + cos(x))dx =

∫sin(x)dx +

∫cos(x)dx

= − cos(x) + sin(x).

• Vertauscht man die Integrationsgrenzen, dann dreht sich das Vorzeichen um:∫ x1

x0

f(x)dx = F (x1)− F (x0)

= −(F (x0)− F (x1)

)= −

∫ x0

x1

f(x)dx.

Beispiel 4.14 ∫ 5

1

x2dx =[x3/3

]51

= 125/3− 1/3= 124/3∫ 1

5

x2dx =[x3/3

]15

= 1/3− 125/3= −124/3

• Summen kann man an einer beliebigen Zwischenstelle zerlegen und in zwei Teil-summen aufspalten. Gleiches gilt auch für das Integral. Für ein beliebigesx ∈ Rgilt ∫ x1

x0

f(x)dx =∫ x

x0

f(x)dx +∫ x1

x

f(x)dx.

Dies gilt insbesondere auch dann wennx nicht zwischenx0 undx1 liegt.

Beispiel 4.15 Möchte man ∫ 1

−1

|x|dx

berechnen, so integriert man zunächst von−1 bis 0 und dann von0 bis 1.Zwischen−1 und 0 ist |x| = −x, zwischen0 und 1 ist |x| = x. Damit

Page 132: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 132

erhält man ∫ 1

−1

|x|dx =∫ 0

−1

|x|dx +∫ 1

0

|x|dx

=∫ 0

−1

−xdx +∫ 1

0

xdx

=[− x2/2

]0−1

+[x2/2

]10

=(0− (−1/2)

)+(1/2− 0

)= 1.

Merkregel 4.16

∫c f(x)dx = c

∫f(x)dx∫ (

f(x) + g(x))dx =

∫f(x)dx +

∫g(x)dx∫ x1

x0

f(x)dx = −∫ x0

x1

f(x)dx∫ x1

x0

f(x)dx =∫ x

x0

f(x)dx +∫ x1

x

f(x)dx.

Aufgrund der ersten beiden Gleichungen sagt man ähnlich wie bei der Ableitung dassdas Integral eine lineare Operation ist.

4.3.2 Integration durch Substitution

Für die Berechnung einer Stammfunktion von zusammengesetzten Funktionen gibt esleider keine einfache Regel, die immer zum Ziel führt. Häufig läßt sich das Problemaber durch eine Umformung lösen.

Beispiel 4.17 Zu berechnen ist das unbestimmte Integral∫cos(1 + 3x)dx.

Hier geht man so vor, dass man eine geeignete Hilfsvariableg einführt. In diesemBeispiel wählt man

g = 1 + 3x.

Man kanng auch als Funktion vonx interpretieren und nachx ableiten. Hier-durch erhält man

dg

dx= 3.

Page 133: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 133

Diesen Ausdruck löst man nachdx auf.

dx =13dg.

Somit kann das Integral umgeschrieben werden in∫cos(1 + 3x)dx =

∫cos(g)dx

=∫

cos(g)13dg

=13

∫cos(g)dg

=13

sin(g)

=13

sin(1 + 3x).

Das allgemeine Prinzip zum Lösen eines Integrals∫f(x)dx

durch Substitution ist, dass man eine neue Variableg wählt und nachx ableitet. DenDifferentialquotienten

dg

dx= g′(x)

löst man nachdx auf

dx =dg

g′(x)und setzt dies im ursprünglichen Integral ein. Auf diese Weise erhält man∫

f(x)dx =∫

f(x)g′(x)

dg.

Um den Term auf der rechten Seite integrieren zu können müssen alle Vorkommen derVariablenx durch entsprechende Terme in der Variableng ersetzt werden. Es ist aller-dings keinesfalls garantiert, dass sich das Integral auf der rechten Seite dann leichterlösen läßt als das auf der linken Seite. Dies hängt wesentlich von einer geschicktenWahl vong ab.

Beispiel 4.18 Zur Berechnung von∫x2 cos(x3 + 4)dx

wählt man

g = x3 + 4dg

dx= 3x2

dx =dg

3x2.

Page 134: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 134

Damit erhält man∫x2 cos(x3 + 4)dx =

∫x2 cos(g)dx

=∫

x2 cos(g)dg

3x2

=13

∫cos(g)dg

=13

sin(g)

=13

sin(x3 + 4).

Beispiel 4.19 Zur Integration vonf(x) = tan(x) formt man zunächst um.∫tan(x)dx =

∫sin(x)cos(x)

dx.

Als Hilfsvariable wählt man nun

g = cos(x)dg

dx= − sin(x)

dx =dg

− sin(x).

Somit ist ∫sin(x)cos(x)

dx =∫

sin(x)g

dx

=∫

sin(x)g

dg

− sin(x)

= −∫

1gdg

= − ln(|g|)= − ln(| cos(x)|).

Wichtig war hier die Wahl der Hilfsvariableng = cos(x). Mit g = sin(x) hättees nicht funktioniert.

4.3.3 Produkt Integration

Nach Theorem 3.18 läßt sich die Ableitung vonf(x)g(x) nach der Regel(f(x)g(x)

)′= f ′(x)g(x) + f(x)g′(x)

Page 135: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 135

berechnen. Integriert man auf beiden Seiten, so erhält man

f(x)g(x) =∫

f ′(x)g(x)dx +∫

f(x)g′(x)dx.

Dies kann man wiederum umformen in∫f(x)g′(x)dx = f(x)g(x)−

∫f ′(x)g(x)dx.

Den Nutzen, den man aus dieser Übung zieht, ist dass wenn man ein Integral der Form∫f(x)g′(x)dx

zu berechnen hat, man dies umformen kann in

f(x)g(x)−∫

f ′(x)g(x)dx.

Das macht natürlich nur dann Sinn, wenn dadurch das Problem einfacher wird. Dies istbei geschickter Wahl vonf(x) undg′(x) aber oft der Fall. Als Faustregel sollte mandabeif(x) undg′(x) so wählen, dass die Ableitung vonf(x) und die Stammfunktionvong′(x) möglichst einfache Terme ergeben. Hierzu ein paar Beispiele.

Beispiel 4.20 Zu lösen ist das Integral∫xexdx.

Mit der Wahlf(x) = x, g′(x) = ex

erhält manf ′(x) = 1, g(x) = ex.

Somit ist ∫xexdx = xex −

∫1× exdx

= xex −∫

exdx

= xex − ex

= ex(x− 1).

Beispiel 4.21 Hätte man im vorigen Beispiel

f(x) = ex, g′(x) = x

gewählt, so hätte man

f ′(x) = ex, g(x) = x2/2

Page 136: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 136

erhalten. Damit kann man das Integral umformen in∫xexdx = exx2/2−

∫exx2/2dx,

was die Sache aber nicht einfacher macht. Es ist also durchaus wichtig, den rich-tigen Term mitf(x) bzw.g′(x) zu identifizieren.

Beispiel 4.22 Damit man die Produktregel zur Integration von∫ln(x)dx

Anwenden kann, führt man zuerst künstlich den Faktor 1 ein:∫ln(x)× 1dx.

Nun wählt manf(x) = ln(x), g′(x) = 1

und erhältf ′(x) = 1/x, g(x) = x.

Damit läßt sich das Integral umschreiben in∫ln(x)× 1dx = ln(x)x−

∫1x

xdx

= x ln(x)−∫

1dx

= x ln(x)− x.

Beispiel 4.23 Abschließend noch ein etwas längeres Beispiel. Zu berechnen ist∫x2 sin(x)dx.

Hier wählt man

f(x) = x2, g′(x) = sin(x)f ′(x) = 2x, g(x) = − cos(x).

Damit ist ∫x2 sin(x)dx = −x2 cos(x) + 2

∫x cos(x).

Als nächstes ist somit das Integral∫x cos(x)dx

Page 137: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 137

zu lösen. Auch hierfür wendet man Produkt Integration an, diesmal mit

f(x) = x, g′(x) = cos(x)f ′(x) = 1, g(x) = sin(x)

und erhält ∫x cos(x)dx = x sin(x)−

∫sin(x)dx

= x sin(x) + cos(x).

Nach dieser Nebenrechnung erhält man somit für das ursprüngliche Integral∫x2 sin(x)dx = −x2 cos(x) + 2

∫x cos(x)dx

= −x2 cos(x) + 2(x sin(x) + cos(x))= cos(x)(2− x2) + 2x sin(x).

4.4 Integration rationaler Funktionen

Eine rationale Funktion ist eine Funktion, die sich als Quotient zweier reeller Polynomeschreiben läßt.

Beispiel 4.24 Rationale Funktionen sind

f(x) =2x3 − x2 + 1

3x4 − x

f(x) =1

x2 + 1

f(x) =x− 1x + 1

.

Rationale Funktionen sind auf ganzR definiert außer dort wo der Nenner Nullstellenhat.Will man eine rationale Funktionen integrieren, so muss man diese zunächst geeignetumformen. Dies geschieht in zwei Schritten:

• Polynomdivision: Umformen in eine Summe aus einem Polynom und einer ra-tionalen Funktion, bei der das Zählerpolynom einen kleineren Grad hat als dasNennerpolynom.

• Partialbruchzerlegung: Zerlegen der übrig gebliebenen rationalen Funktion ineine Summe aus einfacheren rationalen Funktionen, deren Nennerpolynome dieForm(x− a)n haben.

Page 138: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 138

4.4.1 Polynomdivision

Sei

f(x) =a(x)b(x)

,

wobeia ∈ R[x] ein Polynom vom Gradn undb ∈ R[x] ein Polynom vom Gradm sei.Ist n ≥ m, so kann manf(x) durch Polynomdivision in die Form

f(x) = q(x) +r(x)b(x)

bringen, wobeiq ∈ R[x] ein Polynom vom Gradn − m und r ∈ R[x] ein Polynomvom Grad< m ist.

Beispiel 4.25 Sei

f(x) =a(x)b(x)

=8x3 − 2x2 + 1

2x + 1

Der Grad des Zählerpolynoma(x) ist größer oder gleich dem Grad des Nenner-polynomb(x), d.h. man kann die Polynomdivision ausführen.

8x3 − 2x2 + 1 : 2x + 1 = 4x2 − 3x + 3/28x3 + 4x2

−6x2 + 1−6x2 − 3x

3x + 13x + 3/2−1/2

Somit ist

f(x) = 4x2 − 3x + 3/2 +−1/22x + 1

.

4.4.2 Partialbruchzerlegung

Im Folgenden sei

f(x) =a(x)b(x)

eine rationale Funktion wobeia(x) ein Polynom vom Gradn und b(x) ein Polynomvom Gradm und n < m sei. (Durch Polynomdivision kann man den Falln ≥ mimmer auf den Falln < m reduzieren.) Weiterhin kann man ohne Beschränkung derAllgemeinheit annehmen, dass der führende Koeffizient vonb(x) gleich eins ist.

Wir betrachten zunächst den Spezialfall wennb(x) keine vielfachen Nullstellenhat. Seien alsoz1, z2, . . . , zm die m verschiedenen (komplexen) Nullstellen vonb(x),d.h.

b(x) = (x− z1)(x− z2) · · · (x− zm).

Page 139: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 139

Dann existieren Zahlena1, a2, . . . , am ∈ C so dass

f(x) =a1

x− z1+

a2

x− z2+ . . . +

am

x− zm.

Das heißt, man kannf(x) als Summe von sehr einfachen rationalen Funktionen schrei-ben. Jeder dieser Summanden kann problemlos integriert werden und damit ist∫

f(x)dx = a1 ln(x− z1) + a2 ln(x− z2) + . . . + am ln(x− zm).

Neben dem Problem, die Nullstellenzi vonb(x) zu finden, bleibt nur noch die Berech-nung der Koeffizientenai. Dies ist jedoch sehr einfach: Ausgehend von der Gleichung

a(x)(x− z1)(x− z2) · · · (x− zn)

=a1

x− z1+

a2

x− z2+ . . . +

am

x− zm

erhält man durch Multiplikation mitx− z1 auf beiden Seiten:

a(x)(x− z1)(x− z1)(x− z2) · · · (x− zn)

=a1(x− z1)

x− z1+

a2(x− z1)x− z2

+ . . . +am(x− z1)

x− zm

Nach Kürzen mitx− z1 erhält man

a(x)(x− z2) · · · (x− zn)

= a1 +a2(x− z1)

x− z2+ . . . +

am(x− z1)x− zm

.

Diese Gleichung gilt für allex, insbesondere also auch fürx = z1. Setzt man aufbeiden Seitenx = z1 bleibt nur noch

a(z1)(z1 − z2) · · · (z1 − zn)

= a1

übrig, d.h. man kanna1 sofort ausrechnen. In gleicher Weise berechnet man die ande-renai durch

a(zi)(zi − z1) · · · (zi−1 − zi)(zi+1 − zi) · · · (zm − zi)

= ai.

Beispiel 4.26 Sei

f(x) =x + 4

x2 + 2x− 3.

Das Nennerpolynom hat zwei Nullstellenz1 = 1 undz2 = −3, d.h.

x2 + 2x− 3 = (x− 1)(x + 3).

Somit gilt der Ansatz

x + 4(x− 1)(x + 3)

=a1

x− 1+

a2

x + 3.

Page 140: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 140

Zur Berechnung vona1 werden beide Seiten mitx + 3 multipliziert und beix = 1 ausgewertet:

(x + 4)(x− 1)(x− 1)(x + 3)

=a1(x− 1)

x− 1+

a2(x− 1)x + 3

x + 4x + 3

= a1 +a2(x− 1)

x + 354

= a1.

Zur Berechnung vona2 werden beide Seiten mitx + 1 multipliziert und beix = −3 ausgewertet:

(x + 4)(x + 3)(x− 1)(x + 3)

=a1(x + 3)

x− 1+

a2(x + 3)x + 3

x + 4x− 1

=a1(x + 3)

x− 1+ a2

−14

= a2.

Damit gilt

f(x) =5/4

x− 1− 1/4

x + 3und somit ∫

f(x)dx = 5/4 ln(x− 1)− 1/4 ln(x + 3).

Beispiel 4.27 Sei

f(x) =1

x2 − 2x + 2Das Nennerpolynom hat ein konjugiert komplexes Nullstellenpaarz1 = 1 + jundz2 = 1− j, d.h.

x2 − 2x + 2 = (x− 1− j)(x− 1 + j)

Somit gilt der Ansatz

1(x− 1− j)(x− 1 + j)

=a1

x− 1− j+

a2

x− 1 + j.

Berechnung vona1:

x− 1− j

(x− 1− j)(x− 1 + j)=

a1(x− 1− j)x− 1− j

+a2(x− 1− j)

x− 1 + j

1x− 1 + j

= a1 +a2(x− 1− j)

x− 1 + j12j

= a1

Page 141: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 141

Berechnung vona2:

x− 1 + j

(x− 1− j)(x− 1 + j)=

a1(x− 1 + j)x− 1− j

+a2(x− 1 + j)

x− 1 + j

1x− 1− j

=a1(x− 1 + j)

x− 1− j+ a2

− 12j

= a2

Damit gilt

f(x) =1

2j(x− 1− j)− 1

2j(x− 1 + j)

=12

(1

xj − j + 1− 1

xj − j − 1

).

Integration ergibt nun∫f(x)dx =

12j

(ln(xj − j + 1)− ln(xj − j − 1))

=12j

(ln√

(x− 1)2 + 1ej arctan(x−1)

− ln√

(x− 1)2 + 1ej(π−arctan(x−1)))

=12j

(j(2 arctan(x− 1)− π))

= arctan(x− 1)− π/2.

Da die Stammfunktion nur bis auf eine additive Konstante eindeutig ist, gilt∫f(x)dx = arctan(x− 1).

Nun zum allgemeinen Fall, bei demb(x) mehrfache Nullstellen haben kann. Eineeinfache Nullstellezi von b(x) führt bei der Partialbruchzerlegung zu einem Summan-den

f(x) = . . . +ai

x− zi+ . . . .

Ist zi jedoch einek-fache Nullstelle, so entsprechen demk Summanden bei der Parti-albruchzerlegung in der Form

f(x) = . . . +a(1)i

x− zi+

a(2)i

(x− zi)2+ . . . +

a(k)i

(x− zi)k+ . . . .

Die Koeffizientena(j)i werden in diesem Fall nacheinander beginnend mita

(k)i berech-

net. Multiplikation beider Seiten mit(x− zi)k und Auswertung beix = zi ergibt den

Page 142: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 142

Wert vona(k)i . Danach bringt man den Terma(k)

i /(x − zi)k auf die linke Seite underhält die Gleichung

f(x)− a(k)i

(x− zi)k= . . . +

a(1)i

x− zi+

a(2)i

(x− zi)2+ . . . +

a(k−1)i

(x− zi)k−1+ . . . .

Wenn man sich nicht verrechnet hat, kann man auf der linken Seite mitx − zi kürzenund dann beginnt das Spiel von vorn zur Berechnung vona

(k−1)i .

Beispiel 4.28 Sei

f(x) =4x2 + 2

x3 − 3x + 2Das Nennerpolynom hat eine doppelte Nullstelle beix = 1 und eine einfacheNullstelle beix = −2 d.h.

x3 − 3x + 2 = (x− 1)2(x + 2).

Somit gilt der Ansatz

4x2 + 2x3 − 3x + 2

=a(1)1

x− 1+

a(2)1

(x− 1)2+

a2

x + 2.

Berechnung vona(2)1 :

4x2 + 2(x− 1)2(x + 2)

=a(1)1

x− 1+

a(2)1

(x− 1)2+

a2

x + 24x2 + 2x + 2

= a(1)1 (x− 1) + a

(2)1 +

a2(x− 1)2

x + 2

2 = a(2)1

Als nächstes bringt man den Term

a(2)1

(x− 1)2

auf die linke Seite:

4x2 + 2(x− 1)2(x + 2)

− 2(x− 1)2

=4x + 2

(x− 1)(x + 2).

(Wie versprochen konnte man mitx − 1 kürzen.) Übrig bleibt somit die Glei-chung

4x + 2(x− 1)(x + 2)

=a(1)1

x− 1+

a2

x + 2

Page 143: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 143

Berechnung vona(1)1 :

4x + 2x + 2

= a1 +a2(x− 1)

x + 22 = a1

Berechnung vona2:

4x + 2x− 1

=a(1)1 (x + 2)x− 1

+ a2

2 = a2.

Damit gilt

f(x) =2

x− 1+

2(x− 1)2

+2

x + 2

Integration ergibt nun∫f(x)dx = 2 ln(x− 1)− 2

x− 1+ 2 ln(x + 2).

Page 144: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 144

5 Fourier Transformation

5.1 Funktionen sind Vektoren

Vektoren kennt man vielleicht am ehesten aus der Geometrie. Ein dreidimensionalerVektor besteht aus drei Zahlen, die man übereinander schreibt und runde Klammernaußen rum macht, also z.B. 5

38

.

Man kann sich solche Vektoren ganz gut durch Pfeile in einem dreidimensionalen Ko-ordinatensystem veranschaulichen. Im Beispiel hat der Pfeil inx-Richtung die Länge5, in y-Richtung die Länge 3 und inz-Richtung die Länge 8.

Doch nun zu den Rechenoperationen. Vektoren addiert man, indem man die Kom-ponenten addiert, also z.B. 2

15

+

463

=

678

.

Allgemein ist die Vektor Addition fürn-dimensionale Vektoren eine Funktion

+ ∈ Rn × Rn → Rn.

Außerdem kann man Vektoren strecken, was man durch Multiplikation mit einer Zahlerreicht:

4

358

=

122032

.

Diese Multiplikation einer Zahl mit einem Vektor heißt S-Multiplikation. Es handeltsich um eine Funktion

· ∈ R× Rn → Rn.

Eine weitere Vektoroperation ist das Skalarprodukt, welches aus zwei Vektoren eineZahl macht, indem man die Komponenten multipliziert und die Ergebnisse aufsum-miert: 3

41

◦ 2

25

= 6 + 8 + 5 = 19.

Das Skalarprodukt ist also eine Funktion

◦ ∈ Rn × Rn → R.

Zwei Vektoren stehen senkrecht auf einander genau dann wenn das Skalarprodukt Nullist.

Bei der ganzen Rechnerei sind zwei Arten von Objekten im Spiel:

Page 145: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 145

• Eine MengeK von Zahlen, in diesem FallK = R und

• eine MengeV von Vektoren, in diesem FallV = Rn.

In diesem Kapitel wird gezeigt, dass alles, was man bisher mit Vektoren gemacht hat,analog auch mit Funktionen geht. Man kann mit Funktionen also genauso rechnen wiemit Vektoren, d.h. es gibt eine Addition, eine S-Multiplikation und ein Skalarproduktauf Funktionen, das die selben Eigenschaft hat wie die entsprechenden Operationenauf Vektoren. Schauen wir uns zunächst spezielle Funktionen

f ∈ {1, 2, . . . , n} → R

an. Eine solche Funktion ist vollständig durchn relle Zahlen bestimmt, nämlich dieFunktionswerte

f(0), f(1), . . . , f(n).

Damit istf genau das Selbe wie ein Vektor~v ∈ Rn. Der nächste Schritt sind Funktio-nen

f ∈ N→ R.

Solche Funktionen sind im Prinzip das selbe wie Vektoren mit unendlich vielen Kom-ponenten

f(0), f(1), f(2), . . . .

Uns interessieren natürlich vor allem Funktionen

f ∈ R→ R.

Mit etwas Phantasie kann man sich so eine Funktion als Vektor vorstellen mit über-abzählbar vielen Komponenten. Der einzige Unterschied zu den “normalen” Vektorenist, dass sich die Komponenten nicht mehr durchindizieren lassen. Stattdessen wird einreellwertiger “Index” (meistensx) verwendet:

↑f(x)↓

↑x↓

...vi

...

...i...

.

Den Funktionswert vonf an der Stellex kann man analog zu Vektoren somit auch alsx-te Komponente vonf bezeichnen. Mit diesem Bild lassen sich die Vektor Operatio-nen auf Funktionen übertragen. Man rechnet also mit

• einer MengeK von Zahlen, nach wie vor istK = R und

• einer MengeV von Vektoren, dies ist nun aber die Menge von FunktionenV =R→ R.

Die Vektor Additionh = f + g zweier Funktionenf undg ist nach wie vor kompo-nentenweise definiert durch

h(x) = f(x) + g(x).

Page 146: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 146

Wie bei der Vektor Addition ist also die Komponentex des Ergebnis Vektorsh gleichder Summe der Komponentenx von f undg. Die Addition von Funktionen ist somiteine Funktion

+ ∈((R→ R)× (R→ R)

)→ (R→ R)

und nicht zu verwechseln mit der Addition von Zahlen

+ ∈ R× R→ R.

Beispiel 5.1 Seienf, g ∈ R→ R mit

f(x) = 3xg(x) = 2x + 1

Die Funktionh = f + g ist somit definiert durchh ∈ R→ R,

h(x) = 5x + 1.

Die S-Multiplikationg = af einer Zahla und einer Funktionf ist definiert durch

g(x) = a(f(x)

).

Die S-Multiplikation von Funktionen ist somit eine Funktion

· ∈(R× (R→ R)

)→ (R→ R).

Beispiel 5.2 Seif ∈ R→ R definiert durch

f(x) = x2 + 5.

Dann isth = 3f die Funktionh ∈ R→ R mit

h(x) = 3x2 + 15.

Auch das Skalarprodukts = f ◦ g auf Funktionen ist eng mit dem Skalarproduktvon Vektoren verwandt. Es liefert uns den wichtigen Begriff der Orthogonalität zwei-er Funktionen. Wie bei Vektoren heißen zwei Funktionenf und g orthogonal, wennf ◦ g = 0. Wörtlich genommen müsste man die Summe vonf(x)g(x) über alle Kom-ponentenx berechnen. Dax über einen kontinuierlichen Bereich läuft, nimmt man stattder Summe das Integral, d.h.

s =∫ ∞

−∞f(x)g(x)dx.

Das so definierte Skalarprodukt

◦ ∈(R→ R× R→ R

)⇀ R

Page 147: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 147

ist jedoch nur eine partielle Funktion, da das Integral nicht für alle Funktionenf, gexistiert. Genaugenommen erfüllt diese Operation auch nicht alle Eigenschaften einesSkalarprodukts. Die Eigenschaft

f ◦ f = 0 genau dann wennf(x) = 0 für allex

ist nicht erfüllt. Ein Gegenbeispiel ist z.B.

f(x) ={

1 für x = 00 sonst.

Die Situation lässt sich dadurch retten, dass man nicht die Menge aller FunktionenR→R betrachtet sondern nur besonders einfache Teilmengen und auf diesen Teilmengenein Skalarprodukt definiert. Hierzu zwei Beispiele:

Beispiel 5.3 SeiRn[x] ⊆ R → R die Menge aller Polynome vom Grad≤ n, d.h.Funktionen der Form

f(x) = a0 + a1x + a2x2 + . . . + anxn, ai ∈ R für i = 0, 1, . . . , n.

Die oben definierte Funktions Addition und S-Multiplikation werden in nahelie-gender Weise aufRn[x] eingeschränkt. Man kann diese Funktionenmenge auchbeschreiben als die Menge aller Linearkombinationen dern+1 Basisfunktionen

p0(x) = 1, p1(x) = x, p2(x) = x2, . . . pn(x) = xn

Um ein Skalarprodukt auf dieser Funktionenmenge zu definieren, hat man meh-rere Möglichkeiten. Für beliebigea, b ∈ R mit a < b erfüllt

f ◦ g =∫ b

a

f(x)g(x)dx

alle Eigenschaften eines Skalarprodukts. Füra = 0 undb = 1 erhält man z.B.

(3x + 1) ◦ (x2 − 2x) =∫ 1

0

(3x3 − 5x2 − 2x)dx

=[34x4 − 5

3x3 − x2

]10

= −2312

.

Beispiel 5.4 SeiF ⊆ R→ R die Menge der Funktionen der Form

f(x) = a0 +∞∑

k=1

ak cos(kx) + bk sin(kx), a0, ak, bk ∈ R.

Es handelt sich also um die Menge aller Linearkombinationen der Basisfunktio-nen

1, cos(x), sin(x), cos(2x), sin(2x), cos(3x), sin(3x), . . .

Page 148: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 148

Da alle Basisfunktionen2π-periodisch sind, gilt dies für alle Funktionen ausF .In der Tat enthältF alle stetigen2π-periodischen Funktionen und sogar nocheinige spezielle nicht stetige. Addition und S-Multipliklation aufF sind wiederdurch Einschränkung vonR→ R definiert. Als Skalarprodukt kann man hier

f ◦ g =∫ 2π

0

f(x)g(x)dx

verwenden. Besonders hübsch an diesem Skalarprodukt ist, dass die Basisfunk-tionen alle senkrecht zueinander stehen:

1 ◦ cos(kx) = 01 ◦ sin(kx) = 0

cos(kx) ◦ cos(`x) = 0 falls k 6= `

sin(kx) ◦ sin(`x) = 0 falls k 6= `

cos(kx) ◦ sin(`x) = 0

für allek, ` ∈ N. Außerdem gilt für allek ∈ N

cos(kx) ◦ cos(kx) = sin(kx) ◦ sin(kx) = π

und1 ◦ 1 = 2π.

5.2 Fourier Reihen

Definition 5.5 (T -periodische Funktion.)Eine Funktion f ∈ R→ R heißt T -periodisch wenn

f(x) = f(x + T )

für alle x ∈ R.

Beispiel 5.6 Die Sinusschwingung mit Kreisfrequenzω ist definiert durch

f(x) = sin(ωx).

Da die Sinusfunktion2π-periodisch ist, durchläuftf(x) eine Periode wenn

ωx = 2π

bzw.

x =2π

ω.

Page 149: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 149

Die Funktion ist alsoT -periodisch für

T =2π

ω.

Nachrechnen ergibt

f(x + T ) = sin(ω(x + T ))= sin(ωx + ωT )= sin(ωx + 2π)= sin(ωx)= f(x).

Beispiel 5.7 Die k-te Oberschwingung einer Sinusschwingung mit Kreisfrequenzω ist definiert durch

f(x) = sin(kωx).

Sie hat also diek-fache Frequenz der Grundschwingung. Auch diese Schwin-gung istT -periodisch mit

T =2π

ω

denn

f(x + T ) = sin(kω(x + T ))= sin(kωx + kωT )= sin(kωx + k2π)= sin(kωx)= f(x).

Gleiches gilt natürlich auch für die Cosinusfunktion.

Beispiel 5.8 Die konstante Funktion

f(x) = 1

ist T periodisch für jedesT .

Das folgende Theorem besagt, dass man jede stetigeT -periodische Funktion als Line-arkombination von Sinus- und Cosinusschwingungen darstellen kann. Die Frequenzender Schwingungen sind hierbei ganzzahlige Vielfache der Grundfrequenz

ω =2π

T.

Der praktische Nutzen ist, dass man jedesT -periodische Signal in harmonische Schwin-gungen mit Grundfrequenzω und entsprechende Oberschwingungen zerlegen kann.Diesen Vorgang nennt man Spektralanalyse. Ein Anwendungsbeispiel ist die Analyse

Page 150: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 150

des Obertonspektrums eines Musikinstruments um es anschließend elektronisch syn-thetisieren zu können.

Theorem 5.9Ist f ∈ R → R eine stetige, T -periodische Funktion, dann gibt es Koeffizi-

enten a0, ak, bk ∈ R, k = 1, 2, . . . so dass

f(x) =a0

2+

∞∑k=1

ak cos(kωx) + bk sin(kωx).

Die Koeffizientena0, ak, bk nennt man Fourier Koeffizienten. Den Faktor1/2 bei a0

könnte man natürlich weglassen — er dient lediglich dazu dass die Formeln zur Be-rechnung der Fourier Koeffizienten etwas einfacher werden.

Tatsächlich gilt das Theorem nicht nur für stetige Funktionen sondern auch fürFunktionen mit Sprungstellen. Allerdings muss dann in jeder Sprungstelle der links-und rechtsseitige Grenzwert existieren und der Funktionswert an der Sprungstelle gleichdem Mittelwert der beiden Grenzwerte sein. Bei den technisch relevanten Funktionenf(x) ist es in der Regel so, dass die Koeffizientenak, bk mit wachsendemk sehr schnellklein werden. Man kann die Summe dann ab einem bestimmtenk abschneiden ohneeinen allzu großen Fehler zu machen, siehe Bild 5.1.

Doch nun zu der Frage, wie man zu einer gegebenenT -periodischen Funktionf(x) die Fourier Koeffizientena0, ak, bk berechnet. Theorem 5.9 sagt, dassf(x) eineLinearkombination der Basisfunktionen

1, cos(kωx), sin(kωx), k = 1, 2, . . .

ist. Mit dem Skalarprodukt

f ◦ g =∫ T

0

f(x)g(x)dx

sind alle Basisfunktionen orthogonal zueinander, siehe Beispiel 5.4. Man kann diesauch leicht mit Maple nachrechnen.

1 ◦ cos(kωx) = 01 ◦ sin(kωx) = 0

cos(kωx) ◦ cos(`ωx) = 0 falls k 6= `

sin(kωx) ◦ sin(`ωx) = 0 falls k 6= `

cos(kωx) ◦ sin(`ωx) = 0

für allek, ` ∈ N. Außerdem gilt für allek ∈ N

cos(kωx) ◦ cos(kωx) = sin(kωx) ◦ sin(kωx) = T/2.

und1 ◦ 1 = T.

Page 151: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 151

x

x

x

Abbildung 5.1: Approximation einer Rechteckschwingung durch harmonischeSchwingungen. Oben wird nur die Grundschwingung verwendet, in der Mitte alleSchwingungen bis zur zweiten Oberschwingung und unten alle Schwingungen bis zurneuten Oberschwingung.

Page 152: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 152

Ausgehend von der Gleichung

f(x) =a0

2+

∞∑k=1

ak cos(kωx) + bk sin(kωx).

kann man für ein bestimmtesden Fourier Koeffizientena` leicht berechnen, indemman auf beiden Seiten das Skalarprodukt mitcos(`ωx) berechnet. Man erhält

f(x) ◦ cos(`ωx) =

(a0

2+

∞∑k=1

ak cos(kωx) + bk sin(kωx)

)◦ cos(`ωx)

=a0

21 ◦ cos(`ωx)︸ ︷︷ ︸

=0

+

∞∑k=1

ak cos(kωx) ◦ cos(`ωx)︸ ︷︷ ︸=0 falls k6=`, T/2 sonst

+

∞∑k=1

bk sin(kωx) ◦ cos(`ωx)︸ ︷︷ ︸=0

= a` cos(`ωx) ◦ cos(`ωx)= a`T/2.

Damit ist

a` =2T

f(x) ◦ cos(`ωx)

=∫ T

0

f(x) cos(`ωx).

In gleicher Weise erhält man durch Skalarprodukt mitsin(`ωx) den Fourier Koeffizi-enten

b` =∫ T

0

f(x) sin(`ωx).

Um schließlich nocha0 zu berechnen, nimmt man auf beiden Seiten das Skalarproduktmit der konstanten1-Funktion und erhält

f(x) ◦ 1 =

(a0

2+

∞∑k=1

ak cos(kωx) + bk sin(kωx)

)◦ 1

=a0

21 ◦ 1︸︷︷︸=T

+∞∑

k=1

ak cos(kωx) ◦ 1︸ ︷︷ ︸=0

+bk sin(kωx) ◦ 1︸ ︷︷ ︸=0

=a0

2T.

Page 153: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 153

Damit ist

a0 =2T

f(x) ◦ 1

=2T

∫ T

0

f(x)dx.

Zusammenfassend berechnen sich die Fourier Koeffizienten also durch folgende einfa-che Formeln:

ak =2T

∫ T

0

f(x) cos(kωx), k = 0, 1, 2, . . .

bk =2T

∫ T

0

f(x) sin(kωx), k = 1, 2, . . . .

Bemerkung. Man hätte die Berechnung der Fourier Koeffizienten auch durch ein Op-timierungsproblem herleiten können: Gesucht sind die Koeffizientena0, ak, bk

so dass ∫ T

0

(f(x)−

(a0

2+

∞∑k=1

ak cos(kωx) + bk sin(kωx)

))2

minimal ist. Partielle Ableitung nacha` und Vertauschen der Reihenfolge vonIntegral und Ableitung und Nullsetzen liefert

2∫ T

0

cos(`ωx)

(f(x)−

(a0

2+

∞∑k=1

ak cos(kωx) + bk sin(kωx)

))= 0.

Hieraus folgt∫ T

0

f(x) cos(`ωx) =∫ T

0

(a0

2+

∞∑k=1

ak cos(kωx) + bk sin(kωx)

)cos(`ωx).

Aus den Orthogonalitätseigenschaften folgt∫ T

0

f(x) cos(`ωx) = a`T/2

und damit wie oben

a` =2T

∫ T

0

f(x) cos(`ωx).

Beispiel 5.10 Gegeben ist dieT = 2-periodische Funktion

f(x) =

1 falls 2n ≤ x ≤ 2n + 10 falls 2n− 1 ≤ x ≤ 2n

1/2 falls x = n

Page 154: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

V. Stahl Analysis Seite 154

für n ∈ Z, siehe Bild 5.1. Die Fourier Koeffizienten berechnen sich wie folgt:

a0 =2T

∫ T

0

f(x)dx

=∫ 2

0

f(x)dx

=∫ 1

0

1dx

= 1.

Fürk 6= 0 erhält man

ak =2T

∫ T

0

f(x) cos(kπx)dx

=∫ 2

0

f(x) cos(kπx)dx

=∫ 1

0

cos(kπx)dx

=1kπ

[sin(kπx)]10

=1kπ

(sin(kπ)− sin(0))

= 0.

bk =2T

∫ T

0

f(x) sin(kπx)dx

=∫ 2

0

f(x) sin(kπx)dx

=∫ 1

0

sin(kπx)dx

= − 1kπ

[cos(kπx)]10

=1kπ

(1− cos(kπ))

={

0 falls k gerade2/(kπ) falls k ungerade

Damit ist

f(x) =12

+2π

∑k=1,3,5,...

sin(kπt)k

.

Page 155: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

Literatur

[1] I. N. Bronstein and K. A. Semendjajew.Taschenbuch der Mathematik. Teubner,1985.

[2] Klemens Burg, Herbert Haf, and Friedrich Wille.Höhere Mathematik für Inge-nieure, Band 2: Lineare Algebra. Teubner, 1992.

[3] Klemens Burg, Herbert Haf, and Friedrich Wille.Höhere Mathematik für Inge-nieure, Band 3: Gewöhnliche Differentialgleichungen, Distributionen und Inte-graltransformationen. Teubner, 1992.

[4] Klemens Burg, Herbert Haf, and Friedrich Wille.Höhere Mathematik für Inge-nieure, Band 1: Analysis. Teubner, 1997.

[5] H. Fischer and H. Kaul.Mathematik für Physiker. Teubner, 1990.

[6] Glatz, Grieb, Hohloch, and Kümmerer.Brücken zur Mathematik, Band 4:Differential- und Integralrechnung 1. Cornelsen, 1994.

[7] Glatz, Grieb, Hohloch, and Kümmerer.Brücken zur Mathematik, Band 5:Differential- und Integralrechnung 2. Cornelsen, 1994.

[8] Glatz, Grieb, Hohloch, Kümmerer, and Mohr.Brücken zur Mathematik, Band 7:Fourier Analysis. Cornelsen, 1996.

[9] Lothar Papula. Mathematik für Ingenieure und Naturwissenschaftler, Band 1.Vieweg, 1999.

[10] Lothar Papula. Mathematik für Ingenieure und Naturwissenschaftler, Band 2.Vieweg, 1999.

[11] Peter Stingl.Mathematik für Fachhochschulen. Hanser, 1999.

[12] Wilhelm Werner.Mathematik lernen mit Maple (Band 1). dpunkt, 1996.

[13] Wilhelm Werner.Mathematik lernen mit Maple (Band 2). dpunkt, 1998.

155

Page 156: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

IndexJ~f , 108

R, 8a, 17`, 58, 101∞, 7lim, 11, 18, 21, 33∇, 88x, 29an → 0, 11an, 5f ′, 51f ′′, 67f (n), 67

Abbruchkriterium, 65Ableitung, 51

elementarer Funktionen, 54Grenzwert, 51Höhere Ableitung, 67Kettenregel, 56partielle, 87Rechenregeln, 54

Ableitungsfunktion, 51Approximation

Taylor Polynom, 70Ausgleichsrechnung, 113

bestimmt divergent, 10, 19, 20bestimmtes Integral, 127

Flächenberechnung, 127Integrationsgrenzen, 127

Differential, 66Differenzierbarkeit, 49

Grenzwert, 49

elementarer Funktionen, 122Extremwert, 29, 47, 68, 88

Ableitung, 68Gradient, 88lokales Maximum, 68lokales Minimum, 68

Flächenberechnung, 122

Stammfunktion, 122Folge, 5

bestimmt divergent, 10, 19, 20Glieder, 5Grenzwert, 17Konvergenz, 10, 18Nullfolge, 10, 11reelle Folge, 5unbestimmt divergent, 10, 19, 25uneigentlicher Grenzwert, 20

FunktionAbleitung, 51Ableitungsfunktion, 51Differenzierbarkeit, 49Extremwert, 29, 47, 68Grenzwert, 28, 29, 31, 37, 38Linearisierung, 58Nullstelle, 28, 43Stetigkeit, 28

Funktionswert, 39

Glieder, 5Gradient, 88, 104

Eigenschaften, 88Extremwert, 88Gradientenabstiegsverfahren, 88Jacobi Matrix, 108partielle Ableitung, 88Richtung, 89steilster Anstieg, 88Tangentialebene, 104

Grenzwert, 17, 28, 29, 31, 37–39, 47,51

einer Funktion, 28Funktionswert, 39Grenzwert einer Funktion, 29, 31Grenzwert einer Funktion bei±∞,

38Rechenregeln, 25, 27, 36Stetigkeit, 39Taylor Reihe, 76uneigentlicher Grenzwert, 20

156

Page 157: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

uneigentlicher Grenzwert einer Funk-tion, 37

Grenzwert einer Funktion, 29, 31Grenzwert einer Funktion bei±∞, 38

Höhere Ableitung, 67

Infinitessimalrechnung, 66Integral

bestimmtes, 127Grenzwert einer Summe, 128Schreibweise, 129unbestimmtes, 127

Integrationeiner Summe, 130Integrationsregeln, 130konstanter Faktor, 130partielle Integration, 134Produkt Integration, 134Substitution, 132Zwischenstelle, 131

Integrationsgrenzen, 127Vertauschung, 131

Integrationsregeln, 130Intervallhalbierung, 43

Jacobi Matrix, 108

Konvergenz, 10, 18, 62Taylor Reihe, 76

Limes, 11Linearisierung, 58, 59, 105

Jacobi Matrix, 108mehrdimensionales Newton Verfah-

ren, 105Newton Verfahren, 59Nullstelle, 58Tangente, 59Tangentengleichung, 58Tangentialebene, 101

lokales Maximum, 68lokales Minimum, 68

Newton Verfahren, 59Abbruchkriterium, 65Jacobi Matrix, 109

Konvergenz, 62linearisiertes System, 105Linearisierung, 59, 105mehrdimensionales, 104Vergleich mit Intervallhalbierung,

65Normalgleichungen, 118Nullfolge, 10, 11Nullstelle, 28, 43, 58

Intervallhalbierung, 43Linearisierung, 58Newton Verfahren, 59

Partialbruchzerlegung, 138partielle Ableitung, 88

Gradient, 88nachxi, 88

partielle Integration, 134Polynomdivision, 138Produkt Integration, 134

reelle Folge, 5Richtung, 89

Sekantensteigung, 45Stammfunktion, 121, 122

elementarer Funktionen, 122Flächenberechnung, 122

SteigungGrenzwert, 47in einem Punkt, 45mittlere Steigung, 45Richtung, 87, 89Sekantensteigung, 45Tangentensteigung, 46

stetige Funktionen, 42Stetigkeit, 28, 39

Grenzwert, 39in einer Menge, 41stetige Funktionen, 42verkettete Funktionen, 41

Substitution, 132

Tangente, 59Tangentengleichung, 58Tangentensteigung, 46

157

Page 158: Analysis - Mitarbeiter-Servermitarbeiter.hs-heilbronn.de/~vstahl/mathe-se4/skript.pdf · kation ist die Menge C der komplexen Zahlen herausgekommen. Machen wir nun das Selbe mit ∞,

Tangentialebene, 101, 104Gradient, 104

Taylor Polynom, 70, 73n-stellig, 109Ansatz, 71

Taylor Reihe, 76Grenzwert, 76

unbestimmt divergent, 10, 19, 25unbestimmtes Integral, 121, 127uneigentlicher Grenzwert, 20uneigentlicher Grenzwert einer Funkti-

on, 37

158