Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf ·...

90
Mathematik III; WS 2003/4 M.Sieveking 1 FB Mathematik J.W.Goethe-Universit¨ at Frankfurt a. M. WS 2003/4 1 e-mail: [email protected]

Transcript of Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf ·...

Page 1: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Mathematik III; WS 2003/4

M.Sieveking1

FB Mathematik

J.W.Goethe-UniversitatFrankfurt a. M.

WS 2003/4

1e-mail: [email protected]

Page 2: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

1 Zufall

deutsch: Gluck, Hans im Gluck, Pech , Los; althochdeutsch hliozzan: losen ,erlosen, wahrsagen;englisch : accidental, by chance, at random; occasion, haphazard;spanisch: casualidad, acaso, azard, coincidencia;franzosisch: fortune, chance, hazard, sort; aleatoire von lateineisch : aleaWurfelarabisch: al zahr, der Wurfel (zum Spielen)

Aufgabe 1.1 Zufall und Einfall: schreiben Sie auf einer Seite, was ihnenzum Thema Zufall einfallt. (Kann man Einfalle herbeifuhren, lenken? Wie)

Aufgabe 1.2 Dies ist eher ein etwas ungewonliches Thema einer Staatsex-amensarbeit: Wie kommt “ Zufall” in der deutschen philosophischen (didak-tischen) Literatur vor? Die Aufgabe ist zunachst informatischer Natur: perComputer Textstellen bei Hegel und Kollegen zu suchen.

Literatur zur Vorlesung: Vor allem die zu recht weltberuhmten Bucher vonArthur Engel . Engel lehrte am Institut fur Didaktik der Mathematik, umsich spater ganz der Schulerolympiade zu widmen.Arthur Engel(1973) Wahrscheinlichkeitstheorie und Statistik, Band 1,2; KlettArthur Engel(1987) Stochastik; KlettFerner gibt es am Fachbereich die beiden folgenden Vorlesungsskripten:Jurgen Wolfart : Mathematik IIIAnton Wakolbinger Elementare Stochastik.In weiten Teilen der Wahrscheinlichkeitstheorie benotigt man keine Definitiondessen, was eine zufallige Folge von Ereignissen sein soll ( siehe : “axiomati-sche Methode”); auf anderen Gebieten, wie der Kryptographie, benotigt maneine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( vonZahlen ), die sich fur gewisse praktische Zwecke wie zufallige verhalten.

2 Spiele

Tartaglia, Nicolo( der Stotterer) ; 1500 - 1557Cardano, Geronimo 1501 - 1576; schrieb das erste Buch uber WT: Liber deLudo Aleae (Buch des Wurfelspiels)Cardano ist beruhmt wegen der Formeln

u =3

−q +√

q2 + p3; v =3

−q −√

q2 + p3

1

Page 3: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

welche die Gleichungen

0 = x3 + 3px2 + 2q

losen. Ferner wegen der Erfindung des Kardanantriebes z.B. von BMWMotorradern und der Kardan Aufhangungen von Kompassnadeln. Es sinddies jedoch falschliche Zuschreibungen:Tartaglia hatte in einem offentlichen Wettstreit bewiesen, dass er imBesitz von Losungsformeln fur Gleichungen dritten Grades war, ohne diesepreiszugeben. ( Ein fruhes Beispiel fur das was man in der Kryptographie“Zero- Knowledge -proof” nennt), sie aber Cardano anvertraut, der sie dannwiderrechtlich veroffentlichte.Das folgende Problem des abgebrochenen Wurfelspiels, namlich wie derEinsatz verteilt werden soll, geht der Anekdote zu Folge auf eine gemeinsameFahrt des Philosophen und Literaten am Hofe Ludwig des 14ten Chevalierde Mr mit dem Philosophen und Mathematiker Blaise Pascal zuruck.Man einigte sich im Laufe einer Korrespondenz darauf, dass der Einsatzentsprechend den Gewinnchancen zu verteilen sei.

Beispiel 2.1 (Abgebrochenes Wurfelspiel) Jeder Spieler setzt 32 Pistolendarauf, dass er seine Zahl dreimal werfen kann, bevor es dem anderen Spielergelingt. Nachdem sie eine Weile gespielt haben hat M. seine 4 zweimal ge-worfen, sein Gegner aber nur einmal seine 6. An dieser Stelle wird das Spielabgebrochen. Wie sollen die 64 Pistolen verteilt werden?

Wir losen die Aufgabe mit der Methode der “ kleinen Markowkette”. Der ersteSchritt besteht in der Wahl eines geeigneten Zustandsbegriffes. Sodannverbindet man die Zustande mit Pfeilen, an welche man die sogenannten“Ubergangswahrscheinlichkeiten” schreibt:

4 −→ 44 −→ 444

y

y↗

x

Start 46 −→ 446 −→ 4466

↘x

↘ ↗

y

6 664 −→ 666

↘x

66

Hier bedeutet z.B. 4 den Zustand, in welchem bereits eine 4 geworfen wurde,aber noch keine 6. Er steht fur die Menge aller Spielprotokolle mit genau

2

Page 4: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

einer 4 und keiner 6. 446 bedeutet den Zustand, in welchem genau zwei 4ren gewurfelt wurden, und genau eine 6. Im Startzustand ist noch keine 4und auch noch keine 6 gewurfelt, aber beliebig viele Weder-4-noch-6-en. Miteinem Schritt, d.h. einem Wurf des Wurfels kommt man mit der Ubergangs-wahrscheinlichkeit pzy = 1

6von einem Zustand z zu einem anderen, wahrend

man mit der Restwahrscheinlichkeit pzz = 46

im selben Zustand z bleibt. Z.B.kommt man mit WS 1

6in einem Schritt vom Zustand 446 in den Zustand

444 weil in einem von 6 gleichwahrscheinlichen Fallen eine 4 gewurfelt wird.Man sollte also an alle Pfeile eine 1

6malen. Ferner an jeden Zustand einen

“loop” mit einem 23

weil man bei einem Schritt mit WS 46

im selben Zustandbleibt. Wir konnen ubrigens pzy = 0 setzen fur z = 444, und z = 666, weilin diesen Zustanden das Spiel abgebrochen wird mit 4 bez. 6 als Sieger. DerSieger bekommt 64 Pistolen. Beachte, dass man fur jedes x = 1, 2, 3, . . . mitx Schritten von 664 nach 4466 kommt, aber nur mit x = 2, 3, 4, . . . Schrittenvon 664 nach 444.Als nachstes definieren wir die Funktion g(z) deren Wert im Zustand z = 446wir berechnen mochten:g(z) = Wahrscheinlichkeit, beim ersten Treffen der Menge E = {444, 666}diese in 444 zu treffen, vorrausgesetzt, dass man in 446 gestartet ist.g(z) sind also die Gewinnchancen im Zustand z.Wenn nun z kein Endzustand ist, d.h. z 6= E, , dann gibt es , bevor dasSpiel abgebrochen wird einen Schritt (Wurf), der mit WS pzy von z nach yfuhrt. Im Zustand y sind die Gewinnchancen nach Definition g(y). Also giltdie Mittelwertgleichung

g(z) =∑

y∈Z

pzyg(y)

Hierbei bedeutet Z die Menge aller Zustande, den Zustandsraum. Speziell :

g(446) =1

6g(444) +

1

6g(4466) +

4

6g(446)

Dies ist eine Gleichung mit 3 Unbekannten. Allerdings: es gibt einen Fall, inwelchem wir den Wert von g(z) sofort angeben konnen: wenn z ein Endzu-stand ist: es ist g(444) = 1, und g(666) = 0. Damit haben wir in unsererGleichung eine Unbekannte eliminiert und es bleiben zwei. Nachdem manaber den Wert der Funktion in den Endzustanden bestimmt hat, kann mansie in den “vorletzten” Zustanden bestimmen, d.h. in denjenigen, in denenein Schritt entweder in denselben Zustand zuruckfuhrt, oder in einen End-zustand. Ein solcher Zustand ist in unserem Beispiel 4466 :

g(4466) =1

6g(444) +

1

6g(666) +

4

6g(4466)

3

Page 5: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Hieraus ergibt sich g(4466) = 12. Einsetzten in die Gleichung fur g(446) ergibt

g(446) = 34

Die Gewinnchancen fur die 6 sind demnach 1− 34.

Dieses Vorgehen, von den letzten Zustanden zu den vorletzten zuruckzurech-nen, und von diesen zu den vorvorletzten u.s.w. wird auch dynamische Pro-

grammierung genannt.(Es muss nicht vorletzte Zustande im obigen Sinnegeben.) Ware es nur um g(446) gegangen, so hatte es genugt, ein kleineresDiagramm zu betrachten:

444

↗x

446 −→ 4466

Dies erlautert das Prinzip der “ kleinen” Markowkette.Bevor wir das Allgemeine an unserem Vorgehen mittels einer geeigneten

Sprechweise darstellen, (im nachsten Abschnitt) die Berechnung einer weite-ren Funktion: der mittleren Spieldauer d(z) im Zustand z : Es ist denkbardass man im Zustand 446 ewig Weder-4-noch-6-en wurfelt . Das wird al-lerdings praktisch nicht vorkommen. Statt dessen wird mit einer gewissenWahrscheinlichkeit nach n Wurfen eine 4 gewurfelt. In einem solchen Fallist die Spieldauer n + 1. Wenn hingegen nach n Weder-4noch-6-en eine 6geworfen wird, ist man erst im Zustand 4466. Wird nun nach m Weder-4-noch-6-en eine 4 oder eine 6 geworfen, so ist die Spieldauer n + m + 2. Diemittlere oder erwartete Spieldauer ist jedoch wieder einfach zu berechnen,da wir die folgende Mittelwertgleichung haben: wenn z kein Endzustand ist,dann gilt

d(z) = 1 +∑

y∈Z

pzyd(y)

Man muss namlich in einem solchen Zustand einen Schritt machen; dieserfuhrt mit WS pzy in den Zustand y . Folglich ist die verbleibende Spieldauermit WS pzy g(y). In unserem Beispiel:

d(446) = 1 +1

6d(444) +

1

6d(4466) +

2

3d(446)

Wir arbeiten wieder ruckwarts: d(444) = d(666) = 0; d(4466) = 1 +16d(444)+ 1

6d(666) = 2

3d(4466); d(4466) = 3; 1

3d(446) = 1 + 3

6; d(446) = +3

2.

Mit der Gleichen Methode behandelt man das folgende Beispiel:

Beispiel 2.2 (Die kuhne Strategie): Ich habe 1 Euro und brauche 5 Euro.Daher spiele ich ein Spiel, in welchem ich gewisse Gewinnchancen habe, aber

4

Page 6: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

auch ein Verlustrisiko eingehe: Abhangig von meinem Kapital - Anfangska-pital = 1 - setze ich s(x) ≤ x auf den Ausgang eines Munzwurfes. Ist dasErgebnis 1, was mit WS 1

2passiert, dann erhalte ich den doppelten Einsatz

zuruck, so dass sich mein Kapital von x auf x+s(x) erhoht. Ist hingegen dasErgebnis 0, was ebenfalls mit WS 1

2passiert, so verliere ich meinen Einatz,

so dass sich mein Kapital von x auf x− s(x) vermindert. Die Funktion s istdie Strategie. Die “kuhne Strategie” besteht in derjenigen Funktion s, diedie Differenz |5 − x − s(x)| - im Fall dass die Munze 1 zeigt, so klein wiemoglich macht.

Wir wahlen den Kapitalstock als Zustandsgroße, also X = {0, 1, 2, 3, 4, 5}.Entsprechend setzen wir fur die Ubergangswahrscheinlichkeiten pzy : p00 =p55 = 1. Es sind 0, 5 also Endzustande. An den Pfeilen des folgenden Dia-gramms steht im ubrigen 1

2.

2 −→ 4 −→ 5

↙x

y↗

0 ←− 1 ←− 3

Wir benutzen fur die Gewinnchancen im Zustand z wieder die Mittelwert-gleichung

g(z) =∑

y

pzyg(y)

sowie die Endwerte g(5) = 1, g(0) = 0. Damit folgt

g(1) =1

2g(2) +

1

2g(0) =

1

2g(2)

g(2) =1

2g(4) +

1

2g(0) =

1

2g(4)

g(4) =1

2g(5) +

1

2g(3) =

1

2+

1

2g(3)

g(3) =1

2g(5) +

1

2g(1) =

1

2+

1

2g(1)

Damit ergibt sich

g(1) =1

2g(2) =

1

4g(4) =

1

8+

1

8g(3) =

3

16+

1

16g(1)

d.h. g(1) = 15

. In jedem 5 ten Spiel kann ich also meinen Einsatzverfunffachen,- nicht besonders uberraschend. Fur die Spieldauer d in einemnicht- Endzustand z benutzen wir wieder die Gleichung

d(z) = 1 +∑

y

pzyd(y)

5

Page 7: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Hier ergibt sich auf die gleiche Weise : d(1) = 2.

Aufgabe 2.1 Soldaten! Um viele Soldaten zu bekommen befiehlt der Furstseinen Untertanen, so lange Kinder zu gebaren, bis jede Familie mehr Sohneals Tochter hat. Bestimme die mittlere Familiengroße im Falle dass Tochtermit WS 1/2 geboren werden.

1. Zeichne einen passenden Grafen mit n = Anzahl Madchen − AnzahlJungen als Zustanden.

2. Leite eine Rekursionsformel fur die mittlere Anzahl s(n) der noch aus-stehenden Geburten im Zustand n her.

3. Zeige s(n) =∞ falls n verschieden von −1 ist.

Aufgabe 2.2 Verteilung von Summen: Ein Munzwurf zeige mit Wahr-scheinlichkeit 1/2 1 und mit Ws 1/2 : 2. Sei s(n) die Summe der Ergebnisseder ersten n Wurfe. Frage: wie groß iost die WS w(k) dass k unter den s(n)vorkommt.

1. Zeichne eine passende Markowkette.(Zustande, Ubergangswahrschein-lichkeiten)

2. Leite eine Rekursionsformel des Typs w(k) = aw(k−1)+ bw(k−2) ab.

3. Lose die Gleichung fur kleine k.

4. MAPLE hilft weiter:

w(k) =1

2(4

3w(0)− 4

3w(1))(−1

2)k +

1

3w(0) +

2

3w(1)

5. Was kommt im Limes fur k →∞ heraus? Inwiefern ist das plausibel?

6. Was lasst sich bei einem normalen Wurfel statt einer Munze sagen?

Zur letzten Aufgabe eineBemerkung zur Analysis: Die geometrische Reihe.Hat eine relle Zahl a den Betrag 0 < |a| < 1, so strebt die Folge der Zahlenan gegen Null, wenn die Folge der Exponenten gegen Unendlich strebt:

limn→∞

an = 0

Zunachst stellt man namlich fest, dass die Glieder |a|n immer kleiner werden,aber doch großer als Null bleiben, denn |a|n+1 < |a|n ist gleichbedeutend mit

6

Page 8: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

|a| < 1 wie man mittels Division durch |a|n feststellt. Also strebt die Folgeder Zahlen |a|n gegen eine nichtnegative Zahl b. Nun ist aber

limn→∞

|a|n = limn→∞

|a|2n = ( limn→∞

|a|n)2 = b2

Also ist b2 = b. Ware b > 0, so ware b = 1, was nicht der Fall ist, dab < |a| < 1. Nun betrachten wir die Gleichung

(1− a)(1 + a + a2 + . . . + an) = 1− an+1

oder

1 + a + . . . + an =1− an+1

1− a

Nach dem vorangegangenen folgt

∞∑

n=1

an = limn→∞

(1 + a + . . . + an) =1

1− a

Facit Wir haben fur gewisse eigekleidete aufgaben Modelle konstruiert: Dia-gramme mit Pfeilen, an welche Zahlen geschrieben sind( sogenannte Ubber-gangswahrscheinlichkeiten. Aus doiesen diagrammen haben wir zwei Mittel-wertgleichungen abgelesen, mit deren Lßung wir die Aufgabe losten. Mankann diese Gleichungen beweisen - siehe folgenden Abschnitt - man kann sieaber auch und das ist zu deren Handhabe wichtiger - einleuchtend finden.Die korrekte Wahl eines Modells kann man nicht beweisen ( warum nicht? );man kann aber dafur argumentieren.

3 Axiome

In diesem Abschnitt soll geregelt werden, wie uber Ereignisse, Zufallsvaria-blen, Wahrscheinlichkeit, Erwartungswerte, Unabhangigkeit und Zustandegeredet wird. Dies geschieht nicht so, wie es im konkreten Fall zu geschehenhat, namlich so, dass ganz genau gesagt wird, was eine Wahrscheinlichkeitist, und wie groß sie ist, sondern in Form von Axiomen. Diese Axiome sindeinerseits so prazise, dass sie Beweise von interessanten Satzen gestatten, dielogisch aus diesen Axiomen folgen, wie z.B. das “ Gesetz der großen Zahl”;andererseits sind sie so allgemein, dass sie viele Interpretationen zulassen.Das was wir als Beispiele diskutieren, sind meistens Konstruktionen, bei de-nen sich die Axiome verifizieren lassen, und die andererseits als Modelle fur “reale” Situationen gebraucht werden konnen. So ergeben sich aus den Satzen,

7

Page 9: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

die man uber die Modelle - aus den Axiomen - beweisen kann, Vorhersagenfur die realen Situationen,- die man dann zwar nicht beweisen aber uber-prufen kann.Was man unter der fur Mai 2004 erwarteten Anzahl von Regentagen in Stutt-gart zu verstehen hat (im Internet abzulesen ) oder unter der fur 2004 erwar-teten Anzahl von Geburten von Madchen, wird klarer werden im Abschnittuber relative Haufigkeiten und Stichproben.Historisch: Die Griechischen Mathematiker haben als erste erkannt, dass manetwas Interessantes beweisen kann, unumstoßlich und fur alle Zeiten, wennman gewisse Annahmen, die Axiome, zugrunde legt, und nur dann. Euklidhat dafur ein Beispiel gegeben: In seinen “Elementen” hat er die gesamtedamalige Geometrie streng auf wenige Axiome aufgebaut. David Hilbert hatim 20 sten Jahrhundert dieses Projekt wieder aufgenommen. Er meinte, jedestrenge Wissenschaft sucht sich - in ihrem Reifestadium - gewisse zentra-le Axiome, aus denen sich alles ubrige herleiten laßt. Davon angeregt hatA.N.Kolmogorow die heute ublichen Axiome der Wahrscheinlichkeitstheo-rie aufgestellt, in Form der Definition eines Wahrscheinlichkeitsraumes. Furdie wirklich interessanten Dinge braucht man unendliche Wahrscheinlich-keitsraume z.B. schon fur die Diskussion des abgebrochenen Wurfelspiels.Der Einfachheit halber beginnen wir aber mit “ endlichen Wahrscheinlich-keitsraumen”:

Definition 3.1 Eine endliche Menge X = {x1, x2, . . . xn} zusammen mitZahlen p(xi) ≥ 0 heißt endlicher Wahrscheinlichkeitsraum, wenn

n∑

i=1

p(xi) = 1

Die Elemente xi heißen Atome oder Elementarereignisse. Die Teilmen-gen von X heißen Ereignisse. Man setzt p(∅) = 0 und

p({xi1 , xi2 , . . . xik}) = p(xi1) + . . . + p(xik)

p(E) heißtWahrscheinlichkeit von E. Man nennt p Wahrscheinlich-

keitsmaß auf X. Eine Funktion f : X → R wird Zufallsvariable genannt.Die Zahl

E(f) =

n∑

i=1

f(xi)p(xi)

heißt Erwartungswert von f. Zwei Ereignisse E, F heißen unabhangig

wenn p(E ∩ F ) = p(E)p(F ). Zwei Zufallsvariable f, g heißen unabhangig,

8

Page 10: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

wenn fur alle reellen Zahlen a, b die Ereignisse [f = a], [g = b] unabhangigsind. Dabei bedeutet [f = a] die Menge der Elementarereignisse x , fur welchef(x) = a. Sind E, F Ereignisse und p(F ) 6= 0, so heißt

p(E|F ) =p(E ∩ F )

p(F )

die bedingte Erwartung oder bedingte Wahrscheinlichkeit von E un-ter der Bedingung oder Hypothese F.

Diese Definitionen wirken auf manch einen uberraschend: Man fragt sich inwieweit sie das Vorverstandnis, das man von Zufallsgroßen oder von Un-abhangigkeit hat erfassen, oder dem widersprechen. Z.B. fragt man sich,was denn an einer Funktion uberhaupt zufallig sein kann. Fur die Mehrheitder Statistiker und Wahrscheinlichkeitstheoretiker hat sich durch die Arbeitan konkreten Problemen herausgestellt, dass diese Definitionen die richtigensind: Niemand hat andere vorgeschlagen. Allerdings hat man bald bemerkt,dass noch eine Definition der Zufalligkeit einer Folge von reellen Zahlen -bestehend z.B. aus Nullen und Einsen - fehlt, und dass eine solche in derPraxis benotigt wird, wie auch in der Theorie (z.B. in der Kryptographie).Bevor wir das Beispiel des Wurfels diskutieren, zwei beweisbare Satze - diehaufig in Prufungen gefragt werden:

Satz 3.1 (Linearitat des Erwartungswertes) Seien f, g zwei Zufallsvariable,und a, b zwei reelle Zahlen. Dann gilt

E(af + bg) = aE(f) + bE(g)

Satz 3.2 Sind f, g unabhangige Zufallsvariable, so gilt

E(f · g) = E(f) · E(g)

Der Beweis der Linearitat des Erwartugswertes soll als Ubungsaufgabe die-nen. Wir benutzen ihn, um den zweiten Satz zu beweisen.Beweis des zweiten Satzes mit Indikatoren: Der Indikator einer TeilmengeE von X ist die Funktion 1E die den Wert 1E(x) = 1 annimmt, falls x ∈ Eund sonst den Wert 1E(x) = 0. Es gilt fur jede Funktion f : X → R

f =∑

a

a1[f=a]

wie man durch Einsetzen von x nachpruft. Wegen der Linearitat des Erwar-tungswertes hat man

E(f) =∑

a

aE(1[f=a])

9

Page 11: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Aus der Definition des Erwartungswertes ergibt sich : E(1[f=a]) = p([f = a]).Benutzt man nun die Unabhangigkeit von f, g, so ergibt sich

E(f)E(g) = E(∑

a

a1[f=a])E(∑

b

b1[g=b]) = (∑

a

ap([f = a]))(∑

b

bp([g = b]))

=∑

a,b

abp([f = a] ∩ [g = b])

E(fg) = E((∑

a

a1[f=a])(∑

b

b1[g=b])) = E(∑

a,b

ab1[f=a]1[g=b]) = E(∑

a,b

ab1[f=a]∩[g=b])

=∑

a,b

abE(1[f=a]∩[g=b]) =∑

a,b

abp([f = a] ∩ [g = b])

Beispiel 3.1 Der Wurfel: X = {1, 2, 3, 4, 5, 6}; p({i}) = 16.

“ gerade”= {2, 4, 6} = E ist ein Ereignis, das die Wahrscheinlichkeit 16+ 1

6+

16

= 12

hat. F = {1, 2} ist ein anderes Ereignis, das die Wahrscheinlichkeit 13

hat. Beide Ereignisse sind unabhangig, denn p(E ∩ F ) = p({2}) = 16

= 12

13.

Entspricht dies dem Vorverstandnis das man von Unabhangigkeit hat? Es ist

p(E|F ) =p(E ∩ F )

p(F )= p(E)

wie immer fur “mathematisch” unabhangige Ereignisse E, F. Dies entsprichtaber dem Vorverstandnis von Unabhangigkeit, denn gerade dann wird manE als unabhangig von F ansehen, wenn es fur das Eintreten von E keineRolle spielt, ob auch F eintritt.

f({i}) = i definiert eine Zufallsvariable, die “Augenzahl”. Ihr Erwar-tungswert ist E(f) = 1 · 1

6+ 21

6+ . . . + 61

6= 1

6(1 + 2 + 3 + 4 + 5 + 6) = 1

66·72

.Dies ist so auf Grund der folgendenBemerkung zur Kombinatorik: 1 + 2 + 3 . . . + n = n(n+1)

2=(

n2

)

. All-gemein bezeichnet

(

nk

)

sprich “k aus n “ oder “n uber k” die Anzahl derMoglichkeiten, k Elemente aus n auszuwahlen. Es gilt

(

n

k

)

=n · (n− 1) . . . (n− k + 1)

1 · 2 · 3 . . . k

Es ist offensichtlich (?) dass

(x + y)n =

n∑

k=0

(

n

k

)

akbn−k

Fur x = y = 1 ergibt sich 2n als Anzahl der Teilmen-gen einer n -elementigen Menge. Beispiel: X = {1, 2, 3} :∅, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1, 2, 3}.

10

Page 12: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Aufgabe 3.1 Beweise die Linearitat des Erwartungswertes fur endliche W-Raume.

Aufgabe 3.2 Wieviele Teilmengen hat X = {1, 2, 3, 4, 5, 6} ? Wieviele Paa-re von Teilmengen gibt es? Wie groß ist der Anteil der unabhangigen daran(Anzahl unabhangigen geteilt durch Azahl aller Paare.)

Aufgabe 3.3 Die Gleiche Frage wie oben fur eine Menge X aus n Elemen-ten. Eine befriedigende Antwort ist schwierig; jedes Teilergebnis zahlt, z.Bein Programm.

In den meisten Fallen handelt es sich bei unabhangigen Ereignissen um“Wiederholungen eines Versuchs”. So etwas modelliert man mit sogenanntenProduktraumen (mit lauter gleichen Faktoren)

Definition 3.2 Seien (X, p), (Y, q) endliche Wahrscheinlichkeitsraume undZ = X × Y = {(x, y)|x ∈ X, y ∈ Y } der Raum aller Paare von Elementenx aus X und y aus Y . Man definiert das Produktmass r = p × q durchr((x, y)) = p(x)q(y). (Z, r) ist dann ein endlicher W-Raum, genannt derProduktraum von (X, p) und (Y, q).

Satz 3.3 Fur jedes Ereignis E ⊂ X und jedes Ereignis F ⊂ Y sind dieEreignisse E × Y und X × F unabhangig im Produktraum (X × Y, p× q).

Beweis: Es ist E × Y ∩X × F = E × F, und∑

z∈E×F

r(z) =∑

(x,y)∈E×F

p(x)q(y) = (∑

x∈E

p(x))(∑

y∈F

q(y)) = p(E)q(F )

Fur E = X bez.F = Y ergibt sich r(X × F ) = q(F ) bez. r(E × Y ) = P (E).Also

r(E × Y ∩X × F ) = r(E × Y )r(X × F )

was zu zeigen war.

Beispiel 3.2 (Zweimaliges Wurfeln) : Wir nehmen X = {1, 2, 3, 4, 5, 6} mitp(i) = 1

6und den Produktraum (X ×X, p× p).

Sei f1((i, j)) = i der erste Wurf, bez. genauer dessen Augenzahl, undf2((i, j)) = j die des zweiten. Mit Hilfe des vorangegangenen Satzes siehtman leicht, dass diese Zufallsvariablen auf dem Produktraum unabhangigsind. Es gilt

E(f1 + f2) = 27

2

11

Page 13: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Beispiel 3.3 (Sportschau) 6 Experten versuchen einen Ball in ein Loch zuschießen. Jeder der Experten trifft mit WS 1

3. Frage wie groß ist die WS,

dass der Ball ins Loch fliegt?

Sei w die gesuchte Wahrscheinlichkeit. Dann ist 1−w die Wahrscheinlichkeit,dass keiner der Experten ins Loch trifft. Wir werden annehmen, dass dieVersuche der Experten unabhangig von einander sind, also als W-Raum dassechsfache Produkt von ({0, 1}, p) mit sich selbst nehmen, wobei 0 fur “verfehlen” und 1 fur “treffen” steht, und wir entsprechend p(0) = 2

3, p(1) =

13

setzen. Dann folgt

1− w = (2

3)6 =

64

729, w =

665

729

Beispiel 3.4 (n- maliges Wurfeln):

X = {(x1, x2, . . . , xn)|xi ∈ {1, 2, . . . , 6}; p(x1, . . . , xn) =1

6

Es ist dies das n− fache Produkt von ({1, 2, 3, 4, 5, 6}, 16) mit sich selbst.

Sn(x1, . . . , xn) = x1 + . . . + xn,

die Augensumme , hat den Erwartungswert

E(Sn) = n7

2

Die MengeA der Ereignisse eines endlichen Wahrscheinlichkeitsraumes (X, p)erfullen die folgenden “Axiome”

1. Mit dem Ereignis E gehort auch das “ Gegenereignis” X\E “ zu A. (Esist die Menge aller Elementarereignisse x ∈ X, die nicht zu E gehoren.

2. Fur jedes Ereignis E ∈ A ist p(E) ≥ 0; p(∅) = 0; p(X) = 1 ;

3. Fur je zwei Ereignisse E, F ∈ A gehort das “ und-Ereignis” E ∩F unddas “oder- Ereignis” E ∪ F zu A und es gilt

p(E ∪ F ) = p(E) + p(F )− p(E ∩ F )

4. Liegen E1, E2, . . . in A so auch das “und-Ereignis “ E1 ∩E2 ∩ . . . undes gilt

p(E1 ∩ E2 ∩ . . . ) = limn→∞

p(E1 ∩ . . . En)

12

Page 14: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Definition 3.3 (X,A, p) heißt Wahrscheinlichkeitsraum, und pWahrscheinlichkeitsmaß auf X, wenn A eine Menge von Teilmengenvojn X ist - man nennt sie Ereignisse - und p eine Funktion auf A mitWerten im Intervall [0, 1] , so dass die obigen Axiome 1 - 4 gelten.

In diesem Kurs soll auch der Umgang mit Grenzwerten geubt werden. Dazudie folgende Aufgabe. Es geht um die Herleitung aus den Axiomen von Din-gen, die fur das Vorverstandnis von Wahrscheinlichkeit selbstverstasndlichsind:

Aufgabe 3.4 (Grenzwerte) Es seien E1, E2, . . . Ereignisse.

1. Zeige, dass

p(E1 ∩E2 ∪ . . . ∪ En) ≤ p(E1 ∪ . . . ∪En ∪En+1)

Also existiert der Grenzwert limn→∞ p(E1∪ . . .∪En) im letzten Axiom.

2. Es gelte noch Ei ∩ Ej = ∅ fur i 6= j. Zeige, dass

p(E1 ∪E2 ∪ . . . ) = limn→∞

n∑

j=1

p(Ej)

Das Wichtigste und in gewisser Weise einfachste Beispiel eines unendlichenW-Raumes ist der”wiederholte Munzwurf”. Statt eines Wurfels nehmen wireine Munze. Ein Munzwurf zeige mit WS 1

2die 1 und mit WS 1

2die 0. Es sei

Xn das Ergebnis des n -ten Munzwurfes. Wir wollen Xn als Zufallsvariableansehen und fur gegebene bi ∈ {0, 1} die Protokolle, d.h. Folgen (x1, x2, . . . )aus Nullen und Einsen mit

X1 = b1, X2 = b2, . . . xn = bn

als Ereignis mit WS = (12)n.

Beispiel 3.5 (Wiederholter Munzwurf) X = {(b1, b2, . . . )|bi ∈ {0, 1}};

p([X1 = b1] ∩ [X2 = b2] ∩ . . . ∩ [Xn = bn]) = (1

2)n

Es sind also in diesem Beispiel die Atome die Folgen aus Nullen und Einsen.Zum Rechnen taugen sie allerdings nicht viel, da sie alle die Wahrscheinlich-keit 0 haben.

Aufgabe 3.5 Zeige, dass die Atome beim wiederholten Munzwurf die WS 0haben.

13

Page 15: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Als “ Elementarereignisse”taugen vielmehr die sehr großen Ereinisse [Xi = b],die durch festlegen des i ten Resultates definiert sind. Diese sind, nach obi-ger Definitiion, unabhangig fur verschiedene i - so dass die WS eines Durch-schnitts das Produkt Ihrer Wahrscheinlichkeiten ist. Beachte, dass wir nursolche Ereignisse in der Definition des W-Raumes aufgefuhrt haben, undnicht alle Ereignisse. Das zu tun ware schwierig, und in gewissem Sinne auchgar nicht moglich,- aber fur unsere Zwecke auch nicht notig. Man nennt denRaum der Folgen von Nullen und Einsen auch den Pfadraum.Man braucht den Pfadraum zwar , vor allem zu definitorischen Zwecken; furdie konkrete aufgabe lautet die Devise jedoch: schaffe dir ein der Aufgabeangepasstes Modell.

Beispiel 3.6 Wie groß ist die WS dafur, dass irgendwann einmal eine “1 “geworfen wird?

Zum Gluck kann man hier im Pfadraum rechnen, indem man - Trick - die“ Gegenwahrscheinlichkeit” berechnet, das ist die Wahrscheinlichkeit derFolge, die nur aus Nullen besteht. Diese ist (Unabhangigkeit der einzelnenAusgange) offebar Null; also ist die gesuchte WS gleich 1.Die Methode des kleinen Modells bez. der kleinen Markowkette funktionierthier so: ich wahle zwei Zustande: 0 und 1 , sowie Ubergangswahrscheinlichkei-ten p00 = 1

2= p01, p11 = 1− p00 Die gesuchte WS ist die Wahrscheinlichkeit

w(0) von 0 startend einmal 1 zu erreichen. Unsere Mittewertgleichung besagt

w(0) =1

w(0) +

1

2w(1); w(1) = 1

Also ist w(0) = 1.Wir wollen nun die Mittelwertgleichung im Pfadraum beweisen. Der Pfa-draum wird allgemein zu einer (diskreten) Markowkette konstruiert:

Definition 3.4 Eine Menge X = {x1, x2, . . . } zusammen mit Zahlen pxy ≥0, x, y ∈ X heißt Markowkette mit Zustandsraum X und Ubergangs-

wahrscheinlichkeiten pxy, wenn fur alle x ∈ X :∑

x,y

pxy = 1

Man betrachtet den Pfadraum X∞ aller Folgen (z1, z2, . . . ) mit Zustandenzi ∈ X sowie die “ einfachen” Ereignisse [a1, a2, . . . , al] die aus allen Fol-gen (z1, z2, . . . ) ∈ X∞ bestehen, die an den ersten l Stellen mit (a1, . . . , al)ubereinstimmen, so dass also z1 = a1, z2 = a2, . . . zl = al. Fur jeden Zustandz ∈ X definiert man ein Wahrscheinlichkeitsmaß pz durch:

pz[z, a1, . . . , al] = pza1pa1a2 . . . pal−1al

14

Page 16: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Man liest dies als: die Wahrscheinlichkeit, bei Start in z im ersten Schrittnach a1 zugelangen, im zweiten Schritt nach a2, usw. und im l-ten Schrittnach al. Es wird

pz[y, a1, a2, . . . al]) = 0

gesetzt fury 6= z. Hierdurch wird, was wir nicht beweisen, ein Wahrschein-lichkeitsraum (X∞,A, pz) dediniert. Beachte, dass wir nur die “einfachen”Ereignisse in A und ihre Wahrscheinlichkeiten beschrieben haben, aber nichtalle. Das genugt jedoch fur das folgende, namlich, die Wahrscheinlichkeitpz(E) des Ereignisses E zubestimmen, das aus allen Folgen besteht, die ei-ne Teilmenge A von X zum ersten Mal in einem Zustand a ∈ A treffen,d.h. allen (z1, z2, . . . ) so dass z1 = z und z1, z2, . . . zl−1 6= A, zl = a. DieseWahrscheinlichkeit sei mit w(z) bezeichnet.

Satz 3.4 (Erster Mittelwertsatz) Fur die Wahrscheinlichkeit w(z) , bei Startin z die Menge A zum ersten Mal in a zu treffen, gilt w(z) = 0 fur z ∈A \ {a}, w(a) = 1 und

w(z) =∑

y

pzyw(y)

sonst, d.h. fur z ∈ X \ A.

Beweis: Das Ereignis dessen Wahrscheinlichkeit wir bestimmen wollen, be-steht aus allen [z, y1, . . . , yl, a] wo alle yi nicht zu A gehoren. Die Wahrschein-lichkeit eines solchen “ einfachen” Ereignisses ist pzy1py1y2 . . . pyla. Summiertman hier uber y1, so erhalt man gerade pzy1w(y1). Damit folgt die Behaup-tung durch Summation uber y1.Fur Folgen f = (z, y1, y2, . . . yl, yl+1, . . . ) mit z, y1, y2, . . . yl−1 6= A, yl ∈ A istD(f) = l die Lebenszeit in X \A. Fur Folgen, die nicht von dieser Art sind,die also niemalsA treffen, setzen wir D(f) =∞. Es interessiert die erwarteteLebenszeit Ez(D) = d(z) bei Start in z.

Satz 3.5 (Zweiter Mittelwertsatz) Fur die erwartete Lebenszeit d(z) in X\Abei Start in z gilt:

d(z) = 1 +∑

y

pzyd(y)

falls z ∈ X \ A, und d(z) = 0, falls z ∈ A.

Beweis: Es ist

d(z) = Ez(D) =∑

(l + 1)pz[z, y1, y2, . . . ylb]

15

Page 17: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

wobei uber diejenigen einfachen Ereignisse [z, y1, . . . yl, b] summiert wird, diein z starten und A zum ersten Mal nach l + 1 Schritten treffen. dabei wirdallerdings vorrausgesetzt, dass mit Wahrscheinlichkeit 1 A getroffen wird;sonst ist d(z) =∞. Es ist

pz[z, y1, y2, . . . yl, b] = pzy1py1y2 . . . pylb = pzy1py1 [y1, . . . yl, b]

Demnach ist

d(z) =∑

(l + 1)pzy1py1[y1, y2, . . . b]

Bei festgehaltenem y1 ergibt die Summation

pzy1

py1[y1y2 . . . b] + pzy1py1([y1, . . . , yl, b]) = pzy1d(y1) + pzy1w(y1)

Wegen der Vorraussetzung, dass Folgen mit Wahrscheinlichkeit 1 A treffen,ist der zweite Summand, uber y1 summiert, gleich 1. Daraus folgt die Be-hauptung.

16

Page 18: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

4 Relative Haufigkeiten

“Wahrscheinlichkeit ist relative Haufigkeit auf lange Sicht”,(Georg Plya : Mathematik und plausibles Schließen, Band 2, Birkhauser 1975) (Eine Aussage, wie diese wird auch “frequentistische”Interpretation derWahrscheinlichkeit genannt. Es gibt auch anders lautende Interpretationen,z.B. die sogenannte “Wettdeutung”. Interpretationen von Modellen oder ab-strakten Sprechweisen konnen unstimmig, oder unnutz sein, aber haufig sindModelle oder Sprechweisen gerade darum nutzlich weil sie verschiedene In-terpretationen haben, und damit keine “ richtige” und auch keine “falsche”.)

Im vorrausgegangenen Abschnitt ging es um Wahrscheinlichkeit, Zufalls-variable, etc allgemein und in der Welt der mathematischen Modelle.

“{1, 2, 3, 4, 5, 6}, p({i}) =1

6“

ist ein solches Modell. Es ist ein Modell fur ein”Experiment”, das jederausfuhren kann, namlich einen realen Wurfel - aus Holz oder Plastik - zuwurfeln. In diesem Abschnitt geht es darum, warum man in diesem Fallp({i}) = 1

6wahlt.

Die Antwort ist doch wohl diese: wenn ich tausend mal einen realen Wurfelwurfle, dann erwarte ich dass ungefahr jeder 6 te Wurf eine 2 zeigt, besser,dass ungefahr 1000

6mal die 2 unter den Ergebnissen vorkommt, d.h. die rela-

tive Haufigkeit mit der die 2 unter den Ergebnissen vorkommt erwarte ichnahe bei 1

6. Wenn diese relative Haufigkeit statt dessen 0, 5321 ist, schopfe

ich Verdacht, dass etwas mit dem Wurfel nicht stimmt, in dem Sinne, dassdie der 2 gegenuberliegende Seite schwerer ist als andere. Wenn allerdingsgenau jeder sechste Wurf eine 2 zeigt, werde ich ebenfalls stutzig, denn voneinem zufalligen Ereignis erwarte ich nicht eine solche Regelmaßigkeit. In derTat ist in unserem mathematischen Modell die Wahrscheinlichkeit, dass dererste, 7 te, 13 te Wurf u.s.w. eine 2 ist , kleiner als

1

10999

Die meisten Menschen glauben nicht, dass sie sehr seltene Ereignisse erle-ben, - wobei naturlich das was als sehr selten bezeichnet wird von Mensch zuMensch und Situation zu Situation schwankt. Statt dessen werden sie eineModellierung verwerfen, die eine derartig kleine Wahrscheinlichkeit des be-obachteten Ereignisses ergibt.Sei nun fur eine Folge (z1, . . . , zn) von Wurfen des mathematischen Wurfels

Xi(z1, . . . , zn) = 1, falls zi = 2 und = 0 sonst

17

Page 19: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Dann ist

1

n(X1 + . . . + Xn)

eine Zufallsvariable welche die relative Haufigkeit der 2 unter n Wurfen an-gibt. Wir betrachten den WS- Raum der (z1, . . . , zn) mit zi ∈ {1, 2, 3, 4, 5, 6}und pn({(z1, . . . , zn)}) = 6−n. Ferner sei ε eine positive Zahl.

Satz 4.1

pn([|X1 + . . . + Xn|

n− 1

6]) ≤ 3− 1

12

ε2n

Dieser Satz ergibt sich aus der Ungleichung von Tschebyschew weiter unten.Dabei bedeutet [ 1

n|X1+. . .+Xn| ≥ ε] das Ereignis, dass die relative Haufigkeit

von 2 bei n Wurfen um mindestens ε von 16

abweicht. Wahlt man z.B.ε = 0.1,und n = 1000 so erhalt man rechts

3− 112

1100

1000≤ 300

1000=

3

10

3 von 10 Fallen sieht man i.a. noch nicht als selten an. Beobachtet manhingegen als relative Haufigkeit 1

2so hat man das Ereignis [ 1

n|X1+. . .+Xn| ≥

13] beobachtet, und dieses hat nach obiger Formel eine Wahrscheinlichkeit, die

kleiner ist als

27

1000≤ 0.027

und dies sieht man schon oft als Seltenheit an. Man hat dann die Annahme,( auch Hypothese) dass das Wurfeln mit dem vorliegenden Wurfel durchp({i}) = 1

6gut modelliert wird, einem statistischen Test unterworfen der

darin besteht zu berechnen, ob das beobachtete Ereignis im Modell eine WShat , die z.B. kleiner als 0.05 ist . Ist dies der Fall, so kann man die Hypothese“auf dem 5 Prozent- Niveau’’ verwerfen. Hat man dies getan, so erhebtsich die Frage, welches Modell man an die Stelle des verworfenen setzt. DieseFrage kann man beantworten, indem man die Wahrscheinlichkeit von 2 durch

S =1

n(X1 + . . . + Xn)

schatzt. ( Das wird man insbesondere dann tun, wenn kein anderes Wissenuber den Wurfel vorliegt, als das Ergebnis des n- maligen Wurfelns.) Dannist S ein statistischer Schatzer fur die Wahrscheinlichkeit von 2.

18

Page 20: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Beispiel 4.1 (Eine Spielbank brechen) Da kein realer Wurfel vollkommenist, gibt es die folgende Moglichkeit “eine Spielbank zu brechen” : ich beobachteeinen Wurfel so lange, bis ich meine herausgefunden zu haben, dass z.B. die2 eine relative Hufigkeit q > 1

6hat. Dann biete ich der Bank das folgende

Spiel an: ich erhalte das Doppelte meines Einsatzes auf eine Zahl i, wenn igewurfelt wird, und zahle der Bank ein funftel davon anderenfalls.

Ist der Wurfel, wie die Bank meint, perfekt, so ist ihr erwarteter Gewinn−a

6+ 5

6a5

= 0. Also wird sie nichtsahnend auf das Spiel eingehen. Wenn michmeine Beobachtungen jedoch nicht getauscht haben, dann ist der erwarteteGewinn der Bank,

−qa + (1− q)a

5=

1− 6q

5< 0

und ich gewinne. In Wirklichkeit wird die Bank solch lange Versuchsreihenverhindern.Es folgt die Ungleichung von Tschebyschew, aus welcher das beruhmte “Gesetz der großen Zahl” folgt, welches wiederum den obigen Satz impliziert.

Satz 4.2 (Ungleichung von Tschebyschew) Auf dem W-Raum (X, p) sei Veine Zufallsvariable mit Erwartungswert E(V ) = µ. Dann gilt fur jede posi-tive Zahl ε

p(|V − µ| ≥ ε) ≤ E(V − µ)2

ε2

Der Beweis ist sehr einfach: (V − µ)2 ist eine Zufallsvariable, die nur nicht-negative Werte annimmt, namlich Quadrate.Der “Indikator” des Ereignisses,dass |V − µ| ≥ ε ist eine Zufallsvariable, die auf dem Elementarereignis zden Wert 1 annimmt,wenn |V (z) − µ| ≥ ε und sonst den Wert Null. Manbezeichnet diesen Indikator mit

1[|V −µ|≥ε]

Beachte, dass |V − µ| ≥ ε genau dann, wenn (V − µ)2 ≥ ε2. Daher gilt

(V − µ)2 ≥ (V − µ)21[(V −µ)2≥ε2] ≥ ε21[|V −µ|≥ε]

Wendet man auf diese Ungleichung die Operation “ Erwartungswert an, soerhalt man

E(V − µ)2 ≥ ε2E(1[|v−µ|≥ε])

19

Page 21: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Die Behauptung folgt nun daraus, dass der Erwartungswert E(1A) eines Er-eignisses A gleich der WS dieses Ereignisses ist:

E(1A) = p(A)

Diese Ungleichung gibt Anlass zur Definition der Varianz V arV einer Zu-fallsvariablen. Sie misst die Abweichung der Zufallsvariablen von ihrem Er-wartungswert.

Definition 4.1 V ar(V ) = E(V − E(V ))2 heißt Varianz,√

V ar(V ) heißtStreuung, Standardabweichung von V.

Beispiel 4.2 (Augenzahl) Es sei V die Augenzahl beim Wurfeln. Dann istV ar(V ) = 1

6(1 + 22 + 32 + 42 + 52 + 62) = 91

6

Allgemeiner kann man nach einer “ geschlossenen”Formel S(n) fur 1+22+32+. . . n2 fragen. Eine allgemeine Methode hierfur ist laut Graham, Knuth, Pa-tashnik(1991) : Concrete mathematics (A Foundation For Computer Science,Dedicated to Leonard Euler (1707 - 1783), Addison Wesley)Method 0 : “You could look it up “Der MAPLE Befehl “ sum “ ergibt S(n) = n(n+1)(2n+1)

6

Wenn man benutzt, dass E(V1V2) = E(V1)E(V2) fur unabhangige Zufalls-variable V1, V2, so ergeben sich mit einfachen Umformungen die folgendenRechenregeln

Satz 4.3 Seien V1, V2 unabhangige Zufallsvariable und a eine relle Zahl.Dann gilt :

1. V ar(V1) = E(V 21 )− E(V1)

2

2. V ar(aV ) = a2V arV

3. V ar(V1 + V2) = V ar(V1) + V ar(V2)

Es ist also fur unabhangige V1, V2, . . . Vn, die alle die gleiche Varianz σ2 haben:

V ar(V1 + . . . + Vn

n) = V ar(

1

nV1) + . . . + V ar(

1

nVn) =

1

n2σ2

und somit folgt aus der Ungleichung von Tschebyschew

Satz 4.4 (Schwaches Gesetz der großen Zahl) Seien V1, V2, . . . Vn Zufalls-variable, die alle den gleichen Erwartungswert E(vi) = µ und die gleicheVarianz V ar(Vi) = σ2 haben. Dann gilt fur jede positive Zahl ε :

p(|V1 + . . . + Vn

n− µ| ≥ ε) ≥ σ2

ε2n

20

Page 22: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Dieser Satz erlaubt die folgende Interpretation des Erwartungswertesµ = E(V ) einer Zufallsvariablen: “µ ist eine relle Zahl mit folgenderEigenschaft: Die Wahrscheinlichkeit, dass bei n-maligen unabhangigenAuswertungen v1, v2, . . . vn von V das arithmetische Mittel 1

n(v1 + . . . + vn)

außerhalb eines Intervalls mit Lange 2ε und Mittelpunkt µ liegt, sinkt gegenNull, falls n gegen unendlich strebt.” Wie im Spezialfall des Wurfels laßtsich das schwache Gesetz der großen Zahl benutzena. Zum Test, ob der Erwartungswert in einem gewissen Intervall liegtb: Zum Schatzen des Erwartungswertes.

Aufgabe 4.1 Laden Sie einen langeren Text in deutscher oder anderer Spra-che aus dem Internet herunter. Z.B. Goethes “ Die Leiden des jungen Wer-ter” oder die Ausgabe einer Tageszeitung in deutscher oder anderer Sprache.Bringen Sie den text in eine Form, in welcher Ihre software , z.B. MAPLEdie Relative Haufigkeit von Buchstaben zahlen kann. Es ist interessant, wennviele verschiedene Texte - und Sprachen - untersucht werden.

Aufgabe 4.2 Zahlen Sie die relative Haufigkeit h(j) der verschiedenenBuchstaben j in Ihrem Text, indem Sie verschiedene Zahlmethoden anwen-den: der Reihe nach den Text durchlaufend , zufallig auswahlend (Stichpro-ben), . . . . Ab welcher Textgroße andern sich die relativen Haufigkeiten nurnoch kaum merklich? Haben sie Argumente dafur oder dagegen, dass die re-lativen H. vom speziellen text unabhanggig sind?

Aufgabe 4.3 Bestimmen Sie die “Ubergangswahrscheinlichkeiten“ pij voneinem Buchstaben i zu einem Buchstaben j , d.h. dien relative Haufigkeit,mit der auf einen Buchstaben i ein Buchstabe j folgt. Prufen Sie , ob fur allei ungefahr

j

pijh(j) = h(i)

wobei h(j) die relative Hufigkeit von j in einem Teiltext.

21

Page 23: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

5 Was ist ein Erwartungswert?

In diesem Abschnitt soll noch einmal einiges uber den Erwartungswert zu-sammengestellt werden: Definitionen, Beispiele, Eigenschaften. Der Ewar-tungswert ist ein “Operator” der Zufallsvariablen eine Zahl zuordnet. Diewichtigsten Eigenschaften sind die “ Linearitat des Erwartungswertes” unddies, dass der Erwartungswert des Indikators eines Ereignisses die Wahr-scheinlichkeit dieses Ereignisses ist,- weil diese Einschaften festlegen, welcheWerte der Erwartungswert annimmt. Das Lernziel ist , anhand von Beispielenein intuitives Verstandnis des Erwartungswertes zu gewinnen, das es erlaubt,ohne formale Ableitung, oder vor einer formalen Ableitung den Erwartungs-wert “ abzuschatzen”. Wir reden prinzipiell nur von Zufallsvariablen, diediskrete Werte annehmen. Einige Zufallsvariable “haben keinen Erwartungs-wert”.(Siehe Beispiel unten). Wir ignorieren diese Schwierigkeit.

Definition 5.1 Sei (X, p) ein endlicher W-Raum, und X → R eine Zufalls-variable.

E(V ) =∑

x

V (x)p({x})

heißt Erwartungswert von V.

Weiter unten erscheint ein Ausdruck fur den Erwartungswert, der auch furnicht endliche W-Raume taugt.

Beispiel 5.1 Wurfel: X = {1, 2, 3, 4, 5, 6}, p({i}) = i; V (i) = i, EV = 72.

Man sagt, V sei gleichverteilt, weil jeder Wert von V die gleiche Wahr-scheinlichkeit hat. Der Erwartungswert von V heißt darum auch erstes Mo-ment der Gleichverteilung auf {1, 2, 3, 4, 5, 6}, EV 2 zweites Moment,usw. z.B.ist das funfte Moment 1

6(1 +25 + . . .+ 65). Man kann MAPLE befragen, was

bei

1 + 25 + . . . n5

herauskommt. Die Antwort - mit dem Befehl “sum” -lautet

1

6(k + 1)6 − 1

2(k + 1)5 +

5

12(k + 1)4 − 1

12(k + 1)2

Wir betrachten jetzt einen W-Raum (X, p) der nicht notwendig endlich ist,z.B. den Raum X der Folgen (x1, x2, . . . ) wiederholten unabhangigen Munz-werfens. Diese Folgen sind dann einerseits die Elementarereignisse, anderer-seits haben sie (wieso?) die Wahrscheinlichkeit 0. Daher ersetzt man die obigeDefinition durch die folgende

22

Page 24: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Definition 5.2 Sei v : X → R eine Zufallsvariable. Dann heißt

E(V ) =∑

a

ap([V = a])

der Erwartungswert von V.

Beispiel 5.2 Wiederholtes Wurfeln: V ((x1, x2, . . . )) = xi falls xi die erstegerade Augenzahl, die gwurfelt wird. E(V ) = 1

3.

Intuitiv: Immerzu etwas ungerades zu Wurfeln hat Wahrscheinlichkeit Null,also wird mit WS 1 einmal etwas gerades gewurfelt. 2, 4, 6 sind gleichwahr-scheinlich und einander ausschließend, also: 1

32 + 1

34 + 1

6= 4.

Formal: ,[V = 2] besteht aus allen [x1, x2, . . . , xn, 2] , fur welche alle xi unge-rade sind. Dass x1, x2, . . . xn ungerade sind, hat ( Unabhangigkeit) die Wahr-scheinlichkeit 1

2n Weil die Summe dieser Zahlen, von n = 0 angefangen 2 ist,ist die WS, dass die esrte gerade Zahl eine 2 ist, 21

6= 1

3, und ebenso fur 4, 6.

Also ist E(V ) = 132 + 1

34 + 1

36 = 4.

Mit Markowkette: Wir wahlen einen Zustand u fur “ noch nichts gerades”sowie 2, 4, 6. Die Markowkette wird durch das folgende Diagramm dargestellt

4 6↑ ↗u −→ 2

Der Loop tragt die Inschrift 13

, die anderen Pfeile 16; 2, 4, 6 sind Endzustande.

Fur den gesuchten Erwartungswert e(u) gilt die Mittelwertgleichung

e(u) =1

2e(u) +

1

6e(2) +

1

6e(4) +

1

6e(6)

Weil e(2) = 2, e(4) = 4, e(6) = 6 erhalt man 1(2)e(u) = 12

6= 2, e(u) = 4.

Im folgenden Satz werden die wichtigsten Rechenregeln zusammengestellt.

Satz 5.1 Seien V1, V2 Zufallsvariable, a1, a2 relle Zahlen, A ein Ereignis.

1. E1A = p(A);

2. E(a1V1 + a2V2) = a1E(V1) + a2E(V2); “ Linearitat des Erwartungswer-tes”.

3. E(V1V2) = E(V1)E(V2), falls V1 und V2 unabhangig sind.

23

Page 25: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Definition 5.3 Ein Wahrscheinlichkeitsmaß p wird auch Verteilung ge-nannt. Jede Zufallsvariable V : X → R auf einem W-Raum (X, p) hat eineVerteilung q = V (p) , gegeben duch

V (p)({a}) = p([V = a])

Ist q eine beliebige Verteilung auf R , so definiert man den Erwartungswert

von q durch

M1(q) = E(q) =∑

a

aq({a})

Analog definiert man das “ zweite Moment” von q durch

M2(q) =∑

a

a2q({a})

u.s.w.

Nach unserer neuen Definition ist der Erwartungswert der Verteilung einerZufallsvariablen auch der Erwartungswert der Zufallsvariablen. Nicht alleVerteilungen haben einen Erwartungswert bez. ein zweites oder k -tes Mo-ment; wir ignorieren aber dieses Problem. Fur alle Falle aber ein Beispiel

Beispiel 5.3 X bestehe aus den naturlichen Zahlen 1, 2, 3, . . . . Es seip({n}) = 2−n und die Zufallsvariable V definiert durch V (n) = (−1)n2n.Folglich ist

n∑

a=1

V (a)p({a}) = −1 bez. 0

je nach dem, ob n ungerade oder gerade ist.

Man kann also V keinen Erwartungswert zu ordnen, ohne mit den erstenzwei Rechenregeln in Konflikt zu geraten.

Beispiel 5.4 (Binomialverteilung) X bestehe aus den Teilmengen T von{1, 2, 3, . . . , n}. X hat 2n Elemente und daher setzen wir p({T}) = 2−n ;ferner V (T ) = ]T = Anzahl der Elemente von T.

Es gibt(

nk

)

Teilmengen mit k Elementen. Daher ist p([v = k]) = 2−n(

nk

)

. Des-wegen heißt die Verteilung von V Binomialverteilung. Wir suchen E(V ):Uber den Daumen gepeilt: E(V ) liegt zwischen 1 und n; alle Elementzahlensind gleichberechtigt: also E(V ) = n

2.

Induktion, oder : zuerst die einfachsten Falle : n = 1; E(V ) = 012

+ 112

=

24

Page 26: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

12

= n2

: n = 2 : E(V ) = 014

+ 124

+ 214

= 1 = n2.

Der Induktionsschluss: Es sei bereits gezeigt, dass die erwartete Elementzahlbei n Elementen En = n

2ist. Da eine Teilmenge T von {1, . . . , n+1} entweder

n+1 enthalt, oder nicht, ergibt sich En+1 = 12En + 1

2En + 2n

2n+1 = n4+ n

4+ 1

2=

n+12

.Mit Binomialkoeffizienten:

En = 2−n

n∑

n=0

k

(

n

k

)

= 2−nn

n∑

k=1

(

n− 1

k − 1

)

= 2−nn

n−1∑

k=0

(

n− 1

k

)

= 2−nn2n−1 =n

2

Haufig lassen sich Erwartungswerte mit geeigneten Markowketten interpre-tieren, so dass man eine der zwei Mittelwertgleichungen verwenden kann:

Satz 5.2 (Markowketten) Sei pxy, x, y ∈ X eine Markowkette

1. Fur die erwartete Zeit eB(x) bis zum Verlassen einer Teilmenge B vonX, bei Start in x ∈ B gilt

eB(x) = 1 +∑

y

pxyeB(y)

falls x ∈ B und eB(x) = 0 falls x 6= B.

2. Fur die WS w(x) bei Start in x eine Teilmenge B ⊂ X zuerst in A ⊂ Bzu erreichen, gilt

w(x) =∑

y

pxyw(y)

falls x 6= B und w(x) = 1 bez.w(x) = 0 , falls x ∈ A bez.x ∈ B \ A.

Beispiel 5.5 (Kann man sein Gluck abwarten?) Eine Munze zeigt mit WS12

eine 1 und mit WS 12

eine −1.Im ersten Fall gewinnt man 1Euro, imzweiten Fall verliert man 1Euro. Wie groß ist die WS, dass man, falls manlange genug wartet, Millionar wird, d.h. 106Euro gewonnen hat? Und wielange muss man - im Mittel - darauf warten?

Wir wahlen das Kapital k als Zustandsgroße, d.h. die ganzen Zahlen X alsZustandsraum; ferner fur k < m = 106

pk,k−1 = pk,k+1 =1

2

sowie pkk = 1 fur k ≥ m. Die gesuchte WS genugt der Gleichung

w(k) =1

2w(k − 1) +

1

2w(k + 1), w(m) = 1.

25

Page 27: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

w erfullt also eine Geradengleichung. Die Gerade geht durch den Punkt(m, 1). Da ferner 0 ≤ g(k) ≤ 1 fur alle k , ist g die Konstante 1. Wie langemuss man auf die Million warten? Wir zeigen, dass die erwartete Wartezeitauf 1Euro bereits unendlich ist , falls man in 0 startet. fur die erwartete Zeite(k) gilt

e(k) = 1 +1

2e(k − 1) +

1

2e(k + 1)

und e(0) = 1 + 12e(−1). Wir konnen also e(0) durch e(−1) ausdrucken. Setzt

e(−1) = 1 + 12e(0) + 1

2e(−2) ein, so ergibt sich e(0) = 2+ 1

3e(−2) . setzt man

e(−2) = 1 + 12e(−3) + 1

2e(−1) ein , so ergibt sich e(0) = 3 + 1

4e(−3). Nun

errat man bereits

e(0) = i +1

i + 1e(i), i ≥ 1

Also ist e(0) =∞.Man kann die erratene Gleichung auch beweisen, und zwar mit dem als “vollstandige Induktion nach i “ bezeichneten Verfahren, siehe unten.

Satz 5.3 (Interpretation) Sei V : X → R Zufallsvariable auf einem W-Raum (X, p) . Dann “ konzentriert” sich das arithmetische Mittel unabhangigwiederholter Auswertungen von V auf den Erwartungswert EV.

Genauer: Ist Xn = {(x1, . . . xn)|xi ∈ X} das n mal wiederholte “ Expe-riment”, und pn({(x1, . . . , xn)}) = p({x1}) . . . p({xn}, - wir reden hier voneinem endlichen W-Raum (X, p) - und Vi((x1, . . . , xn)) = xi, so gilt fur jedesε > 0 :

pn([|V1 + . . . + Vn

n− E(V )| ≥ ε]) −→

n0

Statt −→n

0 kann man auch schreiben

≤ V arV

ε2n

In den folgenden beiden Aufgaben geht es ebenfalls um Interpretation desErwartungswertes:

Aufgabe 5.1 Mit WS p(k) bricht in k, k ganze Zahl, ein Waldbrand aus. Istder Wasserspeicher in z so entstehen Kosten in Hohe von (z−k)2. Wo stehtder Wasserspeicher am besten?

26

Page 28: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Aufgabe 5.2 Ein Bauunternehmer in Stuttgart mochte sich mit einer Sum-me (Pramie) von sEuro pro Regentag gegen Regentage versichern. Und zwarfur die nachsten funf Jahre. Wieviele Regentage pro Jahr erwarten Sie in dennachsten Jahren? (Internetrecherche) Was wurden Sie als Versicherung vomBauunternehmer als Versicherungsbeitrag verlangen?

Aufgabe 5.3 (T.Kern) Eine Munze wird geworfen. Sie zeigt mit WS 12

Kopfund mit WS 1

2Zahl. Nach kmaligem Werfen wird das Spiel abgebrochen, wenn

entweder k = n, oder die ersten k − 1 mal Zahl, und das k− te mal Kopfgeworfen wurde. In diesem Fall wird Gewinn 2k−1 ausgeschuttet. Ermittleden erwarteten Gewinn.

Beispiel eines Beweises mittels “vollstandiger Induktion”

Die Gleichung

e(0) = i +1

i + 1e(−i)

werde mit G(i) bezeichnet. Wir wissen, dass G(1) richtig ist. Wenn nun fur je-des i aus der Annahme A(i), namlich dass G(1), G(2), . . .G(i) gelten, schondie Gultigkeit von G(i + 1) folgt, gilt offenbar G(i) fur alle i = 1, 2, 3, . . . .Um nun aus e(0) = i + 1

i+1e(−i) die Gleichung G(i + 1) : e(0) = i + 1 +

1i+2

e(−i−1) zu folgern, hat man offenbar e(−i) durch e(−i−1) auszudrucken.

Hierzu hat man nur die Gleichung e(−i) = 1 + 12e(−i + 1) + 1

2e(−i− 1) zur

Verfugung. Darin stort der Term e(−i + 1). Wir konnen ihn aber nach An-nahme A(i) mit der Gleichung G(i−1) : e(0) = i−1+ 1

ie(−i+1) eliminieren,

und erhalten

e(−i) = 1 +1

i + 1(1 +

1

2e(0)− 1

2i(i− 1) +

1

2e(−i− 1))

Dies in G(i) eingesetzt ergibt

e(0) = i +1

i + 1(1 +

1

2ie(0)− 1

2i(i− 1) + e(−i− 1))

oder

i + 2

2(i + 1)e(0) = i +

1

i + 1− i(i− 1)

2(i + 1)+

1

2e(−i− 1) =

(i + 1)(i + 2)

2(i + 1)+

1

2(i + 1)e(−i− 1)

Mittlels Kurzen folgt die Gleichung G(i + 1) :

e(0) = i + 1 +1

i + 2e(−i− 1)

27

Page 29: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

6 Simulation

In diesem Abschnitt geht es umzufallige Folgen - von Zahlen - und wie sie erzeugt werden, umPseudozufallsfolgen, d.h. Folgen die zufallig aussehen, aber durch eineneinfachen Algorithmus (Pseudozufallsgenerator) erzeugt werden,wie man mit zufalligen Folgen oder pseudozufalligen zufallige Ereignisse si-

muliert,und was der Nutzen davon ist.Zunachst ein Beispiel fur Simulation aus Engels Stochastik

Beispiel 6.1 (Entenjager) 10 Jager schießen gleichzeitig auf 10 Enten. Je-der Jager wahlt sein Opfer zufallig, und unabhangig von den anderen Jagernaus, und trifft. Welches ist die erartete Anzahl der uberlebenden Enten?

Simulation: man entnimmt einer Tafel mit Zufallsziffern 5 Blocke von je10 Zufallsziffern aus {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}. Die in einem Block fehlendenZiffern sin die bei einem Versuch uberlebenden Enten.

9416956090; fehlend : 2378; Anzahl : 4

7506682320; fehlend : 149; Anzahl : 3

4628819077; fehlend : 35; Anzahl : 2

7592050242; fehlend : 1368; Anzahl : 4

4233819129; fehlend : 0567; Anzahl : 4

Das arithmetische Mittel der Fehlenden:175

= 3, 4 dient als Naherung furden wahren Wert. Diesen konnen wir hier im Beispiel auch exakt berechnen:die Wahrscheinlichkeit dafur, dass eine spezielle Ente von allen 10 Jagernverfehlt wird, ist namlich p = (0, 9)10. Also ist der gesuchte Erwarungswert10(0, 9)10 ≈ 3, 5. Man kann also unsere Simulation auch als ein - mit zufalli-gen Fehlern behaftetes Naherungsverfahren zur Berechnung von 10(0, 9)10

ansehen.Man kann diesem Spielbeispiel schon moglichen Nutzen von Simulationenentnehmen:Simulationen sind “ unblutig”; man greift nicht in die zu untersuchende Si-tuation ein;man kann uberhaupt Experimente machen, wo dies realiter gar nicht moglichist, wie z.B. wenn man Entstehung von Sternen untersuchen mochte;man spart Rechenzeit, indem man kleine Stichproben (im Beispiel k = 5 )nimmt, - und auf das Gesetz der großen Zahl baut.Wie man gesehen hat wird die Simulation der Entenjagd von zufalligen Fol-gen von Ziffern betrieben. Aber

28

Page 30: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Was ist eine zufallige Folge?

Man gewinnt zufallige Folgen durch gewisse physikalische Vorgange, wieWurfeln (mit Wurfelautomaten) oder durch Vorgange, in denen die Un-bestmmtheit der Quantenphysik direkt zum Ausdruck kommt. Damit ist an-gedeutet, wenn auch auf nichtmathematische Art, was ein “ Zufallsgenerator”ist. Es ist aber noch nicht geklart, wann man eine einzelne Folge, geschweigedenn eine endliche, als zufallig anzusehen hat. Das Vorverstandnis fordertdass man keine Muster erkennen kann;dass man die Glieder der Folge nicht vorhersagen kann;dass es keine einfache Beschreibung gibt;dass regelmassig ausgewahlte Teilfolgen Gleichverteilung aufweisen. Z.B.wird man eine periodische Folge nicht als zufallig ansehen, wegen des Pe-riodenmusters. Aber auch die Dezimalentwicklung der Kreiszahl π ist nichtzufallig, denn sie ist vorhersagbar. Eine Folge, bei welcher die relative Haufig-keit der 0 langsam zunimmt, wird man auch nicht als zufallig ansehen, auchwenn sie ansonsten auserst unregelmaßig ist.Bei der folgenden Aufgabe kommt es darauf an, mit Hilfe von Zufallsziffernandere zufallige Objekte zu konstruieren.

Beispiel 6.2 Gegeben sei eine zufallige Folge x1, x2, x3, . . . mit xi ∈ {0, 1}Gib ein einfaches Verfahren an, hieraus eine zufallige Folge von Dezimalzif-fern yi ∈ {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} zu machen.

Ein solches Verfahren ist, aufeinanderfolgende Blocke der Form (xi, xi+1, xi+2)als Zahlen der Form xi2

0+xi+12i+1+xi+22

i+2 ∈ {0, 1, . . . 15} aufzufassen, unddiese wegzulassen, wenn sie nicht in {0, 1, . . . 9} liegen. Man kann, muss abermeistens nicht fur die Korrektheit eines solchen Verfahrens argumentieren(d.h. dafur, dass es tut was von ihm behauptet wird); beweisen kann man dieKorrektheit nicht, weil Zufalligkeit von Folgen nicht mathematisch definiertwurde.

Aufgabe 6.1 Gegeben sei eine zufallige Folge von Dezimalziffern (∈{0, 1, . . . , 9}. Gib ein einfaches Verfahren an zur Herstellung

1. einer zufalligen Folge aus Nullen und Einsen;

2. einer zufalligen Folge reeller Zahlen im Intervall [0, 1]. (Die Folgen-elemente sollen also u.a. in diesem Intervall annahernd gleichverteiltsein.)

3. einer zufalligen Folge von Punkten im Quadrat [0, 1]× [0, 1] ;

4. eine zufallige Folge von Teilmengen von {1, . . . , 1000};

29

Page 31: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

5. eine zufallige Folge von Permutationen von {1, 2, . . . , 1000}

6. eine zufallige Folge von geraden Zahlen; (Welche Unklarheit steckt indieser Aufgabe?)

Was ist eine Pseudozufallsfolge?

Wir geben ein Beispiel eines Pseudozufallsgenerators, und zwar ein Bei-spiel eines“linearen Schieberegisters der Lange 4”, mit “Ruckkopp-

lungsfunktion” c1 ⊕ c4. Der Zustand der j ten Zelle ist durch cj ∈ {0, 1}bestimmt. ⊕ ist definiert durch 1 ⊕ 1 = 0, 1 ⊕ 0 = 0 ⊕ 1 = 1, 0 ⊕ 0 = 0.Wenn man einen Anfangszustand wahlt, z.B. c4 = 1, c3 = c2 = c1 = 0, dannerhalt man eine Folge weiterer Zustande, namlich

c4 - c3 - c2 - c1 -

6 6 6 6

c1 ⊕ c4�

? -

1 0 0 01 1 0 01 1 1 01 1 1 10 1 1 11 0 1 10 1 0 11 0 1 01 1 0 10 1 1 00 0 1 11 0 0 10 1 0 00 0 1 00 0 0 11 0 0 0

Ein Schritt, d.h. eine Zustandsanderung besteht darin, dass der Wert derRuckkoppelungsfunktion in die Zelle 1 wandert, der Inhalt einer jeden ande-ren Zelle einen Platz weiter rechts einnimmt, und der Inhalt der letzten, 4

30

Page 32: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

-ten Zelle das nachste Glied der Ausgabefolge wird. Der letzte, 16 - te Zu-stand ist wieder der erste; es gibt also eine Periode der Lange 15. Zwar gibt es24 = 16 verschiedene Zustande, aber aus dem Nullzustand 0 0 0 0 kann keinanderer Zustand hervorgehen, und der Nullzustand kann auch aus keinemanderen Zustand hervorgehen. Darum ist 15 die maximale Periodenlange ei-nes linearen Schieberegisters der Lange 4. Allgemein kann man zeigen, dasses zu jedem n ein lineares Schieberegister mit Periodenlange 2n−1 gibt, unddass dies die maximale Periodenlange ist.

Aufgabe 6.2 Finde Schieberegister der Lange 3, 5, 6 mit maximaler Peri-odenlange.

Was hier interessiert, ist die “Ausgabefolge” : 0 0 0 1 1 1 1 0 1 0 1 1 0 0 1 0.Es ist dies die Folge der Elemente in der ersten Zelle, d.h. die Folge der c1.(In jedem Schritt wird c4 mittels Ruckkoppelungsfunktion ersetzt, wahrendalle anderen Zelleninhalte in die nachste rechts gelegene Zelle wandern.) Mansieht diese Folge als Pseudozufallsfolge an, d.h. als eine Folge, die aussieht,wie eine Zufallsfolge, aber keine ist.Es sollen nun Vor und Nachteile von Zufallsfolgen bez. Pseudozufallsfolgendurch eine Anwendung in der Kryptologie erlautert werden. (Als leichtlesbare Einfuhrung sei empfohlen: Albrecht Beutelspacher : Kryptologie, 1994,Vieweg)Es soll eine Nachricht

x1, x2, x3 . . .

Von einem Sender an gewisse Empfanger versandt werden, derart, dass keinUnbefugter diese auf dem Wege der Ubermittlung lesen kann. Zu diesemZweck wird , -mit getrennter Post - an Sender und Empfanger ein Schlussel

y1, y2, . . .

verteilt. Die xi seien “ bits”, d.h. Nullen oder Einsen. Sind nun die yi zufalligebits, so kann man die xi verschlusseln, indem man zi = xi ⊕ yi bildet, -und genauso wieder entschlusseln, - indem man xi = zi⊕ yi bildet. Wie mansieht, ist es die Zufalligkeit in Form von Nichtvorhersagbarkeit, welche hierdie Sicherheit der Nachrichtenubertragung garantiert. Allerdings, wenn eskeine einfache Beschreibung gibt, dann ist die Verteilung der Schlussel an dieTeilnehmer der Kommunikation schwierig. Diese Problem kann gelost werdendurch eine Pseudozufallsfolge, die zwar eine einfache Beschreibung besitzt,-was die Verteilung erleichtert,- aber so, dass es nur mit sehr großem Rechen-aufwand moglich ist, diese Beschreibung aus der Kenntnis der Folgenglieder

31

Page 33: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

zu erraten, - das macht die Sicherheit aus.Im Fall eines linearen Schieberegisters, ist das Geheimnis, das der Lauschernur mit großem Aufwand soll erraten konnen, die Lange n des Registers (oben4 ), die Ruckkopplungsfunktion ( oben c1⊕c4 ) und der Anfangszustand (oben(1, 0, 0, 0).) Es gibt aber schnelle Algorithmen, die dieses “ Geheimnis” be-reits aus 4n Folgengliedern berechnen konnen. (Wegen der Periodizitat istspatestens nach 2n Folgengliedern alles bekannt.)Daher sind lineare Schiebe-register krytologisch unbrauchbar; man betrachtet gewisse nichtlineare Schie-beregister, bei welchen die Ruckkoppelungsfunktion nicht nichtlinear ist.Die meisten Mehrzweck- software- Systeme enthalten Pseudozufallsgenerato-ren, meistens sind es Schieberegister.

Aufgabe 6.3 Berichten Sie, was Ihre software tut, wenn sie “ random(k) “aufrufen.(MAPLE gibt einen Graphen aus.) Was passiert, wenn man ansch-liessend “draw “ eingibt? Was passiert bei “ randomize”?

32

Page 34: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

7 Diffusion

Inhalt:In diesem Abschnitt wird naherungsweise ein Gleichungssystemgelost, das eine zeitlich konstante Temperaturverteilung beschreibt. Das Glei-chungssystem hat im Prinzip beliebig viele Gleichungen und Unbekannte; diedurch stochastische Simulation gewonnene Naherungslosung benotigt außerAdditionen jedoch nur eine Division (durch eine naturliche Zahl.)Die Figur unten zeigt den Differenzenquotienten als Naherung der Ab-

leitung fur kleine h.

f(x + h)− f(x)

h≈ f ′(x)

Die Gerade mit der Steigung f ′(x), die im Punkte (x, f(x)) beruhrt, wirddurch eine Funktion beschrieben:

g(y) = f(x) + f ′(x)(y − x)

Diese Funktion heißt “ Approximation erster Ordnung“ von f im Punkte x.

-

...................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

��������������������

x x+h

f(x)

f(x+h)

33

Page 35: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Es sei an die folgenden Rechenregeln erinnert:

(f + g)′ = f ′ + g′

(fg)′ = f ′g + fg′

c′ = 0⇔ c = const.

(f(g))′ = f ′(g)g′

Der symmetrische Differenzenquotient

f(x + h)− f(x− h)

2h

ist - fur kleine h - ebenfalls eine Naherung fur die Ableitung:

f(x + h)− f(x− h)

2h≈ f ′(x)

-

....................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

..........................................................................................................................................................................................................................................................................................................................................................................................

..............................................................................................................................................................................................................................

������������������������������

x x+hx-h

f(x)

f(x+h)

f(x-h)

Daher ist der “symmetrische Differenzenquotient des symmetrischen Dif-ferenzenquotienten “ eine Naherung fur die zweite Ableitung, genauer, fur2h2f ′′(x).

Bezeichnet man den symmetrischen Differenzenquotienten mit g(x) so istder “ doppelte” Differenzenquotient:

g(x + h)− g(x− h)

2h=

1

2h

f(x + 2h)− f(x)

2h− f(x)− f(x− 2h)

2h

=1

2h2(1

2f(x + 2h) +

1

2f(x− 2h)− f(x))

34

Page 36: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Es ist also der Operator, der f die Funktion 12f(x− 2h) + 1

2f(x + 2h)− f(x)

zuordnet, eine Naherung fur den Operator, der f die Funktion 2h2f ′′(x)zuordnet. Ersetzt man hier 2h durch h so erhalt man

1

2f(x− h) +

1

2f(x + h)− f(x)

als Naherung fur

1

2h2f ′′(x)

Diese Naherung ist in gewisser Hinsicht uberraschend gut, wie der folgendeSatz zeigt

Satz 7.1

f ′′(x) = 0 ⇔ 1

2f(x− h) +

1

2f(x + h)− f(x) = 0 ⇔ f “ist eine Gerade”

Hier bedeutet “f ist eine Gerade”, dass es Zahlen a, b gibt, so dass f(x) =a+ bx; f ′′(x) = 0 bedeutet, dass die Funktion f ′′ die Konstante Null ist, unddie mittlere Aussage bedeuet, dass fur alle x und alle h : f(x) = 1

2f(x−h)+

12f(x + h).

Aufgabe 7.1 Beweise diesen Satz.

Worauf es hier ankommt, ist die Markowkette mit

px,x+h =1

2; px,x−h =

1

2,

die hier am Werke ist. Eine Markowkette ist ein Prozess, welcher Zustands-großen ausgleicht, in dem Sinne, dass lokale Maxima und Minima abge-flacht werden: ist f(x) großer als an den Nachbarzustanden x−h, x+h, d.h.f(x) ≥ f(x− h), f(x) ≥ f(x + h) so ist f(x) ≥ 1

2f(x− h) + 1

2f(x + h), oder

allgemein

f(x) ≥∑

y

pxyf(y)

Ausgleichsprozesse heißen auch Diffusionen. Wenn man einen Tropfen Tintein ein Glas mit Wasser fallen lasst, stellt man fest, dass sich die Konzentra-tion der Tinte im Laufe der Zeit ausgleicht. Also gibt es im Wasser Diffusion.(Die sogenannte Brownsche Molekularbewegung) Auch die Temperatur ineinem Medium, wie der Luft in einem Kuhlschrank oder der Suppe in einem

35

Page 37: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Suppentopf, gleicht sich aus. Großen (Funktionen), die nicht weiter ausge-glichen werden konnen, also ausgeglichen sind heißen auch harmonisch. ImModell der Markowkette heißt harmonisch:

f(x) =∑

y

pxyf(y)

Wie man gesehen hat, entspricht dies in einem speziellen Fall, der sogenann-ten “ symmetrischen Irrfahrt auf der Zahlengeraden“, namlich

px,x+h = px,x−h =1

2

der Geradengleichung f ′′ = 0. Um physikalisch interessante Ausgleichspro-zesse zu studieren, wollen wir die Diskussion von einer Variablen auf mehrereVariable ausdehnen. Dabei beschranken wir uns aber der Einfachheit halberauf zwei: wir betrachten also ein ebenes Gebiet mit Punkten (Zustanden),die durch zwei Koordinaten : x, y bechrieben werden.Bezeichnungen: Die Ableitung einer Funktion f(x, y) von zwei Variablenbetrachtet als Funktion der ersten, bei festgehaltener zweiter Variable y wirdmit ∂

∂xf(x, y) bezeichnet. Die zweite Ableitung dieser Funktion (von x bei

festgehaltenem y ) wird mit ∂2

∂x2 f(x, y) bezeichnet. Halt man die erste Varia-ble x fest, so erhalt man eine Funktion von y , deren Ableitung mit ∂

∂yf(x, y)

bezeichnet wird. Die zweite Ableitung wird mit ∂2

∂y2 bezeichnet. Man schreibt

(∆f)(x, y) =∂2

∂x2f(x, y) +

∂2

∂y2f(x, y)

und nennt ∆ (sprich “ Delta” ) den Laplace- Operator. Um moglicheMissverstandnisse zu vermeiden, sollte man Beispiele betrachten:

Beispiel 7.1 Sei f(x, y) = a+bx+cy+dx2 +ey2 +g ·x ·y. ( Ein “Polynom”in den Variablen x, y vom Grad ≤ 2 ). Dann gilt

∂xf(x, y) =b + 2d · x + gy;

∂2

x2f(x, y) = 2d

∂yf(x, y) =c + 2e · y + g · x;

∂2

∂y2f(x, y) = d + e

Also ist (∆f)(x, y) = d + e und dies ist Null genau dann, wenn d = −e.

Wie man im Fall einer Variablen gesehen hat, hat man die folgende Nahe-rungsgleichung

1

2f(x− h, y) +

1

2f(x + h, y)− f(x, y) ≈ 1

2h2 ∂2

∂x2f(x, y)

36

Page 38: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Addiert man die entsprechende Gleichung fur y und dividiert durch 2 , soerhalt man

1

4f(x− h, y) +

1

4f(x + h, y) +

1

4f(x, y − h) +

1

4f(x, y + h)− f(x, y) ≈ h2∆

Hier ist wieder eine Markowkette am Werk: das “Teilchen” hupft mit WS 14

eine Einheit nach rechts, nach oben, nach links, oder nach unten. (Symme-trische Irrfahrt in der Ebene).

Beispiel 7.2 (2d- Kulhschrank) Bei Ihrem zweidimensionalen Kuhlschrank{(x, y)|x, y ∈ {0, 1, 2, 3, 4, 5}} ist die Temperatur am Rande, d.h. bei x, y ∈{0, 5} eingestellt, und im Inneren ausgeglichen. Berechne die Temperatur imInnneren.

Wir wollen diese Aufgabe mittels stochastischer Simulation naherungsweiselosen und die Naherungslosung mit der exakten Losung vergleichen. (Wiebei der Entenjagd) Zu diesem Zweck betrachten wir die Funktion f(x, y) =x2− y2, von der wir nach obigem wissen, dass sie ∆f = 0 erfullt. Hier ist derKuhlschrank mit den Werten von f in den Gitterpunkten

-25 -24 -21 -16 -9 0

-16 -15 -12 -7 0 9

-9 -8 -5 0 7 16

-4 -3 0 5 12 21

-1 0 3 8 15 24

0 1 4 9 16 25

37

Page 39: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Diese Funktion ist harmonisch fur die symmetrische Irrfahrt. (Uberra-schung?)Z.B. ergibt sich links oben

f(1, 4) = −15 =1

4(−12) +

1

4(−24) +

1

4(−16) +

1

4(−8)

Es soll nun f(2, 2) durch stochastische Simulation naherungsweise berechnetwerden, um das Verfahren zu erlautern. Dazu wird eine zufallige Folge vonZiffern aus {1, 2, 3, 4} benutzt:

123342443|343|43241111|32114432321424233|414|132322|22133413423|3414|

1343132141231431232421322|222|1411|1414|32114341314|21444|343|233|233|

433|4233|31232423|114331121

Vom Zustand (2, 2) ausgehende und am Rand endende Pfade sind jeweilsdurch senkrechte Striche abgetrennt. Man interpretiert: 1 als “nach rechts,”2 als “nach oben”, 3 als “nach links”, 4 als “nach unten”. Es gibt 21 Pfade.Die Summe der 20 entsprechenden Randwerte ist

− 1− 1 + 24− 9 + 9− 24− 9 + 4− 21− 21 + 24

+ 16 + 9 + 9− 1− 9− 9− 1− 4− 16 + 21 = −10

Dividiert durch 21 erhalt man die Naherung von 10/20 = 0, 48 (an 0 .)Die folgende Figur zeigt den vierten Pfad, welcher durch 32114432321424233beschrieben ist, und bei (0, 3) mit dem Wert f(0, 3) = −9 endet.

6- -

?

?�

6�

6-

?

6

?

6��

(2,2)

(0,3)

38

Page 40: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Aufgabe 7.2 Wiederhole das Experiment mit der Randfunktion f(x, y) =x− y. Ist ein besseres Ergebnis zu erwarten, und warum?

Aufgabe 7.3 Berechne die erwartete Treffzeit des Randes des 2d- Kuhl-schrankes fur die symmetrische Irrfahrt, die in (2, 2) startet. Hinweis: Be-achte die Symmetrien des Systems.

Fazit

1. Wenn in einem Kuhlschrank in den Wanden eine konstante Tempraturver-teilung eingestellt ist, dann stellt sich nach einer Weile auch im Inneren einekonstante Temperaturverteilung t ein. Die Physik sagt: ∆t = 0 : t ist ausge-glichen. In der diskreten Naherung, zu 2 Dimensionen vereinfacht, bedeutetdies

1

4t(x− h, y) +

1

4t(x + h, y) +

1

4t(x, y + h) +

1

4t(x, y − h) = t(x, y)

2. Wenn man einem Pfad z0 = (x, y), z1, . . . zk, der im Punkte z0 startet, undden Rand zum ersten Mal im Punkte zk trifft, den Wert t(zk) zuordnet, defi-niert man eine Zufallsvariable V auf den Pfaden der symmetrischen Irrfahrt,die in (x, y) startet. Ihr Erwartungswert Ex,yV werde mit e(x, y) bezeichnet.e erfullt ebenfalls die Mittelwertgleichung:

1

4e(x− h, y) +

1

4e(x + h, y) +

1

4e(x, y + h) +

1

4(x, y − h)

3.Erfullen zwei Funktionen mit den gleichen Randwerten die Mittelwertglei-chung , so sind sie gleich. Es ist also e = t. Damit ist die Temperatur in (x, y)als Erwartungswert interpretiert. Jeden Erwatungswert kann man durch einStichprobenmittel approximieren.(Theoretische Rechtfertigung ist das Ge-setz der großen Zahl im Abschnitt uber relative Haufigkeiten.)4. Mit einem Viererwurfel wurfelt man Pfade: Pfad1, . . . P fadk , die in (x, y)starten und beim ersten Treffen des Randes aufhoren.

V (Pfad1) + . . . + V (Pfadk)

k

ist die mittels Simulation gewonnene Naherung.(Dies ist im Prinzip fur jedeGroße moglich, die als Erwartungswert interpretiert werden kann.)Bemerkungen

1. Zwei Funktionen, e, t mogen der Mittelwertgleichung genugen und diegleichen Randwerte haben. Dann hat dei Differenz d = t− e die RandwerteNull und genugt ebenfalls der Mittelwertgleichung. Angenommen d hat einen

39

Page 41: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

positiven Wert: Dann hat d einen positiven maximalen Wert: d(x, y). Dannfolgt aber aus

a = d(x, y) =1

4d(x + h, y) +

1

4d(x− h, y) +

1

4d(x, y − h) +

1

4d(x, y + h)

dass d auch in den Nachbarn von (x, y) den Wert a hat. Auf diese Weise be-kommt man heraus, dass d in allen Punkten den Wert a hat. Also ist a = 0,und e = t.2. Die Gute der Naherung laßt sich mit mit dem Gesetz der großen Zahl(Abschnitt uber relative Haufigkeiten abschatzen.)3.Dass die Funktion e oben die Mittelwertgleichung erfullt, laßt sich so ein-sehen: mit WS 1

4springt ein Pfad von (x, y) zunachst nach rechts. Der Er-

wartungswert von V fur diese Pfade ist aber e(x+h, y). Analog mit “ oben”,“links”, “unten“. Summation ergibt die Behauptung.

40

Page 42: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

8 Exponential und Logarithmus

8.1 Die Exponentialfunktion im Reellen

Bekanntlich ist a2 = a · a. Dies ist die Definition von a2. Ebenso definiertman

an = a · a · . . . · a (n mal)

Hierbei kann a eine beliebige reelle Zahl sein. Ist aber a positiv, so kannman die “positive Quadratwurzel” ziehen: die ist definitionsgemaß diejenigepositive Zahl

√a , die mit sich selbst multipliziert a ergibt:

√a√

a = a

Statt√

a schreibt man auch a12 . Analog definiert man a

1n als diejenige positive

Zahl z , fur die

zn = a

(Bekanntlich hat die Gleichung zn − a = 0 hochstens zwei reelle Losungenund genau n komplexe.) Insgesamt ist damit

amn = (a

1n )m

definiert fur positive ganze Zahlen m, n. Man setzt

a0 = 1, a−mn =

1

amn

Damit ist ax definiert fur alle “ Bruche” x. Man beweist leicht die folgendenRechenregeln

a0 = 1

a1 = a

ax+y = axay

(ax)y = axy

Man definiert nun ax fur eine beliebige reelle Zahl x,(und eine beliebige po-sitive relle Zahl a ) auf Grund der folgenden Tatsachen

1. Jede relle Zahl x ist Grenzwert einer Folge von Bruchen bk : x = limk bk.Wenn z.B. x als unendlicher Dezimalbruch x = 1037, 2041567 . . . gege-ben ist, wird x durch Bruche der Form mk

10k wie

103720415

108

41

Page 43: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

approximiert. Man kann aber x auch mit Bruchen approximieren, dienur Zweierpotenzen im Nenner haben : x = limk bk mit bk = mk

2k . abk istdann auf wiederholtes Quadratwurzelziehen und Potenzieren zuruck-gefuhrt.

2. Wenn bk → x, d.h. limk→∞ bk = x, dann strebt abk gegen einen Grenz-wert y = limk abk , der nicht von der gewahlten Folge der bk sondern nurvon x abhangt, und mit ax bezeichnet wird.

(Es geht hier nur um die Definition des Exponentials, sowie um die zugehori-gen Rechenregeln, nicht um die Darstellung in Dezimalen etwa. Durch rich-tigen Umgang mit Grenzwerten erhalt man die Rechenregeln, die fur Bruchex gelten, nun auch fur beliebige relle x. z.B. ergibt sich

ax+y = axay

so: aus bk → x, ck → y, folgt bk + ck → x + y, abk → ax, ack → y, abk+ck →ax+y, abkack → axay. Damit folgt die zu beweisende Gleichung aus der selbenGleichung fur Bruche: abkack = abk+ck

Satz 8.1 Sei a < 0. Dann gibt es genau eine Funktion g : R→ (0,∞) , so,dass

1. g(0) = 1

2. g(1) = a

3. g(x + y) = g(x)g(y)

4. limk g(bk) = g(x), falls limk bk = x.

Man schreibt g(x) = ax und nennt ax Exponential von x zur Basis a .

Beweis: Wir zeigen, dass g(x) = ax fur eine Funktion g mit den genann-ten Eigenschaften: g(n) = g(1 + 1 + . . . 1) = g(1)n = an; g( 1

n) . . . g( 1

n) =

(g( 1n))n = g( 1

n+ . . . + 1

n) = g(1) = a. Also ist g( 1

n) = a

1n . (Eindeutigkeit der

pos. n− ten Wurzel.) Also gilt g(mn) = a

mn . Wegen 1 = g(0) = g(m

n− m

n) =

g( nm

)g(−mn) = a

mn g(−m

n) gilt schließlich g(x) = ax fur alle Bruche x, und

damit fur alle reellen Zahlen auf Grund der letzten Eigenschaft.Der folgende Satz gilt dem Logarithmus als Umkehrfunktion des Exponenti-als:

Satz 8.2 1. Sei 1 < a. Dann gilt ax < ay fur x < y und

limx→∞

ax =∞; limx→−∞

ax = 0

42

Page 44: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

2. ist 0 < a < 1, so gilt ax < ay fur y < x, und

limx→∞ax = 0; limx→−∞

ax =∞

Es ist nicht schwer, sich diese Eigenschaften fur Bruche x vor Augen zufuhren, was dem Leser uberlassen bleibe. Der Satz besagt, dass x→ ax eineBijektion von R auf (0,∞) ist. Zu jedem y ∈ (0,∞) gibt es also genau einx ∈ R mit y = ax. Man schreibt

x = logay

und nennt x den Logarithmus von y zur Basis a. Es gilt also

loga(ax) = x; x ∈ R; alogay = y, y ∈ (0,∞)

Satz 8.3 Sei a > 0. Es gibt genau eine Funktion l(x) = loga(x) auf (0,∞),so dass

loga1 = 0

logaa = 1

loga(xy) = (logax) + (logay)

limk

(logabk) = logay, falls limk

bk = y

Aufgabe 8.1 Beweise diesen Satz, sowie loga(xb) = b(logax).

Wenn man die Exponentialfunktion f(x) = ax ableiten will, kommt man auf

ax+h − ax

h= ax ah − 1

h.

Wenn

limh→0

ah − 1

h= b

existiert, dann erhalt man f ′ = bf. Wir werden jetzt zeigen, dass dieserLimes existiert, - mit einer exemplarischen Grenzwertbetrachtung. Es gibtein a, fur welches das entsprechende b = 1 ist, also f ′ = f. Dieses wird mit ebezeuichnet und Eulerzahl genannt. Es ist

e = limn

(1 +1

n)n

Leonhard Euler(1707 - 1783) zeigte, dass e keine rationale Zahl (kein Bruch)ist. Hermite zeigte 1873, dass e transzendent ist, d.h. nich Nullstelle eines

43

Page 45: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Polynoms p(x) = a0 + a1x + . . . + akxk.

Wenn man zu einem Vermogen v nach Verlauf einer Zeit t Zinsen atv hin-zuzahlt - Zinsrate a - so erhalt man v(1+at). Nach der Halfte der Zeit ergibtsich v(1 + at

2) und nach einer weiteren Halfe: v(1 + at

2)2. Teilt man das Zeit-

intervall in n gleiche Teile, und zahlt die Zinsen nach Ablauf eines jeden n−ten Teils hinzu, so erhalt man v(1 + at

n)n. Es ist klar, dass dieser Ausdruck

mit n wachst, aber nicht gegen +∞, denn sonst konnte man reich werdenallein durch einteilen eines Intervalls in sehr kleine Teile. Es gilt in der Tat

Satz 8.4

limn(1 +x

n)n = ex (x ∈ R)

Insbesondere wird hier die Konvergenz der Folge fn = (1 + xn)n behauptet.

Wir zeigen zunachst fn ≥ fn+1.(Dies ist doch nicht so klar, wie oben be-hauptet, da das n in der Klammer den Ausdruck fallen laßt, wahrend das nim Exponenten ihn wachsen laßt, wenn x > 0. ) Weil nach der binomischenFormel

(1 +x

n)n =

n∑

k=0

(

n

k

)

(x

n)k

genugt es(

nk

)

n−k ≤(

n+1k

)

(n + 1)−k zu zeigen. Weil

(

n

k

)

=n!

k!(n− k)!

kann man dies zu

1

nk≤ n + 1

(n + 1− k)(n + 1)k

vereinfachen. Diese Ungleichung kann mit Induktion nach k bewiesen werden.Sie ist offenbar fur k = 0 richtig. Sie sei fur ein gewisses k richtig. Multipliziertman auf beiden seiten mit n−1, so erhalt man

1

nk+1≤ n + 1

(n + 1− k)(n + 1kn≤ n + 1

(n− k)(n + 1)k+1

Was zu beweisen war. Also wachst die Folge der fn. Wenn sie zudem be-schrankt ist, konvergiert sie gegen einen endlichen Grenzwert. Nun ist aber

(

n

k

)

1

nk≤ 1

k!

44

Page 46: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

und deswegen ist

(1 +x

n)n =

n∑

k=0

(

n

k

)

xk

nk≤

n∑

k=0

1

k!xk

Ist n hinreichend groß, so gilt

xn+1

(n + 1)!≤ 1

2

xn

n!

und daher

xn+k

(n + k)!≤ 1

2k

xn

n!

Also wird die Reihe mit den Gliedern 1n!

xn fur hinreichend große n “domi-niert” durch die Reihe mit den Gliedern 1

2k const. Diese Reihe, die “geometri-sche”, konvergiert, wie wir wissen, gegen 2 · const. Damit ist die Konvergenzgezeigt. Sei

limn

(1 +x

n)n = e(x)

Offenbar gilt e(0) = 1; e(1) = e. Ferner gilt, wie man leicht sieht

(1 +x

n)n(1 +

y

n)n = (1 +

x + y

n+

xy

n2)n → (1 +

x + y

n)n

Wir schenken uns den Beweis, dass e(x) Limiten in Limiten uberfuhrt. Dannfolgt e(x) = ex aus dem vorangegangenen Satz.Wenn man die Funktion (1 + x

n)n nach x ableitet ergibt sich (1 + x

n)n−1.

Hieraus folgt (man hat den Limes mit der Ableitung zu vertauschen):

Satz 8.5 Sei expx = ex; exp heißt naturliche Exponentialfunktion unddie Umkehrfunktion loge = ln der naturliche Logarithmus. Es gilt

exp′ = exp

Die Formel ex = limn(1 + xn)n ist eine der wichtigsten Formeln der

Analysis,- wegen der Verallgemeinerungen, die sie unter der Uberschrift Eu-lerpolygon zulaßt.(Abschnitt uber Differentialgleichungen) Eine weitere For-mel erhalt man, wenn man in

(1 +x

n)n =

n∑

k=0

(

n

k

)

xk

n!

45

Page 47: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

beim Koeffizienten von xk n gegen ∞ strebenlaßt: es gilt namlich

limn

(

n

k

)

1

n!=

1

k!

Damit ergibt sich fur ex die Exponentialreihe:

Satz 8.6

expx =

∞∑

k=0

1

k!xk

Die Exponentialfunktion wachst starker als jede Potenz von x :

Korollar 8.1 Fur jede naturliche Zahl m gilt

limx→+∞

ex

xm= 0

Aufgabe 8.2 Skizziere den Graphen der folgenden Funktionen:

xex; xe−x; x2ex, x2e−x, e1x , e−

1x

f(x) = e1

(x−a)(x−b) ; a < x < b; f(x) = 0 fur x 6∈ (a, b)

Es ist erlaubt, “plot” Befehle zu benutzen. Sogar erwunscht.

Korollar 8.2 1. logbx = logbalogax

2. ddx

logbx = logbex

3. limx→0 xlogax = 0.

Wie sieht man etwa die dritte Formel ein?Man setzt x = ey. Dann ergibt sich mit der ersten

xlogax = eylogaelogeey = yeylogae

und dies strebt gegen Null, da ey gegen 1 strebt, -wenn y gegen 0 strebt.Wie sieht man die zweite Formel ein? Man leitet

x = logbelogeex

nach x ab. Dann erhalt man 1 = logbe(loge)′(ey)ey. Fur x = ey erhalt man

die zweite Formel.

46

Page 48: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Fazit: Man benotigt in Naturwissenschaft - und Okonomie - Zahlen undFunktionen ( z.B. e, ex ) die man im Bereich der naturlichen Zahlen undBruche nicht findet. Vor allem benotigt man zur Beschreibung von Wachs-tumsprozessen Losungen der Differentialgleichung y′ = ay. Solche Funktio-nen muss man als Limiten von Grenzprozessen konstruiren: man muss Folgenfinden, die konvergent sind, mit einem Limes, der die gewnschten Eigenschaf-ten hat. Man kann aber die Konvergenz der Folgenglieder, z.B. (1+ x

n)n nicht

mit dem Hinweis darauf zeigen, dass ihr Abstand zu etwas, das bereits vor-liegt, immer kleiner wird, denn dieses, wogegen die Folge konvergiert, wirderst definiert, d.h. existiert erst als Grenzwert dieser Folge, oder einer ande-ren. Jeder rechnerische Umgang mit einem solchen Grenzwert wie e, der aufgewisse Dezimalstellen abzielt, muss auf einen approximierende Folge zuruck-greifen. Im Fall der Exponentialfunktion haben wir uns von der Konvergenzder Folge berzeugt durch den Nachweis, dass sie wachst und beschrankt ist.

Beispiel 8.1 (Goldbachsche Vermutung) : Fur jede naturliche Zahl n > 1ist 2n Summe zweier Primzahlen. (Goldbach 1742 in einem Brief an Euler)Setze g(n) = 1, falls 2n Summe zweier Primzahlen oder n = 1, und g(n) = 0sonst. Die Folge

g(1)

101+

g(2)

102+ . . . +

g(n)

10n

konvergiert gegen eine relle Zahlα mit einer Dezimalentwicklung

α = 0, 1111 . . .

Ist die Goldbachsche Vermutung richtig so sind alle Dezimalen von α Einsund α = 1

9. Da bis heute niemand weiß, ob die Vermutung richtig ist, -

vielleicht wird es niemals jemand wissen,- kann man nicht entscheiden, obα < 1

9.

Aufgabe 8.3 Rate das Bildungsgesetz der Folge

0 0 0 1 1 0 1 1 2 1 0 1 22 4 8 16 32 64 128 256 512 1024 2048 4096 8192

Wenn unten 2n steht, steht oben c(n). Setze α =∑∞

n=1cn2n . Berechne Dezi-

malstellen von α. Ist α < 19?

Man kann α = 19

zeigen. Siehe unten.

47

Page 49: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

8.2 Periodische Dezimalzahlen

Das Verstandnis der geometrischen Reihe, d.h. dass

(1− a)(1 + a + a2 + . . . + an)

= 1 + a + a2 + . . . + an − a− a2 − . . .− an+1 = 1− an+1

1 + a + . . . + an =1− an+1

1− a→ 1

1− a, i.e.

1 + a + a2 + . . . =∞∑

n=0

an =1

1− afalls − 1 < a < 1

ermoglicht die Umwandlung einer periodischen Dezimalentwicklung in einengewohnlichen Bruch: fur a = 10−k erhalt man namlich

10−k(1 + 10−k + 102k + . . . ) =1

10k − 1

und somit z.B.

0, 123123123 . . . =0, 123 =1

10+

2

102+

3

104+ . . . =

123

102+

123

106+

123

109+ . . .

=123

103 − 1=

123

999

Eine Dezimalentwicklung wie 0, 123 heißt rein periodisch, wahrend etwa13, 555123 nur periodisch oder bedingt periodisch genannt wird. LetztereZahl laßt sich als

13555

103+

123

103(103 − 1)=

(103 − 1)13555 + 123

103(103 − 1)

schreiben. An diesen Beispielen erkennt man schon den allgemeinen Sachver-halt

Satz 8.7 Jede periodische Dezimalentwicklung laßt sich in einen gewohnli-chen Bruch umwandeln.

Die schriftliche Division, wie man sie auf der Schule lernt, zeigt aber auchdas Umgekehrte:

Satz 8.8 Die Dezimalentwicklung eines jeden Bruches ist bedingt periodisch.

48

Page 50: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Beispiel:

1 : 7 = 0, 1428571 . . . = 0, 142857

10

7

30

28

20

14

60

56

40

35

50

49

10

In der dritten, funften, Siebten u.s.w. Zeile steht jeweils ein Rest bei Divisiondurch 7 einer zweistelligen Zahl,- mit 10 Multipliziert. Weil es von diesenResten nur enlich viele gibt - genau 7- wird die Entwicklung nach hochstens6 Ziffern periodisch. Damit sieht man aber bereits, dass der obige Satz involler Allgemeinheit richtig ist.Bei 2 : 7 = 0, 285714 hat man dieselbe Periodenlange, namlich 6 . Die Periodeselber hat die gleichen Ziffern, wie die von 1 : 7; sie entsteht aus dieser, wennman erst die 1 nach hinten stellt, und dann die 4.1 : 6 = 0, 16 hingegen ist nicht rein periodisch mit Periodenlange 1, und1 : 8 = 0, 125 ist abbrechend. Wer also verschiedene Divisionen mit demSchulalgorithmus durchfuhrt, dem stellen sich - mglicherweise - die folgendenFragen

1. Welche Bruche besitzen eine abbrechende Dezimalarstellung ?

2. Welche Bruche besitzen eine rein periodiche Darstellung ?

3. Wie kann man die Periodenlange vorhersagen ?

4. Welche Rolle spielt jeweils der Nenner - in der gekurzten Darstellungab

- und welche Rolle spielt der Zahler ?

5. Was ist der tiefere Grund fur dieses Wunder: dass jede zu 10 teilerfrem-de Zahl 99 . . . 9 teilt?

49

Page 51: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

6. Was passiert, wenn man von der Dezimaldarstellung zu einer anderenDarstellung ubergeht (einer g -adischen?)

Wenn der Schler mit der Division experimentiert, findet er mit den Fragenmglicherweise auch gleichAntworten:

1. ab

(gekurzt) hat genau dann eine abbrechende Darstellung, wenn b =2k5l.

2. Genau dann ist die Darstellung rein periodisch, wenn b zu 10 teilerfremdist.

3. Die Periodenlnge hangt nur von b ab; sie ist b− 1 bei Primzahlen b.

4. Das “Wunder” wird auch der Satz von Euler- Fermat genannt und soformuliert

10ϕ(b) ≡ 1mod(b)

Hierbei ist ϕ(b) die Anzahl der zu b teilerfremden Zahlen zwischen 1und b und die obige “ Kongruenz” bedeutet, dass es ein v gibt, so dass

99 . . . 9 = 10ϕ(b) − 1 = vb.

5. Ersetzt man die 10 in der Dezimaldarstellung einer Zahl durch eineZahl g , so “ geht alles genau so.”

Fazit: Sobald der Schuler die schriftliche Division beherrscht, kann er alleineuberraschende Entdeckungen machen, wie z.b. dass sich bei der Dezimalent-wicklung von 1/7 nach einer Weile alles wiederholt, einfach dadurch dasser weiterrechnet. Dazu sollte allerdings nicht der Eindruck erweckt werden,dass es nur schn ist, wenn es “aufgeht” und sonst garstig. Jedem Lehrersollte klar sein, dass die Mglichkeiten, durch eigene Aktivitat Entdeckungenzu machen, und mathematische Fragen zu formulieren, wichtiger sind, alsKorrektheitsbeweise - wenigstens im schulischen Zusammenhang.

Aufgabe 8.4 Zeige die Korrektheit der obigen Antworten.

50

Page 52: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

8.3 Stirlings Formel

Stirlings Formel :Zu jeden naturlichen n gibt es eine Zahl t(n) zwischen Null und Eins, so dass

n! =√

2πnnne−net(n)12n ≈

√2πnnne−n

Nach dem schottischen Mathematiker James Stirling (1692 - 1770)

Beispiel 8.2 Erfolge beim Munzwurf: Eine Munze zeige mit WS 1/2 Kopfund mit WS 1/2 Adler. Sn sei die Anzahl der Kopfe nach n unabhangigenWurfen. Dann ist die WS dafur, dass S2n = n genau

(

2nn

)

2−2n Wie groß istdas fur große n ?

Mit Stirlings Formel erhalt man(

2n

n

)

2−2n =(2n)!

(n!)222n

e−t(2n)24n

+ t(n)6n√

πn≈ 1√

πn

Aufgabe 8.5 Erstelle eine Tabelle fur den Quotienten von n! und dieStirling- Approximation

√2πnnne−ne−

112n ,- mit einigen Werten fur n um

zu sehen, wie gut die Approximation ist.

8.4 Entropie

Ein Experiment ε habe die Ausgange Ak mit Wahrscheinlichkeit pk. Mandefiniert die Entropie H(ε) von ε als Maß fur die Unbestimmtheit von

ε durch

H(ε) = −p1logp1 − p2logp2 − . . .− pnlogpn

Hierbei setzt man plogp = 0. falls p = 0. (Weil ex niemals Null ist, ist logals Umkehrfunktion der Exponentialfunktion in 0 nicht definiert). Das warenicht besonders sinnvoll, wenn nicht

limp→0,p>0

plogp = 0

ware. Dies ist aber der Fall weil man p = e−x schreiben kann und

plogap = plogaelogep =(logae)x

ex→ 0 falls x→∞

In technischen Anwendungen wird meist log = log2 genommen. Bei Basis-wechsel multiplizeit sich die Entropie mit einer positiven Konstanten, da

logax = logablogbx

Die folgenden Eigenschaften sprechen dafur dass H in der Tat ein Maß furdie Unbestimmtheit von ε ist.

51

Page 53: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

1. Ist ε bestimmt, d.h. ist pk = 1 fur ein k , so ist H(ε) = 0.

2. Hat ε die Ausgange Ak mit WS pk und δ die Ausgange Bj mit WS qj ,und hat ε× δ die Ausgange (Ak, Bj) mit WS pkqj, so gilt

H(ε× δ) = H(ε) + H(δ)

(Die Entropie ist additiv)

3. Die Entropie ist maximal bei Gleichverteilung, d.h. wenn alle pk gleichsind : p1 = p2 = . . . = pn = 1

n

Die erste Eigenschaft ist klar: wenn pk = 1, dann ist logpk = 0 und fur j 6= kist pj = 0, und daher kraft Setzung pjlogpj = 0.Die zweite Eigenschaft - analog zu logxy = logx+logy - kann man so einsehen

H(ε× δ) =∑

i,j

piqjlog(piqj) =∑

i,j

piqj(logpi + logqj)

=∑

i,j

piqjlogpi +∑

i,j

piqjlogqj

=∑

i

(∑

j

qj)pilogpi +∑

j

(∑

i

pi)qjlogqj

=∑

i

pilogpi +∑

j

qjlogqj = H(ε) + H(δ)

(Man hat zu festem i zunachst die Summanden qjpilogpi gesammelt undq1 + q2 + . . . = 1 benutzt.)Nun zur dritten Eigenschaft: man weiß aus der Schule, dass die Ableitungeiner Funktion fur ein Argument verschwindet, falls die Funktion fur diesesArgument maximal ist. Dies bleibt richtig fur Funktionen mehrer Argumente(Variablen), wenn man die “partiellen” Funktionen betrachtet, die entstehen,wenn man alle bis auf eine Variable festhalt. z.B. kann man in der EntropieH(p1, . . . , pn) alle pj bis auf eines, etwa p1 festlassen, und nach p1 ableiten:

∂p1H(p1, . . . , pn) = −logp1 − loge

Wenn es ein lokales Maximum gibt, dann ist es also (1e, . . . , 1

e). In der Tat:

es ist leicht zu sehen, dass dies auch das globale Maximum ist. Allerdings istes nicht das, wonach hier gefragt ist. Gefragt ist nach demMaximum unter der Nebenbedingung :

j

pj = 1; p1 ≥ 0; . . . , pn ≥ 0

52

Page 54: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Wir betrachten zunachst den einfachsten Fall: n = 2. Die Nebenbedingungp1 + p2 = 1 kann man zur Elimination von p1 benutzen: p1 = 1 − p2 Mitdieser Ersetzung ist die Entropie nur noch eine Funktion der Variablen p2 :

H(p1, p2) = (p2 − 1)log(1− p2)− p2logp2

Die Variable p2 variiert hier im Intervall: [0, 1]. Außer in den Eckpunkten 0, 1kann man nach p2 differenzieren, und erhalt

log(1− p2) + loge− logp2 − loge = logp1 − logp2

Wenn bei (p1, p2) ein Maximum vorliegt so ist (p1, p2) = (12, 1

2) d.h. man

hat Gleichverteilung. Wir betrachten nun den Fall n = 3. Danach wird mansich den allgemeinen Fall zusammenreimen knnen. Elimination von p1 ergibt:p1 = 1− p2 − p3 und

H(p1, p2, p3) = −(1− p2 − p3)log(1− p1 − p2 − p3)− p2logp2 − p3logp3

Ableiten nach p2 bez. p3 ergibt

log(1− p2 − p3)− logp2 = logp1 − logp2 bez.

log(1− p2 − p3)− logp3) = logp1 − logp3

Wenn nun in (p1, p2, p3 - unter den angegebenen Nebenbedingungen ein Ma-ximum vorliegt, und keines der pi = 0, dann ist p1 = p2 = p3 = 1

3und

H(p1, p2, p3) = log3. Wenn zwei der pi Null sind, ist = H(p1, p2, p3) = 0.Wenn nur eines Null ist, etwa p3 = 0, dann ist wie oben gezeigt: p1 = p2 =12, H(p1, p2, p3) = log2. Also hat man ein Maximum unter den angegebenen

Nebenbedingungen nur bei Gleichverteilung.Die Entropie spielt eine Rolle z.B. bei der Frage, wie weit sich Nachrichtenin deutscher Sprache zwecks effektiver Versendung komprimieren lassen.

8.5 Sinus und Cosinus

Es sei daran erinnert, dass man die Punkte der Ebene mit den Koordina-ten (x, y) als komplexe Zahlen x + iy auffassen kann, die man addiert undmultipliziert gemaß den folgenden Regeln:

(x + iy) + (u + iv) = x + y + i(u + v)

(x + iy) · (u + iv) = xu− yv + i(yu + xv)

53

Page 55: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Der Betrag, d.h. der Abstand vom Koordinatenursprung einer Zahl z = x+iyist gegeben durch

|z|2 = x2 + y2 = (x + iy)(x− iy)

Wie bei reellen Zahlen zeigt man fur komplexe Zahlen z, dass die Folge derZahlen (1 + z

n)n) konvergiert, wenn n gegen Unendlich strebt, und setzt

limn→∞

(1 +z

n)n = ez

Es ist leicht zu verifizieren, dass wieder

ex+y = exey; e0 = 1

Man hat (1 + itn)(1− it

n) = 1 + t2/n

nHieraus folgt, dass

|eit| = 1

Mehr noch: die Abbildung t→ eit bildet das Intervall [0, 1) bijectiv auf denKreis um (0, 0) mit Radius 1 ab:

Satz 8.9 Die Lange des Kreisbogens (um den Mittelpunkt (0, 0) mit Radius 1) von (1, 0) zu eit ist t. Da die Lange des vollen Kreisbogens 2π - so definierenwir π - gilt

ei2π = 1

Also ist t der Winkel zwischen der “x-Achse” {(x, 0)|x ≥ 0} und der Halb-geraden durch (0, 0) und eit : {xeit|x ≥}, gemessen im “ Bogenmaß”, d.h.Man definiert cost bez. sint als den Realteil bez. den Imaginarteil von eit :

eit = cost + isint

-

6

.

.

.

..

.

.

.

..

.

.

.

.

..

.

.

.

.

..

.

.

.

..

.

.

..

.

.

..

.

.

.

..

.

.

..

.

.

..

.

.

..

.

..

.

.

..

.

..

.

.

..

.

..

.

.

..

.

..

.

..

.

..

.

..

.

..

.

..

.

..

.

..

..

.

..

..

..

..

.

..

..

..

..

.

..

..

..

..

.

..

..

.

..

..

..

.

..

..

.

..

..

..

..

..

..

..

..

..

..

..

..

.

..

..

..

..

..

..

..

..

.

..

..

..

..

..

..

.............................................................................................................................................................................

.............................................................................................................................................................................................................................

........................

................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

........................................................................................................................................................................................................................................................................................................................................................................................

��������

sint

cost

eit

54

Page 56: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Aus

cos(s + t)sin(s + t) = ei(s+t) = eiseit = (coss + isins)(cost + isint)

= (coss)(cost)− (sins)(sint) + i((coss)(sint) + (sins)(cost))

folgt

Korollar 8.3 (Additionstheorem fur Sinus und Cosinus)

cos(s + t) = (coss)(coss)− (sins)(sint)

sin(s + t) = (coss)(sint) + (sins)(cost)

Wegen

d

dt(1 +

it

n)n = n(1 +

it

n)n−1 i

n= i(1 +

it

n)n−1

gilt

d

dteit = ieit

und daher

Korollar 8.4

d

dtcost = −sint;

d

dtsint = cost

da t → eit periodisch ist mit Periode 2π : eit = eit + 2π = ei(t+2π) sind esauch Sinus und Cosinus:

Korollar 8.5 (Periodizitat)

cos(t + 2π) = cost; sin(t + 2π) = sint

Was ist nun die Lange einer Kurve?Zunachst die Lange eines Streckenzuges durch Punkte ai : Dies ist die Summeder Langen ‖ai+1 − ai‖ der Strecken [ai, ai+1] Die Lange einer glatten Kurve{x(t)|s ≥ t ≤ u} wird angenahert durch die Lange eines einbeschriebenenStreckenzuges durch Punkte x(ti) = ai, fur welche ti+1− ti hinreichend kleinist. Weil aber

x(ti+1)− x(ti)

ti+1 − ti≈ x′(ti)oder x(ti+1)− x(ti) ≈ (ti+1 − ti)x

′(ti)

55

Page 57: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

ist

Lange von x =

∫ u

s

‖x′(t)‖dt

Man betrachte dies als die Definition der Lange einer Kurve. Im Fall derExponentialfunktion hat man aber

d

dteit = ieit

Hiervon ist der Betrag eins, so dass die Lange der Kurve {eis|0 ≤ s ≤ u}gerade

∫ t

01ds = t ist. Damit ist der Satz bewiesen.

.

.

.

..

.

.

..

.

.

..

.

.

..

.

..

.

.

..

.

.

..

.

..

.

.

..

..

..

..

.

..

..

..

..

..

.

..

..

..

..

..

.

..

..

.

..

.

..

..

.

..

.

..

.

..

..

.

..

.

..

.

..

.

..

..

..

..

..

..

..

..

..

.

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

.......................................................................................................................................................................................................................................

.......................................................................................................................................................................................................................................................................................................................................................................................................

...................................................................................................................................................................................................................................................................................................................................................................

���������hhhhhhhhh�

��������

x(ti−1)

x(ti)

x(ti+1)

x(ti+1)

Jede komplexe Zahl z = x + iy 6= 0 besitzt genau eine Darstellung derForm

z = reit; 0 < r; 0 ≤ t < 2π

r, t heißen die Polarkoordinaten von z.

Beispiel 8.3 (Einheitswurzeln)Gesucht sind die funften Einheitswurzeln,d.h. die Losungen von z5 = 1. Es gibt davon funf, namlich

e152iπ, e

252iπ, e

352iπ, e

452iπ, 1

Allgemeiner gilt

56

Page 58: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Satz 8.10 Sei 0 6= a eine komplexe Zahl. Dann gibt es funf funfte Wurzelnvon a. Ist a = reit (Polarkoordinaten), so sind dies;

r0.2eit5 = e1, e1e

15i2π, e1e

25i2π, e1e

35i2π, e1e

45i2π

Dieser Satz, der naturlich nicht nur fur k = 5 gilt, ist ein Spezialfall dessogenannten Hauptsatzes der Algebra, den zuerst C.F. Gauss bewiesenhat. (Er hat sogar viele Beweise dafur gegeben) :

Satz 8.11 (Hauptsatz der Algebra) Sei p = a0 +a1x+ . . .+akxk ein Plynom

mit komplexen Koeffizienten ai und ak = 1. Dann gibt es b1, . . . , bk ∈ C, sodass p = (x− b1) . . . (x− bk).

Reelle Zahlen x, y heißen Real - bez. Imaginarteil einer komplexen Zahlz , wenn z = x + iy. So ist z.B. cost der Realteil von eit und sint derImaginarteil. Sammelt man Real-, und Imaginarteile der Summanden von∑

1k!

(it)k so ergibt sich, weil i2k = (−1)k, i2k+1 = (−1)ki :

Satz 8.12

eit =

∞∑

k=0

1

k!(it)k

cost =

∞∑

k=0

(−1)k

(2k)!t2k

sint =∞∑

k=0

(−1)k

(2k + 1)!t2k+1

Diese ”Reihen” sind Spezialfalle von Taylorreihen. Ist f eine glatte Funktion,und f (k)(0) die k− te Ableitung von f im Punkte 0, so ist

f(0) + xf ′(0) +x2

2f ′′(0) +

x3

3!f 3(0) + . . . =

∞∑

k=0

xk

k!f (k)

die Taylorreihe von f in 0. Es gibt Funktionen f , fur welche die Taylorreiheim Punkte 0, fur Argumente x in der Nahe von 0 konvergiert, und dortdie Funktion f darstellt, z.B. Polynome. Wenn eine Funktion f durch ihreTaylorreihe dargestellt wird, so ist dies ein “ Wunder”, denn die Taylorreihehangt nur von den Werten der Funktion und ihren Ableitungen in einemPunkt ab.

Aufgabe 8.6 Berechne die funften Wurzeln von −1 (d.h. funf komplexeZahlen z mit z5 = −1 auf vier Stellen nach dem Komma.

57

Page 59: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Aufgabe 8.7 Berechne eine Partialbruchzerlegung von 1z3+1

. (Es sind alsokomplexe Zahlen a1, a2, a3, b1, b2, b3 gefragt, mit

1

z3 + 1=

a1

z − b1+

a2

z − b2+

a3

z − b3

Aufgabe 8.8 Welches ist die Taylorreihe in 0 der Funktion f(x) = ab+z

, woa, b komplexe Zahlen sind ? (Geometrische Reihe benutzen!) Wo konvergiertdiese Reihe? Welches ist die Taylorreihe der Funktion aus der vorangegan-genen Aufgabe?

Aufgabe 8.9 Zeige, dass jedes Polynom (in einer Variablen) durch seineTaylorreihe in 0 dargestellt wird.

58

Page 60: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

9 Differentialgleichungen

-

6

6

6

?

?

-

-

@@@@@I

@@@@@@@@@I

�����

������

���

@@@@@R

@@@@@@@@@R

������

����������

These: Man kann Differentialgleichungen unterrichten, sobald Schulerein intuitives Verstandnis von Geschwindigkeit haben, und mit Koordinatenumzugehen wissen. Es lohnt sich, den Computer einzusetzen.Inhalt

1. Lineare Systeme

2. Pendel

3. Himmelsmechanik

4. Gradienten

5. Fische

59

Page 61: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

9.1 Lineare Systeme

Diese Figur zeigt ein Vektorfeld v. Es ordnet jedem Punkt der Ebene zeinen Pfeil v(z) zu, der im Punkte z abgetragen wird. Die Figur zeigt z.B.

den Pfeil d.h. Spaltenvektor

(

050

)

vom Punkt mit den Koordinaten 50, 0

abgetragen. Das Vektorfeld der Figur hat die Form

v(

(

xy

)

) =

(

−yx

)

=

(

0 −11 0

)(

xy

)

Wenn man Matrizen verwendet, vereinfacht sich die Notation. Daher sei andie Additiuon und Multiplikation von Matrizen erinnert:

(

a11 a12

a21 a22

)

+

(

b11 b12

b21 b22

)

=

(

a11 + b11 a12 + b12

a21 + b21 a22 + b22

)

(

a11 a12

a21 a22

)(

b11 b12

b21 b22

)

=

(

a11b11 + a12b21 a11b12 + a12b22

a21b11 + a22b21 a21b12 + a22b22

)

Vektorfelder der Form z → Az wo A eine Matrix ist, heißen linear. LineareVektorfelder sind besonders einfach zu zeichnen, da entlang von Geradendurch den Ursprung alle Vektoren gleichgerichtet sind: Aαz = αAz.Es sei z(t) = (x1(t), x2(t)) der zeitabhangige Ort eines Punktes in der Ebene.Dann ist

z(t) =d

dtz(t) = (

d

dtx1(t),

d

dtx2(t))

die Ortsanderung pro Zeiteinheit, d.h. die momentane Geschwindigkeit desPunktes zur Zeit t.(Wir gebrauchen hier das Wort Geschwindigkeit anders als im taglichen Le-ben, wo es den Betrag ‖z(t)‖ von z(t) bezeichnet; es liegt hier eine Verallge-meinerung des Begriffs der Ableitung einer Funktion y(x) einer Variablen xvor, insofern als (1, y(x)) die Geschwindigkeit von x → (x, y(x)) ist. z(t) inz(t) abgetragen ist tangential zu s→ z(s).)Ein Vektorfeld f schreibt also in jedem Ort z eine Geschwindigkeit f(z) vor.t→ z(t) heißt Losung der Differentialgleichung

z = f(z)

wenn stets z(t) die vorgeschriebene Geschwindigkeit hat:

d

dt|t=sz(t) = f(z(s))

60

Page 62: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Der Betrag des Vektors v(z) ist verantwortlich fur den Betrag der Ge-schwindigkeit mit der der Bahnpunkt z(t) die Bahn {z(s)|t ∈ R} durchlauft.Andert man den Betrag aber nicht die Richtung des Vektors, so andert sichzwar die Geschwindigkeit, mit der der Bahnpunkt seine Bahn durchlauft,aber die Bahn selbst andert sich nicht. Man zeichnet daher vorteilhafterWeise nicht das Vektorfeld, sondern das “ Richtungsfeld”, welches aus demVektorfeld entsteht, indem man alle Vektoren zu einer einheitlichen Langenormiert, die so klein ist, dass sich die verschiedenen Vektoren nicht in dieQuere kommen. Als Beispiel zeichnen wir ein Richtungsfeld fur

z →(

1 00 −1

)

z

Aus Symmetriegrunden zeichnen wir nur im rechten oberen Quadranten. Mansieht schon, dass die Losugskurven Hyperbelform haben. In der Tat rechnetman nach, dass

z(t) =

(

et 00 e−t

)

z0

Losungen mit Anfangswert z(0) = z0 sind.

-- -

6

?

?

� -- ��������������

R

R

����������

���

j

j

��������������

AAU

AAU

��������������

CCW

CCW

������

������

�XXz

XXz

61

Page 63: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Allgemein wird die lineare Differentialgleichung

z = Az, z(0) = z0

duch

z(t) = etAz0

geloßt. Dabei ist das Exponential der Matrix tA wie fur reelle Zahlen defi-niert:

etA = limn

(Id +tA

n)n = Id + tA +

t2

2A2 +

t3

3!A3 + . . .

Das Exponential etA einer Matrix A ist besonders einfach zu berechnen, wennA Diagonalform hat:

A =

(

λ 00 µ

)

⇒ etA =

(

etλ 00 etµ

)

Das vorangegangene Beispiel ist von dieser Art. Das Eingangsbeispiel istaber auch ein lineares System (von gewonlichen Differentialgleichungen) Hiererreicht man eine Vereinfachung, wenn man komplexe Zahlen benutzt: manstellt eine komplexe Zahl a + ib durch eine 2× 2− Matrix dar:

ϕ(a + ib) =

(

a, −bb a

)

Die folgenden Eigenschaften von ϕ sind leicht einzusehen:

ϕ(1) = Id =

(

1 00 1

)

, ϕ(z1 + z2) = ϕ(z1) + ϕ(z2), ϕ(z1z2) = ϕ(z1)ϕ(z2)

ϕ(limn

un) = limn

ϕ(zn); eϕ(z) = ϕ(ez)

Aufgabe 9.1 Verifiziere diese Eigenschaften.

62

Page 64: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Insbesondere ergibt sich

(

cost −sintsint cost

)

= ϕ(eit) = et

0

@

0 −11 0

1

A

Also sind die Kreise

z(t) =

(

ucost− vsintusint + vcost

)

= ϕ(eit(u + iv))

Losungen mit Anfangswert z0 = u + iv und die komplexe Schreibweise fureinen Kreis

eitz; t ∈ R

bewahrt sich.Sei z → f(z) ein Vectorfeld. z heißt Eigenvektor von f wenn es eine reelleZahl µ gibt mit f(z) = µz. µ heißt dann Eigenwert zum Eigenvektor z.Die folgende Figur stellt ein Vektorfeld mit zwei Eigenvektoren veschiedenerRichtung dar. Das lineare Vektorfeld ist gegeben durch

x = 2x + 3y; y = −0.3y + 4x

Es wurde mit dem MAPLE- Befehl “dfieldplot” erstellt.

–2

–1

0

1

2

y

–2 –1 1 2x

63

Page 65: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Nicht immer besitzt ein lineares Vektorfeld Eigenvektoren, wie das Beispiel

x = 2x + 3y; y = −0.3y − 4x

zeigt. Die Figur ist wieder mit dfieldplot erstellt.

–4

–2

0

2

4

y

–4 –2 2 4x

Mit weiteren Beispielen kann man die folgende Aufgabe losen:

Aufgabe 9.2 Wie sieht ein lineares Vektorfeld ohne Eigenvektor aus? Wieviele verschiedene Richtungen von Eigenvektoren kann es geben? Wie siehtein lineares Vektorfeld aus, mit zwei Eigenwerten gleichen Vorzeichens, undwie eines mit zwei Eigenwerten verschiedenen Vorzeichens?

64

Page 66: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

9.2 Das Pendel

Ein “mathematisches” Pendel ist ein idealisiertes physikalisches Pendel: eshat keine Reibung und eine masselose Verbindung. Die Schwingungen einesmathematischen Pendels sind periodisch. Dies folgt aus dem Satz, dass dieLosung einer (glatten) Differentialgleichung durch einen Anfangszustand be-reits festgelegt ist. Periodische Vorgange kann man zur Herstellung von Uh-ren verwenden. Fur eine Uhr im technischen Sinne verlangt man mehr: dieSchwingungsdauer (Frequenz) soll “robust” sein gegenuber kleinen Storun-gen. Am Ende dieses Abschnittes zeigt eine Figur ein Mathematisches Mo-dell , bei welchem sich die Schwingungsdauer nach einer kleinen Storung vonselbst wieder einstellt.

Satz 9.1 (Eindeutigkeitssatz) Zwei Losungen t → z1(t), t → z(2(t) einer(glatten) Differentialgleichung z = f(z), die zu einem Zeitpunkt ubereinstim-men: z1(t0) = z2(t0 , stimmen fur alle t uberein, fur welche sie beide definiertsind.

Korollar 9.1 (Priodizitat) Wenn z(t0) = z(t0 + p), dann ist z(t) = z(t + p)fur alle t, d.h. t→ z(t) ist periodisch mit Periode p.

Der Eindeutigkeitssatz soll hier nicht bweiesen werden; statt dessen soll aufeine Subtilitat hingewiesen werden, die sich hinter dem Wort “glatt“ ver-birgt: wenn z → f(z) nicht differenzierbar ist, sondern nur stetig, dann kannVieldeutigkeit auftreten. So ist z.B. die Funktion y →

|y| im Punkte y = 0nicht differenzierbar, wie man an der Figur ( mit dem MAPLE Befehl “plot-function” erstellt) erkennt:

Wie die folgende Figur (mit dem MAPLE- Befehl “phaseportrait” erstellt)zeigt, gibt es viele Losungen von x = 1; y = 2|y|0.5, mit x(0) = 0, y(0) = 0,

65

Page 67: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

namlich

x(t) = t, y(t) =

{

0; (0 ≤ t ≤ h

(t− h)2; h ≤ t

Die Sache ist insofern subtil, als man mit bloßem Auge die entscheidendeFrage, ob namlich Losungen in endlicher Zeit Null werden konnen, nichtentscheiden kann. Es ist aber so, wie die Mathematik zeigt.

–6

–4

–2

0

2

4

y(x)

x

SSSSSSSSSSSS

l

uml cos θ

θ

.......................................

......................................................................................................................................................................................................................................................................................................

?

Die Position des Pendels mit Masse m und Lange l wird durch den Winkelθ beschrieben, der die Auslenkung aus der (unteren) Ruhelage mißt. Die

66

Page 68: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

kinetische Energie ist dann ml2

2θ2 . Die potentielle Energie ist −glmcosθ

. Energieerhaltung besagt, dass die Gesamtenergie:

E =ml2

2θ2 −mglcosθ = const

Durch Differenzieren erhalt man hieraus die Differentialgleichung fur das ma-thematische Pendel- in der m nicht mehr vorkommt:

θ′′ = −g

lsinθ

Hieraus macht man - ein allgemeingultiges Verfahren - zwei Differenrilaglei-chungen erster Ordnung - und damit ein Vektorfeld in der Ebene - indemman fur θ′ eine neue Variable y einfuhrt:

θ = y; y = −g

lsinθ

Der Satz von der Erhaltung der Energie besagt nun, dass die Funktion

E(θ, y) =l

2gy2 − cos θ

auf den Losungen t → (θ(t), y(t)) constant ist, dass also zu jeder solchenLosung eine Zahl c existiert derart, dass fur alle t : E(θ(t), y(t)) = c. Mannennt die Mengen {(θ, y)|E(θ, y) = c} auch “Niveaulinien” von E. Die fol-gende Figur zeigt einige Niveaulinen der Funktion E(x, y) = 0.2y2 − cosx.Sie wurde mit dem MAPLE Befehl “contourplot” erstellt.

–4

–2

2

4

y

–6 –4 –2 2 4 6x

67

Page 69: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Wie liest man diese Figur?Man betrachtet eine Losung t → (x(t), y(t)) = (θ(t), ˙θ(t)) Auf Grund derErhaltung der Energie liegen alle (x(t), y(t)) auf einer Niveaulinie zu einemNiveau c d.h. es gilt

dy2(t) = c + cosx(t)

Fall 1: c > 1. Dann ist dy2(t) ≥ c − 1. Entweder ist dann y(t) stets po-sitiv oder stets negativ. Im ersten Fall wachst x(t) unbeschrankt. Deswe-gen kommt nach einem s ein t > s mit x(t) = x(s) + 2π. Dann ist aberdy(t)2 = c + cos(x(s) + 2π) = c + cos(x(s)) = dy(s)2. Weil es sich beix(t) = θ(t) um Winkel handelt haben wir x(s) und x(s) + 2π zu identifizie-ren (der Zustandsraum ist eigentlich nicht R × R{(x, y)|x, y ∈ R} sondern[0, 2π)× R = Einheitskreis × R, ein Zylinder). Darum ist zur Zeit t = s + pwieder der Zustand erreicht, den das Pendel zur Zeit s hatte. Nach Korrollarist die Bewegung daher periodisch mit Periode p. Das Pendel vollfuhrt peri-odisch Volldrehungen gegen den Uhrzeigersinn. Oder es ist y(t) stets negativ,und das Pendel vollfuhrt periodisch Volldrehungen mit dem Uhrzeiger.Fall 2: 0 < c < 1 Wenn z.B. x(t0) > 0 und y(t0) < 0 dann fallen x(t), y(t)und zwar solange bis x(t) = 0 und die y2(t) maximal. Es ist der Durch-gang mit dem Urzeigersinn durch die untere Ruhelage des Pendels.danachwachst x(t) weier, aber y/t) nimmt ab, bis wieder bei c = cosx(t), y(t) = 0der maximale ausschlag erreicht ist Danach fallen beide, x(t) und y(t) bisx(t) = x(t0), y(t) = y(t0) . Nach korollar ist die Lßung periodisch mitPeriode p = t − t0. Das Pendel schwingt periodisch zwischen zwei Aus-schlagen hin und her. Fur den maximalen Ausschlag x , die Amplitude,gilt: c = −cos(x) = cos(−x).Fall 3: c = 1.Ein Zustand e heißt Gleichgewicht einer Differentialgleichung z = f(z)wenn f(e) = 0. Dann ist also die konstante Funktion t→ e Losung mit An-fangswert e. Auf Grund des Eindeutigkeitssatzes ist diese konstante Losungdie einzige , die den Wert e annehmen kann. Mit anderen Worten: man kannbei einem glatten Vektorfeld - ein Gleichgewicht nicht in endlicher Zeit voneinem anderen Zustand aus erreichen.Man unterscheidet stabile und instabile Gleichgewichte. Fur das Pendelist e1 = (0, 0) ein stabiles Gleichgewicht und e2 = (π, 0) ein instabiles. Diemathematische Definition der Stabilitat ist nicht ganz einfach, siehe Figurunten. Der Leser prufe, inwiefern sie sein Vorverstandnis trifft:

Definition 9.1 Ein Gleichgewicht e einer Differentialgleichung z = f(z)heißt stabil, wenn es zu jeder Zahl a > 0 eine Zahl b > 0 gibt, so dass jedeLosung t → z(t) von z = f(z) , mit ‖z(0) − e‖ < b fur alle Zeiten t > 0einen Abstand ‖z(t)− e‖ < a von e hat.

68

Page 70: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

-................................................................................................................................................................................................................................................................................................................................................................................

........................................................................................................................................................................................................................................

...........................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

.............................................................................................................................................................................................................................................................................................................................................................................................

.

..

.

.

.

.

..

.

.

.

.

.

..

.

.

..

.

.

.

..

.

.

..

.

.

..

.

..

.

.

..

.

..

.

..

.

..

.

..

..

..

.

..

..

..

..

..

.

..

..

.

..

.

..

.

..

..

..

..

..

.

..

..

..

..

............................................................................................

.............................................................................................................................................................................................................................................................................................................................................................................................................................

..................................................................................................................................................................................... ab

...................................................................................................................................................................

..................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

z(0)

z(t)

e

Aufgabe 9.3 Zeichne die Niveaulinien der obigen Figur auf eine Rolle, denZustandsraum des Pendels, d.h. einen Zylinder, der aus der Ebene R × R

entsteht, indem man sie entlang der x− Achse so aufrollt, dass je zwei Punkteder Form (x, y) und (x + 2π, y) identifiziert werden.

Aufgabe 9.4 Zeige: die Niveaulinien fur c = 1 bestehen aus drei Losungenz1, z2z3, mit

limt→∞

zi(t) = e2; z1(t) > 0 > z2(t), z3(t) = e2

Warum kann eine nicht konstante Losung einer Differentialgleichung z =f(z) mit glattem f ein Gleichgewicht nicht in endlicher Zeit erreichen?

Aufgabe 9.5 Welches sind die Gleichgewichte der Differentialgleichung aufder Zahlengeraden

x = (x− 3)(x− 4)(x− 5)(x− 6)(x− 7)

und welche davon sind stabil? Was laßt sich fur die allgemeine Gleichungx = f(x) auf der Zahlengeraden ( x ∈ R ) sagen?

Wenn man in der Pendelgleichung

d2

dt2θ(t) = −g

lsinθ(t)

den Sinus durch das erste Glied in der Taylorreihe ersetzt erhalt man

θ′′ = −g

69

Page 71: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

den “harmonischen Oszillator”, der, fur kleine Ausschlage eine gute Nahe-rung an das mathematische Pendel ist. Das Verfahren ist allgemeingultigund wird Linearisierung im Gleichgewicht e genannt: man ersetzt dieDifferentialgleichung z = f(z) = (f1(x, y), f2(x, y)) durch die lineare Diffe-rentialgleichung

z =

(

∂f1

∂x(e) ∂f1

∂y(e)

∂f2

∂x(e) ∂f2

∂y(e)

)

z

Fur das Pendel erhalt man im Fall vom stabilen Gleichgewicht e = (0, 0)erhalt man den “ harmonischen Oszillator”

z =

(

0 1−g

l0

)

z

mit Losungen

z(t) =

(

cosωt sinωt−sinωt cosωt

)

z(0); ω =

g

l

Bemerkenswert ist, dass die Schwingungsdauer 2πω

unabhangig ist vom Ma-ximalen Ausschlag, der Amplitude. ω heißt “ Frequenz”. Die Abbildung

z(0)→ z(t) =

(

cosωt sinωt−sinωt cosωt

)

z(0) = D(t)z(0)

kann man mit komplexen Zahlen ( z(0) = z1 + iz2 ) auch so schreiben

z → eisz; s = ωt

Es handelt sich um eine Drehung (von z ) um den Winkel s (im Bogenmaßgemessen.)Im Fall des instabilen Gleichgewichtes e2 = (π, 0) erhalt man

z =

(

0 10 g

l

)

weil cosπ = −1. Diese Matrix hat zwei Eigenvektoren, einen in Richtung derDiagonale, einen in Richtung der Antidiagonale. Das Phasenportrait fur g

l=

2.5 dieses linearen Systems soll man mit den Niveaulinien des entsprechendenPendels in der Nahe von (π, 0) vergleichen.

70

Page 72: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

–8

–6

–4

–2

0

2

4

6

8

y

–4 –2 2 4x

Das MAPLE workscheet, das diese Figur produziert, ist dieseswith(DEtools):phaseportrait([D(x)(t)=y(t),D(y)(t)=2.5*x(t)], [x(t),y(t)], t=-1..1,[[x(0)=0,y(0)=2],[x(0)=0,y(0)=-2],[x(0)=2,y(0)=0],[x(0)=-2,y(0)=0]],linecolor=black);

In der Physik ist man gewohnt, die Stabilitat eines Gleichgewichtesmit Hilfe der potentiellen Energie zu diskutieren. Im Falle des Pendels siehtdas so aus: bei θ = 0 hat die potentielle Energie −g

lcosθ ein Minimum; die

erste Ableitung verschwindet und die zweite ist positiv. Daher handelt essich um ein stabiles Gleichgewicht. Bei θ = π hat die potentielle Energie einMaximum: die erste Ableitung verschwindet und die zweite ist negativ. Alsohandelt es sich um ein instabiles Gleichgewicht. Weil namlich die Energieerhalten bleibt, wird die kinetiche Energie in der Nahe eines Minimumsder potentiellen Energie vermindert, in der Nahe eines Maximums jedochvergroßert. Die Energiefunktion ist aber nicht nur bei Erhaltung der Energiefur die Stabilitatsanalyse nutzlich, wie jetzt gezeigt werden soll.Reibung: Reibung wird haufig durch einen Term modelliert, der proportio-nal zur Geschwindigkeit ist. Wir betrachten daher die Pendelgleichung

θ′′ = −g

lsinθ − rθ′

Hier ist die Energiefunktion E(x, y) = 12ml2y2−lmgcosx nicht mehr konstant

auf Losungen, sondern nimmt ab:

d

dtE(θ(t), θ′(t)) = ml2y2 − glmsinθθ′ = lmθ′(lθ′′ + gsinθ) = lmθ′(t)2 < 0

71

Page 73: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Hieraus laßt sich schließen, dass die Energie entlang einer Losung so langeabnimmt, bis - nach unendlich langer Zeit - ein Gleichgewicht erreicht wird.Davon gibt es aber, wie im Fall ohner Reibung zwei: e1 = (0, 0), e2 = (π, 0).Das erste Gleichgewicht ist ein Minimum der Energiefunktion, das zweite einSattelpunkt.

–3

–2

–1

1

2

3

y(t)

2 4 6x(t)

Eine Analyse der obigen Figur ( es ist g = l und r = 0.3 gewahlt, undMAPLEs phaseportrait benutzt) zeigt, dass es genau zwei “Trajektorien”gibt, die nach e2 laufen; alle anderen laufen (spiralisierend) gegen e1. Diebeiden Ausnahmetrajektorien sind jedoch so storanfallig, dass sie praktischnicht beobachtet werden konnen.

Die folgende Figur zeigt ein “Phasenportrat” mit einer periodischenLosung t → z(t), die sich selbst stabilisiert: Jede Losung nahert sich imLaufe der Zeit einer Losung der Form t → z(t + h) . Die Figur wurde mitdem MAPLE- Befehl “phaseportrait”erstellt. Die Gleichungen (sogenannteLienardGleichungen) lauten x = 1, y = −(2x2 + y2 − x)y − 2x.

72

Page 74: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

–1

–0.5

0

0.5

1

1.5

2

2.5

y(t)

–0.8 –0.6 –0.4 –0.2 0.2 0.4 0.6 0.8x(t)

Historisches:( Nach Berkeley Physik Kurs 1: Mechanik, Vieweg 1991)Streng genommen gibt es in der Pendelgleichung bez. in der Gleichung desfreien Falles zwei Arten von Masse

mtrθ′′ = −msch

g

lsinθ, bez. mtrx

′′ = mschg

die “trage” Masse mtr , die der Beschleunigung entgegensteht, und die “schwere” Masse, die der Schwerkraft (Gravitation) entgegensteht. Die Beob-achtung, dass alle Korper ( vom Luftwiderstand abgesehen ) gleich schnellfallen, legt die Vermutung nahe, dass beide proportional oder bei geeignetenEinheiten gleich sind. Einstein hat das Postulat der Aquivalenz von schwererund trager Masse zum Ausgangspunkt der allgemeinen Relativitatstheoriegemacht. Newton (1643 - 1727)schreibt dazu in “philosophiae naturalis prin-cipia mathematica”(1687), kurz “ principia” genannt:“Aber es ist schon vor langer Zeit von anderen beobachtet worden, dass (un-ter Berucksichtigung der geringen Luftreibung) alle Korper in gleichen Zeitendurch gleiche Strecken fallen; und mit Hilfe von Pendeln laßt sich die Gleich-heit von Fallzeiten genau feststellen.Ich versuchte die Sache mit Gold, Silber, Blei, Glas, Sand, Holz, Wasserund Weizen. Ich benutzte zwei gleiche Holzkasten. Ich fullte den einen mitHolz und befestigte die gleiche Gewichtsmenge Gold im Oszillationszentrumdes anderen so genau ich es konnte. An gleichen Faden von 11 Fuß Langeaufgehangt bildeten die beiden Kasten zwei nach Gewicht und Form volliggleiche Pendel, mit gleichem Luftwiederstand: ich beobachtete ihr gemein-sames Bewegungsspiel lange Zeit; sie schwangen gemeinsam. Und deshalb

73

Page 75: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

(aufgrund von Cor. I und VI, Prop.XXIV, Buch II) verhalt sich die MengeMaterie im Holz wie die Wirkung der Bewegungskraft auf das gesamte Goldzur Wirkung deselben auf das gesamte Holz; d.h. wie das Gewicht des einenzum Gewicht des anderen.Und mit diesen Exerimenten hatte ich bei Korpern gleichen Gewichteseinen Materieunterschied geringer als ein tausendstel des Ganzen feststel-len konnen.”Das Aquivalenzprinzip besagt, dass fur einen Beobachter in einem frei fal-lenden Fahrstuhl die Gesetze der Physik dieselben sind wie in den Inertial-systemen der speziellen Relativittstheorie (zumindest in der unmittelbarenNachbarschaft des Fahrstuhlmittelpunktes). Die durch die beschleunigte Be-wegung und die von den Gravitationskraften verursachten Wirkungen hebeneinander auf. Ein Beobachter, der in einem geschlossenen Fahrstuhl sitztund scheinbare Schwerkrafte mißt, kann nicht entscheiden, welcher Anteildieser Krafte auf eine Beschleunigungsursache und welcher auf eine tatsachli-che Gravitationsursache zuruckgeht. Wenn außer der Gravitationskraft keineanderen Krafte am Fahrstuhl angreifen, so wird er uberhaupt keine Aufla-gekrafte spuren. Insbesondere fordert das postulierte Aquivalenzprinzip furden Quotienten aus trager und schwerer Masse, dass mtr/msch = 1. Die “Gewichtslosigkeit” eines Astronauten in einem Satelliten mit abgestelltemTriebwerk ist eine Konsequenz des Aquivalenzprinzips.

9.3 Skalarprodukt

Wir verwenden die Notation u = (u1, u2) sowohl fur den punkt in der Ebene,als auch fur den Zeigevektor mit Ursprung in (0, 0) und Pfeilspitze in (u1, u2).Fur solche Vektoren u = (u1, u2), v = (v1, v2) definiert man

< u, v >= u1v1 + u2v2, ‖u‖2 =< u, u >

Man nennt < u, v > das Skalarprodukt von u und v , und ‖u‖ die Norm

oder den Betrag von u. Man hat die folgendenRechenregeln:

1. < u, v >=< v, u >

2. < u + v, w >=< u, w > + < v, w >

3. < λu, v >= λ < u, v >, λ ∈ R

4. < u, u >> 0 außerm wenn u = 0.

74

Page 76: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Bekanntlich ist

u→(

cost −sintsint cost)

)

u = Du

eine Drehung um den Winkel t (im Bogenmaß) gegen den Uhrzeigersinn,mit 0 als Fixpunkt Man rechnet leicht nach, dass dabei das Skalarproduktfestgelassen wird:

Satz 9.2 < U, v >=< Du, Dv >

Wenn man nun die Drehung so wahlt, dass v auf die positive x Achse gedrehtwird, also von der Form (v1, 0), v1 > 0 ist, dann hat man die folgende Figur

-�������������3

(u1, u2)

(u1, 0)(v1, 0)

(0, 0)

Es ist also < u, v > die Lange der senkrechten Projektion von u auf vmutipliziert mit ±‖v‖. Es gibt nun einen kleinsten Winkel, derart, dass eineDrehung um diesen Winkel gerade u nach v dreht. Dieser Winkel werde mit(u, v) bezeichnet. Dann sagt die Figur

Satz 9.3

cos(u, v) =< u, v >

‖u‖‖v‖

Satz 9.4 (Ungleichung von Cauchy-Schwarz

−‖u‖ · ‖v‖ ≤< u, v >≤ ‖u‖ · ‖v‖

Hier steht = an der Stelle von ≤ genau dann wenn es eine reelle Zahl c gibt,so dass entweder u = cv ode rv = cu.

75

Page 77: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Der Beweis ist sehr einfach: es genugt den Fall u 6= 0, v 6= 0 zu btrachten.Dann reduziert sich die Ungleichung mittels Division durch ‖u‖ · ‖v‖ auf

−1 ≤< u, v >≤ 1 ‖u‖ = 1, ‖v‖ = 1

Dies ergibt sich aber aus den beiden folgenden Gleichungen < u+v, u+v >=‖u‖2 +‖v‖2 +2 < u, v >= 2+2 < u, v > < u−v, u−v >= ‖u‖2 +‖v‖2−2 <u, v >= 2− 2 < u, v > Hieraus folgt

Korollar 9.2 (Dreiecksungleichung)

‖u + v‖ ≤ ‖u‖+ ‖v‖

Zum Beweis genugt es, die quadrierte Ungleichung zu beweisen. Diese lautetaber

< u + v, u + v >= ‖u‖2 + ‖v‖2 + 2 < u, v >≤ ‖u‖2 + ‖v‖2 + 2‖u‖‖v‖

und dies ist nach der C.S.- Ungleichung richtig.

9.4 Gradienten

–4

–2

0

2

4

y

–2 2 4 6x

76

Page 78: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Die vorstehende Figur zeigt die Niveaulinien und den Gradienten, d.h. dasGradientenfeld der Energiefunktion 0.2y2 − cosx = E(x, y) eines Pendels.Hier oist das MAPLE-worksheet, das diese Figur produziert:with(DEplots):F:=contourplot(0.2*y*y-cos(x),x=-6..6,y=-4..4,filled=true,coloring=[white,black]);G:=phaseportrait( [D(x)(t)=sin(x(t)),D(y)(t)=0.4*y(t)],[x(t),y(t)],t=0..10,[[x(0)=0.1,y(0)=-0.1],[x(0)=0.1,y(0)=-0.1],[x(0)=-0.1,y(0)=-0.1], [x(0)=-0.1,y(0)=-0.1],[x0=6,y(0)=0.1],[x(0)=6,y(0)=-0.1]]);display{F,G};Der Gradient gradf(x, y) einer Funktion f von zwei Variablen x, y ist einVektorfeld, das so definiert ist:

gradf(x, y) = (∂

∂x(x, y),

f

∂y(x, y)

Wie die Figur zeigt, steht gradf(x, y) senkrecht auf den Niveaulinien:

Satz 9.5 1. Die Richtung von gradf(x, y) ist die Richtung steilsten An-stieges von f.

2. gradf(x, y) steht senkrecht auf Niveaulinien durch (x, y).

Man beachte, dass Niveaulinien sehr schwer zu berechnen sind, der Gradientjedoch sehr einfach. Man kann also den Gradienten benutzen um Niveaulinienzu veranschaulichen.Fur den Beweis benotigt man die folgende Ableitungsregel: ist t → c(t) =(c1(t), c2(t)), so gilt

d

dtf(c(t)) =

∂f

∂x(c(t))c1(t) +

∂f

∂y(c(t))c2(t)

( Die Ableitungsregel kann man sich leicht klar machen fur Funktionenf(x, y) = g(x)h(y).) Fur unsere Zwecke genugt eine “Gerade”:c(t) = z + tcmit c = (c1, c2). Dann ist c(t) = c. Nach Cauchy - Schwarz gilt

| < gradf, c > | ≤ ‖gradf‖‖c‖

mit Gleichheitszeichen an der Stelle vo ≤ genau dann, wenn c Vielfaches vongradf ist. Also ist d

dt |t=0f(z + tc) am großten, wenn c positives Vielfaches

von gradf(z) ist. Dies beweist die erste Behauptung. Bezeichnet man nunt→ c(t) als Niveaulinie, wenn t→ f(c(t)) konstant ist, so gilt

0 =d

dtf(c(t)) =< gradf(c(t), c(t) >

77

Page 79: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

was die zweite Behauptung beweist.Was Differentialgleichungen anbetrifft, so unterscheidet man “Gradientensy-steme”

z = gradf(z)

und “konservative” Systeme:

z = −gradf(z)

Gradientensysteme treten eher selten auf. (fur lineare Gradientensystemesiehe Aufgabe unten.)Ihr Langzeitverhalten ist einfach zu studieren (SieheAufgabe unten) weil f entlang Losungen wachst: falls gradf(z) 6= 0, ist

d

dtf(z(t)) =< gradf(z), z = ‖gradf(z)‖2 > 0

Konservative Systemetreten in der Mechanik auf (siehe Himmelsmechanik).

Hier bleibt die Energie E(z, z) = 12(z)2+f(z) entlang von Losungen konstant,

weil

d

dtE(z, z) =< gradf(z), z > + < (z), (z) >=< (z), gradf(z) + z >= 0

Aufgabe 9.6 Sei

A =

(

a11 a12

a21 a22

)

eine symmetrische matrix, d.h. a12 = a21 . Dann ist z = Az ein Gradienten-system, d.h. Az = gradf(z) ; namlich mit f(z) =< Az, z > .

Aufgabe 9.7 Beschreibe das Verhalten von Losungen von z = gradf(z) inder Nahe von a. einem Minimum von f ; b. einem Maximum von f , c. einemSattelpunkt von f,- anhand von Beispielen (mit MAPLE’s phaseportrait)

Aufgabe 9.8 Was tun die Losungen t → z(t) eines Gradientensystemswenn t gegen unendlich strebt? (Beispiele plotten!)

Just for fun noch die Niveaus und das Phasenprtrat des Gradienten derFunktion sin(x) + sin(y). Man beachte die Abfolge der “Senken, “Quellen”und “Sattelpunkte”. Die Funktion ist “doppelt periodisch” mit der Periode2π. Die Maxima (wie die Minima und die Sattelpunkte) bilden ein “ Gitter.”

78

Page 80: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

–6

–4

–2

0

2

4

6

y

–6 –4 –2 2 4 6x

–4

–2

0

2

4

y

–4 –2 2 4 6 8x

Das Insekt, das in der Luft ein anderes findet, auf Grund der aufgenommenenDuftpartikel, sucht in der Richtung maximal zunehmender Duftkonzentra-tion zu fliegen. Wer von einer Lawine verschuttet wird, und vorsichtshalberseinen Piepser angeschaltet hat, den kann das Rettungsteam finden, wennes sich in Richtung maximaler Zunahme der Signalintensitat bewegt. DasElektron wird in Richtung maximaler Zunahme des elektrischen Potentialsbeschleunigt. Der Numeriker sucht ein Maximum einer Funktion mit Hilfe

79

Page 81: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

des Gradienten. Der Himmelskorper wird Richtung maximaler Zunahme desNewton-Potentials beschleunigt. - Genauere Betrachtung zeigt jedoch einenUnterschied: Insekt, Rettungsteam und oftmals auch Numeriker mussen den“Gradienten”erst ermitteln. Daher die auffalligen Zickzackbewegungen derInsekten.

9.5 Fische

Vito Volterra (1860 - 1940) wurde von einem befreundeten Meeresbiologennach einer Erklarung fur periodische Schwankungen im Vorkommen zweierAtren von Fischen in der Adria gefragt. In der Folge entstand ein Buch mitdem vielsagenden Titel “ Lecons mathmathiques sur la lutte pour la vie”.Volterra konstruiert darin ein Modell fur die zeitliche Veranderung der Po-pulationsgroße x1(t), x2(t) zweier Fischpopulationen. Die Reproduktionsrateeines Lebewesens (d.h. wieviele Nachkommen es pro Zeiteinheit produziert),hangt normalerweise von seinem Alter ab. Damit hangt die Reproduktions-rate der Gesamtpopulation xi(t) von der Zusammensetzung der Gesamtpo-pulation aus den verschiedenen Altersgruppen ab. Wenn man nun aber dieseAbhangigkeit vernachlassigt, kann man den Ansatz

x1 = f(1(x1, x2); x2 = f2(x1, x2)

machen. (So etwas heißt “ autonomes System von (gewohnlichen) Differen-tialgleichungen erster Ordnung). Jetzt kann man nach dem Prinzip des ein-fachsten Ansatzes vorgehen. Das ist zweifellos f1 = a1x1; f2 = a2x1 mitLosungen x1(t) = ea1tx1(0), x2(t) = ea2tx2(0). Exponentielles Wachstum istnaturlich fur keine naturliche Population moglich, wenigstens nicht fur einenlangeren Zeitraum. Man kann nun dem, dass bei einer sehr großen Popu-lation nicht mehr genugend Nahrung vorhanden ist, um ein ungehemmtesWachstum zu gestatten - wiederum am einfachsten - durch einen Term der“innerartlichen” Konkurrenz aiix

2i Rechnung tragen:

x1 = (a1 − a11x1)x1; x2 = (a2 − a22x2)x2

Man kann, ohne zu rechnen, sofort angeben, was hier passiert: beide Po-pulationen entwickeln sich unabhangig voneinander; fangt xi klein an, d.h.ai − aiixi > 0 so wachst xi indem es sich dem Zustand ai − aiixi = 0annahert, d.h. ei = ai

aii. Dasselbe passiert, wenn xi groß anfangt, d.h. bei

ai− aiixi < 0. allerdings wird in diesem Fall x(t) immer kleiner. Um nun pe-riodische Schwankungenzu modellieren fuhrt man “Wechselwirkungsterme”

80

Page 82: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

aijxj ein. Das System

x1 = (a1 − a11x1 − a12x2)x1

x2 = (a2 − a21x1 − a22)x2)x2

Modelliert”zwischenartliche Konkurrenz”.( und innerartliche) Es ist nichtschwierig, aber interessant, das Langzeitverhalten eines solchen Systems anHand von Beispielen zu erraten.(Aufgabe weiter unten) Wiederholte Schwan-kungen ergeben sich fur ein sogenanntes “Rauber - Beute - System”

x1 = (a1 − a12x2)x1

x2 = (−a2 + a21x1)x2

Diese Gleichungen heißen Volterra - Lotka Gleichungen. Hier ist die inner-artliche Konkurrenz Null, die zweite Art ernahrt sich ausschlieslich von derersten, der Beute, und nimmt ohne diese exponentiell ab, wahrend die er-ste ohne die zweite exponentiell wachst (unbegrenzte Nahrungsquelle), aberproportional zur Große der zweiten, der Rauber, vermindert wird.Das erste, was man zum Studium einer Differentialgleichung z = f(z) unter-nehmen sollte, ist die Bestimmung der Gleichgewichte, d.h. der konstantenLosungen, d.h. der Zustande e , fur welche f(e) = 0. Hier sind dies

e1 = (0, 0), e2 = (0,− a2

a21), e3 = (

a1

a12, 0), e4 = (

a1

a12,− a2

a21)

Als nachstes sollte man die Isoklinen bestimmen: das ist einmal die Mengeder Zustande, in welchen x1 = 0 ist, hier: x1 = 0, die x2- Achse, und a1 =a12x2 , eine zur x1 - Achse parallele Gerade. Sodann x2 = 0 , hier x2 = 0, diex1 - Achse, und a2 = −a21x1 eine zur x2 - Achse parallele Gerade. Auf denIsoklienen sind die Pfeile des Richtungsfeldes einfach zu zeichnen: senkrechtbez. waagerecht. Fur die Figur wurde

x1 = (5− x2)x1; x2 = (−5 + x1)x2

gewahlt, mit dem Effekt, dass die Pfeile auf der Diagonale x1 = x2 alle dieSteigung −1 haben. Der Verdacht entsteht, dass es sich hier, wie beim har-monischen Oszillator, um periodische Losungen handeln konnte. Dass demso ist, kann man naturlich weder mit der Zeichnung eines Richtungsfeldesnoch mit einer Computersimulation beweisen, wie genau sie auch sei. Washier zum Ziel fuhrt, ist die Konstruktion einer Funktion L , die - ahnlich derEnergiefunktion beim Pendel- auf Losungskurven ihren Wert nicht andert:sei

V (x1, x2) = a21x1 + a12x2 − a2lnx1 − a1lnx2

Aufgabe 9.9 Sei z(t) = (x1(t), x2(t)) Losung der Volterra - Lotka Glei-chungen. Zeige durch ableiten, dass t→ L(z(t)) konstant ist.

81

Page 83: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

-

6

-

-

-

-

? ? ? ? ?

6 6 6 6

- - - - - - -@@@R

@@@R

@@@R

@@@R

@@@I

@@@I

@@@I

@@@I

���

���

���:

5

5

(0, 0)

2

4

6

8

10

12

14

16

18

20

y

2 4 6 8 10 12 14 16 18 20x

Es durchlauft also jede Losung des Volterra- Lotka-Systems eine Niveau-linie der Funktion L. Man hat sich also nur noch davon zu uberzeugen, dassdiese Niveaulinien verbeulte Kreise sind, denn in diesem Fall kommt eine jedeLosung t → z(t) nach einer gewissen Zeit t > 0 zu ihrem Anfangszustandz(0) zuruck: z(t) = z(0) und ist somit periodisch mit Periode t.

82

Page 84: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Aufgabe 9.10 Zeige, dass die Niveaulinien von L : {z|L(z) = c}; c ∈ R

verbeulte Kreise sind.

Zu diesem Zweck kann man sich z.B. uberlegen, dass die Funktion L aufeiner jeden von ( a2

a21, a1

a12) ausgehenden Geraden eine streng wachsende Funk-

tion ist.Die Volterra - Lotka -Gleichungen sind als Modell fur Populationen unbe-friedigend aus folgenden Grunden:

1. jeder noch so kleine Term innerartlicher Konkurrenz zerstohrt die Pe-riodizitat vollstandig; eine “ Erklarung” durch ein modell sollte aber“robust” gegenuber kleinen Veranderungen des Modells sein.

2. Wie bei jedem Modell der Form xi = xig(x1, x2) ist bei den Volterra-lotka- Gleichungen fur eine Losung t→ (x1(t), x2(t)) entweder xi(t) = 0fur alle t oder fur keines. (Dies folgt aus der Eindeutigkeit der Losungenvon “glatten” Differentialgleichungen). In Wirklichkeit beobachtet manjedoch , dass Arten aussterben.

Der ersten der beiden folgenden Figuren liegen die Gleichungen:

x = x(1− 0.2x− 0.1y), y = y(2− 0.5x− 0.13y)

zugrunde. Hier gewinnt die x Spezies (Gleichgewicht (5, 0) und die y Spe-zies stirbt aus. Bei der zweiten Figur ist innerspezifische Konkurrenz der ySpezies von 0.13 auf 0.1 herabgesetzt. Nun gewinnt die y Spezies (Gleich-gewicht (0, 15, 4)), und die x− Spezies stirbt aus. Es liegt also bei 0.12 eineVerzweigung des Verhaltens vor.

83

Page 85: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Man spricht in diesem Fall von einer “strukturellen Instabilitat”: nichtein zustand ist instabil, sondern das ganze System “kippt” bei einer kleinenVeranderung der Parameter. Es ist einleuchtend, dass solche Instabilitaten inder Diskussion von Umweltproblemen wichtig sind. In der nachsten Aufgabeist der Leser aufgefordert, was er in diesen Figuren sieht, zu verallgemeinern.

Aufgabe 9.11 Zwei Arten, die um eine gemeinsame Nahrungsquelle kon-kurrieren, werden durch

x1 = (a1 − a11x1 − a12x2)x1; x2 = (a2 − a21x1 − a22x2)x2

beschrieben. (0 < a12, a21 zwichenartliche Konkurrenz; < a11, a22 innerartli-che Konkurrenz.) Welches sind die Gleichgewichte und was passiert auf langeSicht? (Prinzip von der kologischen Nische). Man studiere Beispiele mittelsspezieller Wahl der koeffizienten.

84

Page 86: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

10 Die Normalverteilung

10.1 Integration von Funktionen einer Variablen

Ist F eine Funktion mit einer stetigen Ableitung F ′ = f, und a < b , so setztman bekanntlich

∫ b

a

f =

∫ b

a

f(x)dx = F (a)− F (b)

Damit hier die rechte Seite als Definition der linken gelten kann, muss gelten,dass verschiedene Stammfunktionen G von f , d.h. Funktionen G mit G′ =f zur gleichen rechten Seite fuhren: G(b)−G(a) = F (b)−F (a). Nun kann manaber zeigen, dass eine Funktion deren Ableitung verschwindet konstant ist.Es gibt also eine Konstante c , so dass G−F = c. Dann ist aber G(b)−F (b) =G(a)− F (a). Q.e.d.Das so definierte Integral von a bis b einer Funktion f ist gleich der Flachedie von dem Intervall von a bis b auf der x− Achse und dem Graphen derFunktion:

{(x, f(x))|a ≤ x ≤ b}

eingeschlossen wird. Dies macht man sich am einfachsten am Beispiel einerlinearen Funktion F (x) = 1 + 2x + 3x3 klar. Es ist namlich

∫ 2

1

f ′ =

∫ 2

1

(2 + 6x)dx = F (2)− F (1) = 1 + 4 + 12− 1− 2− 3 = 11

Es stellen sich nun zwei Fragen:

1. welche Funktionen besitzen eine Stammfunktion, - und

2. wie findet man eine Stammfunktion, wenn es eine gibt?

Die erste Frage findet eine Antwort im

Satz 10.1 (Hauptsatz der Differential- und Integralrechnung.) Sei f stetig.Dann besitzt f eine Stammfunktion, und zwar

x→ F (x) =

∫ x

a

f

Dieser Satz dient hier dazu Die Normalverteilung N(y, σ) zu definieren:Die Funktion

x→ n(x, y, σ) =1√2πσ

e−(x−y)2

85

Page 87: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

heißt Gausssche Glockenfunktion mit Mittelwert y und Yarianz σ. Das Maß

|a, b]→∫ b

a

n(x, y, σ)dx

heißt (y, σ)Normalverteilung. Es handelt sich um ein Wahrscheinlichkeits-maß mit Mittelwert y und Varianz σ2, denn es gilt

Satz 10.2 1.∫∞

−∞n(x, y, σ)dx = 1

2.∫∞

−∞n(x, y, σ)xdxy

3.∫∞

∞n(x, y, σ)(x− y)2dx = σ2

Hier ist verwendet, dass∫ n

−nn(x, y, σ)dx konvergiert, und die Definition:

limn

∫ n

−n

n(x, y, σ)dx =

∫ ∞

−∞

n(x, y, σ)dx

Das Maximum aller |f(x)| fur a ≤ x ≤ b wird mit ‖f‖[a,b] bezeichnet. Fur denBeweis des Hauptsatzes sind die beiden folgenden Eigenschaften des Integralsnutzlich - und leicht zu beweisen

Satz 10.3 1. Wenn a ≤ b ≤ c, dann ist∫ b

af +

∫ c

bf =

∫ c

af

2. Wenn ‖f‖[a,b] ≤ ε, dann ist |∫ b

af | ≤ ε(b− a).

Aus diesen beiden Eigenschaften folgt namlich

Minf([x, x + h]) ≤ 1

h

∫ x+h

x

f ≤ 1

h(

∫ x+h

a

f −∫ x

a

) =1

h(F (x + h)− F (x))

≤Maxf([x, x + h])

Weil aber f stetig ist, gilt

limh→0

Minf([x, x + h]) = f(x) = Maxf([x, x + h])

was den Hauptsatz beweist unter der Annahme, dass f eine Stammfunktionbesitzt,- und damit das Integral definiert ist. Hier sind Beispiele fur Stamm-funktionen:

Beispiel 10.1 1. a0 + a1x + . . . + anxn = (a0x + 12a1x

2 + . . . + 1n+1

anxn+1

2. 1x−a

= (ln(x− a))′

86

Page 88: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

3. 1(x−a)2

= ( −1x−a

)′

4. 11−x2 = 1

(x+1)(x−1)= −1/2

x+1+ 1/2

x−1= 1

2ln(x−1

x+1)

5. (x2 + 1)−1 = (arctan(x))′

Wir kommen nun zu der Behuptung des Hautsatzes, nach welcher jede stetigeFunktion f eine Stammfunktion besitzt, zwar nicht so dass man dafur eine“ geschlossene Formel angeben konnte, aber doch so, dass man Naherungenbeliebiger Genauigkeit angeben kann, falls man ausreichende Kenntnis vonf hat:

Satz 10.4 Es sei fn eine Folge von stetigen Funktionen mit StammfunktionFn so dass fn gegen f konvergiert in dem Sinne, dass limn ‖fn − f‖[a,b] = 0und fur alle n : Fn(a) = 0. Dann konvergiertFn gegen eine Funktion F imSinne von limn ‖Fn − F‖[a,b] = 0, und F ist Stammfunktion von f : F ′ = f.

Fur den Beweis, auf den hier verzichtet wird ist vor allem die zweite Formeldes vorangegangenen Satzes ausschlaggebend. Dieser Satz und der folgendesogenannte Approximationssatz von Weierstrass ergeben zusammen einenBeweis des Hautsatzes. Mehr noch: weil die approximierenden Polynome indiesem Satz konkret angegeben werden konnen (Interpolationspolynome),kann man die Stammfunktion konstruktiv approximieren.

Satz 10.5 (Approximationssatz von Weierstrass) Sei f eine stetige Funkti-on, a < b und ε > 0. Dann gibt es ein Polynom p = a0 + a1x + . . . anxn, sodass ‖f − p‖[a,b] ≤ ε.

Beispiel 10.2 Fur 0 ≤ x hat man

(1 +1

n)n ≤ ex ≤ (1 +

x

n)n+1

Aufgabe 10.1 Berechne damit∫ b

aex2

dx mit Fehlerabschatzung.

10.2 Integration von Funktionen mehrer Variabler

Sei (x1, x2) eine stetige Funktion von zwei Variablen und

R = {(x1, x2)|a1 ≤ x1 ≤ b1, a2 ≤ x2 ≤ b2}

ein achsenparalleles Rechteck mit Seiten der Lange b1− a1 bez. b2− a2. Mandefiniert das Integral von f uber R durch

R

f =

∫ b2

a2

(

∫ b1

a1

f(x1, x2)dx1)dx2

87

Page 89: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

Man integriert also zuerst die “ partielle” Funktion f(·, x2) nach x1, unddann das Resultat, die Funktion

x2 →∫ b1

a1

f(x1, x2)dx1

nach x2. Fur Funktionen f(x1, x2) = f1(x1)f2(x2) ergibt sich einfach dasProdukt:

R

f =

∫ b1

a1

f1

∫ b2

a2

f2

Fur solche Funktionen kommt es offenbar nicht auf die Reihenfolge der Inte-gration an. Also auch nicht fur Polynome p in zwei Variablen. Durch solchePolynome kann man aber eine beliebige stetige Funltion f auf R gleichmaßig- d.h. im Sinne von ‖f − pn‖R → 0 aproximieren, - nach dem Approximati-onssatz von Weierstrass, der fur beliebig viele Variable gilt. Folglich ist dieReihenfolge der Integration in jedem Falle unerheblich:

Satz 10.6

∫ b2

a2

(

∫ b1

a1

f(x1, x2)dx1)dx2 =

∫ b1

a1

(

∫ b2

a2

f(x1, x2)dx2)dx1.

Wie man gesehen hat ist es manchmal nutzlich, die Variablen hinzuschreiben,und manchmal uberflussig. Man schreibt

R

f =

1Rf =

1Rfλ =

1R(x)f(x)dx

u.s.w. Das Maß R →∫

1R = λ(R) heißt Gleichverteilung auf dem R2 oderauch Haarsches Maß auf R

2. Allgemeinere Mengen als es die Rechtecke sind,mißt man durch Ausschopfen, bez. Uberdecken mit Rechtecken. Allerdingsist es meist komfortabler mit Dreiecken statt mit Rechecken zu arbeiten.Dabei berechnet sich die Flache λ(D) eines Dreiecks als das Produkt vonGrundlinie und Hohe.Als Beispiel berechnen wir im Stil von Archimedes(287-212 B.C.) die Kreis-flache λ(K) einer Kreisscheibe mit Mittelpunkt (0, 0) und Radius r. Dazuwird zuerst ein Winkel α = 2π/n gewahlt, und dann ein regelmaßiges n-Eck einbeschrieben, und eines umgeschrieben. Das kleinere einbeschriebeneVieleck besteht aus n gleichseitigen Dreiecken mit je zwei Seiten der Lange r,die den Winkel α einschließen, und den Flacheninhalt r2 cos(π

n)sin(π

n) haben.

Siehe Figur.

88

Page 90: Mathematik III; WS 2003/4 - math.uni-frankfurt.deismi/sieveking/lecturenotes/MathematikIII.pdf · eine Theorie und Praxis der “Pseudo- Zufallsfolgen”, das sind Folgen ( von Zahlen

–1

–0.8

–0.6

–0.4

–0.2

0.2

0.4

0.6

0.8

1

–1–0.8 –0.4 0.2 0.4 0.6 0.8 1

Das umgeschriebene n -Eck besteht aus Dreiecken mit zwei gleich langen Sei-ten, die den Winkel α einschlieen, und die Hohe r haben. Der Flacheninhalteines solchen Dreiecks ist r2 sin α/ cosα.. Also gilt

nr2sinαcosα ≤ λ(K) ≤ nr2 sin α

cos(α)

Fur n→∞ ergibt sich

Satz 10.7

λ(K) = πr2

Dies folgt aus der Ableitung von sinx :

limn

n

πsin(

π

n) = lim

n

sin(πn)− sin(0)

πn

= sin′(0) = cos(0) = 1

Aufgabe 10.2 Sei Vn das einbeschriebene, Wn das umgeschriebene Vieleck.Dann gilt λ(Vn) ≤ λ(K) ≤ λ(Wn. Schatze den Fehler λ(K) − λ(Vn) ≤λ(Wn)− λ(Vn) ab. Berechnung von π. !

89