Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression,...

56
Stochastik mit dem GTR

Transcript of Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression,...

Page 1: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Stochastik mit dem GTR

Page 2: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

• Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation)

• Simulationen – Modellbildung

• Wahrscheinlichkeitsberechnungen

• Verteilungen und deren Maßzahlen: Binomial- und Normalverteilung, Approximation

• Beurteilende Statistik: Testen von Hypothesen, Fehler 1. und 2. Art

• MARKOFF-Ketten

Elemente der Stochastik

Page 3: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Mathematik-Menü

Page 4: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Menü zur Listenbearbeitung

Page 5: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Statistik-Menü

Page 6: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Befehle Bedingungen

rand

rand(3) rand(10)>0.5

randInt(1,6)

randInt(1,6,300) randInt(1,6,300) = 1

Simulation mit Pseudozufallszahlen

Vorstellungen von Zufall entwickeln

Page 7: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Einen 100fachen Münzwurf simulieren ...

Simulation mit Pseudozufallszahlen

Page 8: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

... und die Entwicklung der relativen Häufigkeiten darstellen ...

Simulation mit Pseudozufallszahlen

Page 9: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Das 300fache Würfeln simulieren ...

Simulation mit Pseudozufallszahlen

Page 10: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

... und die Entwicklung der relativen Häufigkeiten darstellen ...

Simulation mit Pseudozufallszahlen

Page 11: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

die Bestimmung der absoluten Häufigkeiten

automatisieren ...

Simulation mit Pseudozufallszahlen

Page 12: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Simulation zum 1/e - Gesetz

20faches Werfen eines Ikosaeders

2, 4, 6, 10, 12, 13, 14, 17 fehlen,

also 8 von 20 (40%)

P(bestimmte Augenzahl tritt nicht auf)

1/e 37%

Simulation mit Pseudozufallszahlen

Page 13: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Simulation zum 1/e - Gesetz

Zufallsregen auf 5x5 -Quadratgitter

P(ein Feld bleibt leer) 1/e 37%

Simulation mit Pseudozufallszahlen

Page 14: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Ziehen mit und ohne Zurücklegen

Mit welcher Wahrscheinlichkeit sind die erzeugten Lottozahlen brauchbar?

Simulation mit Pseudozufallszahlen

Page 15: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Wahrscheinlichkeit für lauter verschiedene Glückszahlen

Geburtstagsproblem (Lottoziehung mit Zurücklegen)

Page 16: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Wahrscheinlichkeit für lauter verschiedene Geburtstage

Geburtstagsproblem

Page 17: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Faustregel: Hat der Zufallsversuch n mögliche Ergebnisse, dann benötigt man ca. 1,2*n Versuchsdurchführungen, damit die Wahrscheinlichkeit für mind. zwei gleiche Ergebnisse über 50% ist.

Modellierung von Zufallsversuchen vom Typ „Geburtstagsproblem“

Page 18: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Menü der Wahrscheinlichkeitsverteilungen

Page 19: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Wahrscheinlichkeit für einen Lottogewinn

Hypergeometrische Verteilung

Page 20: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Am ersten Schultag werden 206 neue Schülerinnen und Schüler eingeschult.

Wie groß ist Wahrscheinlichkeit, dass hierunter (k)ein Geburtstagskind ist (oder vielleicht sogar mehr als eins)?

Binomialverteilung

Page 21: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Binomialverteilung - Histogramme

Page 22: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Bedienungsfehler

Binomialverteilung

Page 23: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Große Stichprobenumfänge

Binomialverteilung

Page 24: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Simulation einer Binomialverteilung

Binomialverteilung - Simulation

Page 25: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Erwartungswert einer Binomialverteilung

Binomialverteilung - Erwartungswert

Page 26: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Kumulierte Binomialverteilung

Kumulierte Binomialverteilung

Page 27: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Viele Menschen leiden unter Bluthochdruck. Die Heilungswahrscheinlichkeit eines bestimmten Medikaments beträgt p = 0,8.

Mit welcher Wahrscheinlichkeit werden von 72 Patienten

- weniger als 50 geheilt?

- mehr als 60 geheilt?

Kumulierte Binomialverteilung

Page 28: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Graphen der Größe des Displays anpassen

Binomialverteilung – Streuung um den Erwartungswert

Page 29: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Graphen der Größe des Displays anpassen

Binomialverteilung – Streuung um den Erwartungswert

Page 30: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Graphen der Größe des Displays anpassen

Wir beobachten: Mit wachsendem Stichprobenumfang n

nimmt die Breite der „Glocken“ mit dem Faktor n zu und die Höhe mit dem Faktor 1/n ab.

Binomialverteilung – Streuung um den Erwartungswert

n Breite Höhe

50 20 0,113

100 30 0,080

200 42 0,057

300 52 0,047

400 62 0,040

Page 31: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Man kann zeigen: Bei festem n ist die Breite der „Glocken“

proportional zu p(1-p).

Bei BERNOULLI-Versuchen konzentrieren sich die Ergebnisse auf eine Umgebung um den Erwartungswert = n p mit einem Radius von ungefähr 3 np(1-p).

np(1-p) ist gleich der Varianz der Zufallsgröße.

Binomialverteilung

Page 32: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Varianz – Nachweis der Formel np(1-p)

n = 50 ; p = 0,4 n = 100 ; p = 0,2 n = 200 ; p = 0,3

Binomialverteilung - Varianz

Page 33: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

n = 200 ;

p = 0,3

Binomialverteilung - Normalverteilung

Page 34: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

P(1-Umgebung) 0.68 P(2-Umgebung) 0.955

Binomialverteilung – sigma-Regeln

Page 35: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Bestimmung der Wahrscheinlichkeiten von Umgebungen von

Binomialverteilung – sigma-Regeln

Page 36: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

P(1-Umgebung) 0.68 P(2-Umgebung) 0.955

Binomialverteilung – sigma-Regeln

Page 37: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Binomialverteilung – Approximation durch GAUSSsche Dichtefunktion

Page 38: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Binomialverteilung – Approximation durch GAUSSsche Dichtefunktion

Page 39: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Binomialverteilung – Approximation durch GAUSSsche Dichtefunktion

Page 40: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Bei dominanter Vererbung haben in der zweiten Tochtergeneration 75% der Nachkommen die erste Ausprägung und 25% die andere.

Ist bei einem vorliegenden Kreuzungsversuch mit n = 120 die MENDELsche Regel anwendbar?

95%-Umgebung um den Erwartungswert: = 120 0,75 = 90 ; = (1200,750,25) = 4,74

Entscheidungsregel: Verwirf die Hypothese p = 0,75 , falls X < 81 oder falls X > 99

Binomialtest Entscheidungsregel

Page 41: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Bei dominanter Vererbung haben in der zweiten Tochtergeneration 75% der Nachkommen die erste Ausprägung und 25% die andere.

Ist bei einem vorliegenden Kreuzungsversuch mit n = 120 die MENDELsche Regel anwendbar?

Binomialtest Entscheidungsregel

Page 42: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

95%-Umgebung um den Erwartungswert: = 120 0,75 = 90 ; = (1200,750,25) = 4,74

Entscheidungsregel: Verwirf die Hypothese p = 0,75 , falls X < 81 oder falls X > 99

Binomialtest Entscheidungsregel

Page 43: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Angenommen, die zugrunde liegende Wahrscheinlichkeit ist tatsächlich p = 0,7.

Mit welcher Wahrscheinlichkeit wird nicht erkannt, dass hier nicht die MENDELsche Regel zugrunde liegt?

P(Fehler 2. Art) = 0,759

Binomialtest Fehler 2. Art

Page 44: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Binomialtest Operationscharakteristik

Page 45: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

In einer Stichprobe unter 1000 Frauen im Alter zwischen 18 und 20 Jahren fand man die o. a. Verteilung für die Körpergröße.

NormalverteilungBestimmung von Mittelwert und Stichprobenstreuung

Page 46: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Lässt sich die empirische

Verteilung durch eine

Normalverteilung

beschreiben?

NormalverteilungApproximation durch Normalverteilung

Page 47: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Mit welcher Wahrscheinlichkeit ist die Körpergröße mindestens 1,60 m und höchstens 1,70 m?

gesuchte Wahrscheinlichkeit: 56, 3 %

NormalverteilungBerechnung von Wahrscheinlichkeiten

Page 48: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Von 100 neugeborenen Mädchen wurde das Körpergewicht bestimmt. Weisen die Daten darauf hin, dass das Körpergewicht von Neugeborenen normalverteilt ist?

NormalverteilungÜberprüfung auf Normalverteilung

Page 49: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

ohne / mit Diagnose

NormalverteilungÜberprüfung auf Normalverteilung

Page 50: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Ausgehend von den Wählerwanderungen zwischen vorletzter und letzter Bundestagswahl gaben wir eine Prognose für den 18. September 2005 ab . . .

SPD / Grüne ?

CDU/CSU/FDP ?

Sonstige Parteien ?

Die ultimative Wahlprognose

Page 51: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Wählerwanderungen 1998 2002

1998 2002

SPD / Grüne

CDU/CSU / FDP

andere Nichtw. / Erstw.

gesamt

SPD / Grüne 72,7% 7,0% 19,0% 19,3%

34,7%

CDU/CSU / FDP 12,0% 76,5% 13,8% 17,9%

33,8%

andere2,3% 1,3% 37,4% 3,2%

5,2%

Nichtw. / gest. 12,9% 15,2% 29,8% 59,6%

26,3%

gesamt 100% 100% 100% 100% 100%

Page 52: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

33,66% / 73,16% = 46,0%

35,45% / 73,16% = 48,5%

Übergangsmatrix Startvektor Produkt

Übergangsmatrix

Page 53: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Ausgehend von den Wählerwanderungen zwischen vorletzter und letzter Bundestagswahl ergab sich folgende Prognose:

SPD / Grüne 46,0%

CDU/CSU/FDP 48,5%

Sonstige Parteien 5,5%

Die ultimative Wahlprognose

Page 54: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Niederlassung eines Autovermieters: A, B, C

80% der Fahrzeuge, die am Morgen in A stehen, stehen am Abend wieder in, je 10% sind von A nach B bzw. C gewechselt.

Nach B kehren 60% der ausgeliehenen Fahrzeuge wieder zurück; je 20% wechseln nach A oder nach C.

Von Niederlassung C aus wechseln erfahrungsgemäß 20% nach A und 10% nach B.

Wie viele Fahrzeuge befinden sich an den drei Niederlassungen nach 1, 2, ..., 10, ...20 Tagen, wenn am Anfang je ein Drittel an jeder der drei Niederlassungen vorhanden war?

Gibt es eine optimale Aufteilung der Fahrzeug-Bestände?

Matrixpotenzen

Page 55: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

Matrixpotenzen

Page 56: Stochastik mit dem GTR. Beschreibende Statistik (Kennzahlen von Datenmengen, Regression, Korrelation) Simulationen – Modellbildung Wahrscheinlichkeitsberechnungen.

„Elemente der Mathematik – Gesamtband

Mathematik mit neuen Technologien“

Schroedel 83990

Das Stochastik-Kapitel wurde von mir verfasst und enthält die im Vortrag beschriebenen Einsatzmöglichkeiten des GTR.

Heinz Klaus Strick

Rückmeldungen erwünscht: [email protected]

Literaturhinweis