Statistische Methoden I WS 2007/2008 Vorlesung:Prof. Dr. Michael Schürmann Zeiten: Donnerstag 13:00...

Post on 05-Apr-2015

103 views 0 download

Transcript of Statistische Methoden I WS 2007/2008 Vorlesung:Prof. Dr. Michael Schürmann Zeiten: Donnerstag 13:00...

Statistische Methoden IWS 2007/2008

Vorlesung: Prof. Dr. Michael SchürmannZeiten: Donnerstag 13:00 -14:00

Freitag 12:00 -13:15Ort: HS Makarenkostraße (Kiste)

ÜbungenGruppe 1: Hermann Haase Di 10.00 - 12.00 SR

222/201Gruppe 2: Henrike Berg Di 8.00 - 10.00 SR

222/201 Gruppe 3: Sebastian Grapenthin Mi 10.00 - 12.00 SR

222/201Gruppe 4: Sabine Storandt Mi 8.00 - 10.00 SR

222/201Gruppe 5: Hermann Haase Di 12.00 - 14.00 SR

222/201Gruppe 6: Svenja Schützhold Mo 8.00 - 10.00 SR 109Gruppe 7: Sebastian Grapenthin Di 8:00 - 10:00 SR

105/106Gruppe 9: Hermann Haase Mi 10:00 -12:00 SR

105/106

SR 222/201 Fleischmannstraße 6

SR 109SR 105/106

Domstraße 20

Beginn der Übungen nächste Woche

http://www.math-inf.uni-greifswald.de/algebra/

Statistische Methoden IWS 2007/2008

Literatur

1) G. Bamberg, F. Baur: Statistik. Oldenbourg 2) G. Bamberg, F. Baur: Statistik-Arbeitsbuch. Oldenbourg 3) L. Fahrmeir, R. Künstler, I. Pigeot, G. Tutz: Statistik. Springer 4) J. Schira: Statistische Methoden der VWL und BWL. Pearson Education 5) H. Haase: Stochastik für Betriebswirte. Shaker 6) J. Hartung: Statistik. Oldenbourg 7) R. Schlittgen: Einführung in die Statistik. Oldenbourg 8) A. Quatember: Statistik ohne Angst vor Formeln. Pearson Studium 9) H.-D. Radke: Statistik mit Excel. Markt + Technik

Statistische Methoden I WS 2007/2008

Einleitung: Wie schätzt man die Zahl der Fische in einem See?Zur Geschichte der Statistik

I. Beschreibende Statistik

1. Grundlegende Begriffe

2. Eindimensionales Datenmaterial2.1. Der Häufigkeitsbegriff2.2. Lage- und Streuungsparameter2.3. Konzentrationsmaße (Lorenz-Kurve)

3. Mehrdimensionales Datenmaterial3.1. Korrelations- und Regressionsrechnung3.2. Indexzahlen3.3. Saisonbereinigung

II. Wahrscheinlichkeitstheorie1. Laplacesche Wahrscheinlicheitsräume

1.1. Kombinatorische Formeln1.2. Berechnung von Laplace-Wahrschein-

lichkeiten2. Allgemeine Wahrscheinlichkeitsräume

2.1. Der diskrete Fall2.2. Der stetige Fall2.3. Unabhängigkeit und bedingte

Wahrscheinlichkeit3. Zufallsvariablen

3.1. Grundbegriffe3.2. Erwartungswert und Varianz

3.3. Binomial- und Poisson-Verteilung 3.4. Die Normalverteilung und der Zentrale Grenzwertsatz

4. Markov-Ketten 4.1. Übergangsmatrizen 4.2. Grenzverhalten irreduzibler Markov-Ketten 4.3. Gewinnwahrscheinlichkeiten 4.4. Beispiel „Ruin der Spieler“ 4.5. Anwendungen

III. Induktive Statistik

1. Schätztheorie 1.1. Grundbegriffe, Stichproben 1.2. Maximum-Likelihood-Schätzer 1.3. Erwartungstreue Schätzer 1.4. Konfidenzintervalle 1.5. Spezialfall Binomial-Verteilung

2. Spezialfall Normalverteilung 2.1. Student- und Chi-Quadrat-Verteilung 2.2. Konfidenzintervalle

3. Tests 3.1. Grundbegriffe 3.2. Tests einfacher Hypothesen (Neyman-Pearson-Test) 3.3. Tests zusammengesetzter Hypothesen 3.4. Vergleich zweier unabhängiger Stichproben 3.5. Chi-Quadrat-Tests 3.6. Kolmogorov-Smirnov-Test 3.7. Einfache Varianzanalyse

Beschreibende Statistik(= Deskriptive Statistik)Beschreibung von Datenmaterial

Vorstufe zur

Schließenden Statistik(= Induktive Statistik)Analyse von Datenmaterial,Hypothesen, Prognosen

1. Semester

2. Semester

Fisch-Statistik

Ein Mensch, der von Statistik hört,denkt dabei nur an Mittelwert.Er glaubt nicht dran und ist dagegen,ein Beispiel soll es gleich belegen:

Doch wär‘ er klug und nähme Schrot- dies sei gesagt, ihn zu bekehren -er würde seine Chancen mehren:Der Schuss geht ab, die Ente stürzt,weil Streuung ihr das Leben kürzt.(aus: J. Hartung, B. Elpert, K.-H. Klösener: Statistik)

Ein Jäger auf der Entenjagdhat einen ersten Schuss gewagt.Der Schuss, zu hastig aus dem Rohr,lag eine gute Handbreit vor.

Der zweite Schuss mit lautem Krachlag eine gute Handbreit nach.Der Jäger spricht ganz unbeschwertvoll Glauben an den Mittelwert:Statistisch ist die Ente tot.

Zur Geschichte der StatistikDiese ist zunächst eine Geschichte der Wahrscheinlichkeitstheorie.Ursprung der Wahrscheinlichkeitstheorie: GlücksspieleAnfrage des Chevalier de Méré an den französischen Mathematiker Blaise Pascal (1623 - 1662)

aus dem Jahre 1654.Man betrachte die beiden folgenden Wetten:1) 1 Würfel wird 4 mal geworfen. Gesetzt wird darauf, dass dabei mindenstens eine 6 auftritt.2) 2 Würfel werden gleichzeitig 24 mal geworfen. Gesetzt wird darauf, dass dabei mindestens ein 6er-Pasch (d. h. beide Würfel zeigen die 6) auftritt.

Daraufhin Korrespondenz zwischen Blaise Pascal undPierre de Fermat (1601 - 1665) über dieses Problem.

Der Chevalier hatte angefragt, ob es stimme, dass man bei der Wette 1) öfter gewinnt als bei Wette 2). Pascal und Fermat konnten diese Vermutung des Chevaliers mathematisch bestätigen. (Wir führen die Rechnung nachher noch hier durch.)

Weitere Stationen der anfänglichen Entwicklung der Wahrscheinlich-keitstheorie:

Abraham de Moivre (1667 - 1754)Zentraler Grenzwertsatz in der elementaren Form:Approximation der Binomial-Verteilung durch die Normalverteilung. The Doctrine of Chances

Thomas Bayes (1702 - 1761)„Umgekehrte“ Vorgehensweise:Welche Rückschlüsse kann man bei Kenntnis der Ausgänge eines Spiels auf die Wahrscheinlichkeiten machen?(Bayessche Formel)

Pierre Simon Marquis de Laplace (1749 - 1827) Théorie Analytique des ProbabilitésErste Zusammenfassung des Wissensstandes auf dem Gebiet der Wahrscheinlichkeitstheorie

Jacob Bernoulli (1654- 1705)Gesetz der großen Zahlen:Relative Häufigkeiten konvergieren gegen die Wahrscheinlichkeit des Ereignisses (Wiederholung voneinander unabhängiger Versuche) Ars Conjectandi

Adrien Marie Legendre (1752 - 1833)Gauß (= Normal)-Verteilung Methode der kleinsten Quadrate

Carl Friedrich Gauß (1777 - 1855)

Entwicklung der Statistik

R. A. Fisher (1890 - 1962) The Design of ExperimentsVarianzanalyseF-Verteilung (G. W. Snedecor)

Karl Pearson (1857 - 1936)Chi-Quadrat-VerteilungChi-Quadrat-Test

W. S. Gosset (1876 - 1937) (Pseudonym „Student“)Student-Verteilung (= t-Verteilung)Ersetzt die Gauß-Verteilung, wenn Varianz nicht bekannt.

J. NeymanE. S. PearsonEntwicklung der Testtheorie seit Beginn des 2.Weltkrieges„Neyman-Pearson-Test“

Abraham Wald (1902 - 1950) Statistical Decision FunctionsEntscheidungstheorie

Eine Menge ist eine Zusammenfassung bestimmter wohl unterschiedener Objekte unserer Anschauung oder unseres Denkens- welche Elemente der Menge genannt werden -zu einem Ganzen.Georg Cantor (1845 - 1918)

Charakterisierung von Merkmalen

Merkmalen

quantitative: Merkmale unterscheiden sich nach der Größequalitative: Merkmale unterscheiden sich nach der Art

Unterscheidung nach der zugrundeliegenden Werteskala

Nominal-Ordinal-metrische

Skala

Unterscheidung zwischen

qualitativenquantitativen

Nominal: keine RangordnungOrdinal: Rangordnung, aber Zwischenwerte nicht interpretierbarmetrisch: Rangordnung (Reihenfolge), Werte zwischen 2 Werten erlauben eine Interpretation

Unterscheidung nach

Merkmalen

diskret: Menge der Werte abzählbar (evtl. abzählbar unendlich)stetig: Menge der Werte kontinuierlich

(z.B. reelle Zahlen oder ein Intervall reeller Zahlen)

diskretenstetigen

HäufigkeitenGegeben ist eine Datenliste (Urliste)(hier z. B. die Klausur-Noten von 50 Studenten) 3 3 4 5 2 1 3 3 4 3

2 3 4 4 4 5 2 1 3 33 3 4 4 4 5 4 3 4 32 3 3 2 4 3 2 1 5 44 4 5 4 5 1 1 3 3 3

Geordnete Daten

1 1 1 1 1 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 45 5 5 5 5 5

Absolute Häufigkeiten

H(1) = 5H(2) = 6H(3) = 18H(4) = 15H(5) = 6h(1) = 0.1 h(2) = 0.12h(3) = 0.36h(4) = 0.3h(5) = 0.12

Relative Häufigkeiten

Kumulierte relativeHäufigkeiten

F(1) = 0.1F(2) = 0.22F(3) = 0.58F(4) = 0.88F(5) = 1

Fakultäten EMAUBerechnung der Winkel für ein Kreisdiagramm

T: TheologischeRSW: Rechts- und Staatswiss.Med: MedizinischePhil: PhilosophischeMathNat: Mathematisch-NaturwissenschaftlicheK: Studienkolleg, ...

h(T) = 0.011 h(RSW) = 0.22h(Med) = 0.164h(Phil) = 0.309h(MathNat) = 0.273h(K) = 0.022

3.96 Grad 79.2 Grad 59.04 Grad111.24 Grad 98.28 Grad 7.92 Grad

WS 00/01„alte“ Zahlen

KreisdiagrammFakultäten EMAU

Fakultät WS 98/99 99/00 00/01 01/02 02/03 03/04 04/05 05/06

Philosophische Fakultät

1 707 1 985 2 200 2 393 2 800 3 299 4 006 4 173

Math.-Nat. Fakultät

1 667 1 890 1 955 2 021 2 169 2 493 2 753 2 859

Rechts- u. Staatsw. Fak

1 460 1 513 1 569 1 610 1 723 1 942 1 992 1 911

Medizinische Fakultät

1 138 1 157 1 147 1 239 1 252 1 320 1 415 1 528

Theologische Fakultät

87 81 82 85 86 88 113 145

Kolleg, DSH Kurs

187 164 158 190 183 153 141 140

Gesamt 6 246 6 790 7 111 7 538 8 213 9 295 10 420 10 756

h(T) = 0.011 h(RSW) = 0.22h(Med) = 0.164h(Phil) = 0.309h(MathNat) = 0.273h(K) = 0.022

3.96 Grad 79.2 Grad 59.04 Grad111.24 Grad 98.28 Grad 7.92 Grad

WS 05/06

Stabdiagramm„Zähne“

Histogramm„Zähne“

Empirische Verteilungsfunktion

„Zähne“