Statistische Methoden I WS 2002/2003 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag 10.00 -...

Post on 05-Apr-2015

105 views 0 download

Transcript of Statistische Methoden I WS 2002/2003 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag 10.00 -...

Statistische Methoden IWS 2002/2003

Vorlesung: Prof. Dr. Michael SchürmannZeit: Freitag 10.00 - 12.30

(Pause: 11.30 - 11.45)Ort: Hörsaal Loefflerstraße

ÜbungenGruppe 3: Andreas Matz Di 7.30 - 9.00Gruppe 1: Birte Holtfreter Di 9.15 -

10.45Gruppe 2: Birte Holtfreter Di 11.00 -

12.30Gruppe 4: Melanie Hinz Mi 7.30 -

9.00Gruppe 5: Melanie Hinz Mi 9.15 -

10.45Gruppe 6: Michael Schürmann Mi 11.00 -

12.30

Ort: PC Pool Loefflerstraße

Beginn der Übungen nächste Woche

Statistische Methoden IWS 2002/2003

Literatur

1) G. Bamberg, F. Baur: Statistik. Oldenbourg 2002 2) G. Bamberg, F. Baur: Statistik-Arbeitsbuch. Oldenbourg 2000 3) G. Gelbrich: Statistik für Anwender. Shaker 1998 4) H. Haase: Stochastik für Betriebswirte. Shaker 1998 5) R. Schlittgen: Einführung in die Statistik. Oldenbourg 2000 6) P. v. d. Lippe: Deskriptive Statistik. Oldenbourg 2002 7) P. v. d. Lippe: Induktive Statistik. Oldenbourg 1999

8) N. Henze: Stochastik für Einsteiger. Vieweg 2000 9) U. Krengel: Einführung in die Wahrscheinlichkeitstheorie und Statistik. Vieweg 2002

Statistische Methoden IWS 2002/2003

Zur Geschichte der Statistik

I. Beschreibende Statistik

1. Grundlegende Begriffe

2. Eindimensionales Datenmaterial2.1. Der Häufigkeitsbegriff2.2. Lage- und Streuungsparameter2.3. Konzentrationsmaße (Lorenz-Kurve)

3. Mehrdimensionales Datenmaterial3.1. Korrelations- und Regressionsrechnung3.2. Indexzahlen3.3. Saisonbereinigung

II. Wahrscheinlichkeitstheorie

1. Laplacesche Wahrscheinlicheitsräume1.1. Kombinatorische Formeln1.2. Berechnung von Laplace-Wahrschein-

lichkeiten

2. Allgemeine Wahrscheinlichkeitsräume2.1. Der diskrete Fall2.2. Der stetige Fall2.3. Unabhängigkeit und bedingte

Wahrscheinlichkeit

3. Zufallsvariablen3.1. Grundbegriffe3.2. Erwartungswert und Varianz

3.3. Binomial- und Poisson-Verteilung 3.4. Die Normalverteilung und der Zentrale Grenzwertsatz

Beschreibende Statistik(= Deskriptive Statistik)Beschreibung von Datenmaterial

Vorstufe zur

Schließenden Statistik(= Induktive Statistik)Analyse von Datenmaterial,Hypothesen, Prognosen

1. Semester

2. Semester

Ein Mensch, der von Statistik hört,denkt dabei nur an Mittelwert.Er glaubt nicht dran und ist dagegen,ein Beispiel soll es gleich belegen:

Ein Jäger auf der Entenjagdhat einen ersten Schuss gewagt.Der Schuss, zu hastig aus dem Rohr,lag eine gute Handbreit vor.

Der zweite Schuss mit lautem Krachlag eine gute Handbreit nach.Der Jäger spricht ganz unbeschwertvoll Glauben an den Mittelwert:Statistisch ist die Ente tot.

Doch wär‘ er klug und nähme Schrot- dies sei gesagt, ihn zu bekehren -er würde seine Chancen mehren:Der Schuss geht ab, die Ente stürzt,weil Streuung ihr das Leben kürzt.

(aus: J. Hartung, B. Elpert, K.-H. Klösener: Statistik)

Zur Geschichte der Statistik

Diese ist zunächst eine Geschichte der Wahrscheinlichkeitstheorie.

Ursprung der Wahrscheinlichkeitstheorie: Glücksspiele

Anfrage des Chevalier de Méré an den französischenMathematiker Blaise Pascal (1623 - 1662)

aus dem Jahre 1654:

Man betrachte die beiden folgenden Wetten:

1) 1 Würfel wird 4 mal geworfen. Gesetzt wird darauf, dass dabei mindenstens eine 6 auftritt

2) 2 Würfel werden gleichzeitig 24 mal geworfen. Gesetzt wird darauf, dass dabei mindestens ein 6er-Pasch (d. h. beide Würfel zeigen die 6) auftritt.

Daraufhin Korrespondenz zwischen Blaise Pascal undPierre de Fermat (1601 - 1665)über dieses Problem.

Der Chevalier hatte angefragt, ob es stimme, dass manbei der Wette 1) öfter gewinnt als bei Wette 2).Pascal und Fermat konnten diese Vermutung desChevaliers mathematisch bestätigen. (Wir führen die Rechnung nachher noch hier durch.)

Weitere Stationen der anfänglichen Entwicklung der Wahrscheinlichkeitstheorie:

Abraham de Moivre (1667 - 1754)Zentraler Grenzwertsatz in der elementaren Form:Approximation der Binomial-Verteilung durch dieNormalverteilung. The Doctrine of Chances

Thomas Bayes (1702 - 1761)„Umgekehrte“ Vorgehensweise:Welche Rückschlüsse kann man bei Kenntnis der Aus-gänge eines Spiels auf die Wahrscheinlichkeiten machen?(Bayessche Formel)

Pierre Simon Marquis de Laplace (1749 - 1827) Théorie Analytique des ProbabilitésErste Zusammenfassung des Wissesnsstandes auf demGebiet der Wahrscheinlichkeitstheorie

Jacob Bernoulli (1654- 1705)Gesetz der großen Zahlen:

Relative Häufigkeiten konvergieren gegen die Wahrscheinlichkeit des Ereignisses (Wiederholung

voneinander unabhängiger Versuche)Ars Conjectandi

Adrien Marie Legendre (1752 - 1833)Gauß (= Normal)-Verteilung, Methode der kleinsten Quadrate

Carl Friedrich Gauß (1777 - 1855)

Entwicklung der Statistik

R. A. Fisher (1890 - 1962) The Design of ExperimentsVarianzanalyseF-Verteilung (G. W. Snedecor)

Karl Pearson (1857 - 1936)Chi-Quadrat-VerteilungChi-Quadrat-Test

W. S. Gosset (1876 - 1937)(Pseudonym „Student“)Student-Verteilung (= t-Verteilung)Ersetzt die Gauß-Verteilung, wenn Varianz nicht bekannt

J. NeymanE. S. PearsonEntwicklung der Testtheorie seit Beginn des2. Weltkrieges„Neyman-Pearson-Test“

Abraham Wald (1902 - 1950) Statistical Decision FunctionsEntscheidungstheorie

Eine Menge ist eine Zusammenfassung bestimmter wohlunterschiedener Objekteunserer Anschauung oder unseres Denkens- welche Elemente der Menge genanntwerden - zu einem Ganzen.

Georg Cantor (1845 - 1918)

Charakterisierung von Merkmalen

Merkmalen

quantitative: Merkmale unterscheiden sich nach der Größequalitative: Merkmale unterscheiden sich nach der Art

Unterscheidung nach der zugrundeliegendenWerteskala

Nominal-Ordinal-metrische

Skala

Unterscheidung zwischen

qualitativenquantitativen

Nominal: keine RangordnungOrdinal: Rangordnung, aber Zwischenwerte

nicht interpretierbarmetrisch: Rangordnung (Reihenfolge), Werte

zwischen 2 Werten erlauben eine Interpretation

Unterscheidung nach

diskretenstetigen Merkmalen

diskret: Menge der Werte abzählbar(evtl. abzählbar unendlich)

stetig: Menge der Werte kontinuierlich,(z.B. reelle Zahlen oder ein Intervallreeller Zahlen)

Häufigkeiten

Gegeben ist eine Datenliste (Urliste)(hier z. B. die Klausur-Noten von 50 Studenten)

3 3 4 5 2 1 3 3 4 32 3 4 4 4 5 2 1 3 33 3 4 4 4 5 4 3 4 32 3 3 2 4 3 2 1 5 44 4 5 4 5 1 1 3 3 3

Hier die geordneten Daten

1 1 1 1 1 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 45 5 5 5 5 5

Absolute Häufigkeiten

H(1) = 5H(2) = 6H(3) = 18H(4) = 15H(5) = 6

h(1) = 0.1 h(2) = 0.12h(3) = 0.36h(4) = 0.3h(5) = 0.12

Relative Häufigkeiten

Kumulierte relativeHäufigkeiten

F(1) = 0.1F(2) = 0.22F(3) = 0.58F(4) = 0.88F(5) = 1

Fakultäten EMAUBerechnung der Winkelfür ein Kreisdiagramm

T: TheologischeRSW: Rechts- und Staatswiss.Med: MedizinischePhil: PhilosophischeMathNat: Mathematisch-Naturwiss.K: Studienkolleg, ...

h(T) = 0.011 h(RSW) = 0.22h(Med) = 0.164h(Phil) = 0.309h(MathNat) = 0.273h(K) = 0.022

3.96 Grad 79.2 Grad 59.04 Grad111.24 Grad 98.28 Grad 7.92 Grad

KreisdiagrammFakultäten EMAU

Stabdiagramm„Zähne“

Histogramm„Zähne“

Empirische Verteilungsfunktion

„Zähne“