Statistische Methoden II SS 2007 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag 10.00 - 12.30...

Post on 05-Apr-2015

105 views 0 download

Transcript of Statistische Methoden II SS 2007 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag 10.00 - 12.30...

Statistische Methoden IISS 2007

Vorlesung: Prof. Dr. Michael SchürmannZeit: Freitag 10.00 - 12.30

(Pause: 11.30 - 11.45)Ort: Hörsaal Loefflerstraße

ÜbungenGruppe 3: Melanie Hinz Di 8.00 -

10.00Gruppe 1: Rüdiger Zeller Di 10.00 -

12.00Gruppe 6: Melanie Hinz Di 12.00 -

14.00Gruppe 4: Hermann Haase Mi 8.00 -

10.00Gruppe 5: Hermann Haase Mi 10.00 -

12.00Gruppe 2: Marcus Vollmer Mi 12.00 -

14.00

Ort: SR 222 Fleischmannstraße 6, 2. OG

Beginn der Übungen nächste Woche

Statistische Methoden IWS 2006/2007

Zur Geschichte der Statistik

I. Beschreibende Statistik

1. Grundlegende Begriffe

2. Eindimensionales Datenmaterial2.1. Der Häufigkeitsbegriff2.2. Lage- und Streuungsparameter2.3. Konzentrationsmaße (Lorenz-Kurve)

3. Mehrdimensionales Datenmaterial3.1. Korrelations- und Regressionsrechnung3.2. Indexzahlen3.3. Saisonbereinigung

II. Wahrscheinlichkeitstheorie1. Laplacesche Wahrscheinlicheitsräume

1.1. Kombinatorische Formeln1.2. Berechnung von Laplace-Wahrschein-

lichkeiten2. Allgemeine Wahrscheinlichkeitsräume

2.1. Der diskrete Fall2.2. Der stetige Fall2.3. Unabhängigkeit und bedingte

Wahrscheinlichkeit3. Zufallsvariablen

3.1. Grundbegriffe3.2. Erwartungswert und Varianz

3.3. Binomial- und Poisson-Verteilung 3.4. Die Normalverteilung und der Zentrale Grenzwertsatz

4. Markov-Ketten 4.1. Übergangsmatrizen 4.2. Grenzverhalten irreduzibler Markov-Ketten 4.3. Gewinnwahrscheinlichkeiten 4.4. Beispiel „Ruin der Spieler“ 4.5. Anwendungen

III. Induktive Statistik

1. Schätztheorie 1.1. Grundbegriffe, Stichproben 1.2. Maximum-Likelihood-Schätzer 1.3. Erwartungstreue Schätzer 1.4. Konfidenzintervalle 1.5. Spezialfall Binomial-Verteilung

2. Spezialfall Normalverteilung 2.1. Student- und Chi-Quadrat-Verteilung 2.2. Konfidenzintervalle

3. Tests 3.1. Grundbegriffe 3.2. Tests einfacher Hypothesen (Neyman-Pearson-Test) 3.3. Tests zusammengesetzter Hypothesen 3.4. Vergleich zweier unabhängiger Stichproben 3.5. Chi-Quadrat-Tests 3.6. Kolmogorov-Smirnov-Test 3.7. Einfache Varianzanalyse

Beschreibende Statistik(= Deskriptive Statistik)Beschreibung von Datenmaterial

Schließenden Statistik(= Induktive Statistik)Analyse von Datenmaterial,Hypothesen, Prognosen

1. Semester

2.Semester

Wahrscheinlich-keitstheorie

1. Semester

Die hypergeometrische Verteilung

Notation

Eine Urne enthält n Kugeln, davon N weiße und n - N schwarze.

Aus der Urne werden nacheinander m Kugelnohne Zurücklegen gezogen.

Wie groß ist die Wahrscheinlichkeit, genau k weiße Kugeln zu ziehen?

Sie beträgt gerade H(n, N, m)(k)!

Schätzung der Zahl der Fische in einem See in Mecklenburg

N Fische werden gefangen und markiert

Die Fische werden in den See zurückgegeben. Man wartet, bis die markierten Fische sich (möglichst gleichmäßig) im See verteilt haben.

Man geht erneut auf Fischzug und fäng m Fische. Von diesen seien k markiert.

Schätzung für die Gesamtzahl der Fische im See:

Statistische Struktur(diskreter Fall)

Dabei sind:

Schätzproblem

Schätzer

Ω

ΘModell

Beobachtung(Stichprobe)

Grundgesamtheit(mögliche Beobachtungen)

Schätzung

Ω

ΘModell

Beobachtung(Stichprobe)

Grundgesamtheit(mögliche Beobachtungen)

Schätzung

Eg

Berliner Taxifahrer

Ein Berliner Taxifahrer notierte imJanuar 1987 während 5 Schichten mit je 20 Fahrten, welchen Prozentsatz des Fahrpreises lt. Taxameterdie Fahrgäste als Trinkgeld gaben.

Stichprobe (diskreter Fall)

Mathematischer Rahmen

Stichprobenfunktionen (Beispiele)

StichprobenfunktionenBeispiel „Taxifahrer“

SonntagseinsätzeFeuerwacheFeuerwache

Mittlerer quadratischer Fehler

Gegeben sind:

Statistische Struktur Schätzproblem

Als mittleren quadratischen Fehler bezeichnet man die Größe

Schätzer

„Feuerwache“Angepasste Poisson-Verteilungen

Stichproben (stetiger Fall)

Mathematischer Rahmen

Statistische Struktur diskret stetig

Verwendung der Tafelfür die Normalvertreilung

Maximum-Likelihood-Schätzer(diskreter Fall)

Likelihood-Funktion

mit

oder

M-L-Schätzer

Der Parameter

ist die beste Erklärung für die Beobachtung

Schätzung der Zahl der Fische in einem See in Mecklenburg

N Fische werden gefangen und markiert

Die Fische werden in den See zurückgegeben. Man wartet, bis die markierten Fische sich (möglichst gleichmäßig) im See verteilt haben.

Man geht erneut auf Fischzug und fäng m Fische. Von diesen seien k markiert.

Schätzung für die Gesamtzahl der Fische im See:

ist M-L-Schätzer !

Likelihood-Funktion

Der Logharithmus ln x ist streng monoton wachsend

Beispiel Poisson-Verteilung

Stichprobe vom Umfang n mit Poisson-verteilter Stich-Probenvariablen (Intensität: )

M-L-Schätzer für

oder

Beispiel Bernoulli-Verteilung

Stichprobe vom Umfang n mit Bernoulli- verteilter Stichprobenvariablen(p: Wahrscheinlichkeit des Ereignisses)

M-L-Schätzer für p wieder gegeben durch:

Maximum-Likelihood-Schätzer(stetiger Fall)

Likelihood-Funktion

mit

oder

M-L-Schätzer

Der Parameter

ist die beste Erklärung für die Beobachtung

Maximum-Likelihood-Schätzer(diskreter Fall)

Likelihood-Funktion

mit

oder

M-L-Schätzer

Beispiel Bernoulli-Verteilung

Stichprobe vom Umfang n mit Bernoulli- verteilter Stichprobenvariablen(p: Wahrscheinlichkeit des Ereignisses)

M-L-Schätzer für p wieder gegeben durch:

Normalverteilte Stichprobenvariable

M-L-Schätzer Erwarungswert

Hier spielt es keine Rolle, ob die Varianz bekannt ist oder nicht. In jedem Fall gilt:

Normalverteilte Stichprobenvariable

M-L-Schätzer Varianz bekannt

Normalverteilte Stichprobenvariable

M-L-Schätzer Varianz unbekannt

Übersicht

BeispielGewicht von ÄpfelnÄpfeln

Gewicht von Äpfeln der Sorte Cox-Orange aus einem bestimmten italienischen Anbaugebiet

Erwartungstreue Schätzer

Wenn der Parameter selbst geschätzt werden soll:

Wenn ein allgemeines statistisches Problem vorliegt:

Dabei bedeutet der Index , dass der Erwartungswert bzgl. des W.maßes zum Parameter genommen wird.

Schätzung des Erwartungswertes der Stichprobenvariablen X

Statistisches Problem gegeben durch:

Erwartungstreuer Schätzer:

Schätzung der Varianz der Stichprobenvariablen X

Statistisches Problem gegeben durch:

Erwartungstreuer Schätzer:

Erwartungswert bekannt

Schätzung der Varianz der Stichprobenvariablen X

Statistisches Problem gegeben durch:

Erwartungstreuer Schätzer:

Erwartungswert unbekannt

Normalverteilte StichprobenvariableErwartungstreuer Schätzer

für den Erwarungswert

Hier spielt es wieder keine Rolle, ob die Varianz bekannt ist oder nicht. In jedem Fall gilt:

ist erwartungstreuerwartungstreu

Normalverteilte StichprobenvariableErwartungstreuer Schätzer

für die Varianz

bekannt

ist erwartungstreuerwartungstreu

Normalverteilte StichprobenvariableErwartungstreuer Schätzer

für die Varianz

unbekannt

ist erwartungstreuerwartungstreu

Kein M-L-Schätzer!!

Übersicht

erwartungstreuerwartungstreu

erwartungstreuerwartungstreu

erwartungstreuerwartungstreu

nichtnichterwartungstreuerwartungstreu