Download - Methodenlehre II, SS 2009 - Ruhr-Universität Bochum fileMethodenlehre II, SS 2009 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schlieˇenden Statistik am Beispiel des t-Tests

Transcript

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Methodenlehre II, SS 2009

Prof. Dr. Holger Dette

Ruhr-Universitat Bochum

13. Juli 2009

1 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Methodenlehre II

I Prof. Dr. Holger Dette

I NA 3/73

I Telefon: 0234 322 8284

I Email: [email protected]

I Internet:www.ruhr-uni-bochum.de/mathematik3/index.html

I Vorlesung: Montag, 8.15 - 9.45 Uhr

I Thema: Das allgemeine lineare Modell und seine Anwendungen inder Psychologie

2 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Statistik-Team

I Ubung: Dienstag, 12.15 - 13.00 Uhr, HGA 10 (ab nachste Woche)Tobias Kley: [email protected]

I Tutorium (SPSS - (ab nachste Woche)

Hans-Georg Sonnenberg: [email protected]

Mo: 10-12 GA 1/128: Jens [email protected]: 10-12 GAFO 04/615: Linda [email protected]: 12-14 GAFO 04/615: Laura Bringmann, Linda EngelbrechtMo: 12-14 GA 1/128: Jens KreitewolfDo 14-16 GAFO 04/615:: Laura [email protected]

3 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Das allgemeine lineare Modell:

“ Ein mathematisches Modell - viele statistischeVerfahren”

Inhaltsverzeichnis

1. Grundlegende Prinzipien der schließenden Statistik am Beispieldes t-Tests

2. Das lineare Regressionsmodell, multiple Regression undKorrelation

3. Das “allgemeine” lineare Modell

4. Kovarianzanalyse

4 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Literaturverzeichnis

A. Aron, E.N. Aron, E.J. Coups, Statistics for Psychology, 5thEdition, Pearson Prentice Hall

J. Bortz, Statistik, 6. Auflage, Springer

M. Rudolf, J. Muller, Multivariate Verfahren, Hogrefe

P. Zofel, Statistik fur Psychologen, Pearson Studium

5 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

1. Grundlegende Prinzipien der schließendenStatistik (Wiederholung) am Beispiel des

t-Tests

1.1 Schatzer und Konfidenzintervalle

1.2 t-Test fur eine Stichprobe

1.3 Zweistichprobenprobleme

1.4 Einfaktorielle Varianzanalyse

6 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

1.1 Schatzer und Konfidenzintervalle

7 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Beispiel 1.1 (Intelligenzquotient)

Fragestellung: Haben (15-jahrige) Kinder aus Bochum einen hoherenIntelligenzquotienten als 100?

I 10 Kinder (zufallig ausgewahlt) machen einen IQ-TestDaten: y1, . . . , y10 Stichprobe

i 1 2 3 4 5yi 104 98 106 99 110

i 6 7 8 9 10yi 107 100 97 108 112

I Hypothese (IQ der Kinder ist niedriger als 100):

H0 : µ ≤ 100

Alternative (IQ ist hoher als 100):

H1 : µ > 100

Dabei ist µ der (unbekannte) Erwartungswert der Gesamtpo-pulation der (15-jahrigen) Kinder aus Bochum

8 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Prinzip der schließenden Statistik:

Auf Grund der Stichprobe y1, . . . , y10 sollen Aussagen uber dasMerkmal der Grundgesamtheit getroffen werden. Zum Beispiel

(a) Wie groß ist µ (Schatzung)?

(b) Kann man ein Intervall bestimmen, in dem µ liegt(Konfidenzintervall)?

oder giltH1 : µ > 100 (IQ ist hoher)?

(statistischer Test)

9 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Grundlegende Schwierigkeit:

I µ ist der Erwartungswert der Population der 15-jahrigen Kinder

I Auf Basis der Stichprobe soll auf Grundgesamtheit geschlossenwerden−→ Fehler, Unsicherheiten sind moglich!

I Beispiel: “zufallig” wahlen wir 5 hochbegabte Kinder (IQ ≥ 130)fur die Stichprobe aus. Vermutlich wird dadurch µ uberschatzt!

I Ziel der schließenden Statistik: Quantifizierung derUnsicherheit, z.B.– mit welcher Wahrscheinlichkeit macht ein statistischer Testeinen Fehler, falls (aufgrund von Daten) fur H1 (IQ ist hoher als100) entschieden wird obwohl in Wirklichkeit H0 gilt?

I Notwendig fur diese Quantifizierung: Mathematische Modell-annahmen

10 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Zusatzliche Modellannahme: Normalverteilung

I Allgemein gangige Annahme: IQ in einer bestimmten Alters-gruppe der Bevolkerung ist normalverteilt

ϕ(x) =1√

2πσ2exp

(−1

x − µσ

)µ : Erwartungswert

σ2 : Varianz

I Deutung: Ist Y der IQ eines zufallig aus der Populationausgewahlten Individuums, so gilt

P(a ≤ Y ≤ b) =

∫ b

ϕ(x)dx

I Diese Modellannahme sollte man stets rechtfertigen (wie man dasmachen kann, sehen wir spater)

11 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Interpretation der Wahrscheinlichkeiten:

a b

I Die Wahrscheinlichkeit, dass eine Beobachtung zwischen denWerten a und b liegt, entspricht der Flache unter der Kurve imIntervall [a, b].

I In Formeln:

P(a ≤ Y ≤ b) =

∫ b

ϕ(x)dx

12 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Verschiedene Normalverteilungen N(µ, σ2)

Dichten der Normalverteilung mit verschiedenen Parametern

-4 -2 0 2 4 6

0.0

0.1

0.2

0.3

0.4

0.5

N(0,0.707)N(0,1)N(1,1.25)N(2,2)

I µ: Erwartungswert

I σ2: Varianz

I Beachte: unter jeder Kurve ist die Flache genau 1

13 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Motivation der Modellannahme der Normal-verteilung:

14 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Zusatzliche Modellannahme: Normalverteilung:I Mathematisches Modell (hier n = 10): y1, . . . , yn sind

Realisierungen von Zufallsvariablen

Yi = µ+ εi i = 1, . . . ,m

– yi : IQ-Messung fur i-tes Kind (Realisation der ZufallsvariablenYi )

– µ: (unbekannter) Erwartungswert der Population(hier der 15-jahrigen Kinder aus Bochum)

– ε1, . . . , εn: unabhangige Zufallsvariable, normalverteilt mitErwartungswert 0 und Varianz σ2. Interpretation: Meßfehler,genetische Variabilitat, Tagesform ...

I Mathematische Statistik z.B. Maximum Likelihood (in diesem Bei-spiel auch der gesunde Menschenverstand) liefert Schatzer fur µ:

µ = y · =1

n∑i=1

yi = 104.1

I Wie genau ist diese Schatzung? Wie sehr streut diese Schatzung?

15 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Zusatzliche Modellannahme: Normalverteilung:I Maß fur die Genauigkeit: Varianz (je kleiner die Varianz, desto

”genauer” die Schatzung)

I Mathematische Statistik (Methodenlehre I): die Varianz desSchatzers µ ist:

Var(µ) = s2 =σ2

nI Beachte:

(a) Je großer der Stichprobenumfang n, desto kleiner die Varianz vonµ. D.h. desto genauer ist die Schatzung.

(b) Fur die Beurteilung der Genauigkeit muss man die Varianz σ2 derPopulation kennen.

I Mathematische Statistik: Schatzung fur den Parameter σ2

σ2 =1

n − 1

n∑i=1

(yi − y ·)2 = 28.32

s2 =σ2

n= 2.832

16 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Zusatzliche Modellannahme: Normalverteilung:

I Oft wird der Schatzer zusammen mit dem Standardfehlerangegeben

µ = 104.1

µ+ s = 105.78

µ− s = 102.42

I s = σ√n

=√

σ2

n = 1.683 ist der Standardfehler des Schatzers µ

I σ = 5.322 ist die aus den Daten geschatzte Standardabweich-ung

I Deutung: Vor der Datenerhebung ist m zufallig. Falls die Nor-malverteilungsannahme korrekt ist, ist auch µ normalverteilt mit:

- Erwartungswert µ- Varianz σ2/n

17 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

40 60 80 100 120 140 160

0.00

0.02

0.04

0.06

0.08

0.10

0.12

0.14

Dic

hte

40 60 80 100 120 140 160

0.00

0.02

0.04

0.06

0.08

0.10

0.12

0.14

40 60 80 100 120 140 160

0.00

0.02

0.04

0.06

0.08

0.10

0.12

0.14

Verschiedene Normalverteilungen

Y1 ~ N (104.1, 28.32)

((Y1 ++ Y2)) 2 ~ N (104.1, 28.32/2)

((∑∑i==1

10Yi)) 10 ~ N (104.1, 2.832)

40 60 80 100 120 140 160

0.00

0.02

0.04

0.06

0.08

0.10

0.12

0.14

Dic

hte

40 60 80 100 120 140 160

0.00

0.02

0.04

0.06

0.08

0.10

0.12

0.14

18 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

1.2 Schatzverfahren (Erwartungswert einer Populationunter Normalverteilungsnahme)

I Daten y1, . . . , yn (Stichprobe) mit Erwartungswert µ

I Rechtfertigung der Unabhangigkeits- und Normalver-teilungsannahme

I µ = 1n

n∑i=1

yi Schatzung fur den Erwartungswert µ der

Population

I σ2 = 1n−1

n∑i=1

(yi − y ·)2 Schatzung fur die Varianz der

Population (σ Standardabweichung)

I s2 = σ2

n Schatzung fur die Varianz von µ

I Schatzung fur den Standardfehler von µ: s =√

σ2

n = σ√n

19 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

SPSS-Output: die Schatzer fur die Daten ausBeispiel 1.1 (Intelligenzquotient)

Statistik StandardfehlerStatistik Statistik Statistik

VarianzStandardabweichungMittelwertN

Intelligenzquotient

Gültige Werte (Listenweise) 10

28,3225,3221,683104,1010

Deskriptive Statistik

µ = 104.1 (Mittelwert)

s = 1.683 (Standardfehler)

σ2 = 28.322 (empirischeVarianz)

σ = 5.322 (Standardabweichung)

20 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Beachte:I

µ =1

n∑i=1

yi ; σ2 =1

n − 1

n∑i=1

(yi − y ·)2; s =

√σ2

hangen von den Daten y1, . . . , yn ab (sind also vor Datener-hebung zufallig)

I (µ− a s, µ+ a s

)ist (vor der Datenerhebung) ein zufalliges Intervall, das miteiner bestimmten Wahrscheinlichkeit den Erwartungswert µenthalt

a −→ 0 =⇒ Wahrscheinlichkeit ≈ 0a −→∞ =⇒ Wahrscheinlichkeit ≈ 1

I Gesucht: zufalliges Intervall, das den unbekannten Erwart-ungswert mit einer vorgegebenen Wahrscheinlichkeit enthalt:Konfidenzintervall

21 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Das Konfidenzintervall

I Gebe eine Wahrscheinlichkeit 1− α vor (z.B. 1 - α = 95%)

I Bestimme a so, dass das zufallige Intervall

(µ− a s, µ+ a s)

den Parameter µ mit Wahrscheinlichkeit 1− α enthalt.

I Mathematische Statistik liefert

a = tn−1,1−α/2

(1− α/2)-Quantil der t-Verteilung mit n − 1 Freiheitsgraden

I Diese Werte sind tabelliert oder durch Software verfugbar.

I Das Intervall

I =(µ− tn−1,1−α/2 s, µ+ tn−1,1−α/2 s

)heißt (1− α) Konfidenzintervall fur µ.

22 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Verschiedene t-Verteilungen

t Vert.pdf

-4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

t t t

Dichten der t– Verteilung mit verschiedenen Freiheitsgraden

100

Dichten der t– Verteilung mit verschiedenen Freiheitsgraden

fn(t) =1√πn

Γ((n + 1)/2)

Γ(n/2)

(1 +

)−(n+1)/2

23 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Das Quantil der t-Verteilung mit n Freiheits-graden

mit 095.pdf

-4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

Dichte der t4 -Verteilung

t 4, 0.95 = 2.132

0.95

P(T4 ≤ t4,0.95) =

∫ t4,0.95

−∞f4(t)dt = 0.95

24 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Beispiel 1.3 (Fortsetzung von Beispiel 1.1)

(1) Berechnung eines 90% Konfidenzintervalls fur µ

I n = 10, µ = 104.1, σ2 = 28.32

I α = 10%

I (aus Tabelle bzw. Software) t9,0.95 = 1.833

I 90% Konfidenzintervall fur µ = (101.02, 107.18)

(2) Beachte:

I Ein (1− α)-Konfidenzintervall ist ein “zufalliges” Intervall, dasden (unbekannten) Erwartungswert mit Wahrscheinlichkeit 1− αenthalt.

I Die Aussage: “das Intervall (101.02, 107.18) enthalt den unbe-kannten Erwartungswert der Population mit Wahrscheinlichkeit90%”, macht keinen Sinn!

25 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Erklarung des Begriffs “zufalliges” Intervall durchein “fiktives” Experiment

I Annahme: das Experiment (Untersuchung des IQ von 10 Kindern)kann N mal (unabhangig) wiederholt werden (z.B. 1000 mal)

I jeweils 10 Daten liefern ein (1− α)-Konfidenzintervall(z.B. 95 % Konfidenzintervall)Datensatz 1 −→ Konfidenzintervall I1Datensatz 2 −→ Konfidenzintervall I2

...Datensatz N −→ Konfidenzintervall IN

I c.a. (1− α) N (z.B. 95% 1000 = 950) Intervalle enthalten den(unbekannten) Erwartungswert µ der Population

26 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

1.4 Konfidenzbereich fur den Erwartungswert einer Po-pulation unter Normalverteilungsannahme

I Daten y1, . . . , yn (Stichprobe) mit Erwartungswert µ

I Rechtfertigung der Unabhangigkeits- und Normalverteil-ungsannahme

I Bestimme das tn−1,1−α/2 Quantil der t-Verteilung mit n− 1Freiheitsgraden (aus Tabelle oder Software)

I Das Intervall

(µ− tn−1,1−α/2s, µ+ tn−1,1−α/2s)

ist ein (1− α) Konfidenzintervall fur µ

I In vielen Softwarepaketen erhalt man direkt das Konfi-denzintervall als Ausgabe (z.B. in SPSS)

27 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

SPSS-Output: Konfidenzintervall fur die Datenaus Beispiel 1.1 (Intelligenzquotient)

MittlereDifferenzSig. (2-seitig)dfT ObereUntere

90% Konfidenzintervall der Differenz

Testwert = 100

Intelligenzquotient 7,181,024,100,03892,436

Test bei einer Sichprobe

Beachte:

I SPSS liefert nur ein Konfidenzintervall fur die Differenz µ− 100

=⇒ 90% Konfidentintervall fur den Erwartungswert µ

(101.02, 107.18)

28 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

1.2 t-Test fur eine Stichprobe

29 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Beispiel 1.5 (Fortsetzung von Beispiel 1.1)

Frage: Ist der IQ der Kinder aus Bochum hoher als 100?

H0 : µ ≤ 100 H1 : µ > 100

H0 nennt man Nullhypothese and H1 heißt Alternative.

I Intuitiv wurde man fur H1 entscheiden, falls der Mittelwert derStichprobe

µ =1

10∑i=1

“groß” ist

I Beachte: µ andert sich, falls man die Daten anders skaliert!

I Besser: entscheide fur H1, falls µ groß im Verhaltnis zu demStandardfehler s ist (Invarianz bzgl. unterschiedlichenSkalierungen)

30 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Die Nullhypothese H0 : µ ≤ 100 wird abgelehnt falls

T =µ− 100

s> c

Fragen:

I Wie legt man den kritischen Wert c fest?

I Bei dem Verfahren konnen 2 Fehler auftreten

– Fehler erster Art: die Nullhypothese H0 wird abgelehnt, obwohlH0 in Wirklichkeit stimmt (d.h. der IQ ist nicht hoher als 100)

– Fehler zweiter Art: die Nullhypothese H0 wird nicht abgelehnt,obwohl in Wirklichkeit die Alternative H1 zutrifft (d.h. der IQ isthoher als 100)

Ziel: “kleine” Wahrscheinlichkeiten fur Fehler erster und zweiter Art

31 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Grundlegendes Prinzip der TesttheorieI Der kritische Wert c wird festgelegt, in dem man eine maximal

tolerierbare Wahrscheinlichkeit α fur einen Fehler erster Artvorgibt (α-Fehler)!

I Diese Wahrscheinlichkeit heißt Niveau des Tests

I Damit hat man keine Kontrolle uber die Wahrscheinlichkeit einesFehlers zweiter Art (β-Fehler)

I Z.B. Wahrscheinlichkeit fur Fehler erster Art soll maximalα = 5% = 0.05 sein

=⇒ (mathematische Statistik, Tabelle, Software)

n = 10, c = tn−1,1−α = t9,0.95 = 1.833

T =µ− 100

104.1− 100√2.832

= 2.436 > 1.833

D.h. die Nullhypothese H0 : µ ≤ 100 wird zum Niveau α = 5% zuGunsten der Alternative H1 : µ > 100 verworfen (signifikantesErgebnis zum Niveau 5 %)

32 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Erklarung des Begriffs Niveau durch ein“fiktives” Experiment

I Annahme: das Experiment (Untersuchung des IQ von 10 Kindern)kann N mal (unabhangig) wiederholt werden (z.B. 1000 mal)

I jeweils 10 Daten liefern ein Ergebnis fur den Test zum Niveau α(z.B. Niveau 5 %)Datensatz 1 −→ Testergebnis 1Datensatz 2 −→ Testergebnis 2

...Datensatz N −→ Testergebnis N

I Falls die Nullhypothese H0 : µ ≤ 100 ”wahr” ist, so wird maximalin ca. αN (z.B. 5% 1000 = 50) Fallen fur die Alternative

H1 : µ > 100

entschieden

33 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Fehler erster und zweiter Art

in der Population giltH0 H1

Entscheidung auf- richtige β-Fehlergrund der Stich- H0 Enscheidungprobe zugunsten richtigevon: H1 α-Fehler Entscheidung

Beachte:

I Die Wahrscheinlichkeiten fur α-Fehler und β-Fehler verandernsich gegenlaufig

I Bei festem Niveau (Wahrscheinlichkeit fur α-Fehler) kann dieWahrscheinlichkeit fur einen β-Fehler durch Vergroßerung desStichprobenumfangs verkleinert werden

I Bei festem Stichprobenunfang wird ”nur” der Fehler erster Artkontolliert

34 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Die Verteilung von T falls µ = 100 ist.

-3 -2 -1 0 1 2 3

0.0

0.1

0.2

0.3

0.4

Dichte der t9 -Verteilung

α = 5 %

p– Wert

t 9, 0.95 = 1.833 T n = 2.436

I Kritischer Wert: tn−1,0.95 = 1.833 (H0 wird verworfen, falls Tgroßer als der kritische Wert ist)

I Blaue Flache: Niveau (α)I Rote Flache: p-Wert: Wahrscheinlichkeit einen Wert großer als

2.436 zu beobachten: P(T > 2.436) = 0.0188I Beachte: Ist der p-Wert < α (wie in diesem Beispiel) dann wird

H0 abgelehnt (signifikantes Ergebnis)35 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Testverfahren fur den Erwartungswert einerStichprobe unter Normalverteilungsannahme

1.6. Einstichproben t-Test fur rechtsseitige Hypothesen

I Hypothesen: H0 : µ ≤ µ0 ; H1 : µ > µ0 (rechtsseitigeHypothese)

I Daten y1, . . . , yn (Stichprobe) mit Erwartungswert µ

I Rechtfertigung der Unabhangigkeits- und Normalverteil-ungsannahme

I H0 wird zum Niveau α verworfen, falls

T =µ− µ0

s> tn−1,1−α

gilt, bzw. falls der p-Wert < α ist.

I µ: Schatzer fur µ; s: Schatzer fur den Standardfehler von µ

36 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Vertauschen der Hypothesen

1.7. Einstichproben t-Test fur linksseitige Hypothesen

I Hypothesen: H0 : µ ≥ µ0 ; H1 : µ < µ0 (linksseitigeHypothese)

I Daten y1, . . . , yn (Stichprobe) mit Erwartungswert µ

I Rechtfertigung der Unabhangigkeits- und Normalverteil-ungsannahme

I H0 wird zum Niveau α verworfen, falls

T =µ− µ0

s< −tn−1,1−α = tn−1,α

gilt, bzw. falls der p-Wert < α ist.

I µ: Schatzer fur µ; s: Schatzer fur den Standardfehler von µ

37 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Tests fur zweiseitige Hypothesen

1.8. Einstichproben t-Test fur zweiseitige Hypothesen

I Hypothesen: H0 : µ = µ0 ; H1 : µ 6= µ0 (zweiseitigeHypothese)

I Daten y1, . . . , yn (Stichprobe) mit Erwartungswert µ

I Rechtfertigung der Unabhangigkeits- und Normalverteil-ungsannahme

I H0 wird zum Niveau α verworfen, falls

|T | = | µ− µ0

s| > tn−1,1−α/2

gilt, bzw. falls der p-Wert kleiner als α ist.

I µ: Schatzer fur µ; s: Schatzer fur den Standardfehler von µ

38 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Die Verteilung von T falls µ = 100 ist.

-3 -2 -1 0 1 2 3

0.0

0.1

0.2

0.3

0.4

α = 2,5 % α = 2,5 %

p– Wert p– Wert

Dichte der t9 -Verteilung

t 9, 0.975 = 2.262 T n = 2.436 t 9, 0.025 = -2.262 -T n = -2.436

I Blaue Flache: Niveau α; Rote Flache: p-Wert (Wahrscheinlichkeiteinen Wert zu beobachten, dessen Betrag großer als 2.436 istP(|T | > 2.436) = 0.038

I Beachte: Ist der p-Wert < α (wie in diesem Beispiel), dann wirdH0 abgelehnt!

39 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

SPSS-Output bei Anwendung des t-Tests auf dieDaten aus Beispiel 1.1 (Intelligenzquotient)

MittlereDifferenzSig. (2-seitig)dfT ObereUntere

90% Konfidenzintervall der Differenz

Testwert = 100

Intelligenzquotient 7,181,024,100,03892,436

Test bei einer Sichprobe

Beachte:

I SPSS liefert nur den p-Wert fur den zweiseitigen t-Test ausBeispiel 1.8!

I Den p-Wert fur den einseitigen Test erhalt man als0.038/2 = 0.019.

40 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

1.9 Bemerkungen (zu den statistischen Verfahren1.2, 1.4, 1.6, 1.7, 1.8)

I Mathematische Statistik ⇒ unter der Normalverteilungsannahmesind alle hier vorgestellten Verfahren optimal

I die Normalverteilungsannahme kann (und sollte) manrechtfertigen. Mogliche Verfahren sind:

I statistische Tests fur die Hypothese

H0 : Y1, . . . ,Yn normalverteilt

In SPSS ublich sind

- Kolmogorov-Smirnov-Test- Shapiro-Wilk Test

I Explorative Verfahren. In SPSS ublich: QQ-Plot

I besteht die Normalverteilungsannahme diese Uberprufung nicht,so sind z.B. nichtparametrische Verfahren anzuwenden

41 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Der QQ-PlotI Unter der Modellannahme gilt: die Großen Yi sind normalverteilt

mit Erwartungswert µ und Varianz σ2

I Der QQ-Plot vergleicht grafisch die empirischen Quantile der“Daten” y1, . . . , yn mit den Quantilen der Normalverteilung mitErwartungswert µ und Varianz σ2.(1) 1/n-Quantil der Stichprobe y1, . . . , yn =⇒ kleinste der

Beobachtungen y(1) (in Beispiel 1.1 ist y(1) = 97)(1− 1/2)/n-Quantil der Normalverteilung mit Erwartungswert µund Varianz σ2 =⇒ (im Beispiel 1.1 ist z(1) = 104.1− 1.64 · 5.32= 95.37 )

(2) 2/n Quantil der Stichprobe y1, . . . , yn =⇒ zweitkleinste derBeobachtungen y(2) (in Beispiel 1.1 ist y(2) = 98 )(2− 1/2)/n-Quantil der Normalverteilung mit Erwartungswert µund Varianz σ2 =⇒ (in Beispiel 1.1 ist z(2) = 104.1− 1.04 · 5.32= 98.57 )

(3) usw.I Der QQ-Plot ist das Streudiagramm der Daten

(y(1), z(1)), . . . , (y(n), z(n))

I In in vielen Fallen enthalt dieses Diagramm noch die Winkelhalb-ierende des entsprechenden Quadranten

42 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

SPSS Output: QQ-Plot fur die Daten ausBeispiel 1.1

Beobachteter Wert

11511010510095

Erw

arte

ter

Wer

t vo

n N

orm

115

110

105

100

Q-Q-Diagramm von Normal von Intelligenzquotient

43 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

1.3 Zweistichprobenprobleme

44 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Beispiel 1.10 (Erkennen von Zahlenreihen)

I Studierende der Fachrichtungen Mathematik (M) und Psychologie(P) machen einen Zahlengedachtnistest

– Wie viele Ziffern konnen sich maximal gemerkt werden

– Wiedergabe in Original und umgekehrter Reihenfolge

I Daten (P. Zofel: Statistik fur Psychologen)

M 14 14 15 12 13 19 17 13P 13 14 13 12 16 16 10 16

M 14 17 15 13 16 13P

I Frage: Haben Studierende der Psychologie ein besseresZahlengedachtnis als Studierende der Mathematik?

45 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Mathematisches Modell (n1 = 14, n2 = 8)

I Yij := µi + εij j = 1, . . . , ni ; i = 1, 2

Yij : Ergebnis der j-ten Versuchsperson in Gruppe i(Mathematik: i = 1, Psychologie i = 2)

µi : unbekannter Erwartungswert in der Population i(Mathematik: i = 1, Psychologie: i = 2)

εij : Storgroßen (Meßfehler, Tagesform ...)

ni : Stichprobenumfang in Gruppe i

I Normalverteilungs und Unabhangigkeitsannahme

- in jeder Gruppe (i = 1, 2) liegt eine Normalverteilung mitErwartungswert µi und Varianz σ2

i vor

- in jeder Gruppe sind die Beobachtungen unabhangig

- unabhangige Stichproben

46 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Schatzer

I Schatzer werden wie in 1.2 fur jede Gruppe durchgefuhrt

Mathematiker (i=1) : µ1 = y 1· = 1n1

n1∑j=1

y1j = 14.64

σ21 = 1

n1−1

n1∑j=1

(y1j − y 1·)2 = 3.94⇒ s1 =

√σ2

n1= 0.53

Psychologen (i=2): µ2 = y 2· = 1n2

n2∑j=1

y2j = 13.75

σ22 = 1

n2−1

n2∑j=1

(y2j − y 2·)2 = 4.79⇒ s2 =

√σ2

n2= 0.77

I Auch Konfidenzbereiche werden gruppenweise bestimmtz.B. unter Normalverteilungsannahme ist(

µ1 − tn1−1,1−α/2s1, µ1 + tn1−1,1−α/2s1

)ein 90% Konfidenzinterval fur µ1. Fur das spezielle Datenbeispielergibt sich [n1 = 14, α = 10%, t13,0.95 = 1.77 (aus Tabelle)](13.70, 15.58) als 90% Konfidenzintervall fur µ1

47 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

SPSS-Output fur die Daten aus Beispiel 1.10

Schatzer fur die Parameter in den einzelnen Gruppen

VarianzMittelwertMathematik

Psychologie

Insgesamt 4,22714,32

4,78613,75

3,94014,64StudienfachStudienfach

Gemerkte Zahlen

Beachte:

I SPSS liefert hier die Schatzer fur Erwartungswert und Varianz dereinzelnen Gruppen

I SPSS liefert außerdem Schatzer fur Erwartungswert und Varianzder gesamten Stichprobe

48 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Tests zum Vergleich der Erwartungswerte

I Nullhypothese: Zahlengedachtnis der Psychologiestudenten istnicht schlechter als das der Mathematikstudenten

H0 : µ1 ≤ µ2

I Alternative: Zahlengedachtnis der Mathematikstudenten ist besserals das der der Psychologiestudenten

H1 : µ1 > µ2

I Rezept: Verwerfe die Nullhypothese H0 zu Gunsten derAlternative H1, falls die Differenz

y 1· − y 2·

der Schatzer fur die Erwartungswerte “groß” ist

49 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Rezept im Fall von Varianzhomogenitat, d.h.(σ2

1 = σ22)

I Verwerfe H0 zu Gunsten von H1, falls y 1· − y 2· “groß” ist

I Normiere diese Große mit einem Schatzer fur die Standardab -weichung der Mittelwertdifferenz:

I s =√

( 1n1

+ 1n2

)σ2

I σ2 = 1n1+n2−2

{(n1 − 1)σ21 + (n2 − 1)σ2

2}: Schatzer fur Varianz (die

in beiden Gruppen dieselbe ist)

I Entscheide fur die Alternative H1 : µ1 > µ2, falls

Tn1,n2 =y 1· − y 2·

s> tn1+n2−2,1−α

gilt. Dabei ist tn1+n2−2,1−α das (1− α)-Quantil der t-Verteilungmit n1 + n2 − 2 Freiheitsgraden

I Im Beispiel ergibt sich fur einen Test zum Niveau α = 5%

σ2 = 4.24, t20,0.95 = 1.725 =⇒ T14,8 = 0.979

d.h. die Hypothese H0 kann nicht verworfen werden.

50 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Testverfahren fur die Erwartungswerte von zweiStichproben unter Normalverteilungsannahme

1.11(a) Einseitiger t-Test fur zwei unabhangige Stich-proben (rechtsseitige Hypothese)

I Dateny11, . . . , y1n1 (Gruppe 1; Erwartungswert µ1; Varianz σ2

1)y21, . . . , y2n2 (Gruppe 2; Erwartungswert µ2; Varianz σ2

I Rechtfertigung der Voraussetzungen– Unabhangigkeit in und zwischen den Gruppen– Normalverteilungsannahme (in beiden Gruppen)– Varianzhomogenitat, d.h. σ2

1 = σ22

I Die Hypothese H0 : µ1 ≤ µ2 wird zu Gunsten derAlternative H1 : µ1 > µ2 verworfen, falls

Tn1,n2 =y 1· − y 2·

s> tn1+n2−2,1−α

gilt, bzw. der p-Wert < α ist. s =√

( 1n1

+ 1n2

)σ2 ist der

Schatzer fur den Standardfehler der Mittelwertdifferenz

51 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

1.11(b) Einseitiger t-Test fur zwei unabhangige Stich-proben (linksseitige Hypothese)

I Dateny11, . . . , y1n1 (Gruppe 1; Erwartungswert µ1; Varianz σ2

1)y21, . . . , y2n2 (Gruppe 2; Erwartungswert µ2; Varianz σ2

I Rechtfertigung der Voraussetzungen– Unabhangigkeit in und zwischen den Gruppen– Normalverteilungsannahme (in beiden Gruppen)– Varianzhomogenitat, d.h. σ2

1 = σ22

I Die Hypothese H0 : µ1 ≥ µ2 wird zu Gunsten derAlternative H1 : µ1 < µ2 verworfen, falls

Tn1,n2 =y 1· − y 2·

s< −tn1+n2−2,1−α = tn1+n2−2,α

gilt, bzw. der p-Wert < α ist. s =√

( 1n1

+ 1n2

)σ2 ist der

Schatzer fur den Standardfehler der Mittelwertdifferenz.

52 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

1.11(c) t-Test fur zwei unabhangige Stichproben (zwei-seitige Hypothesen)

I Dateny11, . . . , y1n1 (Gruppe 1; Erwartungswert µ1; Varianz σ2

1)y21, . . . , y2n2 (Gruppe 2; Erwartungswert µ2; Varianz σ2

I Rechtfertigung der Voraussetzungen– Unabhangigkeit in und zwischen den Gruppen– Normalverteilungsannahme (in beiden Gruppen)– Varianzhomogenitat, d.h. σ2

1 = σ22

I Die Nullhypothese H0 : µ1 = µ2 (kein Unterschied derErwartungswerte in beiden Gruppen) wird zu Gunsten derAlternative H1 : µ1 6= µ2 verworfen, falls

|Tn1,n2 | =|y 1· − y 2·|

s> tn1+n2−2,1−α/2

gilt, bzw. der p-Wert < α ist. s =√

( 1n1

+ 1n2

)σ2 ist der

Schatzer fur den Standardfehler der Mittelwertdifferenz.53 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Bemerkung zur Varianzhomogenitat

Ist die Annahme der Varianzhomogenitat

σ21 = σ2

nicht erfullt, so

I wird die vorgegebene Wahrscheinlichkeit fur einen α-Fehler nichteingehalten (der Test halt sein Niveau nicht)

I ist die Wahrscheinlichkeit fur einen β-Fehler großer

I von Interesse ist daher auch ein Test fur die Hypothesen

H0 : σ21 = σ2

2 H1 : σ21 6= σ2

und ein Verfahren, das ohne die Annahme der Varianzhomo-genitat auskommt

54 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Rezept (fur Test auf Varianzhomogenitat)

I Die Nullhypothese H0 : σ21 = σ2

2 gilt genau dann, wenn

F =σ2

σ22

= 1

I Schatze den Quotienten der beiden Varianzen, durch

Fn1−1,n2−1 =σ2

σ22

n1−1

∑n1

j=1(y1j − y 1·)2

1n2−1

∑n2

j=1(y2j − y 2·)2

I Die Nullhypothese H0 wird zu Gunsten der AlternativeH1 : σ2

1 6= σ22 verworfen, falls

Fn1−1,n2−1 > c2 oder Fn1−1,n2−1 < c1

gilt

I Die kritischen Werte c1 und c2 werden so festgelegt, dass dieWahrscheinlichkeit fur einen Fehler erster Art maximal α ist!

55 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

1.12 F -Test fur den Vergleich von zwei Stichprobenva-rianzen

I Teststatistik

Fn1−1,n2−1 =σ2

σ2

I Die NullhypotheseH0 : σ2

1 = σ22

(die Varianzen sind gleich) wird zu Gunsten der Alternative

H1 : σ21 6= σ2

verworfen, falls mindestens eine der Ungleichungen

Fn1−1,n2−1 < Fn1−1,n2−1,α/2

Fn1−1,n2−1 > Fn1−1,n2−1,1−α/2

erfullt ist

I Fn1−1,n2−1,β bezeichnet das β-Quantil der F -Verteilung mit(n1 − 1, n2 − 1) Freiheitsgraden

56 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Verschiedene F -Verteilungen

F Vert.pdf

0 1 2 3 4 5

0.0

0.2

0.4

0.6

0.8

1.0

F F F F

Dichten der F– Verteilung mit verschiedenen Freiheitsgraden

2, 10

4, 4

10, 1

20, 20

fm,n(x) =Γ(m+n

2 )

Γ(m2 )Γ( n

2 )

)m/2 xm/2−1

(1 + mn x)(m+n)/2

(x ≥ 0)

57 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Das Quantil der F -Verteilung mit (n1, n2) Frei-heitsgraden

4 4 mit 090.pdf

0 1 2 3 4 5

0.0

0.1

0.2

0.3

0.4

0.5

0.6

Dichte der F4, 4 -Verteilung

F 4, 4; 0.9 = 4.107

0.9

P(F4,4,≤ F4,4,0.9) =

∫ F4,4,0.9

−∞fm,n(x)dx = 0.90

58 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Der F -Test auf Varianzhomogenitat fur dieDaten aus Beispiel 1.10 (n1 = 14, n2 = 8)

I σ21 = 3.94 σ2

2 = 4.79 ⇒ F13,7 = 0.823

I Fur das Niveau α = 10% erhalt man

F13,7,0.05 = 0.3531 F13,7,0.95 = 3.5503

und damit kann die Nullhypothese zum Niveau 10% nichtverworfen werden

I Beachte: oft wird der Test 1.12 verwendet, um die Voraus-setzungen fur den t-Test zu uberprufen

I In diesem Fall wahlt man oft ein großeres Niveau (→ kleinereWahrscheinlichkeit fur β-Fehler)

I Der Gesamttest (erst F -Test, falls H0 nicht verworfen wird, dannt-Test) hat nicht das Niveau α

I Was macht man, falls F -Test H0 verwirft?

59 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

1.13(i) t-Test fur zwei unabhangige Stichproben mitnicht notwendig gleichen Varianzen (Welch-Test)

I Dateny11, . . . , y1n1 (Gruppe 1; Erwartungswert µ1; Varianz σ2

1)y21, . . . , y2n2 (Gruppe 2; Erwartungswert µ2; Varianz σ2

I Rechtfertigung der Voraussetzungen– Unabhangigkeit in und zwischen den Gruppen– Normalverteilungsannahme (in beiden Gruppen)

I Varianzen in den Gruppen sind nicht notwendig gleich

I Teststatistik

T Wn1,n2

=y 1· − y 2·

I Dabei

τ =√τ 2 =

√σ2

n1+σ2

ist die Schatzung fur die Varianz von y 1· − y 2·60 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

1.13(ii) t-Test fur zwei unabhangige Stichproben mitnicht notwendig gleichen Varianzen (Welch-Test);

I Die NullhypotheseH0 : µ1 ≤ µ2

(Erwartungswert der ersten Population nicht großer als derder Zweiten) wird zu Gunsten der Alternative

H1 : µ1 > µ2

falls

T Wn1,n2

> tf ,1−α

gilt, bzw. der p-Wert < α ist. Dabei bezeichnet

f =(s2

1 + s22 )2

s41

n1−1 +s4

n2−1

die geschatzten Freiheitsgrade der t-Verteilung.61 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

1.13(iii) t-Test fur zwei unabhangige Stichproben mitnicht notwendig gleichen Varianzen (Welch-Test)

I Die NullhypotheseH0 : µ1 ≥ µ2

(Erwartungswert der ersten Population nicht kleiner als derder Zweiten) wird zu Gunsten der Alternative

H1 : µ1 < µ2

verworfen, falls

T Wn1,n2

< tf ,α = −tf ,1−α

gilt, bzw. der p-Wert < α ist. Dabei bezeichnet

f =(s2

1 + s22 )2

s41

n1−1 +s4

n2−1

die geschatzten Freiheitsgrade der t-Verteilung.62 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

1.13(iv) t-Test fur zwei unabhangige Stichproben mitnicht notwendig gleichen Varianzen (Welch-Test)

I Die NullhypotheseH0 : µ1 = µ2

(kein Unterschied der Erwartungswerte in beiden Gruppen)wird zu Gunsten der Alternative

H1 : µ1 6= µ2

(es besteht ein Unterschied) verworfen, falls

|T Wn1,n2| > tf ,1−α/2

gilt, bzw. der p-Wert < α ist. Dabei bezeichnet

f =(s2

1 + s22 )2

s41

n1−1 +s4

n2−1

die geschatzten Freiheitsgrade der t-Verteilung.63 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Bemerkung: t-Test oder Welch-Test?

I Sind die Voraussetzungen fur den t-Test erfullt (Normalver-teilung, Unabhangigkeit, Varianzhomogenitat), so ist diesesVerfahren optimal, d.h. dieser Test minimiert unter allen Testszum Niveau α die Wahrscheinlichkeit fur einen β-Fehler

I Ist die Voraussetzungen der Varianzhomogenitat beim t-Testnicht erfullt, so wird die vorgegebene Wahrscheinlichkeit fureinen α-Fehler nicht eingehalten

I Der Welch-Test ist eine “Naherungslosung”, d.h. die Wahrschein-lichkeit fur einen α-Fehler ist ”nur” naherungsweise α

I Der Welch-Test hat im Fall der Varianzhomogenitat eine großereWahrscheinlichkeit fur einen β-Fehler als der t-Test

64 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

SPSS-Output fur die Daten aus Beispiel 1.10

SignifikanzF Sig. (2-seitig)dfT

T-Test für die MittelwertgleichheitLevene-Test der Varianzgleichheit

Varianzen sind gleich

Varianzen sind nicht gleich

Gemerkte Zahlen

,35813,523,952

,33920,979,752,103

Test bei unabhängigen Stichproben

Standardfehlerder Differenz

MittlereDifferenz ObereUntere

95% Konfidenzintervall der Differenz

T-Test für die Mittelwertgleichheit

Varianzen sind gleich

Varianzen sind nicht gleich

Gemerkte Zahlen

2,911-1,125,938,893

2,796-1,010,912,893

Test bei unabhängigen Stichproben

Beachte:

I SPSS liefert nicht den in 1.12 dargestellten F -Test auf Varianzhomogenitatsondern ein “robustes” Verfahren (Levene-Test)

I SPSS liefert nur einen p-Wert fur den zweiseitigen t-Test aus Beispiel 1.11(c)bzw. zweiseitigen Welch-Test aus Beispiel 1.13(iv)

I SPSS liefert ein Konfidenzintervall fur die Differenz µ1 − µ2

=⇒ 95% Konfidentintervall fur die Differenz der Erwartungswerte (unter derAnnahme gleicher Varianzen)

(−1.01, 2.796)65 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

1.4 Einfaktorielle Varianzanalyse

66 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Beispiel 1.14 (Fortsetzung von Beispiel 1.10)

I An dem Zahlengedachtnistest (vgl. Beispiel 1.10) nehmen auchnoch 7 Studierende der Geisteswissenschaften (G) teil.

M 14 14 15 12 13 19 17 13P 13 14 13 12 16 16 10 16G 11 13 13 10 13 12 13 -

M 14 17 15 13 16 13 - -P - - - - - - - -G - - - - - - - -

I Frage: Existieren Unterschiede hinsichtlich des Zahlenge-dachtnisses zwischen dem Studierenden der Psychologie,Mathematik und Geisteswissenschaften?

67 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Mathematisches Modell (n1 = 14, n2 = 8, n3 = 7)

I Yij := µi + εij j = 1, . . . , ni ; i = 1, 2, 3

Yij : Ergebnis der j-ten Versuchsperson in Gruppe i (Mathe-matik: i = 1, Psychologie: i = 2, Geisteswisenschaften:i = 3)

µi : unbekannter Erwartungswert in der Population i (Mathe-matik: i = 1, Psychologie: i = 2,Geisteswisenschaften:i = 3)

εij : Storgroßen (Erwartungswert 0 und Varianz σ2)

I Normalverteilungs und Unabhangigkeitsannahme

- in jeder Gruppe (i = 1, 2, 3) liegt eine Normalverteilung mitErwartungswert µi vor

- in jeder Gruppe sind die Beobachtungen unabhangig- unabhangige Stichproben

I NullhypotheseH0 : µ1 = µ2 = µ3

68 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Schatzer und Konfidenzbereiche

I Schatzer fur Erwartungswert und Varianz werden in den einzelnenGruppen durchgefuhrt

I Beispiel:

y i· σ2i si ni

Mathematik (i = 1) 14.64 3.94 0.53 14Psychologie (i = 2) 13.75 4.79 0.60 8Geisteswissenschaften (i = 3) 12.14 1.48 0.46 7

I µ1 = 14.64 ist Schatzer fur den “Erwartungswert derMathematiker”

I Beachte: t6,0.95 = 1.943, µ3 + s3t6,0.95 = 13.03µ3 − s3t6,0.95 = 11.25, also ist das Intervall

[11.25, 13.03]

ein 90% Konfidenzintervall fur den ”Erwartungswert derGeisteswissenschaftler”

69 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

SPSS Output

NStandardfehler

des MittelwertesVarianzMittelwertMathematik

Psychologie

Geisteswissenschaften

Insgesamt 29,3894,38413,79

7,4591,47612,14

8,7734,78613,75

14,5303,94014,64StudienfachStudienfach

Gemerkte Zahlen

70 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Prinzip der Varianzanalyse

I Ziel: Test fur die Hypothese “es bestehen keine Unterschiedezwischen den Gruppen”

H0 : µ1 = µ2 = µ3

I Idee: Bestimme die Streuung der Daten:

I Mittelwert:

y ·· =1

3∑i=1

ni∑j=1

yij

I Varianz (n = n1 + n2 + n3)

n − 1

3∑i=1

ni∑j=1

(yij − y ··)2

und versuche Unterschiede in der Merkfahigkeit aufgrund derGruppenzugehorigkeit durch eine Zerlegung der Streuung bzgl.der Gruppen zu erklaren!

71 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Prinzip der Varianzanalyse

I Zerlegung der Summe der Quadrate (Sum of squares)

– Summe der Quadrate innerhalb der Gruppen (within groups)

SSR =3∑

i=1

ni∑j=1

(yij − y i·)2

– Summe der Quadrate zwischen den Gruppen (between groups)

SSM =3∑

i=1

ni (y i· − y ··)2

wobei n = n1 + n2 + n3 = 29 die Gesamtzahl der Beobachtungen

bezeichnet und

y ·· =1

3∑i=1

ni∑j=1

yij

den Mittelwert aus allen Beobachtungen.

72 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Prinzip der Varianzanalyse

I Zerlege die Summe der Quadrate in eine durch das Modellerklarte Summe (Varianz zwischen den Gruppen) und eine Summevon Quadraten der Storgroßen (Varianz innerhalb der Gruppen)

SST =3∑

i=1

ni∑j=1

(yij − y ··)2

︸︷︷︸Gesamtvarianz (Total)

=3∑

i=1

ni∑j=1

(yij − y i·)2

︸︷︷︸Gesamtvarianz innerhalb der Gruppen

+k∑

i=1

ni (y i· − y ··)2

︸︷︷︸Varianz zwischen den Gruppen

73 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

F -Test fur die Hypothese H0 : µ1 = µ2 = µ3

(gleiche Erwartungswerte in den drei Gruppen)

I Vergleiche die Varianz zwischen den Gruppen mit der Varianzinnerhalb der Gruppen

F =

13−1

3∑i=1

ni (y i· − y ··)2

129−3

3∑i=1

ni∑j=1

(yij − y i·)2

Falls F “groß” ist, wird die Nullhypothese H0 abgelehnt.

I Mathematische Statistik ⇒ Test zum Niveau α verwirft dieNullhypothese H0, falls

F > F2,26,1−α

gilt (Vergleich mit dem (1− α)-Quantil der F -Verteilung mit(2,26) Freiheitsgraden), bzw. falls der zugehorige p-Wert desTests kleiner als α ist.

74 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Beispiel 1.15 (Fortsetzung von Beispiel 1.12)

I Frage: “besteht ein Unterschied zwischen den Studierenden derFacher Psychologie, Mathematik und Geisteswissenschaften bzgl.des Zahlengedachtnisses”Genauer: Besteht ein Unterschied zwischen den Erwartungs-werten der drei Gruppen: H0 : µ1 = µ2 = µ3

I n1 = 14, n2 = 8, n3 = 7; α = 5% F2,26,0.95 = 3.37

F =SSM/2

SSR/26=

14.6

3.6= 4.06 > 3.37

I D.h. die Hypothese: H0 : µ1 = µ2 = µ3 wird zum Niveau 5%abgelehnt.

I In anderen Worten: zwischen den Studierenden der verschiedenenFacher besteht ein Unterschied

I Beachte: In vielen Fallen ist man an der Frage interessiert,zwischen welchen Gruppen ein Unterschied besteht. DieseFrage beantwortet der F -test nicht!

75 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

F -Verteilung

0 1 2 3 4 5

0.0

0.2

0.4

0.6

0.8

1.0

Dic

hte

F == 4.06

0 1 2 3 4 5

0.0

0.2

0.4

0.6

0.8

1.0

Dic

hte

Dichte der F2,26 −− Verteilung

F2,26,0.95 == 3.37

0 1 2 3 4 5

0.0

0.2

0.4

0.6

0.8

1.0

Dic

hte

76 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

F -Verteilung

2.5 3.0 3.5 4.0 4.5 5.0

0.00

0.05

0.10

0.15

Dic

hte

F2,26,0.95 == 3.37 F == 4.06

Dichte der F2,26 −− Verteilung ((Zoom))

αα == 5%

p−Wert

2.5 3.0 3.5 4.0 4.5 5.0

0.00

0.05

0.10

0.15

Dic

hte

I Blaue Flache: Niveau des Tests

I Rote Flache: p-Wert (Wahrscheinlichkeit, daß ein Wert großer alsF = 4.06 beobachtet wird)

77 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Varianzanalysetabelle (k bezeichnet die Anzahlder Gruppen)

Variabilitat Sum of Squares df SS/df F

zwischen SSM k − 1 SSM/(k − 1) SSM

k−1 /SSR

n−k

innerhalb SSR n − k SSR/(n − k)gesamt SST n − 1 SST/(n − 1)

Beispiel (Zahlengedachtnis)

Variabilitat Sum of Squares df SS/df Fzwischen 29.2 2 14.6 4.06innerhalb 93.6 26 3.6gesamt 122.8 28

78 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

SPSS Output

SignifikanzFMittel der QuadratedfQuadratsumme

Zwischen den Gruppen

Innerhalb der Gruppen

Gesamt 28122,759

3,5992693,571

,0294,05514,594229,187

Gemerkte Zahlen

79 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Beispiel 1.16 (Fortsetzung von Beispiel 1.15)

I Bei signifikantem Ergebnis der Varianzanalyse (d.h. die Hypothesegleicher Erwartungswerte wird abgelehnt) stellt sich die Frage:“Welche Gruppe ist maßgeblich fur die Signifikanzverantwortlich?”

I Losungsvorschlag: paarweise Vergleiche!

Gruppe 1 - Gruppe 2; H12 : µ1 = µ2

Gruppe 1 - Gruppe 3; H13 : µ1 = µ3

Gruppe 2 - Gruppe 3; H23 : µ2 = µ3

I Jeder Vergleich wird mit dem Zwei- Stichproben t-Test (vgl.1.11(b)) durchgefuhrt.

I Dabei ist zu beachten, dass das Gesamtverfahren: Verwerfe dieHypothese H0 : µ1 = µ2 = µ3, falls mindestens ein Paarvergleichsignifikant ist das Niveau α einhalt .

I Die t-Tests fur die paarweisen Vergleiche sind mit Niveau α/3durchzufuhren. Man dividiert durch 3, da 3 paarweise Vergleichedurchgefuhrt werden (Bonferroni-Methode)

80 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Paarweise Vergleiche mit Zwei-Stichprobent-Tests (α = 5%):

I Test-Statistik fur den Vergleich von Gruppe i mit Gruppe j :

Tni ,nj =|Yi· − Yj·|

sij

s2ij =

( 1

ni+

)( 1

ni + nj − 2{(ni − 1)σ2

i + (nj − 1)σ2j })

i j Tni ,nj ni nj tni +nj−2,1−α′/2 p-Wert signifikant1 2 0.98 14 8 2.61 0.339 nein1 3 3.04 14 7 2.62 0.007 ja2 3 1.72 8 7 2.74 0.109 nein

Beachte: die paarweisen Vergleiche werden zum Niveau α′ = α/3= 5%/3 = 0.0167 durchgefuhrt (da man 3 Vergleiche macht).

I Mit dieser Methode kann man zum Niveau 5% einen signifi-kanten Unterschied zwischen den Gruppen feststellen.

I Bonferroni-Methode ist konservativ (d.h. das wirkliche Niveaudes Verfahrens wird unterschatzt

I Ist die Anzahl der Paarvergleiche groß, so ist dieses Verfahrennicht zu empfehlen.

81 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Post-Hoc-Test “Bonferroni” in SPSS

I Verwendet andere Schatzung fur den Standardfehler der Differenzder Mittelwerte aus Gruppe i und j :

s2ij =

ni+

)(1

n − 3

3∑k=1

(nk − 1)σ2k

)

I An Stelle der Quantile der t-Verteilung mit ni + nj − 2 Freiheits-graden mussen dann die Quantile der t-Verteilung mit n − 3Freiheitsgraden verwendet werden (n = n1 + n2 + n3)

I Das Niveau fur die Paarvergleiche muss dann wieder durch dieAnzahl der Vergleich dividiert werden (im Beispiel α′ = α/3)

I Adjustierung der p-Werte erfolgt durch Multiplikation derp-Werte aus den Paarvergleichen mit der Anzahl der Vergleiche

82 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

SPSS Output paarweise Vergleiche mit derBonferroni-Methode

SignifikanzStandardfehlerMittlere

Differenz (I-J) ObergrenzeUntergrenze

95%-Konfidenzintervall

Psychologie

Geisteswissenschaften

Mathematik

Geisteswissenschaften

Mathematik

Psychologie

Mathematik

Psychologie

Geisteswissenschaften

,91-4,12,341,982-1,607

-,25-4,75,026,878-2,500*

4,12-,91,341,9821,607

1,26-3,04,894,841-,893

4,75,25,026,8782,500*

3,04-1,26,894,841,893(I) Studienfach (J) Studienfach(I) Studienfach (J) Studienfach

Mehrfachvergleiche

Gemerkte ZahlenBonferroni

*. Die Differenz der Mittelwerte ist auf dem Niveau 0.05 signifikant.

83 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Scheffe-Methode (α = 5%)

I Fur den Vergleich der Gruppe i mit j betrachte:

ds(i , j) =

√3− 1

29− 3SSR · F2,26,0.95(

ni+

nj)

√2

26· 93.6 · 3.37(

ni+

nj) = 4.93

√1

ni+

und vergleiche diese Große mit Mittelwertdifferenz Y i· − Y j·

I Ergebnis

i j y i· − y j· ds(i , j) Ergebnis1 2 0.89 2.18 kein sign. Unterschied1 3 2.5 2.28 y 1· sign. großer als y ·32 3 1.61 2.55 kein sign. Unterschied

84 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Einige Bemerkungen zur Scheffe-Methode:

I Die Scheffe-Methode garantiert, dass die Wahrscheinlichkeit einesα-Fehlers fur jeden beliebigen a-posteriori durchgefuhrtenEinzelvergleichstests nicht großer ist als der α-Fehler des F -Tests

I Kurz: Die Signifikanzaussagen gelten simultan fur ALLEPaarvergleiche mit dem Gesamtniveau α

I Die Scheffe-Methode ist ein konservatives Verfahren

I Die Wahrscheinlichkeit eines α-Fehlers ist eher kleiner als dasvorgegebene Niveau

I man entscheidet tendenziell eher zu oft fur H0

85 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

SPSS Output paarweise Vergleiche mit derScheffe-Methode

SignifikanzStandardfehlerMittlere

Differenz (I-J) ObergrenzeUntergrenze

95%-Konfidenzintervall

Psychologie

Geisteswissenschaften

Mathematik

Geisteswissenschaften

Mathematik

Psychologie

Mathematik

Psychologie

Geisteswissenschaften

,94-4,16,279,982-1,607

-,22-4,78,029,878-2,500*

4,16-,94,279,9821,607

1,29-3,08,576,841-,893

4,78,22,029,8782,500*

3,08-1,29,576,841,893(I) Studienfach (J) Studienfach(I) Studienfach (J) Studienfach

Mehrfachvergleiche

Gemerkte ZahlenScheffé-Prozedur

*. Die Differenz der Mittelwerte ist auf dem Niveau 0.05 signifikant.

86 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

1.17 Einfaktorielle Varianzanalyse (zum Vergleichvon k unabhangigen Stichproben)

Modellannahmen und Hypothese

I Daten (n =∑k

i=1 ni )

y11, . . . , y1n1 (Gruppe 1, Erwartungswert µ1; Varianz σ21)

......

...yk1, . . . , yknk

(Gruppe k , Erwartungswert µk ; Varianz σ2k)

I Nullhypothese: es besteht kein Unterschied zwischen denErwartungswerten der einzelnen Gruppen:

H0 : µ1 = µ2 = . . . = µk

I Rechtfertigung der VoraussetzungenI Unabhangigkeit zwischen den Gruppen

I Unabhangigkeit innerhalb der Gruppen

I Normalverteilungsannahme

I Varianzhomogenitat: σ21 = σ2

2 = · · · = σ2k

87 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

F-Test fur die einfaktorielle Varianzanalyse (zum Ver-gleich von k unabhangigen Stichproben)

I Die Hypothese H0 : µ1 = µ2 = . . . = µk gleicher Erwart-ungswerte in allen Gruppen wird verworfen, falls

F =1

k−1 SSM

1n−k SSR

> Fk−1,n−k,1−α

Dabei ist:

SSM =k∑

i=1

ni (y i· − y ··)2

(sum of squares between groups)

SSR =k∑

i=1

ni∑j=1

(yij − y i·)2

(sum of squares within groups) und Fk−1,n−k,1−α das(1− α)-Quantil der F -Verteilung mit (k − 1, n − k)Freiheitsgraden

88 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

1.18 Paarweise Vergleich mit der Scheffe-Methode (No-tation wie in 1.15)

I wird die Nullhypothese H0 : µ1 = µ2 = · · · = µk abgelehnt,so kann mit der Scheffe-Methode festgestellt werden,“welche Gruppen fur die Signifikanz verantwortlich sind”!

I dazu bestimmt man die Großen (n =∑k

i=1 ni )

ds(i , j) =

√k − 1

n − kSSR · Fk−1,n−k,1−α(

ni+

nj)

Ist y i· − y j· großer (bzw. kleiner) als ds(i , j) (bzw. als−ds(i , j)) so ist y i· signifikant großer (bzw. kleiner) als y j·

I Beachte:– insgesamt k(k−1)

2 Vergleiche– die Scheffe-Methode halt simultan das Niveau α– es ist moglich, das F -Test H0 ablehnt, aber keiner der

paarweisen Vergleiche signifikant ist!

I Andere Verfahren (z.B. in SPSS implementiert): Tukey-Methode, Duncan Test

89 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

1.19 Levene-Test auf Varianzhomogenitat von kunabhangigen Stichproben

Modellannahmen und Hypothese

I Daten (n =∑k

i=1 ni )

y11, . . . , y1n1 (Gruppe 1, Erwartungswert µ1; Varianz σ21)

......

...yk1, . . . , yknk

(Gruppe k , Erwartungswert µk ; Varianz σ2k)

I Nullhypothese: es liegt Varianzhomogenitat vor, d.h.

H0 : σ21 = σ2

2 = . . . = σ2k

I Rechtfertigung der VoraussetzungenI Unabhangigkeit zwischen den Gruppen

I Unabhangigkeit innerhalb der Gruppen

I Normalverteilungsannahme

90 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

Levene-Test auf Varianzhomogenitat von k un-abhangigen Stichproben

I Die Hypothese der Varianzhomogenitat

H0 : σ21 = σ2

2 = . . . = σ2k

wird verworfen, falls

F =1

k−1

∑ki=1 ni (x i· − x ··)

1n−k

∑ki=1

∑ni

j=1(xij − x i·)2> Fk−1,n−k,1−α

Dabei ist:I n = n1 + . . .+ nk der GesamtstichprobenunfangI x i· = 1

∑nij=1 xij , x ·· = 1

∑ki=1

∑nij=1 xij

I xij = |yij − y i·|I Fk−1,n−k,1−α das (1− α)-Quantil der F -Verteilung mit

(k − 1, n − k) Freiheitsgraden.

I Beachte:I Der Test ist robust bzgl. der NormalverteilungsannahmeI Der Test halt ”nur” naherungsweise das Niveau αI Alternativer Test: Bartlett Test

91 / 92

Methodenlehre II, SS2009

Prof. Dr. HolgerDette

1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests

1.1 Schatzer undKonfidenzintervalle

1.2 t-Test fur eineStichprobe

1.3 Zweistichproben-probleme

1.4 EinfaktorielleVarianzanalyse

SPSS Output

Signifikanzdf2df1Levene-Statistik

,3132621,214

Test der Homogenität der Varianzen

Gemerkte Zahlen

SignifikanzFMittel der QuadratedfQuadratsumme

Zwischen den Gruppen

Innerhalb der Gruppen

Gesamt 28122,759

3,5992693,571

,0294,05514,594229,187

ONEWAY ANOVA

Gemerkte Zahlen

92 / 92

Top Related

Methodenlehre II, SS 2009 - Ruhr University Bochum · 2010. 6. 10. · Methodenlehre II, SS 2009 Prof. Dr. Holger Dette 1. Grundlegende Prinzipien der schlieˇenden Statistik am Beispiel

Prof. Dr. Justus Meyer, Juristenfakultät BGB II (SS 2014) Übungsfälle Kaufrecht 1.

Einführungskurs Wissenschaftstheorie und Wissenschaftsgeschichte: II: Theorien Gerd Grasshoff Universität Bern SS 2010.

Yield (%) Sid Bachir Dividende n (€) 01 44 70 20 76 Dette ...

LINEARE ALGEBRA I, II (VORLESUNG WS 2015/16 UND SS 2016 ... · LINEARE ALGEBRA I, II (VORLESUNG WS 2015/16 UND SS 2016, FU BERLIN) KLAUS ALTMANN 0. Einf¨uhrende Beispiele, mathematische

II SS MM SWIM MEETING INTERNATIONAL SWIM M EETIN G · 2013-02-25 · II SS MM GERMANY - BERLIN INT ERNATIONA L SWIM M EETIN G INTERNATIONAL SWIM MEETING 01. - 03. März 2013 Schwimm-

Methodenlehre II, SoSe 2015 - ruhr-uni-bochum.de · Methodenlehre II, SoSe 2015 Holger Dette 1. Grundlegende Prinzipien der schließenden Statistik am Beispiel des t-Tests 2. Korrelation,

Vorlesung Programmierung II: SS 2004 Laufzeitkomplexität und Asymptotische Notation