Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Methodenlehre II, SS 2009
Prof. Dr. Holger Dette
Ruhr-Universitat Bochum
13. Juli 2009
1 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Methodenlehre II
I Prof. Dr. Holger Dette
I NA 3/73
I Telefon: 0234 322 8284
I Email: [email protected]
I Internet:www.ruhr-uni-bochum.de/mathematik3/index.html
I Vorlesung: Montag, 8.15 - 9.45 Uhr
I Thema: Das allgemeine lineare Modell und seine Anwendungen inder Psychologie
2 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Statistik-Team
I Ubung: Dienstag, 12.15 - 13.00 Uhr, HGA 10 (ab nachste Woche)Tobias Kley: [email protected]
I Tutorium (SPSS - (ab nachste Woche)
Hans-Georg Sonnenberg: [email protected]
Mo: 10-12 GA 1/128: Jens [email protected]: 10-12 GAFO 04/615: Linda [email protected]: 12-14 GAFO 04/615: Laura Bringmann, Linda EngelbrechtMo: 12-14 GA 1/128: Jens KreitewolfDo 14-16 GAFO 04/615:: Laura [email protected]
3 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Das allgemeine lineare Modell:
“ Ein mathematisches Modell - viele statistischeVerfahren”
Inhaltsverzeichnis
1. Grundlegende Prinzipien der schließenden Statistik am Beispieldes t-Tests
2. Das lineare Regressionsmodell, multiple Regression undKorrelation
3. Das “allgemeine” lineare Modell
4. Kovarianzanalyse
4 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Literaturverzeichnis
A. Aron, E.N. Aron, E.J. Coups, Statistics for Psychology, 5thEdition, Pearson Prentice Hall
J. Bortz, Statistik, 6. Auflage, Springer
M. Rudolf, J. Muller, Multivariate Verfahren, Hogrefe
P. Zofel, Statistik fur Psychologen, Pearson Studium
5 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
1. Grundlegende Prinzipien der schließendenStatistik (Wiederholung) am Beispiel des
t-Tests
1.1 Schatzer und Konfidenzintervalle
1.2 t-Test fur eine Stichprobe
1.3 Zweistichprobenprobleme
1.4 Einfaktorielle Varianzanalyse
6 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
1.1 Schatzer und Konfidenzintervalle
7 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Beispiel 1.1 (Intelligenzquotient)
Fragestellung: Haben (15-jahrige) Kinder aus Bochum einen hoherenIntelligenzquotienten als 100?
I 10 Kinder (zufallig ausgewahlt) machen einen IQ-TestDaten: y1, . . . , y10 Stichprobe
i 1 2 3 4 5yi 104 98 106 99 110
i 6 7 8 9 10yi 107 100 97 108 112
I Hypothese (IQ der Kinder ist niedriger als 100):
H0 : µ ≤ 100
Alternative (IQ ist hoher als 100):
H1 : µ > 100
Dabei ist µ der (unbekannte) Erwartungswert der Gesamtpo-pulation der (15-jahrigen) Kinder aus Bochum
8 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Prinzip der schließenden Statistik:
Auf Grund der Stichprobe y1, . . . , y10 sollen Aussagen uber dasMerkmal der Grundgesamtheit getroffen werden. Zum Beispiel
(a) Wie groß ist µ (Schatzung)?
(b) Kann man ein Intervall bestimmen, in dem µ liegt(Konfidenzintervall)?
(c) GiltH0 : µ ≤ 100 (IQ ist nicht hoher)
oder giltH1 : µ > 100 (IQ ist hoher)?
(statistischer Test)
9 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Grundlegende Schwierigkeit:
I µ ist der Erwartungswert der Population der 15-jahrigen Kinder
I Auf Basis der Stichprobe soll auf Grundgesamtheit geschlossenwerden−→ Fehler, Unsicherheiten sind moglich!
I Beispiel: “zufallig” wahlen wir 5 hochbegabte Kinder (IQ ≥ 130)fur die Stichprobe aus. Vermutlich wird dadurch µ uberschatzt!
I Ziel der schließenden Statistik: Quantifizierung derUnsicherheit, z.B.– mit welcher Wahrscheinlichkeit macht ein statistischer Testeinen Fehler, falls (aufgrund von Daten) fur H1 (IQ ist hoher als100) entschieden wird obwohl in Wirklichkeit H0 gilt?
I Notwendig fur diese Quantifizierung: Mathematische Modell-annahmen
10 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Zusatzliche Modellannahme: Normalverteilung
I Allgemein gangige Annahme: IQ in einer bestimmten Alters-gruppe der Bevolkerung ist normalverteilt
ϕ(x) =1√
2πσ2exp
(−1
2(
x − µσ
)2
)µ : Erwartungswert
σ2 : Varianz
I Deutung: Ist Y der IQ eines zufallig aus der Populationausgewahlten Individuums, so gilt
P(a ≤ Y ≤ b) =
∫ b
a
ϕ(x)dx
I Diese Modellannahme sollte man stets rechtfertigen (wie man dasmachen kann, sehen wir spater)
11 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Interpretation der Wahrscheinlichkeiten:
a b
I Die Wahrscheinlichkeit, dass eine Beobachtung zwischen denWerten a und b liegt, entspricht der Flache unter der Kurve imIntervall [a, b].
I In Formeln:
P(a ≤ Y ≤ b) =
∫ b
a
ϕ(x)dx
12 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Verschiedene Normalverteilungen N(µ, σ2)
Dichten der Normalverteilung mit verschiedenen Parametern
-4 -2 0 2 4 6
0.0
0.1
0.2
0.3
0.4
0.5
N(0,0.707)N(0,1)N(1,1.25)N(2,2)
I µ: Erwartungswert
I σ2: Varianz
I Beachte: unter jeder Kurve ist die Flache genau 1
13 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Motivation der Modellannahme der Normal-verteilung:
14 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Zusatzliche Modellannahme: Normalverteilung:I Mathematisches Modell (hier n = 10): y1, . . . , yn sind
Realisierungen von Zufallsvariablen
Yi = µ+ εi i = 1, . . . ,m
– yi : IQ-Messung fur i-tes Kind (Realisation der ZufallsvariablenYi )
– µ: (unbekannter) Erwartungswert der Population(hier der 15-jahrigen Kinder aus Bochum)
– ε1, . . . , εn: unabhangige Zufallsvariable, normalverteilt mitErwartungswert 0 und Varianz σ2. Interpretation: Meßfehler,genetische Variabilitat, Tagesform ...
I Mathematische Statistik z.B. Maximum Likelihood (in diesem Bei-spiel auch der gesunde Menschenverstand) liefert Schatzer fur µ:
µ = y · =1
n
n∑i=1
yi = 104.1
I Wie genau ist diese Schatzung? Wie sehr streut diese Schatzung?
15 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Zusatzliche Modellannahme: Normalverteilung:I Maß fur die Genauigkeit: Varianz (je kleiner die Varianz, desto
”genauer” die Schatzung)
I Mathematische Statistik (Methodenlehre I): die Varianz desSchatzers µ ist:
Var(µ) = s2 =σ2
nI Beachte:
(a) Je großer der Stichprobenumfang n, desto kleiner die Varianz vonµ. D.h. desto genauer ist die Schatzung.
(b) Fur die Beurteilung der Genauigkeit muss man die Varianz σ2 derPopulation kennen.
I Mathematische Statistik: Schatzung fur den Parameter σ2
σ2 =1
n − 1
n∑i=1
(yi − y ·)2 = 28.32
s2 =σ2
n= 2.832
16 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Zusatzliche Modellannahme: Normalverteilung:
I Oft wird der Schatzer zusammen mit dem Standardfehlerangegeben
µ = 104.1
µ+ s = 105.78
µ− s = 102.42
I s = σ√n
=√
σ2
n = 1.683 ist der Standardfehler des Schatzers µ
I σ = 5.322 ist die aus den Daten geschatzte Standardabweich-ung
I Deutung: Vor der Datenerhebung ist m zufallig. Falls die Nor-malverteilungsannahme korrekt ist, ist auch µ normalverteilt mit:
- Erwartungswert µ- Varianz σ2/n
17 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
40 60 80 100 120 140 160
0.00
0.02
0.04
0.06
0.08
0.10
0.12
0.14
x
Dic
hte
40 60 80 100 120 140 160
0.00
0.02
0.04
0.06
0.08
0.10
0.12
0.14
x
40 60 80 100 120 140 160
0.00
0.02
0.04
0.06
0.08
0.10
0.12
0.14
Verschiedene Normalverteilungen
x
Y1 ~ N (104.1, 28.32)
((Y1 ++ Y2)) 2 ~ N (104.1, 28.32/2)
((∑∑i==1
10Yi)) 10 ~ N (104.1, 2.832)
40 60 80 100 120 140 160
0.00
0.02
0.04
0.06
0.08
0.10
0.12
0.14
x
Dic
hte
40 60 80 100 120 140 160
0.00
0.02
0.04
0.06
0.08
0.10
0.12
0.14
x
18 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
1.2 Schatzverfahren (Erwartungswert einer Populationunter Normalverteilungsnahme)
I Daten y1, . . . , yn (Stichprobe) mit Erwartungswert µ
I Rechtfertigung der Unabhangigkeits- und Normalver-teilungsannahme
I µ = 1n
n∑i=1
yi Schatzung fur den Erwartungswert µ der
Population
I σ2 = 1n−1
n∑i=1
(yi − y ·)2 Schatzung fur die Varianz der
Population (σ Standardabweichung)
I s2 = σ2
n Schatzung fur die Varianz von µ
I Schatzung fur den Standardfehler von µ: s =√
σ2
n = σ√n
19 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
SPSS-Output: die Schatzer fur die Daten ausBeispiel 1.1 (Intelligenzquotient)
Statistik StandardfehlerStatistik Statistik Statistik
VarianzStandardabweichungMittelwertN
Intelligenzquotient
Gültige Werte (Listenweise) 10
28,3225,3221,683104,1010
Deskriptive Statistik
µ = 104.1 (Mittelwert)
s = 1.683 (Standardfehler)
σ2 = 28.322 (empirischeVarianz)
σ = 5.322 (Standardabweichung)
20 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Beachte:I
µ =1
n
n∑i=1
yi ; σ2 =1
n − 1
n∑i=1
(yi − y ·)2; s =
√σ2
n
hangen von den Daten y1, . . . , yn ab (sind also vor Datener-hebung zufallig)
I (µ− a s, µ+ a s
)ist (vor der Datenerhebung) ein zufalliges Intervall, das miteiner bestimmten Wahrscheinlichkeit den Erwartungswert µenthalt
a −→ 0 =⇒ Wahrscheinlichkeit ≈ 0a −→∞ =⇒ Wahrscheinlichkeit ≈ 1
I Gesucht: zufalliges Intervall, das den unbekannten Erwart-ungswert mit einer vorgegebenen Wahrscheinlichkeit enthalt:Konfidenzintervall
21 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Das Konfidenzintervall
I Gebe eine Wahrscheinlichkeit 1− α vor (z.B. 1 - α = 95%)
I Bestimme a so, dass das zufallige Intervall
(µ− a s, µ+ a s)
den Parameter µ mit Wahrscheinlichkeit 1− α enthalt.
I Mathematische Statistik liefert
a = tn−1,1−α/2
(1− α/2)-Quantil der t-Verteilung mit n − 1 Freiheitsgraden
I Diese Werte sind tabelliert oder durch Software verfugbar.
I Das Intervall
I =(µ− tn−1,1−α/2 s, µ+ tn−1,1−α/2 s
)heißt (1− α) Konfidenzintervall fur µ.
22 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Verschiedene t-Verteilungen
t Vert.pdf
-4 -2 0 2 4
0.0
0.1
0.2
0.3
0.4
t t t
Dichten der t– Verteilung mit verschiedenen Freiheitsgraden
100
4
1
Dichten der t– Verteilung mit verschiedenen Freiheitsgraden
fn(t) =1√πn
Γ((n + 1)/2)
Γ(n/2)
(1 +
t2
n
)−(n+1)/2
23 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Das Quantil der t-Verteilung mit n Freiheits-graden
mit 095.pdf
-4 -2 0 2 4
0.0
0.1
0.2
0.3
0.4
Dichte der t4 -Verteilung
t 4, 0.95 = 2.132
0.95
P(T4 ≤ t4,0.95) =
∫ t4,0.95
−∞f4(t)dt = 0.95
24 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Beispiel 1.3 (Fortsetzung von Beispiel 1.1)
(1) Berechnung eines 90% Konfidenzintervalls fur µ
I n = 10, µ = 104.1, σ2 = 28.32
I α = 10%
I (aus Tabelle bzw. Software) t9,0.95 = 1.833
I 90% Konfidenzintervall fur µ = (101.02, 107.18)
(2) Beachte:
I Ein (1− α)-Konfidenzintervall ist ein “zufalliges” Intervall, dasden (unbekannten) Erwartungswert mit Wahrscheinlichkeit 1− αenthalt.
I Die Aussage: “das Intervall (101.02, 107.18) enthalt den unbe-kannten Erwartungswert der Population mit Wahrscheinlichkeit90%”, macht keinen Sinn!
25 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Erklarung des Begriffs “zufalliges” Intervall durchein “fiktives” Experiment
I Annahme: das Experiment (Untersuchung des IQ von 10 Kindern)kann N mal (unabhangig) wiederholt werden (z.B. 1000 mal)
I jeweils 10 Daten liefern ein (1− α)-Konfidenzintervall(z.B. 95 % Konfidenzintervall)Datensatz 1 −→ Konfidenzintervall I1Datensatz 2 −→ Konfidenzintervall I2
...Datensatz N −→ Konfidenzintervall IN
I c.a. (1− α) N (z.B. 95% 1000 = 950) Intervalle enthalten den(unbekannten) Erwartungswert µ der Population
26 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
1.4 Konfidenzbereich fur den Erwartungswert einer Po-pulation unter Normalverteilungsannahme
I Daten y1, . . . , yn (Stichprobe) mit Erwartungswert µ
I Rechtfertigung der Unabhangigkeits- und Normalverteil-ungsannahme
I Bestimme das tn−1,1−α/2 Quantil der t-Verteilung mit n− 1Freiheitsgraden (aus Tabelle oder Software)
I Das Intervall
(µ− tn−1,1−α/2s, µ+ tn−1,1−α/2s)
ist ein (1− α) Konfidenzintervall fur µ
I In vielen Softwarepaketen erhalt man direkt das Konfi-denzintervall als Ausgabe (z.B. in SPSS)
27 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
SPSS-Output: Konfidenzintervall fur die Datenaus Beispiel 1.1 (Intelligenzquotient)
MittlereDifferenzSig. (2-seitig)dfT ObereUntere
90% Konfidenzintervall der Differenz
Testwert = 100
Intelligenzquotient 7,181,024,100,03892,436
Test bei einer Sichprobe
Beachte:
I SPSS liefert nur ein Konfidenzintervall fur die Differenz µ− 100
=⇒ 90% Konfidentintervall fur den Erwartungswert µ
(101.02, 107.18)
28 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
1.2 t-Test fur eine Stichprobe
29 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Beispiel 1.5 (Fortsetzung von Beispiel 1.1)
Frage: Ist der IQ der Kinder aus Bochum hoher als 100?
H0 : µ ≤ 100 H1 : µ > 100
H0 nennt man Nullhypothese and H1 heißt Alternative.
I Intuitiv wurde man fur H1 entscheiden, falls der Mittelwert derStichprobe
µ =1
10
10∑i=1
yi
“groß” ist
I Beachte: µ andert sich, falls man die Daten anders skaliert!
I Besser: entscheide fur H1, falls µ groß im Verhaltnis zu demStandardfehler s ist (Invarianz bzgl. unterschiedlichenSkalierungen)
30 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Die Nullhypothese H0 : µ ≤ 100 wird abgelehnt falls
T =µ− 100
s> c
Fragen:
I Wie legt man den kritischen Wert c fest?
I Bei dem Verfahren konnen 2 Fehler auftreten
– Fehler erster Art: die Nullhypothese H0 wird abgelehnt, obwohlH0 in Wirklichkeit stimmt (d.h. der IQ ist nicht hoher als 100)
– Fehler zweiter Art: die Nullhypothese H0 wird nicht abgelehnt,obwohl in Wirklichkeit die Alternative H1 zutrifft (d.h. der IQ isthoher als 100)
Ziel: “kleine” Wahrscheinlichkeiten fur Fehler erster und zweiter Art
31 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Grundlegendes Prinzip der TesttheorieI Der kritische Wert c wird festgelegt, in dem man eine maximal
tolerierbare Wahrscheinlichkeit α fur einen Fehler erster Artvorgibt (α-Fehler)!
I Diese Wahrscheinlichkeit heißt Niveau des Tests
I Damit hat man keine Kontrolle uber die Wahrscheinlichkeit einesFehlers zweiter Art (β-Fehler)
I Z.B. Wahrscheinlichkeit fur Fehler erster Art soll maximalα = 5% = 0.05 sein
=⇒ (mathematische Statistik, Tabelle, Software)
n = 10, c = tn−1,1−α = t9,0.95 = 1.833
T =µ− 100
s=
104.1− 100√2.832
= 2.436 > 1.833
D.h. die Nullhypothese H0 : µ ≤ 100 wird zum Niveau α = 5% zuGunsten der Alternative H1 : µ > 100 verworfen (signifikantesErgebnis zum Niveau 5 %)
32 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Erklarung des Begriffs Niveau durch ein“fiktives” Experiment
I Annahme: das Experiment (Untersuchung des IQ von 10 Kindern)kann N mal (unabhangig) wiederholt werden (z.B. 1000 mal)
I jeweils 10 Daten liefern ein Ergebnis fur den Test zum Niveau α(z.B. Niveau 5 %)Datensatz 1 −→ Testergebnis 1Datensatz 2 −→ Testergebnis 2
...Datensatz N −→ Testergebnis N
I Falls die Nullhypothese H0 : µ ≤ 100 ”wahr” ist, so wird maximalin ca. αN (z.B. 5% 1000 = 50) Fallen fur die Alternative
H1 : µ > 100
entschieden
33 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Fehler erster und zweiter Art
in der Population giltH0 H1
Entscheidung auf- richtige β-Fehlergrund der Stich- H0 Enscheidungprobe zugunsten richtigevon: H1 α-Fehler Entscheidung
Beachte:
I Die Wahrscheinlichkeiten fur α-Fehler und β-Fehler verandernsich gegenlaufig
I Bei festem Niveau (Wahrscheinlichkeit fur α-Fehler) kann dieWahrscheinlichkeit fur einen β-Fehler durch Vergroßerung desStichprobenumfangs verkleinert werden
I Bei festem Stichprobenunfang wird ”nur” der Fehler erster Artkontolliert
34 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Die Verteilung von T falls µ = 100 ist.
-3 -2 -1 0 1 2 3
0.0
0.1
0.2
0.3
0.4
Dichte der t9 -Verteilung
α = 5 %
p– Wert
t 9, 0.95 = 1.833 T n = 2.436
I Kritischer Wert: tn−1,0.95 = 1.833 (H0 wird verworfen, falls Tgroßer als der kritische Wert ist)
I Blaue Flache: Niveau (α)I Rote Flache: p-Wert: Wahrscheinlichkeit einen Wert großer als
2.436 zu beobachten: P(T > 2.436) = 0.0188I Beachte: Ist der p-Wert < α (wie in diesem Beispiel) dann wird
H0 abgelehnt (signifikantes Ergebnis)35 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Testverfahren fur den Erwartungswert einerStichprobe unter Normalverteilungsannahme
1.6. Einstichproben t-Test fur rechtsseitige Hypothesen
I Hypothesen: H0 : µ ≤ µ0 ; H1 : µ > µ0 (rechtsseitigeHypothese)
I Daten y1, . . . , yn (Stichprobe) mit Erwartungswert µ
I Rechtfertigung der Unabhangigkeits- und Normalverteil-ungsannahme
I H0 wird zum Niveau α verworfen, falls
T =µ− µ0
s> tn−1,1−α
gilt, bzw. falls der p-Wert < α ist.
I µ: Schatzer fur µ; s: Schatzer fur den Standardfehler von µ
36 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Vertauschen der Hypothesen
1.7. Einstichproben t-Test fur linksseitige Hypothesen
I Hypothesen: H0 : µ ≥ µ0 ; H1 : µ < µ0 (linksseitigeHypothese)
I Daten y1, . . . , yn (Stichprobe) mit Erwartungswert µ
I Rechtfertigung der Unabhangigkeits- und Normalverteil-ungsannahme
I H0 wird zum Niveau α verworfen, falls
T =µ− µ0
s< −tn−1,1−α = tn−1,α
gilt, bzw. falls der p-Wert < α ist.
I µ: Schatzer fur µ; s: Schatzer fur den Standardfehler von µ
37 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Tests fur zweiseitige Hypothesen
1.8. Einstichproben t-Test fur zweiseitige Hypothesen
I Hypothesen: H0 : µ = µ0 ; H1 : µ 6= µ0 (zweiseitigeHypothese)
I Daten y1, . . . , yn (Stichprobe) mit Erwartungswert µ
I Rechtfertigung der Unabhangigkeits- und Normalverteil-ungsannahme
I H0 wird zum Niveau α verworfen, falls
|T | = | µ− µ0
s| > tn−1,1−α/2
gilt, bzw. falls der p-Wert kleiner als α ist.
I µ: Schatzer fur µ; s: Schatzer fur den Standardfehler von µ
38 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Die Verteilung von T falls µ = 100 ist.
-3 -2 -1 0 1 2 3
0.0
0.1
0.2
0.3
0.4
α = 2,5 % α = 2,5 %
p– Wert p– Wert
Dichte der t9 -Verteilung
t 9, 0.975 = 2.262 T n = 2.436 t 9, 0.025 = -2.262 -T n = -2.436
I Blaue Flache: Niveau α; Rote Flache: p-Wert (Wahrscheinlichkeiteinen Wert zu beobachten, dessen Betrag großer als 2.436 istP(|T | > 2.436) = 0.038
I Beachte: Ist der p-Wert < α (wie in diesem Beispiel), dann wirdH0 abgelehnt!
39 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
SPSS-Output bei Anwendung des t-Tests auf dieDaten aus Beispiel 1.1 (Intelligenzquotient)
MittlereDifferenzSig. (2-seitig)dfT ObereUntere
90% Konfidenzintervall der Differenz
Testwert = 100
Intelligenzquotient 7,181,024,100,03892,436
Test bei einer Sichprobe
Beachte:
I SPSS liefert nur den p-Wert fur den zweiseitigen t-Test ausBeispiel 1.8!
I Den p-Wert fur den einseitigen Test erhalt man als0.038/2 = 0.019.
40 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
1.9 Bemerkungen (zu den statistischen Verfahren1.2, 1.4, 1.6, 1.7, 1.8)
I Mathematische Statistik ⇒ unter der Normalverteilungsannahmesind alle hier vorgestellten Verfahren optimal
I die Normalverteilungsannahme kann (und sollte) manrechtfertigen. Mogliche Verfahren sind:
I statistische Tests fur die Hypothese
H0 : Y1, . . . ,Yn normalverteilt
In SPSS ublich sind
- Kolmogorov-Smirnov-Test- Shapiro-Wilk Test
I Explorative Verfahren. In SPSS ublich: QQ-Plot
I besteht die Normalverteilungsannahme diese Uberprufung nicht,so sind z.B. nichtparametrische Verfahren anzuwenden
41 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Der QQ-PlotI Unter der Modellannahme gilt: die Großen Yi sind normalverteilt
mit Erwartungswert µ und Varianz σ2
I Der QQ-Plot vergleicht grafisch die empirischen Quantile der“Daten” y1, . . . , yn mit den Quantilen der Normalverteilung mitErwartungswert µ und Varianz σ2.(1) 1/n-Quantil der Stichprobe y1, . . . , yn =⇒ kleinste der
Beobachtungen y(1) (in Beispiel 1.1 ist y(1) = 97)(1− 1/2)/n-Quantil der Normalverteilung mit Erwartungswert µund Varianz σ2 =⇒ (im Beispiel 1.1 ist z(1) = 104.1− 1.64 · 5.32= 95.37 )
(2) 2/n Quantil der Stichprobe y1, . . . , yn =⇒ zweitkleinste derBeobachtungen y(2) (in Beispiel 1.1 ist y(2) = 98 )(2− 1/2)/n-Quantil der Normalverteilung mit Erwartungswert µund Varianz σ2 =⇒ (in Beispiel 1.1 ist z(2) = 104.1− 1.04 · 5.32= 98.57 )
(3) usw.I Der QQ-Plot ist das Streudiagramm der Daten
(y(1), z(1)), . . . , (y(n), z(n))
I In in vielen Fallen enthalt dieses Diagramm noch die Winkelhalb-ierende des entsprechenden Quadranten
42 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
SPSS Output: QQ-Plot fur die Daten ausBeispiel 1.1
Beobachteter Wert
11511010510095
Erw
arte
ter
Wer
t vo
n N
orm
al
115
110
105
100
95
Q-Q-Diagramm von Normal von Intelligenzquotient
43 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
1.3 Zweistichprobenprobleme
44 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Beispiel 1.10 (Erkennen von Zahlenreihen)
I Studierende der Fachrichtungen Mathematik (M) und Psychologie(P) machen einen Zahlengedachtnistest
– Wie viele Ziffern konnen sich maximal gemerkt werden
– Wiedergabe in Original und umgekehrter Reihenfolge
I Daten (P. Zofel: Statistik fur Psychologen)
M 14 14 15 12 13 19 17 13P 13 14 13 12 16 16 10 16
M 14 17 15 13 16 13P
I Frage: Haben Studierende der Psychologie ein besseresZahlengedachtnis als Studierende der Mathematik?
45 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Mathematisches Modell (n1 = 14, n2 = 8)
I Yij := µi + εij j = 1, . . . , ni ; i = 1, 2
Yij : Ergebnis der j-ten Versuchsperson in Gruppe i(Mathematik: i = 1, Psychologie i = 2)
µi : unbekannter Erwartungswert in der Population i(Mathematik: i = 1, Psychologie: i = 2)
εij : Storgroßen (Meßfehler, Tagesform ...)
ni : Stichprobenumfang in Gruppe i
I Normalverteilungs und Unabhangigkeitsannahme
- in jeder Gruppe (i = 1, 2) liegt eine Normalverteilung mitErwartungswert µi und Varianz σ2
i vor
- in jeder Gruppe sind die Beobachtungen unabhangig
- unabhangige Stichproben
46 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Schatzer
I Schatzer werden wie in 1.2 fur jede Gruppe durchgefuhrt
Mathematiker (i=1) : µ1 = y 1· = 1n1
n1∑j=1
y1j = 14.64
σ21 = 1
n1−1
n1∑j=1
(y1j − y 1·)2 = 3.94⇒ s1 =
√σ2
1
n1= 0.53
Psychologen (i=2): µ2 = y 2· = 1n2
n2∑j=1
y2j = 13.75
σ22 = 1
n2−1
n2∑j=1
(y2j − y 2·)2 = 4.79⇒ s2 =
√σ2
2
n2= 0.77
I Auch Konfidenzbereiche werden gruppenweise bestimmtz.B. unter Normalverteilungsannahme ist(
µ1 − tn1−1,1−α/2s1, µ1 + tn1−1,1−α/2s1
)ein 90% Konfidenzinterval fur µ1. Fur das spezielle Datenbeispielergibt sich [n1 = 14, α = 10%, t13,0.95 = 1.77 (aus Tabelle)](13.70, 15.58) als 90% Konfidenzintervall fur µ1
47 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
SPSS-Output fur die Daten aus Beispiel 1.10
Schatzer fur die Parameter in den einzelnen Gruppen
VarianzMittelwertMathematik
Psychologie
Insgesamt 4,22714,32
4,78613,75
3,94014,64StudienfachStudienfach
Gemerkte Zahlen
Beachte:
I SPSS liefert hier die Schatzer fur Erwartungswert und Varianz dereinzelnen Gruppen
I SPSS liefert außerdem Schatzer fur Erwartungswert und Varianzder gesamten Stichprobe
48 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Tests zum Vergleich der Erwartungswerte
I Nullhypothese: Zahlengedachtnis der Psychologiestudenten istnicht schlechter als das der Mathematikstudenten
H0 : µ1 ≤ µ2
I Alternative: Zahlengedachtnis der Mathematikstudenten ist besserals das der der Psychologiestudenten
H1 : µ1 > µ2
I Rezept: Verwerfe die Nullhypothese H0 zu Gunsten derAlternative H1, falls die Differenz
y 1· − y 2·
der Schatzer fur die Erwartungswerte “groß” ist
49 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Rezept im Fall von Varianzhomogenitat, d.h.(σ2
1 = σ22)
I Verwerfe H0 zu Gunsten von H1, falls y 1· − y 2· “groß” ist
I Normiere diese Große mit einem Schatzer fur die Standardab -weichung der Mittelwertdifferenz:
I s =√
( 1n1
+ 1n2
)σ2
I σ2 = 1n1+n2−2
{(n1 − 1)σ21 + (n2 − 1)σ2
2}: Schatzer fur Varianz (die
in beiden Gruppen dieselbe ist)
I Entscheide fur die Alternative H1 : µ1 > µ2, falls
Tn1,n2 =y 1· − y 2·
s> tn1+n2−2,1−α
gilt. Dabei ist tn1+n2−2,1−α das (1− α)-Quantil der t-Verteilungmit n1 + n2 − 2 Freiheitsgraden
I Im Beispiel ergibt sich fur einen Test zum Niveau α = 5%
σ2 = 4.24, t20,0.95 = 1.725 =⇒ T14,8 = 0.979
d.h. die Hypothese H0 kann nicht verworfen werden.
50 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Testverfahren fur die Erwartungswerte von zweiStichproben unter Normalverteilungsannahme
1.11(a) Einseitiger t-Test fur zwei unabhangige Stich-proben (rechtsseitige Hypothese)
I Dateny11, . . . , y1n1 (Gruppe 1; Erwartungswert µ1; Varianz σ2
1)y21, . . . , y2n2 (Gruppe 2; Erwartungswert µ2; Varianz σ2
2)
I Rechtfertigung der Voraussetzungen– Unabhangigkeit in und zwischen den Gruppen– Normalverteilungsannahme (in beiden Gruppen)– Varianzhomogenitat, d.h. σ2
1 = σ22
I Die Hypothese H0 : µ1 ≤ µ2 wird zu Gunsten derAlternative H1 : µ1 > µ2 verworfen, falls
Tn1,n2 =y 1· − y 2·
s> tn1+n2−2,1−α
gilt, bzw. der p-Wert < α ist. s =√
( 1n1
+ 1n2
)σ2 ist der
Schatzer fur den Standardfehler der Mittelwertdifferenz
51 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
1.11(b) Einseitiger t-Test fur zwei unabhangige Stich-proben (linksseitige Hypothese)
I Dateny11, . . . , y1n1 (Gruppe 1; Erwartungswert µ1; Varianz σ2
1)y21, . . . , y2n2 (Gruppe 2; Erwartungswert µ2; Varianz σ2
2)
I Rechtfertigung der Voraussetzungen– Unabhangigkeit in und zwischen den Gruppen– Normalverteilungsannahme (in beiden Gruppen)– Varianzhomogenitat, d.h. σ2
1 = σ22
I Die Hypothese H0 : µ1 ≥ µ2 wird zu Gunsten derAlternative H1 : µ1 < µ2 verworfen, falls
Tn1,n2 =y 1· − y 2·
s< −tn1+n2−2,1−α = tn1+n2−2,α
gilt, bzw. der p-Wert < α ist. s =√
( 1n1
+ 1n2
)σ2 ist der
Schatzer fur den Standardfehler der Mittelwertdifferenz.
52 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
1.11(c) t-Test fur zwei unabhangige Stichproben (zwei-seitige Hypothesen)
I Dateny11, . . . , y1n1 (Gruppe 1; Erwartungswert µ1; Varianz σ2
1)y21, . . . , y2n2 (Gruppe 2; Erwartungswert µ2; Varianz σ2
2)
I Rechtfertigung der Voraussetzungen– Unabhangigkeit in und zwischen den Gruppen– Normalverteilungsannahme (in beiden Gruppen)– Varianzhomogenitat, d.h. σ2
1 = σ22
I Die Nullhypothese H0 : µ1 = µ2 (kein Unterschied derErwartungswerte in beiden Gruppen) wird zu Gunsten derAlternative H1 : µ1 6= µ2 verworfen, falls
|Tn1,n2 | =|y 1· − y 2·|
s> tn1+n2−2,1−α/2
gilt, bzw. der p-Wert < α ist. s =√
( 1n1
+ 1n2
)σ2 ist der
Schatzer fur den Standardfehler der Mittelwertdifferenz.53 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Bemerkung zur Varianzhomogenitat
Ist die Annahme der Varianzhomogenitat
σ21 = σ2
2
nicht erfullt, so
I wird die vorgegebene Wahrscheinlichkeit fur einen α-Fehler nichteingehalten (der Test halt sein Niveau nicht)
I ist die Wahrscheinlichkeit fur einen β-Fehler großer
I von Interesse ist daher auch ein Test fur die Hypothesen
H0 : σ21 = σ2
2 H1 : σ21 6= σ2
2
und ein Verfahren, das ohne die Annahme der Varianzhomo-genitat auskommt
54 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Rezept (fur Test auf Varianzhomogenitat)
I Die Nullhypothese H0 : σ21 = σ2
2 gilt genau dann, wenn
F =σ2
1
σ22
= 1
I Schatze den Quotienten der beiden Varianzen, durch
Fn1−1,n2−1 =σ2
1
σ22
=1
n1−1
∑n1
j=1(y1j − y 1·)2
1n2−1
∑n2
j=1(y2j − y 2·)2
I Die Nullhypothese H0 wird zu Gunsten der AlternativeH1 : σ2
1 6= σ22 verworfen, falls
Fn1−1,n2−1 > c2 oder Fn1−1,n2−1 < c1
gilt
I Die kritischen Werte c1 und c2 werden so festgelegt, dass dieWahrscheinlichkeit fur einen Fehler erster Art maximal α ist!
55 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
1.12 F -Test fur den Vergleich von zwei Stichprobenva-rianzen
I Teststatistik
Fn1−1,n2−1 =σ2
1
σ2
I Die NullhypotheseH0 : σ2
1 = σ22
(die Varianzen sind gleich) wird zu Gunsten der Alternative
H1 : σ21 6= σ2
2
verworfen, falls mindestens eine der Ungleichungen
Fn1−1,n2−1 < Fn1−1,n2−1,α/2
Fn1−1,n2−1 > Fn1−1,n2−1,1−α/2
erfullt ist
I Fn1−1,n2−1,β bezeichnet das β-Quantil der F -Verteilung mit(n1 − 1, n2 − 1) Freiheitsgraden
56 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Verschiedene F -Verteilungen
F Vert.pdf
0 1 2 3 4 5
0.0
0.2
0.4
0.6
0.8
1.0
F F F F
Dichten der F– Verteilung mit verschiedenen Freiheitsgraden
2, 10
4, 4
10, 1
20, 20
fm,n(x) =Γ(m+n
2 )
Γ(m2 )Γ( n
2 )
(m
2
)m/2 xm/2−1
(1 + mn x)(m+n)/2
(x ≥ 0)
57 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Das Quantil der F -Verteilung mit (n1, n2) Frei-heitsgraden
4 4 mit 090.pdf
0 1 2 3 4 5
0.0
0.1
0.2
0.3
0.4
0.5
0.6
Dichte der F4, 4 -Verteilung
F 4, 4; 0.9 = 4.107
0.9
P(F4,4,≤ F4,4,0.9) =
∫ F4,4,0.9
−∞fm,n(x)dx = 0.90
58 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Der F -Test auf Varianzhomogenitat fur dieDaten aus Beispiel 1.10 (n1 = 14, n2 = 8)
I σ21 = 3.94 σ2
2 = 4.79 ⇒ F13,7 = 0.823
I Fur das Niveau α = 10% erhalt man
F13,7,0.05 = 0.3531 F13,7,0.95 = 3.5503
und damit kann die Nullhypothese zum Niveau 10% nichtverworfen werden
I Beachte: oft wird der Test 1.12 verwendet, um die Voraus-setzungen fur den t-Test zu uberprufen
I In diesem Fall wahlt man oft ein großeres Niveau (→ kleinereWahrscheinlichkeit fur β-Fehler)
I Der Gesamttest (erst F -Test, falls H0 nicht verworfen wird, dannt-Test) hat nicht das Niveau α
I Was macht man, falls F -Test H0 verwirft?
59 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
1.13(i) t-Test fur zwei unabhangige Stichproben mitnicht notwendig gleichen Varianzen (Welch-Test)
I Dateny11, . . . , y1n1 (Gruppe 1; Erwartungswert µ1; Varianz σ2
1)y21, . . . , y2n2 (Gruppe 2; Erwartungswert µ2; Varianz σ2
2)
I Rechtfertigung der Voraussetzungen– Unabhangigkeit in und zwischen den Gruppen– Normalverteilungsannahme (in beiden Gruppen)
I Varianzen in den Gruppen sind nicht notwendig gleich
I Teststatistik
T Wn1,n2
=y 1· − y 2·
τ
I Dabei
τ =√τ 2 =
√σ2
1
n1+σ2
2
n2
ist die Schatzung fur die Varianz von y 1· − y 2·60 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
1.13(ii) t-Test fur zwei unabhangige Stichproben mitnicht notwendig gleichen Varianzen (Welch-Test);
I Die NullhypotheseH0 : µ1 ≤ µ2
(Erwartungswert der ersten Population nicht großer als derder Zweiten) wird zu Gunsten der Alternative
H1 : µ1 > µ2
falls
T Wn1,n2
> tf ,1−α
gilt, bzw. der p-Wert < α ist. Dabei bezeichnet
f =(s2
1 + s22 )2
s41
n1−1 +s4
2
n2−1
die geschatzten Freiheitsgrade der t-Verteilung.61 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
1.13(iii) t-Test fur zwei unabhangige Stichproben mitnicht notwendig gleichen Varianzen (Welch-Test)
I Die NullhypotheseH0 : µ1 ≥ µ2
(Erwartungswert der ersten Population nicht kleiner als derder Zweiten) wird zu Gunsten der Alternative
H1 : µ1 < µ2
verworfen, falls
T Wn1,n2
< tf ,α = −tf ,1−α
gilt, bzw. der p-Wert < α ist. Dabei bezeichnet
f =(s2
1 + s22 )2
s41
n1−1 +s4
2
n2−1
die geschatzten Freiheitsgrade der t-Verteilung.62 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
1.13(iv) t-Test fur zwei unabhangige Stichproben mitnicht notwendig gleichen Varianzen (Welch-Test)
I Die NullhypotheseH0 : µ1 = µ2
(kein Unterschied der Erwartungswerte in beiden Gruppen)wird zu Gunsten der Alternative
H1 : µ1 6= µ2
(es besteht ein Unterschied) verworfen, falls
|T Wn1,n2| > tf ,1−α/2
gilt, bzw. der p-Wert < α ist. Dabei bezeichnet
f =(s2
1 + s22 )2
s41
n1−1 +s4
2
n2−1
die geschatzten Freiheitsgrade der t-Verteilung.63 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Bemerkung: t-Test oder Welch-Test?
I Sind die Voraussetzungen fur den t-Test erfullt (Normalver-teilung, Unabhangigkeit, Varianzhomogenitat), so ist diesesVerfahren optimal, d.h. dieser Test minimiert unter allen Testszum Niveau α die Wahrscheinlichkeit fur einen β-Fehler
I Ist die Voraussetzungen der Varianzhomogenitat beim t-Testnicht erfullt, so wird die vorgegebene Wahrscheinlichkeit fureinen α-Fehler nicht eingehalten
I Der Welch-Test ist eine “Naherungslosung”, d.h. die Wahrschein-lichkeit fur einen α-Fehler ist ”nur” naherungsweise α
I Der Welch-Test hat im Fall der Varianzhomogenitat eine großereWahrscheinlichkeit fur einen β-Fehler als der t-Test
64 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
SPSS-Output fur die Daten aus Beispiel 1.10
SignifikanzF Sig. (2-seitig)dfT
T-Test für die MittelwertgleichheitLevene-Test der Varianzgleichheit
Varianzen sind gleich
Varianzen sind nicht gleich
Gemerkte Zahlen
,35813,523,952
,33920,979,752,103
Test bei unabhängigen Stichproben
Standardfehlerder Differenz
MittlereDifferenz ObereUntere
95% Konfidenzintervall der Differenz
T-Test für die Mittelwertgleichheit
Varianzen sind gleich
Varianzen sind nicht gleich
Gemerkte Zahlen
2,911-1,125,938,893
2,796-1,010,912,893
Test bei unabhängigen Stichproben
Beachte:
I SPSS liefert nicht den in 1.12 dargestellten F -Test auf Varianzhomogenitatsondern ein “robustes” Verfahren (Levene-Test)
I SPSS liefert nur einen p-Wert fur den zweiseitigen t-Test aus Beispiel 1.11(c)bzw. zweiseitigen Welch-Test aus Beispiel 1.13(iv)
I SPSS liefert ein Konfidenzintervall fur die Differenz µ1 − µ2
=⇒ 95% Konfidentintervall fur die Differenz der Erwartungswerte (unter derAnnahme gleicher Varianzen)
(−1.01, 2.796)65 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
1.4 Einfaktorielle Varianzanalyse
66 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Beispiel 1.14 (Fortsetzung von Beispiel 1.10)
I An dem Zahlengedachtnistest (vgl. Beispiel 1.10) nehmen auchnoch 7 Studierende der Geisteswissenschaften (G) teil.
M 14 14 15 12 13 19 17 13P 13 14 13 12 16 16 10 16G 11 13 13 10 13 12 13 -
M 14 17 15 13 16 13 - -P - - - - - - - -G - - - - - - - -
I Frage: Existieren Unterschiede hinsichtlich des Zahlenge-dachtnisses zwischen dem Studierenden der Psychologie,Mathematik und Geisteswissenschaften?
67 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Mathematisches Modell (n1 = 14, n2 = 8, n3 = 7)
I Yij := µi + εij j = 1, . . . , ni ; i = 1, 2, 3
Yij : Ergebnis der j-ten Versuchsperson in Gruppe i (Mathe-matik: i = 1, Psychologie: i = 2, Geisteswisenschaften:i = 3)
µi : unbekannter Erwartungswert in der Population i (Mathe-matik: i = 1, Psychologie: i = 2,Geisteswisenschaften:i = 3)
εij : Storgroßen (Erwartungswert 0 und Varianz σ2)
I Normalverteilungs und Unabhangigkeitsannahme
- in jeder Gruppe (i = 1, 2, 3) liegt eine Normalverteilung mitErwartungswert µi vor
- in jeder Gruppe sind die Beobachtungen unabhangig- unabhangige Stichproben
I NullhypotheseH0 : µ1 = µ2 = µ3
68 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Schatzer und Konfidenzbereiche
I Schatzer fur Erwartungswert und Varianz werden in den einzelnenGruppen durchgefuhrt
I Beispiel:
y i· σ2i si ni
Mathematik (i = 1) 14.64 3.94 0.53 14Psychologie (i = 2) 13.75 4.79 0.60 8Geisteswissenschaften (i = 3) 12.14 1.48 0.46 7
I µ1 = 14.64 ist Schatzer fur den “Erwartungswert derMathematiker”
I Beachte: t6,0.95 = 1.943, µ3 + s3t6,0.95 = 13.03µ3 − s3t6,0.95 = 11.25, also ist das Intervall
[11.25, 13.03]
ein 90% Konfidenzintervall fur den ”Erwartungswert derGeisteswissenschaftler”
69 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
SPSS Output
NStandardfehler
des MittelwertesVarianzMittelwertMathematik
Psychologie
Geisteswissenschaften
Insgesamt 29,3894,38413,79
7,4591,47612,14
8,7734,78613,75
14,5303,94014,64StudienfachStudienfach
Gemerkte Zahlen
70 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Prinzip der Varianzanalyse
I Ziel: Test fur die Hypothese “es bestehen keine Unterschiedezwischen den Gruppen”
H0 : µ1 = µ2 = µ3
I Idee: Bestimme die Streuung der Daten:
I Mittelwert:
y ·· =1
n
3∑i=1
ni∑j=1
yij
I Varianz (n = n1 + n2 + n3)
1
n − 1
3∑i=1
ni∑j=1
(yij − y ··)2
und versuche Unterschiede in der Merkfahigkeit aufgrund derGruppenzugehorigkeit durch eine Zerlegung der Streuung bzgl.der Gruppen zu erklaren!
71 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Prinzip der Varianzanalyse
I Zerlegung der Summe der Quadrate (Sum of squares)
– Summe der Quadrate innerhalb der Gruppen (within groups)
SSR =3∑
i=1
ni∑j=1
(yij − y i·)2
– Summe der Quadrate zwischen den Gruppen (between groups)
SSM =3∑
i=1
ni (y i· − y ··)2
wobei n = n1 + n2 + n3 = 29 die Gesamtzahl der Beobachtungen
bezeichnet und
y ·· =1
n
3∑i=1
ni∑j=1
yij
den Mittelwert aus allen Beobachtungen.
72 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Prinzip der Varianzanalyse
I Zerlege die Summe der Quadrate in eine durch das Modellerklarte Summe (Varianz zwischen den Gruppen) und eine Summevon Quadraten der Storgroßen (Varianz innerhalb der Gruppen)
SST =3∑
i=1
ni∑j=1
(yij − y ··)2
︸ ︷︷ ︸Gesamtvarianz (Total)
=3∑
i=1
ni∑j=1
(yij − y i·)2
︸ ︷︷ ︸Gesamtvarianz innerhalb der Gruppen
+k∑
i=1
ni (y i· − y ··)2
︸ ︷︷ ︸Varianz zwischen den Gruppen
73 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
F -Test fur die Hypothese H0 : µ1 = µ2 = µ3
(gleiche Erwartungswerte in den drei Gruppen)
I Vergleiche die Varianz zwischen den Gruppen mit der Varianzinnerhalb der Gruppen
F =
13−1
3∑i=1
ni (y i· − y ··)2
129−3
3∑i=1
ni∑j=1
(yij − y i·)2
Falls F “groß” ist, wird die Nullhypothese H0 abgelehnt.
I Mathematische Statistik ⇒ Test zum Niveau α verwirft dieNullhypothese H0, falls
F > F2,26,1−α
gilt (Vergleich mit dem (1− α)-Quantil der F -Verteilung mit(2,26) Freiheitsgraden), bzw. falls der zugehorige p-Wert desTests kleiner als α ist.
74 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Beispiel 1.15 (Fortsetzung von Beispiel 1.12)
I Frage: “besteht ein Unterschied zwischen den Studierenden derFacher Psychologie, Mathematik und Geisteswissenschaften bzgl.des Zahlengedachtnisses”Genauer: Besteht ein Unterschied zwischen den Erwartungs-werten der drei Gruppen: H0 : µ1 = µ2 = µ3
I n1 = 14, n2 = 8, n3 = 7; α = 5% F2,26,0.95 = 3.37
F =SSM/2
SSR/26=
14.6
3.6= 4.06 > 3.37
I D.h. die Hypothese: H0 : µ1 = µ2 = µ3 wird zum Niveau 5%abgelehnt.
I In anderen Worten: zwischen den Studierenden der verschiedenenFacher besteht ein Unterschied
I Beachte: In vielen Fallen ist man an der Frage interessiert,zwischen welchen Gruppen ein Unterschied besteht. DieseFrage beantwortet der F -test nicht!
75 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
F -Verteilung
0 1 2 3 4 5
0.0
0.2
0.4
0.6
0.8
1.0
x
Dic
hte
F == 4.06
0 1 2 3 4 5
0.0
0.2
0.4
0.6
0.8
1.0
x
Dic
hte
Dichte der F2,26 −− Verteilung
F2,26,0.95 == 3.37
0 1 2 3 4 5
0.0
0.2
0.4
0.6
0.8
1.0
x
Dic
hte
76 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
F -Verteilung
2.5 3.0 3.5 4.0 4.5 5.0
0.00
0.05
0.10
0.15
x
Dic
hte
F2,26,0.95 == 3.37 F == 4.06
Dichte der F2,26 −− Verteilung ((Zoom))
αα == 5%
p−Wert
2.5 3.0 3.5 4.0 4.5 5.0
0.00
0.05
0.10
0.15
x
Dic
hte
I Blaue Flache: Niveau des Tests
I Rote Flache: p-Wert (Wahrscheinlichkeit, daß ein Wert großer alsF = 4.06 beobachtet wird)
77 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Varianzanalysetabelle (k bezeichnet die Anzahlder Gruppen)
Variabilitat Sum of Squares df SS/df F
zwischen SSM k − 1 SSM/(k − 1) SSM
k−1 /SSR
n−k
innerhalb SSR n − k SSR/(n − k)gesamt SST n − 1 SST/(n − 1)
Beispiel (Zahlengedachtnis)
Variabilitat Sum of Squares df SS/df Fzwischen 29.2 2 14.6 4.06innerhalb 93.6 26 3.6gesamt 122.8 28
78 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
SPSS Output
SignifikanzFMittel der QuadratedfQuadratsumme
Zwischen den Gruppen
Innerhalb der Gruppen
Gesamt 28122,759
3,5992693,571
,0294,05514,594229,187
Gemerkte Zahlen
79 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Beispiel 1.16 (Fortsetzung von Beispiel 1.15)
I Bei signifikantem Ergebnis der Varianzanalyse (d.h. die Hypothesegleicher Erwartungswerte wird abgelehnt) stellt sich die Frage:“Welche Gruppe ist maßgeblich fur die Signifikanzverantwortlich?”
I Losungsvorschlag: paarweise Vergleiche!
Gruppe 1 - Gruppe 2; H12 : µ1 = µ2
Gruppe 1 - Gruppe 3; H13 : µ1 = µ3
Gruppe 2 - Gruppe 3; H23 : µ2 = µ3
I Jeder Vergleich wird mit dem Zwei- Stichproben t-Test (vgl.1.11(b)) durchgefuhrt.
I Dabei ist zu beachten, dass das Gesamtverfahren: Verwerfe dieHypothese H0 : µ1 = µ2 = µ3, falls mindestens ein Paarvergleichsignifikant ist das Niveau α einhalt .
I Die t-Tests fur die paarweisen Vergleiche sind mit Niveau α/3durchzufuhren. Man dividiert durch 3, da 3 paarweise Vergleichedurchgefuhrt werden (Bonferroni-Methode)
80 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Paarweise Vergleiche mit Zwei-Stichprobent-Tests (α = 5%):
I Test-Statistik fur den Vergleich von Gruppe i mit Gruppe j :
Tni ,nj =|Yi· − Yj·|
sij
s2ij =
( 1
ni+
1
nj
)( 1
ni + nj − 2{(ni − 1)σ2
i + (nj − 1)σ2j })
i j Tni ,nj ni nj tni +nj−2,1−α′/2 p-Wert signifikant1 2 0.98 14 8 2.61 0.339 nein1 3 3.04 14 7 2.62 0.007 ja2 3 1.72 8 7 2.74 0.109 nein
Beachte: die paarweisen Vergleiche werden zum Niveau α′ = α/3= 5%/3 = 0.0167 durchgefuhrt (da man 3 Vergleiche macht).
I Mit dieser Methode kann man zum Niveau 5% einen signifi-kanten Unterschied zwischen den Gruppen feststellen.
I Bonferroni-Methode ist konservativ (d.h. das wirkliche Niveaudes Verfahrens wird unterschatzt
I Ist die Anzahl der Paarvergleiche groß, so ist dieses Verfahrennicht zu empfehlen.
81 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Post-Hoc-Test “Bonferroni” in SPSS
I Verwendet andere Schatzung fur den Standardfehler der Differenzder Mittelwerte aus Gruppe i und j :
s2ij =
(1
ni+
1
nj
)(1
n − 3
3∑k=1
(nk − 1)σ2k
)
I An Stelle der Quantile der t-Verteilung mit ni + nj − 2 Freiheits-graden mussen dann die Quantile der t-Verteilung mit n − 3Freiheitsgraden verwendet werden (n = n1 + n2 + n3)
I Das Niveau fur die Paarvergleiche muss dann wieder durch dieAnzahl der Vergleich dividiert werden (im Beispiel α′ = α/3)
I Adjustierung der p-Werte erfolgt durch Multiplikation derp-Werte aus den Paarvergleichen mit der Anzahl der Vergleiche
82 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
SPSS Output paarweise Vergleiche mit derBonferroni-Methode
SignifikanzStandardfehlerMittlere
Differenz (I-J) ObergrenzeUntergrenze
95%-Konfidenzintervall
Psychologie
Geisteswissenschaften
Mathematik
Geisteswissenschaften
Mathematik
Psychologie
Mathematik
Psychologie
Geisteswissenschaften
,91-4,12,341,982-1,607
-,25-4,75,026,878-2,500*
4,12-,91,341,9821,607
1,26-3,04,894,841-,893
4,75,25,026,8782,500*
3,04-1,26,894,841,893(I) Studienfach (J) Studienfach(I) Studienfach (J) Studienfach
Mehrfachvergleiche
Gemerkte ZahlenBonferroni
*. Die Differenz der Mittelwerte ist auf dem Niveau 0.05 signifikant.
83 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Scheffe-Methode (α = 5%)
I Fur den Vergleich der Gruppe i mit j betrachte:
ds(i , j) =
√3− 1
29− 3SSR · F2,26,0.95(
1
ni+
1
nj)
=
√2
26· 93.6 · 3.37(
1
ni+
1
nj) = 4.93
√1
ni+
1
nj
und vergleiche diese Große mit Mittelwertdifferenz Y i· − Y j·
I Ergebnis
i j y i· − y j· ds(i , j) Ergebnis1 2 0.89 2.18 kein sign. Unterschied1 3 2.5 2.28 y 1· sign. großer als y ·32 3 1.61 2.55 kein sign. Unterschied
84 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Einige Bemerkungen zur Scheffe-Methode:
I Die Scheffe-Methode garantiert, dass die Wahrscheinlichkeit einesα-Fehlers fur jeden beliebigen a-posteriori durchgefuhrtenEinzelvergleichstests nicht großer ist als der α-Fehler des F -Tests
I Kurz: Die Signifikanzaussagen gelten simultan fur ALLEPaarvergleiche mit dem Gesamtniveau α
I Die Scheffe-Methode ist ein konservatives Verfahren
I Die Wahrscheinlichkeit eines α-Fehlers ist eher kleiner als dasvorgegebene Niveau
I man entscheidet tendenziell eher zu oft fur H0
85 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
SPSS Output paarweise Vergleiche mit derScheffe-Methode
SignifikanzStandardfehlerMittlere
Differenz (I-J) ObergrenzeUntergrenze
95%-Konfidenzintervall
Psychologie
Geisteswissenschaften
Mathematik
Geisteswissenschaften
Mathematik
Psychologie
Mathematik
Psychologie
Geisteswissenschaften
,94-4,16,279,982-1,607
-,22-4,78,029,878-2,500*
4,16-,94,279,9821,607
1,29-3,08,576,841-,893
4,78,22,029,8782,500*
3,08-1,29,576,841,893(I) Studienfach (J) Studienfach(I) Studienfach (J) Studienfach
Mehrfachvergleiche
Gemerkte ZahlenScheffé-Prozedur
*. Die Differenz der Mittelwerte ist auf dem Niveau 0.05 signifikant.
86 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
1.17 Einfaktorielle Varianzanalyse (zum Vergleichvon k unabhangigen Stichproben)
Modellannahmen und Hypothese
I Daten (n =∑k
i=1 ni )
y11, . . . , y1n1 (Gruppe 1, Erwartungswert µ1; Varianz σ21)
......
...yk1, . . . , yknk
(Gruppe k , Erwartungswert µk ; Varianz σ2k)
I Nullhypothese: es besteht kein Unterschied zwischen denErwartungswerten der einzelnen Gruppen:
H0 : µ1 = µ2 = . . . = µk
I Rechtfertigung der VoraussetzungenI Unabhangigkeit zwischen den Gruppen
I Unabhangigkeit innerhalb der Gruppen
I Normalverteilungsannahme
I Varianzhomogenitat: σ21 = σ2
2 = · · · = σ2k
87 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
F-Test fur die einfaktorielle Varianzanalyse (zum Ver-gleich von k unabhangigen Stichproben)
I Die Hypothese H0 : µ1 = µ2 = . . . = µk gleicher Erwart-ungswerte in allen Gruppen wird verworfen, falls
F =1
k−1 SSM
1n−k SSR
> Fk−1,n−k,1−α
Dabei ist:
SSM =k∑
i=1
ni (y i· − y ··)2
(sum of squares between groups)
SSR =k∑
i=1
ni∑j=1
(yij − y i·)2
(sum of squares within groups) und Fk−1,n−k,1−α das(1− α)-Quantil der F -Verteilung mit (k − 1, n − k)Freiheitsgraden
88 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
1.18 Paarweise Vergleich mit der Scheffe-Methode (No-tation wie in 1.15)
I wird die Nullhypothese H0 : µ1 = µ2 = · · · = µk abgelehnt,so kann mit der Scheffe-Methode festgestellt werden,“welche Gruppen fur die Signifikanz verantwortlich sind”!
I dazu bestimmt man die Großen (n =∑k
i=1 ni )
ds(i , j) =
√k − 1
n − kSSR · Fk−1,n−k,1−α(
1
ni+
1
nj)
Ist y i· − y j· großer (bzw. kleiner) als ds(i , j) (bzw. als−ds(i , j)) so ist y i· signifikant großer (bzw. kleiner) als y j·
I Beachte:– insgesamt k(k−1)
2 Vergleiche– die Scheffe-Methode halt simultan das Niveau α– es ist moglich, das F -Test H0 ablehnt, aber keiner der
paarweisen Vergleiche signifikant ist!
I Andere Verfahren (z.B. in SPSS implementiert): Tukey-Methode, Duncan Test
89 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
1.19 Levene-Test auf Varianzhomogenitat von kunabhangigen Stichproben
Modellannahmen und Hypothese
I Daten (n =∑k
i=1 ni )
y11, . . . , y1n1 (Gruppe 1, Erwartungswert µ1; Varianz σ21)
......
...yk1, . . . , yknk
(Gruppe k , Erwartungswert µk ; Varianz σ2k)
I Nullhypothese: es liegt Varianzhomogenitat vor, d.h.
H0 : σ21 = σ2
2 = . . . = σ2k
I Rechtfertigung der VoraussetzungenI Unabhangigkeit zwischen den Gruppen
I Unabhangigkeit innerhalb der Gruppen
I Normalverteilungsannahme
90 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
Levene-Test auf Varianzhomogenitat von k un-abhangigen Stichproben
I Die Hypothese der Varianzhomogenitat
H0 : σ21 = σ2
2 = . . . = σ2k
wird verworfen, falls
F =1
k−1
∑ki=1 ni (x i· − x ··)
2
1n−k
∑ki=1
∑ni
j=1(xij − x i·)2> Fk−1,n−k,1−α
Dabei ist:I n = n1 + . . .+ nk der GesamtstichprobenunfangI x i· = 1
ni
∑nij=1 xij , x ·· = 1
n
∑ki=1
∑nij=1 xij
I xij = |yij − y i·|I Fk−1,n−k,1−α das (1− α)-Quantil der F -Verteilung mit
(k − 1, n − k) Freiheitsgraden.
I Beachte:I Der Test ist robust bzgl. der NormalverteilungsannahmeI Der Test halt ”nur” naherungsweise das Niveau αI Alternativer Test: Bartlett Test
91 / 92
Methodenlehre II, SS2009
Prof. Dr. HolgerDette
1. GrundlegendePrinzipien derschließenden Statistikam Beispiel des t-Tests
1.1 Schatzer undKonfidenzintervalle
1.2 t-Test fur eineStichprobe
1.3 Zweistichproben-probleme
1.4 EinfaktorielleVarianzanalyse
SPSS Output
Signifikanzdf2df1Levene-Statistik
,3132621,214
Test der Homogenität der Varianzen
Gemerkte Zahlen
SignifikanzFMittel der QuadratedfQuadratsumme
Zwischen den Gruppen
Innerhalb der Gruppen
Gesamt 28122,759
3,5992693,571
,0294,05514,594229,187
ONEWAY ANOVA
Gemerkte Zahlen
92 / 92
Top Related