Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier...
Transcript of Biostatistik, Sommer 2019 - staff.uni-mainz.de · Biostatistik, Sommer 2019 Vergleich zweier...
Biostatistik, Sommer 2019Vergleich zweier Stichproben:
Gepaarter, Ungepaarter t-Test, Welch Test
Prof. Dr. Achim Klenke
https://www.aklenke.de
11. Vorlesung: 05.07.2019
1/57
Inhalt
1 Vergleich zweier StichprobenGepaarter t-TestUngepaarter t-TestUngepaarter t-Test bei unterschiedlicher Varianz, WelchTestVergleich: Gepaarter vs ungepaarter t-Test
2/57
Vergleich zweier Stichproben Gepaarter t-Test
Grundproblem
Bei n Individuen soll eine Messgroße x unter zweiVersuchsbedingungen gemessen werden.Unterscheiden sich die Mittelwerte der Messungen?
3/57
Vergleich zweier Stichproben Gepaarter t-Test
Modellierung
Unter Versuchsbedingung 1 sind die Messwerte x (1)1 , . . . , x (1)
n
unabhangig mit Erwartungswert µ1.Unter Versuchsbedingung 2 sind die Messwerte x (2)
1 , . . . , x (2)n
unabhangig mit Erwartungswert µ2.
Annahme (Hoffnung!!!): Die Differenzenx (2)
1 − x (1)1 , . . . , x (2)
n − x (1)n sind (ungefahr) normalverteilt mit
unbekannter Varianz σ2 (und Erwartungswert µ2 − µ1).
Nullhypothese (H0): µ1 = µ2.
Alternative (H1): µ1 6= µ2 (beidseitig)µ1 < µ2 (rechtsseitig)µ1 > µ2 (linksseitig).
4/57
Vergleich zweier Stichproben Gepaarter t-Test
VerfahrenUnter der Nullhypothese sind die Differenzen xk = x (2)
k − x (1)k
unabhangig und normalverteilt mit unbekannter Varianz σ2 undErwartungswert µ = µ2 − µ1 = 0.Also verfahren wir jetzt wie im bekannten t-Test: Teststatistik
T (x) =x
sn−1/√
n,
wobei
x =1n
n∑k=1
xk =1n
n∑k=1
(x (2)k − x (1)
k )
ist und
s2n−1 =
1n − 1
n∑k=1
(xk − x)2.
5/57
Vergleich zweier Stichproben Gepaarter t-Test
Linksseitige Alternative
Verwerfungsregel
Nullhypothese (H0): µ2 = µ1
Alternative (H1): µ2 < µ1.
Verwirf H0 zugunsten von H1, falls T (x) ≤ −tn−1;1−α.
p-Wert
p(x) = tn−1(T (x)) = 1− tn−1(−T (x)).
tn−1 Verteilungsfunktion der tn−1-Verteilung (Tabelle T4).
Berechnung mit Rt.test(x2 - x1, alternative = "less")
6/57
Vergleich zweier Stichproben Gepaarter t-Test
Rechtsseitige Alternative
Verwerfungsregel
Nullhypothese (H0): µ2 = µ1
Alternative (H1): µ2 > µ1.
Verwirf H0 zugunsten von H1, falls T (x) ≥ tn−1;1−α.
p-Wert
p(x) = tn−1(−T (x)) = 1− tn−1(T (x)).
tn−1 Verteilungsfunktion der tn−1-Verteilung (Tabelle T4).
Berechnung mit Rt.test(x2 - x1, alternative = "greater")
7/57
Vergleich zweier Stichproben Gepaarter t-Test
Beidseitige Alternative
Verwerfungsregel
Nullhypothese (H0): µ2 = µ1
Alternative (H1): µ2 6= µ1.
Verwirf H0 zugunsten von H1, falls |T (x)| ≥ tn−1;1−α/2.
p-Wert
p(x) = 2(1− tn−1(|T (x)|)).
tn−1 Verteilungsfunktion der tn−1-Verteilung (Tabelle T4).
Berechnung mit Rt.test(x2 - x1, alternative = "two.sided")
8/57
Vergleich zweier Stichproben Gepaarter t-Test
Beispiel: Orientierung von Zugvogeln
Zugvogel werden einer Beleuchtung mit bestimmter Farbe (grunoder blau) ausgesetzt.Ist die Genauigkeit der Orientierung (magnetischer Kompass)abhangig von der Farbe?
Nullhypothese: Nein.Alternative: Doch.
9/57
Vergleich zweier Stichproben Gepaarter t-Test
Beispiel: Orientierung von ZugvogelnVersuchsanordnung
Es werden n = 17 Trauerschnapper inKafigen einer Beleuchtung mit blauemLicht ausgesetzt (Versuchsbedingung 1)und jeweils in mehreren Durchgangenihre Flugrichtung ermittelt.
Die Flugrichtung wird als Punkt auf einem Kreis dargestellt. Ausallen Punkten auf dem Kreis wird der Schwerpunktvektorermittelt.
Danach der gleiche Versuch mit grunem Licht (Bedingung 2).
10/57
Vergleich zweier Stichproben Gepaarter t-Test
Beispiel: Orientierung von ZugvogelnBestimmung des Schwerpunktvektors
Je variabler die Richtungen, destokurzer der Pfeil!
11/57
Vergleich zweier Stichproben Gepaarter t-Test
Beispiel: Orientierung von ZugvogelnAnsatz des Tests
Fur jeden Vogel i = 1, . . . ,17 bezeichnen wir mit x (1)i die Lange
des Schwerpunktvektors bei blauem Licht und mit x (2)i die Lange
des Schwerpunktvektors bei grunem Licht.
xi = x (2)i − x (1)
i .
Festlegung des Niveaus: α = 5%.Schwerpunktvektoren sind Mittelwerte vieler zufalligerBeobachtungen, also etwa normalverteilt (zentralerGrenzwertsatz). Also: Gepaarter t-Test mit beidseitigerAlternative und Niveau 5%.Verwerfe H0, falls
|T (x)| > tn−1;1−α/2 = t16;0.975 = 2.12.
12/57
Vergleich zweier Stichproben Gepaarter t-Test
Beispiel: Orientierung von ZugvogelnDaten und Durchfuhrung
Differenzen xi :
−0.05 0.00 0.05 0.10 0.15 0.20
Mittelwert und Streuung:
x = 0.0518 sn−1 = 0.0912.
t-Statistik T (x) =x
sn−1/√
n=
0.05180.0912/
√17≈ 2.34.
Also ist |T (x)| = 2.34 > 2.12 = t16;0.975.p-Wert:
p(x) = 2(1−tn−1(|T (x)|)) = 2(1−t16(2.34)) = 2(1−0.983) = 0.034.
13/57
Vergleich zweier Stichproben Gepaarter t-Test
Beispiel: Orientierung von ZugvogelnFazit
Wir konnen die Hypothese, dass die Farbe des Lichtes keineRolle fur die Orientierungsgenauigkeit der Trauerschnapperspielt, zum Niveau 5% verwerfen.
14/57
Vergleich zweier Stichproben Ungepaarter t-Test
Beispiel: Backenzahne von Hipparions
(c): public domain
15/57
Vergleich zweier Stichproben Ungepaarter t-Test
Beispiel: Backenzahne von HipparionsDie Daten
77 Backenzahne
gefunden in den Chiwondo Beds, Malawi,
jetzt in den Sammlungen desHessischen Landesmuseums, Darmstadt
16/57
Vergleich zweier Stichproben Ungepaarter t-Test
Beispiel: Backenzahne von HipparionsZuordnung
Die Zahne wurden zwei Arten zugeordnet:
Hipparion africanum≈ 4 Mio. Jahre, 39 Zahne
Hipparion libycum≈ 2,5 Mio. Jahre, 38 Zahne
17/57
Vergleich zweier Stichproben Ungepaarter t-Test
Beispiel: Backenzahne von HipparionsGeologischer Hintergrund
Vor 2,8 Mio. Jahren kuhlte sich das Klima weltweit ab.
Das Klima in Ostafrika:warm-feucht −→ kuhl-trocken
Hipparion:Laubfresser −→ Grasfresser
18/57
Vergleich zweier Stichproben Ungepaarter t-Test
Beispiel: Backenzahne von HipparionsFrage
Hipparion:Laubfresser −→ Grasfresser
andere Nahrung −→ andere Zahne?
Messungen: mesiodistale Lange
Lasst sich die Nullhypothese, dass die Zahne gleich sind, zumNiveau 1% verwerfen?
19/57
Vergleich zweier Stichproben Ungepaarter t-Test
Die Theorie
Annahme: Wir haben zwei unabhangige Stichprobenx1,1, . . . , x1,n1 und x2,1, . . . , x2,n2.
Die x1,i stammen aus einer Normalverteilung mit (unbekanntem)Mittelwert µ1 und unbekannter Varianz σ2 > 0, die x2,i aus einerNormalverteilung mit (unbekanntem) Mittelwert µ2 undderselben Varianz σ2.
20/57
Vergleich zweier Stichproben Ungepaarter t-Test
Die Theorie
Seien
x1 =1n1
n1∑i=1
x1,i und x2 =1n2
n2∑i=1
x2,i
die jeweiligen Stichprobenmittelwerte,
s1 =
√√√√ 1n1 − 1
n1∑i=1
(x1,i − x1)2,
s2 =
√√√√ 1n2 − 1
n2∑i=1
(x2,i − x2)2,
die (korrigierten) Stichprobenstreuungen.
21/57
Vergleich zweier Stichproben Ungepaarter t-Test
Die TheorieWir mochten die Hypothese H0 : ”µ1 = µ2“ prufen.Wenn µ1 = µ2 gilt, so sollte x1 = x2 ”bis aufZufallsschwankungen“ gelten, denn E[x1] = µ1, E[x2] = µ2.Was ist die Skala der typischen Schwankungen von x2 − x1?Var(x1 − x2) = σ2
(1n1
+ 1n2
)Problem (wie bereits im ein-Stichproben-Fall): Wir kennen σ2 nicht.Wir schatzen es im zwei-Stichproben-Fall durch die gepoolteStichprobenvarianz
s2 =(n1 − 1)s2
1 + (n2 − 1)s22
n1 + n2 − 2und bilden die Teststatistik
T (x) =x2 − x1
s√
1n1
+ 1n2
.
22/57
Vergleich zweier Stichproben Ungepaarter t-Test
Die Theorie
Wenn µ1 = µ2 gilt, so ist
T (x) =x2 − x1
s√
1n1
+ 1n2
tn1+n2−2-verteilt.
23/57
Vergleich zweier Stichproben Ungepaarter t-Test
Die TheorieLinksseitige Alternative
Verwerfungsregel
Nullhypothese (H0): µ2 = µ1
Alternative (H1): µ2 < µ1.
Verwirf H0 zugunsten von H1, falls T (x) ≤ −tn1+n2−2;1−α.
p-Wert
p(x) = tn1+n2−2(T (x)) = 1− tn1+n2−2(−T (x)).
tn1+n2−2 Verteilungsfunktion der tn1+n2−2-Verteilung (Tabelle T4).
Berechnung mit Rt.test(x2, x1, var = TRUE, alternative = "less")
24/57
Vergleich zweier Stichproben Ungepaarter t-Test
Die TheorieRechtsseitige Alternative
Verwerfungsregel
Nullhypothese (H0): µ2 = µ1
Alternative (H1): µ2 > µ1.
Verwirf H0 zugunsten von H1, falls T (x) ≥ tn1+n2−2;1−α.
p-Wert
p(x) = tn1+n2−2(−T (x)) = 1− tn1+n2−2(T (x)).
tn1+n2−2 Verteilungsfunktion der tn1+n2−2-Verteilung (Tabelle T4).
Berechnung mit Rt.test(x2, x1, var = TRUE, alternative = "greater")
25/57
Vergleich zweier Stichproben Ungepaarter t-Test
Die TheorieBeidseitige Alternative
Verwerfungsregel
Nullhypothese (H0): µ2 = µ1
Alternative (H1): µ2 6= µ1.
Verwirf H0 zugunsten von H1, falls |T (x)| ≥ tn1+n2−2;1−α/2.
p-Wert
p(x) = 2(1− tn1+n2−2(|T (x)|)).
tn1+n2−2 Verteilungsfunktion der tn1+n2−2-Verteilung (Tabelle T4).
Berechnung mit Rt.test(x2, x1, var = TRUE, alternative = "two.sided")
26/57
Vergleich zweier Stichproben Ungepaarter t-Test
Beispiel: Backenzahne von HipparionsDie Daten als Tabelle
Africanum30.0 24.0 26.0 23.0 23.0 23.0 29.0 29.0 26.5 24.024.5 23.0 27.0 27.0 27.0 27.0 27.0 25.0 24.5 26.027.0 26.0 25.0 23.0 23.5 24.0 25.0 27.0 25.0 24.026.5 24.0 28.5 31.0 28.0 31.0 27.5 24.0 25.0
Libycum23.0 25.0 30.0 26.0 28.5 28.5 25.5 24.0 35.0 23.025.0 27.0 26.0 26.0 40.0 32.0 33.0 30.0 26.0 35.024.0 32.5 25.0 26.0 27.0 30.0 36.0 25.0 34.0 29.022.0 26.0 37.0 25.5 29.0 30.5 26.5 27.0
27/57
Vergleich zweier Stichproben Ungepaarter t-Test
Beispiel: Backenzahne von HipparionsDie Daten als Grafik
25 30 35 40
H. l
ibyc
umH
. afr
ican
um
mesiodistale Länge [mm]
xA == 25.9, sA == 2.2
xL == 28.4, sL == 4.3
xA ++ sAxA −− sA
xL ++ sLxL −− sL
28/57
Vergleich zweier Stichproben Ungepaarter t-Test
Beispiel: Backenzahne von HipparionsDie Daten
nA = 39, xA = 25.9, sA = 2.2nL = 38, xL = 28.4, sL = 4.3
Gepoolte Stichprobenstreuung
s =
√(nA − 1)s2
A + (nL − 1)s2L
nA + nL − 2
=
√38× 2.22 + 37× 4.32
39 + 38− 2= 3.402.
Es folgt
T (x) =xL − xA
s√
1nA
+ 1nL
=28.4− 25.9
3.402×√
1/39 + 1/38= 3.22.
29/57
Vergleich zweier Stichproben Ungepaarter t-Test
Beispiel: Backenzahne von HipparionsDurchfuhrung des Tests
Nullhypothese µ1 = µ2, Alternative µ1 6= µ2 (beidseitig).Test verwirft zum Niveau α = 1%, wenn
|T (x)| > tnA+nL−2;1−α/2 = t75;0.995 ≈ 2.65.
Tatsachliche Daten: |T (x)| = |3.22| > 2.65.p-Wert
p(x) = 2(1− tnA+nL−2(|T (x)|)) = 2(1− t75(3.22))= 2(1− 0.998) = 0.002.
Diesen p-Wert sollte man nicht glauben, weil dieModellanahmen zu optimistisch waren.
30/57
Vergleich zweier Stichproben Ungepaarter t-Test
Beispiel: Backenzahne von HipparionsFazit
Der ungepaarte Zweistichproben-t-Test verwirft dieNullhypothese, dass die mesiodistale Lange der Backenzahnebei Hipparion africanum und Hipparion libycum gleichenErwartungswert hatten, zu Gunsten der zweiseitigen Alternativezum Niveau 1%.
31/57
Vergleich zweier Stichproben Ungepaarter t-Test
Beispiel: Backenzahne von HipparionsRechnung mit R / Dateneingabe
> africanum <- c(
30.0, 24.0, 26.0, 23.0, 23.0, 23.0, 29.0, 29.0,
26.5, 24.0, 24.5, 23.0, 27.0, 27.0, 27.0, 27.0,
27.0, 25.0, 24.5, 26.0, 27.0, 26.0, 25.0, 23.0,
23.5, 24.0, 25.0, 27.0, 25.0, 24.0, 26.5, 24.0,
28.5, 31.0, 28.0, 31.0, 27.5, 24.0, 25.0)
> libycum <- c(
23.0, 25.0, 30.0, 26.0, 28.5, 28.5, 25.5, 24.0,
35.0, 23.0, 25.0, 27.0, 26.0, 26.0, 40.0, 32.0,
33.0, 30.0, 26.0, 35.0, 24.0, 32.5, 25.0, 26.0,
27.0, 30.0, 36.0, 25.0, 34.0, 29.0, 22.0, 26.0,
37.0, 25.5, 29.0, 30.5, 26.5, 27.0)
32/57
Vergleich zweier Stichproben Ungepaarter t-Test
Beispiel: Backenzahne von HipparionsRechnung mit R / Statistik und p-Wert
> sa <- sd(africanum)
> sl <- sd(libycum)
> (na <- length(africanum))
[1] 39> (nl <- length(libycum))
[1] 38> (xa.quer <- mean(africanum))
[1] 25.91026> (xl.quer <- mean(libycum))
[1] 28.43421> (s <- sqrt(((na-1)*sa∧2+(nl-1)*sl∧2)/(na+nl-2)))[1] 3.429327> (t <- (xl.quer - xa.quer)/(s*sqrt(1/na + 1/nl)))
[1] 3.228875> (p.wert <- 2*(1-pt(df=75, t)))
[1] 0.00184498433/57
Vergleich zweier Stichproben Ungepaarter t-Test
Beispiel: Backenzahne von HipparionsRechnung mit R / Automatischer Test
Der Schalter var=TRUE erzwingt, dass in beiden Stichproben diegleiche Varianz angenommen wird.> t.test(libycum, africanum, var=TRUE,
alternative="two.sided")
Two Sample t-test
data: libycum and africanumt = 3.2289, df = 75, p-value = 0.001845alternative hypothesis: true difference in means is not equal to 095 percent confidence interval:0.9667634 4.0811448sample estimates:mean of x mean of y28.43421 25.91026
34/57
Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Die Theorie (Welch Test)
Annahme: Wir haben zwei unabhangige Stichprobenx1,1, . . . , x1,n1 und x2,1, . . . , x2,n2.
Die x1,i stammen aus einer Normalverteilung mit (unbekanntem)Mittelwert µ1 und unbekannter Varianz σ2
1 > 0, die x2,i aus einerNormalverteilung mit (unbekanntem) Mittelwert µ2 undmoglicherweise anderer Varianz σ2
2.
35/57
Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Die Theorie (Welch Test)
Seien
s1 =
√√√√ 1n1 − 1
n1∑i=1
(x1,i − x1)2,
s2 =
√√√√ 1n2 − 1
n2∑i=1
(x2,i − x2)2,
die (korrigierten) Stichprobenstreuungen.
36/57
Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Die Theorie (Welch Test)
Unter der Hypothese µ1 = µ2 ist die Teststatistik
T (x) =x2 − x1√
s21
n1+
s22
n2
ungefahr t-verteilt mit f Freiheitsgraden, wobei f aus den Datengeschatzt wird:
f =
(s2
1n1
+s2
2n2
)2
s41
n21(n1−1) +
s42
n22(n2−1)
.
37/57
Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Die Theorie (Welch Test)Linksseitige Alternative
Verwerfungsregel
Nullhypothese (H0): µ2 = µ1
Alternative (H1): µ2 < µ1.
Verwirf H0 zugunsten von H1, falls T (x) ≤ −tf ;1−α.
p-Wert
p(x) = tf (T (x)) = 1− tf (−T (x)).
tf Verteilungsfunktion der tf -Verteilung (Tabelle T4).
Berechnung mit Rt.test(x2, x1, alternative = "less")
38/57
Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Die Theorie (Welch Test)Rechtsseitige Alternative
Verwerfungsregel
Nullhypothese (H0): µ2 = µ1
Alternative (H1): µ2 > µ1.
Verwirf H0 zugunsten von H1, falls T (x) ≥ tf ;1−α.
p-Wert
p(x) = tf (−T (x)) = 1− tf (T (x)).
tf Verteilungsfunktion der tf -Verteilung (Tabelle T4).
Berechnung mit Rt.test(x2, x1, alternative = "greater")
39/57
Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Die Theorie (Welch Test)Beidseitige Alternative
Verwerfungsregel
Nullhypothese (H0): µ2 = µ1
Alternative (H1): µ2 6= µ1.
Verwirf H0 zugunsten von H1, falls |T (x)| ≥ tf ;1−α/2.
p-Wert
p(x) = 2(1− tf (|T (x)|)).
tf Verteilungsfunktion der tf -Verteilung (Tabelle T4).
Berechnung mit Rt.test(x2, x1, alternative = "two.sided")
40/57
Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Beispiel: Versuch zur KeimhemmungVersuchsaufbau im Pflanzenphysiologischen Praktikum
In vier Petrischalen werden jeweils exakt 100 SamenGartenkresse ausgebracht. Gewassert wird mit
(A) Aqua dest. (zur Kontrolle)(B) ABS Losung(C) Saccharose-Losung(D) Saccharose-ABS-Losung
Nach zwei Tagen wird gezahlt, wie viele Samen gekeimt haben.
41/57
Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Beispiel: Versuch zur KeimhemmungIm Praktikum wird jeder Versuch dreimal durchgefuhrt.
Versuch A B C DKeime Schale 1 90 85 45 25Keime Schale 2 88 87 44 27Keime Schale 3 91 75 45 29
A B C D
020
6010
0
42/57
Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Beispiel: Versuch zur Keimhemmung
A B C D
020
6010
0
(A) Aqua dest.(B) ABS(C) Saccharose(D) Saccharose-
ABS
FragenIst die Hemmung bei B schon vorhanden?Hemmt Saccharose (C)?Hemmt Saccharose mit ABS (D) starker als Saccharose?Ist die Wirkung von Saccharose und ABS gleich?
43/57
Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Beispiel: Versuch zur KeimhemmungVergleich C gegen D
Vermutung: Hemmung bei ABS+Saccharose (D) starker als beiSaccharose (C).
Test zum Niveau α = 1% soll Klarheit schaffen.
Nullhypothese: (D) genauso wie (C)Alternative: (D) hemmt starker.
44/57
Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Beispiel: Versuch zur KeimhemmungVergleich C gegen D, Welch Test
DatenxC,1 = 45, xC,2 = 44, xC,3 = 45
xD,1 = 25, xD,2 = 27, xD,3 = 29
Idee: Daten etwa normalverteilt mit unbekannten MittelwertenµC und µD und unbekannten Varianzen σ2
C, σ2D.
Nullhypothese (H0) µC = µD
Alternative (H1) µC > µD.Linksseitiger Zwei-Stichproben t-Test mit unterschiedlichenVarianzen (Welch Test).
45/57
Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Beispiel: Versuch zur KeimhemmungVergleich C gegen D, Welch Test
xC,1 = 45, xC,2 = 44, xC,3 = 45
xD,1 = 25, xD,2 = 27, xD,3 = 29
xC = 44.67, xD = 27.
sC =
√√√√12
3∑i=1
(xC,i − xC)2
=
√12((45− 44.67)2 + (44− 44.67)2 + (45− 44.67)2)
= 0.57735.
46/57
Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Beispiel: Versuch zur KeimhemmungVergleich C gegen D, Welch Test
xC,1 = 45, xC,2 = 44, xC,3 = 45
xD,1 = 25, xD,2 = 27, xD,3 = 29
xC = 44.67, xD = 27.
sD =
√√√√12
3∑i=1
(xD,i − xD)2
=
√12((25− 27)2 + (27− 27)2 + (29− 27)2) = 2.
47/57
Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Beispiel: Versuch zur KeimhemmungVergleich C gegen D, Welch Test
xC = 44.67, xD = 27.
sC = 0.57735, sD = 2.
t-Statistik
T (x) =xD − xC√
s2C
nC+
s2D
nD
=27− 44.67√
0.57352
3 + 22
3
= −14.7.
Freiheitsgrade
f =
(s2
CnC
+s2
DnD
)2
s4C
n2C(nC−1) +
s4D
n2D(nD−1)
= . . . = 2.331.
48/57
Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Beispiel: Versuch zur KeimhemmungVergleich C gegen D, Welch Test
t-StatistikT (x) = −14.7.
Freiheitsgradef = 2.331.
Der linksseitige Test zum Niveau α = 0.01 verwirft H0, falls
T (x) < −tf ,1−α = −t2.331;0.99 ≈ −5.77.
(Alternativ: Tabellenwert t2;0.99 = 6.96)Wegen T (x) = −14.7 < −5.77 verwirft der Test zum Niveau 1%die Nullhypothese.p-Wert
p(x) = t2.331(−14.7) = 0.0012.
Alternativ: Tabellenwert p(x) ≤ t2(−14.7) = 0.0023.49/57
Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Beispiel: Versuch zur KeimhemmungVergleich C gegen D, Ergebnis
Mit Hilfe eines ungepaarten einseitigen t-Tests beiunterschiedlichen Varianzen (Welch Test) wird dieNullhypothese (Saccharose hemmt die Keimung gleich gut wieeine Losung mit Saccharose und ABS) auf dem Niveau 1%gegen die Alternative (S hemmt nicht so gut wie S+ABS)verworfen.Der p-Wert betragt p ≤ 0.0023 (bzw. p = 0.0012, wenn manexakt mit dem Computer rechnet, statt den p-Wert nach derTabelle der t2-Verteilung anzunahern).
50/57
Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Beispiel: Versuch zur KeimhemmungVergleich C gegen D, Berechnung mit R
Ohne die Option var=TRUE wird der Welch-Test durchgefuhrt.> xA <- c(90, 88, 91)
> xB <- c(85, 87, 75)
> xC <- c(45, 44, 45)
> xD <- c(25, 27, 29)
> t.test(xD, xC, alternative="less") # D.h. xD < xC ??
Welch Two Sample t-test
data: xD and xCt = -14.6996, df = 2.331, p-value = 0.001188alternative hypothesis: true difference in means is less than 095 percent confidence interval:-Inf -14.47462sample estimates:mean of x mean of y27.00000 44.66667
51/57
Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Beispiel: Versuch zur KeimhemmungVergleich C gegen B
Hemmt Saccharose (C) genauso gut wie ABS (B)?Zweiseitiger ungepaarter t-Test bei unterschiedlichen Varianzen(Welch Test) zum Niveau α = 1%.
52/57
Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Beispiel: Versuch zur KeimhemmungVergleich C gegen B, Daten
xC = 44.67, xB = 82.333.sC = 0.57735, sB = 6.4291.
t-StatistikT (x) =
xB − xC√s2
CnC
+s2
BnB
= 10.1.
Freiheitsgradef = 2.032.
Beidseitiger Test verwirft, falls
|T (x)| > t2.032;0.995 ≈ t2;0.995 = 9.92.
Wegen |T (x)| = 10.1 verwirft der Test zum Niveau 1%.
p-Wert 2(1− t2.032(10.1)) ≈ 2(1− t2(10.1)) = 0.0097 ≈ 0.01.53/57
Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Beispiel: Versuch zur KeimhemmungVergleich C gegen B, Ergebnis
Der zweiseitige ungepaarte t-Test bei unterschiedlicher Varianz(Welch Test) verwirft die Nullhypothese (Saccharose hemmtKeimung gleich gut wie ABS) gegen die beidseitige Alternativezum Niveau 1%. Der p-Wert ist etwa 0.01.
54/57
Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Beispiel: Versuch zur KeimhemmungVergleich C gegen B, Berechnung mit R
> t.test(xB, xC, alternative="two.sided")
Welch Two Sample t-test
data: xB and xCt = 10.107, df = 2.032, p-value = 0.009142alternative hypothesis: true difference in means is not equal to 095 percent confidence interval:21.87307 53.46027sample estimates:mean of x mean of y82.33333 44.66667
55/57
Vergleich zweier Stichproben Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Beispiel: Backenzahne des HipparionsBerechnung ohne Annahme der gleichen Varianz
Die Annahme, dass bei den Hipparions beide Stichprobengleiche Varianz haben, ist eigentlich durch nichts begrundet.Sauberer ware daher der Welch-Test.> t.test(libycum, africanum, alternative="two.sided")
Welch Two Sample t-test
data: libycum and africanumt = 3.2043, df = 54.975, p-value = 0.002255alternative hypothesis: true difference in means is not equal to 095 percent confidence interval:0.9453745 4.1025338sample estimates:mean of x mean of y28.43421 25.91026Der p-Wert ist großer als bei Annahme gleicher Varianz(0.001845).
56/57
Vergleich zweier Stichproben Vergleich: Gepaarter vs ungepaarter t-Test
Vergleich: Gepaarter vs ungepaarter t-Test
Wenn die Stichprobenlange unterschiedlich ist,ergibt ”gepaart“ keinen Sinn.
Wenn die Stichprobenlange gleich ist:Sind die Stichproben unabhangig voneinander?Falls ja, dann ungepaart testen. Ein gepaarter Test wurdesinnlose Abhangigkeiten unterstellen und hatte auch einegeringere Scharfe.Sind die Stichproben voneinander abhangig?(z.B. Messungen von denselben Individuen bzw. Objekten)Falls ja, dann ist ein gepaarter Test sinnvoll. Bei starkerAbhangigkeitsstruktur hat der gepaarte t-Test großereScharfe (da der Test von Variabilitat zwischen denIndividuen bereinigt ist)
57/57