Post on 06-Feb-2018
Nicht-parametrische Statistik Eine kleine Einführung
Überblick
• Anwendung nicht-parametrischer Statistik
• Behandelte Tests– Mann-Whitney U Test
– Kolmogorov-Smirnov Test
– Wilcoxon Test
– Binomialtest
– Chi-squared Test
– Kruskal-Wallis Test
Anwendung nicht-parametrischer Statistik
• kleine Stichproben (bei Experimenten häufig
zwischen n=6 und n=30)
• keine Annahmen über die Verteilung der Daten in der
Grundgesamtheit
• ordinalskalierte und kategoriale Variablen können
einfach ausgewertet werden
• Methoden ähnlich der Medizin, Biologie
Mann-Whitney U-test
Test, ob Daten aus zwei statistisch unabhängigen Stichproben (X und Y) aus derselben Grundgesamtheit (hinsichtlich des Mittelwertes) stammen.
H0 : keine Mittelwertsunterschiede
H1 : Mittelwerte unterscheiden sich: X ≠
Y (zweiseitiger Test)
(Einseitiger Test wäre X > Y oder X < Y.)
Mann-Whitney U-test: Ein Beispiel
Ultimatum-Spiel mit VWlern vs. Nicht-VWLer:
Bringe die Beobachtungen in eine aufsteigende Reihenfolge und ordne aufsteigend Ränge zu
Angebote der VWLer 2 4 1 0.5 0.5
Angebote der Nicht-VWLer 3 2.5 5 5
offer 0.5 0.5 1 2 2.5 3 4 5 5group V V V V NV NV V NV NVrank 1.5 1.5 3 4 5 6 7 8.5 8.5
U-test: Ein Beispiel – Fortsetzung
Summiere die Ränge der kleineren Gruppe zu W (Testgröße)
Im Beispiel: W(N) = 28 [maximaler Wert wäre W(N) = 30]
p = 0.063 (zweiseitig) (siehe Table J aus Siegel/Castellan)
p = 0.048 (zweiseitig) (aus STATA)
Approximation durch Normalverteilung von W(N) für große n
STATA: ranksum offer, by(study)
offer 0.5 0.5 1 2 2.5 3 4 5 5group V V V V NV NV V NV NVrank 1.5 1.5 3 4 5 6 7 8.5 8.5
Kolmogorov-Smirnov-Test
Test, ob Daten aus zwei statistisch unabhängigen Stichproben (X und Y) aus derselben Grundgesamtheit (hinsichtlich der Verteilung der Beobachtungen, Mittelwert, Schiefe …) stammen.
H0 : Verteilungsgleichheit
H1 : Verteilungen sind signifikant unterschiedlich (zweiseitiger Test)
Kolmogorov-Smirnov-Test: Ein Beispiel
Ultimatum-Spiel mit VWLern vs. Nicht-VWLer:
Bestimme die kumulierten Häufigkeiten der Beobachtungen.
Angebote der VWLer 2 4 1 0.5 0.5
Angebote der Nicht-VWLer 3 2.5 5 5
offer 0.5 1 2 2.5 3 4 5VWL 40% 60% 80% 80% 80% 100% 100%N-VWL 0% 0% 0% 25% 50% 50% 100%
Kolmogorov-Smirnov-Test – Fortsetzung
Suche die größte (absolute) Differenz zwischen den kumulierten Häufigkeiten und bilde folgende Größen:
Dm,n = max |Sn (X) - Sm (X)|, wobei m(n) die Anzahl der Beobachtungen in beiden Stichproben ist und
Sm (X) = K/m, wobei K die Anzahl der Beobachtungen ist, die kleiner oder gleich X sind.
offer 0.5 1 2 2.5 3 4 5VWL 40% 60% 80% 80% 80% 100% 100%N-VWL 0% 0% 0% 25% 50% 50% 100%Sn (X) - Sm (X) 40% 60% 80% 55% 30% 50% 0%
Kolmogorov-Smirnov-Test – Fortsetzung
Die Testgröße ist dann: m*n* Dm,n = 5*4*0.8 = 16
p = 0.10 (zweiseitig) (siehe Table LII aus Siegel/Castellan)
p = 0.116 (zweiseitig) (aus STATA)
Approximation durch die χ² Verteilung für große n (mit df=2)
STATA: ksmirnov offer, by(study)
Möglichkeit gegen eine theoretische Verteilung zu testen
offer 0.5 1 2 2.5 3 4 5VWL 40% 60% 80% 80% 80% 100% 100%N-VWL 0% 0% 0% 25% 50% 50% 100%Sn (X) - Sm (X) 40% 60% 80% 55% 30% 50% 0%
Wilcoxon-Signed-Ranks Test
Test, ob zwischen zwei statistisch abhängigen Beobachtungen (X1 und X2) Unterschiede bestehen
H0 : keine Unterschiede (X1 = X2)
H1 : Beobachtungen unterscheiden sich: X1 ≠
X2 (zweiseitiger Test)
(Einseitiger Test wäre X1 > X2 oder X1 < X2.)
Wilcoxon Test: Ein BeispielWiederholtes Ultimatum-Spiel
Bilde die Differenz zwischen den gepaarten Beobachtungen und ordne Ränge nach absoluter Differenz (versehen mit dem Vorzeichen der Differenz zu)
Subjekt 1 2 3 4 5 6 7 8 9Runde 1 0.5 0.5 1 2 2.5 3 4 5 5Runde 2 1.5 1.5 1 1.5 1 1 1 2 2.5
Subjekt 1 2 3 4 5 6 7 8 9Runde 1 0.5 0.5 1 2 2.5 3 4 5 5Runde 2 1.5 1.5 1 1.5 1 1 1 2 2.5Differenz 1 1 0 -0.5 -1.5 -2 -3 -3 -2.5Rang +2.5 +2.5 drop -1 -4 -5 -7.5 -7.5 -6
Wilcoxon Test: Ein Beispiel – Fortsetzung
T+ = Summe der Ränge mit positivem Vorzeichen (T+ = 5)
T- = Summe der Ränge mit negativem Vorzeichen (T- = 31)
p = 0.078 (zweiseitig mit N=8 (!), siehe Table H aus S/C)
p = 0.0745 (aus STATA)
Approximation durch Normalverteilung für große nSTATA: signrank offer = offer[_n+1]
Sign-Test als Alternative (auch gegen feste Werte)
Subjekt 1 2 3 4 5 6 7 8 9Runde 1 0.5 0.5 1 2 2.5 3 4 5 5Runde 2 1.5 1.5 1 1.5 1 1 1 2 2.5Differenz 1 1 0 -0.5 -1.5 -2 -3 -3 -2.5Rang +2.5 +2.5 drop -1 -4 -5 -7.5 -7.5 -6
Binomial-TestZwei Merkmalsausprägungen [X=1 oder X=0] (z.B.
Kopf oder Zahl bei Münze; Budgetüber- oder – unterschreitung)
Wahrscheinlichkeit für X=1: pWahrscheinlichkeit für X=0: q = 1 – p
H0 : p = p0
H1 : p ≠
p0
Test, ob die Verteilung der Merkmalsausprägungen aus einer Grundgesamtheit mit p = p0 stammen kann
Binomial-Test: Ein BeispielMünzwurf: Eine Münze werde 10 mal geworfen
Wahrscheinlichkeiten: p = q = 0.5Y = Σ
X = 2
Wahrscheinlichkeit, dass Y einen bestimmten Wert annimmt:
wobei
Wurf 1 2 3 4 5 6 7 8 9 10Ergebnis K Z K K K K Z K K KX 0 1 0 0 0 0 1 0 0 0
)!(!!
][
kNkN
kN
qpkN
kYP kNk
−=⎟
⎠
⎞⎜⎝
⎛
⎟⎠
⎞⎜⎝
⎛== −
Binomial-Test: Ein Beispiel - FortsetzungWahrscheinlichkeit, dass Y=2
Beim Binomialtest interessiert die kumulierte Wahrscheinlichkeit, dass Y ≤
r oder Y ≥
s
(siehe Table D)
043.05.0210*95.05.0
!8!2!10
210
]2[ 108282 ===⎟⎠
⎞⎜⎝
⎛== qpYP
iNik
iqp
iN
kYP −
=∑ ⎟
⎠
⎞⎜⎝
⎛=≤
0][
055.0
]2[]1[]0[]2[2
0=∑ ⎟
⎠
⎞⎜⎝
⎛=
==+=+==≤
−
=
iNi
iqp
iN
YPYPYPYP
Binomial-Test: Ein anderes Beispiel
Weichen Budgetvoranschlag und Budgetrealisierung für Forschung und Wissenschaft systematisch voneinander ab? Nein (16 Überschreitungen in den letzten 28 Jahren).
U n te rs c h ie d V o ra n s c h la g / Za h lu n g e n (+ Ü b e rs c h re itu n g )B ild u n g s s e k to r
-8 .00%
-6.00%
-4.00%
-2.00%
0.00%
2.00%
4.00%
6.00%
8.00%
10.00%
12.00%
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29
J a h r
F ors c hung und W is s ens c haft
Chi-squared-test (χ²-test)
Test, ob Unterschiede in Verteilungen in zwei oder mehreren Kategorien existieren (Mindestanzahl an Beobachtungen pro Zelle ca. 5).
Test möglich für den Vergleich zweier Beoabchtung und dem Vergleich zu einer theoretischen Verteilung.
Einfachste Anwendung: 2x2-Tabellen.
Teststatistik (mit Kontinuitätskorrektur):
χ² = N{|AD – BC| - N/2}² / {(A+B)(C+D)(A+C)(B+D)}
Reject, if χ² > 3.84 (p < 0.05).
A BC D
Chi-squared-test (χ²-test) - Beispiel
χ² = N{|AD – BC| - N/2}² / {(A+B)(C+D)(A+C)(B+D)} = 0.61
Nicht ablehnen, da χ² < 3.84 (p < 0.05)
Möglichkeit der Erweiterung auf r x k Beobachtungen
# offers unter 5 # offers über 5VWLer 8 14Nicht-VWLer 13 12
Kruskal-Wallis Test
Test, ob Daten aus k statistisch unabhängigen Stichproben (X, Y, Z, …) aus derselben Grundgesamtheit stammen.
Teststatistik H wird über die Varianzen gebildet und folgt einer χ² Verteilung mit df = k-1
H0 = mehrere Stichproben sind aus derselben Grundgesamtheit
H1 = Stichproben aus unterschiedlichen GrundgesamtheitenSTATA: kwallis offer, by(age)
Übersicht der behandelten Tests
One sample Two samples N samplesAbhängige Beobachtungen
Unabhängige Beobachtungen
Unabhängige Beobachtungen
Nominale oder kategoriale Daten
Binomial Test
χ²-test (r x 2) χ²-test (r x k)
Ordinale Daten
Kolmogorov- Smirnov (one- sample)
Sign testWilcoxon signed ranks test
Mann-Whitney U testKolmogorov- Smirnov (two- sample)
Kruskal-Wallis test