SPSS III Mittelwerte vergleichen - io- · PDF file2 Tests auf Normalverteilung Seeigel...
Click here to load reader
Transcript of SPSS III Mittelwerte vergleichen - io- · PDF file2 Tests auf Normalverteilung Seeigel...
1
SPSS III – Mittelwerte vergleichen
A Zwei Gruppen ------------ Zwei-Stichproben t-Test Beispieldatei: Seegräser Fragestellung: Unterscheidet sich die Anzahl der Seegräser in Gebieten mit und ohne Seeigelvorkommen signifikant voneinander? H0: Die mittlere Anzahl der Seegräser (µ) hängt nicht vom Seeigelvorkommen ab.
µohne Seeigel = µmit Seeigel Vorbereitung Zunächst gilt es, die Voraussetzungen für die Anwendung des t-Tests zu überprüfen, welche sind: 1. Die Stichproben müssen voneinander unabhängig sein 2. Die Verteilung der einzelnen Stichproben müssen einer Normalverteilung folgen (K-S-
Test oder Shapiro – Wiks Test) 3. Die Varianzen der beiden Stichproben müssen gleich sein (Levene-Test)
1. 2. Shapiro – Wilks Test, da kleine Gruppengröße (Faustregel n<50, also eigentlich immer)
Auswahl über Explorative Datenanalyse
In die Faktorenliste wird
die Gruppenvariable
eingetragen, also Seeigel ja/
nein
Wenn nur der Test auf
Normalverteilung
gewünscht wird, reicht die
Auswahl Diagramme
2
Tests auf Normalverteilung
Seeigel vorhanden? Kolmogorov-Smirnova Shapiro-Wilk
Statistik df Signifikanz Statistik df Signifikanz
Anzahl der Seegräser pro m2
ja ,232 11 ,101 ,901 11 ,188
nein ,130 14 ,200* ,960 14 ,721
*. Dies ist eine untere Grenze der echten Signifikanz. a. Signifikanzkorrektur nach Lilliefors
Da p > 0.05, wird die Nullhypothese, dass die Anzahl der Seegräser normalverteilt ist, nicht
verworfen. Bedingung 2 ist erfüllt.
3. Varianzhomogenität wird geprüft mit Hilfe des Levene – Tests Die Varianzhomogenität ist eine nicht ganz so „wichtige“ Voraussetzung, denn es gibt einen in SPSS implementierten Test, der ungleiche Varianzen berücksichtigt. Der Levene-Test wird bei Auswahl des T-Tests frei Haus mitgeliefert. Also zur Ausführung des Tests:
Testausführung
Ausgabe:
Gruppenstatistiken
Seeigel
vorhanden?
N Mittelwert Standard
abweichung
Standardfehler
des Mittelwertes
Anzahl der Seegräser
pro m2
ja 11 52,09 7,739 2,333
nein 14 35,71 8,757 2,340
3
Test bei unabhängigen Stichproben
Levene-Test der Varianzgleichheit
T-Test für die Mittelwertgleichheit
F Signifikanz T df Sig. (2-seitig)
Mittlere Differenz
Standardfehler der Differenz
95% Konfidenzintervall der Differenz
Untere Obere
Anzahl der Seegräser pro m2
Varianzen sind gleich
,385 ,541 4,880 23 ,000 16,377 3,356 9,434 23,319
Varianzen sind nicht gleich
4,955 22,626 ,000
16,377 3,305 9,534 23,219
Die Anzahl der Seegräser unterscheidet sich signifikant zwischen Gebieten mit und ohne Seeigel (t-Test, p<0.01).
B Drei Gruppen und mehr Im Falle, dass mehr als zwei Gruppen vorliegen, wird bei Erfüllen der Bedingungen wie beim T-Test eine ANOVA durchgeführt. Datei Seeigel_ANOVA Das Vorhandensein von Seeigeln wird eingeteilt in die Kategorien „viel“, „wenig“ und „keine“. Somit liegen drei unabhängige Gruppen vor.
H0: Die mittlere Anzahl der Seegräser (µ) hängt nicht von der Seeigel“menge“ ab. µohne Seeigel = µwenig Seeigel = µmit viele Seeigel
1. Test auf Normalverteilung. S. oben, der Faktor ist wiederum Seeigelvorhandensein, nun
aber eben mit mehr als zwei Kategorien.
Tests auf Normalverteilung
Seeigel menge
Kolmogorov-Smirnova Shapiro-Wilk
Statistik df Signifikanz Statistik df Signifikanz
Anzahl der Seegräser pro m2
Viele ,232 11 ,101 ,901 11 ,188
keine ,130 14 ,200* ,960 14 ,721
wenig ,135 11 ,200* ,962 11 ,801
*. Dies ist eine untere Grenze der echten Signifikanz. a. Signifikanzkorrektur nach Lilliefors
2. Test auf Varianzhomogenität wird ebenfalls bei der Testausführung angewählt
Da p>0.05, wird die Nullhypothese, dass
die Varianzen in den Gruppen gleich sind,
nicht verworfen. Bedingung 3 erfüllt. Hier nun das eigentliche Ergebnis des t-
Tests. Da p<0.05, wird die Nullhypothese
abgelehnt.
4
Ausführung der ANOVA
Nach Auswahl der ANOVA wird die Variable Anzahl der Seegräser eingefügt, die Seeigelmenge in das Faktorenfeld (entspricht der Gruppenvariable).
Bei Optionen kann ein Test auf Homogenität der Varianzen angefordert werden (ist nicht default). Die Ausgabe ist dann:
Test der Homogenität der Varianzen
Anzahl der Seegräser pro m2
Levene-Statistik df1 df2 Signifikanz
,785 2 33 ,465
5
Einfaktorielle ANOVA
Anzahl der Seegräser pro m2
Quadratsumme df Mittel der Quadrate F Signifikanz
Zwischen den Gruppen 1653,024 2 826,512 10,450 ,000
Innerhalb der Gruppen 2609,948 33 79,089
Gesamt 4262,972 35
Zwischen den Gruppen bestehen signifikante Unterschiede bezüglich der Anzahl der Seeigel. Aber zwischen welchen Gruppen? Hierfür gibt es die sogenannten post hoc-Tests, die entweder paarweise alle Gruppen miteinander vergleichen oder sequenziell (also immer die größte mit der kleinsten). Die Adjustierung des Signifikanzniveaus (es liegen ja keine unabhängigen Vergleiche mehr vor) kann auf verschiedenste Arten erfolgen (am bekanntesten: Bonferroni; auch am einfachsten) Bonferroni-Adjustierung: neues α = altes α/Anzahl paarweiser Vergleiche Z.B. bei drei Gruppen gibt es drei paarweise Vergleiche (keine-wenig/ keine-viel/ wenig-viel), .damit ist αneu_nach_Bonferroni = 0.05/3 = 0.0167. In SPSS sind diverseste post hoc-Tests implementiert:
Häufig verwendet:
Bonferroni
Empfehlenswert:
Scheffé
Auch für die ANOVA
gibt es Tests, die
Varianzheterogenität
berücksichtigen
können
6
Ergebnis des Scheffé post hoc-Tests: Homogene Untergruppen
Anzahl der Seegräser pro m2
Seeigelmenge N Untergruppe für Alpha = 0.05.
1 2
Scheffé-Prozedura,b
keine 14 35,71
wenig 11 43,27 43,27
viele 11 52,09
Signifikanz ,134 ,068
Die Mittelwerte für die in homogenen Untergruppen befindlichen Gruppen werden angezeigt. a. Verwendet ein harmonisches Mittel für Stichprobengröße = 11,846. b. Die Gruppengrößen sind nicht identisch. Es wird das harmonische Mittel der Gruppengrößen verwendet. Fehlerniveaus des Typs I sind nicht garantiert.
Ergebnis: Zwischen den Gruppen „keine Seeigel“ und „viele Seeigel“ gibt es signifikante Unterschiede. Jedoch unterscheiden sich „keine“ und „ wenig“ nicht in der mittleren Seegrasanzahl. Auch gibt es keine signifikanten Unterschiede zwischen „wenig“ und „vielen“ Seeigeln.
Post hoc-Tests können auch manuell durchgeführt werden, indem alle paarweisen Gruppenunterschiede mit dem t-Test durchgeführt werden, dann muss das Signifikanzniveau angepasst werden.