Einfaktorielle Varianzanalyse. Einführendes Beispiel Es soll in einer empirischen Untersuchung...

Post on 05-Apr-2015

103 views 0 download

Transcript of Einfaktorielle Varianzanalyse. Einführendes Beispiel Es soll in einer empirischen Untersuchung...

Einfaktorielle VarianzanalyseEinfaktorielle Varianzanalyse

Einführendes Beispiel

Es soll in einer empirischen Untersuchung überprüft werden, ob das Alter von

Vpn einen Einfluss auf ihre Einstellung zu Gewalt in der Erziehung hat.

Dazu werden die Probanden in zwei Gruppen eingeteilt:

Gruppe 1: Vpn < 20 Jahre

Gruppe 2: Vpn > 20 Jahre

Stichprobentyp: unabhängig

UV (Faktor): Alter

Ausprägung der UV: 2 (Vpn < 20 Jahre & Vpn > 20 Jahre)

AV: Einstellung zu Gewalt in der Erziehung

Testverfahren: t-Test für unabhängige Stichproben

t-Test

Prüft, ob die Mittelwerte einzelner Gruppen (maximal 2) einer

Variablen in der Grundgesamtheit gleich groß sind.

Problem: Wie verhält es sich, wenn die UV mehr als 2

Ausprägungen hat?

Beispiel Es soll in einer empirischen Untersuchung überprüft werden, ob das Alter von

Vpn einen Einfluss auf ihre Einstellung zu Gewalt in der Erziehung hat. Dazu werden die Probanden in vier Gruppen eingeteilt:Gruppe 1: Vpn < 20 JahreGruppe 2: Vpn 20-40 JahreGruppe 3: Vpn 40-60 JahreGruppe 4: Vpn > 60 Jahre

Vorgehensweise bei Berechnung eines t-Testes Vergleich zwischen:

Gruppe 1 & Gruppe 2 Gruppe 2 & Gruppe 3 Gruppe 1 & Gruppe 3 Gruppe 2 & Gruppe 4 Gruppe 1 & Gruppe 4 Gruppe 3 & Gruppe 4

Vergleich zwischen 3 Gruppen

1. Hypothese µ1 = µ 2

2. Hypothese µ2 = µ 3

Falls die Hypothesen 1 und 2 zutreffen, bedingt sich die letzte

Nullhypothese von selbst!

3. Hypothese µ1 = µ3

Schlussfolgerung

Wenn die UV mehr als zwei Ausprägungen hat:

1. Können nur p-1 verschiedenen unabhängige Nullhypothesen

getestet werden (p = Zahl der Faktorstufen)

2. Mit jedem t-Test erhöht sich die Irrtumswahrscheinlichkeit α

α-Fehler-Adjustierung (Irrtumswahrscheinlichkeiten der

Einzeltests muss in ihrer Summe ein Gesamt-α von 5% haben)

Jeder Test wird mit einer Irrtumswahrscheinlichkeit von 5/m%

geprüft (m = Anzahl der durchgeführten Tests)

Argumente gegen einen t-Test bei mehr als 2 Ausprägungen der UV

Die Anzahl der Paare, die man mit einem t-Test vergleichen

möchte, ist zu groß!

Bei vielen t-Test werden schon einige zufällig signifikant:

große Schwierigkeiten, die signifikanten Ergebnisse zu

interpretieren!

Varianzanalyse

Erlaubt einen gleichzeitigen Vergleich zwischen mehreren

Stichproben, oder:

Überprüft den Einfluss 1 UV mit mehr als zwei Ausprägungen

auf 1 AV.

Voraussetzung für die Varianzanalyse:

AV muss intervallskaliert sein!

Formen der Varianzanalyse

Stufen der AV

1 2

Stufen

der UV

1einfaktorielle univariate VA

einfaktorielle multivariate VA

2Mehrfaktorielle univariate VA

mehrfaktorielle multivariate VA

Hypothesen der Varianzanalyse

Ho = Alle verglichenen Gruppenmittelwerte der AV sind in

der Grundgesamtheit identisch.

Ho = µ1 = µ2 = ... µ m

H1 = Mindestens 2 Gruppenmittelwerte der AV

unterscheiden sich in der Grundgesamtheit.

H1 = µ1 ≠ µ2 = ... µ m

Beispieldatensatz

Vpn < 20 Jahre 20-40 Jahre 40-60 Jahre > 60 Jahre

1 2 3 6 5

2 1 4 8 5

3 3 3 7 5

4 3 5 4 3

5 1 0 10 2

Summe 10 15 35 20

Mittelwerte 2 3 7 4

Ziel und Grundgedanke der Varianzanalyse Zerlegung der Varianzen bzw. Streuung in ihre verschiedenen

Bestandteile

Lassen sich vorhandene Unterschiede auf Unterschiede zwischen den Gruppen zurückführen?

(im Beispiel: Altersunterschiede)

Oder:

Lassen sich vorhandene Unterschiede auf Unterschiede innerhalb der Gruppe zurückführen?

(im Beispiel: Zusammensetzung der jeweiligen Stichprobe so genannte „Störvariablen“ oder „Fehlervariablen“)

1. Schritt: Bestimmung von QStot und σ2

tot

Bestimmung der Gesamtvarianz aller Messwerte

n

i

i

n

xx

1

2

2

1

df

QStottot 2

df tot = (n x p - 1)

2. Schritt: Bestimmung von QStreat und σ2

treat

Vpn < 20 Jahre 20-40 Jahre

40-60 Jahre

> 60 Jahre

1 2 3 6 5

2 1 4 8 5

3 3 3 7 5

4 3 5 4 3

5 1 0 10 2

Summe 10 15 35 20

Mittelwerte 2 3 7 4

2. Schritt: Bestimmung von QStreat und σ2

treat

Vpn < 20 Jahre 20-40 Jahre

40-60 Jahre

> 60 Jahre

1 2 3 7 4

2 2 3 7 4

3 2 3 7 4

4 2 3 7 4

5 2 3 7 4

Frage: Wie verhalten sich die Varianzen zwischen den Stichproben?

3. Schritt: Bestimmung von QSFehler und σ2

Fehler

Frage: Wie verhalten sich die Varianzen innerhalb der Gruppe?

Unterscheiden sich die Messwerte innerhalb einer Gruppe, so

kann dieses nur auf Störgrößen zurückgeführt werden.

Quantifizierung der Störgröße: Berechnung der Abweichung

jeder Vpn vom Gruppenmittelwert

Fehler

FehlerFehler

df

QS2 df= p x (n - 1)

3. Schritt: Signifikanzberechnung

Fehler

treatF

2

2

dfzähler = p - 1

dfnenner = p x (n – 1)

Darstellungsweise der Ergebnisse

QS df 2 F p

Treatment 70 3 23,33 8,10 .049

Fehler 46 16 2,88

Total 116 19 6,11

Einzelvergleiche

falls ein signifikanter F-Wertes existiert:

Durchführung von Einzelvergleichen oder

Kontrasten (Scheffé) Test

Bestimmung der kritischen Differenzschwelle, ab der Mittelwerte

signifikant werden.

n

FpDiff

anpFehlercrit

%%100,1,12 *)1(2

Einzelvergleiche

Vpn < 20 Jahre 20-40 Jahre 40-60 Jahre > 60 Jahre

1 2 3 6 5

2 1 4 8 5

3 3 3 7 5

4 3 5 4 3

5 1 0 10 2

Summe 10 15 35 20

Mittelwerte 2 3 7 4

…Ende