Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

29
Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009

Transcript of Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

Page 1: Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

Tutorat IIMultiple Korrelation

Mediator- Moderatoranalyse

19.05.2009

Page 2: Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

Offene Fragen

Welches Diagramm entspricht am besten folgender Korrelationstabelle?

y x1 x2

y 1 0,25 0,64

x1 1 0,04

x2 1

Page 3: Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

Multiple Regression

Multiple Regression - 3

Inhalt:

1. Multiple Regression– Strukturgleichung– Regressionskoeffizienten– Quadratsummen und F-Test– Determinationskoeffizient

2. Multiple Korrelation und multiple Regression- Schrumpfungskorrektur- Capitalization of Chance

3. Selektion der Prädiktoren- Einschluss- Schrittweise

Page 4: Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

Multiple Regression - 4

- Kriterium hängt mehr als einem Prädiktor ab- Zusammenhänge mit vielen Variablen

Beispiel: Erfolg in Statistik II hängt ab von… - Mathematischen Fähigkeiten- Anzahl der Vorlesungs- und Tutoratsbesuche- Anzahl der Arbeitsstunden zu Hause- Motivation / Interesse- IQ- …

Multiple Regression

Page 5: Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

Multiple Regression - 5

Strukturgleichungen

axby ii ˆ

kikkiii axbxbxby ...23.12211 ...ˆ

Bivariate Regression

Multivariate Regression

– Erweiterung der einfachen linearen Regression

mehrere Prädiktorvariablen

– Bestimmung über die Methode der kleinsten Quadrate

N

ii

N

iii eyy

1

2

1

2)ˆ(

Page 6: Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

Ziel der Regressionsanalyse

- Bestimmung der Parameter der Regressionsgleichung: b1, b2, b3, a

Interpretation der b-Gewichte:

• Das Vorzeichen gibt die Richtung des Effekts an.

• Der Betrag gibt an, wie stark ein Prädiktor gewichtet wird.

• Aber: Das Gewicht häng von der Skalierung (dem Wertebereich) von x und y ab.

• Einfacher zu interpretieren sind die standardisierten Gewichte (β).

Page 7: Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

Signifikanztests der multiplen Regression

(1) Wird ein statistisch bedeutsamer Anteil der Varianz des Kriteriums durch alle Prädiktoren gemeinsam aufgeklärt? F-Test

(2) Leisten die einzelnen Prädiktoren einen bedeutsamen Beitrag? t-Tests für alle Prädiktoren

resregtotal SSSSSS

Page 8: Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

Standardisierte Regressionsgewichte(β – Gewichte)

Multiple Regression - 8

Die Regressionsgerade kann auch in einer standardisierten Form beschrieben werden:

kikkiii axbxbxby ...23.12211 ...ˆ

ikkiiyi zzzz ...ˆ 2211

unstandardisiert:

standardisiert:

Vorteil: Die Beta-Gewichte nehmen nur Werte zwischen -1 und +1 an. Sie können wie Korrelationskoeffizienten interpretiert werden.

Die additive Konstante (a) entfällt, da die zy einen Mittelwert von Null hat.

Page 9: Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

Multiple Regression - 9

n

iiires

n

iireg

n

iitotal

yySS

yySS

yySS

1

1

1

)²ˆ(

)²ˆ(

)²(

res

reg

resres

regreg

MS

MSF

KN

SSMS

K

SSMS

1

Signifikanztest dermultiplen Regression und Korrelation

Page 10: Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

Multiple Regression - 10

2

1

/

/

dfSS

dfSSF

res

regGesucht:

total

reg

SS

SSR 2

Signifikanztest dermultiplen Regression und Korrelation

Bekannt:

F soll aus R² berechnet werden!

1df

n)Prädiktoreder (Anzahl df

:mit

,/1

/

/

/

2

1

22

12

2

1

kN

k

dfR

dfR

dfSS

dfSSF

res

regemp

Page 11: Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

Signifikanztest - Beispiel

Multiple Regression - 11

Y X1 X2

Y 1.0 .45 .60

X1 1.0 .30

X2 1.050

44.

66.2

21.

21.

N

R

R

xxy

xxy

/1

/

22

12

dfR

dfRFemp

46.18.012

.22

47/56.

2/44.empF

18.347;2 NdfZdfkritF

Zähler-Freiheitsgrade

Nenner-Freiheitsgrade

Es besteht ein bedeut-samer Zusammenhang zwischen dem Kriterium und den Prädiktoren

Page 12: Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

Übung I:

Eine multiple Korrelation mit 4 Prädiktoren und 47 Probanden ergibt einen Wert von

r = 0.40. Ist der Zusammenhang statistisch bedeutsam? Begründet eure Antwort.

R²= 0.16

Femp = 2;

F(4/42)=2.61 => n.s

Weil Fkrit> Femp …

Page 13: Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

Übung II

(a) Berechnet den emp. F-Wert(b) Ist das Ergebnis statistisch bedeutsam?(c) Wie viele Prädiktoren wurden verwendet?(d) Wie viele Probanden nahmen an der

Untersuchung teil?

Modell Quadrat

summe

df Mittel der Quadrate

F Signifikanz

1Regression

Residuen

ges

30.198

7.661

37.859

15

46

61

2.013

.167

.000

Page 14: Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

Multiple Regression - 14

Korrigiertes R²

R überschätzt Populationszusammenhang!• Die Vorhersage in einer Stichprobe überschätzt Vorhersage

in anderen Stichproben bzw. in der Population• Je kleiner die Stichprobe und je größer die Anzahl der

Prädiktoren desto größer die Überschätzung von R²

Page 15: Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

Multiple Regression - 15

Korrigiertes R²

Schrumpfungskorrektur nach Olkin & Pratt:

22 ²)1(2

²)1(2

31ˆ R

KNR

KN

NR

40.)50(.17

2)50(.

15

171ˆ 22

R

Beispiel: k=3; N=20; R² = .50

Page 16: Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

Multiple Regression - 16

Multiple Regression - Vorgehen

Mögliche Strategien:

1. Hypothesengeleites Vorgehen: Einschluss

2. Hierarchische Regressionsanalysen• Vorwärts-Selektion• Rückwärts-Eliminieren• Schrittweise Vorgehen

Problem: welche und wie viele Prädiktoren sollen für die Vorhersage ausgewählt werden?

=> immer ein „sparsames“ Vorgegehen wählen, weil eine große Prädiktormenge eine Überschätzung von R² fördert.

Page 17: Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

Multiple Regression - 17

Multiple Regression - Vorgehen

EinschlussA priori Auswahl der aufzunehmenden Prädiktoren

(aufgrund von Vorwissen oder Theorie)

Vorteile:– Hypothesengeleitetes Vorgehen– Keine Capitalization of Chance

Nachteile:– Möglicherweise Aufnahme von mehr Prädiktoren als unbedingt

erforderlich (Prädiktoren, die keinen signifikanten Beitrag leisten)Dies kann zu einer Verringerung des F-Wertes führen (wegen der größeren Anzahl der Zähler-Freiheitsgrade), und damit die Teststärke verringern.

– Möglicherweise werden wichtige Prädiktoren „übersehen“ bzw. „vergessen“

Page 18: Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

Multiple Regression - 18

Hierarchische RegressionsanalysenPost hoc werden die am besten passenden Prädiktoren emp. bestimmt

Vorteile:– Minimum an Prädiktoren– Exploratives Vorgehen möglich.

Nachteile:– Capitalization of Chance wg. Bevorzugung hoch

korrelierender Prädiktoren– Kein hypothesengeleitetes Vorgehen

Multiple Regression - Vorgehen

Page 19: Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

Vorwärts-Selektion

• Aus einer Menge möglicher Prädiktoren wird der Prädiktor mit der höchsten Validität zuerst aufgenommen.

• Unter den verbleibenden Prädiktoren wird immer derjenige ausgewählt, der den größten Teil der verbleibenden Varianz aufklärt (=höchste inkrementelle Validität).

• Wenn kein Prädiktor die aufgeklärte Varianz signifikant erhöht,ist die endgültige Auswahl gefunden.

Page 20: Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

Rückwärts-Eliminierung

• Zunächst werden alle Prädiktoren eingeschlossen

• Dann wird immer der Prädiktor weglassen, der am wenigsten zur Vorhersage beiträgt

• Wenn der Ausschluss eines Prädiktors zu einer signifikanten Reduktion der aufgeklärten Varianz führen würde, wird der Selektionsprozess abgebrochen

Page 21: Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

Multiple Regression - 21

Schrittweise Selektion:• Es wird abwechseln ein Vorwärts- und ein Rückwärtsschritt durchgeführt.

• Dadurch werden Variablen, die im Kontext neu aufgenommener Prädiktoren keine Varianz mehr aufklären, im Nachhinein wieder entfernt.

• Diese Schritte werden so lange wiederholt, bis eine optimale Vorhersage gefunden ist.

Multiple Regression - Vorgehen

Page 22: Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

1. Weitere Regressionsanalysen

Mediatoranalyse:

Wird der Zusammenhang von X und Y durch M vermittelt?

Moderatoranalyse:

Wird der Zusammenhang von X und Y durch M beeinflusst?

Page 23: Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

Mediatoranalyse

• Annahme zur Kausalität kann gemacht werden (wirkt etwas direkt oder indirekt)

• man untersucht, wie etwas wirkt

• Schaubild an Tafel

Page 24: Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

Mediatoranalyse Vorgehen

1. Schritt: Regression von Y auf X. (Regression der Note auf die Motivation) Y = b X + a Nur wenn sich ein signifikanter Zusammenhang zwischen Y und X zeigt (b ≠ 0), kann eine Mediation vorliegen.

2. Schritt: Regression von M auf X.(Regression der Lerndauer auf die Motivation) M = b X + a

b ≠ 0, sonst keine Mediation 3. Schritt: Regression von Y auf M.(Regression der Note auf die Lerndauer)

Y = b M + a b ≠ 0, sonst keine Mediation

4. Schritt: Regression von Y auf X und M.(Regression der Note auf die Lerndauer und die Motivation)

Y = b1X + b2 M + a

Page 25: Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

Ergebnis Mediatoranalyse

= 0: „Vollständige Mediation“

| |> 0, aber kleiner als in Schritt 1: „partielle Mediation“

gleich wie in Schritt 1: Keine Mediation

• Man unterscheidet einen partiellen Mediator-Effekt von einem vollständigem Mediator-Effekt

• Ein partieller Mediator-Effekt liegt dann vor, wenn Z von X und zugleich Y von Z beeinflusst wird, aber X zudem auch einen direkten Effekt auf Y ausübt

• Ein totaler Mediator-Effekt liegt hingegen vor, wenn der Effekt von X auf Y komplett durch Z interveniert wird und kein direkter Effekt mehr zwischen X und Y besteht (komplette Effekt der M auf die Note wird über Lerndauer vermittelt)

yxb ,

Mxb ,

Mxb ,

Page 26: Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

Moderatoranalyse

• Merkmalausprägung in der Moderatorvariablen bestimmt die Stärke der Prädiktion bei der Vorhersage der Variablen Y durch eine Variable X

• Unterschied zur Mediatoranalyse Moderator wirkt auf b-Gewichte der Regression, nicht auf aV, oder wird auch nicht von uV beeinflusst

Bsp.: Zusammenhang von verbaler Intelligenz (x) und Gedächtnisleistung (y) hängt vom Alter (z) ab

(Abbildung anfertigen)

Page 27: Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

Moderatoranalyse- Vorgehen1. Schritt: z-Transformation von X und M

2. Schritt: Berechnung eines neuen Prädiktors: P = z(X) ∙ z(M).

3. Schritt: Berechnung einer Regression von Y auf z(X), z(Y) und P

Interpretation des Regressionsgewichts von P:

• b> 0 (sig): Je größer M, desto höher (positiver) die Steigung der ursprünglichen Regressionsgeraden

• b< 0 (sig) : Je größer M, desto geringer (negativer) die Steigung der ursprünglichen Regressionsgeraden

• b≈0 (n.s.): Keine Moderation des Zusammenhangs von X und Y durch M.

Page 28: Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

Übungen:

Modell Quadrat

summe

df Mittel der Quadrate

F Signifikanz

1Regression

Residuen

ges

24.115

???

38.389

3

???

64

8.038

???

??? .000

Page 29: Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

Lösung:

Modell Quadrat

summe

df Mittel der Quadrate

F Signifikanz

1Regression

Residuen

ges

24.115

14.274

38.389

3

61

64

8.038

0.234

34.350 .000