Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

Post on 05-Apr-2015

123 views 4 download

Transcript of Tutorat II Multiple Korrelation Mediator- Moderatoranalyse 19.05.2009.

Tutorat IIMultiple Korrelation

Mediator- Moderatoranalyse

19.05.2009

Offene Fragen

Welches Diagramm entspricht am besten folgender Korrelationstabelle?

y x1 x2

y 1 0,25 0,64

x1 1 0,04

x2 1

Multiple Regression

Multiple Regression - 3

Inhalt:

1. Multiple Regression– Strukturgleichung– Regressionskoeffizienten– Quadratsummen und F-Test– Determinationskoeffizient

2. Multiple Korrelation und multiple Regression- Schrumpfungskorrektur- Capitalization of Chance

3. Selektion der Prädiktoren- Einschluss- Schrittweise

Multiple Regression - 4

- Kriterium hängt mehr als einem Prädiktor ab- Zusammenhänge mit vielen Variablen

Beispiel: Erfolg in Statistik II hängt ab von… - Mathematischen Fähigkeiten- Anzahl der Vorlesungs- und Tutoratsbesuche- Anzahl der Arbeitsstunden zu Hause- Motivation / Interesse- IQ- …

Multiple Regression

Multiple Regression - 5

Strukturgleichungen

axby ii ˆ

kikkiii axbxbxby ...23.12211 ...ˆ

Bivariate Regression

Multivariate Regression

– Erweiterung der einfachen linearen Regression

mehrere Prädiktorvariablen

– Bestimmung über die Methode der kleinsten Quadrate

N

ii

N

iii eyy

1

2

1

2)ˆ(

Ziel der Regressionsanalyse

- Bestimmung der Parameter der Regressionsgleichung: b1, b2, b3, a

Interpretation der b-Gewichte:

• Das Vorzeichen gibt die Richtung des Effekts an.

• Der Betrag gibt an, wie stark ein Prädiktor gewichtet wird.

• Aber: Das Gewicht häng von der Skalierung (dem Wertebereich) von x und y ab.

• Einfacher zu interpretieren sind die standardisierten Gewichte (β).

Signifikanztests der multiplen Regression

(1) Wird ein statistisch bedeutsamer Anteil der Varianz des Kriteriums durch alle Prädiktoren gemeinsam aufgeklärt? F-Test

(2) Leisten die einzelnen Prädiktoren einen bedeutsamen Beitrag? t-Tests für alle Prädiktoren

resregtotal SSSSSS

Standardisierte Regressionsgewichte(β – Gewichte)

Multiple Regression - 8

Die Regressionsgerade kann auch in einer standardisierten Form beschrieben werden:

kikkiii axbxbxby ...23.12211 ...ˆ

ikkiiyi zzzz ...ˆ 2211

unstandardisiert:

standardisiert:

Vorteil: Die Beta-Gewichte nehmen nur Werte zwischen -1 und +1 an. Sie können wie Korrelationskoeffizienten interpretiert werden.

Die additive Konstante (a) entfällt, da die zy einen Mittelwert von Null hat.

Multiple Regression - 9

n

iiires

n

iireg

n

iitotal

yySS

yySS

yySS

1

1

1

)²ˆ(

)²ˆ(

)²(

res

reg

resres

regreg

MS

MSF

KN

SSMS

K

SSMS

1

Signifikanztest dermultiplen Regression und Korrelation

Multiple Regression - 10

2

1

/

/

dfSS

dfSSF

res

regGesucht:

total

reg

SS

SSR 2

Signifikanztest dermultiplen Regression und Korrelation

Bekannt:

F soll aus R² berechnet werden!

1df

n)Prädiktoreder (Anzahl df

:mit

,/1

/

/

/

2

1

22

12

2

1

kN

k

dfR

dfR

dfSS

dfSSF

res

regemp

Signifikanztest - Beispiel

Multiple Regression - 11

Y X1 X2

Y 1.0 .45 .60

X1 1.0 .30

X2 1.050

44.

66.2

21.

21.

N

R

R

xxy

xxy

/1

/

22

12

dfR

dfRFemp

46.18.012

.22

47/56.

2/44.empF

18.347;2 NdfZdfkritF

Zähler-Freiheitsgrade

Nenner-Freiheitsgrade

Es besteht ein bedeut-samer Zusammenhang zwischen dem Kriterium und den Prädiktoren

Übung I:

Eine multiple Korrelation mit 4 Prädiktoren und 47 Probanden ergibt einen Wert von

r = 0.40. Ist der Zusammenhang statistisch bedeutsam? Begründet eure Antwort.

R²= 0.16

Femp = 2;

F(4/42)=2.61 => n.s

Weil Fkrit> Femp …

Übung II

(a) Berechnet den emp. F-Wert(b) Ist das Ergebnis statistisch bedeutsam?(c) Wie viele Prädiktoren wurden verwendet?(d) Wie viele Probanden nahmen an der

Untersuchung teil?

Modell Quadrat

summe

df Mittel der Quadrate

F Signifikanz

1Regression

Residuen

ges

30.198

7.661

37.859

15

46

61

2.013

.167

.000

Multiple Regression - 14

Korrigiertes R²

R überschätzt Populationszusammenhang!• Die Vorhersage in einer Stichprobe überschätzt Vorhersage

in anderen Stichproben bzw. in der Population• Je kleiner die Stichprobe und je größer die Anzahl der

Prädiktoren desto größer die Überschätzung von R²

Multiple Regression - 15

Korrigiertes R²

Schrumpfungskorrektur nach Olkin & Pratt:

22 ²)1(2

²)1(2

31ˆ R

KNR

KN

NR

40.)50(.17

2)50(.

15

171ˆ 22

R

Beispiel: k=3; N=20; R² = .50

Multiple Regression - 16

Multiple Regression - Vorgehen

Mögliche Strategien:

1. Hypothesengeleites Vorgehen: Einschluss

2. Hierarchische Regressionsanalysen• Vorwärts-Selektion• Rückwärts-Eliminieren• Schrittweise Vorgehen

Problem: welche und wie viele Prädiktoren sollen für die Vorhersage ausgewählt werden?

=> immer ein „sparsames“ Vorgegehen wählen, weil eine große Prädiktormenge eine Überschätzung von R² fördert.

Multiple Regression - 17

Multiple Regression - Vorgehen

EinschlussA priori Auswahl der aufzunehmenden Prädiktoren

(aufgrund von Vorwissen oder Theorie)

Vorteile:– Hypothesengeleitetes Vorgehen– Keine Capitalization of Chance

Nachteile:– Möglicherweise Aufnahme von mehr Prädiktoren als unbedingt

erforderlich (Prädiktoren, die keinen signifikanten Beitrag leisten)Dies kann zu einer Verringerung des F-Wertes führen (wegen der größeren Anzahl der Zähler-Freiheitsgrade), und damit die Teststärke verringern.

– Möglicherweise werden wichtige Prädiktoren „übersehen“ bzw. „vergessen“

Multiple Regression - 18

Hierarchische RegressionsanalysenPost hoc werden die am besten passenden Prädiktoren emp. bestimmt

Vorteile:– Minimum an Prädiktoren– Exploratives Vorgehen möglich.

Nachteile:– Capitalization of Chance wg. Bevorzugung hoch

korrelierender Prädiktoren– Kein hypothesengeleitetes Vorgehen

Multiple Regression - Vorgehen

Vorwärts-Selektion

• Aus einer Menge möglicher Prädiktoren wird der Prädiktor mit der höchsten Validität zuerst aufgenommen.

• Unter den verbleibenden Prädiktoren wird immer derjenige ausgewählt, der den größten Teil der verbleibenden Varianz aufklärt (=höchste inkrementelle Validität).

• Wenn kein Prädiktor die aufgeklärte Varianz signifikant erhöht,ist die endgültige Auswahl gefunden.

Rückwärts-Eliminierung

• Zunächst werden alle Prädiktoren eingeschlossen

• Dann wird immer der Prädiktor weglassen, der am wenigsten zur Vorhersage beiträgt

• Wenn der Ausschluss eines Prädiktors zu einer signifikanten Reduktion der aufgeklärten Varianz führen würde, wird der Selektionsprozess abgebrochen

Multiple Regression - 21

Schrittweise Selektion:• Es wird abwechseln ein Vorwärts- und ein Rückwärtsschritt durchgeführt.

• Dadurch werden Variablen, die im Kontext neu aufgenommener Prädiktoren keine Varianz mehr aufklären, im Nachhinein wieder entfernt.

• Diese Schritte werden so lange wiederholt, bis eine optimale Vorhersage gefunden ist.

Multiple Regression - Vorgehen

1. Weitere Regressionsanalysen

Mediatoranalyse:

Wird der Zusammenhang von X und Y durch M vermittelt?

Moderatoranalyse:

Wird der Zusammenhang von X und Y durch M beeinflusst?

Mediatoranalyse

• Annahme zur Kausalität kann gemacht werden (wirkt etwas direkt oder indirekt)

• man untersucht, wie etwas wirkt

• Schaubild an Tafel

Mediatoranalyse Vorgehen

1. Schritt: Regression von Y auf X. (Regression der Note auf die Motivation) Y = b X + a Nur wenn sich ein signifikanter Zusammenhang zwischen Y und X zeigt (b ≠ 0), kann eine Mediation vorliegen.

2. Schritt: Regression von M auf X.(Regression der Lerndauer auf die Motivation) M = b X + a

b ≠ 0, sonst keine Mediation 3. Schritt: Regression von Y auf M.(Regression der Note auf die Lerndauer)

Y = b M + a b ≠ 0, sonst keine Mediation

4. Schritt: Regression von Y auf X und M.(Regression der Note auf die Lerndauer und die Motivation)

Y = b1X + b2 M + a

Ergebnis Mediatoranalyse

= 0: „Vollständige Mediation“

| |> 0, aber kleiner als in Schritt 1: „partielle Mediation“

gleich wie in Schritt 1: Keine Mediation

• Man unterscheidet einen partiellen Mediator-Effekt von einem vollständigem Mediator-Effekt

• Ein partieller Mediator-Effekt liegt dann vor, wenn Z von X und zugleich Y von Z beeinflusst wird, aber X zudem auch einen direkten Effekt auf Y ausübt

• Ein totaler Mediator-Effekt liegt hingegen vor, wenn der Effekt von X auf Y komplett durch Z interveniert wird und kein direkter Effekt mehr zwischen X und Y besteht (komplette Effekt der M auf die Note wird über Lerndauer vermittelt)

yxb ,

Mxb ,

Mxb ,

Moderatoranalyse

• Merkmalausprägung in der Moderatorvariablen bestimmt die Stärke der Prädiktion bei der Vorhersage der Variablen Y durch eine Variable X

• Unterschied zur Mediatoranalyse Moderator wirkt auf b-Gewichte der Regression, nicht auf aV, oder wird auch nicht von uV beeinflusst

Bsp.: Zusammenhang von verbaler Intelligenz (x) und Gedächtnisleistung (y) hängt vom Alter (z) ab

(Abbildung anfertigen)

Moderatoranalyse- Vorgehen1. Schritt: z-Transformation von X und M

2. Schritt: Berechnung eines neuen Prädiktors: P = z(X) ∙ z(M).

3. Schritt: Berechnung einer Regression von Y auf z(X), z(Y) und P

Interpretation des Regressionsgewichts von P:

• b> 0 (sig): Je größer M, desto höher (positiver) die Steigung der ursprünglichen Regressionsgeraden

• b< 0 (sig) : Je größer M, desto geringer (negativer) die Steigung der ursprünglichen Regressionsgeraden

• b≈0 (n.s.): Keine Moderation des Zusammenhangs von X und Y durch M.

Übungen:

Modell Quadrat

summe

df Mittel der Quadrate

F Signifikanz

1Regression

Residuen

ges

24.115

???

38.389

3

???

64

8.038

???

??? .000

Lösung:

Modell Quadrat

summe

df Mittel der Quadrate

F Signifikanz

1Regression

Residuen

ges

24.115

14.274

38.389

3

61

64

8.038

0.234

34.350 .000