1 SS 2006 Langzeitauswirkungen von frühpädagogischen Betreuungen Statistische...

35
1 SS 2006 SS 2006 Langzeitauswirkungen von Langzeitauswirkungen von frühpädagogischen Betreuungen frühpädagogischen Betreuungen Statistische Auswertungsverfahren Statistische Auswertungsverfahren

Transcript of 1 SS 2006 Langzeitauswirkungen von frühpädagogischen Betreuungen Statistische...

1

SS 2006SS 2006Langzeitauswirkungen von Langzeitauswirkungen von

frühpädagogischen Betreuungenfrühpädagogischen Betreuungen

Statistische AuswertungsverfahrenStatistische Auswertungsverfahren

2

Statistische AuswertungsverfahrenStatistische Auswertungsverfahren

GrundideenGrundideen• Analyse von GruppenunterschiedenAnalyse von Gruppenunterschieden

t-Testt-Test einfache und multiple Varianzanalyseeinfache und multiple Varianzanalyse KovarianzanalyseKovarianzanalyse

• Analyse von ZusammenhängenAnalyse von Zusammenhängen KorrelationKorrelation RegressionRegression hierarchische Regressionhierarchische Regression

3

Gruppenunterschiede – t-TestGruppenunterschiede – t-Test

FragestellungFragestellung• Werte von 2 Gruppen von Kindern in einer Werte von 2 Gruppen von Kindern in einer

Variablen; z.B. von Mädchen (nVariablen; z.B. von Mädchen (n11) und Jungen ) und Jungen (n(n22) in einem Indikator des Sozialverhalten) in einem Indikator des Sozialverhalten

• Unterscheiden sich die beiden Gruppen signifi-Unterscheiden sich die beiden Gruppen signifi-kant, d.h. nicht nur zufällig, in dieser Variablen?kant, d.h. nicht nur zufällig, in dieser Variablen?

• Das Merkmal Geschlecht, das die beiden Grup-Das Merkmal Geschlecht, das die beiden Grup-pen definiert, wird pen definiert, wird unabhängige Variableunabhängige Variable oder oder FaktorFaktor genannt. genannt.

• Der Indikator des Sozialverhaltens, der evtl. Der Indikator des Sozialverhaltens, der evtl. vom Geschlecht abhängig ist, wird vom Geschlecht abhängig ist, wird abhängige abhängige VariableVariable genannt. genannt.

4

Gruppenunterschiede – t-TestGruppenunterschiede – t-Test

Was heißt Unterschiede?Was heißt Unterschiede?1.1. Unterschiede schlagen sich in den Mittelwerten Unterschiede schlagen sich in den Mittelwerten

und in den Streuungen nieder. Getestet werden und in den Streuungen nieder. Getestet werden Mittelwertunterschiede.Mittelwertunterschiede.

2.2. Stichprobenmittelwerte können sich auch zu-Stichprobenmittelwerte können sich auch zu-fällig unterscheiden. Gefragt ist aber, ob die fällig unterscheiden. Gefragt ist aber, ob die Mittelwerte in den beiden Grundgesamtheiten Mittelwerte in den beiden Grundgesamtheiten (Populationsmittelwerte) sich unterscheiden.(Populationsmittelwerte) sich unterscheiden.

3.3. Einladung zu einem Gedankenspiel:Einladung zu einem Gedankenspiel:

5

Gruppenunterschiede – t-TestGruppenunterschiede – t-Test

• Wir ziehen nicht nur 1 Stichprobe von Mädchen und 1 Stich-Wir ziehen nicht nur 1 Stichprobe von Mädchen und 1 Stich-probe von Jungen aus den jeweiligen Populationen, sondern probe von Jungen aus den jeweiligen Populationen, sondern sehr viele Paare von Stichproben mit fixem nsehr viele Paare von Stichproben mit fixem n11 und n und n22..

• Wir berechnen für jedes Paar die Mittelwertdifferenz.Wir berechnen für jedes Paar die Mittelwertdifferenz.• Unter der Annahme, dass zwischen den Mittelwerten in den Unter der Annahme, dass zwischen den Mittelwerten in den

Populationen kein Unterschied besteht, folgt die Verteilung Populationen kein Unterschied besteht, folgt die Verteilung der Stichprobendifferenzen einer bestimmten Form der Stichprobendifferenzen einer bestimmten Form t-Ver- t-Ver-teilung (ab nteilung (ab n11 + n + n22 ≥≥ 30 oder 50 30 oder 50 Normalverteilung).Normalverteilung).

• Diese t-Verteilung ist abhängig von den Stichprobenumfängen Diese t-Verteilung ist abhängig von den Stichprobenumfängen (n(n11 + n + n22) – genauer von den Freiheitsgraden (n) – genauer von den Freiheitsgraden (n11 + n + n22 – 2). – 2).

• Aus der t-Verteilung kann abgelesen werden, wie wahrschein-Aus der t-Verteilung kann abgelesen werden, wie wahrschein-lich Mittelwertdifferenzen sind, die größer als die von uns lich Mittelwertdifferenzen sind, die größer als die von uns gefundenen sind.gefundenen sind.

• Voraussetzung ist bei „kleinen Stichproben“ (nVoraussetzung ist bei „kleinen Stichproben“ (n11 + n + n22 ≥≥ 30 30 oder 50): Merkmal muss normalverteilt sein.oder 50): Merkmal muss normalverteilt sein.

6

Gruppenunterschiede – t-TestGruppenunterschiede – t-Test

4.4. Vergleich der gefundenen Stichprobendiffe-Vergleich der gefundenen Stichprobendiffe-renz mit tabellierten „kritischen“ Werten: Ist renz mit tabellierten „kritischen“ Werten: Ist die gefundene Differenz größer als der tabel-die gefundene Differenz größer als der tabel-lierte Wert, wird die Nullhypothese verworfen. lierte Wert, wird die Nullhypothese verworfen. Ist sie kleiner oder gleich, wird sie beibehal-Ist sie kleiner oder gleich, wird sie beibehal-ten.ten.

5.5. Je nach gewünschtem „Sicherheitsniveau“ Je nach gewünschtem „Sicherheitsniveau“ müssen andere kritische Werte betrachtet müssen andere kritische Werte betrachtet werden. Üblicherweise 5 %-, 1 %- oder 0,1 %-werden. Üblicherweise 5 %-, 1 %- oder 0,1 %-Niveau, z.B. 5 %-Niveau: Ich akzeptiere, in Niveau, z.B. 5 %-Niveau: Ich akzeptiere, in weniger als 5 von 100 Fällen die Nullhypothe-weniger als 5 von 100 Fällen die Nullhypothe-se zu verwerfen, obwohl sie richtig ist.se zu verwerfen, obwohl sie richtig ist.

7

Gruppenunterschiede – t-TestGruppenunterschiede – t-Test

6.6. Leider ist die Testgröße nicht die einfache Leider ist die Testgröße nicht die einfache Differenz zwischen den beiden Mittelwerten, Differenz zwischen den beiden Mittelwerten, sondern etwas komplizierter (das ist aber nur sondern etwas komplizierter (das ist aber nur rechnen).rechnen).

)nn

(nn

1)s - (n s)n(x - x t

21

22

21

2

21

11 112

1 2

8

Gruppenunterschiede – t-TestGruppenunterschiede – t-Test

7.7. Achtung: Je größer nAchtung: Je größer n11 und n und n22 sind, desto eher sind, desto eher wird ein Mittelwertunterschied statistisch sig-wird ein Mittelwertunterschied statistisch sig-nifikant! nifikant! Unterschied zwischen statistischer Unterschied zwischen statistischer und praktischer Signifikanz.und praktischer Signifikanz.

8.8. t-Test für unabhängige Stichproben und t-Test t-Test für unabhängige Stichproben und t-Test für abhängige Stichprobenfür abhängige Stichproben

9

Gruppenunterschiede – einfache und multiple VarianzanalyseGruppenunterschiede – einfache und multiple Varianzanalyse

Einfache VarianzanalyseEinfache Varianzanalyse1.1. Nicht mehr 2 Ausprägungen der unabhängigen Nicht mehr 2 Ausprägungen der unabhängigen

Variablen, sondern mehrere; Beispiel: mütter-Variablen, sondern mehrere; Beispiel: mütter-licher Bildungsabschluss in niedrig, mittel und licher Bildungsabschluss in niedrig, mittel und hoch und der Einfluss auf das Sozialverhalten.hoch und der Einfluss auf das Sozialverhalten.

2.2. Frage nach dem Zusammenhang zwischen ei-Frage nach dem Zusammenhang zwischen ei-ner qualitativen und einer quantitativen Varia-ner qualitativen und einer quantitativen Varia-blen.blen.

3.3. Frage nach den Unterschieden ist wieder Fra-Frage nach den Unterschieden ist wieder Fra-ge nach den Mittelwertunterschieden in den ge nach den Mittelwertunterschieden in den Populationen.Populationen.

10

Gruppenunterschiede – einfache und multiple VarianzanalyseGruppenunterschiede – einfache und multiple Varianzanalyse

4.4. Formalisiert:Formalisiert:• Nullhypothese HNullhypothese H00: Alle Populationsmittel-: Alle Populationsmittel-

werte sind gleich - werte sind gleich - μμ11 = μ = μ2 2 = μ= μ33

• Alternativhypothese HAlternativhypothese H11: Mindestens ein Mit-: Mindestens ein Mit-telwert unterscheidet sich von den anderen.telwert unterscheidet sich von den anderen.

• Welche Hypothese ist bei einem festzulegen-Welche Hypothese ist bei einem festzulegen-den Sicherheitsniveau wahrscheinlicher?den Sicherheitsniveau wahrscheinlicher?

5.5. Grundidee: Wir setzen die Unterschiede zwi-Grundidee: Wir setzen die Unterschiede zwi-schen den Gruppenmittelwerten in Bezie-schen den Gruppenmittelwerten in Bezie-hung zu den Unterschieden innerhalb der hung zu den Unterschieden innerhalb der Gruppen.Gruppen.

11

Gruppenunterschiede – einfache und multiple VarianzanalyseGruppenunterschiede – einfache und multiple Varianzanalyse

Zwei Möglichkeiten:Zwei Möglichkeiten:• Sind die Unterschiede zwischen den Grup-Sind die Unterschiede zwischen den Grup-

penmittelwerten klein im Verhältnis zu den penmittelwerten klein im Verhältnis zu den Unterschieden innerhalb der Gruppen:Unterschieden innerhalb der Gruppen:Beibehalt von HBeibehalt von H00 = Ablehnung von Grup- = Ablehnung von Grup-

penunterschiedenpenunterschieden• Sind die Unterschiede zwischen den Grup-Sind die Unterschiede zwischen den Grup-

penmittelwerten fast so groß wie die Unter-penmittelwerten fast so groß wie die Unter-schiede innerhalb der Gruppen:schiede innerhalb der Gruppen:Ablehnung von HAblehnung von H00 = Annahme von Grup- = Annahme von Grup-

penunterschiedenpenunterschieden

12

Gruppenunterschiede – einfache und multiple VarianzanalyseGruppenunterschiede – einfache und multiple Varianzanalyse

6.6. Formalisierung der Grundidee:Formalisierung der Grundidee:Zerlegung der Messwerte in:Zerlegung der Messwerte in:

)xx()xx(xx GGii

Es gilt dann (SAQ = Summe der Abweichungsquadrate):Es gilt dann (SAQ = Summe der Abweichungsquadrate):

gNSAQMAQ within

within

betweenwithintotal SAQSAQSAQ

SAQs sind abhängig von den Fallzahlen SAQs sind abhängig von den Fallzahlen Bildung mittlerer Bildung mittlerer Abweichungsquadrate MAQ:Abweichungsquadrate MAQ:

1

gSAQMAQ between

between g = Anzahl Gruppen

N = Anzahl Fälle ins-gesamt

13

Gruppenunterschiede – einfache und multiple VarianzanalyseGruppenunterschiede – einfache und multiple Varianzanalyse

Testgröße ist dann:Testgröße ist dann:

within

between

MAQMAQF

oderoder

gNSAQ

gSAQ

Fwithin

between

1

Der F-Wert wird mit tabellierten kritischen F-Werten verglichen Der F-Wert wird mit tabellierten kritischen F-Werten verglichen (nachschauen (nachschauen α, Freiheitsgrade Zähler = g – 1; Freiheitsgrade α, Freiheitsgrade Zähler = g – 1; Freiheitsgrade Nenner = N – g):Nenner = N – g):• falls unser F-Wert >falls unser F-Wert > dem tabellierten Wert dem tabellierten Wert Ablehnung von H Ablehnung von H00

• falls unser F-Wert ≤ dem tabellierten Wert falls unser F-Wert ≤ dem tabellierten Wert Beibehalt von H Beibehalt von H00

14

Gruppenunterschiede – einfache und multiple VarianzanalyseGruppenunterschiede – einfache und multiple Varianzanalyse

7.7. Bei Ablehnung von HBei Ablehnung von H00 wissen wir, dass wissen wir, dass mindestens ein Populationsmittelwert von mindestens ein Populationsmittelwert von den anderen verschieden ist. Aber wo liegen den anderen verschieden ist. Aber wo liegen die Unterschiede?die Unterschiede?

anschließender Test, z.B. DUNCAN-Test: anschließender Test, z.B. DUNCAN-Test: Welche Sets von Mittelwerte unterschei-Welche Sets von Mittelwerte unterschei-den sich signifikant und welche nicht?den sich signifikant und welche nicht?

15

Gruppenunterschiede – einfache und multiple VarianzanalyseGruppenunterschiede – einfache und multiple Varianzanalyse

Multiple oder mehrfaktorielle VarianzanalyseMultiple oder mehrfaktorielle Varianzanalyse1.1. Erweiterung: Wir haben nicht mehr nur einen Erweiterung: Wir haben nicht mehr nur einen

Faktor (z.B. mütterlicher Bildungsstand), son-Faktor (z.B. mütterlicher Bildungsstand), son-dern mehrere, die gleichzeitig auf die abhän-dern mehrere, die gleichzeitig auf die abhän-gige quantitative Variablen wirken (z.B. zu-gige quantitative Variablen wirken (z.B. zu-sätzlich Zugehörigkeit zu Kindergarten A, B sätzlich Zugehörigkeit zu Kindergarten A, B oder C). Was wirkt sich aus:oder C). Was wirkt sich aus:• mütterlicher Bildungsstand (Haupteffekt)mütterlicher Bildungsstand (Haupteffekt)• Zugehörigkeit zu einem Kindergarten Zugehörigkeit zu einem Kindergarten

(Haupteffekt)(Haupteffekt)• besondere Wechselwirkungen zwischen Bil-besondere Wechselwirkungen zwischen Bil-

dungsstand und Kindergartenzugehörigkeit dungsstand und Kindergartenzugehörigkeit (Interaktionseffekt)(Interaktionseffekt)

16

Gruppenunterschiede – einfache und multiple VarianzanalyseGruppenunterschiede – einfache und multiple Varianzanalyse

2.2. Haupteffekte und Interaktionseffekte sollen Haupteffekte und Interaktionseffekte sollen unabhängig sein (Sonderfall gleiche Zellen-unabhängig sein (Sonderfall gleiche Zellen-besetzungen – orthogonales Design; geht besetzungen – orthogonales Design; geht aber auch sonst)aber auch sonst)

3.3. Formalisiert: NullhypothesenFormalisiert: Nullhypothesen• HHBildung 0Bildung 0: Bildungsstand hat keinen Effekt,: Bildungsstand hat keinen Effekt,• HHZugehörigkeit 0Zugehörigkeit 0: Zugehörigkeit hat keinen Effekt,: Zugehörigkeit hat keinen Effekt,• HHInteraktion 0Interaktion 0: es gibt keine Wechselwirkungen: es gibt keine Wechselwirkungen• sowie die entsprechenden Alternativhypo-sowie die entsprechenden Alternativhypo-

thesen.thesen.

17

Gruppenunterschiede – einfache und multiple VarianzanalyseGruppenunterschiede – einfache und multiple Varianzanalyse

3.3. Idee ist wieder, Unterschiede zwischen Grup-Idee ist wieder, Unterschiede zwischen Grup-penmittelwerden in Beziehung zu den Unter-penmittelwerden in Beziehung zu den Unter-schieden innerhalb der Gruppen zu setzen.schieden innerhalb der Gruppen zu setzen.

4.4. Dazu berechnen wir:Dazu berechnen wir:• Abweichungen der Gruppenmittelwerte im mütterlichen Bil-Abweichungen der Gruppenmittelwerte im mütterlichen Bil-

dungsstand vom Gesamtmittelwert (SAQdungsstand vom Gesamtmittelwert (SAQBildungBildung))• Abweichungen der Gruppenmittelwerte der verschiedenen Abweichungen der Gruppenmittelwerte der verschiedenen

Kindergärten vom Gesamtmittelwert (SAQKindergärten vom Gesamtmittelwert (SAQZugehörigkeitZugehörigkeit))• Abweichungen der Gruppenmittelwerte einer Kombination Abweichungen der Gruppenmittelwerte einer Kombination

(z.B. niedriger Bildungsstand in Kindergarten A) von dem, (z.B. niedriger Bildungsstand in Kindergarten A) von dem, was man bei additiven Effekten erwarten kann (Summe der was man bei additiven Effekten erwarten kann (Summe der Mittelwerte in den Variablen Bildungsstand und Zugehörig-Mittelwerte in den Variablen Bildungsstand und Zugehörig-keit minus Gesamtmittelwert) (SAQkeit minus Gesamtmittelwert) (SAQInteraktionInteraktion))

• restliche Abweichungen innerhalb jeder Kombination restliche Abweichungen innerhalb jeder Kombination (SAQ(SAQResidualResidual))

18

Gruppenunterschiede – einfache und multiple VarianzanalyseGruppenunterschiede – einfache und multiple Varianzanalyse

Es werden dann die jeweiligen mittleren Es werden dann die jeweiligen mittleren Abweichungsquadrate (MAQ) gebildet:Abweichungsquadrate (MAQ) gebildet:• MAQMAQBildungBildung = SAQ = SAQBildung Bildung / df/ dfBildungBildung

mit mit df dfBildungBildung = Anzahl Kategorien Bildung – 1 = Anzahl Kategorien Bildung – 1

• MAQMAQZugehörigkeitZugehörigkeit = SAQ = SAQZugehörigkeitZugehörigkeit / df / dfZugehörigkeitZugehörigkeit mit mit df dfZugehörigkeitZugehörigkeit = Anzahl Kategorien Zugehörigkeit - 1 = Anzahl Kategorien Zugehörigkeit - 1

• MAQMAQInteraktionInteraktion = SAQ = SAQInteraktionInteraktion / df / dfInteraktionInteraktion mit mit df dfInteraktionInteraktion = df = dfBildungBildung x df x dfZugehörigkeitZugehörigkeit

• MAQMAQResidualResidual = SAQ = SAQResidualResidual / df / dfResidualResidual mit mit df dfResidualResidual = N – (Anzahl Kategorien Bildung x Anzahl = N – (Anzahl Kategorien Bildung x Anzahl Kategorien Zugehörigkeit)Kategorien Zugehörigkeit)

19

Gruppenunterschiede – einfache und multiple VarianzanalyseGruppenunterschiede – einfache und multiple Varianzanalyse

• Für das Testen einer Quelle für Für das Testen einer Quelle für Unterschie-die werden jeweils die MAQ Unterschie-die werden jeweils die MAQ dieser Quelle durch die MAQdieser Quelle durch die MAQResidualResidual dividiert dividiert (F-Wert).(F-Wert).

• Der kritische F-Wert wird bestimmt durch α, Der kritische F-Wert wird bestimmt durch α, df der Quelle (df Zähler) und dfdf der Quelle (df Zähler) und dfResidualResidual (df (df Nenner)Nenner)

20

Gruppenunterschiede – einfache und multiple VarianzanalyseGruppenunterschiede – einfache und multiple Varianzanalyse

• Beispiel:Beispiel:

sidual

BildungBildung

MAQMAQF

Re

Nachschauen in F-Tabelle für α,df Zäh-Nachschauen in F-Tabelle für α,df Zäh-ler und df Nennerler und df Nenner• falls unser F-Wert >falls unser F-Wert > dem tabellierten Wert dem tabellierten Wert

Ablehnung von H Ablehnung von H00

• falls unser F-Wert ≤ dem tabellierten Wert falls unser F-Wert ≤ dem tabellierten Wert Beibehalt von H Beibehalt von H00

21

KovarianzanalyseKovarianzanalyse

Gruppenunterschiede – KovarianzanalyseGruppenunterschiede – Kovarianzanalyse

1.1. Problemstellung: Vergleich des Sozialverhal-Problemstellung: Vergleich des Sozialverhal-tens von Kindern aus einer Experimental- tens von Kindern aus einer Experimental- und einer Kontrollgruppe bei evtl. unter-und einer Kontrollgruppe bei evtl. unter-schiedlicher Ausgangslageschiedlicher Ausgangslage Beispiel: Evaluation des „Kindergartens Beispiel: Evaluation des „Kindergartens der Zukunft in Bayern – KiDZ“der Zukunft in Bayern – KiDZ“

2.2. t-Test oder Varianzanalyse geben nur eine t-Test oder Varianzanalyse geben nur eine unbefriedigende Antwort auf die Forschungs-unbefriedigende Antwort auf die Forschungs-frage.frage.

3.3. Gewünscht: nachträgliche „Angleichung“ der Gewünscht: nachträgliche „Angleichung“ der Ausgangslage der KinderAusgangslage der Kinder

22

Gruppenunterschiede – KovarianzanalyseGruppenunterschiede – Kovarianzanalyse

4.4. Sprachgebrauch: Die Variable, in der die Kin-Sprachgebrauch: Die Variable, in der die Kin-der „angeglichen“ werden sollen, wird Kova-der „angeglichen“ werden sollen, wird Kova-riate genannt.riate genannt.

5.5. Grundidee: Wir filtern den Effekte der Kova-Grundidee: Wir filtern den Effekte der Kova-riaten aus der abhängigen Variablen heraus riaten aus der abhängigen Variablen heraus und führen mit der „bereinigten“ abhängigen und führen mit der „bereinigten“ abhängigen Variablen eine einfache Varianzanalyse (Fak-Variablen eine einfache Varianzanalyse (Fak-tor: Zugehörigkeit zur Experimental- oder tor: Zugehörigkeit zur Experimental- oder Kontrollgruppe) durch.Kontrollgruppe) durch.

6.6. Herausfiltern technisch: Wir führen eine Re-Herausfiltern technisch: Wir führen eine Re-gression der abhängigen Variablen auf die gression der abhängigen Variablen auf die Kovariate durch und berechnen die Residual-Kovariate durch und berechnen die Residual-variable.variable.

23

Gruppenunterschiede – KovarianzanalyseGruppenunterschiede – Kovarianzanalyse

7.7. Vielfältige Erweiterungsmöglichkeiten:Vielfältige Erweiterungsmöglichkeiten:• mehrere Kovariatenmehrere Kovariaten• mehrere Faktorenmehrere Faktoren• mehrere Kriterien gleichzeitigmehrere Kriterien gleichzeitig

24

Zusammenhänge – KorrelationZusammenhänge – Korrelation

1.1. FragestellungFragestellung• Gibt es einen Zusammenhang zwischen Gibt es einen Zusammenhang zwischen

zwei quantitativen Variablen?zwei quantitativen Variablen?• Beispiel: Zusammenhang zwischen Kör-Beispiel: Zusammenhang zwischen Kör-

pergröße und Gewicht = Frage nach dem pergröße und Gewicht = Frage nach dem durchschnittlichen Zusammenhang:durchschnittlichen Zusammenhang:

Ist im Durchschnitt jemand, der schwerer Ist im Durchschnitt jemand, der schwerer als der Durchschnitt ist, auch größer als als der Durchschnitt ist, auch größer als der Durchschnitt? der Durchschnitt? pos. Zusammenhang pos. Zusammenhang

Ist im Durchschnitt jemand, der schwerer Ist im Durchschnitt jemand, der schwerer als der Durchschnitt ist, kleiner als der als der Durchschnitt ist, kleiner als der Durchschnitt? Durchschnitt? neg. Zusammenhang neg. Zusammenhang

25

Zusammenhänge – KorrelationZusammenhänge – Korrelation

• Zusammengang meint damit das Überwie-Zusammengang meint damit das Überwie-gen von gleichläufigen oder gegenläufigen gen von gleichläufigen oder gegenläufigen Abweichungen vom MittelwertAbweichungen vom Mittelwert

2.2. Technische Umsetzung: Korrelation Technische Umsetzung: Korrelation (genauer: Produkt-Moment-Korrelation)(genauer: Produkt-Moment-Korrelation)• Bildung der Kreuz-Produkt-SummeBildung der Kreuz-Produkt-Summe

)()( yyxx i

i

i

• Problem: Kreuz-Produkt-Summe ist abhängig von n, Problem: Kreuz-Produkt-Summe ist abhängig von n, deshalb Division durch = Kovarianz = sdeshalb Division durch = Kovarianz = sxyxy

n

yyxxi

ii )()(

26

Zusammenhänge – KorrelationZusammenhänge – Korrelation

• Problem: Kovarianz hängt von den Skalen von x und y Problem: Kovarianz hängt von den Skalen von x und y ab. Um die unterschiedlichen Skalen herauszubekom-ab. Um die unterschiedlichen Skalen herauszubekom-men, wird durch die Standardabweichungen von x und y men, wird durch die Standardabweichungen von x und y dividiert. Dadurch liegt der Korrelationskoeffizient immer dividiert. Dadurch liegt der Korrelationskoeffizient immer zwischen -1 und +1; d.h., er ist auf diesen Bereich stan-zwischen -1 und +1; d.h., er ist auf diesen Bereich stan-dardisiert:dardisiert:

yx

i

ii

xyssn

yyxxr

)()(

27

Zusammenhänge – KorrelationZusammenhänge – Korrelation

3. 3. Besonderheiten der KorrelationBesonderheiten der Korrelation• Korrelation sagt nichts über Kausalität aus!Korrelation sagt nichts über Kausalität aus!• rrxyxy = standardisiertes Maß. Es verändert sich = standardisiertes Maß. Es verändert sich

nicht bei Standardisierung der Variablen.nicht bei Standardisierung der Variablen.• Das Vorzeichen gibt die Richtung an.Das Vorzeichen gibt die Richtung an.• Die Zahl sagt „etwas“ zur Größe des Zusam-Die Zahl sagt „etwas“ zur Größe des Zusam-

menhangs aus; man kann sagen, welcher menhangs aus; man kann sagen, welcher Zusammenhang größer ist.Zusammenhang größer ist.

• Absolutes Maß für einen Zusammenhang ist Absolutes Maß für einen Zusammenhang ist das Quadrat von rdas Quadrat von rxyxy (Anteil der gemeinsa- (Anteil der gemeinsa-men Varianz).men Varianz).

• rrxyxy gilt nur für lineare Zusammenhänge. gilt nur für lineare Zusammenhänge.

28

Zusammenhänge – RegressionZusammenhänge – Regression

1.1. FragestellungFragestellung• Kann ich aufgrund der Werte einer Varia-Kann ich aufgrund der Werte einer Varia-

blen (x) die Werte in einer anderen Varia-blen (x) die Werte in einer anderen Varia-blen (y) vorhersagen, schätzen?blen (y) vorhersagen, schätzen?

• Beispiel: Kann ich aufgrund der Intelligenz Beispiel: Kann ich aufgrund der Intelligenz eines Kindes sein Sozialverhalten vorher-eines Kindes sein Sozialverhalten vorher-sagen?sagen?

• x wird Prädiktor und y Kriterium genannt.x wird Prädiktor und y Kriterium genannt.• y wird kaum exakt vorgesagt werden y wird kaum exakt vorgesagt werden

können. Wir können nur schätzen; die können. Wir können nur schätzen; die Schätzvariable wird mit Schätzvariable wird mit ŷ bezeichnet.ŷ bezeichnet.

29

Zusammenhänge – RegressionZusammenhänge – Regression

• Eine Schätzung ist dann gut, wenn für je-Eine Schätzung ist dann gut, wenn für je-den Fall die Differenz zwischen gegebe-den Fall die Differenz zwischen gegebe-nem Wert ynem Wert yii und dem Schätzwert ŷ und dem Schätzwert ŷii (auf- (auf-grund der Kenntnis von xgrund der Kenntnis von xii) klein ist, d.h.) klein ist, d.h. für alle Fälle muss (ŷfür alle Fälle muss (ŷii – y – yii) minimiert ) minimiert werden,werden, da sich bei der Summenbildung Abwei-da sich bei der Summenbildung Abwei-chungen nach oben und unten ausglei-chungen nach oben und unten ausglei-chen, wird über alle Fälle (ŷchen, wird über alle Fälle (ŷii – y – yii))22 mini- mini-miert = Kleinstquadratkriterium.miert = Kleinstquadratkriterium.

• Im Folgenden beschränkt auf lineare Be-Im Folgenden beschränkt auf lineare Be-ziehungen.ziehungen.

30

Zusammenhänge – RegressionZusammenhänge – Regression

2.2. Technische Umsetzung:Technische Umsetzung:• Im Falle einer linearen Gleichung liegen für alle Fälle i die Im Falle einer linearen Gleichung liegen für alle Fälle i die

Schätzwerte auf der Gerade:Schätzwerte auf der Gerade:

abxi iymit b = Steigung der Geraden und a = Schnittpunkt auf der mit b = Steigung der Geraden und a = Schnittpunkt auf der y-Achsey-Achse

• Gesucht sind dann a und b so, dass die Summe aller Ab-Gesucht sind dann a und b so, dass die Summe aller Ab-weichungsquadrate (ŷweichungsquadrate (ŷii – y – yii))22 minimiert wird. minimiert wird.

• Mathematisch letztlich einfach und bekannt: Bilden der 1. Mathematisch letztlich einfach und bekannt: Bilden der 1. Ableitung usw.Ableitung usw.

• b = sb = sxyxy22 / s / sxx

22; a = y; a = y¯ – bx – bx¯. . • b = Regressionskoeffizient = Um wie viele Einheiten verän-b = Regressionskoeffizient = Um wie viele Einheiten verän-

dert sich ŷdert sich ŷii, wenn ich x um eine Einheit verändere., wenn ich x um eine Einheit verändere.• a = Regressionskonstante, gleicht die unterschiedlichen a = Regressionskonstante, gleicht die unterschiedlichen

Ska-len von x und y aus.Ska-len von x und y aus.

31

Zusammenhänge – RegressionZusammenhänge – Regression

3.3. Besonderheiten der Regression:Besonderheiten der Regression:• a und b hängen davon ab, was Prädiktor a und b hängen davon ab, was Prädiktor

und was Kriterium ist.und was Kriterium ist.• Anders als bei der Korrelation: a und b än-Anders als bei der Korrelation: a und b än-

dern sich, wenn die Variablen standardi-dern sich, wenn die Variablen standardi-siert werden.siert werden.Im Fall der einfachen Regression mit nur Im Fall der einfachen Regression mit nur einem Prädiktor einem Prädiktor a = 0 und b = r a = 0 und b = rxyxy..

• Anteil der erklärten Varianz = rAnteil der erklärten Varianz = rxyxy22

• Anteil der nicht erklärten Varianz = 1 - rAnteil der nicht erklärten Varianz = 1 - rxyxy22

32

Zusammenhänge – RegressionZusammenhänge – Regression

4.4. Besonderheiten der multiplen Regression:Besonderheiten der multiplen Regression:• Um ein Kriterium y angemessen vorhersa-Um ein Kriterium y angemessen vorhersa-

gen zu können, benötigt man in der Realität gen zu können, benötigt man in der Realität mehrere Prädiktoren xmehrere Prädiktoren x11 bis x bis xnn..

• In der Realität korrelieren Prädiktoren mit-In der Realität korrelieren Prädiktoren mit-einander. Wir sind aber speziell auch an einander. Wir sind aber speziell auch an den jeweils eigenständigen Beiträgen der den jeweils eigenständigen Beiträgen der Prädiktoren interessiert.Prädiktoren interessiert.

• Gleichzeitig ist aber auch die gesamte Er-Gleichzeitig ist aber auch die gesamte Er-klärungskraft eines Satzes von Prädiktoren klärungskraft eines Satzes von Prädiktoren wichtig.wichtig.

33

Zusammenhänge – RegressionZusammenhänge – Regression

• Die multiple Regressionsrechnung gibt uns Die multiple Regressionsrechnung gibt uns für jeden Prädiktor k einen Regressions-für jeden Prädiktor k einen Regressions-koeffizienten bkoeffizienten bkk, der die eigenständige , der die eigenständige Bedeutung indiziert (bildlich = wenn alle Bedeutung indiziert (bildlich = wenn alle anderen Prädiktoren gleich wären).anderen Prädiktoren gleich wären).

• Ebenfalls erhalten wir einen Wert für die Ebenfalls erhalten wir einen Wert für die Gesamtbedeutung: RGesamtbedeutung: R22 = Anteil der im Kri- = Anteil der im Kri-terium durch alle Prädiktoren gemeinsam terium durch alle Prädiktoren gemeinsam erklärten Varianz.erklärten Varianz.

• Die bDie bkk hängen jeweils von den Skalengrö- hängen jeweils von den Skalengrö-ßen ab (schwierig zu interpretieren) ßen ab (schwierig zu interpretieren) Standardisierung aller VariablenStandardisierung aller Variablen ß ßkk

34

Zusammenhänge – RegressionZusammenhänge – Regression

• -1 -1 ≤ ≤ ßßkk ≤≤ Um wie viele Standardeinheiten Um wie viele Standardeinheiten verändert sich y, wenn ich den Prädiktor k verändert sich y, wenn ich den Prädiktor k um eine Standardeinheit verändere.um eine Standardeinheit verändere.

• Achtung: In der multiplen Regression sind Achtung: In der multiplen Regression sind die Regressionskoeffizienten aus Analysen die Regressionskoeffizienten aus Analysen mit standardisierten Variablen nicht mehr mit standardisierten Variablen nicht mehr identisch mit den Korrelation.identisch mit den Korrelation.

35

Zusammenhänge – RegressionZusammenhänge – Regression

Hierarchische RegressionHierarchische Regression1.1. Oftmals sind wir daran interessiert, was ver-Oftmals sind wir daran interessiert, was ver-

schiedene (Teil-) Blöcke von Prädiktoren für schiedene (Teil-) Blöcke von Prädiktoren für eine gemeinsame Bedeutung haben.eine gemeinsame Bedeutung haben.

2.2. Evtl. ist auch von Bedeutung, was ein Block Evtl. ist auch von Bedeutung, was ein Block dann noch erklärt, wenn andere schon be-dann noch erklärt, wenn andere schon be-rücksichtigt sind.rücksichtigt sind.

3.3. Grundidee der hierarchischen Regression:Grundidee der hierarchischen Regression:Blöcke werden nacheinander betrachtet. Bei Blöcke werden nacheinander betrachtet. Bei dem jeweils späteren Block wird nur das dem jeweils späteren Block wird nur das berücksichtig, was der vorherige nicht bereits berücksichtig, was der vorherige nicht bereits erklärt hat.erklärt hat.