Statistik I Übung - uni-goettingen.de · Statistik I Übung – Statistik und Tabellenkalkulation?...

13
Statistik I Übung – Statistik und Tabellenkalkulation? 1 Göttingen 27. Juni 2007 Statistik I Übung 1 Göttingen 27. Juni 2007 11. Zusammenhangsmaße für nominale Variablen Dozent: Jürgen Leibold

Transcript of Statistik I Übung - uni-goettingen.de · Statistik I Übung – Statistik und Tabellenkalkulation?...

Page 1: Statistik I Übung - uni-goettingen.de · Statistik I Übung – Statistik und Tabellenkalkulation? 1 Göttingen 27. Juni 2007 Statistik I Übung 11. Zusammenhangsmaße für nominale

Statistik I Übung – Statistik und Tabellenkalkulation?

1Göttingen27. Juni 2007

Statistik I Übung

1Göttingen27. Juni 2007

11. Zusammenhangsmaßefür nominale Variablen

Dozent: Jürgen Leibold

Page 2: Statistik I Übung - uni-goettingen.de · Statistik I Übung – Statistik und Tabellenkalkulation? 1 Göttingen 27. Juni 2007 Statistik I Übung 11. Zusammenhangsmaße für nominale

Statistik I Übung – Statistik und Tabellenkalkulation?

2Göttingen27. Juni 2007

Übersicht

Evaluation

Nominale Zusammenhangsmaße

Chi-Quadrat Phi Cramers V

Page 3: Statistik I Übung - uni-goettingen.de · Statistik I Übung – Statistik und Tabellenkalkulation? 1 Göttingen 27. Juni 2007 Statistik I Übung 11. Zusammenhangsmaße für nominale

Statistik I Übung – Statistik und Tabellenkalkulation?

3Göttingen27. Juni 2007

Nominale Zusammenhangsmaße

Page 4: Statistik I Übung - uni-goettingen.de · Statistik I Übung – Statistik und Tabellenkalkulation? 1 Göttingen 27. Juni 2007 Statistik I Übung 11. Zusammenhangsmaße für nominale

Statistik I Übung – Statistik und Tabellenkalkulation?

4Göttingen27. Juni 2007

EWL (X)AWL (Y) gesamt

e11 e12 464e21 e22 3025

gesamt 1703 1786 3489

gut (x1) nicht gut (x2)gut (y1)nicht gut (y2)

Randverteilung Erwartete Häufigkeiten

e11=n1 °∗n° 1n

EWL (X)AWL (Y) gesamt

226,5 237,5 4641467,5 1548,5 3025

gesamt 1703 1786 3489

gut (x1) nicht gut (x2)gut (y1)nicht gut (y2)

Erwartete Häufigkeiten e11=464∗17033489

=226.5

EWL (X)AWL (Y) gesamt

338 126 4641365 1660 3025

gesamt 1703 1786 3489

gut (x1) nicht gut (x2)gut (y1)nicht gut (y2)

Empirische Häufigkeiten

Page 5: Statistik I Übung - uni-goettingen.de · Statistik I Übung – Statistik und Tabellenkalkulation? 1 Göttingen 27. Juni 2007 Statistik I Übung 11. Zusammenhangsmaße für nominale

Statistik I Übung – Statistik und Tabellenkalkulation?

5Göttingen27. Juni 2007

Chi-Quadrat

F19 Geschlecht

männlich weiblich Gesamt ErgebnisJa 30 (29,05) 41 (41,95) 71nein 15 (15,95) 24 (23,05) 39Gesamt Ergebnis 45 65 110

F12 Können Sie mit einem Summen-zeichen umgehen?'

( ) ( ) ( ) ( ) ( )2 2 2 2 2jI

ij ij 11 12 21 222

i 1 j 1 ij 11 12 21 22

n e a e b e c e d ee e e e e= =

− − − − −χ = = + + +∑∑

( ) ( ) ( ) ( )2 2 2 22 30 29,05 41 41.95 15 15.95 24 23,05

0,1483229.05 41.95 15,95 23.05− − − −

χ = + + + =

e11=n1 °∗n° 1n

Page 6: Statistik I Übung - uni-goettingen.de · Statistik I Übung – Statistik und Tabellenkalkulation? 1 Göttingen 27. Juni 2007 Statistik I Übung 11. Zusammenhangsmaße für nominale

Statistik I Übung – Statistik und Tabellenkalkulation?

6Göttingen27. Juni 2007

( ) ( ) ( ) ( ) ( )2 2 2 2 2jI

ij ij 11 12 21 222

i 1 j 1 ij 11 12 21 22

n e a e b e c e d ee e e e e= =

− − − − −χ = = + + +∑∑

( ) ( )( ) ( ) ( ) ( )

2 211 22 12 212

1 2 1 2

n n n n a d b cn n

n n n n a b c d a c b d⋅ − ⋅ ⋅ − ⋅

χ = ⋅ = ⋅⋅ ⋅ ⋅ + ⋅ + ⋅ + ⋅ +g g g g

alternative Formel:

Wenn der Chiquadratwert hohe Werte annimmt, ist die Nullhypothese eher abzulehnen. Dies ist auch daher nahe liegend, weil bei gültiger Nullhypothese keine oder nur geringe Differenzen zwischen beobachteten und erwarteten Häufigkeiten auftreten sollten und entsprechend die Chiquadratstatistik klein sein sollte.

Anmeldung.ods Tabelle 7

Page 7: Statistik I Übung - uni-goettingen.de · Statistik I Übung – Statistik und Tabellenkalkulation? 1 Göttingen 27. Juni 2007 Statistik I Übung 11. Zusammenhangsmaße für nominale

Statistik I Übung – Statistik und Tabellenkalkulation?

7Göttingen27. Juni 2007

Die Interpretation Ф erfolgt analog zur Prozentsatzdifferenz:-.05 < Φ < +.05 praktisch kein Zusammenhang;.05 ≤ |Φ| < .10 geringer Zusammenhang.10 ≤ |Φ| < .25 mittlerer Zusammenhang, |Φ| ≥ .25 darüber: starker Zusammenhang

Anmeldung.ods Tabelle 8

Phi-Quadrat und PhiIn einer Vierfeldertafel ist der maximale Wert von χ² gleich dem Stichprobenumfang n.Bei der Berechnung von Φ² wird die Fallzahlabhängigkeit von χ² dadurch berücksichtigt, dass χ² durch n geteilt wird.

²= x²n

= x²n = ad−bc abcd acbd

Page 8: Statistik I Übung - uni-goettingen.de · Statistik I Übung – Statistik und Tabellenkalkulation? 1 Göttingen 27. Juni 2007 Statistik I Übung 11. Zusammenhangsmaße für nominale

Statistik I Übung – Statistik und Tabellenkalkulation?

8Göttingen27. Juni 2007

••

χ χ= = = =⋅ − − ⋅χ

max

2 2

2252.4V 0.24

n min(I 1, J 1) 2168 2

Mehrere Felder → Cramers V

χ2max = n••⋅Minimum von I−1 oder J−1

In einer IJ-Kreuztabelle ist der Maximalwert von χ² gleich dem Produkt aus der Fallzahl und dem Minimum der Spalten- oder Zeilenzahl minus eins:

Die Interpretation ist wie bei Φ : Es besteht eine mittelstarke Beziehung. Im Unterschied zu Φ hat V kein Vorzeichen, da das Maß für nominalskalierte Variablen mit mehr als zwei Ausprägungen konstruiert ist.

Page 9: Statistik I Übung - uni-goettingen.de · Statistik I Übung – Statistik und Tabellenkalkulation? 1 Göttingen 27. Juni 2007 Statistik I Übung 11. Zusammenhangsmaße für nominale

Statistik I Übung – Statistik und Tabellenkalkulation?

9Göttingen27. Juni 2007

Ausgangswerte ( empirische Häufigkeiten)Wahlabsicht katholisch evangelisch keine gesamt

CDU 48.4% (327) 35.6% (306) 22.3% (141) 35.7% (774)SPD 29.3% (198) 34.9% (300) 34.2% (216) 32.9% (714)FDP 7.2% (49) 12.7% (109) 6.5% (41) 9.2% (199)Grüne 13.6% (92) 15.0% (129) 21.2% (134) 16.4% (355)PDS 1.5% (10) 1.9% (16) 15.8% (100) 5.8% (126)gesamt 100.0% (676) 100.0% (860) 100.0% (632) 100.0% (2168)

• ••• • •

••

⋅= ⋅ ⋅ = i j

ij i j

n ne n p p

n

Erwartete HäufigkeitenWahlabsicht katholisch evangelisch keine gesamt

CDU 241,34 307,03 225,63SPD 222,63 283,23 208,14FDP 62,05 78,94 58,01Grüne 110,69 140,82 103,49PDS 39,29 49,98 36,73gesamt

Page 10: Statistik I Übung - uni-goettingen.de · Statistik I Übung – Statistik und Tabellenkalkulation? 1 Göttingen 27. Juni 2007 Statistik I Übung 11. Zusammenhangsmaße für nominale

Statistik I Übung – Statistik und Tabellenkalkulation?

10Göttingen27. Juni 2007

Erwartete HäufigkeitenWahlabsicht katholisch evangelisch keine

CDU 241,34 307,03 225,63SPD 222,63 283,23 208,14FDP 62,05 78,94 58,01Grüne 110,69 140,82 103,49PDS 39,29 49,98 36,73

Ausgangswerte ( empirische Häufigkeiten)Wahlabsicht katholisch evangelisch keine

CDU 327 306 141SPD 198 300 216FDP 49 109 41Grüne 92 129 134PDS 10 16 100

••

χ χ= = = =⋅ − − ⋅χ

max

2 2

2252.4V 0.24

n min(I 1, J 1) 2168 2

( )= =

−χ = ∑∑

2JI

ij ij2

i 1 j 1 ij

n e

e

Chi²-AnteileWahlabsicht katholisch evangelisch keine

CDU 30,404 0,003 31,744SPD 2,725 0,993 0,297FDP 2,745 11,448 4,988Grüne 3,156 0,992 8,997PDS 21,833 23,103 108,983gesamt 60,86 36,54 155,01 252,4

Anmeldung.ods Tabelle 9

Page 11: Statistik I Übung - uni-goettingen.de · Statistik I Übung – Statistik und Tabellenkalkulation? 1 Göttingen 27. Juni 2007 Statistik I Übung 11. Zusammenhangsmaße für nominale

Statistik I Übung – Statistik und Tabellenkalkulation?

11Göttingen27. Juni 2007

Aufgabe Folien bzw. Kapitel im Statistikbuch zu den ordinalen

Zusammenhangsmaßen gründlichst durchlesen: Gamma Tau-a Tau-b SomersD

Fragen zu Unklarheiten notieren!

Page 12: Statistik I Übung - uni-goettingen.de · Statistik I Übung – Statistik und Tabellenkalkulation? 1 Göttingen 27. Juni 2007 Statistik I Übung 11. Zusammenhangsmaße für nominale

Statistik I Übung – Statistik und Tabellenkalkulation?

12Göttingen27. Juni 2007

2. Probeklausur Probeklausur im jeweiligen Cip-Pool Ergebnisse bzw. Lösungsweg auf Klausurbogen

vermerken während des Tutoriums maximale Punktzahl = 60 31 Punkte = bestanden nur eine Variante

Abschlussklausur hat mehrere Varianten!

Page 13: Statistik I Übung - uni-goettingen.de · Statistik I Übung – Statistik und Tabellenkalkulation? 1 Göttingen 27. Juni 2007 Statistik I Übung 11. Zusammenhangsmaße für nominale

Statistik I Übung – Statistik und Tabellenkalkulation?

13Göttingen27. Juni 2007

Dann bis nächste Woche.