Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit...

33
Abh¨ angigkeit zweier Merkmale Johannes Hain Lehrstuhl f¨ ur Mathematik VIII – Statistik 1 / 33

Transcript of Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit...

Page 1: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Abhangigkeit zweier Merkmale

Johannes Hain

Lehrstuhl fur Mathematik VIII – Statistik

1 / 33

Page 2: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Allgemeine Situation

Neben der Untersuchung auf Unterschiede zwischen zwei odermehreren Untersuchungsgruppen hinsichtlich eines bestimmtenMerkmals, kann unter Umstanden das Gegenteil von Interesse sein– namlich die Frage, ob ein bestimmter Zusammenhang zwischenzwei Merkmalen besteht.

Die Frage nach dem Zusammenhang lasst sich aus statistischerSicht wieder sowohl explorativ, als auch mit Hilfe vonSignifikanztests untersuchen. Dabei unterschiedet man imWesentlichen die folgenden Falle:

(i) Die Daten sind metrisch:

Normalverteilte StichprobenNicht normalverteilte Stichproben

(ii) Die Daten sind kategorial

2 / 33

Page 3: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Abhangigkeit bei metrischen Variablen

Voraussetzungen

Fur zwei Zufallsvariablen X und Y vom stetigen Typ, d.h. entwederintervall- oder sogar verhaltnisskalierte Variablen, liegt eineunabhangige Stichprobe (X1,Y1), . . . , (Xn,Yn) vom Umfang n vor.

Die Abhangigkeitsstruktur von X und Y kann man mit einemScatterplot grafisch untersuchen. Hierbei werden die beidenVariablen X und Y gegeneinander in einem Diagramm eingetragen.

Je nach dem wie stark der Zusammenhang zwischen den beidenVariablen ist, kann man mit einem Scatterplot schon eine Strukturin den Daten erkennen.

3 / 33

Page 4: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Abhangigkeit bei metrischen Variablen

Beispiel: Scatterplot der Ehepaar-Daten, X = Alter des Mannes,Y = Alter der Frau.

4 / 33

Page 5: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Abhangigkeit bei metrischen Variablen

Erstellung eines Scatterplots in SPSS

→ Diagramme

→ Veraltete Dialogfelder

→ Streu-/Punkt-Diagramm

→ Definiere ein Einfaches Streudiagramm und wahle die beidengewunschten Variablen in die X-Achse und die Y-Achse.

5 / 33

Page 6: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Abhangigkeit bei metrischen Variablen

Eng mit dem Begriff der Abhangigkeit verwandt ist in der Statistikdie Korrelation zwischen zwei Variablen. Mit der Korrelation lasstsich der Zusammenhang quantifizieren und somit auch statistischgenauer untersuchen.

Die Korrelation zwischen X und Y ist dann wie folgt definiert:

Corr(X ,Y ) =Cov(X ,Y )

σX · σY∈ [−1; 1].

=⇒ Die Korrelation ist auf dem Intervall [−1,+1] standardisiertund kann deshalb viel leichter interpretiert werden.

6 / 33

Page 7: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Abhangigkeit bei metrischen Variablen

Interpretation der Korrelation:Eine hohe positive (negative) Korrelation bedeutet, dasstendenziell ein uberdurchschnittlich hoher Wert von X mit einemuberdurchschnittlich hohen (niedrigen) Wert von Y einhergeht.

Richtlinien fur die Starke der Korrelation

Corr(X ,Y ) ≈ 0: vernachlassigbare lineare Abhangigkeitzwischen X und Y .

0.3 < |Corr(X ,Y )| < 0.7: schwacher linearer Zusammenhangzwischen X und Y .

|Corr(X ,Y )| > 0.7: starker linearer Zusammenhang zwischenX und Y .

7 / 33

Page 8: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Abhangigkeit bei metrischen Variablen

Zusammenhang zwischen Abhangigkeit und Korrelation:Es gilt:

X und Y unabhangig ⇒ X und Y unkorreliert.

Achtung:

X und Y unkorreliert ⇒ X und Y unabhangig.

gilt im Allgemeinen aber NICHT!

Merke:

Die Korrelation misst nur die lineare Abhangigkeit. Es gibtauch andere Arten von Abhangigkeiten zwischen Variablen,z.B. quadratische oder logarithmische.

Gilt |Corr(X ,Y ) = 1|, spricht man auch von einem perfektenpostiven (negativen) Zusammenhang. In der Praxis kommt einsolcher Koeffizient aber eigentlich nicht vor.

8 / 33

Page 9: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Abhangigkeit bei metrischen VariablenNormalverteilte Stichproben

Um nun konkrete statistische Aussagen uber die Starke desZusammenhangs zweier Variablen zu machen, berechnet man ausder vorliegenden Stichproben den empirischenKorrelationskoeffizienten nach Pearson:

ρ :=Cov(X ,Y )

σX σY=

( 1n

∑ni=1 XiYi)− ( 1

n

∑ni=1 Xi)(

1n

∑ni=1Yi )√

( 1n

∑ni=1(Xi − X )2)( 1

n

∑ni=1(Yi − Y )2)

Interpretation von ρ

Wenn der Wert der einen Variablen, z.B. von X um eine Einheitansteigt, dann verandert sich der Wert der anderen Variablen, alsoY , um ρ Einheiten. Je nach dem Vorzeichen geht der Wert von Yum ρ Einheiten nach oben oder nach unten.

9 / 33

Page 10: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Abhangigkeit bei metrischen VariablenNormalverteilte Stichproben

Um festzustellen, ob der Zusammenhang zwischen zwei VariablenX und Y nicht nur zufallig sondern systematisch ist, kann maneinen Signifikanztest durchfuhren.

Voraussetzungen

Gegeben sind zwei metrisch-skalierte Stichproben X1, . . . ,Xn undY1, . . . ,Yn, die durch die Bildung von Paaren (Xi ,Yi), i = 1, . . . , nerhoben wurden.Die beiden Stichproben sind außerdem normalverteilt, d.h.X1, . . . ,Xn ∼ N(µX , σ

2) und Y1, . . . ,Yn ∼ N(µY , σ2).

=⇒ Es reicht bei diesem Test also nicht aus, dass intervallskalierteDaten vorliegen, sondern die Daten mussen zusatzlich auchnoch beide normalverteilt sein!

10 / 33

Page 11: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Abhangigkeit bei metrischen VariablenNormalverteilte Stichproben

Die zugehorige Nullhypothese fur diesen Test lautet

H0 : ρ = 0,

d.h. es wird uberpruft, ob uberhaupt ein Zusammenhang zwischenX und Y vorliegt. Die zugehorige Teststatistik

T :=ρ√

1− ρ2

√n − 2

ist unter H0 t-verteilt mit (n − 2) Freiheitsgraden. Wird H0 nunverworfen, kann man anhand des Vorzeichens von ρ erkennen, inwelche Richtung der Zusammenhang geht.

11 / 33

Page 12: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Abhangigkeit bei metrischen VariablenNormalverteilte Stichproben

Pearson’scher Korrelationskoeffizient in SPSS

→ Analysieren

→ Korrelation

→ Bivariat

→ Wahle die gewunschten Variablen aus und klicke im FeldKorrelationskoeffizienten den Koeffizienten nach Pearson an.

12 / 33

Page 13: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Abhangigkeit bei metrischen VariablenNicht normalverteilte Stichproben

Voraussetzungen

Fur zwei metrische Zufallsvariablen X und Y liegt eineunabhangige Stichprobe (X1,Y1), . . . , (Xn,Yn) vom Umfang n vor.

Im Fall nicht normalverteilter Daten, kann ebenfalls einKorrelationskoeffizient berechnet werden, der sogenannteSpearman Rangkorrelationskoeffizient.

Vorgehen zur Berechnung:

Ordne die X1, . . . ,Xn und die Y1, . . . ,Yn jeweils der Großenach an.

Jeder Messwert Xi und Yi erhalt einen Rang rX ,i und rY ,i .

Berechne den Spearman’schen Rangkorrelationskoeffizienten:

rS :=6∑n

i=1(rX ,i − rY ,i)2

n(n2 − 1)∈ [−1; 1].

13 / 33

Page 14: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Abhangigkeit bei metrischen VariablenNicht normalverteilte Stichproben

Wie beim Korrelationkoeffizienten nach Pearson wird auch hier dieNullhypothese

H0 : rS = 0

getestet, also ob die beiden Variablen signifikant zusammenhangen– in welche Richtung auch immer.

Die TeststatistikT :=

rS√1− r2S

√n − 2

ist dann fur n > 30 approximativ t-verteilt mit (n − 2)Freiheitsgraden. Fur n ≤ 30 berechnet SPSS den p-Wert basierendauf Tafelwerken.

14 / 33

Page 15: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Abhangigkeit bei metrischen VariablenNicht normalverteilte Stichproben

Spearman’scher Korrelationskoeffizient in SPSS

→ Analysieren

→ Korrelation

→ Bivariat

→ Wahle die gewunschten Variablen aus und klicke im FeldKorrelationskoeffizienten den Koeffizienten nach Spearman an.

15 / 33

Page 16: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Abhangigkeit bei metrischen VariablenAufgaben zur Vertiefung I

Aufgabe zum Datensatz Kino.sav

Gibt es einen Zusammenhang zwischen dem Alter und der Anzahlder Kinobesuche?

Stelle die Daten grafisch dar, berechne ein geeignetesZusammenhangsmaß und fuhre dazu einen Signifikanztest durch.

Aufgabe zum Datensatz Fussball.sav

Wie hoch ist die Korrelation zwischen den Punkten am Saisonendeund dem Etat des jeweiligen Vereins?

Uberprufe die Signifikanz mit dem korrekten Testverfahren undversuche die Daten grafisch zu veranschaulichen.

16 / 33

Page 17: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Abhangigkeit bei metrischen VariablenAufgaben zur Vertiefung II

Aufgabe zum Datensatz Arbeitsbeschaffung.sav

Der Datensatz enthalt das Bruttoeinkommen von Erwerbslosen vorund wahrend einer Arbeitsbeschaffungsmaßnahme. Wie hoch istdie Korrelation zwischen den beiden Einkommen?Uberprufe die Signifikanz mit dem korrekten Testverfahren undversuche die Daten grafisch zu veranschaulichen.

Aufgabe zum Datensatz Pisa.sav

Zwischen welchen der drei Leistungsparameter (Lesen, Mathe,Naturwissenschaften) gibt es den starksten linearenZusammenhang?

17 / 33

Page 18: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Abhangigkeit bei kategorialen Variablen

Voraussetzungen

Fur zwei Zufallsvariablen X und Y mit nominalskalierten Wertenliegt eine unabhangige Stichprobe (X1,Y1), . . . , (Xn,Yn) vomUmfang n vor.

Fur Variablen vom diskreten Typ macht die Erstellung einesScatterplot naturlich wenig Sinn. Allerdings gibt es auch in diesemFall die Moglichkeit der grafischen Veranschaulichung der Daten,beispielsweise mittels 3D-Balken.

Dabei wird fur jede mogliche Merkmalskombination von X und Ydie Haufigkeit in ein dreidimensionales Histogramm gezeichnet.

18 / 33

Page 19: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Abhangigkeit bei kategorialen Variablen

Beispiel: 3D-Histogramm fur zwei nominalsaklierte Variablen

19 / 33

Page 20: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Abhangigkeit bei kategorialen Variablen

3D-Histogramm in SPSS

→ Diagramme

→ Veraltete Diaglogfelder

→ 3D-Balken

→ Klicke sowohl fur die X-Achse als auch fur die Y-Achse dieAuswahl Fallgruppen an und gehe auf das Feld Definieren

→ Wahle die beiden gewunschten Variablen in die FelderKategorieachse X und Kategorieachse Z

20 / 33

Page 21: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Abhangigkeit bei kategorialen Variablen

Die nominalskalierten Variablen X und Y mit einem statistischenVerfahren auf ihren Zusammenhang zu testen kann man mit demχ2-Unabhangigkeitstest.

Die zu untersuchende Nullhypothese lautet:

H0 : X und Y sind voneinander unabhangig

Das Vorgehens des χ2-Tests kann man sich mit Hilfe vonKontingenztafeln deutlich machen. Das Resultat jeder Sichprobemit paarweisen Beobachtungen (Xi ,Yi ) lasst sich mit einerKontingenztafel darstellen.

21 / 33

Page 22: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Abhangigkeit bei kategorialen Variablen

Beispiel einer KontingenztafelX := Familienstand mit den Auspragungen

X ∈ {ledig, geschieden, verheiratet}

Y := Schulbildung mit den Auspragungen

Y ∈ {Gymnasium, Realschule, Hauptschule}

Gymnasium Realschule Hauptschule Gesamt

ledig 15 14 9 38

geschieden 12 26 28 66

verheiratet 22 18 73 113

Gesamt 49 58 110 217

22 / 33

Page 23: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Abhangigkeit bei kategorialen VariablenGrafische Veranschaulichung

Ein Balkendiagramm, dass fur jede Auspragung der einer Variabledie prozentuale Verteilung der anderen Variablen darstellt,verdeutlicht ebenso die Vorgehensweise des χ2-Tests:

schwarzblondbraunrot

100,0%

80,0%

60,0%

40,0%

20,0%

0,0%

gruen

nuss

braun

blau

Auge

23 / 33

Page 24: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Abhangigkeit bei kategorialen VariablenGrafische Veranschaulichung

Balkendiagramm mit SPSS

→ Diagramme

→ Diagrammerstellung...

→ Wahle im Feld Galerie eines der beiden ”gruppiertenBalkendiagrammsymbole”mit einem Doppelklick aus.

→ Ziehe die Variable Haar in das Feld X-Achse? und die VariableAuge in das Feld Clustervariable...

→ Aktiviere das Fenster Elementeigenschaften. Andere im FeldStatistiken unter Statistik die Auswahl von Anzahl zuProzentsatz ()

→ Klicke auf das Feld Parameter festlegen... und wahle im neuerscheinenden Dialogfeld Gesamt fur jede X-Achsen-Kategorieaus und gehe auf Weiter

→ Gehe auf Zuweisen und danach im FensterDiagrammerstellung auf OK

24 / 33

Page 25: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Abhangigkeit bei kategorialen VariablenGrundlegender Gedanke

Vorgehen beim χ2-Test

Ausgehend von den vorliegenden Daten berechnet man beimχ2-Test die erwarteten Haufigkeiten jederFaktorstufenkombination unter der Annahme, dass X und Yunabhangig sind. Diese erwarteten Haufigkeiten werden dann mitden tatsachlichen Haufigkeiten vergleichen. Trifft H0 zu, solltedie Differenz der beiden Werte nahe bei Null liegen.

Die zugehorige Teststatistik X 2 ist etwas komplizierter –vereinfacht gesprochen werden die quadrierten Differenzen fur jedeFaktorstufenkombination aufsummiert:

X 2 :=

I∑

i=1

J∑

j=1

(nij − n•jni•

n

)2n•jni•

n

.

Wird diese Gesamtsumme zu groß wird die Nullhypotheseverworfen.

25 / 33

Page 26: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Abhangigkeit bei kategorialen Variablen

Der χ2-Unabhangigkeitstest in SPSS

→ Analysieren

→ Deskriptive Statistiken

→ Kreuztabellen

→ Ziehe eine der gewunschen Variablen in das Feld Zeilen, dieandere in das Feld Spalten

→ Klicke das Feld Statistik an und wahle Chi-Quadrat aus

→ Klicke das Feld Zellen und klicke im Feld Haufigkeiten dieOption Erwartet an, um sich zusatzlich noch die erwartetenHaufigkeiten angeben zu lassen

26 / 33

Page 27: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Abhangigkeit bei kategorialen Variablen

Der χ2-Unabhangigkeitstest ist ein approximatives Testverfahren –die zugehorige Teststatistik TP ist nur approximativ χ2-verteilt mit(I − 1)(J − 1) Freiheitsgraden. Das gleiche Problem trittbeispielsweise beim Mann-Whitney-U-Test auf.

Damit die Approximation von ausreichender Gute ist, sollte diefolgende Faustregel erfullt sein:

Faustregel fur den χ2-Test (Regel von Cochran)

Die erwartete Haufigkeit sollte in jeder Zelle mindestens den Wert1 betragen und fur 80% der Zellen sollte die erwartete Haufigkeitmindestens den Wert 5 betragen.

Ist die Regel verletzt, gibt es zwei Moglichkeiten:

(i) Weglassen von”dunn“ besetzten Kategorien oder

(ii) Zusammenfassen von (fachlich ahnlichen) Kategorien.

27 / 33

Page 28: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Abhangigkeit bei kategorialen Variablen

Ein wichtiger Spezialfall tritt auf, wenn die Variablen X und Ybeide binar sind, d.h. jeweils nur zwei mogliche Auspragungenbesitzen. In diesem Fall spricht man bei der Kontingenztafel auchvon einer Vierfeldertafel.

Dieser Fall ist unter anderem deshalb so wichtig, weil es fur ihn einspezielles Auswertungsverfahren gibt, dass auf Kontingeztafelnhoherer Ordnung nicht anwendbar ist (siehe weiter unten).

Allgemeines Schema einer Vierfeldertafel:

X/Y 1 2

1 n11 n12 n1•2 n21 n22 n2•

n•1 n•2 n

28 / 33

Page 29: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Abhangigkeit bei kategorialen Variablen

Fur den Fall zweier binarer Variablen X und Y kann man auf dieapproximativen Testverfahren verzichten, denn hierfur ist sogar einexakter Test moglich, namlich Fishers exakter Test aufUnabhangigkeit

Die obigen Faustregeln fur eine ausreichende Gute des Tests sind indiesem Fall also nicht zu beachten – die Zellenbesetzung in einerVierfeldertafel kann demzufolge auch sehr dunn sein.

Die Nullhypothese H0 ist hier die gleiche wie beim χ2-Test, dieTeststatistik ist in diesem Fall sehr einfach definiert durch

TF := n11

also genau der Wert in der linken oberen Zelle.

Die Teststatistik TF ist unter H0 hypergeometrisch verteilt gemaßH(n, n1·, n·1).

29 / 33

Page 30: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Abhangigkeit bei kategorialen Variablen

Fishers exakter Test in SPSS

→ Fuhre den χ2-Unabhangigkeitstest durch wie auf Folie 26beschrieben.

→ Im Fall einer Vierfeldertafel wird in der SPSS-Ausgabeautomatisch zusatzlich zum bekannten Output noch dasErgebnis des exakten Test nach Fisher angegeben.

30 / 33

Page 31: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Abhangigkeit bei kategorialen VariablenAufgaben zur Vertiefung I

Aufabe zum Datensatz Titanic.sav

Der Datensatz enthalt Informationen uber dieKlassenzugehorigkeit, das Geschlecht und das Alter aller Passagiereder Titanic.

(i) Gibt es einen Zusammenhang zwischen dem Uberleben desSchiffsuntergangs und der Klasse?

(ii) Gibt es einen Zusammenhang zwischen Uberleben undGeschlecht?

(iii) Gibt es einen Zusammenhang zwischen Uberleben und demAlter? Erstellen Sie hierfur eine neue Variable mit zweiKategorien: Passagiere unter 18 Jahre und Passagiere uber 18Jahre.

31 / 33

Page 32: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Abhangigkeit bei kategorialen VariablenAufgaben zur Vertiefung II

Aufabe zum Datensatz Suizid.sav

Der Datensatz enthalt Informationen uber die Todesart vonPersonen, die einen Suizid begangen haben. Gibt es einenZusammenhang zwischen der die Todesart des Selbstmords unddem Geschlecht?

Aufabe zum Datensatz Interesse.sav

Das Ergebnis einer Umfrage nach den Interesse an Fußball ist imDatensatz Interesse.sav dokumentiert. Gibt es einenZusammenhang zwischen dem Interesse an Fußball und demGeschlecht der befragten Personen?

32 / 33

Page 33: Abhängigkeit zweier Merkmale - uni-wuerzburg.de · Abh¨angigkeitbeimetrischenVariablen Eng mit dem Begriff der Abh¨angigkeit verwandt ist in der Statistik die Korrelation zwischen

Abhangigkeit bei kategorialen VariablenAufgaben zur Vertiefung III

Aufabe zum Datensatz Kopfschmerzen.sav

Ein neues Medikament (Medikament1) gegen Kopfschmerzen wirdgegen ein bereits auf dem Markt zugelassenes Medikament(Medikament2) getestet. Von allen Teilnehmern wird außerdemaufgezeichnet, ob sich ihre Kopfschmerzen durch das Medikamentverbessert haben (Behandlungserfolg). Untersuche dieFragestellung ob das neue Medikament besser wirkt, als das bereitszugelassene.

Aufabe zum Datensatz Kino.sav

Offne den Datensatz kino.sav und definiere die Variablealter codiert nach dem Schema

alter ≤ 37 →”jung“

alter > 37 →”alt“.

Gibt es einen Zusammenhang zwischen gender undalter codiert?

33 / 33