Vorlesung: Biometrie für Studierende der Veterinärmedizin 8.12.2005 1 Assoziation zweier diskreter...

25
Vorlesung: Biometrie für Studierende der Veterinärmedizin 8.12.2005 1 Assoziation zweier diskreter Merkmale Erhebung von zwei (oder mehr) Merkmalen: Frage nach dem Zusammenhang beider Merkmale Sind beide Merkmale diskret mit endlich vielen Ausprägungen (kategorial) sprechen wir von der Assoziation Sind beide Merkmale stetig, sprechen wir von der Korrelation Zunächst: X und Y werden als diskret angenommen Statistik beantwortet nicht die Frage der Kausalität

Transcript of Vorlesung: Biometrie für Studierende der Veterinärmedizin 8.12.2005 1 Assoziation zweier diskreter...

Page 1: Vorlesung: Biometrie für Studierende der Veterinärmedizin 8.12.2005 1 Assoziation zweier diskreter Merkmale Erhebung von zwei (oder mehr) Merkmalen: Frage.

Vorlesung: Biometrie für Studierende der Veterinärmedizin

8.12.2005

1

Assoziation zweier diskreter Merkmale

• Erhebung von zwei (oder mehr) Merkmalen: Frage nach dem Zusammenhang beider Merkmale

• Sind beide Merkmale diskret mit endlich vielen Ausprägungen (kategorial) sprechen wir von der Assoziation

• Sind beide Merkmale stetig, sprechen wir von der Korrelation

• Zunächst: X und Y werden als diskret angenommen

• Statistik beantwortet nicht die Frage der Kausalität

Page 2: Vorlesung: Biometrie für Studierende der Veterinärmedizin 8.12.2005 1 Assoziation zweier diskreter Merkmale Erhebung von zwei (oder mehr) Merkmalen: Frage.

Vorlesung: Biometrie für Studierende der Veterinärmedizin

8.12.2005

2

Beispiel: Körpertemperaturveränderung bei Ferkeln

Erhöhung 8 Stunden nach Erstimpfung

Erhöhung 8 Stunden nach Zweitimpfung

Summe

nein ja

nein 21 (n11) 11 (n12) 32 (n1+)

ja 3 (n21) 10 (n22) 13 (n2+)

Summe 24 (n+1) 21 (n+2) 45 (n)

Page 3: Vorlesung: Biometrie für Studierende der Veterinärmedizin 8.12.2005 1 Assoziation zweier diskreter Merkmale Erhebung von zwei (oder mehr) Merkmalen: Frage.

Vorlesung: Biometrie für Studierende der Veterinärmedizin

8.12.2005

3

Darstellung zweier diskreter Merkmale

• Die Darstellung der letzten Folie nennt man Kontingenztafel

• Merkmal X: Temperaturerhöhung nach Erstimpfung• Merkmal Y: Temperaturerhöhung nach Zweitimpfung• Beide Merkmale sind binär und haben 2

Ausprägungen (nein/ja)• Im Beispiel: 2x2-Tafel oder Vierfeldertafel• Fragestellung: Sind X und Y abhängig

(assoziiert)?

Page 4: Vorlesung: Biometrie für Studierende der Veterinärmedizin 8.12.2005 1 Assoziation zweier diskreter Merkmale Erhebung von zwei (oder mehr) Merkmalen: Frage.

Vorlesung: Biometrie für Studierende der Veterinärmedizin

8.12.2005

4

Definition: Unabhängigkeit

• Vorlesung vom 27.10.2005:Zwei Ereignisse A und B heißen unabhängig, falls gilt:

)()()(

)()|(

)()|(

BPAPBAP

APBAP

BPABP

Page 5: Vorlesung: Biometrie für Studierende der Veterinärmedizin 8.12.2005 1 Assoziation zweier diskreter Merkmale Erhebung von zwei (oder mehr) Merkmalen: Frage.

Vorlesung: Biometrie für Studierende der Veterinärmedizin

8.12.2005

5

Unabhängigkeit zweier diskreter Merkmale

• Jetzt: Zwei diskrete Merkmale X und Y sind unabhängig, wenn

itenheinlichkeRandwahrsc lichkeit Wahrschein

der Produkt Gemeinsame

)()(),(

yYPxXPyYxXP

Page 6: Vorlesung: Biometrie für Studierende der Veterinärmedizin 8.12.2005 1 Assoziation zweier diskreter Merkmale Erhebung von zwei (oder mehr) Merkmalen: Frage.

Vorlesung: Biometrie für Studierende der Veterinärmedizin

8.12.2005

6

Unabhängigkeit zweier diskreter Merkmale II

• Beispiel zweimaliger Münzwurf einer fairen Münze• X: Ergebnis des 1.Wurfs (K oder Z)• Y: Ergebnis des 2.Wurfs (K oder Z)• 4 mögliche Kombinationen:

1. P(X=K; Y=K) = 0.25 = 0.5 · 0.5 = P(X=K) P(Y=K)

2. P(X=K; Y=Z) = 0.25 = 0.5 · 0.5 = P(X=K) P(Y=Z)

3. P(X=Z; Y=K) = 0.25 = 0.5 · 0.5 = P(X=Z) P(Y=K)

4. P(X=Z; Y=Z) = 0.25 = 0.5 · 0.5 = P(X=Z) P(Y=Z)• X und Y sind offensichtlich nach Definition unabhängig!

Page 7: Vorlesung: Biometrie für Studierende der Veterinärmedizin 8.12.2005 1 Assoziation zweier diskreter Merkmale Erhebung von zwei (oder mehr) Merkmalen: Frage.

Vorlesung: Biometrie für Studierende der Veterinärmedizin

8.12.2005

7

Unabhängigkeit zweier diskreter Merkmale III

• Wahrscheinlichkeitstafel beim fairen, unabhängigen Münzwurf:

1. Münzwurf 2. Münzwurf Summe

K Z

K 0.25 0.25 0.5

Z 0.25 0.25 0.5

Summe 0.5 0.5 1.0

Page 8: Vorlesung: Biometrie für Studierende der Veterinärmedizin 8.12.2005 1 Assoziation zweier diskreter Merkmale Erhebung von zwei (oder mehr) Merkmalen: Frage.

Vorlesung: Biometrie für Studierende der Veterinärmedizin

8.12.2005

8

Kontingenztafel versus Wahrscheinlichkeitstafel

• Kontingenztafel: empirisch beobachtete Daten (Häufigkeiten)• Wahrscheinlichkeitstafel: theoretische W. eines Experiments• Münzwurfbeispiel: Fair hat nichts mit Unabhängigkeit zu tun. Unfaire

Münze (mit Wahrscheinlichkeit 0.7 kommt K):

1. Münzwurf 2. Münzwurf SummeK Z

K 0.49 0.21 0.7

Z 0.21 0.09 0.3

Summe 0.7 0.3 1.0

Page 9: Vorlesung: Biometrie für Studierende der Veterinärmedizin 8.12.2005 1 Assoziation zweier diskreter Merkmale Erhebung von zwei (oder mehr) Merkmalen: Frage.

Vorlesung: Biometrie für Studierende der Veterinärmedizin

8.12.2005

9

Experiment: unfairer Münzwurf

• Das Experiment des (unabhängigen) unfairen Münzwurfs wird 100 mal wiederholt. Wir erwarten (im Sinne statistischer Erwartungswerte/Mittelwerte) folgende Häufigkeiten:

1. Münzwurf 2. Münzwurf SummeK Z

K 49 21 70

Z 21 9 30

Summe 70 30 100

Page 10: Vorlesung: Biometrie für Studierende der Veterinärmedizin 8.12.2005 1 Assoziation zweier diskreter Merkmale Erhebung von zwei (oder mehr) Merkmalen: Frage.

Vorlesung: Biometrie für Studierende der Veterinärmedizin

8.12.2005

10

Erwartete Häufigkeiten bei Unabhängigkeit

• Die unter Unabhängigkeit von X und Y erwarteten gemeinsamen Häufigkeiten sind das Produkt der Randhäufigkeiten geteilt durch den Gesamtstichprobenumfang n:

(70·70 / 100) = 49 (70·30 / 100) = 21(30·70 / 100) = 21 (30·30 / 100) = 9

• Formal:

Häufigk. erwartete:

2,1,

ij

jiij

e

jin

nne

Page 11: Vorlesung: Biometrie für Studierende der Veterinärmedizin 8.12.2005 1 Assoziation zweier diskreter Merkmale Erhebung von zwei (oder mehr) Merkmalen: Frage.

Vorlesung: Biometrie für Studierende der Veterinärmedizin

8.12.2005

11

Übertragung auf das Eingangsbeispiel

Erhöhung 8 Stunden nach Erstimpfung

Erhöhung 8 Stunden nach Zweitimpfung

Summe

nein ja

nein 21 (17.07) 11 (14.93) 32 (n1+)

ja 3 (6.93) 10 (6.07) 13 (n2+)

Summe 24 (n+1) 21 (n+2) 45 (n)

Page 12: Vorlesung: Biometrie für Studierende der Veterinärmedizin 8.12.2005 1 Assoziation zweier diskreter Merkmale Erhebung von zwei (oder mehr) Merkmalen: Frage.

Vorlesung: Biometrie für Studierende der Veterinärmedizin

8.12.2005

12

Übertragung auf das Eingangsbeispiel II

• Berechnungsbeispiel: e_11 = (32·24) / 45 = 17.07• Um die Assoziation von X und Y zu messen, berechnen wir den

Abstand der empirisch beobachteten Häufigkeiten von den unter Unabhängigkeit zu erwartenden Häufigkeiten in statistisch geeigneter Weise:

2

1

2

1

22

1

2

1

2

2

i j ij

ijij

i j ji

jiij

e

en

n

nnn

nnn

Page 13: Vorlesung: Biometrie für Studierende der Veterinärmedizin 8.12.2005 1 Assoziation zweier diskreter Merkmale Erhebung von zwei (oder mehr) Merkmalen: Frage.

Vorlesung: Biometrie für Studierende der Veterinärmedizin

8.12.2005

13

Übertragung auf das Eingangsbeispiel III

)724.6(17.607.6

07.610

93.6

93.63

93.14

93.1411

07.17

07.1721

22

22

2

ogrammComputerprmit

Page 14: Vorlesung: Biometrie für Studierende der Veterinärmedizin 8.12.2005 1 Assoziation zweier diskreter Merkmale Erhebung von zwei (oder mehr) Merkmalen: Frage.

Vorlesung: Biometrie für Studierende der Veterinärmedizin

8.12.2005

14

Pearsonscher Kontingenzkoeffizient C

nC

2

2

Page 15: Vorlesung: Biometrie für Studierende der Veterinärmedizin 8.12.2005 1 Assoziation zweier diskreter Merkmale Erhebung von zwei (oder mehr) Merkmalen: Frage.

Vorlesung: Biometrie für Studierende der Veterinärmedizin

8.12.2005

15

Pearsonscher Kontingenzkoeffizient C (II)

• C ist ein normiertes Maß, d.h. es liegt im Intervall [0,1)• Sind X und Y unabhängig, so gilt: C=0• Je größer C, desto stärker die Assoziation bei gegebener

Dimension der Tafel (bis jetzt: 2x2)• C gibt keine Richtung des Zusammenhangs an!• C läßt sich auf IxJ-Tafeln analog erweitern (X: I Kategorien;

Y: J Kategorien)• Im Beispiel:

361.045724.6

724.6 C

Page 16: Vorlesung: Biometrie für Studierende der Veterinärmedizin 8.12.2005 1 Assoziation zweier diskreter Merkmale Erhebung von zwei (oder mehr) Merkmalen: Frage.

Vorlesung: Biometrie für Studierende der Veterinärmedizin

8.12.2005

16

Odds Ratio

• Der Odds Ratio (das Kreuzproduktverhältnis) ist ein zu C alternatives Zusammenhangsmaß für 2x2-Tafeln

• Der Odds Ratio gibt die Richtung des Zusammenhangs an

• Der (empirische) Odds Ratio ist definiert als

2112

2211

nn

nnOR

Page 17: Vorlesung: Biometrie für Studierende der Veterinärmedizin 8.12.2005 1 Assoziation zweier diskreter Merkmale Erhebung von zwei (oder mehr) Merkmalen: Frage.

Vorlesung: Biometrie für Studierende der Veterinärmedizin

8.12.2005

17

Odds Ratio (II)

• Der Odds Ratio nimmt Werte im Intervall [0,∞) an• Sind X und Y unabhängig, so ist OR=1• Bemerkung: der OR ist nicht immer invariant gegen

Vertauschung von Zeilen oder Spalten der Kontingenztafel

• OR>1: positive Abhängigkeit (siehe aber vorigen Stichpunkt)

• OR<1: negative Abhängigkeit• Im Beispiel: OR = (21·10)/(11·3) = 6.36• Interpretation:

Page 18: Vorlesung: Biometrie für Studierende der Veterinärmedizin 8.12.2005 1 Assoziation zweier diskreter Merkmale Erhebung von zwei (oder mehr) Merkmalen: Frage.

Vorlesung: Biometrie für Studierende der Veterinärmedizin

8.12.2005

18

Interpretation des Odds Ratio (III)

nein ja Summenein 21 11 32Ja 3 10 13Bedingte Betrachtungen innerhalb der Zeilen:1.Zeile (keine Temperaturerhöhung nach Erstimpfung):

Die sog. Chance (Odds), keine Temperaturerhöhung nach der Zweitimpfung zu haben, ist

Ω1 = (21/32) / (11/32) = 21/11 = 1.912.Zeile (Temperaturerhöhung nach Erstimpfung):

Die sog. Chance (Odds), keine Temperaturerhöhung nach der Zweitimpfung zu haben, ist

Ω2 = (3/13) / (10/13) = 3/10 = 0.3

Page 19: Vorlesung: Biometrie für Studierende der Veterinärmedizin 8.12.2005 1 Assoziation zweier diskreter Merkmale Erhebung von zwei (oder mehr) Merkmalen: Frage.

Vorlesung: Biometrie für Studierende der Veterinärmedizin

8.12.2005

19

Interpretation des Odds Ratio (IV)

• Der Odds Ratio ist das Verhältnis der Chancen:

OR = Ω1/ Ω2 = 1.91/0.3 = 6.37

Die Chance, keine Temperaturerhöhung nach der Zweitimpfung zu haben, ist 6.37 mal so groß für die Ferkel, die nach der Erstimpfung keine Temperaturerhöhung hatten im Vergleich zu den Ferkeln, die eine Temperaturerhöhung nach der Erstimpfung hatten. Das heißt aber nicht, dass die Wahrscheinlichkeit, keine Temperaturerhöhung nach Zweitimpfung zu haben, für die Ferkel, die nach Erstimpfung keine Temperaturerhöhung hatten, 6.36 mal so groß ist wie für die Ferkel, die eine Temperaturerhöhung nach Erstimpfung hatten, denn:

Page 20: Vorlesung: Biometrie für Studierende der Veterinärmedizin 8.12.2005 1 Assoziation zweier diskreter Merkmale Erhebung von zwei (oder mehr) Merkmalen: Frage.

Vorlesung: Biometrie für Studierende der Veterinärmedizin

8.12.2005

20

Interpretation des Odds Ratio (V)

• (Bedingte) Wahrscheinlichkeit für Ferkel, die nach Erstimpfung keine Temperaturerhöhung hatten, auch nach Zweitimpfung keine TE zu haben, ist 21/32=0.66 und die Wahrscheinlichkeit für die, die eine TE nach Erstimpfung hatten, ist 3/13= 0.23.

• Wichtig für Interpretation: Zeilen- und Spaltenlabels beachten. Vertauschen wir zum Beispiel die 1. und 2. Zeile:

nein ja SummeJa 3 10 13nein 21 11 32

OR = (3·11) / (10·21) = 0.157 = 1/6.37Die inhaltliche Interpretation bleibt aber bei Beachtung der Labels erhalten!

Page 21: Vorlesung: Biometrie für Studierende der Veterinärmedizin 8.12.2005 1 Assoziation zweier diskreter Merkmale Erhebung von zwei (oder mehr) Merkmalen: Frage.

Vorlesung: Biometrie für Studierende der Veterinärmedizin

8.12.2005

21

Relatives Risiko

nein ja Summenein 21 11 32Ja 3 10 13Das (empirische) relative Risiko (RR), nach Zweitimpfung keineTE zu haben, ist definiert als Verhältnis der bedingten relativenHäufigkeiten (bedingt auf das Ergebnis der Erstimpfung):

)/(

)/(

222121

121111

nnn

nnnRR

Page 22: Vorlesung: Biometrie für Studierende der Veterinärmedizin 8.12.2005 1 Assoziation zweier diskreter Merkmale Erhebung von zwei (oder mehr) Merkmalen: Frage.

Vorlesung: Biometrie für Studierende der Veterinärmedizin

8.12.2005

22

Relatives Risiko (II)

• Im Beispiel:

RR = (21/32) / (3/13) = 2.84 (≈0.66/0.23)• Interpretation: keine Temperaturerhöhung nach

Erstimpfung „erhöht das Risiko“, auch nach Zweitimpfung keine Temperaturerhöhung zu haben.

• RR=1 würde bedeuten: Risiko ist unabhängig vom Ergebnis der Erstimpfung, d.h. die Merkmale TE nach Erstimpfung und TE nach Zweitimpfung sind unabhängig

Page 23: Vorlesung: Biometrie für Studierende der Veterinärmedizin 8.12.2005 1 Assoziation zweier diskreter Merkmale Erhebung von zwei (oder mehr) Merkmalen: Frage.

Vorlesung: Biometrie für Studierende der Veterinärmedizin

8.12.2005

23

Vor- und Nachteile des Odds Ratios

• Der Odds Ratio kann für alle gängigen Studiendesigns berechnet werden und ist dabei immer ein sinnvolles Zusammenhangsmaß

• Der Odds Ratio gibt die Richtung des Zusammenhangs an (C dagegen nicht)

• Für größere als 2x2-Tafeln gibt es nicht nur einen Odds Ratio, was die Interpretation schwierig macht. Hier ist C ein einfacheres Assoziationsmaß

• RR ist bei manchen Studiendesigns nur in einer bestimmten „Richtung“ anwendbar (z.B. case-control)

Page 24: Vorlesung: Biometrie für Studierende der Veterinärmedizin 8.12.2005 1 Assoziation zweier diskreter Merkmale Erhebung von zwei (oder mehr) Merkmalen: Frage.

Vorlesung: Biometrie für Studierende der Veterinärmedizin

8.12.2005

24

Zusammenfassung I (was Sie wissen sollten)

• Für zwei diskrete Merkmale haben wir drei Assoziationsmaße kennengelernt: C, Odds Ratio und RR

• Insbesondere für 2x2-Tafeln ist der Odds Ratio ein geeignetes Zusammenhangsmaß, da er auch eine Richtung angibt

• Für allgemeine IxJ-Tafeln (I>2 und/oder J>2) bietet sich C als (richtungsloses) Zusammenhangsmaß an

• Bei Verwendung des relativen Risikos RR ist auf das Studiendesign zu achten, um keinen unsinnigen Wert zu berechnen!

Page 25: Vorlesung: Biometrie für Studierende der Veterinärmedizin 8.12.2005 1 Assoziation zweier diskreter Merkmale Erhebung von zwei (oder mehr) Merkmalen: Frage.

Vorlesung: Biometrie für Studierende der Veterinärmedizin

8.12.2005

25

Zusammenfassung II (was Sie können sollten)

• C berechnen• Odds Ratio berechnen und interpretieren• Relatives Risiko berechnen und interpretieren