IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen...

43
IBE, Korr. (L6-2) 1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie

Transcript of IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen...

Page 1: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 1

Korrelation und lineare Regression

Quantitative Methoden in der klinischen Epidemiologie

Page 2: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 2

Lernziele

• Besteht ein funktioneller Zusammenhang zwischen zwei Messungen an einem Patienten?

• Korrelation als Maßzahl für die Stärke eines linearen Zusammenhanges

• Beschreiben des linearen Zusammenhanges• Korrelationsanalysen wenn eine Folge von Messwertpaaren

pro Patient erhoben wird.• Nicht-parametrische Korrelation: Monotonie des

Zusammenhanges.• Probleme: Scheinkorrelation und Korrelation bei aggregierten

Daten.• Korrelation und kausaler Zusammenhang• Prädiktion von zukünftigen Werten• Übereinstimmung von Messungen

Page 3: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 3

Beispiel: Alter und Fettanteil (I)

Eine Studie von Mazess et al. (1984) untersucht den prozentualen Fettanteil (% Fett) im Körper von n=18 gesunden Erwachsenen im Alter von 23 bis 61 Jahren.Besteht ein Zusammenhang zwischen dem Alter und dem Fettgehalt im Körper?

Subj. Alter Fett[%]

1 23 9.52 23 27.93 27 7.84 27 17.85 39 31.46 41 25.97 45 27.48 49 25.29 50 31.1

Subj. Alter Fett[%]

10 53 34.711 53 42.012 54 29.113 56 32.514 57 30.315 58 33.016 58 33.817 60 41.118 61 34.5

Page 4: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 4

Beispiel: Alter und Fettanteil (II)

Beispiel „Fettanteil“

30 40 50 60

10

15

20

25

30

35

40

Alter [Jahre]

Fe

tt [%

]

Page 5: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 5

Pearson‘s Korrelationskoeffizient: Formel (I)

Formel:

r =

n

1i

n

1i

2i

2i

n

1iii

)yy()xx(

)yy()xx(

Gleichsinnigkeit von x- und y-Werten führt zu großen Werten in

Straffheit bedeutet geringe Variabilität, damit wird der Nenner klein und der Bruch groß.

n

1iii )yy()xx(

n

1i

n

1i

2i

2i )yy()xx(

Der Korrelationswert ändert sich nicht, wenn die Rolle von x und y vertauscht wird.

Page 6: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 6

Beispiel: Alter und Fettanteil (II)

Beispiel „Fettanteil“

30 40 50 60

10

15

20

25

30

35

40

Alter [Jahre]

Fe

tt [%

]

x=46,3

y=28,3

Page 7: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 7

Pearson‘s Korrelationskoeffizient: Richtung (II)

Erwünschte Eigenschaften eines statistischen Maßes für einen linearen Zusammenhang :

• Vorzeichen gibt die Richtung des Zusammenhanges an. Negativer Wert: Mit zunehmendem x-Wert nimmt der y-Wert ab Positiver Wert: Mit zunehmendem x-Wert nimmt der y-Wert zu

x-Achse x-Achsey-A

chse

y-A

chse

Negative Korrelation

Positive Korrelation

Page 8: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 8

Pearson‘s Korrelationskoeffizient: Quiz (III)

Abweichen (in beiden Richtungen) von der Null gibt Stärke des Zusammenhanges an: = 0, falls kein linearer Zusammenhang = 1 (bzw. = -1), bei maximalem linearen Zusammenhang

Korrelationsquiz: Für welche der abgebildeten Situationen vermuten Sie einen Korrelationswert, der näher an der 0 als an +1 oder -1 liegt?

Page 9: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 9

Pearson‘s Korrelationskoeffizient: Skalierung (IV)

Der Korrelationskoeffizient ist dimensionslos und skalenunabhängig:

Die Multiplikation der Variablenwerte mit einem konstanten Faktor oder deren Verschiebung um einen konstanten Wert haben keinen Einfluß auf den Wert des Korrelationsmaßes.

Beispiel: Der Korrelationskoeffizient ist unabhängig davon, ob die Messung in Metern oder Zentimetern erfolgt ist.

Gleiche Korrelation

Page 10: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 10

Pearson‘s Korrelationskoeffizient: Statistik (V)

Beispiel „Fettanteil“:

Nach Anwendung der Formel auf die Daten von Mazess et al. ergibt sich r = 0.792

95% Konfidenzintervall: [0.516; 0.919] Formeln für diese Berechnung sind kompliziert, Angaben werden aber von den meisten Statistikprogrammen geliefert.

Test auf Korrelation: Nullhypothese: Es besteht kein linearer Zusammenhang p-Wert: 0.000893

Page 11: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 11

Interpretationsprobleme mit Korrelationen (I)

Statistischer Zusammenhang ist kein kausaler Zusammenhang. Das gleichsinnige Verhalten beider Variablen kann durch eine verborgene dritte Variable gesteuert werden.

Beispiel: Der Korrelationskoeffizient zwischen der Fähigkeit Rechenaufgaben zu lösen und der Körpergröße bei Kindern ist positiv. Beides nimmt mit demAlter zu.

Anderes Beispiel:Abhängigkeit von Gehalt und Schuhgröße:

Schuhgröße

Ein

kom

men

Männer

Frauen

Korrelation durch Confounding

Page 12: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 12

Interpretationsprobleme mit Korrelationen (II)

• Pro Individuum darf nur ein Beobachtungspaar vorliegen. Oft wird aber auch die Frage nach der Korrelation zweier „Marker“ im Verlauf einer Erkrankung bei einem Patienten gefragt. Hier müssen andere Verfahren zur Berechnung der Korrelation verwendet werden

• Selektionsprozesse können Korrelationsaussagen beeinflussen:

verringert die Korrelation vergrößert die Korrelation

Auswahl innerer Werte Auswahl extremer Werte

Page 13: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 13

Interpretationsprobleme mit Korrelationen (III)

• Verzerrte Korrelation bei gemischten Stichproben

30 40 50 60

10

15

20

25

30

35

40

Alter[Jahre]

Fe

tt[%

]

MannFrau

Korrelation aller: r = 0.792Männer: r = 0.89Frauen: r = 0.51

Page 14: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 14

Interpretationsprobleme mit Korrelationen (IV)

• Gefahr der Überinterpretation beim simultanen Untersuchen vieler Korrelationen. Manche signifikante Korrelation kann falsch positiv sein. (Adjustierung für multiples Testen). 10 stetige Variablen erlauben die Untersuchung von 45 Korrelationen.

• Korrelation misst den Grad des Zusammenhanges, nicht den Grad der Übereinstimmung.

Übereinstimmung und guter

Zusammenhang

Keine Übereinstimmung aber guter

Zusammenhang

Gleiche Korrelation

Page 15: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 15

Interpretationsprobleme mit Korrelationen (V)

Grenzen der Anwendung des Korrelationskoeffizienten von Pearson:

Hat eine der zu untersuchenden Variablen nur ordinales Skalenniveau oder liegt ein monotoner, nicht-linearer Zusammenhang vor, so ist der Korrelationskoeffizient nach Pearson nicht das geeignete Instrument zur Quantifizierung des Zusammenhanges.

Page 16: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 16

Spearman‘s Korrelationskoeffizient (I)

Der Korrelationskoeffizient nach Spearman entspricht dem Korrelationskoeffizienten nach Pearson, beruht aber bei der Berechnung nicht auf den Originalmesswerten (xi, yi), sondern auf deren zugehörigen Rangzahlen (ri, si), die separat nach der Stellung der jeweiligen Beobachtung in der nach Größe geordneten Messreihe aller x und y Messwerte bestimmt werden.

n

1i

2i3S d

nn

61r

Dabei sind di die Differenzen der Rangwerte bezüglich X bzw. Y und n die Anzahl der Beobachtungen.

Page 17: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 17

Spearman‘s Korrelationskoeffizient (II)

Wikipedia: Spearman Korrelationskoeffizient

IQ, Xi Stunden TV pro Woche, Yi Rang xi Rang yi di d²

86 0 1 1 0 0

97 20 2 6 -4 16

99 28 3 8 -5 25

100 27 4 7 -3 9

101 50 5 10 -5 25

103 29 6 9 -3 9

106 7 7 3 4 16

110 17 8 5 3 9

112 6 9 2 7 49

113 12 10 4 6 36

176.0194101000

61d

nn

61r

n

1i

2i3S

Page 18: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 18

Spearman‘s Korrelationskoeffizient (III)

Voraussetzungen:• Der aus der Punktwolke vermutete Zusammenhang muss nur monoton sein (monoton wachsend oder fallend). Es ist kein linearer Zusammenhang notwendig.• Beide Merkmale sind mindestens ordinalskaliert.

Eigenschaften:Analog zum Korrelationskoeffizienten nach Pearson;Unterschied: keine direkte Beziehung zur Regressionsanalyse, da jetzt nicht die lineare Assoziation quantifiziert wird, sondern eine breiter gefasste monotone Assoziation von Interesse ist.

Sein Wert wird weniger von Ausreißern beeinflusst als der des Pearson Korrelationskoeffizienten

Page 19: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 19

Spearman‘s Korrelationskoeffizient (IV)

Zusammenhang zwischen Lungenkrebstodesfällen und Zigarettenkonsum:

Korrelationskoeffizient nach Pearson: 0.715Korrelationskoeffizient nach Spearman: 0.726

Page 20: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 20

Beschreiben eines linearen Zusammenhanges (I)

30 40 50 60

10

15

20

25

30

35

40

Alter [Jahre]

Fe

tt [%

]

Alter [Jahre]

Fett

[%

]

Page 21: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 21

Beschreiben eines linearen Zusammenhanges (II)

Er Wert des Pearson-Korrelationskoeffizienten, der deutlich von der Null verschieden ist, läßt auf einen linearen Zusammenhang schließen.

Der Wert des Pearson-Korrelationskoeffizienten gibt jedoch keinerlei Information über die Form des linearen Zusammenhanges.

Das Verfahren der linearen Regression ermöglicht eine quantitative Beschreibung des vermuteten Zusammenhanges.

Page 22: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 22

Lineare Regression (I)

Vorhersage einer Zielgröße Y bei gegebener Einflußgröße X durch eine lineare Gleichung:

y = a + b•x

Der Achsenabschnitt a und die Steigung b werden so bestimmt, daß man die Gerade enthält, die den geringsten quadratischen Abstand zu den beobachteten (x,y) Punkten hat.

Mit dieser Strategie ergibt sich

b = r • sy / sx mit r – Korrelation zwischen x und y, sx – Standardabweichung der x-Werte sy - Standardabweichung der y-Werte

a = - b• mit Mittelwert der y-Werte, Mittelwert der x-Werte

y x yx

x

y

Page 23: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 23

Lineare Regression (II)

Beispiel „Fettanteil“:

r = 0.7539 Korrelation zwischen x und y

sx = 13.217 x – Alter in Jahren Standardabweichung

sy = 9.144 y – Fettgehalt [%] Standardabweichung

b = 0.5215 Steigung der Regressionsgeraden

= 46.33333 x – Alter in Jahren Mittelwert

= 28.61111 y – Fettgehalt [%] Mittelwert

a = 3.2209 Achsenabschnitt der Regressionsgerade

Regressionsgerade: y = 3.2209 + 0.5480 • x

Pro weiterem Lebensjahr nimmt der mittlere Fettgehalt des Körpers um etwa 0.55% zu.

y

x

Page 24: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 24

Abweichung vom Mittelwert

yi – y = (yi – y*i) + (y*i – y)

y: Mittelwert aller y-Messungen

y*i = a + b•xi: Geradenwert für Beobachtung i

yi: y-Wert der Beobachtung i

n

1i

2*i

n

1i

2*ii

n

1i

2i )yy()yy()yy(

SStotal = SSResiduen + SSRegression

Anteil der erklärten Varianz: SSRegression / SStotal = r²

Das Quadrat der Korrelation wird auch Bestimmtheitsmaß genannt.

Page 25: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 25

Residualanalyse (I)

Unter den Residuen einer Regressionsanalyse versteht man die Unterschiede zwischen der Beobachtung und dem Wert, der durch die Regressionsgerade für diese Beobachtung vorgegeben wird.

Die Residuen quantifizieren das Rauschen der Beobachtungen um die Regressionsgerade.

Die Varianz der Residuen wird als Schätzer für das Rauschen der Beobachtungen um die Regressionsgerade verwendet.

Ist die Varianz der Residuen klein, so liegen die Beobachtungen eng um die Gerade und somit ist der Pearson Korrelationskoeffizient der Beobachtungen nahe an -1 oder 1.

Ein Residuum

Noch ein Residuum

Page 26: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 26

Residualanalyse (II)

Passt ein lineares Regressionsmodell zu den Daten:

• Residuen repräsentieren Rauschen, sie sollten den Mittelwert 0 haben und keine Struktur aufweisen. Ideal: ein um die Null liegendes Band, falls man auf der x-Achse den x-Wert einer Beobachtung aufträgt und auf der y-Achse deren Residuum.

• Falls die Residuen normalverteilt sind, so lassen sich Aussagen über die Regression auch statistisch testen. Es lassen sich dann Konfidenzintervalle berechnen: 95% Konfidenzintervall für die Abszisse der Geraden und die Geradensteigung.

• Betrachte Residuen mit dem QQ-Plot um die Normalverteilungs- annahme zu prüfen.

Page 27: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 27

+

+

++

+

+

+

+

+

++

+++ +

++

+

+

++

++

+

++

+++

+

+

++

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

++

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+++

+

+

+

+

+

+

+

+

+

+

+++

+

+

++

+

+

+

+

+

+

+

0 2 4 6 8 10

-2-1

01

2

x

y

Ideale Situation

++

++

+

+

+

+

+

+

+

+

+

++

++

++

++

+ +

++

+

++

+

++

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

++

++

+

+

+

+

++

++

+

+

+

+

+

+ +

+++

++

+

++ +

+

++

+

++

++

+

+

+

+

++

+

+

+++

+

+

+

+

+

+

+

0 2 4 6 8 10

-3-2

-10

12

3

x

y

Kruemmung

+

++ +

+

+

+

+

+

+

++ +

++

++

+

+

+

+

+

+ +

+

+

++

++

++

+

+

+

+

++ +

++

+

+ +

+

+ ++

+

+

+

+

++

+ ++

+

+

+

+

+

+

+

+

++

+

+

++

+

+

+

+++

++

++

+ ++

+

+

+

++

+ + ++

+

+

++

++

+

0 2 4 6 8

-6-4

-20

24

68

x

y

zunehmende Variabilitaet

Residualanalyse (III)

Page 28: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 28

QQ-Plot

Die tatsächlichen Realisationen der interessierenden Variablen werden gegen die erwarteten Werte der zu untersuchenden Verteilung (hier Normalverteilung) geplottet:

Page 29: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 29

Korrelation innerhalb Patienten (I)

Bei 8 Probanden werden wiederholt pH und PaCO2 Messungen durchgeführt.

Wie groß ist die Korrelation zwischen beiden Messungen?

Subj. pH PaCO2 Subj. pH PaCO2 Subj. pH PaCO2

1 6.68 3.91 4 7.36 5.67 6 7.38 4.781 6.53 4.12 4 7.33 5.10 6 7.30 4.731 6.43 4.09 4 7.29 5.53 6 7.29 5.121 6.33 3.97 4 7.30 4.75 6 7.33 4.932 6.85 5.27 4 7.35 5.51 6 7.31 5.032 7.06 5.37 5 7.35 4.28 6 7.33 4.932 7.13 5.41 5 7.30 4.32 7 6.86 6.85 2 7.17 5.44 5 7.37 3.23 7 6.94 6.44 3 7.40 5.67 5 7.27 4.46 7 6.92 6.52 3 7.42 3.64 5 7.30 4.44 8 7.19 5.283 7.41 4.32 5 7.30 4.32 8 7.29 4.563 7.37 4.73 5 7.37 3.23 8 7.21 4.343 7.34 4.96 5 7.27 4.46 8 7.25 4.323 7.35 5.04 5 7.28 4.72 8 7.20 4.413 7.28 5.22 5 7.32 4.75 8 7.19 3.693 7.30 4.82 5 7.32 4.99 8 6.77 6.093 7.34 5.07 8 6.82 5.58

Bland, Altman (1995) BMJ, 310:446

Page 30: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 30

Korrelation innerhalb Patienten (II)

4 5 6

6.4

6.6

6.8

7.0

7.2

7.4

PaCO2

Intr

am

ura

ler

pH

1

1

1

1

2

2

22

33 3

333

333

44

44

45

5

5

555

5

5 55 5

6

6 66

66

7

77

8

8

88

88

88

Addiere für jeden Patienten die quadrierten Residuen um seine Gerade und die quadrierten Abweichungen der Geradenwerte vom Mittelwert des Patienten. Dies ergibt SSResiduen und SSRegression

Daraus errechnet man SStotal = SSResiduen + SSRegression und für das Quadrat der Korrelation r²:

SSRegression / SStotal = r²

Page 31: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 31

Korrelation innerhalb Patienten – Berechnung (III)

Problem: Eine unabhängige Variable liegt in Ordinal- oder Nominal-skalierung in n Ausprägungen vor

Lösung: Umkodieren – es werden (n-1) Dummyvariablen erzeugt

Beispiel: Subject 8 Ausprägungen -> 7 Dummys

Subject p1 p2 p3 p4 p5 p6 p7

1 1 0 0 0 0 0 0

2 0 1 0 0 0 0 0

3 0 0 1 0 0 0 0

4 0 0 0 1 0 0 0

5 0 0 0 0 1 0 0

6 0 0 0 0 0 1 0

7 0 0 0 0 0 0 1

8 0 0 0 0 0 0 0

Alte VariableNeue Variablen

Page 32: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 32

Korrelation innerhalb Patienten – Berechnung (IV)

Df Sum Sq Mean Sq F value Pr(>F) PaCO2 1 0.03438 0.03438 4.1903 0.0471 * Subjects 7 3.00425 0.42918 52.3054 <2e-16 ***Residuals 41 0.33642 0.00821

SStotal = SSResiduen + SSRegression

SSResiduen = 0.33642

SSRegression = 0.03438

SStotal = 0.3708

r² = SSRegression / SStotal = 0.03438 / 0.3708 = 0.093

r (Korrelation) = - 0.304 (aufgrund der Richtung der Geraden)

ANOVA

Berechnung der Quadratsummen mittels ANOVA (etwa in SPSS)

Page 33: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 33

Vorhersage von Werten - Prädiktion

Ein Patient hat zum Zeitpunkt der Untersuchung einen Blutdruckwert von x mmHg.

Wie kann sein Blutdruckwert für das nächste Jahr vorhergesagt werden?

Aus Studien sind folgende Tatsachen bekannt:

• Mittelwert des Blutdrucks in der Altersgruppe des Patienten (m);

• Streuung des Blutdrucks in der Altersgruppe des Patienten (s2);

• Mittlere Veränderung des Blutdrucks, wenn die Population um ein Jahr altert (d);

• Korrelation der Blutdruckwerte, wenn ein Patient um 1 Jahr altert (ρ).

Antwort: Vorhersage: m+d+ρ∙(x-m) Präzision: (1-ρ2)∙s2

Page 34: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 34

Regression zum Mittelwert

Zeit

m

m + d d

Die vorhergesagte Veränderung ist exakt

• d, wenn die Korrelation zwischen den Zeitpunkten 1 ist;

• d+(m-x), wenn es keine Korrelation zwischen beiden Zeitpunkten gibt;

• d + (1-ρ)·(m-x), wenn die Korrelation zwischen beiden Zeitpunkten ρ beträgt;

x

m-x d

Page 35: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 35

Regression zum Mittelwert

Regression zum Mittelwert beschreibt das Phänomen, dass bei zwei verbundenen Messungen extreme Werte bei einer der beiden Messungen im Durchschnitt mit weniger extremen Werten bei der anderen Messung einhergehen.

• Es tritt dann auf, wenn die Stichprobenauswahl anhand von extremen

Baselinewerten des Untersuchungsmerkmals durchgeführt wurde

• Bei perfekter Korrelation zwischen den beiden Messungen tritt der Effekt nicht auf

• Je stärker die Korrelation zwischen den beiden Messungen ist, desto geringer ist der Effekt

Page 36: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 36

Regression zum Mittelwert

Beispiel: Writing Group of the PREMIER Collaborative Research Group (2003) JAMA, 289(16):2083-2093

Patienten mit hohem Blutdruck (120-159mm Hg bzw. 80-95mm Hg, Durchschnitt aus 3 Messungen) werden in 3 Gruppen randomisiert:

Zwei Gruppen mit Verhaltensintervention (Established/Established+DASH) und eine Vergleichsgruppe (Advice Only)

Nach 3 Monaten und nach 6 Monaten werden erneut Blutdruckmessungen durchgeführt

Durchschnittliche Ruhewerte:100–130 mmHg (systolischer Wert) 60–85 mmHg (diastolischer Wert )

Page 37: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 37

Zusammenfassung

• Die Korrelation nach Pearson quantifiziert, wie gut ein Zusammenhang durch eine lineare Funktion beschrieben werden kann.

• Liegt eine ausreichend starke Korrelation bei den untersuchten Daten vor, so kann der lineare Zusammenhang durch eine lineare Regression quantitativ beschrieben werden.

• Funktionelle Zusammenhänge lassen sich oft in lineare Zusammenhänge transformieren und dann geeignet durch eine lineare Regression beschreiben.

• Residualanalyse ist ein wichtiges Instrument um eine korrekte Beschreibung eines linearen Zusammenhanges durch eine lineare Regression zu analysieren.

• Der Spearman‘sche Korrelationskoeffizient ist ein geeignetes Instrument um die Güte bei monotonen Zusammenhängen zu quantifizieren.

• Korrelation ist nicht mit Übereinstimmung gleichzusetzen

• Korrelation ist verantwortlich für das Phänomen: Regression zum Mittelwert.

Page 38: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 38

Quiz

Was ist ein Residuum im linearen Modell?

a) Der Anteil der erklärten Varianz an der Gesamtvarianz

b) Die Differenz zwischen zwischen der Beobachtung und dem Wert, der durch die Regressionsgerade für diese Beobachtung vorgegeben wird

c) Der y-Achsenabschnitt der Regressionsgerade

d) Die Steigung der Regressionsgerade

Page 39: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 39

Quiz

Welche Aussage über den Korrelationskoeffizienten von Pearson trifft nicht zu?

a) X und Y lassen sich beliebig vertauschen

b) Der Korrelationskoeffizient von Pearson liegt zwischen -1 und 1

c) Der Korrelationskoeffizient von Pearson gibt die Stärke und die Richtung eines beliebigen monotonen Zusammenhangs wieder

d) Liegt eine der beiden Variablen nur in ordinalem Skalenniveau vor, ist der Korrelationskoeffizient von Pearson nicht anwendbar

Page 40: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 40

Quiz

Wann kann Regression zum Mittelwert auftreten?

a) Wenn die Stichprobenauswahl anhand von extremen Baselinewerten des Untersuchungsmerkmals durchgeführt wurde

b) Wenn der Korrelationskoeffizient von Pearson auf einen nicht-monotonen Zusammenhang angewendet wurde

c) Wenn bei der linearen Regression die Residuen eine nicht-zufällige Struktur aufweisen

d) Wenn der Korrelationskoeffizient von Pearson auf verbundene Beobachtungen angewendet wurde

Page 41: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 41

Quiz

Wir wollen den Zusammenhang zwischen Gesundheitszustand (aus einem Fragebogen, Kategorien: 1=„gut“, 2=„mittel“, 3=„schlecht“) und dem Alter des Patienten untersuchen.

Was sollten wir berechnen?

a) Korrelationskoeffizient von Pearson

b) Korrelationskoeffizient von Spearman

c) QQ-Plot

d) Regression zum Mittelwert

e) Keine der Methoden unter a) – d) sind für die Lösung der Fragestellung geeignet

Page 42: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 42

Quiz

Welches der folgenden Maße misst die Übereinstimmung zweier Merkmale?

a) Korrelationskoeffizient von Pearson

b) Korrelationskoeffizient von Spearman

c) Bestimmtheitsmaß

d) Keines dieser Maße

Page 43: IBE, Korr. (L6-2)1 Korrelation und lineare Regression Quantitative Methoden in der klinischen Epidemiologie.

IBE, Korr. (L6-2) 43

Quiz

Welche der folgenden Aussagen über die lineare Regression trifft zu?

a) X und Y lassen sich beliebig vertauschen

b) Wenn das Modell korrekt spezifiziert ist, ist die Varianz der Residuen konstant

c) Das Quadrat des Korrelationskoeffizienten von Spearman wird auch Bestimmtheitsmaß genannt

d) Die abhängige Variable muss mindestens ordinales Skalenniveau haben