Statistische Analyse eines multivariaten Continuation ... · HINTERGRUND WERKZEUGE BIVARIATES CRM...

Post on 13-Aug-2019

218 views 0 download

Transcript of Statistische Analyse eines multivariaten Continuation ... · HINTERGRUND WERKZEUGE BIVARIATES CRM...

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

Statistische Analyse eines multivariatenContinuation Ratio-Models mit

StandardwerkzeugenEin Regressionsmodell für korrelierte ordinale Daten

Jürgen Wellmann

Institut für Epidemiologie und Sozialmedizin, Universität Münster

20. November 2009

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

HintergrundAltersabhängige MakuladegenerationMünsteraner Altern- und Retina Studie (MARS)

Die »Werkzeuge«Alternating Logistic RegressionContinuation Ratio Modell (CRM)

Ein bivariates CRMEin Beispiel aus MARSVersuch einer Simulation

ErweiterungenMehr als zwei Beobachtungen pro ClusterWiederholte Cluster

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

Altersabhängige Makuladegeneration (AMD)

• Degenerative Erkrankung der Netzhaut, insbesondere derMakula (Gelber Fleck)

• Häu�ge Ursache von Einschränkungen der Sehfähigkeit inhöherem Alter (in industrialisierten Ländern)

• Wird in verschiedene Stadien eingeteilt, etwa gesund,Frühform, Spätform

• Verlauf der Erkrankung: Verschlechterung von Stadium zuStadium oder Stillstand, aber (unbehandelt) keineVerbesserung

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

Abbildung: Healthy retina

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

Abbildung: Early ARM with drusen

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

Abbildung: Late ARM (choroidal neovascularization)

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

Abbildung: Late ARM (geographic atrophy)

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

Abbildung: Range of vision of an AMD patient

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

Münsteraner Altern- und Retina Studie (MARS)

Ziel Risikofaktoren für Fortschreiten der AMDidenti�zieren

Ort Münster und Umgebung

Teilnmehmer 1,063 Probanden zu Anfang, 58�82 Jahre alt

• Überwiegend Patienten aus Augenarztpraxen mitAnzeichen von AMD

• etwa 20% gesunde Probanden• Ausschlusskriterium: Engwinkelglaukom

Principal investigators Prof. Dr. Hense (Uni Münster), Prof. Dr.Pauleikho� (St. Franziskus-Hospital Münster)

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

Erhebungen bei MARS

MARS 1 Juni 2001 � Nov. 2003, n = 1 063MARS 2 Nov. 2003 � Juni 2006, n = 828MARS 3 Feb. 2008 � Ende 2009, n = 425+

Wiederholte Erhebungen an denselben ProbandenUnter anderem Befundung des AMD-Status

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

Alternating Logistic Regression (ALR)

Regressionsansatz für korrelierte binäre Zielvariablen aus demBereich �Generalized Estimation Equation� (GEE)Verwendet zwei Regressionsmodelle

• Generalisiertes Lineares Modell (GLM) für E�ekt von festenEin�ussgröÿen auf Zielvariable

• Modell für Odds Ratios innerhalb der Cluster(entspricht der �working correlation matrix� bei GEE)

[Carey et al., 1993]

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

Notation für ALRBinäre Zielvariablen Yij (j-te Beobachtung aus Cluster i,i = 1, . . . , m, j = 1, . . . , ni), Cluster unabhängig

• Ein�ussvariablen xij, Parametervektor β, Linkfunktion g(etwa g(u) = ln(u/1−u) = logit(u) → logistische Regression).

• Ein�ussvariablen zijk, Parametervektor α

ORi(j,k) =Pr(Yij = 0, Yik = 0) Pr(Yij = 1, Yik = 1)Pr(Yij = 1, Yik = 0) Pr(Yij = 0, Yik = 1)

Modellgleichungen ALR

g(Pr(Yij = 1)) = x′ijβ, j = 1, . . . , ni

ln(

ORi(j,k)

)= z′ijkα, j, k = 1, . . . , ni, j < k,

i = 1, . . . , m

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

Unabhängige ordinale Beobachtungen

[Moers, 1999]

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

Continuation Ratio Model (CRM)

Modell für ordinale Zufallsvariable YDiskrete Überlebenszeiten Hazardrate von Y ist

h(s) = Pr(Y = s | Y ≥ s).Cox [1972]:

h(s)1− h(s)

=h0(s)

1− h0(s)exp(x′β)

mit �baseline hazard� h0(s).Continuation Ratio model (Forward) Continuation Ratio

c(s) = 1− h(s) = Pr(Y > s | Y ≥ s)Modell

logit(c(s)) = βs + x′β

oder mit anderer Linkfunktion g

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

Likelihood für CRM

Ausprägungen von Y sind s = 1, . . . , C + 1.c(s) = Pr(Y ≥ s + 1 | Y ≥ s), s = 1, . . . , C, c(C + 1) := 0

Pr(Y = s) = Pr(Y ≥ 1, . . . , Y ≥ s, Y < s + 1)

Satz von der totalen Wahrscheinlichkeit

= Pr(Y ≥ 1) Pr(Y ≥ 2 | Y ≥ 1) Pr(Y ≥ 3 | Y ≥ 2, Y ≥ 1)× · · · × Pr(Y ≥ s | Y ≥ s− 1, . . . , Y ≥ 1)Pr(Y < s + 1 | Y ≥ s, . . . , Y ≥ 1)

= (1− c(s))s−1

∏t=1

c(t), s = 1, . . . , C + 1.

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

Berechnung des ML-Schätzers für CRM mittels »dataexpansion«

Seien Y1, . . . , Ym unabhängige ordinale ZVen.

• Für Analyse mit CRM erstelle von jeder Beobachtung (Yi, xi)Kopien mit bedingt unabhängigen Hilfsvariablen

Wi(s) =

{1, Yi > s0, Yi = s

, s = 1, . . . , min{C, Yi}

als binären Zielvariablen und identischen Ein�ussvariablen.

• Wende darauf GLM für unabhängige binäre Variablen an,wobei �Stadium� s weitere, kategorielle Ein�ussvariable ist(sorgt für Parameter βs).

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

Data expansion für Zielvariable mit vier Kategorien

Stadium Yi

s 1 2 3 4

Wi(1) 1 0 1 1 1Wi(2) 2 0 1 1Wi(3) 3 0 1

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

Zwei Beobachtungen pro Cluster

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

Odds Ratios für mehrere ordinale Zufallsvariablen

Outcomes Yij ∈ {1, . . . , C + 1}, i = 1, . . . , m, j = 1, . . . , ni

ORi(j,k)(s, t) =Pr(Yij = s, Yik = t) Pr(Yij > s, Yik > t)Pr(Yij > s, Yik = t) Pr(Yij = s, Yik > t)

i = 1, . . . , m, j, k = 1, . . . , ni, j < k, s, t = 1, . . . , C

�Clayton-Oakes cross-product ratios� [Heagerty and Zeger, 2000]

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

Beispiel aus MARSVerteilung der AMD-Stadien nach Auge

linkes rechtes Auge

Auge gesund früh spät Summe

gesund 181 73 5 259früh 47 302 79 428spät 10 87 89 186

Summe 238 462 173 873

OR(1, 1) =181(302 + 79 + 87 + 89)

(47 + 10)(73 + 5)≈ 22,7

OR(1, 2) =73(79 + 89)(302 + 87)5

≈ 6,3

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

Beispiel Mars, Odds Ratios

rechts, t

�roh� CRM+ALR

links, s 1 2 1 2

1 22,7 6,3 22,7 3,9(95% KI) (15,5�33,2) (2,5�15,9) (15,5�33,2) (2,7�5,6)

2 2,2 3,9 1,7 3,9(95% KI) (1,1�4,4) (2,7�5,8) (1,2�2,3) (2,6�5,8)

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

SAS-Code

PROC GENMOD DATA=crm DESCENDING;

CLASS id seite stage;

MODEL worse = seite stage seite*stage / DIST=BIN;

REPEATED SUBJECT=id / WITHINSUBJECT=seite*stage

LOGOR=ZREP( (1 2) 0 0 0 0, /* Links >1, Links >2 */

(1 3) 1 0 0 0, /* Links >1, Rechts>1 */

(1 4) 0 1 0 0, /* Links >1, Rechts>2 */

(2 3) 0 0 1 0, /* Links >2, Rechts>1 */

(2 4) 0 0 0 1, /* Links >2, Rechts>2 */

(3 4) 0 0 0 0); /* Rechts>1, Rechts>2 */

RUN;

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

Daten simulieren

• Vierfeldertafel: Aus Randhäu�gkeiten und Odds Ratio lassensich die einzelnen W.-keiten berechnen (Dale, 1986)

• �Random Walk� Starte mit gesundem Augenpaar,

• Generiere Indikator für �Verschlechterung links� und�Verschlechterung rechts� anhand der W.-keiten einerVierfeldertafel (s. o.) mit continuation ratios (alsRandwahrscheinlichkeiten) und Odds Ratio aus Modell.

• Generiere weitere Verschlechterungen, wenn zugelassen

• Stopp, wenn keine Verschlechterung mehr zugelassen

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

Beispiel für Simulationslauf

• Berechne Pr(Yi1 = 1, Yi2 = 1), Pr(Yi1 = 1, Yi2 > 1),Pr(Yi1 > 1, Yi2 = 1), Pr(Yi1 > 1, Yi2 > 1).

Erzeuge Wi1(1) und Wi2(1), etwa Wi1(1) = 0 undWi2(1) = 1. Damit liegt Yi1 = 1 fest.

• Brauche

Pr(Yi2 = 2 | Yi2 ≥ 2, Yi1 = 1) =Pr(Yi2 = 2, Yi1 = 1)

Pr(Yi1 = 1)

Pr(Yi2 > 2 | Yi2 ≥ 2, Yi1 = 1) =Pr(Yi2 > 2, Yi1 = 1)

Pr(Yi1 = 1)

Entscheide damit, ob weitere Verschlechterung von Yi2möglich ist

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

Mehr als zwei Beobachtungen pro Cluster

[Moers, 1999]

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

»Map data«

• Psychologisches Experiment mit m = 89 Kindern

• Versuchsaufbau: Eine Reihe von �Verstecken�, in einem istein Spielzeug. Alle Verstecke sind auf Karte eingezeichnet,inklusive Lage des Spielzeugs

• Exposition: 43 Kinder erhalten auf Kopf stehende Karte, 46korrekte Karte

• Outcome Y = s, Kind �ndet Spielzeug bei Versuchs ∈ {1, 2, 3}; Y = 4: Nicht erfolgreich in drei Versuchen

• ni = 10 Durchgänge pro Kind

• Frage: Ändert sich Erfolg mit Anzahl der Durchgänge?

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

Modell für log-Odds-Ratios, identisch für alle (j, k)

γi(j,k)(s, t) = ln(

ORi(j,k)(s, t))

j, k 1 2 3

s, t 1 2 3 1 2 3 1 2 3

1 • 0 0 γ(1, 1) γ(1, 2) γ(1, 3) γ(1, 1) γ(1, 2) γ(1, 3)1 2 • 0 γ(2, 1) γ(2, 2) γ(2, 3) γ(2, 1) γ(2, 2) γ(2, 3)

3 • γ(3, 1) γ(3, 2) γ(3, 3) γ(3, 1) γ(3, 2) γ(3, 3)

1 • 0 0 γ(1, 1) γ(1, 2) γ(1, 3)2 2 • 0 γ(2, 1) γ(2, 2) γ(2, 3)

3 • γ(3, 1) γ(3, 2) γ(3, 3)

1 • 0 03 2 • 0

3 •

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

SAS-Code für Z-MatrixSei n = maxi ni der Umfang des gröÿten Clusters

DATA zrep;

ARRAY z {〈C〉,〈C〉} z11 - zCC;

DO j=1 TO 〈n〉; DO s=1 TO 〈C〉;DO k=j TO 〈n〉; DO t=1 TO 〈C〉;

IF (t>s OR k>j) THEN DO;

DO u = 1 TO 〈C〉; DO v = 1 TO 〈C〉;IF k>j THEN z{u,v}=(u=s)*(v=t);

ELSE z{u,v}=0;

END; END;

OUTPUT;

END;

END; END;

END; END;

RUN;

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

Modellierung der map data

Modell für Outcome• Unterschiedliche Intercepts für Stadium• Quadratische Funktion von j = Nummer desDurchgangs

• Jeweils andere Parameter für Karte richtig herumund auf Kopf

Modelle für Odds Ratios1. γ(s, t) ≡ α2. γ(s, t) = α1 + α2

|s−t|3. γ(s, t) = γ(t, s)

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

Ergebnisse Modell 1

Heagerty/Zeger CRM-ALR

Schätzer StdErr Schätzer StdErr

r0.c1 0.219 0.163 0.219 0.164r0.c2 -0.283 0.194 -0.315 0.194r0.c3 -0.993 0.243 -1.131 0.239r0.trial 0.028 0.019 0.027 0.020r0.trial2 -0.010 0.010 -0.010 0.010r1.c1 -0.849 0.189 -0.859 0.190r1.c2 -0.923 0.171 -0.848 0.186r1.c3 -1.242 0.190 -1.186 0.205r1.trial 0.157 0.037 0.157 0.034r1.trial2 -0.004 0.011 -0.042 0.011Alpha1 0.577 0.123 0.583 0.133

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

Ergebnisse Modell 2

Heagerty/Zeger CRM-ALR

Schätzer StdErr Schätzer StdErr

r0.c1 0.219 0.163 0.218 0.164r0.c2 -0.282 0.194 -0.324 0.194r0.c3 -0.992 0.243 -1.134 0.241r0.trial 0.027 0.019 0.025 0.020r0.trial2 -0.010 0.010 -0.010 0.010r1.c1 -0.850 0.189 -0.863 0.191r1.c2 -0.923 0.171 -0.859 0.187r1.c3 -1.242 0.190 -1.195 0.207r1.trial 0.155 0.036 0.152 0.033r1.trial2 -0.044 0.011 -0.041 0.011Alpha1 0.547 0.132 0.525 0.138Alpha2 0.067 0.110 0.130 0.113

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

Ergebnisse Modell 3Heagerty/Zeger CRM-ALR

Schätzer StdErr Schätzer StdErr

r0.c1 0.224 0.163 0.225 0.164r0.c2 -0.278 0.194 -0.341 0.192r0.c3 -0.990 0.243 -1.102 0.217r0.trial 0.030 0.019 0.029 0.020r0.trial2 -0.010 0.010 -0.010 0.009r1.c1 -0.842 0.189 -0.844 0.190r1.c2 -0.992 0.171 -0.872 0.183r1.c3 -1.242 0.190 -1.180 0.194r1.trial 0.158 0.036 0.158 0.034r1.trial2 -0.004 0.011 -0.043 0.011Alpha1 0.759 0.165 0.795 0.169Alpha2 0.560 0.139 0.554 0.146Alpha3 0.449 0.163 0.432 0.171Alpha4 0.328 0.173 0.356 0.177Alpha5 0.597 0.167 0.616 0.170Alpha6 0.044 0.274 0.172 0.248

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

Wiederholte Erhebungen an Probanden (Augenpaaren)

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

Ausblick

• MARS erhebt Cluster (Augenpaare) drei mal

• Modelliere serielle Korrelation durch Markow-Modell: Statuszur letzten Ergebung ist Ein�ussvariable für aktuelle ErhebungErste Ergebung liefert somit keine Outcomes

• Da AMD irreversibel, fange Reiher der Indikatorvariablen fürVerschlechterung immer erst bei Stadium der letzten Erhebungan

• ALR-Teil wie bisher

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

Diskussion

• Modell interessant, da continuation ratios interpretierbar,besonders bei irreversibler Erkrankung

• Modell erweiterbar mit Wechselwirkungen Stadium ∗Ein�ussvariablen

• Programmierung mit Standardsoftware scheint praktikableApproximation an Heagerty and Zeger [2000] zu sein.

• Genaueres noch unklar

HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR

V. Carey, S. L. Zeger, and P. Diggle. Modelling multivariate binarydata with alternating logistic regressions. Biometrika, 80(3):517�526, 1993.

D. R. Cox. Regression models and life-tables (with discussion). J R

Statist Soc B, 34(2):187�220, 1972.

P. J. Heagerty and S. L. Zeger. Multivariate continuation ratiomodels: Connections and caveats. Biometrics, 56(3):719�732,Sept. 2000. doi: 10.1111/j.0006-341X.2000.00719.x.

W. Moers. Die 131/2 Leben des Käpt'n Blaubär. Eichborn Verlag,Frankfurt a.M., 1999. ISBN 3-8218-2969-9.