Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t...

38

Transcript of Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t...

Page 1: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Life Tables und Kaplan Meier

9. Mai 2012

Life Tables und Kaplan Meier

Page 2: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Inhaltsverzeichnis

1 EinführungMathematische GrundlagenDer Datensatz

2 Nichtparametrische VerfahrenLife TablesKaplan Meier

Life Tables und Kaplan Meier

Page 3: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Mathematische GrundlagenDer Datensatz

Zusammenhänge

F (t) + S(t) = 1

P (T ≤ t) + P (T ≥ t) = P (Ω) = 1

∫ t

0f(u)du+

∫ ∞t

f(u)du =

∫ ∞0

f(u)du = 1

Life Tables und Kaplan Meier

Page 4: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Mathematische GrundlagenDer Datensatz

Dichtefunktion f(t)

0 2 4 6 80.0

0.1

0.2

0.3

0.4

0.5

fHxL

Abbildung: t=5Life Tables und Kaplan Meier

Page 5: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Mathematische GrundlagenDer Datensatz

Verteilungsfunktion F (t)

0 2 4 6 80.0

0.2

0.4

0.6

0.8

1.0

FHxL

Abbildung: t=5Life Tables und Kaplan Meier

Page 6: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Mathematische GrundlagenDer Datensatz

Survivalfunktion S(t)

0 2 4 6 80.0

0.2

0.4

0.6

0.8

1.0

SHxL

Abbildung: t=5Life Tables und Kaplan Meier

Page 7: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Mathematische GrundlagenDer Datensatz

Datensatz

Die Beispiele orientieren sich an dem Lehrbuch

Blossfeld, H.-P.; Golsch, K. und Rohwer, G. (2007):

Event History Analysis With Stata. New York: Erlbaum.

Der verwendete Datensatz kann unter

http://web.uni-bamberg.de/sowi/soziologie-i/eha/stata/

heruntergeladen werden.

Life Tables und Kaplan Meier

Page 8: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Mathematische GrundlagenDer Datensatz

Variablen

Variable Beschreibung

id Identiziert jede einzelne Befragungsperson im Datensatznoj Laufende Nummer der Jobepisodetstart Anfangszeit der Jobepisode in Monaten seit Beginn des Jahrhunderts

(1=1900)tn Endzeit der Jobepisode in Monaten seit Beginn des Jahrhundertssex Geschlecht: 1=Männer, 2=Frauenti Interviewzeitpunkt in Monaten seit Beginn des Jahrhundertstb Geburtsdatumte Eintritt in den Arbeitsmarkt in Monaten seit Beginn des Jahrhundertstmar Eintritt in die Ehe in Monaten seit Beginn des Jahrhunderts,

0 wenn unverheiratetpres Prestigewert des Jobspresn Prestigewert des darauf folgenden Jobs, -1 falls kein weiterer Jobedu Höchster Bildungsabschluss vor Eintritt in den Arbeitsmarkt in Jahren

Life Tables und Kaplan Meier

Page 9: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Mathematische GrundlagenDer Datensatz

Beispiel: 1. Fall

list id noj tstart tn sex ti tb te tmar pres presn edu in 1/9, sepby(id)

Life Tables und Kaplan Meier

Page 10: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Mathematische GrundlagenDer Datensatz

Arbeitsvariablen

Erstellung der Variable des → für destination:des misst, ob eine Episode mit einem Ereignis endet oder eineRechtszensierung vorliegtRechtszensiert, wenn tn=ti ; Episode beendet, wenn tn ~= ti.

Erstellung der Variablen tf → für nish time:Bildet die Dierenz aus den Variablen tn und tstart.Auf diese Weise wird die Verweildauer in einer Jobepisode für jedeBefragungsperson in Monaten gemessen.

destination & nish time

gen des = tn ~= ti

gen tf = tn - tstart + 1

Life Tables und Kaplan Meier

Page 11: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Life TablesKaplan Meier

Einführung

Nichtparametrische Verfahren sind Verfahren, bei denen keineAnnahmen über die Verteilung der Wartezeit gemacht wird.

Hierzu zählen die Life-Table-Methode (Sterbetafelschätzung)als auch die Kaplan-Meier-Schätzung (Product-LimitEstimation).

Die Life-Table Methode hat ihren Ursprung in derDemographie und zählt zu den bekanntesten und lange Zeitbeliebtesten Methoden der Ereignisanalyse.

Der wesentlicher Unterschied zwischen diesen beidennichtparametrischen explorativen Verfahren ist, dass dieSterbetafel-Schätzung für gruppierte Wartezeiten und dieProdukt-Limit-Schätzung für exakte Wartezeiten konzipiert ist.

Life Tables und Kaplan Meier

Page 12: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Life TablesKaplan Meier

Life Table Methode: Verweildauer in Intervallen

Wie bereits erwähnt, sind bei der Life-Table Methode keineAnnahmen über die Verteilung von T notwendig.

Errechnet werden die Survivorfunktionen zu Beginn desjeweiligen Intervalls sowie für jedes Intervall die Dichte- undHazardfunktion (und deren Standardfehler).

Nachteile dieser Methode sind, dass diskrete Zeitintervallenötig sind und dass sie eine groÿe Anzahl an events benötigt,um reliabel zu sein.

Um die diskreten Intervalle zu erhalten, wird die Zeitachsepunktweise aufgesplittet.

Life Tables und Kaplan Meier

Page 13: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Life TablesKaplan Meier

Life Table Methode: Notation

Mit der Konvention: τL+1 =∞ existieren L Intervalle, von denenjedes die linke Grenze beinhaltet, aber nicht die Rechte.

Il = t|τl ≤ T < τl+1, l = 1, · · · , L

Terminologie:

Nl Zahl der Fälle, die in Intervall Il eintreten.

El Zahl der Ereignisse / Übergänge im Intervall Il,Ausfälle

Zl Zahl der Zensierungen im intervall IlRl Risk Set / Risikomenge im Intervall Il,noch lebende

Rl Zahl der Elemente in RlLife Tables und Kaplan Meier

Page 14: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Life TablesKaplan Meier

Life Table Methode: Grundidee

Rekursive Bestimmung von Nl. Es gilt für das erste Intervall:

N1 = N

Für alle weiteren Intervalle

Nl = Nl−1 − El−1 − Zl−1

Zur Berechnung der Risikomenge sind nun Annahmen über dieVerteilung der zensierten Fälle während des Intervalls zu machen,normalerweise:

Rl = Nl −1

2Zl

Life Tables und Kaplan Meier

Page 15: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Life TablesKaplan Meier

Beispiel

Life Tables und Kaplan Meier

Page 16: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Life TablesKaplan Meier

Life Tables: Stata

Der Befehl, um Sterbetafeln in Stata zu berechnen lautetltable.

Einen Überblick könne wir uns mit help ltable verschaen.Der Befehl ltable tf des, intervals(30) su f h zerlegt die Zeit in30-Monats-Intervalle und führt zu 3 Tabellen. Die Optionenführen zu folgendem Output:

su → survival: Verteilungsfunktion derÜberlebenswahrscheinlichkeitenf → failure: Dichtefunktionh → hazard: Risikofunktion

Da Sterbetafeln recht unübersichtlich sein können, bietet essich an, die in ihnen enthaltene Information graphischdarzustellen.

Life Tables und Kaplan Meier

Page 17: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Life TablesKaplan Meier

Survival

Life Tables und Kaplan Meier

Page 18: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Life TablesKaplan Meier

Failure

Life Tables und Kaplan Meier

Page 19: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Life TablesKaplan Meier

Hazard

Life Tables und Kaplan Meier

Page 20: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Life TablesKaplan Meier

ltable tf des, intervals(30) gr

.1.2

.3.4

.5.6

Pro

port

ion

Sur

vivi

ng

0 100 200 300 400 500tf

Life Tables und Kaplan Meier

Page 21: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Life TablesKaplan Meier

ltable tf des, intervals(30) by(sex) gr

0.2

.4.6

0 500 0 500

1 2

Pro

port

ion

Sur

vivi

ng

tfGraphs by Geschlecht: 1=Männer, 2=Frauen

Life Tables und Kaplan Meier

Page 22: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Life TablesKaplan Meier

ltable tf des, intervals(30) by(sex) gr overlay

0.2

.4.6

Pro

port

ion

Sur

vivi

ng

0 100 200 300 400 500tf

sex = 1 sex = 2

Life Tables und Kaplan Meier

Page 23: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Life TablesKaplan Meier

ltable tf des, intervals(30) by(sex) gr overlay ci

0.2

.4.6

.8P

ropo

rtio

n S

urvi

ving

0 100 200 300 400 500tf

95% CI sex = 1sex = 2

Life Tables und Kaplan Meier

Page 24: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Life TablesKaplan Meier

Graph Editor / set scheme0

.2.4

.6.8

Pro

port

ion

Sur

vivi

ng

0 100 200 300 400 500tf

95% CI sex = 1sex = 2

0.2

.4.6

.8P

ropo

rtio

n S

urvi

ving

0 100 200 300 400 500tf

95% CI sex = 1sex = 2

Life Tables und Kaplan Meier

Page 25: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Life TablesKaplan Meier

Kaplan Meier

Der Unterschied zu der Life-Table Methode ist die direkteVerwendung der Wartezeiten.

Es ist also unnötig, eine Zusammenfassung der Zeit inIntervallen vorzunehmen.

Statt dessen wird die Risikomenge für jeden Zeitpunkt, an demein Ereignis statt ndet, berechnet.

Eine Sortierung der Zeitpunkte mit Ereignissen ist erforderlich:

τ1 < τ2 < τ3 < · · · < τL

wobei τ1 den Zeitpunkt bezeichnet, an dem das erste Ereignisstattndet, τ2 den Zeitpunkt, an dem das zweite Ereignisstandet, und so weiter.

Life Tables und Kaplan Meier

Page 26: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Life TablesKaplan Meier

Kaplan Meier: Notation

El Zahl der Episoden mit Ereignissen zum Zeitpunkt τl.

Zl Zahl der Zensierugen im Intervall [τl−1, τl)

Rl Gröÿe der Risikomenge zum Zeitpunkt τl, d.h.: Anzahl derEpisoden mit einer Startzeit τStart < τl und einer EndzeitτEnde ≥ τl. Also die Personen die noch leben

Es gilt für einen Zeitpunkt mit Ereignis:

ql =ElRl

pl = 1− ql = 1− ElRl

Life Tables und Kaplan Meier

Page 27: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Life TablesKaplan Meier

Product-Limit-Estimator

Der Product-Limit-Estimator für S(t) ist deniert als:

S(t) = p1 · p2 · p3 · · · · pl−1 =∏l:τl<t

pl =∏l:τl<t

1− ElRl

S(t) = (1− q0) · (1− q1) · (1− q2) · (1− q3)

S(t) =

(1− E0

R0

)·(

1− E1

R1

)·(

1− E2

R2

)·(

1− E3

R3

)Beispiel:

S(t) =

(1− 0

125

)·(1− 1

125

)·(1− 1

124

)·(1− 1

123

)·(1− 2

122

)·(1− 1

120

)

S(t) = 1 · 0, 992 · 0, 99194 · 0, 99187 · 0, 98361 · 0, 99167

Life Tables und Kaplan Meier

Page 28: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Life TablesKaplan Meier

Beispiel

Life Tables und Kaplan Meier

Page 29: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Life TablesKaplan Meier

Kaplan Meier in Stata

Um eine Kaplan-Meier Schätzung in Stata durchzuführen müssenwir Stata ein paar Angaben mitteilen.

Als Ereignisdaten deklarieren

stset tf, f(des)

Life Tables und Kaplan Meier

Page 30: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Life TablesKaplan Meier

Ereignisdatensatz denieren

Denieren über stset, Informationen durch stdes und stsum.

Life Tables und Kaplan Meier

Page 31: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Life TablesKaplan Meier

Kaplan Meier Schätzung

Der Stata Befehl für die Kaplan-Meier Schätzung lautet sts list

Life Tables und Kaplan Meier

Page 32: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Life TablesKaplan Meier

sts graph

0.00

0.25

0.50

0.75

1.00

0 100 200 300 400analysis time

Kaplan-Meier survival estimate

Life Tables und Kaplan Meier

Page 33: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Life TablesKaplan Meier

sts graph, by(sex)

0.00

0.25

0.50

0.75

1.00

0 100 200 300 400analysis time

sex = 1 sex = 2

Kaplan-Meier survival estimates

Life Tables und Kaplan Meier

Page 34: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Life TablesKaplan Meier

sts graph, by(sex) ci

0.2

5.5

.75

1

0 100 200 300 400analysis time

95% CI 95% CIsex = 1 sex = 2

Kaplan-Meier survival estimates

Life Tables und Kaplan Meier

Page 35: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Life TablesKaplan Meier

Signikanztests

Die Teststatistiken folgen nährungsweise einer χ2-Verteilung.

H0 geht davon aus, dass keine Unterschiede zwischen denSubgruppen bestehen.

H1 nimmt an, dass sich die Überlebensfunktionenunterscheiden.

Wilcoxon Test (Breslow) : sts test varlist, wilcoxonLog-Rank Test (Savage) : sts test varlist, logrank

Tarone-Ware Test : sts test varlist, twarePeto-Peto-Prentice Test : sts test varlist, petoFleming-Harrington Test : sts test varlist, fh()

Cox Test : sts test varlist, cox

Life Tables und Kaplan Meier

Page 36: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Life TablesKaplan Meier

sts test sex, wilcoxon / sts test sex, logrank

Life Tables und Kaplan Meier

Page 37: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Life TablesKaplan Meier

Testcharakteristiken

Abbildung: Unterschiedliche Sensitivität des Wilcoxon und Log-Rank Test

Aus Blossfeld, H.-P.; Golsch, K. und Rohwer, G. (2007): Event History Analysis With Stata. New York:

Erlbaum, S. 81

Life Tables und Kaplan Meier

Page 38: Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t n ~= ti . Erstellung der Variablen tf !für nish time : Bildet die Di erenz aus

EinführungNichtparametrische Verfahren

Life TablesKaplan Meier

Nachteile nichtparametrischer Verfahren

1 Bei vielen Subgruppen wird ng schnell so klein, dass einVergleich der Sg(t) nicht mehr sinnvoll ist.

2 Ist ng in den Subgruppen groÿ genug, so ist der Vergleich vonSg(t) schnell sehr komplex und die Interpretation äuÿerstschwierig.

3 Sollen metrische Variablen werden, ist es nötig diese zugruppieren, um die Survivorfunktionen schätzen zu können.Der potentielle Informationsverlust ist dementsprechend groÿ.

Life Tables und Kaplan Meier