Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t...
Transcript of Life ablesT und Kaplan Meier - uni-due.de · Rechtszensiert, wenn t n=ti ; Episode beendet, wenn t...
EinführungNichtparametrische Verfahren
Life Tables und Kaplan Meier
9. Mai 2012
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Inhaltsverzeichnis
1 EinführungMathematische GrundlagenDer Datensatz
2 Nichtparametrische VerfahrenLife TablesKaplan Meier
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Mathematische GrundlagenDer Datensatz
Zusammenhänge
F (t) + S(t) = 1
P (T ≤ t) + P (T ≥ t) = P (Ω) = 1
∫ t
0f(u)du+
∫ ∞t
f(u)du =
∫ ∞0
f(u)du = 1
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Mathematische GrundlagenDer Datensatz
Dichtefunktion f(t)
0 2 4 6 80.0
0.1
0.2
0.3
0.4
0.5
fHxL
Abbildung: t=5Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Mathematische GrundlagenDer Datensatz
Verteilungsfunktion F (t)
0 2 4 6 80.0
0.2
0.4
0.6
0.8
1.0
FHxL
Abbildung: t=5Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Mathematische GrundlagenDer Datensatz
Survivalfunktion S(t)
0 2 4 6 80.0
0.2
0.4
0.6
0.8
1.0
SHxL
Abbildung: t=5Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Mathematische GrundlagenDer Datensatz
Datensatz
Die Beispiele orientieren sich an dem Lehrbuch
Blossfeld, H.-P.; Golsch, K. und Rohwer, G. (2007):
Event History Analysis With Stata. New York: Erlbaum.
Der verwendete Datensatz kann unter
http://web.uni-bamberg.de/sowi/soziologie-i/eha/stata/
heruntergeladen werden.
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Mathematische GrundlagenDer Datensatz
Variablen
Variable Beschreibung
id Identiziert jede einzelne Befragungsperson im Datensatznoj Laufende Nummer der Jobepisodetstart Anfangszeit der Jobepisode in Monaten seit Beginn des Jahrhunderts
(1=1900)tn Endzeit der Jobepisode in Monaten seit Beginn des Jahrhundertssex Geschlecht: 1=Männer, 2=Frauenti Interviewzeitpunkt in Monaten seit Beginn des Jahrhundertstb Geburtsdatumte Eintritt in den Arbeitsmarkt in Monaten seit Beginn des Jahrhundertstmar Eintritt in die Ehe in Monaten seit Beginn des Jahrhunderts,
0 wenn unverheiratetpres Prestigewert des Jobspresn Prestigewert des darauf folgenden Jobs, -1 falls kein weiterer Jobedu Höchster Bildungsabschluss vor Eintritt in den Arbeitsmarkt in Jahren
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Mathematische GrundlagenDer Datensatz
Beispiel: 1. Fall
list id noj tstart tn sex ti tb te tmar pres presn edu in 1/9, sepby(id)
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Mathematische GrundlagenDer Datensatz
Arbeitsvariablen
Erstellung der Variable des → für destination:des misst, ob eine Episode mit einem Ereignis endet oder eineRechtszensierung vorliegtRechtszensiert, wenn tn=ti ; Episode beendet, wenn tn ~= ti.
Erstellung der Variablen tf → für nish time:Bildet die Dierenz aus den Variablen tn und tstart.Auf diese Weise wird die Verweildauer in einer Jobepisode für jedeBefragungsperson in Monaten gemessen.
destination & nish time
gen des = tn ~= ti
gen tf = tn - tstart + 1
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Life TablesKaplan Meier
Einführung
Nichtparametrische Verfahren sind Verfahren, bei denen keineAnnahmen über die Verteilung der Wartezeit gemacht wird.
Hierzu zählen die Life-Table-Methode (Sterbetafelschätzung)als auch die Kaplan-Meier-Schätzung (Product-LimitEstimation).
Die Life-Table Methode hat ihren Ursprung in derDemographie und zählt zu den bekanntesten und lange Zeitbeliebtesten Methoden der Ereignisanalyse.
Der wesentlicher Unterschied zwischen diesen beidennichtparametrischen explorativen Verfahren ist, dass dieSterbetafel-Schätzung für gruppierte Wartezeiten und dieProdukt-Limit-Schätzung für exakte Wartezeiten konzipiert ist.
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Life TablesKaplan Meier
Life Table Methode: Verweildauer in Intervallen
Wie bereits erwähnt, sind bei der Life-Table Methode keineAnnahmen über die Verteilung von T notwendig.
Errechnet werden die Survivorfunktionen zu Beginn desjeweiligen Intervalls sowie für jedes Intervall die Dichte- undHazardfunktion (und deren Standardfehler).
Nachteile dieser Methode sind, dass diskrete Zeitintervallenötig sind und dass sie eine groÿe Anzahl an events benötigt,um reliabel zu sein.
Um die diskreten Intervalle zu erhalten, wird die Zeitachsepunktweise aufgesplittet.
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Life TablesKaplan Meier
Life Table Methode: Notation
Mit der Konvention: τL+1 =∞ existieren L Intervalle, von denenjedes die linke Grenze beinhaltet, aber nicht die Rechte.
Il = t|τl ≤ T < τl+1, l = 1, · · · , L
Terminologie:
Nl Zahl der Fälle, die in Intervall Il eintreten.
El Zahl der Ereignisse / Übergänge im Intervall Il,Ausfälle
Zl Zahl der Zensierungen im intervall IlRl Risk Set / Risikomenge im Intervall Il,noch lebende
Rl Zahl der Elemente in RlLife Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Life TablesKaplan Meier
Life Table Methode: Grundidee
Rekursive Bestimmung von Nl. Es gilt für das erste Intervall:
N1 = N
Für alle weiteren Intervalle
Nl = Nl−1 − El−1 − Zl−1
Zur Berechnung der Risikomenge sind nun Annahmen über dieVerteilung der zensierten Fälle während des Intervalls zu machen,normalerweise:
Rl = Nl −1
2Zl
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Life TablesKaplan Meier
Beispiel
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Life TablesKaplan Meier
Life Tables: Stata
Der Befehl, um Sterbetafeln in Stata zu berechnen lautetltable.
Einen Überblick könne wir uns mit help ltable verschaen.Der Befehl ltable tf des, intervals(30) su f h zerlegt die Zeit in30-Monats-Intervalle und führt zu 3 Tabellen. Die Optionenführen zu folgendem Output:
su → survival: Verteilungsfunktion derÜberlebenswahrscheinlichkeitenf → failure: Dichtefunktionh → hazard: Risikofunktion
Da Sterbetafeln recht unübersichtlich sein können, bietet essich an, die in ihnen enthaltene Information graphischdarzustellen.
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Life TablesKaplan Meier
Survival
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Life TablesKaplan Meier
Failure
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Life TablesKaplan Meier
Hazard
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Life TablesKaplan Meier
ltable tf des, intervals(30) gr
.1.2
.3.4
.5.6
Pro
port
ion
Sur
vivi
ng
0 100 200 300 400 500tf
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Life TablesKaplan Meier
ltable tf des, intervals(30) by(sex) gr
0.2
.4.6
0 500 0 500
1 2
Pro
port
ion
Sur
vivi
ng
tfGraphs by Geschlecht: 1=Männer, 2=Frauen
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Life TablesKaplan Meier
ltable tf des, intervals(30) by(sex) gr overlay
0.2
.4.6
Pro
port
ion
Sur
vivi
ng
0 100 200 300 400 500tf
sex = 1 sex = 2
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Life TablesKaplan Meier
ltable tf des, intervals(30) by(sex) gr overlay ci
0.2
.4.6
.8P
ropo
rtio
n S
urvi
ving
0 100 200 300 400 500tf
95% CI sex = 1sex = 2
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Life TablesKaplan Meier
Graph Editor / set scheme0
.2.4
.6.8
Pro
port
ion
Sur
vivi
ng
0 100 200 300 400 500tf
95% CI sex = 1sex = 2
0.2
.4.6
.8P
ropo
rtio
n S
urvi
ving
0 100 200 300 400 500tf
95% CI sex = 1sex = 2
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Life TablesKaplan Meier
Kaplan Meier
Der Unterschied zu der Life-Table Methode ist die direkteVerwendung der Wartezeiten.
Es ist also unnötig, eine Zusammenfassung der Zeit inIntervallen vorzunehmen.
Statt dessen wird die Risikomenge für jeden Zeitpunkt, an demein Ereignis statt ndet, berechnet.
Eine Sortierung der Zeitpunkte mit Ereignissen ist erforderlich:
τ1 < τ2 < τ3 < · · · < τL
wobei τ1 den Zeitpunkt bezeichnet, an dem das erste Ereignisstattndet, τ2 den Zeitpunkt, an dem das zweite Ereignisstandet, und so weiter.
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Life TablesKaplan Meier
Kaplan Meier: Notation
El Zahl der Episoden mit Ereignissen zum Zeitpunkt τl.
Zl Zahl der Zensierugen im Intervall [τl−1, τl)
Rl Gröÿe der Risikomenge zum Zeitpunkt τl, d.h.: Anzahl derEpisoden mit einer Startzeit τStart < τl und einer EndzeitτEnde ≥ τl. Also die Personen die noch leben
Es gilt für einen Zeitpunkt mit Ereignis:
ql =ElRl
pl = 1− ql = 1− ElRl
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Life TablesKaplan Meier
Product-Limit-Estimator
Der Product-Limit-Estimator für S(t) ist deniert als:
S(t) = p1 · p2 · p3 · · · · pl−1 =∏l:τl<t
pl =∏l:τl<t
1− ElRl
S(t) = (1− q0) · (1− q1) · (1− q2) · (1− q3)
S(t) =
(1− E0
R0
)·(
1− E1
R1
)·(
1− E2
R2
)·(
1− E3
R3
)Beispiel:
S(t) =
(1− 0
125
)·(1− 1
125
)·(1− 1
124
)·(1− 1
123
)·(1− 2
122
)·(1− 1
120
)
S(t) = 1 · 0, 992 · 0, 99194 · 0, 99187 · 0, 98361 · 0, 99167
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Life TablesKaplan Meier
Beispiel
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Life TablesKaplan Meier
Kaplan Meier in Stata
Um eine Kaplan-Meier Schätzung in Stata durchzuführen müssenwir Stata ein paar Angaben mitteilen.
Als Ereignisdaten deklarieren
stset tf, f(des)
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Life TablesKaplan Meier
Ereignisdatensatz denieren
Denieren über stset, Informationen durch stdes und stsum.
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Life TablesKaplan Meier
Kaplan Meier Schätzung
Der Stata Befehl für die Kaplan-Meier Schätzung lautet sts list
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Life TablesKaplan Meier
sts graph
0.00
0.25
0.50
0.75
1.00
0 100 200 300 400analysis time
Kaplan-Meier survival estimate
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Life TablesKaplan Meier
sts graph, by(sex)
0.00
0.25
0.50
0.75
1.00
0 100 200 300 400analysis time
sex = 1 sex = 2
Kaplan-Meier survival estimates
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Life TablesKaplan Meier
sts graph, by(sex) ci
0.2
5.5
.75
1
0 100 200 300 400analysis time
95% CI 95% CIsex = 1 sex = 2
Kaplan-Meier survival estimates
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Life TablesKaplan Meier
Signikanztests
Die Teststatistiken folgen nährungsweise einer χ2-Verteilung.
H0 geht davon aus, dass keine Unterschiede zwischen denSubgruppen bestehen.
H1 nimmt an, dass sich die Überlebensfunktionenunterscheiden.
Wilcoxon Test (Breslow) : sts test varlist, wilcoxonLog-Rank Test (Savage) : sts test varlist, logrank
Tarone-Ware Test : sts test varlist, twarePeto-Peto-Prentice Test : sts test varlist, petoFleming-Harrington Test : sts test varlist, fh()
Cox Test : sts test varlist, cox
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Life TablesKaplan Meier
sts test sex, wilcoxon / sts test sex, logrank
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Life TablesKaplan Meier
Testcharakteristiken
Abbildung: Unterschiedliche Sensitivität des Wilcoxon und Log-Rank Test
Aus Blossfeld, H.-P.; Golsch, K. und Rohwer, G. (2007): Event History Analysis With Stata. New York:
Erlbaum, S. 81
Life Tables und Kaplan Meier
EinführungNichtparametrische Verfahren
Life TablesKaplan Meier
Nachteile nichtparametrischer Verfahren
1 Bei vielen Subgruppen wird ng schnell so klein, dass einVergleich der Sg(t) nicht mehr sinnvoll ist.
2 Ist ng in den Subgruppen groÿ genug, so ist der Vergleich vonSg(t) schnell sehr komplex und die Interpretation äuÿerstschwierig.
3 Sollen metrische Variablen werden, ist es nötig diese zugruppieren, um die Survivorfunktionen schätzen zu können.Der potentielle Informationsverlust ist dementsprechend groÿ.
Life Tables und Kaplan Meier