Projekt I Deskription eines klinischen Datensatzesduerre/BerichtAlexander.pdf · 3.1 Auf Momente...

24
Dozenten: Prof. Dr. Christine M¨ uller Dipl.-Math. Liesa Denecke Fallstudien I (SoSe 2010) Projekt I Deskription eines klinischen Datensatzes Autor: Alexander D¨ urre 24. April 2010 in Zusammenarbeit mit: Johanna Buncke, Nils Goeken und Thomas Lehmann

Transcript of Projekt I Deskription eines klinischen Datensatzesduerre/BerichtAlexander.pdf · 3.1 Auf Momente...

Dozenten:

Prof. Dr. Christine Muller

Dipl.-Math. Liesa Denecke

Fallstudien I (SoSe 2010)

Projekt I

Deskription eines klinischen Datensatzes

Autor: Alexander Durre

24. April 2010

in Zusammenarbeit mit: Johanna Buncke, Nils Goeken und Thomas

Lehmann

Inhaltsverzeichnis

1 Einleitung 1

2 Problemstellung 1

2.1 Datenmaterial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

2.2 Untersuchungsziele . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

3 Statistische Methoden 2

3.1 Auf Momente basierende statistische Kennzahlen . . . . . . . . . . . 3

3.2 Robuste Kennzahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

3.3 Zusammenhangsmaße . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

3.4 Grafische Darstellungen . . . . . . . . . . . . . . . . . . . . . . . . . 6

3.5 Schiefetransformationen . . . . . . . . . . . . . . . . . . . . . . . . . 7

4 Statistische Auswertung 7

4.1 Gute der Randomisation . . . . . . . . . . . . . . . . . . . . . . . . . 7

4.2 Korrelation zwischen Bilirubin- und Alkaline Phosphate-Werten vor

der OP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

4.3 Zusammenhang zwischen Leberwerten vor der Operation und Alter . 9

4.4 Transformationen zu normalverteilten Leberwerten . . . . . . . . . . 10

4.5 Wirkung des Medikaments . . . . . . . . . . . . . . . . . . . . . . . . 11

4.6 Abhangigkeit zwischen Medikamentenwirkung und Alter . . . . . . . 12

5 Zusammenfassung 12

A Anhang i

A.1 Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . i

A.2 R-Code . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ii

1 Einleitung

Ungewohnliche hohe Konzentrationen des Pigments Bilirubin und des Proteins Alka-

line Phosphatase im Blut konnen auf das Vorliegen eines Verschlusses des Gallengan-

ges hindeuten (Pelligrini et al., 1982). Im Folgenden wird die Konzentration dieser

chemischen Elemente vor und nach einer Gallenoperation sowie der Einfluss eines

Medikaments untersucht. Neben verschiedenen grafischen Darstellungen wie Box-

plots und Histogrammen werden Lage- und Streuungsmaße auf die Werte vor und

nach der Operation sowie auf verschiedene Teilgruppen, die durch Geschlecht, Alter

und Art des Medikaments charakterisiert werden, angewendet. Außerdem werden

mogliche Abhangigkeiten zwischen Alter, Leberwerten und Medikamentenwirkung

mit Hilfe von Zusammenhangsmaßen betrachtet.

Im ersten Kapitel werden die zu untersuchenden Fragestellungen umrissen sowie

das Datenmaterial der Studie vorgestellt. Verwendete statistische Kennzahlen und

grafische Darstellungen werden im zweiten Abschnitt vorgestellt, bevor im dritten

Teil die Daten schließlich analysiert werden. Im vierten Kapitel werden neben einer

Zusammenfassung weitere mogliche zu untersuchende Fragen aufgeworfen.

2 Problemstellung

2.1 Datenmaterial

Die in dem Bericht genutzten Daten entstammen einer klinischen Studie aus dem

Jahre 1980, die die Wirksamkeit eines medizinischen Praperates untersuchen sollte.

Dazu wurden 20 Patienten mit einem Gallengangsverschluss ausgewahlt. Ihnen wur-

de einmalig nach der notwendigen Operation zufallig entweder das Medikament oder

ein Placebo verabreicht. Durch diese Randomisiation wurde versucht, den Einfluss

der Storeffekte wie Alter und Geschlecht zu minimieren. Die protokollierten Leber-

werte vor und zehn Tage nach der Operation bilden eine verbundene Stichprobe.

Dieser Bericht konzentriert sich nur auf die damals gemessenen Alkaline Phosphatase-

und Bilirubinwerte, die sehr aufschlussreiche Indikatoren fur einen Gallengangsver-

schluss sind (Pelligrini et al., 1982). In Tabelle 1 sind alle erfassten univariaten

Merkmale dargestellt.

Die Messung der Leberwerte erfolgt in klinischen Laboren. Eine Messungenaugikeit

1

Merkmal Merkmalstyp Skalentyp Einheit Auspragungen

Patientennummer nominal Nominal - N

Geburtsjahr diskret Intervall Jahr N

Geschlecht nominal Nominal - m / w

Behandlungsgruppe nominal Nominal - Medikament

/ Placebo

Messzeitpunkt ordinal Ordinal - vor / nach OP

Bilirubin-Wert stetig Verhaltnis mg/dL R+

Alkaline-

Phosphatase-Wert

stetig Verhaltnis IU/L R+

Tabelle 1: Die beobachteten Merkmale und ihre Eigenschaften

muss bei Bilirubin (Rosenthal et al., 1990) wie auch bei Alkaline Phosphatase (Lott

et al., 1978) berucksichtigt werden.

2.2 Untersuchungsziele

Der Datensatz soll unter folgenden Gesichtspunkten deskriptiv untersucht werden:

• Gute der Randomisation der Studie

• Korrelation zwischen Bilirubin- und Alkaline Phosphate-Werten vor der OP

• Zusammenhang zwischen Leberwerten vor der Operation und Alter

• Transformationen zu normalverteilten Leberwerten

• Wirkung des Medikaments

• Abhangigkeit zwischen Medikamentenwirkung und Alter der Probanden

3 Statistische Methoden

Im ersten Teil werden die verschieden robusten statistischen Kennzahlen, mit denen

der Datensatz deskriptiv ausgewertet wird, vorgestellt, im zweiten Abschnitt die

2

angewendeten grafischen Darstellungen und zum Ende eine Transformation, um die

Schiefe einer Stichprobe zu korrigieren. Im Folgenden bezeichne x = x1, . . . , xn eine

Stichprobe, n die Stichprobengroße und x(1) . . . x(n) die geordnete Statistik.

3.1 Auf Momente basierende statistische Kennzahlen

Lage, Streuung, Schiefe und Wolbung einer empirischen Verteilung konnen mit Hilfe

von Momenten berechnet werden. Sie sind damit gut mit den theoretischen Para-

metern Erwartungswert und Varianz der Wahrscheinlichkeitstheorie vegleichbar. Ein

Nachteil besteht jedoch in der Anfalligkeit der Kennzahlen fur Ausreißer, die mit

steigendem verwendeten Moment zunimmt.

Das Lagemaß arithmetisches Mittel (R-Befehl: mean(x))

x =1

n

n∑i=1

xi (1)

stellt das erste unzentrierte Moment dar. Zur Bestimmung der Streuung einer Stich-

probe, kann die empirische Varianz (R-Befehl: var(x))

s2(x) =1

n− 1

n∑i=1

(xi − x)2 (2)

(bis auf einen Vorfaktor das zweite zentrierte Moment) verwendet werden. Zur bes-

seren Interpretierbarkeit wird haufig die Standardabweichung (R-Befehl: sd(x))

s =√s2 betrachtet. Die Symmetrie einer Verteilung kann uber den Momentenko-

effizienten der Schiefe (R-Befehl: Schiefe(x); eigene Funktion, siehe Anhang)

skm(x) =

(1

n

n∑i=1

(xi − x)3

)/s3 (3)

charakterisiert werden. Dabei gilt, dass bei Symmetrie der Wert 0 angenommen

wird. Ist skm > 0, so spricht man von einer linkssteilen, bei skm < 0 von einer

rechtssteilen Verteilung (Fahrmeir et al., 2007, S. 75). Ein betragsmaßig großer Wert

spricht gegen das Vorliegen einer bekanntermaßen symmetrischen Normalverteilung

(Hartung, 2005, S. 49). Die Wolbung beschreibt, wie viele Beobachtungen an den

Randern (also im weitesten Sinne Ausreißer) vorliegen. Das Wolbungsmaß von

Fisher (R-Befehl: Wolbung(x); eigene Funktion, siehe Anhang)

km(x) =

(1

n

n∑i=1

(xi − x)4

)/s4 − 3 (4)

3

basiert auf dem vierten zentrierten Moment. Es ist durch die Normalverteilung nor-

miert, fur spitzere Verteilungen ist km positiv, fur flachere nimmt km negative Werte

an (Fahrmeir et al., 2007, S. 76). Wieder spricht eine betragsmaßig große Wolbung

gegen eine Normalverteilung (Hartung, 2005, S. 49).

3.2 Robuste Kennzahlen

Auf Momenten beruhende Maßzahlen konnen schon durch die Veranderung eines

einzigen Wertes beliebig manipuliert werden. Wie viele Manipulationen im Vegleich

zur Stichprobengroße eine Kennzahl vertragt, beschreibt der Bruchpunkt ε. Ein Wert

von 0 bedeutet deshalb keine Resistenz gegen Ausreißer (Hartung, 2005, S.864). Im

Folgenden sollen deshalb robustere Kennzahlen betrachtet werden.

Das p-Quantil (R-Befehl: quantile(x,p,type=2)

xp =

x[np]+1 , falls np ∈ N0

12(x(n/2) + x((n+2)/2)) , falls np /∈ N0

0 < p < 1 (5)

beschreibt den Wert, bei dem p · 100% der Beobachtungen kleiner und (1 − p) ·

100% der Beobachtungen großer sind. Der Bruchpunkt ε hangt von p ab: ε =p p ≤ 0.5

1− p p > 0.5

. Alle folgenden uber Quantile konstruierte Parameter ubernehmen

den Bruchpunkt, von ihrem”anfalligsten“ Quantil. Der Median (R-Befehl: medi-

an(x)) ist das 0.5-Quantil und eine robuste Alternative zu x (1). Eine Moglichkeit

die Streuung einer Stichprobe anzugeben, ist der Quartilsabstand

dQ = x0.75 − x0.25 (6)

mit ε = 0.25. Der MAD (R-Befehl: mad(x,constant=1))

MAD = Median(|xi − x0.5|) · 1.2826 (7)

ist mit ε = 0.5 noch resistenter (Hartung, 2005, S. 865) und stellt den medianen

betragsmaßigen Abstand der Beobachtungen zum Median dar. Der Quantilsko-

effizient der Schiefe (R-Funktion: Schiefe(x,p,robust=TRUE); eigene Funktion,

siehe Anhang)

skp(x) =x1−p + xp − 2x0.5

x1−p − xp, p ∈

(0,

1

2

)(8)

4

uberpruft die symmetrische Lage von xp und x1−p zu x0.5. Die Interpretation ent-

spricht der des Momentenkoeffizienten (3). Auch die Kurtosis kann robust beschrie-

ben werden. Das Wolbungsmaß nach Moors (R-Befehl: Wolbung(x,robust=TRUE);

eigene Funktion, siehe Anhang)

kp(x) =x0.875 − x0.625 + x0.375 − x0.125

x0.75 − x0.25

− 1.23 (9)

ist ebenfalls zur Normalverteilung normiert und besitzt deshalb die gleiche Interpre-

tation wie das Wolbungsmaß nach Fisher (4) (Kim und White, 2003).

3.3 Zusammenhangsmaße

Fur mehrdimensionale qualitative oder diskrete Daten stellt der Kontingenzkoef-

fizient

K =

√χ2

χ2 + n(10)

ein Maß fur die Abhangigkeit zwischen den Variablen dar. Er berechnet sich uber

den unnormierten und deshalb schwer interpretierbaren χ2-Koeffizient (R-Befehl:

chisq.test(x,correct=FALSE)$statistic)

χ2 =k∑i=1

m∑j=1

(hij −

hi.h.jn

)2

/

(hi.h.jn

)(11)

. Dabei bezeichnet hij die relativen Haufigkeiten, hi. die relativen Zeilen- und h.j

die relativen Spaltenhaufigkeiten. Der Kontingenzkoeffizient liegt zwischen 0 und√M−1M

, wobei M das Minimum aus Spalten- und Zeilenanzahl der zugehorigen Kon-

tingenztafel ist. Je großer der Koeffizient ausfallt, umso großer ist die Abhangigkeit

zwischen den einzelnen Variablen. Die Maßzahl gibt keine Aussage uber die Art des

Zusammenhangs an (Fahrmeir et al., 2007, S. 125).

Fur zweidimensionale mindestens ordinale Merkmale uberpruft der Korrelations-

koeffizent von Spearman (R-Befehl: cov(x,method=“spearman“))

rsp(x, y) =

n∑i=1

(rg(xi)− rg(x)(rg(yi)− rg(y)√n∑i=1

(rg(xi)− rg(x))2n∑j=1

(rg(yj)− rg(y))2

, rg(x(i)) = i (12)

die Daten auf einen monotonen Zusammenhang. Dabei liegt rsp zwischen −1 (ne-

gativer monotoner Zusammenhang) und 1 (positiver monotoner Zusammenhang)

5

(Fahrmeir et al., 2007, S. 143). Im Gegensatz zum Korrelationskoeffizienten von

Bravais-Pearson ist der von Spearman resistent gegenuber Ausreißern.

3.4 Grafische Darstellungen

Der Boxplot (R-Befehl: boxplot(x)) stellt uber die Quartile (inklusive Minimum

und Maximum) Lage, Streuung und Schiefe der Daten auf einen Blick dar. Außer-

dem werden Beobachtungen, deren Lage sich stark von der der ubrigen unterscheidet

(xi /∈ [x0.25− 1.5dQ, x0.75 + 1.5dQ]) als Ausreißer identifiziert (Chambers et al., 1983,

S. 21-22).

Im Histogramm (R Befehl: hist(x,freq=FALSE)) werden die Beobachtungen in

mehrere Klassen (als Orientierung gilt: [√n]) eingeteilt. Fur jede Klasse wird die

Haufigkeitsdichte (relative Haufigkeit/Klassenbreite) auf der y-Achse abgetragen.

Im Allgemeinen besitzt das Histogramm mehr Informationsgehalt als ein Boxplot.

Allerdings sind Lage, Schiefe und Streuung der Beobachtungen schwerer herauszu-

lesen und das Erscheinungsbild hangt stark von den individuell gewahlten Klassen

ab (Chambers et al., 1983, S. 24).

Um einen ersten Eindruck uber Zusammenhange zwischen zwei metrischen Varia-

blen zu gewinnen, verwendet man ein Streudiagramm (R-Befehl: plot(x,y)). In

ihm werden die Beobachtungen wie in ein Koordinatensystem eingezeichnet. Damit

konnen strukturelle Zusammenhange unterschiedlichster Art (nicht nur monoton)

erkannt werden (Chambers et al., 1983, S. 76-86).

Der theoretische Q-Q-Plot (R-Befehl:qqnorm(x) fur Vergleich mit Normalvertei-

lung) dient der Uberprufung von Verteilungsannahmen an die Stichprobe. Die empi-

rischen Quantile werden gegen die theoretischen Quantile der vermuteten Verteilung

abgetragen. Bei Zutreffen der Vermutung mussten die sich so ergebenen Punkte auf

einer Linie befinden. Liegt ein kleiner Teil der ersten Punkte unter der Geraden be-

ziehungsweise ein kleiner Teil der letzten Punkte oberhalb der Geraden, so spricht

dies fur Ausreißer. Zeigen mehrere Randpunkte dieses Verhalten, so deutet das auf

eine Verteilung mit schwereren Randern hin. Eine Kurve im Diagramm spricht fur

Asymmetrie, eine Welle fur zwei sich uberlagernde Verteilungen mit unterschiedli-

cher Lage (Chambers et al., 1983, S. 197-212).

6

3.5 Schiefetransformationen

Asymmetrische Verteilungen konnen meist mit Hilfe einer Potenzfunktion der Form

y(x)θ =

xθ θ > 0

log(x) θ = 0

(13)

symmetrisch transformiert werden, wobei θ ∈ [0, 1) fur linkssteile und θ > 1 fur

die selteneren rechtssteile Verteilungen benutzt wird. Zur Bestimmung von θ gibt

es verschiedene Ansatze. Unter der Voraussetzung, dass ein θ existiert, so dass die

transformierte Stichprobe einer Normalverteilung entstammt, liefert nach Box und

Cox

θBC = argmaxθ

(−n2

log(2πσ2(y(x)θ))−n

2+ n log |θ|+ (θ − 1)

n∑j=1

log |yj|

)(14)

den gewunschten Parameter (Chambers et al., 1983, S.214f). Robuster (und ohne

Normalverteilungsannahme praktikabel) ist der Ansatz von Hinkley uber die Quan-

tile. Die Losung der Gleichung(xpx0.5

)θ+

(x1−p

x0.5

)θ= 2 (15)

entspricht dem gesuchten θ := θH (Hinkley, 1975). Beide Gleichungen lassen sich

nur numerisch losen. Im Anhang findet sich eine geeignete R-Funktion.

4 Statistische Auswertung

Die im zweiten Kapital aufgeworfenen Fragen sollen nun mit Hilfe der im dritten Ab-

schnitt eingefuhrten Methoden und der Statistik-Software R 2.6.0 (R Development

Core Team, 2007) beantwortet werden.

4.1 Gute der Randomisation

Notwendig fur die Einschatzung der Wirkung des Praperates ist eine gute Rando-

misierung und damit eine Minimierung des Einflusses der Storvariablen. Auf den

ersten Blick erscheint der Frauenanteil (15 von 20) in der Stichprobe ungewohnlich

7

hoch zu sein. Er lasst sich jedoch durch eine hohere weibliche Pravelenz fur Gallen-

steinleiden erklaren (Stechemesser, 2007). Dass Frauen und Manner den Gruppen

zufallig zugeteilt wurde, zeigt der (bei dieser Anzahl an weiblichen und mannlichen

Probanden) kleinstmogliche Kontingenzkoeffizient von 0.11. Auch bezuglich des Al-

ters scheint die Randomisierung gut gelungen zu sein. Das arithmetische Mittel der

Medikamentengruppe ist mit 1912.1 Jahren zu dem der Kontrollgruppe mit 1912.7

Jahren nahezu identisch. Die Streuung der Placebogruppe mittels der Standardab-

weichung ist mit 14.0 zu 10.7 Jahren jedoch etwas großer.

Wichtig fur die Bewertung des Arzneimittels sind ahnliche vor-OP-Leberwerte der

Medikamenten- und Kontrollgruppe. Der Tabelle 2 ist zu entnehmen, dass sowohl

der Mittelwerte als auch die Streuung der Alkaline Phosphatase und der Bilirubin-

Werte in der Medikamentengruppe deutlich hoher als in der Kontrollgruppe sind.

Die Unterschiede der Leberwerte vor allem in der Lage sollten dazu veranlassen den

Medikamenteneffekt nicht nur uber die Leberwerte nach der Operation zu bewerten,

sondern die aussagefahigere Differenz der Werte vorher und nachher zu betrachten.

Leberwerte Allaline Phosphatase Bilirubin

Gruppen x0.5 mad x s

Placebo 160 110.5 2.4 2.5

Medikament 244.5 171.2 3.5 3.8

Tabelle 2: Lage- und Streuparameter fur AP- und Bilirubin-Werte vor der Operation

4.2 Korrelation zwischen Bilirubin- und Alkaline Phosphate-

Werten vor der OP

Alkaline Phosphatase und Bilirubin-Werte werden genutzt um Gallengangsverschlusse

zu diagnostizieren (Pelligrini et al., 1982). Dabei gelten Werte zwischen 0,1 - 1,2

mg/dl (Internisten im Netz, 2010) fur Bilirubin und 47-144 mg/dl fur Alkaline-

Phosphatase als normal (nlm, 2010). Stark uberhohte Werte sind Indikatoren fur

Krankheiten. Die hohe Korrelation von Spearman zwischen den beiden Leberwerten

vor der Operation von 0.71 lasst vermuten, dass moglicherweise die Messung von nur

einem Parameter notig sind. Die Abbildung 1 macht jedoch deutlich, dass uberhohte

8

Bilirubin-Konzentrationen nicht immer uberhohte Alkaline-Phosphatase-Werte nach

sich ziehen.

●●

200 400 600 800

02

46

8

Alkaline Phosphatase in IU/L

Bili

rubi

n in

mg/

dL

Abbildung 1: Zusammenhang zwischen Bilirubin und Alkaline Phosphatase-Werten

vor der Operation

4.3 Zusammenhang zwischen Leberwerten vor der Operati-

on und Alter

Es wurden schon wissenschaftliche Arbeiten uber den Zusammenhang von Alter

und Bilirubin (Rosenthal et al., 1984) sowie Alter und Alkaline Phosphatase-Werten

(Eastman und Bixler 1977) verfasst. Eine Korrelation bei den”krankhaften“ Werten

vor der Operation ist mit rsp = −0.04 bei Bilirubin und rsp = −0.29 bei Alkaline

Phosphatase jedoch nicht so stark ausgepragt. Der Abblidung 2 ist jedoch zu ent-

nehmen, dass bei Bilirubin ein nicht monotoner Zusammenhang vorliegen konnte.

Die Bilirubin-Werte um das Geburtsjahr 1915 sind deutlich hoher und streuen viel

mehr als bei den alteren und jungeren Jahrgangen. Aufgrund der wenigen Daten

sollte man diese Beobachtung jedoch nicht uberinterpretieren. Den leicht negativen

Zusammenhang zwischen Alter und Alkaline Phosphatase-Konzentrationen im Blut

kann man auch der Abbildung 6 im Anhangs entnehmen.

9

●●

1900 1910 1920 1930 1940

02

46

8

Geburtsjahr

Bili

rubi

n in

mg/

dl

Abbildung 2: Zusammenhang zwischen Alter und Bilirubin-Wert vor der Operation

4.4 Transformationen zu normalverteilten Leberwerten

Um in einer spateren Studie den Gauß-Test oder andere die Normalverteilung-

voraussetzende Verfahren auf die Daten nach der Operation anwenden zu konnen,

ist es wichtig die Verteilung zu uberprufen. Wie man der Tabelle 3 entnehmen kann,

besitzen alle Messreihen eine recht starke Schiefe. Nach einer geeigneten Potenztrans-

formation mit dem Exponenten θ (zur Erinnerung, fur θ = 0 wird der Logarithmus

angewendet) sind die Verteilungen wie erwartet symmetrisch. Die Bilirubin-Werte

besitzen jedoch eine zu kleine Wolbung fur eine Normalverteilung. Die zu Alkali-

ne Phosphatase gehorigen Q-Q-Plots (Abbildungen 5 und 7 im Anhang) vermitteln

tatsachlich den Eindruck, dass eine Normalverteilung vorliegen konnte.

AP BIL

sk0.25 θH skp(y(x)θH) kp(y(x)θH

) skm θBC skm(y(x)θBC) km(y(x)θBC

)

Pla 0 1 0 −0.27 0.71 0 0.31 −1.60

Med 0.28 0 0.11 −0.79 0.32 0.38 −0.13 −1.51

Tabelle 3: Schiefe- und Wolbungsmaße vor und nach der Transformation

10

4.5 Wirkung des Medikaments

Da die Ausgangswerte fur Bilirubin- und Alkaline Phosphatase zwischen der Medi-

kamenten und der Kontrollgruppe recht unterschiedlich waren, konzentriert sich die

Auswertung vor allem auf die Differenz der Werte vor und nach der Operation. Bei

Bilirubin zeigt das Praperat die großere Wirkung, was eine durchschnittliche Sen-

kung von 2.61 mg/dl zu 1.67 mg/dl bei dem Placebo zeigt. Der Abbildung 3 ist auch

zu entnehmen, dass die Streuung der Wirkung unter dem Medikament großer ist,

der Bilirubinwert eines Patienten stieg sogar leicht an. In Abbildung 9 im Anhang

erkennt man, dass nach der Operation die großeren Bilirubin-Werte in der Medika-

mentengruppe auftreten, jedoch ohne besorgniserregend groß zu sein.

Ahnliche Ergebnisse erhalt man auch fur Alkaline Phosphatase. Wie in Abbildung 9

Med

ikam

ent

Pla

cebo

0 2 4 6 8

Veränderung der Bilirubin−Werte in mg/dl

Abbildung 3: Differenzen zwischen den Alkaline Phosphatase- und Bilirubin-Werten

vor und nach der Operation

im Anhang zu sehen, ist der Median der Differenzen zwischen der Messung vor und

nach der Operation bei dem Medikament mit 65 IU/l großer als unter dem Placebo

mit 24 IU/l. Der Unterschied in der Streuung ist hier noch starker mit MAD-Werten

von 104 IU/l (Medikament) zu 54 IU/l (Placebo). Besonders besorgniserregende ist

die Anzahl von 4 von 10 Patienten, deren Wert sich vergroßerte. Nach der Operati-

on hatten fast ausschließlich die Patienten der Medikamentengruppe die uberhohten

Werte (siehe Abbildung 8 im Anhang).

11

4.6 Abhangigkeit zwischen Medikamentenwirkung und Al-

ter

Im vorhergehenden Teil konnte man eine großere Streuung bei der Wirkung des

Medikamentes beobachten, jetzt soll versucht werden, ob diese wenigstens zum Teil

durch Kenntnis des Alters erklart werden kann, um das Medikament gezielt anwen-

den zu konnen. Untersucht man einen Zusammenhang zwischen Alter und Differenz

der Alkaline Phosphatase Werte getrennt nach Medikamenten und Placebogruppe,

so macht man eine uberraschende Beobachtung. Wahrend der rsp unter der Kontroll-

gruppe den Wert 0.18 annimmt, misst er unter den Empfangern des Medikamentes

-0.54. Das deutet daraufhin, dass die Wirkung des Praperates mit steigendem Alter

zunimmt. Bei Bilirubin sieht es ahnlich aus, dort betragt rsp in der Medikamenten-

gruppe -0.27 und in der Placebogruppe 0.32. Es scheint also, als ob das Medikament

vor allem fur altere Menschen geeignet sei. Allerdings liegen jeweils nur zehn Beob-

achtungen vor, weshalb man das Ergebnis nicht uberbewerten sollte.

5 Zusammenfassung

Auf der Grundlage einer Untersuchung uber die Wirksamkeit eines neuen Medika-

mentes bei Gallengangsverschlussen wollte man neben dieser Fragestellung die Ran-

domisierung der Studie beurteilen und zwei wichtige Indikatoren fur Gallengangsver-

schlusse, die Leberwerte Alkaline Phosphatase sowie Bilirubin, auf Normalverteilung

uberprufen. Die Randomisierung konnte bis auf die unterschiedlichen Leberwerte vor

der Operation als sehr zufriedenstellend bewertet werden. Ersterem behalf man sich

durch Differenzbetrachtung der Werte vor und nach der Operation. Als normalver-

teilt konnten lediglich die Alkaline Phosphatase-Werte angesehen werden. Es konnte

tatsachlich eine allgemein leberwertsenkende Wirkung des Medikamentes beobach-

tet werden, jedoch war sie inhomogene Wirkung durch das unterschiedliche Alter zu

erklaren, was teilweise auch gelang. Jedoch ist die Stichprobe fur eine solche diffe-

renzierte Betrachtung viel zu klein um solide Schlussfolgerungen zu ziehen. Bei einer

zukunftigen Untersuchung sollte jedoch ein starkes Augenmerk auf die unterschied-

liche Wirkung aufgrund des Alters und auch des Geschlechts mit einem großeren

Stichprobenumfang Rucksicht genommen werden.

12

Literaturverzeichnis

Chambers, J., Cleveland, S., Kleiner, B., Tukey, P. (1983) Graphical methods for

data analysis, 1. Auflage, Duxbury Press, Boston

Eastman, R, Bixler, D (1977). Serum Alkaline Phosphatase: Normal Values by Sex

and Age. clinical chemestrie 23(9), 1769-1770

Fahrmeir, L., Kunstler, R., Pigeot, I., Tutz, G. (2007). Statistik, 6. Auflage, Sprin-

ger, Berlin

Hartung, J. (2005). Statistik, 14 Auflage, Oldenbourg, Munchen

Hinkley, D. (1975). On power transformations to symmetry. Biometrika 62(1), 101-

111

Internisten im Netz (2010).

http://www.internisten-im-netz.de/de bilirubin 1327.html (21.04.2010). Kim, T., Whi-

te, H. (2003). http://www.escholarship.org/uc/item/7b52v07p, 24.4.2010

Lott, J., Turner, K., Scott, J. (1978). Factors Affecting Measurement of Total Alkali-

ne Phosphatase Activity in Human Serum, Especially Wavelength Accuracy. clinical

chemestrie 246, 938-941

nlm, http://www.nlm.nih.gov/medlineplus/ency/article/003470.htm, 24.4.2010

Pellegrini, C., Thomas, J., Way, L. (1982). Bilirubin and alkaline phosphatase values

before and after surgery for biliary obstruction. The American Journal of Surgery

143(1), 67-73.

R Development Core Team (2007). A language and environment for statistical com-

puting, R Foundation for Statistical Computing, Vienna, Austria, URL: http://www.R-

project.org.

Rosenthal, P., Pincus, M., Fink, D. (1984). Sex- and age-related differences in biliru-

bin concentrations in serum. Clinical chemestrie clinical chemestrie 30, 1380-1382

Rosenthal, P., Keefe, M., Henten, D., Cheng, M.m Lee, C., Hall, R., Newton, M.

13

(1990). Total and Direct-Reacting Bilirubin Values by Automated Methods Compa-

red with Liquid Chromatography and with Manual Methods for Determining Delta

Bilirubin clinical chemestrie 36, 788-791

Stechermesser, http://www.diss.fu-berlin.de/diss/servlets/MCRFileNodeServlet

/FUDISS derivate 000000003356,24.4.2010

A Anhang

A.1 Abbildungen

200

400

600

800

AP−Werte vor OP

Alk

alin

e P

hosp

hata

se in

IU/l

5015

025

035

0AP−Werte nach OP

Alk

alin

e P

hosp

hata

se in

IU/l

02

46

8

BIL−Werte vor OP

Bili

rubi

n in

mg/

dl

0.5

1.0

1.5

BIL−Werte nach OP

Bili

rubi

n in

mg/

dl

Abbildung 4: Alkaline-Phosphate- und Bilirubin-Werte vor und nach der Operation

i

●●

−1.5 −1.0 −0.5 0.0 0.5 1.0 1.5

5010

015

020

025

030

0

Normal Q−Q Plot

theoretische Quantile

empi

risch

e Q

uant

ile

Abbildung 5: QQ-Plot der logarithmierten Alkaline Phosphatase-Werte nach der

Operation der Medikamentengruppe

A.2 R-Code

### Einlesen der Daten

daten <- read.table("http://www.statistik.tu-dortmund.de/fileadmin/

user_upload/Lehrstuehle/Ingenieur/Mueller/Lehre/Fallstudien_I/Projekt_1/

GALLEN.DAT", header=F,skip=1)

daten <- read.table("GALLEN.DAT", header=F,skip=1)

daten <- daten[,-c(7,8,10)]

names(daten) <- c("PAT_NR","GEB","SEX","TREAT","ZEIT","BIL","AP")

## Aufspalten des Datensatzes in Gruppen

daten_vor <- daten[daten$ZEIT=="vor",] #vor OP

daten_nach <- daten[daten$ZEIT=="nach",] #nach OP

## Patienten mit medikamentoser Behandlung vor OP

daten_vor_med <- daten_vor[daten_vor$TREAT=="v",]

## Patienten unter Placebo vor OP

daten_vor_p <- daten_vor[daten_vor$TREAT=="p",]

## Patienten mit medikamentoser Behandlung nach OP

daten_nach_med <- daten_nach[daten_vor$TREAT=="v",]

## Patienten unter Placebo nach OP

daten_nach_p <- daten_nach[daten_nach$TREAT=="p",]

## nach Geschlecht

daten_vor_w <- daten_vor[daten_vor$SEX=="w",]

daten_nach_w <- daten_nach[daten$SEX=="w",]

ii

1900 1910 1920 1930 1940

200

400

600

800

Geburtsjahr

Alk

alin

e P

hosp

hata

se in

UI/l

Abbildung 6: Zusammenhang zwischen Alter und Alkaline Phospatase-Werten

daten_vor_m <- daten_vor[daten_vor$SEX=="m",]

daten_nach_m <- daten_nach[daten$SEX=="m",]

## Patientinnen mit Medikament vor OP

daten_vor_med_w <- daten_vor_med[daten_vor_med$SEX=="w",]

## Patienten mit Medikament vor OP

daten_vor_med_m <- daten_vor_med[daten_vor_med$SEX=="m",]

## Patientinnen mit Placebo vor OP

daten_vor_p_w <- daten_vor_p[daten_vor_p$SEX=="w",]

## Patienten mit Placebo vor OP

daten_vor_p_m <- daten_vor_p[daten_vor_p$SEX=="m",]

## Patientinnen mit Medikament nach OP

daten_nach_med_w <- daten_nach_med[daten_nach_med$SEX=="w",]

## Patienten mit Medikament nach OP

daten_nach_med_m <- daten_nach_med[daten_nach_med$SEX=="m",]

## Patientinnen mit Placebo nach OP

daten_nach_p_w <- daten_nach_p[daten_nach_p$SEX=="w",]

## Patienten mit Placebo nach OP

daten_nach_p_m <- daten_nach_p[daten_nach_p$SEX=="m",]

### Gute der Randomisation

# generalle Ausreißeranalyse

pdf("Diagramme\\Ausreisseranalyse.pdf",family="Times")

par(mfrow=c(2,2))

iii

−1.5 −1.0 −0.5 0.0 0.5 1.0 1.5

4.5

5.0

5.5

Normal Q−Q Plot

theoretische Quantile

empi

risch

e Q

uant

ile

Abbildung 7: QQ-Plot der Alkaline Phosphatase-Werte nach der Operation der Kon-

trollgruppe

boxplot(daten_vor$AP,main="AP-Werte vor OP",

ylab="Alkaline Phosphatase in IU/l")

boxplot(daten_nach$AP,main="AP-Werte nach OP",

ylab="Alkaline Phosphatase in IU/l")

boxplot(daten_vor$BIL,main="BIL-Werte vor OP",

ylab="Bilirubin in mg/dl")

boxplot(daten_nach$BIL,main="BIL-Werte nach OP",

ylab="Bilirubin in mg/dl")

dev.off()

# Kontingenzkoeffizient

table(daten[1:20,]$SEX) # Anteil Frauen Manner

Kontingenztafel <- rbind(table(daten_vor_med$SEX),table(daten_vor_p$SEX))

rownames(Kontingenztafel) <- c("Medikament","Placebo")

colnames(Kontingenztafel) <- c("m", "w")

n <- sum(Kontingenztafel)

Chiquadrat <- chisq.test(Kontingenztafel,correct=FALSE)$statistic

(Chiquadrat/(n + Chiquadrat))^0.5

# Randomisierung bezgl. Alter

mean(daten_vor_med$GEB)

mean(daten_vor_p$GEB)

sd(daten_vor_med$GEB)

sd(daten_vor_p$GEB)

# Randomisation bzgl. Bilirubinund AP

median(daten_vor_med$AP)

iv

Placebo

Alkaline Phosphate in IU/L

rel.

Häu

f. / K

lass

enbr

eite

0 100 200 300 4000.00

00.

006

Medikament

Alkaline Phosphate in IU/L

rel.

Häu

f. / K

lass

enbr

eite

0 100 200 300 4000.00

00.

006

Abbildung 8: Alkaline Phosphatase-Werte nach der Operation

median(daten_vor_p$AP)

mad(daten_vor_med$AP)

mad(daten_vor_p$AP)

mean(daten_vor_med$BIL)

mean(daten_vor_p$BIL)

sd(daten_vor_med$BIL)

sd(daten_vor_p$BIL)

### Korrelation zwischen Bilirubin- und AP-Werten vor der OP

pdf("Diagramme\\KorrelationAPBIL.pdf",family="Times")

par(cex.axis=1.6,cex.lab=1.6,cex.main=1.6,mar=c(5,5,2,2))

plot(daten_vor$AP,daten_vor$BIL,xlab="Alkaline Phosphatase in IU/L",

ylab="Bilirubin in mg/dL")

dev.off()

cor(daten_vor$AP, daten_vor$BIL, method="spearman")

### Zusammenhang zwischen Leberwerten vor der Operation und Alter

pdf("Diagramme\\AlterBIL.pdf",family="Times")

par(cex.axis=1.6,cex.lab=1.6,cex.main=1.6,mar=c(5,5,2,2))

plot(daten_vor$GEB, daten_vor$BIL, xlab="Geburtsjahr",

ylab="Bilirubin in mg/dl")

dev.off()

cor(daten_vor$AP, daten_vor$GEB,method="spearman")

cor(daten_vor$BIL, daten_vor$GEB,method="spearman")

pdf("Diagramme\\AlterAP.pdf",family="Times")

par(cex.axis=1.6,cex.lab=1.6,cex.main=1.6,mar=c(5,5,2,2))

v

Placebo

Bilirubin in mg/dl

rel.

Häu

f. / K

lass

enbr

eite

0.0 0.5 1.0 1.5 2.0

0.0

0.4

0.8

Medikament

Bilirubin in mg/dl

rel.

Häu

f. / K

lass

enbr

eite

0.0 0.5 1.0 1.5 2.0

0.0

0.4

0.8

Abbildung 9: B

ilirubin-Werte nach der Operation

plot(daten_vor$GEB, daten_vor$AP, xlab="Geburtsjahr",

ylab="Alkaline Phosphatase in UI/l")

dev.off()

### Transformationen zu normalverteilten Leberwerten

#### notige Programme

# Schiefe-Berechnung

# x: Datenvektor

# robust: falls F -> uber Momente

# falls T -> uber Quantile

# p: welches Quantil

Schiefe <- function(x,robust=FALSE,p=0.25) {

if (robust==FALSE)

{return(mean((x-mean(x))^3)/var(x)^1.5) }

else

{return((quantile(x,1-p, type=2)+quantile(x,p, type=2)-2*quantile

(x,0.5, type=2))/(quantile(x,1-p, type=2)-quantile(x,p, type=2)))}

}

# Berechnung der Wolbung

# x: Datenvektor

# robust: falls F -> uber Momente

# falls T -> uber Quantile

Wolbung <- function(x,robust=FALSE) {

if (robust==FALSE) {

return(mean((x-mean(x))^4)/var(x)^2-3)}

else {return((quantile(x,0.875, type=2)-quantile(x,0.625, type=2)

vi

Med

ikam

ent

Pla

cebo

−200 0 200 400 600

Veränderung der AP−Werte in IU/l

Abbildung 10: Differenzen zwischen den Alkaline Phosphatase-Werten vor und nach

der Operation

+quantile(x,0.375, type=2)-quantile(x,0.125, type=2))/

(quantile(x,0.75, type=2)-quantile(x,0.25, type=2))-1.23)}

}

# diese Funktion berechnet ein a, so dass x^a symmetrisch ist

# ist a in der Nahe von 0, so ist log(x) symmetrisch

# x: Datenvektor

# robust: soll Schiefe uber Momente oder uber Quantile

# zu 0 transformiert werden

# Quantil: welches Quantil soll symmetrisch sein

# Schrittgroße: wie genau soll a berechnet werden

##### Schiefe-Trafo ######

Schiefe_Trafo <- function(x,Schrittgroße=0.001,robust=FALSE,Quantil=0.25) {

if (robust==FALSE) {

Definitionsbereich <- seq(Schrittgroße,4,by=Schrittgroße)

n <- length(x)

y <- matrix(x,nrow=length(x),ncol=(length(Definitionsbereich)))

y <- rbind(y,Definitionsbereich)

Potenzfunktion <- function(x) {

n <- length(x)

return(x[-n]^x[n])}

Varianz <- apply(y,2,Potenzfunktion)

Varianz <- apply(Varianz,2,var)

zuMaximierendes <- -n/2*log(2*pi*Varianz)-n/2+n*

log(Definitionsbereich)+(Definitionsbereich-1)*sum(log(x))

return(Definitionsbereich[which.max(zuMaximierendes)]) }

else {

q1 <- median(x)

q2 <- quantile(x,Quantil,type=2)

q3 <- quantile(x,1-Quantil,type=2)

vii

Definitionsbereich <- seq(Schrittgroße,4,by=Schrittgroße)

b <- (q2/q1)^Definitionsbereich+(q3/q1)^Definitionsbereich-2

return(Definitionsbereich[which.min(abs(b))])

}

}

Schiefe(daten_nach_med$AP,robust=TRUE)

Wolbung(daten_nach_med$AP,robust=TRUE)

Schiefe_Trafo(daten_nach_med$AP,robust=TRUE)

Schiefe(log(daten_nach_med$AP),robust=TRUE)

Wolbung(log(daten_nach_med$AP),robust=TRUE)

Schiefe(daten_nach_p$AP,robust=TRUE)

Wolbung(daten_nach_p$AP,robust=TRUE)

Schiefe_Trafo(daten_nach_p$AP,robust=TRUE)

Schiefe(daten_nach_p$AP,robust=TRUE)

Wolbung(daten_nach_p$AP,robust=TRUE)

Schiefe(daten_nach_med$BIL)

Wolbung(daten_nach_med$BIL)

Schiefe_Trafo(daten_nach_med$BIL)

Schiefe(daten_nach_med$BIL^0.38)

Wolbung(daten_nach_med$BIL^0.38)

Schiefe(daten_nach_p$BIL)

Wolbung(daten_nach_p$BIL)

Schiefe_Trafo(daten_nach_p$BIL)

Schiefe(log(daten_nach_p$BIL))

Wolbung(log(daten_nach_p$BIL))

pdf("Diagramme\\qqMed.pdf",family="Times")

par(cex.axis=1.6,cex.lab=1.6,cex.main=1.6,mar=c(5,5,2,2))

qqnorm(daten_nach_p$AP,xlab="theoretische Quantile",

ylab="empirische Quantile")

dev.off()

pdf("Diagramme\\qqp.pdf",family="Times")

par(cex.axis=1.6,cex.lab=1.6,cex.main=1.6,mar=c(5,5,2,2))

qqnorm(log(daten_nach_med$AP),xlab="theoretische Quantile"

,ylab="empirische Quantile")

dev.off()

### Wirkung des Medikaments

AP_diff2 <- daten_vor_med$AP - daten_nach_med$AP

AP_diff3 <- daten_vor_p$AP - daten_nach_p$AP

BIL_diff2 <- daten_vor_med$BIL - daten_nach_med$BIL

BIL_diff3 <- daten_vor_p$BIL - daten_nach_p$BIL

viii

median(AP_diff2)

median(AP_diff3)

mad(AP_diff2)

mad(AP_diff3)

mean(BIL_diff2)

mean(BIL_diff3)

pdf("Diagramme\\DiffBIL.pdf",family="Times")

par(cex.axis=1.6,cex.lab=1.6,cex.main=1.6,mar=c(5,5,2,2))

boxplot(BIL_diff2, BIL_diff3, horizontal=T, names=c("Medikament",

"Placebo"),xlab="Veranderung der Bilirubin-Werte in mg/dl")

dev.off()

pdf("Diagramme\\DiffAP.pdf",family="Times")

par(cex.axis=1.6,cex.lab=1.6,cex.main=1.6,mar=c(5,5,2,2))

boxplot(AP_diff2, AP_diff3, horizontal=T, names=c("Medikament",

"Placebo"),xlab="Veranderung der AP-Werte in IU/l")

dev.off()

pdf("Diagramme\\EndwerteAP.pdf",family="Times")

par(mfrow=c(2,1),cex.axis=1.6,cex.lab=1.6,cex.main=1.6,mar=c(5,5,2,2))

hist(daten_nach_p$AP, xlab="Alkaline Phosphate in IU/L",

ylab="rel. Hauf. / Klassenbreite",freq=F, main="Placebo",xlim=c(0,400))

hist(daten_nach_med$AP, xlab="Alkaline Phosphate in IU/L",

ylab="rel. Hauf. / Klassenbreite",freq=F, main="Medikament",xlim=c(0,400))

dev.off()

pdf("Diagramme\\EndwerteBIL.pdf",family="Times")

par(mfrow=c(2,1),cex.axis=1.6,cex.lab=1.6,cex.main=1.6,mar=c(5,5,2,2))

hist(daten_nach_p$BIL, xlab="Bilirubin in mg/dl",

ylab="rel. Hauf. / Klassenbreite",freq=F, main="Placebo",xlim=c(0,2),breaks=seq(from=0,to=2,by=0.4))

hist(daten_nach_med$BIL, xlab="Bilirubin in mg/dl",

ylab="rel. Hauf. / Klassenbreite",freq=F, main="Medikament",xlim=c(0,2),breaks=seq(from=0,to=2,by=0.4))

dev.off()

# Abhangigkeit zwischen Medikamentenwirkung und Alter bzw. Geschlecht

cor(daten_nach_med$GEB, AP_diff2, method="spearman")

cor(daten_nach_p$GEB, AP_diff2, method="spearman")

cor(daten_nach_med$GEB, BIL_diff2, method="spearman")

cor(daten_nach_p$GEB, BIL_diff2, method="spearman")

ix