Biometrie! - Thieme Gruppe – Startseite " ZusammenhangzweierquantitativerVariablen" •...
-
Upload
trinhnguyet -
Category
Documents
-
view
216 -
download
0
Transcript of Biometrie! - Thieme Gruppe – Startseite " ZusammenhangzweierquantitativerVariablen" •...
2
Grundbegriffe
Allgemein
• Grundgesamtheit: Die Menge aller Objekte, auf die sich die Aussage einer Studie beziehen soll
• Stichprobe (=n): Der Teil der Grundgesamtheit, der befragt/ untersucht wird, und stellvertretend für die Grundgesamtheit steht.
• Beobachtungseinheit: zu untersuchende(s) Objekt / Person. Die Summe aller Beobachtungseinheiten bildet die Stichprobe.
Merkmale
• Qualitativ (nicht zählbar): o Nominal à keine Reihenfolge o Ordinal à Reihenfolge möglich (Medizinische Scores!)
• Quantitativ (zählbar / messbar): o Diskret à nur ganze Zahlen o Stetig à alle reellen Zahlen (SI-‐Einheiten!)
Verschiedene Variablen
• Einflussvariable: Intervention, bzw. Einfluss, der untersucht werden soll. o qualitative EV: Faktor o quantitative EV: Kovariable
• Zielvariable: hierauf wird untersucht, wird durch Einflussvariable verursacht. • Störvariable: alle Einflussvariablen, die nicht berücksichtigt, bzw. kontrolliert werden
können.
3
Studien allgemein
• Randomisierung: o …ist ein Verfahren, bei dem die Versuchspersonen unter Verwendung eines
Zufallsmechanismus unterschiedlichen Gruppen zugeordnet werden o Ziel à Sicherung der Strukturgleichheit
• Verblindung: o …Unkenntlichmachung der Studienmedikation, sodass die Therapien der
einzelnen Behandlungsgruppen für Patient (einfach blind) und Arzt (doppelblind) nicht zu unterscheiden sind.
o Ziel à Sicherung der Beobachtungsgleichheit
• Transversal vs. Longitudinal: Einmalige Messung vs. zeitlicher Verlauf
• Prospektiv vs. Retrospektiv: Blick in Zukunft vs. Blick in Vergangenheit
• Kontrollgruppe: Gruppe, bei der nicht interveniert wird. Nicht zwingend Placebo (Placebo bei Studien häufig ethisch nicht vertretbar!)
Studientypen
o Randomisierte, kontrollierte Studie ( = Randomized controlled trial = RCT): • „Goldstandard“, aber teuer und aufwendig • 2 (oder mehr) Gruppen mit
unterschiedlichen Interventionen (häufig: Neue vs. Standardtherapie)
• Interventionsstudie
• Sonderform: Quasi-‐experimentelle Studie à keine Randomisierung möglich
Kontrolliert Randomisiert Prospektiv longitudinal Ja Ja Ja Ja
4
o Kohortenstudie: • Gruppe von Probanden, die in mind. 1 Merkmal übereinstimmen = Kohorte • Beobachtung von Zielvariablen in
Abhängigkeit von Einflussvariablen • Beobachtungsstudie ( = Panelstudie)
• Zunächst nicht kontrolliert; evtl. Ermittlung von Kontrollgruppen nach Abschluss der Studie (daher keine Randomisierung möglich, Einteilung in Gruppen aufgrund der Merkmalsübereinstimmung (Kohorte!))
o Fall-‐Kontroll-‐Studie: • Vergleich von Fällen, bei denen das Ereignis (!) eingetreten ist, mit Fällen, bei
denen das Ereignis (!) nicht eingetreten ist • Kontrolle nicht bei Exposition, sondern bei
Ereignis • Zuordnung der Kontrollen durch
„matched-‐pairs“-‐Technik • Beobachtungsstudie
o Querschnittstudie: • Einmalige Befragung einer Stichprobe • Beobachtungsstudie (Befragung, Umfrage)
• transversal
Kontrolliert Randomisiert Prospektiv longitudinal Nein Nein Nein Nein
Kontrolliert Randomisiert Prospektiv longitudinal (Nein) Nein Ja Ja
Kontrolliert Randomisiert Prospektiv longitudinal Ja Nein Nein (Retrosp.) (Ja)
5
Univariate Analysen
Statistische Maßzahlen
• Mittelwert: arithmetisches Mittel aller Einzelwerte (starke Beeinflussung durch Ausreißer)
(Beispiel: 2 – 2 – 5 – 7 – 8 à !!!!!!!!!!
= !"! = 4,8)
• Median ( = 0,5-‐Quantil): Zahl, die an der mittleren Stelle steht, wenn alle Zahlen nach ihrer Größe sortiert sind (kaum Beeinflussung durch Ausreißer) (Beispiel: 2 – 2 – 5 – 7 – 8 à Median ist 5)
• Modalwert: häufigster Wert einer Messreihe (Beispiel: 2 – 2 – 5 – 7 – 8 à Modalwert ist 2)
• Standardabweichung (σ): Die Standardabweichung gibt an, wie weit die
Beobachtungswerte von ihrem Mittelwert abweichen ( 𝜎 = 𝜎²! )
• Varianz (𝜎!): Hier: Zwischenschritt zur Berechnung der Standardabweichung
• Quartile: Die Werte, die eine chronologische Zahlenfolge in vier Viertel teilt o 1. Quartil = 0,25-‐Quantil = 25%-‐Perzentil o 2. Quartil = 0,5-‐Quantil = 50%-‐Perzentil (= Median) o 3. Quartil = 0,75-‐Quantil = 75%-‐Perzentil
• Interquartilsabstand = 3. Quartil – 1. Quartil
• Maximum / Minimum: größter / kleinster gemessener Wert • Spannweite (= Range) = Maximum -‐ Minimum
Grafische Darstellungen
• 2 Möglichkeiten: o Histogramm o Boxplot
• Normalverteilung liegt vor, wenn… o …im Histogramm alle Säulen annähernd wie eine Gauß’sche Glockenkurve
angeordnet sind. o …der Boxplot symmetrisch ist.
6
• Histogramm:
o Faustregel für Klassenanzahl: 𝑛 o Range geteilt durch Anzahl aller Klassen ergibt die Klassenbreite o Klassenbreite:
§ „(„ oder „)“ à Wert nicht mehr enthalten § „[“ oder „]“ à Wert noch enthalten
• Boxplot:
Klasse
7
Bivariate Analysen
Risikomaßzahlen
• Odds Ratio (= Quotenverhältnis): o Einzige Risikomaßzahl, die sich aus retrospektiven Studien (Fall-‐Kontroll-‐
Studien) ableiten lässt, da sie nicht von der Prävalenz abhängt o Schätzwert für das Relative Risiko (Je geringer die Prävalenz einer Erkrankung,
desto besser stimmt das OR mit dem RR überein) o Verhältnis aus Exposition und Nicht-‐Exposition bei eingetretenem Ereignis,
geteilt durch das Verhältnis aus Exposition und Nicht-‐Exposition bei nicht eingetretenem Ereignis
o Möglicher Wertebereich: OR ≥ 0 § 0 ≤ OR < 1 à Exposition hat präventiven Einfluss (Medikament) § OR = 1 à Exposition hat keinen Einfluss § OR > 1 à Exposition hat schädigenden Einfluss (Nikotin)
• Risiko unter Exposition: o Anteil aller Exponierten, bei denen das Ereignis eingetreten ist, geteilt durch
alle Exponierten • Risiko unter Nicht-‐Exposition:
o Anteil aller Nicht-‐Exponierten, bei denen das Ereignis eingetreten ist, geteilt durch alle Nicht-‐Exponierten
• Relatives Risiko:
o Verhältnis aus RExp und RNExp ( RExpRNExp
)
o Wertebereich wie bei Odds Ratio • Relative Risikoreduktion:
o = 1-‐RR • Absolute Risikoreduktion (ARR) / -‐zunahme (ARI):
o Differenz zwischen RExp und RNExp o Die absoluten Werte von ARR und ARI sind gleich (|ARR| = |ARI|), lediglich
das Vorzeichen variiert. Welcher Wert letztendlich angegeben wird, hängt davon ab, was betont werden soll.
• Number needed to treat (NNT) / Number needed to harm (NNH): o Kehrwert der absoluten Werte (ARR / ARI) o NNT / NNH besagen, wie viele Patienten exponiert werden müssen, um ein
Ereignis eintreten zu lassen. o Soll die schädigende Wirkung hervorgehoben werden, spricht man von der
NNH (z.B. Nikotin), soll die präventive Wirkung hervorgehoben werden, spricht man von der NNT (z.B. Medikament).
8
Zusammenhang zweier quantitativer Variablen
• Kovarianz: o Zusammenhangsmaß zwischen zwei Merkmalen, wobei jede Beobachtung
einen positiven oder negativen Beitrag liefert. o Durch den Schwerpunkt wird je eine Gerade parallel zur X-‐ und Y-‐Achse
gezeichnet. Die Wertepaare in den somit entstandenen vier Quadranten werden ausgezählt.
o Wertebereich: Alle reellen Zahlen o Einheit: [Variable 1] * [Variable 2]
• Korrelationskoeffizient (r):
o Wertebereich: [-‐1 ; +1] § r = -‐1 à linearer antiproportionaler Zusammenhang § -‐1 < r < 0 à negativer Trend erkennbar § r = 0 à kein Zusammenhang erkennbar § 0 < r < +1 à positiver Trend erkennbar § r = +1 à linearer proportionaler Zusammenhang
o Einheit: keine Einheit
• Lineare Regression:
o dient der Vorhersage eines Wertes auf der Y-‐Achse, bei bekanntem zugehörigen X-‐Wert (nicht andersherum!)
9
Diagnostische Verfahren
Gütekriterien
• Sensitivität: o Wahrscheinlichkeit alle Kranken zu erkennen o „Wenn ich krank bin, mit welcher Wahrscheinlichkeit wird der Test dann auch
positiv sein“ • Spezifität:
o Wahrscheinlichkeit alle Gesunden zu erkennen o „Wenn ich gesund bin, mit welcher Wahrscheinlichkeit wird der Test dann
auch negativ sein“ • Sensitivität und Spezifität:
o werden „vor dem Test“ erfragt, d.h. das Testergebnis ist noch nicht bekannt o Bei infektiologischen Suchtests sollte die Sensitivität hoch sein, damit man
möglichst viele Kranke als krank erkennen kann. Dabei nimmt man in Kauf, dass möglicherweise auch Gesunde als falsch-‐positiv getestet werden. (Bestätigungstest sollte spezifisch sein)
o Bei Screening-‐Tests sollte die Spezifität hoch sein, damit möglichst alle Gesunden erkannt werden. Hier steht die Verhinderung der „Überdiagnose“ und damit verbundenen „Übertherapie“ im Vordergrund. Die Konsequenzen bei Nicht-‐Erkennen eines Kranken sind nicht so weitreichend wie bei den infektiologischen Suchtests.
o Es gilt: § 100% = Sensitivität + Falsch-‐Negative § 100% = Spezifität + Falsch-‐Positive
• Positiver prädiktiver Wert (PPW):
o Wahrscheinlichkeit bei positivem Testergebnis, auch wirklich krank zu sein. o „Wenn der Test positiv ist, mit welcher Wahrscheinlichkeit bin ich dann
wirklich krank?“ • Negativer prädiktiver Wert (NPW):
o Wahrscheinlichkeit bei negativem Testergebnis, auch wirklich gesund zu sein. o „Wenn der Test negativ ist, mit welcher Wahrscheinlichkeit bin ich dann auch
wirklich gesund?“ • PPW und NPW:
o werden „nach dem Test“ erfragt, d.h. das Testergebnis ist bekannt und wird hinterfragt
o Die prädiktiven Werte sind Prävalenz-‐abhängig. Es gilt: § Prävalenz à PPW à NPW
10
Referenzbereich
• dient zur Unterscheidung zwischen „unauffällig (=gesund?)“ und „auffällig (=krank?)“ • beschreibt einen Wertebereich, in dem sich 95% aller gesunden Werte befinden
(absolute Zahlen, keine Wahrscheinlichkeiten!)
• Grenzen des Referenzbereiches bei Normalverteilung:
• Grenzen des Referenzbereiches bei Nicht-‐Normalverteilung:
• Die Spezifität ist gleich dem Referenzbereich, da beide dasselbe beschreiben: Die Spezifität beschreibt die richtig-‐negativen und der Referenzbereich beinhaltet 95% der gesunden Werte. Damit wird die Spezifität durch den Referenzbereich festgelegt (i.d.R. 95%).
11
Statistische Analyse einer quantitativen Zielvariable
Konfidenzintervalle
• Definition: Das KI ist ein Intervall, das mit einer vorgegebenen Wahrscheinlichkeit 1−α (i.d.R. gilt α = 5%, also 1-‐ α = 95%) den zu schätzenden wahren Parameter der Verteilung in der Grundgesamtheit überdeckt.
• Der wahre Mittelwert (= Erwartungswert = µ) der Grundgesamtheit bleibt unbekannt, kann aber anhand des empirischen Mittelwertes der untersuchten Stichprobe geschätzt werden. Dieser empirische Mittelwert der Stichprobe muss nun nach rechts und links durch ein Intervall erweitert werden, um die Wahrscheinlichkeit, den wahren Mittelwert darin erfassen zu können, zu vergrößern.
• Grenzen des Konfidenzintervalls:
o Untere Grenze:
o Obere Grenze:
o Es gilt: Je größer n und kleiner s, desto kleiner wird das KI (die Konfidenzwahrscheinlichkeit bleibt aber trotz verkleinertem KI bei 95%, da sie nur von t abhängig ist, nicht jedoch von n oder s)
• Referenzbereich und Konfidenzintervall haben nichts miteinander zu tun! o Unterschiede:
§ Der Referenzbereich gibt an, welcher prozentuale Anteil der Messwerte innerhalb der Grenzen liegt (keine Wahrscheinlichkeiten!)
§ Das KI beschreibt die Genauigkeit einer Schätzung eines unbekannten Parameters in der Grundgesamtheit
§ Grenzen des KI werden zusätzlich durch Stichprobenumfang beeinflusst
12
Statistische Tests
• Nullhypothese (H0): besagt, es besteht „null Unterschied“, „null Zusammenhang“, d.h. dass eine Intervention keinen Einfluss hat
• Alternativhypothese (H1): ist die Hypothese, die der Untersucher belegen möchte, d.h. dass die Intervention einen Einfluss hat
• Testdurchführung: Obwohl die Alternativhypothese nachgewiesen werden soll, wird immer die Nullhypothese getestet. Wenn sich H0 als falsch / nicht zutreffend herausstellt, darf sie abgelehnt werden und damit H1 angenommen, also als zutreffend angesehen werden. Wenn also ein Testergebnis statistisch nicht signifikant ist, muss H0 beibehalten werden. Sobald der Test signifikant ist, wird H0 verworfen. Das Signifikanzniveau (= α) wird i.d.R. auf 0,05 (= 5%) festgelegt.
• Da das Signifikanzniveau bei 5% liegt, bleibt immer eine Restwahrscheinlichkeit, Fehler bei der Testentscheidung zu machen. Man unterscheidet:
o Fehler 1. Art: H0 wird abgelehnt, da der gemessene Wert fälschlicherweise nicht im Intervall gelegen hat, obwohl dies richtig gewesen wären. (Der Fehler 1. Art wird direkt durch das Signifikanzniveau bestimmt)
o Fehler 2. Art: H0 wird fälschlicherweise beibehalten, obwohl sie eigentlich abgelehnt werden müsste.
Testentscheidung mithilfe des p-‐Wertes
• Der p-‐Wert ist das Ergebnis eines Signifikanztests zur Prüfung der Nullhypothese • Es gilt:
o verwerfe H0, falls gilt: p ≤ α (i.d.R. p ≤ 0,05) o verwerfe H0 nicht, falls gilt: p > α
• den p-‐Wert könnte man als das „α“ sehen, bei dem die Nullhypothese gerade noch abgelehnt werden darf
• Falls das Signifikanzniveau nicht anders angegeben ist, wird immer von α = 5% = 0,05 ausgegangen. Dies entspricht einer Konfidenzwahrscheinlichkeit von 95%.
• Beispiele: o Falls p = 0,01, könnte man auf einem 1%-‐Signifikanzniveau, d.h. mit einer
99%-‐Konfidenzwahrscheinlichkeit die Nullhypothese ablehnen. Das „α“ wäre in diesem Fall mit 0,01 kleiner als die zur statistischen Signifikanz benötigte Höchstgrenze von α = 0,05. Es gilt also: p ≤ α à H0 verwerfen!
o Falls p = 0,84, müsste man auf einem 84%-‐Signifikanzniveau, d.h. nur mit einer 16%-‐Konfidenzwahrscheinlichkeit die „Nullhypothese ablehnen“. Merke: Signifikanzniveau = Irrtumswahrscheinlichkeit, die also in diesem Fall auch bei 84% liegen würde (= Fehler 1. Art!) Es gilt: p >> α à H0 beibehalten!
13
Nullhypothesen
• t-‐Test für (un)verbundene Stichproben: Die Erwartungswerte sind gleich.
• Mann-‐Whitney-‐U-‐Test: Die Verteilungsfunktionen sind gleich.
• Chi-‐Quadrat-‐Test: Die Variablen sind voneinander unabhängig.
• Vorzeichen-‐Test: Wirkung ist gleich.
• Kolmogorov-‐Smirnov-‐Test: Die Variablen sind normalverteilt.
• Levene-‐Test: Die Varianzen sind gleich.
14
Analysen von Überlebenszeiten
Kaplan-‐Meier-‐Kurve
• auf X-‐Achse: kumulierte Überlebensrate [%] • auf Y-‐Achse: Zeit • Vorteil: Es werden auch zensierte Daten berücksichtigt
o Zensierte Daten: alle, die nicht gestorben sind und in die Wertung eingehen (ob abgebrochen, oder nicht) à Berücksichtigung von Fällen, bei denen kein Todeszeitpunkt bekannt ist
• Bei jedem eingetretenem Ereignis rutscht die Kurve eine Stufe herunter