Biometrie! - Thieme Gruppe – Startseite " ZusammenhangzweierquantitativerVariablen" •...

14
1 Biometrie

Transcript of Biometrie! - Thieme Gruppe – Startseite " ZusammenhangzweierquantitativerVariablen" •...

1    

 

 

 

Biometrie    

 

   

2    

Grundbegriffe  

 

Allgemein  

• Grundgesamtheit:  Die  Menge  aller  Objekte,  auf  die  sich  die  Aussage  einer  Studie  beziehen  soll  

• Stichprobe  (=n):  Der  Teil  der  Grundgesamtheit,  der  befragt/  untersucht  wird,  und  stellvertretend  für  die  Grundgesamtheit  steht.  

• Beobachtungseinheit:  zu  untersuchende(s)  Objekt  /  Person.  Die  Summe  aller  Beobachtungseinheiten  bildet  die  Stichprobe.    

Merkmale  

• Qualitativ  (nicht  zählbar):  o Nominal   à  keine  Reihenfolge  o Ordinal   à  Reihenfolge  möglich  (Medizinische  Scores!)  

• Quantitativ  (zählbar  /  messbar):  o Diskret     à  nur  ganze  Zahlen  o Stetig     à  alle  reellen  Zahlen  (SI-­‐Einheiten!)  

 

Verschiedene  Variablen  

• Einflussvariable:  Intervention,  bzw.  Einfluss,  der  untersucht  werden  soll.  o qualitative  EV:  Faktor  o quantitative  EV:  Kovariable  

• Zielvariable:  hierauf  wird  untersucht,  wird  durch  Einflussvariable  verursacht.  • Störvariable:  alle  Einflussvariablen,  die  nicht  berücksichtigt,  bzw.  kontrolliert  werden  

können.  

 

   

3    

Studien  allgemein  

• Randomisierung:  o …ist  ein  Verfahren,  bei  dem  die  Versuchspersonen  unter  Verwendung  eines  

Zufallsmechanismus  unterschiedlichen  Gruppen  zugeordnet  werden  o Ziel  à    Sicherung  der  Strukturgleichheit  

• Verblindung:  o …Unkenntlichmachung  der  Studienmedikation,  sodass  die  Therapien  der  

einzelnen  Behandlungsgruppen  für  Patient  (einfach  blind)  und  Arzt  (doppelblind)  nicht  zu  unterscheiden  sind.  

o Ziel  à    Sicherung  der  Beobachtungsgleichheit  

 

• Transversal  vs.  Longitudinal:  Einmalige  Messung  vs.  zeitlicher  Verlauf  

• Prospektiv  vs.  Retrospektiv:  Blick  in  Zukunft  vs.  Blick  in  Vergangenheit        

• Kontrollgruppe:  Gruppe,  bei  der  nicht  interveniert  wird.  Nicht  zwingend  Placebo  (Placebo  bei  Studien  häufig  ethisch  nicht  vertretbar!)  

   Studientypen  

o Randomisierte,  kontrollierte  Studie  (  =  Randomized  controlled  trial  =  RCT):  • „Goldstandard“,  aber  teuer  und  aufwendig  • 2  (oder  mehr)  Gruppen  mit  

unterschiedlichen  Interventionen  (häufig:  Neue  vs.  Standardtherapie)  

• Interventionsstudie    

• Sonderform:  Quasi-­‐experimentelle  Studie  à    keine  Randomisierung  möglich  

             

Kontrolliert   Randomisiert   Prospektiv   longitudinal  Ja   Ja   Ja   Ja  

4    

o Kohortenstudie:  • Gruppe  von  Probanden,  die  in  mind.  1  Merkmal  übereinstimmen    =  Kohorte  • Beobachtung  von  Zielvariablen  in  

Abhängigkeit  von  Einflussvariablen  • Beobachtungsstudie  (  =  Panelstudie)  

• Zunächst  nicht  kontrolliert;  evtl.  Ermittlung  von  Kontrollgruppen  nach  Abschluss  der  Studie  (daher  keine  Randomisierung  möglich,  Einteilung  in  Gruppen  aufgrund  der  Merkmalsübereinstimmung  (Kohorte!))  

         

o Fall-­‐Kontroll-­‐Studie:  • Vergleich  von  Fällen,  bei  denen  das  Ereignis  (!)  eingetreten  ist,  mit  Fällen,  bei  

denen  das  Ereignis  (!)  nicht  eingetreten  ist  • Kontrolle  nicht  bei  Exposition,  sondern  bei  

Ereignis  • Zuordnung  der  Kontrollen  durch  

„matched-­‐pairs“-­‐Technik  • Beobachtungsstudie  

   

       

o Querschnittstudie:  • Einmalige  Befragung  einer  Stichprobe  • Beobachtungsstudie  (Befragung,  Umfrage)  

 • transversal  

 

     

   

Kontrolliert   Randomisiert   Prospektiv   longitudinal  Nein   Nein   Nein   Nein  

Kontrolliert   Randomisiert   Prospektiv   longitudinal  (Nein)   Nein   Ja   Ja  

Kontrolliert   Randomisiert   Prospektiv   longitudinal  Ja   Nein   Nein  (Retrosp.)   (Ja)  

5    

Univariate  Analysen  

 

Statistische  Maßzahlen  

• Mittelwert:  arithmetisches  Mittel  aller  Einzelwerte  (starke  Beeinflussung  durch  Ausreißer)  

(Beispiel:  2  –  2  –  5  –  7  –  8    à  !!!!!!!!!!

 =  !"!  =  4,8)  

• Median  (  =  0,5-­‐Quantil):  Zahl,  die  an  der  mittleren  Stelle  steht,  wenn  alle  Zahlen  nach  ihrer  Größe  sortiert  sind  (kaum  Beeinflussung  durch  Ausreißer)  (Beispiel:  2  –  2  –  5  –  7  –  8    à  Median  ist  5)  

• Modalwert:  häufigster  Wert  einer  Messreihe  (Beispiel:  2  –  2  –  5  –  7  –  8    à  Modalwert  ist  2)    

• Standardabweichung  (σ):  Die  Standardabweichung  gibt  an,  wie  weit  die  

Beobachtungswerte  von  ihrem  Mittelwert  abweichen            (  𝜎 =   𝜎²!  )  

• Varianz  (𝜎!):  Hier:  Zwischenschritt  zur  Berechnung  der  Standardabweichung    

• Quartile:  Die  Werte,  die  eine  chronologische  Zahlenfolge  in  vier  Viertel  teilt  o 1.  Quartil  =  0,25-­‐Quantil  =  25%-­‐Perzentil  o 2.  Quartil  =  0,5-­‐Quantil  =  50%-­‐Perzentil    (=  Median)  o 3.  Quartil  =  0,75-­‐Quantil  =  75%-­‐Perzentil  

• Interquartilsabstand  =  3.  Quartil  –  1.  Quartil    

• Maximum  /  Minimum:  größter  /  kleinster  gemessener  Wert  • Spannweite  (=  Range)  =    Maximum  -­‐  Minimum  

 

 

Grafische  Darstellungen  

• 2  Möglichkeiten:  o Histogramm  o Boxplot  

• Normalverteilung  liegt  vor,  wenn…  o …im  Histogramm  alle  Säulen  annähernd  wie  eine  Gauß’sche  Glockenkurve  

angeordnet  sind.  o …der  Boxplot  symmetrisch  ist.    

   

6    

• Histogramm:                  

o Faustregel  für  Klassenanzahl:   𝑛  o Range  geteilt  durch  Anzahl  aller  Klassen  ergibt  die  Klassenbreite  o Klassenbreite:  

§ „(„  oder  „)“  à    Wert  nicht  mehr  enthalten  § „[“    oder  „]“    à    Wert  noch  enthalten  

         

• Boxplot:  

   

Klasse  

7    

Bivariate  Analysen  

 

Risikomaßzahlen  

• Odds  Ratio  (=  Quotenverhältnis):  o Einzige  Risikomaßzahl,  die  sich  aus  retrospektiven  Studien  (Fall-­‐Kontroll-­‐

Studien)  ableiten  lässt,  da  sie  nicht  von  der  Prävalenz  abhängt  o Schätzwert  für  das  Relative  Risiko  (Je  geringer  die  Prävalenz  einer  Erkrankung,  

desto  besser  stimmt  das  OR  mit  dem  RR  überein)  o Verhältnis  aus  Exposition  und  Nicht-­‐Exposition  bei  eingetretenem  Ereignis,  

geteilt  durch  das  Verhältnis  aus  Exposition  und  Nicht-­‐Exposition  bei  nicht  eingetretenem  Ereignis  

o Möglicher  Wertebereich:  OR  ≥  0  § 0  ≤  OR  <  1   à    Exposition  hat  präventiven  Einfluss    (Medikament)  § OR  =  1     à    Exposition  hat  keinen  Einfluss  § OR  >  1     à    Exposition  hat  schädigenden  Einfluss    (Nikotin)  

• Risiko  unter  Exposition:  o Anteil  aller  Exponierten,  bei  denen  das  Ereignis  eingetreten  ist,  geteilt  durch  

alle  Exponierten  • Risiko  unter  Nicht-­‐Exposition:  

o Anteil  aller  Nicht-­‐Exponierten,  bei  denen  das  Ereignis  eingetreten  ist,  geteilt  durch  alle  Nicht-­‐Exponierten  

• Relatives  Risiko:  

o Verhältnis  aus  RExp  und  RNExp      (  RExpRNExp

 )  

o Wertebereich  wie  bei  Odds  Ratio  • Relative  Risikoreduktion:  

o =  1-­‐RR  • Absolute  Risikoreduktion  (ARR)  /  -­‐zunahme  (ARI):  

o Differenz  zwischen  RExp  und  RNExp  o Die  absoluten  Werte  von  ARR  und  ARI  sind  gleich  (|ARR|  =  |ARI|),  lediglich  

das  Vorzeichen  variiert.  Welcher  Wert  letztendlich  angegeben  wird,  hängt  davon  ab,  was  betont  werden  soll.  

• Number  needed  to  treat  (NNT)  /  Number  needed  to  harm  (NNH):  o Kehrwert  der  absoluten  Werte  (ARR  /  ARI)  o NNT  /  NNH  besagen,  wie  viele  Patienten  exponiert  werden  müssen,  um  ein  

Ereignis  eintreten  zu  lassen.  o Soll  die  schädigende  Wirkung  hervorgehoben  werden,  spricht  man  von  der  

NNH  (z.B.  Nikotin),  soll  die  präventive  Wirkung  hervorgehoben  werden,  spricht  man  von  der  NNT  (z.B.  Medikament).  

8    

Zusammenhang  zweier  quantitativer  Variablen  

• Kovarianz:  o Zusammenhangsmaß  zwischen  zwei  Merkmalen,  wobei  jede  Beobachtung  

einen  positiven  oder  negativen  Beitrag  liefert.  o Durch  den  Schwerpunkt  wird  je  eine  Gerade  parallel  zur  X-­‐  und  Y-­‐Achse  

gezeichnet.  Die  Wertepaare  in  den  somit  entstandenen  vier  Quadranten  werden  ausgezählt.  

o Wertebereich:  Alle  reellen  Zahlen  o Einheit:  [Variable  1]  *  [Variable  2]  

 • Korrelationskoeffizient  (r):  

o Wertebereich:  [-­‐1  ;  +1]  § r  =  -­‐1     à    linearer  antiproportionaler  Zusammenhang  § -­‐1  <  r  <  0   à    negativer  Trend  erkennbar  § r  =  0     à    kein  Zusammenhang  erkennbar  § 0  <  r  <  +1   à    positiver  Trend  erkennbar  § r  =  +1     à    linearer  proportionaler  Zusammenhang  

o Einheit:  keine  Einheit    

 • Lineare  Regression:  

o dient  der  Vorhersage  eines  Wertes  auf  der  Y-­‐Achse,  bei  bekanntem  zugehörigen  X-­‐Wert  (nicht  andersherum!)  

   

9    

Diagnostische  Verfahren  

 

Gütekriterien  

• Sensitivität:  o Wahrscheinlichkeit  alle  Kranken  zu  erkennen  o „Wenn  ich  krank  bin,  mit  welcher  Wahrscheinlichkeit  wird  der  Test  dann  auch  

positiv  sein“  • Spezifität:  

o Wahrscheinlichkeit  alle  Gesunden  zu  erkennen  o „Wenn  ich  gesund  bin,  mit  welcher  Wahrscheinlichkeit  wird  der  Test  dann  

auch  negativ  sein“  • Sensitivität  und  Spezifität:  

o werden  „vor  dem  Test“  erfragt,  d.h.  das  Testergebnis  ist  noch  nicht  bekannt  o Bei  infektiologischen  Suchtests  sollte  die  Sensitivität  hoch  sein,  damit  man  

möglichst  viele  Kranke  als  krank  erkennen  kann.  Dabei  nimmt  man  in  Kauf,  dass  möglicherweise  auch  Gesunde  als  falsch-­‐positiv  getestet  werden.  (Bestätigungstest  sollte  spezifisch  sein)  

o Bei  Screening-­‐Tests  sollte  die  Spezifität  hoch  sein,  damit  möglichst  alle  Gesunden  erkannt  werden.  Hier  steht  die  Verhinderung  der  „Überdiagnose“  und  damit  verbundenen  „Übertherapie“  im  Vordergrund.  Die  Konsequenzen  bei  Nicht-­‐Erkennen  eines  Kranken  sind  nicht  so  weitreichend  wie  bei  den  infektiologischen  Suchtests.  

o Es  gilt:  § 100%  =  Sensitivität  +  Falsch-­‐Negative  § 100%  =  Spezifität  +  Falsch-­‐Positive  

 • Positiver  prädiktiver  Wert  (PPW):  

o Wahrscheinlichkeit  bei  positivem  Testergebnis,  auch  wirklich  krank  zu  sein.  o „Wenn  der  Test  positiv  ist,  mit  welcher  Wahrscheinlichkeit  bin  ich  dann  

wirklich  krank?“  • Negativer  prädiktiver  Wert  (NPW):  

o Wahrscheinlichkeit  bei  negativem  Testergebnis,  auch  wirklich  gesund  zu  sein.  o „Wenn  der  Test  negativ  ist,  mit  welcher  Wahrscheinlichkeit  bin  ich  dann  auch  

wirklich  gesund?“  • PPW  und  NPW:  

o werden  „nach  dem  Test“  erfragt,  d.h.  das  Testergebnis  ist  bekannt  und  wird  hinterfragt  

o Die  prädiktiven  Werte  sind  Prävalenz-­‐abhängig.  Es  gilt:  § Prävalenz                à      PPW                à      NPW  

10    

Referenzbereich  

• dient  zur  Unterscheidung  zwischen  „unauffällig  (=gesund?)“  und  „auffällig  (=krank?)“  • beschreibt  einen  Wertebereich,  in  dem  sich  95%  aller  gesunden  Werte  befinden  

(absolute  Zahlen,  keine  Wahrscheinlichkeiten!)    

• Grenzen  des  Referenzbereiches  bei  Normalverteilung:                

 

 

 

• Grenzen  des  Referenzbereiches  bei  Nicht-­‐Normalverteilung:  

 

 

 

 

 

 

 

   

• Die  Spezifität  ist  gleich  dem  Referenzbereich,  da  beide  dasselbe  beschreiben:  Die  Spezifität  beschreibt  die  richtig-­‐negativen  und  der  Referenzbereich  beinhaltet  95%  der  gesunden  Werte.  Damit  wird  die  Spezifität  durch  den  Referenzbereich  festgelegt  (i.d.R.  95%).  

   

11    

Statistische  Analyse  einer  quantitativen  Zielvariable  

 

Konfidenzintervalle  

• Definition:  Das  KI  ist  ein  Intervall,  das  mit  einer  vorgegebenen  Wahrscheinlichkeit  1−α  (i.d.R.  gilt  α  =  5%,  also  1-­‐  α  =  95%)  den  zu  schätzenden  wahren  Parameter  der  Verteilung  in  der  Grundgesamtheit  überdeckt.  

• Der  wahre  Mittelwert  (=  Erwartungswert  =  µ)  der  Grundgesamtheit  bleibt  unbekannt,  kann  aber  anhand  des  empirischen  Mittelwertes  der  untersuchten  Stichprobe  geschätzt  werden.  Dieser  empirische  Mittelwert  der  Stichprobe  muss  nun  nach  rechts  und  links  durch  ein  Intervall  erweitert  werden,  um  die  Wahrscheinlichkeit,  den  wahren  Mittelwert  darin  erfassen  zu  können,  zu  vergrößern.  

           

       

• Grenzen  des  Konfidenzintervalls:    

o Untere  Grenze:      

o Obere  Grenze:    

o Es  gilt:  Je  größer  n  und  kleiner  s,  desto  kleiner  wird  das  KI  (die  Konfidenzwahrscheinlichkeit  bleibt  aber  trotz  verkleinertem  KI  bei  95%,  da  sie  nur  von  t  abhängig  ist,  nicht  jedoch  von  n  oder  s)  

   

• Referenzbereich  und  Konfidenzintervall  haben  nichts  miteinander  zu  tun!  o Unterschiede:  

§ Der  Referenzbereich  gibt  an,  welcher  prozentuale  Anteil  der  Messwerte  innerhalb  der  Grenzen  liegt  (keine  Wahrscheinlichkeiten!)  

§ Das  KI  beschreibt  die  Genauigkeit  einer  Schätzung  eines  unbekannten  Parameters  in  der  Grundgesamtheit  

§ Grenzen  des  KI  werden  zusätzlich  durch  Stichprobenumfang  beeinflusst      

 

   

12    

Statistische  Tests  

• Nullhypothese  (H0):  besagt,  es  besteht  „null  Unterschied“,  „null  Zusammenhang“,  d.h.  dass  eine  Intervention  keinen  Einfluss  hat  

• Alternativhypothese  (H1):  ist  die  Hypothese,  die  der  Untersucher  belegen  möchte,  d.h.  dass  die  Intervention  einen  Einfluss  hat    

• Testdurchführung:  Obwohl  die  Alternativhypothese  nachgewiesen  werden  soll,  wird  immer  die  Nullhypothese  getestet.  Wenn  sich  H0  als  falsch  /  nicht  zutreffend  herausstellt,  darf  sie  abgelehnt  werden  und  damit  H1  angenommen,  also  als  zutreffend  angesehen  werden.  Wenn  also  ein  Testergebnis  statistisch  nicht  signifikant  ist,  muss  H0  beibehalten  werden.  Sobald  der  Test  signifikant  ist,  wird  H0  verworfen.  Das  Signifikanzniveau  (=  α)  wird  i.d.R.  auf  0,05  (=  5%)  festgelegt.    

• Da  das  Signifikanzniveau  bei  5%  liegt,  bleibt  immer  eine  Restwahrscheinlichkeit,  Fehler  bei  der  Testentscheidung  zu  machen.  Man  unterscheidet:  

o Fehler  1.  Art:  H0  wird  abgelehnt,  da  der  gemessene  Wert  fälschlicherweise  nicht  im  Intervall  gelegen  hat,  obwohl  dies  richtig  gewesen  wären.  (Der  Fehler  1.  Art  wird  direkt  durch  das  Signifikanzniveau  bestimmt)  

o Fehler  2.  Art:  H0  wird  fälschlicherweise  beibehalten,  obwohl  sie  eigentlich  abgelehnt  werden  müsste.  

 

Testentscheidung  mithilfe  des  p-­‐Wertes  

• Der  p-­‐Wert  ist  das  Ergebnis  eines  Signifikanztests  zur  Prüfung  der  Nullhypothese  • Es  gilt:  

o  verwerfe  H0,  falls  gilt:    p  ≤  α      (i.d.R.  p  ≤  0,05)  o verwerfe  H0  nicht,  falls  gilt:    p  >  α  

• den  p-­‐Wert  könnte  man  als  das  „α“  sehen,  bei  dem  die  Nullhypothese  gerade  noch  abgelehnt  werden  darf  

• Falls  das  Signifikanzniveau  nicht  anders  angegeben  ist,  wird  immer  von  α  =  5%  =  0,05  ausgegangen.  Dies  entspricht  einer  Konfidenzwahrscheinlichkeit  von  95%.      

• Beispiele:  o Falls  p  =  0,01,  könnte  man  auf  einem  1%-­‐Signifikanzniveau,  d.h.  mit  einer  

99%-­‐Konfidenzwahrscheinlichkeit  die  Nullhypothese  ablehnen.  Das  „α“  wäre  in  diesem  Fall  mit  0,01  kleiner  als  die  zur  statistischen  Signifikanz  benötigte  Höchstgrenze  von  α  =  0,05.  Es  gilt  also:  p  ≤  α    à  H0  verwerfen!  

o Falls  p  =  0,84,  müsste  man  auf  einem  84%-­‐Signifikanzniveau,  d.h.  nur  mit  einer  16%-­‐Konfidenzwahrscheinlichkeit  die  „Nullhypothese  ablehnen“.  Merke:  Signifikanzniveau  =  Irrtumswahrscheinlichkeit,  die  also  in  diesem  Fall  auch  bei  84%  liegen  würde  (=  Fehler  1.  Art!)  Es  gilt:  p  >>  α    à  H0  beibehalten!  

   

13    

Nullhypothesen  

• t-­‐Test  für  (un)verbundene  Stichproben:  Die  Erwartungswerte  sind  gleich.    

• Mann-­‐Whitney-­‐U-­‐Test:  Die  Verteilungsfunktionen  sind  gleich.    

• Chi-­‐Quadrat-­‐Test:  Die  Variablen  sind  voneinander  unabhängig.    

• Vorzeichen-­‐Test:  Wirkung  ist  gleich.    

• Kolmogorov-­‐Smirnov-­‐Test:  Die  Variablen  sind  normalverteilt.    

• Levene-­‐Test:  Die  Varianzen  sind  gleich.    

   

14    

Analysen  von  Überlebenszeiten  

 

Kaplan-­‐Meier-­‐Kurve  

• auf  X-­‐Achse:  kumulierte  Überlebensrate  [%]  • auf  Y-­‐Achse:  Zeit  • Vorteil:  Es  werden  auch  zensierte  Daten  berücksichtigt  

o Zensierte  Daten:  alle,  die  nicht  gestorben  sind  und  in  die  Wertung  eingehen  (ob  abgebrochen,  oder  nicht)  à  Berücksichtigung  von  Fällen,  bei  denen  kein  Todeszeitpunkt  bekannt  ist  

 • Bei  jedem  eingetretenem  Ereignis  rutscht  die  Kurve  eine  Stufe  herunter