Download - Grundbegriffe der statistik

Transcript
Page 1: Grundbegriffe der statistik

Grundbegriffe der Statistik

Skript Kapitel 6.2, Seite 130

Page 2: Grundbegriffe der statistik

Grundbegriffe der Statistik

Ich glaube nur derStatistik, die ich

selbst gefälscht habe

Page 3: Grundbegriffe der statistik

„Wer misst, misst Mist...“

Analysenergebnisse sind stets mit einem Fehler behaftetMit Hilfe von statistischen Verfahren lassen sich diese Fehler objektiv beurteilen

Page 4: Grundbegriffe der statistik

Fehler

Fehler = Differenz zwischen demwahren und dem gemessenen WertBei „normalen“ Proben kennen wir nur den Messwert, nicht aber den wahren WertWir unterscheiden zwischen zufälligenund systematischen Fehlern

Page 5: Grundbegriffe der statistik

Arten von Fehlern:der zufällige Fehler

Wahrer Wert• Die Werte streuen zufällig

und häufen sich um einenmittleren Wert.

• Entsteht während derMessung durch nicht beherr-schte Änderungen der Probeund der Messgeräte.

• Unregelmässig bezüglichBetrag und Vorzeichen.

• Beispiel: Zittern der letztenZiffer beim Einwägen.

Page 6: Grundbegriffe der statistik

Arten von Fehlern:der systematische Fehler

Wahrer Wert• Die Werte weichen deutlich

vom wahren Wert ab.• Entsteht durch bleibende

Unvollkommenheiten imAnalysenverfahren und inder Probe.

• Beispiel: Falsche Einwaagebei der Herstellung einer 0.1 molaren Natriumoxalat-lösung.

Page 7: Grundbegriffe der statistik

Messunsicherheit:Präzision und Genauigkeit

Die Präzision (auch Reproduzierbar-keit) sagt aus, wie gut die Ergebnisse mehrerer Analysen untereinander übereinstimmen. Die Genauigkeit (auch Richtigkeit)beschreibt, wie gut die Ergebnisse mit dem wahren Wert übereinstimmen.

Page 8: Grundbegriffe der statistik

Messunsicherheit:Präzision und Genauigkeit

Messunsicherheit

Präzision(Reproduzierbarkeit)

Zufällige Fehler

Genauigkeit(Richtigkeit)

Systematische Fehler

Page 9: Grundbegriffe der statistik

Zufällige und systematische Fehler

Genauigkeit: gutPräzision: schlecht

Genauigkeit: schlechtPräzision: gut

Page 10: Grundbegriffe der statistik

Statistische Kenngrössen:Mittelwert

Auch „Durchschnitt“ genanntFormelzeichen⎯x („x quer“)Berechnet sich aus der Summe aller Messwerte xi geteilt durch die Anzahl der Werte n:

n

x

n...xxx

x i321 ∑=+++=

Page 11: Grundbegriffe der statistik

Statistische Kenngrössen:Mittelwert

Messwerte:Gesamt-Phosphor im Belebtschlamm 5.9 mg P/l

5.4 mg P/l

5.8 mg P/l

5.7 mg P/l

22.8 mg P/l : 4 =5.7 mg P/l5.7 mg P/l

5.95.45.85.7

Page 12: Grundbegriffe der statistik

Statistische Kenngrössen:Mittlerer Fehler

Vergleich eines Messwertes mit dem Mittelwert einzelner absoluter Fehler dMittelwert aus allen absoluten Fehlern mittlerer Fehler⎯dBerechnung:

n

)x(x

n

...xxxxxxd

n...ddd

d

i321

321

−=

+−+−+−=

+++=

Page 13: Grundbegriffe der statistik

Statistische Kenngrössen:Mittlerer FehlerMess-wert

Fehler(Messwert - Mittelwert)

absoluter Fehler d

5.9 5.9 - 5.7 = 0.2 0.25.4 5.4 - 5.7 = -0.3 0.35.8 5.8 - 5.7 = 0.1 0.15.7 5.7 – 5.7 = 0.0 0.0

0.6 : 4 =Mittlerer Fehler = 0.15 mg P/lMittlerer Fehler = 0.15 mg P/l

Page 14: Grundbegriffe der statistik

Statistische Kenngrössen:Standardabweichung

Wichtiges Mass für die StreuungDie absoluten Fehler werden vor dem Zusammenzählen quadriert, nach der Mittelwertbildung wird die Wurzel gezogenBei Stichproben wird durch n-1 dividiertBerechnung:

1n)x(x

1n...)x(x)x(x)x(x

s2

i2

32

22

1

−−

=−

+−+−+−= ∑

Page 15: Grundbegriffe der statistik

Statistische Kenngrössen:StandardabweichungMess-wert

Fehler(Messwert - Mittelwert)

Fehler-Quadrat

5.9 5.9 - 5.7 = 0.2 0.045.4 5.4 - 5.7 = -0.3 0.095.8 5.8 - 5.7 = 0.1 0.015.7 5.7 – 5.7 = 0.0 0.00

0.14 : 3 = 0.0467

Standardabweichung = 0.22 mg P/lStandardabweichung = 0.22 mg P/l

n-1

davon die Quadratwurzel 0.216

Page 16: Grundbegriffe der statistik

Statistische Kenngrössen:Relative Standardabweichung

Die relative Standardabweichung (Variations-koeffizient V) erlaubt den Vergleich der Streuung unterschiedlicher Konzentrationen oder ParameterDie Standardabweichung wird relativ zum Mittelwert ausgedrückt (in Prozent)Berechnung:

100%xs

V ⋅=

Page 17: Grundbegriffe der statistik

Statistische Kenngrössen:Relative Standardabweichung

Probe Mittelwert Standardabweichung1 5.7 mg P/l 0.22 mg P/l2 1.2 mg P/l 0.09 mg P/l

Bei welcher Probe war die Messung reproduzierbarer?Antwort gibt die relative Standardabweichung:

3.86% 100%5.70.22

V:1 Probe =⋅=

7.5% 100%1.20.09

V:2 Probe =⋅=

Page 18: Grundbegriffe der statistik

Normalverteilung:Tabelle

316 341 303 340 260 354337 320 356 327 300 380327 316 316 379 319 322348 344 327 305 274 340284 403 310 335 350 369322 360 316 340 319 319360 272 360 338 310 379341 250 316 332

Kaliumpermanganatverbrauch [mg/l] Gruppe Anzahl-250

251-275276-300301-325326-350351-375376-400

401-

Gruppe Anzahl-250 1

251-275 3276-300 2301-325 15326-350 15351-375 6376-400 3

401- 1

Um die Verteilung der Daten darstellen zu können, teilenwir die Resultate in acht Gruppen ein und zählen dieMesswerte in jeder Gruppe.

Page 19: Grundbegriffe der statistik

Normalverteilung:HäufigkeitsdiagrammGruppe Anzahl

-250 1251-275 3276-300 2301-325 15326-350 15351-375 6376-400 3

401- 1

Die grafische Darstellung der gruppierten Daten nenntman Häufigkeitsdiagramm oder Histogramm.

Häufigkeitsverteilung der KMnO4-Resultate

02468

10121416

-250 251-275

276-300

301-325

326-350

351-375

376-400

401-

mg KMnO4/l

Anza

hl M

essw

erte

Page 20: Grundbegriffe der statistik

Normalverteilung:Gaußsche Glockenkurve

230 245 260 275 290 305 320 335 350 365 380 395 410 425

• keine systematischen Fehler• Gruppenbreite 5 mg/l• sehr viele Messergebnisse

C.F. Gauß (1777-1855)

Page 21: Grundbegriffe der statistik

230 245 260 275 290 305 320 335 350 365 380 395 410 425

Eigenschaften derNormalverteilung

• Standardabweichung bestimmt die Wendepunkte• Kurve symmetrisch um den Mittelwert

Mittelwert = 329

s=31s=31

WendepunktWendepunkt

Page 22: Grundbegriffe der statistik

230 245 260 275 290 305 320 335 350 365 380 395 410 425

ss

68%

230 245 260 275 290 305 320 335 350 365 380 395 410 425

2 s 2 s

• ca. 2/3 aller Messwerte liegen im Bereich ⎯x ± s

95%

Eigenschaften derNormalverteilung

• 19 von 20 Messwerten liegen im Bereich ⎯x ± 2s

Page 23: Grundbegriffe der statistik

Statistische Kenngrössen:Median

Entspricht bei den nach der Grösse aufgelisteten Messwerten dem in der Mitte liegenden WertAuch „Zentralwert“ genanntUnempfindlich gegenüber AusreissernEntspricht bei exakt symmetrischen Verteilungen dem Mittelwert

Page 24: Grundbegriffe der statistik

Statistische Kenngrössen:Spannweite

Differenz zwischen dem grössten und dem kleinsten Wert einer Reihe von MesswertenFormelzeichen REmpfindlich gegenüber Ausreissern

Page 25: Grundbegriffe der statistik

2.5 2.6 2.72.8 3.4

Statistische Kenngrössen:Median und Spannweite

2.5 2.6 2.7 2.8 3.4Messwerte

2.8Mittelwert

Median 2.72.7

Spannweite 0.9

Page 26: Grundbegriffe der statistik

Statistische Kenngrössen:Median

12.3 12.7 13.112.1 12.6

Fall 1: Ungerade Anzahl Messwerte:

5.7 5.95.4 5.8

Fall 2: Gerade Anzahl Messwerte:

12.6

5.7 5.8

5.75

Page 27: Grundbegriffe der statistik

Grafische Darstellungen:Diagramme

Ein Bild sagt mehr als tausend Worte!Ein Bild sagt mehr als tausend Worte!

Page 28: Grundbegriffe der statistik

Grafische Darstellungen:XY-Diagramm

0

10

20

30

40

50

60

0 2 4 6

X-Werte

Y-W

erte Das XY-Diagramm eignet

sich dazu, Zusammenhängezwischen zwei Zahlen-

reihen darzustellen

Page 29: Grundbegriffe der statistik

Grafische Darstellungen:Balken/Säulen-Diagramm

Dieser Diagrammtyp eignet sichz.B. für den Vergleich unter-

schiedlicher Analysenmethoden,Probentypen etc.

0

10

20

30

40

50

60

A B C D

Kategorien

Wer

te

Page 30: Grundbegriffe der statistik

Grafische Darstellungen:Kuchen-Diagramm

Das Kuchendiagramm zeigtdie prozentuelle Aufteilungeines zusammengesetzten

Werts in seine Komponenten.

Gesamt-NNH4NO2NO3

Page 31: Grundbegriffe der statistik

Grafische Darstellungen:Regeln

Auf optische Spielereien und unüber-sichtliche 3D-Darstellungen verzichtenNicht zu viele Daten ins gleiche Diagramm hineinzwängenDas Diagramm soll selbsterklärend seinAuf sinnvolle Skalierung der Achsen achten

Page 32: Grundbegriffe der statistik

Qualitätssicherung im Labor

Skript Kapitel 6.3, Seite 134

Page 33: Grundbegriffe der statistik

Analysenkenndaten

Was leistet meine Analysenmethode?Eignet sie sich überhaupt für die Fragestellung?

Methoden-validierung

Analysenkenndaten

Page 34: Grundbegriffe der statistik

Analysenkenndaten:Präzision

Mass für die Reproduzierbarkeit der gesamten analytischen MethodeBerechnung der relativen Standard-abweichung aus mehreren Wiederhol-messungen der gleichen Probe

Beispiel: Präzision der PO4-P-Messung

V = 3.86% (n=4, c=5.7 mg/l)

Beispiel: Präzision der PO4-P-Messung

V = 3.86% (n=4, c=5.7 mg/l)

Page 35: Grundbegriffe der statistik

Analysenkenndaten:Genauigkeit

Abweichung eines Resultats vom wahren Wert Test mit einer Lösung bekannter Konzentration (z.B. Ringversuch)

Beispiel: Genauigkeit KMnO4 beim Ringversuch

Sollwert: 377 mg/l Messwert: 416 mg/lAbweichung: +39 mg/l bzw. +10.3%

Beispiel: Genauigkeit KMnO4 beim Ringversuch

Sollwert: 377 mg/l Messwert: 416 mg/lAbweichung: +39 mg/l bzw. +10.3%

Page 36: Grundbegriffe der statistik

Analysenkenndaten:Linearität

Linearität einer Analysenmethode bedeutet, dass die Messwerte entweder direkt oder nach einer Umrechung proportional zur Konzentration der interessierenden Substanz sind

Beispiele, wo die Linearität aufhört:

• Extinktion bei hohen Konzentrationen• KMnO4 ab 5 ml Titrationsvolumen

Beispiele, wo die Linearität aufhört:

• Extinktion bei hohen Konzentrationen• KMnO4 ab 5 ml Titrationsvolumen

Page 37: Grundbegriffe der statistik

Analysenkenndaten:Messbereich

Derjenige Konzentrationsbereich der interessierenden Substanz in der Probe, in dem eine Messung mit akzeptabler Präzision, Genauigkeit und Linearität möglich ist

Beispiel: BSB5

Messbereich Sauerstoff in derVerdünnung: 2 bis 6 mg O2/l

Beispiel: BSB5

Messbereich Sauerstoff in derVerdünnung: 2 bis 6 mg O2/l

Page 38: Grundbegriffe der statistik

Analysenkenndaten:Robustheit

Kleine Veränderungen im Verfahren sollen keinen Einfluss auf das Resultat habenKlärwärter A sollte das gleiche Ergebnis erhalten wie Klärwärter B

Page 39: Grundbegriffe der statistik

Analysenkenndaten:Nachweisgrenze

Kleinste Konzentration in einer Probe, die noch nachgewiesen werden kannDer gemessene Wert muss sich vom Geräte-Rauschen unterscheiden

Beispiel: ChromatografieRauschenNachweisgrenze

Beispiel: ChromatografieRauschenNachweisgrenze

Page 40: Grundbegriffe der statistik

Analysenkenndaten:Bestimmungsgrenze

Kleinste Konzentration in einer Probe, die sich noch mit einer akzeptablen Präzision und Genauigkeit bestimmen lässt

Beispiel: Unterschiedliche NH4-Konzentrationen

• Präzision 5% bei 1 mg/l• Präzision 10% bei 0.1 mg/l Best.grenze• Präzision 30% bei 0.01 mg/l

Beispiel: Unterschiedliche NH4-Konzentrationen

• Präzision 5% bei 1 mg/l• Präzision 10% bei 0.1 mg/l Best.grenze• Präzision 30% bei 0.01 mg/l

Page 41: Grundbegriffe der statistik

Analysenkenndaten:Selektivität / Spezifität

Selektivität: Stören andere Komponenten in der Probe die Messung der interessierenden Substanz?Spezifität: Stammt das gemessene Signal wirklich von der interessierenden Substanz und nicht von anderen Komponenten aus der Probe?

Page 42: Grundbegriffe der statistik

Qualitätssicherung im Labor:Kontrollkarten

Analysenmethode nicht zur bei der Einführung, sondern auch in der Routine regelmässig überprüfenTestlösung (Standard oder stabile Probe) mehrmals messen und die Präzision der Analyse bestimmenIm Routinebetrieb die Testlösung mitlaufen lassenMessergebnisse grafisch auswerten(auf Kontrollkarte eintragen)

Page 43: Grundbegriffe der statistik

Kontrollkarten:Beispiel

KMnO4-Analysenmethode mit Zuckerlösung überprüfenTestlösung 7 mal messen:Mittelwert ⎯x = 214 mg/lStandardabw. s = 8 mg/lWarngrenzen bei ⎯x ± 2s (NV 95%)

oben 230 mg/l, unten 198 mg/lKontrollgrenzen bei ⎯x ± 3s (NV 99.7%)

oben 238 mg/l, unten 190 mg/l

Page 44: Grundbegriffe der statistik

Kontrollkarten:Beispiel

180

190

200

210

220

230

240

250

0 2 4 6 8 10 12 14 16

Analysennummer

mg

KM

nO4/

l

Warngrenze

Warngrenze

Kontrollgrenze

Kontrollgrenze

Mittelwert

Page 45: Grundbegriffe der statistik

Kontrollkarten:Methode überprüfen bei...

1 Wert ausserhalb der Kontrollgrenze7 aufeinanderfolgende Werte auf einer Seite der Mittelswertlinie7 aufeinanderfolgende Werte mit ansteigender Tendenz7 aufeinanderfolgende Werte mit absteigender Tendenz2 von 3 aufeinanderfolgenden Werten ausserhalb der Warngrenze10 von 11 Werten auf einer Seite der Mittelwertslinie

Page 46: Grundbegriffe der statistik

Aufdecken systematischer Fehler

Problem:Systematische Fehler werden durch Mehrfachbestimmungen mit der gleichen Methoden nicht entdecktLösung:- Überprüfung mit einer zweiten,

unabhängigen Methodeund/oder

- Vergleichsmessung mit anderen Labors