Irrtumswahrscheinlichkeiten Freiheitsgrade Stichprobe ... · IOW-Statistikseminar: 1. Veranstaltung...

22
IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert Statistische Methoden in den Umweltwissenschaften Irrtumswahrscheinlichkeiten Freiheitsgrade Stichprobe Skalentypen

Transcript of Irrtumswahrscheinlichkeiten Freiheitsgrade Stichprobe ... · IOW-Statistikseminar: 1. Veranstaltung...

Page 1: Irrtumswahrscheinlichkeiten Freiheitsgrade Stichprobe ... · IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert Grundgesamtheit und Stichprobe • Wie groß ist die

IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert

Statistische Methoden in den Umweltwissenschaften

Irrtumswahrscheinlichkeiten

Freiheitsgrade

Stichprobe

Skalentypen

Page 2: Irrtumswahrscheinlichkeiten Freiheitsgrade Stichprobe ... · IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert Grundgesamtheit und Stichprobe • Wie groß ist die

IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert

Grundgesamtheit und Stichprobe

• Wie groß ist die mittlere Blattlänge der Seegräser in einer Seegraswiese ?

• Bestes Verfahren: Alle Seegräser der Seegraswiese vermessen

(= Grundgesamtheit) Man kann den wahren Mittelwert (µ) berechnen Das ist allerdings oft nicht möglich…

• Ausreichendes Verfahren: Eine möglichst hohe Anzahl (= Stichprobe, Teilmenge)

der Seegräser vermessen Der wahre Mittelwert kann nur geschätzt werden (m) Daraus ergibt sich immer ein Fehlerrisiko >0 (= Irrtumswahrscheinlichkeit)

Page 3: Irrtumswahrscheinlichkeiten Freiheitsgrade Stichprobe ... · IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert Grundgesamtheit und Stichprobe • Wie groß ist die

IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert

Wiederholungen und Replikate

• Stichprobenumfang (= n) ist die Anzahl der Wiederholungen oder Replikate

• WARUM ?? Erfassen der natürlichen und systematischen Variabilität

• REPLIKAT = experimentelle Einheit

– Replikate sind unabhängige Wiederholungen !

– ABER, wie groß ist die experimentelle Einheit ???

– Fehleinschätzung der Skalierung einer experimentellen Einheit: die angenommenen Replikate sind nicht unabhängig

– Pseudo-Replikate sind ein sehr häufiges und ernstes Problem

Page 4: Irrtumswahrscheinlichkeiten Freiheitsgrade Stichprobe ... · IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert Grundgesamtheit und Stichprobe • Wie groß ist die

IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert

Das Problem der Pseudo-Replikate

• Zeitliche Pseudo-Replikate

– Vermessen der selben Probe über einen Zeitraum (Wachstumsexperimente!)

Zeit

Zeit

• Räumliche Pseudo-Replikate

– Beprobung der Wassersäule mit Wasserschöpfern an CTD

IOW-Fotogalerie, Terminfahrt März 2009

Page 5: Irrtumswahrscheinlichkeiten Freiheitsgrade Stichprobe ... · IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert Grundgesamtheit und Stichprobe • Wie groß ist die

IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert

Gepoolte Proben

• Gemischte Proben:

– Mittelwertbestimmung

– Keine Variabilität bestimmbar 1 2 3 4 5 6

C

Page 6: Irrtumswahrscheinlichkeiten Freiheitsgrade Stichprobe ... · IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert Grundgesamtheit und Stichprobe • Wie groß ist die

IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert

Replikate in der Mikrobiellen Ökologie ?

See 1 See 2

10 ml Wasserprobe

Auszählen der Abundanz der Bakterien: 1,4 x 106 Zellen ml-1 < 3,2 x 106 Zellen ml-1

Keine Replikate, daher keine Schlussfolgerung bzgl. Unterschiede in der Bakterienabundanz beider Seen

10 ml Wasserprobe

Page 7: Irrtumswahrscheinlichkeiten Freiheitsgrade Stichprobe ... · IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert Grundgesamtheit und Stichprobe • Wie groß ist die

IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert

Replikate in der Mikrobiellen Ökologie ?

See 1 See 2

10 ml Wasserprobe

Erstellen je einer 16S rRNA Klonbibliothek, Sequenzieren von je 200 Klonen Bestimmen der relativen Abundanz verschiedener phylogenetischer Gruppen, Rechnen von phylogenetischen Bäumen, etc.: Bakterielle Gemeinschaft beider Seen Vergleich der Ergebnisse der beiden Wasserproben und Schlussfolgerung bzgl. Unterschiede in der bakteriellen Gemeinschaft beider Wasserproben

10 ml Wasserprobe

Page 8: Irrtumswahrscheinlichkeiten Freiheitsgrade Stichprobe ... · IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert Grundgesamtheit und Stichprobe • Wie groß ist die

IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert

Versuchsplanung (in der Mikrobiellen Ökologie)

• Neues Zeitalter: Next Generation Sequencing, PhyloChips

– Generierung einer ernormen Anzahl von Sequenzen

– 90.000 Sequenzen von jedem See? Aber besser 3 x 30.000 Sequenzen !

• Wenn der Probenumfang vergrößert werden kann, sollte die Anzahl der Replikate erhöht werden ! (und nicht die Messwiederholungen und Pseudo-Replikate)

Page 9: Irrtumswahrscheinlichkeiten Freiheitsgrade Stichprobe ... · IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert Grundgesamtheit und Stichprobe • Wie groß ist die

IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert

Nullhypothese H0

• Formulieren einer Arbeitshypothese H - aber testen der Nullhypothese H0

• Häufig beinhaltet die Nullhypothese H0 die Gleichheit von Sachverhalten, bzw. dass das Ergebnis ein Zufallsprodukt ist, zum Beispiel:

dass zwischen Gruppen kein Unterschied besteht,

dass ein bestimmtes Medikament keine Wirkung zeigt,

dass zwischen Merkmalen kein Zusammenhang besteht.

• Ziel: Widerlegen der Nullhypothese

Page 10: Irrtumswahrscheinlichkeiten Freiheitsgrade Stichprobe ... · IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert Grundgesamtheit und Stichprobe • Wie groß ist die

IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert

Seeigel und Seegräser

Mittelmeer: Der Seeigel Paracentrotus lividus beweidet Posidonia oceanica

Page 11: Irrtumswahrscheinlichkeiten Freiheitsgrade Stichprobe ... · IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert Grundgesamtheit und Stichprobe • Wie groß ist die

IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert

Seeigel und Seegräser

Mittelmeer: Der Seeigel Paracentrotus lividus beweidet Posidonia oceanica

Arbeitshypothese: 1. Die Seegrasdichten in einem

Gebiet mit und einem ohne Seeigel unterscheiden sich.

2. In einer Seegraswiese mit Seeigeln ist die Seegrasdichte geringer als in einem Gebiet ohne Seeigel.

Page 12: Irrtumswahrscheinlichkeiten Freiheitsgrade Stichprobe ... · IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert Grundgesamtheit und Stichprobe • Wie groß ist die

IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert

• Nullhypothese:

Seeigel und Seegräser

Die Seegrasdichten im Gebiet mit Seeigeln und ohne Seeigel unterscheiden sich nicht.

(m1 = m2)

m1 m2

Page 13: Irrtumswahrscheinlichkeiten Freiheitsgrade Stichprobe ... · IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert Grundgesamtheit und Stichprobe • Wie groß ist die

IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert

Seeigel und Seegräser

• Gegenhypothese 1:

Die Seegrasdichte im Gebiet ohne Seeigel ist größer als im Gebiet mit Seeigeln.

(m1 > m2)

m1 m2

Page 14: Irrtumswahrscheinlichkeiten Freiheitsgrade Stichprobe ... · IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert Grundgesamtheit und Stichprobe • Wie groß ist die

IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert

Seeigel und Seegräser

• Gegenhypothese 2:

Die Seegrasdichte im Gebiet ohne Seeigel ist kleiner als im Gebiet ohne Seeigel.

(m1 < m2)

m1

m2

Page 15: Irrtumswahrscheinlichkeiten Freiheitsgrade Stichprobe ... · IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert Grundgesamtheit und Stichprobe • Wie groß ist die

IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert

alpha- und beta-Fehler

Realität

Die Seegrasdichten beider Gebiete unterscheiden

sich nicht

Die Seegrasdichten beider Gebiete unterscheiden

sich

Statistischer Test

Nullhypothese wird nicht abgelehnt

Richtige Entscheidung, es wird kein Fehler

begangen

Typ II Fehler (beta)

Nullhypothese wird abgelehnt

Typ I Fehler (alpha)

Richtige Entscheidung, es wird kein Fehler

begangen

Nullhypothese: Die Seegrasdichten im Gebiet mit Seeigeln und ohne Seeigel unterscheiden sich nicht (m1 = m2).

Page 16: Irrtumswahrscheinlichkeiten Freiheitsgrade Stichprobe ... · IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert Grundgesamtheit und Stichprobe • Wie groß ist die

IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert

Testentscheidung: alpha-Fehler

• Maximale Irrtumswahrscheinlichkeit (Signifikanzniveau): muss vor dem Test vorgegeben werden

• z.B. 0,1% 1% 5%

• p-Wert (probability, Irrtumswahrscheinlichkeit) wird mit dem vorgegebenen Signifikanzniveau verglichen

Testentscheidung: Wenn p < alpha, dann wird die Nullhypothese abgelehnt. Die Gegenhypothese (= Arbeitshypothese) wird angenommen.

Page 17: Irrtumswahrscheinlichkeiten Freiheitsgrade Stichprobe ... · IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert Grundgesamtheit und Stichprobe • Wie groß ist die

IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert

Das Testen von Hypothesen

• Da die Irrtumswahrscheinlichkeit < 5%, kann die Nullhypothese (m1 = m2) abgelehnt werden, d.h. m1 < m2

Nullhypothese: Gegenhypothesen:

m1 = m2

m1 < m2

m1 > m2

Seeigel

mit ohne

Spr

ossd

icht

e See

gras

0

2

4

6

8

10

12

14

16

18

m1

m2

p < 0.001

Page 18: Irrtumswahrscheinlichkeiten Freiheitsgrade Stichprobe ... · IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert Grundgesamtheit und Stichprobe • Wie groß ist die

IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert

Seeigel und Seegräser: 1-seitig oder 2-seitige ?

Mittelmeer: Der Seeigel Paracentrotus lividus beweidet Posidonia oceanica

Arbeitshypothese: 1. Die Seegrasdichten in einem

Gebiet mit und einem ohne Seeigel unterscheiden sich.

2. In einer Seegraswiese mit Seeigeln ist die Seegrasdichte geringer als in einem Gebiet ohne Seeigel.

Page 19: Irrtumswahrscheinlichkeiten Freiheitsgrade Stichprobe ... · IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert Grundgesamtheit und Stichprobe • Wie groß ist die

IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert

1-seitige oder 2-seitige Signifikanz ?

• Die Arbeitshypothese entscheidet, ob die 1-seitige oder 2-seitige Signifikanz die richtige ist.

2-seitige Fragestellung

Besteht zwischen zwei Messwerten ein Unterschied, ohne dass die

Richtung des Unterschiedes wichtig ist ?

(m1 < m2 oder m1 > m2)

1-seitige Fragestellung

Besteht zwischen zwei Messwerten ein Unterschied und

geht dieser Unterschied in die erwartete Richtung ?

(m1 < m2)

• Der 2-seitige Wert ist immer exakt doppelt so hoch wie der entsprechende 1-seitige Wert. Der 1-seitige Wert hat es damit “leichter”, signifikant zu werden, erfordert aber die genauere Arbeitshypothese.

Page 20: Irrtumswahrscheinlichkeiten Freiheitsgrade Stichprobe ... · IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert Grundgesamtheit und Stichprobe • Wie groß ist die

IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert

Freiheitsgrade

• Der Stichprobenumfang n, der zur Schätzung eines Parameters herangezogen wird, ist der Ausgangspunkt für die Festlegung der zur Verfügung stehenden Freiheitsgraden.

• Wird z.B. die Varianz (s2 ) einer Verteilung mit n Werten geschätzt, dann ist die Anzahl der Freiheitsgrade n-1, da die Formel zur Berechnung von Varianz den Mittelwert als weiteren Parameter enthält.

Anzahl der Freiheitsgrade

Anzahl der unabhängigen

Einzelinformationen

Anzahl der eingehenden

Parameter = -

1)²(

²−−

= ∑n

xxs i

Page 21: Irrtumswahrscheinlichkeiten Freiheitsgrade Stichprobe ... · IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert Grundgesamtheit und Stichprobe • Wie groß ist die

IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert

Bayes-Statistik etc.

• Reconstruction of the Annelida phylogenetic tree.

• TH Struck et al. Nature 471, 95-98 (2011) doi:10.1038/nature09864

Majority rule consensus trees of the Bayesian inference analysis using the site-heterogeneous CAT model of the data set with 39 taxa and 47,953 amino acid positions. Only PP (top of branch or alone) and BS (bottom) values ≥ 0.70 or 70, respectively, are shown. The branch leading to Myzostomida is reduced by 75%. Annelida are highlighted in red, with Sedentaria in blue and Errantia in green. Grey bars indicate additional annelid groups. *, BS value for the monophyly of Annelida without Myzostomida in the maximum likelihood analysis is 99.

Page 22: Irrtumswahrscheinlichkeiten Freiheitsgrade Stichprobe ... · IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert Grundgesamtheit und Stichprobe • Wie groß ist die

IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert

Skalentypen

• Nominal-Skala

„Klassenskala“

Endliche diskrete Skala, d.h. es liegen endlich viele Merkmalsausprägungen (Klassen) vor, OHNE Rangordnung

Bsp. Einteilung Geschlecht, morphologische Gruppen

• Ordinal-Skala

„Rangskala“

Diskrete Skala MIT Rangordnung

Bsp. Deckungsgrad bei Vegetationskartierung

• Metrische-Skala

„Kardinalskala“

Diskrete metrische Skala, Differenzbildung ist interpretierbar

Messgrößen wie Temperatur, Abundanz, Biomasse