Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel...

51

Transcript of Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel...

Page 1: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.
Page 2: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Formulierung und Überprüfung von

Hypothesen

Page 3: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Statistische Kennwerte

• z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz

mehr oder weniger genaue Beschreibung

Page 4: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Nun aber:

• Eigenschaften einer Population werden zunächst postuliert und dann überprüft

• Überprüfung anhand einer Stichprobe

Page 5: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Stichprobenergebnisse

• Starke Zufallsschwankungen!

• Wie weit darf Stichprobe von der Behauptung (Hypothese) abweichen um noch mit der Theorie über einzustimmen?

zentrale Frage

Page 6: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Beispiel: folgende Behauptung

Die durchschnittliche Unterrichtsleistungen von Schülern, die nach einer herkömmlichen Methode unterrichtet wurden, sind schlechter als die Durchschnittsleistungen von Schülern, die nach einer neuen Methode unterrichtet wurden! (Alternativhypothese – H1)

Page 7: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

H0

Nullhypothese:

Die neue Methode ist genauso gut oder schlechter wie die alte Methode!

kein Unterschied

(null und nichtig…)

Page 8: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Das Ergebnis der Untersuchung bezieht sich nur auf die Stichprobe während die Hypothesen die Verhältnisse in der Population beschreiben!

Es besteht immer die Möglichkeit, dass die Stichprobenauswahl ZUFÄLLIG nicht mit der Population übereinstimmt!

Page 9: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Hypothesen

• H0: μ0≥ μ1 Die Unterrichtsmethoden unterscheiden sich nicht oder die neue Methode ist sogar schlechter!

• H1: μ0< μ1 Die neue Methode ist besser als die herkömmliche Methode!

Page 10: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Es gilt:

Nur wenn die Realität „praktisch“ nicht mit der Nullhypothese zu erklären ist, darf sie zugunsten der neuen Alternativhypothese verworfen werden.

Page 11: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Fehlerarten bei statistischen Entscheidungen

Wahrer Sachverhalt:

H0

Wahrer Sachverhalt:

H1

durch einen stat. Test fällt eine Entscheidung für die Nullhypothese H0

Richtige Entscheidung

beta (Fehler 2. Art, falsch negativ)

durch einen stat.Test fällt eine Entscheidung für die alternative Hypothese H1

alpha (Fehler 1. Art, falsch positiv)

Richtige Entscheidung

Page 12: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

SIGNIFIKANZAUSSAGENÜberprüfung der neuen Lernmethode anhand einer Stichprobe

Das Ergebnis zeigt, dass tatsächlich im Durchschnitt bessere Leistungen mit der neuen Methode erbracht wurden! (Annahme des Beispiels)

Ist das Ergebnis rein ZUFÄLLIG oder nicht?

Page 13: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

ALLGEMEIN lautet die Frage:

Die Wahrscheinlichkeit, mit der das gefundene Ergebnis oder extremere Ergebnisse bei Gültigkeit von H0 eintreten, bezeichnet man als α-Fehlerwahrscheinlichkeit oder Irrtumswahrscheinlichkeit.

Je geringer der Wert desto unwahrscheinlicher die H0!

Page 14: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Bestimmung der Irrtumswahrscheinlichkeit

Die Verteilung der Mittelwerte in einer zufällig gezogenen Stichprobe (nach der alten Methode unterrichtet) hat Normalform. (nach zentralem Grenzwerttheorem…)

Page 15: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Bestimmung der Irrtumswahrscheinlichkeit

Der Lernerfolg der nach der neuen Methode unterrichteten Stichprobe ist durch ein „x quer“ markiert!

… wurde im Bsp. als besser angenommen

Page 16: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Bestimmung der Irrtumswahrscheinlichkeit

graue Fläche P besagt, mit welcher Wahrscheinlichkeit die gleiche oder bessere Durchschnittsleistung auch von der „alten“ Methode erzielt werden könnte!

Page 17: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Bestimmung der Irrtumswahrscheinlichkeit

graue Fläche P gibt daher die Wahrscheinlichkeit an, mit der wir uns bei der Entscheidung für H1 bei einem Ergebnis „x quer“ irren würden.....

die Irrtumswahrscheinlichkeit

Page 18: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Zur Rechnung - ANGABE

herkömmliche Methode - durchschnittlich erzielter Lernerfolg: μ0=40(z.B.: Anzahl der gelösten Aufgaben)Streuung der Leistung: σ=0,8

bei einer Stichprobe von Schülern (n=100), die mit der neuen Methode unterrichtet wurden, ergab sich eine durchschnittliche Leistung von x=42.

Page 19: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Nun ist zu überprüfen:

Mit welcher Wahrscheinlichkeit hätten 100 Schüler auch mit der herkömmlichen Methode eine durchschnittliche Leistung von 42 oder besser erzielen können!

Es besteht nämlich die Möglichkeit, dass die neue Methode nicht besser ist, sondern nur per ZUFALL eine derartige Leistung erbracht wurde.

Page 21: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

z-Transformation

Durch die z-Transformation können sämtliche Normalverteilungen standardisiert werden, d.h. auf einen Standard gebracht werden.

Wir bezeichnen deshalb die Normalverteilung mit μ=0 und σ=1 als Standardnormalverteilung.

Page 22: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

z-Transformation

Es muss deshalb lediglich ermittelt werden, welcher z-Wert in der Standardnormalverteilung (Mittelwert (Mittelwert = 0 und Streuung = 1)= 0 und Streuung = 1) dem gefundenen x-Wert (bei uns 42) in unserer Verteilung (μ0=40 und σ=0,8)

entspricht!

Page 23: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

z-Transformation

0

x

z

Page 24: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Für das Beispiel ergibt sich folgender z-Wert:

50,28,0

40420

xz

Nachschlagen in der Standardnormalverteilungstabelle:

Page 25: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Standardnormalverteilung

Page 26: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.
Page 27: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

z-Wert Φ(-z) Φ(z)

Nach der Tabelle schneidet dieser z-Wert 0,62% von der Normalverteilungsfläche ab!

Page 28: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Ergebnis

… gefärbter Flächenanteil bzw. Wahrscheinlichkeit dafür, dass das gefundene oder ein extremeres Ergebnis auch bei der Gültigkeit der H0 hätte auftreten können beträgt somit P=0,62%

= Wahrscheinlichkeit, dass wir H0 fälschlich verwerfen = Irrtumswahrscheinlichkeit

x=42 ist nur sehr schwer mit H0 in Einklang zu bringen!

Page 29: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Interpretation

P=0,62%

…wenn 10000 Stichproben nach der herkömmlichen Methode unterrichtet werden, können wir nur in ca. 62 Fällen mit einer durchschnittlichen Leistung von 42 rechnen

…schlechter Beleg für H0

Page 30: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Interpretation

P=0,62%

…es bleibt nun dem Forscher überlassen, ob er bereit ist sich für die H1 zu entscheiden und sich dabei mit einer Wahrscheinlichkeit von 0,62% irrt!

Page 31: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Das Signifikanzniveau

Wegen der Vergleichbarkeit und der Qualität statistisch abgesicherter Entscheidungen hat sich daher folgendes Niveau eingebürgert:

H0 ist erst dann zu verwerfen, wenn die Irrtumswahrscheinlichkeit P kleiner oder gleich 5% ist(Medizin: 1%)

Page 32: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Das Signifikanzniveau• Beträgt die Wahrscheinlichkeit des

gefundenen oder eines extremeren Untersuchungsergebnisses unter der Annahme, die H0 sei richtig, höchstens 5%, so wird dieses Ergebnis als signifikant bezeichnet.

• Beträgt diese Wahrscheinlichkeit höchstens 1%, so ist das Ergebnis sehr signifikant.

Page 33: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

ACHTUNG

Eine statistische Hypothesenprüfung führt NICHT zur Wahrheit, sondern nur zu Wahrscheinlichkeiten!

… bei der Entscheidung für die H1 müssen wir immer mit einem -Fehler rechnen!

… einen -Fehler in Kauf nehmen

Page 34: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Einseitige und zweiseitige Tests

Eine Hypothese kann gerichtet oder ungerichtet sein!

Am Beispiel der Unterrichtsmethoden:gerichtet: die eine Methode ist besser als die

andere Methode einseitiger TestUngerichtet: beide Methoden unterscheiden

sich

Page 35: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Einseitiger Test

für die H0

für die H0

Page 36: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Einseitiger TestNun könnte man den Wert, der die 5% - Grenze markiert suchen!

Gesucht: z-Wert, der die 5% - Grenze markiert

z1- = z0,95 = 1,65 ist der Wert, der von der rechten Seite der Standardnormalverteilung genau 5% abschneidet!

Page 37: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

z-Wert Φ(-z) Φ(z)

Nach der Tabelle schneidet dieser z-Wert 5% von der Normalverteilungsfläche ab!

xCRIT = μ0 + z1- · σ = 40 + 1,65 · 0,8 = 41,32

Page 38: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Interpretation

Alle Werte, die mindestens so groß sind (x≥41,32) befinden sich im Ablehnungsbereich für H0

xCRIT = μ0 + z1- · σ = 40 + 1,65 · 0,8 = 41,32

Page 39: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Zweiseitiger Test

Die beiden Methoden unterscheiden sich! (ungerichtete Hypothese)

x-Werte, die deutlich kleiner oder größer sind als μ0 deuten auf die Richtigkeit der H1

Page 40: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Zweiseitiger Test

Die Grenzen müssen nun so gewählt werden, dass an beiden Seiten der Verteilung INSGESAMT 5% abgeschnitten werden, also an beiden Seiten jeweils 2,5%.

Page 41: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Zweiseitiger Test

43,388,0)96,1(40

96,1

20

025,02

)2(

zx

zz

CRIT

57,418,096,140

96,1

)21(0

975,021

)21(

zx

zz

CRIT

Page 42: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.
Page 43: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Interpretation

x-Werte, die kleiner oder gleich 38,43 und größer oder gleich 41,57 sind führen zu einer Ablehnung der H0

Page 44: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Fortsetzung des Beispiels:

Nun ist ein -Fehlerniveau von 1% zu wählen:

Einseitiger Test:

Zweiseitiger Test:

Page 45: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

z-Wert Φ(-z) Φ(z)

Page 46: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Einseitiger Test – Lösung:1% - Grenze

1% - Grenze

z-Wert der die 1% - Grenze markiert ist gesucht!

z1- = z0,99 = 2,33

xCRIT = μ0 + z1- · σ = 40 + 2,33 · 0,8 = 41,864

Page 47: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

z-Wert Φ(-z) Φ(z)

Page 48: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Zweiseitiger Test – Lösung: 1% - Grenze

936,378,0)58,2(40

58,2

20

005,02

)2(

zx

zz

CRIT

064,428,058,240

58,2

)21(0

995,021

)21(

zx

zz

CRIT

Page 49: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Beispiel 1:Zwei Unterrichtsmethoden werden miteinander verglichen. herkömmliche Methode (A) - durchschnittlich erzielter Lernerfolg: μ0=12(z.B.: Anzahl der gelösten Aufgaben)Streuung der Leistung: σ=1,2

Bei einer Stichprobe von Schülern, die mit der neuen Methode (B) unterrichtet wurden, ergab sich eine durchschnittliche Leistung von x=13.

a) In wie viel Prozent der Fällen erbringen auch Schüler mit Methode A diese Leistung?b) Ist A wirklich schlechter?c) Suche jenen kritischen Wert, der mit einer Irrtumswahrscheinlichkeit von 5% B als die bessere Methode identifiziert.

Page 50: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

Beispiel 2:Frau Prof. Katschnig behauptet, dass bei ständiger Anwesenheit in der Übung im durchschnitt nur 10 Studenten die Prüfung nicht schaffen. (Streuung = 3,13)

Nun stellt sich die Frage ab wie vielen durchgefallenen Studenten die Behauptung nicht mehr haltbar ist (bei einer Irrtumswahrscheinlichkeit von 5%)!

Page 51: Formulierung und Überprüfung von Hypothesen Statistische Kennwerte z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz.

DANKE FÜR IHRE AUFMERKSAMKEIT