Statistik

573
Inhalte Organisatorisches Einf¨ uhrung Aufbereitung der erhobenen Daten Einf¨ uhrung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2011 Waldherr / Christodoulides Einf¨ uhrung in Quantitative Methoden- 1.VO 1/49

description

 

Transcript of Statistik

Page 1: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Einfuhrung in Quantitative Methoden

Mag. Dipl.Ing. Dr. Pantelis Christodoulides&

Mag. Dr. Karin Waldherr

SS 2011

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 1/49

Page 2: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

I Bedeutung der Psychologischen Methodenlehre und Statistikfur Psychologie

I GrundbegriffeI Beschreibende Statistik (Deskriptivstatistik):

I Aufbereitung von Daten mittels Tabellen, Grafiken,statistischen Kennzahlen.

I Zusammenhangsmaße.

I Versuchsplanung

I Grundlagen der Wahrscheinlichkeitstheorie und spezielleWahrscheinlichkeitsverteilungen

I Statistische Schlusse, Parameterschatzung und Logik desHypothesentestens (ausgewahlte statistische Testverfahren)

I Berechnungen handisch und mit Statistik-Programm ”SPSS”

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 2/49

Page 3: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Vorlesungsunterlagen und KontaktPrufungErganzende Literaturbegleitende Ubung & Tutorien

I SPSS: erhaltlich im Rechenzentrum der Universitat Wien,www.univie.ac.at/zid/software-shop

I Vorlesungsunterlagen: Folien werden spatestens Mittwochmittag zum Download zur Verfugung gestellt. Die Folienersetzen nicht den Vorlesungsbesuch! Sie sind nur alsErleichterung gedacht; prufungsrelevant sind die Inhalte, die inder Vorlesung gebracht werden.

I Homepage:psychologie.univie.ac.at/grundlagenforschung/studium/methodenlehre

I Die Folien unterliegen einem Copyright.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 3/49

Page 4: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Vorlesungsunterlagen und KontaktPrufungErganzende Literaturbegleitende Ubung & Tutorien

I schriftliche Prufung

I 4 Prufungstermine (Ende Juni, Oktober,November/Dezember, Janner), s. Homepage fur genaueTermine

I Theorieteil: Multiple Choice-Fragen.Praktischer Teil: Rechenbeispiele oder Interpretation einesSPSS-Ausdruckes.Sowohl im MC-Teil als auch im Praktischen Teil istMindestpunkteanzahl notwendig fur positive Note!

I Sprechstunde: nach Vereinbarung(e-mail: [email protected])

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 4/49

Page 5: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Vorlesungsunterlagen und KontaktPrufungErganzende Literaturbegleitende Ubung & Tutorien

I Zusatzliche Literatur:Bortz, J. & Doring, N. (2006). Forschungsmethoden undEvaluation fur Human- und Sozialwissenschaftler. (4.Auflage). Berlin: Springer.Buhner, M. & Ziegler, M. (2009). Statistik fur Psychologenund Sozialwissenschaftler. Munchen: Pearson Studium.Eid, M., Gollwitzer, M, & Schmitt, M. (2010). Statistik undForschungsmethoden. Mit Online-Materialien. Weinheim:BeltzSedlmeier, P. & Renkewitz, F. (2008). Forschungsmethodenund Statistik in der Psychologie. Pearson Studium.

I Zusatzliche MaterialienI www.neuestatistik.deI www.mathe-online.at

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 5/49

Page 6: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Vorlesungsunterlagen und KontaktPrufungErganzende Literaturbegleitende Ubung & Tutorien

I Ubungen zur Statistik: mehrere Parallelveranstaltungen,Anwesenheitspflicht, Beispiele sind vorzubereiten, Anmeldungin Univis.

I Ubungsbeispiele werden auf der Homepage jeweils amMittwoch nachmittag zum Download bereitgestellt.

I Tutorien zur Vorlesung und zu den Ubungen: s. Homepage

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 6/49

Page 7: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

I Psychologie = empirische Wissenschaft(auf Erfahrung beruhend):

I Bortz & Doring: Empirische Forschung sucht nachErkenntnissen durch systematische Auswertung vonErfahrungen.

I Psychologische Methodenlehre beschaftigt sich mit Fragen derPlanung und Auswertung empirischer Untersuchungen

I Gute Untersuchungsplanung entscheidend furAussagekraft der Ergebnisse einer empirischenUntersuchung!

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 7/49

Page 8: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

I Warum benotigt eine Klinische Psychologin undGesundheitspsychologin in freier Praxis, die nicht selbstempirische Untersuchungen durchfuhren mochte, Kenntnisseder Psychologischen Methodenlehre und Statistik?

I Psychologisches Gutachten:Zur Auswahl geeigneter psychologischer Testverfahren und derInterpretation der Ergebnisse (Umgang mit Normtabellen)Kenntnisse der Statistik notwendig.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 8/49

Page 9: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

I Behandlung:Ethischer Grundsatz: Anwendung evidenzbasierterBehandlungsmethoden. Behandlungsmethoden, derenEffektivitat in Studien mit entsprechendem Studiendesigngezeigt werden konnte. ⇒ Notwendigkeit, die Qualitat einerStudie, Untersuchungsdesign, statistische Auswertung undInterpretation, nachzuvollziehen und kritisch zu bewerten.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 9/49

Page 10: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

”Goldstandard” in der medizinischen und psychologischenForschung sind randomisiert kontrollierte Studien (”randomizedcontrolled trials”, RCT’s).Kontrolliert, weil die Ergebnisse in der Studiengruppe mit deneneiner Kontrollgruppe ohne Intervention oder einerKontrollintervention verglichen werden. Kontrollintervention:bisher wirksamste Maßnahme oder eine Scheinintervention (beiMedikamenten Placebo).Die Studiengruppe wird auch als Pruf-, Interventions-,Behandlungs- oder Verumgruppe (lateinisch Verum, ”das Wahre”;im Gegensatz zum Placebo die echte Behandlungsform, z. B. daswirkstoffhaltige Medikament) bezeichnet.Die Kontrollgruppe wird auch als Vergleichs- oder Placebogruppe(sofern Placebos eingesetzt werden) bezeichnet.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 10/49

Page 11: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

Randomisierung bedeutet, dass die Zuordnung zurBehandlungsgruppe (etwa Verhaltenstherapie oderGestalttheoretische Psychotherapie) oder Vergleichsgruppe nachdem Zufallsprinzip erfolgt.Zweck der Randomisierung: 1. Ausschluss der Einflussnahme desUntersuchers (Befangenheit) auf die Zuordnung einer Behandlungund dadurch auf die Studienergebnisse. 2. Gleichmaßige Verteilungvon bekannten und nicht bekannten Einflussfaktoren auf alleGruppen.Form und Durchfuhrung der Randomisierung mussen in der Studieangefuhrt werden.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 11/49

Page 12: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

Quelle: Bortz,J. & Doring,N. Forschungsmethoden und Evaluation.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 12/49

Page 13: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

Gutekriterien einer quantitativen empirischen Untersuchung

I Objektivitat: Ergebnisse sollen unabhangig vom jeweiligenUntersucher sein.

I Validitat = Gultigkeit, Aussagekraft:

1. Interne Validitat = Interpretationseindeutigkeit (keinealternativen Erklarungen moglich)

2. Externe (okologische) Validitat = Verallgemeinerbarkeit derErgebnisse auf andere Personen, Situationen und/oderZeitpunkte.

I Reliabilitat = Zuverlassigkeit, Genauigkeit.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 13/49

Page 14: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

Deskriptivstatistik und Inferenzstatistik

I Deskriptivstatistik oder Beschreibende Statistik:zusammenfassende Beschreibung der Daten, explorativeDatenanalyse (Suchen von Strukturen und Zusammenhangen)

I Inferenzstatistik oder Schließende Statistik:Vollstandige Befragung der interessierenden Grundgesamtheitmeist nicht moglich ⇒ mit Hilfe der Inferenzstatistik werdenaufgrund von Beobachtungen in einer Teilmenge von PersonenRuckschlusse auf Gegebenheiten in der interessierendenGrundgesamtheit gezogen.Ruckschlusse sind mit gewisser Fehlerwahrscheinlichkeitbehaftet = Wahrscheinlichkeitsaussagen.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 14/49

Page 15: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

Population und Stichprobe (1)Aus Grundgesamtheit aller interessierenden Personen = Populationwird eine Teilmenge von Personen ausgewahlt = Stichprobe undaufgrund der Beobachtungen in dieser Stichprobe auf dieGrundgesamtheit geschlossen.

Quelle: www.neuestatistik.de

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 15/49

Page 16: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

Population und Stichprobe (2)

I Beispiel aus dem Alltag: Wenn Sie Spaghetti kochen, werdenSie vielleicht zunachst einige davon aus dem Wasser nehmenum zu uberprufen, ob sie bereits ”al dente” sind. Trifft diesfur diese Stichprobe zu, werden Sie daraus schließen, dass dasmit hoher Wahrscheinlichkeit auch fur die Grundgesamtheitaller von Ihnen ins Wasser gelegten Spaghetti zutrifft.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 16/49

Page 17: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

Population und Stichprobe (3)

I Beispiel: Epidemiologische Studie zur Pravalenzrate vonEssstorungen bei 10-15 Jahrigen in Wien: Liste aller WienerSchulen, Zufallsauswahl von Schulen, Testung von zufalliggewahlten Schulerinnen und Schulern in diesen Schulen.Schluss auf Pravalenzrate in der Grundgesamtheit.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 17/49

Page 18: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

Population und Stichprobe (4)

I Verallgemeinerung auf Population ist nur mitinferenzstatistischen Verfahren zulassig, Deskriptivstatistikmacht nur Aussagen uber die erhobene Stichprobe.

I Inferenzschluss nur bei Zufallsauswahl gultig.

I Population muss eindeutig definiert sein.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 18/49

Page 19: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

Merkmale und Variablen (1)

I Die Psychologie interessiert sich fur Variation vonEigenschaften in der Population bzw. fur gemeinsameVariation mehrerer Merkmale (die Veranderung einesMerkmales in Abhangigkeit von einem anderen).

I In Experimenten wird Veranderung eines Merkmales durchaktive Manipulation eines anderen Merkmales untersucht

I Beispiel: In einem verkehrspsychologischen Experiment wirduntersucht wie sich die Konzentrationsfahigkeit und dieReaktionsgeschwindigkeit von Personen unter verschiedenstarkem Alkoholeinfluss verandern.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 19/49

Page 20: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

Merkmale und Variablen (2)

I Interessierende Merkmale (Eigenschaften) der Personen,welche verschiedene Auspragungen annehmen konnen, werdenals Variablen bezeichnet.

I Eine Variable ist ein Symbol fur eine Menge vonMerkmalsauspragungen. (Bortz & Doring)

I Variablen werden ublicherweise mit lateinischenGroßbuchstaben gekennzeichnet, die konkreten Auspragungen(Realisierungen) mit Kleinbuchstaben.

I Beispiel: Variable X , Geschlecht, steht fur die moglichenMerkmalsauspragungen x ′

1, weiblich, oder x ′2, mannlich

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 20/49

Page 21: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

Funktionale Bedeutung von Variablen (1)

I Unabhangige Variablen (UV): Variablen, deren Einfluss aufeine oder mehrere andere Variablen untersucht wird (auchFaktoren genannt).

I Abhangige Variablen (AV): Variablen, auf die ein Einfluss derVeranderung der unabhangigen Variablen vermutet wird.

I Beispiel: Im verkehrspsychologischen Experiment wareAlkoholeinfluss die unabhangige Variable,Konzentrationsfahigkeit und Reaktionsgeschwindigkeit dieabhangigen Variablen.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 21/49

Page 22: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

Funktionale Bedeutung von Variablen (2)

I Moderierende Variablen oder Moderatorvariablen sindVariablen, die das Ergebnis beeinflussen, indem sie dieWirkung einer unabhangigen Variablen auf die abhangigeVariable verandern (sie beeinflussen Richtung und Starke desZusammenhanges zwischen UV und AV).

I Beispiel: Im verkehrspsychologischen Experiment konnte diegleichzeitige Einnahme von Medikamenten die Alkoholwirkungbeeinflussen.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 22/49

Page 23: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

Funktionale Bedeutung von Variablen (3)

I Mediierende Variablen oder Mediatorvariablen sind Variablen,die den Zusammenhang zwischen zwei Variablen vermitteln(erklaren).

I Beispiel: Altere AutofahrerInnen sind ”bessere”AutofahrerInnen. Dieser Zusammenhang wird durch dieVariable ”Fahrpraxis” vermittelt.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 23/49

Page 24: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

Funktionale Bedeutung von Variablen (4)

Quelle: Faller, H. & Lang, H. (2006). Medizinische Psychologie und

Soziologie (2. Auflage, S.51). Heidelberg: Springer Medizin Verlag.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 24/49

Page 25: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

Funktionale Bedeutung von Variablen (5)

I Storvariablen sind Variablen, die das Untersuchungsergebnisbeeinflussen konnen, aber nicht berucksichtigt wurden.Moglichkeiten zur Ausschaltung von Storvariablen (vgl. Bortz& Doring):

I Randomisierung.I Paarbildung (matched samples): Bei zwei

Untersuchungsgruppen werden aufgrund der Auspragung(en)der moglichen Storvariable(n) ”Paare” vonUntersuchungsteilnehmerInnen gebildet; je eine Person derKontrollgruppe wird einer Person der Studiengruppezugeordnet.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 25/49

Page 26: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

Funktionale Bedeutung von Variablen (6)

I Mogliche Storvariable als zusatzliche Variable erheben und beider statistischen Auswertung als Kontrollvariableberucksichtigen.

I Nur Personen mit einer bestimmten Auspragung dieser Variableuntersuchen (z.B. nur Personen, die keine Medikamenteeingenommen haben); d.h. die Variable konstant halten.

I Außerdem sollte man dafur sorgen, dass die Untersuchung inallen Vergleichsgruppen storungsfrei verlauft (= Ausschaltenvon Storfaktoren).

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 26/49

Page 27: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

Empirische Zuganglichkeit von Variablen

I Manifeste Variablen sind direkt beobachtbar. Z.B.Alkoholmenge, Gewicht, Geschlecht, usw.

I Latente Variablen sind nicht beobachtbar (sichtbar). Z.B.Konzentrationsfahigkeit, Intelligenz, etc. Hierbei handelt essich um sog. hypothetische Konstrukte, welche nur indirektgemessen werden konnen. Aufgrund der Auspragungen vonmanifesten Variablen wird auf die latente Eigenschaftgeschlossen.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 27/49

Page 28: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

Arten von MerkmalsauspragungenI Numerische oder Quantitative Variablen: Auspragungen sind

Zahlenwerte. Z.B. Gewicht, Alter, etc.

I Kategoriale oder Qualitative Variablen: Auspragungen sindZustande oder Kategorien. Z.B. Geschlecht, Familienstand,Staatsburgerschaft.

I Auspragungen quantitativer Variablen lassen sich durchMessen, Zahlen, Wiegen erfassen und unterscheiden sichdurch ihre Große.Auspragungen qualitativer Variablen unterscheiden sich durchihre Art und lassen sich nicht durch Messen, Zahlen, Wiegenerfassen.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 28/49

Page 29: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

Arten qualitativer und quantitativer Variablen

Weiters unterscheidet man:

I Bei quantitativen Variablen zwischen diskreten Variablen,welche nur ganzzahlige Auspragungen haben (1,2,3,. . . ) undstetigen oder kontinuierlichen Variablen, die beliebig feinabstufbar sind.

I Bei qualitativen Variablen zwischen dichotomen Variablen =Variablen mit nur zwei Auspragungen (z.B. Geschlecht) undpolytomen Variablen = Variablen mit mehr als zweiAuspragungen.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 29/49

Page 30: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

Skalenniveau (1)

I Um ein Merkmal zu messen werden den einzelnenAuspragungen Messwerte (Zahlen) auf einer Skala zugeordnet.

I Eine Skala ist eine Vorschrift, die jeder Person der Stichprobeeinen Beobachtungswert zuordnet, der die Auspragung desinteressierenden Merkmales angibt.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 30/49

Page 31: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

Skalenniveau (2)

In diesem Sinne lassen sich auch qualitative Merkmale ”messen”;man nennt diese Zuordnung von Zahlen zu denMerkmalsauspragungen auch Kodierung.Bei der Zuordnung der Zahlen ist zu beachten, dassunterschiedlichen Merkmalsauspragungen unterschiedliche Zahlenzugeordnet werden und jeder moglichen Merkmalsauspragungeindeutig eine Zahl zuordenbar ist.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 31/49

Page 32: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

Skalenniveau (3)

I Nominalskala: Die Skala mit dem niedrigsten Niveau.Rangordnung der Auspragungen nicht moglich oder sinnvoll,auch wenn ihnen Zahlen zugeordnet werden. Beurteilt nurGleichheit und Verschiedenheit von Merkmalsauspragungen.Beispiele: Geschlecht, Familienstand, Staatsburgerschaft.Nominalskalierte Variablen heissen nominale Merkmale.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 32/49

Page 33: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

Skalenniveau (4)

I Ordinalskala oder Rangskala: Auspragungen weisen naturlicheRangordnung auf. Macht Großer-Kleiner-Aussagen. DieAbstande zwischen den verschiedenen Werten einerordinalskalierten Variablen lassen sich jedoch nichtinterpretieren; die Ordinalskala macht keine Aussage uber dieGroße der Unterschiede zwischen den Auspragungen. Solangedie Großer-Kleiner-Relationen erhalten bleiben sind die Zahlenbeliebig wahlbar.

I Typisches Beispiel einer Ordinalskala: Platzierungen beisportlichen Wettkampfen. Platzierung gibt nur Auskunftdaruber wer z.B. am schnellsten war, nicht uber Zeitabstandezwischen den einzelnen Rangplatzen.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 33/49

Page 34: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

Skalenniveau (5)

I Metrische Variablen: Auspragungen unterliegen nicht nurRangordnung, sondern Differenzen sind sinnvollinterpretierbar. Gleich große Zahlendifferenzen entsprechenauch gleich großen Unterschieden zwischen denAuspragungen. Beispiele sind: Gewicht, Große, Alter.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 34/49

Page 35: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

Skalenniveau (7)

I Metrische Skalen konnen weiters noch unterteilt werden inI Intervallskala: kein naturlicher Nullpunkt (z.B. Kalender,

Temperatur in Grad Celsius); Verhaltnisse konnen nichtinterpretiert werden. In der Psychologie wird furPsychologische Tests angenommen, dass die Messwerteintervallskaliert sind.

I Rationalskala: absoluter (naturlicher) Nullpunkt, Verhaltnissekonnen interpretiert werden (Gewicht, Alter, Große, Anzahl derKinder, Temperatur in Kelvin, usw.)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 35/49

Page 36: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

Univariat, Bivariat, Multivariat

I Univariat: nur eine Variable wird betrachtet.

I Bivariat: zwei Variablen werden gemeinsam betrachtet.

I Multivariat: mehr als zwei Variablen werden gemeinsambetrachtet.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 36/49

Page 37: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

Hypothesengenerierende und HypothesenprufendeUntersuchungen

I Hypothesenprufende Untersuchungen: aufgrund vonVorinformationen aus bisherigen Untersuchungen konnenwissenschaftliche Hypothesen formuliert und statistischgepruft werden.

I Hypothesengenerierende Untersuchungen: bei neuenForschungsgebieten, fur welche zu wenige Informationenvorliegen um Hypothesen zu formulieren, werden zunachsthypothesenerkundende Untersuchungen durchgefuhrt. Ziel istdie Formulierung wissenschaftlicher Hypothesen, die in eineranschließenden hypothesenprufenden Untersuchung statistischgepruft werden.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 37/49

Page 38: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

Wissenschaftliche Hypothesen (1)

I Eine wissenschaftliche Hypothese behauptet eine mehr oderweniger prazise Beziehung zwischen zwei oder mehr Variablen,die fur eine bestimmte Population vergleichbarer Objekte oderEreignisse gelten soll. (Bortz & Doring)

I Die Hypothesen mussen im Rahmen derUntersuchungsplanung vor der Datenerhebung formuliertwerden!

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 38/49

Page 39: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

Psychologische Methodenlehre und Statistik - Wozu?Gutekriterien einer quantitativen empirischen UntersuchungGrundbegriffe

Wissenschaftliche Hypothesen (2)

I Wissenschaftliche Hypothesen (im Gegensatz zuAlltagsvermutungen)

I beziehen sich auf reale Sachverhalte, die empirisch uberprufbarsind,

I sind allgemeingultige, uber den Einzelfall hinausgehendeBehauptungen,

I mussen durch Erfahrung widerlegbar (falsifizierbar) sein,I mussen widerspruchsfrei sein,I sollen moglichst prazise formuliert sein,I mussen theoriegeleitet sein.

(vgl. Bortz & Doring)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 39/49

Page 40: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

NotationSummenzeichen

I Die Anzahl der Personen in der Stichprobe =Stichprobenumfang wird mit N bzw. n bezeichnet.

I Die Merkmalsauspragungen der einzelnen Personen in derStichprobe bei Variable X werden mit x1, . . . , xi , . . . , xn (oderin anderer Schreibweise xi , i = 1, . . . , n) bezeichnet.

I Die moglichen Auspragungen (Realisierungen) einesMerkmales X werden mit x ′

1, . . . , x′j , . . . , x

′k (oder in anderer

Schreibweise: x ′j , j = 1, . . . , k) bezeichnet.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 40/49

Page 41: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

NotationSummenzeichen

I Hat man nur ein Merkmal erhoben und notiert dieBefragungsergebnisse in der Reihenfolge der Befragung oderzufallig, bezeichnet man die entstehende Liste als Urliste oderBeobachtungsreihe.

I Beispiel: Erhobene Variable X : Anzahl der Kinder,Stichprobenumfang n = 15.

I Urliste:x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 x14 x15

0 1 2 3 2 1 2 2 4 3 1 2 3 1 0

x2 = 1 bedeutet, dass die in die Urliste an zweiter Stelleeingetragene Person ein Kind hat.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 41/49

Page 42: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

NotationSummenzeichen

Hat man mehrere Merkmale (Variablen) erhoben, fasst man diesein Form einer Datenmatrix zusammen. Die Matrix besteht aus nZeilen fur die Personen und p Spalten fur die erhobenen Variablen(n × p−Matrix).Zeile i enthalt die beobachteten Merkmalsauspragungen der i−tenPerson,Spalte k enthalt die bei den n Personen beobachtetenAuspragungen des Merkmales K .Die Eintragungen x11, . . . , xnp bezeichnen die Auspragungen dereinzelnen Merkmale bei den einzelnen Personen: x11 steht fur dieMerkmalsauspragung der ersten Person beim ersten Merkmal.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 42/49

Page 43: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

NotationSummenzeichen

Beispiel einer Datenmatrix in allgemeiner Notation:

Variable1 2 . . . k . . . p

Person 1 x11 x12 . . . x1k . . . x1p

2 x21 x22 . . . x2k . . . x2p...

.... . .

...i xi1 xi2 . . . xik . . . xip...

.... . .

...n xn1 xn2 . . . xnk . . . xnp

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 43/49

Page 44: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

NotationSummenzeichen

Beispiel einer Datenmatrix fur n = 50 Personen und erhobeneVariablen Geschlecht (1=weiblich, 2=mannlich), Kinderanzahl,Alter

VariableGeschlecht Kinder Alter

Person 1 1 2 402 2 0 25...

......

......

......

...50 2 1 45

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 44/49

Page 45: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

NotationSummenzeichen

In der Statistik benotigt man sehr oft die Summe von Messwerten,z.B. in der Gesamtstichprobe oder einer Teilstichprobe.Hat eine Summe sehr viele Summanden, ist es zweckmaßig dasSummenzeichen

∑(griech. Sigma) zu verwenden.

Zum Beispiel: Summe aller xi fur i = 1 bis n:

x1 + x2 + x3 + . . . + xn =

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 45/49

Page 46: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

NotationSummenzeichen

Zusatzmaterial:

http://www.mathe-online.at/materialien/klaus.berger/files/Summen/summenzeichen.pdf

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 46/49

Page 47: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

NotationSummenzeichen

I Beispiel 1: Summe der Kinder aller Personen aus unsererUrliste

n∑i=1

xi = 0+1+2+3+2+1+2+2+4+3+1+2+3+1+0 = 27

I Beispiel 2: Summe der Kinder der ersten 5 Personen aus derUrliste

5∑i=1

xi = 0 + 1 + 2 + 3 + 2 = 8

I Beispiel 3: Summe der Kinder der letzten 5 Personen aus derUrliste (also Personen 11 bis 15)

15∑i=11

= 1 + 2 + 3 + 1 + 0 = 7

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 47/49

Page 48: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

NotationSummenzeichen

I Laufindex ist beliebig wahlbar

n∑i=1

xi =n∑

j=1

xj =n∑

l=1

xl

I Aber!n∑

i=1

xi 6=n∑

j=1

xi

I

n∑i=1

(xi+yi ) = (x1+y1)+(x2+y2)+. . .+(xn+yn) =n∑

i=1

xi+n∑

i=1

yi

6=n∑

i=1

xi + yi = (x1 + x2 + . . . + xn) + yi

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 48/49

Page 49: Statistik

InhalteOrganisatorisches

EinfuhrungAufbereitung der erhobenen Daten

NotationSummenzeichen

In∑

i=1

a = a + a + a + ... = na

(a ist eine Konstante)

I

n∑i=1

axi = (ax1+ax2+. . .+axn) = a(x1+x2+. . .+xn) = an∑

i=1

xi

I Es gelten die allgemeinen Rechenregeln fur AdditionenZusatzmaterial:http://www.mathe-online.at/materialien/klaus.berger/files/Summen/regenregelnsummen.pdf

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 1.VO 49/49

Page 50: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Einfuhrung in Quantitative Methoden

Mag. Dipl.Ing. Dr. Pantelis Christodoulides&

Mag. Dr. Karin Waldherr

SS 2011

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 1/62

Page 51: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Summenzeichen

In der Statistik benotigt man sehr oft die Summe von Messwerten,z.B. in der Gesamtstichprobe oder einer Teilstichprobe.Hat eine Summe sehr viele Summanden, ist es zweckmaßig dasSummenzeichen

∑(griech. Sigma) zu verwenden.

Zum Beispiel: Summe aller xi fur i = 1 bis n:

x1 + x2 + x3 + . . .+ xn =

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 2/62

Page 52: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Summenzeichen

Zusatzmaterial:

http://www.mathe-online.at/materialien/klaus.berger/files/Summen/summenzeichen.pdf

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 3/62

Page 53: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Summenzeichen

Urliste: Anzahl der Kinder von n = 15 Personenx1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 x14 x15

0 1 2 3 2 1 2 2 4 3 1 2 3 1 0

I Beispiel 1: Summe der Kinder aller Personen aus der Urlisten∑

i=1

xi = 0 + 1 + 2 + 3 + 2 + 1 + 2 + 2 + 4 + 3 + 1 + 2 + 3 + 1 + 0 = 27

I Beispiel 2: Summe der Kinder der ersten 5 Personen aus der Urliste

5∑i=1

xi = 0 + 1 + 2 + 3 + 2 = 8

I Beispiel 3: Summe der Kinder der letzten 5 Personen aus der Urliste(also Personen 11 bis 15)

15∑i=11

xi = 1 + 2 + 3 + 1 + 0 = 7

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 4/62

Page 54: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Summenzeichen

I Laufindex ist beliebig wahlbarn∑

i=1

xi =n∑

j=1

xj =n∑

l=1

xl

I Aber!n∑

i=1

xi 6=n∑

j=1

xi

I

n∑i=1

(xi+yi ) = (x1+y1)+(x2+y2)+. . .+(xn+yn) =n∑

i=1

xi+n∑

i=1

yi

6=n∑

i=1

xi + yi = (x1 + x2 + . . .+ xn) + yi

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 5/62

Page 55: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Summenzeichen

In∑

i=1

a = a + a + a + ... = na

(a ist eine Konstante)

I

n∑i=1

axi = (ax1+ax2+. . .+axn) = a(x1+x2+. . .+xn) = an∑

i=1

xi

I Es gelten die allgemeinen Rechenregeln fur AdditionenZusatzmaterial:http://www.mathe-online.at/materialien/klaus.berger/files/Summen/regenregelnsummen.pdf

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 6/62

Page 56: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

I Die Deskriptivstatistik dient der Beschreibung der erhobenenDaten in der Stichprobe durch

1. Tabellen,2. Statistische Kennwerte, und/oder3. Grafiken.

I Diese Strukturierung, Zusammenfassung und anschaulicheDarstellung der Daten dient aber auch dazu, sich zunachsteinen Uberblick zu verschaffen und ev. Widerspruchlichkeitenzu entdecken (verursacht z.B. durch Dateneingabefehler,falsche Angaben eines Untersuchungsteilnehmers, etc.).

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 7/62

Page 57: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Die Datenmatrix liefert Informationen uber die Charakteristikajeder einzelnen Person. Im allgemeinen ist man allerdings daraninteressiert, wie haufig die einzelnen Merkmalsauspragungen in derStichprobe vorkommen. Dazu kann man sich die Haufigkeitstabellebzw. Haufigkeitsverteilung ansehen.

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 8/62

Page 58: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Nominalskalierte Merkmale

Absolute Haufigkeit, fj , ist die Anzahl von Personen mit der j-tenAuspragung des Merkmals X .

Es gilt stets: Die Summe der absoluten Haufigkeiten fur dieverschiedenen Auspragungen betragt n:

k∑j=1

fj = n

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 9/62

Page 59: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

I Die absoluten Haufigkeiten sind vom Stichprobenumfangabhangig; eignen sich nicht um die Ergebnisse verschiedenerErhebungen mit unterschiedlichem Stichprobenumfang zuvergleichen. Großen, die unabhangig vom Stichprobenumfangsind, sind die relative Haufigkeit und Prozentwerte.

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 10/62

Page 60: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

I Relative Haufigkeit, rj , ist der Quotient

absolute Haufigkeit

Anzahl der Personen=

fjn

Es gilt stets: Es konnen nur Werte zwischen 0 und 1vorkommen; die Summe der relativen Haufigkeiten fur die

verschiedenen Auspragungen betragt 1.

k∑j=1

rj = 1

I Prozentwerte, pzj :

Prozentuelle Haufigkeit = rj × 100

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 11/62

Page 61: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Datenbeispiel 1:

Allgemeine Bevolkerungsumfrage der Sozialwissenschaften(ALLBUS 2006):1 Variable ”Erhebungsgebiet: Alte Bundeslander(= Westdeutschland) oder Neue Bundeslander (=Ostdeutschland)”; Zufallsstichprobe von n = 50 Personen.Kodierung: 1 = Westdeutschland, 2 = Ostdeutschland.

Urliste: 2, 2, 2, 1, 1, 1, 1, 1, 2, 2, 1, 1, 1, 1, 1, 1, 1, 1, 2, 1, 1, 1,1, 2, 2, 2, 2, 1, 2, 2, 1, 1, 1, 2, 1, 1, 2, 1, 2, 2, 1, 2, 1, 2, 2, 1, 1,2, 1, 2

1Das ALLBUS-Programm ist 1980-1986 und 1991 von der DFG (Deutsche Forschungsgemeinschaft) gefordert

worden. Die weiteren Erhebungen wurden von Bund und Landern uber die GESIS (Gesellschaftsozialwissenschaftlicher Infrastruktureinrichtungen) finanziert. ALLBUS wird innerhalb der GESIS an denStandorten Mannheim und Koln in Zusammenarbeit mit dem ALLBUS-Ausschuß realisiert. Die vorgenanntenInstitutionen und Personen tragen keine Verantwortung fur die Verwendung der Daten in dieser Vorlesung.

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 12/62

Page 62: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Haufigkeitstabelle fur Datenbeispiel 1Erhebungsgebiet Strichliste abs. H. rel. H. Prozent

x ′j fj rj pzjWestdeutschland ||||— ||||— ||||— ||||— ||||— |||| 29 0.58 58Ostdeutschland ||||— ||||— ||||— ||||— | 21 0.42 42

Summe 50 1 100

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 13/62

Page 63: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Ordinalskalierte Merkmale

Zusatzlich kumulative Haufigkeitsfunktionen interessant undsinnvoll.Voraussetzung ist, dass die Merkmalsauspragungen der Große nachgeordnet sind.

I Kumulierte absolute Haufigkeit oder EmpirischeVerteilungsfunktion f + = die Summe der absolutenHaufigkeiten der betreffenden Merkmalsauspragung und allerkleineren. Gibt an, wieviele Personen einen Wert haben, derkleiner oder gleich der betreffenden Kategorie l ist.

f +l =

l∑j=1

fj

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 14/62

Page 64: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

I Kumulierte relative Haufigkeit r+ = die Summe der relativenHaufigkeiten der betreffenden Merkmalsauspragung und allerkleineren. Anteil der Personen, die einen Wert haben, derkleiner oder gleich der betreffenden Kategorie l ist.

r+l =

1

n

l∑j=1

fj

I Kumulierte prozentuelle Haufigkeit pz+ = die Summe derprozentuellen Haufigkeiten der betreffendenMerkmalsauspragung und aller kleineren. Prozentwert derPersonen, die einen Wert haben, der kleiner oder gleich derbetreffenden Kategorie l ist.

pz+l = r+

l × 100

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 15/62

Page 65: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Es gilt stets:

f +k =

k∑j=1

fj = n

r+k =

1

n

k∑j=1

fj = 1

pz+k = 100

bei j = 1, . . . , k Merkmalsauspragungen.

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 16/62

Page 66: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Datenbeispiel 2:Variable ”Gesundheitszustand” aus ALLBUS (2006): Kodierung: 1= sehr gut, 2 = gut, 3 = zufriedenstellend, 4 = weniger gut, 5 =schlecht; Zufallsstichprobe von n = 50 Personen.

Urliste: 1, 2, 3, 2, 3, 2, 3, 4, 3, 2, 2, 5, 2, 3, 3, 2, 2, 3, 2, 2, 2, 2,2, 1, 1, 1, 2, 4, 3, 3, 2, 4, 3, 5, 1, 3, 5, 2, 1, 2, 2, 2, 2, 4, 2, 3, 1,2, 4, 4

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 17/62

Page 67: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Haufigkeitstabelle fur Datenbeispiel 2

Gesundheitszustand fj rj pzj f +j r+

j pz+j

sehr gut 7 0.14 14 7 0.14 14gut 22 0.44 44 29(7 + 22) 0.58 58zufriedenstellend 12 0.24 24 41(29 + 12) 0.82 82weniger gut 6 0.12 12 47 0.94 94schlecht 3 0.06 6 50 1.00 100

Summe 50 1.00 100 - - -

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 18/62

Page 68: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Metrische Merkmale

Haufigkeitstabelle unubersichtlich, insbesondere bei stetigenVariablen → Intervalle (= Klassenzusammenfassung odergruppierte Daten). 5-15 Intervalle (max. 20). Je weniger Intervalleumso großer Informationsverlust, je mehr Intervalle umsounubersichtlicher.Variable ”Alter” aus ALLBUS (2006), Zufallsstichprobe vonn = 50 Personen.

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 19/62

Page 69: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Haufigkeitstabelle fur Datenbeispiel 3 mit Originaldaten

Alter fj rj pzj f +j r+

j pz+j

19 1 0.02 2 1 0.02 220 1 0.02 2 2 0.04 424 2 0.04 4 4 0.08 831 1 0.02 2 5 0.10 1033 1 0.02 2 6 0.12 1235 1 0.02 2 7 0.14 1436 2 0.04 4 9 0.18 1838 2 0.04 4 11 0.22 2240 4 0.08 8 15 0.30 3041 2 0.04 4 17 0.34 3442 2 0.04 4 19 0.38 3843 1 0.02 2 20 0.40 40

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 20/62

Page 70: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Fortsetzung Haufigkeitstabelle fur Datenbeispiel 3 mitOriginaldaten

45 1 0.02 2 21 0.42 4246 2 0.04 4 23 0.46 4647 2 0.04 4 25 0.50 5048 2 0.04 4 27 0.54 5449 1 0.02 2 28 0.56 5651 1 0.02 2 29 0.58 5852 1 0.02 2 30 0.60 6053 2 0.04 4 32 0.64 6454 1 0.02 2 33 0.66 6655 2 0.04 4 35 0.70 7056 1 0.02 2 36 0.72 7257 1 0.02 2 37 0.74 7458 1 0.02 2 38 0.76 76

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 21/62

Page 71: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Fortsetzung Haufigkeitstabelle fur Datenbeispiel 3 mitOriginaldaten

60 1 0.02 2 39 0.78 7862 1 0.02 2 40 0.80 8064 2 0.04 4 42 0.84 8466 1 0.02 2 43 0.86 8667 1 0.02 2 44 0.88 8869 1 0.02 2 45 0.90 9071 2 0.04 4 47 0.94 9475 1 0.02 2 48 0.96 9682 1 0.02 2 49 0.98 9885 1 0.02 2 50 1.00 100

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 22/62

Page 72: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Haufigkeitstabelle fur Datenbeispiel 3 mit gruppierten Daten

Alter fj rj pzj f +j r+

j pz+j

≤ 29 Jahre 4 0.08 8 4 0.08 830-39 Jahre 7 0.14 14 11 0.22 2240-49 Jahre 17 0.34 34 28 0.56 5650-59 Jahre 10 0.20 20 38 0.76 7660-69 Jahre 7 0.14 14 45 0.90 90≥ 70 Jahre 5 0.10 10 50 1.00 100

Summe 50 1 100

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 23/62

Page 73: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Haufigkeitstabelle mit SPSS

I Menu Analysieren...

I → Deskriptive Statistik

I → Haufigkeiten...

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 24/62

Page 74: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Histogramm

I Histogramm oder Blockdiagramm - Grafische Darstellung derHaufigkeitstabelle

I Beobachtete Auspragungen x ′j geordnet auf der X -Achse

I Relative (rj) oder absolute Haufigkeiten (fj) auf der Y -Achse

I Rechtecksflachen sind gleich den rj oder fj

I Gesamtflache des Histogramms ist gleich 1 bzw. n

I Maßstab auf der X -Achse beliebig und wird so gewahlt, dassdie Verteilung moglichst anschaulich wird

I Balkendiagramm fur nominalskalierte Variablen

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 25/62

Page 75: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 26/62

Page 76: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Treppenfunktion

I Grafische Darstellung der kumulativen Haufigkeitstabelleanalog zu Histogramm

I Letzte und großte Teilflache ist gleich 1 bzw. n

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 27/62

Page 77: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Treppenfunktion

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 28/62

Page 78: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Lagemaße - Zweck

I Wir wollen die zentrale Tendenz einer Stichprobe moglichstgut schatzen

I Eine Maßzahl, die in geeigneter Weise ein ’Zentrum’ derStichprobe angibt

I Mittelwert, Geometrisches Mittel, Modalwert und Median

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 29/62

Page 79: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Arithmetisches Mittel (Mittelwert)

I Der Mittelwert oder Durchschnittswert ist die Summe allerWerte dividiert durch den Stichprobenumfang n:

Ix =

n∑i=1

xi

n=

1

n

n∑i=1

xi

I Das arithmetische Mittel ist nur fur metrische Variablensinnvoll!

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 30/62

Page 80: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Arithmetisches Mittel (Mittelwert)

Beispiel: Anzahl der Kinder:

Urliste: 0 1 2 3 2 1 2 2 4 3 1 2 3 1 0

x =0 + 1 + 2 + 3 + 2 + 1 + 2 + 2 + 4 + 3 + 1 + 2 + 3 + 1 + 0

15=

=27

15= 1.8

Die durchschnittliche Kinderzahl in der Stichprobe betragt 1.8Kinder.

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 31/62

Page 81: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Arithmetisches Mittel (Mittelwert)Auf Grundlage der Haufigkeitstabelle lasst sich der Mittelwertberechnen, indem man jede Merkmalsauspragung mit ihrerabsoluten Haufigkeit multipliziert und die Summe uber alleMerkmalsauspragungen bildet.

x =1

n

k∑j=1

x ′j · fj

Beispiel: Berechnung des Mittelwertes fur Datenbeispiel 3 aus derHaufigkeitstabelle

x =1

50(19 · 1 + 20 · 1 + 24 · 2 + 31 · 1 + . . .) =

2459

50= 49.18

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 32/62

Page 82: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Eigenschaften des Mittelwertes (1)

Die Summe der Differenzen aller Werte vom Mittelwert ist Null,

n∑i=1

(xi − x) = 0

d.h. positive und negative Abweichungen vom Mittelwert hebensich auf.

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 33/62

Page 83: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Eigenschaften des Mittelwertes (2)

Die Summe der quadrierten Differenzen aller Werte zum Mittelwertist ein Minimum (d.h. ist kleiner als die Summe der quadriertenDifferenzen aller Werte zu irgendeinem anderen Wert)

n∑i=1

(xi − x)2 = Min

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 34/62

Page 84: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Gemeinsamer Mittelwert fur zwei oder mehr Datensatze

Den gemeinsamen Mittelwert aus zwei Stichproben mitMittelwerten x1 und x2 und Stichprobenumfangen n1 und n2

berechnet man, indem man die Mittelwerte mit denStichprobenumfangen gewichtet:

x =n1x1 + n2x2

n1 + n2

Analog fur mehr als zwei Datensatze.

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 35/62

Page 85: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Median und das α-QuantilI Der Median ist dadurch charakterisiert, dass jeweils

mindestens 50% der Beobachtungen einen Wert großer odergleich bzw. kleiner oder gleich dem Median annehmen

I Sind x(1) ≤ · · · ≤ x(n) die der Große nach geordnetenBeobachtungswerte, so ist der Median definiert als

x =

x( n+12

) falls n ungerade

x( n2

) + x( n+22

)

2 falls n gerade

I Bei einer ungeraden Anzahl von Merkmalsauspragungen istder Median der Wert in der Mitte der geordneten Reihe

I Bei einer geraden Anzahl ist der Median das arithmetischeMittel zwischen den beiden mittleren Werten der geordnetenReihe

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 36/62

Page 86: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Median und das α-Quantil

I Beispiel 1: Anzahl der Kinder (n = 15):Urliste: 0 1 2 3 2 1 2 2 4 3 1 2 3 1 0

Geordn. Urliste: 0 0 1 1 1 1 2 2 2 2 2 3 3 3 4

x = x(8) = 2

I Beispiel 2: Anzahl der Kinder (n = 16):

Urliste: 0 1 2 3 2 1 2 2 4 3 1 2 3 1 0 5Geordn. Urliste: 0 0 1 1 1 1 2 2 2 2 2 3 3 3 4 5

x =x(8) + x(9)

2=

2 + 2

2= 2

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 37/62

Page 87: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Median und das α-QuantilI Sind x(1) ≤ · · · ≤ x(n) die der Große nach geordneten

Beobachtungswerte, so ist das α-Quantil (0 < α < 1) definiertals

xα =

x(l) falls n · α keine ganze Zahl ist;

l = die auf n · α folgende ganze Zahlx(l)+x(l+1)

2 falls n · α eine ganze Zahl ist;l = n · α

I Der Median ist das Quantil mit α = 0.50 (0.50-Quantil)

I Die Quantile mit α = 0.25 und α = 0.75 heißen unteres bzw.oberes Quartil

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 38/62

Page 88: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Median und das α-Quantil

Beispiel Anzahl der Kinder (n = 15):

Urliste: 0 1 2 3 2 1 2 2 4 3 1 2 3 1 0Geordnete Urliste: 0 0 1 1 1 1 2 2 2 2 2 3 3 3 4

x = x(8) = 2 x0.25 = x(4) = 1 x0.75 = x(12) = 3

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 39/62

Page 89: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Median und das α-Quantil

I Der Median hat gegenuber dem arithmetischen Mittel denVorteil, dass er auch bei rangskalierten Merkmalen verwendetwerden kann

I Der Median ist weniger empfindlich gegenuber Ausreissern inder Stichprobe

I Werte, die weit von allen ubrigen entfernt liegen, beeinflussenden Median kaum

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 40/62

Page 90: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Ausreisser - Graphische Uberprufung

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 41/62

Page 91: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

ModalwertI Bei nominalskalierten Merkmalen wie Geschlecht oder Beruf

kann man weder das arithmetische Mittel noch den Medianals Lagemaß verwenden

I Der Modalwert (Mod) (haufigster Wert) ist ein dafurgeeignetes Lagemaß

I Der Modalwert gibt die Auspragung an, welche die großteHaufigkeit in der Stichprobe besitzt

I Falls mehrere Auspragungen diese Bedingung erfullen, derModalwert also nicht eindeutig ist, ist es nicht sinnvoll ihn alsLagemaß zu verwenden

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 42/62

Page 92: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Modalwert

Beispiel Anzahl der Kinder (n = 15):

Urliste: 0 1 1 3 2 2 2 3 4 3 1 2 3 1 0

Mod = 1, 2, 3

I Modalwert nicht eindeutig

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 43/62

Page 93: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Bemerkungen zu den Lagemaßen

I Bei mehrgipfeligen und U-formigen Haufigkeitsverteilungensind Lagemaße nicht charakteristisch fur die Verteilung

I Vor der Verwendung eines Lagemaßes immer seineSinnhaftigkeit uberprufen

I Charakterisierung von Haufigkeitsverteilungen

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 44/62

Page 94: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Charakterisierung von Haufigkeitsverteilungen

I Bei einer symmetrischen Verteilung gilt x = x = Mod

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 45/62

Page 95: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Charakterisierung von Haufigkeitsverteilungen

I Lagemaße charakterisieren den Datensatz nicht richtig

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 46/62

Page 96: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

I Bei einer linksschiefen Verteilung gilt x < x < Mod

I Bei einer rechtsschiefen Verteilung gilt x > x > Mod

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 47/62

Page 97: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Wegweiser Lagemaße

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 48/62

Page 98: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Streuungsmaße - ZweckI Streuungsmaße beschreiben die Abweichung von einem

Zentrum einer Haufigkeitsverteilung

I Prazisierung einer Haufigkeitsverteilung durch Lagemaß undStreuungsmaß

I Spannweite, Standardabweichung, Varianz,Variationskoeffizient und Quartilabstand

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 49/62

Page 99: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

SpannweiteI Streubereich einer Haufigkeitsverteilung ist derjenige Bereich,

in dem alle Werte der Stichprobe liegen

I Sind x(1) ≤ · · · ≤ x(n) die der Große nach geordnetenBeobachtungswerte, so ist das Intervall

[x(1), x(n)

]der

Streubereich der Stichprobe

I Spannweite R = x(n) − x(1), d.h. die Breite des Streubereichs

I Ausreisser beeinflussen die Spannweite sehr stark

I Berechnung der Spannweite ist nur fur metrische Variablensinnvoll

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 50/62

Page 100: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

VarianzI Die Varianz s2 ist ein Maß, das die Streuung der Werte um

den Mittelwert ausdruckt

I

s2 =1

n − 1

n∑i=1

(xi − x)2 =1

n − 1

[n∑

i=1

x2i −

(∑n

i=1 xi )2

n

]︸ ︷︷ ︸praktische Berechnungsformel

I Varianz ist ein quadratisches Streuungsmaß und nimmt somitstets positive Werte an

I Ausreisser beeinflussen die Varianz sehr stark, da dieBezugsgroße der Mittelwert ist

I Berechnung der Varianz ist nur fur metrische Variablensinnvoll

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 51/62

Page 101: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

VarianzBeispiel Anzahl der Kinder (n = 15):

Urliste: 0 1 1 3 2 2 2 3 4 3 1 2 3 1 0

15∑i=1

xi = 2815∑i=1

x2i = 72 s2 =

1

14

[72− 784

15

]= 1.38

I Die Varianz laßt sich auch durch die Haufigkeitstabelleberechnen, analog zu Mittelwert

s2 =1

n − 1

k∑j=1

fjx′2j −

(∑k

j=1 fjx′j )

2

n

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 52/62

Page 102: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Varianz

Beispiel Datenbeispiel 3:Haufigkeitstabelle siehe 1. Vorlesungseinheit

50∑i=1

xi = 245950∑i=1

x2i = 132027

s2 =1

49

[132027− 24592

50

]= 226.396

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 53/62

Page 103: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

StandardabweichungI Die Standardabweichung s ist die positive Wurzel aus der

Varianz einer Stichprobe

I

s =+√s2 = +

√√√√ 1

n − 1

n∑i=1

(xi − x)2

I Die Standardabweichung besitzt die gleiche Dimension wie dieBeobachtungswerte (Vorteil gegenuber der Varianz)

I Ausreisser beeinflussen die Standardabweichung sehr stark, dadie Bezugsgroße der Mittelwert ist

I Berechnung der Standardabweichung ist sinnvoll nur furmetrische Variablen

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 54/62

Page 104: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

VariationskoeffizientI Der Variationskoeffizient v ist ein vom Mittelwert bereinigtes

Streuungsmaß

I

v =s

x

I Der Variationskoeffizient misst das Verhaltnis vonStandardabweichung und Mittelwert

I Berechnung von v nur fur metrische Variablen mit positivenWerten sinnvoll

I Der Variationskoeffizient eignet sich zum Vergleich derStreuungen verschiedener Messreihen

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 55/62

Page 105: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Quartilabstand

I

qA = x0.75 − x0.25

I Quartilabstand ist robust gegenuber Ausreissern

I Zwischen dem unteren und oberen Quartil liegen 50% allerWerte

I Berechnung des Quartilabstandes ist sinnvoll fur mindestensrangskalierte Variablen

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 56/62

Page 106: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Quartilabstand

Beispiel Anzahl der Kinder (n = 15):

Urliste: 0 1 2 3 2 1 2 2 4 3 1 2 3 1 0Geordnete Urliste: 0 0 1 1 1 1 2 2 2 2 2 3 3 3 4

x = x(8) = 2 x0.25 = x(4) = 1 x0.75 = x(12) = 3

qA = x0.75 − x0.25 = 2

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 57/62

Page 107: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Ausreisser - Grafische Uberprufung

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 58/62

Page 108: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Wegweiser Streuungsmaße

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 59/62

Page 109: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Schiefe

I Die Schiefe g1 ist eine Maßzahl, die uns angibt, in welcheRichtung eine Haufigkeitsverteilung schief ist

g1 =1n

∑ni=1(xi − x)3√

( 1n

∑ni=1(xi − x)2)3

I Ist g1 = 0, so ist die Verteilung symmetrisch

I Je starker negativ/positiv g1 ist, destolinksschiefer/rechtsschiefer ist die Verteilung

I Die Schiefe ist sinnvoll fur eingipfelige Verteilungen

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 60/62

Page 110: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

I Messwerte von Personen verschiedener Populationen sind oftnicht direkt vergleichbar, z.B. die Leistung eines Madchens inKugelstoßen mit jener eines Knaben

I Dennoch mochte man ausdrucken konnen, wie gut jeder derbeiden Leistungen innerhalb der Bezugsgruppe ist

I Der Standardmesswert t∗i bezieht den beobachteten Messwertxi der i-ten Person auf den Mittelwert x der Gruppe unddruckt die Abweichung in Standardeinheiten s aus

I

t∗i =xi − x

s

I Es gilt t = 0 und s2t = 1

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 61/62

Page 111: Statistik

GrundbegriffeUnivariate Deskriptive Statistik

Tabellarische Darstellung - HaufigkeitstabelleHaufigkeitsverteilung - Histogramm und TreppenfunktionStatistische Kennwerte - LagemaßeStatistische Kennwerte - StreuungsmaßeStatistische Kennwerte - SchiefeStandardmesswerte

Beispiel

I Ein Knabe erzielt 5.20m bei Gruppenkennwerten xM = 5.03,bzw. sM = 0.92

I Ein Madchen erreicht 4.50m bei GruppenkennwertenxW = 4.21, bzw. sW = 0.85

I Daher ist t∗M = 0.18 und t∗W = 0.42

I Der Knabe liegt 0.18, das Madchen 0.42 Standardeinheitenuber dem Mittelwert (0!); die Leistung des Madchens istrelativ besser

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 62/62

Page 112: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

3. Vorlesung

Einfuhrung in Quantitative Methoden

Karin Waldherr & Pantelis Christodoulides

23. Marz 2011

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 1/49

Page 113: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Boxplot

Boxplot

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 2/49

Page 114: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Ziele

I Gemeinsame Betrachtung zweier Variablen

I Aufschluss uber Art und Starke des Zusammenhangeszwischen den beiden Variablen

I Bei metrischen Merkmalen: Beschreibung einer funktionalenBeziehung und darauf beruhende Prognosen fehlender Werte

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 3/49

Page 115: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Methoden

I Zweidimensionale numerische und grafische DarstellungI Bivariate Haufigkeitstabelle (Kontingenztafel, Kreuztabelle)I Grafiken zur Beschreibung der Art des ZusammenhangesI Maßzahlenermittlung zur Beschreibung der Starke des

Zusammenhanges zwischen den beiden VariablenI Bei metrischen Variablen Darstellung des Merkmales X als

Funktion des Merkmales Y : X = f (Y )

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 4/49

Page 116: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Bivariate Haufigkeitstabelle

I Zwei Merkmale X und Y mit Auspragungen x ′j , j = 1, . . . , k,y ′l , l = 1, . . . ,m

I X = Zeilen, Y = Spalten; Auspragungen jeweils geordnetnach Große

I fjl , abs. H., oder rjl , rel.H. der Merkmalskombinationen inZellen

I Beispiel 1: X = vom Arzt gewogenes Gewicht; Y = selbstangegebenes Gewicht

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 5/49

Page 117: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Beispiel 1: Variable X : vom Arzt gewogenes Gewicht; Variable Y :selbst angegebenes Gewicht; n = 20 16-jahrige Madchen

Beispiel: f46,46 = 1

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 6/49

Page 118: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Beispiel 2

Variablen Erhebungsgebiet und Religionszugehorigkeit ausALLBUS (2006)X = Erhebungsgebiet (x ′1 = Westdeutschl., x ′2 = Ostdeutschland);Y = Religionszugehorigkeit (y ′1 = Evang., y ′2 = Rom.-Kath., y ′3 =andere, y ′4 = keine)

X = Y = ReligionszugehorigkeitErhebungs- Rom.-gebiet Evang. Kath. andere keine GesamtWestd. 905 838 165 377 2285Ostd. 284 45 25 765 1119

Gesamt 1189 883 190 1142 3404

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 7/49

Page 119: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Kontingenztafel allgemein

y ′1 y ′2 . . . y ′m∑m

l=1

x ′1 f11 f12 . . . f1m f1.x ′2 f21 f22 . . . f2m f2....

......

......

...

x ′k fk1 fk2... fkm fk.∑k

j=1 f.1 f.2 . . . f.m f.. = n

fj . =∑m

l=1 fjl und f.l =∑k

j=1 fjl sind die univariatenRandhaufigkeiten.Die eindimensionalen Haufigkeitsverteilungen heißenRandverteilungen.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 8/49

Page 120: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Bedingte relative Haufigkeiten (1)

Relative Haufigkeit einer bestimmten Auspragung des MerkmalesX unter der Bedingung des Auftretens einer bestimmtenAuspragung von Y , Y = y ′l

rX=x ′j |Y=y ′

l=

fjlf.l

(f.l > 0)

und vice versa

rY=y ′l |X=x ′

j=

fjlfj .

(fj . > 0)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 9/49

Page 121: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Bedingte relative Haufigkeiten (2)

Beispiel 3: Relative Haufigkeit der Personen mit evangelischerReligionszugehorigkeit unter der Bedingung, dass sie a) inWestdeutschland und b) in Ostdeutschland wohnen

a) rY=Evang.|X=Westd. =905

2285≈ 0.40 b) rY=Evang.|X=Ostd. =

284

1119≈ 0.25

X = Y = ReligionszugehorigkeitErhebungs- Rom.-gebiet Evang. Kath. andere keine GesamtWestd. 905 838 165 377 2285Ostd. 284 45 25 765 1119

Gesamt 1189 883 190 1142 3404

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 10/49

Page 122: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Empirische Unabhangigkeit (1)I X und Y sind unabhangig, wenn bedingte

Haufigkeitsverteilungen = unbedingte Haufigkeitsverteilung,d.h. wenn die Verteilungen in allen Spalten gleich sind jenerder Randverteilung (analog fur die Zeilen)

fjlf.l

=fj .n

bzw.fjlfj .

=f.ln

I Beispiel 4:Y

X ja nein Gesamtja 10 25 35 10

39 ≈25101 ≈

35140 ≈ 0.25

nein 29 76 105Gesamt 39 101 140

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 11/49

Page 123: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Empirische Unabhangigkeit (2)

I außerdem:

fjl =fj .f.ln

fur alle j = 1, . . . , k, l = 1, . . . ,m.

y ′1 y ′2 . . . y ′m∑m

l=1

x ′1 f11 f12 . . . f1m f1....

......

......

...x ′k fk1 fk2

... fkm fk.∑kj=1 f.1 f.2 . . . f.m f.. = n

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 12/49

Page 124: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Empirische Unabhangigkeit (3)

I Beispiel 4:Y

X ja nein Gesamtja 10 25 35nein 29 76 105Gesamt 39 101 140

39 · 35

140= 9.75 ≈ 10

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 13/49

Page 125: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Zwei nominalskalierte Variablen: Balkendiagramm

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 14/49

Page 126: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Dreidimensionales Balkendiagramm

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 15/49

Page 127: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Zwei metrische Variablen: StreudiagrammBeispiel: Linearer Zusammenhang

VariablePerson X Y1 2 32 5 63 1 24 3 45 6 7

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 16/49

Page 128: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Starker positiver Zusammenhang

große X -Werte, große Y -Werte

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 17/49

Page 129: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Starker negativer Zusammenhang

große X -Werte, kleine Y -Werte

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 18/49

Page 130: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Mittelmaßiger Zusammenhang

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 19/49

Page 131: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Geringer Zusammenhang

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 20/49

Page 132: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Nicht-linearer (U-formiger) Zusammenhang

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 21/49

Page 133: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Kovarianz

Gemeinsame Variation der Variablen X und Y - mittleresAbweichungsprodukt

I Hoher Wert → positive Abweichung vom Mittelwert(xi − x > 0),niedriger Wert → negative Abweichung vom Mittelwert(xi − x < 0)

I Starker positiver Zusammenhang: hohe X -Werte → hoheY -Werte und niedrige X -Werte → niedrige Y -Werte

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 22/49

Page 134: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

xi − x > 0 ∧ yi − y > 0 → (xi − x)(yi − y) > 0xi − x < 0 ∧ yi − y < 0 → (xi − x)(yi − y) > 0

cXY = 1n−1

∑ni=1(xi − x)(yi − y) großer positiver Wert

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 23/49

Page 135: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

xi − x < 0 ∧ yi − y > 0 → (xi − x)(yi − y) < 0xi − x > 0 ∧ yi − y < 0 → (xi − x)(yi − y) < 0

⇒ cXY = 1n−1

∑ni=1(xi − x)(yi − y) großer negativer Wert

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 24/49

Page 136: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

cXY =1

n − 1

n∑i=1

(xi − x)(yi − y) Betrag der Kovarianz klein

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 25/49

Page 137: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Eigenschaften der Kovarianz

I Formel zur Berechnung der Kovarianz:

cXY =1

n − 1

n∑i=1

xiyi −nx y

n − 1=

1

n − 1

(n∑

i=1

xiyi − nx y

)

I Betrag der maximalen Kovarianz zweier Variablen ist Produktihrer Standardabweichungen

I Kovarianz einer Variablen mit sich selbst ist die Varianz derVariablen

I Kovarianz nicht direkt interpretierbar (kein standardisiertesMaß)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 26/49

Page 138: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Bravais-Pearson-Korrelationskoeffizient(Produkt-Moment-Korrelation)

rXY =cXY

sX sY− 1 ≤ rXY ≤ 1

rXY = 0 X und Y kein linearer ZusammenhangrXY > 0 positiver ZusammenhangrXY < 0 negativer ZusammenhangrXY ± 1 perfekter Zusammenhang

Bestimmtheitsmaß: B = r2 gibt Anteil der Varianz von X wieder,der durch Darstellung von X als lineare Funktion von Y erklartwerden kann und vice versa (s. 4. VO)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 27/49

Page 139: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 28/49

Page 140: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Voraussetzungen fur Produkt-Moment-Korrelation

I Linearer Zusammenhang

I Metrische Variablen

I keine Ausreißer im Streudiagramm

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 29/49

Page 141: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Ausreißer 1. Art

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 30/49

Page 142: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Ausreißer 2. Art

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 31/49

Page 143: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Datenbeispiel

Variable X : vom Arzt gewogenes Gewicht; Variable Y : selbstangegebenes Gewicht; n = 20 16-jahrige Madchen

vgl. Folie 5: Bivariate Haufigkeitstabelle

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 32/49

Page 144: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Datenbeispiel

∑ni=1 xi = 1 · 46 + 1 · 48 + 1 · 51 + 4 · 52 + . . . =

∑ni=1 yi =

= 1062 = 1061

x = 53.1 y = 53.05∑ni=1 x2

i = 1× 462 + 1× 482 + . . . = 56558∑n

i=1 y2i = 56461

s2X = 8.73 s2

Y = 9.21

sX = 2.95 sY = 3.03∑ni=1 xiyi = 56494

cXY =1

1956494− 20

192816.96 = 8.15

rXY = 0.91⇒ B = 0.83 = 83% erklarter Varianzanteil

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 33/49

Page 145: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Berechnung in SPSS - StreudiagrammBeispiel: Zusammenhang zwischen Selbstwert undKorperzufriedenheit

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 34/49

Page 146: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Berechnung in SPSS - Korrelationskoeffizient

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 35/49

Page 147: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Interpretation von Korrelationen

I rXY = 0 bedeutet nur: kein linearer Zusammenhang

I Keine Kausalinterpretation aufgrund großem rXY moglich

I rXY gibt keine Auskunft uber Ursache-Wirkungs-Beziehungen

I Scheinkorrelation: der Zusammenhang zwischen X und Y istdurch eine dritte Variable Z induziert (Frage nachsachlogischem Zusammenhang)

I Beispiel: Anzahl der Notarzte, die zu einem Einsatzort gerufenwurden, und Anzahl der spateren Todesopfer. PlausibelsteErklarung: beide Variablen werden von Schwere desKatastrophenfalles beeinflusst.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 36/49

Page 148: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Beispiel: Zusammenhang zwischen Schuhgroße undEinkommen

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 37/49

Page 149: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Partielle Korrelation

I Ziel: Korrelation zwischen Variablen X und Y ohne denEinfluss von Z → partielle Korrelation von X und Y unterKonstanthalten von Z (‘Z wird aus der Korrelation herauspartialisiert’)

I Partielle Korrelation:

rXY |Z =rXY − rXZ rYZ√

(1− r2XZ )(1− r2

YZ )

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 38/49

Page 150: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Beispiel: Zusammenhang zwischen Gewissenhaftigkeit, X , undVertraglichkeit, Y , Kontrollvariable Extraversion, Z

rXY = 0.98; rXZ = 0.90; rYZ = 0.80

rXY |Z =0.98− (0.90)(0.80)√(1− .902)(1− .802)

= 0.99

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 39/49

Page 151: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Berechnung in SPSSBeispiel: Zusammenhang zwischen Korperzufriedenheit undSelbstwertgefuhl (r = 0.775), Kontrollvariable Body Mass Index(BMI)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 40/49

Page 152: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Rangkorrelation nach Spearman

I Variablen ordinalskaliert oder andere Voraussetzungen furProdukt-Moment-Korrelation nicht gegeben

I Produkt-Moment-Korrelation der Rangplatze R(xi ) und R(yi )I Berechnung:

I Zuordnung von Rangzahlen zu den der Große nach geordnetenMesswerten x(1) ≤ . . . ≤ x(n) und y(1) ≤ . . . ≤ y(n) getrennt furX und Y

I Tritt eine Auspragung x ′j mehrmals auf (Bindung) erhalten alle

Personen mit diesem x ′j als Rangplatz das arithmetische Mittel

der zu vergebenden RangplatzeBeispiel:geordnete Urliste: 10, 12, 12, 13, 15Rangplatze: 1, 2.5, 2.5, 4, 5

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 41/49

Page 153: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

I Praktische Berechnungsformel:

rsp = 1−6∑n

i=1 d2i

n(n2 − 1)

mit di = R(xi )− R(yi )

I Kontrolle der Rangplatzvergabe:

n∑i=1

R(xi ) =n(n + 1)

2bzw.

n∑i=1

R(yi ) =n(n + 1)

2

n∑i=1

di = 0

I −1 ≤ rsp ≤ 1

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 42/49

Page 154: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Beispiel fur Rangkorrelation nach Spearman

Bewertung des Preis-Leistungs-Verhaltnis von 15 Produkten durch

I NutzerInnen (5-Punkte Skala; hoher Wert = gutesPreis-Leistungs-Verhaltnis) und

I Expertin (Rangreihung; 1=schlechtestesPreis-Leistungs-Verhaltnis)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 43/49

Page 155: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Beispiel fur Rangkorrelation nach SpearmanX = durchschnittliche Bewertung von NutzerInnen, Y = Expertin

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 44/49

Page 156: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Punkt-biseriale Korrelation fur Zusammenhang einerdichotomen mit einer metrischen Variable

I Abgeleitet aus Produkt-Moment-Korrelation

rpb =x1 − x0

sx

√n1n0

n(n − 1)

I Voraussetzung: metrische Variable, keine Ausreißer

I Berechnung in SPSS mittels Produkt-Moment-Korrelation

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 45/49

Page 157: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

BeispielALLBUS (2006): Zufallsstichprobe n = 22, Zusammenhangzwischen Geschlecht und Alter der Befragten; 1 = Mann, 0 = Frau

Person Geschlecht Alter Person Geschlecht Alter1 1 58 12 0 682 0 45 13 0 643 0 54 14 1 454 1 79 15 0 635 1 46 16 0 206 0 34 17 1 377 1 76 18 0 208 0 63 19 1 529 1 49 20 0 5010 0 55 21 1 4411 1 32 22 0 57

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 46/49

Page 158: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

n1∑i=1

xi = 518, n1 = 10, x1 = 51.80

n0∑i=1

xi = 593, n0 = 12, x0 = 49.42

N∑i=1

xi = 1111,

N∑i=1

x2i = 61285, sX = 15.70

rpb =51.8− 49.42

15.7

√0.26 = 0.077

⇒ kein Zusammenhang zwischen Geschlecht und Alter

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 47/49

Page 159: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Vierfelderkorrelation

X0 1

Y 0 f00 f01 f0.1 f10 f11 f1.

f.0 f.1 f..

Bei zwei dichotomen Variablen ergibt sich als Spezialfall derProdukt-Moment-Korrelation der Phi-Koeffizient:

rφ =f00f11 − f01f10√

f0.f1.f.0f.1

Vorzeichen von rφ ist abhangig von Vorzeichen der Determinantef00f11 − f01f10 (Uberwiegen der Kombinationen 00 und 11 oder 01und 10)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 48/49

Page 160: Statistik

Univariate Deskriptive StatistikBivariate Deskriptive Statistik

Bivariate Haufigkeitstabelle (Kontingenztafel)Grafische DarstellungMaßzahl fur linearen Zusammenhang metrischer VariablenZusammenhangsmaß fur rangskalierte VariablenZusammenhangsmaß dichotome-metrische VariableZusammenhangsmaß fur zwei dichotome Variablen

Beispiel

ALLBUS (2006): Zusammenhang zwischen Geschlecht undHandy-Besitz in Ostdeutschland

Handy-Besitzja nein

Geschlecht Mann 446 96 542Frau 414 165 579

860 261 1121

rφ =(446)(165)− (414)(96)√

(542)(579)(860)(261)=

33846

265404.57= 0.13

→ nur sehr geringer Zusammenhang zwischen Geschlecht undHandy-Besitz

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 3.VO 49/49

Page 161: Statistik

Einfache Regressionsanalyse

Einfuhrung in Quantitative Methoden

Mag. Dipl.Ing. Dr. Pantelis Christodoulides&

Mag. Dr. Karin Waldherr

SS 2011

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 1/47

Page 162: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

HistorischesI Regression geht auf Galton (1889) und seine Studien zur

Vererbung zuruck; Galton formulierte das Gesetz deruniversalen Regression

I Jede vom ’normalen’ abweichende Eigenschaft eines Menschenwird in der nachfolgenden Generation zwar ubernommen, aberim Durchschnitt in einem geringeren Ausmaß. Es tritt alsobzgl. dieser Eigenschaft ein Rucktritt (Regression) ein

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 2/47

Page 163: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

HistorischesI Karl Pearson hat bei 1078 Familien die Große von Vater und

Sohn untersucht

I Obwohl große Vater dazu neigen große Sohne zu haben, sinddie Sohne von großen Vatern im Durchschnitt kleiner als ihreVater

I Ebenso wird die Besonderheit der Kleinheit von Vatern nichtin vollem Maße an die Sohne vererbt, denn diese sinddurchschnittlich großer als ihre Vater

I Es ist eine Regression oder ein Rucktritt in Bezug auf dieGroße bei Sohnen sichtbar

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 3/47

Page 164: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

Ziele

I Empirische Reprasentation großer Datenmengen

I Erkennen eines funktionalen Zusammenhanges

I Nachweis einer bereits bekannten Beziehung zwischen denVariablen

I Spezifizierung eines funktionalen Zusammenhanges zwischenzwei Variablen

I Schatzen der Parameter einer funktionalen Beziehung

I Interpolation fehlender bzw. Prognose zukunftiger Werte

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 4/47

Page 165: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

Ausgangslage

I Zusammenhang zwischen 2 metrischen Variablen X und Ymit Auspragungen xi und yi

I Spezifizierung einer funktionalen Beziehung Y = f (X ): Ywird mithilfe von X und f geschatzt

I Stichprobe mit n Objektpaaren - (x1, y1) · · · (xn, yn)

I Objektpaare (x1, y1) · · · (xn, yn) darstellbar als Punkte inkartesischem Koordinatensystem mit Koordinaten (xi , yi ) =Streudiagramm

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 5/47

Page 166: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

Ausgangslage

I Y ist der Regressand (abhangige Variable); X ist derRegressor (unabhangige Variable); Regression von Y auf X

I Annahmen - die abhangige Variable ist mit Zufallsfehlernuberlagert; die unabhangige Variable gilt als fehlerfrei

I Einfache Regression weil ein Regressor, im Vergleich zumultipler Regression mit mehr als einem Regressor

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 6/47

Page 167: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

Funktion f (X )I Linear: Y = a + bX , a und b reelle Zahlen, hochster

Polynomgrad ist 1

I Quadratisch: Y = c + wX + dX 2, c , w , und d reelle Zahlen,hochster Polynomgrad ist 2

I Exponentiell: Y = q(egX), q und g reelle Zahlen

I Logarithmisch: Y = h ln(Xp

), h und p reelle Zahlen, p

zusatzlich positiv

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 7/47

Page 168: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

Beispiel 1: Lineare Funktion f (X )I Treibstoffverbrauch (Y ) und Leistungsabgabe eines Motors

(X ) bei konstanter Drehzahl: Y ≈ 0.854 + 0.302X

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 8/47

Page 169: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

Beispiel 2: Quadratische Funktion f (X )I Kornerertrag (Y ) und Dungung (X ):

Y ≈ 5.78 + 2.29X − 0.09X 2

I Bis zu einer bestimmten Dungungsgrenze steigt derKornerertrag an, um wieder abzufallen

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 9/47

Page 170: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

Beispiel 3: Logarithmische Funktion f (X )I Weber-Fechner’sches Gesetz: Bei einem linearen Anstieg der

Reizstarke (X ), wachst die Empfindung im Sinnesorgan (Y )logarithmisch an

I

Y = c ln

(X

b

)b = Schwellenreiz c = Konstante abhangig von der Reizart

I Weber-Fechner’sches Gesetz allgemein bekannt durch dieDezibel-Skala, die das logarithmische Verhaltnis zwischen Reizund Larmempfindung ubertragt

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 10/47

Page 171: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

Beispiel 3: Logarithmische Funktion f (X )

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 11/47

Page 172: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

I Vermutet wird ein zumindest naherungsweise linearerZusammenhang zwischen zwei Variablen Y und X

I Die Variable Y soll naherungsweise durch eine lineareFunktion von X beschrieben werden

I

Y ≈ Y = bX + a mit a, b reelle Zahlen

I a (Schnitt mit Y -Achse) und b (Anstieg) sind unbekannt

I a und b so wahlen, dass Zusammenhang (Streudiagramm)zwischen Y und X ’am besten’ beschrieben wird

I Die Methode der kleinsten Quadrate ermittelt besteSchatzungen a und b fur a und b

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 12/47

Page 173: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

Kleinste Quadrate Schatzung (KQS)

I Residuum ei = yi − yi ; n Residuen (Abweichungen von derRegressionsgerade in Richtung abhangiger Variable)

I Zentrale Idee bei KQS ist, a und b derart zu wahlen, dass dieSumme der quadrierten Differenzen (Quadratsumme allerResiduen) minimal wird

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 13/47

Page 174: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 14/47

Page 175: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 15/47

Page 176: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

Kleinste Quadrate Schatzung (KQS)I Bestimme a und b derart, dass die Quadratsumme aller

Residuen minimal wird, d.h.

S2 =n∑

i=1

(yi − yi )2 =

n∑i=1

(yi − a− bxi )2 → Min

I Partielles Differenzieren von S2 nach den Unbekannten a undb und anschließendes Nullsetzen der Ableitungen liefert

b =cXYs2X

, a = y − bx

I b = Verhaltnis zwischen Kovarianz und Varianz des RegressorsI a ist abhangig von den Mittelwerten, x , y , und b

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 16/47

Page 177: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

BeispielI Bei einer Stichprobe von n = 40 Personen wurden

Korpergroße (X ) und Gewicht (Y ) gemessen

40∑i=1

xi = 6814,40∑i=1

x2i = 1163780, s2

X = 77.31

40∑i=1

yi = 2722,40∑i=1

y2i = 190422, s2

Y = 133.07,40∑i=1

xiyi = 466599

I

cXY =1

39(

40∑i=1

xiyi − 40x y) =1

39(466599− 40

6814

40

2722

40)

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 17/47

Page 178: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

BeispielcXY = 74.52, s2

X = 77.31 ⇒ b =cXYs2X

= 0.9639

a = y − bx = 68.05− 0.9639 · 170.35 = −96.15

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 18/47

Page 179: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

Beispiel

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 19/47

Page 180: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

I Produktmomentkorrelation rXY steht im engenZusammenhang zum Schatzer b

I Es gilt

rXY =cXYsX sY

, b =cXYsX sX

=cXY sYsY sX sX

=rXY sYsX

I Aus der Korrelation kann der Steigungsparameter geschatztwerden und umgekehrt

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 20/47

Page 181: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

I Maß fur Gute der Anpassung einer Regression ist dasBestimmtheitsmaß B

I B misst das Verhaltnis der Varianz der geschatzten Werte yizur Varianz der beobachteten Werte yi

I B misst den Anteil der Varianz der abhangigen Variable Y ,der durch die unabhangige Variable X (bzw. die Regression)erklart werden kann

I Achtung ’verursacht’ nur bei Kausalitat

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 21/47

Page 182: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

B =s2Y

s2Y

mit 0 ≤ B ≤ 1

I Je naher die Punkte zur Regressionsgerade liegen, destogroßer ist B

I Liegen alle Punkte auf der Regressionsgerade, dann ist B = 1und Y wird durch die Regression vollig erklart

I Das Bestimmtheitsmaß ist gleich dem Quadrat der Korrelation

I Es gilt also B = r2

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 22/47

Page 183: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

B und Streudiagramm

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 23/47

Page 184: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

BeispielI Gewicht und Korpergroße

b = 0.9639; r = 0.9639

√77.31√

133.07= 0.735

I

B = r2 = 0.7352 = 0.54

I 54% der Varianz vom Gewicht wird durch die lineareRegression mit Korpergroße erklart

I deswegen Korrelation von ’mittelmaßiger Hohe’

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 24/47

Page 185: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

Regression von X auf YI Vertauschen von abhangiger und unabhangiger Variable;

Vertauschen des Koordinatensystems X -Y

I X approximativ als lineare Funktion von Y darstellen

X ≈ b′Y + a′

I Wie andern sich unsere Parameter? Vertauschen von X undYin den Formeln, d.h.

b′ =cXYs2Y

a′ = x − b′y

I 2 Regressionsgeraden, je nach Fragestellung; beide gehendurch den Schwerpunkt des Punktschwarms (x , y)

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 25/47

Page 186: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

Regression von X auf Y bzw. Y auf X

I Verschiedenheit beider Regressionsgeraden hat ihre Ursache inder Annahme, dass die unabhangige Variable als fehlerfreiangesehen wird, wahrend die abhangige Variable durch einenZufallsfehler uberlagert wird

I Darstellung beider Geraden im X -Y Koordinatensystem

Y = bX + a (1)

X = b′Y + a′ ⇒ Y =1

b′X − a′

b′(2)

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 26/47

Page 187: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

BeispielY = 0.624X + 35.13 (1) X = 0.789Y + 27.01

Y =1

0.789X − 27.01

0.789⇒ Y = 1.27X − 34.23 (2)

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 27/47

Page 188: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

Bemerkungen

I Korrelation und Bestimmtheitsmaß andern sich nicht, da siesymmetrisch bzgl. X und Y sind

I Vorzeichen der Steigungsparameter bleibt auch unverandert

I Steigungsparameter andert sich um die jeweilige Varianz desRegressors X bzw.Y

I Regressionsgeraden fallen zusammen bei perfektem linearenZusammenhang zwischen X und Y , d.h. bei rXY = ±1

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 28/47

Page 189: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

I Prognose von Y ⇒ Y als abhangige Variable; fur gegebenes xin die Modellgleichung y = bx + a einsetzen und y ausrechnen

I Prognose von X ⇒ X als abhangige Variable; fur gegebenes yin die Modellgleichung x = b′y + a′ einsetzen und xausrechnen

I Die zu prognostizierende Variable ist die im jeweiligen Modellabhangige Variable

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 29/47

Page 190: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

Beispiel

I Prognose von y bei x = 125 ⇒ y = (0.624)(125) + 35.13,d.h. y = 113.13

I Prognose von x bei y = 125 ⇒ x = (0.789)(125) + 27.01,d.h. x = 125.635

I Uberprufung der Gute der Prognose mithilfe der Abweichungdes beobachteten Wertes yi vom geschatzten yi (bzw. analogfur X )

I Betragsmaßig ’kleine’ Abweichungen sprechen fur eine ’gutePrognose’

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 30/47

Page 191: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

Allgemeine Richtlinien

I Grafische Uberprufung der Daten und der Regressionsgeradeim Streudiagramm; Daten sollten annahernd auf einenlinearen Zusammenhang hinweisen

I Große und Struktur der Residuen: Betragsmaßig kleineResiduen, die in einem Streudiagramm mit den geschatztenWerten yi keine erkennbare Struktur zeigen, weisen auf eingutes Modell hin

I Hohes Bestimmtheitsmaß: Dieses Kriterium sollte imZusammenhang mit einer Residualanalyse und grafischenUberprufung der Daten verwendet werden

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 31/47

Page 192: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

Residualanalyse

I ’Betragsmaßig kleine’ Residuen ei = yi − yi weisen auf eingutes Regressionsmodell hin

I Residuen sind aber abhangig von den Maßeinheiten in Y und X

I∑n

i=1 ei = 0 und auch e = 0, d.h. der Mittelwert der Residuenist 0

I Standardisieren der Residuen mit

s2e =

1

n − 2

n∑i=1

e2i , also ei =

ei√s2e

ei sind die normierten Residuen, welche bei einem ’gutenModell’ im Intervall [−2.5, 2.5] liegen sollten

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 32/47

Page 193: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

BeispielI Datei ’bspreg.sav’, n = 61, Y sei die abhangige VariableI Streudiagramm spricht eher fur einen positiven linearen

Zusammenhang

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 33/47

Page 194: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

Beispiel

I y = 0.92x + 3.63, B = 0.86, rXY = 0.93

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 34/47

Page 195: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

Beispiel

I Berechnung der Residuen und normierten Residuen mit√s2e = 1.45

i yi xi yi ei ei1 33 32 33.20 -0.20 -0.142 33 33 34.13 -1.13 -0.783 35 35 35.98 -0.98 -0.67...

......

......

...61 47 48 47.99 -0.99 -0.68

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 35/47

Page 196: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

BeispielI Graph der normierten Residuen mit Konfidenzbereich

[−2.5, 2.5]I i auf der X Achse, ei auf der Y Achse

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 36/47

Page 197: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

BeispielI Graph der normierten Residuen gegen die geschatzten Werte

yiI yi auf der X Achse, ei auf der Y Achse

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 37/47

Page 198: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

Problematische DarstellungenI Graph der normierten Residuen gegen die geschatzten Werte

yiI linearer Trend, Hinweis auf Messfehler oder inadaquates

Modell

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 38/47

Page 199: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

Problematische DarstellungenI Graph der normierten Residuen gegen die geschatzten Werte

yiI Ansteigende Varianzen mit ansteigendem yi

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 39/47

Page 200: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

Problematische DarstellungenI Graph der normierten Residuen gegen die geschatzten Werte

yiI Nicht-linearer Verlauf der Residuen, inadaquates Modell

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 40/47

Page 201: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

Regression mit Standardmesswerten

I Wir betrachten die Regression von Y auf X mitstandardisierten Variablen t∗Y und t∗X

I Kovarianz, Korrelation und Regressionskoeffizient b sindgleich dem mittleren Messwertprodukt, und dieRegressionskonstante a = 0.

I

ct∗Y t∗X= rt∗Y t∗X

= bt∗Y t∗X=

1

n − 1

n∑i=1

t∗yi t∗xi

I Regressionseffekt (bei |rXY | < 1: |yi − y | < |xi − x |) leichtererkennbar, da x , y und y standardisiert sind

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 41/47

Page 202: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

Partielle Korrelation rXY |Z

I Berechnung der partiellen Korrelation mithilfe der Residuen

I Regression von X auf Z durchfuhren und die Residuenei = (xi − xi ) berechnen; diese Residuen drucken jeneVariation von X aus, die durch Z nicht erklart wird

I Regression von Y auf Z durchfuhren und die Residuenei = (yi − yi ) berechnen; diese Residuen drucken jeneVariation von Y aus, die durch Z nicht erklart wird

I rXY |Z ist identisch mit rE ,E

I Einfachere Berechnung mit Formel von letzter Einheit

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 42/47

Page 203: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

Einfluss von Ausreissern

I Einzelne Ausreisser konnen die Regressionsgerade beeinflussen

I b und a werden sehr stark durch Ausreisser verfalscht

I Schlimmster Fall, wenn Ausreisser nicht in Richtung desPunktschwarms liegen

I Leichtes Erkennen von Ausreissern im Streudiagramm derDaten

I Nur in manchen Fallen sind Ausreisser auch durch großenormierte Residuen erkennbar (Residuengraphs)

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 43/47

Page 204: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

Einfluss von Ausreissern

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 44/47

Page 205: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

Einfluss von Ausreissern

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 45/47

Page 206: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

Einfluss von Ausreissern

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 46/47

Page 207: Statistik

Einfache Regressionsanalyse

EinfuhrungArt funktionaler BeziehungLineare RegressionParameterschatzungZusammenhang Regression und KorrelationVertauschen abhangiger und unabhangiger VariablenPrognose und InterpolationGutekriterienWeitere Erkentnisse

Nichtlineares f (X )

I Quadratisch: Y = c + dX 2 ⇒ KQS

I Exponentiell: Y = qegX ⇒ Logarithmieren ergibtln(Y ) = ln(q) + gX also ln(Y ) = q′ + gX ⇒ KQS fur q′ undg

I Logarithmisch: Y = ln (hX p) ⇒ Y = p ln(X ) + ln(h); KQS

fur p und ln(h)

I Achtung auf richtige Interpretation der Parameter!

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 2.VO 47/47

Page 208: Statistik

InferenzstatistikKombinatorik

5. Vorlesung

Einfuhrung in Quantitative Methoden

Karin Waldherr & Pantelis Christodoulides

6. April 2011

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 1/24

Page 209: Statistik

InferenzstatistikKombinatorik

Inferenzstatistik

I Schluss von Zufallsstichprobe auf Population

I Grundlage Wahrscheinlichkeitsrechnung

I Zentral: Zufallsprozesse (Ausgang unsicher, nicht mitSicherheit vorhersagbar)

”Zufall ist das unberechenbare Geschehen, das sich unsererVernunft und unserer Absicht entzieht.”(Gebruder Grimm, Deutsches Worterbuch. Band 32, Sp. 345. Leipzig: S. Hirzel 1854-1960.)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 2/24

Page 210: Statistik

InferenzstatistikKombinatorik

Kann man Zufall berechnen?

I Rudolf Taschner: ”Mathematik ist der Versuch, alles zubandigen, auch den Zufall.”

I ”Wenn man weiß, wie ein Wurfel wahrscheinlich fallt, kannman sogar damit reich werden.” (Rudolf Taschner,kurier.at/nachrichten/2076992.php)

I Beispiel: WurfelspielI Ich lasse Sie werfen. Sie zahlen mir 100 Euro dafur, dass Sie

werfen durfen. Wenn Sie eine 6 werfen, gebe ich Ihnen 500Euro.

I Wollen Sie 6000 Mal werfen, erhalte ich 600.000 Euro.I Bei etwa 1/6 der Falle (ca. 1000 Mal) wird eine 6 kommen.I Ich muss also 500.000 zahlen, 100.000 bleiben mir.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 3/24

Page 211: Statistik

InferenzstatistikKombinatorik

Stochastik

I die Kunst des Vermutens (altgriechisch: στoχαστικη τεχvη,stochastike techne)

I Mathematik setzt Vorstellung von Zufall voraus (= Modellevon Situationen, deren Ausgang unsicher ist) undquantifizierbar ist

I Keine Einzelereignisse vorhersagbar, aber:

I Erkennen von Regelmaßigkeiten bei Vorgangen, derenErgebnisse vom Zufall abhangen.

I Hinderer (1980): ’Statistischer Wahrscheinlichkeitsbegriffdient der Beschreibung von beobachteten Haufigkeiten beibeliebig oft wiederholbaren Vorgangen, deren Ausgang nichtvorhersehbar ist.’

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 4/24

Page 212: Statistik

InferenzstatistikKombinatorik

Geschichte der Wahrscheinlichkeitsrechnung II Interesse am Zufall bis in fruheste Menschheitsgeschichte

zuruckzuverfolgenI Lat. ’Astragali’ genannte Knochen wurden im romischen

Reich als Spielwurfel verwendet - zum Glucksspiel um Geld,oder zu rituellen Zwecken um Auskunft uber die Meinung derGotter zu erhalten.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 5/24

Page 213: Statistik

InferenzstatistikKombinatorik

Geschichte der Wahrscheinlichkeitsrechnung II

I Solche und ahnliche Orakel auf der Grundlage vonZufallsereignissen weltweit zu beobachten.

I Bereits fruh auch Wurfel in der heute ublichen Kubusformoder als Tetraeder → faire und damit besonders interessanteSpiele

I Einer der fruhesten Funde im heutigen Iran datiert etwa auf3000 v. Chr.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 6/24

Page 214: Statistik

InferenzstatistikKombinatorik

Geschichte der Wahrscheinlichkeitsrechnung III

I Statistischer Wahrscheinlichkeitsbegriff geht zuruck auf 17.Jahrhundert (Frankreich)

I Im Jahr 1654 wandte sich der Glucksspieler Chevalier de Meremit mehreren Fragen an den franzosischen MathematikerBlaise Pascal

I Teilungsproblem: Fiktives Spiel: jener Spieler gewinnt einenGeldpreis, der zuerst eine festgesetzte Anzahl von fairenRunden gewinnt (bei denen jeder Spieler je eine Siegchancevon 50 % besitzt, unabhangig vom Ausgang dervorangegangenen Runden). Das Spiel wird aber durch hohereGewalt vor der Entscheidung abgebrochen. Betrag sollabhangig vom Spielstand zum Abbruch gerecht geteilt werden.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 7/24

Page 215: Statistik

InferenzstatistikKombinatorik

Geschichte der Wahrscheinlichkeitsrechnung IV

I Briefwechsel zwischen Blaise Pascal und Pierre de Fermat(Mathematiker)

I Schluss: Einsatz musse entsprechendGewinnwahrscheinlichkeiten der ausstehenden Rundenaufgeteilt werden

I Pascal zeigte auf, wie diese mit Hilfe der Kombinatorik undspeziell dem von ihm entwickelten Pascalschen Dreieckberechnet werden konne

Blaise Pascal (1623-1662)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 8/24

Page 216: Statistik

InferenzstatistikKombinatorik

Kombinatorik

I Rechenregeln zur Berechnung von:

I In wie vielen unterschiedlichen Reihenfolgen konnen nElemente angeordnet werden? = Permutationen

I Wieviele Moglichkeiten gibt es, aus n Elementen eineTeilmenge von k Elementen auszuwahlen? = Kombinationen

1. mit oder ohne Wiederholung (= mit oder ohne Zurucklegen)2. mit oder ohne Berucksichtigung der Reihenfolge

I Grundlage fur Wahrscheinlichkeitsrechnung

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 9/24

Page 217: Statistik

InferenzstatistikKombinatorik

Permutationen ohne WiederholungPermutation = jede Anordnung einer endlichen Anzahl vonElementen, bei der alle Elemente verwendet werdenBeispiel: 3 Kugeln sollen auf 3 Platten angeordnet werden

¶ · ¸

→ ¬ l l

{→ ¬ ­ l {→ ¬ ­ ®

→ ¬ l ­ {→ ¬ ® ­

→ l ¬ l

{→ ­ ¬ l {→ ­ ¬ ®

→ l ¬ ­ {→ ® ¬ ­

→ l l ¬

{→ ­ l ¬ {→ ­ ® ¬

→ l ­ ¬ {→ ® ­ ¬

1. Kugel: 3 Moglichkeiten (allgemein:n) → 2. Kugel: 2Moglichkeiten (allgemein: n − 1) → 3. Kugel: 1 Moglichkeit⇒ allgemein: n(n − 1)(n − 2) . . . 1 = n! MoglichkeitenAnmerkung: n! = n Fakultat = 1 · 2 · . . . · n (z.B.4! = 1 · 2 · 3 · 4 = 24); 0! = 1

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 10/24

Page 218: Statistik

InferenzstatistikKombinatorik

Permutationen mit Wiederholung

Wie viele Moglichkeiten gibt es, n Elemente, die sich in mverschiedene Typen (Klassen) mit je k Elementen unterscheidenlassen, anzuordnen? Z.B. n = 4 Kugeln, m = 2 Klassen (m1=blau,m2 = schwarz), k1 = 2, k2 = 2

l l l l

l l l ll l l ll l l ll l l ll l l ll l l l

n Elemente → n! verschiedene Anordnungsmoglichkeitenm verschiedene Klassen mit k1, k2 . . . , km nicht unterscheidbarenElementen → k1!k2! . . . km! Anordnungsmoglichkeiten nichtunterscheidbar, daher⇒ n!

k1!k2! . . . km!verschiedene Anordnungsmoglichkeiten

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 11/24

Page 219: Statistik

InferenzstatistikKombinatorik

Spezialfall m = 2 Klassen

Hier gilt:n!

k!(n − k)!=:

(n

k

)(nk

)= Binomialkoeffizient, n ≥ k

Beispiel: 2 blaue, 2 schwarze Kugeln(4

2

)=

4!

2!2!=

4 · 3 · 2 · 1(2 · 1)(2 · 1)

= 6

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 12/24

Page 220: Statistik

InferenzstatistikKombinatorik

Rechenregeln fur BinomialkoeffizientenEs gilt:

I (n

n − k

)=

n!

(n − k)!k!=

(n

k

)I (

n

0

)=

(n

n

)=

n!

0!n!= 1

I (n

1

)=

(n

n − 1

)=

n!

1!(n − 1)!=

n(n − 1)(n − 2) . . . 1

(n − 1)(n − 2) . . . 1= n

I (n

2

)=

(n

n − 2

)=

n(n − 1)(n − 2) . . . 1

2(n − 2) . . . 1=

n(n − 1)

2

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 13/24

Page 221: Statistik

InferenzstatistikKombinatorik

Kombinationen mit Zurucklegen mit Berucksichtigung derReihenfolge

k Elemente sollen aus n Elementen ausgewahlt werden (k Versucheoder Ziehungen), wobei sich jedes der n Elemente beliebig oftwiederholen kann (d.h. zuruckgelegt wird).Beispiel: Ziehen von k = 2 aus n = 3 Kugeln

l l l

→ l

→ l l→ l l→ l l

→ l

→ l l→ l l→ l l

→ l

→ l l→ l l→ l l

→ nk verschiedene Reihenfolgen

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 14/24

Page 222: Statistik

InferenzstatistikKombinatorik

Beispiel

Ein Zahlencode besteht aus 4 voneinander unabhangigen,nacheinander einzugebenden Ziffern von 0 bis 9. Wie vieleMoglichkeiten gibt es?

n = 10, k = 4nk = 104 = 10000

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 15/24

Page 223: Statistik

InferenzstatistikKombinatorik

Kombinationen ohne Zurucklegen mit Berucksichtigungder Reihenfolge

Ziehen von k Elementen aus insgesamt n Elementen, wobei jedesder n Elemente nur einmal gewahlt werden kann (d.h. nichtzuruckgelegt wird)Beispiel: Ziehen von k = 2 aus n = 3 Kugeln

l l l

→ l

{→ l l

→ l l

→ l

{→ l l

→ l l

→ l

{→ l l

→ l l

n!

(n − k)!=

3!

(3− 2)!= 6

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 16/24

Page 224: Statistik

InferenzstatistikKombinatorik

Beispiel

Bei einem Pferderennen sind 8 Pferde am Start. Wie vieleMoglichkeiten gibt es fur die Belegung der ersten drei Platze?

n = 8, k = 3

n!

(n − k)!=

8!

(8− 3)!= 336 Moglichkeiten

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 17/24

Page 225: Statistik

InferenzstatistikKombinatorik

Kombinationen ohne Zurucklegen ohne Berucksichtigungder Reihenfolge

Wie viele Moglichkeiten gibt es, k Elemente aus n Elementen inbeliebiger Reihenfolge auszuwahlen, wobei jedes der n Elementenur ein Mal gewahlt werden kann?Beispiel: Ziehen von k = 2 aus n = 3 Kugeln, Reihenfolge egal

l l l

l l

l l

l l

(n

k

)=

n!

k!(n − k)!

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 18/24

Page 226: Statistik

InferenzstatistikKombinatorik

BeispielLotto 6 aus 45

n = 45, k = 6(n

k

)=

(45

6

)=

45!

6!39!=

45 · 44 · 43 · 42 · 41 · 40

6 · 5 · 4 · 3 · 2 · 1= 8145060

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 19/24

Page 227: Statistik

InferenzstatistikKombinatorik

Kombinationen mit Zurucklegen ohne Berucksichtigungder Reihenfolge

Aus n Elementen sollen k Elemente in beliebiger Reihenfolgeausgewahlt werden, wobei sich jedes der n Elemente beliebig oftwiederholen kann.Beispiel: Ziehen von k = 2 aus n = 3 Kugeln, Reihenfolge egal

l l l

l l

l l

l l

l l

l l

l l

(n + k − 1

k

)=

(n + k − 1)!

k!(n − 1)!=

4!

2!2!= 6

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 20/24

Page 228: Statistik

InferenzstatistikKombinatorik

Beispiel

Gummibarchenorakel: Man wahlt k = 5 Gummibarchen aus n = 5Elementen (= Farben). Wieviele verschiedene Farbkombinationensind moglich?

(n + k − 1

k

)=

(5 + 5− 1

5

)=

(9

5

)=

9!

5!4!= 126

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 21/24

Page 229: Statistik

InferenzstatistikKombinatorik

Kombinationen - Zusammenfassende Ubersicht

Wiederholung (= Zurucklegen)nein ja

Berucksichtigung jan!

(n − k)!nk Variationen

d. Reihenfolge nein

(n

k

) (n + k − 1

k

)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 22/24

Page 230: Statistik

InferenzstatistikKombinatorik

Beispiele

I Ein Intelligenztest besteht aus 15 Aufgaben. DerTestentwickler mochte uberprufen, ob die Testergebnisseunabhangig von der Reihenfolge der Vorgabe der Aufgabensind. Wie viele verschiedene Testversionen (Reihenfolgen)kann er erstellen?

Losung in der Vorlesung

I Eine Klinische Psychologin hat sich auf drei Storungsbilderspezialisiert. Im Laufe eines Monats meldeten sich 9 neuePatientInnen mit einem dieser Storungsbilder. Wie vieleMoglichkeiten der PatientInnenzusammensetzung gibt es?

Losung in der Vorlesung

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 23/24

Page 231: Statistik

InferenzstatistikKombinatorik

Beispiele

I Die zwei Studierenden mit den besten Seminararbeiten sollenStipendien in unterschiedlicher Hohe erhalten. Insgesamtnehmen 20 Studierende teil. Wie viele verschiedeneMoglichkeiten gibt es fur die Belegung der Platze 1 und 2?

Losung in der Vorlesung

I Wieviele Moglichkeiten ergeben sich, wenn die beiden bestenStudierenden Stipendien derselben Hohe erhalten sollen, d.h.es ist gleichgultig wer den 1. und wer den 2. Platz erhalt.

Losung in der Vorlesung

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 5.VO 24/24

Page 232: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Einfuhrung in Quantitative Methoden

Pantelis Christodoulides & Karin Waldherr

4. Mai 2011

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 1/49

Page 233: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Dichtefunktion

I Eine stetige ZV X kann jeden Wert in einem Intervall [a, b]annehmen

I Die Wahrscheinlichkeiten der einzelnen Auspragungen (Werte)einer stetigen ZV konnen (im Gegensatz zum diskreten Fall)nicht angegeben werden

I Es konnen nur Wahrscheinlichkeiten f (x)dx angegebenwerden, mit welchen die Werte innerhalb von Intervallen dxum die Werte x auftreten

I Beispielsweise fragt man nicht, wie viele Personen exakt 1.75Meter groß sind, sondern z.B., wie viele Personen zwischen1.75 und 1.76 Meter groß sind

I Die Funktion f (x) heißt Dichtefunktion

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 2/49

Page 234: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

I Die Wahrscheinlichkeit, dass die ZV Werte zwischen a und bannimmt, wird dann allgemein definiert als das Integral uberdie Dichtefunktion mit Integrationsgrenzen a und b.

I Analog zum diskreten Fall erhalt man durch Integration dieVerteilungsfunktion

F (x) = P(X ≤ x) =

∫t≤x

f (t)dt

I Die Wahrscheinlichkeit ist definiert als Flache unter derDichtefunktion

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 3/49

Page 235: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

I Es gilt fur alle a < b

P(a ≤ X ≤ b) = P(a < X < b) =

∫ b

af (x)dx

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 4/49

Page 236: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Eigenschaften der Dichtefunktion

I Es gilt weiters fur alle x

f (x) ≥ 0 und

∫xf (x)dx = 1

I P(a ≤ X ≤ b) = F (b)− F (a)

I f (x) = dF (x)dx = F ′(x)

I f (x) gibt an mit welcher Wahrscheinlichkeit Beobachtungenin der ’Nahe’ von x auftreten

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 5/49

Page 237: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Eigenschaften der Verteilungsfunktion

I MonotonieF (x1) ≤ F (x2) fur x1 ≤ x2

I Normierung im Intervall [0, 1]

F (x)→ 0 fur ’sehr kleines’ x

F (x)→ 1 fur ’sehr großes’ x

I P(c ≤ X ≤ b) = F (b)− F (c) fur c < b

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 6/49

Page 238: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

I Es seien X und Y ZV; die gemeinsame Verteilungsfunktionvon X und Y ist definiert als

F (x , y) = P(X ≤ x ∧ Y ≤ y)

I X und Y heißen stochastisch unabhangig wenn gilt:

F (x , y) = P(X ≤ x ∧ Y ≤ y) = P(X ≤ x) P(Y ≤ y)

I Bei diskreten ZV folgt Unabhangigkeit aus

P(X = x ∧ Y = y) = P(X = x) P(Y = y)

I Bei stetigen ZV folgt Unabhangigkeit aus

f (x , y) = f (x) f (y)

I Obige Regeln sind verallgemeinbar auf beliebig viele ZV

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 7/49

Page 239: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Beispiel

I Beim zweimaligen Wurfeln bezeichne X die Augenzahl beimersten und Y die Augenzahl beim zweiten Wurf

I Das Ereignis Y = 2 ist unabhangig vom Ereignis X < 2

I Auch das Ereignis Y = {2, 4, 6} ist unabhangig vom EreignisX = {1, 3, 5}

I X und Y sind stochastisch unabhangig, weil fur jede Auswahlvon Ereignissen in beiden ZV Unabhangigkeit vorliegt

I Die Bedingung Y = y beeinflusst nicht die Verteilung von Xund umgekehrt

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 8/49

Page 240: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

ErwartungswertI Beispiel: X ist die erhaltene Augenzahl bei einmaligem

Wurfeln; die Wahrscheinlichkeitsverteilung von X ist

xi 1 2 3 4 5 6

f (xi )16

16

16

16

16

16

I Welchen Wert ’erwarten’ wir, wenn wir diesesZufallsexperiment sehr lange durchfuhren?

I Intuitiv erwarten wir X = 1 bei 16 der Wurfe, X = 2 bei 1

6 beider Wurfe, usw.

I Der Durchschnitt von X auf lange Sicht ist derErwartungswert von X

11

6+ 2

1

6+ · · ·+ 6

1

6= 3.5,

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 9/49

Page 241: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Erwartungswert

I Der Erwartungswert einer ZV ist ein Maß fur das Zentrum derVerteilung

I Bei einer diskreten ZV X ist der Erwartungswert definiertE [X ] als der gewichtete Durchschnitt uber alle moglichenAuspragungen von X ; die Gewichte sind die jeweiligenWahrscheinlichkeiten.

E [X ] =∑x

xf (x)

I Bei einer stetigen ZV Y analog

E [X ] =

∫xxf (x)dx

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 10/49

Page 242: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Erwartungswert

I Folgende Eigenschaft folgt direkt aus der Definition desErwartungswerts; fur beliebige Konstanten a und b gilt

E [aX + b] = aE [X ] + b

I Weiters gilt

E [X1 + X2 + · · ·+ Xn] = E [X1] + · · ·+ E [Xn]

I Fur unabhangige ZV X1 · · ·Xn gilt

E [X1 · X2 · . . . · Xn] = E [X1] · . . . · E [Xn]

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 11/49

Page 243: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Varianz, Kovarianz, Korrelation

I Die Varianz σ2 ist ein Streuungsmaß der Verteilung

σ2X = E[(X − E [X ])2

]= E

[X 2]− (E [X ])2

I Analog zur Stichprobenkovarianz ist die Kovarianz zwischen 2ZV definiert als

σXY = E [XY ]− E [X ]E [Y ]

I Die Varianz einer ZV ist die Kovarianz dieser ZV mit sichselbst!

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 12/49

Page 244: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Varianz, Kovarianz, Korrelation

I Die Korrelation ρXY ist das Verhaltnis zwischen der Kovarianzund dem Produkt der Standardabweichungen

ρXY =σXYσXσY

I Gleiche Interpretation wie in Stichprobe

I Sind zwei ZV Variablen unabhangig, dann ist ihre Korrelation0; Achtung die umgekehrte Folgerung ist nicht immer richtig!

I Aus Korrelation gleich 0 folgt nicht unbedingt stochastischeUnabhangigkeit

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 13/49

Page 245: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Varianz, Kovarianz, Korrelation

I Es gilt fur beliebige ZV bzw. fur Konstanten a und b

σ2(aX+b) = a2σ2X

I Weiters

σ2(X+Y ) = σ2X +σ2Y +2σXY bzw. σ2(X−Y ) = σ2X +σ2Y −2σXY

I

σ(aX+b)(cY+d) = acσXY

I Und schließlich

ρ(aX+b)(cY+d) = sgn(ac)ρXY

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 14/49

Page 246: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Varianz

I Beispiel: X ist die beobachtete Augenzahl bei einmaligemWurfeln; die Wahrscheinlichkeitsverteilung von X ist

xi 1 2 3 4 5 6

f (xi )16

16

16

16

16

16

I

σ2 = E[X 2]− (E [X ])2︸ ︷︷ ︸

3.52

und E[X 2]

=6∑

i=1

x2i p(x2i )

E[X 2]

= 121

6+ · · ·+ 62

1

6= 15.17, σ2 = 2.92, σ = 1.71

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 15/49

Page 247: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Erwartungswert und Varianz

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 16/49

Page 248: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

α-Quantil

I Als α-Quantil qα wird ein Wert bezeichnet, unterhalb dessenein vorgegebener Anteil α aller Falle der Verteilung liegen

I Jeder Wert unterhalb von qα unterschreitet den Anteil α, mitα als reelle Zahl zwischen 0 (gar kein Fall der Verteilung) und1 (alle Falle oder 100% der Verteilung)

I Fur stetige ZV gilt

F (qα) = P(X ≤ qα) =

∫t≤qα

f (t)dt = α

I α-Quantile sind fur die wichtigsten stetigen Verteilungen inTabellen ausgegeben

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 17/49

Page 249: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Stetige ZV

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 18/49

Page 250: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

α-Quantil

I Fur diskrete ZV gilt

F (qα) = P(X ≤ qα) =∑t≤qα

P(X = t) ≥ α

F (x) < α fur jedes x kleiner als qα

I Aufrunden auf die nachste großere ganzzahlige Auspragung,analog zur Stichprobe

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 19/49

Page 251: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Diskrete ZV

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 20/49

Page 252: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Diskrete Gleichverteilung

I Diese Verteilung beschreibt eine ZV, welche die Zahlen1, 2, · · · ,m annehmen kann, und

I es gilt

P(X = x) =1

mfur alle x = 1, 2, · · · ,m

E [X ] =(m + 1)

2

σ2 =(m2 − 1)

12

I Anwendung bei Zufallsexperimenten, deren Ergebnisse gleichhaufig sind, also wenn angenommen wird, dass die mElementarereignisse gleichwahrscheinlich sind

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 21/49

Page 253: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Diskrete Gleichverteilung

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 22/49

Page 254: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Diskrete Gleichverteilung

I Erwartungswert und Varianz

E [X ] =m∑i=1

i1

m=

1

m

m∑i=1

i︸︷︷︸m(m + 1)

2

=m + 1

2

E[X 2]

=1

m

m∑i=1

i2 =1

m

m(m + 1)(2m + 1)

6

σ2 =(m + 1)(2m + 1)

6−(m + 1

2

)2

= · · · =(m + 1)(m − 1)

12

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 23/49

Page 255: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Diskrete Gleichverteilung

I Beispiel: X = die erhaltene Augenzahl bei einmaligem Wurfeln

E [X ] =(6 + 1)

2= 3.5

σ2 =(62 − 1)

12= 2.92

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 24/49

Page 256: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Binomialverteilung

I Wir betrachten ein Zufallsexperiment mit 2 Ausgangen,’Erfolg (1)’ und ’Misserfolg (0)’

I Die Wahrscheinlichkeit fur Erfolg sei p, mit p zwischen 0 und1

I Wir fuhren dieses Experiment n-mal durch, wobei zwischenden einzelnen Durchfuhrungen Unabhangigkeit angenommenwird (’Ziehen mit Zurucklegen’)

I Die ZV X beschreibt die Anzahl der Erfolge und istbinomialverteilt mit Parametern n und p, X v B(n, p)

P(X = k) =

(n

k

)pk(1− p)n−k fur k = 0, 1, · · · , n

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 25/49

Page 257: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Binomialverteilung

I Beispiel: Ein Glucksrad besteht aus 20 Feldern, wobei 5 davonGewinnfelder sind. Wie groß ist die Wahrscheinlichkeit, dassSie zwei Mal gewinnen, wenn Sie das Glucksrad drei Maldrehen?

I Experiment mit 2 Ausgangen, Erfolg (5 Gewinnfelder) undMisserfolg

I n = 3, weil wir das Glucksrad drei Mal drehen

I p = 520 = 0.25 ist die Wahrscheinlichkeit zum Erfolg

P(X = 2) =

(3

2

)0.252(1− 0.25)1 =

3!

2!1!0.0625 · 0.75 = 0.14

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 26/49

Page 258: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Binomialverteilung

I Binomialverteilte ZV nimmt Werte zwischen 0 und n an

I Binomialverteilung ist symmetrisch fur p = 0.5

I Je kleiner/großer p desto rechts/links-schiefer die Verteilung

I Erwartungswert und Varianz

E [X ] = np σ2 = np(1− p)

I Fur n = 1: B(1, p) ist eine Bernoulli-ZV mit Erwartungswertp und Varianz p(1− p)

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 27/49

Page 259: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Binomialverteilung

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 28/49

Page 260: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Poisson-Verteilung

I Diese Verteilung beschreibt ZV, die alle naturliche Zahlen und0 annehmen konnen

I Die Wahrscheinlichkeitsfunktion

P(X = k) =λke−λ

k!fur k = 0, 1, · · · ,∞

I λ ist der Parameter der Poisson-Verteilung und kann jedereelle positive Zahl sein

I Erwartungswert und Varianz

E [X ] = λ σ2 = λ

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 29/49

Page 261: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Poisson-Verteilung

I Poisson-Verteilung ist Grenzverteilung der Binomialverteilungbei n→∞ und p → 0 unter der Nebenbedingung, dassnp = λ beschrankt bleibt

I Poisson-Verteilung kann als gute Approximation fur dieBinomialverteilung bei großem n und kleinem p verwendetwerden

I Poisson-Verteilung beschreibt seltene Ereignisse

I Anwendung bei binomialverteilter ZV mit unbekanntem odergroßem n (leichtere Berechnung) und kleinem p

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 30/49

Page 262: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Poisson-Verteilung

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 31/49

Page 263: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Poisson-Verteilung

I Beispiel: Die Wahrscheinlichkeit, dass ein Patient die Injektioneines Serums nicht vertragt sei 0.001. Wie groß ist dieWahrscheinlichkeit, dass von 200 Patienten mehr als 1 dieInjektion nicht vertragen?

I Wahrscheinlichkeiten (Poisson-Verteilung)

I E [X ] = λ = (200)(0.001) = 0.2

P(X = 0) =0.20e−0.2

0!= 0.818731, P(X = 1) = 0.163746

P(X > 1) = 1− P(X = 0)− P(X = 1) = 0.017523

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 32/49

Page 264: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Poisson-Verteilung

I Wahrscheinlichkeiten (Binomialverteilung B(200, 0.001))

P(X = 0) =

(200

0

)(0.001)0(1− 0.001)(200−0) = 0.818649

P(X = 1) = 0.163894

P(X > 1) = 1− P(X = 0)− P(X = 1) = 0.017458

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 33/49

Page 265: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Poisson-Verteilung

I Beispiel: In einer Telefonzentrale kommen in einer Minutedurchschnittlich 3 Gesprache an. Mit welcherWahrscheinlichkeit kommen in einer Minute mehr als 3Gesprache an?

I Denkt man sich eine Minute in n gleiche Zeitabschnittezerlegt, die so klein sind, dass in jedem Abschnitt hochstensein Gesprach ankommen kann, so liegt eine BinomialverteilungB(n, 3n ) vor

I n ist unbekannt ⇒ Poissonverteilung mit λ = 3

P(X > 3) = 1−P(X = 0)−P(X = 1)−P(X = 2)−P(X = 3)

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 34/49

Page 266: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Poisson-Verteilung

I

P(X = 0) =30e−3

0!= 0.0498

I

P(X = 1) =31e−3

1!= 0.1494

I

P(X = 2) =32e−3

2!= 0.2240

I

P(X = 3) =33e−3

3!= 0.2240

I

P(X > 3) = 1− 0.0498− 0.1494− 0.2240− 0.2240 = 0.3528

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 35/49

Page 267: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Geometrische Verteilung

I Wir fuhren eine Serie von Versuchen mit zwei moglichenAusgangen, ’Erfolg (1)’ und ’Misserfolg (0)’, so lange durchbis wir den ersten Erfolg haben

I Die Wahrscheinlichkeit fur Erfolg sei p

I Unsere ZV X erfasst die Anzahl der Durchfuhrungen bis zumersten Erfolg

P(X = k) = p(1− p)k−1 fur k = 1, 2, · · · ,∞

E [X ] =1− p

pσ2 =

1− p

p2

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 36/49

Page 268: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Geometrische Verteilung

I Anwendung bei der Analyse von Wartezeiten bis zumEintreffen eines bestimmten Ereignisses

I Lebensdauerbestimmung von Geraten und Bauteilen, d.h.dem Warten bis zum ersten Ausfall

I Ruckfalle bei Suchterkrankungen

I Bestimmung der Anzahl haufiger Ereignisse zwischenunmittelbar aufeinanderfolgenden seltenen Ereignissen wiez.B. Fehlern

I Bestimmung der Zuverlassigkeit von Geraten

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 37/49

Page 269: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Hypergeometrische Verteilung

I Aus einer Gesamtheit von N Elementen, wobei A (A ≤ N)markiert sind, wird zufallig eine Stichprobe von n (n ≤ N)Elementen ohne Zurucklegen entnommen

I Mit welcher Wahrscheinlichkeit kommt in der Stichprobe einebestimmte Anzahl a von markierten Elementen vor?

P(X = a) =

(Aa

)(N−An−a)(N

n

)E [X ] = n

A

Nσ2 = n

A

N

(1− A

N

)(N − n

N − 1

)

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 38/49

Page 270: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Hypergeometrische Verteilung

I Beispiel: Lotto 6 aus 45N = 45 Kugeln (=Zahlen) insgesamt, A = 6 Kugeln sind’markiert’ (d.h. am Lottoschein angekreuzt), n = 6 Kugelnwerden gezogen (ohne Zurucklegen). Die einzelnenGewinnwahrscheinlichkeiten ergeben sich durch dieHypergeometrische Verteilung

P(X = 3) =

(63

)(393

)(456

) =20 · 9139

8145060= 0.022

P(X = 6) =

(66

)(390

)(456

) =1

8145060= 0.000000123

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 39/49

Page 271: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Wahrscheinlichkeitsfunktion Beispiel Lotto

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 40/49

Page 272: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Hypergeometrische und Binomialverteilung

I Hypergeometrische Verteilung kann durch B(n, AN ) angenahertwerden, wenn n

N ≤ 0.05

I Beispiel: In der Population der Personen mit Adipositas, diesich einer Magenbypass-Operation unterzogen haben, haben10% einige Jahre nach der Operation (noch) eineBinge-Eating Storung (BED). In einer spezialisierten Klinikwurden in den letzten Jahren 1500 Personen operiert. Wiegroß ist die Wahrscheinlichkeit in einer Stichprobe von n = 50Personen maximal eine Person mit BED zu finden?

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 41/49

Page 273: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Hypergeometrische und Binomialverteilung

I Binomialverteilung B(50, 0.10)

P(X = 0) =

(50

0

)0.100(1− 0.10)50 = 0.005154

P(X = 1) = 0.028632, ⇒ P(X = 0) +P(X = 1) = 0.033786

I Hypergeometrische Verteilung, N = 1500, A = 150, n = 50

P(X = 0) =

(1500

)(135050

)(150050

) = 0.004697

P(X = 1) = 0.027075 ⇒ P(X = 0) + P(X = 1) = 0.031771

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 42/49

Page 274: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Normalverteilung (NV)

I Die NV ist eine stetige Verteilung, die durch 2 Parameter µund σ charakterisiert ist

I Es sei X eine ZV die N(µ, σ2) verteilt ist; X kann Wertezwischen −∞ und +∞ annehmen

I Die Dichtefunktion φ(x)

φ(x) =1

σ√

2πe−1

2

(x − µσ

)2

I Geht x → ±∞ strebt φ(x) gegen 0

I φ(x) ist symmetrisch um µ, d.h. µ+ a = µ− a (a =Konstante)

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 43/49

Page 275: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Normalverteilung (NV)

I σ gibt den Abstand zwischen µ und den Wendepunkten derDichtefunktion an

I Wendepunkte an den Stellen µ± σI Wenn σ groß ist, ist die Verteilung breit und niedrig, wenn σ

klein ist, ist die Verteilung schmal und hoch

I Flache unter φ(x) zwischen −∞ und +∞ ist gleich 1

I Die Flache µ± σ umfasst ca. 68% aller Falle

I Die Flache µ± 2σ umfasst ca. 95% aller Falle

I Es existieren unendlich viele NV durch beliebige Auswahl vonµ und σ

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 44/49

Page 276: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Normalverteilung (NV)

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 45/49

Page 277: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Standardnormalverteilung N(0, 1)

I Spezielle NV fur µ = 0 und σ = 1 (Gauß’sche Glockenkurve)

I Verteilung der N(0,1) ist tabelliert; Flache zwischen µ = 0und einem beliebigen Wert z ist ablesbar (Tabelle 1c)

I Quantile der NV; 1-Flache rechts von einem Wert z , und linksvon −z (Tabelle 1b)

I Beispiele

P(0 ≤ Z ≤ 1) = 0.3413 (Tabelle 1c)

P(−1 ≤ Z ≤ 1) = 0.6826 (Tabelle 1b)

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 46/49

Page 278: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Standardnormalverteilung N(0, 1)

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 47/49

Page 279: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Standardnormalverteilung N(0, 1)

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 48/49

Page 280: Statistik

Verteilungsfunktion fur Stetige ZVUnabhangigkeit von ZVKenngroßen von ZVSpezielle Diskrete VerteilungenSpezielle Stetige Verteilungen

Standardnormalverteilung N(0, 1)

I Ist X N(µ, σ2) verteilt dann fuhrt die Transformation X−µσ auf

eine N(0, 1) Verteilung

I Vorteil, da Quantile ablesbar (Tabelle 1b)

I Beispiel: X ∼ N(11, 5.53). Wie hoch ist P(X ≥ 14.5)?

z =14.5− 11

2.35= 1.49

P(Z ≥ 1.49) = 0.0681 (Tabelle 1b)

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 7.VO 49/49

Page 281: Statistik

Tabelle 1b: Verteilungsfunktion der Standard-Normalverteilung(einseitige Fragestellung)

z0 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

0.0 .5000 .4960 .4920 .4880 .4840 .4801 .4761 .4721 .4681 .46410.1 .4602 .4562 .4522 .4483 .4443 .4404 .4364 .4325 .4286 .42470.2 .4207 .4168 .4129 .4090 .4052 .4013 .3974 .3936 .3897 .38590.3 .3821 .3783 .3745 .3707 .3669 .3632 .3594 .3557 .3520 .34830.4 .3446 .3409 .3372 .3336 .3300 .3264 .3228 .3192 .3156 .3121

0.5 .3085 .3050 .3015 .2981 .2946 .2912 .2877 .2843 .2810 .27760.6 .2743 .2709 .2676 .2643 .2611 .2578 .2546 .2514 .2483 .24510.7 .2420 .2389 .2358 .2327 .2296 .2266 .2236 .2206 .2177 .21480.8 .2119 .2090 .2061 .2033 .2005 .1977 .1949 .1922 .1894 .18670.9 .1841 .1814 .1788 .1762 .1736 .1711 .1685 .1660 .1635 .1611

1.0 .1587 .1562 .1539 .1515 .1492 .1469 .1446 .1423 .1401 .13791.1 .1357 .1335 .1314 .1292 .1271 .1251 .1230 .1210 .1190 .11701.2 .1151 .1131 .1112 .1093 .1075 .1056 .1038 .1020 .1003 .09851.3 .0968 .0951 .0934 .0918 .0901 .0885 .0869 .0853 .0838 .08231.4 .0808 .0793 .0778 .0764 .0749 .0735 .0721 .0708 .0694 .0681

1.5 .0668 .0655 .0643 .0630 .0618 .0606 .0594 .0582 .0571 .05591.6 .0548 .0537 .0526 .0516 .0505 .0495 .0485 .0475 .0465 .04551.7 .0446 .0436 .0427 .0418 .0409 .0402 .0392 .0384 .0375 .03671.8 .0359 .0351 .0344 .0336 .0329 .0322 .0314 .0307 .0301 .02941.9 .0287 .0281 .0274 .0268 .0262 .0256 .0250 .0244 .0239 .0233

2.0 .0228 .0222 .0217 .0212 .0207 .0202 .0197 .0192 .0188 .01832.1 .0179 .0174 .0170 .0166 .0162 .0158 .0154 .0150 .0146 .01432.2 .0139 .0136 .0132 .0129 .0126 .0122 .0119 .0116 .0113 .01102.3 .0107 .0104 .0102 .0099 .0096 .0094 .0091 .0089 .0087 .00842.4 .0082 .0080 .0078 .0076 .0073 .0071 .0070 .0068 .0066 .0064

2.5 .0062 .0060 .0059 .0057 .0055 .0054 .0052 .0051 .0049 .00482.6 .0047 .0045 .0044 .0043 .0042 .0040 .0039 .0038 .0037 .00362.7 .0035 .0034 .0033 .0032 .0031 .0030 .0029 .0028 .0027 .00262.8 .0026 .0025 .0024 .0023 .0023 .0022 .0021 .0021 .0020 .00192.9 .0019 .0018 .0018 .0017 .0016 .0016 .0015 .0015 .0014 .0014

3.0 .00135 Die Tabelle gibt die Wahrscheinlich-3.1 .00097 keiten P (Z ≥ z0) fur beliebige3.2 .00069 Werte z0 einer standardnormal-3.3 .00048 verteilten Variablen Z an. (Ist z03.4 .00034 negativ, so ist |z0| zu verwenden!)

3.5 .00023 Ist die Irrtumswahrscheinlich-3.6 .00016 keit α gegeben, so ist jenes z03.7 .00011 (kritischer Wert) gesucht,3.8 .00007 fur welches gilt:3.9 .00005 P (Z ≥ z0) = α.

4.0 .00003 Fur α = 0.01 und α = 0.05 sind diese5.0 .0000003 kritischen Werte: 2.33 und 1.645.

waldherr
Stempel
waldherr
Stempel
Page 282: Statistik

Tabelle 1c: Verteilungsfunktion der Standard-Normalverteilung

z0 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

0.0 .0000 .0040 .0080 .0120 .0160 .0199 .0239 .0279 .0319 .03590.1 .0398 .0438 .0478 .0517 .0557 .0596 .0636 .0675 .0714 .07530.2 .0793 .0832 .0871 .0910 .0948 .0987 .1026 .1064 .1103 .11410.3 .1179 .1217 .1255 .1293 .1331 .1368 .1406 .1443 .1480 .15170.4 .1554 .1591 .1628 .1664 .1700 .1736 .1772 .1808 .1844 .1879

0.5 .1915 .1950 .1985 .2019 .2054 .2088 .2123 .2157 .2190 .22240.6 .2257 .2291 .2324 .2357 .2389 .2422 .2454 .2486 .2517 .25490.7 .2580 .2611 .2642 .2673 .2703 .2734 .2764 .2794 .2823 .28520.8 .2881 .2910 .2939 .2967 .2995 .3023 .3051 .3078 .3106 .31330.9 .3159 .3186 .3212 .3238 .3264 .3289 .3315 .3340 .3365 .3389

1.0 .3413 .3438 .3461 .3485 .3508 .3531 .3554 .3577 .3599 .36211.1 .3643 .3665 .3686 .3708 .3729 .3749 .3770 .3790 .3810 .38301.2 .3849 .3869 .3888 .3907 .3925 .3944 .3962 .3980 .3997 .40151.3 .4032 .4049 .4066 .4082 .4099 .4115 .4131 .4147 .4162 .41771.4 .4192 .4207 .4222 .4236 .4251 .4265 .4279 .4292 .4306 .4319

1.5 .4332 .4345 .4357 .4370 .4382 .4394 .4406 .4418 .4429 .44411.6 .4452 .4463 .4474 .4484 .4495 .4505 .4515 .4525 .4535 .45451.7 .4554 .4564 .4573 .4582 .4591 .4599 .4608 .4616 .4625 .46331.8 .4641 .4649 .4656 .4664 .4671 .4678 .4686 .4693 .4699 .47061.9 .4713 .4719 .4726 .4732 .4738 .4744 .4750 .4756 .4761 .4767

2.0 .4772 .4778 .4783 .4788 .4793 .4798 .4803 .4808 .4812 .48172.1 .4821 .4826 .4830 .4834 .4838 .4842 .4846 .4850 .4854 .48572.2 .4861 .4864 .4868 .4871 .4875 .4878 .4881 .4884 .4887 .48902.3 .4893 .4896 .4898 .4901 .4904 .4906 .4909 .4911 .4913 .49162.4 .4918 .4920 .4922 .4925 .4927 .4929 .4931 .4832 .4934 .4936

2.5 .4938 .4940 .4941 .4943 .4945 .4946 .4948 .4949 .4951 .49522.6 .4953 .4955 .4956 .4957 .4959 .4960 .4961 .4962 .4963 .49642.7 .4965 .4966 .4967 .4968 .4969 .4970 .4971 .4972 .4973 .49742.8 .4974 .4975 .4976 .4977 .4977 .4978 .4979 .4979 .4980 .49812.9 .4981 .4982 .4982 .4983 .4984 .4984 .4985 .4985 .4986 .4986

3.0 .49865 Die Tabelle gibt die Wahrscheinlich-3.1 .49903 keiten P (0 ≤ Z ≤ z0) fur beliebige3.2 .49931 Werte z0 einer standardnormal-3.3 .49952 verteilten Variablen Z an. (Ist z03.4 .49966 negativ, so ist |z0| zu verwenden!)

3.5 .499773.6 .499843.7 .499893.8 .499933.9 .49995

4.0 .499975.0 .4999997

waldherr
Stempel
Page 283: Statistik

Wahrscheinlichkeitsverteilungen II

Einfuhrung in Quantitative Methoden

Karin Waldherr & Pantelis Christodoulides

11. Mai 2011

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 1/40

Page 284: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Poisson-Verteilung

I Diese Verteilung beschreibt ZV, die alle naturliche Zahlen und0 annehmen konnen

I Die Wahrscheinlichkeitsfunktion

P(X = k) =λke−λ

k!fur k = 0, 1, · · · ,∞

I λ ist der Parameter der Poisson-Verteilung und kann jedereelle positive Zahl sein

I Erwartungswert und Varianz

E [X ] = λ σ2 = λ

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 2/40

Page 285: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Poisson-Verteilung

I Poisson-Verteilung ist Grenzverteilung der Binomialverteilungbei n→∞ und p → 0 unter der Nebenbedingung, dassnp = λ beschrankt bleibt

I Poisson-Verteilung kann als gute Approximation fur dieBinomialverteilung bei großem n und kleinem p verwendetwerden

I Poisson-Verteilung beschreibt seltene Ereignisse

I Anwendung bei binomialverteilter ZV mit unbekanntem odergroßem n (leichtere Berechnung) und kleinem p

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 3/40

Page 286: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Poisson-Verteilung

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 4/40

Page 287: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Poisson-Verteilung

I Beispiel: Die Wahrscheinlichkeit, dass ein Patient die Injektioneines Serums nicht vertragt sei 0.001. Wie groß ist dieWahrscheinlichkeit, dass von 200 Patienten mehr als 1 dieInjektion nicht vertragen?

I Wahrscheinlichkeiten (Poisson-Verteilung)

I E [X ] = λ = (200)(0.001) = 0.2

P(X = 0) =0.20e−0.2

0!= 0.818731, P(X = 1) = 0.163746

P(X > 1) = 1− P(X = 0)− P(X = 1) = 0.017523

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 5/40

Page 288: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Poisson-Verteilung

I Wahrscheinlichkeiten (Binomialverteilung B(200, 0.001))

P(X = 0) =

(200

0

)(0.001)0(1− 0.001)(200−0) = 0.818649

P(X = 1) = 0.163894

P(X > 1) = 1− P(X = 0)− P(X = 1) = 0.017458

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 6/40

Page 289: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Poisson-Verteilung

I Beispiel: In einer Telefonzentrale kommen in einer Minutedurchschnittlich 3 Gesprache an. Mit welcherWahrscheinlichkeit kommen in einer Minute mehr als 3Gesprache an?

I Denkt man sich eine Minute in n gleiche Zeitabschnittezerlegt, die so klein sind, dass in jedem Abschnitt hochstensein Gesprach ankommen kann, so liegt eine BinomialverteilungB(n, 3

n ) vor

I n ist unbekannt ⇒ Poissonverteilung mit λ = 3

P(X > 3) = 1−P(X = 0)−P(X = 1)−P(X = 2)−P(X = 3)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 7/40

Page 290: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Poisson-Verteilung

I

P(X = 0) =30e−3

0!= 0.0498

I

P(X = 1) =31e−3

1!= 0.1494

I

P(X = 2) =32e−3

2!= 0.2240

I

P(X = 3) =33e−3

3!= 0.2240

I

P(X > 3) = 1− 0.0498− 0.1494− 0.2240− 0.2240 = 0.3528

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 8/40

Page 291: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Geometrische Verteilung

I Wir fuhren eine Serie von Versuchen mit zwei moglichenAusgangen, ’Erfolg (1)’ und ’Misserfolg (0)’, so lange durchbis wir den ersten Erfolg haben

I Die Wahrscheinlichkeit fur Erfolg sei p

I Variante 1: Unsere ZV X erfasst die Anzahl derDurchfuhrungen bis zum ersten Erfolg (Anzahl der Versuche,die notwendig sind, bis zum Erfolg)

P(X = k) = p(1− p)k−1 fur k = 1, 2, · · · ,∞

E [X ] =1

p; σ2 =

1− p

p2

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 9/40

Page 292: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Geometrische Verteilung

I Beispiel: Wurfeln einer 6, p = 1/6

I P(6 beim 1. Wurf): P(X = 1) = p = 1/6I P(6 beim 2. Wurf): P(X = 2) =?

I 1. Wurf keine 6: P(keine 6 beim 1.Wurf) = (1− p) = 5/6I P(6 beim 2.Wurf) = p = 1/6I P(X = 2) = p(1− p) = 1/6× 5/6 = 5/36 = 0.14

I allgemein: P(X = k) = p(1− p)k−1

I E (X ) = 1/16 = 6

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 10/40

Page 293: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Geometrische Verteilung

I Variante 2: Unsere ZV Y erfasst die Anzahl der Misserfolgebis zum ersten Erfolg (Anzahl der Fehlversuche vor demErfolg)

P(Y = k) = p(1− p)k fur k = 0, 1, 2, · · · ,∞

E [Y ] = E (X )− 1 =1− p

p; σ2 =

1− p

p2

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 11/40

Page 294: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Geometrische Verteilung

I Anwendung bei der Analyse von Wartezeiten bis zumEintreffen eines bestimmten Ereignisses

I Lebensdauerbestimmung von Geraten und Bauteilen, d.h.dem Warten bis zum ersten Ausfall

I Ruckfalle bei Suchterkrankungen

I Bestimmung der Anzahl haufiger Ereignisse zwischenunmittelbar aufeinanderfolgenden seltenen Ereignissen wiez.B. Fehlern

I Bestimmung der Zuverlassigkeit von Geraten

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 12/40

Page 295: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Hypergeometrische Verteilung

I Aus einer Gesamtheit von N Elementen, wobei A (A ≤ N)markiert sind, wird zufallig eine Stichprobe von n (n ≤ N)Elementen ohne Zurucklegen entnommen

I Mit welcher Wahrscheinlichkeit kommt in der Stichprobe einebestimmte Anzahl a von markierten Elementen vor?

P(X = a) =

(Aa

)(N−An−a

)(Nn

)E [X ] = n

A

Nσ2 = n

A

N

(1− A

N

)(N − n

N − 1

)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 13/40

Page 296: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Hypergeometrische Verteilung

I Beispiel: Lotto 6 aus 45N = 45 Kugeln (=Zahlen) insgesamt, A = 6 Kugeln sind’markiert’ (d.h. am Lottoschein angekreuzt), n = 6 Kugelnwerden gezogen (ohne Zurucklegen). Die einzelnenGewinnwahrscheinlichkeiten ergeben sich durch dieHypergeometrische Verteilung

P(X = 3) =

(63

)(393

)(456

) =20 · 9139

8145060= 0.022

P(X = 6) =

(66

)(390

)(456

) =1

8145060= 0.000000123

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 14/40

Page 297: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Wahrscheinlichkeitsfunktion Beispiel Lotto

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 15/40

Page 298: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Hypergeometrische und Binomialverteilung

I Hypergeometrische Verteilung kann durch B(n, AN ) angenahert

werden, wenn nN ≤ 0.05

I Beispiel: In der Population der Personen mit Adipositas, diesich einer Magenbypass-Operation unterzogen haben, haben10% einige Jahre nach der Operation (noch) eineBinge-Eating Storung (BED). In einer spezialisierten Klinikwurden in den letzten Jahren 1500 Personen operiert. Wiegroß ist die Wahrscheinlichkeit in einer Stichprobe von n = 50Personen maximal eine Person mit BED zu finden?

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 16/40

Page 299: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Hypergeometrische und Binomialverteilung

I Binomialverteilung B(50, 0.10)

P(X = 0) =

(50

0

)0.100(1− 0.10)50 = 0.005154

P(X = 1) = 0.028632, ⇒ P(X = 0) + P(X = 1) = 0.033786

I Hypergeometrische Verteilung, N = 1500, A = 150, n = 50

P(X = 0) =

(1500

)(135050

)(150050

) = 0.004697

P(X = 1) = 0.027075 ⇒ P(X = 0) + P(X = 1) = 0.031771

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 17/40

Page 300: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Normalverteilung (NV)

I Die NV ist eine stetige Verteilung, die durch 2 Parameter µund σ charakterisiert ist

I Es sei X eine ZV die N(µ, σ2) verteilt ist; X kann Wertezwischen −∞ und +∞ annehmen

I Die Dichtefunktion φ(x)

φ(x) =1

σ√

2πe−1

2

(x − µσ

)2

I Geht x → ±∞ strebt φ(x) gegen 0

I φ(x) ist symmetrisch um µ, d.h. µ+ a = µ− a (a =Konstante)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 18/40

Page 301: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Normalverteilung (NV)

I σ gibt den Abstand zwischen µ und den Wendepunkten derDichtefunktion an

I Wendepunkte an den Stellen µ± σI Wenn σ groß ist, ist die Verteilung breit und niedrig, wenn σ

klein ist, ist die Verteilung schmal und hoch

I Flache unter φ(x) zwischen −∞ und +∞ ist gleich 1

I Die Flache µ± σ umfasst ca. 68% aller Falle

I Die Flache µ± 2σ umfasst ca. 95% aller Falle

I Es existieren unendlich viele NV durch beliebige Auswahl vonµ und σ

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 19/40

Page 302: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Normalverteilung (NV)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 20/40

Page 303: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Standardnormalverteilung N(0, 1)

I Spezielle NV fur µ = 0 und σ = 1 (Gauß’sche Glockenkurve)

I Verteilung der N(0,1) ist tabelliert; Flache zwischen µ = 0und einem beliebigen Wert z ist ablesbar (Tabelle 1c)

I Quantile der NV (Tabelle 1b)I 1 - Flache rechts von einem Wert z ,I Flache links von −z

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 21/40

Page 304: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Standardnormalverteilung N(0, 1)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 22/40

Page 305: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Standardnormalverteilung - Beispiel 1

P(0 ≤ Z ≤ 1) = 0.3413 (Tabelle 1c)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 23/40

Page 306: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Standardnormalverteilung - Beispiel 2

P(−1 ≤ Z ≤ 1)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 24/40

Page 307: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 25/40

Page 308: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

I Tabelle 1c: P(−1 ≤ Z ≤ 1) = 2× 0.3413 = 0.6826

I Tabelle 1b:

P(−1 ≤ Z ≤ 1) = 1− 2× 0.1587 = 0.6826

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 26/40

Page 309: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Standardnormalverteilung N(0, 1)

I Ist X N(µ, σ2) verteilt dann fuhrt die Transformation X−µσ auf

eine N(0, 1) Verteilung

I Vorteil, da Quantile ablesbar (Tabelle 1b)

I Beispiel: X ∼ N(11, 5.53). Wie hoch ist P(X ≥ 14.5)?

z =14.5− 11

2.35= 1.49

P(Z ≥ 1.49) = 0.0681 (Tabelle 1b)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 27/40

Page 310: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 28/40

Page 311: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Zentraler Grenzwertsatz

I Große Zahl voneinander unabhangiger ZV Xi mit beliebiger,identischer Verteilung mit gleichem E (Xi ) = µ und VarianzVar(Xi ) = σ2

I Zentraler Grenzwertsatz von Lindeberg & Levy (1922):Die Summe Y = X1 + X2 + . . .Xn ist asymptotischnormalverteilt mit E (Y ) = E (X1) + E (X2) + . . .E (Xn) = nµund Varianz σ2(Y ) = nσ2.

I Fur B(n, p) Satz von de Moivre und Laplace:Summe vieler Xi mit Bernoulli-Verteilung B(1, p) istasymptotisch normalverteilt mit µ = np und σ2 = np(1− p).Voraussetzung: np ≥ 5 und n(1− p) ≥ 5.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 29/40

Page 312: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

BinomialverteilungExperiment mit zwei Ausgangen, z.B. Erfolg und Misserfolg. DieZV K , Anzahl der Erfolge bei n Versuchen, ist binomialverteilt mitParametern n und p, K v B(n, p)

P(K = k) =

(n

k

)pk(1− p)n−k fur k = 0, 1, · · · , n

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 30/40

Page 313: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

NV-Approximation der BinomialverteilungBeispiel: n = 10 Versuche, p(Erfolg) = 0.5, µ = 5, σ = 1.58

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 31/40

Page 314: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

NV-Approximation der Binomialverteilung

I Vorteil: Verwendung der Standardnormalverteilung N(0,1), databelliert

I Berechnen von E (K ) = np und σ =√

np(1− p), unduberprufen ob np ≥ 5 und n(1− p) ≥ 5

I Standardisieren der Variable (d.h. Berechnung desStandardmesswertes), auch z-Transformation genannt

Z =k − µσ

I Bestimmen der Wahrscheinlichkeiten aus der Tabelle derN(0,1)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 32/40

Page 315: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

NV-Approximation der Binomialverteilung - Beispiel 1I n = 10 Versuche, p(Erfolg) = 0.5, µ = 5, σ = 1.58I Beispiel P(k ≥ 7)I k = 7: Dem diskreten Wert 7 entspricht bei der stetigen NV

das Intervall [6.5,7.5].I Stetigkeitskorrektur (Kontinuitatskorrektur)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 33/40

Page 316: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

z =6.5− 5

1.58= 0.95

Tab. 1b: P(Z ≥ 0.95) = 0.1711

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 34/40

Page 317: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Beispiel 2

n = 10 Versuche, p(Erfolg) = 0.5, µ = 5, σ = 1.58Beispiel P(K ≤ 7):

1− P(k ≥ 7) = 1− 0.1711 = 0.829

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 35/40

Page 318: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Beispiel 3n = 10 Versuche, p(Erfolg) = 0.5, µ = 5, σ = 1.58Beispiel P(K ≤ 3): Dem diskreten Wert 3 entspricht bei derstetigen NV das Intervall [2.5,3.5].

z =3.5− 5

1.58= −0.95

Tab. 1b: P(Z ≤ −0.95) = P(Z ≥ 0.95) = 0.1711

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 36/40

Page 319: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Beispiel 4n = 10 Versuche, p(Erfolg) = 0.5, µ = 5, σ = 1.58P(4 ≤ K ≤ 6):

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 37/40

Page 320: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Beispiel 4 - Tabelle 1b

z1:

z1 =3.5− 5

1.58= −0.95

z2:

z2 =6.5− 5

1.58= 0.95

Tab. 1b:P(−0.95 ≤ Z ≤ 0.95)] = 1− P(Z ≤ −0.95)− P(Z ≥ 0.95) =

1− 2× 0.1711 = 0.6578

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 38/40

Page 321: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

Beispiel 4 - Tabelle 1c

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 39/40

Page 322: Statistik

Wahrscheinlichkeitsverteilungen IIFortsetzung Spezielle Diskrete VerteilungenSpezielle Stetige Verteilungen - NormalverteilungNV-Approximation der Binomialverteilung

P(−0.95 ≤ Z ≤ 0.95) = 0.3289 + 0.3289 = 0.6578

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 8.VO 40/40

Page 323: Statistik

Einfuhrung in Quantitative Methoden

Karin Waldherr & Pantelis Christodoulides

Korrektur der Folie 35 vom 11. Mai 2011

Karin Waldherr & Pantelis Christodoulides Einfuhrung in Quantitative Methoden

Page 324: Statistik

Beispiel 2

n = 10 Versuche, p(Erfolg) = 0.5, µ = 5, σ = 1.58Beispiel P(K ≤ 6):

1− P(k ≥ 7) = 1− 0.1711 = 0.829

Karin Waldherr & Pantelis Christodoulides Einfuhrung in Quantitative Methoden

Page 325: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

Einfuhrung in Quantitative Methoden

Pantelis Christodoulides & Karin Waldherr

18. Mai 2011

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 1/37

Page 326: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

Fortsetzung Spezielle stetige Verteilungen

Prufverteilungen - Motivation

I Inferenzstatistik verwendet Stichprobenkennwerte(Stichprobenmittelwert, Stichprobenvarianz oder auch denQuotient zweier Stichprobenvarianzen) als Schatzfunktionenfur die entsprechenden Populationsparameter.

I Zieht man immer wieder voneinander unabhangigeZufallsstichproben und berechnet die Kennwerte, werden dieeinzelnen Kennwerte aufgrund der zufalligenZusammensetzung der Stichproben nicht ident sein sondernstreuen zufallig um den Erwartungswert. Die Kennwerteeinzelner Zufallsstichproben sind Realisierungen vonZufallsvariablen (z.B. X , S2).

I Kenntnis der Verteilung dieser ZV (= Stichprobenverteilung)ist Grundlage fur Inferenzstatistik, z.B. von Hypothesentests,Vertrauensbereichen fur Schatzwerte.

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 2/37

Page 327: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

Fortsetzung Spezielle stetige Verteilungen

Empirische und Theoretische Verteilungen

Empirisch (beobachtet) Theoretisch (erwartet)

Stichprobe Population(Umfang n) n→∞

Haufigkeitsverteilung Wahrscheinlichkeitsfunktionbzw. Dichte

Kumulative relative VerteilungsfunktionHaufigkeitsverteilung

Kennwerte der Verteilungx E (X ) = µs2 σ2

rXY ρXYEmpirische Quantile Theoretische Quantile

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 3/37

Page 328: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

Fortsetzung Spezielle stetige Verteilungen

χ2-VerteilungI Gegeben: standardnormalverteilte ZV (µ = 0, σ = 1)I Man entnimmt wiederholt (theoretisch unendlich oft) zufallig

einzelne z-Werte und quadriert diese. Diese Zufallsvariablewird als Z 2 = χ2

(1)-verteilte ZV bezeichnet.I Welche Verteilungsform ergibt sich?

I da die z-Werte quadriert werden, konnen nur Werte ≥ 0vorkommen

I da bei einer N(0,1)-verteilten ZV die Werte zwischen 0 und ±1 am haufigsten sind, werden daher auch χ2-Werte zwischen 0und 1 am haufigsten sein

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 4/37

Page 329: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

Fortsetzung Spezielle stetige Verteilungen

χ2-Verteilung

I Entnimmt man wiederholt 2, 3, 4 . . . , oder m unabhangigezi -Werte, quadriert diese und bildet die Summe der z2

i ,ergeben sich χ2

(2), χ2(3), χ2

(4), ... bzw. χ2(m)- verteilte ZV

I Es entstehen χ2-Verteilungen mit 2, 3, 4, . . . , bzw. mFreiheitsgraden (df )

I Freiheitsgrade = Anzahl der Summanden, die frei variierendurfen (d.h. fur die es gleichgultig ist, welchen Wert sieannehmen)

I E (χ2) = df , σ2 = 2df

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 5/37

Page 330: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

Fortsetzung Spezielle stetige Verteilungen

Dichten verschiedener χ2-Verteilungen

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 6/37

Page 331: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

Fortsetzung Spezielle stetige Verteilungen

χ2-Verteilung

I Die Summe einer χ2-verteilten Variablen mit df = n und einerunabhangigen χ2-verteilten Variablen mit df = m ist ebenfallsχ2-verteilt mit df = m + n. (= Reproduktionseigenschaft derχ2-Verteilung)

I Mit wachsender Anzahl von Summanden wird dieχ2-Verteilung immer symmetrischer und nahert sich einer NVmit µ = df und σ2 = 2df (vgl. Zentraler Grenzwertsatz)

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 7/37

Page 332: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

Fortsetzung Spezielle stetige Verteilungen

χ2-Tabelle

Tabelle 2 gibt ausgewahlte α-Quantile der χ2-Verteilung furverschiedene Freiheitsgrade an (jene Werte χ2

0, fur die giltP(χ2 ≤ χ2

0) = α).

α

0.005 0.01 0.025 0.05 0.90 0.95 0.975 0.99 0.995

df1 0.00 0.00 0.00 0.00 2.71 3.84 5.02 6.64 7.882 0.01 0.02 0.05 0.10 4.61 5.99 7.38 9.21 10.603 0.07 0.11 0.22 0.35 6.25 7.82 9.35 11.34 12.844 0.21 0.30 0.48 0.71 7.78 9.49 11.14 13.28 14.865 0.41 0.55 0.83 1.15 9.24 11.07 12.83 15.09 16.75...

......

......

......

......

...

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 8/37

Page 333: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

Fortsetzung Spezielle stetige Verteilungen

Beispiel: df = 15, α = 0.95α

0.005 0.01 0.025 0.05 0.90 0.95 0.975 0.99 0.995

df1 0.00 0.00 0.00 0.00 2.71 3.84 5.02 6.64 7.88...

......

......

......

......

...15 4.60 5.23 6.26 7.26 22.31 25.00 27.49 30.58 32.80

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 9/37

Page 334: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

Fortsetzung Spezielle stetige Verteilungen

Asymptotische Entwicklung von χ2

I Wenn df > 100 asymptotische Entwicklung von χ2

I Beispiel df = 200: annahernd normalverteilt mitN(200,

√400)

I

Z =χ2 − E (χ2)

σ(χ2)=χ2 − 200√

400I

χ20.99 − 200

20∼ z0.99 = 2.33(Tab. 1b)

I

χ20.99 ∼ 200 + 20 · 2.33 = 246.6

I

χ20.01 ∼ 200− 20 · 2.33 = 153.4

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 10/37

Page 335: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

Fortsetzung Spezielle stetige Verteilungen

t-Verteilung

I Durch Standardisieren einer normalverteilten Variablen erhaltman eine standardnormalverteilte Variable

Z =X − µXσX

=X − µX√

σ2Xn

I Ist Populationsvarianz jedoch nicht bekannt und mussgeschatzt werden, dann ist der Quotient nichtstandardnormalverteilt sondern t-verteilt

T =X − µXσX

=X − µX√

σ2Xn

mit n Freiheitsgraden.

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 11/37

Page 336: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

Fortsetzung Spezielle stetige Verteilungen

Dichten verschiedener t-VerteilungenDie t-Verteilung ist wie die NV eingipfelig und symmetrisch, mitE (T ) = 0 (fur df ≥ 2), und Varianz n/(n − 2) (fur df ≥ 3).Mit wachsender Zahl der Freiheitsgrade nahert sich diet-Verteilung der N(0,1).

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 12/37

Page 337: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

Fortsetzung Spezielle stetige Verteilungen

t-Tabelle

Tabelle 3 gibt ausgewahlte α-Quantile der t-Verteilung furverschiedene Freiheitsgrade an (jene Werte t0, fur welche giltP(t ≤ t0) = α)

α0.90 0.95 0.975 0.99 0.995 0.999 0.9995

df1 3.09 6.31 12.71 31.82 63.66 318.31 636.622 1.89 2.92 4.30 6.97 9.93 22.33 31.60...

......

......

......

...

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 13/37

Page 338: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

Fortsetzung Spezielle stetige Verteilungen

Beispielα

0.90 0.95 0.975 0.99 0.995 0.999 0.9995

df10 1.37 1.81 2.23 2.76 3.17 4.14 4.59

......

......

......

......

120 1.29 1.66 1.98 2.36 2.62 3.16 3.37∞ 1.28 1.65 1.96 2.33 2.58 3.09 3.29

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 14/37

Page 339: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

Fortsetzung Spezielle stetige Verteilungen

F -Verteilung

I Gegeben seien zwei stochastisch unabhangige χ2-verteilteVariablen, χ2

(n) und χ2(m).

I Der Quotientχ2

(n)

nχ2

(m)

m

ist F -verteilt mit df1 = n (Zahlerfreiheitsgrade) und df2 = m(Nennerfreiheitsgrade)

I F -Verteilungen sind stetig und asymmetrisch

I Da F das Verhaltnis zweier quadrierter Werte ist, konnen nurpositive Werte vorkommen

I Form ist abhangig von der Anzahl der Zahler- undNennerfreiheitsgrade

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 15/37

Page 340: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

Fortsetzung Spezielle stetige Verteilungen

Dichten verschiedener F -Verteilungen

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 16/37

Page 341: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

Fortsetzung Spezielle stetige Verteilungen

F -TabelleI Tabelle 4a gibt jene Werte F0 einer F -verteilten Variablen mit

bestimmter Anzahl von Freiheitsgraden an, fur welche giltP(F ≤ F0) = α.

I Quotient wird so gebildet, dass der großere Wert im Zahlersteht.

I Fur die Werte in der jeweils oberen Zeile ist α = 0.95, fur jeneder unteren Zeile ist α = 0.99.

I df1 . . . Anzahl der ZahlerfreiheitsgradeI df2 . . . Anzahl der Nennerfreiheitsgrade

df1 1 2 3 4 5 . . . 10

df21 161 200 216 225 230 . . . 242

4052 4999 5403 5625 5764 . . . 6056

2 18.51 19.00 19.16 19.25 19.30 . . . 19.4098.50 99.00 99.17 99.25 99.30 . . . 99.40

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 17/37

Page 342: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

Fortsetzung Spezielle stetige Verteilungen

Beispieldf1 1 2 3 4 5 . . . 10

df21 161 200 216 225 230 . . . 242

4052 4999 5403 5625 5764 . . . 6056

2 18.51 19.00 19.16 19.25 19.30 . . . 19.4098.50 99.00 99.17 99.25 99.30 . . . 99.40

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 18/37

Page 343: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern

Parameterschatzung

I Schatzung von Populationsparameter aufgrund einerStichprobe

1. Punktschatzer2. Vertrauensbereiche (Konfidenzintervalle)

I Punktschatzer: Wir benotigen eine Schatzfunktion (kurz:Schatzer).

I Bei der Konstruktion von Schatzern werden bestimmteEigenschaften berucksichtigt.

I ”Gute” (Qualitat) eines Schatzers spielt zentrale Rolle.

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 19/37

Page 344: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern

Gutekriterien von Schatzfunktionen nach R.A. Fisher

Populationsparameter sollen aus Stichprobenkennwerten moglichst’gut’ geschatzt werden. Nach welchen Kriterien konnen wirentscheiden, ob ein Stichprobenkennwert ein brauchbarer Schatzerist?

I Erwartungstreue

I Konsistenz

I Effizienz

I Suffizienz (erschopfend)

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 20/37

Page 345: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern

Erwartungstreue

I Eine Schatzfunktion (kurz: Schatzer) Θ ist erwartungstreu,wenn sein Erwartungswert dem Populationsparameterentspricht.

E (Θ) = θ

D.h., zieht man aus der Population immer wieder Stichprobenvom Umfang n und berechnet z.B. jedes Mal x , entspricht(auf lange Sicht) das arithmetische Mittel dieser xi demPopulationsparameter µ. Der Erwartungswert der ZV X ist µ.

I Unter- oder uberschatzt ein Schatzer den Parametersystematisch, weist er einen Bias auf. Der Bias ist dieDifferenz E (Θ)− θ.

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 21/37

Page 346: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern

Beispiel GewehrErwartungstreues Gewehr und Gewehr mit Bias

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 22/37

Page 347: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern

I X ist ein erwartungstreuer Schatzer fur denPopulationsparameter µ: E (X ) = µ.

I

S2 =1

n − 1

n∑i=1

(Xi − X )2

ist ein erwartungstreuer Schatzer fur denPopulationsparameter σ2.

I

S2 =1

n

n∑i=1

(Xi − X )2

ist kein erwartungstreuer Schatzer fur σ2. Wurde man dieVarianzen aller moglichen Zufallsstichproben aus derPopulation mit dieser Formel berechnen, und daraus denDurchschnittswert, wurde die Populationsvarianz um denFaktor (n − 1)/n unterschatzt.

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 23/37

Page 348: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern

I Analog fur die Kovarianz:

CXY =1

n − 1

n∑i=1

(Xi − X )(Yi − Y )

ist ein erwartungstreuer Schatzer.

I Weitere erwartungstreue Schatzer: Die relative Haufigkeit Rfur die Wahrscheinlichkeit eines Ereignisses, und dieStichprobenkorrelation fur ρXY

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 24/37

Page 349: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern

EffizienzI Ein Schatzer soll auch schon fur kleine Stichprobenumfange

eine moglichst geringe Varianz aufweisen.I Effizienz meint also die Prazision eines Schatzers.I Je kleiner die Varianz der Verteilung eines

Stichprobenkennwertes, umso großer ist seine Effizienz alsSchatzer.

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 25/37

Page 350: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern

Streuung von Stichprobenmittelwerten

I Wie effizient ist X als Schatzer fur µ?

I Standardabweichung von Stichprobenkennwerten heißtStandardfehler

I Der Standardfehler des Mittelwertes σX ist abhangig von derVarianz der Variable X in der Population. σX andert sichproportional zur Populationsstreuung.

I Weiters beeinflusst der Stichprobenumfang denStandardfehler. Mit zunehmendem Stichprobenumfang wirdσX kleiner.

I Der Standardfehler des Mittelwertes betragt

σX =

√σ2X

n

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 26/37

Page 351: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern

Standardfehler des Medians

I Der Standardfehler des Medians betragt

σMd = 1.25

√σ2X

n

I Somit ist die Varianz der Medianwerteverteilung immer großerals jene der Mittelwerteverteilung.

I Der Mittelwert schatzt µ effizienter als der Median.

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 27/37

Page 352: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern

Konsistenz

I Ein Schatzer soll fur große Stichprobenumfange (n→∞)einen moglichst kleinen zufalligen Fehler aufweisen, d.h. mitgroßer werdendem Stichprobenumfang soll Θn gegen denwahren Parameter θ streben, also immer genauer werden.

I Mathematisch

P(|Θn − θ| > ε)−→n→∞

0 fur jedes ε > 0.

Ein Schatzer ist konsistent, wenn die Wahrscheinlichkeit, dassder Absolutbetrag der Differenz zum wahren Parameter großerals jede beliebig kleine reelle Zahl ist, mit wachsendem ngegen 0 strebt.

I Konsistente Schatzer sind: Relative Haufigkeit, X , S2, und dieKorrelation.

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 28/37

Page 353: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern

Suffizienz

I Ein Schatzer ist dann suffizient (oder erschopfend), wenn eralle in den Daten einer Stichprobe enthaltenen Informationenberucksichtigt, so dass die Berechnung eines weiterenstatistischen Kennwertes keine zusatzliche Information uberden zu schatzenden Parameter liefert.

I X und S2 sind suffiziente Schatzer

I Beispiel: Unter ganz bestimmten Bedingungen ist derRohscore (= Anzahl richtig geloster Aufgaben), den einePerson in einem Test erreicht, eine erschopfendeSchatzfunktion fur die Fahigkeit der Person. Die Kenntnis,welche Aufgaben die Person gelost hat und welche nicht,liefert keine zusatzliche Information uber die Fahigkeit derPerson.

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 29/37

Page 354: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern

Methode der kleinsten Quadrate

I auch Ordinary Least Squares-Methode genannt.

I Schatzwert θ fur θ, sodass Stichprobe moglichst gutreprasentiert wird in der Form,

I dass die Summe der quadrierten Abweichungen zwischen θund Messwerten minimiert wird.

I Es wird die Summe der Abweichungsquadrate gebildet,

S(θ) =n∑

i=1

(xi − θ)2 → min,

und anschließend die partielle Ableitung nach dem ParameterNull gesetzt.

I Beispiel: Regression

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 30/37

Page 355: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern

Beispiel Mittelwert

S(µ) =n∑

i=1

(xi − µ)2 =n∑

i=1

(x2i − 2µxi + µ2) =

=n∑

i=1

x2i − 2µ

n∑i=1

xi + nµ2

∂S

∂µ= 2

n∑i=1

xi + 2nµ = 0

⇒ µ =

∑ni=1 xin

= x

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 31/37

Page 356: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern

Maximum-Likelihood SchatzungI Likelihood-Funktion: Wahrscheinlichkeit konkret beobachteter

Daten unter einem bestimmten Wahrscheinlichkeitsmodell.I Fur eine diskrete Verteilung, die durch den Parameter θ

charakterisiert ist, ist die Likelihood-Funktion definiert durch:

L(θ) =n∏

i=1

P(Xi = xi |θ)

I Gesucht: Maximum der Likelihood-Funktion fur diebeobachteten Daten, d.h. jenes θ, bei dem die Likelihood dengroßten Wert hat.

I Man bestimmt die Wahrscheinlichkeit fur das Auftreten derbeobachteten Daten unter der Annahme aller in Fragekommenden Stichprobenverteilungen.

I Der ML-Schatzer ist der Parameter jener Verteilung, bei demdas beobachtete Resultat am wahrscheinlichsten ist.

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 32/37

Page 357: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern

Beispiel: Schatzen des Parameters p einerBinomialverteilung aufgrund beobachteter Daten

I Pilotstudie mit neuem Antidepressivum; bei 5 der 15teilnehmenden PatientInnen erfolgreich. Wie kann manaufgrund dieser Beobachtungen den Parameter p fur Erfolg inder Population schatzen?

I Numerische Losung: Einsetzen verschiedener p inL(p) =

(155

)p5(1− p)10

I

L(p = 0.1) = 0.01 L(p = 0.2) = 0.103

L(p = 0.3) = 0.206 L(p = 0.4) = 0.186

L(p = 0.5) = 0.092

I Die Likelihoodfunktion hat den großten Wert bei p = 0.3.Vielleicht ist ein Wert rund um 0.3 noch besser?

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 33/37

Page 358: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern

I Analytische Losung: Finden des Maximums der Funktion

L(p) =

(n

k

)pk(1− p)n−k

durch partielles Differenzieren und Nullsetzen

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 34/37

Page 359: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern

Da mathematisch einfacher: Logarithmieren der Likelihoodfunktionln L

ln L(p) = ln

(n

k

)+ k ln p + (n − k) ln(1− p)→ Max

∂ ln L

∂p= k

∂ ln p

∂p+ (n − k)

∂ ln(1− p)

∂p= 0

k

p+ (n − k)

−1

1− p= 0

k(1− p) = (n − k)p

p =k

n= r

2. Ableitung ist < 0 ⇒ r ist der ML-Schatzer fur den Parameter pder Binomialverteilung. L(p = 0.33) = 0.214

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 35/37

Page 360: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern

ML-Schatzer fur Poisson-Verteilung

P(K = k |λ) =λke−λ

k!

ln L = k lnλ− ln k!− λ→ Max

∂ ln L

∂λ=

k

λ− 1 = 0

λ = k

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 36/37

Page 361: Statistik

Wahrscheinlichkeitsverteilungen IIIParameterschatzung

PunktschatzungEigenschaften von SchatzfunktionenMethoden zur Konstruktion von Punktschatzern

Eigenschaften von ML-Schatzern

Sie sind stets

I konsistent,

I suffizient,

I nicht unbedingt erwartungstreu (z.B. Varianz berechnet mit1/n)

I ML-Schatzer sind z.B.: R, X

I Nachteile: Oft existiert keine analytische Losung. NumerischeLosungsverfahren oft mathematisch nicht trivial

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 9. VO 37/37

Page 362: Statistik

Tabelle 2: Ausgewahlte α-Quantile der χ2-Verteilung

Die Tabelle gibt jene Werte χ20 einer χ2-verteilten Variablen mit bestimmter

Anzahl von Freiheitsgraden an, sodass P (χ2 ≤ χ20) = α.

α

0.005 0.01 0.025 0.05 0.90 0.95 0.975 0.99 0.995df1 0.00 0.00 0.00 0.00 2.71 3.84 5.02 6.64 7.882 0.01 0.02 0.05 0.10 4.61 5.99 7.38 9.21 10.603 0.07 0.11 0.22 0.35 6.25 7.82 9.35 11.34 12.844 0.21 0.30 0.48 0.71 7.78 9.49 11.14 13.28 14.865 0.41 0.55 0.83 1.15 9.24 11.07 12.83 15.09 16.756 0.68 0.87 1.24 1.64 10.64 12.59 14.45 16.81 18.557 0.99 1.24 1.69 2.17 12.02 14.07 16.01 18.48 20.288 1.34 1.65 2.18 2.73 13.36 15.51 17.53 20.09 21.969 1.74 2.09 2.70 3.33 14.68 16.92 19.02 21.67 23.59

10 2.16 2.56 3.25 3.94 15.99 18.31 20.48 23.21 25.1911 2.60 3.05 3.82 4.58 17.28 19.68 21.92 24.74 26.7612 3.07 3.57 4.40 5.23 18.55 21.03 23.34 26.22 28.3013 3.57 4.11 5.01 5.89 19.81 22.36 24.74 27.69 29.8214 4.08 4.66 5.63 6.57 21.06 23.68 26.12 29.14 31.3215 4.60 5.23 6.26 7.26 22.31 25.00 27.49 30.58 32.8016 5.14 5.81 6.91 7.96 23.54 26.30 28.85 32.00 34.2717 5.70 6.41 7.56 8.67 24.77 27.59 30.19 33.41 35.7218 6.27 7.02 8.23 9.39 25.99 28.87 31.53 34.81 37.1619 6.84 7.63 8.91 10.12 27.20 30.14 32.85 36.19 38.5820 7.43 8.26 9.59 10.85 28.41 31.41 34.17 37.57 40.0021 8.03 8.90 10.28 11.59 29.62 32.67 35.48 38.93 41.4022 8.64 9.54 10.98 12.34 30.81 33.92 36.78 40.29 42.8023 9.26 10.20 11.69 13.09 32.01 35.17 38.08 41.64 44.1824 9.89 10.86 12.40 13.85 33.20 36.42 39.36 42.98 45.5625 10.52 11.52 13.12 14.61 34.38 37.65 40.65 44.31 46.9326 11.16 12.20 13.84 15.38 35.56 38.89 41.92 45.64 48.2927 11.81 12.88 14.57 16.15 36.74 40.11 43.19 46.96 49.6428 12.46 13.56 15.31 16.93 37.92 41.34 44.46 48.28 50.9929 13.12 14.26 16.05 17.71 39.09 42.56 45.72 49.59 52.3430 13.79 14.95 16.79 18.49 40.26 43.77 46.98 50.89 53.6740 20.71 22.16 24.43 26.51 51.80 55.76 59.34 63.69 66.7750 27.99 29.71 32.36 34.76 63.17 67.50 71.42 76.15 79.4960 35.53 37.48 40.48 43.19 74.40 79.08 83.30 88.38 91.9570 43.28 45.44 48.76 51.74 85.53 90.53 95.02 100.42 104.2280 51.17 53.54 57.15 60.39 96.58 101.88 106.63 112.33 116.3290 59.20 61.75 65.65 69.13 107.56 113.14 118.14 124.12 128.30

100 67.33 70.06 74.22 77.93 118.50 124.34 129.56 135.81 140.17200 151.36 156.43 162.73 168.28 226.02 233.99 241.06 249.06 254.27

Page 363: Statistik

Tabelle 4a: Ausgewahlte 0.95- und 0.99-Quantile der F -Verteilung

Die Tabelle gibt jene Werte F0 einer F -verteilten Variablen mit bestimmterAnzahl von Freiheitsgraden an, fur welche gilt: P (F ≤ F0) = α.F ist stets der Quotient aus dem großeren durch den kleineren Wert.Fur die Werte in der jeweils oberen Zeile ist α = 0.95, fur jene der unteren Zeileist α = 0.99.df1 . . . Anzahl der Zahlerfreiheitsgrade,df2 . . . Anzahl der Nennerfreiheitsgrade.

df1 1 2 3 4 5 6 7 8 9 10

df21 161 200 216 225 230 234 237 239 241 242

4052 4999 5403 5625 5764 5859 5928 5981 6022 60562 18.51 19.00 19.16 19.25 19.30 19.33 19.36 19.37 19.38 19.40

98.50 99.00 99.17 99.25 99.30 99.33 99.34 99.36 99.38 99.403 10.13 9.55 9.28 9.12 9.01 8.94 8.88 8.84 8.81 8.78

34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.34 27.234 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96

21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.545 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.78 4.74

16.26 13.27 12.06 11.39 10.97 10.67 10.45 10.27 10.15 10.056 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06

13.74 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.877 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.63

12.25 9.55 8.45 7.85 7.46 7.19 7.00 6.84 6.71 6.628 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.34

11.26 8.65 7.59 7.01 6.63 6.37 6.19 6.03 5.91 5.829 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.13

10.56 8.02 6.99 6.42 6.06 5.80 5.62 5.47 5.35 5.2610 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.97

10.04 7.56 6.55 5.99 5.64 5.39 5.21 5.06 4.95 4.8511 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.86

9.65 7.20 6.22 5.67 5.32 5.07 4.88 4.74 4.63 4.5412 4.75 3.88 3.49 3.26 3.11 3.00 2.92 2.85 2.80 2.76

9.33 6.93 5.95 5.41 5.06 4.82 4.65 4.50 4.39 4.3013 4.67 3.80 3.41 3.18 3.02 2.92 2.84 2.77 2.72 2.67

9.07 6.70 5.74 5.20 4.86 4.62 4.44 4.30 4.19 4.1014 4.60 3.74 3.34 3.11 2.96 2.85 2.77 2.70 2.65 2.60

8.86 6.51 5.56 5.03 4.69 4.46 4.28 4.14 4.03 3.9415 4.54 3.68 3.29 3.06 2.90 2.79 2.70 2.64 2.59 2.55

8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80

Page 364: Statistik

Fortsetzung Tabelle 4a: 0.95- und 0.99-Quantile der F -Verteilung

df1 1 2 3 4 5 6 7 8 9 10

df216 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49

8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3.6917 4.45 3.59 3.20 2.96 2.81 2.70 2.62 2.55 2.50 2.45

8.40 6.11 5.18 4.67 4.34 4.10 3.93 3.79 3.68 3.5918 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41

8.28 6.01 5.09 4.58 4.25 4.01 3.85 3.71 3.60 3.5119 4.38 3.52 3.13 2.90 2.74 2.63 2.55 2.48 2.43 2.38

8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52 3.4320 4.35 3.49 3.10 2.87 2.71 2.60 2.52 2.45 2.40 2.35

8.10 5.85 4.94 4.43 4.10 3.87 3.71 3.56 3.45 3.3722 4.30 3.44 3.05 2.82 2.66 2.55 2.47 2.40 2.35 2.30

7.94 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35 3.2624 4.26 3.40 3.01 2.78 2.62 2.51 2.43 2.36 2.30 2.26

7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.25 3.1726 4.22 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27 2.22

7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.17 3.0928 4.20 3.34 2.95 2.71 2.56 2.44 2.36 2.29 2.24 2.19

7.64 5.45 4.57 4.07 3.76 3.53 3.36 3.23 3.11 3.0330 4.17 3.32 2.92 2.69 2.53 2.42 2.34 2.27 2.21 2.16

7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.06 2.9832 4.15 3.30 2.90 2.67 2.51 2.40 2.32 2.25 2.19 2.14

7.50 5.34 4.46 3.97 3.66 3.42 3.25 3.12 3.01 2.9434 4.13 3.28 2.88 2.65 2.49 2.38 2.30 2.23 2.17 2.12

7.44 5.29 4.42 3.93 3.61 3.38 3.21 3.08 2.97 2.8936 4.11 3.26 2.86 2.63 2.48 2.36 2.28 2.21 2.15 2.10

7.39 5.25 4.38 3.89 3.58 3.35 3.18 3.04 2.94 2.8640 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.07

7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.88 2.8050 4.03 3.18 2.79 2.56 2.40 2.29 2.20 2.13 2.07 2.02

7.17 5.06 4.20 3.72 3.41 3.18 3.02 2.83 2.78 2.7060 4.00 3.15 2.76 2.52 2.37 2.25 2.17 2.10 2.04 1.99

7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 2.6370 3.98 3.13 2.74 2.50 2.35 2.23 2.14 2.07 2.01 1.97

7.01 4.92 4.08 3.60 3.29 3.07 2.91 2.77 2.67 2.59100 3.94 3.09 2.70 2.46 2.30 2.19 2.10 2.03 1.97 1.92

6.90 4.82 3.98 3.51 3.20 2.99 2.82 2.69 2.59 2.51200 3.89 3.04 2.65 2.41 2.26 2.14 2.05 1.98 1.92 1.87

6.76 4.71 3.88 3.41 3.11 2.90 2.73 2.60 2.50 2.41∞ 3.84 2.99 2.60 2.37 2.21 2.09 2.01 1.94 1.88 1.83

6.64 4.60 3.78 3.32 3.02 2.80 2.64 2.51 2.41 2.32

Page 365: Statistik

Fortsetzung Tabelle 4a: 0.95- und 0.99-Quantile der F -Verteilung

11 12 14 16 20 24 30 50 100 ∞ df1

df2

243 244 245 246 248 249 250 252 253 254 16082 6106 6142 6169 6208 6234 6258 6302 6334 636619.40 19.41 19.42 19.43 19.44 19.45 19.46 19.47 19.49 19.50 299.41 99.42 99.43 99.44 99.45 99.46 99.47 99.48 99.49 99.508.76 8.74 8.71 8.69 8.66 8.64 8.62 8.58 8.56 8.53 3

27.13 27.05 26.92 26.83 26.69 26.60 26.50 26.35 26.23 26.125.93 5.91 5.87 5.84 5.80 5.77 5.74 5.70 5.66 5.63 4

14.45 14.37 14.24 14.15 14.02 13.93 13.83 13.69 13.57 13.464.70 4.68 4.64 4.60 4.56 4.53 4.50 4.44 4.40 4.36 59.96 9.89 9.77 9.68 9.55 9.47 9.38 9.24 9.13 9.024.03 4.00 3.96 3.92 3.87 3.84 3.81 3.75 3.71 3.67 67.79 7.72 7.60 7.52 7.39 7.31 7.23 7.09 6.99 6.883.60 3.57 3.52 3.49 3.44 3.41 3.38 3.32 3.28 3.23 76.54 6.47 6.35 6.27 6.15 6.07 5.98 5.85 5.75 5.653.31 3.28 3.23 3.20 3.15 3.12 3.08 3.03 2.98 2.93 85.74 5.67 5.56 5.48 5.36 5.28 5.20 5.06 4.96 4.863.10 3.07 3.02 2.98 2.93 2.90 2.86 2.80 2.76 2.71 95.18 5.11 5.00 4.92 4.80 4.73 4.64 4.51 4.41 4.312.94 2.91 2.86 2.82 2.77 2.74 2.70 2.64 2.59 2.54 104.78 4.71 4.60 4.52 4.41 4.33 4.25 4.12 4.01 3.912.82 2.79 2.74 2.70 2.65 2.61 2.57 2.50 2.45 2.40 114.46 4.40 4.29 4.21 4.10 4.02 3.94 3.80 3.70 3.602.72 2.69 2.64 2.60 2.54 2.50 2.46 2.40 2.35 2.30 124.22 4.16 4.05 3.98 3.86 3.78 3.70 3.56 3.46 3.362.63 2.60 2.55 2.51 2.46 2.42 2.38 2.32 2.26 2.21 134.02 3.96 3.85 3.78 3.67 3.59 3.51 3.37 3.27 3.162.56 2.53 2.48 2.44 2.39 2.35 2.31 2.24 2.19 2.13 143.86 3.80 3.70 3.62 3.51 3.43 3.34 3.21 3.11 3.002.51 2.48 2.43 2.39 2.33 2.29 2.25 2.18 2.12 2.07 153.73 3.67 3.56 3.48 3.36 3.29 3.20 3.07 2.97 2.87

Page 366: Statistik

Fortsetzung Tabelle 4a: 0.95- und 0.99-Quantile der F -Verteilung

11 12 14 16 20 24 30 50 100 ∞ df1

df2

2.45 2.42 2.37 2.33 2.28 2.24 2.20 2.13 2.07 2.01 163.61 3.55 3.45 3.37 3.25 3.18 3.10 2.96 2.86 2.752.41 2.38 2.33 2.29 2.23 2.19 2.15 2.08 2.02 1.96 173.52 3.45 3.35 3.27 3.16 3.08 3.00 2.86 2.76 2.652.37 2.34 2.29 2.25 2.19 2.15 2.11 2.04 1.98 1.92 183.44 3.37 3.27 3.19 3.07 3.00 2.91 2.78 2.68 2.572.34 2.31 2.26 2.21 2.15 2.11 2.07 2.00 1.94 1.88 193.36 3.30 3.19 3.12 3.00 2.92 2.84 2.70 2.60 2.492.31 2.28 2.23 2.18 2.12 2.08 2.04 1.96 1.90 1.84 203.30 3.23 3.13 3.05 2.94 2.86 2.77 2.63 2.53 2.422.26 2.23 2.18 2.13 2.07 2.03 1.98 1.91 1.84 1.78 223.18 3.12 3.02 2.94 2.83 2.75 2.67 2.53 2.42 2.312.22 2.18 2.13 2.09 2.02 1.98 1.94 1.86 1.80 1.73 243.09 3.03 2.93 2.85 2.74 2.66 2.58 2.44 2.33 2.212.18 2.15 2.10 2.05 1.99 1.95 1.90 1.82 1.76 1.69 263.02 2.96 2.86 2.77 2.66 2.58 2.50 2.36 2.25 2.132.15 2.12 2.06 2.02 1.96 1.91 1.87 1.78 1.72 1.65 282.95 2.90 2.80 2.71 2.60 2.52 2.44 2.30 2.18 2.062.12 2.09 2.04 1.99 1.93 1.89 1.84 1.76 1.69 1.62 302.90 2.84 2.74 2.66 2.55 2.47 2.38 2.24 2.13 2.012.10 2.07 2.02 1.97 1.91 1.86 1.82 1.74 1.67 1.59 322.86 2.80 2.70 2.62 2.51 2.42 2.34 2.20 2.08 1.962.08 2.05 2.00 1.95 1.89 1.84 1.80 1.71 1.64 1.57 342.82 2.76 2.66 2.58 2.47 2.38 2.30 2.15 2.04 1.912.06 2.03 1.98 1.93 1.87 1.82 1.78 1.69 1.62 1.55 362.78 2.72 2.62 2.54 2.43 2.35 2.26 2.12 2.00 1.872.04 2.00 1.95 1.90 1.84 1.79 1.74 1.66 1.59 1.51 402.73 2.66 2.56 2.49 2.37 2.29 2.20 2.05 1.94 1.811.98 1.95 1.90 1.85 1.78 1.74 1.69 1.60 1.52 1.44 502.62 2.56 2.46 2.39 2.26 2.18 2.10 1.94 1.82 1.681.95 1.92 1.86 1.81 1.75 1.70 1.65 1.56 1.48 1.39 602.56 2.50 2.40 2.32 2.20 2.12 2.03 1.87 1.74 1.601.93 1.89 1.84 1.79 1.72 1.67 1.62 1.53 1.45 1.35 702.51 2.45 2.35 2.28 2.15 2.07 1.98 1.82 1.69 1.531.88 1.85 1.79 1.75 1.68 1.63 1.57 1.48 1.39 1.28 1002.43 2.36 2.26 2.19 2.06 1.98 1.89 1.73 1.59 1.431.83 1.80 1.74 1.69 1.62 1.57 1.52 1.42 1.32 1.19 2002.34 2.28 2.17 2.09 1.97 1.88 1.79 1.62 1.48 1.281.79 1.75 1.69 1.64 1.57 1.52 1.46 1.35 1.24 1.00 ∞2.24 2.18 2.07 1.99 1.87 1.79 1.69 1.52 1.36 1.00

Page 367: Statistik

Fortsetzung Tabelle 4b: 0.975- und 0.995-Quantile der F -Verteilung

11 12 14 16 20 30 50 100 ∞ df1

df2

973 977 983 987 993 1001 1008 1013 1018 124334 24426 24572 24681 24836 25044 25211 25337 25500

39.4 39.4 39.4 39.4 39.4 39.5 39.5 39.5 39.5 2199 199 199 199 199 199 199 199 20014.4 14.3 14.3 14.2 14.2 14.1 14.0 14.0 13.9 343.5 43.4 43.2 43.0 42.8 42.5 42.2 42.0 41.88.79 8.75 8.69 8.64 8.56 8.46 8.38 8.32 8.26 420.8 20.7 20.5 20.4 20.2 19.9 19.7 19.5 19.36.57 6.52 6.46 6.41 6.33 6.23 6.14 6.08 6.02 513.5 13.4 13.2 13.1 12.9 12.7 12.5 12.3 12.15.41 5.37 5.30 5.25 5.17 5.07 4.98 4.92 4.85 610.1 10.0 9.88 9.76 9.59 9.36 9.17 9.03 8.884.71 4.67 4.60 4.54 4.47 4.36 4.28 4.21 4.14 78.27 8.18 8.03 7.93 7.75 7.53 7.35 7.22 7.084.24 4.20 4.13 4.08 4.00 3.89 3.81 3.74 3.67 87.10 7.01 6.87 6.76 6.61 6.40 6.22 6.09 5.953.91 3.87 3.80 3.74 3.67 3.56 3.47 3.40 3.33 96.31 6.23 6.09 5.98 5.83 5.62 5.45 5.32 5.193.66 3.62 3.55 3.50 3.42 3.31 3.22 3.15 3.08 105.75 5.66 5.53 5.42 5.27 5.07 4.90 4.77 4.643.47 3.43 3.36 3.30 3.23 3.12 3.03 2.96 2.88 115.32 5.24 5.10 5.00 4.86 4.65 4.49 4.36 4.233.32 3.28 3.21 3.15 3.07 2.96 2.87 2.80 2.72 124.99 4.91 4.77 4.67 4.53 4.33 4.17 4.04 3.903.20 3.15 3.08 3.03 2.95 2.84 2.74 2.67 2.60 134.72 4.64 4.51 4.41 4.27 4.07 3.91 3.78 3.653.09 3.05 2.98 2.92 2.84 2.73 2.64 2.56 2.49 144.51 4.43 4.30 4.20 4.06 3.86 3.70 3.57 3.443.01 2.96 2.89 2.84 2.76 2.64 2.55 2.47 2.40 154.33 4.25 4.12 4.02 3.88 3.69 3.52 3.39 3.26

Page 368: Statistik

Fortsetzung Tabelle 4b: 0.975- und 0.995-Quantile der F -Verteilung

11 12 14 16 20 30 50 100 ∞ df1

df2

2.93 2.89 2.82 2.76 2.68 2.57 2.47 2.40 2.32 164.18 4.10 3.97 3.87 3.73 3.54 3.37 3.25 3.112.87 2.82 2.75 2.70 2.62 2.50 2.41 2.33 2.25 174.05 3.97 3.84 3.75 3.61 3.41 3.25 3.12 2.982.81 2.77 2.70 2.64 2.56 2.44 2.35 2.27 2.19 183.94 3.86 3.73 3.64 3.50 3.30 3.14 3.01 2.872.76 2.72 2.65 2.59 2.51 2.39 2.30 2.22 2.13 193.84 3.76 3.64 3.54 3.40 3.21 3.04 2.91 2.782.72 2.68 2.60 2.55 2.46 2.35 2.25 2.17 2.09 203.76 3.68 3.55 3.46 3.32 3.12 2.96 2.83 2.692.65 2.60 2.53 2.47 2.39 2.27 2.17 2.09 2.00 223.61 3.54 3.41 3.31 3.18 2.98 2.82 2.69 2.552.59 2.54 2.47 2.41 2.33 2.21 2.11 2.02 1.94 243.50 3.42 3.30 3.20 3.06 2.87 2.70 2.57 2.432.54 2.49 2.42 2.36 2.28 2.16 2.05 1.97 1.88 263.40 3.33 3.20 3.11 2.97 2.77 2.61 2.47 2.332.49 2.45 2.37 2.32 2.23 2.11 2.01 1.92 1.83 283.32 3.25 3.12 3.03 2.89 2.69 2.53 2.39 2.252.46 2.41 2.34 2.28 2.20 2.07 1.97 1.88 1.79 303.25 3.18 3.06 2.96 2.82 2.63 2.46 2.32 2.182.43 2.38 2.31 2.25 2.16 2.04 1.93 1.85 1.75 323.20 3.12 3.00 2.90 2.77 2.57 2.40 2.26 2.112.40 2.35 2.28 2.22 2.13 2.01 1.90 1.82 1.72 343.15 3.07 2.95 2.85 2.72 2.52 2.35 2.21 2.062.37 2.33 2.25 2.20 2.11 1.99 1.88 1.79 1.69 363.10 3.03 2.90 2.81 2.67 2.48 2.30 2.17 2.012.33 2.29 2.21 2.15 2.07 1.94 1.83 1.74 1.64 403.03 2.95 2.83 2.74 2.60 2.40 2.23 2.09 1.932.26 2.22 2.14 2.08 1.99 1.87 1.75 1.66 1.55 502.90 2.82 2.70 2.61 2.47 2.27 2.10 1.95 1.792.22 2.17 2.09 2.03 1.94 1.82 1.70 1.60 1.48 602.82 2.74 2.62 2.53 2.39 2.19 2.01 1.86 1.692.18 2.14 2.06 2.00 1.91 1.78 1.66 1.56 1.44 702.76 2.68 2.56 2.47 2.33 2.13 1.95 1.80 1.622.12 2.08 2.00 1.94 1.85 1.71 1.59 1.48 1.35 1002.66 2.58 2.46 2.37 2.23 2.02 1.84 1.68 1.492.06 2.01 1.93 1.87 1.78 1.64 1.51 1.39 1.23 2002.54 2.47 2.35 2.25 2.11 1.91 1.71 1.54 1.311.99 1.94 1.87 1.80 1.71 1.57 1.43 1.30 1.00 ∞2.43 2.36 2.24 2.14 2.00 1.79 1.59 1.40 1.00

Page 369: Statistik

Tabelle 4b: Ausgewahlte 0.975- und 0.995-Quantile der F -Verteilung

Die Tabelle gibt jene Werte F0 einer F -verteilten Variablen mit bestimmterAnzahl von Freiheitsgraden an, fur welche gilt: P (F ≤ F0) = α.F ist stets der Quotient aus dem großeren durch den kleineren Wert.Fur die Werte in der jeweils oberen Zeile ist α = 0.975, fur jene der unterenZeile ist α = 0.995.df1 . . . Anzahl der Zahlerfreiheitsgrade,df2 . . . Anzahl der Nennerfreiheitsgrade.

df1 1 2 3 4 5 6 7 8 9 10

df21 648 800 864 900 922 937 948 957 963 969

16211 20000 21615 22500 23056 23437 23715 23925 24091 242242 38.5 39.0 39.2 39.2 39.3 39.3 39.4 39.4 39.4 39.4

198 199 199 199 199 199 199 199 199 1993 17.4 16.0 15.4 15.1 14.9 14.7 14.6 14.5 14.4 14.4

55.6 49.8 47.5 46.2 45.4 44.8 44.4 44.1 43.9 43.74 12.2 10.6 9.98 9.60 9.36 9.20 9.07 8.98 8.90 8.84

31.3 26.3 24.3 23.2 22.5 22.0 21.6 21.4 21.1 21.05 10.0 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.68 6.62

22.8 18.3 16.5 15.6 14.9 14.5 14.2 14.0 13.8 13.66 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.52 5.46

18.6 14.5 12.9 12.0 11.5 11.1 10.8 10.6 10.4 10.27 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.82 4.76

16.2 12.4 10.9 10.0 9.52 9.16 8.89 8.68 8.51 8.388 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36 4.30

14.7 11.0 9.60 8.81 8.30 7.95 7.69 7.50 7.34 7.219 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96

13.6 10.1 8.72 7.96 7.47 7.13 6.88 6.69 6.54 6.4210 6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85 3.78 3.72

12.8 9.43 8.08 7.34 6.87 6.54 6.30 6.12 5.97 5.8511 6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.66 3.59 3.53

12.2 8.91 7.60 6.88 6.42 6.10 5.86 5.68 5.54 5.4212 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 3.37

11.8 8.51 7.23 6.52 6.07 5.76 5.52 5.35 5.20 5.0913 6.41 4.97 4.35 4.00 3.77 3.60 3.48 3.39 3.31 3.25

11.4 8.19 6.93 6.23 5.79 5.48 5.25 5.08 4.94 4.8214 6.30 4.86 4.24 3.89 3.66 3.50 3.38 3.29 3.21 3.15

11.1 7.92 6.68 6.00 5.56 5.26 5.03 4.86 4.72 4.6015 6.20 4.76 4.15 3.80 3.58 3.41 3.29 3.20 3.12 3.06

10.8 7.70 6.48 5.80 5.37 5.07 4.85 4.67 4.54 4.42

Page 370: Statistik

Fortsetzung Tabelle 4b: 0.975- und 0.995-Quantile der F -Verteilung

df1 1 2 3 4 5 6 7 8 9 10

df216 6.12 4.69 4.08 3.73 3.50 3.34 3.22 3.12 3.05 2.99

10.6 7.51 6.30 5.64 5.21 4.91 4.69 4.52 4.38 4.2717 6.04 4.62 4.01 3.66 3.44 3.28 3.16 3.06 2.98 2.92

10.4 7.35 6.16 5.50 5.07 4.78 4.56 4.39 4.25 4.1418 5.98 4.56 3.95 3.61 3.38 3.22 3.10 3.01 2.93 2.87

10.2 7.21 6.03 5.37 4.96 4.66 4.44 4.28 4.14 4.0319 5.92 4.51 3.90 3.56 3.33 3.17 3.05 2.96 2.88 2.82

10.1 7.09 5.92 5.27 4.85 4.56 4.34 4.18 4.04 3.9320 5.87 4.46 3.86 3.51 3.29 3.13 3.01 2.91 2.84 2.77

9.94 6.99 5.82 5.17 4.76 4.47 4.26 4.09 3.96 3.8522 5.79 4.38 3.78 3.44 3.22 3.05 2.93 2.84 2.76 2.70

9.73 6.81 5.65 5.02 4.61 4.32 4.11 3.94 3.81 3.7024 5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78 2.70 2.64

9.55 6.66 5.52 4.89 4.49 4.20 3.99 3.83 3.69 3.5926 5.66 4.27 3.67 3.33 3.10 2.94 2.82 2.73 2.65 2.59

9.41 6.54 5.41 4.79 4.38 4.10 3.89 3.73 3.60 3.4928 5.61 4.22 3.63 3.29 3.06 2.90 2.78 2.69 2.61 2.55

9.28 6.44 5.32 4.70 4.30 4.02 3.81 3.65 3.52 3.4230 5.57 4.18 3.59 3.25 3.03 2.87 2.75 2.65 2.57 2.51

9.18 6.35 5.24 4.62 4.23 3.95 3.74 3.58 3.45 3.3432 5.53 4.15 3.56 3.22 3.00 2.84 2.72 2.62 2.54 2.48

9.09 6.28 5.17 4.56 4.17 3.89 3.68 3.52 3.39 3.2934 5.50 4.12 3.53 3.19 2.97 2.81 2.69 2.59 2.52 2.45

9.01 6.22 5.11 4.50 4.11 3.84 3.63 3.47 3.34 3.2436 5.47 4.09 3.51 3.17 2.94 2.79 2.66 2.57 2.49 2.43

8.94 6.16 5.06 4.46 4.06 3.79 3.58 3.42 3.30 3.1940 5.42 4.05 3.46 3.13 2.90 2.74 2.62 2.53 2.45 2.39

8.83 6.07 4.98 4.37 3.99 3.71 3.51 3.35 3.22 3.1250 5.34 3.98 3.39 3.06 2.83 2.67 2.55 2.46 2.38 2.32

8.63 5.90 4.83 4.23 3.85 3.58 3.38 3.22 3.09 2.9960 5.29 3.93 3.34 3.01 2.79 2.63 2.51 2.41 2.33 2.27

8.49 5.80 4.73 4.14 3.76 3.49 3.29 3.13 3.01 2.9070 5.25 3.89 3.31 2.98 2.75 2.60 2.48 2.38 2.30 2.24

8.40 5.72 4.65 4.08 3.70 3.43 3.23 3.08 2.95 2.85100 5.18 3.83 3.25 2.92 2.70 2.54 2.42 2.32 2.24 2.18

8.24 5.59 4.54 3.96 3.59 3.33 3.13 2.97 2.85 2.74200 5.10 3.76 3.18 2.85 2.63 2.47 2.35 2.26 2.18 2.11

8.06 5.44 4.41 3.84 3.47 3.21 3.01 2.85 2.73 2.63∞ 5.02 3.69 3.12 2.79 2.57 2.41 2.29 2.19 2.11 2.05

7.88 5.30 4.28 3.72 3.35 3.09 2.90 2.74 2.62 2.52

Page 371: Statistik

Tabelle 4b: Ausgewahlte 0.975- und 0.995-Quantile der F -Verteilung

Die Tabelle gibt jene Werte F0 einer F -verteilten Variablen mit bestimmterAnzahl von Freiheitsgraden an, fur welche gilt: P (F ≤ F0) = α.F ist stets der Quotient aus dem großeren durch den kleineren Wert.Fur die Werte in der jeweils oberen Zeile ist α = 0.975, fur jene der unterenZeile ist α = 0.995.df1 . . . Anzahl der Zahlerfreiheitsgrade,df2 . . . Anzahl der Nennerfreiheitsgrade.

df1 1 2 3 4 5 6 7 8 9 10

df21 648 800 864 900 922 937 948 957 963 969

16211 20000 21615 22500 23056 23437 23715 23925 24091 242242 38.5 39.0 39.2 39.2 39.3 39.3 39.4 39.4 39.4 39.4

198 199 199 199 199 199 199 199 199 1993 17.4 16.0 15.4 15.1 14.9 14.7 14.6 14.5 14.4 14.4

55.6 49.8 47.5 46.2 45.4 44.8 44.4 44.1 43.9 43.74 12.2 10.6 9.98 9.60 9.36 9.20 9.07 8.98 8.90 8.84

31.3 26.3 24.3 23.2 22.5 22.0 21.6 21.4 21.1 21.05 10.0 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.68 6.62

22.8 18.3 16.5 15.6 14.9 14.5 14.2 14.0 13.8 13.66 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.52 5.46

18.6 14.5 12.9 12.0 11.5 11.1 10.8 10.6 10.4 10.27 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.82 4.76

16.2 12.4 10.9 10.0 9.52 9.16 8.89 8.68 8.51 8.388 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36 4.30

14.7 11.0 9.60 8.81 8.30 7.95 7.69 7.50 7.34 7.219 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96

13.6 10.1 8.72 7.96 7.47 7.13 6.88 6.69 6.54 6.4210 6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85 3.78 3.72

12.8 9.43 8.08 7.34 6.87 6.54 6.30 6.12 5.97 5.8511 6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.66 3.59 3.53

12.2 8.91 7.60 6.88 6.42 6.10 5.86 5.68 5.54 5.4212 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 3.37

11.8 8.51 7.23 6.52 6.07 5.76 5.52 5.35 5.20 5.0913 6.41 4.97 4.35 4.00 3.77 3.60 3.48 3.39 3.31 3.25

11.4 8.19 6.93 6.23 5.79 5.48 5.25 5.08 4.94 4.8214 6.30 4.86 4.24 3.89 3.66 3.50 3.38 3.29 3.21 3.15

11.1 7.92 6.68 6.00 5.56 5.26 5.03 4.86 4.72 4.6015 6.20 4.76 4.15 3.80 3.58 3.41 3.29 3.20 3.12 3.06

10.8 7.70 6.48 5.80 5.37 5.07 4.85 4.67 4.54 4.42

Page 372: Statistik

Fortsetzung Tabelle 4b: 0.975- und 0.995-Quantile der F -Verteilung

df1 1 2 3 4 5 6 7 8 9 10

df216 6.12 4.69 4.08 3.73 3.50 3.34 3.22 3.12 3.05 2.99

10.6 7.51 6.30 5.64 5.21 4.91 4.69 4.52 4.38 4.2717 6.04 4.62 4.01 3.66 3.44 3.28 3.16 3.06 2.98 2.92

10.4 7.35 6.16 5.50 5.07 4.78 4.56 4.39 4.25 4.1418 5.98 4.56 3.95 3.61 3.38 3.22 3.10 3.01 2.93 2.87

10.2 7.21 6.03 5.37 4.96 4.66 4.44 4.28 4.14 4.0319 5.92 4.51 3.90 3.56 3.33 3.17 3.05 2.96 2.88 2.82

10.1 7.09 5.92 5.27 4.85 4.56 4.34 4.18 4.04 3.9320 5.87 4.46 3.86 3.51 3.29 3.13 3.01 2.91 2.84 2.77

9.94 6.99 5.82 5.17 4.76 4.47 4.26 4.09 3.96 3.8522 5.79 4.38 3.78 3.44 3.22 3.05 2.93 2.84 2.76 2.70

9.73 6.81 5.65 5.02 4.61 4.32 4.11 3.94 3.81 3.7024 5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78 2.70 2.64

9.55 6.66 5.52 4.89 4.49 4.20 3.99 3.83 3.69 3.5926 5.66 4.27 3.67 3.33 3.10 2.94 2.82 2.73 2.65 2.59

9.41 6.54 5.41 4.79 4.38 4.10 3.89 3.73 3.60 3.4928 5.61 4.22 3.63 3.29 3.06 2.90 2.78 2.69 2.61 2.55

9.28 6.44 5.32 4.70 4.30 4.02 3.81 3.65 3.52 3.4230 5.57 4.18 3.59 3.25 3.03 2.87 2.75 2.65 2.57 2.51

9.18 6.35 5.24 4.62 4.23 3.95 3.74 3.58 3.45 3.3432 5.53 4.15 3.56 3.22 3.00 2.84 2.72 2.62 2.54 2.48

9.09 6.28 5.17 4.56 4.17 3.89 3.68 3.52 3.39 3.2934 5.50 4.12 3.53 3.19 2.97 2.81 2.69 2.59 2.52 2.45

9.01 6.22 5.11 4.50 4.11 3.84 3.63 3.47 3.34 3.2436 5.47 4.09 3.51 3.17 2.94 2.79 2.66 2.57 2.49 2.43

8.94 6.16 5.06 4.46 4.06 3.79 3.58 3.42 3.30 3.1940 5.42 4.05 3.46 3.13 2.90 2.74 2.62 2.53 2.45 2.39

8.83 6.07 4.98 4.37 3.99 3.71 3.51 3.35 3.22 3.1250 5.34 3.98 3.39 3.06 2.83 2.67 2.55 2.46 2.38 2.32

8.63 5.90 4.83 4.23 3.85 3.58 3.38 3.22 3.09 2.9960 5.29 3.93 3.34 3.01 2.79 2.63 2.51 2.41 2.33 2.27

8.49 5.80 4.73 4.14 3.76 3.49 3.29 3.13 3.01 2.9070 5.25 3.89 3.31 2.98 2.75 2.60 2.48 2.38 2.30 2.24

8.40 5.72 4.65 4.08 3.70 3.43 3.23 3.08 2.95 2.85100 5.18 3.83 3.25 2.92 2.70 2.54 2.42 2.32 2.24 2.18

8.24 5.59 4.54 3.96 3.59 3.33 3.13 2.97 2.85 2.74200 5.10 3.76 3.18 2.85 2.63 2.47 2.35 2.26 2.18 2.11

8.06 5.44 4.41 3.84 3.47 3.21 3.01 2.85 2.73 2.63∞ 5.02 3.69 3.12 2.79 2.57 2.41 2.29 2.19 2.11 2.05

7.88 5.30 4.28 3.72 3.35 3.09 2.90 2.74 2.62 2.52

Page 373: Statistik

Tabelle 3: Ausgewahlte Quantile der t-Verteilung

Die Tabelle gibt ausgewahlte α-Quantile der t-Verteilung fur verschiedeneFreiheitsgrade an (jene Werte t0, fur welche gilt P (t ≤ t0) = α)

α0.90 0.95 0.975 0.99 0.995 0.999 0.9995

df1 3.08 6.31 12.71 31.82 63.66 318.31 636.622 1.89 2.92 4.30 6.97 9.93 22.33 31.603 1.64 2.35 3.18 4.54 5.84 10.21 12.924 1.53 2.13 2.78 3.75 4.60 7.17 8.61

5 1.48 2.02 2.57 3.37 4.03 5.89 6.876 1.44 1.94 2.45 3.14 3.71 5.21 5.967 1.42 1.90 2.37 3.00 3.50 4.79 5.418 1.40 1.86 2.31 2.90 3.36 4.50 5.049 1.38 1.83 2.26 2.82 3.25 4.30 4.78

10 1.37 1.81 2.23 2.76 3.17 4.14 4.5911 1.36 1.80 2.20 2.72 3.11 4.03 4.4412 1.36 1.78 2.18 2.68 3.06 3.93 4.3213 1.35 1.77 2.16 2.65 3.01 3.85 4.2214 1.35 1.76 2.15 2.62 2.98 3.79 4.14

15 1.34 1.75 2.13 2.60 2.95 3.73 4.0716 1.34 1.75 2.12 2.58 2.92 3.69 4.0217 1.33 1.74 2.11 2.57 2.90 3.65 3.9718 1.33 1.73 2.10 2.55 2.88 3.61 3.9219 1.33 1.73 2.09 2.54 2.86 3.58 3.88

20 1.33 1.73 2.09 2.53 2.85 3.55 3.8521 1.32 1.72 2.08 2.52 2.83 3.53 3.8222 1.32 1.72 2.07 2.51 2.82 3.51 3.7923 1.32 1.71 2.07 2.50 2.81 3.49 3.7724 1.32 1.71 2.06 2.49 2.80 3.47 3.75

25 1.32 1.71 2.06 2.49 2.79 3.45 3.7326 1.32 1.71 2.06 2.48 2.78 3.44 3.7127 1.31 1.70 2.05 2.47 2.77 3.42 3.6928 1.31 1.70 2.05 2.47 2.76 3.41 3.6729 1.31 1.70 2.05 2.46 2.76 3.40 3.66

30 1.31 1.70 2.04 2.46 2.75 3.39 3.6540 1.30 1.68 2.02 2.42 2.70 3.31 3.5660 1.30 1.67 2.00 2.39 2.66 3.23 3.46

120 1.29 1.66 1.98 2.36 2.62 3.16 3.37∞ 1.28 1.65 1.96 2.33 2.58 3.09 3.29

Page 374: Statistik

Konfidenzintervalle und Statistische Tests

Einfuhrung in Quantitative Methoden

Karin Waldherr & Pantelis Christodoulides

25. Mai 2011

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 1/39

Page 375: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

Allgemeines

I Wir interessieren uns fur einen unbekannten wahren Parameterθ, der die Verteilung einer Zufallsvariable charakterisiert

I θ wird durch eine Schatzfunktion Θ aus einer(reprasentativen) Stichprobe mit Umfang n geschatzt

I Es wird davon ausgegangen, dass die Stichprobe in etwa dieGrundgesamtheit widerspiegelt, und dass deshalb dieSchatzung in der Nahe des wahren Parameters liegen musste

I Die Schatzfunktion ist selbst eine Zufallsvariable mit einerVerteilung, die den Parameter θ enthalt

I Bei der Schatzung von Parametern geht es nicht nur darum,Schatzfunktionen zu finden und deren Eigenschaften(Erwartungstreue, Konsistenz, etc.) abzuklaren

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 2/39

Page 376: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

AllgemeinesI Man mochte auch Intervalle angeben, in welchen θ mit einer

gewissen Sicherheit liegtI Es sei α eine vorgegebene Irrtumswahrscheinlichkeit, und a

bzw. b reelle Zahlen, mit a ≤ b. Die Schatzung des Bereichesa ≤ θ ≤ b mit der Vertrauenswahrscheinlichkeit (1− α)nennen wir Konfidenzintervall des Parameters θ mitIrrtumswahrscheinlichkeit α

I Θ Punktschatzung von θ, im Vergleich zur IntervallschatzungI Wir konstruieren ein symmetrisches Konfidenzintervall auf

Grundlage einer Schatzfunktion ΘI Von besonderem Interesse ist die Breite des

Konfidenzintervalls. Diese bestimmt sich durch dieStandardabweichung von Θ

I Erwunscht ist in der Regel ein moglichst schmalesKonfidenzintervall, denn dies weist auf eine genaue Schatzunghin

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 3/39

Page 377: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

Uberblick

I Konfidenzintervall fur den Parameter p einer B(n, p) Variable

I Konfidenzintervall fur den Erwartungswert µ einer N(µ, σ2)Variable bei bekannter Varianz σ2

I Konfidenzintervall fur den Erwartungswert µ einer N(µ, σ2)Variable bei unbekannter Varianz σ2

I Naherungsweises Konfidenzintervall fur den Erwartungswert µeiner Variable mit unbekannter Verteilung

I Konfidenzintervall fur die Varianz σ2 einer N(µ, σ2) Variable

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 4/39

Page 378: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur p einer B(n, p)

I Befragung einer Zufallsstichprobe von n Personen aus einerunendlichen Population zu einem Thema mitAntwortkategorien ja/nein

I k ist die Anzahl der ’ja’ Antworten in der Stichprobe

I r = kn die entsprechende relative Haufigkeit

I p = P (’ja’) ist der wahre (unbekannte) Anteil derJa-Stimmen in der Population

I r ist ein erwartungstreuer Schatzer fur p

I K ist jene Zufallsvariable, die durch wiederholte Ziehungunabhangiger Stichproben vom Umfang n aus der unendlichenPopulation entsteht, R ist die entsprechende Zufallsvariableder relativen Haufigkeiten

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 5/39

Page 379: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur p einer B(n, p)

I K ∼ B(n, p)

I Wenn np ≥ 5 und n(1− p) ≥ 5 darf die Binomialverteilungnaherungsweise durch die N(np, np(1− p)) ersetzt werden

I K ∼a N(np, np(1− p)) und auch

I R ∼a N(npn ,

np(1−p)n2 ) = N(p, p(1−p)

n )

I Um die Tabelle der N(0, 1) fur die Bestimmung derEndpunkte des Konfidenzintervalls anwenden zu konnen,standardisieren wir R

I

Z =R − E (R)

σR=

R − p√p(1−p)

n

∼ N(0, 1)

I Sei α = 0.05

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 6/39

Page 380: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur p einer B(n, p)

Tabelle 1b: P(−1.96 ≤ Z ≤ 1.96) = 0.95

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 7/39

Page 381: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur p einer B(n, p)

I Fur 95% aller Stichproben mit Umfang n gilt

|Z | =|R − p|√

p(1−p)n

≤ 1.96

I Wir ersetzen σR durch einen Schatzer σR

σR =

√p(1− p)

n, σR =

√r(1− r)

n − 1

I Also gilt fur 95% aller Stichproben mit Umfang n

|R − p| ≤ 1.96

√r(1− r)

n − 1

I Grundlage fur ein KI mit einer Irrtumswahrscheinlichkeitα = 0.05

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 8/39

Page 382: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur p einer B(n, p)

I Die Grenzen des KI mit Irrtumswahrscheinlichkeit α = 0.05werden wie folgt bestimmt

p1,2 = r ± 1.96

√r(1− r)

n − 1

I Allgemeiner fur beliebige Irrtumswahrscheinlichkeit α

p1,2 = r ± z1−α2

√r(1− r)

n − 1

I KI ist symmetrisch um den Punkt r , symmetrisches KI

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 9/39

Page 383: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur p einer B(n, p)

I Bei gegebenem p hangt die Breite des KI von zwei Faktorenab: der gewunschten Sicherheit und dem Stichprobenumfang

I Je hoher die Sicherheit, desto kleiner dieIrrtumswahrscheinlichkeit α, desto großer wird z1−α

2, und

desto breiter das Intervall

I Je großer die Stichprobe, desto kleiner wird σR und dessenSchatzung σR , und desto schmaler das Intervall

I Interpretation des KI: Werden immer wieder unabhangigeStichproben vom Umfang n gezogen, und wird fur jede dieserStichproben p = r gerechnet, so liegt p in (1− α) Prozentdieser Stichproben innerhalb des Intervalles [p1, p2]. DerParameter p wird mit einer Vertrauenswahrscheinlichkeit von(1− α) vom Intervall [p1, p2] uberdeckt

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 10/39

Page 384: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur p einer B(n, p)

I Beispiel: Es wurden n = 200 Personen befragt, von denenk = 78 mit ’ja’ geantwortet haben. α = 0.05, bzw. α = 0.01

I r = p = 78200 = 0.39

I

p1,2 = 0.39± 1.96

√(0.39)(0.61)

199= 0.39± 0.068

p1,2 = 0.39± 2.58

√(0.39)(0.61)

199= 0.39± 0.089

I

p1,2 = [0.322, 0.458] p1,2 = [0.301, 0.479]

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 11/39

Page 385: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI in SPSSFile: SPSS-Konfidenzintervalle.sav;Konfidenzintervall fur Anteil der Haustierbesitzer (n = 166,α = 0.05)Deskriptive Statistiken → Explorative Datenanalyse

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 12/39

Page 386: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 13/39

Page 387: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur µ einer N(µ, σ2) bei bekanntem σ2

I Die Normalverteilung ist eine reproduzierende Verteilung

I Seien X1,X2, . . . ,Xn voneinander unabhangig normalverteilteZufallsvariablen mit Erwartungswerten µ1, µ2, . . . , µn undVarianzen σ2

1, σ22, . . . , σ

2n. Dann ist die Zufallsvariable

Y = X1 + X2 + . . .+ Xn ebenfalls normalverteilt mitE [Y ] = µ1 + µ2 + . . .+ µn und σ2

Y = σ21 + σ2

2 + . . .+ σ2n

I Wie ist die Verteilung von Mittelwerten x einernormalverteilten Variable?

I X sei N(µ, σ2)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 14/39

Page 388: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur µ einer N(µ, σ2) bei bekanntem σ2

I Wir ziehen unabhangige Zufallsstichproben vom Umfang n.Die Mittelwerte x aller Zufallsstichproben erzeugen eineVariable X = 1

n (X1 + X2 + . . .+ Xn)

I X ist abgesehen von der multiplikativen Konstante 1n eine

Summe normalverteilter Variablen, und es gilt

X ∼ N(µ,σ2

n)

I Wenn X normalverteilt ist, hat X wiederum Normalverteilungmit dem selben Erwartungswert, aber wesentlich kleinererVarianz σ2

n

I Die Mittelwerte aus Stichproben vom Umfang n gruppierensich also enger zusammen als die Messwerte

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 15/39

Page 389: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur µ einer N(µ, σ2) bei bekanntem σ2

I Wir verwenden die Verteilung von X um ein KI fur µaufzustellen

I Standardisieren der normalverteilten Variable X

Z =X − µ

σ√n

I Es gilt fur (1− α)% aller Stichproben mit Umfang n

|x − µ| ≤ z1−α2

σ√n

I

µ1,2 = x ± z1−α2

σ√n

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 16/39

Page 390: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur µ einer N(µ, σ2) bei bekanntem σ2

I Die Breite des KI hangt von 3 Faktoren ab: von der Streuungder Variable X bzw. σ, von n, und von derIrrtumswahrscheinlichkeit α

I Je kleiner σ, desto enger das KI

I Je großer die Stichprobe, desto enger das KI

I Je kleiner α, desto breiter das KI

I Beispiel: Eine Stichprobe von n = 234 14-jahrigenSchulerInnen wurde mit einem Intelligenztest, der fur 14-18jahrige Jugendliche normiert wurde, getestet. Der Mittelwertder 14-Jahrigen ist x = 98.10. In der Gesamtpopulation allerJugendlichen wurde der Test so geeicht, dass die Messwertenormalverteilt mit µ = 100 und σ = 15 sind.

I In welchem Bereich liegt der Erwartungswert der 14-Jahrigen,µ14 (α = 0.05)?

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 17/39

Page 391: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur µ einer N(µ, σ2) bei bekanntem σ2

I

µ1,2 = 98.10± 1.9615√234

= 98.10± 1.92

I µ14 wird mit einer Vertrauenswahrscheinlichkeit von 0.95 vomKI [96.18, 100.02] uberdeckt

I Berechnung des KI beruht auf der Voraussetzung, dass σ2

bekannt und gultig auch fur die Teilpopulation der14-Jahrigen ist

I Es kommt selten vor, dass σ2 bekannt ist

I Typischer ist der Fall unbekannter Varianz

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 18/39

Page 392: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur µ einer N(µ, σ2) bei unbekanntem σ2

I Unbekannte Varianz σ2 wird aus den vorliegenden Datengeschatzt

σ2 =1

n − 1

n∑i=1

(xi − x)2

I Anstelle der Verteilung

Z =X − µ

σ√n

∼ N(0, 1)

I wird folgender Ausdruck als Grundlage fur das KI verwendet

T =X − µ

σ√n

∼ t(n−1)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 19/39

Page 393: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur µ einer N(µ, σ2) bei unbekanntem σ2

I Das KI fur µ ergibt sich aus∣∣X − µ∣∣σ√n

≤ t1−α2, df = n − 1

I Mit Irrtumswahrscheinlichkeit α gilt

|x − µ| ≤ t1−α2

σ√n, df = n − 1

I Und schließlich das KI

µ1,2 = x ± t1−α2

σ√n, df = n − 1

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 20/39

Page 394: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur µ einer N(µ, σ2) bei unbekanntem σ2

I Beispiel: Der Subtest ’Rechenaufgaben’ eines Intelligenztestswird einer Zufallsstichprobe von n = 87 15-jahrigen WienerHauptschulabsolventInnen vorgegeben, wobei x = 25.48 unds = 6.12. Gesucht ist das Konfidenzintervall fur denErwartungswert µ der Population der WienerHauptschulabsolventInnen (α = 0.05 bzw. 0.01)

I

µ1,2 = 25.48± t1−α2

6.12√87, df = 86

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 21/39

Page 395: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur µ einer N(µ, σ2) bei unbekanntem σ2

I Tabelle enthalt keine Eintragung fur df = 86, abernachstgelegene Wert ist df = 60; t0.975 = 2.00 bzw.t0.995 = 2.66

µ1,2 = 25.48± (2.00)6.12√

87, µ1,2 = 25.48± (2.66)

6.12√87

I µ liegt mit einer Irrtumswahrscheinlichkeit α = 0.05 bzw. 0.01im Intervall [24.17, 26.79] bzw. [23.74, 27.23]

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 22/39

Page 396: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

Naherungsweises KI fur µ einer Variable mit unbekannterVerteilung

I Normalverteilung der betrachteten Variable X war Grundlagefur alle dargestellten KI

I Was tun, wenn die Normalverteilungsannahme nichtgerechtfertigt erscheint?

I KI bleiben naherungsweise gultig wegen ZentralemGrenzwertsatz

I Gute der Naherung hangt von der Verteilung von X und demStichprobenumfang n ab

I Bei kleinem n sollte sich die Verteilung von X nicht allzusehrvon einer Normalverteilung entfernen

I Großes n kann praktisch jede Abweichung von derNormalverteilung kompensieren

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 23/39

Page 397: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur σ2 einer N(µ, σ2)

I Ebenso wichtig wie die Verteilung von X ist auch jene von S2,wobei S2 jene Variable bezeichnet, die durch wiederholtesZiehen von Zufallsstichproben vom Umfang n und Berechnungvon s2 in dieser Stichprobe entsteht

I Um σ2 zu schatzen, verwenden wir

S2 =1

n − 1

n∑i=1

(xi − x)2 = σ2 1

n − 1

n∑i=1

(xi − x

σ

)2

︸ ︷︷ ︸∼χ2

(n−1)

I

S2 =σ2

n − 1χ2

(n−1) oderχ2

(n−1)

n − 1=

S2

σ2

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 24/39

Page 398: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur σ2 einer N(µ, σ2)

I Grundlage fur Aufstellung eines KI fur σ2

I

(n − 1)S2

χ2(n−1)

= σ2

I KI mit Irrtumswahrscheinlichkeit α und Freiheitsgradendf = n − 1

(n − 1)s2

χ2α2

≥ σ2 ≥ (n − 1)s2

χ21−α

2

I Beispiel: Angenommen, s = 14.7 fur eine normalverteilteVariable in einer Stichprobe von (n = 234) Personen: inwelchem Bereich vermuten wir σ2 fur die entsprechendePopulation (α = 0.05)?

I Tabelle enthalt fur df = 233 keine Eintragungen ⇒asymptotische Entwicklung

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 25/39

Page 399: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur σ2 einer N(µ, σ2)

I Bei df →∞ strebt χ2 gegen die Normalverteilung N(df , 2df )

I

z0.975 = 1.96 =χ2

0.975 − 233√466

χ20.975 = 233 + 1.96

√466 = 275.3

z0.025 = −1.96 =χ2

0.025 − 233√466

χ20.025 = 233− 1.96

√466 = 190.7

I KI fur die Varianz

23314.72

275.3≤ σ2 ≤ 233

14.72

190.7⇒ 182.89 ≤ σ2 ≤ 264.02

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 26/39

Page 400: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur σ2 einer N(µ, σ2)

I Beispiel: Wie vorhin, aber mit einer Stichprobe vom Umfangn = 24

I Aus Tabelle fur df = 23

χ20.975 = 38.08 χ2

0.025 = 11.69

I KI fur σ2

2314.72

38.08≤ σ2 ≤ 23

14.72

11.69⇒ 130.52 ≤ σ2 ≤ 425.16

I Wir sehen, dass die kleine Stichprobe zu einerunzuverlassigeren Schatzung (breiteres KI) der Varianz fuhrt

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 27/39

Page 401: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

AllgemeinesI Ein statistischer Test ist ein Entscheidungsverfahren, das nach

Sammlung von empirischer Information (Daten) eineEntscheidung uber a priori formulierte Vermutungen(Hypothesen) trifft

I Der statistische Test basiert auf der Formulierung zweierkomplementarer Hypothesen (Null- und Alternativ) bezuglicheines unbekannten Parameters bzw. der Verteilungsform derGrundgesamtheit, auf welche man durch eine Stichprobeschließen mochte

I Ziel: Fur eine der zwei Hypothesen entscheiden mit moglichstkleinem Risiko

I Da die vorhandenen Daten Realisationen von Zufallsvariablensind, lasst sich niemals mit Sicherheit sagen, ob eineHypothese stimmt oder nicht. Man versucht daher, dieWahrscheinlichkeiten fur Fehlentscheidungen zu kontrollieren

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 28/39

Page 402: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

Grundlagen

I Hypothese: eine anhand empirischer Daten zu prufendeAnnahme. Wir unterscheiden als Gegensatzpaar zwischen derNullhypothese, H0, und der Alternativhypothese, H1

I Die H0 formuliert eine a priori Vermutung uber die Verteilungeiner Zufallsvariable oder den Wert θ0 eines Parameters θ. H0:θ = θ0. Die H0 beinhaltet diejenige Aussage, welche falsifiziertwerden soll

I Die H0 ist fur die Entscheidung von zentraler Bedeutung: sielegt die Annahmen fur die Formulierung einesWahrscheinlichkeitsmodells fest; bei Gultigkeit der H0 ist dieVerteilung der Prufgroße bekannt

I Zu jeder H0 wird eine H1 formuliert, z.B. H1: θ > θ0, oderH1: θ < θ0, oder H1: θ 6= θ0. Die H1 enthalt die Aussage, dieman aufzeigen mochte

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 29/39

Page 403: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

Grundlagen

I Ein statistisches Testverfahren lasst sich im Prinzip mit einemGerichtsverfahren vergleichen. Es wird immer von derUnschuld eines Verdachtigen ausgegangen. Nur, wenn dieIndizien fur die Schuld eines Angeklagten deutlich uberwiegen,kommt es zu einer Verurteilung

I Es gibt zu Beginn des Verfahrens die beiden Hypothesen H0:’der Verdachtige ist unschuldig’, und H1: ’der Verdachtige istschuldig’

I Um einen Unschuldigen nicht zu schnell zu verurteilen, wirddie Hypothese der Unschuld erst dann verworfen, wenn einIrrtum sehr unwahrscheinlich ist

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 30/39

Page 404: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

Grundlagen

I Wir definieren zwei Wahrscheinlichkeiten: DieWahrscheinlichkeit fur einen Fehler erster Art (das Verurteilendes Unschuldigen) und die Wahrscheinlichkeit fur einen Fehlerzweiter Art (das Freisprechen des Schuldigen)

I

P(Fehler erster Art) = α = P(H0 verwerfen|H0 wahr)

P(Fehler zweiter Art) = β = P(H0 beibehalten|H0 falsch)

I Wir berechnen die Wahrscheinlichkeit fur die empirischerhobenen Daten unter der Annahme, dass H0 gilt

I Ist das empirische Ergebnis bei Gultigkeit der H0 sehrunwahrscheinlich, nehmen wir an, dass H0 nicht wahr ist undverwerfen die H0

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 31/39

Page 405: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

Beispiel: Binomialtest

I Ein statistischer Test zur Uberprufung von hellseherischenFahigkeiten.

I Wir zeigen einer Person 25 Mal die Ruckseite einer reinzufallig gewahlten Spielkarte und fragen sie jeweils danach, zuwelcher der vier Farben (Kreuz, Pik, Herz, Karo) die Kartegehort. Unsere ZV X erfasst die Anzahl der Treffer

I H0 besagt, die Person sei nicht hellseherisch begabt; die H1

besagt, die Person hat hellseherische Fahigkeiten;

I Formal:

H0 : p =1

4, und H1 : p >

1

4

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 32/39

Page 406: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

PrinzipI Unter Annahme der Gultigkeit der H0 ist X ∼ B(25, 1

4)I Wenn die Person alle 25 Karten richtig benennt, werden wir

sie als Hellseher betrachten, und die H0 verwerfen, mit 24oder 23 Treffern vermutlich auch

I Wo liegt aber die kritische Anzahl an Treffern k, von der anwir nicht mehr glauben konnen, es seien reine Zufallstreffer?

I In der Praxis kommt es darauf an, wie oft man eineFehlentscheidung erster Art zulassen will

I Mit k = 24 ist die Wahrscheinlichkeit einer solchenFehlentscheidung P(H0 verwerfen | H0 wahr)

P(X ≥ 24) = P(X = 24) + P(X = 25) = (0.675)(10−13)

I Mit k = 10 erhalten wir eine etwas großere Wahrscheinlichkeit

P(X ≥ 10) = 0.07

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 33/39

Page 407: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

Prinzip

I Wir brauchen eine Entscheidungsregel

I In der Praxis wird die obere Grenze fur die Wahrscheinlichkeiteiner Fehlentscheidung erster Art a priori festgesetzt(Signifikanzniveau). Typische Werte sind 0.01 und 0.05

I Beispiel Binomialtest: Kann man von hellseherischenFahigkeiten einer Person ausgehen (α = 0.01)?

I Angenommen, die Person erzielt 18 Treffer.

I H0: p = 14 , H1: p > 1

4 . Unsere Zufallsvariable X hat unterAnnahme, die H0 sei wahr, eine B(25, 1

4)

I Dieses Hypothesenpaar teilt unter Annahme der Gultigkeit vonH0 und dem Signifikanzniveau α alle Realisationen(Stichproben) von X in zwei Bereiche: den Annahmebereichund den Verwerfungsbereich der H0 in Relation zur H1

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 34/39

Page 408: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

Prinzip

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 35/39

Page 409: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

Prinzip

I Wie wahrscheinlich ist es, tatsachlich dieses (oder ein nochextremeres Ergebnis) unter der Annahme, die H0 sei wahr, zubeobachten?

I Die Teststatistik errechnet sich aus der vorhandenenStichprobe und H0. Mithilfe der Teststatistik wird eineEntscheidungsregel fur oder gegen die H0 erstellt

P(X ≥ 18) =25∑

x=18

(25

x

)(1

4

)x (3

4

)(25−x)

P(X ≥ 18) = 0.000001 ≤ α = 0.01

I Unter H0 ist die Wahrscheinlichkeit, dieses Ergebnis (oder einnoch extremeres) zu bekommen, kleiner als das von unsangenommene Risiko fur einen Fehler erster Art, d.h. bei derVerwerfung der H0 eine falsche Entscheidung zu treffen

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 36/39

Page 410: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

Prinzip

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 37/39

Page 411: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

Prinzip

I Entscheidungsregel: Liegt die Teststatistik imVerwerfungsbereich, wird die H0 verworfen. Liegt dieTeststatistik im Annahmebereich, wird die H0 beibehalten(’Freispruch aus Mangel an Beweisen’).

I Aufgrund der Entscheidungsregel wird die H0: p = 14

zugunsten der H1: p > 14 mit einem Irrtumsrisiko von

0.000001 verworfen. Das Ergebnis ist signifikant

I Auch wenn es wunschenswert ist, dass der Test aufgrund dervorliegenden Daten ’richtig’ entscheidet, besteht dieMoglichkeit von Fehlentscheidungen. Bei richtiger H0 undEntscheidung fur H1 (Fehler erster Art oder α-Fehler), bzw.bei falscher H0 und Entscheidung fur die H0 (Fehler zweiterArt oder β-Fehler)

I ’Entscheiden’ ist immer an ein Risiko fur Fehler gebunden

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 38/39

Page 412: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

Vorgangsweise

I Formulierung eines Hypothesenpaares, H0 bzw. H1, undAuswahl eines Signifikanzniveaus α vor Realisation derStichprobe

I Bestimmung der Verteilung der Teststatistik unter Gultigkeitder H0

I Verwerfungsbereich beinhaltet die α% extremsten Falle dieserVerteilung zugunsten der H1

I Berechnung der Teststatistik bei der vorhandenen Stichprobe.Liegt das Ergebnis im Verwerfungsbereich, so wird die H0

verworfen, andernfalls wird die H0 beibehalten

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 39/39

Page 413: Statistik

Konfidenzintervalle und Statistische Tests

Einfuhrung in Quantitative Methoden

Karin Waldherr & Pantelis Christodoulides

25. Mai 2011

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 1/39

Page 414: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

Allgemeines

I Wir interessieren uns fur einen unbekannten wahren Parameterθ, der die Verteilung einer Zufallsvariable charakterisiert

I θ wird durch eine Schatzfunktion Θ aus einer(reprasentativen) Stichprobe mit Umfang n geschatzt

I Es wird davon ausgegangen, dass die Stichprobe in etwa dieGrundgesamtheit widerspiegelt, und dass deshalb dieSchatzung in der Nahe des wahren Parameters liegen musste

I Die Schatzfunktion ist selbst eine Zufallsvariable mit einerVerteilung, die den Parameter θ enthalt

I Bei der Schatzung von Parametern geht es nicht nur darum,Schatzfunktionen zu finden und deren Eigenschaften(Erwartungstreue, Konsistenz, etc.) abzuklaren

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 2/39

Page 415: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

AllgemeinesI Man mochte auch Intervalle angeben, in welchen θ mit einer

gewissen Sicherheit liegtI Es sei α eine vorgegebene Irrtumswahrscheinlichkeit, und a

bzw. b reelle Zahlen, mit a ≤ b. Die Schatzung des Bereichesa ≤ θ ≤ b mit der Vertrauenswahrscheinlichkeit (1− α)nennen wir Konfidenzintervall des Parameters θ mitIrrtumswahrscheinlichkeit α

I Θ Punktschatzung von θ, im Vergleich zur IntervallschatzungI Wir konstruieren ein symmetrisches Konfidenzintervall auf

Grundlage einer Schatzfunktion ΘI Von besonderem Interesse ist die Breite des

Konfidenzintervalls. Diese bestimmt sich durch dieStandardabweichung von Θ

I Erwunscht ist in der Regel ein moglichst schmalesKonfidenzintervall, denn dies weist auf eine genaue Schatzunghin

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 3/39

Page 416: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

Uberblick

I Konfidenzintervall fur den Parameter p einer B(n, p) Variable

I Konfidenzintervall fur den Erwartungswert µ einer N(µ, σ2)Variable bei bekannter Varianz σ2

I Konfidenzintervall fur den Erwartungswert µ einer N(µ, σ2)Variable bei unbekannter Varianz σ2

I Naherungsweises Konfidenzintervall fur den Erwartungswert µeiner Variable mit unbekannter Verteilung

I Konfidenzintervall fur die Varianz σ2 einer N(µ, σ2) Variable

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 4/39

Page 417: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur p einer B(n, p)

I Befragung einer Zufallsstichprobe von n Personen aus einerunendlichen Population zu einem Thema mitAntwortkategorien ja/nein

I k ist die Anzahl der ’ja’ Antworten in der Stichprobe

I r = kn die entsprechende relative Haufigkeit

I p = P (’ja’) ist der wahre (unbekannte) Anteil derJa-Stimmen in der Population

I r ist ein erwartungstreuer Schatzer fur p

I K ist jene Zufallsvariable, die durch wiederholte Ziehungunabhangiger Stichproben vom Umfang n aus der unendlichenPopulation entsteht, R ist die entsprechende Zufallsvariableder relativen Haufigkeiten

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 5/39

Page 418: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur p einer B(n, p)

I K ∼ B(n, p)

I Wenn np ≥ 5 und n(1− p) ≥ 5 darf die Binomialverteilungnaherungsweise durch die N(np, np(1− p)) ersetzt werden

I K ∼a N(np, np(1− p)) und auch

I R ∼a N(npn ,

np(1−p)n2 ) = N(p, p(1−p)

n )

I Um die Tabelle der N(0, 1) fur die Bestimmung derEndpunkte des Konfidenzintervalls anwenden zu konnen,standardisieren wir R

I

Z =R − E (R)

σR=

R − p√p(1−p)

n

∼ N(0, 1)

I Sei α = 0.05

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 6/39

Page 419: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur p einer B(n, p)

Tabelle 1b: P(−1.96 ≤ Z ≤ 1.96) = 0.95

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 7/39

Page 420: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur p einer B(n, p)

I Fur 95% aller Stichproben mit Umfang n gilt

|Z | =|R − p|√

p(1−p)n

≤ 1.96

I Wir ersetzen σR durch einen Schatzer σR

σR =

√p(1− p)

n, σR =

√r(1− r)

n − 1

I Also gilt fur 95% aller Stichproben mit Umfang n

|R − p| ≤ 1.96

√r(1− r)

n − 1

I Grundlage fur ein KI mit einer Irrtumswahrscheinlichkeitα = 0.05

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 8/39

Page 421: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur p einer B(n, p)

I Die Grenzen des KI mit Irrtumswahrscheinlichkeit α = 0.05werden wie folgt bestimmt

p1,2 = r ± 1.96

√r(1− r)

n − 1

I Allgemeiner fur beliebige Irrtumswahrscheinlichkeit α

p1,2 = r ± z1−α2

√r(1− r)

n − 1

I KI ist symmetrisch um den Punkt r , symmetrisches KI

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 9/39

Page 422: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur p einer B(n, p)

I Bei gegebenem p hangt die Breite des KI von zwei Faktorenab: der gewunschten Sicherheit und dem Stichprobenumfang

I Je hoher die Sicherheit, desto kleiner dieIrrtumswahrscheinlichkeit α, desto großer wird z1−α

2, und

desto breiter das Intervall

I Je großer die Stichprobe, desto kleiner wird σR und dessenSchatzung σR , und desto schmaler das Intervall

I Interpretation des KI: Werden immer wieder unabhangigeStichproben vom Umfang n gezogen, und wird fur jede dieserStichproben p = r gerechnet, so liegt p in (1− α) Prozentdieser Stichproben innerhalb des Intervalles [p1, p2]. DerParameter p wird mit einer Vertrauenswahrscheinlichkeit von(1− α) vom Intervall [p1, p2] uberdeckt

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 10/39

Page 423: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur p einer B(n, p)

I Beispiel: Es wurden n = 200 Personen befragt, von denenk = 78 mit ’ja’ geantwortet haben. α = 0.05, bzw. α = 0.01

I r = p = 78200 = 0.39

I

p1,2 = 0.39± 1.96

√(0.39)(0.61)

199= 0.39± 0.068

p1,2 = 0.39± 2.58

√(0.39)(0.61)

199= 0.39± 0.089

I

p1,2 = [0.322, 0.458] p1,2 = [0.301, 0.479]

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 11/39

Page 424: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI in SPSSFile: SPSS-Konfidenzintervalle.sav;Konfidenzintervall fur Anteil der Haustierbesitzer (n = 166,α = 0.05)Deskriptive Statistiken → Explorative Datenanalyse

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 12/39

Page 425: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 13/39

Page 426: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur µ einer N(µ, σ2) bei bekanntem σ2

I Die Normalverteilung ist eine reproduzierende Verteilung

I Seien X1,X2, . . . ,Xn voneinander unabhangig normalverteilteZufallsvariablen mit Erwartungswerten µ1, µ2, . . . , µn undVarianzen σ2

1, σ22, . . . , σ

2n. Dann ist die Zufallsvariable

Y = X1 + X2 + . . .+ Xn ebenfalls normalverteilt mitE [Y ] = µ1 + µ2 + . . .+ µn und σ2

Y = σ21 + σ2

2 + . . .+ σ2n

I Wie ist die Verteilung von Mittelwerten x einernormalverteilten Variable?

I X sei N(µ, σ2)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 14/39

Page 427: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur µ einer N(µ, σ2) bei bekanntem σ2

I Wir ziehen unabhangige Zufallsstichproben vom Umfang n.Die Mittelwerte x aller Zufallsstichproben erzeugen eineVariable X = 1

n (X1 + X2 + . . .+ Xn)

I X ist abgesehen von der multiplikativen Konstante 1n eine

Summe normalverteilter Variablen, und es gilt

X ∼ N(µ,σ2

n)

I Wenn X normalverteilt ist, hat X wiederum Normalverteilungmit dem selben Erwartungswert, aber wesentlich kleinererVarianz σ2

n

I Die Mittelwerte aus Stichproben vom Umfang n gruppierensich also enger zusammen als die Messwerte

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 15/39

Page 428: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur µ einer N(µ, σ2) bei bekanntem σ2

I Wir verwenden die Verteilung von X um ein KI fur µaufzustellen

I Standardisieren der normalverteilten Variable X

Z =X − µ

σ√n

I Es gilt fur (1− α)% aller Stichproben mit Umfang n

|x − µ| ≤ z1−α2

σ√n

I

µ1,2 = x ± z1−α2

σ√n

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 16/39

Page 429: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur µ einer N(µ, σ2) bei bekanntem σ2

I Die Breite des KI hangt von 3 Faktoren ab: von der Streuungder Variable X bzw. σ, von n, und von derIrrtumswahrscheinlichkeit α

I Je kleiner σ, desto enger das KI

I Je großer die Stichprobe, desto enger das KI

I Je kleiner α, desto breiter das KI

I Beispiel: Eine Stichprobe von n = 234 14-jahrigenSchulerInnen wurde mit einem Intelligenztest, der fur 14-18jahrige Jugendliche normiert wurde, getestet. Der Mittelwertder 14-Jahrigen ist x = 98.10. In der Gesamtpopulation allerJugendlichen wurde der Test so geeicht, dass die Messwertenormalverteilt mit µ = 100 und σ = 15 sind.

I In welchem Bereich liegt der Erwartungswert der 14-Jahrigen,µ14 (α = 0.05)?

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 17/39

Page 430: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur µ einer N(µ, σ2) bei bekanntem σ2

I

µ1,2 = 98.10± 1.9615√234

= 98.10± 1.92

I µ14 wird mit einer Vertrauenswahrscheinlichkeit von 0.95 vomKI [96.18, 100.02] uberdeckt

I Berechnung des KI beruht auf der Voraussetzung, dass σ2

bekannt und gultig auch fur die Teilpopulation der14-Jahrigen ist

I Es kommt selten vor, dass σ2 bekannt ist

I Typischer ist der Fall unbekannter Varianz

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 18/39

Page 431: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur µ einer N(µ, σ2) bei unbekanntem σ2

I Unbekannte Varianz σ2 wird aus den vorliegenden Datengeschatzt

σ2 =1

n − 1

n∑i=1

(xi − x)2

I Anstelle der Verteilung

Z =X − µ

σ√n

∼ N(0, 1)

I wird folgender Ausdruck als Grundlage fur das KI verwendet

T =X − µ

σ√n

∼ t(n−1)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 19/39

Page 432: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur µ einer N(µ, σ2) bei unbekanntem σ2

I Das KI fur µ ergibt sich aus∣∣X − µ∣∣σ√n

≤ t1−α2, df = n − 1

I Mit Irrtumswahrscheinlichkeit α gilt

|x − µ| ≤ t1−α2

σ√n, df = n − 1

I Und schließlich das KI

µ1,2 = x ± t1−α2

σ√n, df = n − 1

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 20/39

Page 433: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur µ einer N(µ, σ2) bei unbekanntem σ2

I Beispiel: Der Subtest ’Rechenaufgaben’ eines Intelligenztestswird einer Zufallsstichprobe von n = 87 15-jahrigen WienerHauptschulabsolventInnen vorgegeben, wobei x = 25.48 unds = 6.12. Gesucht ist das Konfidenzintervall fur denErwartungswert µ der Population der WienerHauptschulabsolventInnen (α = 0.05 bzw. 0.01)

I

µ1,2 = 25.48± t1−α2

6.12√87, df = 86

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 21/39

Page 434: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur µ einer N(µ, σ2) bei unbekanntem σ2

I Tabelle enthalt keine Eintragung fur df = 86, abernachstgelegene Wert ist df = 60; t0.975 = 2.00 bzw.t0.995 = 2.66

µ1,2 = 25.48± (2.00)6.12√

87, µ1,2 = 25.48± (2.66)

6.12√87

I µ liegt mit einer Irrtumswahrscheinlichkeit α = 0.05 bzw. 0.01im Intervall [24.17, 26.79] bzw. [23.74, 27.23]

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 22/39

Page 435: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

Naherungsweises KI fur µ einer Variable mit unbekannterVerteilung

I Normalverteilung der betrachteten Variable X war Grundlagefur alle dargestellten KI

I Was tun, wenn die Normalverteilungsannahme nichtgerechtfertigt erscheint?

I KI bleiben naherungsweise gultig wegen ZentralemGrenzwertsatz

I Gute der Naherung hangt von der Verteilung von X und demStichprobenumfang n ab

I Bei kleinem n sollte sich die Verteilung von X nicht allzusehrvon einer Normalverteilung entfernen

I Großes n kann praktisch jede Abweichung von derNormalverteilung kompensieren

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 23/39

Page 436: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur σ2 einer N(µ, σ2)

I Ebenso wichtig wie die Verteilung von X ist auch jene von S2,wobei S2 jene Variable bezeichnet, die durch wiederholtesZiehen von Zufallsstichproben vom Umfang n und Berechnungvon s2 in dieser Stichprobe entsteht

I Um σ2 zu schatzen, verwenden wir

S2 =1

n − 1

n∑i=1

(xi − x)2 = σ2 1

n − 1

n∑i=1

(xi − x

σ

)2

︸ ︷︷ ︸∼χ2

(n−1)

I

S2 =σ2

n − 1χ2

(n−1) oderχ2

(n−1)

n − 1=

S2

σ2

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 24/39

Page 437: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur σ2 einer N(µ, σ2)

I Grundlage fur Aufstellung eines KI fur σ2

I

(n − 1)S2

χ2(n−1)

= σ2

I KI mit Irrtumswahrscheinlichkeit α und Freiheitsgradendf = n − 1

(n − 1)s2

χ2α2

≥ σ2 ≥ (n − 1)s2

χ21−α

2

I Beispiel: Angenommen, s = 14.7 fur eine normalverteilteVariable in einer Stichprobe von (n = 234) Personen: inwelchem Bereich vermuten wir σ2 fur die entsprechendePopulation (α = 0.05)?

I Tabelle enthalt fur df = 233 keine Eintragungen ⇒asymptotische Entwicklung

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 25/39

Page 438: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur σ2 einer N(µ, σ2)

I Bei df →∞ strebt χ2 gegen die Normalverteilung N(df , 2df )

I

z0.975 = 1.96 =χ2

0.975 − 233√466

χ20.975 = 233 + 1.96

√466 = 275.3

z0.025 = −1.96 =χ2

0.025 − 233√466

χ20.025 = 233− 1.96

√466 = 190.7

I KI fur die Varianz

23314.72

275.3≤ σ2 ≤ 233

14.72

190.7⇒ 182.89 ≤ σ2 ≤ 264.02

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 26/39

Page 439: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

KI fur σ2 einer N(µ, σ2)

I Beispiel: Wie vorhin, aber mit einer Stichprobe vom Umfangn = 24

I Aus Tabelle fur df = 23

χ20.975 = 38.08 χ2

0.025 = 11.69

I KI fur σ2

2314.72

38.08≤ σ2 ≤ 23

14.72

11.69⇒ 130.52 ≤ σ2 ≤ 425.16

I Wir sehen, dass die kleine Stichprobe zu einerunzuverlassigeren Schatzung (breiteres KI) der Varianz fuhrt

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 27/39

Page 440: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

AllgemeinesI Ein statistischer Test ist ein Entscheidungsverfahren, das nach

Sammlung von empirischer Information (Daten) eineEntscheidung uber a priori formulierte Vermutungen(Hypothesen) trifft

I Der statistische Test basiert auf der Formulierung zweierkomplementarer Hypothesen (Null- und Alternativ) bezuglicheines unbekannten Parameters bzw. der Verteilungsform derGrundgesamtheit, auf welche man durch eine Stichprobeschließen mochte

I Ziel: Fur eine der zwei Hypothesen entscheiden mit moglichstkleinem Risiko

I Da die vorhandenen Daten Realisationen von Zufallsvariablensind, lasst sich niemals mit Sicherheit sagen, ob eineHypothese stimmt oder nicht. Man versucht daher, dieWahrscheinlichkeiten fur Fehlentscheidungen zu kontrollieren

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 28/39

Page 441: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

Grundlagen

I Hypothese: eine anhand empirischer Daten zu prufendeAnnahme. Wir unterscheiden als Gegensatzpaar zwischen derNullhypothese, H0, und der Alternativhypothese, H1

I Die H0 formuliert eine a priori Vermutung uber die Verteilungeiner Zufallsvariable oder den Wert θ0 eines Parameters θ. H0:θ = θ0. Die H0 beinhaltet diejenige Aussage, welche falsifiziertwerden soll

I Die H0 ist fur die Entscheidung von zentraler Bedeutung: sielegt die Annahmen fur die Formulierung einesWahrscheinlichkeitsmodells fest; bei Gultigkeit der H0 ist dieVerteilung der Prufgroße bekannt

I Zu jeder H0 wird eine H1 formuliert, z.B. H1: θ > θ0, oderH1: θ < θ0, oder H1: θ 6= θ0. Die H1 enthalt die Aussage, dieman aufzeigen mochte

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 29/39

Page 442: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

Grundlagen

I Ein statistisches Testverfahren lasst sich im Prinzip mit einemGerichtsverfahren vergleichen. Es wird immer von derUnschuld eines Verdachtigen ausgegangen. Nur, wenn dieIndizien fur die Schuld eines Angeklagten deutlich uberwiegen,kommt es zu einer Verurteilung

I Es gibt zu Beginn des Verfahrens die beiden Hypothesen H0:’der Verdachtige ist unschuldig’, und H1: ’der Verdachtige istschuldig’

I Um einen Unschuldigen nicht zu schnell zu verurteilen, wirddie Hypothese der Unschuld erst dann verworfen, wenn einIrrtum sehr unwahrscheinlich ist

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 30/39

Page 443: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

Grundlagen

I Wir definieren zwei Wahrscheinlichkeiten: DieWahrscheinlichkeit fur einen Fehler erster Art (das Verurteilendes Unschuldigen) und die Wahrscheinlichkeit fur einen Fehlerzweiter Art (das Freisprechen des Schuldigen)

I

P(Fehler erster Art) = α = P(H0 verwerfen|H0 wahr)

P(Fehler zweiter Art) = β = P(H0 beibehalten|H0 falsch)

I Wir berechnen die Wahrscheinlichkeit fur die empirischerhobenen Daten unter der Annahme, dass H0 gilt

I Ist das empirische Ergebnis bei Gultigkeit der H0 sehrunwahrscheinlich, nehmen wir an, dass H0 nicht wahr ist undverwerfen die H0

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 31/39

Page 444: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

Beispiel: Binomialtest

I Ein statistischer Test zur Uberprufung von hellseherischenFahigkeiten.

I Wir zeigen einer Person 25 Mal die Ruckseite einer reinzufallig gewahlten Spielkarte und fragen sie jeweils danach, zuwelcher der vier Farben (Kreuz, Pik, Herz, Karo) die Kartegehort. Unsere ZV X erfasst die Anzahl der Treffer

I H0 besagt, die Person sei nicht hellseherisch begabt; die H1

besagt, die Person hat hellseherische Fahigkeiten;

I Formal:

H0 : p =1

4, und H1 : p >

1

4

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 32/39

Page 445: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

PrinzipI Unter Annahme der Gultigkeit der H0 ist X ∼ B(25, 1

4)I Wenn die Person alle 25 Karten richtig benennt, werden wir

sie als Hellseher betrachten, und die H0 verwerfen, mit 24oder 23 Treffern vermutlich auch

I Wo liegt aber die kritische Anzahl an Treffern k, von der anwir nicht mehr glauben konnen, es seien reine Zufallstreffer?

I In der Praxis kommt es darauf an, wie oft man eineFehlentscheidung erster Art zulassen will

I Mit k = 24 ist die Wahrscheinlichkeit einer solchenFehlentscheidung P(H0 verwerfen | H0 wahr)

P(X ≥ 24) = P(X = 24) + P(X = 25) = (0.675)(10−13)

I Mit k = 10 erhalten wir eine etwas großere Wahrscheinlichkeit

P(X ≥ 10) = 0.07

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 33/39

Page 446: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

Prinzip

I Wir brauchen eine Entscheidungsregel

I In der Praxis wird die obere Grenze fur die Wahrscheinlichkeiteiner Fehlentscheidung erster Art a priori festgesetzt(Signifikanzniveau). Typische Werte sind 0.01 und 0.05

I Beispiel Binomialtest: Kann man von hellseherischenFahigkeiten einer Person ausgehen (α = 0.01)?

I Angenommen, die Person erzielt 18 Treffer.

I H0: p = 14 , H1: p > 1

4 . Unsere Zufallsvariable X hat unterAnnahme, die H0 sei wahr, eine B(25, 1

4)

I Dieses Hypothesenpaar teilt unter Annahme der Gultigkeit vonH0 und dem Signifikanzniveau α alle Realisationen(Stichproben) von X in zwei Bereiche: den Annahmebereichund den Verwerfungsbereich der H0 in Relation zur H1

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 34/39

Page 447: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

Prinzip

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 35/39

Page 448: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

Prinzip

I Wie wahrscheinlich ist es, tatsachlich dieses (oder ein nochextremeres Ergebnis) unter der Annahme, die H0 sei wahr, zubeobachten?

I Die Teststatistik errechnet sich aus der vorhandenenStichprobe und H0. Mithilfe der Teststatistik wird eineEntscheidungsregel fur oder gegen die H0 erstellt

P(X ≥ 18) =25∑

x=18

(25

x

)(1

4

)x (3

4

)(25−x)

P(X ≥ 18) = 0.000001 ≤ α = 0.01

I Unter H0 ist die Wahrscheinlichkeit, dieses Ergebnis (oder einnoch extremeres) zu bekommen, kleiner als das von unsangenommene Risiko fur einen Fehler erster Art, d.h. bei derVerwerfung der H0 eine falsche Entscheidung zu treffen

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 36/39

Page 449: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

Prinzip

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 37/39

Page 450: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

Prinzip

I Entscheidungsregel: Liegt die Teststatistik imVerwerfungsbereich, wird die H0 verworfen. Liegt dieTeststatistik im Annahmebereich, wird die H0 beibehalten(’Freispruch aus Mangel an Beweisen’).

I Aufgrund der Entscheidungsregel wird die H0: p = 14

zugunsten der H1: p > 14 mit einem Irrtumsrisiko von

0.000001 verworfen. Das Ergebnis ist signifikant

I Auch wenn es wunschenswert ist, dass der Test aufgrund dervorliegenden Daten ’richtig’ entscheidet, besteht dieMoglichkeit von Fehlentscheidungen. Bei richtiger H0 undEntscheidung fur H1 (Fehler erster Art oder α-Fehler), bzw.bei falscher H0 und Entscheidung fur die H0 (Fehler zweiterArt oder β-Fehler)

I ’Entscheiden’ ist immer an ein Risiko fur Fehler gebunden

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 38/39

Page 451: Statistik

Konfidenzintervalle und Statistische TestsKonfidenzintervalle (KI)Statistische Tests

Vorgangsweise

I Formulierung eines Hypothesenpaares, H0 bzw. H1, undAuswahl eines Signifikanzniveaus α vor Realisation derStichprobe

I Bestimmung der Verteilung der Teststatistik unter Gultigkeitder H0

I Verwerfungsbereich beinhaltet die α% extremsten Falle dieserVerteilung zugunsten der H1

I Berechnung der Teststatistik bei der vorhandenen Stichprobe.Liegt das Ergebnis im Verwerfungsbereich, so wird die H0

verworfen, andernfalls wird die H0 beibehalten

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 10 .VO 39/39

Page 452: Statistik

Statistische Tests II

Einfuhrung in Quantitative Methoden

Pantelis Christodoulides & Karin Waldherr

1. Juni 2011

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 1/35

Page 453: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Ein- und Zweiseitige Hypothesen

I H0: p = 14 gegenuber

I Einseitige (= gerichtete) HypotheseH1 : p > 1

4 oder H ′1 : p < 1

4

I versus

I Zweiseitige Hypothese H ′′1 : p 6= 1

4

I Beim einseitigen Testen ist die Kontrolle des α-Fehlers nur ineine Richtung notwendig, beim zweiseitigen Testen ist dieseKontrolle in beide Richtungen erforderlich

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 2/35

Page 454: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Zweiseitiges Testen α = 0.05

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 3/35

Page 455: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Einseitiges vs. zweiseitiges Testen

I Die Wahl der Alternativhypothese muss a priori, d.h. ohneBerucksichtigung der aktuellen Daten aufgrund inhaltlicherKriterien erfolgen

I Insbesondere die Wahl einer der einseitigen Alternativen mussauf einer von den aktuellen Daten unabhangigenVorinformation beruhen

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 4/35

Page 456: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Beispiel: Binomialtest mit NV-Approximation

I Wenn Voraussetzungen fur NV-Approximation der BVgegeben; µ = np, σ2 = np(1− p)

I Standardnormalverteilte Teststatistik:

Z =K − µσ

=K − np0√np0(1− np0)

∼ N(0, 1)

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 5/35

Page 457: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

NV-Approximation der Binomialverteilung:Kontinuitatskorrektur

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 6/35

Page 458: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Beispiel Einseitiges Testen

I Eine Psychologin vermutet, dass weniger als 50% der Frauen,die eine Diat machen, ubergewichtig sind.

I H0: p = 0.50; H1: p < 0.50; α = 0.05

I Verwerfungsbereich:

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 7/35

Page 459: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

I In einer von ihr erhobenen Stichprobe von n = 200 Frauen, diederzeit Diat aus Figurgrunden halten, sind 87 ubergewichtig.

I µ = np = 100, k = 87

I

z =87.5− 100√

200 · 0.50 · 0.50= −1.77

Tab. 1b: P(Z ≤ −1.77) = 0.0384 < α = 0.05 ⇒ H0

verwerfen

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 8/35

Page 460: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Einseitiges Testen

I Verwerfung der H0 zugunsten der H1 mit einem Risiko fureinen Fehler erster Art von 0.0384

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 9/35

Page 461: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Einseitiges Testen

Angenommen, die Psychologin hatte die folgenden Hypothesenformuliert:H0: p = 0.5; H1: p > 0.5Verwerfungsbereich:

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 10/35

Page 462: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

z = −1.77 liegt nicht im Verwerfungsbereich

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 11/35

Page 463: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Beispiel Zweiseitiges Testen

I Angenommen, die Psychologin hatte keine Vermutung in einebestimmte Richtung gehabt und die H1 ungerichtet formuliert:

I H0: p = 0.50; H1: p 6= 0.50; α = 0.05

I Kontrolle des α-Fehlers in beide Richtungen notwendig

I P(Z ≤ −1.77) + P(Z ≥ 1.77) = 0.0384 + 0.0384 = 0.0768 >α = 0.05; Ergebnis liegt noch im Annahmebereich der H0

I Oder aquivalent: nur eine Seite betrachten: α2 = 0.025

I 0.0384 > 0.025;

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 12/35

Page 464: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Fortsetzung

Es konnen bei denselben Daten unterschiedliche Entscheidungenresultieren. Beim einseitigen Testen kommt man eher zu einerVerwerfung der H0

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 13/35

Page 465: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Einseitiges vs. Zweiseitiges Testen

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 14/35

Page 466: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

p-WertI In Statistik-Softwareprodukten wird zusammen mit der

Teststatistik eines statistischen Tests ein sogenannter p-Wertausgegeben

I Der p-Wert gibt die Wahrscheinlichkeit fur den Fehler ersterArt an, also die Wahrscheinlichkeit, eine gultige H0 zuverwerfen aufgrund der beobachteten Daten

I Vorteil des p-Wertes liegt darin, dass bei der Entscheidungkeine Tabelle der Verteilung der Teststatistik benotigt wird

I Wird der zweiseitige p-Wert angegeben und die H1 istgerichtet, muss man den p-Wert durch 2 dividieren und mit αvergleichen.

I Bei einseitigen Hypothesen ist die zusatzliche Uberprufungnotwendig, ob die Teststatistik tatsachlich imVerwerfungsbereich der H0 liegt

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 15/35

Page 467: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

p-WertI SPSS-Beispiel in Datei ’binom.sav’, α = 0.05, B(11, 0.5),

x = 9I H0: p = 0.5, H1: p 6= 0.5, ’Signifikanz’ (zweiseitig!) =

0.065 > α = 0.05 ⇒ H0 wird beibehalten

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 16/35

Page 468: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

p-WertI H0: p = 0.5, H ′

1: p > 0.5, Signifikanz (zweiseitig!) = 0.065⇒, ’Signifikanz’ (einseitig!) = 0.065

2 = 0.0325 < α = 0.05 undTeststatistik liegt im Verwerfungsbereich ⇒ H0 wird verworfen

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 17/35

Page 469: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

p-WertI H0: p = 0.5, H ′′

1 : p < 0.5, Signifikanz (zweiseitig!) = 0.065⇒ ’Signifikanz’ (einseitig!) = 0.065

2 = 0.0325 < α = 0.05,aber Teststatistik liegt nicht im Verwerfungsbereich !!! ⇒ H0

wird beibehalten

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 18/35

Page 470: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Unspezifische H0 bei einseitigem Testen

I Bisher spezifische H0: θ = θ0

I Bei H1: θ < θ0 korrekterweise H0: θ ≥ θ0 (unspezifische H0)

I Kann die H0: θ = θ0 mit einer Irrtumswahrscheinlichkeit αverworfen werden, so kann jede weitere H0: θ > θ0 mit einernoch kleineren Irrtumswahrscheinlichkeit verworfen werden

I Es genugt also, die H1: θ < θ0 an der spezifischen H0: θ = θ0zu testen

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 19/35

Page 471: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Fehler bei statistischen Tests

I α = 0.05 bedeutet: fuhrt man dasselbe Experiment haufigdurch, verwirft man in ca. 5% der Falle die H0 irrtumlich,obwohl sie tatsachlich gilt (Fehler 1. Art oder α-Fehler)

I Man versucht, Wahrscheinlichkeiten fur Fehlentscheidungenzu minimieren, kann sie aber niemals vollig ausschalten

I Statistische Fehler beziehen sich nicht auf unkorrekteVorgangsweise beim Hypothesentesten, sondern aufEntscheidungsfehler. Richtige Prozeduren fuhren zuFehlentscheidungen.

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 20/35

Page 472: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Fehler bei statistischen Tests

I β-Fehler (Fehler 2. Art) = Wahrscheinlichkeit H0

beizubehalten, obwohl sie falsch ist.

I Vergleiche Gerichtsverfahren: Freispruch aus Mangel anBeweisen (Beibehalten der H0: der Verdachtige istunschuldig) bedeutet nicht, dass er mit Sicherheit unschuldigist (β-Fehler). Die Beweise fur seine Schuld waren nichtausreichend

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 21/35

Page 473: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Fehler bei Statistischen Tests

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 22/35

Page 474: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Statistische Fehler

I Je kleiner α, umso kleiner der Fehler 1. Art (H0 irrtumlich zuverwerfen)

I → α moglichst klein wahlen, z.B. α = 0.001?

I Entscheiden fur Signifikanzniveau ist vergleichbar mit demAbschluss einer Versicherung. Umso besser derVersicherungsschutz gegen einen α-Fehler, umso hoher dieKosten.

I Was sind die Kosten eines kleinen Signifikanzniveaus?

I Großerer Fehler 2. Art (β-Fehler = H0 irrtumlichbeizubehalten) und geringere Teststarke 1− β (Macht oderPower = Wahrscheinlichkeit, H0 zugunsten einer H1 zuverwerfen, wenn tatsachlich H1 gilt)

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 23/35

Page 475: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Beziehungen zwischen Statistischen Fehlern - 1

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 24/35

Page 476: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Beziehungen zwischen Statistischen Fehlern - 2

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 25/35

Page 477: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Richtige und falsche Entscheidungen

Reale SituationH0 H1

Ergebnis d. verworfen Fehler 1. Art Richtige E.Hypothesen- H0 α Macht, 1− β

tests beibehalten Richtige E. Fehler 2. Art1− α β

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 26/35

Page 478: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Dilemma

I Versicherung gegen α-Fehler hat die Kosten eines hoherenβ-Fehlers und geringerer Macht des Tests

I Versicherung gegen β-Fehler hat die Kosten eines hoherenα-Fehlers

I Kompromiss in der Praxis: α = 0.05 oder α = 0.01 jenachdem, welchen Fehler man eher riskieren mochte

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 27/35

Page 479: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Macht eines Tests (Teststarke)

I 1− β ist die Wahrscheinlichkeit dafur, dass ein statistischerTest zugunsten einer H1 entscheidet, wenn diese gilt (d.h. dieH0 richtigerweise zu verwerfen)

I Die Teststarke hangt von verschiedenen Faktoren ab:I Signifikanzniveau αI Ein- oder zweiseitige Alternativhypothese (bei einseitiger H1

hoher)I Große des UnterschiedesI Streuung der Variable X in der PopulationI Stichprobenumfang nI Verwendeter statistischer Test: je hoher der verwendete

Informationsgehalt der Daten, umso hoher seine Macht

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 28/35

Page 480: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Teststarke und Große der Unterschiede

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 29/35

Page 481: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Teststarke und Populationsstreuung

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 30/35

Page 482: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Teststarke und Stichprobenumfang

I Beispiel: Binomialtest mit NV-Approximation, Anteil derubergewichtigen Frauen

I Stichprobengroße n = 2000 Frauen (statt n = 200), gleicherAnteil wie vorher: 43.5% ubergewichtig = 870.

I µ = np = 1000, k = 870

I

z =870.5− 1000√

2000 · 0.50 · 0.50= −5.79

zum Vergleich z = −1.77 bei n = 200

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 31/35

Page 483: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Statistische Signifikanz und praktische Relevanz

I Mit genugend großem Stichprobenumfang kann man praktischjede H0 verwerfen

I Festlegung einer Effektgroße ε (z.B. praktisch relevanterUnterschied) und einer spezifischen H1

I Muss aufgrund inhaltlicher Uberlegungen vor Datenerhebungfestgelegt werden

I Vorteil: notwendiger Stichprobenumfang, der bei gegebenemα, gewunschtem 1− β und bestimmter Effektgroße eineeindeutige Entscheidung ermoglicht, bestimmbar

I Tabellen bzw. Computerprogramme im Internet (z.B. GPowervon Erdfelder, Faul & Buchner, 1996).

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 32/35

Page 484: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Kumulierung des α-Fehlers

I Fuhrt man mehrere statistische Tests durch, hat man beijedem dieser Tests das Risiko eines α-Fehlers

I Angenommen, jemand fuhrt drei statistische Tests durch umeine Hypothese zu prufen

I Selbst bei Annahme der Unabhangigkeit der einzelnen Testsware Wahrscheinlichkeit, dass mindestens 1 Test signifikantwird = 1 − (Wahrscheinlichkeit kein Test signifikant) =1− (1− 0.05)3 = 0.14

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 33/35

Page 485: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Kumulierung des α-Fehlers

I Fuhrt man k unabhangige statistische Tests zur Uberprufungeiner H0 durch, kommt es zu einer Kumulierung des α-FehlerRisikos α′ = 1− (1− α)k

I Lasst es sich nicht vermeiden, mehrere statistische Tests zurPrufung einer Hypothese durchzufuhren, muss eine α-FehlerKorrektur vorgenommen werden

I α-Fehler Adjustierung: αadj = 1− (1− α)1/k

I 3 Tests: αadj = 1− (1− 0.05)1/3 = 0.017

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 34/35

Page 486: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Darstellung des Ergebnisses

I Voraussetzung: Formulierung der H0 und H1, Angabe von α,Stichprobenbeschreibung

I Angabe des p-Wertes

I Angabe der Teststatistik (+ df wo notig)

I ev. Teststarke und Effektgroße

I Korrekte Formulierung bei nicht-signifikantem Ergebnis: ’H0

wird beibehalten’; Formulierung, ’H0 wurde bewiesen’, istfalsch

I Falsche Interpretationen:I ’Je kleiner der p-Wert, umso großer der Effekt.’ Der p-Wert ist

keine Effektgroße.I ’Der p-Wert gibt die Wahrscheinlichkeit fur das Zutreffen der

H0 an.’ Der p-Wert ist die P(beobachtetesErgebnis|H0).

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 35/35

Page 487: Statistik

Statistische Tests II

Einfuhrung in Quantitative Methoden

Pantelis Christodoulides & Karin Waldherr

1. Juni 2011

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 1/35

Page 488: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Ein- und Zweiseitige Hypothesen

I H0: p = 14 gegenuber

I Einseitige (= gerichtete) HypotheseH1 : p > 1

4 oder H ′1 : p < 1

4

I versus

I Zweiseitige Hypothese H ′′1 : p 6= 1

4

I Beim einseitigen Testen ist die Kontrolle des α-Fehlers nur ineine Richtung notwendig, beim zweiseitigen Testen ist dieseKontrolle in beide Richtungen erforderlich

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 2/35

Page 489: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Zweiseitiges Testen α = 0.05

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 3/35

Page 490: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Einseitiges vs. zweiseitiges Testen

I Die Wahl der Alternativhypothese muss a priori, d.h. ohneBerucksichtigung der aktuellen Daten aufgrund inhaltlicherKriterien erfolgen

I Insbesondere die Wahl einer der einseitigen Alternativen mussauf einer von den aktuellen Daten unabhangigenVorinformation beruhen

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 4/35

Page 491: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Beispiel: Binomialtest mit NV-Approximation

I Wenn Voraussetzungen fur NV-Approximation der BVgegeben; µ = np, σ2 = np(1− p)

I Standardnormalverteilte Teststatistik:

Z =K − µσ

=K − np0√np0(1− np0)

∼ N(0, 1)

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 5/35

Page 492: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

NV-Approximation der Binomialverteilung:Kontinuitatskorrektur

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 6/35

Page 493: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Beispiel Einseitiges Testen

I Eine Psychologin vermutet, dass weniger als 50% der Frauen,die eine Diat machen, ubergewichtig sind.

I H0: p = 0.50; H1: p < 0.50; α = 0.05

I Verwerfungsbereich:

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 7/35

Page 494: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

I In einer von ihr erhobenen Stichprobe von n = 200 Frauen, diederzeit Diat aus Figurgrunden halten, sind 87 ubergewichtig.

I µ = np = 100, k = 87

I

z =87.5− 100√

200 · 0.50 · 0.50= −1.77

Tab. 1b: P(Z ≤ −1.77) = 0.0384 < α = 0.05 ⇒ H0

verwerfen

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 8/35

Page 495: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Einseitiges Testen

I Verwerfung der H0 zugunsten der H1 mit einem Risiko fureinen Fehler erster Art von 0.0384

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 9/35

Page 496: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Einseitiges Testen

Angenommen, die Psychologin hatte die folgenden Hypothesenformuliert:H0: p = 0.5; H1: p > 0.5Verwerfungsbereich:

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 10/35

Page 497: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

z = −1.77 liegt nicht im Verwerfungsbereich

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 11/35

Page 498: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Beispiel Zweiseitiges Testen

I Angenommen, die Psychologin hatte keine Vermutung in einebestimmte Richtung gehabt und die H1 ungerichtet formuliert:

I H0: p = 0.50; H1: p 6= 0.50; α = 0.05

I Kontrolle des α-Fehlers in beide Richtungen notwendig

I P(Z ≤ −1.77) + P(Z ≥ 1.77) = 0.0384 + 0.0384 = 0.0768 >α = 0.05; Ergebnis liegt noch im Annahmebereich der H0

I Oder aquivalent: nur eine Seite betrachten: α2 = 0.025

I 0.0384 > 0.025;

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 12/35

Page 499: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Fortsetzung

Es konnen bei denselben Daten unterschiedliche Entscheidungenresultieren. Beim einseitigen Testen kommt man eher zu einerVerwerfung der H0

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 13/35

Page 500: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Einseitiges vs. Zweiseitiges Testen

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 14/35

Page 501: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

p-WertI In Statistik-Softwareprodukten wird zusammen mit der

Teststatistik eines statistischen Tests ein sogenannter p-Wertausgegeben

I Der p-Wert gibt die Wahrscheinlichkeit fur den Fehler ersterArt an, also die Wahrscheinlichkeit, eine gultige H0 zuverwerfen aufgrund der beobachteten Daten

I Vorteil des p-Wertes liegt darin, dass bei der Entscheidungkeine Tabelle der Verteilung der Teststatistik benotigt wird

I Wird der zweiseitige p-Wert angegeben und die H1 istgerichtet, muss man den p-Wert durch 2 dividieren und mit αvergleichen.

I Bei einseitigen Hypothesen ist die zusatzliche Uberprufungnotwendig, ob die Teststatistik tatsachlich imVerwerfungsbereich der H0 liegt

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 15/35

Page 502: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

p-WertI SPSS-Beispiel in Datei ’binom.sav’, α = 0.05, B(11, 0.5),

x = 9I H0: p = 0.5, H1: p 6= 0.5, ’Signifikanz’ (zweiseitig!) =

0.065 > α = 0.05 ⇒ H0 wird beibehalten

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 16/35

Page 503: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

p-WertI H0: p = 0.5, H ′

1: p > 0.5, Signifikanz (zweiseitig!) = 0.065⇒, ’Signifikanz’ (einseitig!) = 0.065

2 = 0.0325 < α = 0.05 undTeststatistik liegt im Verwerfungsbereich ⇒ H0 wird verworfen

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 17/35

Page 504: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

p-WertI H0: p = 0.5, H ′′

1 : p < 0.5, Signifikanz (zweiseitig!) = 0.065⇒ ’Signifikanz’ (einseitig!) = 0.065

2 = 0.0325 < α = 0.05,aber Teststatistik liegt nicht im Verwerfungsbereich !!! ⇒ H0

wird beibehalten

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 18/35

Page 505: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Unspezifische H0 bei einseitigem Testen

I Bisher spezifische H0: θ = θ0

I Bei H1: θ < θ0 korrekterweise H0: θ ≥ θ0 (unspezifische H0)

I Kann die H0: θ = θ0 mit einer Irrtumswahrscheinlichkeit αverworfen werden, so kann jede weitere H0: θ > θ0 mit einernoch kleineren Irrtumswahrscheinlichkeit verworfen werden

I Es genugt also, die H1: θ < θ0 an der spezifischen H0: θ = θ0zu testen

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 19/35

Page 506: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Fehler bei statistischen Tests

I α = 0.05 bedeutet: fuhrt man dasselbe Experiment haufigdurch, verwirft man in ca. 5% der Falle die H0 irrtumlich,obwohl sie tatsachlich gilt (Fehler 1. Art oder α-Fehler)

I Man versucht, Wahrscheinlichkeiten fur Fehlentscheidungenzu minimieren, kann sie aber niemals vollig ausschalten

I Statistische Fehler beziehen sich nicht auf unkorrekteVorgangsweise beim Hypothesentesten, sondern aufEntscheidungsfehler. Richtige Prozeduren fuhren zuFehlentscheidungen.

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 20/35

Page 507: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Fehler bei statistischen Tests

I β-Fehler (Fehler 2. Art) = Wahrscheinlichkeit H0

beizubehalten, obwohl sie falsch ist.

I Vergleiche Gerichtsverfahren: Freispruch aus Mangel anBeweisen (Beibehalten der H0: der Verdachtige istunschuldig) bedeutet nicht, dass er mit Sicherheit unschuldigist (β-Fehler). Die Beweise fur seine Schuld waren nichtausreichend

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 21/35

Page 508: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Fehler bei Statistischen Tests

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 22/35

Page 509: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Statistische Fehler

I Je kleiner α, umso kleiner der Fehler 1. Art (H0 irrtumlich zuverwerfen)

I → α moglichst klein wahlen, z.B. α = 0.001?

I Entscheiden fur Signifikanzniveau ist vergleichbar mit demAbschluss einer Versicherung. Umso besser derVersicherungsschutz gegen einen α-Fehler, umso hoher dieKosten.

I Was sind die Kosten eines kleinen Signifikanzniveaus?

I Großerer Fehler 2. Art (β-Fehler = H0 irrtumlichbeizubehalten) und geringere Teststarke 1− β (Macht oderPower = Wahrscheinlichkeit, H0 zugunsten einer H1 zuverwerfen, wenn tatsachlich H1 gilt)

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 23/35

Page 510: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Beziehungen zwischen Statistischen Fehlern - 1

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 24/35

Page 511: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Beziehungen zwischen Statistischen Fehlern - 2

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 25/35

Page 512: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Richtige und falsche Entscheidungen

Reale SituationH0 H1

Ergebnis d. verworfen Fehler 1. Art Richtige E.Hypothesen- H0 α Macht, 1− β

tests beibehalten Richtige E. Fehler 2. Art1− α β

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 26/35

Page 513: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Dilemma

I Versicherung gegen α-Fehler hat die Kosten eines hoherenβ-Fehlers und geringerer Macht des Tests

I Versicherung gegen β-Fehler hat die Kosten eines hoherenα-Fehlers

I Kompromiss in der Praxis: α = 0.05 oder α = 0.01 jenachdem, welchen Fehler man eher riskieren mochte

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 27/35

Page 514: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Macht eines Tests (Teststarke)

I 1− β ist die Wahrscheinlichkeit dafur, dass ein statistischerTest zugunsten einer H1 entscheidet, wenn diese gilt (d.h. dieH0 richtigerweise zu verwerfen)

I Die Teststarke hangt von verschiedenen Faktoren ab:I Signifikanzniveau αI Ein- oder zweiseitige Alternativhypothese (bei einseitiger H1

hoher)I Große des UnterschiedesI Streuung der Variable X in der PopulationI Stichprobenumfang nI Verwendeter statistischer Test: je hoher der verwendete

Informationsgehalt der Daten, umso hoher seine Macht

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 28/35

Page 515: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Teststarke und Große der Unterschiede

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 29/35

Page 516: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Teststarke und Populationsstreuung

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 30/35

Page 517: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Teststarke und Stichprobenumfang

I Beispiel: Binomialtest mit NV-Approximation, Anteil derubergewichtigen Frauen

I Stichprobengroße n = 2000 Frauen (statt n = 200), gleicherAnteil wie vorher: 43.5% ubergewichtig = 870.

I µ = np = 1000, k = 870

I

z =870.5− 1000√

2000 · 0.50 · 0.50= −5.79

zum Vergleich z = −1.77 bei n = 200

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 31/35

Page 518: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Statistische Signifikanz und praktische Relevanz

I Mit genugend großem Stichprobenumfang kann man praktischjede H0 verwerfen

I Festlegung einer Effektgroße ε (z.B. praktisch relevanterUnterschied) und einer spezifischen H1

I Muss aufgrund inhaltlicher Uberlegungen vor Datenerhebungfestgelegt werden

I Vorteil: notwendiger Stichprobenumfang, der bei gegebenemα, gewunschtem 1− β und bestimmter Effektgroße eineeindeutige Entscheidung ermoglicht, bestimmbar

I Tabellen bzw. Computerprogramme im Internet (z.B. GPowervon Erdfelder, Faul & Buchner, 1996).

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 32/35

Page 519: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Kumulierung des α-Fehlers

I Fuhrt man mehrere statistische Tests durch, hat man beijedem dieser Tests das Risiko eines α-Fehlers

I Angenommen, jemand fuhrt drei statistische Tests durch umeine Hypothese zu prufen

I Selbst bei Annahme der Unabhangigkeit der einzelnen Testsware Wahrscheinlichkeit, dass mindestens 1 Test signifikantwird = 1 − (Wahrscheinlichkeit kein Test signifikant) =1− (1− 0.05)3 = 0.14

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 33/35

Page 520: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Kumulierung des α-Fehlers

I Fuhrt man k unabhangige statistische Tests zur Uberprufungeiner H0 durch, kommt es zu einer Kumulierung des α-FehlerRisikos α′ = 1− (1− α)k

I Lasst es sich nicht vermeiden, mehrere statistische Tests zurPrufung einer Hypothese durchzufuhren, muss eine α-FehlerKorrektur vorgenommen werden

I α-Fehler Adjustierung: αadj = 1− (1− α)1/k

I 3 Tests: αadj = 1− (1− 0.05)1/3 = 0.017

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 34/35

Page 521: Statistik

Statistische Tests II

Ein- und zweiseitige HypothesenStatistische FehlerTestmacht (Power)Kumulierung des α-FehlersDarstellung des Ergebnisses

Darstellung des Ergebnisses

I Voraussetzung: Formulierung der H0 und H1, Angabe von α,Stichprobenbeschreibung

I Angabe des p-Wertes

I Angabe der Teststatistik (+ df wo notig)

I ev. Teststarke und Effektgroße

I Korrekte Formulierung bei nicht-signifikantem Ergebnis: ’H0

wird beibehalten’; Formulierung, ’H0 wurde bewiesen’, istfalsch

I Falsche Interpretationen:I ’Je kleiner der p-Wert, umso großer der Effekt.’ Der p-Wert ist

keine Effektgroße.I ’Der p-Wert gibt die Wahrscheinlichkeit fur das Zutreffen der

H0 an.’ Der p-Wert ist die P(beobachtetesErgebnis|H0).

Christodoulides / Waldherr Einfuhrung in Quantitative Methoden- 11 .VO 35/35

Page 522: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Einfuhrung in Quantitative Methoden

Karin Waldherr & Pantelis Christodoulides

8. Juni 2011

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 1/42

Page 523: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter

Anpassungstests allgemein

I Gegeben: Haufigkeitsverteilung der Variable X in einerStichprobe aus bestimmter Population (empirische Verteilung)

I Unbekannt: Verteilungsfunktion der Variable X , F (x), in derPopulation

I Nullhypothese spezifiziert theoretische (erwartete) VerteilungF0(x) (z.B. Gleichverteilung, Normalverteilung)

I H0: F (x) = F0(x) gegen H1: F (x) 6= F0(x)

I Anpassungstest pruft, ob Stichprobe aus Population stammt,in welcher X die Verteilung F0(x) aufweist

I Abweichung empirische - theoretische Verteilung, d.h.Vergleich der empirisch beobachteten Haufigkeiten derAuspragungen von X mit theoretisch erwarteten Haufigkeiten,wenn H0 gilt

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 2/42

Page 524: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter

χ2-Anpassungstest

I Variable X mit j = 1, . . . , k Auspragungen

I fj = beobachtete Haufigkeiten in der Stichprobe, ej =erwartete Haufigkeiten unter H0

k∑j=1

(fj − ej)2

ejasympt. χ2 − verteilt mit df = k − 1

I Empirische und theoretische Verteilung ident ⇒ χ2 → 0

I Abweichungen groß ⇒ χ2 →∞I H0 verworfen, wenn χ2 im Verwerfungsbereich: χ2 > χ2

(df ;1−α)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 3/42

Page 525: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter

Erklarung Freiheitsgrade: Summe der Haufigkeiten muss mitStichprobenumfang identisch sein. Bei k Auspragungen durfen nurbei k − 1 Auspragungen die Haufigkeiten frei variieren.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 4/42

Page 526: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter

Beispiel 1: Gleichverteilung

I Ist erstmaliges Auftreten von Depressionen gleich verteilt aufdie vier Jahreszeiten?

I H0: Gleichverteilung; H1: keine Gleichverteilung; α = 0.05

I n = 100 Personen mit Depression

I Erwartete Haufigkeiten:

ej =n

k=

100

4= 25

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 5/42

Page 527: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter

Beispiel 1: Gleichverteilung

I

Fruhling Sommer Herbst Winter∑

fj 21 19 27 33 100ej 25 25 25 25 100

I

χ2 =k∑

j=1

(fj − ej)2

ej=

(21− 25)2

25+

(19− 25)2

25+

+(27− 25)2

25+

(33− 25)2

25=

= 0.64 + 1.44 + 0.16 + 2.56 = 4.8

I df = 3, χ2(3;0.95) = 7.82 (Tab. 3)

I 4.8 < 7.82 ⇒ χ2 = 4.8 gehort nicht zu den 5% derextremsten Falle unter H0 ⇒ H0 beibehalten.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 6/42

Page 528: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter

χ2-Anpassungstest mit SPSSI Menu AnalysierenI Nichtparametrische TestsI Chi-Quadrat . . .

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 7/42

Page 529: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter

SPSS-Output χ2-Test

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 8/42

Page 530: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter

Voraussetzungen fur χ2-Test

I Jede Person muss eindeutig einer Merkmalsauspragungzuordenbar sein

I Beobachtungen mussen voneinander unabhangig sein

I Eintragungen mussen absolute Haufigkeiten sein

I Approximation der Prufgroße an χ2-Verteilung ausreichend,wenn mind. 80% der ej ≥ 5 und kein ej kleiner 1.

I Fur alle Verteilungen geeignet

I Bei stetigen Verteilungen mussen Merkmalsauspragungen zuKlassen zusammengefasst werden

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 9/42

Page 531: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter

Beispiel 2: beliebige Verteilung

I Laut Statistik der Wiener Gebietskrankenkasse aus dem Jahr2009 verteilten sich vier bestimmte psychiatrische DiagnosenA,B,C,D im Verhaltnis A:B:C:D=4:3:2:1.

I Eine Diplomandin erhebt eine Stichprobe von 320 Personen,die wegen einer dieser vier psychiatrischen Erkrankungen inBehandlung sind.

I Die vier Diagnosen verteilen sich in ihrer Stichprobeprozentmaßig folgendermaßen:

I Diagnose A: 45%I Diagnose B: 25%I Diagnose C: 15%I Diagnose D: 15%

I Entspricht die Verteilung der vier Diagnosen in ihrerStichprobe jener in der Population?

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 10/42

Page 532: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter

Beispiel 2 Fortsetzung

I H0: F (x) = F0(x) = 4 : 3 : 2 : 1; H1: F (x) 6= F0(x)I Erwartete Haufigkeiten:

I Diagnose A: 320 : 10 × 4 = 128I Diagnose B: 320 : 10 × 3 = 96I Diagnose C: 320 : 10 × 2 = 64I Diagnose D: 320 : 10 × 1 = 32

I Beobachtete Haufigkeiten:I Diagnose A: 45% von 320 = 144I Diagnose B: 25% von 320 = 80I Diagnose C: 15% von 320 = 48I Diagnose D: 15% von 320 = 48

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 11/42

Page 533: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter

Beispiel 2 Fortsetzung

I Erwartete und beobachtete HaufigkeitenDiagnose A Diagnose B Diagnose C Diagnose D

∑ej 128 96 64 32 320

fj 144 80 48 48 320I

χ2 =(144− 128)2

128+

(80− 96)2

96+

(48− 64)2

64+

(48− 32)2

32=

= 16.67

I df = 3, χ23;0.95 = 7.82 ⇒ Nullhypothese verwerfen

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 12/42

Page 534: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter

Kolmogorov-Smirnov-Test (K-S-Test)

I Theoretische Verteilung stetig; bei diskreten Verteilungenanwendbar, jedoch weniger Macht

I ”Standardverfahren” zur Prufung auf NV

I Fur kleine Stichproben besser geeignet als χ2-Test, da dieserapproximativ und K-S exakt

I Basiert auf maximalem Abstand zwischen empirischerVerteilungsfunktion (kumulierte Haufigkeitsverteilung) underwarteter Verteilungsfunktion F0(x) (z.B. Normalverteilung)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 13/42

Page 535: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter

Signifikanzkorrektur nach Lilliefors

I Zwei Falle:

1. spezifische NV: H0: Variable X ist in der Population NV mitParametern µ0 und σ0 (z.B. BMI bei Wiener FrauenN(20.64,2.31)-verteilt)

2. unspezifische NV: H0: Verteilung der Variable X in derPopulation ist eine NV (irgendeine NV, mit nicht festgelegtenParametern)

I Bei Fall 2 werden x bzw. s2 aus der Stichprobe als Schatzungfur µ bzw. σ2 verwendet.

I Sind µ und σ2 der theoretischen Verteilung nicht bekannt undmussen aus Stichprobe geschatzt werden, ist K-S-Test sehrkonservativ (d.h. H0 wird zu lange beibehalten) → Korrekturdes kritischen Wertes (Lilliefors, 1967).

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 14/42

Page 536: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter

K-S-Test mit Korrektur nach Lilliefors in SPSSI Menu AnalysierenI Deskriptive Statistiken . . .I Explorative Datenanalyse . . .I Schaltflache Diagramme

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 15/42

Page 537: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter

SPSS-Output K-S-Test mit korrigierten kritischen Wertennach Lilliefors

”originaler” K-S-Test ohne Korrektur nach Lilliefors fur nichtbekanntes µ und σ) ⇒ konservativer, H0 wird langer beibehalten

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 16/42

Page 538: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter

Ein-Stichproben-t-Test

I Hypothesen uber µ einer normalverteilten Variable, wobei σ2

unbekanntI Mogliche Hypothesen:

I H0: µ = µ0; H1: µ 6= µ0

I H0: µ ≤ µ0; H1: µ > µ0

I H0: µ ≥ µ0; H1: µ < µ0

I Pruft anhand des Mittelwerts einer Stichprobe ob derErwartungswert in der entsprechenden Grundgesamtheit gleicheinem vorgegebenen Wert ist (dem unter H0 erwarteten µ0).

I Vergleich eines Stichprobenmittelwertes mit einemhypothetischen Populationsparameter µ0.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 17/42

Page 539: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter

Ein-Stichproben-t-Test: Beispiel 1

I Weicht der Mittelwert einer Zufallsstichprobe aus dem Iran,xI , in einem in Osterreich entwickelten sprachfreienIntelligenztest signifikant vom Populationsparameter inOsterreich, µA = 100, ab?

I n = 108, Testpunkte normalverteilt, xI = 99.32, sI = 4.03,

I H0: µI = 100; H1: µI 6= 100; α = 0.05

I Teststatistik:

T =X − µ

σ√n

∼ t(n−1)

t =99.32− 100

4.03√108

= −1.75

df = 107, t120;0.975 = 1.98 1.75 < 1.98 ⇒ H0 beibehalten

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 18/42

Page 540: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter

Ein-Stichproben-t-Test mit SPSS

I Menu Analysieren

I Mittelwerte vergleichen

I T-Test bei einer Stichprobe . . .

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 19/42

Page 541: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter

SPSS-Output Ein-Stichproben-t-Test

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 20/42

Page 542: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter

Ein-Stichproben-t-Test: Beispiel 2I Stichprobe von n = 36 Schulern mit Unterricht in

Darstellender Geometrie (DG)I Raumvorstellungstest normiert in Population auf µ = 100I Es soll die Hypothese gepruft werden, dass Erwartungswert bei

Schulern mit DG-Unterricht hoher.I H0: µDG ≤ µ; H1: µDG > µ; α = 0.05I xDG = 101.32, sDG = 4.15I NV gegeben ⇒ Ein-Stichproben-t−Test

t =101.32− 100

4.15√36

= 1.91

df = 35, t30;0.95 = 1.70, t40;0.95 = 1.68I Richtung stimmt: unter H1 positiver t-Wert erwartet;

1.91 > 1.69 ⇒ H0 verworfen: Schuler mit DG-Unterrichthaben uberdurchschnittliche Testleistungen.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 21/42

Page 543: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter

SPSS-Output

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 22/42

Page 544: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter

Hypothesen uber p einer B(n, p)

I Binomialtest exakt oder mit NV-Approximation (vgl. letzteVO)

I H0: p = p0; H1: p 6= p0 bzw.

I H0: p ≤ p0; H1: p > p0 oder H0: p ≥ p0, H1: p < p0

I Voraussetzungen fur NV-Approximation der BV gegeben:µ = np, σ2 = np(1− p) → Teststatistik:

Z =K − µσ

=K − np0√

np0(1− np0)∼ N(0, 1)

I Voraussetzung fur NV-Approximation der BV nicht gegeben:

P(k|n, p) =

(n

k

)pk(1− p)n−k

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 23/42

Page 545: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Testen von VerteilungsannahmenTesten von Hypothesen uber Populationsparameter

Ein-Stichproben-Verfahren im Uberblick

Test Prufbare Hypothesen / Voraussetzungen

χ2-Anpassungstest Testen von Verteilungsannahmenalle Verteilungen prufbarabsolute Haufigkeiten

Kolmogorov-Smirnov-Test Testen von Verteilungsannahmeninsbesondere stetige Verteilungen (NV)

Ein-Stichproben-t-Test Vergleich eines x mit µ einer NV (µ, σ2)σ2 unbekannt, NV

Binomialtest exakt Hypothesen uber p einer B(n, p)NV-Approximation nicht moglich

Binomialtest NV-App. Hypothesen uber p einer B(n, p)NV-App. moglich (np und n(1− p) ≥ 5)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 24/42

Page 546: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ

Unabhangige vs. abhangige Stichproben

I Abhangige Stichproben: die Elemente der zwei Stichprobenkonnen einander paarweise zugeordnet werden, weilbeispielsweise die gleichen Personen zwei Mal befragt wurden(Messwiederholungen), es sich um Paare handelt(Geschwisterpaare, Ehepaare,..), oder die Personen aufgrundeines oder mehrerer Variablen parallelisiert wurden (z.B.aufgrund eines Vortests werden je zwei Personen mit gleicherPunktezahl zu Paaren zusammengefasst).

I Unabhangige Stichproben: es besteht kein Zusammenhang(keine Beziehung) zwischen den Elementen der Stichproben.Werte in der einen Stichprobe erlauben keine Vorhersage uberWerte in der anderen Stichprobe (unkorreliert). Z.B.: zufalligeZuteilung von Personen in VG und KG; Zufallsstichproben auszwei unterschiedlichen Populationen, z.B. Frauen und Manner(wobei es sich nicht um Paare handeln darf).

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 25/42

Page 547: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ

Vergleich zweier Varianzen: F -Test

I Unterscheiden sich die Varianzen zweier unabhangigerStichproben aus normalverteilten Grundgesamtheiten?

I H0,1: σ21 = σ2

2; H1,1: σ21 6= σ2

2

I H0,2: σ21 ≤ σ2

2; H1,1: σ21 > σ2

2

I H0,3: σ21 ≥ σ2

2; H1,3: σ21 < σ2

2

I Prufgroße:

F =σ2

1

σ22

df1 = n1 − 1, df2 = n2 − 1

I Voraussetzungen: NV in jeder Population

I Achtung! Großere Varianz muss im Zahler stehen!

I H0,1: σ21 = σ2

2 wird verworfen, wenn F > F(df1,df2,1−α/2)

I H0,2 und H0,3 werden verworfen, wenn F > F(df1,df2,1−α)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 26/42

Page 548: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ

F -Test - Beispiel 1

I Im Rahmen eines Experimentes hort die Versuchsgruppewahrend der Bearbeitung eines GedachtnistestsHintergrundmusik, die Kontrollgruppe bearbeitet den Testohne Hintergrundmusik. Streuen die Testleistungen der beidenBedingungen unterschiedlich stark?

I H0: σ2VG = σ2

KG ; H1: σ2VG 6= σ2

KG ; α = 0.05

I s2VG = 8.5, s2

KG = 4.7, nVG = nKG = 50, NV der Daten injeder Gruppe

F =8.5

4.7= 1.81 df1 = 49, df2 = 49

I Tabelle 4b: F50;50;0.975 = 1.75 < 1.81 ⇒ H0 wird verworfen

I Die Varianzen sind unterschiedlich.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 27/42

Page 549: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ

F -Test - Beispiel 2

I Im Rahmen eines Experimentes erhalt die VG einKonzentrationstraining, die KG erhalt kein Training.Anschließend bearbeiten beide Gruppen einenKonzentrationstest. Der Versuchsleiter vermutet, dass dieLeistungen in der VG homogener sind.

I H0: σ2VG ≥ σ2

KG ; H1: σ2VG < σ2

KG ; α = 0.05

I s2KG = 10.2, s2

VG = 5.9, nVG = 40, nKG = 60, NV der Datenin jeder Gruppe

F =10.2

5.9= 1.73 df1 = 59, df2 = 39

I Tabelle 4a: F50;40;0.95 = 1.66 < 1.73 ⇒ H0 wird verworfen

I Die Leistungen der Versuchsgruppe streuen weniger.

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 28/42

Page 550: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ

t-Test fur unabhangige Stichproben mit gleichen Varianzen

I Unterscheiden sich die Mittelwerte zweier unabhangigerStichproben aus normalverteilten Grundgesamtheitensignifikant voneinander?

I Stammen die beiden Stichproben aus zwei Populationen, indenen das Merkmal X identisch normalverteilt ist?

I Ungerichtete Hypothese:I H0: µ1 = µ2 bzw. µ1 − µ2 = 0 und σ1 = σ2 = σI H1: µ1 6= µ2 bzw. µ1 − µ2 6= 0 und σ1 = σ2 = σ

I Gerichtete Hypothese z.B.:I H0: µ1 ≤ µ2 bzw. µ1 − µ2 ≤ 0 und σ1 = σ2 = σI H1: µ1 > µ2 bzw. µ1 − µ2 > 0 und σ1 = σ2 = σ

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 29/42

Page 551: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ

t-Test fur unabhangige Stichproben

I Zieht man aus 2 normalverteilten Populationen, N(µ1, σ21)

und N(µ2, σ22), immer wieder zwei voneinander unabhangige

Stichproben ⇒ Verteilung der Differenzen derStichprobenmittelwerte = Normalverteilung

N(µ(X1−X2), σ2(X1−X2)

) = N(µ1 − µ2,σ2

1n1

+σ2

2n2

)

I Wegen Reproduktionseigenschaft der NV

I X1 − X2 = X1 + (−X2)

I µ(X1−X2) = µ1 + (−µ2) = µ1 − µ2 (Erwartungswert einerDifferenz = Differenz der Erwartungswerte)

I Ist µ1 = µ2, sind die Differenzen normalverteilt mitµ(X1−X2) = 0

I σ2(X1 − X2) = σ2(X1) + σ2(−X2) = σ2(X1) + σ2(X2)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 30/42

Page 552: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ

Streuung der Mittelwertsdifferenz σ(x1−x2)

I Standardfehler des Mittelwertes (vgl. VO vom 9.1.08, Folie32)

σx =

√σ2

n

I Standardfehler der Mittelwertsdifferenz

σ(x1−x2) =

√σ2

1

n1+σ2

2

n2

I Bei σ21 = σ2

2 = σ2

σ(x1−x2) =

√σ2

(1

n1+

1

n2

)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 31/42

Page 553: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ

t-Test fur unabhangige Stichproben

I Abweichung (x1 − x2)− (µ1 − µ2) in Relation zur Streuungder Mittelwertsdifferenz (= Standardfehler derMittelwertsdifferenz)

(x1 − x2)− (µ1 − µ2)

σ(x1−x2)∼ N(0, 1)

I Unter H0: µ1 − µ2 = 0 ⇒

x1 − x2

σ(x1−x2)∼ N(0, 1)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 32/42

Page 554: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ

Varianzschatzung innerhalb

I Populationsvarianz nicht bekannt ⇒ Schatzung ausStichproben

I Beste Schatzung: gewichtete mittlere Varianzschatzung

I Varianzschatzung innerhalb (der Stichproben)

σ2 =(n1 − 1)σ2

1 + (n2 − 1)σ22

(n1 − 1) + (n2 − 1)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 33/42

Page 555: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ

Warum Varianzschatzung innerhalb?I Unter H1 beide Stichproben normalverteilt mit gleichem σ,

aber unterschiedlichen MittelwertenI Wurde man die Stichproben zu einer einzigen zusammenfassen

und die Varianz berechnen, entstunde eine zweigipfeligeVerteilung und man erhielte eine großere Varianz

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 34/42

Page 556: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ

Standardfehler der Mittelwertsdifferenz

I Standardfehler der Mittelwertsdifferenz bei σ21 = σ2

2 = σ2

σ(x1−x2) =

√σ2

(1

n1+

1

n2

)I Schatzung des Standardfehlers der Mittelwertsdifferenz

σ(x1−x2) =

√(n1 − 1)σ2

1 + (n2 − 1)σ22

(n1 − 1) + (n2 − 1)

(1

n1+

1

n2

)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 35/42

Page 557: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ

Prufgroße t

I

t =x1 − x2√

(n1−1)σ21+(n2−1)σ2

2(n1−1)+(n2−1)

(1n1

+ 1n2

) df = n1 + n2 − 2

I Zweiseitige H0 wird verworfen, wenn |t| > t(df ;1−α/2)

I Einseitige H0 wird verworfen, wenn Abweichung in dieerwartete Richtung und |t| > t(df ;1−α)

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 36/42

Page 558: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ

t-Test - Voraussetzungen

I Unabhangige Stichproben

I Metrische Variable

I Normalverteilung in beiden Populationen

I Homogene Varianzen → F -Test

I Sind Voraussetzungen fur t-Test erfullt, ist er der machtigsteTest zum Vergleich zweier unabhangiger Stichproben

I Ist eine (oder mehrere) der Voraussetzungen nicht erfullt, liegtkeine t-Verteilung vor, das reale α entspricht nicht demvorgegebenen α und es kommt zu Fehlentscheidungen

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 37/42

Page 559: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ

t-Test - Beispiel

I Es soll uberpruft werden, ob zusatzliches autogenes Trainingeinen positiven Effekt bei der Behandlung von Depressionenhat. Klassischer Zwei-Gruppen-Versuchsplan: eine Gruppe vonPatientinnen erhalt nur die konventionelle Therapie (KG), einezweite Gruppe erhalt zusatzlich autogenes Training (VG).Operationalisierung des Effekts der Therapien: Scoredifferenz(vorher minus nachher) in einem Depressionsfragebogen.

I H0: µVG ≤ µKG , σ2VG = σ2

KG

I H1: µVG > µKG , σ2VG = σ2

KG

I VG: xVG = 7.22, s2VG = 6.12, n = 53

I KG: xKG = 4.91, s2KG = 6.54, n = 51

I NV gegeben, α = 0.05

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 38/42

Page 560: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ

t-Test - Beispiel

I Homogenitat der Varianzen: H0: σ21 = σ2

2, H1: σ21 6= σ2

2

F =6.54

6.12= 1.07 df1 = 50, df2 = 52

Tabelle 4b: F50;50;0.975 = 1.75 > 1.07 ⇒ H0 wird beibehalten,Varianzen sind homogen

I

t =7.22− 4.91√

52·6.12+50·6.5452+50

(1

52 + 150

) = 4.64, df = 102

Tabelle 3: t102;0.95 = 1.66 < 4.64 ⇒ H0 verworfen, Ergebnisspricht dafur, dass autogenes Training zusatzlichen Effekt hat

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 39/42

Page 561: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ

t-Test fur unabhangige Stichproben mit SPSSI Es soll uberpruft werden, ob sich die beiden Gruppen (mit vs.

ohne autogenes Training) bezuglich Alter unterscheiden.I H0: µ1 = µ2, σ1 = σ2; H1: µ1 6= µ2, σ1 = σ2; α = 0.05

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 40/42

Page 562: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ

t-Test fur unabhangige Stichproben mit SPSS

I Menu Analysieren

I Mittelwerte vergleichen

I T-Test bei unabhangigen Stichproben . . .

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 41/42

Page 563: Statistik

Verfahren fur eine StichprobeVerfahren zum Vergleich von zwei unabhangigen Stichproben

Vergleich zweier VarianzenVergleich zweier unabhangiger x bei gleichem σ

t-Test fur unabhangige Stichproben mit SPSS

Waldherr / Christodoulides Einfuhrung in Quantitative Methoden- 12. VO 42/42

Page 564: Statistik

E�ektgröÿen (E�ektstärken)

Einführung in Quantitative Methoden

Pantelis Christodoulides & Karin Waldherr

15. Juni 2011

Pantelis Christodoulides & Karin Waldherr Einführung in Quantitative Methoden 1/10

Page 565: Statistik

E�ektgröÿen (E�ektstärken)

Allgemeines

I Wie groÿ ist der E�ekt (d.h. Ausmaÿ der Wirkung) eines

experimentellen Faktors?

I Ist er bedeutsam oder trivial?

I Ein E�ekt kann statistisch signi�kant sein, obwohl praktisch

nicht relevant.

I Ist der E�ekt in einer Studie gröÿer als in einer anderen?

I Vergleich der Ergebnisse verschiedener Studien im Rahmen

einer sog. Metaanalyse.

I Publication Manual of the American Psychological

Association, 2002: "For the reader to fully understand the

importance of your �ndings, it is almost always necessary to

include some index of e�ect size ... "

Pantelis Christodoulides & Karin Waldherr Einführung in Quantitative Methoden 2/10

Page 566: Statistik

E�ektgröÿen (E�ektstärken)

Allgemeines

I Hängen mit statistischer Signi�kanz insofern zusammen, als

geringe E�ektstärken gröÿere Stichproben erfordern, damit

Ergebnisse signi�kant werden

I Können als Ergänzung zu vielen Verfahren berechnet werden

I E�ektgröÿen zur Planung der Untersuchung (Berechnung der

notwendigen Stichprobe). Entsprechende Vorinformation

notwendig

I Grundsätzlich Einteilung in zwei Arten: Abstandsmaÿe und

Korrelationsmaÿe

I Beide Arten drücken dieselbe Information aus

I Ineinander überführbar

I Besonders bekannt gemacht durch Cohen (1962)

Pantelis Christodoulides & Karin Waldherr Einführung in Quantitative Methoden 3/10

Page 567: Statistik

E�ektgröÿen (E�ektstärken)

Abstandsmaÿe

I Naheliegende E�ektgröÿe für Unterschiede zwischen zwei

Gruppen ist der Abstand zwischen den Mittelwerten

(=Rohscore-E�ektgröÿe)

I Probleme:

1. Verwendung unterschiedlicher Skalen, z.B. Konzentrationstest

mit Scores 1-10 vs. Konzentrationstest mit Scores 50-150

2. Unterschied bezieht sich darauf, wie sehr sich die Verteilungen

der beiden Gruppen nicht überschneiden → abhängig von

Streuung der Messwerte

Pantelis Christodoulides & Karin Waldherr Einführung in Quantitative Methoden 4/10

Page 568: Statistik

E�ektgröÿen (E�ektstärken)

Ein�uss der Streuung

Pantelis Christodoulides & Karin Waldherr Einführung in Quantitative Methoden 5/10

Page 569: Statistik

E�ektgröÿen (E�ektstärken)

Abstandsmaÿe: Cohen's d

I Lösung: Standardisiertes Maÿ, das die relative Gröÿe der

Mittelwertsdi�erenz zwischen zwei Populationen angibt

I

d =µ1 − µ2

σ

I Schätzer:

d =x1 − x2√

σ2

1+σ2

2

2

I Modi�kation für ungleiche Gruppengröÿen: Hedge's g

g =x1 − x2√

σ2

1(n1−1)+σ2

2(n2−1)

n1+n2−2

Pantelis Christodoulides & Karin Waldherr Einführung in Quantitative Methoden 6/10

Page 570: Statistik

E�ektgröÿen (E�ektstärken)

E�ektgröÿe aus t-Wert berechnen

I

g =x1 − x2√

(n1−1)σ2

1+(n2−1)σ2

2

(n1−1)+(n2−1)

t =x1 − x2√

(n1−1)σ2

1+(n2−1)σ2

2

(n1−1)+(n2−1)

(1

n1+ 1

n2

)⇒

g = t

√1

n1+

1

n2

Pantelis Christodoulides & Karin Waldherr Einführung in Quantitative Methoden 7/10

Page 571: Statistik

E�ektgröÿen (E�ektstärken)

Einteilung der E�ektgröÿen nach Cohen

I Schwacher E�ekt: ab d = 0.2 oder r = 0.1

I Mittlerer E�ekt: ab d = 0.5 oder r = 0.3

I Starker E�ekt: ab d = 0.8 oder r = 0.5

I Einteilung beruht auf sozialwissenschaftlichem Usus und auf

durchschnittlich in Studien gefundenen Werten.

Bedeutsamkeit der E�ektgröÿe ist stark vom jeweiligen

Problembereich abhängig.

Pantelis Christodoulides & Karin Waldherr Einführung in Quantitative Methoden 8/10

Page 572: Statistik

E�ektgröÿen (E�ektstärken)

Schwacher E�ekt: d = 0.2

Pantelis Christodoulides & Karin Waldherr Einführung in Quantitative Methoden 9/10

Page 573: Statistik

E�ektgröÿen (E�ektstärken)

Starker E�ekt: d = 0.8

Pantelis Christodoulides & Karin Waldherr Einführung in Quantitative Methoden 10/10