Kategoriale Daten - Persönliche...

59
Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der Fakult¨ at f¨ ur Wirtschaftswissenschaften der Universit¨ at Wien Februar 2015 c , Herbert Nagel

Transcript of Kategoriale Daten - Persönliche...

Page 1: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

Kategoriale Daten

Herbert Nagel

Skriptum zum Kurs Wirtschaftsstatistik 2an der Fakultat fur Wirtschaftswissenschaften

der Universitat Wien

Februar 2015

c, Herbert Nagel

Page 2: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

Inhaltsverzeichnis

1 Kategoriale Daten und Fragestellungen 41.1 Ubersicht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41.2 Was sind kategoriale Daten? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41.3 Aufbau des Skriptums . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.4 Beispiele und Fragestellungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.5 Statistiksoftware fur die Fragestellungen . . . . . . . . . . . . . . . . . . . . . . . . 8

1.5.1 Bearbeitung mit SPSS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81.5.2 Bearbeitung mit R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2 Eine kategoriale Variable 92.1 Numerische und grafische Beschreibung . . . . . . . . . . . . . . . . . . . . . . . . 9

2.1.1 Numerische Beschreibung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92.1.2 Grafische Beschreibung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.2 Anpassungstests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112.2.1 Gleiche Haufigkeiten fur die Kategorien . . . . . . . . . . . . . . . . . . . . 112.2.2 Vorgegebene Haufigkeiten fur die Kategorien . . . . . . . . . . . . . . . . . 152.2.3 Anpassungstest gegen eine Verteilungsfamilie . . . . . . . . . . . . . . . . . 16

2.3 Anteilstests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182.3.1 Anteilstest als Anpassungstest . . . . . . . . . . . . . . . . . . . . . . . . . 182.3.2 Anteilstest uber die Normalverteilung . . . . . . . . . . . . . . . . . . . . . 192.3.3 Exakte Anteilstests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2.4 Konfidenzintervalle fur Anteile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202.4.1 Berechnung der Konfidenzintervalle . . . . . . . . . . . . . . . . . . . . . . 212.4.2 Stichprobenumfang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222.4.3 Konfidenzniveau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

2.5 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

3 Zwei kategoriale Variablen 273.1 Numerische und grafische Beschreibung . . . . . . . . . . . . . . . . . . . . . . . . 27

3.1.1 Numerische Beschreibung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 273.1.2 Grafische Beschreibung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

3.2 Homogenitatstest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293.2.1 Rechentechnik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303.2.2 Beispiel: Verwaltungsgerichtshof . . . . . . . . . . . . . . . . . . . . . . . . 31

3.3 Unabhangigkeitstest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323.4 Kontingenzkoeffizienten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333.5 Mehrstichprobenanteilstest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

3.5.1 Berechnung uber den Homogenitatstest . . . . . . . . . . . . . . . . . . . . 343.5.2 Berechnung uber die Normalverteilung . . . . . . . . . . . . . . . . . . . . . 343.5.3 Exakter Test nach Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

3.6 Veranderungen von Anteilen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 363.6.1 Verbundene Stichproben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

2

Page 3: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

3.6.2 McNemar-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 373.7 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

4 Eine kategoriale Variable als abhangige Variable 414.1 Odds und Odds-Ratio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

4.1.1 Odds (Chancen) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 414.1.2 Odds Ratio (Chancenverhaltnis) . . . . . . . . . . . . . . . . . . . . . . . . 424.1.3 Konfidenzintervall und Test fur das Odds Ratio . . . . . . . . . . . . . . . . 42

4.2 Logistische Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 444.2.1 Methode und Begriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 444.2.2 Eine metrische erklarende Variable . . . . . . . . . . . . . . . . . . . . . . . 464.2.3 Eine kategoriale erklarende Variable . . . . . . . . . . . . . . . . . . . . . . 474.2.4 Mehrere erklarende Variable . . . . . . . . . . . . . . . . . . . . . . . . . . . 514.2.5 Modell mit Wechselwirkung . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

4.3 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

A Literatur 59

3

Page 4: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

Kapitel 1

Kategoriale Daten undFragestellungen

1.1 Ubersicht

Dieser Text gibt eine kurzen Uberblick uber die statistische Behandlung kategorialer Daten.Nach der Besprechung von Methoden fur ein- und zweidimensionale kategoriale Daten wird aufMethoden eingegangen, die mit kategorialen abhangigen Variablen arbeiten.

Bis auf diesen letzten Teil haben die hier vorgestellten Methoden den Vorteil, dass sie nicht sehrrechenintensiv sind, ein Arbeiten nur mit Taschenrechner und Statistiktabellen ist durchausdenkbar. Die Rechenvorgange fur viele Beispiele werden auch Schritt fur Schritt vorgefuhrt.Dennoch wird in allen Phasen auch Output von Statistiksoftware vorgestellt, sowohl von SPSSals auch von R. Damit soll zeitgemaßes statistisches Arbeiten von Beginn an Studierenden nahergebracht werden. Im letzten Kapitel gibt es eine kurze Anleitung, wie die besprochenenMethoden mit beiden Programme umgesetzt werden konnen.

Viele der hier vorgestellten Methoden sind in dem Buch von Brannath, Futschik und Krall, dasam BWZ Verwendung findet, vorgestellt. Dieser Text soll eine breitere Darstellung derdeskriptiven Verfahren und eine Erweiterung um einige Methoden bieten.

An Vorkenntnissen genugen das Wissen aus einer Statistik-Einfuhrung und prinzipielleKenntnisse der linearen Regression.

1.2 Was sind kategoriale Daten?

In der bekannten Einteilung der Skalenniveaus von Stevens (1959) in Nominal-, Ordinal-,Intervall-, Rational- und Absolutskala und der damit verbundenen Einteilung von Merkmalenwerden nominale und ordinale Merkmale (Variable) wie folgt beschrieben:

• nominal: Man kann die Beobachtungen nur in Kategorien einordnen, die Kategorienkonnen aber nicht zahlenmaßig verglichen werden. Die Anordnung der Kategorien istbeliebig.Beispiele: Geschlecht, Beruf, Wohnort, Farbe von Blumen

• ordinal: Man kann die Kategorien in eine sinnvolle Reihenfolge bringen (etwas ist großeroder besser als etwas anderes, man kann aber nicht angeben um wieviel).Beispiele: Guteklassen von Lebensmitteln, militarischer Rang, Likertskalen (stimme volligzu, .. , lehne vollig ab), Schulnoten

Im folgenden Text verstehen wir unter kategorialen Daten solche, die entweder nominal oderordinal skaliert sind.

4

Page 5: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

Daten, die hoher skaliert sind (mindestens Intervallskala), werden meist als metrisch bezeichnet.Diese zeichnen sich dadurch aus, dass die Beobachtungen sinnvoll durch Zahlen codiert werdenkonnen (Beispiele: Alter, Einkommen, Zeit zur Bearbeitung eines Auftrages, etc.).Mitunter entstehen aus metrischen Merkmalen ordinale und damit kategoriale Merkmaledadurch, dass Klassen gebildet werden.

Beispiele:

• Alter: Aus Altersangaben in ganzen jahren wird durch Klassenbildung etwa der Form<20, 20-24, 25-29, .. eine ordinale Altersangabe.

• Einkommen: Einkommensangaben (meist ohnehin nicht sehr genau) von Befragtenwerden meist in Klassen eingeteilt.

• Blutdruck: Einteilung in hoch, normal, niedrig.

Vor allem in der empirischen Sozialforschung (man denke nur an Erhebungen uber Fragebogen)sind kategoriale Variable eher der Normalfall und metrische eine Ausnahme. In Statistikkursenwerden aber metrische Variablen meist in den Vordergrund gestellt (Normalverteilung, Schatzenund Testen von Mittelwerten, etc.).Die Unterscheidung kategoriale - metrische Variable entspricht auch in etwa der Unterscheidungqualitative - quantitative Variable, die ebenfalls in Buchern auftaucht.

1.3 Aufbau des Skriptums

Dieses Skriptum folgt in seinem Aufbau der Komplexitat moglicher Daten.

• Eine kategoriale VariableIn Kapitel 2 beginnen wir mit der Beschreibung von Daten, die nur aus einer kategorialenVariablen bestehen. Danach werden Methoden besprochen, die

• Zwei kategoriale VariablenKapitel 3 widmet sich Fragestellungen, in die zwei kategoriale Variablen eingebunden sind.

• Eine kategoriale Variable als abhangige VariableKapitel 4 fuhrt uber Odds-Ratios zur logistischen Regression, dem statistischen Highlightdieses Skriptums. Als Verallgemeinerung der linearen Regression bindet sie das ThemaWechselwirkung aus der Varianzanalyse mit ein und gestattet auch metrische Variablen alserklarende Variablen.

1.4 Beispiele und Fragestellungen

Im Folgenden werden Beispiele vorgestellt, in denen kategoriale Daten maßgeblich vorkommen.Anhand dieser Beispiele tauchen Fragestellungen auf, die mit Methoden beantwortet werdenkonnen, die in den folgenden Kapiteln behandelt werden.

1. Tourismus

In einem Tourismusort wird unter anderem erhoben, woher die Gaste kommen. Fur Gasteaus dem Inland soll eine Untergliederung in die einzelnen Bundeslander, fur Gaste aus demAusland eine spezielle Aufteilung in die beiden wichtigsten Hauptherkunftslander undrestliche Lander erfolgen.

Wie kann man eine Zusammenfassung uber die moglicherweise sehr umfangreichen Datenerfolgen?

5

Page 6: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

2. Arbeitsaufteilung

In einem Krankenhaus sind Wochenend- und Feiertagsdienste im Allgemeinen nicht sehrbeliebt. Dennoch mussen sie geleistet werden und sollen auch gleichmaßig aufgeteiltwerden. Ein starres Schema kann durch Urlaube, Krankenstande, Karenzen, etc. immerwieder unterbrochen werden, eine flexible Einteilung kann dazu fuhren, dass manche diesesSystem fur sich ausnutzen.

Ist sie Aufteilung der Dienste gleich auf die moglichen diensthabenden Arzte erfolgt?

3. Reprasentativitat einer Meinungsumfrage

Eine Telefonumfrage zu Gesetzen uber Forderungen fur Familien mit Kindern soll an 500Befragten durchgefuhrt werden. Nach 200 Interviews soll eine Uberprufung der Stichprobeerfolgen.

Ist die bisherige Interviewserie so abgelaufen, dass man von einer reprasentativenStichprobe sprechen kann?

4. Sonntagsfrage

Vor Wahlen wird in Meinungsumfragen immer wieder die sog. Sonntagsfrage gestellt. InZeitungen werden die Ergebnisse veroffentlicht und diese Ergebnisse weichen mehr oderweniger stark von einander ab.

Gibt es eine Moglichkeit, Bereiche (Intervalle) zu ermitteln, in denen vermutlich dieStimmenanteile der jeweiligen Parteien liegen, statt nur einzelne Prozentwerte anzugeben?

Kann man uberprufen, ob eine Partei einen gewissen Wert ubersteigen wird?

Unterscheiden sich Frauen und Manner in ihrem Wahlverhalten?

5. Verwaltungsgerichtshof

Bei Berufungen gegen Steuerbscheide kann in 2. Instanz der Verawltungsgerichtshofangerufen werden. Die Vertretung konnen nicht nur Rechtsanwalte ubernehmen sondernseit 1999 auch Wirtschaftsprufer.

Sind die Chancen vor dem VwGH bei Rechtsanwalten besser als bei Wirtschaftsprufern?

6. Einstellung zu Technologien

In einer Umfrage wurde die Einstellung zu mehreren Technologien erhoben, darunter dieNutzung der Atomkraft zur Energiegewinnung und die Nutzung der Gentechnik in derMedizin.

Gibt es einen Zusammenhang in der Einstellung zu den beiden Technologien?

7. Verkaufsfordernde Maßnahmen

In einer Studie zu verkaufsfordernden Maßnahmen soll untersucht werden, ob praktischeArzte eher bereit sind, ein neues Medikament zu verwenden, wenn dieses von einemPharmavertreter oder im Rahmen eines speziellen Abendessens vorgestellt wird.

Um wieviel sind die Chancen hoher, wenn das Medikament bei einem speziellenAbendessen vorgestellt wird?

Wird das Medikament signifikant ofter angewendet, wenn es bei einem speziellenAbendessen angewendet wird?

6

Page 7: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

8. Seltene Krankheit

An zwei Kliniken wurden unterschiedliche Behandlungsmodelle zur Therapie einer seltenenKrankheit entwickelt.

Kann man auf Grund weniger Daten schon schließen, dass mit der einenBehandlungsmethode der Behandlungserfolg hoher als mit der anderen ist?

9. Image von Fernsehsendern

In einer Umfrage im Mai 2008, knapp vor der Fußball-EM in Osterreich und der Schweiz,wurden 229 Personen (mit Kabel-TV- oder Satelliten-TV-Empfang) im Raum Wien zuihrem TV-Sehverhalten befragt.

Ein Teil dieser Umfrage zielte darauf ab, Eigenschaften (aktuell, kritisch, informativ,sensationslustern etc.) von Fernsehsendern herauszufiltern.

10. Prufungschancen

In einem Fach gibt es mehrere Prufer, die nicht alle gleich beliebt bei Studierenden sind.Von mehreren Prufungsterminen wurden die Ergebnisse gesammelt und verglichen.

Sind die Chancen bei den verschiedenen Prufern unterschiedlich?

11. Problemlosen und Intelligenz

Mehreren Personen wird ein nicht allzu schweres mathematisches Ratsel vorgelegt, zudessen Losung 10 Minuten Zeit zur Verfugung stehen. Von den Personen kennt man denIntelligenzquotienten (IQ) und die Beobachtung, ob sie das Ratsel losen konnten.

Kann man aus dem IQ prognostifizieren, ob jemand eine Aufgabe lost?

12. Sonderausstattung bei Autos

Personen verschiedener Altersgruppen wurden um Bewertungen fur Sonderausstattungen(hauptsachlich Klimaanalge) beim Autokauf gebeten.

Hangt die Wichtigkeit der Ausstattung eines Autos mit einer Klimaanlage fur dieEntscheidung beim Autokauf vom Alter der Kaufer ab?

13. Verkehrsmittelwahl

Eine Zufallsstichprobe von 80 Beschaftigten in einem Einkaufszentrum ist in einemDatenfile gegeben. Alle Beschaftigten hatten sowohl Zugriff zu einem Auto als auchvertretbare Fahrzeiten mit offentlichen Verkehrsmitteln. Neben der gewahltenVerkehrsalternative sind weitere, moglicherweise (mit-)bestimmende Variablen gegeben.

Was sind Faktoren, die die Verkehrsmittelwahl fur die Fahrt von und zum Arbeitsplatzbestimmen oder zumindest beeinflussen?

14. Aggression im Straßenverkehr

In einem Feldexperiment wurde folgende Situation herbeigefuhrt: Mit einem“Versuchsfahrzeug“ wurden nachfolgende Autos vor einer Ampel blockiert. Beobachtetwurde das Verhalten (Hupen, etc.) der dadurch blockierten AutofahrerInnen aber auchCharakteristika der Blockeurs und der Blockierten.

Wovon hangt das Verhalten der blockierten AutofahrerInnen ab?

7

Page 8: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

1.5 Statistiksoftware fur die Fragestellungen

Obwohl der reine Rechenaufwand in den Kapiteln 2 und 3 uberschaubar und mit einemeinfachen Taschenrechner ohne Weiteres vertretbar ist, wird in diesem Skriptum auch schon indiesen Kapiteln auf die Verwendung von Statistikpaketen eingegangen. Damit konnen zweiwichtige, nicht sehr schwierige, aber arbeitsintensive Arbeiten delegiert werden:

• Die Auszahlung der Daten nach einer oder mehreren Variablen, die als Ergebnis inTabellen mundet.

• Das Erstellen von Grafiken.

Mit der Besprechung der logistischen Regression im Kapitel 4 verlassen wir dasTaschenrechner-Imperium. An eine handische Berechnung ist nur in Ausnahmefallen zu denken,meist sind die Auswertungen sehr rechenintensiv.

Wir besprechen kurz die beiden Statistikpakete SPSS und R.

Jedes andere Statistikpaket liefert Output, der vielleicht etwas anders gegliedert ist und daherauf den ersten Blick anders ausschaut. Nach kurzer Eingewohnung sollte ein Arbeiten mit diesenPaketen genauso leicht sein.

1.5.1 Bearbeitung mit SPSS

Eine weit verbreitete Statistiksoftware ist SPSS (Statistical Package for Social Sciences). Anvielen Universitaten ist SPSS in PC-Labors und PC-Schulungsraumen installiert, so auch amBWZ. Fur die private Nutzung ist der hohe Preis aber eher abschreckend.In den letzten Jahren sind in immer kurzeren Abstanden neue Versionen von SPSS erschienen.Gravierende Anderungen zu vorhergehenden Versionen sind oft nur im Ausgabeteil (speziell beiGrafiken) zu beobachten und machen ein Offnen solcher Ausgabefiles mit alten Versionen oftunmoglich.SPSS bietet eine komfortable Umgebung im Handling und der Aufbereitung von Daten, in derAuswertung wird man uber Menus bei der Auswahl der gewunschten Methoden unterstutzt.Fur eine genaue Beschreibung, wie SPSS in der Bearbeitung statistischer Fragestellungeneingesetzt werden kann, sei auf Hatzinger/Nagel verwiesen.

1.5.2 Bearbeitung mit R

R ist eine Open Source Implementation und Weiterentwicklung von S, das in den 1970er Jahrenan den Bell Labs entwickelt worden war.

R wird einerseits als Software verwendet, um Statistik anwendungsorientiert in der Lehre zuprasentieren. Andererseits ist R eine flexible Programmiersprache und -umgebung, mit derfortgeschrittene Methoden, die nicht in Standard-Software implementiert sind, fur Auswertungenzuganglich gemacht werden konnen.

In der Anwendung bietet der R Commander eine Hilfe durch Menus. Allgemein ist es abernutzlich, sich uber die wichtigsten Befehle selbst eine Ubersicht zu erarbeiten.

Download von R: Entweder von http://CRAN.R-project.org oder uber Google-Suche nach R.Eine gute Beschreibung fur den Einsatz von R in der Auswertung von Datensatzen nachstatistischen Fragestellungen ist in Hatzinger/Hornik/Maier/Nagel zu finden.

8

Page 9: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

Kapitel 2

Eine kategoriale Variable

2.1 Numerische und grafische Beschreibung

Beispiel: Tourismus

In einem Tourismusort wird unter anderem erhoben, woher die Gaste kommen. Fur Gaste ausdem Inland soll eine Untergliederung in die einzelnen Bundeslander, fur Gaste aus dem Auslandeine spezielle Aufteilung in die beiden wichtigsten Hauptherkunftslander und restliche Landererfolgen. Es liegen Daten von 60465 Gasten vor.

Forschungsfrage: Wie kann man Ubersicht uber den umfangreichen Datensatz gewinnen?

2.1.1 Numerische Beschreibung

Absolute und relative Haufigkeiten

Hier sind sehr viele Beobachtungen vorhanden, die etwa dadurch entstanden sind, dass dieTourismusbetriebe Meldungen an die Gemeinde (oder an eine Tourismusverwaltung) machenmussen. Solche Meldungen konnten die Form haben:

Betrieb Ankunft Abfahrt Nachte Land.. .. .. .. ..Hotel Adler 050707 050714 7 DPension Berger 050707 050721 14 A-W.. .. .. .. ..

Da mehr als 60000 Meldungen vorliegen, waren mehr als 60000 solcher Zeilen (1 Zeile beschreibt1 Beobachtung) zu uberblicken. Wie dieses Beipiel zeigt, ist eine wesentliche Aufgabe die, zueiner Zusammenfassung der Daten zu kommen.Fur die eigentlich gestellte Aufgabe ist nur die letzte Spalte von Interesse, die das Herkunftsland(kategorial) bezeichnet. Eine Zusammenfassung nach Herkunftsland (Auszahlung, Strichliste) isteine gedanklich einfache, vom Aufwand her aber eine sehr muhselige Aufgabe.

Herkunft

A-Rest 16987

A-Wien 7413

Deutschland 21910

Italien 3812

Rest EU 6265

Sonstige 4078

9

Page 10: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

Das ist die Auszahlung in absoluten Haufigkeiten. Naturlich wunscht man sich auch relativeAngaben, entweder in

• relativen Haufigkeiten: das sind Angaben zwischen 0 und 1, die sich uber

relativeH. =absoluteH.inKategorie

Gesamtzahl

berechnen. In Summe ergeben relative Haufigkeiten 1 (bis auf Rundungsfehler).

• Prozent: Angaben liegen zwischen 0 und 100.

Prozent = relativeH.× 100

In Summe ergeben Prozente 100 (bis auf Rundungsfehler).

Angabe

Land absolut relativ Prozent

A-Rest 16987 0.281 28.1

A-Wien 7413 0.123 12.3

Deutschland 21910 0.362 36.2

Italien 3812 0.063 6.3

Rest EU 6265 0.104 10.4

Sonstige 4078 0.067 6.7

Kumulative Haufigkeiten

SPSS gibt bei Haufigkeiten immer eine zusatzliche Spalte aus, die in der deutschen Version mitKumulierte Prozente uberschrieben ist. Diese Spalte ist fur rein nominale Variable sinnlos undsollte nicht in Berichte ubernommen werden. Die Spalte ist nur sinnvoll zu interpretieren, wenndie Variable mindestens ordinal skaliert ist.

Beispiel: Messbesuch

Eine Befragung unter 120 Katholiken uber den Besuch der Sonntagsmesse ergab folgendeTabelle:

Messbesuch absolut Prozent kumuliertjede Woche 18 15.00 15.00gelegentlich 37 30.83 45.83nur bei besonderem Anlass 46 38.33 84.17nie 19 15.83 100.00

Forschungsfrage: Was bedeutet die letzte Spalte?

Die erhobene Variable ist ordinal skaliert, die letzte Spalte daher sinnvoll zu interpretieren (unduberhaupt zu berechnen).Die kumulierten Prozente fur eine spezielle Kategorie ergeben sich aus den Prozenten fur dieseKategorie und zusatzlich den Prozenten aller vorhergehenden Kategorien.

Berechnung etwa fur die Kategorie gelegentlich: 30.83 + 15.00 = 45.83

Die Interpretation dieses Wertes ist: Von der Stichprobe besuchen ca. 46% zumindestgelegentlich die Sonntagsmesse. Also besuchen 54% (100-46) hochstens zu besonderen Anlassendie Sonntagsmesse.

10

Page 11: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

2.1.2 Grafische Beschreibung

Die grafische Beschreibung erfolgt uber Balkendiagramme und/oder Kreisdiagramme. DerenKonstruktion wurde schon in fruheren Kursen besprochen, die Interpretation bereitet keineSchwierigkeiten.Fur die Tourismusdaten sind beide Arten von Diagrammen gegeben:

A−

Res

t

A−

Wie

n

Deu

tsch

l.

Italie

n

Res

t EU

Son

stig

e

Herkunftsland des Gastes

050

0010

000

1500

020

000

A−RestA−Wien

Deutschland

Italien

Rest EU

Sonstige

Herkunftsland des Gastes (n=60465)

Wenn in Tabellen oder Grafiken nur relative Haufigkeiten oder Prozent angegeben werden, solltein der Beschreibung eine Angabe erfolgen, auf wieviel Beobachtungen die Tabelle oder Grafikberuht. Im vorigen Kreisdiagramm (aus den Kreissektoren sind nur relative Haufigkeitenablesbar) ist eine solche Angabe direkt im Titel erfolgt.

2.2 Anpassungstests

2.2.1 Gleiche Haufigkeiten fur die Kategorien

Beispiel: Arbeitsaufteilung

In einem Krankenhaus sind Wochenend- und Feiertagsdienste im Allgemeinen nicht sehr beliebt.Dennoch mussen sie geleistet werden und sollen auch gleichmaßig aufgeteilt werden. Ein starresSchema kann durch Urlaube, Krankenstande, Karenzen, etc. immer wieder unterbrochen werden,eine flexible Einteilung kann dazu fuhren, dass manche dieses System fur sich ausnutzen.

Forschungsfrage: Ist die Diensteinteilung fair?

Die Uberprufung fur ein Jahr - es waren insgesamt 63 Dienste zu besetzen - ergab unter den 6 inFrage kommenden Arzten (nennen wir sie A bis F) eine Aufteilung, die dem folgendenBalkendiagramm entnommen werden kann.

In das Balkendiagramm ist eine Referenzlinie in der Hohe von 10.5 eingezeichnet, das entsprichtder durchschnittlichen Dienstanzahl pro Arzt (63/6 = 10.5).

11

Page 12: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

A B C D E F

Dienstverteilung

abso

lute

Häu

figke

iten

02

46

810

1214

Anpassungstest gegen die Gleichverteilung

Die Forschungsfrage umformuliert: Sind die Abweichungen nur auf Zufalligkeiten einerStichprobe zuruckzufuhren oder sind die Abweichungen so groß, dass man sagen muss, einigeverstehen es besser mit dem System der Diensteinteilung umzugehen als andere?

Subjektiv wird diese Verteilung unterschiedlich bewertet werden, die Statistik bietet fur diesenFall den Chi-Quadrat-Test (χ2-Test) an.

Arzt Anzahl Dienste DurchschnittA 10 10.5B 14 10.5C 8 10.5D 13 10.5E 7 10.5F 11 10.5

Die Teststatistik vergleicht die beobachteten Werte (oj=Anzahl Dienste) mit den erwartetenWerten (ej=durchscnittliche Dienstanzahl) auf folgende Weise:

T =

J∑j=1

(oj − ej)2

ej

Ist diese Abweichung groß, spricht viel dagegen, dass die Kategorien gleich haufig auftreten. Istdie Abweichung klein (nahe bei 0) gibt es keinen ausreichenden Grund, an dieser Annahme zuzweifeln. Die Grenze zwischen großer und kleiner Abweichung bildet das Quantil einer einerχ2-Verteilung.

Allgemeine Vorgangsweise beim χ2-Anpassungstest gegen die Gleichverteilung:

1. H0 : Alle Kategorien (Anzahl = J) kommen gleich haufig vorH1 : Zumindest eine Kategorie unterscheidet sich in ihrer Haufigkeit von einer anderen

2. Wahl des Signifikanzneaus (ublich α = 0.05)

3. Bestimmen des kritischen Wertes:df = J − 1

Q(χ2)df (1− α)

12

Page 13: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

4. Berechnen der beobachteten und erwarteten Haufigkeiten: Fur die beobachtetenHaufigkeiten (oj) bedeutet das, die Auszahlungstabelle zu erstellen.

Die erwarteten Haufigkeiten sind konstant die durchschnittlichen Kategorienhaufigkeiten(ej = N/J).

5. Berechnen der Teststatistik:

T =

J∑j=1

(oj − ej)2

ej

6. Entscheidung:Ist T großer als der kritische Wert, wird H0 verworfen, sonst beibehalten.

Bemerkungen:

• Die Verteilung der Teststatistik ist nur approximativ die χ2-Verteilung. Die Approximationist schlechter je kleiner die erwarteten Haufigkeiten sind; diese sollten nicht viel unter als 5liegen.

• In SPSS ist in einer Fußnote angegeben, wieviel Prozent der Zellen erwartete Haufigkeitenunter 5 haben.

• R bringt eine Warnung am Bildschirm, dass die Approximation moglicherweise nicht gut ist.

Beispiel: Arbeitsaufteilung

Der Anpassungstest fur dieses Beispiel bedeutet Folgendes:

1. H0 : Die Dienstverteilung ist fairH1 : Es gibt Unterschiede in der Dienstverteilung

2. Wahl des Signifikanzneaus α = 0.05

3. Bestimmen des kritischen Wertes: Nachschlagen in einer Tabelle der χ2-Verteilung

df = 6− 1 = 5 ⇒ Q(χ2)5 (0.95) = 11.07

4. Die beoachteten Haufigkeiten sind in der Tabelle schon gegeben, die erwartetenHaufigkeiten sind konstant 63/6 = 10.5.

5. Berechnen der Teststatistik:

T =(10− 10.5)2

10.5+

(14− 10.5)2

10.5+

(8− 10.5)2

10.5+

(13− 10.5)2

10.5+

(7− 10.5)2

10.5+

(11− 10.5)2

10.5= 3.57

6. Entscheidung:Der Wert der Teststatistik ist mit 3.57 kleiner als der kritische Wert von 11.07. DieNullhypothese wird beibehalten. Es gibt keinen Grund, an der Dienstaufteilung zu zweifeln.

Arbeiten mit Programmpaketen

Die Verwendung von Statistik-Programmpaketen wie etwa SPSS oder R erleichtert die Arbeit inmehrfacher Weise. Man benotigt im Allgemeinen weder Taschenrechner noch Tabellen furQuantile verschiedener Verteilungen. Es reicht aus, entsprechende Werte im zum Teil rechtumfangreichen Output zu finden.Fur die Entscheidung fur oder gegen die Alternativhypothese genugt allein der sog. p-Wert(p-value, in SPSS Signifikanzwert oder Signifikanz) genannt.

13

Page 14: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

Die Vorgangsweise mit Programm-Paketen ist wie folgt:

1. H0 : Alle Kategorien (Anzahl = J) kommen gleich haufig vorH1 : Zumindest eine Kategorie unterscheidet sich in ihrer Haufigkeit von einer anderen

2. Wahl des Signifikanzneaus

3. Entscheidung mittels p-Wert:Ist der p-Wert kleiner als das Signifikanzniveau, wird H0 verworfen, sonst beibehalten.

Beispiel: ArbeitsaufteilungDer SPSS-Output zu diesem Beispiel:

• Im der sog. Hauptansicht des Tests ist nur der p-Wert (0.613) und die daraus abzuleitendeEntscheidung in etwas eigenem Deutsch (Nullhypothese behalten) angefuhrt.

EntscheidungSig.TestNullhypothese

1 Nullhypothese behalten.,613Chi-Quadrat-Test

einer Stichprobe

Die Kategorien von Arzt treten mit gleichen Wahrscheinlichkeiten auf.

Übersicht über Hypothesentest

Asymptotische Signifikanzen werden angezeigt. Das Signifikanzniveau ist ,05.

• Genauere Angaben erhalt man aus der sog. Zusatzansicht:

Chi-Quadrat-Test einer Stichprobe

ArztFEDCBA

Häu

fig

keit

14

13

12

11

10

9

8

7

HypotheseBeobachtet

Häufigkeit

Gesamtanzahl

Teststatistik

Freiheitsgrade

Asymptotische Sig. (zweiseitiger Test) ,613

5

3,571

63

1. Es sind 0 Zellen (0%) mit erwarteten Werten kleiner als 5 vorhanden. Der kleinste erwartete Wert ist 10,500.

Nach einer leicht irrefuhrenden Grafik mit beobachteten und erwarteten Haufigkeitenfolgen die numerischen Testresultate: n (63), T (3.571), df (5) und (assymptotischer)p-Wert (0.613).

Die Fußnote gibt an, dass keine erwarteten Haufigkeiten unter 5 liegen.

• Interpretation: Mit 0.613 liegt der p-Wert weit uber jedem Signifikanzniveau. H0 wirdbeibehalten.

14

Page 15: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

2.2.2 Vorgegebene Haufigkeiten fur die Kategorien

Beispiel: Reprasentativitat einer Meinungsumfrage

Eine Telefonumfrage zu Gesetzen uber Forderungen fur Familien mit Kindern soll an 500Befragten durchgefuhrt werden. Nach 200 Interviews wird folgende Zwischenbilanz uber dieVerteilung auf die verschiedenen Familienarten gezogen und mit der Population verglichen(Volkszahlung 2001):

Kategorie absolut Prozent OsterreichEhepaar mit Kindern 103 51.5 44.5Ehepaar ohne Kinder 47 23.5 29.4Nicht eheliche Lebensgemeinschaft mit Kindern 26 13.0 4.5Nicht eheliche Lebensgemeinschaft ohne Kinder 5 2.5 5.6Alleinerzieher 19 9.5 16.0

Forschungsfrage: Ist die bisherige Interviewserie so abgelaufen, dass man von einerreprasentativen Stichprobe sprechen kann?

Anpassungstest gegen eine vorgegebene Verteilung

Der Vergleich der Prozentangaben allein kann zu Kurzschlussen fuhren, bei kleinenStichprobenumfangen konnen schnell große Unterschiede in Prozentwerten auftreten.

Fur einen Vergleich der absoluten Haufigkeiten mit erwarteten Haufigkeiten analog demAnpassungstest vom vorigen Abschnitt fehlen die erwarteten Haufigkeiten. Diese konnen aberleicht berechnet werden, z.B. fur die Kategorie Ehepaar mit Kindern: diese machen 44.5% derFamilienarten aus. 44.5% von 200 Befragten sind 200 · 0.445 = 89. Ahnlich berechnet man dieanderen erwarteten Haufigkeiten. Der Rest verlauft wie beim vorigen Anpassungstest.

Allgemeine Vorgangsweise beim χ2-Anpassungstest gegen eine vorgegebene Verteilung(siehe Brannath/Futschik/Krall Kasten mit Formel (6.10)):

1. H0 : Die Kategorien (Anzahl = J) kommen gemaß einer vorgegebenen Verteilung pj vorH1 : Nicht alle Kategorienhaufigkeiten entsprechen den vorgegebenen Haufigkeiten

2. Wahl des Signifikanzneaus α

3. Bestimmen des kritischen Wertes:df = J − 1

Q(χ2)df (1− α)

4. Berechnen der beobachteten und erwarteten Haufigkeiten: Fur die beobachtetenHaufigkeiten (oj) bedeutet das, die Auszahlungstabelle zu erstellen.

Die erwarteten Haufigkeiten berechnet man uber: ej = n · pj

5. Berechnen der Teststatistik:

T =

J∑j=1

(oj − ej)2

ej

6. Entscheidung:Ist T großer als der kritische Wert, wird H0 verworfen, sonst beibehalten.

15

Page 16: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

Beispiel: Reprasentativitat einer Meinungsumfrage

1. H0 : Die 5 Familienarten entsprechen den Haufigkeiten in der GesamtbevolkerungH1 : Nicht alle Kategorienhaufigkeiten entsprechen den vorgegebenen Haufigkeiten

2. α = 0.05

3. df = 5− 1 = 4 ⇒ Q(χ2)4 (0.95) = 9.49

4. Die beobachteten Haufigkeiten liegen schon vor, die erwarteten Haufigkeiten sind schnellberechnet.

Anteil (pj) Berechnung erwarteter Wert (ej)44.5 200 · 0.445 89.029.4 200 · 0.294 58.84.5 200 · 0.045 9.05.6 200 · 0.056 11.2

16.0 200 · 0.160 32.0

5. Berechnen der Teststatistik:

T =(103− 89)2

89+

(47− 58.8)2

58.8+

(26− 9)2

9+

(5− 11.2)2

11.2+

(19− 32)2

32= 45.39

6. Mit 45.39 ist die Teststatistik großer als der kritische Wert von 9.49, somit wird H0

verworfen. Die Stichprobe ist nicht reprasentativ bezuglich Familienarten.

Zum selben Resultat kommt man naturlich auch mit SPSS oder R.

R-Output:

Chi-squared test for given probabilities

data: famt

X-squared = 45.4, df = 4, p-value = 3.291e-09

Der p-Wert ist sehr klein und wird von R in etwas ungewohnter Form dargestellt:

3.291e− 09 = 3.291 · 10−9 = 0.000000003291.

Das korrespondiert damit, dass der Wert der Teststatistik T = 45.39 weit großer als der kritischeWert 9.49 ist. Es wird also die Nullhypothese verworfen und die Alternativhypotheseangenommen.

2.2.3 Anpassungstest gegen eine Verteilungsfamilie

Beispiel: Uberfalle auf Trafiken

Trafiken, eine speziell osterreichische Institution, sind auch immer wieder Ziele von Uberfallen,die in der Boulevardpresse je nach Saison auslandischen Banden, Drogenabhangigen oderanderen Konzentraten medialen Zorns zugeschrieben werden.Nun sind solche Uberfalle zum Gluck seltene Ereignisse und die Haufigkeiten seltener Ereignissekann oft durch eine Poissonverteilung gut beschrieben werden. Die Tabelle gibt die Auszahlungfur die 53 Kalenderwochen des Jahres 2009 nach der Anzahl der Trafikuberfalle wieder.

Uberfalle in einer Woche 0 1 2 3 4 5 6Haufigkeit 6 10 13 14 4 5 1

Forschungsfrage: Ist die Anzahl von Uberfallen auf Trafiken pro Woche poissonverteilt?

16

Page 17: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

Leicht zu beantworten ware eine leicht geanderte Fragestellung der Art, ob die Anzahl anUberfallen poissonverteilt mit einem Parameter λ = 3 ist. Der Parameter der Poissonverteilungist hier aber nicht fix vorgegeben. Welcher Wert fur λ soll gewahlt werden?

Jener Wert, der am besten zur Stichprobe passt. Bei der Poissonverteilung entspricht λ demErwartungswert der Zufallsvariablen. Eine passende Schatzung fur λ ist derStichprobenmittelwert. Mit dieser Schatzung fur λ konnen wir die Wahrscheinlichkeiten unddaraus die erwarteten Haufigkeiten fur die einzelnen Klassen bestimmen. Danach setzt dieBerechnung der Teststatistik T auf den Werten von 0j und ej auf.

Allerdings wird der kritische Wert nicht aus einer χ2-Verteilung mit df = J − 1 bestimmt,sondern bei den Freiheitsgraden wird die Anzahl Verteilungsparameter p, die aus der Stichprobegeschatzt wurden, berucksichtigt: df = J − p− 1.

Beispiel: Uberfalle auf Trafiken

1. Der Mittelwert in der Stichprobe betragt:

x = (0 · 6 + 1 · 10 + 2 · 13 + 3 · 14 + 4 · 4 + 5 · 5 + 6 · 1) /53 = 2.358

Dieser Wert ist eine Schatzung fur den Parameter λ der Poissonverteilung.

2. Aus rechentechnischen Grunden legen wir die zwei oberen Klassen und die in derStichprobe nicht auftretenden Klasse 7+ zu einer Klasse 5+ zusammen

3. Mit der Schatzung fur λ konnen die Wahrscheinlichkeiten fur die einzelnen Klassen unddaraus die erwarteten Haufigkeiten berechnet werden.

Anzahl (j) 0 1 2 3 4 5+Haufigkeit (oj) 6 10 13 14 4 6pj 0.0946 0.2230 0.2630 0.2068 0.1219 0.0907erwartet (ej) 5.0118 11.8204 13.9391 10.9584 6.4613 4.8090

4. Der Wert der Teststatistik ist eine kleine Rechenubung:

T =(6− 5.0118)2

5.0118+

(10− 11.8204)2

11.8204+ · · · = 2.615

5. Wir haben einen Parameter aus der Stichprobe geschatzt, also ist df = 6− 1− 1 = 4 und

der kritische Wert ist Q(χ2)4 (0.95) = 9.49.

6. Das Ergebnis ist nicht signifikant. Die Trafikuberfalle pro Tag sind also poissonverteilt.

Diesem Schema folgen auch Tests auf andere Verteilungen (Binomial-, Normalverteilung, ..). Dienicht vorgegebenen Parameter mussen aus der Stichprobe geschatzt werden, deren Anzahl mussbei der Bestimmung des kritischen Werts berucksichtigt werden.

17

Page 18: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

2.3 Anteilstests

Beispiel: Sonntagsfrage

In regelmaßigen Abstanden tauchen Ergebnisse von Meinungsumfragen zur sog. Sonntagsfrageauf. Im hypothetischen Land Demokrastan hat eine Meinungsumfrage vier Wochen vor der Wahlfolgendes Ergebnis gebracht:

Partei absolut ProzentAP 185 37.0BP 162 32.4CP 106 21.2DP 47 9.4

500 100.0

Naturlich sind diese Anteile abhangig von der konkreten Stichprobe (hier n=500). Kann mantrotzdem schon Aussagen uber die Grundgesamtheit treffen?

Forschungsfragen:Die AP hatte bei der letzten Wahl 35% erreicht. Kann man aufgrund der Umfrage mit einerAnderung rechnen?Die DP hofft nach dieser Umfrage, sicher uber der 5%-Marke zu liegen. Kann sie das wirklich?

Im Prinzip sind beide Fragestellungen gleich, einmal wird AP gegen die Grenze von 35% gepruft,das andere ist es DP mit der Grenze von 5%.Fragestellungen dieser Art konnen mit einer schon bekannten Methode (Anpassungstest)beantwortet werden. Es wird aber noch ein weiteres Verfahren vorgestellt, das auf derApproximation der Binomialverteilung durch die Normalverteilung basiert.

2.3.1 Anteilstest als Anpassungstest

Die Methode mittels Anpassungstest wird an der Frage zu AP demonstriert. Es werden zweiKategorien gebildet: AP einerseits und alle restlichen Parteien andererseits. Unter der H0, dasssich fur AP keine Anderung ergeben wird, kann man leicht die erwarteten Haufigkeitenberechnen. Der Rest ist schon fast Schablone.

Kategorie absolut(oj) Prozent unter H0 erwartete H (ej)AP 185 35.0 500 · 0.35 = 175Rest 315 65.0 500 · 0.65 = 325

1. H0 : Der Anteil fur AP betragt 35%H1 : Der Anteil weicht von 35% ab (also zweiseitige Fragestellung).

2. α = 0.05

3. Bestimmen des kritischen Wertes: df = 2− 1 = 1 ⇒ Q(χ2)1 (0.95) = 3.84

4. Die beobachteten Haufigkeiten sind 185 und 315, die erwarteten Haufigkeiten wurden mit175 und 325 berechnet.

5. Berechnen der Teststatistik:

T =(185− 175)2

175+

(315− 325)2

325= 0.879

6. Der Wert der Teststatistik (0.879) ist kleiner als der kritische Wert (3.84).H0 wird somit beibehalten.

18

Page 19: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

SPSS-Output:

SPSS liefert zunachst nur die sog. Hauptansicht, interessanter ist jedoch die sog. Zusatzansicht

mit mehr Details zum Test.

Chi-Quadrat-Test einer Stichprobe

ParteiRestAP

Häu

fig

keit

350

300

250

200

150

HypotheseBeobachtet

Häufigkeit

Gesamtanzahl

Teststatistik

Freiheitsgrade

Asymptotische Sig. (zweiseitiger Test) ,348

1

,879

500

1. Es sind 0 Zellen (0%) mit erwarteten Werten kleiner als 5 vorhanden. Der kleinste erwartete Wert ist 175.

• In der (schlechten Grafik) sind einander beobachtete und erwartete Haufigkeiten gegenubergestellt.

• Der zweite Block enthalt die eigentlichen Testergebnisse.n (500), T (0.879), df (1) und (assymptotischer) p-Wert (0.348).

• Interpretation: Der p-Wert ist mit 0.348 weit großer als ubliche Signifikanzniveaus. APwird bei 35% bleiben.

Bemerkung:

Bei einseitigen Fragestellungen kann der zweiseitige p-Wert halbiert werden, wenn der Anteil inder Stichprobe in Richtung Alternativhypothese zeigt.

2.3.2 Anteilstest uber die Normalverteilung

Dieser Methode liegt die Approximation der Binomial- (in den meisten praktischen Falleneigentlich der hypergeometrischen) Verteilung durch die Normalverteilung zugrunde. Dadurchgelangt man zu einer Teststatistik, die der Normalverteilung folgt (siehe Kasten mit Formel (6.5)in Brannath/Futschik/Krall).

Beispiel: Sonntagsfrage Partei DP

Fur die Fragestellung, ob die DP uber 5% kommen wird, bedeutet es bei handischer Rechnerei:

1. H0 : p = 0.05 H1 : p > 0.05

2. α = 0.05

3. Bestimmen des kritischen Wertes: Q(N)(1− α) = Q(N)(0.95) = 1.645

4. Berechnen der Teststatistik: p = 47/500 = 0.094

T =0.094− 0.05√

0.05·(1−0.05)500

= 4.514

19

Page 20: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

5. Entscheidung: T = 4.514 > 1.645 daher wird H0 verworfen. Man kann augrund derStichprobe schließen, dass DP uber 5% erreichen wird.

2.3.3 Exakte Anteilstests

Beide bisher vorgestellten Verfahren beruhen darauf, die jeweilige Verteilung der Teststatistikapproximativ durch die χ2-Verteilung oder durch die Normalverteilung zu beschreiben. DieBestimmung der p-Werte uber die exakte Verteilung kann nur mit Rechnerhilfe erfolgen.

• In SPSS:

Test auf Binomialverteilung

Kategorie N Testanteil

Partei Gruppe 1

Gruppe 2

Gesamt

DP 47 ,094 ,05 ,000

Rest 453 ,906

500 1,000

In der Spalte Testanteil ist der Anteil, der zur Uberprufung ansteht.In der letzten Spalte Exakte Signifikanz (1-seitig) ist das Testergebnis fur den exaktenAnteilstest zu finden. Die Stichprobe weist darauf hin (Beobachteter Anteil = 0.094), dassvon den zwei moglichen einseitigen Tests der mit H1 : p > 0.05 die interessantereFragestellung ist. Fur diesen Test gilt der angezeigte p-Wert.

• In R:

Exact binomial test

data: 47 and 500

number of successes = 47, number of trials = 500, p-value = 3.308e-05

alternative hypothesis: true probability of success is greater than 0.05

95 percent confidence interval:

0.0734 1.0000

sample estimates:

probability of success

0.094

Hier ist die einseitige Fragestellung leichter zu erkennen.

Das Ergebnis ist naturlich dasselbe. Man kann aufgrund der Stichprobe schließen, dass DPmehr als 5% der Stimmen erhalten wird.

2.4 Konfidenzintervalle fur Anteile

Beispiel: SonntagsfrageDie Meinungsumfrage (n = 500) in Demokrastan (mit den Parteien AP, ..,DP) hat ein Bild vonder Stimmungslage gegeben.

Allerdings wurde eine andere Umfrage unter 500 Personen vermutlich nicht zu den genaudenselben Werten fuhren.

Forschungsfrage: Ist es moglich, von diesen Einzelwerten wegzukommen und statt dessenIntervalle anzugeben, in denen die Anteile der einzelnen Parteien vermutlich liegen?

20

Page 21: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

2.4.1 Berechnung der Konfidenzintervalle

Obige Fragestellung ist rhetorischer Natur. Die statistische Antwort heißt Konfidenzintervall.Ublich sind 95%-Konfidenzintervalle, theoretisch kann fur jeden Wert 0 < γ < 1 einKonfidenzintervall fur den Anteilswert bestimmt werden (man nennt γ das Konfidenzniveau).

Die Konstruktion zweiseitiger Konfidenzintervalle fur den Anteilswert geschieht folgendermaßen(siehe Brannath/Futschik/Krall Formel (5.4)):

1. In der Mitte des Intervalls ist der beobachtete Anteil p aus der Stichprobe.

2. Nach links und rechts geht man gleich weit, namlich (α = 1− γ):

c = Q(N)(1− α/2) · σp σp =

√p · (1− p)

n

3. Die Grenzen des Intervalls sind damit bestimmt:

(p− c ; p+ c)

Beispiel: Sonntagsfrage

Ein 95%-Konfidenzintervall fur AP berechnet uber:

1. p = 185/500 = 0.37

2. γ = 0.95, α = 1− 0.95 = 0.05, Q(N)(0.975) = 1.96

σp =

√0.37 · (1− 0.37)

500= 0.0216

c = 1.96 · 0.0216 = 0.0423

3. des Intervalls sind damit bestimmt:

(0.3277 ; 0.4123)

4. Das bedeutet, fur AP reicht das 95%-Konfidenzintervall von 32.77% bis 41.23%

In der folgenden Tabelle sind die Werte fur alle Parteien angegeben:

Partei Anteil c Untergrenze ObergrenzeAP 0.370 0.0423 0.3277 0.4123BP 0.324 0.0410 0.2830 0.3650CP 0.212 0.0358 0.1862 0.2478DP 0.094 0.0256 0.0684 0.1196

Man sieht zweierlei:

• Die Konfidenzintervalle sind relativ breit, z.B. hat das das Intervall fur AP eine Breite vonuber 8%. Dabei ist in diesem hypothetischen Beispiel angenommen worden, dass alle 500Befragten die Sonntagsfrage beantwortet haben (ublicherweise geben ungefahr ein Drittelkeine klare Antwort auf die Sonntagsfrage).

• Die Schwankungsbreite sinkt mit fallendem Anteil der Parteien. Die Schwankungsbreite istfur p = 0.5 am großten und wird kleiner je naher man den Extremen 0 bzw. 1 naher kommt.

21

Page 22: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

2.4.2 Stichprobenumfang

Eine Moglichkeit, engere (genauere) Konfidenzintervalle zu erhalten, ist ein großererStichprobenumfang. Allerdings bedeutet eine Verdoppelung des Stichprobenumfanges nicht eineHalbierung der Konfidenzintervallbreite. Fur eine Halbierung der Breite benotigt man ca. denvierfachen Stichprobenumfang.

Eine Formel fur den Stichprobenumfang so, dass eine gewunschte Breite L nicht uberschrittenwird, bietet (siehe Brannath/Futschik/Krall Formel (5.5)):

n ≥(Q(N)(1− α/2)

L

)2

Diese Formel arbeitet mit dem schlechtest moglichen (fur die Breite) Ergebnis der Stichprobe,namlich p = 0.5. Fur p-s weit weg von 0.5 gibt es bessere Abschatzungsformeln fur dennotwendigen Stichprobenumfang.

Beispiel: Sonntagsfrage

Wie hoch muss der Stichprobenumfang gewahlt werden, damit das Konfidenzintervall fur dieParteien nicht breiter als 2% ist (also hochstens ±1%)?

n ≥(

1.96

0.02

)2

= 982 = 9604

Die Kosten fur eine solche Befragung waren also viel zu hoch!

2.4.3 Konfidenzniveau

Eine weitere Moglichkeit fur engere Konfidenzintervalle sind niedrigere Konfidenzniveaus. Gehtman von γ = 0.95 auf γ = 0.90 zuruck, so andert sich das Quantil der Normalverteilung von 1.96auf 1.645. Allerdings ist die dann auch die Gefahr erhoht, dass das Konfidenzintervall denunbekannten Anteil nicht enthalt.

Berechnet man oft Konfidenzintervalle, so enthalten bei einem Konfidenzniveau von γ = 0.95durchschnittlich 5% der Intervalle nicht den Anteil, also erfullt langfristig jedes 20-teKonfidenzintervall nicht seine Aufgabe. Bei einem γ = 0.90 liegt jedes 10-te Intervall daneben.

2.5 Beispiele

1. Wurfel

Um zu uberprufen, ob ein Wurfel fair ist, wird eine Versuchsserie von 60 Wurfendurchgefuhrt, die folgende Haufigkeiten fur die 6 Augenzahlen bringt:

Augenzahl 1 2 3 4 5 6Haufigkeit 14 9 7 10 14 6

Ist der Wurfel fair (hat jede Augenzahl dieselbe Wahrscheinlichkeit)?

Angenommen die Versuchserie hatte nicht aus 60 sondern aus 120 Wurfen bestanden unddie Haufigkeiten fur die Augenzahlen waren genau das Doppelte von obiger Versuchserie:Ware das Ergebnis des Tests gleich?

2. Tore im Fussball

Ein Sportwissenschaftler untersucht, ob beim Fußball Tore eher zu Beginn oder am Endeder jeweiligen Halbzeiten fallen. Fur fruhe Tore in den Halbzeiten spricht etwa, dass dieVerteidigung noch nicht so gut auf die Angreifer eingestellt ist. Fur spate Tore spricht, dassmit zunehmender Mudigkeit auch die Konzentration der Verteidiger nachlaßt.

130 zufallig ausgewahlte Spiele werden untersucht, in denen insgesamt 272 Tore gefallensind. Die Zeiten, zu denen die Tore fielen, werden zweistufig eingeteilt:

22

Page 23: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

• in die Halbzeit, in der das Tor gefallen ist (I und II).

• in die erste, zweite oder dritte Viertelstunde der jeweiligen Halbzeit (1,2 oder 3). Zurdritten Viertelstunde wird auch die etwaige Nachspielzeit gerechnet.

• II-1 bedeutet somit 1.Viertelstunde der 2.Halbzeit.

Eine Auszahlung fuhrt zu folgender Tabelle:

I-1 I-2 I-3 II-1 II-2 II-337 41 52 43 39 60

Ist die Wahrscheinlichkeit fur Tore gleich fur jede Viertelstunde des Spiels?

3. Betreuung von Diplomarbeiten

An einem Department gibt es vier UniversitatslehrerInnen, die auch Diplomarbeitenbetreuen. Naturlich erfordert die Betreuung einer Diplomarbeit einiges an Arbeit und Zeitund vom Aspekt einer gleichmaßigen Aufteilung der Arbeiten her ware es wunschenswert,wenn die Lehrenden des Instituts (in etwa) gleich mit der Betreuung von Diplomarbeitenbelastet wurden. Die Zahlen eines Studienjahres ergaben folgende Aufteilung:

Lehrende A B C Dbetreute Diplomarbeiten 9 19 11 17

Naturlich ist kaum zu erwarten, dass in der Aufteilung jede(r) Lehrende genau ein Viertelder Diplomarbeiten betreut hat. Aber lassen diese Daten schon den Schluss zu, dass in derBetreuung von Diplomarbeiten die Lehrenden nicht gleich stark eingesetzt sind?

4. Morde in New Jersey

Die Morde in New Jersey im Jahr 2003 nach Wochentagen aufgegeliedert, gibt die folgendeTabelle wieder:

So Mo Di Mi Do Fr Sa53 42 51 45 36 37 65

Man fuhre einen Test durch, ob fur Morde jeder Wochentag gleich wahrscheinlich ist.

5. Altersverteilung der Kundschaft

Das Management eines Kaufhauses will durch eine Werbekampagne eine Verjungung derKundschaft erreichen. Einen Monat nach Beendigung der Werbekampagne ergab eineUntersuchung folgende Altersverteilung:

Altersklasse <20 20-24 25-29 30-34 35-39 >=40fruhere Anteile (in %) 10 10 15 20 20 25Stichprobe (absolut) 24 25 42 54 33 42

Ist durch die Werbekampagne eine Veranderung in der Alterstruktur der Kundschafteingetreten?

6. Notenverteilung

An einem Department werden Prufungsmodalitaten geandert. Die Vertretung derStudierenden befurchtet eine Verscharfung der Prufungen und damit einhergehend eineVerschlechterung der Noten.

Noten 1 2-4 5fruhere Anteile (in %) 15 60 25Stichprobe (absolut) 4 31 5

Hat sich durch diese Anderung uberhaupt eine Veranderung in der Notenverteilungergeben?

Hat sich der Anteil an negativen Benotungen verringert?

23

Page 24: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

7. Veranderungen des Wahlverhaltens

Eine Regionalzeitung gibt ein Jahr vor Landtagswahlen eine Meinungsumfrage (n=400) inAuftrag, um die Parteipraferenz in der Bevolkerung zu erheben. Die Angaben (in Prozent)und als Vergleich dazu die Ergebnisse der letzten Landtagswahl sind in der folgendenTabelle zusammen gefasst:

Partei Umfrage letzte WahlP1 38 41P2 35 34P3 14 16P4 13 9

Haben sich Verschiebungen in der Wahlergunst seit der letzten Wahl ereignet?

8. Beschwerden bei e-Commerce

In einer Meldestelle fur E-Commerce-Beschwerden werden Beschwerdefalle inZusammenhang mit E-Commerce registriert und einer Problemlosung zuzufuhren versucht.Um eine Ubersicht uber die Beschwerden eines abgelaufenen Kalenderjahres zu erhalten,wird eine Zufallsstichprobe gezogen.

In fruheren Jahren konnten 70% der Falle auf außergerichtlichem Weg einer Einigungzwischen Beschwerdefuhrer und E-Commerce-Anbieter zugefuhrt werden.

In der Stichprobe sind von 150 Beschwerdefallen 122 auf diesem Weg beigelegt worden.

Hat sich der Anteil geandert?

9. Verkauf ubers Internet

Verkauf uber das Internet wird immer beliebter. Verbraucherorganisationen beklagenallerdings, dass viele Verkaufs-Websites nicht den gesetzlichen Anforderungen (fehlendeoder falsche Angaben uber Anbieter, etc.) entsprechen. Nach diesen Angaben sollen 55%der Websites Mangel in dieser Richtung aufweisen.

In der Redaktion eines Medienmagazins ist man skeptisch, ob dieser hohe Wert zutrifft.Eine eigene Untersuchung von 50 Verkaufs-Websites auf solche Mangel hin wird eingeleitet.22 Websites (also 44%) weisen mehr oder minder große Mangel auf.

Stimmt die Angabe der Verbraucherorganisation?

10. Insiderhandel

Ein Problem fur Borsen stellt der sog. Insiderhandel dar. Darunter versteht man den Kaufbzw. Verkauf von Aktien durch Personen, die Zugang zu sensiblen oder geheimenInformationen von Unternehmen haben. Meist gehoren diese Personen der oberstenFuhrungsebene der Unternehmen an. Naturlich soll es aber auch fur diese Personenmoglich sein, an der Borse Aktien - auch solche des eigenen Unternehmens - zu kaufen oderzu verkaufen.

Daher haben in den meisten Landern Borsenaufsichtsbehorden weit gehende Moglichkeiten,Aktientransaktionen zu kontrollieren.

In einem Quartal gab es 81 Kauftransaktionen von Insidern. Bei 52 davon folgten innerhalbeines Tages (zum Teil massive) Kursanstiege der entsprechenden Aktien.

Sprechen diese Daten fur Insiderhandel, wenn Kursanstiege mit einer Wahrscheinlichkeitvon 50% erwartet werden?

11. Aussichten zum Jahreswechsel

Eine Umfrage zum Jahresende unter 60 Managern von Mittelbetrieben ergab, dass 42optimistisch auf das kommende Jahr blicken (Umsatzsteigerung, allgemein positive

24

Page 25: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

Geschaftsentwicklung,..). 18 der 60 Manager waren pessimistisch fur das kommende Jahreingestellt.

Man berechne ein 95%-Konfidenzintervall fur den Anteil der Optimisten.

Kann man daraus schließen, dass die Mehrheit aller Manager optimistisch ins neue Jahrblickt?

Man vergleiche damit das zugehorige Intervall fur die Pessimisten

12. Raucherbereiche

Nichtraucher wurden befragt, ob sie in Gasthausern und Restaurants mit der Abtrennungder Raucherbereiche zufrieden sind. Von 125 Befragten waren 75 nicht zufrieden.

Man berechne ein 95%-Konfidenzintervall fur den Anteil der Unzufriedenen.

Kann man daraus schließen, dass die Mehrheit aller Nichtraucher nicht mit der Abtrennungder Raucherbereiche in Lokalen zufrieden ist?

13. Sonntagsfrage

Im schon bekannten Beispiel mit der Sonntagsfrage in Demokratstan sind folgende Fragenzu uberprufen:

Wird BP unter 35% bleiben?

Wird CP uber dem letzten Ergebnis (18%) liegen?

14. Krankenstandstage

In einem Betrieb hegt der etwas paranoide Personalchef den Verdacht, dass manche derBeschaftigten Krankmeldungen an Montagen und Freitagen dazu nutzen, ein verlangertesWochenende zu gestalten. Er testet, ob alle Wochentage mit gleicher Wahrscheinlichkeit alsKrankenstandstage auftreten.

Was kann aus dem folgenden SPSS-Output zu dieser Vermutung gesagt werden?

15. Notarzteinsatze

In der Rettungszentrale einer Stadt werden die Notarzteinsatze im Nachtdienst registriert.Bei der Planung der Notarztdienste ist man davon ausgegangen, dass im Mittel 5 Einsatzepro Nacht anfallen und dass die Anzahl Einsatze pro Nacht einer Poissonverteilung folgen.

Die Auszahlung von fast drei Monaten ergibt folgende Aufstellung:

Anzahl Einsatze Haufigkeit0-2 73-4 245-6 257-8 189+ 9

Muss man aufgrund dieser Beobachtungen die Annahme der Poissonverteilung mitMittelwert 5 verwerfen?

25

Page 26: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

16. Internetkauf

In einer Befragung unter 20-40-Jahrigen gaben 61 von 85 Befragten an, im letzten Jahrmindestens einen Kauf uber Internet abgewickelt zu haben.

Kann man daraus folgern, dass es in der Population mehr als zwei Drittel sind?

Interpretieren Sie den folgenden R-Output!

1-sample proportions test without continuity correction

data: 61 out of 85, null probability 0.6667

X-squared = 0.993, df = 1, p-value = 0.1595

alternative hypothesis: true p is greater than 0.667

95 percent confidence interval:

0.632 1.000

sample estimates:

p

0.718

17. Elfmeterschießen

Eine Sportpsychologin hat sich Daten uber die Ergebnisse von Entscheidungen durchElfmeterschießen beschafft. Die Trefferanzahl der ersten 5 Schutzen bei 72 Entscheidungensind in folgender Tabelle enthalten.

Treffer 0 1 2 3 4 5Anzahl 0 4 9 18 29 12

Sind die Treffer binomialverteilt?

26

Page 27: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

Kapitel 3

Zwei kategoriale Variablen

3.1 Numerische und grafische Beschreibung

Beispiel: Sonntagsfrage

Im Beispiel mit der Sonntagsfrage wurde neben der Parteipraferenz auch das Geschlecht derBefragten erhoben.

Partei Frau MannAP 104 81BP 77 85CP 56 50DP 18 29

Forschungsfrage: Wie kann man die Parteipraferenzen fur Manner und Frauen so beschreiben,dass ein Vergleich leicht moglich ist?

3.1.1 Numerische Beschreibung

Kreuztabellen, Kontingenztafeln

Hier sind zwei kategoriale Variablen involviert, Parteipraferenz und Geschlecht. Von Interesse istin diesem Kapitel nicht, wieviel Befragte fur welche Partei ihre Praferenz bekundet haben,sondern, wieviel von den Frauen (bzw. Manner) fur die einzelnen Parteien stimmen wollen oderwieviel von den Unterstutzern einzelner Parteien Manner (bzw. Frauen) sind.

In eine Auszahlung sollen also beide Variablen eingehen. Eine Auszahlung nach mehr als einerkategorialen Variablen fuhrt zu Kreuztabellen oder Kontingenztafeln. Die einzelnenEintragungen nennt man die Zellen Zellen der Kreuztabelle.

Vom Verstandnis her bereiten sie keine Schwierigkeiten. Im hypothetischen Beispiel ausDemokratstan kann sie wie oben unter Einschluss von Zeilen- und Spaltensummen (den sog.Randern) so ausschauen:

Geschlecht

Partei Frau Mann Sum

AP 104 81 185

BP 77 85 162

CP 56 50 106

DP 18 29 47

Sum 255 245 500

27

Page 28: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

Die Interpretation lauft direkt: Die Zelle zu Beginn der Tabelle mit dem Wert 104 besagt, dass104 der Befragten Frauen waren und AP gewahlt haben. 29 der Befragten waren Manner undhaben DP gewahlt.

Relative Haufigkeiten

Die Angabe von relativen Haufigkeiten und Prozenten erfordert Sorgfalt bei der Auswahl undAufmerksamkeit bei der Interpretation. Je nachdem, was als Vergleichsgroße hergenommen wird,spricht man von

• Gesamtprozent

Als Bezugsgroße dient die gesamte Stichprobe (gemeinsame Information, jointinformation). Alle Prozentangaben aufsummiert ergeben 100%.

Geschlecht

Partei Frau Mann

AP 20.8 16.2

BP 15.4 17.0

CP 11.2 10.0

DP 3.6 5.8

Der Wert von 20.8% zu Beginn der Tabelle gibt an, dass 20.8% der Befragten sowohl APwahlen wurden als auch Frauen sind

• Zeilenprozent

Anteil einer Zelle an der Zeilensumme (bedingte Information, conditional information). DieProzentangaben zeilenweise aufsummiert ergeben 100%.

Geschlecht

Partei Frau Mann

AP 56.2 43.8

BP 47.5 52.5

CP 52.8 47.2

DP 38.3 61.7

Die Angabe von 56.2% zu Beginn der Tabelle bedeutet, dass 56.2% von denen, diePraferenz fur AP bekundet haben, Frauen waren.

• Spaltenprozent

Anteil einer Zelle an der Spaltensumme (auch hier liegt eine bedingte Information vor). DieProzentangaben spaltenweise aufsummiert ergeben 100%.

Geschlecht

Partei Frau Mann

AP 40.8 33.1

BP 30.2 34.7

CP 22.0 20.4

DP 7.1 11.8

Die Angabe von 40.8% zu Beginn der Tabelle sagt, dass 40.8% von den Frauen Praferenzfur AP bekundet haben.

Zeilen- und Spaltenprozent nennt man auch bedingte relative Haufigkeiten, weil sie Auskunftnur uber einen Teil der Stichprobe geben (uber jenen, der die jeweilige Bedingung erfullt).

28

Page 29: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

3.1.2 Grafische Beschreibung

Fur die grafische Beschreibung der Stichprobe werden ublicherweise Balkendiagramme verwendet.

Frau Mann

APBPCPDP

Gruppiertes Balkendiagramm

abso

lute

Häu

figke

iten

020

4060

8010

0

Frau Mann

DPCPBPAP

Gestapeltes Balkendiagramm

abso

lute

Häu

figke

iten

050

100

150

200

250

Oft werden relative Haufigkeiten so in einem Balkendiagramm dargestellt, dass sie gruppenweise100% ergeben (Zeilen- oder Spaltenprozent).

AP BP CP DP

MannFrau

Gestapeltes Balkendiagramm

Zei

lenp

roze

nt0

2040

6080

100

Frau Mann

DPCPBPAP

Gestapeltes Balkendiagramm

Spa

ltenp

roze

nt0

2040

6080

100

3.2 Homogenitatstest

Beispiel: Verwaltungsgerichtshof

Bei Berufungen gegen Steuerbscheide kann in 2. Instanz der Verawltungsgerichtshof angerufenwerden. Die Vertretung konnen nicht nur Rechtsanwalte (RA) ubernehmen, sondern seit 1999auch Wirtschaftsprufer (WP).

Forschungsfrage: Unterscheiden sich die Verteilungen der Entscheidungen zwischen den beidenGruppen?

Wenn der Anlass fur den Bescheid eine Betriebsprufung war, erhalt man fur die Entscheidungenaus den Jahren 2000-2004 folgende Tabelle:

Vertretung

Entscheidung RA WP Sum

Abweisung 203 43 246

Aufhebung 89 39 128

29

Page 30: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

teilweise Aufhebung 12 4 16

Sum 304 86 390

In diesem Beispiel definiert die Variable Vertretung die beiden Gruppen. Die Verteilung deranderen Variablen (Entscheidung) wird zwischen den Gruppen verglichen.

Die grafische Beschreibung zeigt hier den Vorteil von Balkendiagrammen mit relativenHaufigkeiten (warum?):

RA WP

teilweise AufhebungAufhebungAbweisung

VwGH−Entscheidungen

abso

lute

Häu

figke

iten

050

100

150

200

250

300

RA WP

teilweise AufhebungAufhebungAbweisung

VwGH−Entscheidungen

Spa

ltenp

roze

nt0.

00.

20.

40.

60.

81.

0

3.2.1 Rechentechnik

Die Fragestellung nach Unterschieden in Verteilungen in zwei oder mehreren Gruppen kann mitdem sog. χ2-Homogenitatstest beantwortet werden. Ahnlich dem χ2-Test aus dem vorigenKapitel werden beobachtete und erwartete Werte verglichen. Die beobachtete Werte (oij) sind inder Kreuztabelle (Matrix!) gegeben (hier zweidimensional, daher zwei Indizes notwendig).

Die Berechnung der erwarteten Haufigkeiten schaut formelmaßig schlimmer aus als sietatsachlich ist. Fur die Eintragung eij in Zeile i und Spalte j der Matrix der erwarteten Wertemultipliziere man die i-te Zeilensumme (oi+) mit der j-ten Spaltensumme (o+j) und dividieredurch n (Stichprobenumfang). Der Rest geht fast analog zum vorigen Kapitel.

Allgemeine Vorgangsweise beim χ2-Homogenitatstest (siehe Brannath/Futschik/Krall Kastenmit Formel (6.11)):

1. H0 : Es gibt keine Unterschiede in der Verteilung einer Variablen zwischen den GruppenH1 : Es gibt Unterschiede in der Verteilung einer Variablen zwischen den Gruppen

2. Wahl des Signifikanzneaus

3. Bestimmen des kritischen Wertes:df = (I − 1) · (J − 1) (I .. Zeilenzahl, J.. Spaltenzahl der Kreuztabelle)

Q(χ2)df (1− α)

4. Berechnen der beobachteten und erwarteten Haufigkeiten: Fur die beobachtetenHaufigkeiten ist das die Kreuztabelle.

Die erwarteten Haufigkeiten bestimmt man uber die Zeilen- und Spaltensummen (oi+, o+j):

eij =oi+ · o+j

n

30

Page 31: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

5. Berechnen der Teststatistik:

T =

I∑i=1

J∑j=1

(oij − eij)2

eij

6. Entscheidung:Ist T großer als der kritische Wert, wird H0 verworfen, sonst beibehalten.

3.2.2 Beispiel: Verwaltungsgerichtshof

Die Umsetzung im konkreten Beispiel mit den Berufungen am VwGH ist schnell erledigt.

1. H0 : Es gibt keine Unterschiede in der Verteilung der Entscheidungen zwischen Berufungen,die von Rechtsanwalten und von Wirtschaftsprufern eingeracht werdenH1 : Es gibt Unterschiede in der Verteilung der Entscheidungen.

2. α = 0.05

3. Bestimmen des kritischen Wertes: df = (3− 1) · (2− 1) = 2 ⇒ Q(χ2)2 (0.95) = 5.991

4. Beobachtete Haufigkeiten (incl. Rander):

Vertretung

Entscheidung RA WP Sum

Abweisung 203 43 246

Aufhebung 89 39 128

teilweise Aufhebung 12 4 16

Sum 304 86 390

Die erwarteten Haufigkeiten bestimmt man z.B.: e11 = o1+ · o+1/n = 246 · 304/390 = 191.8

Insgesamt:

Vertretung

Entscheidung RA WP

Abweisung 191.8 54.2

Aufhebung 99.8 28.2

teilweise Aufhebung 12.5 3.5

5. Berechnen der Teststatistik:

T =(203− 191.8)2

191.8+ . . .+

(4− 3.5)2

3.5= 8.35

6. Entscheidung: T = 8.35 > 5.991, daher wird H0 verworfen. Es gibt Unterschiede zwischenRechtsanwalten und Wirtschaftsprufern in den Verteilungen der Entscheidungen desVwGH.

Berechnung mit R:

Bei Verwendung von Statistik-Software wird der p-Wert mit dem Signifikanzniveau verglichen:

Pearson"s Chi-squared test

data: vwgh

X-squared = 8.35, df = 2, p-value = 0.01539

31

Page 32: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

Das Ergebnis ist naturlich dasselbe: der p-Wert mit 0.0154 ist kleiner als α = 0.05. Somit wirdH0 verworfen.

Bemerkung: Bei den erwarteten Werten war ein Wert < 5. Mit 3.5 ist dieser Wert aber nochnicht im ganz kritischen Bereich.R bringt daher auch die Warnung (am Bildschirm):

Chi-squared approximation may be incorrect in: chisq.test(vwgh)

3.3 Unabhangigkeitstest

Beispiel: Einstellung zu Technologien

In einer Umfrage wurde die Einstellung zu mehreren Technologien erhoben, darunter dieNutzung der Atomkraft zur Energiegewinnung und die Nutzung der Gentechnik in der Medizin.

Atomtechnik

Gentechnik negativ neutral positiv Sum

negativ 65 15 29 109

neutral 14 7 13 34

positiv 6 8 11 25

Sum 85 30 53 168

Forschungsfrage: Gibt es einen Zusammenhang zwischen diesen zwei Variablen?

Technologien

Gentechnik

Ato

mte

chni

k

negativ neutral positiv

nega

tivne

utra

lpo

sitiv

Im Unterschied zum Beispiel des Homogenitatstests definiert hier nicht eine Variable eindeutigGruppen. Die Fragestellung ist anders, beim sog. Unabhangigkeitstest lauten Null- undAlternativhypothese:

H0 : Die beiden Variablen sind unabhangig.H1 : Die Variablen sind nicht unabhangig.

Rechentechnisch unterscheidet sich der Unabhangigkeitstest aber nicht vom Homogenitatstest.

Wie ublich wird bei Verwendung von Statistik-Software der p-Wert interpretiert.

Beispiel: Einstellung zu Technologien

32

Page 33: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

Interpretation: der p-Wert ist sehr klein, die Nullhypothese der Unabhangigkeit derEinstellungen zu den beiden Technologien muss verworfen werden.

Einen Einblick in die Art der Abhangigkeit kann aus Grafiken (etwa dem Mosaikplot) oder ausdem Vergleich beobachteter und erwarteter Haufigkeiten gewinnen. In diesem Beispiel ist einenegative Einstellung zur Atomenergie eher mit einer negativen Einstellung zu Gentechneologie inder Medizin verbunden.

3.4 Kontingenzkoeffizienten

Fur metrische Variable kann mit einem (ob mit dem Pearson- oder einem nichtparametrischen)Korrelationskoeffizenten versucht werden, die Starke des (linearen) Zusammenhanges zwischenden Variablen zu beschreiben. Fur kategoriale Variable ist der Wunsch nach einer solchenMaßzahl ebenfalls vorhanden und wird wesentlich durch die Werte T der Teststatistiken dersoeben besprochenen Tests bestimmt.

• Kontingenzkoeffizient nach Pearson

P =

√T

n+ T

• Kontingenzkoeffizient nach Cramer

C =

√T

n ·min(I − 1, J − 1)

Beispiele:

• Verwaltungsgerichtshof n = 390, I = 3, J = 2, T = 8.35

P =

√8.35

390 + 8.35= 0.145

C =

√8.35

390 ·min(3− 1, 2− 1)= 0.146

• Technologien n = 168, I = 3, J = 3, T = 12.4

P =

√12.4

168 + 12.4= 0.262

C =

√12.4

168 ·min(3− 1, 3− 1)= 0.192

Bemerkungen:

• Fur die Werte beider Kontingenzkoeffizienten gilt: 0 ≤ P,C ≤ 1.Allerdings werden seltener als bei Korrelationskoeffizienten Werte uber 0.5 erreicht.

• Fur ordinale Variable gibt es eigene Koeffizienten, die eine Interpretation der Art “je hoherdie einen Werte desto hoher (oder niedriger) sind die anderen Werte“ erlauben.

33

Page 34: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

3.5 Mehrstichprobenanteilstest

Die wohl haufigste Anwendung des Homogenitatstests ist der Vergleich von Anteilen in mehrerenGruppen.

Beispiel: Verkaufsfordernde Maßnahmen

In einer Studie zu verkaufsfordernden Maßnahmen wurde untersucht, ob praktische Arzte eherbereit sind, ein neues Medikament zu verwenden, wenn dieses von einem Pharmavertreter oderim Rahmen eines speziellen Abendessens (Dinner Party) vorgestellt wird.

Forschungsfrage: Wird das Medikament signifikant ofter angewendet, wenn es bei einemspeziellen Abendessen angewendet wird?

Promotion

Anwendung Dinner Party Vertreter

Ja 58 47

Nein 23 38

Dinner Party Vertreter

NeinJa

Neues Medikament

0.0

0.2

0.4

0.6

0.8

1.0

3.5.1 Berechnung uber den Homogenitatstest

Es liegt eine 2x2-Kreuztabelle (oder Vierfeldertafel) vor. Sie sind von der Dimension her dereinfachste Fall von Kreuztabellen.Mit Hilfe des Homogenitatstests besteht eine einfache Moglichkeit, solche Fragestellungen zubearbeiten. Es handelt sich hier um den Vergleich von Anteilen (Anteile der VariablenAnwendung) zwischen in zwei Gruppen.

Beispiel: Verkaufsfordernde MaßnahmenDer p-Wert ist kleiner als 5%, somit kann auf unterschiedliche Anteile in den Anwendungengeschlossen werden. Der Anteil von Anwendungen ist nach Dinner Parties hoher als nachVertreterbesuchen, also kann auch diese einseitige Interpretation des Testergebnisses erfolgen.

3.5.2 Berechnung uber die Normalverteilung

Eine zweite Methode fur diese Fragestellung, die aber nur zum Vergleich von Anteilen in zweiGruppen eingesetzt werden kann, lauft uber die Normalverteilung. Sie ist inBrannath/Futschik/Krall im Kasten mit Formel (6.9) ausgefuhrt.

34

Page 35: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

Beispiel: Verkaufsfordernde Maßnahmen

Uber Dinner Parties haben 81 (= n1) Arzte das Medikament kennen gelernt, 58 (= k1)davonhaben das Medikament auch angewendet (p1 = 58/81 = 0.716). Uber Vertreter haben 85 (= n2)Arzte vom Medikament erfahren, 47 (= k2) haben es auch angewendet (p2 = 47/85 = 0.553).

1. H0 : p1 = p2.H1 : p1 6= p2

2. α = 0.05

3. Q(N)(0.975) = 1.96

4. Berechnen der Teststatistik:

p =58 + 47

81 + 85= 0.6325

sD =√

0.6325 · (1− 0.6325)

√81 + 85

81 · 85= 0.0749

T =0.716− 0.553

0.0749= 2.179

5. Entscheidung:Mit 2.179 ubersteigt T den kritischen Wert. H0 wird verworfen, die Anteil an Arzten, diedas Medikament verwenden, ist je nach Vorstellung des Medikaments bei den Arztenunterschiedlich.

3.5.3 Exakter Test nach Fisher

Beispiel: Seltene Krankheit

An zwei Kliniken wurden unterschiedliche Behandlungsmodelle zur Therapie einer seltenenKrankheit entwickelt. Die bisherigen Daten zum Behandlungserfolg zeigen folgendes Bild:

Klinik A Klinik BBehandlungserfolg gut 2 5Behandlungserfolg schlecht 5 4

Forschungsfrage: Kann man auf Grund dieser Daten schon schließen, dass mit derBehandlungsmethode von Klinik B der Behandlungserfolg hoher ist?

Beide soeben vorgestellten Methoden zum Vergleich zweier Anteile beruhen auf asymptotischenVerteilungen und setzen daher einen großen Stichprobenumfang voraus. Ist dieser ist – so wie indiesem Beispiel – nicht gegeben, kann als Ausweg der exakte Test nach Fisher weiterhelfen.

Er beruht darauf, alle Kreuztabellen mit denselben Randsummen wie die gegebene zuuntersuchen. Beim Versuch, dies handisch nachzuvollziehen, gerat man schon beiMinidatensatzen ins Schleudern. Den Rechenteil uberlassen wir dankend unterstutzendenProgrammen.

35

Page 36: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

SPSS-Output

• Die kleine Stichprobe schließt den χ2-Homogenitatstest und den Test uber dieNormalverteilung aus.

• Man beachte auch die markierte Fußnote zur Tabelle: sie ist eine Warnung (erwarteteHaufigkeiten zu klein), falls man den Homogenitatsttest einsetzen will.

• Der Fisher-Test ist ohne Bedenken einsetzbar.

• Die Fragestellung ist einseitig. Der p-Wert fur diese Fragestellung ist mit 0.286 jedoch vielzu groß, um die Nullhypothese (kein Unterschied zwischen den Behandlungsmethoden)verwerfen zu konnen.

3.6 Veranderungen von Anteilen

Beispiel: Image von FernsehsendernIn einer Umfrage im Mai 2008, knapp vor der Fußball-EM in Osterreich und der Schweiz, wurden229 Personen (mit Kabel-TV- oder Satelliten-TV-Empfang) im Raum Wien zu ihremTV-Sehverhalten befragt.

Ein Teil dieser Umfrage zielte darauf ab, Eigenschaften (aktuell, kritisch, informativ,sensationslustern etc.) von Fernsehsendern herauszufiltern.

Forschungsfrage: Beurteilen Personen die Sender unterschiedlich?

Wir beschranken uns hier auf eine Eigenschaft, namlich Aktualitat, bei den zwei privatenSendern Pro7 und RTL.

3.6.1 Verbundene Stichproben

RTL

Pro7 nicht aktuell aktuell

nicht aktuell 93 42

aktuell 36 58

Die Hauptdiagonale der Kreuztabelle gibt an, dass 93 Personen beide Sender als nicht aktuellund 58 Personen beide als aktuell eingestuft haben.Die Gegendiagonale ist interessanter. 36 Personen haben Pro7 als aktuell und gleichzeitig RTLals nicht aktuell eingestuft. Die gerade gegenteilige Einstufung haben 42 Personen abgegeben.

36

Page 37: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

Weil die Variablen an denselben Beobachtungseinheiten beobachtet wurden, liegen keineunabhangigen Stichproben vor. Man spricht auch von abhangigen Stichproben, verbundenenStichproben oder gepaarten Stichproben.Der haufigste Fall, bei dem Daten dieser Art auftreten, ist die mehrfache Messung einerVariablen, z.B. einmal vor und einmal nach einem bestimmten Ereignis. Etwa, ob sich diePraferenz fur eine Partei nach einem TV-Duell der SpitzenkandidatInnen geandert hat. DieFragestellung ist dann die nach einer Veranderung in den Anteilen.

3.6.2 McNemar-Test

Hatte man 229 Personen zum einen und weitere 229 Personen zum anderen Programm befragt,ware die Fragestellung leicht mit einem Homogenitatstest zu beantworten.Hier liegen aber keine unabhangigen Stichproben vor. Pro Person gibt es je eine Einstufung vonPro7 und eine von RTL.Wenn ein Sender in Bezug auf Aktualitat besser beurteilt wird als der andere, sollten deutlichmehr Personen diesen als gut und den anderen als nicht gut beurteilt haben. Personen, die beideSender gleich beurteilt haben, tragen nichts zur Bewertung der Unterschiede zwischen den beidenSendern bei.Unter der Nullhypothese keiner Unterschiede zwischen den beiden Sendern ware der Anteil derPersonen, die Pro7 als aktuell, RTL aber als nicht aktuell beurteilen, unter all jenen mitunterschiedlicher Einstufung der beiden Sender 50%.Im McNemar-Test wird mit den Gegendiagonalelementen aus der 2× 2-Kreuztabelle einAnteilstest auf die Vorgabe von 50% (also π0 = 0.5) gerechnet.

McNemar"s Chi-squared test

data: aktuell

McNemar"s chi-squared = 0.462, df = 1, p-value = 0.4969

Interpretation: Der p-Wert gibt keinen Anlass, an der Nullhypothese (beide Sender werdengleich aktuell eingestuft) zu zweifeln.

3.7 Beispiele

1. Sonntagszeitung

In einer Studie wird das Kaufverhalten von Personen bei aushangenden Sonntagszeitungenbeobachtet. Das Kaufverhalten wird in drei Kategorien eingeteilt:

• ehrlich: Einwerfen des Geldbetrages, erstes Studium der Zeitung und Beobachtunganderer Akteure.

• scheinehrlich: Einwerfen einiger Munzen der Kleinstkategorie oder nur angedeutetesEinwerfen von Munzen, rasches Verlassen des Tatortes.

• ungeniert: Nicht einmal angedeutetes Einwerfen von Munzen, keine Veranderung imGehtempo.

Unter Berucksichtigung des Alters ergab sich folgende Tabelle:

ehrlich scheinehrlich ungeniertunter 30 4 18 2230 - 49 15 22 13

50+ 12 15 3

Um die Altersklassen zu vergleichen, beschreibe man die Daten durch geeignete relativeHaufigkeiten und durch ein passendes Balkendiagramm.

37

Page 38: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

2. Organspende

In einer Befragung wurde bei ca. 200 Personen die Einstellung zu Organtransplantationenerhoben. Unter anderem wurde gefragt, ob sie nach ihrem Tod Organe zur Transplantationzur Verfugung stellen wurden. Die Antwortkategorien waren: ja-sicher, eher ja, eher nein,nein.

Ebenso ehoben wurde das Alter der Befragten, das in vier Altersgruppen eingeteilt wurde:Unter 30, 30-39, 40-49, 50+

Alter

Organspende Unter 30 30 - 39 40 - 49 50 +

ja-sicher 21 19 18 19

eher ja 16 15 16 10

eher nein 10 6 5 11

nein 12 8 3 15

Ist die Bereitschaft zur Organspende in den Altersgruppen unterschiedlich?

3. Fahrverhalten und Alter

In einer Befragung zum Fahrverhalten wurde bei ca. 700 Autofahrern erhoben, welcheRisikofaktoren im Fahrverhalten (Mochte moglichst wenig uberholt werden, HaufigesLuckenspringen im Kolonnenverkehr, etc.) vorliegen. Eine Einteilung der AutofahrerInnenin solche ohne Risikofaktor (Risiko gering) und solche mit mindestens einem Risikofaktor(Risiko erhoht) ergab nach Altersgruppen folgende Einteilung:

unter 30 30 - 49 50+Risiko erhoht 131 195 108Risiko gering 65 113 97

Unterscheidet sich die Risikobereitschaft in den Altersgruppen?

4. Zufriedenheit mit offentlichen Verkehrsmitteln

Im Einzugsgebiet einer Großstadt wurde eine Untersuchung uber die Zufriedenheit mit demAngebot an offentlichen Verkehrsmitteln durchgefuhrt. Ein Teilaspekt befasste sich mit derFrage, ob Bewohner des Stadtkerns zufriedener mit dem Angebot offentlicherVerkehrsdienstleister (kurz: Offis) sind als Bewohner des Stadtrandes bzw. derUmlandgemeinden.

Wohnort

Angebot Stadtkern Stadtrand Umland

sehr gut 44 32 19

eher gut 79 57 52

eher schlecht 52 63 127

sehr schlecht 45 83 206

Unterscheidet sich die Zufriedenheit je nach Wohnort?

Berechnen Sie Kontingenzkoeffizienten!

5. Organtransplantation

In einer Befragung wurde bei ca. 200 Personen die Einstellung zu Organtransplantationenerhoben. Unter anderem wurde gefragt, ob sie nach ihrem Tod Organe zur Transplantationzur Verfugung stellen wurden (die Antwortkategorien wurden in die beiden Kategorienpositiv und negativ zusammen gefasst.

Ebenso wurde die Teilnahme am religiosen Geschehen erhoben.

Durch die beiden Variablen kommt folgende Kreuztabelle zustande:

38

Page 39: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

positiv negativAktiv 34 25Passiv 27 46

ohne Bekenntnis 52 19

Sind die beiden Variablen unabhangig? Berechnen Sie auch einen Kontingenzkoeffizienten.

6. Kaffee und Zigaretten

In einer Untersuchung zu Konsum- und Ernahrungsgewohnheiten werden 300 Personenauch uber ihren Konsum der Alltagssuchtmittel Nikotin und Coffein befragt.

Die Einteilung der Befragten einerseits in Raucher und Nichtraucher (weniger als 5Zigaretten pro Woche), andererseits in Kaffeetrinker (mehr als eine Tasse pro Tag) undNichtkaffeetrinker fuhrt zu folgender Tabelle:

Raucher NichtraucherKaffeetrinker 106 79

Nichtkaffeetrinker 37 78

Es soll uberpruft werden, ob Kaffee- und Zigarettenkonsum zusammenhangen.

7. Fahrverhalten und Geschlecht

In einer Befragung zum Fahrverhalten wurde bei ca. 700 Autofahrern erhoben, welcheRisikofaktoren im Fahrverhalten (Mochte moglichst wenig uberholt werden, HaufigesLuckenspringen im Kolonnenverkehr, etc.) vorliegen.

Eine Einteilung der AutofahrerInnen in solche ohne Risikofaktor (geringes Risiko) undsolche mit mindestens einem Risikofaktor (erhohtes Risiko) ergab unter Berucksichtigungdes Geschlechts folgende Einteilung:

Mann FrauRisiko erhoht 253 181Risiko gering 108 167

Unterscheiden sich die Geschlechter im Risikoverhalten?

8. Sicherheit

In einer Stadt wird eine Mediathek in einem Gebiet errichtet, das durch Verkehr undKriminalitat in Verruf geraten ist. Fur manche Besucher der Mediathek stellt diese Lagenaturlich ein Makel oder gar ein Problem dar.

In einer Befragung zwei Monate nach Eroffnung der Mediathek kam auch derSicherheitsaspekt zur Sprache. Von ca. 200 Befragten wurde folgende Einschatzung desSicherheitsaspekts erhoben:

Frau Mannunsicher 27 33sicher 85 53

Eine Test, ob sich die Anteile von Verunsicherten bei Frauen und Mannern unterscheiden,soll berechnet werden.

9. Totungsdelikte

In einer Tabelle sind die Tatwaffen bei Morden in den USA zwischen 1979 und 2002zusammengefasst (Quelle: FBI).

39

Page 40: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

GeschlechtTatwaffe Taterin TaterGewehr 2133 5048Handfeuerwaffe 9216 15018andere Feuerwaffe 302 638spitzer Gegenstand 5915 4934stumpfer Gegenstand 232 1464Hande 97 2695Gift 27 40Fenstersturz 2 25Explosion 6 8Feuer 78 196Betaubungsmittel/Drogen 27 74Ertranken 1 50Strangulieren 30 842Ersticken 14 210unbekannt 229 728

Verwenden Frauen ofter Handfeuerwaffen als Manner?

10. TV-Wahlduell

Vor einer Wahl stellen sich die SpitzenkandidatInnen der kandidierenden Parteien inmehreren TV-Duellen den Fragen von Publikum und Presse.

200 Personen wurden vor und nach diesen TV-Duellen uber die Praferenz fur eine derbeiden großten Parteien befragt. In der folgenden Tabelle sind die Parteipraferenzen zu denzwei Zeitpunkten zusammengefasst:

Nach TV-DuellVor TV-Duell Partei A Partei B

Partei A 82 36Partei B 19 63

Hat sich in der Parteipraferenz etwas geandert?

40

Page 41: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

Kapitel 4

Eine kategoriale Variable alsabhangige Variable

4.1 Odds und Odds-Ratio

4.1.1 Odds (Chancen)

Unter Odds (Chancen) versteht man das Verhaltnis zwischen den Haufigkeiten von zweiKategorien.

Beispiel: Pete Sampras (1991-1998)

Pete Sampras war der dominierende Tennisspieler der 90er-Jahre und aufgrund seinesAufschlages bei schnellen Belagen starker als auf langsamen. Eine Zusammenfassung seinerErgebnisse zwischen 1991 und 1998 auf Rasen und auf Sand gibt die folgende Tabelle:

Rasen Sandgewonnen 63 62verloren 10 24

Forschungsfrage: Kann man die Chancen auf den zwei Belagen vergleichen?

Die Odds, auf Rasen zu gewinnen, sind demnach:

63

10= 6.3

auf Sand sind sie: 62/24 = 2.583.

Bemerkungen:

• Odds konnen alle Werte ≥ 0 annehmen.

• Odds > 1 sprechen dafur, dass das Ereignis eher eintreten wird.

Odds < 1 sprechen dafur, dass das Ereignis eher nicht eintreten wird.

Die Odds fur Gewinn sind bei Sampras auf beiden Belagen > 1, die Odds fur Verlustjeweils < 1.

• Odds durfen nicht mit Wahrscheinlichkeiten verwechselt werden. Die Wahrscheinlichkeit furSieg auf Rasen ware fur Sampras: 63/(63 + 10) = 0.863

41

Page 42: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

4.1.2 Odds Ratio (Chancenverhaltnis)

Fur den Vergleich von Odds wird das Verhaltnis (nicht die Differenz) der Chancen gebildet. Mankommt so zum Odds Ratio oder - weil ein Doppelbruch aufgelost werden muss - zumCrossproduct Ratio.

a bc d

OR =a/c

b/d=a · db · c

Beispiel: Pete Sampras (1991-1998)Der Vergleich der Chancen auf Rasen zu denen auf Sand fuhrt zu

OR =63/10

62/24=

63 · 24

62 · 10= 2.44

Interpretation: die Chancen von Sampras, auf Rasen zu gewinnen, waren ca. 2.5-mal hoher alsauf Sand.

Bemerkungen:

• Odds Ratios konnen Werte ≥ 0 annehmen.

• Odds Ratios von ungefahr 1 bedeuten (ungefahr) gleiche Chancen.

• Odds Ratios stark unterschiedlich von 1 bedeuten ungleiche Chancen.

• Odds Ratios >1 sprechen fur die erste Kategorie (bei Sampras fur Rasen). Logarithmierensolcher Odds Ratios fuhrt zu positiven Werten.

• Odds Ratios <1 sprechen fur die zweite Kategorie. Logarithmieren solcher Odds Ratiosfuhrt zu negativen Werten.

• Hatte man die Chancen von Sampras auf Sand mit denen auf Rasen verglichen, so hatteman 1/2.44 = 0.41 erhalten (also den Kehrwert).

4.1.3 Konfidenzintervall und Test fur das Odds Ratio

Beispiel: Prufungschancen

In einem Fach gibt es zwei Prufer, die nicht gleich beliebt bei Studierenden sind. Von mehrerenPrufungsterminen wurden die Ergebnisse gesammelt, eine Zusammenstellung ist die folgendeTabelle:

PruferA B

positiv 45 21negativ 16 15

Forschungsfrage: Sind die Chancen bei den Prufern unterschiedlich?

Eine geeignete Methode fur diese Fragestellung ist der Homogenitatstest. Es soll aber noch einezweite – dazu alternative – Moglichkeit vorgestellt werden.Der Vergleich der Chancen bei Prufer A zu Prufer B ergibt das Odds Ratio:

OR =45/16

21/15= 2.009

42

Page 43: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

Die Chancen, die Prufung zu bestehen, waren bei dieser Stichprobe bei A doppelt so hoch wiebei B.

Aber das Ergebnis beruht auf einer Stichprobe, eine andere Stichprobe liefert vermutlich andereErgebnisse. Gesucht ist ein Konfidenzintervall fur das Odds Ratio. Die eigentliche Rechenarbeitfur das Konfidenzintervall geschieht auf der logarithmierten Skala:

• Bestimmung der Schwankungsbreite fur das log Odds Ratio (α = 1− γ):

s = Q(N)(1− α/2) ·√

1

a+

1

b+

1

c+

1

d

• Konfidenzintervall auf der logarithmierten Skala:

(ln(OR)− s ; ln(OR) + s)

• Konfidenzintervall auf der eigentlichen Skala (die Grenzen werden exponenziert):(OR

es; OR · es

)Beispiel: PrufungschancenFur das Beispiel mit den zwei Prufern gilt:

• OR = 2.009 und ln(2.009) = 0.6976.

• Schwankungsbreite fur ein 95%-Konfidenzintervall:

s = 1.96 ·√

1/45 + 1/21 + 1/16 + 1/15 = 0.8744

• Konfidenzintervall auf der logarithmierten Skala:

(0.6976− 0.8744 ; 0.6976 + 0.8744) = (−0.1768 ; 1.5720)

• Konfidenzintervall auf der eigentlichen Skala:

(2.009/ exp(0.8744) ; 2.009 · exp(0.8744)) = (0.838 ; 4.816)

• Im Intervall von 0.838 bis 4.816 liegen plausible Werte fur das Odds Ratio.

Interpretation: Der Wert 1 fur das Odds Ratio entspricht gleichen Chancen bei beidenPrufern. Dieser Wert liegt im Konfidenzintervall, ist also auch plausibel. Es gibt somit keinen(oder zumindest nicht ausreichend) Grund an der Hypothese, dass beide Prufer gleich schwerprufen, zu zweifeln.

SPSS-Output:Der SPSS-Output enthalt in der ersten Zeile das Odds Ratio und dann die Grenzen desKonfidenzintervalls. Angaben auf der logarithmierten Skala fehlen.

43

Page 44: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

4.2 Logistische Regression

4.2.1 Methode und Begriffe

Beispiel: Problemlosen und Intelligenz

Mehreren Personen wird ein nicht allzu schweres mathematisches Ratsel vorgelegt, zu dessenLosung 10 Minuten Zeit zur Verfugung stehen. Neben dem Wissen, ob das Ratsel gelost wurde,kennt man auch den Intelligenzquotienten (IQ) der Personen.

Forschungsfrage: Kann man aus dem IQ prognostifizieren, ob jemand mit hohem IQ eineAufgabe eher lost als jemand mit niedrigem IQ?

Ein Blick auf die Daten zeigt, dass Personen mit hoherem IQ das Ratsel eher gelost haben alsPersonen mit niedrigem IQ. Es gibt aber keinen klare Grenze in der Art, dass Personen miteinem hoheren IQ das Ratsel losen, Personen mit einem niedrigeren IQ nicht.

● ● ● ● ● ● ● ● ● ●

● ● ● ● ● ● ● ● ● ● ● ● ● ● ●

95 100 105 110 115 120 125

0.0

0.2

0.4

0.6

0.8

1.0

IQ−Problemloesung

IQ

fitte

d va

lues

Das nichtlineare Regressionsmodell

Wenn die abhangige Variable (Responsevariable) metrisch ist, bieten lineare RegressionsmodelleMoglichkeiten zur Prognose der abhangigen Variable.Hier ist die abhangige Variable Problemloesung aber kategorial (hier als 0 fur nicht gelost und 1als gelost kodiert), das normale Regressionsmodell kann nicht eingesetzt werden.

Man kann aber versuchen, die Wahrscheinlichkeit, das Problem zu losen, zu modellieren (mit denerklarenden Variablen in Verbindung bringen). Im Fall einer binaren kategorialen abhangigenVariable (nur 2 Auspragungen, z.B.: Problem gelost (ja-nein), Produkt gekauft (ja-nein), .. )geschieht die Verbindung uber:

ln

(p

1− p

)= β0 + β1 · x1 + . . .+ βk · xk

Man nennt β0 + β1 · x1 + . . .+ βk · xk den linearen Pradiktor, in ihm stecken die erklarendenVariablen wie in der normalen linearen Regression.

Damit wird aber nicht direkt die Wahrscheinlichkeit erklart. Durch das Zwischenschalten dersog. Linkfunktion werden die log-Odds (und damit indirekt die Wahrscheinlichkeit) inVerbindung mit dem linearen Pradiktor gebracht.Die Linkfunktion hat die Form der logistischen Funktion ln(p/(1− p)).

44

Page 45: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

Wie dieser Zusammenhang ist, zeigt die folgende Grafik:

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

−4 −2 0 2 4

0.0

0.2

0.4

0.6

0.8

1.0

Logistische Funktion

Linearer Praediktor

P

Mit steigendem linearen Pradiktor steigt auch die Wahrscheinlichkeit, der Zusammenhang istaber nicht linear. Die Linkfunktion garantiert auch, dass die prognostiziertenWahrscheinlichkeiten immer zwischen 0 und 1 liegen.

Damit sind die Elemente eines binaren logistischen Regressionsmodells genannt:

• Eine binare abhangige Variable

• Ein linearer Pradiktor, in den die erklarenden Variablen eingehen

• Die Linkfunktion

Es gibt auch Erweiterungen auf abhangige kategoriale Variable mit mehr als zwei Auspragungen,man spricht dann von multinomialer logistischer Regression. In diesem Text wird nurbinare logistische Regression behandelt.

Rechnerisch ist die Aufgabe nicht mehr (auch bei Kleinstdatensatzen) von Hand zu bewaltigen,man ist auf Rechenprogramme angewiesen.

Interpretation der Parameter

Ein wesentlicher Teil im Output von Rechenprogrammen sind die Schatzwerte fur dieKoeffizienten βk. Im Problemlosung - Intelligenz - Beispiel erhalt man

β0 = −24.56 β1 = 0.231

.Wie interpretiert man diese Werte?

• Der lineare Pradiktor hat die Form: −24.56 + 0.231 · IQ.

Die einzige erklarende Variable (IQ) geht positiv ein, je hoher der IQ desto hoher dieprognostizierte Wahrscheinlichkeit, dass das Problem gelost wird.

• Wie hoch ist die Prognose fur jemand mit IQ=100?

Der lineare Pradiktor ergibt −24.56 + 0.231 · 100 = −1.46

Somit gilt:

ln

(p

1− p

)= −1.46

Umformen des Ausdrucks fuhrt zu

p =e−1.46

1 + e−1.46= 0.1885

45

Page 46: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

• Wenn jemand mit IQ=100 die Aufgabe nicht gelost hatte (y=0), so ware die Abweichungvon Beobachtung und Prognose y − p = 0− 0.1885 = −0.1885.

Hatte jemand mit diesem IQ die Aufgabe gelost (y=1), ware die Abweichungy − p = 1− 0.1885 = 0.8115.

• Der nachste Plot zeigt den Zusammenhang zwischen IQ und den vorhergesagten Werten:

● ● ● ● ● ● ● ● ● ●

● ● ● ● ● ● ● ● ● ● ● ● ● ● ●

95 100 105 110 115 120 125

0.0

0.2

0.4

0.6

0.8

1.0

IQ−Problemloesung

IQ

fitte

d va

lues

Modellbeurteilung

Bei linearen Regressionsmodellen gibt es das Bestimmtheitsmaß R2 und den F-Test zurUberprufung, ob uberhaupt eine der erklarenden Variablen von Bedeutung ist. Zur Beurteilungder einzelnen erklarenden Variablen werden t-Tests heran gezogen.

Bei der logistischen Regression wird zur Beurteilung des Gesamtmodells die Devianz verwendet.Sie soll die Abweichung des Modells von den Daten zahlenmaßig angeben. Im Fall, dass jedeBeobachtung exakt prognostiziert wird (was bei der logistischen Regression rechnerisch nie derFall sein kann), ist die Devianz gleich 0. Je schlechter die prognostizierten Werte, desto hoher sollder Wert der Devianz ausfallen.

Die Devianz des aktuellen Modells wird mit der Devianz des Nullmodells (nur eine Konstante alslinearer Pradiktor) verglichen. Ist der Unterschied groß, hat es sich gelohnt eine oder mehrereerklarende Variable ins Modell aufzunehmen. Ist der Unterschied nur gering, hat sich dieserAufwand nicht gelohnt. Der Unterschied zwischen der Devianz des Null- und des aktuellenModells ist asymptotisch χ2-verteilt.

Ist das Gesamtmodell signifikant, werden die einzelnen erklarenden Variablen uberpruft. In Rwerden p-Werte aus einem z-Test, in SPSS p-Werte aus einem Wald-Test ausgegeben. KleineUnterschiede in diesen p-Werten konnen vorkommen.

4.2.2 Eine metrische erklarende Variable

Beispiel: Problemlosen und IntelligenzVon diesem Beispiel, das als Einstiegsbeispiel in die logistische Regression gedient hatte, wird derR-Output als Ganzes vorgestellt.

Call:

glm(formula = y ~ iq, family = binomial)

Deviance Residuals:

Min 1Q Median 3Q Max

-2.065 -0.716 0.288 0.764 1.516

46

Page 47: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

Coefficients:

Estimate Std. Error z value Pr(>|z|)

(Intercept) -24.567 10.417 -2.36 0.018

iq 0.231 0.097 2.38 0.017

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 33.651 on 24 degrees of freedom

Residual deviance: 24.167 on 23 degrees of freedom

AIC: 28.17

Number of Fisher Scoring iterations: 5

Interpretation:

• Aus dem Koeffizientenblock konnen die geschatzten Werte fur β0 und β1 und somit dieForm des linearen Pradiktors abgelesen werden.

Uber den p-Wert fur die erklarende Variable (iq) kann auf die Signikanz der erklarendenVariablen geschlossen werden.

• Die Devianz fallt von 33.65 auf 24.17, das ist ein Unterschied von fast 9.5 und bei einem

Freiheitsgrad (Q(χ2)1 (0.95) = 3.84) signifikant.

4.2.3 Eine kategoriale erklarende Variable

Ein Faktor mit zwei Stufen

Beispiel: Verkaufsfordernde Maßnahmen

Noch einmal das aus dem vorigen Kapitel bekannte Beispiel mit der Unterscheidung DinnerParty vs. Vertreterbesuch bei der Vorstellung eines neuen Medikaments.

Promotion

Anwendung Dinner Party Vertreter

Ja 58 47

Nein 23 38

Forschungsfrage: Wird das Medikament signifikant ofter angewendet, wenn es bei einemspeziellen Abendessen angewendet wird?

Dieses Beispiel kann auch mit der logistischen Regression bearbeitet werden. Ob das Medikamentverwendet wird, ist die abhangige Variable. Die Art, wie das Medikament vorgestellt wurde,dient als erklarende Variable.

Output aus R:

Call:

glm(formula = try ~ promotion, family = binomial)

Deviance Residuals:

Min 1Q Median 3Q Max

-1.587 -1.269 0.817 1.089 1.089

47

Page 48: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

Coefficients:

Estimate Std. Error z value Pr(>|z|)

(Intercept) 0.925 0.246 3.75 0.00017

promotionVertreter -0.712 0.329 -2.16 0.03042

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 218.32 on 165 degrees of freedom

Residual deviance: 213.54 on 164 degrees of freedom

AIC: 217.5

Number of Fisher Scoring iterations: 4

Interpretation:

• Vom Faktor Promotion wurde Dinner Party als Referenzkategorie gewahlt (er kommt inder Liste der erklarenden Variablen nicht vor).

• Die Auswahl der Referenzkategorie ist von Programmpaket zu Programmpaket nichteinheitlich. Manche nehmen die letzte, manche die erste Kategorie.

• Die Variable fur Kategorie Promotion ist signifikant (p-Wert unter 5%), somitunterscheiden sich die beiden Kategorien signifikant.

• Im Vergleich dazu sind die Chancen fur die Kategorie Vertreter schlechter (Koeffizientnegativ). Das Odds Ratio von Vertreter verglichen mit Dinner Party ist:

ORV e,DP = e−0.712 = 0.4907

• Das Odds Ratio von Dinner Party verglichen mit Vertreter ware demnach:

ORDP,V e = e0.712 = 1/0.4907 = 2.038

• Die Devianz ist von 218.32 (Null deviance) auf 213.54 (Residual deviance) gesunken. Das isteine Differenz von 4.78 bei Verlust eines Freiheitsgrades. Diese Differenz ist approximativ

χ2-verteilt, hier bei einem Freiheitsgrad (Q(χ2)1 (0.95) = 3.84). Das bedeutet, die Aufnahme

von des Faktors Promotion hat zu einer signifikanten Verbesserung des Modells gefuhrt.

Output aus SPSS:Der Output nach einer Berechnung des Modells mit SPSS ist in der Reihenfolge etwas anders.

• Zuerst kommt der Ruckgang in der Devianz (wie vorhin 4.78):

• Dann folgen Versuche, ahnliche Maße wie das multiple Bestimmtheitsmaß (R2) derMehrfachregression in der logistischen Regression einzufuhren. Hier seien sie ohne

48

Page 49: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

Kommentar angegeben (bei einem zweistufigen Faktor als einziger erklarenden Variablen

konnen sie nicht hoch sein.

• Zum Schluss die Parameterschatzer

SPSSgibt Parameterschatzer fur die Konstante und vom Faktor Promotion die mit 1 codierteStufe (= Dinner Party) an. Daraus kann geschlossen werden, dass SPSS die andere Stufe(= Vertreter) als Referenzkategorie gewahlt hat.

Aufgrund der anderen Wahl der Referenzkategorie hat der lineare Pradiktor ein anderesAussehen, fuhrt aber zum selben Ergebnis:

ln

(pDP

1− pDP

)= 0.213 + 0.712 = 0.925

Ein Faktor mit mehr als zwei Stufen

Beispiel: Sonderausstattung bei Autos

Personen verschiedener Altersgruppen wurden um Bewertungen fur Sonderausstattungen(hauptsachlich Klimaanalge) beim Autokauf gebeten.

Forschungsfrage: Hangt die Wichtigkeit der Ausstattung eines Autos mit einer Klimaanlagefur die Entscheidung beim Autokauf vom Alter der Kaufer ab?

18−23 24−40 > 40

wichtigunwichtig

Klimaanlage im Auto

rela

tive

Häu

figke

iten

0.0

0.2

0.4

0.6

0.8

1.0

49

Page 50: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

alter

Bedeutung 18-23 24-40 > 40

unwichtig 66 26 13

wichtig 44 63 88

Sowohl die Tabelle als auch das Balkendiagramm vermitteln den Eindruck, dass mit steigendemAlter einer Klimaanlage im Auto hohere Bedeutung zugemessen wird. Der prinzipielleUnterschied zum vorigen Beispiel ist, dass der Faktor Alter nicht zweistufig (wie Promotion imvorigen Beispiel) sondern dreistufig ist. Es werden damit Parameter fur zwei Dummyvariablengeschatzt.

Call:

glm(formula = Bedeutung ~ alter, family = binomial)

Deviance Residuals:

Min 1Q Median 3Q Max

-2.025 -1.011 0.525 0.831 1.354

Coefficients:

Estimate Std. Error z value Pr(>|z|)

(Intercept) -0.405 0.195 -2.08 0.037

alter24-40 1.291 0.304 4.25 2.1e-05

alter > 40 2.318 0.355 6.53 6.8e-11

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 388.47 on 299 degrees of freedom

Residual deviance: 333.14 on 297 degrees of freedom

AIC: 339.1

Number of Fisher Scoring iterations: 4

Interpretation:

• Vom Faktor Alter wurde 18-23 als Referenzkategorie gewahlt.

• Beide anderen Kategorien von Alter unterscheiden sich signifikant (sehr kleine p-Werte)von dieser Refernzkategorie.

• Im Vergleich zur Referenzkategorie sind die Chancen, dass die Klimaanlage als wichtigeingestuft wird, fur die Kategorie 24-40 hoher (Koeffizient positiv). Das Odds Ratio :

OR18−23,24−40 = e1.291 = 3.64

Die Chance, dass 24-40-Jahrige eine Klimaanlage als wichtig einstufen als wichtig einstufen,ist also 3.64 hoher als bei 18-23-Jahrigen.

• Ahnlich fur die Gruppe 40+:

OR18−23,40+ = e2.318 = 10.16

• Die Devianz fallt von 388.47 (Null deviance) auf 333.14 (Residual deviance). Das ist eine

Differenz von 55.33 bei Verlust von zwei Freiheitsgraden. (Q(χ2)2 (0.95) = 5.99). Das

bedeutet, die Aufnahme von des Faktors Alter hat zu einer signifikanten Verbesserung desModells gefuhrt.

50

Page 51: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

4.2.4 Mehrere erklarende Variable

Beispiel: Verkehrsmittelwahl

Eine Zufallsstichprobe von 80 Beschaftigten in einem Einkaufszentrum ist in einem Datenfilegegeben. Alle Beschaftigten hatten sowohl Zugriff zu einem Auto als auch vertretbare Fahrzeitenmit offentlichen Verkehrsmitteln. Neben der gewahlten Verkehrsalternative sind weitere,moglicherweise (mit-)bestimmende Variablen gegeben:

Variable BedeutungTransport Art, wie zum Arbeitsplatz gefahren wird

1 = Auto, 0 = Offentlicher VerkehrAlter Alter (in Jahren)Sex Geschlecht (1=Mann, 2=Frau)Dist Distanz zwischen Wohnung und Arbeitsplatz (in km)

Forschungsfrage: Was sind Faktoren, die die Verkehrsmittelwahl fur die Fahrt von und zumArbeitsplatz bestimmen oder zumindest beeinflussen?Man finde ein geeignetes Modell fur die Verkehrsmittelwahl.

Die Fragestellung passt in das Konzept der logistischen Regression. Es gibt eine abhangigeVariable Transport und in diesem Fall drei erklarende Variable, von denen Sex kategorial ist.

Ein erster Versuch fuhrt zu folgendem (Zwischen-)Ergebnis:

Call:

glm(formula = Transport ~ Alter + Sex + Dist, family = binomial)

Deviance Residuals:

Min 1Q Median 3Q Max

-2.217 -0.976 0.561 0.853 1.641

Coefficients:

Estimate Std. Error z value Pr(>|z|)

(Intercept) -2.9969 1.2874 -2.33 0.0199

Alter 0.0572 0.0247 2.31 0.0207

SexFrau -0.7170 0.5523 -1.30 0.1942

Dist 0.1249 0.0431 2.90 0.0037

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 100.893 on 79 degrees of freedom

Residual deviance: 85.735 on 76 degrees of freedom

AIC: 93.73

Number of Fisher Scoring iterations: 4

51

Page 52: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

Wie ein Blick auf die Tabelle mit den Koeffizienten zeigt, ist der Faktor Sex nicht signifikant undwird aus dem Modell genommen:

Call:

glm(formula = Transport ~ Alter + Dist, family = binomial)

Deviance Residuals:

Min 1Q Median 3Q Max

-2.051 -1.013 0.546 0.831 1.765

Coefficients:

Estimate Std. Error z value Pr(>|z|)

(Intercept) -3.2917 1.2678 -2.60 0.0094

Alter 0.0611 0.0242 2.52 0.0117

Dist 0.1156 0.0418 2.76 0.0057

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 100.89 on 79 degrees of freedom

Residual deviance: 87.45 on 77 degrees of freedom

AIC: 93.45

Number of Fisher Scoring iterations: 4

4.2.5 Modell mit Wechselwirkung

Beispiel: Aggression im Straßenverkehr

In einem Feldexperiment wurde folgende Situation herbeigefuhrt: Mit einem “Versuchsfahrzeug“wurden nachfolgende Autos vor einer Ampel blockiert.

Beobachtet wurde das Verhalten (in diesem Beispiel nur das Hupen) der dadurch blockiertenAutofahrerInnen aber auch Charakteristika des Blockeurs (hier: Geschlecht der FahrerInnen, dieblockieren) und der Blockierten (hier: Autoklasse der Blockierten).

Einen Uberblick uber die Daten zu gewinnen, ist schon - es sind drei kategoriale Variable - weitschwieriger.

Hupen

Geschlecht Autoklasse Ja NeinMann Mittel/Oberkl. 15 17

Kleinwagen 14 16

Frau Mittel/Oberkl. 8 12Kleinwagen 19 5

Forschungsfrage: Wovon hangt das Verhalten der blockierten AutofahrerInnen ab?

Fur die grafische Beschreibung von drei oder vier kategorialen Variablen werden manchmalMosaikplots verwendet. Fur deren Interpretation benotigt man etwas Praxis.

52

Page 53: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

Aggression im Autoverkehr

Auto

Sex

Mittel/Oberklasse Kleinwagen

Man

nF

rau

Nein Ja Nein Ja

Fur die Beantwortung obiger Fragestellung ist die logistische Regression gut einsetzbar - dieabhangige Variable ist kategorial. Beide erklarenden Variablen sind ebenfalls kategorial.

Ware man nur daran interessiert, ob sich FahrerInnen von Kleinwagen anders verhalten alssolche von Wagen der Mittel- und Oberklasse bzw. ob man sich gegenuber Fahrern vonblockierenden Autos anders verhalt als gegenuber Fahrerinnen, ware eine normale logistsicheRegression angebracht, man ware nur an den Haupteffekten (main effects) interessiert.

Wie man aber schnell aus der 3-dimensionalen Kreuztabelle sieht, ist es hier aber so, dass im Falleines mannlichen Blockierers es kaum einen Zusammenhang zwischen Auto und Hupen gibt (OR= 0.99), bei einer Frau aber jedoch einen starken Zusammenhang (OR=5.7).

In Fallen, in denen sich die Starke des Zusammenhanges zwischen zwei Variablen (hier Hupenund Auto) stark in den Kategorien einer dritten Variablen (hier Sex) unterscheidet, genugt dasModell mit den Haupteffekten nicht, man benotigt die Wechselwirkung (interaction)zwischen den erklarenden Variablen. Hier folgt gleich der R-Output zum Wechselwirkungsmodell:

Call:

glm(formula = Hupen ~ Sex * Auto, family = binomial)

Deviance Residuals:

Min 1Q Median 3Q Max

-1.771 -1.121 0.683 1.231 1.354

Coefficients:

Estimate Std. Error z value Pr(>|z|)

(Intercept) -0.12516 0.35425 -0.35 0.724

SexFrau -0.28030 0.57777 -0.49 0.628

AutoKleinwagen -0.00837 0.50933 -0.02 0.987

SexFrau:AutoKleinwagen 1.74883 0.84875 2.06 0.039

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 146.61 on 105 degrees of freedom

Residual deviance: 137.18 on 102 degrees of freedom

AIC: 145.2

Number of Fisher Scoring iterations: 4

53

Page 54: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

Interpretation:

• Vom Faktor Sex wurde Mann als Referenzkategorie gewahlt.

• Vom Faktor Auto wurde Mittel/Oberklasse als Referenzkategorie gewahlt.

• Es gibt hier nur einen Koeffizienten fur die Wechselwirkung, da beide Faktoren nur zweiStufen haben. Bei I Stufen des einen und J Stufen des anderen Faktors gibt es(I − 1) · (J − 1) Koeffizienten fur die Wechselwirkung.

• Der Koeffizient fur die Wechselwirkung ist signifikant (p-Wert < 0.05).

• Der Koeffizient fur die Wechselwirkung ist positiv. Das bedeutet, dass FahrerInnen vonKleinwagen eher hupen, wenn den blockierenden Wagen eine Frau lenkt.

• Die Devianz nimmt von 146.61 auf 137.18 ab, das ist eine Abnahme von 9.43. Das ist bei 3

Freiheitsgraden signifikant (Q(χ2)3 (0.95) = 7.81).

• Inhaltliche Interpretation: Die Hupbereitschaft ist dann uberproportional hoch, wenneine Frau durch ihr Fahrverhalten einen Kleinwagen blockiert (“Kleine Hunde bellenFrauen an“).

Bemerkungen:

• Ist der Wechselwirkungeffekt signifikant, wird nur dieser interpretiert (unabhangig davon,ob die Haupteffekte signifikant sind oder nicht).

• Ist der Wechselwirkungeffekt nicht signifikant, werden die Haupteffekte interpretiert (mankann vorher das Modell noch einmal ohne Wechselwirkung berechnen).

• Das Vorgehen ist also ahnlich der Interpretation der Effekte in der zweifachenVarianzanalysde.

4.3 Beispiele

1. Lehrveranstaltungsbesuch

Der Besuch von Lehrveranstaltungen kostet Zeit und wird von Studierenden gern auf dasNotwendigste beschrankt. Allerdings wird durch aktive geistige Prasenz im Horsaal einGrundstein zur Erfassung und Verstandnis der Lehrinalte gelegt. Dieses Verstandnis ist ingewissen Fachern durch Selbststudium allein nur schwer zu erlangen.

In einem Kurs mit 170 Teilnehmern soll untersucht werden, ob Unterschiede imPrufungsergebnis zwischen jenen Studierenden, die regelmaßig die Kurse besucht haben,und jenen, die nur im Selbststudium gearbeitet haben, existieren. Ein Ergebnis, bei demnur zwischen Bestehen und Nichtbestehen der Prufung unterschieden wird, ist in folgenderTabelle zusammen gefasst:

Kurs + Vorbereitung nur Selbststudiumbestanden 79 55

nicht bestanden 12 24

Um zu untersuchen, ob die Chancen bei der Prufung anders (besser oder schlechter) sind,wenn die Kurse besucht werden, sollen das Odds-Ratio und ein Konfidenzintervall fur dasOdds-Ratio berechnet und entsprechend interpretiert werden.

2. Einkommenssteuerbescheid

Bei einer Untersuchung von Einspruchen gegen Einkommenssteuerbescheide furSelbststandige wurde unterschieden, ob die Steuererklarung von einem Steuerberater odervom Steuerpflichtigen selbst erstellt wurde.

54

Page 55: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

Steuerberater SelbstStattgegeben 68 22Abgewiesen 79 31

Es soll untersucht werden, ob die Chancen bei einem Einspruch anders (besser oderschlechter) sind, wenn die Einkommenssteuer (und auch der Einspruch dagegen) von einemSteuerberater verfasst wurde.

Man berechne das Odds Ratio (Chancenverhaltnis) und ein Konfidenzintervall fur dasOdds-Ratio.

Welche Schlusse kann man daraus hinsichtlich der eigentlichen Fragestellung ziehen?

3. Wartungsvertrag

Ein Autohandler bietet seinen Kunden in einem Wartungsvertrag ein 24-Stunden-Serviceinklusive Ersatzwagen an.

Die Daten enthalten Angaben zu:

Variable BedeutungKAUF Wartungsvertrag (0 = Nein, 1 = Ja)SEX Geschlecht (0 = Mann, 1 = Frau)ALTER Alter in JahrenGEHALT Jahreseinkommen (in 1000 Euro)

Zeigen die Daten einen wichtigen Faktor fur den Abschluss eines Wartungsvertrages?

Call:

glm(formula = KAUF ~ SEX + ALTER + GEHALT, family = binomial)

Deviance Residuals:

Min 1Q Median 3Q Max

-1.422 -0.790 -0.593 0.997 2.123

Coefficients:

Estimate Std. Error z value Pr(>|z|)

(Intercept) -3.36064 1.32045 -2.55 0.0109

SEXFrau 1.54374 0.49583 3.11 0.0018

ALTER 0.05384 0.03184 1.69 0.0909

GEHALT -0.00904 0.02735 -0.33 0.7410

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 141.16 on 119 degrees of freedom

Residual deviance: 128.83 on 116 degrees of freedom

AIC: 136.8

Number of Fisher Scoring iterations: 4

55

Page 56: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

4. Wahlverhalten: Reagan - Carter

Mehr als 900 Beobachtungen aus dem 1982 General Social Survey, betreffend diePrasidentschaftswahl 1980, wurden uber eine logistische Regression ausgewertet.

Variable BedeutungVOTE Wahlverhalten bei den Prasidentschaftswahlen 1980

(1 = Reagan, 2 = Carter oder andere)RACE Hautfarbe (1 = weiß, 2 = nicht weiß)POLVIEW Politische Einstellung

(1 = extrem liberal bis 7 = extrem konservativ)

Interpretieren Sie den SPSS-Output (Referenzkategorie von Vote war Reagan).

5. Prufungserfolg

Was beeinflusst den Prufungserfolg? Folgende Variablen wurden bei 70 Studierendenerhoben.

Variable BedeutungPruefung Prufung bestanden

(0 = nein, 1 = ja)Lernpensum Ausmaß der Prufungsvorbereitung (in Stunden)Vorlesungsbesuch wurde regelmaßig die Vorlesung besucht

(0 = nein, 1 = ja)

SPSS sorgt mit der Prozedur Multinomial logistische Regression fur folgendenOutput:

56

Page 57: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

Interpretieren Sie den Output, man beachte die Auswahl der Referenzkategorien!

6. Fußganger

In einer Untersuchung uber das Verhalten von Fußgangern bei Kreuzungen wurdenfolgende Variablen beobachtet:

Variable BedeutungRot Geht bei Rot uber die Kreuzung (0=Nein, 1=Ja)Sex Geschlecht (1 = Mann, 2 = Frau)Alter Alter kategorial (1 = jung, 2 = alt)

Bei Rot uber die Kreuzung

Geschlecht Alter Ja NeinMann jung 18 8

alt 11 18

Frau jung 19 11alt 10 25

Call:

glm(formula = Rot ~ Sex * Alter, family = binomial)

Deviance Residuals:

Min 1Q Median 3Q Max

-1.535 -0.977 -0.820 0.956 1.583

Coefficients:

Estimate Std. Error z value Pr(>|z|)

(Intercept) 0.811 0.425 1.91 0.056

SexFrau -0.264 0.569 -0.46 0.642

Alteralt -1.303 0.572 -2.28 0.023

SexFrau:Alteralt -0.159 0.781 -0.20 0.838

57

Page 58: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 166.22 on 119 degrees of freedom

Residual deviance: 151.90 on 116 degrees of freedom

AIC: 159.9

Number of Fisher Scoring iterations: 4

Interpretieren Sie das Ergebnis!

58

Page 59: Kategoriale Daten - Persönliche Webseitenhomepage.univie.ac.at/herbert.nagel/KategorialeDaten.pdf · Kategoriale Daten Herbert Nagel Skriptum zum Kurs Wirtschaftsstatistik 2 an der

Anhang A

Literatur

Nicht in alphabetischer Reihenfolge, sondern nach Brauchbarkeit fur dieses Thema sind einigeTitel mit einer Kurzbeschreibung aufgelistet.

Hatzinger R., Nagel H.(2013) : Statistik mit SPSS: Fallbeispiele und Methoden (2.Auflage). Pearson Studium, Munchen

Einfuhrung in die Statistik durch Fallbeispiele. Diese sind mit SPSS ausgearbeitet undwerden ausfuhrlich interpretiert.

Hatzinger R., Hornik K., Maier M., Nagel H.(2014) : R-Einfuhrung durch angewandteStatistik (2. Auflage). Pearson Studium, Munchen

Einfuhrung in die Statistik durch Fallbeispiele. Diese sind mit SPSS ausgearbeitet undwerden ausfuhrlich interpretiert.

Brannath W., Futschik A., Krall C. (2010) : Statistik fur Wirtschaftswissenschaftler.WUV, Wien

Grundlagenliteratur zu Statistik am BWZ

Agresti A.(2013) : Categorical Data Analysis (3rd ed.). Wiley, New York.

Gilt als Bibel fur die Analyse kategorialer Daten

Backhaus K.,Erichson B.,Plinke W.,Weber R.(2010) : Multivariate Analysemethoden.Springer, Berlin

Komplexe Methoden mit starkem SPSS -Bezug (Screenshots von Eingabe-Menus undSPSS-Output)

Verzani J.(2004) : Using R for Introductory Statistics. Chapman and Hall, London

R als Lernsoftware fur Statistik

59