Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick...

69
Einf¨ uhrung Deskriptive Statistik mit Stata Zusammenfassung Einf¨ uhrung Statistik II Statistik II Einf¨ uhrung (1/50)

Transcript of Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick...

Page 1: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Einfuhrung

Statistik II

Statistik II Einfuhrung (1/50)

Page 2: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

EinfuhrungUberblickWiederholungStatistiksoftware

Deskriptive Statistik mit StataTabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Kategoriale DatenKontinuierliche Daten

Zusammenfassung

Statistik II Einfuhrung (2/50)

Page 3: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

UberblickWiederholungStatistiksoftware

Worum geht es hier?

I Eine von zwei zentralen Vorlesungen im Aufbaumodul I

I Fur BA-Kernfach

I Vertiefung und Erweiterung der Grundkenntnisse

I Plus praktische Anwendung

I Berufsqualifizierende Ubung (am Computer) zur Vorlesung(verpflichtend)

I Weitere Bestandteile des Moduls: VL Methoden II + SeminarBerufsfeldqualifikation (z. B. Theorie der Umfrageforschung)+ Ubung

”Anwendung von Forschungsmethoden“ (z. B.

Auswertung von Mikro-Daten)

I Gemeinsame Klausur fur Statistik II/Methoden II

Statistik II Einfuhrung (3/50)

Page 4: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

UberblickWiederholungStatistiksoftware

Worum geht es hier?

I Eine von zwei zentralen Vorlesungen im Aufbaumodul I

I Fur BA-Kernfach

I Vertiefung und Erweiterung der Grundkenntnisse

I Plus praktische Anwendung

I Berufsqualifizierende Ubung (am Computer) zur Vorlesung(verpflichtend)

I Weitere Bestandteile des Moduls: VL Methoden II + SeminarBerufsfeldqualifikation (z. B. Theorie der Umfrageforschung)+ Ubung

”Anwendung von Forschungsmethoden“ (z. B.

Auswertung von Mikro-Daten)

I Gemeinsame Klausur fur Statistik II/Methoden II

Statistik II Einfuhrung (3/50)

Page 5: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

UberblickWiederholungStatistiksoftware

Worum geht es hier?

I Eine von zwei zentralen Vorlesungen im Aufbaumodul I

I Fur BA-Kernfach

I Vertiefung und Erweiterung der Grundkenntnisse

I Plus praktische Anwendung

I Berufsqualifizierende Ubung (am Computer) zur Vorlesung(verpflichtend)

I Weitere Bestandteile des Moduls: VL Methoden II + SeminarBerufsfeldqualifikation (z. B. Theorie der Umfrageforschung)+ Ubung

”Anwendung von Forschungsmethoden“ (z. B.

Auswertung von Mikro-Daten)

I Gemeinsame Klausur fur Statistik II/Methoden II

Statistik II Einfuhrung (3/50)

Page 6: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

UberblickWiederholungStatistiksoftware

Literatur etc.

I Mehr Lehrbucher:I Fox, John: Applied regression analysis,

linear models, and related methods(2008)

I Gelman, Andrew & Hill, Jennifer: DataAnalysis Using Regression andMultilevel/Hierarchical Models

I Kennedy, Peter: A Guide toEconometrics (5e)

I Wooldridge, Jefferey: IntroductoryEconometrics

I Homepage: http://kai-arzheimer.com/Statistik-II/

Statistik II Einfuhrung (4/50)

Page 7: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

UberblickWiederholungStatistiksoftware

Literatur etc.

I Mehr Lehrbucher:I Fox, John: Applied regression analysis,

linear models, and related methods(2008)

I Gelman, Andrew & Hill, Jennifer: DataAnalysis Using Regression andMultilevel/Hierarchical Models

I Kennedy, Peter: A Guide toEconometrics (5e)

I Wooldridge, Jefferey: IntroductoryEconometrics

I Homepage: http://kai-arzheimer.com/Statistik-II/

Statistik II Einfuhrung (4/50)

Page 8: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

UberblickWiederholungStatistiksoftware

Nachschlagewerke Mathematik

I Fox, John: A mathematical primer forsocial statistics.

I Gill, J.: Essential Mathematics forPolitical and Social Research.

Statistik II Einfuhrung (5/50)

Page 9: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

UberblickWiederholungStatistiksoftware

Nach-/Vorbereitung

I Weitere Literatur im ReaderPlus Nr. 7850

I Registrierunschlussel STATA

I Fur heute: Kohler/Kreuter Seite 7-28, https://www.zdv.uni-mainz.de/readerplus/mav/1/miv/0/nph-ld/14545/

31197.07803!1!1256220117!/document.pdf?Log=1

I Außerdem: Kohler/Kreuter Seite 145-157,https://www.zdv.uni-mainz.de/readerplus/mav/1/

miv/0/nph-ld/14545/31197.07803!1!1256220610!

/document.pdf?Log=1

I Fur nachste Woche: in Kohler/Kreuter stobern

Statistik II Einfuhrung (6/50)

Page 10: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

UberblickWiederholungStatistiksoftware

Was steht auf dem Programm?

Vorlesung Inhalt

1 Wiederholung, Stata, Deskriptive Statistik2 Mittelwerte, Zusammenhangsmaße, Hypothesentests

in Stata3 Was ist Regression?4 Partielle Korrelation, Drittvariablenkontrolle5 Signifikanztests, Gewichtung, Multikollinearitat und

Kohortenanalyse6 ANOVA, Transformationen7 Schatzverfahren, Annahmen, Verletzungen

Statistik II Einfuhrung (7/50)

Page 11: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

UberblickWiederholungStatistiksoftware

Was steht auf dem Programm? II

Vorlesung Inhalt

8+9 Einfuhrung Logit und Probit10 Multinomiale Logitmodelle11 Einfuhrung Count/Event Data12 Einfuhrung Zeitreihen13 Einfuhrung Panel/TSCS14 Einfuhrung Faktorenanalyse15 Reserve/Wiederholung

Statistik II Einfuhrung (8/50)

Page 12: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

UberblickWiederholungStatistiksoftware

Was sind Daten?

I Empirische Beobachtungen/Messungen an einem politischenObjekt (z.B. Person, Staat, Parteiprogramm, Parlament)

I QuantitativI Verschiedene

”Skalenniveaus“

1. Ratio-Skalen2. Intervall-Skalen3. Ordinal-Skalen4. Nominal-Skalen

I Speicherung auf Tontafeln/Papyrus/Papier (fruher)

I Heute mit Computer (Lochkarten, Magnetbander, Festplatten,CD/DVD . . . )

Statistik II Einfuhrung (9/50)

Page 13: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

UberblickWiederholungStatistiksoftware

Die Welt fruher: Lochkarten

Statistik II Einfuhrung (10/50)

Page 14: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

UberblickWiederholungStatistiksoftware

Was ist eine”(Roh)datenmatrix“?

I”Rohe“ (nicht-bearbeitete) Meßwerte → Tabelle

I Speicherung intern und auf Festplatte/Speichermedium(Datei/Format)

1. Zeilen =”Falle“ (Untersuchungsobjekt = Personen, Lander,

Departements etc.)

2. Spalten =”Variablen“ (Eigenschaft = Nationalitat, Links-

Rechts-Wert etc.)

Statistik II Einfuhrung (11/50)

Page 15: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

UberblickWiederholungStatistiksoftware

Wie kommen die Daten in den Computer?

I Fruher: pencil & paper →Eingabe von Hand (Fehler)

I Heute: (oft) CAPI/CATI, Web oder Datenbanken→

”maschinenlesbare“ Daten

I Aber: Vielzahl von Formaten (Arbeit + Fehler)

I Unzahl von verschiedenen logischen Formaten z. B. fur Zeitund Datum (1. November 2009, 01/11/09, 11/01/2009, Nov1 2009 . . . )

I Unterschiedliche physische Speicherkonventionen (Unix vs.DOS/Windows, 32/64 bit, big-endian/little-endian)

I Vielzahl von Programmen mit (proprietaren) Formaten(logischer Aufbau der Dateien im Computer)

Statistik II Einfuhrung (12/50)

Page 16: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

UberblickWiederholungStatistiksoftware

Wie kommen die Daten in den Computer?

I Fruher: pencil & paper →Eingabe von Hand (Fehler)

I Heute: (oft) CAPI/CATI, Web oder Datenbanken→

”maschinenlesbare“ Daten

I Aber: Vielzahl von Formaten (Arbeit + Fehler)

I Unzahl von verschiedenen logischen Formaten z. B. fur Zeitund Datum (1. November 2009, 01/11/09, 11/01/2009, Nov1 2009 . . . )

I Unterschiedliche physische Speicherkonventionen (Unix vs.DOS/Windows, 32/64 bit, big-endian/little-endian)

I Vielzahl von Programmen mit (proprietaren) Formaten(logischer Aufbau der Dateien im Computer)

Statistik II Einfuhrung (12/50)

Page 17: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

UberblickWiederholungStatistiksoftware

Wie kommen die Daten in den Computer?

I Fruher: pencil & paper →Eingabe von Hand (Fehler)

I Heute: (oft) CAPI/CATI, Web oder Datenbanken→

”maschinenlesbare“ Daten

I Aber: Vielzahl von Formaten (Arbeit + Fehler)

I Unzahl von verschiedenen logischen Formaten z. B. fur Zeitund Datum (1. November 2009, 01/11/09, 11/01/2009, Nov1 2009 . . . )

I Unterschiedliche physische Speicherkonventionen (Unix vs.DOS/Windows, 32/64 bit, big-endian/little-endian)

I Vielzahl von Programmen mit (proprietaren) Formaten(logischer Aufbau der Dateien im Computer)

Statistik II Einfuhrung (12/50)

Page 18: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

UberblickWiederholungStatistiksoftware

Was sind die wichtigen maschinenlesbaren Formate?

1. Generische (Text) FormateI ASCI (frei, fest, komma-separiert)I Extension z. B. *.txt, *.dat, *.csv

2. Proprietare (binare) FormateI Excel (*.xls)I SPSS (*.sav, *.por)I Stata (*.dta)I . . .

I (Fast) alle Programme lesen Textformate

I Probleme: Ineffizient (Dateigroße), Details

I Proprietare Formate erfordernKonversionsprogramme/-routinen

I Probleme: Details, konzeptuelle Unterschiede (z. B. missingvalues)

Statistik II Einfuhrung (13/50)

Page 19: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

UberblickWiederholungStatistiksoftware

Wozu braucht man ein Statistikprogramm?

1. Zugriff auf Daten

2. Verwaltung von DatenI Auffinden von InformationenI Kombinieren von Daten aus verschiedenen QuellenI Kontrolliertes Verandern/Kopieren von Rohdaten +

Dokumentation →Skriptfahigkeit

3. Reproduzierbare Analyse von Daten →Skriptfahigkeit

4. Erstellen von Grafiken und Tabellen →Skriptfahigkeitwunschenswert

Statistik II Einfuhrung (14/50)

Page 20: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

UberblickWiederholungStatistiksoftware

Welche wichtigen Programme gibt es?

1. Spezielle Programme fur besondere Verfahren:I AMOS, Lisrel, MPlus, MlwinI Interoperabilitat, beschrankte Moglichkeiten zur

Datenverwaltung2. Generelle Programme fur (fast) alle Aufgaben

I Excel (nicht wirklich)I SAS (Dinosaurier, in manchen kommerziellen Bereichen)I SPSS (point & click, Marktforschung, noch an Universitaten)I R (open source, Programmiersprache, an Hochschulen in

fortgeschrittenen Bereichen)I Stata (zunehmend in Wirtschafts- und Sozialwissenschaften)

I Vorteile von Stata

I Kann (fast) alles, was man bis zur Promotion brauchtI Hervorragende Dokumentation, aktive NutzergemeinschaftI Relativ leicht programmier- und erweiterbarI Wer Stata kann, lernt sehr schnell SPSS

Statistik II Einfuhrung (15/50)

Page 21: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

UberblickWiederholungStatistiksoftware

Welche wichtigen Programme gibt es?

1. Spezielle Programme fur besondere Verfahren:I AMOS, Lisrel, MPlus, MlwinI Interoperabilitat, beschrankte Moglichkeiten zur

Datenverwaltung2. Generelle Programme fur (fast) alle Aufgaben

I Excel (nicht wirklich)I SAS (Dinosaurier, in manchen kommerziellen Bereichen)I SPSS (point & click, Marktforschung, noch an Universitaten)I R (open source, Programmiersprache, an Hochschulen in

fortgeschrittenen Bereichen)I Stata (zunehmend in Wirtschafts- und Sozialwissenschaften)

I Vorteile von StataI Kann (fast) alles, was man bis zur Promotion brauchtI Hervorragende Dokumentation, aktive NutzergemeinschaftI Relativ leicht programmier- und erweiterbarI Wer Stata kann, lernt sehr schnell SPSS

Statistik II Einfuhrung (15/50)

Page 22: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

UberblickWiederholungStatistiksoftware

Wie kann man Stata benutzen?

I Anmelden auf Windows-Terminalserverts.zdv.uni-mainz.de (aus PC-Pool oder von zu Hause,Erlauterung: http://www.zdv.uni-mainz.de/3222.php)

I Stata aus Start-Menu auswahlen

I Befehle per Menu/Eingabebox oder uber Eingabezeile(bevorzugt) eingeben

I Befehle und Variablennamen konnen abgekurzt werden

I Ausfuhren → Return-Taste; Befehle mussen nicht mit Punkt,Komma oder Semikolon abgeschlossen werden

I Komplexere Befehle per Editorbearbeiten/speichern/ausfuhren → *.do-Files

I Ein- und Ausgaben konnen protokolliert werden →Reproduzierbarkeit und Automatisierung

Statistik II Einfuhrung (16/50)

Page 23: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

UberblickWiederholungStatistiksoftware

Stata gestartet

Statistik II Einfuhrung (17/50)

Page 24: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

UberblickWiederholungStatistiksoftware

Interaktivitat

I Datensatze und Kommandodateien stehen uber die Homepagezur Verfugung

I Zugriff ist aus Stata heraus moglich

I net from

http://www.kai-arzheimer.com/Statistik-II/stata/

I Per Klicken oder per net get allbus2008 kann das Paketallbus2008 geladen und lokal installiert werden

I Das Paket enthalt eine Version des ALLBUS 2008 sowie eine*.do Datei mit Kommandos

Statistik II Einfuhrung (18/50)

Page 25: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

UberblickWiederholungStatistiksoftware

Paket zur Vorlesung

Statistik II Einfuhrung (19/50)

Page 26: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

UberblickWiederholungStatistiksoftware

Interaktivitat

I Datensatze und Kommandodateien stehen uber die Homepagezur Verfugung

I Zugriff ist aus Stata heraus moglich

I net from

http://www.kai-arzheimer.com/Statistik-II/stata/

I Per Klicken oder per net get allbus2008 kann das Paketallbus2008 geladen und lokal installiert werden

I Das Paket enthalt eine Version des ALLBUS 2008 sowie eine*.do Datei mit Kommandos

Statistik II Einfuhrung (20/50)

Page 27: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

UberblickWiederholungStatistiksoftware

Aufbau eines Stata-Befehls

I Viele optionale Komponenten, aber einfache Struktur

[by varlist:] command [varlist] [in range] [if exp]

[filename], [options]

I by...: – Befehl fur Subgruppen wiederholen

I varlist – Befehl auf diese Variablen anwenden

I range – Befehl auf Gruppe von Fallen anwenden (Reihenfolge)

I if – Befehl auf Gruppe von Fallen anwenden (logischeBedingung)

I filename – Dateinamen (oft mit using eingeleitet)

I , options – Optionen fur Befehl festlegen

use allbus2008, clear

Statistik II Einfuhrung (21/50)

Page 28: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Was ist der ALLBUS 2008?

I”Allgemeine Bevolkerungsumfrage der Sozialwissenschaften“

(+ISSP)

I”Goldstandard“

I Mehr-Themen-Befragung, seit 1980 alle zwei Jahre mit neuenBefragten wiederholt

I Regelmaßige Replikation einzelner Fragenblocke

I Design?I Themen 2008 u. a.

I Politische Einstellungen, politische Partizipation, politischeEntfremdung und Protest

I Staatsburgerschaft, Herkunft, NationalstolzI MedienI Soziales Kapital und FreizeitI Wirtschaft

Statistik II Einfuhrung (22/50)

Page 29: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Haufigkeitstabellen

I Wie haufig kommen einzelne Kategorien einer Variablen vor?

I Z. B. Straftater harter bestrafen?

I Wie findet man die passende Variable?

I describe

I Besser: lookfor straf

I Label = Etikett fur interne WerteI VariablennamenI Numerische Werte von Variablen

I Gesuchte Variable: v26

I Haufigkeitstabelle: tabulate v26 oder tab v26

Statistik II Einfuhrung (23/50)

Page 30: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Allbus Fragebogen

Statistik II Einfuhrung (24/50)

Page 31: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Haufigkeitstabellen

I Wie haufig kommen einzelne Kategorien einer Variablen vor?

I Z. B. Straftater harter bestrafen?

I Wie findet man die passende Variable?

I describe

I Besser: lookfor straf

I Label = Etikett fur interne WerteI VariablennamenI Numerische Werte von Variablen

I Gesuchte Variable: v26

I Haufigkeitstabelle: tabulate v26 oder tab v26

Statistik II Einfuhrung (25/50)

Page 32: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

describe

Statistik II Einfuhrung (26/50)

Page 33: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Haufigkeitstabellen

I Wie haufig kommen einzelne Kategorien einer Variablen vor?

I Z. B. Straftater harter bestrafen?

I Wie findet man die passende Variable?

I describe

I Besser: lookfor straf

I Label = Etikett fur interne WerteI VariablennamenI Numerische Werte von Variablen

I Gesuchte Variable: v26

I Haufigkeitstabelle: tabulate v26 oder tab v26

Statistik II Einfuhrung (27/50)

Page 34: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

lookfor straf

Statistik II Einfuhrung (28/50)

Page 35: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Haufigkeitstabellen

I Wie haufig kommen einzelne Kategorien einer Variablen vor?

I Z. B. Straftater harter bestrafen?

I Wie findet man die passende Variable?

I describe

I Besser: lookfor straf

I Label = Etikett fur interne WerteI VariablennamenI Numerische Werte von Variablen

I Gesuchte Variable: v26

I Haufigkeitstabelle: tabulate v26 oder tab v26

Statistik II Einfuhrung (29/50)

Page 36: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Haufigkeiten: Hartere Strafen

. tab v26

HAERTERE STRAFENFUER STRAFTAETER? Freq. Percent Cum.

STIMME VOLL ZU 1,882 54.25 54.25STIMME EHER ZU 781 22.51 76.77

WEDER NOCH 429 12.37 89.13STIMME EHER NICHT ZU 210 6.05 95.19STIMME GAR NICHT ZU 91 2.62 97.81

WEISS NICHT 62 1.79 99.60KEINE ANGABE 14 0.40 100.00

Total 3,469 100.00

Statistik II Einfuhrung (30/50)

Page 37: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Haufigkeiten: Hartere Strafen

. lab list v26v26:

1. STIMME VOLL ZU2. STIMME EHER ZU3. WEDER NOCH4. STIMME EHER NICHT ZU5. STIMME GAR NICHT ZU8. WEISS NICHT9. KEINE ANGABE

. tab v26 if v26<8

HAERTERE STRAFEN FUERSTRAFTAETER? Freq. Percent Cum.

1. STIMME VOLL ZU 1,882 55.47 55.472. STIMME EHER ZU 781 23.02 78.49

3. WEDER NOCH 429 12.64 91.134. STIMME EHER NICHT ZU 210 6.19 97.325. STIMME GAR NICHT ZU 91 2.68 100.00

Total 3,393 100.00

Gibt es Unterschiede zwischen den Geschlechtern?

Statistik II Einfuhrung (30/50)

Page 38: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Haufigkeiten: Hartere Strafen

. lookfor geschl

storage display valuevariable name type format label variable label

v24 byte %10.0g v24 ANERKENNUNGGLEICHGESCHLECHTLICHER EHEN?

v151 byte %10.0g v151 GESCHLECHT, BEFRAGTE<R>

. tab v151

GESCHLECHT,BEFRAGTE<R> Freq. Percent Cum.

MANN 1,712 49.35 49.35FRAU 1,757 50.65 100.00

Total 3,469 100.00

. tab v26 v151

GESCHLECHT,HAERTERE STRAFEN BEFRAGTE<R>

FUER STRAFTAETER? MANN FRAU Total

STIMME VOLL ZU 876 1,006 1,882STIMME EHER ZU 405 376 781

WEDER NOCH 233 196 429STIMME EHER NICHT ZU 113 97 210STIMME GAR NICHT ZU 53 38 91

WEISS NICHT 23 39 62KEINE ANGABE 9 5 14

Total 1,712 1,757 3,469

Statistik II Einfuhrung (30/50)

Page 39: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Haufigkeiten: Hartere Strafen

. tab v26 v151 if v26<8 ,col

Key

frequencycolumn percentage

GESCHLECHT,HAERTERE STRAFEN BEFRAGTE<R>

FUER STRAFTAETER? MANN FRAU Total

STIMME VOLL ZU 876 1,006 1,88252.14 58.73 55.47

STIMME EHER ZU 405 376 78124.11 21.95 23.02

WEDER NOCH 233 196 42913.87 11.44 12.64

STIMME EHER NICHT ZU 113 97 2106.73 5.66 6.19

STIMME GAR NICHT ZU 53 38 913.15 2.22 2.68

Total 1,680 1,713 3,393100.00 100.00 100.00

Statistik II Einfuhrung (30/50)

Page 40: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Haufigkeiten: Hartere Strafen

. tab v26 v151 if v26<8 ,row

Key

frequencyrow percentage

GESCHLECHT,HAERTERE STRAFEN BEFRAGTE<R>

FUER STRAFTAETER? MANN FRAU Total

STIMME VOLL ZU 876 1,006 1,88246.55 53.45 100.00

STIMME EHER ZU 405 376 78151.86 48.14 100.00

WEDER NOCH 233 196 42954.31 45.69 100.00

STIMME EHER NICHT ZU 113 97 21053.81 46.19 100.00

STIMME GAR NICHT ZU 53 38 9158.24 41.76 100.00

Total 1,680 1,713 3,39349.51 50.49 100.00

Statistik II Einfuhrung (30/50)

Page 41: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Grafikbefehle

I Aus historischen Grunden verschiedene Interfaces

I Teils sehr komplexe Optionen

I Handbucher, Kohler/Kreuter, Visual Guide

I Kategoriale Variable, eine Dimension – warum Histogrammeigentlich nicht geeignet?

Statistik II Einfuhrung (31/50)

Page 42: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Barplot/Histogramm

. graph twoway hist v26 if v26<8,disc percent

020

4060

Per

cent

1 2 3 4 5HAERTERE STRAFEN FUER STRAFTAETER?

Statistik II Einfuhrung (32/50)

Page 43: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Barplot/Histogramm nach Geschlecht

. graph twoway hist v26 if v26<8,disc percent by(v151)

020

4060

0 2 4 6 0 2 4 6

MANN FRAU

Per

cent

HAERTERE STRAFEN FUER STRAFTAETER?Graphs by GESCHLECHT, BEFRAGTE<R>

Statistik II Einfuhrung (33/50)

Page 44: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

”Echte“ Balkendiagramme

I Erfordern einen Trick:

I Kategoriale Variablen mussen in eine Serie binarer Variablen(0/1 kodiert =

”Dummies“) zerlegt werden

I Jede Variable mit k Kategorien kann durch k − 1 Dummiesersetzt werden (andere Kodierungen moglich)

I Beispiel Konfession (”katholisch“,

”protestantisch“,

”andere“)

I Dummies fur katholisch/protestantisch (andere= wederkatholisch noch protestantisch)

I Dummies fur andere/protestantisch (katholisch= weder anderenoch protestantisch)

I Dummies fur andere/katholisch (protestantisch= weder anderenoch katholisch)

I Dritter Dummy redundant (wichtig fur Regression)

Statistik II Einfuhrung (34/50)

Page 45: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Wie generiert man Dummies?

I Befehle um Variablen zu kopieren, erzeugen, verandern

. generate dummy1=0

. replace dummy1=1 if v26==1(1882 real changes made)

Statistik II Einfuhrung (35/50)

Page 46: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Wie generiert man Dummies?

I Befehle um Variablen zu kopieren, erzeugen, verandern

. generate dummy2=v26==2

. tab dummy1 dummy2

dummy2dummy1 0 1 Total

0 806 781 1,5871 1,882 0 1,882

Total 2,688 781 3,469

. tab v26 dummy1

HAERTERE STRAFEN dummy1FUER STRAFTAETER? 0 1 Total

STIMME VOLL ZU 0 1,882 1,882STIMME EHER ZU 781 0 781

WEDER NOCH 429 0 429STIMME EHER NICHT ZU 210 0 210STIMME GAR NICHT ZU 91 0 91

WEISS NICHT 62 0 62KEINE ANGABE 14 0 14

Total 1,587 1,882 3,469

Statistik II Einfuhrung (35/50)

Page 47: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

v26 umkodieren/fehlende Werte loschen?

I Werte großer 5 sollten automatisch ignoriert werden (missing)

I Hohe Werte = Ablehnung: kontraintuitiv

. gen strafe = v26 if v26<8(76 missing values generated)

.

. tab strafe

strafe Freq. Percent Cum.

1 1,882 55.47 55.472 781 23.02 78.493 429 12.64 91.134 210 6.19 97.325 91 2.68 100.00

Total 3,393 100.00

.

Statistik II Einfuhrung (36/50)

Page 48: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

v26 umkodieren/fehlende Werte loschen?

I Werte großer 5 sollten automatisch ignoriert werden (missing)

I Hohe Werte = Ablehnung: kontraintuitiv

. replace strafe = 6 - strafe(2964 real changes made)

. tab strafe

strafe Freq. Percent Cum.

1 91 2.68 2.682 210 6.19 8.873 429 12.64 21.514 781 23.02 44.535 1,882 55.47 100.00

Total 3,393 100.00

Statistik II Einfuhrung (36/50)

Page 49: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Aus der neuen Variable funf Dummies erzeugen

I Mehrere Hilfsmittel

I Sehr schnell:

Statistik II Einfuhrung (37/50)

Page 50: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Aus der neuen Variable funf Dummies erzeugen

I Mehrere Hilfsmittel

I Sehr schnell:

. tab strafe,gen(mehrstraf)

strafe Freq. Percent Cum.

1 1,882 55.47 55.472 781 23.02 78.493 429 12.64 91.134 210 6.19 97.325 91 2.68 100.00

Total 3,393 100.00

. d mehrst*

storage display valuevariable name type format label variable label

mehrstraf1 byte %8.0g strafe== 1.0000mehrstraf2 byte %8.0g strafe== 2.0000mehrstraf3 byte %8.0g strafe== 3.0000mehrstraf4 byte %8.0g strafe== 4.0000mehrstraf5 byte %8.0g strafe== 5.0000

Statistik II Einfuhrung (37/50)

Page 51: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Aus der neuen Variable funf Dummies erzeugen

I Mehrere Hilfsmittel

I Sehr schnell:

. summ mehrstraf*

Variable Obs Mean Std. Dev. Min Max

mehrstraf1 3393 .5546714 .4970753 0 1mehrstraf2 3393 .2301798 .4210098 0 1mehrstraf3 3393 .1264368 .33239 0 1mehrstraf4 3393 .0618921 .240995 0 1mehrstraf5 3393 .0268199 .1615807 0 1

. graph bar mehr*,bargap(15)

Statistik II Einfuhrung (37/50)

Page 52: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Echtes Balkendiagramm0

.2.4

.6

mean of mehrstraf1 mean of mehrstraf2mean of mehrstraf3 mean of mehrstraf4mean of mehrstraf5

Statistik II Einfuhrung (38/50)

Page 53: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Tortendiagramme. . .

I . . . sind unerwunscht

I . . . konnen mit dem gleichen Trick (Dummies) erzeugt werden

. graph pie mehrstraf*

Statistik II Einfuhrung (39/50)

Page 54: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Tortendiagramme. . .

strafe== 1.0000 strafe== 2.0000strafe== 3.0000 strafe== 4.0000strafe== 5.0000

Statistik II Einfuhrung (39/50)

Page 55: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Histogramm und Dichteschatzung

I (Konzeptuell) kontinuierliche Variablen

I Z. B. Alter (18-999)

I Alter > 120 auf missing setzen

. gen alter = v154 if v154<121(12 missing values generated)

. hist alter(bin=35, start=18, width=2.2571429)

. kdensity alter

. kdensity alter,by(v151)option by() not allowedr(191);

. graph twoway kdensity alter,by(v151)

Statistik II Einfuhrung (40/50)

Page 56: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Alter: Histogramm0

.01

.02

.03

Den

sity

20 40 60 80 100alter

Statistik II Einfuhrung (41/50)

Page 57: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Alter: Dichteschatzung0

.005

.01

.015

.02

Den

sity

20 40 60 80 100alter

kernel = epanechnikov, bandwidth = 3.1396

Kernel density estimate

Statistik II Einfuhrung (42/50)

Page 58: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Alter: Dichteschatzung nach Geschlecht0

.005

.01

.015

.02

20 40 60 80 100 20 40 60 80 100

MANN FRAU

kden

sity

alte

r

xGraphs by GESCHLECHT, BEFRAGTE<R>

Statistik II Einfuhrung (43/50)

Page 59: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Vergleich mit theoretischer Verteilung

I Ist das Alter normalverteilt?I Normalverteilung (Dichte)

I SymmetrischI GlockenformigI Ca. 90% der Flache ± 1.64 Standardabweichungen vom

Mittelwert; 95% der Flache ± 1.96 Standardabweichungen

I Kumulierte Normalverteilung: Integral der Dichteverteilung

I Wichtiges Modell fur viele reale und theoretische Verteilungen

I Dichte und kumulierte Verteilungen sind Funktionen

I x- Werten zwischen ±∞ werden y -Werte zugeordnet

I Stata kann diese und viele andere Funktionswerte bestimmen,plotten, ausgeben

Statistik II Einfuhrung (44/50)

Page 60: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Normalverteilung

I Wieviel Prozent der Verteilung liegen links der Werte 1, 2, 3?

I Welche Werte trennen von links 2.5%, 10% und 50% der(Standard)Normalverteilung ab?

. display normal(1)

.84134475

. display normal(2)

.97724987

. display normal(3)

.9986501

. display 2+24

. display "Hallo!"Hallo!

I normal: kumulierte Normalverteilung

I invnormal: Umkehrfunktion zur kumuliertenNormalverteilung

I normalden: Dichtefunktion der Normalverteilung

Statistik II Einfuhrung (45/50)

Page 61: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Normalverteilung

I Wieviel Prozent der Verteilung liegen links der Werte 1, 2, 3?

I Welche Werte trennen von links 2.5%, 10% und 50% der(Standard)Normalverteilung ab?

. display invnormal(.025)-1.959964

. display invnormal(.10)-1.2815516

. display invnormal(.50)0

I normal: kumulierte Normalverteilung

I invnormal: Umkehrfunktion zur kumuliertenNormalverteilung

I normalden: Dichtefunktion der Normalverteilung

Statistik II Einfuhrung (45/50)

Page 62: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Normalverteilung

I Wieviel Prozent der Verteilung liegen links der Werte 1, 2, 3?

I Welche Werte trennen von links 2.5%, 10% und 50% der(Standard)Normalverteilung ab?

. display invnormal(.025)-1.959964

. display invnormal(.10)-1.2815516

. display invnormal(.50)0

I normal: kumulierte Normalverteilung

I invnormal: Umkehrfunktion zur kumuliertenNormalverteilung

I normalden: Dichtefunktion der Normalverteilung

Statistik II Einfuhrung (45/50)

Page 63: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Normalverteilung

I Wieviel Prozent der Verteilung liegen links der Werte 1, 2, 3?

I Welche Werte trennen von links 2.5%, 10% und 50% der(Standard)Normalverteilung ab?

. display invnormal(.025)-1.959964

. display invnormal(.10)-1.2815516

. display invnormal(.50)0

I normal: kumulierte Normalverteilung

I invnormal: Umkehrfunktion zur kumuliertenNormalverteilung

I normalden: Dichtefunktion der Normalverteilung

Statistik II Einfuhrung (45/50)

Page 64: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Normalverteilung

I Wieviel Prozent der Verteilung liegen links der Werte 1, 2, 3?

I Welche Werte trennen von links 2.5%, 10% und 50% der(Standard)Normalverteilung ab?

. display invnormal(.025)-1.959964

. display invnormal(.10)-1.2815516

. display invnormal(.50)0

I normal: kumulierte Normalverteilung

I invnormal: Umkehrfunktion zur kumuliertenNormalverteilung

I normalden: Dichtefunktion der Normalverteilung

Statistik II Einfuhrung (45/50)

Page 65: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Normalverteilung graphisch

Dichtefunktion

0.1

.2.3

.4y

-4 -2 0 2 4x

. graph twoway function y=normden(x),range(-3.5 3.5)

Kumulierte Dichtefunktion

0.2

.4.6

.81

y

-4 -2 0 2 4x

. graph twoway function y=normal(x),range(-3.5 3.5)

Statistik II Einfuhrung (46/50)

Page 66: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Alter und Normalverteilung

I Normalverteilung mit passendem Mittelwert/Varianz uberAltersverteilung plotten

I Bequem: Option nutzen; genauer: Quantil-Plot

0.0

05.0

1.0

15.0

2.0

25D

ensi

ty

20 40 60 80 100alter

Kernel density estimateNormal density

kernel = epanechnikov, bandwidth = 3.1396

Kernel density estimate

. kdensity alter,normal

050

100

alte

r

0 50 100Inverse Normal

. qnorm alter

Statistik II Einfuhrung (47/50)

Page 67: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Zwei kontinuierliche Variablen: Scatterplot

I Viele Variablen nur konzeptuell kontinuierlich

I Wenige Kategorien → Punkte im Plot klumpen

I Beispiel Alter (ok) vs. Attraktivitat auf den Interviewer (1-11)

I”jitter“,

”random noise“

. graph twoway scatter v5 alter,jitter(8) by(v151)

. graph export scatter-2.eps(file scatter-2.eps written in EPS format)

Statistik II Einfuhrung (48/50)

Page 68: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Tabellen, Haufigkeiten, AnteilswerteGraphische Darstellungen

Alter und Attraktivitat nach Geschlecht0

510

20 40 60 80 100 20 40 60 80 100

MANN FRAU

ATT

RA

KTI

VIT

AE

T D

ES

BE

FR.,

INTE

RV

IEW

STA

RT

alterGraphs by GESCHLECHT, BEFRAGTE<R>

Statistik II Einfuhrung (49/50)

Page 69: Einf uhrung - kai-arzheimer.com · Deskriptive Statistik mit Stata Zusammenfassung Uberblick Wiederholung Statistiksoftware Worum geht es hier? I Eine von zwei zentralen Vorlesungen

EinfuhrungDeskriptive Statistik mit Stata

Zusammenfassung

Zusammenfassung

I Software essentiell fur die Verwaltung, Verarbeitung undAuswertung von Daten

I Stata Programm der Wahl fur die Ausbildung in derPolitikwissenschaft

I Alles, was in Statistik I und hier gelernt wurde/wird, mit Statamachbar

I Wichtig: Uben

Statistik II Einfuhrung (50/50)