Vorlesung 9: Kumulierte (gepoolte)...

27
Vorlesung 9: Kumulierte (gepoolte) Querschnittsdaten 1. Kumulierte Querschnittsdaten: Was ist das? 2. Anwendungsmöglichkeiten im Überblick 3. Fallstudie 1: Determinanten von Erwerbseinkommen 1978-85 4. Fallstudie 2: Analyse quasi-experimenteller Daten vorher: Nachtrag zur Analyse nicht-linearer Beziehungen und heteroskedastischer Fehlerterme (s. Vorlesung 7)

Transcript of Vorlesung 9: Kumulierte (gepoolte)...

Vorlesung 9: Kumulierte (gepoolte) Querschnittsdaten1. Kumulierte Querschnittsdaten: Was ist das?2. Anwendungsmöglichkeiten im Überblick3. Fallstudie 1: Determinanten von

Erwerbseinkommen 1978-854. Fallstudie 2: Analyse quasi-experimenteller

Daten

• vorher: Nachtrag zur Analyse nicht-linearer Beziehungen und heteroskedastischerFehlerterme (s. Vorlesung 7)

Teil 1

Kumulierte Querschnittsdaten: Was ist das?

Durchschnittliche Kinderzahl US-amerikanischer Frauen 1972-84

• Datentyp: Zeitreihe• Makrodaten• basiert (wie viele

Zeitreihen) auf einer Serie von Querschnitten

• Quelle: General SocialSurvey (GSS)

• deutsches Pendant: ALLBUS

3.033.21

2.80 2.80 2.82

2.402.24

01

23

mea

n of

kid

s

72 74 76 78 80 82 84

Kumulierte Querschnitte und Zeitreihen

Id Jahr Kids Educ1 72 0 182 72 5 9... ... ... ...

157 74 1 12158 74 2 18... ... ... ...

330 76 3 12331 76 2 12... ... ... ...

482 78 1 20483 78 3 12... ... ... ...

625 80 0 17626 80 1 12... ... ... ...

767 82 3 12768 82 2 12... ... ... ...

953 84 2 12954 84 3 12... ... ... ...

1129 84 2 12

Jahr Kinderzahl72 3.0374 3.2176 2.8078 2.8080 2.8282 2.4084 2.24

KumulierteQuerschnitte

1972-841972: n=1561974: n=1731976: n=1521978: n=1431980: n=1421982: n=1861984: n=177

Zeitreihe

Möglichkeiten der Differenzierung

Id Jahr Kids Educ1 72 0 182 72 5 9... ... ... ...

157 74 1 12158 74 2 18... ... ... ...

330 76 3 12331 76 2 12... ... ... ...

482 78 1 20483 78 3 12... ... ... ...

625 80 0 17626 80 1 12... ... ... ...

767 82 3 12768 82 2 12... ... ... ...

953 84 2 12954 84 3 12... ... ... ...

1129 84 2 12

KumulierteQuerschnitte

1972-841972: n=1561974: n=1731976: n=1521978: n=1431980: n=1421982: n=1861984: n=177

Im Gegensatz zu Zeitreihen (Makro-daten) bieten kumulierte Quer-schnitte Möglich-keiten der Differen-zierung (z.B. nach Ausbildung und anderen Individual-merkmalen)

Eigenschaften kumulierter Querschnitte

• unterschiedliche Stichproben– Person 1 aus 1972 ≠ Person

157 aus 1974• Anordnung wegen der

besseren Lesbarkeit, aber eigentlich unwichtig

• unabhängige Beobachtungen– innerhalb eines Querschnitts– zwischen den Jahren

• Dimension der Datenmatrix– (N1 + N2 + … + NT) ⋅ V

• typisches Beispiel– kumulierter ALLBUS

Id Jahr Kids Educ1 72 0 182 72 5 9... ... ... ...

157 74 1 12158 74 2 18... ... ... ...

330 76 3 12331 76 2 12... ... ... ...

482 78 1 20483 78 3 12... ... ... ...

625 80 0 17626 80 1 12... ... ... ...

767 82 3 12768 82 2 12... ... ... ...

953 84 2 12954 84 3 12... ... ... ...

1129 84 2 12

Nicht verwechseln mit kumulierten Zeitreihen

• Zeitreihen aus N unterschiedlichen Staaten

• Anordnung der Staaten unwichtig, aber innerhalb der Staaten ist die zeitliche Anordnung wichtig

• unabhängige Beobachtungen– zwischen den Staaten– aber nicht innerhalb der Staaten

(Zeitreihe!)• Dimension der Datenmatrix

– N ⋅ T ⋅ V

Staat Datum Unfälle GurtCA Jan. 72 40511 0CA Feb. 72 36034 0... ... ... ...MI Jan. 72 37699 0MI Feb. 72 38816 0... ... ... ...NY Jan. 72 38625 0NY Feb. 72 39539 0... ... ... ...

CO Jan. 72 40676 0CO Feb. 72 39270 0... ... ... ...NJ Jan. 72 36672 0NJ Feb. 72 32699 0... ... ... ...TX Jan. 72 36455 0TX Feb. 72 36690 0... ... ... ...FL Jan. 72 36850 0FL Feb. 72 36284 0... ... ... ...FL Dez. 89 38366 0

Nicht verwechseln mit Panel-Daten

• N Personen werden zu T Zeitpunkten befragt

• pro Person eine Zeitreihe• Anordnung der Personen

unwichtig, aber für jede Person ist die zeitliche Anordnung der Befragungen wichtig

• unabhängige Beobachtungen– zwischen den Personen– aber nicht für jede Person

(Zeitreihe!)• Dimension der Datenmatrix

– N ⋅ T ⋅ V

ID Jahr Kids Educ1 1984 0 121 1985 0 12... ... ... ...2 1984 2 92 1985 2 9... ... ... ...3 1984 0 103 1985 1 11... ... ... ...4 1984 1 84 1985 2 8... ... ... ...5 1984 3 135 1985 3 13... ... ... ...6 1984 2 156 1985 2 15... ... ... ...7 1984 0 97 1985 1 10... ... ... ...7 2000 2 13

Aber ähnliche Datenstruktur bei ländervergleichenden Untersuchungen

• typisches Beispiel– European Social Survey

• unterschiedliche Stichproben– Person 1 aus Land D ≠ Person

157 aus Land NL• Anordnung wegen der

besseren Lesbarkeit, aber eigentlich unwichtig

• unabhängige Beobachtungen– innerhalb eines Querschnitts– zwischen den Ländern

• Dimension der Datenmatrix– (N1 + N2 + … + NL) ⋅ V

ID Land Kids Educ1 D 0 121 D 0 12... ... ... ...2 NL 2 92 NL 2 9... ... ... ...3 GB 0 103 GB 1 11... ... ... ...4 SP 1 84 SP 2 8... ... ... ...5 SWE 3 135 SWE 3 13... ... ... ...6 B 2 156 B 2 15... ... ... ...7 I 0 97 I 1 10... ... ... ...7 I 2 13

Teil 2

Anwendungsmöglichkeiten im Überblick

Überblick

• Erhöhung der Präzision gegenüber einfachen Querschnitten

• Trendanalysen mit Kontrollvariablen• Analyse des sozialen Wandels• Analyse von Ereignissen und Quasi-

Experimenten

Erhöhung der Präzision gegenüber einfachen Querschnitten• Determinanten der Erwerbseinkommen• Daten: Current Population Survey (US-

amerikanischer Mikrozensus)• Bildungsrendite

–– 1978: 5,2% (t=7,19, n=550)– 1985: 7,7% (t=9,49, n=534)– 1978 + 1985: 6,9% (t=12,08, n=1084)

educwage ⋅+= 10)ln( ββ

Trendanalysen mit Kontrollvariablen

3.0263.2082.8032.8042.817

2.4032.237

01

23

me

an o

f kid

s

72 74 76 78 80 82 84

Durchschnittliche Kinderzahl

0.0830.0580.0460.049

0.070

0.199

0.068

0.0

5.1

.15

.2m

ean

of b

lack

72 74 76 78 80 82 84

Anteil Afro-Amerikaner1

23

unk

orri

gier

t/ko

rrigi

ert

70 75 80 85var1

unkorrigiert korrigiert

Durchschnittliche Anzahl Kinder

Korrelation Black-Kids0,1434

Analyse des sozialen Wandels

• Determinanten der Erwerbseinkommen• Daten: Current Population Survey (US-

amerikanischer Mikrozensus)• Bildungsrendite

–– 1978: 5,2% (t=7,19, n=550)– 1985: 7,7% (t=9,49, n=534)

• Die Bildungsrendite hat sich zwischen 1978 und 1985 signifikant um 2,5 Prozentpunkte erhöht(t=2,30)

educwage ⋅+= 10)ln( ββ

Analyse von Ereignissen und Quasi-Experimenten• Auswirkungen des Baus einer Müllverbrennungsanlage

in North Andover (MA) auf die örtlichen Immobilienpreise– Beginn der öffentlichen Diskussion nach 1978– Baubeginn 1981– Inbetriebnahme 1985

• Daten– Hausverkäufe in 1978 (n=179)– Hausverkäufe in 1981 (n=142)

• Untersuchungsdesign– „Experimental“gruppe: Häuser in der Nähe der Anlage– Kontrollgruppe: alle anderen Häuser– keine Randomisierung (daher: Quasi-Experiment)– aber Kontrolle der (unterschiedlichen) Eigenschaften der Häuser

in beiden Gruppen möglich, wenn entsprechende Informationen mit erfasst werden

Teil 3

Fallstudie 1Determinanten von

Erwerbseinkommen 1978-85

Determinanten der Erwerbseinkommen

• Daten: Current Population Survey (US-amerikanischer Mikrozensus)

• kumulierte Querschnittsdaten CPS75_85.dta– 1978: n=550– 1985: n=534

• Analyse s. Handout– getrennt für jedes Jahr– gemeinsam für beide Jahre– Reproduktion der getrennten Analysen in einem

Modell mit Interaktionseffekten

Chow-Test für Strukturunterschiede zwischen Gruppen• Testprinzip: Vergleich eines nicht restringierten

Modells (getrennte Schätzung) mit einem restringierten Modell (gemeinsame Schätzung)

• Oder: gemeinsamer Test der Signifikanz aller Dummies und Interaktionseffekte

• Chow-Test (F-Test) für zwei Gruppen

49,7311

)11(2108496,12654,120

)96,12654,120(18,2811

)1(2)(

21

21

=+

+⋅−×

++−

=

++⋅−

×+

+−=

kkn

SSRSSRSSRSSRSSR

F p

Anwendung des Chow-Testes auf kumulierte Querschnittsdaten• Gruppe = Zeitpunkt• Da in den meisten Fällen von zeitlichen Trends

auszugehen ist, sollten die Unterschiede in den Konstanten (d.h. die Effekte der Dummies) nicht getestet werden.

• Der Test sollte auf die Interaktionseffekte beschränkt werden.

• Lässt sich am besten mit dem Kommando test in Stata umsetzen.

Exkurs: Deflationierung von y• Es häufig sinnvoll, ökonomische Größen für

Zeitvergleiche zu deflationieren• Beispiel Realeinkommen für CPS78_85.dta

– Preisindex 1978: 65,2, 1985: 107,6- 95% gestiegen

– Einkommen aus 1985 in Preisen von 1978- rwage85 = wage85 * (65,2 / 107,6) = wage85 / 1,95- ln(rwage85) = ln(wage85) – ln(1,95)

• Bei Betrachtung logarithmierter y-Variablen ist eigentlich die Deflationierung nicht nötig, da sie sich nur auf die Regressionskonstante für das jeweilige Jahr auswirkt.

Teil 4

Fallstudie 2Analyse quasi-experimenteller

Daten

Müllverbrennungsanlage in North Andover (MA, USA)• Auswirkungen auf die örtlichen

Immobilienpreise– Ereignis (garbage incinerator) zwischen 1978

und 1981• Daten kielmc.dta

– Hausverkäufe in 1978 (n=179)– Hausverkäufe in 1981 (n=142)

• Analyse s. Handout

Analyseergebnisse• naives Modell für 1981

– Der Effekt von nearinc (obwohl signifikant) ist kein sinnvolles Maß. Häuser in der Nähe der Anlage verkaufen sich einfach billiger (um 30.688,27$).

• zum Vergleich: gleiches Modell für 1978– Auch im Jahr 1978, also vor dem Ereignis, verkaufen sich

Häuser in Nähe billiger (um 18.824,37$).• richtiges Modell (difference-in-differences estimator)

– Wenn die Anlage einen Einfluss hat, dann muss der Preisunterschied zugenommen haben. Was er auch tut, wie der Interaktionseffekt zeigt (nämlich um 11.863,90$).

• Kontrolle der Strukturunterschiede zwischen den Stichproben– Da die Stichprobe 1981 nicht die gleichen Häuser enthält wie die

78er Stichprobe, sollte man deren unterschiedliche Zusammensetzung kontrollieren (z.B. nach Baujahr der Häuser). Hier wird der Interaktionseffekt auch signifikant.

Zum Schluss

Zusammenfassung

• Chow-TestTest

unabhängige Stichproben aus verschiedenen Zeitpunkten (oder Ländern)

kumulierte Querschnitte

• Dummies (Zeitpunkte, Länder)• Interaktionen (Strukturunterschiede)

Modelle

• höhere Fallzahlen• Trends• Strukturunterschiede• sozialer Wandel• Quasi-Experimente

Analyse-möglichkeiten

Wichtige Fachausdrücke

Chow TestChow-Test

pooled cross-sections

kumulierte Querschnitte

EnglischDeutschEnglischDeutsch

Weiterführende Literatur

• Wooldridge (2003)– Seite 427-438 in Kapitel 13.– Der Chow-Test für Gruppenunterschiede wird

bereits in Kapitel 7 (WO 237-240) eingeführt.