1 Querschnitt- und Längsschnitterhebung Jian TONG Valentin KASSIN Peter STEBE.

Post on 06-Apr-2015

114 views 1 download

Transcript of 1 Querschnitt- und Längsschnitterhebung Jian TONG Valentin KASSIN Peter STEBE.

1

Querschnitt- und Längsschnitterhebung

Jian TONGValentin KASSINPeter STEBE

2

Querschnitt- und Längsschnitterhebungen

Überblick:

Daten: Querschnitt-, Trend- und Paneldaten Daten und Design Kohortendesign Auswahl von Erhebungsdesigns

3

Dimension von DatenElement Xijk

Untersuchungseinheiten: i Variablen: j Zeitpunkte: t i

Xijt j

t

4

Erhebungsdesign Erhebung von aussagekräftiger Daten zur Überprüfung von

Hypothese Zwei Arten der Datenerhebung von zeitliche Modus:

statische Bestandsgröße vs. Dynamische Größe Querschnittdesign Längsschnittdesign

(Trend- und Paneldesign)

i i

tt

5

Querschnittdesign Die Datenerhebung bezieht sich auf einen

Zeitpunkt oder eine kurze Zeitspanne, in der eine einmalige Erhebung der Eigenschaften (Variablenwerte) bei N Untersuchungseinheiten vorgenommen wird.

Bsp.1: Es werden die Einkommenswerte von verschiedenen Personen zu einem Zeitpunkt erhoben.

6

Bsp. 1: Querschnitterhebung

0

500

1000

1500

2000

2500

3000

3500

4000

1999 2000 2001 2002 2003

Zeitachse

Ein

kom

men

(V

aria

ble

)

Person 1

Person 2

Person 3

Person 4

Person 5

7

Trenderhebung Bei einem Trenddesign werden die Werte der

gleichen Variablen zu mehreren Zeitpunkten mit jeweils unterschiedlichen Stichproben erhoben.

Bsp.2: Es werden die Einkommen von jeweils anderen Personen zu verschiedenen Zeitpunkten erhoben.

8

Bsp. 2: Trenderhebung

0

500

1000

1500

2000

2500

3000

3500

4000

4500

1999 2000 2001 2002 2003

Zeitachse

Eink

omm

en (V

aria

ble)

Mittelw ert

9

Panelerhebung Mit einem Paneldesign werden die Werte der

gleichen Variablen zu mehreren Zeitpunkten, jedoch auf der Grundlage einer identischen Stichprobe erhoben (Panelwellen).

Bsp.3: Es werden die Einkommen von den gleichen Personen zu verschiedenen Zeitpunkten erhoben.

10

Bsp. 3: Panelerhebung

0

500

1000

1500

2000

2500

3000

3500

1999 2000 2001 2002 2003

Zeitachse

Ein

kom

men

(V

aria

ble

)

Person 1

Person 2

Person 3

Person 4

Person 5

11

Vergleichen Informationshierarchie:

Querschnittdaten < Trenddaten < Paneldaten

Trenddesign Aggregatebene Stichproben- und Meßfehler

Paneldesign Individuelle Ebene Panelmortalität (Schwundquote/Welle) Mittelschichtbias Stichproben- und Meßfehler entfällt

12

Daten und Designs Erhebungsdesigns dienen der Sammlung

aussagekräftiger Daten, die Hypothesen überprüfen sollen.

Bisherige Annahmen: Querschnittdesigns erzeugen Querschnittdaten Trenddesigns erzeugen Querschnitt oder Trenddaten Paneldesigns erzeugen Querschnitt, Trenddaten oder

Paneldaten Diese Annahmen setzen voraus:

Zeitpunkt der Messung = Erhebungszeitpunkt

Was passiert bei Ereignissen in der Vergangenheit?

13

Retrospektivfragen Bsp: Retrospektivfragen

Bildungsabschluss, Jahr der Eheschließung, etc. Der Erhebungszeitpunkt ist mit dem Zeitpunkt auf dem

sich die Messung bezieht nicht mehr identisch! Der Datentyp und der Typ des Erhebungsdesigns

müssen in so einem Fall nicht mehr notwendigerweise übereinstimmen.

Das kann Missverständnisse implizieren

Zur Veranschaulichung dieser Problematik soll eine Studie mit dem Ziel der Untersuchung der beruflichen Mobilität dienen

14

Vergleich zweier Designtypen

Interesse gilt Paneldaten zum Wechsel beruflicher Positionen

Design A: Paneldesign mit drei Wellen in den Jahren 95, 96 und 97.

Design B: Querschnittserhebung mit Retrospektivfragen im Jahr 97.

Gegenstand der Betragung:“ Erfragt wird die gegenwärtige Berufsposition sowie die berufliche Position vor einem Jahr und vor zwei Jahren.

Beide Erhebungen liefern Paneldaten zur beruflichen Position.

15

Vergleich zweier Designtypen Fazit:

Die Berufliche Position kann zwar erhoben werden aber..

Monatseinkommen der betreffenden Jahre? Subjektiven Befindlichkeiten?

Da die Ereignisse in der Vergangenheit liegen, müssen diese mit Hilfe von Retrospektivfragen abgefragt werden. Die Paneldaten, die mit Hilfe des Paneldesigns abgefragt wurden haben eine höhere Datenqualität.

16

Beispiel Wählerwanderungsstudien:

Erhebung von Paneldaten mit Hilfe eines Querschnittsdesigns

Befragung des Wählers nach Verlassen des Wahllokals:1. Aktuelle Stimmabgabe2. Stimmabgabe bei der letzten Wahl (Recallfrage)

Das Ergebnis sind Paneldaten Diese Daten werden in einer Matrix angeordnet, die

Auskunft über die Wählermobilität gibt (entspricht einer Mobilitätstabelle)

Sie geben Auskunft über den Ab- und Zustrom der Stammwähler

Die Recallfrage ist mit einer gewissen Ungenauigkeit behaftet.

17

Datentyp nach Kriterien des Zeitbezugs

Querschnittdaten Beobachtungen für

Beschäftigte, Konsumenten, Firmen, Regierungseinheiten zu einem bestimmten Zeitpunkt.

Mit Querschnittsdaten können wir Beziehungen zwischen Variablen erforschen, indem wir Unterschiede zwischen Individuen, Firmen oder anderen Beobachtungseinheiten zu einem bestimmten Zeitpunkt untersuchen.

18

Datentyp nach Kriterien des Zeitbezugs

Zeitreihendaten Daten für eine einzelne

Einheit (Person, Firma, Land etc.), die zu aufeinander folgenden Zeitpunkten beobachtet werden.

Zeitreihendaten können bspw. genutzt werden, um die Entwicklung von Variablen in der Zeit zu studieren und daraus zukünftige Werte dieser Variablen vorauszuschätzen

19

Datentyp nach Kriterien des Zeitbezugs

Paneldaten Paneldaten oder

Längsschnittdaten sind Daten für mehrere Einheiten, wobei für jede Einheit Beobachtungen für zwei oder mehr Zeitpunkte existieren.

Paneldaten können genutzt werden, um ökonomische Beziehungen zwischen den Beobachtungen für einzelne Einheiten sowie deren Entwicklung in der Zeit zu erforschen.

20

Datentyp nach Kriterien des Zeitbezugs Verlauf oder Ereignisdaten

21

Datentyp nach Kriterien des Zeitbezugs Verlauf oder Ereignisdaten

Panelerhebung 1 Panelerhebung 2

22

Datentyp nach Kriterien des Zeitbezugs

Verlaufs- oder Ereignisdaten Bei Ereignisdaten handelt es sich um Zeitintervalle

zwischen zwei Ereignissen Beispiele hierfür wären: Zeitraum zwischen Arbeitslosigkeit

und Wiederbeschäftigung, sowie der Zeitraum zwischen 2 Lebensabschnittspartnern.

Für die Erhebung kommen sowohl Querschnitts- als auch Paneldesigns in Frage. Die Ereignisgeschichte muss jedoch retrospektiv abgefragt werden.

Ereignisdaten werden bspw. bei folgenden Analysen verwendet:

Studien zur Langzeitarbeitslosigkeit Studien zur Berufsfluktuationen

23

Kohortendesign

Begriff

Kohorte in den Sozialwissenschaften

zeitlich gemeinsam, längerfristig prägendes Startereignis

24

Kohortenkonzept Idee: Auf eine Kohorte wirken kulturelle und

sozialökonomische Einflüsse Generationen als Träger sozialen Wandels Datenerhebung mittels Querschnitts- und

Paneldesigns. Ex ante und ex post Berücksichtigung Zeitbezug Bsp. 4 und Bsp. 5

25

Bsp. 4 Scheidungsrisiko nach Heiratskohorten

15 %

10 %

6,5 %

1955 1965 1975

Eheschließungsjahrgänge

26

Bsp. 5: Verlaufmuster des Scheidungsrisikos nach der Ehedauer (Lebenszykluseffekt)

0 1 2 3 4 5 6 7 8 9 10 11 12 13

Ehedauer in Jahre

Sch

eid

un

gsr

isik

o

0 1 2 3 4 5 6 7 8 9 10 11 12 13

Ehedauer in Jahre

Sch

eid

un

gsr

isik

o

27

Drei Effekte bei Kohortenuntersuchungen

Kohorteneffekte: gemeinsam Einflüssen ausgesetzt, systematische Unterschiede während Kalenderzeit

Lebenszykluseffekte: auch Alterseffekte, z.B. Sterbetafel; Abhängigkeiten von der Prozesszeit

Periodeneffekte (Bsp. 6): historisch einmalige Ereignisse (Scheidungsrisiko 1978 BRD)

28

Bsp. 6: Entwicklung der Scheidungsziffern mit Periodeneffekt 1978

0

10

20

30

40

50

60

70

80

90

55 58 60 62 64 66 68 70 72 74 76 78 79 80 82 84 86 88 90 92

Jahr

Sch

eid

un

gen

pro

10

000

Eh

en

29

Lebenszyklus-Fehlschluss Lebenszykluseffekt: Intelligenzabbau im Alter,

geringere Testdaten als jüngere Ältere Probanden gehören zu älteren

Geburtskohorten Mitglieder dieser Kohorten haben geringere

Schulbildung. Prospektive Panelerhebung: kein nennens-

werter Intelligenzabbau bis ins höhere Alter

30

Problem: Einkommensprofil Einkommensverlauf Typisch konkav E-Profil ist ein Lebenszykluseffekt Schätzung nach Querschnittdaten Kohorteneffekt: Niveauunters. des E-Profils Empfohlen: Paneldesign

31

Demographie Wenn möglich Alterseffekte nach Kohorten Kohortensterbetafel von 100t f/m über 100y Q: 1995-2095? A: Periodensterbetafel, Sterblichkeit der einjährigen

1994 etc. Mortalität und Lebenserwartung 100y zurück Sterbetafel erstreckt sich so über 200 Jahre Prognose nur ohne Kohorteneffekte korrekt

32

Probleme Unmöglichkeit der Separierung von Kohorten-

und Lebenszykluseffekten- erhebliche Prognoseprobleme- Lebenszyklus-Fehlschluss- Bsp. Wertwandel/Post(-Materialismus)- Bsp. Wählerpotential (Grüne 20-40y)

33

Auswahl des Erhebungsdesign

Kann man mit Retrospektivfragen Panel oder Ereignisdaten zuverlässig abfragen?

Ausgangspunkt: Hypothese

1. Zuerst wird der erforderliche Datentyp ermittelt2. Es wird ein geeignetes Erhebungsdesign gewählt

Es muss möglichst zuverlässig und mit geringem Aufwand erfasst werden können.

34

Dank für die Aufmerksamkeit

Jian TONGValentin KASSINPeter STEBE

35

Frage Welche Wahrnehmungsprobleme gibt es? Was

versteht man darunter? Erläuterung anhand eines Beispiels.

Was versteht man unter Werturteilen, welche Aspekte des Werturteils-problems lassen sich unterscheiden?