Themen am 12.12.2006 - uni-goettingen.de file2 Empirie-Vorlesung Teil: Quantitative Methoden WiSe...

28
1 Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 12.12.06 Empirie-Vorlesung im Wintersemester 2006/2007 Teil A: Quantitative Methoden Themen am 12.12.2006: Auswahlverfahren (II) • Realisierung von Zufallsstichproben in der Sozialforschung • Auswirkungen von Ausfällen • Gewichtung Datenaufbereitung • Datenmodifikation • Indexbidung • Skalierungsverfahren Lernziele: 1. Kenntnis und Beurteilung der in der Sozialforschung eingesetzten Auswahlmethoden 2. Bedeutung von Ausfällen und Möglichkeiten der Gewichtung 3. Gegenstand von Datenmodifikationen 4. Konstruktion von Indizes am Beispiel des Ingehart-Index 5. Vorgehen bei Skalierungsverfahren am Beispiel von Guttman-Skala und Likert-Skala

Transcript of Themen am 12.12.2006 - uni-goettingen.de file2 Empirie-Vorlesung Teil: Quantitative Methoden WiSe...

1Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 12.12.06

Empirie-Vorlesung im Wintersemester 2006/2007Teil A: Quantitative Methoden

Themen am 12.12.2006:• Auswahlverfahren (II)

• Realisierung von Zufallsstichproben in der Sozialforschung• Auswirkungen von Ausfällen• Gewichtung

• Datenaufbereitung• Datenmodifikation• Indexbidung• Skalierungsverfahren

Lernziele:1. Kenntnis und Beurteilung der in der Sozialforschung eingesetzten Auswahlmethoden2. Bedeutung von Ausfällen und Möglichkeiten der Gewichtung3. Gegenstand von Datenmodifikationen4. Konstruktion von Indizes am Beispiel des Ingehart-Index5. Vorgehen bei Skalierungsverfahren am Beispiel von Guttman-Skala und Likert-Skala

2Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 12.12.06

Wiederholung von letzter Woche

Inhaltsanalyse• Vorteile: Möglichkeit der Analyse von historischen Daten, was die Ex-post-Analyse von

sozialem Wandel ermögicht; Nichreaktivität bei prozessproduziertem Material; • Probleme: Berücksichtigung des Kontextes; • Durchführung: Festlegung der Klasse von Materialien und der Population; Festlegung der

Einheiten; Operationalisierung (Kodierbogen); Pretest von Kodierbogen, Kodierschemata bzw. Wörterbuch, bei manueller Verkodung möglichst Mehrfachverkodung .

Nichtreaktive Erhebungsverfahren• Feldexperimente, Analyse von Verhaltensspuren und prozessproduzierten Daten.

Auswahlverfahren und Stichprobenziehung (I)• Fallstudie, Totalerhebung, Stichprobenerhebung;• Stichprobenziehung: Ziel ist Minimierung der Fehlschlussgefahr als Folge des unvermeid-

baren Induktionsproblems, Repräsentativität im Sinne eines exakten Abbildes der Populationdurch die Stichprobe ist unmöglich;

• Unterscheidung zwischen angestrebter Grundgesamtheit, Auswahlgesamtheit und Inferenz-Gesamtheit; Undercoverage u. Overcoverage;

• Auswahlverfahren: willkürliche Auswahl (ohne angebbare Regel), bewusste Auswahl (nach vorgegebener Regel) u. Zufallsauswahl (nach Ziehungswahrscheinlichkeit in einem Zufalls-experiment).

3

Wiederholung von letzter Woche

Willkürliche Auswahlen• Keinerlei Information über Güte der Stichprobe möglich.Bewusste Auswahlen• Beispiele: Quota-Verfahren, Schneeball-Verfahren, oft Mischformen: Quota-Auswahl in

zufällig ausgewählten Gebieten.• Wenn Auswahlregel Strukturierung der Population berücksichtigt, eher Chance auf korrekte

Erfassung von Populationsmerkmalen.Zufallsauswahlen• Nur Zufallsauswahlen können statistische Repräsentativität garantieren, d.h. die Wahr-

scheinlichkeit von Abweichungen von beliebigen Eigenschaften zwischen Population und Stichprobe sinkt mit der Höhe der Abweichung.

• Erwünschte Eigenschaften: Unverzerrtheit, d.h. interessierendes Populationsmerkmal ist gleich dem Mittelwert des korrespondierenden Stichprobenmerkmals über alle möglichen Stichproben und Effizienz, d.h. möglichst kleine Standardfehler.

• Einfache Zufallsauswahl: alle Elemente und jeweils alle Stichproben gleichen Umfangs haben gleiche Auswahlwahrscheinlichkeit;Geschichtete (stratifizierte) Auswahl: Population ist in Schichten (Strata) aufgeteilt und innerhalb jeder Schicht wird eine Zufallsauswahl gezogen → i.a. geringere Standardfehler;mehrstufige (Cluster-) Auswahl: Population ist in Gruppen (Cluster) aufgeteilt, zunächst werden zufällig Gruppen ausgewählt, dann Elemente in ausgewählten Gruppen → i.a. grö-ßere Standardfehler aber dafür kostengünstiger.

Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 12.12.06

4

Realisierung von Zufallsauswahlen in der Sozialforschung

a) Karteiauswahl: Jedem Element ist eine Karteikarte oder ein Datensatz in einer Datei zuge-ordnet.

Ein Beispiel sind zufällige Auswahlen von Adressen aus dem Einwohnermeldeamt oder von Telefonnummern aus Telefonverzeichnissen, aus denen zufällig Eemente ausgewählt werden.

b) Gebietsauswahl: Auswahleinheiten sind geographisch definiert (Flächen). Zunächst werden Gebiete (sog. sample-points) ausgewählt. Innerhalb eines Sample-Points erfolgt ein sog. Random-Walk, d.h. ausgehend von einem Startpunkt wird nach zufälligen Vorgaben eine Zieladresse bestimmt,

z.B: „Gehe zunächst nach links bis zur nächsten Kreuzung. Dann rechts, dann wieder links ... Jeder 6. Haushalt ist zu notieren.“

Spezialfall systematische Zufallsauswahl: Von den ersten n Elementen wird eines zufällig ausgewählt, von diesem Element ausge-hend wird dann jedes n-te Element in die Stichprobe aufgenommen.Formal gesehen ist dies eine Clusterauswahl, bei der alle Elementes eines einzigen von insgesamt n Clusters ausgewählt werden.

Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 12.12.06

5

Realisierung von Zufallsauswahlen in der Sozialforschung

Drei Spezialfälle des Random-Walks: 1.Random-Walk mit Adressvorlauf:

Im Random-Walk werden die Adressen bestimmt, die in nachfolgenden Kontaktversuchen(möglichst durch andere Personen) kontaktiert werden;

2.Random-Walk ohne Adressvorlauf mit Brutto-Vorgabe:Bereits bei der Adressermittlung im Radom-Walk wird erstmals versucht, die ausgewählten Adressen zu kontaktieren; pro Sample-Point wird eine vorgegebene Anzahl von Adressen (z.B. 10 oder 20) ermittelt. Wenn eine ermittelte Adresse nicht kontaktiert werden kann, er-folgen später weitere Kontaktversuche.

3.Random-Walk ohne Adressvorlauf mit Netto-Vorgabe:Ähnlich wie 2., jedoch ist die Zahl der auszuwählenden Adressen pro Sampel Point nicht vorgegeben. Stattdessen ist festgelegt, wie viele Adressen in Sample-Point realisiert werden sollen (z.B. 10).

Bei face-to-face Interviews erfolgt die Auswahl i.a. - entweder über Karteiauswahl (Adressen aus den Einwohnermeldeamt)- oder über Random-Walk, meist im Rahmen des ADM-Designs (zuerst Auswahl von Sample-

Points aus künstlichen Wahlkreisen, dann Adressenziehung innerhalb der ausgewählten Wahlkreise.Die Wahlkreise sind dazu in Netze aufgeteilt, die jeweils für sich eine geografische stratifi-zierte Zufallsauswahl sind, den Mitgliedern des ADM wird eine Anzahl von solchen Netzen zur Verfügung gestellt.

Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 12.12.06

6

Realisierung von Zufallsauswahlen in der Sozialforschung

Auswahl bei face-to-face-Interviews (Fortsetzung)- Innerhalb eines Haushalts erfolgt die Auswahl der zu befragenden Person (der sog. Ziel-

person) oft nach dem Schwedenschlüssel, d.i. eine Zufallsliste, über die aus einer zunächst erhobenen Liste aller Haushaltsmitglieder eines ausgewählt wird.

Auswahl bei Telefoninterviews:Neben Karteiauswahl oftc) Random-Digit-Verfahren: Ein Zufallszahlengenerator erzeugt zufällige Telefonnummern,

die angewählt werdend) Random-Last-Digits-Verfahren (RLD): Aus einer Telefonnummerndatei werden zufällig

Nummern gezogen. Die letzten Ziffen werden durch mit einen Zufallszahlengenerator erzeugten Ziffern ersetzt.

e) Zufällige Auswahl aus Universum gültiger Blöcke: Alle Telefonnumern aus Verzeichnis-sen werden gesammelt. Anschließend werden die letzten Ziffern entfernt und Dubletten mit gleichen ersten Ziffern entfernt. Die so gebildeten Blöcke werden zu einem vollständi-gen Universum möglicher Telefonnumern ergänzt, aus denen zufällig Nummern angewählt werden.

- Innerhalb eines Telefonhaushalts wird die Zielperson i.a. so bestimmt, dass es sich um die Person handelt, die als letztes oder als nächstes Geburtstage hat oder haben wird (last/next birthday)

- Vor der Auswahl erfolgt oft eine geografische Stratifizierung (nach Vorwahlen).

Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 12.12.06

7

Ausfälle

Der im Erhebungsdesign festgelegte Auswahlplan lässt sich in der Regel nicht vollständig realisieren, da in der Praxis nicht alle Informationen über alle nach dem Auswahlplan zu erfassenden Elemente der Stichprobe vorliegen. Es kommt zu Ausfällen.

Problematisch sind Ausfälle, wenn sie nicht zufällig, sondern systematisch erfolgen,wenn z.B. wohlhabende Personen bei Fragen zum Einkommen eher die Antwort verweigern als weniger wohlhabende Personen.

Bei Ausfällen (Nonresponse) wird - zwischen vollständigem Ausfall einer Untersuchungseinheit (Unit-Nonresponse) - und teilweisem Ausfall bei einem oder mehreren Merkmalen (Item-Nonresponse) unterschieden.

Realisierung von Zufallsauswahlen in der Sozialforschung

Nur bei Karteiauswahl können die Respondenten von Interviews über einfache Zufallsaus-wahlen gewonnen werden. In der Regel werden zwei- oder dreistufige Auswahlen (evtl. inner-halb von Schichten) gezogen.Für Beobachtungen und Inhaltsanalysen gibt es keine Standardverfahren wie bei Interviews.

Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 12.12.06

8

Ausfälle

0

1

2

3

4

5

6

0 1 2 3 4 5 6

Haushaltsnummer der ersten Befragung

Hau

shal

tsnu

mm

er d

er z

wei

ten

Befra

gung

Im Beispiel wird angenommen, dass die Ausfallwahrscheinlichkeit Pr(A) bei einem Stichprobenmittelwert von max. 3500€ 0.10 und bei höheren Einkommen 0.64beträgt.

Bei einer einfachen Zufallsauswahl von n=2 aus N=6 mit Zurücklegen ist dann die Realisie-rungswahrscheinlichkeit einer Stichprobe die Wahrscheinlichkeit, die Stichprobe entsprechend der Auswahlwahrscheinlichkeit der Zufallsauswahl (d.h. nach dem Stichprobenplan) auszu-wählen, mal der Wahrscheinlichkeit, dass kein Ausfall vorkommt.

Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 12.12.06

Einkom- Wahrscheinlichkeitenmen (X) Auswahl Ausfall Pr(X)

1000 1/36 1/10 .0251500 2/36 1/10 .0502000 3/36 1/10 .0752500 4/36 1/10 .1003000 5/36 1/10 .1253500 6/36 1/10 .1504000 5/36 16/25 .0504500 4/36 16/25 .0405000 3/36 16/25 .0305500 2/36 16/25 .0206000 1/36 16/25 .010

Summe: 36/36 .675Missing .325

9

AusfälleEinkom- Wahrscheinlichkeitenmen (X) Auswahl Ausfall Pr(X)

1000 1/36 1/10 .0251500 2/36 1/10 .0502000 3/36 1/10 .0752500 4/36 1/10 .1003000 5/36 1/10 .1253500 6/36 1/10 .1504000 5/36 16/25 .0504500 4/36 16/25 .0405000 3/36 16/25 .0305500 2/36 16/25 .0206000 1/36 16/25 .010

Summe: 36/36 .675Missing .325

0

1

2

3

4

5

6

0 1 2 3 4 5 6

Haushaltsnummer der ersten Befragung

Hau

shal

tsnu

mm

er d

er z

wei

ten

Befra

gung

Einfache Zufallsauswahl mit Ausfällenn=2 aus N=6:Mittelwert: 3111.11 €Standardfehler 1099.94 €:

Bei systematischen Ausfällen, d.h. Ausfallwahr-scheinlichkeiten, die mit der interessierenden Eigenschaft der Elemente in der Population zu-sammenhängen, weicht der Mittelwert über alle Stichproben vom zu schätzenden Populationswert ab.Die Schätzung ist dann verzerrt.

Einfache Zufallsauswahl ohne Ausfällen=2 aus N=6:Mittelwert: 3500 €Standardfehler 1207.615€:

Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 12.12.06

10

Ausfälle

Zur Beurteilung der Qualität einer Stichprobe ist es sinnvoll, möglichst detaillierte Infor-mationen über die Ausfallgründe von Unit-Nonresponse zu erhalten. Kommerzielle Umfrageinstitute unterscheiden dabei zwischen stichprobenneutralen (als zufällig erachteten) und systematischen Ausfällen

Problematischer, aber von kommerziellen Instituten meist ebenfalls als stichprobenneutral aufgeführt werden weiter:• kein Kontakt nach maximaler Anzahl von Kontaktversuchen,• Zielperson krank,• Zielperson über Erhebungszeitraum abwesend (z.B. verreist),• Zielperson trotz mehrerer Versuche nicht erreichbar.

Als relativ unproblematische stichprobenneutrale Ausfallgründe gelten etwa bei Telefonum-fragen:• kein Anschluss unter gewählter Nummer,• technische Probleme (Störungen),• kein Privathaushalt (bei Befragung von Personen in Privathaushalten),• keine Zielperson im Privathaushalt (z.B. Ausländer bei Wahlumfragen),• statt Telefonanschluss Nummer für Fax oder Modem.

Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 12.12.06

11

Ausfälle

Systematische Ausfallgründe sind:• Hörer aufgelegt• keine Auskunft über mögliche Zielperson erhalten• Zielperson verweigert unter Hinweis auf fehlendes Interesse• Zielperson verweigert unter Hinweis auf keine Zeit• Zielperson verweigert unter Hinweis keine Auskunft am Telefon• Zielperson verweigert aus anderen Gründen

Bei Zufallsauswahlen verhindern Ausfälle die Realisierung des Stichprobenplans. Als Folge sind die Vorzüge von Zufallsauswahlen (statistische Repräsentativität) nicht garantiert.Daher sind z.B. Quotenauswahlen innerhalb zufällig ausgewählter Gebiete in der Praxis oft nichtschlechter als zufällige Random-Walks.

Die Ausschöpfungsquote berechnet sich aus dem Verhältnis der Fälle in der Stichprobe (Netto-stichprobenumfang) zur (um stichprobenneutrale Ausfälle bereinigte) Zahl von auszuwählenden Elementen nach dem Stichprobenplan (Bruttostichprobenumfang).

Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 12.12.06

12

Gewichtung

Die Fälle einer Stichprobe werden vor der Datenanalyse oft gewichtet. Hat z.B. ein Fall das Gewicht 2, zählt er bei statistischen Berechnungen doppelt, hat er das Gewicht 1/2, zählt er nur die Hälfte.

Sinnvoll und notwendig ist die Verwendung von Designgewichten, wenn aufgrund des Stichprobenplans (bei geschichteten Stichproben) eine Teilpopulation bewusst überrepräsentiert wird.

Für Vergleiche zwischen den neuen und alten Bundesländern werden oft mehr Personen in den neuen Ländern befragt, als ihrem Anteil an der Gesamtbevölkerung entspricht. Bei Auswahl einer Person pro Haushalt sind Personen aus Single-Haushalten über-repräsentiert.

Designgewichte garantieren, dass sich aus dem Stichprobenplan ergebende Verzerrungen aufgehoben werden. Dies wird dadurch erreicht, dass mit dem Kehrwert der Auswahlwahr-scheinlichkeit gewichtet wird.

Wenn z.B. eine Population aus 5 Elementen in zwei Schichten mit 3 bzw. 2 Elementen geteilt ist und in einer stratifizierten Auswahl aus jeder Schicht ein Element ausgewählt wird, dann ergeben sich verzerrte Schät-zungen, wenn es bei dem betrachteten Merkmal Unterschiede zwischen den Schichten gibt.

Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 12.12.06

13

Design-Gewichte

Im Beispiel beträgt der Mittelwert über die Elemente in der Population 3000.

Auswahl-Schicht Element wahrscheinl. Gewicht

1 1000 1/3 31 2000 1/3 31 3000 1/3 32 4000 1/2 22 5000 1/2 2

1 2x xungewichteter Mittelwert: x2+

= 1 1 2 2

1 2

w x w xgewichteter Mittelwert: xw w⋅ + ⋅

=+

Der Mittelwert über die umgewichteten Mittelwerte der 6 möglichen Stichproben ergibt mit 3250 einen zu hohen durchschnittlichen Mittelwert, was Folge davon ist, dass in jeder Stich-probe die kleinere Schicht 2 mit gleicher Fallzahl auftritt wie die größere Schicht 1 und in Schicht 2 der Mittelwert mit 4500 höher ist als in Schicht 1 mit nur 2000.Wird als Gewicht der Kehrwert der Auswahlwahrscheinlichkeit verwendet und in den Stich-proben gewichtete Mittelwerte berechnet, dann wird die Verzerrung aufgehoben: Der Mittel-wert über die gewichteten Mittelwerte der 6 Stichproben ist gleich dem Populationsmittelwert.

ungew. Stichproben-Stichpr. mittelwert{1,4} 2500{1,5} 3000{2,4} 3000{2,5} 3500{3,4} 3500{3,5} 4000

Mittelw. 3250

gewicht. Stichproben-Stichpr. mittelwert{1,4} 2200{1,5} 2600{2,4} 2800{2,5} 3200{3,4} 3400{3,5} 3800

Mittelw. 3000

Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 12.12.06

14

Redressment

Gewichte werden aber auch vewendet, um (systematrische) Ausfälle auszugleichen.Die Elemente in der Stichprobe werden hierbei so gewichtet, dass bei bestimmten Merkmalen (z.B. Alter und Geschlecht) die Häufigkeitsverteilung mit der bekannten Verteilung in der Population übereinstimmt. Solche nachträglichen Gewichtungen werden als Redressmentbezeichnet.

Wenn z.B. in einer Befragung 40% der Befragten weiblich sind, in der Populationaber 50% weiblich sind, erhalten weibliche Befragte das Gewicht 5/4 und männlicheBefragte das Gewicht 5/6. Der gewichtete Stichprobenanteil der Frauen beträgt dann wie in der Population 50%.

Alternativen zur Gewichtung:In der Statistik werden zunehmend Verfahren entwickelt und in der Sozialforschung eingesetzt, die auf der Basis der verfügbaren Informationen die zusätzlichen Fehlermöglichkeiten durch Ausfälle abschätzen und zu korrigieren versuchen.

Redressment garantiert, dass die bei der Gewichtung berücksichtigen Merkmale mit den Popu-lationsmerkmalen übereinstimmen. Merkmale, die mit den Gewichtungsmerkmalen korrelieren, sind dann möglicherweise eben-falls weniger verzerrt. Andere Merkmale werden durch das Redressment aber nicht beeinflusst oder können sogar noch stärker verzerrt sein. Redressment garantiert somit keine Verbesserung der Stichprobe, kann aber über das Ausmaß der tatsächlichen Stichprobenfehler täuschen.

Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 12.12.06

15

Datenaufbereitung

DatenkontrolleHäufig treten Fehler beim Übertragen der Daten auf. Aufgefundene Fehler müssen vor der eigentlichen Datenanalyse in der Datenmodifikation bereinigt werden (Datenbereinigung oder Datenedition).

Neben „echten“ Verkodungsfehlern, also dem falschen Zuordnen von Antwortkategorien und Zahlen, treten aber oft auch unplausible oder inkonsistente Antworten auf

z.B. sehr hohes Einkommen trotz Arbeitslosigkeit.

Wenn sich unplausiblen Werte bei der Kontrolle nicht als Verkodungsfehler nachweisen lassen, ist allerdings in der Regel von Korrekturen abzusehen. Nur faktisch unmögliche Antworten sind als ungültig bzw. fehlend (k. A.) umzukodieren. Jede nachträgliche Veränderung ist zu dokumentieren.

Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 12.12.06

16

Neben Datenbereinigungen aufgrund von Fehlern und Inkonsistenzen beinhaltet die Datenmo-difikation auch:• Rekodieren von Variablen

z.B.: Zusammenfassen der Altersangaben in Altersgruppen,• Zerlegung von kategorialen Variablen in Dichotomien/Kontraste

z.B. Wahlabsicht in: CDU ja/nein, SPD ja/nein, ...,• Bildung von Indizes und Berechnung von Skalenwerten etc.

z.B. Differenz von CDU-Sympathie und SPD-Sympathie, Berechnung eines Schichtungsindex aus Einkommen, Beruf u. Bildung.

Durch Indizes und Skalen kann berücksichtigt werden, dass sich ein theoretischer Begriff in der Konzeptspezifikation auf verschiedene Aspekte bezieht.

Datenmodifikationen

IndexbildungIn Indizes werden in vorgegebener Weise Informationen aus verschiedenen Variablen zu einer neuen Größe zusammengefasst, die von theoretischem Interesse ist.

Die Arbeitslosenquote kann als Qotient aus der Zahl der Arbeitslosen (Variable 1)geteilt durch die Zahl der Beschäftigten (Variable 2) plus der Zahl der Arbeitslosengebildet werden:

ALQ = Nohne Arbeit / (Nbeschäftigt + Nohne Arbeit).

Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 12.12.06

17

Indexbildung

Indizes können sich nach komplexen Regeln aus Ursprungsvariablen zusammensetzen.Beispiel:Inglehart-Index zur Messung einer materialistischen oder postmaterialistischen Wertorientierung.

Frageformulierung im Fragebogen (Kurzform der Inglehart-Skala):Auch in der Politik kann man nicht alles auf einmal haben. Auf dieser Liste finden Sie einige Ziele, die man in der Politik verfolgen kann:

A. Aufrechterhaltung von Ruhe und OrdnungB. Mehr Einfluss der Bürger auf die Entscheidungen der Regierung.C. Kampf gegen die steigenden Preise.D. Schutz des Rechts auf freie Meinungsäußerung1. Welches Ziel erschiene Ihnen persönlich am wichtigsten? Nennen Sie bitte den

entsprechenden Buchstaben.2. Welches Ziel erschiene Ihnen am zweitwichtigsten? Nennen Sie bitte wieder den

zutreffenden Buchstaben.3. Und welches Ziel käme an dritter Stelle? Der Buchstabe genügt wieder.

Inglehart postulierte, dass die Ziele A und C Indikatoren für eine materialistische und die Ziele B und D für postmaterialistische Wertorientierungen stehen.

Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 12.12.06

18

Indexbildung

Entsprechend den Rangplätzen erhält das wichtigste Ziel den Wert 1, das zweitwichtigste den Wert 2, das drittwichtigste den Wert 3. Die Interviewer werden zudem angewiesen, für das unwichtigste Ziel den Wert 4 zu vergeben. Wenn für fehlende Werte der Wert 9 vergeben wird,könnten sich etwa die obigen Werte ergeben:

Der erste Befragte findet den Kampf gegen steigende Preise (C) am wichtigsten,mehr Einfluss der Bürger (B) am zweitwichtigsten, den Schutz des Rechts auf freieMeinunsgäußerung (D) am drittwichtigsten und Aufrechterhaltung von Ruhe und Ordnung (A) am uwichtigsten.Die letzte Person hält den Kampf gegen steigende Preise für am wichtigsten, kannoder will die andere Ziele jedoch nicht einordnen.

A. Aufrechterhaltung von Ruhe und Ordnung.B. Mehr Einfluss der Bürger auf die Entscheidungen

der Regierung.C. Kampf gegen die steigenden Preise.D. Schutz des Rechts auf freie Meinungsäußerung

Fiktive Antwortenvon 5 Befragten:A B C D4 2 1 31 4 2 33 1 4 24 1 2 39 9 1 9

Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 12.12.06

19

Indexbildung

Inglehart definiert seinen Index so, dass als Postmaterialist (Wert 1 auf der Skala) eine Person gilt, die die beiden postmaterialistischen Ziele B und D am wichtigsten und zweitwichtigsten findet und als Materialist (Wert 4), wer die beiden postmaterialistischen Ziele für am wich-tigsten hält. Bei Mischtypen sind ein materialistisches und ein postmaterialistische Ziel am wichtigsten, wobei es entsprechend dem wichtigsten Ziele eher postmaterialistische (Wert 2) oder eher materialistische Mischtypen (Wert 3) gibt.

Postmaterialismusskala: 1: reiner Postmaterialist: Ziele B und D am wichtigsten2: Mischtyp: eher Postmaterialist: Ziel B oder D am wichtigsten, gefolgt von Ziel A oder C3: Mischtyp: eher Materialist: Ziel A oder C am wichtigsten, gefolgt von Ziel B oder D4: reiner Materialist: Ziele A und C am wichtigsten9: keine Angabe (k.A.)

Fiktive Antwortenvon 5 Befragten:A B C D4 2 1 31 4 2 33 1 4 24 1 2 39 9 1 9

Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 12.12.06

Konstruktion der Indexwerte:zweitwichtigstes wichtigstes Ziel ist:Ziel ist: A B C DA: Ruhe und Ordnung - 2 4 2B: mehr Einfluss 3 - 3 1C: Inflationsbekämpfung 4 2 - 2D: Meinungsfreiheit 3 1 3 -

20

Indexbildung

Fiktive Antwortenvon 5 Befragten:A B C D4 2 1 31 4 2 33 1 4 24 1 2 39 9 1 9

Aufgrund der Antwortmuster wird die erste Person als eher Materialist eingestuft, die zweite Person als reiner Materialist, die dritte als reiner Postaterialist,die vierte als eher postmaterialistischer Mischtyp.Die fünfte Person kann nicht eingestuft werden.

INDEX3 eher Materialist4 reiner Materialist1 reiner Postmaterialist2 eher Postmaterialist9 keine Angabe

Postmaterialismusskala: 1: reiner Postmaterialist: Ziele B und D am wichtigsten2: Mischtyp: eher Postmaterialist: Ziel B oder D am wichtigsten, gefolgt von Ziel A oder C3: Mischtyp: eher Materialist: Ziel A oder C am wichtigsten, gefolgt von Ziel B oder D4: reiner Materialist: Ziele A und C am wichtigsten9: keine Angabe (k.A.)

Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 12.12.06

Konstruktion der Indexwerte:zweitwichtigstes wichtigstes Ziel ist:Ziel ist: A B C DA: Ruhe und Ordnung - 2 4 2B: mehr Einfluss 3 - 3 1C: Inflationsbekämpfung 4 2 - 2D: Meinungsfreiheit 3 1 3 -

21

SkalierungWenn es mehrere Indikatoren (in Umfragen i.a. als Items bezeichnet) zur Messung einer einzigen Größe gibt, kann es sinnvoll sein, die Messungen zu einem gemeinsamen Wert zusammen zu fassen, der eher als die einzelnen Messungen in der Lage ist, die tatsächliche Ausprägung bei einem theoretischen Konstrukt zu erfassen. Eine solche Zusammenfassung wird als Skala bezeichnet.

Der Unterschied zwischen einem Index und einer Skala besteht darin, dass die Berechnung der Skalenwerte (engl: Scores) auf der Basis eines statistischen Modells erfolgt. Skalen können danach als Indizes augefasst werden, die statistisch und empirische begründbar sind, währendandere Idizes nur theoretisch begründet werden.Dieses Kenzeichen von Skalen führt dazu, dass bei der Skalenbildung aufgrund empirischer Ergebnisse Items und/oder Untersuchungsobjekte als nicht skalierbar ausgeschlossen werden.

Es gibt unterschiedliche Methoden der Skalenbildung (Skalierungsverfahren).

Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 12.12.06

Die Grundidee eines Skalierungsverfahrens kann anhand der Guttman-Skala verdeutlicht werden:

Das Skalierungsverfahren geht davon aus, dass es mehrere (dichotome) Items unterschiedlicher Item-Schwierigkeit gibt. Die Item-Schwierigkeit gibt dabei an, wie wahrscheinlich (leicht bzw. schwer) es ist,einem Item zuzustimmen.

22

Guttmann-Skalierung

Als Beispiel soll eine Guttman-Skala der Intensität der politischen Beteiligung gebildet werden.Die Skala könnte etwa auf folgenden Items basieren:

(A) Haben Sie bei der letzten Bundestagswahl gewählt? (ja/nein),(B) Lesen Sie regelmäßig den politischen Teil einer Tageszeitung? (ja/nein),(C) Haben Sie schon einmal eine Wahlkampfveranstaltung besucht? (ja/nein),(D) Sind Sie Mitglied einer politischen Partei? (ja/nein).

Es erscheint plausibel, dass eine Person, die die letzte Frage bejaht, auch die ersten drei Fragen bejaht, dass eine Person, die die dritte Frage bejaht, auch die ersten beiden Fragen bejaht, und dass eine Person, die die zweite Frage bejaht, auch die erste Fragen bejaht. Es ist dagegen unplausibel, dass die vierte Frage bejaht, die erste dagegen verneint wird.

Die Item-Schwierigkeit gibt an, wie schwer es ist, das Item zu bejahen. Im Beispiel ist daher mit folgender Rangfolge zu rechnen:

1 (A) Haben Sie bei der letzten Bundestagswahl gewählt? (ja/nein)2 (B) Lesen Sie regelmäßig den politischen Teil einer Tageszeitung? (ja/nein)3 (C) Haben Sie schon einmal eine Wahlkampfveranstaltung besucht? (ja/nein)4 (D) Sind Sie Mitglied einer politischen Partei? (ja/nein)

Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 12.12.06

23

Guttman-Skalierung

Die möglichen Antwortmuster können dann danach sortiert werden, ob sie mit der Skalierungkompatibel (korrekt) oder nicht sind.Wenn "+" für die Bejahung eines Items steht und "-" für die Verneingung, kann folgende Einordnung erfolgen:

korrekte Muster fehlerhafte MusterFrage Frage

Skalenwert: A B C D Skalenwert A B C D1 - - - - 9 - - + -2 + - - - 9 - + - -3 + + - - 9 + - + +4 + + + - 9 - - + +5 + + + + 9 - + - +

Die Item-Schwierigkeit gibt an, wie schwer es ist, das Item zu bejahen. Im Beispiel ist daher mit folgender Rangfolge zu rechnen:

1 (A) Haben Sie bei der letzten Bundestagswahl gewählt? (ja/nein)2 (B) Lesen Sie regelmäßig den politischen Teil einer Tageszeitung? (ja/nein)3 (C) Haben Sie schon einmal eine Wahlkampfveranstaltung besucht? (ja/nein)4 (D) Sind Sie Mitglied einer politischen Partei? (ja/nein)

Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 12.12.06

24

Guttman-Skalierung

korrekte Muster fehlerhafte MusterFrage Frage

Skalenwert: A B C D Skalenwert A B C D1 - - - - 9 - - + -2 + - - - 9 - + - -3 + + - - 9 + - + +4 + + + - 9 - - + +5 + + + + 9 - + - +

Bei der Methode der Guttman-Skalierung werden üblicherweise (1) zunächst aufgrund der Antwortmuster die Schwierigkeit der Items ermittelt,(2) dann den Respondenten (Befragten) Skalenwerte zugeordnet(3) und anschließend wird geprüft, ob das Skalierungsmodell mit den Daten vereinbar ist. Wenn die Zahl der fehlerhaften Antwortmuster zu hoch ist, bilden die Items keine Guttmann-skala ab. Zur Beurteilung werden Kenngrößen berechnet.

Am Beispiel der Guttman-Skalierung lässt sich das Prinzip der Skalenbildung verdeutlichen. In der Realität ist es aber schwierig, Guttmann-Skalen zu bilden, so dass i.a. andere Skalie-rungsmethoden eingesetzt werden.

Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 12.12.06

25

Likert-Skala

Eine andere Logik der Skalierung wird bei der Likert-Skala (Methode der summierten Ratings) verwendet:

(1) Im ersten Schritt wird eine möglichst große Anzahl von Items formuliert, die das interessie-rende Konstrukt mit unterschiedlichen Item-Schwierigkeiten erfassen sollen.

(2) In einer Test-Stichprobe sollen Befragte alle Items auf einer mehrstufigen Antwortskalabeurteilen.

z.B. von 1: „stimme gar nicht zu“ bis 5: „stimme voll und ganz zu“

(3) Wenn es Items mit unterschiedlicher Polung gibt z. B: positive Polung „Ausländer sollten die gleichen Rechte erhalten wie Deutsche“ und negative Polung „Bei Arbeitslosigkeit sollten Ausländer in ihre Heimat zurück-geschickt werden“

werden die Items so rekodiert, dass bei allen Items ein hoher Wert die gleiche Bedeutung hat

z.B: 1 = für Diskriminierung von Ausländern, 5 = gegen Diskriminierung.Beispiel für eine solche Umpolungs-Recodierung: 5→1, 4→2, 3→3, 2→4, 1→5.

Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 12.12.06

26

Likert-Skala

(4) Von allen Items werden dann diejenigen ausgewählt, die am besten eine eindimensionaleSkala bilden. Dazu gibt es verschiedene Auswahlkriterien. Ein Kriterium besteht darin, zunächst die Summe aus den Angaben aller Items zu berechnen und dann nur diejenigen Items auszu wählen, die mit dieser Summe hoch korrelieren. Eine Korrelation weist einen hohen positiven Wert (Maximalwert: +1.0) auf, wenn sich der Wert einer Variable (hier der Summe) sehr gut aus dem Wert einer anderen Variable (hier: des einzelnen Items) voraussagen lässt.Items, die niedrig mit der Summe korrelieren, werden von der Skalenbildung ausgeschlos-sen.

(5) Die endgültige Skala ergibt sich aus der Summe der Antworten der verbleibenden Items.

Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 12.12.06

27

Likert-Skala

Beispiel: 4 Items zur Erfassung von Ausländerfeindlichkeit aus dem ALLBUS 1996:(1) Die in Deutschland lebenden Ausländer sollten ihren Lebensstil ein bisschen besser an

den der Deutschen anpassen.(2) Wenn Arbeitsplätze knapp werden, sollte man die in Deutschland lebenden Ausländer

wieder in ihre Heimat zurückschicken.(3) Man sollte den in Deutschland lebenden Ausländern jede politische Betätigung

untersagen.(4) Die in Deutschland lebenden Ausländer sollten sich ihre Ehepartner unter ihren eigenen

Landsleuten aussuchen

Die Zustimmung zu jede Frage kann auf einer Skala von 1 (stimme überhaupt nicht zu) bis 7 (stimme voll und ganz zu) geäußert werden. Da alle Items die gleiche Polung aufweisen (hoher Wert steht für Ausländerfeindlichkeit), muss kein Item umgepolt werden.

Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 12.12.06

28

Likert-Skala

Bei 5 fiktiven Fällen könnte es z.B. folgende Antworten geben, die für Schritt (3) zu einer Summe zusammengefasst werden:

A B C D SUMME5.00 6.00 7.00 7.00 25.005.00 4.00 3.00 1.00 13.006.00 7.00 7.00 7.00 27.006.00 1.00 2.00 1.00 10.005.00 3.00 2.00 2.00 12.00

Korrelation mit Summe: 0.12 0.94 0.99 0.98

Item A korreliert nur gering mitSUMME. Es ist sinnvoll nur dieletzten drei Items zu einer Likert-Skala zusammenzufassen.

Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 12.12.06

Die Scores der resulierenden Skala würden dann so berechnet, dass für jede Person die Summe oder der Mittelwert über die drei Items B, C u. D. berechnet wird.

- Wenn Arbeitsplätze knapp werden, sollte man die in Deutschland lebenden Ausländer wiederin ihre Heimat zurückschicken.

- Man sollte den in Deutschland lebenden Ausländern jede politische Betätigung untersagen.- Die in Deutschland lebenden Ausländer sollten sich ihre Ehepartner unter ihren eigenen

Landsleuten aussuchen