ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber:...

223
ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist Mitglied der GESIS Direktor: Prof. Dr. Wolfgang Jagodzinski Geschäftsführer: Dr. h.c. Ekkehard Mochmann Postanschrift: Postfach 410 960 50869 Köln Hausanschrift: Bachemer Straße 40 50931 Köln Telefon: Zentrale 0221 / 4 76 94 - 0 Telefax - 44 Redaktion - 50 Redaktion: Franz Bauske E-mail: [email protected] Internet: http://www.gesis.org/za ISSN: 0723-5607 © Zentralarchiv Die ZA-Information erscheint jeweils im Mai und November eines Jahres. Sie wird kostenlos an Interessenten und Benutzer des Zentralarchivs abgegeben.

Transcript of ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber:...

Page 1: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 November 2003

Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln

Das Zentralarchiv ist Mitglied der GESIS

Direktor: Prof. Dr. Wolfgang Jagodzinski Geschäftsführer: Dr. h.c. Ekkehard Mochmann

Postanschrift: Postfach 410 960 50869 Köln

Hausanschrift: Bachemer Straße 40 50931 Köln

Telefon: Zentrale 0221 / 4 76 94 - 0 Telefax - 44 Redaktion - 50

Redaktion: Franz Bauske

E-mail: [email protected] Internet: http://www.gesis.org/za

ISSN: 0723-5607

© Zentralarchiv

Die ZA-Information erscheint jeweils im Mai und November eines Jahres.

Sie wird kostenlos an Interessenten und Benutzer des Zentralarchivs abgegeben.

Page 2: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 November 2003

Inhaltsverzeichnis Mitteilungen der Redaktion ................................................................................................. 5

Zum Tode von Erwin K. Scheuch (1928 – 2003) von Heinrich Best ................................................................................................................ 6

Zum 100. Geburtstag von Günter Schmölders von Ekkehard Mochmann................................................................................................... 9

Ehrendoktor der Philosophie für Ekkehard Mochmann ................................................... 10

Forschungsnotizen Die Messung und Qualitätskontrolle kontextbezogener Befragungsdaten mithilfe der Mehrebenenanalyse – am Beispiel des Sozialkapitals von Stadtvierteln von Dietrich Oberwittler.................................................................................................... 11

Wie viele Fälle werden gebraucht? Ein Monte-Carlo-Verfahren zur Bestimmung ausreichender Stichprobengrößen und Teststärken (power) bei Strukturgleichungsanalysen mit kategorialen Indikatorvariablen von Dieter Urban und Jochen Mayerl .............................................................................. 42

Die „Last-birthday-Methode“ in einer postalischen Bevölkerungsumfrage. Auswirkungen auf den Rücklauf und die soziale Zusammensetzung von Volker Hüfken ............................................................................................................ 70

Variationen der Permissivität: Wie Frageformulierungen unterschiedliche Antwortverteilungen erbringen, wenn von „Erlauben“ oder „Verbieten“ die Rede ist von Karl-Heinz Reuband................................................................................................... 86

Dimensionalisierung, Gruppenbildung und Wahrscheinlichkeitsübergang. Zur Identifizier- und Interpretierbarkeit multivariater Beziehungen zwischen Milieu, Beruf und Weiterbildung an SOEP-Daten von Klaus Harney, Markus Weischet und Christoph Fuhrmann.................................... 97

Optische Datenerfassung im praktischen Einsatz von Peter Kriwy................................................................................................................ 136

Zur Qualität der sozialwissenschaftlichen Methodenausbildung – am Beispiel statistischer Datenanalyse von Wolfgang Ludwig-Mayerhofer ................................................................................ 144

Page 3: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

November 2003 ZA-Information 53

Berichte aus dem Archiv Das Teilprojekt "Ostdeutsche Lebensverläufe im Transformationsprozess (LV-Ost)" der Deutschen Lebensverlaufsstudie von Britta Matthes ........................................................................................................... 156

„Ausbildungs- und Berufsverläufe der Geburtskohorten 1964 und 1971 in West-deutschland“: die jüngste Teilstudie der Lebensverlaufsstudie als Scientific Use File von Steffen Hillmert ........................................................................................................ 167

Der DJI-Familiensurvey 1988 - 2000 auf CD-ROM von Evelyn Brislinger ...................................................................................................... 178

Sekundäranalysen der Daten der Media-Analyse mit Hilfe des Serviceangebots des Medienwissenschaftlichen Lehr- und Forschungszentrums (MLFZ) von Jörg Hagenah und Haluk Akinci............................................................................. 182

Informationen zum neuen ALLBUS 2002 von Michael Terwey ........................................................................................................ 191

Zum aktuellen Wandel im Zugriff auf ALLBUS-Materialien und zur ALLBUS-Nutzung in Publikationen von Michael Terwey ........................................................................................................ 195

Neue Studien im ZHSF .................................................................................................... 203 Complex Modelling: 33rd Spring Seminar at the Zentralarchiv March 1-19, 2004 von Maria Rohlinger ....................................................................................................... 213

Weiterbildung in statistischer Datenanalyse beim ICPSR Summer Program 2004, June 28 – August 20 ............................................................................................... 219

International Seminar 2003: Empirical Analysis of Labor Markets: Rückblick und Ergebnisse der Seminar-Evaluation von Nicole Thaller ........................................................................................................... 220

Bei Beiträgen, die nicht von Mitarbeitern des Zentralarchivs verfasst wurden, ist die Anschrift der Autoren beim jeweiligen Artikel angegeben. Die Inhalte der Beiträge entsprechen der Meinung der Autoren und geben nicht unbedingt die Ansicht der Redaktion wieder. Alle inhaltlichen Beiträge sind Gegenstand einer Beurteilung durch externe Gutachter. Wir bedanken uns bei den Gutachtern der Beiträge in diesem Jahr: Johann Bacher, Erlangen; Jürgen Friedrichs, Köln; Lorenz Gräf, Hürth; Steffen Kühnel, Göttingen; Heiner Meulemann, Köln; Markus Quandt, Köln; Jost Reinecke, Trier; Karl-Heinz Reuband, Düsseldorf; Heinz Sahner, Halle; Herbert Sallen, Köln; Christof Wolf, Köln.

Page 4: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 5

Mitteilungen der Redaktion

Als wir mit Ekkehard Mochmann verabredeten, zum 100. Geburtstag von Günter Schmölders den Gründer des ZA in Erinnerung zu rufen, ahnten wir nicht, dass uns der Abschied vom Mitbegründer unseres Instituts bevorstand. In der letzten Ausga-be hatten wir noch den 75. Geburtstag von Erwin K. Scheuch feiern können. Wie es die Gepflogenheit von EKS – so sein hausinternes Kürzel – zu ‚runden’ Ge-burtstagen war, hatte er wiederum ein Ausflugsschiff für seine Mitarbeiter und Freunde gechartert. Auf dieser Feier wurde ihm die Verleihung des Ehrendoktors der Fakultät für Sozial- und Verhaltenswissenschaften der Universität Jena angetra-gen. Dies nahm er mit großer Freude auf. Auch wenn er damals schon von einem Krebsleiden gezeichnet war, ließ er sich nichts von der Schwere der Krankheit an-merken. „Es geht mir gut. Ich spüre nichts, also gehe ich davon aus, dass da nichts mehr ist“, sagte er mir wenige Tage vor seinem Tod. Sein Tod hat uns alle über-rascht, hatten wir doch – ausgehend von seiner stets quirligen Aktivität – noch viele Pläne mit ihm. In Trauer verabschieden wir uns vom Spiritus Rector und langjähri-gen Direktor unseres Instituts. Heinrich Best findet für uns die passenden Worte.

Karl-Heinz Reuband prüft den Einfluss von Frageformulierungen auf die Antwort-verteilung und Volker Hüfken die Brauchbarkeit der „Last-birthday-Methode“ als Auswahlverfahren bei postalischen Umfragen.

Wolfgang Ludwig-Mayerhofer hat den Beitrag von Manuela Pötschke und Julia Simonson zum Inhalt und zur Qualität der sozialwissenschaftlichen Methoden-ausbildung aus der letzten Ausgabe aufgegriffen. In seinem Beitrag legt er den Fokus auch auf die Lehre und weist auf Mängel in den Lehr- und Handbüchern hin.

Klaus Harney, Markus Weischet und Christoph Fuhrmann thematisieren, in wel-cher Weise Milieuzugehörigkeit und Weiterbildungsbeteiligung aufeinander bezo-gen sind. Ebenfalls um Kontexteinflüsse geht es bei Dietrich Oberwittler. Er stellt mit der sog. ökometrischen Methode ein Verfahren zur Bildung von Mehrebenen-modellen vor, das die Analyse von Kontexteinflüssen auf individuelle Phänomene ermöglicht.

Dieter Urban und Jochen Mayerl beschreiben ein Verfahren zur Festlegung ausrei-chender Fallzahlen für eine robuste Schätzung von Strukturgleichungsmodellen.

Schließlich präsentieren wir einige Beschreibungen von Archivzugängen und spe-ziell aufbereiteten Datensätzen: den DJI-Familiensurvey 1988 - 2000, den ALLBUS 2002, die Media-Analysen, die Lebensverlaufsstudien des MPI Berlin und Daten-sätze aus der Historischen Sozialforschung.

Franz Bauske

Page 5: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

6 ZA-Information 53

Zum Tode von Erwin K. Scheuch (1928 – 2003)

von Heinrich Best 1

Beim Tode ihres Gründers zählen auch In-stitutionen zu den Hinterbliebenen. Sie er-leiden einen Verlust, der durch keine Neu-besetzung auszugleichen ist. Unwieder-bringlich vergeht das implizite Wissen um die Absichten, Erwartungen, Umstände und Verläufe, die mit ihrer Entstehung und frü-hen Entwicklung verbunden waren, und die ihnen heute angehörenden Menschen haben nun keine Chance mehr, sich aus erster Hand ihren intendierten Sinn erklären und ihre objektive Wirkung rechtfertigen zu las-sen. Was bleibt, ist ein auslegungsfähiger und auslegungsbedürftiger Corpus nachge-lassener Zeugnisse und Erinnerungen. Ver-gewisserung gibt es nur noch aus zweiter Hand.

Erwin K. Scheuch war einer der großen Gründer und Erbauer von Institutionen der internationalen Soziologie. Vieles von dem, was es heute an sozialwissenschaftlicher Infrastruktur in Deutschland gibt, und manches von dem, was international besteht, wurde von ihm gegründet oder maßgebend im Aufbau und der Entwicklung mitges-taltet. Am Gang der Dinge im Zentralarchiv war er als Vorsitzender des Trägerver-eins buchstäblich bis in seine letzten Tage mit hohem Einsatz beteiligt. Als er starb, endeten 43 Jahre der Arbeit für eine Einrichtung, die den Kern seiner wissenschaft-lichen Netzwerke und wohl auch den wichtigsten Bezugspunkt seiner Gefühle insti-tutioneller Vaterschaft bildete. Es fragt sich – und diese Frage ist für die deutsche

1 Dr. Heinrich Best ist Professor für Soziologie an der Friedrich-Schiller-Universität Jena, Carl-

Zeiss-Str. 2, 07740 Jena

Erwin K. Scheuch bei seiner Geburtstagsfeier am 9. Juni 2003

Page 6: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 7

empirische Sozialforschung, die vom Zuschnitt ihrer Infrastruktur entscheidend ge-prägt wird, allgemein von Belang –, welchen „Sinn“ Erwin K. Scheuch mit dieser Arbeit verband, was ihn bei diesem Einsatz bis zuletzt antrieb.

Eine Antwort scheidet ohne viel Aufhebens aus: die selbstgenügsame Geschäftig-keit eines organisationszentrierten Machers war seine Sache nicht. Er war ein Insti-tutionenbauer, ohne hier ein ausgeprägtes Macht- oder Prestigebedürfnis zu befrie-digen. Personalentscheidungen vollzog er, ohne den systematischen Aufbau einer Klientel zu betreiben und Abhängigkeiten zu bewirtschaften. Auch war ihm selbstreferentielle Organisationsarbeit ein Gräuel, dem er sich nur aussetzte, wenn es um Außenwirkung, Identität und Arbeitsfähigkeit der Einrichtung ging – dann aber mit heftigem Engagement.

Andererseits war – und hier bewegen wir uns auf dem unsicheren Terrain der Ver-gewisserungen aus zweiter Hand – sein Einsatz durchaus interessengeleitet und in Zügen ideosynkratisch: Scheuch suchte die sozialwissenschaftliche Infrastruktur als ein empirisches Sinnesorgan zu entwickeln, das seiner Weise des Wirklichkeitszu-gangs entsprach, von der er wiederum annahm, dass sie für die empirische Sozial-forschung zuträglich sei. Ganz elementar ging es ihm dabei um die Ermöglichung einer Befriedigung wissenschaftlicher Neugier, die zwar theoretisch interessiert ist, sich aber weder durch „nomothetische Absichten“ eingrenzen, noch durch politi-sche Verwertungsinteressen finalisieren lässt. Das Datenarchiv ist dabei der ideale Ort, an dem faktisch und virtuell die beständige Neukomposition des Wissens über die Gesellschaft auf einer immer diversifizierteren Datenbasis möglich ist und statt-findet. Die Historisierung und Internationalisierung der Datenbasis war für diese Prozesse konstitutiv, dennoch war sie nur ein begrenzt geplanter und planbarer Teilvorgang einer lateralen und vertikalen Erweiterung. Der Kumulationsvorgang ist nur selten im Sinne des methodologischen Rigorismus theoriegeleitet und wird von einer starken induktiven Unterströmung begleitet. Das Datenarchiv enthält Antworten auf Fragen, die noch niemand gestellt und Befunde, die noch niemand gedeutet hat. Es ist wie ein magischer Weinkeller, der mit den Jahren an Wert ge-winnt, wobei man seine Bestände nutzen kann, ohne sie verbrauchen zu müssen.

Überhaupt ist es ein bemerkenswerter und seinerseits deutungsbedürftiger Sachver-halt, dass auch und gerade für eine quantitative Soziologie Scheuchscher Prove-nienz die „Deutung“ ein legitimer Wirklichkeitszugang ist. Das abwägende „Lesen“ einer Kreuztabelle, die einfühlende Exegese der Befunde exploratorischer Daten-analysen (man denke an seine späte Liebe zur Korrespondenzanalyse), die Durch-musterung existierender Forschungsdaten nach „Entdeckungen“ sind weit von den Maximen und Vorgehensweisen deduktiv-nomologischer Wissenschaft entfernt.

Page 7: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

8 ZA-Information 53

Tatsächlich ist es eher ein hermeneutischer als hermetischer Umgang mit empiri-schem Material, den Scheuch betrieb. Die Deutung einer Skala, eines Faktors oder eines Vektors als „Sinnzusammenhang“ ist nicht weniger heroisch als eine Ge-dichtsinterpretation. Daten werden dann als eine Textsorte besonderer Art behan-delt, deren Botschaften über soziale Sachverhalte es zu entschlüsseln gilt und deren Subtexte sich auf den zweiten Blick und unter veränderter Perspektive durch Se-kundäranalysen erschließen lassen. Datenarchive sind speziell für Datenhermeneu-tiker geschaffene Institutionen. Sie verdanken ihre Existenz nicht zuletzt der Erwar-tung, dass in den dort aufbewahrten Datensätzen ein verborgener Sinn und ein wert-volles Wissen enthalten sind, das den Primärforschern entgangen ist oder von ihnen vernachlässigt wurde und sich bei Wiederaufnahme des Verfahrens aus veränderter Deutungsperspektive erschließt.

Dabei öffnet sich keine paradigmatische Kluft zwischen quantitativen und qualitati-ven Verfahren, Messung und Deutung. Die investigative Soziologie der späten Eli-tenuntersuchungen von Scheuch und Scheuch bezieht unausgesetzt „Fälle“ auf Strukturen und verwendet quantitative Daten als Interpretationshintergrund für in-dividuelle Vorgänge, die ihrerseits wiederum Verwendung finden, wenn es darum geht, den modus operandi zu rekonstruieren, der Muster in den Daten erzeugt. Man kann die Amalgamation von Interpretation und quantitativer Analyse geradezu als Charakteristik dieser Variante soziologischer Methodik ansehen. Dabei befindet man sich recht nah bei Max Weber, der die ursächliche Erklärung durch deutendes Verstehen als Kern des Wissenschaftsprogramms der Soziologie bestimmt hat.

Wenn es zutrifft, dass der Gründer den „Sinn“ seiner institutionellen Hinterlassen-schaft gestiftet hat, dann stehen seine Erben heute vor einem Problem der Verall-täglichung des Charismas. Das gilt nicht für den solide etablierten Bestand der sozi-alwissenschaftlichen Infrastruktur, die eine moderne, qualitativ anspruchsvolle Sozialforschung erst ermöglicht, sondern für deren zukünftige Entwicklung. Nur schwer gewöhnt man sich an den Gedanken, dass sich nun nicht mehr mit gehöriger Verspätung nach Sitzungsbeginn die Tür öffnet, Scheuch am Tisch Platz nimmt, nach Ausbreitung der Sitzungsunterlagen unverzüglich das Wort ergreift, um eine neue Agenda zu bestimmen, eine Kontroverse auszulösen oder eine Beobachtung mitzuteilen, die doch eine erhebliche Auswirkung auf die künftige Arbeit der Ein-richtung haben werde. Was an die Stelle der Erzeugung von Entwicklungsdynamik durch Intuition, Entdeckungsvermögen und seine Gabe, die Zusammenhänge im vermeintlich Disparaten zu erkennen, treten wird, wissen wir nicht, doch wird es sich von der Praxis der Vergangenheit unterscheiden, denn auch das Beziehungs-muster im Verhältnis von Gründer und Gründung ist vergänglich.

Page 8: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 9

Zum 100. Geburtstag von Günter Schmölders

von Ekkehard Mochmann

Am 29. September 2003 wäre Günter Schmölders 100 Jahre alt geworden, er starb mit 88 Jahren am 7.11.1991 in München. Das internationale biographische Archiv führt ihn als Wirtschaftswissenschaftler und Soziologen. Dieses Begriffspaar ist in der heutigen Wissenschaftssprache gängige Münze (wie etwa in socio-economic research oder sozio-ökonomische Forschung) und gilt als richtungweisend für eine empirisch fundierte Wissenschaft, die der Politik und Gesellschaft Orientierung für die wirtschaftliche und gesellschaftliche Entwicklung geben kann. In seiner aktiven Zeit als akademischer Lehrer und Forscher war diese Kombination eher ungewöhn-lich. Die Agenda der Wirtschaftswissenschaftler war bestimmt von abstrakten Theorien und Modellen, die selbst in gesamtwirtschaftlichen Simulationen eher mit Annahmen als mit empirischen Daten vorlieb nahm.

Ganz anders Schmölders: Er betrieb eine lebensnahe Wirtschaftswissenschaft auf Basis soziologischer und sozialpsychologischer Methoden. Bereits 1953 veröffent-lichte er sein erstes Programm zur sozialökonomischen Verhaltensforschung. Dabei ging es ihm nicht um eine Psychologisierung der Wirtschaft, sondern nach eigenem Bekunden vielmehr um die Untersuchung des psychisch motivierten Verhaltens im wirtschaftlichen Handeln sowohl der Einzelnen wie der Gruppen (ZA-Information 1, S. 11). Mit der Gründung der Forschungsstelle für empirische Sozialökonomik e.V. in Köln institutionalisierte er die Schaffung einer sozialökonomischen Datenbasis, die zur Fundierung seiner Analysen des Spannungsverhältnisses zwischen Bürgern und Staat beitrug. Dabei waren unerwartete Anfangswiderstände gegen die Umfra-geforschung zu überwinden. Sowohl bei der Deutschen Forschungsgemeinschaft (DFG) wie bei anderen wissenschaftlichen Gremien, die Umfragen finanzieren soll-ten, war „Auftragsforschung“ suspekt. Auf der anderen Seite konnte er eine wach-sende Sehnsucht nach empirischen Daten beobachten, die nicht nur aktuellen Um-fragen galt, sondern auch dem Festhalten von Umfrageergebnissen, um sie jederzeit wieder abrufbar zu machen (ZA-Information 1, S. 9). Seine Einblicke als Vor-standsmitglied der Deutschen Gesellschaft für Dokumentation in Angebot und Nachfrage nach dokumentiertem Material fanden ihre Ergänzung in den Erfahrun-gen von Erwin K. Scheuch, der längere Zeit in Amerika verbracht hatte und die Entwicklung des Roper Archivs für Umfragedaten kannte. So wurde Schmölders

Page 9: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

10 ZA-Information 53

1960 Gründer des Zentralarchivs für Empirische Sozialforschung, das er bis 1972 zusammen mit Scheuch leitete.

Mit deutlichen Worten mischte er sich auch in die öffentliche Diskussion der wirt-schaftlichen Entwicklung ein. So warnte er z.B. vor der steigenden Ausgabeflut der öffentlichen Hand oder nahm „Sozialschnorrer“, „Wettbewerbsmuffel“ oder „Subventi-onslöwen“ ins Visier. Lange Zeit wirkte er im wissenschaftlichen Beirat des Bundesfi-nanzministeriums, ohne die Einwirkungsmöglichkeiten auf die Politik zu überschätzen. Schmölders ist einer der Väter der Mehrwertsteuer.

Aus jahrzehntelanger Kenntnis und Zusammenarbeit mit Günter Schmölders hat Erwin K. Scheuch, der selbst auch gern deutlich formulierte, in seinem Nachruf auf Schmölders im November 1991 mit den Worten geschlossen: „Wenn die Glasperlen-spiele des rational choice, die inzwischen in andere Sozialwissenschaften hinein-strahlen, auch einmal dort als uraltmodischer Modellplatonismus langweilen, wenn in den Sozialwissenschaften allgemein wieder das Selbstverständnis vorherrschend wird, die Wissenschaft habe die Welt nicht nur zu betrachten, sondern zu verändern, dann ist vielleicht die zweite Wirkungszeit des großen Sozialwissenschaftlers Gün-ter Schmölders gekommen“ (ZA-Information 29, S. 9).

Wir konnten und können bei beiden lernen.

Ehrendoktor der Philosophie für Ekkehard Mochmann

Auf Beschluss der sozialwissenschaftlichen Fakultät hat die Universität zu Göte-borg Ekkehard Mochmann am 18. Oktober den Doktortitel der Philosophie verlie-hen. In der Begründung heißt es, dass damit besonders seine Verdienste gewürdigt werden, die er sich um die Entwicklung des ZA zu einem der weltweit führenden sozialwissenschaftlichen Datenarchive, die Entwicklung eines europäischen und weltweiten Netzwerkes für den sozialwissenschaftlichen Datenservice erworben hat. Darüber hinaus werden sein Einsatz für die Infrastrukturentwicklung in ver-schiedenen internationalen Gremien und sein Beitrag zur Verdeutlichung des Infra-strukturbedarfs der Sozialwissenschaften in Europa sowie besonders dessen Förde-rung im Rahmen der Large Scale Facility Activity der EU hervorgehoben.

Nach seiner Mitwirkung in Planungsgremien für die sozialwissenschaftliche Infra-struktur in Frankreich und den Niederlanden ist Ekkehard Mochmann nun auch vom Belgischen Forschungsministerium gebeten worden, an der Begutachtung der Dateninfrastruktur in Belgien mitzuwirken.

Page 10: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 11

Die Messung und Qualitätskontrolle kontextbezogener

Befragungsdaten mithilfe der Mehrebenenanalyse –

am Beispiel des Sozialkapitals von Stadtvierteln

von Dietrich Oberwittler 1

Zusammenfassung

Kontexteffekte – z.B. von Stadtvierteln, Betrieben oder Schulen – auf individuelle soziale Phänomene werden in der empirischen Sozialforschung bislang wegen der damit verbundenen methodischen Schwierigkeiten selten untersucht. Die Mehrebe-nenanalyse ist ein neueres statistisches Verfahren, das die Integration von Makro-Mikro-Verbindungen in empirische Erklärungsmodelle ermöglicht. In diesem Bei-trag werden zwei Aspekte dieses Verfahrens erörtert. Erstens wird ein ‚ökometri-sches’ Verfahren der Qualitätskontrolle von Befragungsdaten zu Kontextmerkmalen vorgestellt, das angewendet werden kann, wenn z.B. das ‚soziale Klima’ von Stadt-vierteln, Betrieben usw. anhand aggregierter Befragtendaten gemessen werden soll. Zweitens wird gezeigt, wie die simultane Berücksichtigung von Prädiktoren auf der individuellen und Kontextebene im Rahmen der Mehrebenenanalyse zur Korrektur von individualistischen Fehlschlüssen führt. Als empirisches Beispiel dient eine neue Bewohnerbefragung zum Sozialkapital von Stadtvierteln.

Abstract

Due to methodological problems, contextual effects on individual outcomes are a rarely investigated topic in empirical social research. Multilevel analysis as a new statistical method can help to integrate macro-micro-links into models of individual behaviour. In this article, two features of this approach are discussed. First, I de-scribe an ‘ecometric’ method of assessing the quality of survey data on contextual properties like the ‘social climate’ of neighbourhoods or companies derived by ag-

1 Dr. phil. Dietrich Oberwittler ist Wissenschaftlicher Mitarbeiter der kriminologischen For-

schungsgruppe am Max-Planck-Institut für ausländisches und internationales Strafrecht Frei-burg i.Br. E-mail: [email protected].

Page 11: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

12 ZA-Information 53

gregating individual-level data. Second, I demonstrate how the simultaneous use of individual- and context-level predictors in multilevel models can correct individual-istic fallacies. Recent survey data on the social capital of neighbourhoods is taken as an example.

1 Einleitung

1.1 Problemstellung: Mehrebenenansätze in der quantitativen Sozialforschung

Die Mehrebenenanalyse als ein innovatives statistisches Verfahren kann helfen, die in den empirischen Sozial- und Verhaltenswissenschaften weit verbreitete Tendenz zu individualistischen Fehlschlüssen zurückzudrängen und theoretisch angemessene Makro-Mikro-Verbindungen auch in empirische Erklärungsmodelle aufzunehmen. Denn während der ökologische Fehlschluss zum Wissenskanon der Methodenaus-bildung schon im Grundstudium gehört, machen sich nur sehr wenige Sozialfor-scher/innen darüber Gedanken, ob ihre Erklärungsmodelle sozialer Einstellungen oder Verhaltensweisen, die anhand der heute dominierenden Befragungsdaten über-prüft werden, ohne die Berücksichtigung von Kontextvariablen auf einer Makro-Ebene korrekt spezifiziert sind.2 Ein individualistischer Fehlschluss liegt dann vor, wenn fälschlicherweise angenommen wird, dass das zu erklärende Verhalten oder die zu erklärende Einstellung von Individuen ausschließlich durch Faktoren beein-flusst wird, die ebenfalls auf der individuellen Ebene liegen, oder dass das Weglas-sen von Kontext-Variablen zumindest nicht zu einer verzerrten Schätzung der im Modell enthaltenen individuellen Variablen führt. Jedoch ist jedes Individuum stets Teil einer hierarchischen Struktur (eines Stadtviertels, eines Betriebes, einer Region, usw.), so dass ein Einfluss dieser Struktur prinzipiell niemals ausgeschlossen werden kann (Ditton 1998: 13).

Erst in der jüngsten Vergangenheit wird vermehrt im Rahmen von Mehrebenenana-lysen explizit geprüft, ob und in welchem Ausmaß Kontextbedingungen auf einer Makro-Ebene Auswirkungen auf individuelle Einstellungen oder Verhaltensformen

2 Eine Internetrecherche mit der Suchmaschine Google ergab für den deutschen Sprachraum ei-

nen um den Faktor 15,5 häufigeren Gebrauch des Begriffs ‚ökologischer Fehlschluss’ gegen-über dem Begriff ‚individualistischer Fehlschluss’; die entsprechenden englischen Begriffe er-scheinen in der Toplevel-Domain .edu im Verhältnis 24:1. Es kommt noch hinzu, dass unter ‚in-dividualistischem Fehlschluss’ häufig etwas anderes, nämlich der fehlerhafte Rückschluss von Eigenschaften eines Individuums auf die Eigenschaften des Kollektivs, dem das Individuum angehört, verstanden wird.

Page 12: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 13

haben. Hängt zum Beispiel das Heirats-, Scheidungs- oder Fertilitätsverhalten von lokal und regional variierenden Opportunitätsstrukturen und kulturellen Normen ab (Hank 2003; Wagner und Weiß 2003)? Inwieweit wird das Wahlverhalten von lo-kalen Problemlagen beeinflusst (Dülmer et al. 1996)? Ist das Ausmaß der Fremden-feindlichkeit eine Funktion des Kontaktes mit Fremden (Dollase et al. 1999)? Macht ein armes Stadtviertel seine Bewohner noch ärmer (Friedrichs 1998; Wilson 1987)? Behindern sozialräumliche Benachteiligungen die psycho-soziale Entwick-lung oder den Arbeitsmarkterfolg von Jugendlichen (Leventhal und Brooks-Gunn 2000; O’Regan und Quigley 1998; Sampson et al. 1999)? Verhindert die informelle Sozialkontrolle in Wohnquartieren Gewaltkriminalität (Sampson et al. 1997, More-noff et al. 2001)? Fördern subkulturelle Netzwerke und Milieus deviante Verhal-tensweisen von Jugendlichen (Espelage et. al. 2003; Haynie 2001; Oberwittler, im Druck a, b)? Kontexteinflüsse auf individuelle soziale Phänomene, also Makro-Mikro-Verbindungen in der Sprache soziologischer Erklärungen (Esser 1996: 94), sind prinzipiell für ein breites Spektrum sozialwissenschaftlicher Forschungsgegen-stände denkbar, auch wenn ihre Relevanz und die Gestalt der jeweiligen Makro-Ebene (Staaten, Regionen, Stadtviertel, Schulen, Betriebe, Freundesnetzwerke, usw.) sehr unterschiedlich ausfallen.

Erst die Entwicklung der statistischen Methode der Mehrebenenanalyse (oder hie-rarchisch-(nicht)linearer Modelle) seit dem Ende der 1980er Jahre hat es möglich gemacht, den Einfluss unabhängiger Variablen auf Individual- und Aggregatdaten-ebene auf individuelle Zielvariablen sowie auch Interaktionen zwischen Variablen unterschiedlicher Ebenen in simultanen Regressionsgleichungen korrekt zu schätzen (DiPetre und Forristal 1994; Raudenbush und Bryk 2002; Snijders und Bosker 1999). Zwar wurden Mehrebenenanalysen auch schon früher durchgeführt (z.B. Alpheis 1989; Esser 1988), jedoch verletzt die Verwendung von Kontextvariablen im konventionellen Regressionsmodell die Annahme der Unabhängigkeit der Beob-achtungen und Unkorreliertheit der Fehler mit der Folge, dass die Standardfehler der Koeffizienten unterschätzt und Fehler erster Ordnung wahrscheinlicher werden. Das gleiche gilt generell auch für Individualdatenanalysen auf der Basis von ge-schichteten Zufalls- und Klumpenstichproben, selbst wenn ausschließlich Variablen auf individueller Ebene Verwendung finden, da sich die Befragten einer übergeord-neten Einheit (Schüler in Schulklassen, Beschäftigte in Betrieben, Bewohner in Stadtvierteln, Gemeinden oder Regionen) ähnlicher sind als bei einer reinen Zu-fallsauswahl von Befragten zu erwarten (Diekmann 1998: 336). Wenn dieses Prob-lem in der Praxis überhaupt erkannt wird – zum Beispiel trifft es auch auf die ALL-BUS-Datensätze zu – dann erscheint es jedoch eher als ein unerwünschter Störein-

Page 13: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

14 ZA-Information 53

fluss, nicht als Untersuchungsgegenstand eigenen Rechts, wie es in mehrebenenana-lytischen Forschungsdesigns der Fall ist. 3

1.2 Die Messung von Kontextmerkmalen

Wenn im Rahmen von Mehrebenenmodellen Makro-Mikro-Verbindungen eines Kontextes auf individuelle soziale Phänomene untersucht werden sollen, stellt sich die Frage nach der Messung der relevanten Kontexteigenschaften. Hierfür kommen im Wesentlichen zwei Datenquellen in Frage: Amtliche Daten und Befragungsda-ten.4 Zu den amtlichen Datensammlungen zählen in erster Linie die soziodemogra-phischen Strukturdaten der statistischen Ämter und anderer Behörden für unter-schiedliche räumliche oder organisatorische Verwaltungseinheiten (Stadtviertel, Städte und Gemeinden, Kreise, Schulen, usw.). Zwar ist die Reliabilität dieser Da-ten, die meist auf Vollerhebungen basieren, gut, jedoch stehen für zentrale Struk-turmerkmale (z.B. Einkommen, Bildung) mangels aktueller Volkszählung keine Daten zur Verfügung. Ist es möglich, Befragte den entsprechenden kleinräumlichen Verwaltungseinheiten zuzuordnen, so können individuelle Befragungsdaten und räumliche Strukturdaten im Mehrebenenmodell miteinander verbunden werden. Dieses Verfahren wird in einigen national-repräsentativen Befragungsstudien mit sehr großen Stichproben in den USA, wie der ‚Add Health Study’5 und dem ‚Natio-nal Crime Victimization Survey’6, erfolgreich praktiziert. Anhand dieser Mehrebe-nenverknüpfung von Befragungs- und amtlichen Daten lässt sich zum Beispiel zei-gen, dass Jugendliche in Regionen mit ungünstigen Arbeitsmarktbedingungen häu-figer Gewalt ausüben als in anderen Regionen (Bellair et al. 2003), oder dass das Viktimisierungsrisiko in Stadtvierteln ab einer bestimmten Armutskonzentration nicht-linear ansteigt (Lauritsen und White 2001), jeweils unter Berücksichtigung der sozialen Komposition und individuellen Eigenschaften der Befragten. Ein ent-sprechendes Forschungsdesign würde in Deutschland vermutlich schon an der Zer-splitterung der regionalen Zuständigkeiten für statistische Strukturdaten scheitern.

Häufig zielen die Hypothesen zur Kontextabhängigkeit sozialer Phänomene jedoch auf soziale Prozesse, die die Wirkung exogener struktureller Kontextmerkmale auf

3 Während SPSS keine Lösung für dieses Problem anbietet, kann es in STATA durch die Ver-

wendung des Zusatzbefehls /CLUSTER behandelt werden. 4 Andere nichtreaktive Erhebungsformen wie Beobachtungen oder die Analyse prozessproduzier-

ter Daten sollen hier ausgeklammert bleiben. 5 National Longitudinal Study of Adolescent Health, siehe

http://www.cpc.unc.edu/projects/addhealth/. 6 Siehe http://www.icpsr.umich.edu/NACJD/NCVS/.

Page 14: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 15

die individuellen sozialen Phänomene vermitteln. So nehmen Sampson et al. (1997) an, dass der Effekt von konzentrierter Armut auf Gewalt über die ‚kollektive Wirk-samkeit’ von Stadtvierteln vermittelt wird; Hank (2003: 85) vermutet, dass die Frauenerwerbsquote Auswirkungen auf die gesellschaftlichen Rollenerwartungen an Frauen haben könnte, die wiederum ihr Heirats- und Geburtsverhalten beeinflus-sen. In der jüngsten Zeit hat sich ein ganzer Forschungszweig etabliert, der die Exis-tenz und die Auswirkungen von Sozialkapital auf unterschiedlichen räumlichen und inhaltlichen Ebenen untersucht (Dekker und Uslaner 2001; Jungbauer-Gans 2002; Portes 1998; Putnam 2000, 2001; Sampson et al. 2002). Bilden Organisationen wie Betriebe oder Schulen die Makro-Ebene, so besteht häufig ein Interesse an dem so-zialen ‚Klima’ dieser Kontexte in Hinblick auf die individuellen Zielvariablen, z.B. Arbeitszufriedenheit oder Lernerfolg. Zu den Dimensionen des sozialen ‚Klimas’ gehören die Kohäsion der Gruppenmitglieder (Dion 2000) ebenso wie Verhaltens-stile von Lehrern oder Managern. Für die direkte Messung dieser vermittelnden Prozesse sind in der Regel Befragungsdaten erforderlich, die von den individuellen Befragten auf die jeweiligen Makro-Einheiten ‚hochaggregiert’ werden.7 Dies setzt Klumpenstichproben voraus, bei denen pro Kontext relativ viele Individuen gezo-gen werden. Hier stellt sich die Frage nach der Qualität und Qualitätskontrolle solcher aggregierter Befragungsdaten, die in der Psychometrie weitgehend unbeantwortet bleibt (Dion 2000: 20). Wie valide und zuverlässig messen die Befragungsdaten die sozialen Kontexteigenschaften? Wie kann man prüfen, ob die Befragten in ihrer Einschätzung des gemeinsamen Kontextes übereinstimmen? Wie viele Befragte sind notwendig, um zuverlässige Schätzwerte dieser Eigenschaften zu erhalten? Letztere Frage ist besonders für die Planung von Studien und Stichprobendesigns relevant. In diesem Beitrag möchte ich darstellen, wie diese Fragen mithilfe der Mehrebenenanalyse beantwortet werden können.

2 ‚Ökologische’ Reliabilität und Validität von kontextbezogenen Befra-gungsdaten

Die Standardmethoden der Umfrageforschung kennen keine Instrumente, um die Qualität von aggregierten Befragungsdaten in Hinblick auf Reliabilität und Validität auf der Makro-Ebene zu beurteilen. Während auf der Ebene individueller Befragter die Güte von Skalen z.B. mit Cronbachs Alpha bestimmt wird, fehlt es auf der Kon-

7 Dieses Verfahren ist zwar nicht unproblematisch, denn wenn sowohl die abhängige

(Individualdaten-)Variable als auch die unabhängigen (Kontext-)Variablen aus der gleichen Datenerhebung stammen, besteht die Gefahr einer Korrelation ihrer Messfehler (Duncan und Raudenbush 1999; Lüdkte et al. 2002); Alternativen wie die Durchführung unabhängiger Beobachtungen sind jedoch meist nicht möglich.

Page 15: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

16 ZA-Information 53

textebene an entsprechenden Instrumenten, die die Güte der Beobachtungen von Befragten hinsichtlich sozialer Eigenschaften der Kontexte messen. Raudenbush und Sampson (1999) haben daher jüngst eine auf der Mehrebenenanalyse basieren-de Methodik vorgestellt, die sie in Anlehnung an den gängigen Begriff ‚psycho-metrics’ ‚ecometrics’ nennen, und der sich auf die ökologische Dimension von kleinräumlichen Kontexten wie Stadtviertel, Schulen usw. bezieht. Die ökometri-sche Methode knüpft an ältere varianzanalytische Verfahren der Bestimmung der ‚Intraklassenkorrelation’ an (Ebel 1951; Bartko 1976; Buckner 1988). Grundle-gend hierfür ist die Überlegung, dass Befragte als Beobachter eine Einschätzung kollektiver Eigenschaften des gemeinsamen Kontextes, in dem sie sich aufhalten, abgeben. Zum Beispiel werden Bewohner zum sozialen Zusammenhalt in ihrer Nachbarschaft oder Beschäftigte eines Unternehmens zum Führungsstil der Unter-nehmensleitung befragt. Das Ziel ist es, eine intersubjektiv gültige, ‚wahre’ Beurtei-lung dieser kollektiven Eigenschaften zu erhalten. Je übereinstimmender die Beur-teilungen der Befragten ausfallen, desto höher ist die ökologische Reliabilität der Messung.

Für die Schätzung der ökologischen Reliabilität von Befragungsdaten macht man sich die Fähigkeit der Mehrebenenanalyse zunutze, die Gesamtvarianz von Variab-len in den Varianzanteil innerhalb der Kontexte (zwischen Befragten) und in den Varianzanteil zwischen den Kontexten – entsprechend einer Varianzanalyse – zu zerlegen. Das einfachste Mehrebenenmodell ohne Prädiktorvariablen hierzu lautet auf der Ebene der individuellen Befragten (Level 1) (Bryk und Raudenbush 1992: 17):

Yij = β0j + rij, (1)

Wobei Yij den Wert der Zielvariablen von Befragtem i in Kontext j bezeichnet, β0j

den Intercept des Kontexts j, und rij den Fehlerterm der Befragten im Kontext j mit einer Varianz σ2. Auf der Ebene der Gruppenkontexte (Level 2) ist die Gleichung:

β0j = γ00 + uoj. (2)

Der Intercept der Gruppenkontexte (β0j), der im ‚leeren’ Modell gleich dem Mittel-wert der Zielvariablen ist, wird in den Grand Mean der Gesamtpopulation (γ00) und einen Fehlerterm auf der Ebene der Gruppenkontexte (uoj) mit der Varianz τ00 zer-legt. Setzt man Gleichung (2) in Gleichung (1) ein, um das vollständige Mehrebe-nenmodell zu erhalten, ergibt sich

Page 16: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 17

Yij = γ00 + uoj + rij (3)

mit dem Grand Mean der gesamten Population (γ00), dem Fehlerterm der Gruppen-kontexte (uoj) und dem Fehlerterm der Individuen in den Gruppen (rij). Die uner-klärte Varianz der Zielvariablen besteht demnach aus den Varianzanteilen auf der individuellen (Level 1) und Kontextebene (Level 2):

Var(Yij) = σ2 + τ00. (4)

Auf der Basis dieser Varianzzerlegung kann nun das Maß der Übereinstimmung zwischen Befragten als Anteil der Zwischengruppen- an der Gesamtvarianz berech-net werden. Dieser Varianzanteil wird als Intraklassenkorrelation (Intraclass corre-lation, ICC) ρ bezeichnet:

ρ = τ00 /( τ00 + σ2). (5)

Mit 100 multipliziert ergibt ρ den Prozentanteil der kontextbezogenen Varianz an.

Auf der Basis der Intraklassenkorrelation kann nunmehr auch die Reliabilität (λ) der Messungen für die einzelnen Kontexte bestimmt werden. Hierfür ist ähnlich wie bei Cronbachs α für die Individualdatenebene die Anzahl der Messungen relevant, die sich hier jedoch nicht aus der Anzahl der Items ergibt, sondern aus der Anzahl der Befragten in den Kontexten, um die das Gewicht der individuellen Fehlervarianz verringert wird:

λj = τ00 /( τ00 + (σ2/nj)). (6)

Je mehr Befragte pro Kontext in die Messungen eingehen, desto stärker nähert sich die kontextbezogene Reliabilität λ dem Maximalwert 1 an. Die Reliabilität der Ge-samtpopulation der Kontexte ist gleich dem arithmetischen Mittel dieser λj.

Die Mehrebenenanalyse führt robuste Parameterschätzungen anhand von Maxi-mum-Likelihood Methoden durch und verwendet für die Schätzung der Kontextmit-telwerte sog. ‚empirical Bayes estimates’, die die Schätzwerte mit sinkender Relia-bilität in Richtung des Grand Mean bzw. eines aufgrund der Level-1-Prädiktoren in der Gesamtpopulation zu erwartenden Ergebnisses verschieben, so dass es zu einer ‚Schrumpfung’ (shrinkage) der Werteverteilung gegenüber den beobachteten Wer-ten kommt (Bryk und Raudenbush 1992: 39; Ditton 1998: 131). Dieses Verfahren, das wesentlich älter ist als die Mehrebenenanalyse, nutzt also für jeden einzelnen

Page 17: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

18 ZA-Information 53

Gruppenkontext zusätzliche empirische Informationen der übrigen Gruppenkontex-te, so dass das Problem niedriger Fallzahl je Kontext durch Poolen aller Kontexte ausgeglichen wird.

Das Reliabilitätsmaß λ kann dazu genutzt werden, die Frage nach Anzahl der not-wendigen Befragten pro Kontext zu beantworten. Aus der Formel (6) ergibt sich, dass bei sehr wenigen Befragten die Reliabilität mit jedem weiteren Befragten stark ansteigt. Bei einer fiktiven ICC von 10% ergibt sich bei nur 4 Befragten pro Kon-text λ=0,50, bei 10 Befragten λ=0,70, bei 20 Befragten λ=0,83 und bei 40 Befragten λ=0,91. Sampson und Raudenbush (1999: 9) kommen auf der Basis ihrer Beispiel-daten zu dem Ergebnis, dass ca. 30 Befragte pro Kontext ausreichen, um reliable Schätzungen kollektiver sozialer Prozesse zu erhalten.

Natürlich hängt es von dem jeweiligen Untersuchungsgegenstand ab, wie stark die Übereinstimmung der Befragten, und damit sowohl die Intraklassenkorrelation als auch die ökologische Reliabilität der entsprechenden Skalen ausfällt. Fragt man zum Beispiel Anwohner einer viel befahrenen Schnellstraße oder eines Stahlwerkes zur Umweltqualität ihrer Wohngegend, so ist anzunehmen, dass sie diese überein-stimmend als relativ schlecht einschätzen. Bei der Einschätzung der sozialen Ver-trauenswürdigkeit der Nachbarn oder der Sicherheit im Wohngebiet dürften die Ein-schätzungen schon weiter auseinander gehen und stärker von individuellen Merk-malen und Erfahrungen der Befragten abhängig sein. Möglicherweise beurteilen junge Menschen die Vertrauenswürdigkeit ihrer Nachbarn anders als alte, oder Menschen mit hohem Bildungsstatus anders als solche mit niedrigem Status.

Weil individuelle Merkmale in systematischer Weise Einfluss auf die Beurteilung von Kontexteigenschaften nehmen können, ist es empfehlenswert, die Beurteilun-gen um diese relevanten individuellen Merkmale zu kontrollieren (Sampson et al. 1997: 921). Dies wird dadurch erreicht, dass Prädiktorvariablen auf der individuel-len Ebene in das Mehrebenenmodell eingeführt werden und die Mittelwerte der Gruppenkontexte unter Berücksichtigung dieser individuellen Eigenschaften neu geschätzt werden.8

Bei Fragen etwa nach dem ‚sozialen Klima’ von Stadtvierteln oder Betrieben, die die Befragten quasi als ‚Rater’ eines gemeinsamen Kontextes ansprechen, sind hohe

8 Der Vorteil der Mehrebenenanalyse besteht hier vor allem darin, dass der Einfluss einer Prädik-

torvariable in ihren auf der individuellen Ebene und ihren auf der Kontextebene liegenden An-teil zerlegt wird. So könnte zum Beispiel der Ausländerstatus auf der individuellen Ebene einen geringen, aber auf der Kontextebene (als Ausländeranteil) einen großen Einfluss auf die wahr-genommene Vertrauenswürdigkeit der Nachbarn haben.

Page 18: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 19

Übereinstimmungen zwischen den Befragten und hohe Reliabilitäten der Kontext-variablen das selbstverständliche und intendierte Ziel der Datenerhebung. Wenn man die eingangs erwähnte Gefahr individualistischer Fehlschlüsse jedoch ernst nimmt, dann stellt sich die Frage, ob auch andere, eher auf individuelle als auf kol-lektive soziale Phänomene bezogene Fragen nicht ebenfalls – möglicherweise un-erwartete – Übereinstimmungen innerhalb der Kontexte aufweisen. Vielleicht sind beispielsweise das generelle Vertrauen in Mitmenschen, das Umweltbewusstsein oder die Einstellung zur Arbeit neben individuellen Merkmalen auch von Einflüssen des konkreten Lebensumfelds abhängig. Die ‚ökometrische’ Methode ist geeignet, um auch diese Fragen zu untersuchen und Einflussfaktoren auf unterschiedlichen Ebenen in einem Modell zu verbinden.

3 Beispiel: Die Messung des sozialen Kapitals von Stadtvierteln mithilfe von Befragungsdaten

Im Folgenden sollen die theoretischen Ausführungen anhand eines empirischen Beispiels illustriert werden; dabei handelt es sich um eine Bewohnerbefragung zu verschiedenen Aspekten des Zusammenlebens im Stadtviertel, die man unter dem Oberbegriff des kollektiven ‚Sozialkapitals’ subsumieren kann. Das Beispiel ist auf andere Themenbereiche und andere Arten von sozialen Kontexten, z.B. auf Schulen oder Betriebe, übertragbar. Alle nachfolgenden Berechnungen wurden mit dem Pro-gramm HLM 5.04 (Raudenbush et al. 2001) durchgeführt.

3.1 Daten

Die verwendeten Daten entstammen der ‚MPI-Bewohnerbefragung 2001’, die als postalische Befragung im Rahmen des DFG-geförderten Forschungsprojekts ‚So-ziale Probleme und Jugenddelinquenz im sozialökologischen Kontext’ in Köln, Freiburg und Gemeinden des Landkreises Breisgau-Hochschwarzwald zeitgleich durchgeführt wurde.9 Da hierzu ein Methodenbericht vorliegt, beschränke ich mich hier auf eine knappe Beschreibung (Oberwittler und Naplava 2002).10 Die postali-sche Befragung wurde in Köln in 100 von insgesamt 366 Stadtvierteln, in Freiburg in 32 von 40 Stadtbezirken, und im Landkreis Breisgau-Hochschwarzwald in 16 Städten und Gemeinden von insgesamt 50 durchgeführt. Die bewusst erfolgte Ge-bietsauswahl in Köln, die ca. ein Drittel der Gesamtfläche und 45% der jugendli-

9 DFG-Aktenzeichen: Ob 134/3-1 und -2. 10 Der Bericht kann heruntergeladen werden:

www.iuscrim.mpg.de/forsch/krim/docs/oberwitt_techpaper3.pdf

Page 19: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

20 ZA-Information 53

chen Bevölkerung umfasst, zeigt für wichtige sozialstrukturelle Indikatoren keine von der Grundgesamtheit aller 366 Kölner Stadtviertel abweichenden Verteilungen (Oberwittler 2003: 12). Die 100 Kölner Stadtviertel wurden zu 34, die 32 Freibur-ger Stadtbezirke zu 16, und die Städte und Gemeinden im Landkreis zu 11 größeren Einheiten zusammengefasst. Dies ergibt in der Summe N=61 Kontexte mit N=2505 Befragten. Die Zusammenlegung von benachbarten Stadtvierteln oder Gemeinden zu größeren Einheiten orientierte sich an der räumlichen Verteilung der befragten Jugendlichen der ‚MPI-Schulbefragung 1999/2000’, bei der zuvor insgesamt 6400 Jugendliche befragt worden waren (Oberwittler et al. 2001; Oberwittler und Blank 2003); für die Durchführung von Mehrebenenanalysen mit den Daten der Schulbe-fragung war es erforderlich, Stadtviertel und Gemeinden mit nur wenigen befragten Jugendlichen unter Berücksichtigung ihrer soziodemographischen Ähnlichkeit zu-sammenzulegen (Oberwittler 2003).

Die Grundgesamtheit der Bewohnerbefragung besteht aus allen Personen (mit und ohne deutsche Staatsangehörigkeit) im Alter zwischen 25 und 79 Jahren, die in Pri-vathaushalten (Hauptwohnsitz) in den ausgewählten Stadtvierteln Kölns und Frei-burgs bzw. Gemeinden des Landkreises Breisgau-Hochschwarzwald wohnen. Die Stichprobe ist eine Zufallsstichprobe aus den Einwohnermelderegistern, wobei je nach sozialstruktureller Lage zwischen 65 und 95 Adressen eingesetzt wurden, um die Zielgröße von ca. 35 Befragten pro Kontext zu erreichen.11 Die Rücklaufquote betrug bei zwei Mahnwellen in Köln insgesamt 43%, in Freiburg und dem Land-kreis ca. 60%; sie schwankte in den Kölner Gebietseinheiten zwischen 24,5% und 61%, und in den Freiburger Gebietseinheiten und denen des Landkreises zwischen 47% und 70%. Ein Vergleich der anhand der Befragtenangaben berechneten mit den amtlichen Sozialstrukturindikatoren der Kontexte weist auf eine gute Abbild-qualität der realisierten Stichprobe hin.12

Bei der Befragung kam ein standardisiertes, 8-seitiges Erhebungsinstrument mit insgesamt 110 Einzelfragen und -items zum Einsatz. Die Zielrichtung der Be-wohnerbefragung liegt im Rahmen der Gesamtstudie in der Messung der kollektiven, sozialräumlichen Aspekte des Wechselverhältnisses von sozialer Benachteiligung,

11 Da der Rücklauf in einigen Gebietseinheiten in Köln sehr niedrig war, wurden für diese Gebiete

zusätzliche Adressen nach den gleichen Kriterien wie bei der ursprünglichen Adressenziehung angefordert. Insgesamt wurden für 10 Gebiete nochmals 70 Fragebogen versendet.

12 Der Zusammenhang der auf der Basis der Befragtenangaben berechneten Sozialhilfequote mit der amtlichen Sozialhilfequote auf der Ebene der zusammengefassten Gebietseinheiten ergibt einen Zusammenhang von r=0,85; der Zusammenhang zwischen Befragungs- und amtlicher Ausländerquote beträgt r=0,83, und der Zusammenhang des Befragungs- und amtlichen Anteils von Wohnungen in 1- oder 2-Familienhäusern beträgt r=0,94.

Page 20: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 21

sozialer Kohäsion und Kontrolle sowie devianten Einstellungen und Verhaltenswei-sen von Jugendlichen. Bei der Entwicklung des Erhebungsinstruments waren vor allem Einflüsse der U.S.-amerikanischen Forschung zur Stadtsoziologie und zur ‚community’-bezogenen Kriminologie, und hier insbesondere des ‚Project on Hu-man Development in Chicago Neighborhoods’ prägend.13 Kurz gesagt steht dabei die Frage im Mittelpunkt, inwiefern das Sozialkapital von Stadtvierteln (das heißt die sozialen Netzwerke, die soziale Kohäsion, die kollektive Fähigkeit zur Durch-setzung gemeinsamer Interessen) den schon länger bekannten Zusammenhang von sozialstruktureller Benachteiligung und Gewalt- und Jugenddelinquenz vermittelt (Oberwittler 1999, im Druck a, b). Für diese sozialen Prozesse auf der Stadtviertel-ebene werden in der U.S.-amerikanischen Forschung häufig die Begriffe ‚social capital’ und ‚collective efficacy’ verwendet (Bellair 1997; Browning et al. 2000; Sampson et al. 1997, 1999). Eine Übersicht der verwendeten Skalen mit Anga-ben zur ‚psychometrischen’ Güte auf der Individualdatenebene findet sich im Anhang, die Verteilungen dieser Skalen auf der Kontextebene sind in Tabelle 1 dokumentiert.

Tabelle 1 Deskriptive Statistik der Skalen und Einzelitems (beobachtete Mittel-werte, N=61 Stadtviertel)

Bereich Min. Max. Mean Std.dev.

Sozialer Ruf des SV -3 bis +3 -2,14 2,57 1,07 1,20

Beobachtete Jugendgewalt 0 bis 3 0,32 1,69 0,85 0,34

Informelle Sozialkontrolle über Jugendl. 0 bis 3 1,44 2,50 1,91 0,26

Kindbezog. Sozialkapital 0 bis 3 1,37 2,53 1,99 0,31

Kriminalitätsfurcht in Wohngegend 0 bis 3 0,59 1,85 1,16 0,35

Verbundenheit mit SV 0 bis 3 1,42 2,62 2,16 0,33

Soziale Kohäsion 0 bis 3 1,19 2,53 1,87 0,29

Soziales Misstrauen 0 bis 3 0,64 1,63 1,04 0,25

Kollektive Interessenwahrnehmung 0 bis 3 1,45 2,36 1,89 0,21

Bekanntschaft mit Nachbarskindern 0 bis 3 0,49 2,06 1,15 0,34

Anomia 0 bis 3 1,14 2,20 1,65 0,26

Soziale Kontakte 0 bis 3 1,67 2,49 2,07 0,17

13 Projektleiter des PHDNC sind J. Brooks-Gunn, F. Earls, S. Raudenbush und R. Sampson.

Siehe http://phdcn.harvard.edu/about/index.html.

Page 21: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

22 ZA-Information 53

3.2 Ökologische Reliabilität

Zunächst soll die ‚ökometrische’ Methode der Überprüfung von kontextbezogener Reliabilität und Validität am Beispiel der Skala‚Verbundenheit mit dem Stadtvier-tel’ ausführlicher demonstriert werden. Von dieser aus drei Einzelitems gebildeten Skala (α = .89) ist anzunehmen, dass sie zwar indirekt die Merkmale des Kontexts, also der jeweiligen Stadtviertel, reflektiert, aber auch stark von individuellen Merk-malen der Befragten beeinflusst wird. So liegt die Hypothese nahe, dass Bewohner, die schon sehr lange in einem Stadtviertel wohnen, oder die dort Wohneigentum besitzen, eine höhere Verbundenheit mit ihrem Stadtviertel haben. Insofern ist diese Skala keine reine ‚Beobachtungsskala’, in der Befragte Auskunft über soziale Merkmale des Kontexts geben sollen, wie zum Beispiel die Frage nach dem sozia-len ‚Ruf’ des Stadtviertels (siehe unten).

Berechnet man in HLM nach Gleichung (3) das ‚leere Modell’ ohne erklärende Va-riablen, so ergibt die Varianzzerlegung einen Varianzanteil von σ2 = 0,473 auf der Befragtenebene (Level 1) und von τ00 = 0,095 auf der Kontextebene (Level 2) Tabelle 2. Nach Gleichung (5) ergibt sich daraus eine Intraklassenkorrelation (ICC) von ρ = 0,167 (0,095/(0,095+0,473)), also ein Prozentanteil der Level-2-Varianz an der Gesamtvarianz von 16,7%. Dieser Anteil ist nach dem X²-Test hoch signifikant (p<0,001). Unter Einbeziehung der Befragtenzahl liegt die kontextbezogene Relia-bilität (λ) mit 0,89 sehr hoch. Es gibt demnach eine relativ hohe Übereinstimmung der Befragten bei der Verbundenheit zu ihrem jeweiligen Stadtviertel, das heißt, diese Skala charakterisiert nicht nur die individuell geprägten Einstellungen der Be-fragten zu ihrem Stadtviertel, sondern auch einen Aspekt der intersubjektiv gültigen ‚Attraktivität’ der Stadtviertel.

Dies bestätigt sich noch mehr, wenn man einige individuelle Variablen, die die Ver-bundenheit mit dem Stadtviertel beeinflussen könnten, in das Modell aufnimmt – so unter anderem die Wohndauer, das Alter und den Wohnstatus (Eigentümer vs. Mie-ter) – , um den Effekt der sozialen Komposition der Befragten auf die geschätzten Kontextmittelwerte zu kontrollieren. Man erhält dadurch das so genannte ‚konditio-nale’ Modell mit der ‚konditionalen’ ICC (Tabelle 2). Diese liegt in unserem Bei-spiel mit 14,8% nur wenig unterhalb der ICC ohne Berücksichtigung individueller Befragtenmerkmale; entsprechend sinkt die Reliabilität geringfügig von 0,89 auf 0,87. Durch die Einführung von Level-1-Prädiktoren hat sich die Fehlervarianz so-wohl auf der individuellen als auch auf der Kontextebene reduziert; letzteres ist ein Hinweis darauf, dass einige der Prädiktorvariablen ebenfalls mit den Stadtviertel-kontext variieren. Auf der Befragtenebene beträgt der Anteil der nun aufgeklärten Varianz, die als relative Verringerung von σ2 gegenüber dem leeren Modell ((0,473-0,451)/0,473) berechnet wird, 5%.

Page 22: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 23

Tabelle 2 Skala ‚Verbundenheit mit dem Stadtviertel’: Varianzkomponenten im

hierarchisch-linearen Modell (N=2505 Befragte in N=61 Stadtvierteln)

‚leeres Modell’

‚konditionales Modell’ mit L1-Prädiktorena

Intercept 2,16 2,0

Varianzkomponenten

Level 1 - zwischen Befragten (σ2) 0,473 0,451

Level 2 – zw. Stadtvierteln (τ00) 0,095 X² 565,4 *** 0,078 X² 494,7 ***

ICC (ρ) 16,8% 14,8%

Reliabilität (λ) .89 .87

a Kontrollvariablen: Geschlecht, Alter, Kinder im Haushalt, Bildungsstatus, Bezug von Sozialhilfe oder Wohngeld, Bildungsgüter, Wohndauer mehr als 4 Jahre, Wohnung im 1- oder 2-Familienhaus, Wohneigentum

Ist nun eine konditionale ICC von 14,8% als hoch oder niedrig einzuschätzen? Über-wiegen hier die individuellen Einflüsse oder die des Kontextes? Um diese Frage zu beantworten, ist es sinnvoll, die Skala mit anderen Skalen und Items zu vergleichen, die in ganz unterschiedlichem Ausmaße Übereinstimmungen zwischen den Befrag-ten eines Kontexts zeigen. Hierzu habe ich in Tabelle 3 die Ergebnisse der eben dargestellten ‚ökometrischen’ Prüfung für die übrigen in der Befragung verwende-ten Skalen und Einzelitems in der nach ihrer ökologischen Reliabilität (unter Kon-trolle individueller soziodemographischer Merkmale) absteigenden Reihenfolge aufgelistet. Die konditionalen ICCs liegen zwischen 42,1% und 1,4%, die ökologi-schen Reliabilitäten entsprechend zwischen .97 und .36. Am höchsten ist die ökolo-gische Reliabilität bei der wahrgenommenen Einschätzung des sozialen ‚Rufs’ des Stadtviertels. Die Befragten wurden dazu nach ihrer Einschätzung gefragt, welchen Ruf ihr eigenes Stadtviertel bei den übrigen Bewohnern der Stadt (auf einer Skala von -3 bis +3) hat. 42% der Varianz liegen bei dieser Frage zwischen den Stadtvier-teln, und die Einführung individueller Kontrollvariablen führt sogar zu einer mini-malen Vergrößerung dieses Anteils gegenüber dem leeren Modell, während nur 3,1% der Varianz auf der Befragtenebene durch die Kontrollvariablen erklärt wer-den kann. Dies bedeutet, dass die Befragten ganz unabhängig von ihrem eigenen soziodemographischen Profil die soziale Reputation ihres Stadtviertels sehr über-einstimmend einschätzen.

Deutlich niedriger, aber ebenfalls noch höher als für die Verbundenheit mit dem Stadtviertel, fällt die ökologische Reliabilität für die Beobachtung von Jugendge-walt, für die Einschätzung des kindbezogenen Sozialkapitals und für die so genannte

Page 23: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

24 ZA-Information 53

Standardfrage zur Kriminalitätsfurcht im Wohngebiet aus (Tabelle 3). Letzteres Er-gebnis unterstreicht, dass das Ausmaß der Kriminalitätsfurcht sehr stark von klein-räumlichen Problemlagen bestimmt wird (Oberwittler, in Vorbereitung). Deutlich schlechter ist die ökologische Reliabilität der Skalen zur sozialen Kohäsion, zum sozialen Misstrauen und zum wahrgenommenen Potenzial kollektiver Interessen-durchsetzung im Wohngebiet mit weniger als 10% Varianz zwischen den Kontexten und λ-Werten um oder unter .80. Hier sorgen die individuellen soziodemographi-schen Kontrollvariablen für eine Reduktion der ICCs um ca. 40% gegenüber dem ‚leeren’ Modell. Das bedeutet, dass individuelle Befragtenmerkmale bei diesen Fra-gen einen erheblicheren Einfluss auf das Antwortverhalten haben als es etwa bei der Kriminalitätsfurcht oder der Verbundenheit mit dem Stadtviertel (jeweils ca. 11% Reduktion) der Fall ist. Betrachtet man schließlich zwei Skalen bzw. Einzelfragen, die keine Einstellungen bzw. Einschätzungen des Stadtviertels zum Gegenstand ha-ben, sondern individuelles Verhalten (Bekanntschaft mit Nachbarskindern, soziale Kontakte in der Nachbarschaft) sowie eine sozialraum-unabhängige Einstellungs-skala (Anomia), so ergeben sich noch geringere Reliabilitätswerte. Dies ist auch zu erwarten, da konkretes Verhalten ebenso wie Einstellungen, die sich nicht auf den Kontext beziehen, auch weniger vom Kontext beeinflusst werden sollten. Dennoch ist hervorzuheben, dass auch die Anomia-Skala selbst nach Kontrolle individueller soziodemographischer Merkmale, die 20% der Varianz auf der individuellen Ebene erklären können, einen hoch signifikanten (p < 0.001) Varianzanteil von knapp 5% auf der Kontextebene behält. Dies ist ein Hinweis darauf, dass Anomia auch durch Merkmale des kleinräumlichen sozialen Kontexts beeinflusst sein könnte.14

Es gibt keinen allgemeingültigen Grenzwert für die ökologische Reliabilität von kontextbezogenen Befragungsdaten; Duncan und Raudenbush (1999: 33) weisen jedoch darauf hin, dass selbst niedrige ICCs von ca. 10% für große Effektstärken von ca. .6 bis .8 verantwortlich sein können.

14 Eine kausale Interpretation des Ergebnisses ist bei Mehrebenenanalysen mit Querschnittsdaten

schwierig, da stets auch die Selbstselektion der Individuen in Kontexte und weitere, nicht ge-messene individuelle Eigenschaften für eine signifikante Level-2-Varianz verantwortlich sein könnten (Duncan und Raudenbush 1999: 36).

Page 24: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 25

Tabelle 3 ‚Ökometrische’ Gütewerte der Skalen und Einzelitems

(N=2505 Befragte in N=61 Stadtvierteln)

Level-2-Prädiktoren ICC (ρ)

ICC-cond. ∆% λ L1 R² L2 R²

A B C D

Sozialer Ruf des SV 42,0 42,1 + 0,2 .97 3,1 81,5 ---

Beobachtete Jugendgewalt 23,2 20,9 - 9,9 .91 3,7 75,9 +++

Kindbezog. Sozialkapital 25,1 17,5 - 30,3 .89 4,7 81,0 --- +++

Kriminalitäts-furcht in Wohngegend

18,5 16,4 - 11,4 .89 8,7 87,8 +++

Verbundenheit mit SV 16,8 14,8 - 11,9 .87 4,7 82,0 --- -

Soziale Kohäsion 16,7 9,7 - 41,9 .81 6,7 74,2 --- +++

Informelle Sozialkontrolle Jugendl.

10,0 7,5 -25.0 .76 0,7 76,4 --- (+)

Soziales Miss-trauen 12,6 7,4 - 41,3 .76 2,6 90,1 +++ +

Kollektive Interessen-wahrnehmung

8,3 5,1 - 38,6 .68 0,5 92,7 --- +

Bekanntschaft mit Nachbars-kindern

12,1 4,0 - 66,9 .63 16,6 80,6 --- +++

Anomia 9,6 4,5 - 53,1 .65 19,7 86,6 +++

Soziale Kontakte 4,6 1,4 - 69,7 .36 6,8 50,9 -

+ : positiver Zusammenhang; - : negativer Zusammenhang (+) p<0,10; + p<0,05; ++ p<0,01; +++ p<0,001 A: Sozialhilfequote gesamt; B: Sozialhilfequote < 18 Jahren; C: % Wohnungen in 1-/2-Familienhäusern D: % Kinder < 14 Jahren

Page 25: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

26 ZA-Information 53

3.3 Ökologische Validität

Ein weiteres Qualititätskriterium für kontextbezogene Befragungsdaten sind deren Zusammenhänge mit theoretisch vorhergesagten, am besten extern gemessenen Ei-genschaften der Kontexte. Bei sozialräumlichen Kontexten kommen dafür amtliche soziodemographische Daten in Frage. Aufgrund der bisherigen stadtsoziologischen Forschung ist bekannt, dass kollektive soziale Phänomene wie soziale Kohäsion im und Verbundenheit mit dem Stadtviertel stark von soziodemographischen Bedin-gungen beeinflusst werden. Nach dem klassischen Ansatz der sozialen Desorganisa-tion der ‚Chicago-School’ gelten Armut, Fluktuation und ethnische Heterogenität als Ursachen für niedrige Kohäsion und deviante Verhaltensweisen im Stadtviertel (Wirth 1938; Friedrichs 1995). In ihrem klassischen Aufsatz ‚Community Attach-ment in Mass Society’ zeigten Kasarda und Janowitz (1974), dass die Verbunden-heit mit dem Stadtviertel eher mit der individuellen Wohndauer als mit dem Urbani-tätsgrad des Wohnorts zusammenhängt. Die Schwächung der sozialen Kohäsion durch konzentrierte Armut wird auch in dem erneuerten Desorganisationsansatz von Sampson et al. (1997) bestätigt. Andere Autoren haben die Auswirkungen sozialer und physischer Desorganisation auf den sozialen Zusammenhalt in Stadtvierteln untersucht (Skogan 1990; Taylor 1996; Woldoff 2002).

Die Ergebnisse der externen Validierungen aller untersuchten Skalen mit amtlichen Strukturdaten sind in Tabelle 3 auf der rechten Seite wiedergegeben. Betrachtet man als erstes den wahrgenommenen sozialen Ruf des Stadtviertels, so zeigt sich ein sehr hoher Zusammenhang mit der Soziallage der Bewohner. Die bivariate Korrela-tion der nach der ‚Empirical-Bayes’-Methode geschätzten Stadtviertelmittelwerte des sozialen Rufs mit der amtlichen Sozialhilfequote der Stadtviertel beträgt r=-0,89, was einem Anteil der aufgeklärten Varianz von knapp 80% entspricht. Im vollstän-digen Mehrebenenmodell erklärt die Sozialhilfequote sogar 81,5% der Varianz auf der Kontextebene (siehe Tabelle 3, Spalte ‚L2 R²’). Berücksichtigt man, dass diese zusammengelegten Stadtviertel mit durchschnittlich 11.000 Einwohnern und 1,9 qkm Siedlungsfläche (im dicht besiedelten Köln 1,4 qkm) relativ groß und intern nicht völlig homogen sind, so ist es bemerkenswert, dass durchschnittlich 40 Be-fragte pro Kontext ausreichen, um die sozialstrukturelle Position der Stadtviertel innerhalb der Gesamtstadt mit einer einzigen Frage beinahe perfekt vorauszusagen.

Auch die Skala ‚Verbundenheit mit dem Stadtviertel’ korreliert auf der Kontext-Ebene sehr eng mit der amtlichen Sozialhilfequote; unter Kontrolle dieser Variable wirkt der Anteil der Wohnungen in 1- und 2-Familienhäusern zusätzlich leicht negativ auf die Verbundenheit; gemeinsam werden 82% der Varianz auf der Kontext-ebene erklärt. Auch bei den übrigen Skalen werden unabhängig von ihrer ökologi-

Page 26: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 27

schen Reliabilität auf der Kontextebene zwischen 70% und 90% der Varianz erklärt, wobei die Sozialhilfequote als Indikator der Sozialstruktur fast durchweg von großer Bedeutung ist.15 Teilweise gilt dies noch mehr für die Sozialhilferate der un-ter 18-Jährigen, die für die beobachtete Jugendgewalt und die Kriminalitätsfurcht im Wohngebiet stärkere Erklärungskraft hat als die Gesamt-Sozialhilfequote. Dieses Ergebnis ist plausibel, da die spezifische materielle Benachteiligung von Familien mit Kindern stärkere Auswirkungen auf das deviante Verhalten von Kindern und Jugendlichen und die daran gekoppelte Furcht der übrigen Bewohner vor Gewalt haben sollte als beispielsweise die materielle Benachteiligung von Rentnern.

Jedoch fallen die Zusammenhänge zwischen den ökologischen Skalen und der So-zialstruktur nicht einheitlich aus; wäre dem so, würde dies den Verdacht nähren, dass letztlich stets dasselbe latente Konstrukt gemessen wird. Die Kontext-Varianz von Skalen, die mit dem Ausmaß sozialer Problemlagen im Stadtviertel zu tun ha-ben (Ruf des Stadtviertels, Jugendgewalt, Kriminalitätsfurcht, Anomia), wird aus-schließlich durch sozialstrukturelle Benachteiligung erklärt, während für Skalen der sozialen Kohäsion und des Sozialkapitals (Kindbezogenes Sozialkapital, soziale Kohäsion, soziales Misstrauen, kollektive Interessenwahrnehmung, Kontakt mit Nachbarskindern) daneben auch der Anteil von 1- oder 2-Familienhäusern bzw. der Kinderanteil in der Wohnbevölkerung Erklärungskraft besitzt. Unabhängig von der sozialstrukturellen Lage spielt für das Sozialkapital von Stadtvierteln offenbar auch die Siedlungsstruktur bzw. durch diesen Indikator repräsentierten sozialen Eigen-schaften von Individuen und Wohngebieten eine wichtige Rolle. Sowohl 1- und 2-Familienhäuser als auch der Kinderanteil scheinen den sozialen Zusammenhalt und das Sozialkapital von Wohngebieten (unabhängig von Effekten des sozialen Status) zu fördern. Diese differenziellen Zusammenhänge der kontextbezogenen Skalen mit extern gemessenen sozialstrukturellen Merkmalen der Stadtviertel sprechen insge-samt für ihre ökologische Validität.

Das Untersuchungsdesign der ‚MPI-Bewohnerbefragung’ erlaubt es zudem, die Er-gebnisse dieser externen Validierung anhand mehrerer, voneinander unabhängiger Stichproben zu vergleichen. Dazu werden die bivariaten Zusammenhänge der ge-schätzten Stadtviertelmittelwerte der Skalen mit der amtlichen Sozialhilfequote als sozialstrukturellem ‚Leitindikator’ getrennt für die drei Untersuchungsgebiete Köln, Freiburg und Landkreis Breisgau-Hochschwarzwald in Streudiagrammen darge-

15 Bei der Bewertung dieser für Individualdaten ungewöhnlich hohen Zusammenhangswerte ist zu

bedenken, dass sich diese auf die Zusammenhänge von Mittelwerten auf einer Makro-Ebene be-ziehen, wo die individuelle Streuung statistisch eliminiert ist. Daher sind Zusammenhänge auf Aggregatdatenebene immer erheblich enger als auf Individualdatenebene.

Page 27: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

28 ZA-Information 53

stellt. Wegen ihrer schiefen Verteilung wurde die Sozialhilferate wurzeltransfor-miert (Abbildung 1 a bis h). Hier zeigt sich, dass sowohl die Intercepts als auch die Neigungen der Regressionslinien für die Stadtviertel in Köln und Freiburg in den meisten Fällen absolut deckungsgleich und in einigen Fällen immerhin weitgehend deckungsgleich sind. In keinem Fall bestehen statistisch signifikante Abweichungen der Regressionsmodelle auf der Kontextebene. Bei lediglich 11 Fällen ist der Ver-lauf der Regressionslinien für die Gemeinden des Landkreises Breisgau-Hoch-schwarzwald naturgemäß nicht so stabil wie für die anderen Stichproben. Zudem befinden sich die ländlichen Gemeinden stets gedrängt am äußersten oberen bzw. unteren Ende der Punktwolken, weil die Varianz der sozialen Bedingungen in die-sem Gebiet weitaus niedriger ist als in den Städten. Dennoch zeigen auch die ländli-chen Kontexte weitgehend ähnliche Zusammenhänge und vor allem gleiche Ni-veaus wie die großstädtischen Sozialräume, wenn man die sozialstrukturellen Be-dingungen kontrolliert. Obwohl Köln und Freiburg Städte von sehr unterschiedli-cher Größe und Struktur sind und zudem in unterschiedlichen regionalen Kontexten verankert sind, und obwohl die Stichprobe sowohl städtische als auch ländliche Ge-biete umfasst, bestehen demnach keinerlei sozialräumliche Unterschiede in der Ein-schätzung stadtviertelbezogener sozialer Prozesse, die nicht durch sozialstrukturelle Bedingungen erklärt werden können. Dieser Befund spricht für die Validität der kontextbezogenen Skalen und für die Generalisierbarkeit der Ergebnisse über die untersuchte Stichprobe hinaus.

Page 28: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 29

Abbildung 1 a bis h: Bivariate Streudiagramme der Befragungsdaten mit der amt-

lichen Sozialhilfequote (N=61 Stadtviertel, Empirical-Bayes-Schät-zungen unter Kontrolle individueller soziodemographischer Merkmale)

Sozialhilfequote (sqrt)

6543210

sozi

aler

Ruf

des

Woh

ngeb

iets

3,0

2,0

1,0

0,0

-1,0

-2,0

-3,0

FR-L (N=11)

Rsq = 0.2111

FR (N=16)

Rsq = 0.7869

K (N=34)Rsq = 0.7839

Sozialhilfequote (sqrt)

6543210

SV-V

erbu

nden

heit

3,0

2,5

2,0

1,5

1,0

FR-L (N=11)

Rsq = 0.5759

FR (N=16)

Rsq = 0.6779

K (N=34)Rsq = 0.6927

Sozialhilfequote 0-18 J. (sqrt)

7654321

beob

. Jug

endg

ewal

t

2,0

1,5

1,0

,5

0,0

FR-L (N=11)

Rsq = 0.3257

FR (N=16)

Rsq = 0.3083

K (N=34)Rsq = 0.6893

Sozialhilfequote 0-18 J. (sqrt)

7654321

Krim

inal

itäts

furc

ht

2,0

1,5

1,0

,5

0,0

FR-L (N=11)

Rsq = 0.1922

FR (N=16)

Rsq = 0.5679

K (N=34)Rsq = 0.7490

Verbundenheit mit dem SV Sozialer ‚Ruf’ des SV

Beobacht. Jugendgewalt Kriminalitätsfurcht

Page 29: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

30 ZA-Information 53

Sozialhilfequote 0-18 J. (sqrt)

7654321

kind

bez.

Soz

ialk

apita

l

3,0

2,5

2,0

1,5

1,0

FR-L (N=11)

Rsq = 0.2076

FR (N=16)

Rsq = 0.5852

K (N=34)Rsq = 0.5945

Sozialhilfequote (sqrt)

6543210

sozi

ales

Mis

stra

uen

2,0

1,5

1,0

,5

0,0

FR-L (N=11)

Rsq = 0.1368

FR (N=16)

Rsq = 0.4518

K (N=34)Rsq = 0.6681

Sozialhilfequote (sqrt)

6543210

sozi

ale

Kohä

sion

2,0

1,5

1,0

,5

0,0

FR-L (N=11)

Rsq = 0.3363

FR (N=16)

Rsq = 0.5389

K (N=34)Rsq = 0.3838

Sozialhilfequote (sqrt)

6543210

kolle

kt. I

nter

esse

nwah

rneh

mun

g

3,0

2,5

2,0

1,5

1,0

FR-L (N=11)

Rsq = 0.5221

FR (N=16)

Rsq = 0.4980

K (N=34)Rsq = 0.5630

Kollektive Interessenwahrnehmung

Soziales Misstrauen

Kindbezogenes Sozialkapital

Soziale Kohäsion

Page 30: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 31

Abbildung 2 Sozialhilfequote (Januar 2000, in %), Kölner Auswahlgebiete

Diese Ergebnisse sind in den Abbildungen 2 – 5 auch kartographisch jeweils für die Auswahlgebiete in Köln dargestellt. Kartographische Darstellungen erlauben eine detalliertere und zugleich intuitive Informationsvermittlung, da sie relevante Zusatz-informationen wie z.B. die Zentralität von Stadtvierteln mit transportieren. Für die Klassenbildung der Werteverteilung wurde hier das Verfahren der gleich großen Skalenabstände gewählt. Dies betont die Extremwerte stärker als das Verfahren der gleich großen Klassen (z.B. Quintile).

Page 31: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

32 ZA-Information 53

Abbildung 3 %-Anteil Wohnungen in 1-/2-Familienhäusern (2000),

Kölner Auswahlgebiete

Abbildung 4 Verbundenheit mit dem Stadtviertel (Empirical-Bayes-Schätzungen), Kölner Auswahlgebiete

Page 32: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 33

Abbildung 5 Soziale Kohäsion (Empirical-Bayes-Schätzungen),

Kölner Auswahlgebiete

3.4 Korrektur individualistischer Fehlschlüsse mithilfe von Mehrebenen-modellen

Zuletzt möchte ich die eingangs formulierte These von der Gefahr individualisti-scher Fehlschlüsse am Beispiel der Skala ’Verbundenheit mit dem Stadtviertel’ em-pirisch belegen. Wie sich bereits bei der Untersuchung der ökologischen Reliabilität zeigte, beeinflussen offenbar sowohl individuelle als auch kontextbezogene Merk-male das Ausmaß der Verbundenheit mit dem Stadtviertel. Die Mehrebenenanalyse ermöglicht eine angemessene Modellierung dieser Einflüsse von Variablen auf mehreren Ebenen, während eine konventionelle Modellierung auf der Individualda-tenebene impliziert, dass solche Effekte auch ausschließlich auf der Individualda-tenebene angesiedelt sind. Um die Konsequenzen dieser unterschiedlichen Modell-ansätze zu vergleichen, sind die Ergebnisse der konventionellen OLS-Regression und der hierarchisch-linearen Modelle (HLM) mit denselben Daten in Tabelle 4 nebeneinander dargestellt.

Page 33: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

34 ZA-Information 53

Tabelle 4 Vergleich konventioneller OLS- und hierarchisch-linearer Regression

für die Skala ‚Verbundenheit mit dem Stadtviertel’

OLS HLM unstandard. Beta-Koeff.

b std. err. t-wert b std. err. t-wert

Level 1 (N=2505 Befragte)

Geschlecht (weiblich) 0,025 0,03 0,86 -0,006 0,03 -0,24

Alter in Jahren (*10) 0,030 0,01 2,4 * 0,028 0,01 2,6 **

Bildungsstatusa -0,001 0,03 -0,2 n.s. -0,049 0,03 -1,7

Sozialhilfe/Wohngeld -0,288 0,06 -5,1 *** -0,114 0,06 -1,8

Bildungsgüterb -0,047 0,05 -1,1 -0,131 0,04 -3,1 **

Kinder im HH -0,088 0,04 -2,5 * -0,045 0,03 -1,4

Wohndauer > 4 Jahre 0,087 0,04 2,4 * 0,101 0,04 2,7 **

Wohneigentum -0,071 0,04 -1,9 -0,029 0,04 -0,7

1- od. 2-Familienhaus 0,201 0,04 5,6 *** 0,136 0,03 4,0 ***

Soziale Kontakte im SV 0,253 0,02 10,4 *** 0,224 0,03 7,5 ***

Intercept 1,503 0,13 12,0 *** 1,610 0,12 13,7 ***

Level 2 (N=61 Stadtviertel/Gemeinden)

% Sozialhilfeempf. (sqrt) -0,280 0,02 -11,7 ***

% 1-, 2-Fam.häuser (sqrt) -0,036 0,01 -2,9 **

Level 1 - R² 8,3% σ² = 0.433

Level 2 - R² c 12,5 %

83,8% τ00 = 0.013 a Bildungsstatus: dichotom (Abitur oder höher) b Bildungsgüter: mehr als 100 Bücher, Internetanschluss (dreistufig) c gegenüber dem konditionalen Modell

Folgt man der OLS-Regression, so hängt die Verbundenheit mit dem Stadtviertel vor allem mit der Häufigkeit sozialer Kontakte und dem Wohnen in einem 1- oder 2-Familienhaus positiv, mit dem Empfang von Sozialhilfe oder Wohngeld (als Sta-tusindikator) negativ zusammen; wenn Kinder im Haushalt des Befragten leben, ist die Verbundenheit ebenfalls etwas niedriger. Insgesamt werden 12,5% der Varianz aufgeklärt. In der HLM-Regression stellen sich diese Zusammenhänge auf der indi-viduellen Ebene teilweise anders dar: Zwar bestehen hier einige Zusammenhänge, allen voran die Bedeutung der sozialen Kontakte, in ähnlicher Weise fort, aber an-dere, vor allem sozialstrukturelle Faktoren verlieren bzw. gewinnen an Bedeutung. Der unstandardisierte Betakoeffizient des Bezugs von Sozialhilfe oder Wohngeld schrumpft um 60% und verliert seine signifikante Rolle; das Gleiche gilt für die

Page 34: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 35

Anwesenheit von Kindern im Haushalt. Auch der Koeffizient des Wohnens im 1- oder 2-Familienhaus schrumpft um ein Drittel, bleibt jedoch signifikant. Gleichzei-tig führt ein Ansteigen der Quote der Sozialhilfeempfänger auf der Kontextebene zu einem deutlichen Absinken der durchschnittlichen Verbundenheit der Befragten, und auch der Zusammenhang der durchschnittlichen Verbundenheit mit dem Anteil der Wohnungen in 1- oder 2-Familienhäusern im Stadtviertel ist signifikant negativ. Im OLS-Modell führt die individuelle Eigenschaft Sozialhilfe-/Wohngeldbezug zu einer Reduktion der Verbundenheit mit dem Stadtviertel um 0,31 Punkte (auf einer Skala von 0 bis 3); im hierarchisch-linearen Modell führt die gleiche Eigenschaft nur zu einer Reduktion der Zielvariable um 0,11 Punkte. Steigt jedoch die Sozialhil-fequote auf der Stadtviertelebene um 6% (eine Standardabweichung), sinkt die Ver-bundenheit mit dem Stadtviertel um 0,27 Punkte.16

Während der Faktor Sozialhilfe auf Individual- und Kontextebene in der gleichen Richtung wirkt, der weitaus größere Effekt jedoch auf der Kontextebene liegt, wirkt der Faktor 1-/2-Familienhaus auf den beiden Ebenen in entgegengesetzte Richtun-gen und ist auf der individuellen Ebene stärker. Befragte, die in 1-/2-Familien-häusern wohnen, geben eine deutlich höhere Verbundenheit mit ihrem Stadtviertel an, aber die durchschnittliche Verbundenheit der Befragten in Stadtvierteln mit ei-nen hohem Anteil von Wohnungen in 1-/2-Familienhäusern ist etwas niedriger. Dieses Ergebnis ist auf den ersten Blick verblüffend, lässt sich aber mit der fehlen-den Geschäfts- und Unterhaltungsinfrastruktur in ‚reinen’ Wohngebieten erklären. Diese Vermutung wird bestätigt, wenn auf der Kontextebene anstelle des Anteils der Wohnungen in 1-/2-Familienhäusern eine Indikatorvariable der Infrastruktur-dichte17 in das Mehrebenenmodell eingeführt wird. Diese Prädiktorvariable hat ei-nen positiven Einfluss auf die Verbundenheit mit dem Stadtviertel und erhöht die Varianzaufklärung auf Level 2 leicht von 83,8% auf 85,1% (nicht dargestellt). Die Monostruktur von Eigenheimsiedlungen führt also zu einem subjektiv wahrgenom-menen Attraktivitätsverlust gegenüber den ‚lebendigeren’ Innenstädten. Dies ist vermutlich auch der Grund, warum die ländlichen Gemeinden im Freiburger Um-land etwas niedrigere Verbundenheitswerte aufweisen.

Zwar ist der Anteil der aufgeklärten Varianz in der HLM-Regression auf der Indivi-dualebene geringer (8,3%), dafür werden nun zusätzlich fast 84% der Varianz auf

16 Hierfür habe ich, anders als in der Tabelle berichtet, Modelle mit der untransformierten (schief verteil-

ten) Sozialhilfequote gerechnet. 17 Diese besteht aus der Anzahl der Bekleidungsgeschäfte, Arztpraxen, Reisebüros und Gaststätten

pro qkm. Die Daten wurden der CD-ROM ‚Gelbe Seiten’ 1998 der Deutschen Telekom ent-nommen, rekodiert und auf die Untersuchungsgebiete aggregiert.

Page 35: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

36 ZA-Information 53

der Kontextebene, die wiederum 14,8% der Gesamtvarianz ausmacht (ICCcond. in Tabelle 3), erklärt.18

Die falsche Annahme der konventionellen Regression, dass alle relevanten Effekte auf der Individualebene liegen, hat also sowohl zur Über- als auch Unterschätzung von Regressionskoeffizienten geführt. Stadtviertel mit einer hohen Konzentration von Sozialhilfeempfängern weisen eine durchschnittlich geringere Verbundenheit aller ihrer Bewohner auf, vermutlich weil diese Viertel aufgrund verschiedener As-pekte – soziale Zusammensetzung, bauliche/physische Struktur, Lage innerhalb des Siedlungsraumes – als weniger attraktiv empfunden werden. Dafür ist es gleichgül-tig, ob die Befragten individuell von Sozialhilfe betroffen sind oder nicht. Weil in Stadtvierteln mit vielen Sozialhilfeempfängern auch viele Kinder leben (r = .38), zeigt die OLS-Regression einen negativen Zusammenhang der Eigenschaft ‚Kinder im Haushalt’ mit der Verbundenheit mit dem Stadtviertel an; wird der sozialstruktu-relle Effekt auf der Kontextebene berücksichtigt, verschwindet dieser Scheinzu-sammenhang. Auf der anderen Seite ergibt sich in der HLM-Regression ein negati-ver individueller Zusammenhang zwischen dem Bildungsstatus (gemessen an dem Besitz von Bildungsgütern) und der Verbundenheit mit dem Stadtviertel, der in der OLS-Regression nicht erkennbar ist, weil der Bildungsstatus mit dem durchschnitt-lichen Sozialstatus der Stadtviertel, der sich positiv auf die Verbundenheit auswirkt, konfundiert ist (vgl. Buckner 1988: 785).

Nun könnte man einwenden, dass die Analyse eines soziales Phänomens wie der Verbundenheit mit dem Stadtviertel erkennbar eine kollektive, kontextbezogene Dimension hat, und die Frage der angemessenen ‚unit of analysis’ leicht zu klären ist. Doch sollten die Beispiele in diesem Beitrag das Bewusstsein dafür schärfen, dass Makro-Mikro-Effekte des Kontextes auf individuelle Zielvariablen auch in unerwarteten und weniger offensichtlichen Themengebieten ‚lauern’ können. Zum Beispiel zeigen sich ganz ähnliche Kontexteffekte des Stadtviertels bei der Erklä-rung der Kriminalitätsfurcht, die in der Forschung bislang ganz überwiegend als ein rein individuelles Phänomen behandelt wird (Oberwittler, in Vorbereitung).

Ausblick

Die hier vorgestellte ‚ökometrische’ Methode stellt einen Baustein für die Bildung von Mehrebenenmodellen dar, die die Analyse von Kontexteinflüssen auf individu-

18 Eine einfache Berechnung des Gesamt-R² in Mehrebenenmodellen ist nicht möglich (Kreft und

de Leeuw 1998: 119).

Page 36: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 37

elle Phänomene ermöglichen. Beispielsweise dienen die hier vorgestellten Skalen zum Sozialkapital von Stadtvierteln dazu, den Einfluss der sozialräumlichen Mak-roebene auf das individuelle Delinquenzverhalten von Jugendlichen zu überprüfen, das in einer unabhängigen Befragung in denselben Stadtvierteln gemessen wurde (Oberwittler im Druck a, b). Dieser gegenüber der konventionellen Analysestrategie komplexere Ansatz ist theoretisch vielen Gegenstandsbereichen der Sozial- und Verhaltenswissenschaften angemessen, da Individuen in der realen Welt stets in größere Strukturen eingebettet sind und entsprechende Wirkungen im Sinne von Makro-Mikro-Verbindungen nicht ausgeschlossen werden können. Ist der Fokus der Forschung ausschließlich auf die Makro-Ebene gerichtet, sind also Kontexte die zentralen Untersuchungseinheiten, deren Eigenschaften jedoch durch Individualda-ten gemessen werden müssen, so ermöglicht die ‚ökometrische’ Methode eine Qua-litätskontrolle der individuell erhobenen Daten und die Bildung von aggregierten Werten, die um individuelle Messfehler bereinigt sind. Dabei sind schon 30 bis 40 Befragte pro Kontext ausreichend, um zu reliablen Daten zu gelangen.

Die sich schnell entwickelnden mehrebenenanalytischen Verfahren ermöglichen Erweiterungen dieses Ansatzes. Raudenbush und Sampson (1999a, 1999b) bilden 3-Ebenen-Modelle, in denen auf der ersten Ebene Items in Befragten, und auf der zweiten Ebene Befragte in Kontexten geschachtelt sind, und die im Effekt eine Ver-knüpfung eines Makro-Mikro-Kontextmodells mit einem Messmodell latenter Vari-ablen darstellen. Dadurch wird eine Messfehlerkontrolle auch auf der individuellen Ebene ermöglicht und die Mehrebenenanalyse an die Logik der Strukturglei-chungsmodelle angenähert.

Es wäre wünschenswert, wenn der Mehrebenenansatz größere Berücksichtigung in der empirischen Sozialforschung finden würde, und wenn die ‚geschachtelte’ Struk-tur sozialer Phänomene schon in der Konzeption von Datenerhebungen berücksich-tigt werden würde, um überhaupt die Voraussetzungen für Mehrebenenanalysen zu schaffen.

Literatur

Alpheis, Hannes (1989). Kontext- und Mehrebenenanalyse: neue Perspektiven für den Netzwerk-Ansatz. In Kardorff, Ernst von; Stark, Wolfgang; Rohner, Robert; Wiedemann, Peter (Hrsg.), Zwischen Netzwerk und Lebenswelt - Soziale Unterstützung im Wandel: wissenschaftliche Analysen und praktische Strategien (S. 145-158). München: Profil-Verlag. Bartko, J. J. (1976). On various intraclass reliability coefficients. Psychological Bulletin, 83, 762-765. Bellair, Paul E. (1997). Social interaction and community crime: Examining the importance of neighbor networks. Criminology, 35, 677-703.

Page 37: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

38 ZA-Information 53

Bellair, Paul E.; Roscigno, Vincent J.; McNulty, Thomas L. (2003). Linking Local Labor Market Opportu-nity to Violent Adolescent Delinquency. Journal of Research in Crime and Delinquency, 40(1), 6-33. Browning, Christopher; Dietz, Robert; Feinberg, Seth (2000). 'Negative' Social Capital and Urban Crime: A Negotiated Coexistence Perspective (Urban and Regional Analysis Initiative, Ohio State University) Un-veröffentlichtes Manuskript.

Bryk, Anthony S.; Raudenbush, Stephen W. (1992). Hierarchical Linear Models: Applications and Data Analysis Methods, 1. Auflage. Newbury Park: Sage. Buckner, John C. (1988). The Development of an Instrument to Measure Neighborhood Cohesion. Ameri-can Journal of Community Psychology, 16, 771-791. Dekker, Paul; Uslaner, Eric M. (Hrsg.) (2001). Social capital and participation in everyday life. London: Routledge. Diekmann, Andreas (1998). Empirische Sozialforschung: Grundlagen, Methoden, Anwendungen. Reinbek bei Hamburg: Rowohlt. DiPrete, Thomas A.; Forristal, Jerry D. (1994). Multilevel Models: Methods and Substance. Annual Review of Sociology, 20 , 331-357. Ditton, Hartmut (1998). Mehrebenenanalyse: Grundlagen und Anwendungen des Hierarchisch Linearen Modells. Weinheim; München: Juventa. Dollase, Rainer; Ridder, Arnd; Bieler, Ariel; Köhnemann, Ina; Woitowitz, Katharina (1999). Sind hohe Anteile ausländischer SchülerInnen in Schulklassen problematisch? Beurteilungsübereinstimmungen und -diskrepanzen zwischen SchülerInnen, Eltern, LehrerInnen zu einer zentralen Frage der städtischen und schulischen Integration. Journal für Konflikt- und Gewaltforschung, 1(1), 56-83. Dülmer, Hermann; Jagodzinski, Wolfgang; Friedrichs, Jürgen (1996). Bestimmungsgründe der Wahlbe-teiligung und der Wahl rechtsextremistischer Parteien - Ergebnisse von Aggregatdatenanalysen zweier west-deutscher Großstädte. In Gabriel, Oscar W.; Falter, Jürgen (Hrsg.), Wahlen und politische Einstellungen in westlichen Demokratien (S. 119-147). Frankfurt/M.: Peter Lang. Duncan, Greg J.; Raudenbush, Stephen W. (1999). Assessing the Effect of Context in Studies of Child and Youth Development. Educational Psychologist, 34(1), 29-41. Ebel, R. L. (1951). Estimation of the reliability of ratings. Psychometrika, 16, 407-424. Espelage, Dorothy L.; Holt, Melissa K.; Henkel, Rachael R. (2003). Examination of Peer Group Contextual Effects on Aggression During Early Adolescence. Child Development, 74(1), 205-220. Esser, Hartmut (1996). Soziologie. Allgemeine Grundlagen. Frankfurt: Campus. Friedrichs, Jürgen (1995). Stadtsoziologie. Opladen: Leske + Budrich. Friedrichs, Jürgen (1998). Do poor neighborhoods make their residents poorer? Context effects of poverty neighborhoods on residents. In Andreß, Hans-Jürgen (Hrsg.), Empirical Poverty Research in a Comparative Perspective (S. 77-98). Aldershot: Ashgate. Hank, Karsten (2003). Eine Mehrebenenanalyse regionaler Einflüsse auf die Familiengründung westdeut-scher Frauen in den Jahren 1984 bis 1999. Kölner Zeitschrift für Soziologie und Sozialpsychologie, 55(1), 79-98.

Haynie, Dana L. (2001). Delinquent Peers Revisited: Does Network Structure Matter? American Journal of Sociology, 106(4), 1013-1057. Jungbauer-Gans, Monika (2002). Schwindet das soziale Kapital? Soziale Welt, 53, 189-208. Kasarda, John; Janowitz, Morris (1974). Community Attachment in Mass Society. American Sociological Review, 39, 328-339. Kreft, Ita; de Leeuw, Jan (1998). Introducing Multilevel Modelling. London: Sage. Lauritsen, J.; White, N. A. (2001). Putting Violence in Its Place: The Influence of Race, Ethnicity, Gender, and Place on the Risk for Violence. Criminology and Public Policy, 1(1), 37-60.

Page 38: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 39

Leventhal, Tama; Brooks-Gunn, Jeanne (2000). The Neighborhoods They Live In: The Effects of Neighborhood Residence on Child and Adolescent Outcomes. Psychological Bulletin, 126, 309-337. Morenoff, Jeffrey; Sampson, Robert J.; Raudenbush, Stephen W. (2001). Neighborhood Inequality, Collective Efficacy, and the Spatial Dynamics of Urban Violence. Criminology, 39(3), 517-559. Oberwittler, Dietrich (1999). Soziale Probleme, Gewalt und Jugenddelinquenz in der Stadt. Ansätze einer sozialökologischen Forschung. In Albrecht, Hans-Jörg (Hrsg.), Forschungen zu Kriminalität und Kriminali-tätskontrolle am Max-Planck-Institut für ausländisches und internationales Strafrecht in Freiburg i.Br. (S. 403-419). Freiburg: edition iuscrim. Oberwittler, Dietrich (2003). Das stadtviertel- und gemeindebezogene Stichprobendesign – Anlage und em-pirische Ergebnisse (working paper des Projekts 'Soziale Probleme und Jugenddelinquenz im sozialökologi-schen Kontext' / Nr. 9)

Oberwittler, Dietrich (im Druck a). A Multilevel Analysis of Neighbourhood Contextual Effects on Serious Juvenile Offending. The Role of Subcultural Values and Social Disorganization. European Journal of Crimi-nology, 1(2). Oberwittler, Dietrich (im Druck b). Jugenddelinquenz und Stadtstruktur - Eine Mehrebenenanalyse zu sozi-alökologischen Kontexteffekten. In Oberwittler, Dietrich; Karstedt, Susanne (Hrsg.), Soziologie der Krimi-nalität (Sonderheft 43 der Kölner Zeitschrift für Soziologie und Sozialpsychologie). Wiesbaden: Westdeut-scher Verlag. Oberwittler, Dietrich (in Vorbereitung) Armut macht Angst – eine sozialökologische Neuinterpretation der Kriminalitätsfurcht. Oberwittler, Dietrich; Blank, Tom; Köllisch, Tilman; Naplava, Thomas (2001). Soziale Lebenslagen und Delinquenz von Jugendlichen. Ergebnisse der MPI-Schulbefragung 1999 in Freiburg und Köln. Freiburg: edition iuscrim. Oberwittler, Dietrich; Köllisch, Tilman; Naplava, Thomas; Blank, Tom (2001). MPI-Schulbefragung Breis-gau / Markgräfler Land 2000 - Ergebnisbericht (working paper des Projekts 'Soziale Probleme und Jugendde-linquenz im sozialökologischen Kontext' / Nr. 8)

Oberwittler, Dietrich; Naplava, Thomas (2002). Methodenbericht postalische Bewohnerbefragung (Techni-sche Berichte des Projekts 'Soziale Probleme und Jugenddelinquenz im sozialökologischen Kontext / Nr. 3)

O'Regan, Katherine M.; Quigley, John M. (1998). Where Youth Live: Economic Effects of Urban Space on Employment Prospects. Urban Studies, 35(7), 1187. Portes, Alejandro (1998). Social Capital: Its Origins and Applications in Modern Sociology. Annual Review of Sociology, 24, 1-24. Putnam, Robert D. (2000). Bowling Alone. The Collapse and Revival of American Community. London: Simon and Schuster. Putnam, Robert D. (Hrsg.) (2001). Gesellschaft und Gemeinsinn: Sozialkapital im internationalen Ver-gleich. Gütersloh: Bertelsmann Stiftung.

Raudenbush, Stephen W.; Bryk, Anthony S. (2002). Hierarchical Linear Models: Applications and Data Analysis Methods, 2. Auflage. Newbury Park: Sage. Raudenbush, Stephen W.; Sampson, Robert J. (1999). Ecometrics: Toward a Science of Assessing Ecologi-cal Settings, with Appliance to the Systematic Social Observation of Neighborhoods. Sociological Method-ology, 29, 1-41. Raudenbush, Stephen W.; Sampson, Robert J. (1999). Assessing direct and indirect associations in multi-level designs with latent variables. Sociological Methods and Research, 28(2), 123-153. Sampson, Robert J.; Raudenbush, Stephen W.; Earls, Felton J. (1997). Neighborhoods and Violent Crime: A Multilevel Study of Collective Efficacy. Science, 277, 918-924.

Page 39: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

40 ZA-Information 53

Sampson, Robert J.; Morenoff; Jeffrey, D.; Earls, Felton (1999). Beyond Social Capital: Spatial Dynamics of Collective Efficacy for Children. American Sociological Review, (64), 633-660. Sampson, Robert J.; Morenoff, Jeffrey D.; Gannon-Rowley, Thomas (2002). Assessing "Neighborhood Effects": Social Processes and New Directions in Research. Annual Review of Sociology, 28, 443-478. Skogan, Wesley G. (1990). Disorder and Decline. Crime and the Spiral of Decay in American Neighbor-hoods. New York: Free Press. Snijders, Thomas; Bosker, Roelof (1999). Multilevel Analysis. An Introduction to Basic and Advanced Multilevel Analysis. London: Sage. Taylor, R. B. (1996). Neighborhood Responses to Disorder and Local Attachments: The Systemic Model of Attachment, Social Disorganization, and Neighborhood Use Value. Sociological Forum, 11, 41-47. Wilson, William J. (1987). The Truly Disadvantaged: The Inner City, the Underclass, and Public Policy. Chicago: Chicago University Press. Wirth, Louis (1938). Urbanism as a Way of Life. American Journal of Sociology, 44(1), 1-24. Woldoff, Rachael Anne (2002). The Effects of Local Stressors on Neighborhood Attachment. Social Forces, 81(1), 87-116.

4 Anhang

Übersicht über Skalen und Einzelitems rit

Kindbezogenes Sozialkapital (α = .70)

Die Leute hier kennen die Kinder aus der Nachbarschaft. .50Die Eltern wissen, wer die Freunde ihrer Kinder sind. .55Dies ist kein guter Ort für Kinder, um groß zu werden (-). .42Hier gibt es Menschen, die ein Vorbild für Kinder sein können. .44

Soziale Kontakte (α = .80) Häufigkeit der Kontakte mit Nachbarn in den letzten 6 Monaten Gemeinsam eine Tasse Kaffee oder Tee getrunken .64Gemeinsam etwas in der Freizeit unternommen (z.B. zu Abend gegessen, ausgegangen, Sport getrieben) .58

Lebensmittel oder Werkzeug ausgeliehen .53Kleine Erledigungen übernommen (z.B. Blumen gegossen, Briefkasten geleert, etwas eingekauft) .54

Sich über persönliche Angelegenheiten (z.B. Kindererziehung, berufliche Fragen) unterhalten .59

Sich über Ereignisse oder Probleme in der Nachbarschaft oder im Stadtviertel unterhalten .50

Beobachtete Jugendgewalt (α = .82) Häufigkeit des Vorkommens im Wohngebiet Eine Gruppe von Jugendlichen steht abends draußen herum und macht Lärm und verunsichert Anwohner. .68

Jugendliche beschädigen mutwillig etwas (Postkästen, Mülleimer, Pflanzen, Telefonzelle o. ä.). .71

Es gibt eine Schlägerei zwischen mehreren Jugendlichen, bei der jemand verletzt wird. .66

Page 40: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 41

Übersicht über Skalen - Fortsetzung rit

Informelle Sozialkontrolle über Jugendliche (α = .83) Jemand würde einschreiten und die Jugendlichen auffordern, das zu lassen (‚ja, sicher’ bis ‚nein’) bei den 3 Items der beobachteten Jugendgewalt

Lärm, Verunsicherung der Anwohner .68Mutwillige Beschädigung .75Schlägerei .66

Soziale Kohäsion (α = .82) Die Leute hier helfen sich gegenseitig. .71Hier kennen sich die Leute gut. .66Man kann den Leuten in der Nachbarschaft vertrauen. .64

Soziales Misstrauen (α = .73) Die Leute hier kommen nicht gut miteinander aus. .56Die Leute hier haben keine gemeinsamen Werte. .57Die Leute hier haben keinen Respekt vor Gesetz und Ordnung. .53

Verbundenheit mit dem Stadtviertel (α = .89) Wenn Sie an Ihr Stadtviertel denken: Wie zufrieden sind Sie hier insgesamt? .75Fühlen Sie sich in Ihrem Stadtviertel richtig "zu Hause"? .83Wenn Sie aus irgendeinem Grund aus Ihrem Stadtviertel wegziehen müssten, wie sehr würden Sie das bedauern? .76

Kollektive Interessenwahrnehmung (α = .76) Wahrscheinlichkeit des gemeinsamen Handels in folgenden Situationen Ein kleiner Lebensmittelladen im Viertel, in dem viele alte Menschen einkaufen, soll ge-schlossen werden. .46

Auf einer kleinen Grünfläche liegt häufig Sperrmüll herum (alte Fernseher, Sessel etc.). .59Im Stadtviertel fehlen Freizeitangebote für Jugendliche. Die Stadt will ein Jugendzentrum einrichten, es fehlt jedoch Geld für Möbel, Spiele etc. .51

An einer Straßenkreuzung sind schon mehrere Unfälle passiert, weil es keine Fußgängerampel gibt. .58Eine Gruppe von Jugendlichen trifft sich häufig abends draußen und macht Lärm oder Unfug. .50

Anomia (α = .78) Heutzutage ist alles so unsicher geworden, dass man auf alles gefasst sein muss. .58Heute ändert sich alles so schnell, dass man nicht weiß, woran man sich halten soll. .70Früher waren die Leute besser dran, weil jeder wusste, was er zu tun hatte. .61Einzelitems: 1) Sozialer Ruf des Wohngebiets Wahrgenommener ‚Ruf’ des eigenen Wohngebiets bei den übrigen Bewohnern der Stadt (-3 bis +3)

2) Kriminalitätsfurcht Wie sicher fühlen Sie sich oder würden Sie sich fühlen, wenn Sie hier in Ihrem Wohnge-biet nachts draußen alleine sind?

3) Bekanntschaft mit Nachbarskindern Wie viele dieser Kinder und Jugendliche in Ihrer Nachbarschaft kennen Sie beim Vornamen?

Page 41: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

42 ZA-Information 53

Wie viele Fälle werden gebraucht?

Ein Monte-Carlo-Verfahren zur Bestimmung

ausreichender Stichprobengrößen und Teststärken

(power) bei Strukturgleichungsanalysen mit kategorialen

Indikatorvariablen

von Dieter Urban und Jochen Mayerl 1

Zusammenfassung

Zur Festlegung ausreichender Fallzahlen für eine robuste Schätzung von Struktur-gleichungsmodellen (SEM-Analyse) gibt es verschiedene Daumenregeln. Diese ba-sieren jedoch auf Ergebnissen von Simulationsstudien, die in der Regel mit anwen-dungsfremden Modellspezifikationen durchgeführt wurden, und sie berücksichtigen stets auch nur wenige Daten- und Modell-Spezifika. Insbesondere sind sie nicht für SEM-Analysen mit kategorialen Indikatorvariablen und WLS-Methode geeignet. Als Alternative wird hier ein Verfahren aufgezeigt, das von Muthén/Muthén in ver-schiedenen Veröffentlichungen vorgeschlagen wurde, und in dem in vier Schritten mittels Monte-Carlo-Simulation mehrere Kriterien zur Festlegung einer ausrei-chenden Fallzahl für ein spezielles Modell zu überprüfen sind (der Grad der Ver-zerrung bei der Schätzung von Effektparametern und Standardfehlern, der Grad der Abdeckung (coverage), die Teststärke (power) für Signifikanztests einzelner Effekt-parameter). Das ursprünglich für die SEM-Analyse mit kontinuierlichen Variablen gedachte Verfahren wird hier auf die speziellen Bedingungen einer kategorialen SEM-Analyse bezogen. Die dazu notwendigen EDV-Steuerfiles werden in der Syn-tax der SEM-Software „Mplus“ vorgestellt.

1 Dr. Dieter Urban ist Professor, Jochen Mayerl (MA) ist Wissenschaftlicher Mitarbeiter am

Institut für Sozialwissenschaften, Abteilung für Soziologie I, Universität Stuttgart, 70174 Stutt-gart.

Wir danken Linda K. Muthén und Bengt O. Muthén für Hinweise und Informationen, die sie uns u.a. über das Internet-Diskussionsforum „Mplus Discussion“ (www.statmodel.com/discussion) zur Verfügung stellten.

Page 42: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 43

Abstract

How Many Cases Are Needed? Using Monte-Carlo Simulation to Determine Suffi-cient Sample Size and Power When Analyzing Structural Equation Models with Categorical Outcome Variables.

There are several rules of thumb trying to determine a sufficient number of cases for a robust estimation of a structural equation model (SEM analysis). All of these rules generalize from results of simulation studies relying on model and data speci-fications that could be far away from those of a particular research project. Specifi-cally, these rules do not consider the conditions of SEM analyses with categorical output variables and WLS estimation. In this paper an alternative procedure that was proposed by Muthén/Muthén in several publications is shown. Using the re-sults of Monte-Carlo simulations, this procedure assesses sample size by several criteria to find out a sufficient number of cases for SEM estimation in a particular research project. Criteria are: parameter and standard error biases, coverage and power for single parameter tests. It is shown how to apply the procedure originally developed for SEM analysis with continuous outcome variables to the analysis of structural models with categorical indicators. In addition, all input files needed to conduct the four step procedure are documented in the syntax of the SEM software package Mplus.

1 Einleitung

Wie viele Fälle werden benötigt, um für ein bestimmtes Strukturgleichungsmodell ein stabiles oder zumindest halbwegs robustes Schätzergebnis zu erzielen? Welche Fallzahlen werden mindestens gebraucht, um den Resultaten einer Strukturglei-chungsmodellierung vertrauen zu können? Ein jeder Anwender dieser Analysetech-nik (im Folgenden auch „SEM-Analyse“ genannt) kennt das Problem. Reichen die vorhandenen 100, 200 oder 1000 Beobachtungsfälle aus, um für die freien Parame-ter eines Strukturgleichungsmodells, welches theoretisch interessiert, das aber auch zumeist in sehr anspruchsvoller Weise und mit einer hohen (viel zu hohen?) Kom-plexität spezifiziert wurde, mehr als nur numerische Zufallstreffer im Rahmen eines bestimmten statistischen Schätzverfahrens (ML, GLS, WLS/ADF, o.a.) geliefert zu bekommen?

Die einschlägige Methodenliteratur hilft dabei in aller Regel nicht viel weiter. In ihr ist zunächst einmal zu lesen, dass alle gängigen Schätzverfahren zur Bestimmung der freien Parameter in Strukturgleichungsmodellen auf einer asymptotischen Schätztheorie beruhen, nach der bei einer möglichst großen Fallzahl (und bei Ein-

Page 43: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

44 ZA-Information 53

haltung bestimmter Annahmen) vertrauenswürdige Schätzwerte zu erhalten sind.2 Wann eine solche, möglichst große Fallzahl gegeben ist, sagt die statistische Schätz-theorie leider jedoch nicht. Das verunsichert den Anwender natürlich noch mehr, und er greift umso dankbarer nach bestimmten Daumenregeln, die ebenfalls in der Literatur angeboten werden (wie z.B. nach der N:q-Hypothese, mehr dazu im nächsten Abschnitt), um sein Entscheidungsproblem überhaupt „in den Griff“ zu bekommen. Leider sind diese Daumenregeln jedoch stets umstritten (auch in der Literatur) und basieren zumeist auf Simulationsstudien mit spezifischen Modellspe-zifikationen, die ganz anders als diejenigen des leidgeplagten Anwenders aussehen können, so dass sie häufig auch nicht zu übertragen sind. So wurden und werden z.B. als Richtlinien bei Analysen mit kontinuierlichen Variablen häufig die Simula-tionsstudien von Boomsma (1982, 1983) und die neuere Studie von Hoogland (1999) herangezogen.

Noch um ein Vielfaches größer ist das Leid desjenigen Anwenders, der so vermes-sen ist, die Werte seiner sozialwissenschaftlichen Einstellungs- und Verhaltensindi-katoren nicht als Messungen kontinuierlicher Variablen anzunehmen bzw. zu defi-nieren (was sie in aller Regel auch nicht sind, was aber fast alle SEM-Praktiker, die Autoren der vorliegenden Studie eingeschlossen, als – unter bestimmten Umständen – verzeihliche Sünde betrachten und deshalb tun). Alle Anwender, die ihre Indika-torvariablen als kategoriale Variablen (geordnet oder ungeordnet) betrachten und auch als solche in die SEM-Analyse einbeziehen wollen, erfahren in der Literatur und in einschlägigen Internet-Diskussionsforen (SEMNET, Mplus-Discussion, o.Ä.) höchst Verwirrendes über die dafür benötigten Mindest-Fallzahlen. Wenn sie sich z.B. der LISREL-Strategie verschrieben haben, und deren Analyseweg über die Berechnung polychorischer bzw. polyserieller Korrelationskoeffizienten und WLS-Schätzung gehen wollen, wird ihnen nahe gelegt, mindestens 2000 oder sogar 5000 Fälle in die Schätzung einzubeziehen, da ansonsten insbesondere die Schätzwerte für die Standardfehler extrem verzerrte Werte annehmen können.3 Wenn sie aber die Mplus-Strategie bevorzugen und die dortige Implementation der WLS-Schätzung für Modelle mit kategorialen Indikatorvariablen akzeptieren,4 werden

2 So ist z.B. zu lesen: „Because the GLS estimates are only asymptotically correct, large samples

are required for the estimates to be trustworthy.“ (Xie 1989: 340). 3 Olsson et al. (2000) empfehlen 2000 bis 3000 Fälle. Yuan/Bentler (1994) empfehlen sogar

2000 bis 5000 Fälle pro Gruppe von Variablen-Werten, da die Anzahl der Elemente in der weight matrix mit einem Exponenten von 4 für die Anzahl der Variablen anwachse.

4 Als „Mplus-Strategie“ wird hier die Schätzmethode bezeichnet, die im EDV-Programmpaket Mplus implementiert ist (vgl. www.statmodel.com). Vgl. dazu Muthén 1983, 1984, 1993; Muthén/Satorra 1995; Xie 1989; Muthén/Muthén 2001: 339-343 (Appendix 1: Regression

Page 44: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 45

bereits brauchbare Schätzungen mit nur 150 Fällen (bei geringer Anzahl freier Parameter und symmetrischer Werteverteilung) als machbar erklärt.5

Einen Ausweg aus dieser Misere scheinen Monte-Carlo-Simulationen zu ermögli-chen, in denen für ein spezielles, zu testendes Strukturgleichungsmodell (und nicht für ein beliebiges bzw. nach methodischen Kriterien spezifiziertes Modell!) be-stimmte Parameterwerte als richtig angenommen werden und sodann große Mengen von Zufallsstichproben für jeweils unterschiedliche Fallzahlen gezogen werden, um diese Werte zu replizieren. Über das Ausmaß der dabei erhaltenen Abweichungen zwischen „wahren“ und geschätzten Werten lässt sich dann ermitteln, welche Fall-zahlen als akzeptabel und welche als nicht ausreichend gelten können.

Linda K. Muthén und Bengt O. Muthén haben unlängst in einem viel beachteten Vorschlag diese Methode zur Festlegung einer sinnvollen Stichprobengröße für die Schätzung von Strukturgleichungsmodellen mit latenten Variablen vorgestellt (Muthén/Muthén 2002a, 2002b; Muthén 2002). Allerdings eignet sich der von ihnen präsentierte Verfahrensweg nur für die Bestimmung von Mindest-Fallzahlen, wenn alle Indikatorvariablen als kontinuierliche Variablen in eine ML-Schätzung einbe-zogen werden.6 Im Folgenden wollen wir deshalb die von Muthén/Muthén vorge-schlagene Methodik benutzen, um einen Verfahrensweg aufzuzeigen, mit dem sinn-volle Mindest-Fallzahlen auch für Modelle mit kategorialen Indikatorvariablen, die mit einer WLS-Methode geschätzt werden müssen, zu ermitteln sind.7

Um diesen Weg für alle SEM-Anwender so leicht wie möglich gangbar zu machen, werden wir die dazu notwendigen vier Analyseschritte anhand eines Beispiels ver-anschaulichen (Abschnitt 4) und auch die dabei benutzten vier EDV-Inputfiles in der Syntax des SEM-Programmpakets „Mplus“8 im Anhang dokumentieren. Zuvor werden wir noch typische Praxistipps und Daumenregeln zur Festlegung von

with a categorical dependent variable), 345-352 (Appendix 2: The general modeling frame-work).

5 Vgl. die Mitteilung von Linda K. Muthén im Internet-Diskussionsforum „Mplus-Discussion“ (www.statmodel.com/discussion) vom 23.5.2001.

6 Dies liegt u.a. daran, dass sie zur Bestimmung ausreichender Fallzahlen eine Teststärke-Analyse (power analysis) nach dem Satorra-Saris Ansatz vornehmen (in: Muthén/Muthén 2002b), der nur unter Bedingungen multivariater Normalverteilung gültig ist (vgl. dazu Saris/Satorra 1993; Satorra/Saris 1985; Saris/Stronkhorst 1984; Muthén/Curran 1997).

7 Für Analysen mit geordnet-kategorialen Variablen, deren Werte mindestens fünf Ausprägungen und keine allzu starken Abweichungen vom Idealbild einer Normalverteilung aufweisen, kann auch alternativ zur WLS-Methode die von Satorra/Bentler (1986) vorgeschlagene robuste Va-riante der ML-Schätzung eingesetzt werden.

8 Vgl. Muthén/Muthén 2001 (www.statmodel.com).

Page 45: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

46 ZA-Information 53

Mindest-Fallzahlen für SEM-Analysen vorstellen (Abschnitt 2) sowie die von uns benutzten Kriterien zur Bestimmung des Zusammenhangs zwischen Stichproben-größe und SEM-Analysequalität erläutern (Abschnitt 3).

2 SEM-Schätzung und Stichprobenumfang

Im Allgemeinen ist es allen SEM-Anwendern bekannt: die Ergebnisse von SEM-Analysen können durch zu kleine Stichprobengrößen in unerwünschter Weise be-einflusst werden. So tendiert die χ2-Teststatistik zum Beispiel bei einem niedrigen Stichprobenumfang zu überhöhten Werten und die H0 wird zu oft verworfen (vgl. Bollen 1989: 268). Ebenso kann eine Verzerrung der Parameterschätzungen und insbesondere der geschätzten Standardfehler auftreten, wovon die Schätzung der Konfidenzintervalle beeinflusst wird: unterschätzte Standardfehler können zur Über-schätzung und überschätzte Standardfehler zur Unterschätzung der Signifikanz von Effekten führen (vgl. Muthén/Muthén 2002: 600). Des Weiteren nimmt die Breite des Konfidenzintervalls mit abnehmender Fallzahl zu. Eine zu kleine Stichprobe kann folglich zu einer deutlichen Verschlechterung der Qualität der Modellschät-zung führen, wodurch eine zuverlässige substantielle Interpretation beeinträchtigt wird (vgl. Algina/Olejnik 2000).

In systematischer Argumentation wird die Qualität einer SEM-Analyse in ganz entscheidendem Maße von der Robustheit einer SEM-Schätzung bestimmt. Die Robustheit einer SEM-Schätzung betrifft wiederum:

a) die Robustheit aller geschätzten Effektparameter b) die Robustheit der Standardfehler aller geschätzten Effektparameter c) die Robustheit der χ2-Teststatistik und aller darauf basierenden Fit-Indizes

Und alle drei Robustheiten werden durch die jeweils zur Verfügung stehende Fall-zahl positiv beeinflusst: je höher die Fallzahl, umso höher ist die Robustheit der SEM-Schätzung. Allerdings wirkt die Fallzahl nicht in direkter Weise auf die Ro-bustheit, sondern in Abhängigkeit von vielen anderen Merkmalen des jeweils analy-sierten Modells und der ausgewerteten Daten sowie in Abhängigkeit vom jeweils benutzten Schätzverfahren (ML-, GLS-, WLS/ADF-Schätzung). Zu den fallzahl-relevanten Modell- und Datenmerkmalen gehören insbesondere:9 die Gesamtzahl der Indikatoren im Modell (k) die durchschnittliche Anzahl von Indikatoren pro Faktor (k/f)

9 Diese Auflistung und die folgenden Praxishinweise folgen den Analysen von Hoogland 1999

und Marsh/Hau 1999.

Page 46: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 47

die durchschnittliche Faktorladung (L) in allen Messmodellen die durchschnittliche Schiefe aller Werte-Verteilungen (S) die Standardabweichung der Schiefe (sd(s)) die durchschnittliche Kurtosis der Verteilungen aller gemessenen Variablen (K)

Hinsichtlich des Zusammenhangs zwischen der Robustheit von SEM-Schätzungen (im Sinne der drei oben genannten Bezüge) und der zur Verfügung stehenden Fall-zahlen wurden verschiedene Regelmäßigkeiten beobachtet und Praxisempfehlungen bzw. Daumenregeln abgeleitet, die hier vor allem hinsichtlich ihrer praktischen Konsequenzen für die SEM-Forschung vorgestellt werden sollen:

(ad a) Im Vergleich zu GLS- und WLS/ADF-Schätzung10 ist die ML-Schätzung am wenigsten von der Kombination „geringe Fallzahl und hohe Kurtosis“ betroffen. Generell sind ML-Schätzungen stabiler und von größerer Präzision, was ihren Fit angeht (Olsson et al. 2000). Wenn ein Modell mindestens drei Indikatoren pro Fak-tor aufweist, und die durchschnittliche Faktorladung über 0.5 liegt, dann gelten bei N ≥ 200 die ML-Parameterschätzwerte als unverzerrt. Dabei ist der Quotient (k / f) die wichtigste Determinante. So wurde z.B. für die ML-Schätzung eines Strukturmodells mit k = 12, k / f = 4 und K = 3 eine Mindest-Fallzahl von N = 200 empfohlen (Hoogland 1999).

In verschiedenen Simulationen (mit ML-Schätzung) konnte gezeigt werden, dass die Nachteile kleiner Stichproben durch hohe k / f-Werte kompensiert werden kön-nen (vor allem, aber nicht nur, wenn die Faktorladungen höher als 0.6 sind).11 Für viele ML-Schätzungen sind demnach bei k / f von 6 bis 12 auch Fallzahlen von 50 durchaus ausreichend.

Es konnte auch gezeigt werden, dass bei hoher Reliabilität (d.h. bei geringer Fehler-varianz) bereits Fallzahlen von 50 bis 100 Einheiten ausreichen können, um ML-Schätzwerte mit nur geringen Verzerrungen zu erhalten. Voraussetzung dafür sind jedoch normalverteilte Indikatoren (vgl. Hoyle/Kenny 1999).

Die Ergebnisse der GLS-Schätzung sind auch schon bei kleinen Fallzahlen akzepta-bel, setzen aber Modelle mit nur sehr kleinem Spezifikationsfehler voraus (Olsson

10 WLS: „Weighted-least-squares“-Schätzverfahren; ADF: „Asymptotic-distribution-free“-Schätz-

verfahren. Das WLS-Verfahren ist theoretisch identisch mit dem ADF-Verfahren. Beide sind nur unterschiedliche Umsetzungen des gleichen Schätzverfahrens in verschiedenen Software-Paketen.

11 Vgl. Marsh/Hau 1999.

Page 47: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

48 ZA-Information 53

et al. 2000). Eine genügend große Robustheit sei bei N ≥ 50 * k gegeben, weil für die Robustheit der GLS-Schätzung die Gesamtheit der zur Verfügung stehenden Indika-toren (k) die wichtigste Determinante zu sein scheint. Im oben genannten Beispiel (mit k = 12, k / f = 4, K = 3), für das sich bei einer ML-Schätzung eine Mindest-Fallzahl von 200 empfiehlt, ergibt sich somit für eine GLS-Schätzung eine empfeh-lenswerte Fallzahl von N = 600.

Die WLS/ADF-Schätzung braucht große bis sehr große Fallzahlen und eine Modell-spezifikation, die nur sehr gering fehlerhaft ist (Olsson et al. 2000). Eine genügend große Fallzahl könnte sich aus der Gesamtzahl aller Indikatoren (k) in Abhängigkeit von der durchschnittlichen Kurtosis aller Werteverteilungen (K) ergeben, denn es besteht ein starker Effekt von K / √ N auf die Verzerrung der WLS/ADF-Schätzung. Dies bedeutet für Empfehlungen (nach Hoogland 1999) hinsichtlich der Mindest-Fallzahl bei WLS/ADF-Schätzungen:

N ≥ 50 * k, wenn K zwischen -1.0 und 0.0 N ≥ 100 * k, wenn K zwischen 0.0 und 3.3 N ≥ 250 * k, wenn K zwischen 3.3 und 6.0

Daraus würde als Empfehlung für eine sinnvolle WLS/ADF-Fallzahl bei einem Modell mit k = 12, k / f = 4, K = 3 (s.o.) eine Stichprobengröße von N = 1200 folgen.

(ad b) Für den Zusammenhang von Stichprobengröße und Robustheit der Standard-fehler können aus den Ergebnissen der Simulationen von Hoogland (1999) folgen-de Praxisempfehlungen abgeleitet werden:

Hinsichtlich der Robustheit von ML- und GLS-Schätzung sind L und K am wich-tigsten. Sie sollten möglichst bei 0.00 liegen. Das hieße:

wenn L ≥ 0.7 und K = 0 wird N = 200 empfohlen, wenn L ≥ 0.5 und K = 0 wird N = 400 empfohlen, wenn K ≥ 2.0 sollte ML-robust benutzt werden.

Demgegenüber verzerrt die WLS/ADF-Schätzung die Standardfehler so sehr, dass sie nur bei sehr großen Fallzahlen eingesetzt werden sollte. Als Daumenregel zur Maximierung der Robustheit von Standardfehlern bei WLS/ADF-Schätzungen könnte nach Hoogland (1999) gelten:

N ≥ 10k(k+1) bei K = 0 (z.B. bei k = 12: N = 1560) N ≥ 15k(k+1) bei K ≤ 5.70 (z.B. bei k = 12: N = 2340)

(ad c) Auch der Zusammenhang zwischen der Robustheit der χ2-Teststatistik (sowie aller darauf basierender Fit-Indizes) und einer genügend großen Fallzahl ist von

Page 48: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 49

vielen Determinanten abhängig. Generell könnte gelten:12 Insbesondere bei ange-messen spezifizierten Modellen mit normalverteilten Variablen zeigen χ2-Tests bei ML-Schätzungen mit unterschiedlichsten Fallzahlen (N = 100, 200, 500 oder 1000) keine verzerrten Ergebnisse. Hingegen sind die χ2-Testergebnisse bei WLS/ADF-Schätzungen nur dann nicht verzerrt, wenn die Fallzahlen sehr groß sind (ab N = 1000). Nach den Ergebnissen von Hoogland (1999) könnten folgende Daumenregeln sinn-voll sein:

für ML-Schätzungen bei alpha=0.05: N ≥ max (3Ldf (1 + 10S - 10sd(s) + K), 100) Beispiel: N = 826 für df = 51, L = 0.6, S = 1.0, sd(s) = 0.5, K = 3.0

für GLS-Schätzungen bei alpha = 0.05: N ≥ max (2(1-L) df (1 + 10S - 10sd(s) + K), 100) Beispiel: N = 367 für df = 51, L = 0.6, S = 1.0, sd(s) = 0.5, K = 3.0

für WLS/ADF-Schätzungen bei alpha = 0.05:

N ≥ 45 * df Beispiel: N = 2295 für df = 51

Die oben genannten, minimalen Fallzahlen (200-400) zur Erreichung robuster ML-Schätzwerte werden auch von Monte-Carlo-Simulationen bestätigt, in denen expe-rimentell möglichst viele der zuvor genannten Einflussfaktoren konstant gehalten werden und nur die Fallzahl variiert wird. Jackson (2001, 2003) konnte z.B. in ver-schiedenen Simulationen zeigen, dass vieles für eine sinnvolle Stichprobengröße in ML-Schätzungen bei Fallzahlen ab einer Größenordnung von 200 bis 400 Einheiten spricht. So hatte in einem „wahren“ Modell der GFI (ein direkter Fit-Index) bei einer Fallzahl von 200 einen Wert von 0.92, der dann bis zu einer Fallzahl von 400 auf 0.96 anstieg, aber sich bei einer Erhöhung auf eine Fallzahl von 800 nur noch um 2,6 % vergrößerte, während er sich bei der Erhöhung von 50 auf 400 Fälle noch um 29 % vergrößerte (Jackson 2001).

Generell betrachtet ist somit die notwendige Fallzahl für SEM-Analysen von sehr vielen Determinanten abhängig. Da hilft auch die oftmals benutzte Universal-Daumenregel13 von 5, 10 oder 20 Beobachtungen für jeden zu schätzenden Parame-

12 Vgl. dazu Curran et al. 1996. 13 Diese Daumenregel wird hier als „universell“ bezeichnet, weil sie beansprucht, unabhängig vom

jeweils eingesetzten Schätzverfahren sowie unabhängig von den jeweils empirisch gegebenen Datenverteilungen und den forschungspraktisch begründeten Modellspezifikationen gültig zu sein.

Page 49: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

50 ZA-Information 53

ter14 nicht viel weiter, die zudem wohl auch falsch ist. Zumindest konnte Jackson (2001, 2003) in verschiedenen Monte-Carlo-Simulationen nicht eindeutig nachwei-sen, dass der NPPP-Wert (number of participants per parameter) bzw. das N:q-Verhältnis (Anzahl von Beobachtungen, N, pro zu schätzendem Parameter, q) einen direkten Einfluss auf die Varianz der geschätzten Koeffizienten und die Höhe der Fit-Indizes hat. Deutliche statistische Hinweise gibt es demnach allein dafür, dass das N:q-Verhältnis einen negativen Effekt auf zwei von sieben Fit-Indizes hat (näm-lich auf den „chi-square bias“ und den RMSEA-Index): je mehr Beobachtungen pro Parameter vorliegen, umso kleiner wird der Chi-Square Bias15 und der RMSEA-Index. Allerdings ist das Ausmaß des nachgewiesenen Effektes nicht dramatisch und oftmals auch ohne praktische Relevanz. Zum Beispiel reduzierte sich der RMSEA-Index von 0.005 auf 0.002, wenn bei N = 800 das N:q-Verhältnis durch zusätzliche Modell-Constraints von 20:1 (800 Fälle und 40 Parameter) auf 400:1 (800 Fälle und 2 Parameter) vergrößert wurde. So hat wohl die absolute Fallzahl eine größere Bedeutung für die Erhöhung der Modellanpassung (Fit) und die Ver-meidung von Parameterverzerrungen (s.o.) als das Verhältnis von Fallzahl zu Parameterzahl.16 Zudem haben Marsh/Hau (1999) nachgewiesen, dass auch, wenn die Fallzahl kleiner als die Anzahl der zu schätzenden Parameter ist, stabile Schätzungen erreicht werden können.

3 Kriterien zur Bestimmung des Stichprobenumfangs

Die oben genannten Beispiele für Praxistipps/Daumenregeln zur Festlegung eines genügend großen Stichprobenumfangs bei einer SEM-Schätzung haben gezeigt, dass das Problem einer genügend großen Fallzahl nicht durch Anwendung einer einzigen, einheitlichen Generalformel zu lösen ist: „In reality, there is no rule of thumb that applies to all situations“ (Muthén/Muthén 2002a: 599). Wie viele Fälle insgesamt benötigt werden, scheint in erster Linie vom spezifizierten Modell und den zur Verfügung stehenden Daten abzuhängen. Denn es ist unstrittig, dass für gu-te Schätzungen von komplexen Modellen mehr Fälle benötigt werden als für einfa-che Modelle.17 Und auch die Verwendung von kategorialen Indikatoren vergrößert die benötigten Fallzahlen erheblich.

14 Vgl. zu dieser Universal-Daumenregel: Bollen 1989, Kline 1998, Tanaka 1987. 15 Wird berechnet als: (χ2-Wert - df) / (df) (Jackson 2003: 133). 16 Zu diesem Resümee kommt auch Jackson 2001, 2003. 17 Nach Stone/Sobel (1990) verdoppelt sich bei einer ML-Schätzung sofort die Mindest-

Stichprobengröße von ca. 200 auf 400 Fälle, wenn im Modell eine latente statt einer manifesten Mediatorvariablen enthalten ist.

Page 50: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 51

Wie viele Fälle insgesamt benötigt werden, hängt aber auch davon ab, in welcher Hinsicht die Qualität einer SEM-Analyse durch Festlegung einer genügend großen Fallzahl optimiert werden soll bzw. in welcher Hinsicht durch eine genügend große Fallzahl ein bestimmter SEM-Qualitätsstandard zu gewährleisten ist. Denn eine bes-timmte Fallzahl „may be large enough for unbiased parameter estimates, unbiased standard errors, and good coverage, but it may not be large enough to detect an im-portant effect in the model“ (Muthén/Muthén 2002a: 600).

Im Folgenden wollen wir deshalb das von Muthén/Muthén (2002a) vorgeschlagene Vorgehen zur Ermittlung einer ausreichenden Anzahl von Beobachtungsfällen be-nutzen, um die besonders heikle Frage nach der Zahl notwendiger Fälle für eine SEM-Analyse mit kategorialen Indikatorvariablen zu beantworten. Dieses Verfah-ren nutzt zum einen eine Monte-Carlo-Simulation am empirisch zu analysierenden und nicht an einem abstrakt-methodisch bestimmten Strukturgleichungsmodell, und es liefert zum anderen Informationen zu insgesamt fünf verschiedenen Kriterien, mit denen die Relevanz verschiedener Stichprobenumfänge für den Erfolg bzw. die Qualität einer SEM-Analyse zu beurteilen ist. Diese fünf Kriterien sind:18 1. Der Grad der Verzerrung (bias), mit dem jeder Effektparameter im Modell

geschätzt wird. Dieser sollte nicht größer als 10% sein. Er wird hier ermittelt, indem die Modellschätzung in Form einer Monte-Carlo-Simulation mit den Populationswerten als Startwerten sehr häufig wiederholt wird (in unserem Beispiel insgesamt 5000-mal). Die Abweichung des Durchschnittswertes aller Replikationen vom „wahren“ Populationswert sollte dann nicht größer als 10% der Größe des Populationswertes selbst sein.19

2. Der Grad der Verzerrung (bias), mit dem jeder Standardfehler im Modell ge-schätzt wird. Dafür gilt der gleiche Grenzwert und die gleiche Methodik wie für den Grad der Verzerrung aller Effektparameter (s.o.).

3. Der Grad der Verzerrung (bias) für den Standardfehler eines oder mehrerer besonders wichtiger Effektparameter, für den/die hier auch die Teststärke (s.u.) bestimmt werden soll. Er sollte nicht oberhalb von 5 % liegen.

4. Der Grad der Abdeckung (coverage) für alle Effektparameter sollte oberhalb von 0.90 liegen. Mit dem Abdeckungsgrad wird hier der Anteil der Replikati-onen der Monte-Carlo-Simulation bezeichnet, deren 95%-Konfidenzintervall den „wahren“ Parameter der Population enthalten.

18 Vgl. dazu Muthén/Muthén 2002a: 605f. 19 Um dies festzustellen, muss nur der Durchschnittswert vom Populationswert subtrahiert werden

und dieser Differenzwert durch den Populationswert dividiert werden. Der sich daraus ergeben-de Kennwert sollte nicht größer als 0.010 sein.

Page 51: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

52 ZA-Information 53

5. Die Teststärke (power) (s.u.), die notwendig ist, um einen wichtigen Effek-

tparameter zu identifizieren (vgl. 3.). Diese ergibt sich hier aus dem Anteil von Replikationen der Monte-Carlo-Simulation, für welche die falsche Null-Hypothese, dass ein Parameter gleich null ist, mit einer Irrtumswahrschein-lichkeit von 5% zurückgewiesen wird. Sie sollte entsprechend eines Vor-schlags von Cohen (1988) und den Konventionen der gängigen Forschungs-praxis nahe einem Anteil von 80% bzw. einem Wert von 0.80 liegen.

Da es in sozialwissenschaftlichen Forschungen noch immer eher unüblich ist, sich mit der Teststärke von Hypothesentests zu beschäftigen, sollen dazu an dieser Stelle noch einige Erläuterungen gegeben werden:

Die übliche Praxis bei Anwendung von Signifikanztests zielt darauf ab, eine Null-Hypothese (H0), an deren Richtigkeit der Forscher nicht glaubt, mit einer möglichst geringen Irrtumswahrscheinlichkeit (α) zu verwerfen. Wenn z.B. die Irrtumswahr-scheinlichkeit mit 0.021 unterhalb des allgemein akzeptierten Grenzwertes von 0.05 liegt, wird dies in der Forschungspraxis als Hinweis darauf gewertet, dass die H0 falsch ist, folglich verworfen werden muss, und deshalb die Alternativ-Hypothese (HA), an deren Berechtigung der Forscher glaubt, richtig sein könnte. Freilich ist eine solche Entscheidung stets mit einem Fehler, dem so genannten „Typ I-Fehler“, versehen: die H0 könnte auch irrtümlich, also fälschlicherweise (obwohl sie richtig ist) verworfen worden sein. Zur Vorbeugung gegenüber einem solchen falschen Entscheid sollte dann auch der Typ I-Fehler möglichst gering sein und im Regelfall unterhalb von 5% liegen.

Eine solche Testpraxis entspricht einer konservativen Entscheidungsstrategie. Um eine neue Hypothese als möglicherweise richtige Hypothese überhaupt akzeptieren zu können, muss möglichst viel gegen die Null-Hypothese sprechen, die behauptet, dass an der neuen Alternativ-Hypothese überhaupt nichts dran ist. Jedoch könnten die Wälle, die zum Schutz vor übereilten Schlüssen errichtet wurden, auch zu hoch sein, um einer neuen Hypothese überhaupt eine Chance zu geben. Dadurch könnte eine falsche H0 irrtümlicherweise viel zu lange Bestand haben und daran gehindert werden, durch eine neue, innovative Hypothese ersetzt zu werden. Die Wahrschein-lichkeit eines solchen Irrtums wird also umso größer, je höher die Schutzmauern um H0 gezogen werden, oder je kleiner der Typ I-Fehler gesetzt wird. Diese Wahr-scheinlichkeit, dass die H0, obwohl sie falsch ist, irrtümlicherweise beibehalten wird, wird als Typ II-Fehler bezeichnet. Die Wahrscheinlichkeiten der beiden Feh-ler verlaufen also gegensinnig: Wird die Wahrscheinlichkeit (α) des Typ I-Fehlers abgesenkt, steigt im Gegenzug die Wahrscheinlichkeit (β) des Typ II-Fehlers und umgekehrt. Beide sollten natürlich möglichst klein sein, aber beide können nicht

Page 52: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 53

gleich klein sein. Deshalb ist ein Kompromiss zu suchen, und der liegt üblicherwei-se bei einem α ≤ 0.05 und einem β ≤ 0.20.

Als Teststärke (power) wird die Differenz von 1-β bezeichnet. Sie sollte mithin ≥ 0.80 sein. Die Teststärke kann als die Wahrscheinlichkeit definiert werden, eine falsche Null-Hypothese richtigerweise zu verwerfen, was im Kontext von SEM-Analysen die Möglichkeit zur Entdeckung von schwerwiegenden Spezifikationsfehlern bedeutet. Und damit wird auch der Zusammenhang zwischen Teststärke und Stich-probenumfang deutlich: Da sich Typ I- und Typ II-Fehler gegenläufig verändern, sinkt die Teststärke bei gleicher Stichprobengröße, wenn die Irrtumswahrschein-lichkeit α herabgesetzt wird. Somit muss die Fallzahl angehoben werden, um eine höhere Teststärke bei einem festgesetzten α zu erhalten, da eine Vergrößerung des Stichprobenumfangs zu einer Verkleinerung des Standardfehlers20 und damit zu einer Erhöhung der Teststärke führt.21 Eine zu geringe Teststärke aufgrund einer zu kleinen Fallzahl kann demnach auch dazu führen, dass eine Alternativ-Hypothese keine Chance bekommt, die H0 zu ersetzen. Denn wenn mit der „konservativen Teststrategie“ (s.o.) eine nicht ausreichende Test-Signifikanz (α) substantiell als Zurückweisung der alternativen HA-Hypothese interpretiert wird, kann das Schei-tern der HA auch daran liegen, dass im Test- bzw. Untersuchungsdesign keine aus-reichende Teststärke gegeben ist.

Im Kontext von SEM-Analysen ist die Teststärke-Bestimmung schwieriger als bei einfachen statistischen Modellen (z.B. bei t-Tests oder Korrelationsanalysen), in denen Alternativ-Hypothesen immer nur zu wenigen Parametern zu formulieren sind. Im Prinzip kann in der SEM-Analyse jeder fixierte Parameter (auch jeder via Modellannahme unausgesprochen fixierte Parameter) falsch sein und eine sehr gro-ße Anzahl von alternativen Werten annehmen. Zudem hängt die Teststärke auch nicht nur von der Stichprobengröße ab. Weitere Bestimmungsgrößen der Teststärke in der SEM-Analyse sind: die Größe des α-Fehlers (s.o.), die Anzahl fehlender Wer-te (Muthén/Muthén 2002a), Spezifikationsfehler im Analysemodell (Kaplan 1997, 2000), Positionierungen von Variablen innerhalb des Modells (Kaplan 1997), Wer-teverteilungen von Variablen (Muthén/Muthén 2002a), die Reliabilität der Indika-torvariablen (Hoyle/Kenny 1999), die Anzahl von Indikatoren pro Faktor (Bollen 1989: 348) und die Effektstärken der Variablenbeziehungen (Bollen 1989: 343).

20 Der Standardfehler des Regressionskoeffizienten lässt sich berechnen als: SEb = √ var (b) / √ N. 21 Mit einer Verkleinerung des Standardfehlers (SEb) verkleinert sich im Hypothesentest (Annah-

me: H0 ist richtig) das Konfidenzintervall (KIB = b ± (k ∗ SEb)), damit steigt der Typ I-Fehler, was wiederum ein Abfallen des Typ II-Fehlers (β) zur Folge hat, und ein kleinerer Typ II-Fehler führt zu einer größeren Teststärke (power = 1- β).

Page 53: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

54 ZA-Information 53

Für die Teststärke-Analyse/Poweranalyse im Rahmen von Strukturgleichungsmo-dellierungen liegen verschiedene Verfahrensvorschläge vor, die dazu in aller Regel eine Monte-Carlo-Simulation mit ML-Schätzverfahren für Modelle mit kontinuier-lichen Indikatorvariablen nutzen (z.B. MacCallum et al. 1996, Muthén/Muthén 2002b, Satorra/Saris 1985). Nachfolgend soll jedoch erstmals in systematischer Weise gezeigt werden, in welcher Weise das Simulationsverfahren auch eingesetzt werden kann, um den notwendigen Stichprobenumfang für Strukturgleichungsmo-dellierungen mit kategorialen Indikatoren zu ermitteln.

4 Die vier Schritte der Monte-Carlo-Simulation, am Beispiel verdeutlicht

Das zu analysierende Modell, mit dem beispielhaft die Schritte zur Bestimmung von Stichprobengröße und Teststärke ausgeführt werden sollen, stammt aus der Xe-nophobie-Forschung und soll hier nur in aller Kürze vorgestellt werden.22 In diesem Modell (vgl. dazu die Abbildung 2) übt das latente Konstrukt „Autoritarismus“ (F2/AU) einen kausalen Effekt auf die ausländerablehnende Einstellung (F1/AA) aus. Die beiden exogenen Variablen „Bildung“ (x1) und „subjektive Schichteinstu-fung“ (x2) üben sowohl einen direkten Effekt als auch jeweils einen indirekten Ef-fekt (über den Mediator „Autoritarismus“) auf die Ausländerablehnung aus. Die sieben Indikatoren y1 - y7 enthalten Messwerte auf siebenstufigen Ratingskalen, die in mündlicher Befragung von 142 Personen erhoben wurden. Die univariaten Ver-teilungen dieser ordinalen (kategorial geordneten) Indikatoren sind teilweise extrem schief (vgl. Abbildung 1), so dass sich eine Analyse des Modells mit einem Schätz-verfahren für kontinuierlich-normalverteilte Variablen strikt verbietet. Stattdessen soll das Modell mit einem WLS-Schätzverfahren nach der Mplus-Strategie23 be-rechnet werden, welche auch Monte-Carlo-Simulationen unter kategorialen Mo-dellbedingungen zulässt.

22 Für weitere theoretische und substantielle Informationen zu diesem Modell vgl. Urban/Mayerl

(2003). 23 Vgl. dazu die Literaturhinweise in Fußnote 4.

Page 54: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 55

Abbildung 1 Univariate Werteverteilungen von zwei y-Indikatoren

7654321

Häu

figke

it

60

50

40

30

20

10

07654321

Häu

figke

it

70

60

50

40

30

20

10

0

y2: „bei knapper Arbeit Jobs nur für y5: „dankbar für führende Köpfe“ Deutsche“ 1: lehne völlig ab; 7: stimme voll und 1: lehne völlig ab; 7: stimme voll ganz zu und ganz zu

Abbildung 2 Beispielmodell zum Zusammenhang zwischen Autoritarismus und Ausländerablehnung

x2

x1

F2(AU)

y5

F1(AA)

y6y7

y2y1

y4y3

Page 55: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

56 ZA-Information 53

Der nachfolgende Vorschlag zur Bestimmung der Stichprobengröße für Struktur-gleichungsmodellierungen mit kategorialen Indikatoren besteht aus insgesamt vier Schritten. Die Monte-Carlo-Methode wird dabei in den Schritten 2, 3 und 4 einge-setzt. Im Einzelnen betreffen die vier Schritte folgende Aufgaben:

Schritt 1: Modellschätzung zur Bestimmung der Populationswerte

Schritt 2: Erstellung einer Populationskovarianzmatrix

Schritt 3: Evaluation der Modellschätzung mittels Analyse von Parameter-, Standardfehlerverzerrungen und Abdeckungen (coverage)

Schritt 4: Bestimmung der Teststärken

Die modell-notwendige Stichprobengröße ergibt sich aus den Schritten 3 und 4 und ist erreicht, sobald durch stufenweise Anhebung der Stichprobengröße in der Mon-te-Carlo-Simulation für alle der in Abschnitt 3 genannten Kriterien zufrieden stel-lende Ergebnisse vorliegen.

Im Folgenden werden die vier notwendigen Analyseschritte anhand des oben vorge-stellten Beispielmodells erläutert. Die programmtechnische Realisation eines jeden Analyseschritts wird in der Mplus-Syntax im Anhang gezeigt.

4.1 Erster Schritt: Modellschätzung

Ausgangspunkt einer jeden Monte-Carlo-Simulation ist eine hypothetische Be-stimmung der Populationswerte aller Parameter des zu analysierenden Strukturmo-dells: „These values can be obtained from theory or previous research“ (Muthén/Muthén 2002a: 601). Im vorliegenden Beispiel (Abb. 2) sollen die WLS-Schätzwerte des Strukturmodells, die mit den Daten der oben genannten Studie er-mittelt wurden, als Populationswerte verwendet werden. Somit dient der erste Schritt des Verfahrens der Bestimmung der Populationswerte aller zu schätzenden Parameter und der sich daraus ergebenden Residualvarianzen.

Die im ersten Schritt erzielten WLS-Schätzwerte für alle Effektparameter zeigt Ab-bildung 3.24

Die Anpassungswerte sind für die Zwecke dieser Arbeit insgesamt zufrieden stel-lend. Der χ2-Wert beträgt 45.83 (mit p = 0.00 und df = 23 gegenüber einem χ2-Wert

24 Die geschätzten Residualvarianzen der latenten Konstrukte betragen: 0.335 (F1) und 0.572 (F2),

diejenigen der Indikatoren betragen: 0.345 (y1*), 0.368 (y2*), 0.391 (y3*), 0.545 (y4*), 0.428 (y5*), 0.244 (y6*) und 0.381 (y7*). Die Thresholds aller sieben kontinuierlich-normalverteilten y*-Indikatoren bewegen sich (mit minimalen Abweichungen) zwischen -1.500 und 1.000.

Page 56: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 57

des Baseline-Modells von 722.03 mit p = 0.00 und df = 35), der CFI beträgt 0.97 und der RMSEA 0.08.25

Die in Schritt 1 gewonnenen Populationswerte werden nun in Schritt 2 zur Generie-rung einer Populationskovarianzmatrix benutzt. Erst dann können in den Schritten 3 und 4 die erwünschten Ergebnisse zum notwendigen Stichprobenumfang des Mo-dells berechnet werden.

Abbildung 3 Beispielmodell mit unstandardisierten Koeffizienten

x2

-0.195

-0.202

0.037 n.s.

0.748

x1

0.074

n.s.

F2(AU)

y5*

F1(AA)

1.040

1.149

@1.000

@1.000

0.964

0.982

0.833

y6*y7*

y2*

y1*

y4*

y3*

Erläuterungen:

Koeffizientenwerte, die mit @ markiert sind, wurden in der Schätzung auf 1.00 fixiert. Die y*-Indikatoren werden in der WLS-Schätzstrategie als kontinuierlich-normalverteilte Hintergrund-Indikatoren ermittelt (vgl. dazu die in Fußnote 4 angegebene Literatur). Da es sich bei den y*-Indikatoren um latente Indikatoren handelt, deren empirische Werte nur als kategorial skalierte Ausprägungen von y-Variablen empirisch ermittelt werden konnten, sind sie hier als umkreiste Rechtecke grafisch dargestellt.

25 Bessere Anpassungswerte für dasselbe Modell können mit dem robusten WLS-Schätzer

WLSMV erzielt werden, der bislang nur in Mplus implementiert ist.

Page 57: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

58 ZA-Information 53

4.2 Zweiter Schritt: Erzeugung der Populationskovarianzmatrix

Die im zweiten Verfahrensschritt zu generierende Populationskovarianzmatrix wird für die Monte-Carlo-Simulationen der Schritte 3 und 4 benötigt. Sie bezieht sich auf die kontinuierlich verteilten y*-Indikatoren, die zwar in der empirischen Erhebung nur als kategoriale y-Indikatoren beobachtet werden konnten, deren kontinuierliche Verteilungen aber aufgrund der Schätzung von Threshold-Werten im ersten Schritt unseres Verfahrensweges26 zu ermitteln sind.

Die Kovarianzelemente werden mit Hilfe der in Schritt 1 bestimmten, hypothetischen Parameterwerte für Faktorladungen, Regressionskoeffizienten, Faktor(ko)varianzen und Residualvarianzen gewonnen. Die entsprechende Kovarianzmatrix der Popula-tion kann mittels einer ML-Schätzung in einer Monte-Carlo-Simulation mit einer einzigen Replikation und einer möglichst hohen (fiktiv festzusetzenden) Fallzahl generiert werden (in der vorliegenden Studie werden 100000 Fälle verwendet). Für die Schätzung ist allein eine Identitätskovarianzmatrix zu definieren, die die modell-bedingte Matrixstruktur festlegt, und eine Fixierung aller Modellparameter auf die in Schritt 1 gewonnenen Parameterwerte vorzunehmen (vgl. dazu die Syntax für Schritt 2 im Anhang).

Die folgende Abbildung 4 zeigt die Identitätskovarianzmatrix und (in der ersten Zeile) den Vektor der arithmetischen Mittelwerte der abhängigen und unabhängigen Modellvariablen (insgesamt neun Variablen) im Format einer üblichen Datensatz-Textdatei.

Abbildung 4 Vektor der arithmetischen Mittel und Identitätskovarianzmatrix (hier dargestellt als Datenfile „identity.dat“; vgl. Syntax im Anhang)

0 0 0 0 0 0 0 0 0 1 0 1 0 0 1 0 0 0 1 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1

26 Vgl. die Werte in Fußnote 24. Zur Schätzung von kontinuierlichen y*-Verteilungen aufgrund

von kategorialen y-Informationen vgl. Bollen 1989: 439-442.

Page 58: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 59

Die gesuchte Kovarianzmatrix der Population kann der Residualstatistik des Monte-Carlo-Outputs entnommen werden. Sie wird in Abbildung 5 vorgestellt (die erste Zeile der Abbildung enthält den Vektor der arithmetischen Mittel aller y*-Indikatoren). Diese Populationswerte werden zur Datengenerierung in den Monte-Carlo-Simulationen der folgenden Schritte 3 und 4 für die Bestimmung der notwendigen Stichprobengrößen und Teststärken benötigt.

Abbildung 5 Vektor der arithmetischen Mittel und Populationskovarianzmatrix aller y*-Indikatoren (hier dargestellt als Datenfile „pop.dat“; vgl. Syntax im Anhang)

0 0 0 0 0 0 0 1.033 0.676 1.032 0.664 0.652 1.031 0.573 0.563 0.553 1.023 0.438 0.430 0.422 0.365 1.043 0.504 0.494 0.485 0.419 0.707 1.057 0.456 0.448 0.439 0.380 0.640 0.735 1.047 -0.109 -0.107 -0.105 -0.091 -0.195 -0.224 -0.203 1.000 -0.147 -0.144 -0.141 -0.122 0.074 0.085 0.077 0.001 1.000

4.3 Dritter Schritt: Evaluation der Modellschätzung

Der dritte Verfahrensschritt dient der Evaluation der Modellschätzung hinsichtlich der in Abschnitt 3 vorgestellten Qualitätskriterien: Grad der Parameterverzerrung, Grad der Standardfehlerverzerrung, Grad der Abdeckung (coverage). Mittels Mon-te-Carlo-Simulation soll untersucht werden, ob der für das Beispielmodell gegebene Stichprobenumfang von N = 142 zur Erfüllung dieser Kriterien ausreicht, oder, falls nicht, mit welcher Stichprobengröße die genannten Kriterien erfüllt werden könnten.

Im Input-File zum dritten Verfahrensschritt (vgl. Anhang) müssen als Erstes die Schwellenwerte (Cutpoints) der kategorialen Variablen definiert werden. In Anleh-nung an den Wertebereich der empirischen Thresholds (vgl. Schritt 1) werden im vorliegenden Beispiel für alle sieben der siebenstufigen Indikatoren die sechs Cut-points -1,5, -1, -0,5, 0, 0,5 und 1 verwendet. Als Datenbasis dient der Simulation die in Schritt 2 gewonnene Kovarianzmatrix plus dem Vektor der arithmetischen Mittel der y*-Indikatoren. Alle Modellparameter werden mit den Populationswerten aus Schritt 1 als Startwerte unter Verwendung des WLS-Verfahrens geschätzt. Dabei wird zunächst eine Monte-Carlo-Simulation mit einer Stichprobengröße von 142 Fällen durchgeführt, die der oben skizzierten empirischen Datengrundlage ent-spricht. In Tabelle 1a werden die dementsprechenden Ergebnisse vorgestellt.

Page 59: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

60 ZA-Information 53

In den Tabellen 1a und 1b stammen die Werte der Spalte „hyp. Parameterwert“ aus Schritt 1 und benennen die hypothetischen Parameterwerte der Population. In der Spalte „durchschn. Parameter“ werden die durchschnittlichen Parameterschätzwerte über alle Replikationen der Monte-Carlo-Simulation aufgeführt. Wie der Spalte „Parameterverzerrung“ in Tabelle 1a bei 142 Fällen zu entnehmen ist, weist ledig-lich ein Parameter eine Verzerrung von mehr als 10% auf (fett gedruckt). Ganz an-ders hingegen verhält es sich bei den Standardfehlerverzerrungen (vorletzte Spalte). Deren Verzerrungsgrad ist bei 142 Fällen durchweg viel zu hoch. Auch die Covera-ge-Werte sind für die meisten Parameter nicht zufrieden stellend, d.h. der Anteil an Replikationen, die den wahren Parameterwert im 95 %-Konfidenzintervall beinhal-ten, ist bei fast allen Parametern zu gering. Insgesamt betrachtet, reicht also eine Fallzahl von nur 142 Beobachtungen für eine stabile Schätzung des Analysemodells nicht aus.

Weitere Monte-Carlo-Simulationen mit größeren Fallzahlvorgaben zeigen, dass sich erst ab einer Fallzahl von 400 weitestgehend akzeptable Schätzwerte ergeben. Denn dann erfüllen die Parameter- und Standardfehlerverzerrungen sowie die Coverage-Werte für fast alle Parameter die hier angesetzten Kriterien. Einzige Ausnahme ist die Schätzung der Residualvarianz des latenten Konstrukts F2. Diese weist eine leicht erhöhte Standardfehlerverzerrung von 11% auf, was evtl. vernachlässigt wer-den könnte, wenn nicht auch der zugehörige Coverage-Wert bei lediglich 0.884 lie-gen würde. Eine erneute Anhebung der Stichprobengröße auf 500 Fälle erbringt jedoch zufrieden stellende Werte für alle Schätzwerte (vgl. Tabelle 1b).

Diesen Ergebnissen zufolge ist für das untersuchte Beispielmodell bei Verwendung von kategorialen Indikatoren eine Stichprobengröße von mindestens 500 Fällen an-zustreben. Mit kleineren Abstrichen ist auch eine Fallzahl von 400 noch akzeptabel, allerdings sollte die Fallzahl für unser Beispiel nicht darunter liegen.

Page 60: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 61

Tabelle 1a) Parameterbias, Standardfehlerbias und Coverage bei 142 Fällen hyp.

Para-meter-wert

durchschn. Parameter

Parame-terverzer-rung (1)

Standard-abwei-chung

durchschn.Standard-fehler

Standard-fehlerver-zerrung (2)

95%-Cover-age

y1 (Ausl1) 1,000 y2 (Ausl2) 0,982 0,9860 0,00 0,0752 0,0574 -0,24 0,874 y3 (Ausl3) 0,964 0,9712 0,01 0,0742 0,0576 -0,22 0,885 y4 (Ausl5) 0,833 0,8526 0,02 0,0835 0,0619 -0,26 0,845

F1 (AA) BY

y5 (Auto2) 1,000 y6 (Auto3) 1,149 1,1347 -0,01 0,0949 0,0717 -0,24 0,849 y7 (Auto4) 1,040 1,0391 0,00 0,0868 0,0674 -0,22 0,888

F2 (AU) BY

F2 0,748 0,7884 0,05 0,0959 0,0709 -0,26 0,827 X1 (Bildung) 0,037 0,0455 0,23 0,0723 0,0596 -0,18 0,887 X2 (Schicht) -0,202 -0,1989 -0,02 0,0697 0,0587 -0,16 0,900

F1 ON

X1 (Bildung) -0,195 -0,1960 0,01 0,0793 0,0694 -0,12 0,913 X2 (Schicht) 0,074 0,0731 -0,01 0,0770 0,0685 -0,11 0,920

F2 ON

F1 0,335 0,3156 -0,06 0,0722 0,0535 -0,26 0,815 Residual-

varianzen F2 0,572 0,6173 0,08 0,0822 0,0615 -0,25 0,777

Tabelle 1b) Parameterbias, Standardfehlerbias und Coverage bei 500 Fällen

hyp. Para-meter-wert

durchschn. Parameter

Parame-terverzer-rung (1)

Standard-abwei-chung

durchschn.Standard-fehler

Standard-fehlerver-zerrung (2)

95%-Cover-age

y1 (Ausl1) 1,000 y2 (Ausl2) 0,982 0,9832 0,00 0,0389 0,0357 -0,08 0,932 y3 (Ausl3) 0,964 0,9666 0,00 0,0386 0,0358 -0,07 0,932 y4 (Ausl5) 0,833 08386 0,01 0,0420 0,0386 -0,08 0,928

F1 (AA) BY

y5 (Auto2) 1,000 y6 (Auto3) 1,149 1,1447 0,00 0,0488 0,0446 -0,09 0,918 y7 (Auto4) 1,040 1,0385 0,00 0,0451 0,0414 -0,08 0,928

F2 (AU) BY

F2 0,748 0,7594 0,02 0,0480 0,0437 -0,09 0,920 X1 (Bildung) 0,037 0,0392 0,06 0,0352 0,0333 -0,05 0,935 X2 (Schicht) -0,202 -0,2005 -0,01 0,0348 0,0328 -0,06 0,934

F1 ON

X1 (Bildung) -0,195 -0,1952 0,00 0,0400 0,0377 -0,06 0,938 X2 (Schicht) 0,074 0,0742 0,00 0,0386 0,0372 -0,04 0,941

F2 ON

F1 0,335 0,3306 -0,01 0,0350 0,0323 -0,08 0,921 Residual-

varianzen F2 0,572 0,5862 0,02 0,0407 0,0370 -0,09 0,905

(1) berechnet als: (durchschn. Parameterschätzung – hypothetischer Parameterwert)/hypothetischer Parameterwert (2) berechnet als: (durchschnittliche Standardfehlerschätzung – Standardabweichung)/Standardabweichung

Page 61: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

62 ZA-Information 53

Als weiteres Kriterium zur Festlegung einer ausreichenden Fallzahl wird im folgen-den Abschnitt die Teststärke (Power) betrachtet.

4.4 Vierter Schritt: Bestimmung von Teststärken

Im vierten und letzten Verfahrensschritt soll die Teststärke für verschiedene Modell-parameter ermittelt werden. Sie wird über eine bewusste Modell-Fehlspezifikation von jeweils einem Effektparameter berechnet.27 Als „empirischer Powerwert“ kann dann der in einer Monte-Carlo-Simulation korrekterweise zurückgewiesene Anteil fehlspezifizierter Modelle bezeichnet werden.

Die Wahl der Parameter, die fehlspezifiziert werden, sollte bei einer SEM-Poweranalyse zunächst auf die kleinsten bedeutsamen Parameter (Mindesteffekte) des Analysemodells fallen.28 Um dies am Beispiel zu veranschaulichen, wird hier der empirisch signifikante Effekt der Bildung (x1) auf den latenten Mediator „Auto-ritarismus“ (F2/AU) fälschlicherweise auf einen Wert von 0.00 fixiert (in bewusster Abweichung vom ursprünglichen Parameterwert von -0.195).29 Dies ermöglicht, den im Rahmen einer Monte-Carlo-Simulation ermittelten Anteil von Zurückwei-sungen des fehlspezifizierten Modells als geschätzten empirischen Powerwert (auf einem bestimmten Signifikanzniveau) zu definieren. Dieser Anteil kann dann auch als Wahrscheinlichkeit für das Zurückweisen einer falschen Null-Hypothese ver-standen werden (vgl. Tabelle 2).

Im Beispiel ergibt sich für eine Fallzahl von 142 ein Powerwert von 0.466 (bei einem α von 0.05) sowie (bei einem α von 0.01) ein Powerwert von 0.258 (vgl. Ta-belle 2a). Da diese Powerwerte den Grenzwert von 0.80 deutlich unterschreiten, sollte demnach die Fallzahl zur Schätzung unseres Beispielmodells unabhängig vom Ausmaß der Verzerrung aller Schätzwerte (vgl. Schritt 3) deutlich erhöht werden.

Eine schrittweise Anhebung der Fallzahl in mehreren Monte-Carlo-Simulationen zeigt, dass die Teststärke das Kriterium von 0.80 bei einem α von 0.05 erst bei einer Fallzahl von 400 mit einem Powerwert von 0.808 erreicht. Bei N = 500 liegt die

27 Eine alternative Möglichkeit zur Durchführung von Poweranalysen im Kontext von SEM-

Analysen besteht darin, den Modellfit – und nicht einzelne Effekte – als Bezugseinheit für die Power-Bestimmung zu benutzen (vgl. MacCallum/Browne/Sugawara 1996).

28 Die Poweranalyse kann (und sollte) aber auch für jeden anderen theoretisch interessierenden Parameter durchgeführt werden.

29 Bis auf diese Fehlspezifikation bleibt die Syntax des Inputfiles dieselbe wie in Schritt 3 (vgl. Anhang).

Page 62: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 63

Teststärke bereits bei 0.903 (vgl. Tabelle 2b). Für ein α von 0.01 liegt die Teststärke sogar erst bei 550 Fällen mit einem Wert von 0.816 über dem Grenzwert.

Tabelle 2 Monte-Carlo-Resultat zur Bestimmung der Teststärke des Effektes von Bildung (x1) auf Autoritarismus (F2/AU) (vierter Verfahrens- schritt)

2a) Mplus-Output bei N=142 2b) Mplus-Output bei N=500

CHI-SQUARE P-VALUES CHI-SQUARE P-VALUES

Expected 0.990 0.980 0.950 0.900 0.800 0.700 0.500 0.300 0.200 0.100 0.050 0.020 0.010

Observed 1.000 0.999 0.997 0.993 0.981 0.963 0.902 0.807 0.721 0.587 0.466 0.334 0.258

Expected 0.990 0.980 0.950 0.900 0.800 0.700 0.500 0.300 0.200 0.100 0.050 0.020 0.010

Observed 1.000 1.000 1.000 1.000 0.999 0.999 0.996 0.987 0.977 0.948 0.903 0.820 0.756

Zu beachten ist allerdings auch, dass nach den von Muthén/Muthén vorgeschlage-nen Kriterien (in Abschnitt 3 beschrieben) die Verzerrung der Standardfehler für den Parameter, dessen Teststärke interessiert, nicht größer als 5 % sein sollte. Im vorliegenden Beispiel wird dieser Wert erst bei 600 Fällen erreicht. Hingegen liegt die Standardfehlerverzerrung mit 400 Fällen bei 7 % und mit 500 Fällen bei 6 % (vgl. Tabelle 1b), was nur noch knapp über dem geforderten Grenzwert ist.

Führt man die vorgestellte Poweranalyse statt für einen Effekt mit schwacher Stärke auch für einen mit hoher Stärke durch, ergeben sich andere Resultate. Dies lässt sich im vorliegenden Analysemodell am Beispiel des kausalen Effektes vom latenten Mediator „Autoritarismus“ (F2/AU) auf das Konstrukt „Ausländerablehnung“ (F1/AA) zeigen (der standardisierte Regressionskoeffizient liegt hier bei 0.709, während er für den schwachen Effekt bei -0.286 lag). Nunmehr ergibt sich schon bei einer Fallzahl von 142 ein Powerwert von 1.00 (α = 0.01). Allerdings legt die Verzerrungsfreiheit der Schätzwerte, die in Schritt 3 evaluiert wurde, auch in die-sem Falle einen Stichprobenumfang von mindestens 400 Fällen nahe.

Keineswegs sollte aber davon ausgegangen werden, dass, wie oben geschehen, bei höherer Effektstärke der Powerwert automatisch ansteigt. Dies lässt sich unschwer

Page 63: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

64 ZA-Information 53

an folgendem Beispiel erkennen: Oben haben wir für den Effekt von Bildung (x1) auf Autoritarismus (F2/AU) mit einer standardisierten Effektstärke von -0.286 eine Teststärke von 0.466 kalkuliert (α = 0.05). Die Teststärke für den im Vergleich dazu schwächeren Effekt von subjektiver Schicht (x2) auf Ausländerablehnung (F1/AA) mit einer standardisierten Effektstärke von -0.168 liegt jedoch mit 0.598 (α = 0.05) sehr deutlich über dem Wert des schwächeren Effekts, so dass hier bereits eine Fall-zahl von 300 ausreichte, um eine Teststärke von 0.852 zu erreichen. Die Teststärke hängt eben bei Konstanz der Stichprobengröße nicht nur von der Effektstärke, son-dern auch noch von vielen anderen Faktoren ab.30 Folgerichtig sollte die Power-analyse stets für alle interessierenden Parameter durchgeführt werden, u.a. auch dann, wenn alle Effektstärken als (fast) gleich groß oder schwach geschätzt werden.31

Die folgende Abbildung 6 zeigt, in welcher Weise sich die Teststärke (bzw. der Powerwert) für die drei hier diskutierten Effekte verändert, wenn die Stichproben-größe über die von uns beobachteten 142 Fälle anwächst. Deutlich ist zu erkennen, dass die Teststärke des „F2→F1“-Effektes von schwankenden Fallzahlen nicht be-troffen ist, und dass die beiden anderen Effekte deutlich mehr als 142 Fälle benöti-gen, um akzeptable Powerwerte aufzuweisen. Dabei erreicht der relativ schwache „x2→F1“-Effekt schon bei ca. 260 Fällen eine Teststärke oberhalb von 0.80, wäh-rend der relativ stärkere „x1→F2“-Effekt dies erst ab ca. 400 Fällen schafft.

30 Vgl. dazu die Ausführungen in Abschnitt 3. 31 Die Teststärke/power von Parametern mit gleichen „wahren“ Werten kann in Abhängigkeit von

der Platzierung der betreffenden Variablen im Modell variieren, weil sie je nach Lokalität unter-schiedliche statistische Beziehungen zu anderen Parametern im Modell haben können (vgl. Saris/Satorra/Sörbom 1987).

Page 64: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 65

Abbildung 6 Der Zusammenhang zwischen Teststärke und Stichprobengröße

bei drei als unterschiedlich stark geschätzten und unterschiedlich positionierten Modelleffekten

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

1.1

Stichprobengröße

Test

stär

ke b

ei p

=0,0

5

x2 F1, Effekts tärke: -0.202 (s tandardis iert -0.168)

x1 F2, Effekts tärke: -0.195 (s tandardis iert -0.286)

F2 F1, Effekts tärke: 0.748 (s tandardis iert 0.709)

142 200 300 400 500 600

1.0

0.0

5 Resümee

Kategoriale SEM-Analysen werden von Horrorwarnungen hinsichtlich der dafür erforderlichen Fallzahlen begleitet. Oftmals werden bis zu 5000 Fälle gefordert (s.o.), um mit einer WLS-Schätzung und kategorialen Indikatorvariablen unabhän-gig von der Modellkomplexität zu halbwegs zuverlässigen und stabilen Parameter-schätzwerten gelangen zu können.

Auch werden zur Bestimmung der notwendigen Fallzahl mehr oder weniger gut begründete Daumenregeln vorgeschlagen, die stets aber nur ganz wenige Modell- und Datenstrukturen der jeweiligen SEM-Analyse berücksichtigen und zudem auch noch zu weit streuenden Fallzahlempfehlungen führen. So würden die in Abschnitt 2 vorgestellten Daumenregeln von Hoogland (1999), die er für den Fall einer WLS-Schätzung aufstellte, bei dem von uns beispielhaft analysierten Modell zu Mindest-

Page 65: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

66 ZA-Information 53

Fallzahlen von 450 (zur Schätzung robuster Effektparameter), 900 (zur Schätzung robuster Standardfehler) oder 1035 (zur Erreichung robuster χ2-Teststatistiken) füh-ren.32 Und auch die Universal-Daumenregel „Fälle pro Modellparameter“, die den Typ des jeweiligen Schätzverfahrens und die Messqualität der Daten erst gar nicht berücksichtigt, könnte zu äußerst unterschiedlichen Fallzahlforderungen führen, die zwischen 110 und 440 Beobachtungen lägen.33

Im Unterschied dazu berücksichtigt das hier für die kategoriale SEM-Analyse vor-gestellte Verfahren nach Muthén/Muthén (2002a) alle Spezifika des jeweils zu ana-lysierenden Modells, alle Spezifika der zur Verfügung stehenden Daten und alle Spezifika der WLS-Schätzmethode. Und es kommt dabei zu recht eindeutigen Empfehlungen hinsichtlich der einzusetzenden Mindestzahl von Beobachtungs-fällen anhand von fünf Bewertungskriterien, die von der Vermeidung eines allzu starken Schätzbias bis zur Erreichung einer ausreichenden Teststärke (für den Test einzelner Effektparameter) reichen.

Im Falle unseres Beispielmodells, für das nach den üblichen Daumenregeln, wie oben skizziert, Mindest-Fallzahlen von 110 bis 5000 empfohlen worden wären, be-rechnet das hier vorgeschlagene Verfahren in methodisch kontrollierter, nachvoll-ziehbarer Weise bei Einsatz einer WLS-Schätzung mit kategorialen Indikatorvariab-len einen sinnvollerweise anzustrebenden Stichprobenumfang von mindestens 400, besser noch von 500 Fällen. Und es begründet auch mit statistischen Kenngrößen, warum in diesem Falle einer substantiell interpretierten SEM-Analyse, die allein auf den 142 beobachteten Fällen beruhte, mit großer Skepsis begegnet werden müsste.

Die im Verfahren erzielten Ergebnisse decken sich mit den Resultaten von Algina und Olejnik, wonach „sample sizes needed for accurate estimation are likely to be substantially larger than sample sizes needed for powerful hypothesis tests“ (dies. 2000: 132). Wie gesehen, sollte jedoch hinzugefügt werden, dass es auch von der Effektgröße und dem in der Poweranalyse angesetztem α-Niveau abhängt, ob die Teststärke oder die Akkuratesse höhere Anforderungen an den Stichprobenumfang stellen. Folgerichtig ist es generell ratsam, wie hier gezeigt und wie es der Logik des dargestellten Verfahrens entspricht, sowohl die Akkuratesse der Schätzung als auch die Teststärke unter verschiedenen Bedingungen zur Bestimmung des notwen-digen Stichprobenumfangs heranzuziehen und zu simulieren. Denn jedes einzelne

32 N = 450 bei (50 * k, wenn K zwischen -1.0 und 0.00) mit k = 9, K = -0.45; N = 900 bei (10k(k+1),

wenn K = 0) mit k = 9, K = -0.45; N = 1035 bei (45(df) mit df = 23. 33 N = 110 bei 5 Fällen pro Modellparameter (q = 22), N = 220 bei 10 Fällen pro Modellparameter,

N = 440 bei 20 Fällen pro Modellparameter.

Page 66: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 67

Kriterium könnte, für sich alleine genommen, falsche Fallzahlempfehlungen abge-ben (z.B. könnte eine Poweranalyse geringere Stichprobenumfänge vorschlagen, als zur Erreichung einer ausreichend großen Verzerrungsfreiheit notwendig wären).

Das hier vorgestellte, vierstufige Verfahren kann für eine Apriori- oder eine Posthoc-Analyse eingesetzt werden. Bei der Apriori-Analyse ginge es um den not-wendigen Stichprobenumfang einer geplanten SEM-Analyse. Im weniger idealisti-schen – aber häufig realistischeren – Falle einer Posthoc-Analyse mit gegebener Fallzahl kann das Verfahren zur Beurteilung der Qualität von Parameterschätzwer-ten und der Teststärke eingesetzt werden, selbst wenn dies "more like an autopsy than a diagnostic procedure" (Kline 1998: 308) erscheinen mag.

Mit welchem Erkenntnisinteresse das Verfahren auch immer eingesetzt wird: Es liefert eine rationale, modell- und datenspezifische Grundlage für die Bewertung von Stichprobenumfängen hinsichtlich der Schätzung von unverzerrten Effektpara-metern und unverzerrten Standardfehlern sowie hinsichtlich der Möglichkeit, ein-flussstarke und einflussschwache Effekte im spezifizierten Modell zu entdecken.

Literatur

Algina, J../Olejnik, S., 2000: Determining Sample Size for Accurate Estimation of the Squared Multiple Correlation Coefficient. Multivariate Behavioral Research 35: 119-136. Bollen, K.A., 1989: Structural Equations with Latent Variables. New York et al.: Wiley. Boomsma, A., 1982: The Robustness of LISREL Against Small Sample Sizes in Factor Analysis Models. S. 149-174 in: Jöreskog, K.G./Wold, H. (Hrsg.): Systems Under Indirect Observation: Causality, Structure, Prediction (Band 1). Amsterdam: North-Holland. Boomsma, A., 1983: On the robustness of LISREL (maximum likelihood estimation) against small sample size and non-normality. Amsterdam: Sociometric Research Foundation. Cohen, J., 1988: Statistical Power Analysis for the Behavioral Sciences. 2nd Edition. London: Erlbaum. Curran, P.J./West, S.G./Finch, J., 1996: The Robustness of Test Statistics to Non-normality and Specifica-tion Error in Confirmatory Factor Analysis. Psychological Methods 1: 16-29. Hoogland, J.J., 1999: The Robustness of Estimation Methods for Covariance Structure Analysis. Groningen: Dissertation. Hoyle, R.H./Kenny, D.A., 1999: Sample Size, Reliability, and Tests of Statistical Mediation. S. 195-222 in: Hoyle, R.H. (Hrsg.): Statistical Strategies For Small Sample Research. Thousand Oaks et al.: Sage Publica-tions. Jackson, D.L., 2001: Sample Size and Number of Parameter Estimates in Maximum Likelihood Confirma-tory Factor Analysis: A Monte Carlo Investigation. Structural Equation Modeling 8: 205-223. Jackson, D.L., 2003: Revisiting Sample Size and Number of Parameter Estimates: Some Support for the N:q Hypothesis. Structural Equation Modeling 10: 128-141. Kaplan, D., 1997: Statistical Power in Structural Equation Modeling. S. 110-117 in: Hoyle, R.H. (Hrsg.): Structural Equation Modeling: Concepts, Issues, and Applications. Thousand Oaks et al.: Sage Publications. Kaplan, D., 2000: Structural Equation Modeling. Foundations and Extensions. Thousand Oaks et al.: Sage Publications. Kline, R.E., 1998: Principles and Practice of Structural Equation Modeling. New York/London: Guilford Press.

Page 67: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

68 ZA-Information 53

MacCallum, R.C./Browne, M.W./ Sugawara, H.M., 1996: Power Analysis and Determination of Sample Size for Covariance Structure Modeling. Psychological Methods 2: 130-149. Marsh, H.W./Hau, K.-T., 1999: Confirmatory Factor Analysis: Strategies for Small Sample Sizes. S. 251-284 in: Hoyle, R.H. (ed.), Statistical Strategies for Small Sample Research. London: Sage. Muthén, B.O., 1983: Latent Variable Structural Equation Modeling With Categorical Data. Journal of Eco-nometrics 22: 43-65. Muthén, B.O., 1984: A General Structural Equation Model with Dichotomous, Ordered Categorial, and Con-tinuous Latent Variable Indicators. Psychometrika 49: 115-132. Muthén, B.O., 1993: Goodness of Fit With Categorical and Other Nonnormal Variables. S. 205-234 in: Bollen, K.A./Long, J.S. (Hrsg.), Testing Structural Equation Models. Newbury Park: Sage. Muthén, B.O., 2002: Using Mplus Monte Carlo-Simulations in Practice: A Note on Assessing Estimation Quality and Power in Latent Variable Models. Vers. 2.0 vom 22.3.2002. Mplus Web Notes 1: 1-9 (www.statmodel/Mplus/examples/webnote.html) Muthén, B.O./Curran, P.J., 1997: General Longitudinal Modeling of Individual Differences in Experimental Designs. A Latent Variable Framework for Analysis and Power Estimation. Psychological Methods 2: 371-402. Muthén, B.O./Satorra, A., 1995: Technical Aspects of Muthén's LISCOMP Approach to Estimation of Latent Variable Relations with a Comprehensive Measurement Model. Psychometrika 60: 489-503. Muthén, L.K./Muthén, B.O., 2001: Mplus. Statistical Analysis with Latent Variables. User´s Guide. Version 2. Los Angeles: Muthén & Muthén. Muthén, L.K./Muthén, B.O., 2002a: How to Use a Monte Carlo Study to Decide on Sample Size and Deter-mine Power. Structural Equation Modeling 9: 599-620. Muthén, L.K./Muthén, B.O., 2002b: How to Calculate the Power to Detect that a Parameter is Different From Zero. www.statmodel.com/power.html, S. 1-6. Olsson, U.H. et al., 2000: The Performance of ML, GLS and WLS Estimation in Structural Equation Model-ing Under Conditions of Misspecification and Nonnormality. Structural Equation Modeling 7: 557-595. Saris, W.E./Stronkhorst, L.H., 1984: Causal Modelling in Nonexperimental Research. Amsterdam: Sociometric Research Foundation. Saris, W.E./Satorra, A., 1993: Power Evaluations in Structural Equation Models. S. 181-204 in: Bollen, K.A./Long, J.S. (Hrsg.), Testing Structural Equation Models. Newbury Park: Sage. Saris, W.E./Satorra, A./Sörbom, D., 1987: The Detection and Correction of Specification Errors in Struc-tural Equation Models. S. 105-129 in: Clogg, C.C. (Hrsg.), Sociological Methodology. Washington: Jossey-Bass. Satorra, A./Bentler, P., 1986: Some robustness properties of goodness of fit statistics in covariance structure analysis. American Statistical Association: Proceedings of the Business and Economic Statistics Section, S.549-554 Satorra, A./Saris, W.E., 1985: The Power of the Likelihood Ratio Test in Covariance Structure Analysis. Psychometrika 50: 83-90. Stone, C.A./Sobel, M.E., 1990: The Robustness of Estimates of Total Indirect Effects in Covariance Struc-ture Models Estimated by Maximum Likelihood. Psychometrika 55: 337-352. Tanaka, J.S., 1987: „How big is big enough?“: Sample Size and Goodness of Fit in Structural Equation Models with Latent Variables. Child Development 58: 134-146. Urban, D./Mayerl, J., 2003: Autoritarismus und Ausländerablehnung. Ein vergleichender Hypothesentest. Universität Stuttgart, Institut für Sozialwissenschaften, unv. Manuskript. Xie, Y., 1989: Structural Equation Models for Ordinal Variables: An Analysis of Occupational Destination. Sociological Methods and Research 17: 325-352. Yuan, K.-H./Bentler, P.M., 1994: Bootstrap-corrected ADF Test Statistics in Covariance Structure Analysis. British Journal of Mathematical and Statistical Psychology 47: 63-64.

Page 68: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 69

Anhang TITLE: Mplus-Inputfile für Schritt 1 DATA: FILE IS daten.dat; ANALYSIS: ESTIMATOR= WLS; VARIABLE: NAMES ARE y1-y7 x1-x2; USEVARIABLES ARE y1 y2 y3 y4 y5 y6 y7 x1 x2; MISSING ARE y1-y7 x1 x2(99); CATEGORICAL ARE y1-y7; MODEL: F1 BY y1 y2 y3 y4; F2 BY y5 y6 y7; F1 on F2 x1 x2; F2 on x1 x2; OUTPUT: SAMPSTAT STANDARDIZED RESIDUAL TECH2 TECH4; TITLE: Mplus-Inputfile für Schritt 2 MONTECARLO: FILE IS identity.dat; NAMES = y1-y7 x1-x2; NOBSERVATIONS = 100000; NREPS = 1; SEED = 53487; ANALYSIS: ESTIMATOR = ML; MODEL: f1 BY y1@1 [email protected] [email protected] [email protected]; f2 BY y5@1 [email protected] [email protected]; f1 on [email protected] [email protected] [email protected]; f2 on [email protected] [email protected]; [email protected] [email protected] [email protected] [email protected]; [email protected] [email protected] [email protected]; [email protected]; [email protected]; OUTPUT: RESIDUAL; TITLE: Mplus-Inputfile für Schritt 3 MONTECARLO: FILE IS pop.dat; NAMES = y1-y7 x1-x2; CUTPOINTS = y1-y7(-1.5 -1 -0.5 0 0.5 1); CATEGORICAL = y1-y7(6); NOBSERVATIONS = 142; !hier kann die Fallzahl variiert werden NREPS = 5000; SEED = 53487; ANALYSIS: ESTIMATOR = WLS; MODEL: f1 BY y1@1 y2*.982 y3*.964 y4*.833; f2 BY y5@1 y6*1.149 y7*1.040; f1 on f2*.748 x1*.037 x2*-.202; f2 on x1*-.195 x2*.074; f1*.335; f2*.572; TITLE: Mplus-Inputfile für Schritt 4 MONTECARLO: FILE IS pop.dat; NAMES = y1-y7 x1-x2; CUTPOINTS = y1-y7(-1.5 -1 -0.5 0 0.5 1); CATEGORICAL = y1-y7(6); NOBSERVATIONS = 142;!hier kann die Fallzahl variiert werden NREPS = 5000; SEED = 53487; ANALYSIS: ESTIMATOR = WLS; MODEL: f1 BY y1@1 y2*.982 y3*.964 y4*.833; f2 BY y5@1 y6*1.149 y7*1.040; f1 on f2*.748 x1*.037 x2*-.202; f2 on x1@0 x2*.074; f1*.335; f2*.572;

Page 69: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

70 ZA-Information 53

Die „Last-birthday-Methode“ in einer postalischen

Bevölkerungsumfrage: Auswirkungen auf den Rücklauf

und die soziale Zusammensetzung

von Volker Hüfken 1

Zusammenfassung

Postalische Bevölkerungsumfragen werden üblicherweise auf der Basis von Perso-nenstichproben durchgeführt. Haushaltsadressen werden dagegen selten verwendet. So verwundert es nicht, dass Erfahrungen mit der Verwendung von Haushaltsadres-sen und zur Auswahl der Zielperson, wie etwa durch die Last-birthday-Methode, für postalische Umfragen bisher nicht existieren. Diese Lücke versucht der vorliegende Beitrag ein Stück weit zu schließen. In einem experimentellen Design (split-ballot) werden die Auswirkungen der beiden Methoden auf die Teilnahmerate und die sozi-ale Zusammensetzung der Befragten dargestellt. Ein Vergleich der Randverteilun-gen erbringt für die soziodemographischen Merkmale keine signifikanten Unter-schiede. Einen besonderen Stellenwert zur Reduzierung von Verzerrungen in der sozialen Zusammensetzung nehmen die Erinnerungsschreiben bei der Geburts-tagsauswahlgruppe ein. Geringe Unterschiede bleiben dennoch bestehen. Die for-mal besser Gebildeten, Erwerbstätigen, Älteren (45 Jahre und älter) und Verheira-teten sind in der Geburtstagsauswahlgruppe leicht überrepräsentiert. Zudem wirken sich einige personenbezogene Merkmale auf die Teilnahme aus: So nehmen mit dem Geburtstagsauswahlverfahren eher die aufgeschlosseneren, interessierteren und sozial aktiveren Personen an der Befragung teil.

1 Volker Hüfken ist Wissenschaftlicher Mitarbeiter am Sozialwissenschaftlichen Institut der

Heinrich-Heine-Universität Düsseldorf. E-mail: [email protected]

Dieser Beitrag stellt eine erweiterte Fassung eines Vortrages dar, der auf der Frühjahrstagung der Sektion für Methoden der Deutschen Gesellschaft für Soziologie (in der Zeit vom 30. bis 31.03.2001) in Konstanz gehalten wurde.

Page 70: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 71

Abstract

Mail surveys on general populations in Germany are mostly based on a random sample of individuals from the city registration office. Experiences by last-birthday-method in mail surveys don’t exist. A comparison of both groups shows that the last-birthday-method leads to a higher response rate and a higher participation of the old, of married people, of people with a higher level of education and employ-ees. Reminders have a positive effect on the structure of the realised sample espe-cially for the last-birthday-group. In addition, considerable differences were found of some characteristics that make them more relevant to participate.

1 Einleitung

Postalische Bevölkerungsbefragungen werden in Deutschland üblicherweise auf der Basis von Personenadressen durchgeführt. Dabei werden die Adressen meist aus dem Einwohnermelderegister gezogen. Auf kommunaler Ebene stellt die Ziehung von Adressen in der Regel kein Problem dar. Anders sieht dies hinsichtlich nationa-ler Studien aus: Auf Grund eines fehlenden bundesweiten Registers müssten die Adressen aus den Registern der kommunalen Behörden gezogen werden, was enorme Kosten verursacht und einen hohen Zeitaufwand bedeutet (vgl. Kirschner 1986). Dies könnte auch eine Erklärung dafür sein, dass postalische Bevölkerungs-umfragen auf nationaler Ebene eher selten durchgeführt wurden (Kirschner 1986, Harkness et al. 1998, Lüschen et al. 1997, Schnell und Kreuter 2000). Um den-noch nationale postalische Bevölkerungsbefragungen durchführen zu können, kamen bisher zwei Vorgehensweisen zur Anwendung. Eine Variante wurde im Rahmen der Allgemeinen Bevölkerungsumfrage (ALLBUS) 1985 beim International Social Survey Program (ISSP) angewandt (vgl. Kirschner 1986). In dieser Studie wurden in einem zweistufigen Auswahlverfahren Personenadressen aus den Einwohnermelde-registern der Kommunen gezogen. Eine andere Vorgehensweise stellen Schnell und Kreuter (2000) vor: Sie ermittelten auf der Basis des ADM-Mastersample durch Begehung Haushaltsadressen. In einem Anschreiben an den Haushalt wurden die Mitglieder gebeten, den Fragebogen an die Person weiterzuleiten, die zuletzt Geburtstag hatte und mindestens 18 Jahre oder älter war.

Weitere Hinweise oder Erfahrungen hinsichtlich der Praktikabilität der Geburts-tagsauswahl in postalischen Umfragen existieren in der Literatur nicht2. So berichtet

2 Die Recherchen in den Datenbanken „Sociofile“ und „Medline“ erbrachten – bis auf die oben

genannten – keine Hinweise auf die Anwendung dieses Auswahlverfahrens.

Page 71: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

72 ZA-Information 53

Dillman (2000: 203 f.): „We know of no experiments that have compared results with other selection methods for mail surveys. This too is a topic of needed re-search.” Aus diesem Grund wird vorliegend zunächst auf Arbeiten zur Geburts-tagsauswahl in Telefonumfragen zurückgegriffen. In der amerikanischen Literatur (vgl. u. a. Salmon und Nichols 1983, Oldendick et al. 1988) wurde schon in den 80er Jahren über die Praktikabilität des Geburtstagsauswahlverfahrens3 berichtet. Demnach wurden hinsichtlich der Responsequote und der sozialen Zusammenset-zung keine nennenswerten Differenzen beobachtet. Lediglich bezüglich der ge-schlechtsspezifischen Zusammensetzung werden geringe Unterschiede berichtet. Groves und Lyberg (1988) weisen darauf hin, dass durch die „Last-birthday-Aus-wahl“ der Anteil der Frauen überrepräsentiert sei. Zu vergleichbaren Ergebnissen kommen auch Brosius und Donsbach (1989) in einer westdeutschen Studie. Dass der Anteil der Frauen bei der Anwendung der Geburtstagsauswahlmethode in eini-gen Studien überrepräsentiert ist, könnte auf die geringere Erwerbsquote von Frauen im Vergleich zu Männern (Statistisches Bundesamt 2000) und die damit verbunde-ne leichtere Erreichbarkeit von Frauen in Haushalten zurückzuführen sein. Wäre dies der Fall, dürften in solchen Regionen nur geringe oder gar keine geschlechts-spezifischen Unterschiede auftreten, in denen die Quote der Erwerbsbeteiligung von Männern und Frauen etwa gleich groß ist. Dieser Zusammenhang konnte in einer Studie (Hüfken 2000) belegt werden, die in Ostdeutschland durchgeführt wurde – einem Gebiet, in dem der Unterschied bei der Erwerbsbeteiligung zwischen Män-nern und Frauen weniger deutlich ausfällt (Statistisches Bundesamt 2000).

Inwieweit sich die Geburtstagsauswahl in postalischen Umfragen als brauchbar er-weist, ist bisher nicht untersucht. Für postalische Umfragen bleibt daher zu klären, ob die Auswahl nach der Last-birthday-Methode zu ähnlichen Rücklaufraten und vergleichbaren Ergebnissen in der sozialen Zusammensetzung führt, wie dies bei persönlich adressierten postalischen Umfragen üblich ist.

2 Rücklauf, Auswahl der Zielperson und soziale Zusammensetzung

Vergleicht man die beiden Auswahlverfahren (Personen- und Haushaltsstichprobe), so sprechen vor allem zwei Aspekte für die Bevorzugung der Personenstichprobe. Erstens: Die Verteilungen der Merkmale Geschlecht und Alter der Nettostichprobe

3 Zur Frage des Verständnisses und der Anwendung von Geburtstagsauswahlverfahren vgl. Bin-

son et al. (2000), wonach in Abhängigkeit von der ethnischen Zugehörigkeit größere Schwie-rigkeiten bestehen, die „Last-birthday-Auswahl“ im Vergleich zur „Next-birthday-Auswahl“ anzuwenden.

Page 72: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 73

können mit den Angaben der Bruttostichprobe verglichen werden, weshalb über die Repräsentativität der Stichprobe eine genauere Aussage getroffen werden kann. Zweitens: Werden Zielpersonen persönlich angeschrieben, erhöht sich die Rück-laufquote (vgl. u. a. Yammarino et al. 1991). Dieser Befund ist jedoch nicht unstrit-tig. So konstatiert Mangione (1995:87), dass es gegenwärtig keine konsistenten Befunde über die Wirkung persönlicher Begleitbriefe auf die Teilnahme gebe. Scott (1961: 172) weist darauf hin, dass die Wirkung eines persönlich gehaltenen An-schreibens verglichen mit einer unpersönlichen Fassung zu keinen Unterschieden bei den Rücklaufraten führe. Dagegen zeigt der Literaturüberblick von Wiseman 1976 (zitiert nach Hippler und Seidel, 1985: 41), dass persönliche Begleitschreiben recht unterschiedlich wirken können: die Ausschöpfungsraten variierten zwischen +15 % und –15 %. Linsky (1975) erklärt dieses Ergebnis damit, dass die Interview-situation für die Befragten durch die persönliche Ansprache weniger anonym erscheine, was sowohl zu einer erhöhten Teilnahmebereitschaft, aber auch zu einer erhöhten Ablehnungsquote führen könne. Unklar ist, ob in diesem Zusammenhang das Thema einer Umfrage und die von der Zielperson wahrgenommene gesell-schaftliche Relevanz eine Rolle spielen könnte.

Weiterhin wird angenommen, dass persönliche Anschreiben die Zielpersonen stär-ker binden, den Fragebogen selbst auszufüllen statt ihn von Dritten beantworten zu lassen. Dennoch konnte in einigen Studien nachgewiesen werden, dass Fragebögen stellvertretend ausgefüllt wurden. So beziffert Scott (1961: 152) den Anteil der Frage-bögen, die nicht von der Zielperson ausgefüllt wurden, auf etwa 14 %4. Reuband (1999: 91) ermittelte in einer neueren kommunalen ostdeutschen Studie einen Anteil von 2 %. Die Berechnung beruht dabei auf einem Abgleich der Angaben aus der Befragung mit denen aus der Bruttostichprobe. Für diesen Vergleich wurden die Angaben zum Geschlecht und zum Lebensalter herangezogen. Als zentralen Grund5 für die Beantwortung durch Dritte wird die Nicht-Erreichbarkeit der Zielperson vermutet (Scott 1961). Personen die stellvertretend antworten, sind nach Scott eher verheiratet, Frauen und ältere Personen (50 Jahre und älter).

4 Ermittelt wurde der Anteil durch einen Abgleich der Unterschriften auf dem Fragebogen mit

den Angaben aus der Adressliste der Bruttostichprobe.

5 Die längere Abwesenheit der angeschriebenen Person von der Wohnadresse veranlasst häufig andere Familienmitglieder, das Ausfüllen des Erhebungsbogens zu übernehmen. Eine stellver-tretende Beantwortung findet oft auch dann statt, wenn sich der Adressat (Zielperson) infolge hohen Alters und/oder körperlicher Gebrechen der gestellten Aufgabe nicht mehr gewachsen fühlt. Solche aus dem Pflichtgefühl resultierenden Gefälligkeitsaktionen sind in der Regel leicht zu identifizieren, da die Ersatzperson die Bearbeitung durch entsprechende Entschuldigungen dem Institut mitteilt.

Page 73: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

74 ZA-Information 53

Um Aussagen hinsichtlich der Repräsentativität bzw. der sozialen Zusammenset-zung einer realisierten Strichprobe treffen zu können, werden meist die sozialen Merkmale der Teilnehmer und der Nicht-Teilnehmer mit den Angaben aus der Brut-tostichprobe verglichen6. Bei Bevölkerungsstichproben ist die Anzahl der Informa-tionen bzw. Merkmale jedoch sehr begrenzt – bei Stichproben aus dem Einwoh-nermelderegister liegen in der Regel nur die Geburtsjahre der Männer und Frauen vor. Weitere Informationen über Verzerrungen einer realisierten Stichprobe ermög-licht der Vergleich der Befragtenangaben nach Rücksendedatum oder durchgeführ-ten Erinnerungen. Diese Variante löste in den 40er Jahren eine heftige Diskussion darüber aus, inwiefern über Nicht-Teilnehmer brauchbare Aussagen getroffen wer-den können bzw. auf diese extrapoliert werden kann (vgl. u. a. Ferber 1948, Ford und Zeisel 1949). Scott (1961) wandte diese Variante erstmalig bei einer allgemei-nen Bevölkerungsbefragung an und konnte über die Mahnwellen hinweg vergleich-bare Muster – wie zuvor in der Arbeit von Ferber berichtet – beobachten.

Vor diesem Hintergrund lassen sich die Nicht-Teilnehmer in postalischen Bevöl-kerungsumfragen anhand folgender Merkmale beschreiben (Mangione 1995: 61); „... less educated, or elderly, or unmarried, or male, or to have some characteristic that makes them seem less relevant to the study.” Auch die in Deutschland durchge-führten postalischen Bevölkerungsbefragungen (vgl. u. a. Hippler und Seidel 1985, Blasius und Reuband 1996, Reuband 1999, Reuband 2001), die auf großstädtischer Ebene angelegt waren, bestätigen in gewissem Umfang die oben beschriebenen Ergebnisse. Unterschätzt werden danach die jüngeren Befragten sowie der Anteil der Personen, die der unteren sozialen Schicht zugerechnet werden (gemessen nach Bildung, Einkommen und Beruf). Auch ließen sich in den genannten Untersuchungen bei einigen Themen Differenzen bezüglich des Rücklaufs beobachten. Danach nehmen diejenigen überproportional häufig an der Befragung teil, die gegenüber der Stadt eine stärkere Bindung aufweisen, eher politisch oder an gesellschaftlichen Themen interessiert sind und ihre psychosoziale Befindlichkeit eher positiv beur-teilen.

Was bedeuten nun die beschriebenen Befunde für postalische Umfragen, die mit der „Last-birthday-Auswahl“ durchgeführt werden? Der geringere Verpflichtungscha-rakter der Haushaltsschreiben bzw. die Anwendung der Geburtstagsauswahl dürfte

6 Die gesamten Angaben der Befragten können bei Bevölkerungsbefragungen nicht geprüft wer-

den. Dies hat seinen Grund darin, dass die Einwohnermeldelisten der Ämter nur wenige perso-nenbezogene Angaben enthalten: die Anschrift, das Geschlecht, das Geburtsdatum und i.d.R. die Konfessionszugehörigkeit. Anders in der medizinischen Forschung. Insbesondere bei klini-schen Studien können z. B. bei den patientenbezogenen Studien einige Angaben aus der Befra-gung mit denen aus den Patientenakten verglichen werden (vgl. Andersen et al. 1979).

Page 74: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 75

im Vergleich zu den persönlichen Anschreiben zu einer geringeren Teilnahmerate führen. In Mehrpersonenhaushalten kommt hinzu, dass die eher ambivalenten bzw. nicht kooperationsbereiten Zielpersonen eher Gelegenheit haben könnten, den Fra-gebogen an Dritte weiterzureichen – und dies vermutlich besonders dann, wenn die Mailings einsetzen. Dementsprechend müsste der Anteil der Mehrpersonenhaushalte und der formal besser Gebildeten in der Gruppe, bei der die Geburtstagsauswahl zur Anwendung kam, größer sein als in der Vergleichsgruppe. Zudem ist in Anlehnung an die Studie von Scott zu erwarten, dass Verheiratete, Frauen und Ältere (50 Jahre und älter) zumindest leicht überrepräsentiert sind. Weiterhin ist anzunehmen, dass die Selektion über die soziodemographischen Merkmale hinausgeht. Die Teilneh-mer, bei denen die Geburtstagsauswahl zur Anwendung kam, dürften daher eher mit den Personen Ähnlichkeiten aufweisen, die ohnehin ein stärkeres themenbezogenes oder auch ein allgemeingesellschaftliches Interesse zeigen.

3 Methode

Die Basis der Untersuchung bildet eine Zufallsstichprobe aus dem Einwohnermel-deregister von 1000 wahlberechtigten Düsseldorfern. Durchgeführt wurde die Erhe-bung im Frühjahr 19987. Der 12-seitige DIN-A4 Fragebogen (einschließlich der Titelseite) umfasste mit der Demographie 72 Fragen (dies entspricht 193 Statements). Die Erhebung wurde in Anlehnung an die Empfehlungen von Dillman (1978) durchgeführt8. Betitelt wurde die Untersuchung – im Anschreiben wie auch auf der Titelseite des Fragebogens – als „Umfrage zum Leben in Düsseldorf“. Sie enthielt Fragen zur Bewertung der lokalen Infrastruktur, der sozialen Beziehungen und der psychosozialen Befindlichkeiten. Um den Effekt der „Last-birthday-Methode“ zu prüfen, wurden die Adressen in zwei gleichgroße Gruppen zufällig aufgeteilt. 500 Fragebögen wurden an den Haushalt9 und 500 an die Zielperson versandt. Variatio-nen gab es lediglich im Begleitschreiben, wobei in dem Brief an den Haushalt die Anrede „Sehr geehrte Frau/sehr geehrter Herr ...“ lautete und im Text darauf hinge-wiesen wurde, dass nur diejenige Person an der Befragung teilnehmen solle, die 18 Jahre und älter sei und zuletzt Geburtstag gehabt habe.

7 Die Umfrage wurde durch die Teilnehmer des Forschungspraktikums am Sozialwissenschaftli-

chen Institut der Universität Düsseldorf realisiert. Das Projekt „Lebensqualität und Krisenerle-ben“, geleitet von Karl-Heinz Reuband, beinhaltete verschiedene Methodenexperimente.

8 marginale Modifikationen siehe Reuband (1999: 75 f.). 9 Weitere Angaben über die Haushaltsstruktur sowie die Anzahl der im Haushalt lebenden Perso-

nen und deren Geburtstage wurden vom Amt für Einwohnerwesen der Stadt Düsseldorf nicht zur Verfügung gestellt. Hilfreich wären diese Angaben, um genauere Aussagen über den Pro-zess der Zielpersonermittlung und der Einhaltung der Geburtstagsauswahl machen zu können.

Page 75: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

76 ZA-Information 53

4 Ergebnisse

4.1 Auswirkungen der Auswahl der Zielperson auf die Teilnahme und die soziale Zusammensetzung der Befragten

Anders als erwartet, konnte mittels persönlichem Begleitschreiben keine höhere Teilnahmerate erzielt werden. Nach Abzug der neutralen Ausfälle liegt die Aus-schöpfungsquote in der Gruppe mit persönlichem Begleitschreiben bei 52 %, wäh-rend sie in der Gruppe, in der die Geburtstagsauswahl angewendet wurde, 56 % be-trägt. Auch in Bezug auf die Rücklaufgeschwindigkeit – berechnet auf die ersten sieben Tage bis zur ersten Mahnung – konnte kein Effekt beobachtet werden. In beiden Gruppen belaufen sich die Teilnahmequoten (Rücklaufanteil an der Netto-stichprobe) auf 38 %. Ob der Anteil der Frauen und Männer sowie das Altersspektrum der beiden realisierten Stichproben die Bevölkerung repräsentiert, wurde mit den Angaben aus der Bruttostichprobe verglichen (siehe Tabelle 1).

Wie Tabelle 1 zu entnehmen ist, lassen sich keine systematischen Effekte durch die Auswahl der Zielperson bzgl. des Merkmals Geschlecht erkennen. Der Unterschied zwischen beiden Varianten ist marginal: In der Geburtstagsauswahlgruppe liegt der Anteil der Frauen lediglich um 2 % höher. Leichte Unterschiede ergeben sich allen-falls beim Alter. Vergleicht man die Altersverteilung der beiden Befragtengruppen mit den Angaben aus der Bruttostichprobe, sind die 18-29-Jährigen und die 65-Jährigen und Älteren leicht unterrepräsentiert. Dagegen sind die 45-64-Jährigen in beiden Gruppen überrepräsentiert, wobei dies in der Gruppe, in der die Geburts-tagsauswahl angewandt wurde, deutlicher zu beobachten ist (10 % vs. 5 %). Anders bei den 30-44-Jährigen: In der Geburtstagsauswahlgruppe ist dieser mit 4 % leicht unterrepräsentiert und in der Vergleichsgruppe dagegen mit 2 % gering überreprä-sentiert. Die Älteren sind in der vorliegenden Untersuchung in ihrer Teilnahme, und dies unabhängig von der Auswahl der Zielperson, zurückhaltender. Inwieweit die Fragebogenlänge oder das Thema der Untersuchung für die Motivation der älteren Bevölkerung eine Rolle gespielt haben, kann nicht geprüft werden.

Beim Familienstand werden Unterschiede bei den Verheirateten und den Ledigen deutlich. Der Anteil der Verheirateten ist in der Gruppe, in der die Geburtstagsauswahl durchgeführt wurde, mit 59 % deutlich größer als in der Vergleichsgruppe (50 %). Um-gekehrt verhält es sich bei den Ledigen: Ihr Anteil beträgt in der Geburtstagsaus-wahlgruppe 25 % im Gegensatz zu 31 % bei den persönlich Angeschriebenen. Teilweise ist dieser Effekt als eine Folge der unterschiedlichen Altersrekrutierung zu erklären. Weder beim Einkommen und der Konfessionszugehörigkeit noch bei der Haushaltsgröße lassen sich nennenswerte Unterschiede beobachten. Bemerkenswert

Page 76: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 77

Tabelle 1 Soziodemographische und sozioökonomische Merkmale nach Aus-

wahl der Zielperson (in %)

persönlich (n=250)

last-birthday(n=271)

Gesamt (n=521)

Brutto-stichprobe

Alter 18 bis 29 Jahre 30 bis 44 Jahre 45 bis 64 Jahre 65 Jahre und älter

13 30 35 22

14 24 40 22

13 27 38 22

16 28 30 26

Geschlecht Männer Frauen

55 45

53 47

54 46

54 46

Familienstand verheiratet ledig geschieden verwitwet

50 31 11 8

59 25 9 7

55 27 10 8

+ + + +

Haushaltsgröße 1 2 3 4 5 und mehr

26 48 10 12 4

26 46 14 10 4

26 47 12 11 4

+ + + + +

Schulabschluss bis Hauptschule Real-/Fachoberschule (Fach-)Hochschulreife

37 22 41

36 28 36

37 25 38

+ + +

Haushaltsnettoeinkommen bis 1.000,- DM 1.000,- bis 2.000,- 2.000,- bis 3.000,- 3.000,- bis 4.000,- 4.000,- bis 5.000,- 5.000,- bis 6.000,- über 6.000,-

1

13 18 21 17 9

21

2 9

20 21 19 12 17

2

11 19 21 18 10 19

+ + + + + + +

Erwerbstätigkeit ja nein

64 36

68 32

66 34

+ +

Konfession ev. rk. sonstige keine Konfession

35 38 3

24

33 42 3

22

34 40 3

23

+ + + +

Keine der Tabellen ist auf dem 5%-Niveau signifikant, + keine Information

Page 77: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

78 ZA-Information 53

und nicht zu erwarten war allerdings, dass die Anteile der Einpersonenhaushalte in beiden Gruppen mit 26 % gleich groß sind. Die geringe Verpflichtung der Haus-haltsanschreiben hätte in den Singlehaushalten zu einer geringeren Teilnahmerate führen müssen. Bezogen auf die Erwerbstätigkeit gibt es geringe Unterschiede, wo-bei die Erwerbstätigen in der Geburtstagsauswahlgruppe etwas häufiger vertreten sind (68 %) als in der Gruppe, die persönlich angeschrieben wurde (64 %).

Geringe Effekte lassen sich hinsichtlich der Schulbildung beobachten: Während der Anteil der Personen mit geringer Schulbildung (bis Hauptschulabschluss) in beiden Gruppen fast unverändert ist (37 % vs. 36 %), variiert er in den Gruppen mit höherem Schulabschluss. Der Anteil der Personen mit mittlerer Schulbildung (Real-/Fach-oberschulabschluss) ist in der Gruppe, in der die Geburtstagsauswahl zur Anwendung kam, mit sechs Prozent stärker vertreten als in der Vergleichsgruppe (22 % vs. 28 %).

Betrachtet man diese Ergebnisse, so wird deutlich, dass das persönliche Anschrei-ben die Ausschöpfungsquote nicht zu erhöhen vermag. Warum aber wird mit den weniger personalisierten Haushaltsschreiben eine höhere Teilnahmerate erzielt? Einerseits kann, die persönliche Ansprache und die damit beim Teilnehmer assozi-ierte geringere Anonymität sich tatsächlich auch mindernd auf die Teilnahme aus-wirken, andererseits könnte der Fragebogen in Mehrpersonenhaushalten von Dritten ausgefüllt worden sein. Auch wenn sich die Ausschöpfungsquoten der beiden Grup-pen (persönlich Angeschriebene und „Last-birthday-Methode“) unterscheiden, so ließen sich dennoch keine signifikanten Zusammenhänge zwischen den sozioöko-nomischen und soziodemographischen Merkmalen beobachten. Die Unterschiede betragen in der Regel wenige Prozentpunkte und lassen sich daher allenfalls als ten-denzielle Beziehungen interpretieren. Auffallend ist, dass das beschriebene Muster der Rekrutierung dem von Scott beobachteten ähnelt. Danach sind die Verheirateten (mit 9%), Frauen (mit 2 %) und die Älteren (45 Jahre und älter) mit 5 % leicht über-repräsentiert. Hinzu kommt ein etwas höherer Anteil der Erwerbstätigen mit 4 %.

4.2 Die soziale Zusammensetzung der Befragten nach Erinnerungsschreiben

Inwieweit Erinnerungsschreiben nicht nur die Teilnahmerate hinsichtlich allgemei-ner Bevölkerungsbefragungen insgesamt erhöhen, sondern auch dazu führen, dass bestimmte Personengruppen stärker in die Erhebung einbezogen werden, wurde für Deutschland bisher von Hippler und Seidel (1985), Blasius und Reuband (1996) und Reuband (1999, 2001) untersucht. Danach werden die jüngeren Personen (die 18-29-Jährigen und später die 30-44-Jährigen), die Ledigen, die schlechter Gebilde-ten und die Arbeiter durch Erinnerungsschreiben stärker in die Erhebung einbe-zogen.

Page 78: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 79

Wenn Haushaltsanschreiben eine geringere Verpflichtung bewirken, als man es per-sönlichen Anschreiben zuschreibt, so müssten die ambivalenten oder kooperations-unwilligen Zielpersonen eher in Mehrpersonenhaushalten davon Gebrauch machen, jemanden aus dem Haushalt zu bitten, den Fragebogen stellvertretend auszufüllen. Dies müsste gerade dann deutlich werden, wenn mittels Erinnerungsschreiben mehrmals um die Teilnahme gebeten wird. Daher müssten sich die Befragten, die ohne Erinnerungsschreiben teilnehmen, von denen, die erst durch Mahnungen akti-viert werden konnten, im Sozialprofil deutlich unterscheiden. Wie in Tabelle 2 ersichtlich ist, konnte diese Annahme tendenziell bestätigt werden. So bewirken Erinnerungen systematische Effekte auf die Alterszusammensetzung. In beiden Befragtengruppen antworten die Jüngeren (18-29- und 30-44-Jährigen) eher ohne Erinnerungsschreiben. Erst durch Erinnerungsschreiben werden dagegen die Älteren (45-64 und 65 und älter) deutlich häufiger zu einer Reaktion bewegt, wobei der Effekt in der Gruppe, in der die Geburtstagsauswahl angewandt wurde, stärker aus-fällt. Beim Merkmal Geschlecht lassen sich kaum Unterschiede beobachten. Allen-falls bei den Befragten, die persönlich angeschrieben wurden, nimmt der Anteil der Frauen durch Erinnerungsschreiben zu. Deutlichere Effekte können dagegen beim Familienstand beobachtet werden.

Erst durch Erinnerungen können hier die Verwitweten und Verheirateten in die Er-hebung einbezogen werden, während es in einer ostdeutschen Studie die Ledigen (Reuband 1999) waren. Dabei ist dieser Effekt in der Gruppe, in der die Geburts-tagsauswahl angewandt wurde, schwächer. Hinsichtlich der Haushaltsgröße sind in den beiden Befragtengruppen unterschiedliche Effekte zu beobachten. Einpersonen-haushalte werden nur in der persönlich angeschriebenen Befragtengruppe stärker durch Erinnerungsschreiben zur Teilnahme motiviert. Bei den Zwei-, Drei- und Vierpersonenhaushalten zeigen sich uneinheitliche Tendenzen. Dass Erinnerungs-schreiben die Teilnahme der formal schlechter Gebildeten positiv beeinflussen, ist aus der Literatur bekannt. Auch in den vorliegenden Untersuchungsergebnissen lässt sich dieser Zusammenhang beobachten. In der persönlich angeschriebenen Gruppe erhöht sich der Anteil der formal schlechter gebildeten Personen (bis Hauptschulab-schluss) von 29 % auf 41 %, und in der Gruppe, die nach der Geburtstagsauswahl teilnahm, von 32 % auf 38 %. Der Anteil derer mit mittlerer Schulbildung wird da-gegen nur in der Geburtstagsauswahlgruppe durch Erinnerungsschreiben erhöht (von 24 % auf 30 %). Bezüglich des Einkommens treten dagegen keine systemati-schen Unterschiede auf. Anders ist dies aber hinsichtlich der Erwerbstätigkeit. Der Anteil der Erwerbstätigen konnte nur in der Gruppe, die persönlich angeschrieben wurde, durch Erinnerungsschreiben erhöht werden.

Page 79: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

80 ZA-Information 53

Tabelle 2 Soziodemographische und sozioökonomische Merkmale nach Erinne-

rungen und Auswahl der Zielperson (in %)

Auswahl der Zielperson persönlich last-birthday Cramers V Pearsons’r

Erinnerungen keine (n=86)

1 - 3 (n=164)

keine (n=92)

1 - 3 (n=179)

per-sönlich

last-birthday

Alter 18 bis 29 Jahre 30 bis 44 Jahre 45 bis 64 Jahre 65 Jahre und älter

14 33 36 17

12 29 34 24

17 29 35 19

12 22 42 24

.10 .13*

Geschlecht Männer Frauen

60 40

52 48

53 47

52 48

.08 .00

Familienstand verheiratet ledig geschieden verwitwet

44 37 15 4

54 27 8

11

53 29 12 6

62 22 8 8

.19* .10

Haushaltsgröße 1 2 3 4 5 und mehr

22 53 14 7 4

29 45 8

14 4

28 46 10 11 5

26 45 16 9 4

.02 -.01

Schulabschluss .13+ .12 bis Hauptschule 29 41 32 38 Real-/Fachoberschule 24 20 24 30 (Fach-) Hochschulreife 47 39 43 32 Haushaltsnettoeinkommen bis 1.000,- DM 1.000,- bis 2.000,- 2.000,- bis 3.000,- 3.000,- bis 4.000,- 4.000,- bis 5.000,- 5.000,- bis 6.000,- über 6.000,-

1

14 17 24 16 12 27

1

13 18 20 18 12 18

5 7

19 20 18 12 19

1

10 20 21 20 12 16

.00 .00

Erwerbstätigkeit ja nein

61 39

65 35

70 30

66 34

.03 .05

Konfession ev. rk. sonstige keine Konfession

35 39 2

24

35 37 3

25

29 40 1

30

35 43 3

19

.03 .14+

+ p ≤ .10, *p ≤ .05

Page 80: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 81

Bezüglich der Konfessionszugehörigkeit lassen sich nur in der Gruppe, in der die Geburtstagsauswahl angewandt wurde, Unterschiede beobachten. Dabei wird der Anteil der konfessionell Gebundenen durch Erinnerungsschreiben unabhängig von der Zugehörigkeit der Glaubensgemeinschaft, erhöht: bei den Katholiken sind dies 3 % und bei den Protestanten immerhin 6 %. Zum Teil ist dieser Effekt als Folge der unterschiedlichen Alterszusammensetzung zu erklären. Inwiefern jedoch auch religiöse Orientierungen einen Einfluss auf die Teilnahme ausüben ist unklar, wenngleich unter-schiedliche Normvorstellungen zwischen den Konfessionslosen und den konfessionell Gebundenen in Befragungssituationen wirksam sein können (Sudman 1967).

4.3 Geburtstagsauswahl und Einstellungen, Verhalten, psychische Befindlichkeiten und gesundheitsbezogene Merkmale

Betrachtet man die soziale Zusammensetzung in den realisierten Stichproben der beiden Gruppen (Geburtstagsauswahl versus persönlich Angeschriebene), so leisten Erinnerungsschreiben einen deutlichen Beitrag zur Reduzierung von Verzerrungen. Die Differenzen betragen letztlich (siehe Tabelle 1) nur noch wenige Prozentpunkte. Aber auch Einstellungen und einzelne Themen einer Untersuchung bestimmen die Teilnahme an Umfragen und dies zum Teil unabhängig von sozialen Merkmalen. Welche Präferenz, Orientierung oder Einstellung wirksam wird, kann meist nur in Abhängigkeit der jeweiligen Untersuchung bestimmt werden. Ganz allgemein gilt jedoch, dass eine allgemeine Aufgeschlossenheit diese Personengruppe kennzeich-net. In den zuvor erwähnten kommunalen postalischen Bevölkerungsumfragen (vgl. u.a. Blasius und Reuband 1996) wurden in den Erhebungen themenbezogene Se-lektionseffekte beobachtet. Fasst man diese zusammen, so existieren zwar kommu-nalspezifische Unterschiede, dennoch kann man sagen, dass eher solche Personen an den postalischen Umfragen teilnahmen, die ihre wirtschaftliche Lage eher positiv beurteilen, eher gerne im Viertel bzw. der Gegend leben, ein stärkeres politisches Interesse haben und sich weniger ängstlich einschätzen.

Wenn, wie eingangs erwähnt, die Geburtstagsauswahl besonders diejenigen begüns-tigt die einer Teilnahme eher ambivalent gegenüberstehen und den Fragebogen inter-essierteren Haushaltsmitgliedern zur Beantwortung geben, dann sollte dies auch in den Randverteilungen zu beobachten sein. Demnach müssten sich die Befragten der Geburtstagsauswahlgruppe von denen die im Rahmen der persönlichen Anschreiben teilnahmen, zumindest durch eine allgemein interessiertere Haltung, unterscheiden. Auch kann davon ausgegangen werden, das die Differenzen abhängig vom Ausmaß der Stellvertreterbeantwortung sind, worüber in dieser Untersuchung jedoch keine Angaben gemacht werden können.

Page 81: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

82 ZA-Information 53

Tabelle 3 Einstellungen und Verhalten nach Auswahl der Zielperson (Pearsons’r

und beta Koeffizient in der Regressionsanalyse)

Mittelwerte Standardab-weichungen r beta

per-sönlich

last-birthday

per-sönlich

last-birthday

v8 Attraktivität Innenstadt 2,64 2,50 0,87 0,79 -.09 * -.09 +v14 Ausgehen in Lokal, Kino, Freunde 2,94 2,75 0,98 0,97 -.09 * -.11 *v17 subjektive wirtschaftliche Lage 2,57 2,53 0,79 0,82 -.02 -.02v47 Freunde treffen 20,0 21,6 31,6 32,6 .02 .02v55 Sorgen: Familienmitgl. arbeitslos 3,57 3,39 1,25 1,26 -.07 + -.06v65 wichtig im Leben: Arbeitsplatz 1,73 1,59 0,96 0,80 -.08 * -.08v91 fühle mich oft einsam und allein 3,13 3,19 0,91 0,81 .03 .01v95 häufig unglücklich und traurig 3,09 3,22 0,83 0,76 .08 * .07 +v97 Angst vor der Zukunft 2,77 2,83 0,91 0,87 .03 .03v104 Gesundheitszustand 2,67 2,56 0,97 0,95 -.06 + -.05v188 politisches Interesse 2,67 2,50 0,97 1,04 -.08 + -.09 +

+ p ≤ .10, *p ≤ .05, **p ≤ .01 Regressionsanalyse jeweils unter Kontrolle von Alter, Geschlecht, Bildung, Familienstand, Er-werbstätigkeit und Haushaltsgröße Frageformulierungen: v8 Wie zufrieden sind Sie in Düsseldorf mit der Gestaltung und Attraktivität der Innenstadt?

1 „sehr zufrieden“ 2 „zufrieden“ 3 „teils-teils“ 4 „unzufrieden“ 5 „überhaupt nicht zufrieden“. v14 Wie oft gehen Sie in Ihrer Freizeit in Düsseldorf aus (z. B. in ein Lokal, ins Kino oder Freun-

de besuchen)? 1 „fast jeden Tag“ 2 „mindestens einmal die Woche“ 3 „mindestens einmal im Monat“ 4 „seltener“ 5 „nie“.

v17 Wie beurteilen Sie Ihre eigene wirtschaftliche Lage? 1 „sehr gut“ 2 „gut“ 3 „teils-teils“ 4 „schlecht“ 5 „sehr schlecht“.

v47 Wie häufig im Monat treffen Sie sich mit Freunden/Freundinnen? „Ca. .... mal im Monat“ „seltener als einmal im Monat“.

Was bereitet Ihnen zur Zeit persönlich Sorgen? Was bedrückt Sie, wenn Sie an sich und Ihre Zu-kunft denken? Geben Sie bitte anhand der Skala an, wie sehr die jeweilige Aussage auf Sie zutrifft.

v55 Ich mache mir Sorgen, dass jemand aus meiner Familie arbeitslos wird/bleibt 1 „sehr stark“ 2 „stark“ 3 „mittel“ 4 „wenig“ 5 „überhaupt nicht“. Für jeden Menschen sind im Leben verschiedene Dinge wichtig: Wie wichtig ist für Sie, v65 einen gesicherten Arbeitsplatz haben 1 „sehr wichtig“ 2 „wichtig“ 3 „weniger wichtig“ 4 „unwichtig“. Wie sehr stimmen Sie den folgenden Aussagen zu? v91 Ich fühle mich oft einsam und allein v95 Ich bin häufig unglücklich und traurig v97 Ich habe Angst vor der Zukunft 1 „stimme voll und ganz zu“, 2 „stimme eher zu“,

3 „stimme eher nicht zu“, 4 „stimme überhaupt nicht zu“ v104 Nun einige Fragen zum Thema Gesundheit: Alles in allem gesehen, wie würden Sie im gro-

ßen und ganzen Ihren Gesundheitszustand beschreiben? 1 „sehr gut“ 2 „ziemlich gut“ 3 „es geht“ 4 „ziemlich schlecht“ 5 „sehr schlecht“.

v188 Wie stark interessieren Sie sich für Politik? 1 „sehr stark“ 2 „stark“ 3 „mittel“ 4 „wenig“ 5 „überhaupt nicht“.

Page 82: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 83

Wie aus dem Vergleich der Mittelwerte (siehe Tabelle 3) zu entnehmen ist, berich-ten die Personen, die nach der Geburtstagsauswahl an der Umfrage teilgenommen haben, positiver über die Attraktivität der Innenstadt, gehen häufiger in ihrer Frei-zeit aus und treffen sich häufiger mit Freunden. Die Befragten beurteilen zudem ihre eigene psychosoziale Befindlichkeit (gemessen über „Ich fühle mich oft einsam und allein“, „Ich bin häufig unglücklich und traurig“ und „Ich habe Angst vor der Zukunft“), wie auch ihre eigene gesundheitliche Lage positiver. Dagegen existieren keine Differenzen hinsichtlich der beurteilten eigenen wirtschaftlichen Lage. Ge-fragt nach der Wichtigkeit eines gesicherten Arbeitsplatzes, beurteilten die Teil-nehmer der Geburtstagsauswahl dies als wichtiger, was sich entsprechend auch in einer größeren Sorge vor einer Arbeitslosigkeit eines Familienmitgliedes äußert. Auch lässt sich, wie nicht anders erwartet, bei den Befragten nach dem Geburts-tagsauswahlverfahren ein größeres politisches Interesse beobachten. Bei den wenig bedeutsamen Unterschieden liegt die Vermutung nahe, dass diese zum Teil durch die unterschiedliche soziale Zusammensetzung der beiden Gruppen mitbedingt sind. Mittels multivariater Analysen wurden daher die Zusammenhänge unter Kontrolle von Alter, Geschlecht, Bildung, Familienstand, Erwerbstätigkeit und Haushaltsgrö-ße geprüft. Die Ergebnisse der Regressionsanalysen wurden der besseren Vergleich-barkeit wegen in Tabelle 3 neben den Korrelationskoeffizienten aufgeführt. Die adjustierten Werte (beta-Werte) verdeutlichen, dass die Effekte nur zum Teil auf die soziale Zusammensetzung der Befragten zurückgeführt werden können. Die oben beschriebenen Effekte bleiben in ihrer Richtung und meistens auch in ihrer Stärke bestehen.

5 Schlussbemerkungen

Die Auswahl der Zielperson mit der „Last-birthday-Methode“ erbringt bei postali-schen Bevölkerungsbefragungen – unter Anwendung der von Dillman empfohlenen Erinnerungsschreiben – vergleichbare Teilnahmeraten. Auch in den Randverteilun-gen der soziodemographischen und sozioökonomischen Merkmale ergeben sich im Vergleich zu der Gruppe, die persönlich angeschrieben wurde, eher geringe Unter-schiede. Hinweise auf Stellvertreterbeantwortung bzw. auf Beantwortung durch Dritte lassen sich vermuten, da vergleichbare Muster beobachtet werden konnten, wie sie Scott (1961) berichtet, so dass Verheiratete, Frauen und Ältere (50 Jahre und älter) leicht überrepräsentiert sind. Erinnerungsschreiben bewirken in beiden Be-fragtengruppen – den persönlich Angeschriebenen und der Gruppe, die ein Haus-haltsschreiben erhielt – eine Reduzierung der Verzerrungen in der sozialen Zusam-mensetzung. Der Effekt der Erinnerungsschreiben fällt jedoch bei den Teilnehmern der Geburtstagsauswahlgruppe deutlicher aus als bei denen, die persönlich ange-

Page 83: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

84 ZA-Information 53

schrieben wurden. Danach wirken sich Mailings besonders deutlich auf die alters-spezifische Zusammensetzung, die Haushaltsgröße und die Konfessionszugehörig-keit aus. Bei der bildungsspezifischen Zusammensetzung ist der Effekt durch die Erinnerungsschreiben zwar vergleichbar stark, wirkt sich jedoch unterschiedlich aus. In der „Last-birthday-Gruppe“ konnte zudem der Anteil der Realschulabsol-venten durch Erinnerungen erhöht werden. Unterschiedlich deutlich wirken sich zudem Erinnerungen auf den Familienstand aus.

Auf der Ebene von Einstellungen, Verhalten, psychosozialen und gesundheitsbezo-genen Merkmalen sowie auf der Ebene der sozialen Aktivitäten sind die Effekte der Geburtstagsauswahl auf die dargestellten Merkmale nicht sehr stark. Auch unter Kontrolle der sozialen Merkmale bleiben die beobachteten Unterschiede in den multivariaten Analysen bestehen. Folglich finden sich überproportional häufig die-jenigen im realisierten Sample der Geburtstagsauswahl wieder, die ohnehin aufge-schlossener, interessierter und als sozial aktiver gelten. Daher ist zu vermuten, dass eher in Haushalten von den Vorgaben abgewichen und der Fragebogen von Dritten beantwortet wird. Bezieht man jedoch alle untersuchungsrelevanten Merkmale in diesen Vergleich mit ein, erstaunt, dass lediglich einige wenige Merkmale signifi-kante Unterschiede aufweisen und andere lediglich in der Tendenz interpretierbar sind. Ob und inwiefern die Geburtstagsauswahl in postalischen Bevölkerungsbefra-gungen eine brauchbare Variante darstellt, hängt damit nicht zuletzt von weiteren systematischen Untersuchungen zum Kooperationsprozess in postalischen Bevölke-rungsbefragungen ab.

Literatur

Andersen, Ronald, Judith Kasper, Martin R. Frankel and Associates, 1979: Total Survey Error. San Francisco: Jossey-Bass

Binson, Diane, Jesse A. Canchola, und Joseph A. Catania, 2000: Random Selection in a National Tele-phone Survey: A Comparison of the Kish, Next-Birthday and Last-Birthday Methods, Journal of Official Statistics 16: 53 – 59

Blasius, Jörg und Karl-Heinz Reuband, 1996: Postalische Befragungen in der empirischen Sozialforschung. Ausschöpfungsquoten und Antwortqualität, Planung und Analyse 1: 35 – 41

Brosius Hans-Bernd und Wolfgang Donsbach, 1989: Resource optimisation and sample quality in tele-phone surveys, Marketing and Research Today 17: 96 – 106

Dillman, Don, 1978: Mail and telephone surveys: the total design method. New York: Wiley

Dillman, Don, 2000: Mail and Internet Surveys, New York: Wiley

Ferber, Robert, 1948: The Problem of Bias in Mail Returns: A Solution, Public Opinion Quarterly 12: 669 – 676

Ford, Robert N. und Hans Zeisel, 1949: Bias in mail surveys cannot be controlled by one mailing, Public Opinion Quarterly 13: 495 – 501

Page 84: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 85

Frey, James. H, Gerhard Kunz und Günther Lüschen, 1990: Telefonumfragen in der Sozialforschung, Wiesbaden: Westdeutscher Verlag

Groves, Robert, M. und Lars E. Lyberg, 1988: An Overview of Nonresponse Issues in Telephone Surveys, in: Robert M. Groves, Paul P. Biemer, Lars E. Lyberg, James T. Massey, William L. Nicholls II und Jo-seph Waksberg (Hg.): Telephone Survey Methodology, New York: Wiley

Harkness, Janet, Peter Mohler, Michael Schneid und Bernhard Christoph, 1998: Incentives in Two German Mail Surveys 1996/97 & 1997. S. 201 – 218, in: Koch, Achim und Rolf Porst (Hg.): Nonresponse in Survey Research, Mannheim: ZUMA-Nachrichten Spezial 4

Hippler, Hans-Jürgen und Kristiane Seidel, 1985: Schriftliche Befragung bei allgemeinen Bevölkerungs-stichproben – Untersuchungen zur Dillmanschen „Total Design Method“, ZUMA-Nachrichten 16: 39 – 56

Hüfken, Volker, 2000: Kontaktierung bei Telefonumfragen. Auswirkungen auf das Kooperations- und Antwortverhalten. S. 11 – 31. in: Hüfken, Volker (Hg.): Methoden in Telefonumfragen. Wiesbaden: West-deutscher Verlag

Kirschner, Hans-Peter, 1986: Der Stichprobenplan zum Projekt ISSP – 1985 und seine Realisierung, ZUMA-Arbeitsbericht 86/10

Linsky, Arnold S., 1975: Stimulating responses to mailed questionnaires: a review, Public Opinion Quarterly 39: 82 – 101

Lüschen, Günther, Olga Geling, Christian Janssen, Gerhard Kunz und Olaf v. d. Knesebeck, 1997: After Unification: Gender and Subjective Health Status in East and West Germany, Social Science and Medicine, Vol. 44, No. 9: 1313 – 1323

Mangione, Thomas W., 1995: Mail Surveys. Improving the Quality. Thousand Oaks: Sage

Oldendick, Robert W., George F. Bishop, Susan B. Sorenson und Alfred J. Tuchfarber, 1988: A Compari-son of the Kish and Last-Birthday Methods of Respondent Selection in Telephone Surveys, Journal of Official Statistics 4: 307 – 318

Reuband, Karl-Heinz, 1999: Postalische Befragungen in den neuen Bundesländern. Durchführungsbedin-gungen, Ausschöpfungsquoten und soziale Zusammensetzung der Befragten in einer Großstadtstudie, ZA-Informationen 45: 71 – 99

Reuband, Karl-Heinz, 2001: Möglichkeiten und Probleme des Einsatzes postalischer Befragungen, in: Kölner Zeitschrift für Soziologie und Sozialpsychologie 53: 338 – 364

Salmon, Charles T. und John Spicer Nichols, 1983: The Next-Birthday Method of Respondent Selection, Public Opinion Quarterly 47: 270 – 276

Schnell, Rainer und Frauke Kreuter, 2000: Das DEFECT-Projekt: Sampling-Errors und Nonsampling-Errors in komplexen Bevölkerungsstichproben, ZUMA-Nachrichten 47: 89 – 102

Scott Christopher, 1961: Research on Mail Surveys, Journal of Royal Statistical Society, vol. 124, Part II: 143 – 205

Statistisches Bundesamt, 2000: Datenreport 1999. Wiesbaden

Sudman, Seymour, 1967: Reducing the cost of surveys. Chicago: Aldine

Yammarino, Francis J., Steven J. Skinner und Terry L. Childers, 1991: Understanding Mail Survey Re-sponse Behavior. A Meta-Analysis, Public Opinion Quarterly 55: 613 – 639

Wiseman, Frederick, 1976: A reassessment of the effects of personalization on response patterns in mail surveys, Journal of Marketing Research 13: 110 – 111

Page 85: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

86 ZA-Information 53

Variationen der Permissivität: Wie Frageformulierungen

unterschiedliche Antwortverteilungen erbringen, wenn

von „Erlauben“ oder „Verbieten“ die Rede ist

von Karl-Heinz Reuband1

Zusammenfassung

Repliziert wird ein Frageexperiment, das in der sozialwissenschaftlichen Methoden-literatur Berühmtheit erlangt hat: dabei geht es darum, ob man öffentliche Reden gegen die Demokratie „erlauben“ oder ob man sie „verbieten“ solle. In einer eige-nen Untersuchung auf der Basis einer lokalen Face-to-face-Bevölkerungsumfrage wird nachgewiesen, dass die bisher ermittelten Unterschiede in den Antwortvertei-lungen in maßgeblicher Weise auf die fehlende Spezifikation der Antwortalternati-ven zurückgehen. Inwieweit die fehlende Spezifikation für den Befragten implizit eine bestimmte Form von Normalität bedeutet, von der abgewichen werden soll (entweder durch das Erlauben respektive Verbieten des jeweiligen Verhaltens), bedarf weiterer Klärung. Sekundär wirkt sich ebenfalls der Sprachgebrauch des „Erlaubens“ bzw. „Verbietens“ auf das Antwortmuster aus. Viele Bürger wollen offenbar bestimmte Verhaltensweisen nicht toleriert wissen, vor einem gesetzgebe-rischen Verbot schrecken sie jedoch zurück. Vermutet wird, dass unter bestimmten Umständen - in Zeiten der Moralisierung und des Rufs nach neuen Gesetzen - auch das „Verbieten“ als Antwortoption bevorzugt wird.

Abstract

A question wording experiment that has become famous in the social science meth-odology literature is replicated: whether public speeches against democracy should be “allowed” or “forbidden”. Based on a local face-to-face survey of the general population it is shown that the difference in responses to the two question wordings is largely due to the neglect of specifying the respective response alternative in the

1 Dr. Karl-Heinz Reuband ist Professor für Soziologie am Sozialwissenschaftlichen Institut der

Heinrich-Heine-Universität Düsseldorf. E-mail: [email protected]

Page 86: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 87

question. Whether hereby a certain image of legal reality is implicitly conveyed, from which one is going to deviate (either by allowing or forbidding it) deserves further study. The wording of “allow” – “forbid” itself seems to be of secondary importance for the observed response pattern. Many people are apparently not will-ing to tolerate certain forms of behaviour but however, don’t want them legally for-bidden. Under certain circumstances – in periods of moralisation and cry for new laws – it is hypothesized, however, that the answer “forbid” will be preferred as response option.

1 Einleitung

In der kriminologischen und rechtssoziologischen Forschung ebenso wie in Umfra-gen von Markt- und Meinungsforschungsinstituten kommt es des Öfteren vor, dass danach gefragt wird, ob ein bestimmtes Verhalten erlaubt sein solle oder nicht. Die Art und Weise, wie dabei die Frage formuliert wird, variiert. Mal wird gefragt, ob man das Verhalten „erlauben“ solle, und mal wird gefragt, ob es „verboten“ bleiben soll bzw. ob man es verbieten solle. Bei der Interpretation der Ergebnisse werden die Antworten auf die Fragen gewöhnlich gleichgesetzt. „Erlauben“ wird als Äqui-valent zu „nicht verbieten“ angesehen.

Diese Praxis mag auf den ersten Blick gerechtfertigt erscheinen: schließlich geht es um den gleichen Sachverhalt. Und ob man nun fragt, ob etwas (nicht) erlaubt oder verboten werden sollte, erscheint dem Sinngehalt nach als durchaus identisch. Man könnte beides für Synonyme halten. Nun gibt es jedoch aus den USA eine Untersu-chung aus dem Jahr 1940, die zu dokumentieren scheint, dass es sehr wohl darauf ankommen kann, ob man die Begriffe „erlauben“ oder „verbieten“ benutzt. Das eine Mal wurde gefragt, ob man öffentliche Reden („public speeches“) gegen die Demo-kratie erlauben solle, das andere Mal, ob man sie verbieten solle. Bei der ersten Formulierung plädierten 21 % für das Erlauben und 62 % verneinten es (der Rest war in dieser Frage unentschieden). Bei der zweiten Formulierung, bei der statt von „erlauben“ von „verbieten“ die Rede war, plädierten hingegen weitaus mehr Befrag-te – nämlich 39 % – für das Nicht-Verbieten und nur noch 46 % für das Verbieten (Rugg 1941).

Der beschriebene Befund hat sich, was das Muster der Beantwortung angeht, als unabhängig von Zeit und Raum erwiesen. So wurde das Frageexperiment in den 70er Jahren in den USA wiederholt und führte zu identischen Resultaten (Schuman und Presser 1981). Zu gleichen Ergebnissen kamen Replikationsuntersuchungen in anderen Ländern, darunter auch in der Bundesrepublik Deutschland (vgl. Hippler und Schwarz 1986, Waterplas et al. 1988, Glendall und Hoek 1990, Loosveldt

Page 87: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

88 ZA-Information 53

1997, Holleman 2000). Inzwischen stellt die Frage des „Erlaubens/Verbietens“ wohl das berühmteste und am häufigsten in der sozialwissenschaftlichen Methoden-literatur zitierte Beispiel für die Relevanz unterschiedlicher Begrifflichkeiten dar. In nahezu keinem Lehrbuch zu Methodenfragen und fast keiner Abhandlung über die Bedeutung von Frageformulierungen vergisst man, es zu erwähnen.2 Es gilt als be-sonders eindrucksvoller Beleg dafür, wie sehr geringe Veränderungen in den For-mulierungen zum gleichen Sachverhalt große Effekte auf der Ebene der Antwort-muster nach sich ziehen können.

Nun sind in letzter Zeit jedoch Zweifel aufgetaucht, ob das vielzitierte Beispiel in der Vergangenheit überhaupt korrekt interpretiert wurde. Es gibt nämlich seit langem eine Standardregel bei der Formulierung von Fragen, die verletzt wird. Und diese lautet: man sollte die Alternativen in den Fragen explizit ausformulieren (vgl. z.B. Cantril 1947: 35, Sudman und Bradburn 1982: 139, Noelle-Neumann und Petersen 2000: 194 ff.). Nur in dem Moment, wo man sicher sein kann, dass die Befragten über auskristallisierte Einstellungen zum Thema verfügen, wäre denkbar, dass das Fehlen der Alternativen keinen Effekt auf das Antwortmuster ausübt (so schon Rugg und Cantril 1965: 96). Dementsprechend stellt sich die Frage, ob die in der Literatur beschriebenen Unterschiede in den Antwortverteilungen nicht primär als Folge eines solchen Regelverstoßes anzusehen sind (Reuband 2001: 46).

Um dies zu klären, haben wir in einer lokalen Studie – in Düsseldorf und Umge-bung – die ursprüngliche US-Frageformulierung unter Verwendung der Begrifflich-keit „öffentliche Reden gegen die Demokratie“3 repliziert und sie um zwei – früher

2 So stellt diese Frage auch heute noch das Paradebeispiel dar, das immer wieder zitiert wird, um

die Bedeutung von Fragenformulierungen zu illustrieren (oftmals als einziges, weil besonders eindrucksvolles Beispiel). Siehe z.B. den Beitrag von Howard Schuman in seinem für die Öf-fentlichkeit gedachten, aber im Kontext des inter-universitär ausgerichteten „Survey Methods Program“ entstandenen Beitrags „Sense and Nonsense about Surveys“ (www.umich.edu/new-sinf/Releases/2002/Jul02; News Service, University of Michigan). Die große Bedeutung, die dieser Fragenformulierung in der Umfrageforschung eingeräumt wird, zeigt sich auch daran, dass dieser Frage in der von Sam Best und Benjamin Radcliff herausgegebenen Enzyklopädie „Polling America: An Encyclopedia of Public Opinion“ (erscheint demnächst bei Greenwood Press, 2004) ein eigener Beitrag gewidmet sein wird.

3 In der amerikanischen Fassung heißt es „public speeches against democracy“, was u.E. am sinnvollsten mit „öffentliche Reden gegen die Demokratie“ zu übersetzen ist (so auch Fried-richs 1993: 198). Andreas Diekmann zitiert hingegen die Frage in einer Übersetzung von Wal-ter Krämer, in der von „öffentlichen Angriffen auf die Demokratie“ die Rede ist (Diekmann 1995: 393). Dies scheint uns angesichts der Verhaltenskomponente im Begriff „Angriff“ nicht gerechtfertigt. Ebenfalls unbefriedigend erscheint uns die Übersetzung in dem Lehrbuch von E-lisabeth Noelle-Neumann und Thomas Petersen, wo von „öffentlichen Äußerungen gegen die Demokratie“ die Rede ist (2000: 197). Äußerungen haben zu sehr den Charakter des Beiläufi-gen. Sie müssen nicht Bestandteil einer Rede sein, die eine Kritik an der Demokratie zum Hauptthema hat. Sie können auch Bestandteil von Reden zu anderen Themen sein.

Page 88: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 89

schon bei einer anderen Thematik eingesetzte (Reuband 2001) – Varianten ergänzt: es handelt sich um Formulierungen, bei denen die Antwortalternativen gemäß Lehr-buchregeln explizit ausformuliert sind (hier in der Form „erlauben oder nicht erlau-ben“ sowie „erlauben oder verbieten“). Als wichtigstes Ergebnis der Analyse zeigte sich, dass der in der Vergangenheit beobachtete Frageeffekt in der Tat zu einem erheblichen Anteil auf das Fehlen expliziter Alternativen zurückgeht und eher sekundär als Folge der verwendeten Begrifflichkeiten anzusehen ist. Wo lediglich der Begriff des „Verbietens“ angeboten wurde, wählten mehr Befragte die implizite Option des „Erlaubens“ als in dem Fall, bei dem die Alternative ausformuliert war. Zugleich aber auch wurde deutlich, dass bei Vorgabe der beiden Alternativen die Einführung des Begriffes „Verbieten“ anstelle des „Nicht-Erlaubens“ zu einem Rückgang des Anteils führte, der sich für das „Erlauben“ aussprach (Reuband 2003).

2 Zielsetzung und methodisches Vorgehen

In der folgenden Untersuchung wollen wir das ursprüngliche US-Frageexperiment einer weiteren Prüfung unterziehen, es durch Fragen mit Antwortalternativen wie in unserer Replikation erweitern und darüber hinaus eine weitere, bisher nicht getestete Kombination der Antwortkategorien „erlauben“/„verbieten“ einbeziehen: nämlich die Formulierung „verbieten oder nicht verbieten“. Damit sind alle denkbaren Kombinationsmöglichkeiten der Antwortkategorien erfasst und gehen in die Über-prüfung ein. Grundlage der Untersuchung ist eine Befragung der erwachsenen Bevölkerung 18 Jahre und älter in Düsseldorf und Umgebung. Die Erhebung fand im Sommer 2003 statt. Befragt wurden 552 Personen.4

Die Auswahl der Befragten erfolgte auf der Basis einer Quotenstichprobe mit einfa-cher – nicht kombinierter – Quotierung. Als Quotenmerkmale waren vorgegeben: Geschlecht, Alter (18-29, 30-44, 45-59, 60+) sowie Bildung (möglichst nicht mehr als einer der fünf zu befragenden Personen sollte über Abitur verfügen). Den Inter-viewern – Studenten der Sozialwissenschaften – wurde von vornherein die Mög-lichkeit eingeräumt, die Befragung auch im Verwandten- und Bekanntenkreis durchzuführen. In dieser Weise sollten auch die Personen einbezogen werden, die sich normalerweise nicht an Umfragen beteiligen, sich aber aus einem Gefühl der sozialen Verpflichtung heraus dann doch dazu bereit finden. Von wenigen Ausnahmen abgesehen führte jeder Interviewer fünf Interviews auf der Basis aller fünf Splitversi-

4 Die Untersuchung ist Bestandteil eines von der VW-Stiftung geförderten Projekts des Verfas-

sers zur lokalen Drogenpolitik im Förderschwerpunkt Recht und Verhalten (AZ II/76571). Die vorliegende Teiluntersuchung dient allein methodischen Zwecken. Es geht um die Prüfung von Effekten, die aus Frageformulierungen erwachsen.

Page 89: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

90 ZA-Information 53

onen des Fragebogens durch. 5 Über die möglichen Auswirkungen der im Fragebo-gen eingebrachten unterschiedlichen Formulierungen wurden die Studenten vor der Durchführung der Interviews nicht informiert, um mögliche Beantwortungstenden-zen aufgrund von Erwartungshaltungen (vgl. u.a. Hyman et al. 1954, Bauske 1984) zu vermeiden.

Die Befragung erfolgte – wie in der amerikanischen Originaluntersuchung – face-to-face, die entsprechenden Fragen wurden vorgelesen. Wo lediglich eine der Ant-wortvarianten explizit genannt wurde („erlauben“ respektive “verbieten“), bedeutete die Bejahung – je nach Frage – eine Bejahung des Erlaubens respektive des Verbie-tens. Die Verneinung wurde analog als Ablehnung gedeutet. Nur in dem Fall, wo explizit eine Antwort gegeben wurde, die nicht in den vorgelesenen Antwortrahmen paßte – sei es durch Nennung sonstiger Alternativen oder die Antwort „weiß nicht“ bzw. „unentschieden“ – wurde vom Interviewer die für ihn verfügbare (aber dem Befragten nicht vorgelesene) Antwortoption „Sonstiges“ angekreuzt.6

Die Kategorie „Sonstiges“ ersetzt die in der Originaluntersuchung und in unserer früheren Replikation verwendete Kategorie „Weiß nicht, keine Angabe“. Die Ent-scheidung für diese Modifikation erwuchs aus dem Bemühen heraus, auch Nennun-gen, die substantielle Aussagen beinhalten und nicht in das bisher übliche Antwort-schema passen, mittels entsprechender Antwortkategorien eigens auszuweisen. Die-jenigen Befragten, die sich unentschieden oder ambivalent geben und keine Antwort

5 Einige Interviewer führten freiwillig mehr als 5 Interviews durch. Aufgrund dessen ist die Zahl

der Interviews höher als es einer Berechnung auf der Basis des Faktors 5 entspricht. Im Fall der Splitversion 1 liegt die Zahl der Befragten etwas höher als in den anderen Versionen, weil an zwei Interviewer, die nach Abschluss der Ausgabe der Fragebögen noch Exemplare erhielten, lediglich diese Version ausgegeben wurde. Für die Befragten und ihre Antworten hat dies je-doch keine Konsequenzen, wir belassen daher diese Interviews im Gesamtpool der Befragten. Hinweise dafür, dass sich die Befragten der Splitversion in der sozialen Zusammensetzung nen-nenswert unterscheiden, gibt es nicht. Es findet sich allenfalls eine – statistisch nicht signifikan-te – Tendenz, derzufolge in der ersten Version jüngere Befragte etwas stärker vertreten sind als in den übrigen Versionen. Insgesamt setzen sich die Befragten wie folgt zusammen: jeweils 50 % Männer und Frauen; 19 % 18-29 Jahre, 25 % 30-44, 27 % 45-59, 30 % 60 Jahre und älter; 13 % Hauptschule als höchsten allgemeinbildenden Schulabschluss, 27 % Realschule, 13% Fachhoch-schulreife, 28% Abitur, 3% Sonstigen Abschluss. 55 % der Befragten gehören zum Familien-, Verwandten-, Kollegenkreis oder sind Nachbarn. 36 % sind Fremde und 6 % wurden über Ver-wandte oder Freunde/Bekannte rekrutiert. 3 % gehören zur Kategorie „sonstige Personen“. Die Fremden wurden mehrheitlich im öffentlichen Raum – auf der Straße, in Parks oder in Lokalen – befragt, nur 3% in einer Wohnung.,

6 Die entsprechenden Kategorien im Fragebogen lauteten „Ja, erlauben – Nein – Sonstiges, was?“ bzw. „Ja, verbieten – Nein – Sonstiges, was?“. In den anderen Fällen, bei denen die Alternati-ven ausformuliert wurden, waren die Antwortkategorien den geäußerten Antwortalternativen gemäß benannt.

Page 90: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 91

geben wollen, können sich unter diesen Bedingungen auch weiterhin in dieser Weise äußern, nur werden sie nun unter die Kategorie „Sonstiges“ gefasst.7

3 Ergebnisse

Wie man der Tabelle entnehmen kann, spricht sich in jeder Splitversion eine Mehr-heit der Befragten (zwischen 54 % und 70 %) für das Erlauben von öffentlichen Re-den gegen die Demokratie aus. Eine Minderheit (zwischen 26 % und 41 %) wendet sich dagegen. Und zwischen 3 % und 6 % machen sonstige Angaben (einschl. Weiß nicht, Unentschieden, Keine Angabe). In der Frage der dominierenden Antwort-muster werden die Ergebnisse unserer Vorgängerstudie, die ein Jahr zuvor stattfand, damit repliziert: auch hier fand sich eine mehrheitliche Entscheidung für das Erlau-ben öffentlicher Reden gegen die Demokratie. Und auch hier fanden sich erhebliche Variationen im Prozentsatz des Erlaubens bis hin zu Werten von 72 %. Nur die Un-tergrenze lag damals mit einem Wert von 41 % niedriger als in der vorliegenden Studie. In der Splitversion, in der lediglich von „erlauben“ die Rede war, errangen dadurch die Gegner des Erlaubens eine relative Mehrheit (Reuband 2003).

Nicht repliziert werden in unserer Untersuchung die Befunde zum Anteil derer, die sich für die dritte, nicht explizite Antwortoption entscheiden („Sonstiges“ bzw. „Weiß nicht, keine Angabe“). In der vorliegenden Erhebung, in der die Kategorie „Sonstiges“ verwendet wurde, sind sie mit einem Durchschnittswert um 4 % vertre-ten, in der Vorgängeruntersuchung, bei der die Kategorie „Weiß nicht, keine Anga-be“ eingesetzt war, handelte es sich um einen Wert um 15 %. Der Grund für den niedrigeren Wert in der vorliegenden Erhebung dürfte wohl in der Verwendung einer für den Interviewer anders formulierten Restkategorie liegen. Offenbar zögern die Interviewer, Personen, die sich undezidiert äußern, der Restkategorie „Sonsti-ges“ zuzuordnen.

7 Insgesamt erscheint uns die Kategorie „Sonstiges, was?“ auch noch deswegen brauchbarer zu

sein als die Kategorie „Weiß nicht, keine Angaben“, weil der Befragte stärker dazu ermuntert wird, sich inhaltlich zu äußern. Im anderen Fall besteht die Gefahr, dass der Interviewer vor-schnell eine vorgetäuschte Meinungslosigkeit akzeptiert. Unklar ist, in welchem Umfang die Wahl einer anderen Benennung für das gleiche Antwortverhalten für die Antwortverteilung Konsequenzen hat. Dass es Konsequenzen gibt, ist wahrscheinlich: Interviewer neigen gewöhn-lich dazu, diejenigen Antworten als legitim anzusehen, die in den Kategorien des Fragebogens eine Entsprechung finden. Demgemäß wird von ihnen nachgefragt, wenn die Kategorie „Weiß nicht/ keine Angabe“ nicht vorgegeben ist und der Befragte sich unentschieden äußert. Die Be-fragten werden dadurch in gewissem Maße auf eine inhaltliche Antwort hin gedrängt (vgl. Reu-band 1990). Demgemäß wäre bei Vorgabe der Kategorie „Weiß nicht/ keine Angabe“ im Fra-gebogen ein höherer Anteil von Personen zu erwarten, die sich nicht für eine der beiden explizit vorgegebenen inhaltlichen Antwortkategorien entscheiden.

Page 91: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

92 ZA-Information 53

Tabelle Einstellung zum Verbot von Reden gegen die Demokratie nach Frage-

formulierung (in %)

Erlauben

(1)

Verbieten

(2)

Erlauben vs. nicht erlauben

(3)

Erlauben vs. Verbieten

(4)

Verbieten vs. nicht verbieten

(5)

Erlauben/ nicht verbieten 59 70 56 54 65

Nicht erlauben/ verbieten 38 26 39 41 30

Sonstiges 3 4 5 5 5

100 100 100 100 100

(N=) (120) (108) (106) (108) (109)

Frageformulierung: „Sollte man öffentliche Reden gegen die Demokratie (1) ... erlauben (2) ... verbieten (3) ... erlauben oder nicht erlauben (4) ... erlauben oder verbieten (5) ... verbieten oder nicht verbieten?“

Womöglich geht auch der zuvor beschriebene Effekt der Splitversion, in der ledig-lich von „erlauben“ die Rede war und bei der die Meinungsverhältnisse zwischen unseren älteren Untersuchungen und unserer neuesten so sehr differierten (mal eine Mehrheit für „Erlauben“, mal eine Minderheit), auf die unterschiedliche Ausformu-lierung der Restkategorie zurück: ein Teil der „Unentschiedenen“ könnte sich unter dem Eindruck, sich inhaltlich äußern zu müssen, der Kategorie „Nicht-Erlauben“ angeschlossen haben. Inwieweit ebenfalls zeitspezifische Ereignisse eine Rolle ge-spielt haben - in die Zeit der ersten Erhebung fällt eine steigende Beunruhigung über Rechtsextremismus und Fremdenfeindlichkeit (siehe dazu Reuband 2002) – muss an dieser Stelle offen bleiben.

Die Unterschiede im Anteil derer, die sich für die Antwortoption „Erlauben“ (bzw. „Nicht-Erlauben“) aussprechen, sind je nach Splitversionen erheblich. Wie man der Tabelleentnehmen kann, macht es – wie schon in der Originaluntersuchung – einen erheblichen Unterschied, ob man lediglich von „erlauben“ oder lediglich von „ver-bieten“ spricht (Spalte 1 und 2 der Tabelle): mal sind es 59 %, das andere Mal 70 %, die für ein Erlauben plädieren. Anders als in der Literatur über die Effekte einseitig formulierter Antworten behauptet und empirisch auch belegt (siehe z.B. Cantril 1947: 36, Noelle-Neumann und Petersen 2000: 195), ist es jedoch nicht die einsei-tig vorgegebene Antwortoption, die begünstigt wird. Sonst hätte man im Fall der einseitigen Vorgabe des Begriffes „verbieten“ im Vergleich zur einseitigen Vorgabe des „Erlaubens“ einen erhöhten Anteil von Personen finden müssen, die sich für das

Page 92: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 93

Nichterlauben/Verbieten aussprechen. Das Gegenteil ist der Fall: Die nicht explizite Antwortalternative des Erlaubens wird verstärkt gewählt.

Expliziert man die jeweiligen Alternativen (Sp. 3 und 4), so sinken die Werte für das „Erlauben“ im Vergleich zur Originalfassung des „Verbietens“ erheblich ab8 – egal, ob man die Alternativen als „erlauben oder nicht erlauben“ oder als „erlauben oder verbieten“ formuliert. Die Werte der beiden Fassungen liegen dann für die Ka-tegorie des „Erlaubens“ zwischen 54 % und 56 % statt bei 70 %. Im Gegensatz zu unseren früheren Untersuchungen (Reuband 2001, 2003) bedingt in diesem Fall die bloße Einführung des Begriffs „verbieten“ (Sp. 4 im Vergleich zu Sp. 3) noch keine Verschiebung hin zu einem vermehrten Plädoyer für das „Erlauben“. Inwieweit da-für zum Teil die andersgearteten Antwortverteilungen in der Kategorie „Sonstiges“ respektive „Weiß nicht, keine Angabe“, die spezifische Wahl des Themas, eine Kombination von beiden oder andere Gründe verantwortlich sind, muss offen bleiben.

Eine Verschiebung hin zur Option des Erlaubens – analog wie beim Vergleich der ursprünglichen, einseitigen Formulierungen – zeigt sich in unserer Untersuchung in der Fassung mit ausformulierten Alternativen erst, wenn man die Variante „verbie-ten oder nicht verbieten“ mit der Variante „erlauben oder verbieten“ kontrastiert (Sp. 5 vs. 4). Offenbar bringt die besondere Betonung der Verbots-Dimension (durch doppelte Verwendung des Begriffs „verbieten“) eine zusätzliche Verschär-fung in das Sprachverständnis hinein und führt dazu, dass die Befragten vor der Be-jahung eines Verbots zurückschrecken.

Bemerkenswert ist, dass die Explizierung der Alternative des Nicht-Erlaubens bzw. Verbietens – unter Beibehaltung des Begriffes „Erlauben“ in der Frageformulierung – im Vergleich zur ursprünglichen, einseitig formulierten Fassung des „Erlaubens (Sp. 3 und 4 vs. Sp. 1) noch keine nennenswerte Verschiebung im Antwortmuster herbeiführt. Der eigentliche Kontrast tritt erst auf, wenn man die einseitig formulier-te Frage des „Verbietens“ (Sp. 2) zum Ausgangspunkt des Vergleichs macht. Be-deutet dies womöglich, dass die einseitig formulierte Frage des „Verbietens“ impli-zit dem Befragten den Eindruck vermittelt, es gehe darum, etwas bisher Erlaubtes unter Strafe zu stellen? Und bedeutet dies im Fall der ausformulierten Alternativen, etwas ungeachtet der bisherigen Praxis zur Disposition zu stellen?

8 Cramers V liegt bei Zugrundelegung der Splitversionen 1 und 2 bei .12. Dieser Wert erreicht,

mitbedingt durch eine relativ geringe Fallzahl, keine statistische Signifikanz, ist von der Ten-denz her jedoch konsistent mit den zuvor von uns durchgeführten Experimenten, so dass wir den Effekt nicht als Zufallsergebnis abtun können.

Page 93: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

94 ZA-Information 53

Diese Möglichkeit der Interpretation ist keineswegs ausgeschlossen und bedarf wei-terer Klärung. So könnte man argumentieren, dass durch die einseitig formulierte Frage nach dem „Erlauben“ implizit unterstellt und dem Befragten vermittelt wird, Reden gegen die Demokratie seien verboten. Und im Fall der Frage nach dem „Verbieten“ wäre unterstellt, das Verhalten sei erlaubt. In beiden Fällen ginge es dann jeweils um eine Änderung der Verhältnisse. Fragen, in denen die Alternativen von vornherein ausformuliert sind, haben demgegenüber vermutlich mehr den Cha-rakter einer generellen – von der aktuellen Realität losgelösten – Entscheidung zwi-schen prinzipiell denkbaren Handlungsmöglichkeiten.

Welche Kenntnisse und Vorstellungen die Befragten von der gegenwärtigen Geset-zeslage haben und wie sehr dies auf die Interpretation der Fragen abfärbt und das Antwortmuster mitbedingt, ist ungewiss. Je weniger Kenntnisse bestehen und je mehr sich die Befragten in der Frage der Gesetzeslage nicht sicher sind, desto eher dürften sich die unterschiedlichen Formulierungen auswirken. Der Befund von Hippler und Schwarz (1986), demzufolge besonders die Befragten mit weniger de-zidierten und eher unsicheren Einstellungen von den Effekten unterschiedlicher Frageformulierungen betroffen wurden, könnte ein Hinweis für die Richtigkeit die-ser Annahme sein. Möglicherweise liegt in der unterschiedlichen Kenntnis- und Gesetzeslage auch der Grund, warum anderen Untersuchungen zufolge (vgl. Schu-man und Presser 1981, Holleman 1999, 2000) die Frageeffekte themenspezifisch unterschiedlich stark ausfallen.

4 Schlussbemerkungen

Was bleibt als Fazit? Die bisherige Interpretation in der Methodenliteratur, derzu-folge die unterschiedliche Begriffsverwendung dafür verantwortlich ist, dass auf die Frage nach dem „Erlauben“ bzw. „Verbieten“ von Verhaltensweisen unterschied-lich geantwortet wird, erweist sich als zu einfach. Der wichtigste Grund dafür liegt – zumindest im dem hier diskutierten Standardbeispiel – darin, dass die Antwortal-ternativen nicht ausformuliert sind. Inwieweit erst durch die Vorgabe der Antwort-alternativen die Frage zu einer Frage nach generellen Handlungsoptionen wird (während die einseitige Ausformulierung womöglich dem Befragten lediglich eine Abweichung von der gegenwärtigen Gesetzeslage signalisiert), muss offen bleiben.

Sekundär übt zweifellos auch die spezifische Begriffsverwendung einen – wenn auch schwachen – Effekt aus: sobald der Begriff des „Verbietens“ eingeführt und besonders hervorgehoben wird, steigt der Anteil derer, die sich für ein Erlauben aussprechen. Vermutlich liegt der wichtigste Grund dafür darin, dass der Begriff des „Nicht-Erlaubens“ für den Befragten eher informelle Normen, der des „Verbietens“

Page 94: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 95

hingegen eher gesetzgeberische Maßnahmen beinhaltet. Viele Bürger, so scheint es, wollen bestimmte Verhaltensweisen nicht toleriert wissen, vor einem gesetzgeberischen Verbot schrecken sie jedoch zurück.

Diese Haltung muss nun freilich nicht generell für alle Formen des Verhaltens und zu allen Zeiten gelten. So ist es denkbar, dass in Zeiten der Moralisierung, in der Verbote als Mittel der Abschreckung geradezu propagiert werden, die gesetzgeberische Variante des „Verbietens“ eher bekräftigt wird. Dem Begriff des „Verbietens“ käme dann gewissermaßen die Funktion eines Schlüsselbegriffs in der Moralisierungs-Kampagne zu. Aus dieser Perspektive ist unter Umständen auch der Befund einer deutsch-amerikanischen Vergleichsuntersuchung unter Studenten aus dem Jahr 1986 zu deuten, der zeigt, dass bei der Anwendung der Originalformulierung von Daniel Rugg auf die Thematik des Rauchens an öffentlichen Orten bei der Vorgabe der Fragefassung „Verbieten“ die Antwortoption des „Verbietens“ und nicht die das „Erlaubens“ in den USA überproportional bevorzugt wurde (vgl. Bishop et al. 1988: 235 f.).

Der amerikanische Befund steht damit im Widerspruch zu den Erwartungen und Traditionen der bisherigen Forschung (was die Autoren verwirrt und sie nicht zu deuten wissen). Der deutsche Befund hingegen stimmt mit den Erwartungen über-ein. Der Schlüssel zu dem beschriebenen Phänomen könnte in der spezifischen kul-turellen Konstellation zum Zeitpunkt der Erhebung liegen. Anders als in der Bun-desrepublik (wo sich entsprechende gesetzgeberische Initiativen erst seit kurzem zeigen) war in den USA zum Zeitpunkt der Erhebung die Diskussion um Gesetze gegen das Rauchen an öffentlichen Orten längst entflammt, waren Initiativen gegen das Rauchen teilweise schon implementiert und weitere Maßnahmen geplant (vgl. Warner 1981, Troyer 1984). Die Anti-Raucher-Bewegung hatte den Charakter einer Prohibitionsbewegung angenommen, nicht unähnlich der Anti-Alkohol-Bewegung zu Beginn des Jahrhunderts. Das Rauchen wurde zunehmend moralisiert und der Raucher zum Abweichler von der gesellschaftlichen Norm deklariert.

Dass der landesspezifische Effekt in dieser deutsch-amerikanischen Vergleichsun-tersuchung in der schriftlichen Befragung stärker ausgeprägt war als in der telefoni-schen Befragungsform, macht zugleich deutlich, dass das Antwortverhalten in die-sem Fall nicht als Resultat einer kurzfristigen, wenig überlegten Reaktion der Be-fragten auf die vorgegebene Frage verstanden werden kann. Denn bei schriftlichen Befragungen haben die Befragten in der Regel mehr Zeit, über die Frage nachzu-denken, als in Telefonumfragen. Aus dieser Sicht ist der beobachtete kulturelle Ein-flussfaktor, der beide Länder voneinander unterscheidet, in seiner Bedeutsamkeit für das Antwortverhalten um so höher anzusetzen.

Page 95: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

96 ZA-Information 53

Literatur:

Bauske, F., 1984: Einstellungen und Erwartungen des Interviewers. Eine experimentelle Untersuchung über interpersonelle Beeinflussung im Interview, in: H. Meulemann und K.-H. Reuband, Hrsg.: Soziale Realität im Interview. Empirische Analysen methodischer Probleme. Frankfurt/Main: Campus Verlag, S. 95-115 Bishop, G.F., H.J. Hippler, N. Schwarz und F. Strack, 1988: A comparison of response effects in self-administered and telephone surveys, in: R.M. Groves, P.P. Biemer, L.E., Lyberg, J.T. Massey, W.L. Ni-cholls II und J. Waksberg, Hrsg., Telephone survey methodology. New York: J. Wiley & Sons, S. 321-340 Cantril, H., 1947: Gauging public opinion. Princeton: Princeton University Press Diekmann, A., 1995: Empirische Sozialforschung. Grundlagen, Methoden, Anwendungen. Reinbek bei Hamburg: Rowohlt Friedrichs, J., 1973: Methoden der empirische Sozialforschung. Reinbek bei Hamburg: Rowohlt

Glendall, P. und J. Hoek, 1990: A question of wording, in: Marketing Bulletin, 1, S. 25-36 Hyman H.H. mit W.J. Cobb, J.J. Feldman, C.W. Hart und Ch. H. Stember, 1954: Interviewing in social research. Chicago und London: The University of Chicago Press Hippler, H.J. und N. Schwarz, 1986: Not forbidding isn’t allowing: the cognitive basis of the forbid – allow asymmetry, in: Public Opinion Quarterly, 50, S. 87-96 Holleman, B., 1999: Wording effects in survey research. Using meta analysis to explain for forbid-allow asymmetry, in: Journal of Quantitative Linguistics, 6, S. 29-40 Holleman, B., 2000: The forbid/allow asymmetry. On the cognitive mechanism underlying wording effects in surveys. Amsterdam-Atlanta: Radopi Loosveldt, G., 1997: Interaction characteristics in some question wording experiments, in: Bulletin de Méthodologie Sociologique (BMS), 56, S. 20-31

Noelle-Neumann, E. und T. Petersen, 2000: Alle, nicht jeder. Einführung in die Methoden der Demoskopie. 3. Auflage, Berlin: Springer Verlag

Reuband, K.-H., 1990: Meinungslosigkeit im Interview. Erscheinungsformen und Folgen unterschiedlicher Befragungsstrategien, in: Zeitschrift für Soziologie, 19, S. 428-443

Reuband, K.-H., 2001: „Erlauben“ vs. „nicht-erlauben“ oder „verbieten“? Wie sich unterschiedliche Frage-Alternativen auf das Antwortverhalten auswirken, in: ZA-Information 48, S. 42-55

Reuband, K.-H., 2002: Frageformen, themenspezifische Sensibilitäten und Antwortmuster. Wie Fragen in Statementform und Fragen mit dichotomen Antwortvorgaben Antwortverteilungen beeinflussen, in: ZA- Information 51, S. 82-99

Reuband, K.-H., 2003: The „allow-forbid“ asymmetry. A new look at an old problem, in: Bulletin de Méthodologie Sociologique (BMS) (im Druck)

Rugg, D., 1941: Experiments in wording questions, in: Public Opinion Quarterly, 5, S. 91-92

Rugg, D. und H. Cantril, 1965: Die Formulierung von Fragen, in: R. König, Hrsg., Das Interview. Formen-Technik-Auswertung. Köln und Berlin: Kiepenheuer und Witsch, S. 86-114

Schuman, H. und Presser, S., 1981: Questions and answers in attitude surveys. Experiments in question form, wording and context. New York: Academic Press

Sudman, S. und N. Bradburn, 1982: Asking questions. A practical guide to questionnaire design. San Francisco: Jossey-Bass Troyer, R.J., 1984: From prohibition to regulation: comparing two antismoking movements, in: Research in Social Movements, Conflict and Change, 7, S. 53-69

Warner, K.E., 1981: State legislation and health: a comparison of two policies, in: Policy Sciences, 13, S. 139-152

Waterplas, L., J. Billiet und G. Loosveldt, 1988: De verbieden versus niet toelaten asymmetrie. Een stabiele formuleringseffect in survey-onderzoek?, in: Mens en Maatschappij, 63, S. 399-417

Page 96: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 97

Dimensionalisierung, Gruppenbildung und Wahrschein-

lichkeitsübergang. Zur Identifizier- und Interpretier-

barkeit multivariater Beziehungen zwischen Milieu,

Beruf und Weiterbildung an SOEP-Daten

von Klaus Harney, Markus Weischet und Christoph Fuhrmann1

Zusammenfassung

Der Artikel behandelt Fragen der Milieu- und Bildungsbeteiligungsforschung pri-mär unter methodischen Gesichtspunkten der Auswertung aus verschiedenen Erhe-bungen des SOEP (Erhebungen 1994 und 1999). Im Zentrum steht die Frage, in welcher Weise Milieuzugehörigkeit und Weiterbildungsbeteiligung aufeinander be-zogen werden können. Die Rekonstruktion des Zusammenhangs erfolgt auf der Grundlage multivariater Verfahren der Objekt- und Variablenklassifikation. Ge-zeigt wird, dass mittels einer gezielten, auf die Analyse von Milieus zugeschnittenen Kombination solcher Verfahren die Unterscheidung milieuspezifischer von milieu-unspezifischen Bestimmungsfaktoren der Weiterbildungsbeteiligung gelingen kann. Auf diese Weise ist es möglich, eine inhaltliche und methodische Schwäche der bil-dungsbezogenen Milieuforschung sichtbar zu machen: Nicht nur die innere Unter-scheidbarkeit von Milieus, sondern auch die Unterscheidung von Milieu und Nicht-Milieu ist eine für die Einschätzung von Milieus als unabhängige Variable inhalt-lich und methodisch erforderliche Operation.

Abstract

The article deals with issues from milieu research and research on participation in education, primarily looking at methodological aspects in the analysis of various surveys from the SOEP (surveys 1994 and 1999). The central question is how milieu

1 Dr. Klaus Harney ist Professor für Berufs- und Wirtschaftspädagogik, Fakultät für Philosophie,

und Pädagogik, Arbeitsstelle für berufliche Aus- und Weiterbildung, Universitätsstraße 150, 44780 Bochum. E-Mail: [email protected] Ch. Fuhrmann und M. Weischet sind Wissenschaftliche Mitarbeiter am selben Lehrstuhl.

Page 97: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

98 ZA-Information 53

and participation in further education are related to each another. The relationship is reconstructed on the basis of multivariate procedures for classifying objects and variables. It will be shown that milieu-specific factors for participation in further education can be distinguished from milieu-non-specific factors, namely by system-atically combining these multivariate procedures in such a way that the combina-tion is tailored to the analysis of milieus. Thus a weakness regarding content and methodology can be made visible in milieu research focusing on education: in order to assess milieus as an independent variable, both matter and methodology require not only a differentiation between various types of milieus, but also between milieu and non-milieu.

1 Fragestellung: Milieuzugehörigkeit und berufsinstrumentelle Rahmung

Die Weiterbildung in Deutschland ist im Unterschied zum Wissenserwerb in der Schule weder auf bestimmte Lebensbereiche noch auf bestimmte institutionelle Fel-der beschränkt, sondern bewegt sich zwischen verschiedenen Institutionen wie Volkshochschule, Arbeitsverwaltung, Kirche, soziale Bewegung, Betrieb etc. (Kade 1997, S. 313; Schrader 2001). Die Interessen und Bindungen erzeugende Bedeutung von Lebensstilen und Milieus sowie von beruflich instrumentellen Absichten ist für die institutionelle Ortswahl der Weiterbildungsbeteiligung von besonderem Gewicht. Aus der Perspektive neuerer Weiterbildungsbeteiligungsanalysen bilden Lebensstil und Milieuzugehörigkeit den Rahmen aus, in den die Beteiligung von Personen an der Weiterbildung jeweils eingelagert ist (vgl. Barz 2002). Beide Begriffe beziehen sich auf soziale Sachverhalte, die die Unterscheidbarkeit von Individuen und Gruppen an gesellschaftlich sichtbare, das Persönliche im Sinne einer sozialen Benennung markierende Zeichen der Lebenspraxis binden (vgl. Sobel 1981).

Durch Milieus werden individuelle Lebensstile in kollektive Muster der Lebensfüh-rung und lebenspraktischen Orientierung transformiert (vgl. Zapf u.a. 1987, S. 14). Lebensstile und Milieus stellen Verweisungszusammenhänge bzw. Sinnlieferanten der Weiterbildungsbeteiligung dar (vgl. Tippelt 1997). Sie werden durch solche Variablen des SOEP indiziert, die der Milieuforschung zufolge der Milieuseite des Lebens typischerweise angehören (Übersicht 1). Neben Lebensstil und Milieu kommt die beruflich instrumentelle Rahmung als sinnhafter Anker der Weiterbil-dungsbeteiligung in Frage. Wie die soziologische Milieu- sieht auch die Weiterbil-dungsforschung das Auftreten beruflich instrumenteller Interessen in der Abhängig-keit von Lebensstilen und Milieus (vgl. Georg 1998). Im Verhältnis zu lebensstil-abhängigen Alltagspraktiken kommt der beruflich instrumentellen Rahmung der Weiterbildungsbeteiligung eine spezifische, an berufliche Themen und ihren Nutzen

Page 98: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 99

gebundene Zweckrationalität zu (Weiland und Tippelt 2003, S. 30). Sicherung des Arbeitsplatzes, Karriereaspiration, betriebliche Personalentwicklung (z.B. ablesbar daran, dass Personen mit der Teilnahme an beruflichen Weiterbildungsmaßnahmen rechnen) und Einkommensinteressen treffen hier zusammen und zählen deshalb zum ständigen Gegenstandsbereich bildungsökonomischer wie auch bildungssozio-logischer Forschung (vgl. Sadowski 2002). Die beruflich instrumentelle Rahmung ist an Karriere und Erwerbstätigkeit angekoppelt. Sie enthält eine auf die eigene Kompetenz bezogene Humankapitalperspektive und hat an Bedeutung zugenommen (vgl. Bolder und Hendrich 2002; Friebel u.a. 2000, S.263f.). Im Unterschied zur beruflich instrumentellen Rahmung dienen milieugebundene Verankerungen der Weiterbildungsbeteiligung dagegen der sozialen wie auch kulturellen Herkunftsbe-stimmung und Grenzziehung der Lebenspraxis. Sie sorgen für die Differenz von Normalität und Fremdheit, durch die das eigene Leben auf kollektive Zugehörigkeiten und Erkennbarkeiten hin bezogen werden kann. Theoretisch ist die Frage gerecht-fertigt, inwieweit die beruflich instrumentelle Rahmung der Weiterbildungsbeteili-gung in diesen Zusammenhang gehört, oder ob durch sie die Weiterbildungsbeteili-gung nicht in quasi monetärer Weise auf ihren Nutzen hin kodiert wird. Aus soziolo-gisch empirischer Sicht ist diese Frage nicht von vornherein entscheidbar. Beantwor-tet man sie positiv, so müsste man davon ausgehen, dass es lebensstil- und milieuspe-zifischen Alltagspraktiken gegenüber indifferente Verankerungen der Weiterbil-dungsbeteiligung gibt, die einer geldähnlichen Tauschlogik folgen, also eine sozu-sagen lebensstilunspezifische Bedeutung haben. Die damit angesprochene Frage des Verhältnisses zwischen Lebensstil/Milieu und beruflich instrumenteller Rahmung für die Weiterbildungsbeteiligung ist bislang unbeantwortet geblieben, was explora-tive Studien zur Aufhellung dieses Verhältnisses nach wie vor rechtfertigt und inso-fern auch eine auf die Fragestellung zugeschnittene Analyse von SOEP-Daten in-haltlich sinnvoll erscheinen lässt. Auch die Rekonstruktion von Berufsmilieus (vgl. Noller 1999) beantwortet die Frage nicht: denn hier geht es um die Affinität von Berufen zu Milieus und Lebensstilen, nicht jedoch um die Reichweite von milieu-bezogenen Variablen zur Erklärung eines sozialen Sachverhalts wie z.B. der Wei-terbildungsbeteiligung. Allerdings ist die Absicht der vorliegenden Studie nicht auf die inhaltliche Seite beschränkt. Die Studie versteht sich vor allem als methodischer Beitrag zur auswertungsanalytischen Herstellung von Gruppenunterscheidungen und der Analyse darauf aufbauender variablenbezogener Abhängigkeits- und Unab-hängigkeitsbeziehungen im Rahmen der Milieuforschung. Am Verhältnis zwischen milieuabhängiger und beruflich instrumenteller Rahmung der Weiterbildungsbetei-ligung wird gezeigt, dass mit der Konzeptualisierung von Milieus als unabhängigen Variablen die Frage nach der Spezifikation und Reichweite von Nicht-Milieu-Variablen aufgeworfen wird: d.h. von Variablen, die – und zwar im Hinblick auf die

Page 99: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

100 ZA-Information 53

jeweils zu erklärenden sozialen Sachverhalte (wie hier: im Hinblick auf die Weiter-bildungsbeteiligung) – anderen Prämissen als denen einer milieubezogenen Alltags-praxis angeschlossen sind. Die methodische Beantwortbarkeit dieser Frage mittels einer Kombination variablen- und untersuchungsobjektgruppierender Verfahren der Datenauswertung wird aufgezeigt.

Konzeptionell kann man sinnhafte Verweisungen auf das Milieu und sinnhafte Verweisungen auf die beruflich instrumentelle Rahmung als Variablen begreifen, die unabhängig voneinander auf die Weiterbildungsbeteiligung einwirken. Die Hypothese lautet, dass die angesprochenen Variablen „Lebensstil/Milieu“ und „Beruflich instrumentelle Rahmung“ unterschiedlichen interessenbezogenen Ressourcen der Weiterbildungsbeteiligung entstammen und als – nicht an sich, sondern im Hinblick auf die Weiterbildungsbeteiligung – unabhängige Einflussgrößen anzusehen sind. Das Gegenkonzept dazu ist die Vorstellung von der Weiterbildungsbereitschaft als einer von der Interaktion zwischen „Lebensstil/Milieu“ und „beruflich instrumenteller Rahmung“ abhängigen Größe. In jedem Fall macht es Sinn, mit der Konzeptualisierung der abhängigen Variable die empirische Einflussmöglichkeit des Nicht-Milieus bzw. der Lebensstilunspezifität als unabhängiger Variable vorzusehen, was z.B. beim Konsumverhalten als abhängiger Variable (vgl. Sobel 1981) andere Konzeptualisierungsfragen aufwirft als bei der Weiterbildungsbeteiligung etc.

2 Das Sozioökonomische Panel als Variablen- und Datengrundlage

Die Problematik wird anhand von Items und Daten des Sozioökonomischen Panels (SOEP-Welle 1999) rekonstruiert. Eingeschlossen darin ist die Frage nach der Re-konstruierbarkeit der Problemstellung aus dem Datensatz. Diese hat zweifellos Grenzen, die auf dem für die Fragestellung unspezifischen Erhebungsinstrument beruhen. So kann die Weiterbildungsbeteiligung nicht direkt, sondern nur mit Hilfe einer Indikatorvariablen erfasst werden (s.u.). Gleiches trifft auf die Spezifikation der Milieus zu. Da es die Kategorie „Milieu“ im SOEP nicht gibt, andererseits aber Itemantworten erfragt werden, die unter definitorischen Gesichtspunkten als Le-bensstil- und Milieuindikatoren interpretierbar sind, ist den Berechnungen eine in-haltlich begründete Itemauswahl zugrunde zu legen. Einbezogen werden Items zu den subjektiv angegebenen Zufriedenheitsbedingungen für das eigene Leben, zur Präferierung von Alltagspraktiken und zur Einschätzung der selbst gestaltbaren Kontrolle über das eigene Leben. Eine Feinanalyse von Milieus ist mit dem SOEP nicht möglich. Möglich ist jedoch die Analyse von milieuspezifischen Schemata, die im Sinne von Markierungen für die Trennung oder auch für die Binnendifferen-zierung von Milieus wichtig werden können, eine entsprechende Bedeutung in der

Page 100: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 101

Literatur haben und sich in der Datenanalyse als stabil erweisen. Betrachtet man die milieubezogenen Gruppenunterscheidungen des Sinus-Instituts und der an sie an-schließenden Untersuchungen von Vester u.a. (2001) sowie von Barz (2002), dann sieht man, dass die Benennungen sich an der alltagskulturellen Praxis, am Status-bewusstsein, an Wertorientierungen, an der Identifikation mit der Arbeit und an le-benspraktischen Relevanzen orientieren (Übersicht 1). Gemeinsam stellen solche Benennungen kulturelle und soziale Normalität für Personen her (vgl. Hradil 1987, S. 166 f.), was mittels der Zweckrationalität arbeitskraftbezogener Reproduktionsin-teressen alleine nicht möglich ist. Die Prestigebezogenheit des Statusbewusstseins wie auch die Heteronomie von Wertorientierungen werden in den SOEP-Items nicht direkt angesprochen. Im Rahmen der genannten Kategorien angesprochen werden die alltagskulturelle Praxis, lebenspraktische Relevanzen und das auf die eigene Lebensführung gerichtete Selbstbewusstsein. Die folgende Übersicht stellt die im SOEP erhobenen, als Milieuvariablen kennzeichenbare Merkmale interpretativ ne-ben diejenigen, mit denen die auf der Grundlage der konzeptionellen denen die auf der Grundlage der Vorarbeit des Sinus-Instituts betriebene bildungsbezogene Mi-lieuforschung Milieuunterscheidungen vornimmt (vgl. Ueltzhöffer und Flaig 1993). Die auf die Unterscheidungen bezogene Auflistung der SOEP-Variablen bedeutet, dass ihre jeweilige positive Ausprägung vorhandenen Milieuunterscheidungen (Übersicht 1, Spalte a und b) sinngemäß zugeordnet werden kann. Man sieht, dass dabei mit starken Überlappungen zwischen den Milieus und den aus dem SOEP ermittelbaren Milieuvariablen zu rechnen ist. Die Relevanz für die künftige Bil-dungsforschung ergibt sich aus der Frage, inwieweit solche Überlappungen grund-sätzlich dadurch bearbeitbar gemacht werden, dass man die SOEP-Variablen grup-piert und auf die Weiterbildungsbeteiligung bezieht. Lediglich dieser Schritt – und nicht die Analyse von Milieus an sich – kann Gegenstand der vorgelegten Daten-auswertung sein. Insofern steht die Frage im Zentrum, inwieweit und mit welchen Strategien der Datenauswertung sich milieuaffine SOEP-Variablen im Sinne von Schemata dimensionalisieren, gruppieren und zur Erklärung der Weiterbildungsbe-teiligung verwenden lassen.

Untersucht man die SOEP-Variablen (Spalte c) im Hinblick auf die Weiterbil-dungsbeteiligung, dann geht es auch um die methodische Seite der Identifikation von Variablenkonstellationen, die für das Design einer auf lebensbegleitende Bil-dungsprozesse gerichteten Milieuforschung (vgl. Vester u.a. 2001; Tippelt u.a. 2003) von Bedeutung sein können. Es dürfte vor allem der mit dem Begriff des Mi-lieuschemas verbundene methodische Aspekt sein, der dabei zum Tragen kommt: indem er nämlich auf die problembezogene (hier: die Weiterbildungsbeteiligung betreffende) Identifikation milieuabhängiger Dimensionen abstellt. Übersicht 1

Page 101: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

102 ZA-Information 53

Übersicht 1 Milieuunterscheidungen

Spalte a Spalte b Spalte c

Milieuunterscheidungen des Sinus-Instituts

Sinusvariablen Auf die Milieus positiv bezieh-bare, affine SOEP-Variablen

Konservativ gehobenes Milieu Konservativismus, Tugenden, Elitebewusstsein

Familie, Gesundheit, Freunde, Religion, Theater, Vorträge, Konzerte, Verein, Selbstge-staltbarkeit des Lebens

Kleinbürgerliches Milieu Tradition, Sicherheit, Pflicht, Verzicht, Harmonie, Konventi-on

Beruf und Arbeit, Familie, Gesundheit, Freunde, Religion, Bestimmung des Lebens von außen

Traditionelles Arbeitermilieu Einfachheit, Sparsamkeit, Be-scheidenheit, Solidarität, Konformität, Gemeinschaft

Beruf und Arbeit, Familie, Gesundheit, Freunde, Religion, Bestimmung des Lebens von außen, Vereine, Verbände etc.

Traditionsloses Arbeitermilieu Unterprivilegiert, Kompen-sation von Benachteiligung

Einkommen, Kino, Disco, Bür-gerinitiativen, Vereine

Neues Arbeitnehmermilieu Mainstream, Professionalität im Beruf, Freizeit, realitätsbezoge-ner Hedonismus

Beruf und Arbeit, Freunde, Religion, Kino, Disco, Theater, Vorträge, Konzerte, Freizeit, Selbstgestaltbarkeit des Lebens, Bürgerinitiativen, Vereine etc.

Aufstiegsorientiertes Milieu Mainstream, Anpassung, Leistungsbereitschaft, Karriere, Status

Beruf und Arbeit, Selbstge-staltbarkeit des Lebens, Be-stimmung des Lebens von au-ßen, Bürgerinitiativen, Vereine etc.

Technokratisch liberales Milieu

Intellektuelle Elite, Selbstver-wirklichung

Beruf und Arbeit, Kino, Disco, Theater, Vorträge, Konzerte, Freizeit, Selbstgestaltbarkeit des Lebens

Hedonistisches Milieu Beruf und Arbeit, Kino, Disco, Freizeit, Bürgerinitiativen

Alternatives Milieu Freunde, Religion, Bürgeriniti-ativen, Vereine

zeigt, dass es Sinn macht, von der Identifizierbarkeit solcher Dimensionen auszuge-hen. Der Problembezug ermöglicht es, Milieufaktoren von Nicht-Milieufaktoren zu unterscheiden, was im Folgenden mit dem Einbau der sozusagen individuellen, als beruflich instrumentelle Rahmung den Milieuschemata gegenübergestellte Human-kapitalperspektive in die Rekonstruktion der Weiterbildungsbeteiligung geschieht.

Page 102: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 103

Unter methodischen Gesichtspunkten lassen sich die SOEP-Variablen (Spalte c) als Items begreifen, die für den Zusammenbau von Milieus und Lebensstilen bedeut-sam sind. Dazu gehören auch Beruf und Arbeit als Variablen der Lebenszufrieden-heit. Als Variablenhintergrund im Kontext der betrieblichen und beruflichen Arbeits-kraftreproduktion und Karriere lassen sich Beruf und Arbeit von ihrer Hintergrund-bedeutsamkeit für Milieus aber auch analytisch unterscheiden, so dass man den Sinnzusammenhang von Beruf und Arbeit auf zwei Seiten antreffen kann: Auf der Seite der Milieu- und auf der Seite der Arbeitskraftreproduktion. In diesem Sinne werden milieuspezifische Items von Items (Faktoren) unterscheidbar, die die glei-che Bedeutung für den Zusammenbau der individuellen Humankapitalperspektive haben. Inwieweit beide Seiten unabhängig voneinander auf die Weiterbildungsbe-teiligung einwirken, ist dann vor dem Hintergrund der begrifflichen Unterscheidung die interessante empirische Frage.

Die vorgenommene Auswertung der Wellen 11(1994) und 16 (1999) des SOEP richtet sich auf voll- und teilzeitbeschäftigte Erwerbstätige zwischen 30 und 55 Jahren. Ihnen lag die Frage vor: „Wie sieht gegenwärtig Ihr normaler Alltag aus?“ Die Fra-ge ist u.a. mit der Antwort „Aus- und Weiterbildung, Lernen (auch Schule/Studium)“ versehen. Aufgrund des Alters und der Erwerbstätigkeit der Befragten wird das Item als Weiterbildungsbeteiligungsvariable verwendet. Die Antwortmöglichkeit sieht skalierte Zeitangaben nach Stunden pro Woche vor. Die vorliegende Auswer-tung beschränkt sich auf die binäre Zusammenfassung, unterscheidet also nur zwischen denen, die „0“ eintragen (=„Nein“), und denjenigen, die Zeitangaben machen (=„Ja“). Zusammen mit der Alterseingrenzung werden die Antworten als Weiterbil-dungsvariable verwertet. Primär herangezogen wird die Welle 16. Die Daten der anderen Welle dienen der Kontrolle.

Die dreißig bis fünfundfünfzig Jahre alten Erwerbstätigen schneiden N=4837 Per-sonen aus den Datensätzen der Welle 16 (1999) des SOEP aus. Die durchschnittliche auf die Variable beziehbare Weiterbildungsbeteiligung liegt bei ca. 20%. Gegenüber höheren Werten aus anderen Untersuchungen z.B. aus dem Berichtssystem Weiter-bildung muss man bedenken, dass nach gegenwärtiger Beteiligung gefragt wird, dass ein Antwortbias anzunehmen ist, und dass die Weiterbildungsbeteiligung mit dem Alter generell sinkt. Kontrolliert wurden die Berechnungen an der Welle 1994, die die gleichen Variablen enthält (s. Anhang). Eine Untersuchung der für die Weiterbildung günstigeren Wellen 1989/93 (vgl. Behringer 1999) war aufgrund der fehlenden Spezifikationsmöglichkeit vergleichbarer Milieuvariablen nicht möglich.

Behringer (1999, S. 133 ff.) hat die direkt auf die berufliche Weiterbildung bezo-genen SOEP-Befragungen 1989/1993 ausgewertet. Dort wird zwischen individuel-

Page 103: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

104 ZA-Information 53

ler, betrieblicher und beruflicher Weiterbildung unterschieden. Den höchsten Wert erreicht die berufliche Weiterbildung in den Daten von Behringer bei den 35-39-Jährigen mit 38%, den niedrigsten bei den 50-54-Jährigen mit 21%. Die individuelle Weiterbildung erreicht bei den 30-34-Jährigen 18%, und bei den 50-54-Jährigen liegt sie bei 9%.

Die Daten sind mit denjenigen, die unsere „Kunstvariable“ erzeugt, kompatibel. Die Dimensionalisierung und typologische Zusammenfassung der im Rahmen des SOEP 1999 auf Lebensstil/Milieuzugehörigkeit beziehbaren Items erfolgt durch eine Kombination von faktor- und clusteranalytischen Auswertungen. Die Faktor-analyse wird im Rahmen dieser Analyse als exploratives Verfahren eingesetzt. Die dimensionalen Zusammenfassungen, die die Faktoranalyse (Orthogonalität, Vari-max-Rotation) erlaubt, bilden dann im nächsten clusteranalytischen Schritt der Da-tenauswertung das empirische Substrat der Abgrenzung milieuspezifischer Markie-rungen. Die Faktoranalyse liefert Dimensionen, die für eine Clusterverschmelzung besser geeignet sind als Einzelitems. Die Berücksichtigung von Faktoren anstatt von Einzelitems hat den Vorteil, dass sich irrelevante, manifeste Variablen in der dimensionalen Struktur der Faktoranalyse auflösen können, wohingegen irrelevante Variablen bei Anwendung von Verschmelzungsverfahren auf Itemebene Berück-sichtigung finden würden. Irrelevante Variablen zerstören die dimensionale Struktur der Faktoranalyse nicht. Es kann sogar vorkommen, dass alle irrelevanten Variablen durch die Faktoranalyse in einem eigenständigen Faktor zusammengefasst werden (Bacher 2002: S. 171).

Sofern sie sich inhaltlich interpretieren lassen, stellen die ermittelten Cluster eine Typologie auf der Grundlage der faktoranalytisch ermittelten dimensionalen Aus-prägungen bereit (Schnell/Hill/Esser 1999, S. 162). Die Auswahl eines durch das SOEP vorgegebenen Sets von Items setzt einer so betriebenen Milieuanalyse zwar Grenzen. Sie gestattet aber die Analyse von Grobmarkierungen bzw. Schemata, die zu milieubezogenen Gruppenunterscheidungen beitragen, in Verbindung mit fein-gliedrigen Milieuabgrenzungen, wie sie in der Forschung vorliegen (vgl. u.a. Barz 2002), weiterbildungsrelevante Konstitutionsmerkmale der Milieubildung enthalten und somit indikatorische Bedeutung für die allgemeine Abgrenzbarkeit von Milieu und Nicht-Milieu besitzen.

Die auf die beruflich instrumentelle Rahmung, also auf die Nicht-Milieu-Perspek-tive beziehbaren Items, wurden als Indikatorvariablen jeweils für die Dimensionen „Anpassungs- und aufstiegsbezogene berufliche Rahmung“ und „Wechselbezogene berufliche Rahmung“ ausgewählt und faktoranalytisch auf dimensionale Zugehö-rigkeit überprüft.

Page 104: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 105

Die erste Dimension lässt sich durch das Qualifikationsniveau der Erwerbstätigkeit, durch die für die Zukunft erwartete berufliche Weiterbildungsbeteiligung (die auf die Projektion von Weiterbildungserfahrungen und die Weiterbildungsplanung von Betrieben (Husemann und Vonken 2003, S. 98 verweist), und die Erwartung eines beruflichen Aufstiegs im eigenen Betrieb indizieren.2 Die drei Variablen gelten in der Weiterbildungsforschung nicht nur als stark beteiligungswirksame Variablen (Wittpoth 1997, S. 75), sondern auch als Variablen, die linear miteinander zusam-menhängen (Ahlene und Dobischat 2003, S. 153 ff.). Faktoranalytisch lässt sich der Zusammenhang zwischen diesen Variablen in den hier untersuchten Daten wieder antreffen, so dass sich ihre Verknüpfung zur Dimension „Anpassungs- und auf-stiegsbezogene berufliche Rahmung“ bestätigt.3

Die zweite Dimension greift die weiterbildungspolitische Rhetorik auf, die die in Erwerbsbiografien auftretenden Wechsel von beruflichen wie auch von betrieblichen Einsatzbereichen immer wieder kausal auf die Weiterbildungsbeteiligung bezieht. Weder der Berufs- noch der Stellenwechsel konnten jedoch bislang als durchgängig nennenswerte Bestimmungsgrößen der Weiterbildungsbeteiligung identifiziert wer-den (vgl. Behringer 1999, S. 222 ff.). Der Kontinuität des beruflichen Einsatzfelds im Rahmen von Anpassungsstrategien kommt bisherigen Analysen zufolge eine wesentlich höhere Bedeutung zu (ebenda; vgl. auch anhand der SOEP-Welle von 1997 Harney/Geselbracht/Weischet 1999). Offensichtlich fungiert die Beteiligung an beruflicher Weiterbildung vor allem als Instrument der qualifikatorischen Anpas-sung eines einmal beschrittenen berufsbiografischen Pfads an veränderte Anforde-rungen (vgl. Behringer a.a.O.). Vor diesem Hintergrund macht es Sinn, wechselbe-zogene Variablen des SOEP (beabsichtigter Stellenwechsel in den nächsten zwei Jahren; beabsichtigter Berufswechsel in den nächsten zwei Jahren) einzubeziehen und faktoranalytisch festzustellen, inwieweit diese der ersten Dimension ebenfalls angehören. Zu diesem Zweck wurde eine weitere Faktoranalyse gerechnet, die ergab,

2 Die Qualifikationsniveaus wurden entlang der beruflichen Stellung zum Befragungszeitpunkt

bestimmt (z.B. wurden un- und angelernte Arbeiter, einfacher Dienst bei Beamten, Angestellten der Stufe „ohne besonderes Qualifikationsniveau“ zugeordnet, Facharbeiter, Meister, Angestell-te mit qualifizierter Tätigkeit der darüber liegenden Stufe usw.). Die Erwartung der Weiterbil-dungsbeteiligung und der berufliche Aufstieg wurden jeweils durch folgendes Item operationa-lisiert: „Wie wahrscheinlich ist es, dass in den nächsten zwei Jahren für Sie die folgenden beruf-lichen Veränderungen eintreten – sich durch Lehrgänge/Kurse weiterqualifizieren/fortbilden? bzw. – in Ihrem jetzigen Betrieb einen beruflichen Aufstieg schaffen?“. Mit ja wurden jeweils Wahrscheinlichkeitsangaben >10% codiert (99er Welle mit elf Antwortkategorien). Bei der 94er Welle gab es jeweils vier Antwortkategorien: „Ganz sicher nicht“ und „eher unwahrscheinlich“ wurden = 0 gesetzt.

3 Aus den drei Variablen lässt sich ein Faktor extrahieren, der 54 % der Varianz aufklärt. Die Ladungen der drei Variablen liegen > .65

Page 105: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

106 ZA-Information 53

dass wechselbezogene Variablen der Dimension nicht angehören, sondern als eigene Dimension („Wechselbezogene berufliche Rahmung“) ausgewiesen werden müssen.4

Man kann also für das aus den Variablen des SOEP entwickelte Design zwei Ebenen unterscheiden: die Ebene der auf Faktoren- und Clusteranalysen beruhenden milieu-spezifischen Schemata und die Ebene der beruflich instrumentellen Rahmung, die man ebenfalls als ein die alltägliche Lebensperspektive bestimmendes Schema, und zwar im Sinne eines nicht-milieuspezifischen Blicks auf die eigene Arbeitskraft, ansehen kann. Die Ebene der milieuspezifischen Schemata einerseits und der beruf-lich instrumentellen Rahmung andererseits werden durch logistische Regressions-modelle zur Weiterbildungsbeteiligung in Beziehung gesetzt und auf ihre modell-bildende Bedeutung für deren Erklärung überprüft. Sind beide Ebenen im Hinblick auf die Weiterbildungsbeteiligung voneinander unabhängig, dann kann man be-gründet annehmen, dass die beruflich instrumentell gerahmte Weiterbildungsbetei-ligung ein über milieuschemaspezifische Weiterbildungsaffinitäten hinausgehendes Beteiligungspotenzial erschließt. Die Dichotomisierung der Faktorwerte für die Dimensionen „Anpassungs- und aufstiegsbezogene berufliche Rahmung“ und „Wechselbezogene berufliche Rahmung“ erfolgt aufgrund der Faktormittelwerte als Kriterien für die 0/1-Kodierung.5

Übersicht 2: Unabhängige Variablen

Clusterzugehörigkeit auf der Grundlage von di-mensionalen Ausprägungen (Faktorwerten (Siehe Übersicht 3 und 3a))

Dreistufig (Kontrolliert durch andersstufige Modelle)

Qualifikationsniveau Dreistufig Beruflich instrumentelle Rahmung indiziert durch Faktorwerte zu den Dimensionen: Anpassungs- und aufstiegsbezogene berufliche Rahmung Wechselbezogene berufliche Rahmung

Jeweils dichotom nach Faktorwert <=/>0

Geschlecht Dichotom Alter Dichotom

4 Hier ergibt sich eine Zweifaktorlösung: Die drei ersten Variablen (Anm. 1) bilden erneut eine

Dimension mit Ladungen > .65, die wechselbezogenen Variablen bilden die andere Dimension mit Ladungen > .85. Die Varianzaufklärung liegt bei 64,9%.

5 Faktormittelwerte sind jeweils =0 aufgrund der z-Standardisierung der Faktorwerte. Werte<= 0 wurden bei den beiden Dimensionen zur beruflich-instrumentellen Rahmung mit 1 kodiert, die anderen mit 0. Der Grund für die Wahl dieser Kodierung besteht darin, dass dann bei der Logis-tischen Regression das Eintreten einer unter dem Mittelwert liegenden Ausprägung der Dimen-sionen mit einem zu erwartenden Rückgang der Weiterbildungsbeteiligung in Verbindung ge-bracht werden kann. Das umgekehrte Vorgehen führt bei Effektkoeffizienten >2 leicht zur An-gabe von Steigerungsquoten von 100% und mehr, was für die Wahrnehmung der Größenver-hältnisse unserer Auffassung nach unschön ist.

Page 106: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 107

3 Faktor- und Clusteranalyse: Methodologische Fragen, Vorgehensweise

und Ergebnisse

Die jeweilige Ausprägung der genannten beiden Dimensionen zur beruflich instru-mentellen Rahmung kann aus den Faktorwerten ermittelt und in weitere Berech-nungen (Logistische Regression) jeweils übernommen werden. Gleiches gilt für die Clusterzugehörigkeit, die als Indikatorvariable von milieu- und lebensstilbezogenen Schematisierungen fungiert. Den Clusteranalysen vorgeschaltet sind faktoranalytische Variablenzusammenfassungen. Eine der Faktoranalysen pro Welle erfolgt jeweils pro Themenbereich, die andere über alle Items. Die Themenbereiche stellen eine vorab vorgenommene, durch die Faktoranalysen über alle Items abgesicherte (s.u.) Gliederung von Items dar, die als lebensstilbezogene Items ausgewählt wurden.

3.1 Ergebnisse der Faktoranalyse

Durch den der Clusteranalyse vorgeschalteten Zwischenschritt der Faktoranalyse werden statistische Itemzusammenhänge sichtbar, die sich, wenn sie empirisch Sinn machen, als Dimensionen ausweisen lassen (Übersicht 3 u. 3a). So ist es nicht selbstverständlich, dass sich in den Variablen „Berufserfolg“ und „Arbeit“ eine von „Wohngegend“ und „Einkommen“ unabhängige Dimension ausbildet. Andere Aggre-gationen bzw. Variablenkombinationen wie „Beruflicher Erfolg“ und „Einkommen“ oder „Familie“ und „Glaube, Religion“ oder „Gesundheit“, „Politischer Einfluss“ und „Umweltschutz“ führen ebenfalls zu sinnvollen Dimensionalisierungen, wie man an Detailabweichungen der Dimensionenbildung zwischen den Wellen 1994 und 1999 beobachten kann. Genauso wenig selbstverständlich ist es, dass die Items in den Wellen von 1994 und 1999 zu im Großen und Ganzen ähnlichen Dimensiona-lisierungen führen.

Faktoranalysen wurden für die Daten von 1999 wie auch von 1994 auf zwei Ebenen der Datenzusammenfassung vorgenommen: Es wurde eine orthogonale Faktorana-lyse (Varimax-Rotation) über alle Items gerechnet (Übersicht 3).6 Mittels einer zweiten Faktoranalyse wurden die auf der Grundlage des Erhebungsinstruments nach Bereichen klassifizierbaren SOEP-Items jeweils bereichsspezifisch zu Fakto-ren zusammengefasst (Übersicht 3a, der man die Bereiche entnehmen kann). Dieser Schritt ließ es zu, sich auf die unterstellte Unabhängigkeit der Dimensionen bezie-hen zu können – was allein mit dem ersten Schritt nicht möglich war. Die Unabhän-gigkeit im Faktorenmodell wurde also gebraucht, um Abhängigkeiten zwischen

6 Die Unabhängigkeitsannahme (Rechtwinkligkeit) zwischen den Faktoren ist das methodische

Problem der orthogonalen Faktoranalyse. Allerdings ändert auch die Schiefstellung der Fakto-ren am Modellcharakter der dann zugrunde gelegten Abhängigkeitsannahme nichts.

Page 107: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

108 ZA-Information 53

Übersicht 3 Faktorenmodell über alle Items 1999 (Items mit Ladungen > .5)

1. Faktor 2. Faktor 3. Faktor 4. Faktor 5. Faktor Orientierung am Lebensstandard

Abhängigkeit von äußeren Mächten

Kultur

Religiöse Praxis

Berufserfolg

Varianzaufkl. 8,4 Varianzaufkl. 8,2 Varianzaufkl. 6,1 Varianzaufkl. 5,7 Varianzaufkl. 5,3

Wohngegend Wohnung Gesundheit Freizeit Umweltschutz Einkommen Eigene Mobilität jeweils Bedin-gungen für Zu-friedenheit

Wenig Kontrolle über die Dinge, die passieren Wenn im Leben Schwierigkeiten, zweifle ich an meinen Fähig-keiten Im Vergleich mit anderen, habe ich nicht er-reicht, was ich verdient hätte Mache die Er-fahrung, dass andere mein Leben bestimmen Was man im Leben erreicht, ist primär eine Frage von Schicksal oder Glück

Kino, Disco, Popkonzerte Aktiver Sport, Konzerte, Thea-ter, Vorträge

Kirchgang, reli-giöse Veranstal-tungen Glaube und Religion Bedin-gung für Zufrie-denheit

Beruflicher Erfolg, Arbeit, jeweils Bedin-gungen für Zu-friedenheit

6. Faktor 7. Faktor 8. Faktor 9. Faktor Hilfe und Gesel-

ligkeit

Partizipation

Individualistische Determination des Lebens

Politisches En-gagement

Varianzaufkl. 5,2 Varianzaufkl. 4,6 Varianzaufkl. 4,5 Varianzaufkl. 4,4

Mithelfen bei Freunden, Ver-wandten, Nach-barn, Geselligkeit mit Freunden, Freunde, Be-dingung für Zu-friedenheit

Ehrenamt in Vereinen, Ver-bänden, sozia-len Diensten Bürgerinitiative, Parteien, Kom-munalpolitik

Fähigkeiten sind wichtiger als alle Anstren-gung, Erfolg muss man sich hart erarbeiten. Wie mein Leben verläuft, hängt von mir selbst ab

Politischer Ein-fluss wichtig für Zufriedenheit Wenn man sich sozial oder poli-tisch engagiert, kann man die sozialen Verhält-nisse beeinflus-sen

Page 108: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 109

Übersicht 3a Faktorenmodell über bereichsspezifisch vorgeordnete Items 1999

Themenbereich Relevanz von Lebensbedingungen für Lebenszufriedenheit

1. Faktor 2. Faktor 3. Faktor 4. Faktor

Orientierung am Lebensstandard

Orientierung am Berufserfolg

Orientierung am Privatleben

Orientierung an kollektiven Verbindlichkeiten

Varianzaufkl. 16,0 Varianzaufkl. 12,2 Varianzaufkl. 12,1 Varianzaufkl. 11,5 Items mit Ladungen > .5

Items mit Ladungen > .5

Items mit Ladungen > .5

Items mit Ladungen > .5

Eigene Mobilität Wohngegend Freizeit Wohnung Einkommen

Beruflicher Erfolg Arbeit

Familie Gesundheit Freunde

Glaube, Religion Politischer Einfluss Umweltschutz

Themenbereich Lebensgewohnheiten

1. Faktor 2. Faktor 3. Faktor Kultur im Alltagsleben

Partizipation im Alltagsleben

Hilfe und Gesellig-keit im Alltagsleben

Varianzaufkl. 22,0 Varianzaufkl. 19,2 Varianzaufkl. 16,9

Items mit Ladungen > .5

Items mit Ladungen > .5

Items mit Ladungen > .5

Kino, Disco, Pop-konzerte Aktiver Sport Konzerte, Theater, Vorträge

Ehrenamt in Verei-nen, Verbänden, sozialen Diensten, Bürgerinitiative, Par-teien, Kommunalpo-litik Kirchgang, religiöse Veranstaltungen

Mithelfen bei Freun-den, Verwandten, Nachbarn Geselligkeit mit Freunden

den Themenbereichen untersuchen zu können: Wenn Faktorwerte jeweils über N nach Themenbereichen getrennt ermittelt werden, lassen sie sich zwar nicht inner-halb der Themenbereiche (denn dort sind sie Ausdruck des Modells), wohl aber zwischen den Themenbereichen korrelieren, also auf gegenseitige Abhängigkeit untersuchen (Übersicht 4). In diesem Fall ist die Auswahl der Themenbereiche me-thodisch zu begründen – was mittels der Faktoranalyse über alle Items im Rahmen sowohl der Welle 1994 wie auch der von 1999 möglich war.

Page 109: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

110 ZA-Information 53

Themenbereich Lebenskontrolle

1. Faktor 2. Faktor 3. Faktor Abhängigkeit von äußeren Mächten

Individualistische Determination des Lebens

Bedeutung sozialen Engagements7

Varianzaufkl. 24,9 Varianzaufkl. 13,5 Varianzaufkl. 10,2

Items mit Ladun-gen> .5

Items mit Ladun-gen> .5

Items mit Ladun-gen> .5

Wenig Kontrolle über die Dinge, die passieren Mache die Erfah-rung, dass andere mein Leben bestimmen Wenn im Leben Schwierigkeiten, zweifle ich an mei-nen Fähigkeiten Im Vergleich mit anderen, habe ich nicht erreicht, was ich verdient hätte Was man im Leben erreicht, ist primär eine Frage von Schicksal oder Glück

Erfolg muss man sich hart erarbeiten Fähigkeiten sind wichtiger als alle Anstrengung Wie mein Leben verläuft, hängt von mir selbst ab

Wenn man sich so-zial oder politisch engagiert, kann man die sozialen Verhältnisse beeinflussen

Während die erste Faktoranalyse 1999 einen einzigen Variablenraum dimensionali-siert, teilt sich die zweite Analyse 1999 in mehrere Variablenräume und damit auch in mehrere Faktoranalysen auf. Gleiches gilt für die der Kontrolle dienende, über alle Items gerechnete und im Anhang dokumentierte Faktoren- und Clusteranalyse der Daten von 1994, die ähnliche Dimensionen und Gruppentrennungen aufweist wie die entsprechende Analyse der 99er Welle.

7 Unter Zugrundelegung des Ladungskriteriums stellt der Faktor einen Restfaktor dar, der im

anderen Faktorenmodell 99 über alle Items dem Faktor Politisches Engagement zugeordnet wird

Page 110: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 111

Die Dimensionen der ersten Faktoranalyse 1994 bestätigen insgesamt die Ergebnisse der Analyse 1999 über alle Items (s. Anhang). Methodisch und inhaltlich interes-sante Abweichungen im Detail ergeben sich bei der 94er Analyse über alle Items. Sie gehen auf leichte Unterschiede in der Formulierung der Items zurück, was sich in einer im Vergleich zu den anderen drei Analysen etwas anderen Bedeutung der Cluster für die Weiterbildungsbeteiligung niederschlägt. Das Ergebnis der Untersu-chung bleibt davon unberührt (s. Kommentar im Anhang).

Die Analyse 1999 über alle Items bestätigt den Modus der Vorabfestlegung der Vari-ablenräume nach Themenbereichen im Erhebungsinstrument, auf die sich dann der zweite aus mehreren bereichsspezifisch vorgenommenen Faktoranalysen bestehende Untersuchungsschritt bezieht. Hier ist wichtig, dass bis auf drei Faktoren (Hilfe und Geselligkeit, Religiöse Praxis und Politisches Engagement) die Unterscheidung der Themenbereiche nach Bedingungen für Zufriedenheit, nach Lebensgewohnheiten und nach Lebenskontrolle in der Verteilung der Items auf Faktoren wiederkehrt. Empirisch kommen also zwei Ordnungsgesichtspunkte zum Tragen: Zum einen die Unterscheidung nach Zufriedenheit, Gewohnheit und Kontrolle, zum andern die in diese Bereiche eingefügten dimensionalen Unterscheidungen nach Kultur, Partizi-pation etc. Lediglich bei den Dimensionen Hilfe und Geselligkeit, Religiöse Praxis und Politisches Engagement werden Items aus unterschiedlichen Themenbereichen überkreuzt: und zwar aus Zufriedenheit/Lebensgewohnheit im ersten und zweiten und aus Zufriedenheit/Lebenskontrolle im dritten Fall. Teilt man jetzt Faktoranalysen themenbereichsspezifisch auf, dann ordnen sich die Items denjenigen Dimensionen zu, die sie in ihrem Themenbereich jeweils antreffen. So werden Religion und poli-tisches Engagement zwar in der Analyse über alle Items (1999) als eigener Faktor jeweils ausdifferenziert, in der restriktiveren, nach Bereichen vorgeordneten Analyse zeigt sich aber, dass in ihnen auch andere Dimensionen des Datensatzes enthalten sind und sich die Items dann auch anderen Dimensionen zuweisen lassen – was man als die inhaltliche Seite des Kommunalitätenproblems bezeichnen kann: So wandern die Items des Faktors Religiöse Praxis in den Partizipationsfaktor ein, diejenigen des Faktors Politisches Engagement jeweils in den Faktor Kollektive Verbindlich-keiten und in den Faktor Soziales Engagement und diejenigen des Faktors Hilfe und Geselligkeit in wiederum Hilfe und Geselligkeit und Orientierung am Privatleben.

Page 111: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

112 ZA-Information 53

Übersicht 4 Korrelationen zwischen bereichsspezifischen Faktorwerten (1999)8

Le-

bens-stand.

Beruf Privat-leben

Koll. Ver-bdk

Ab-hän-gigkeit

Indi-vid. Det.

Soz. Engagement

Kultur Parti-zip.

Hilfe

Le-bens-stand.

Mod

ell

Mod

ell

Mod

ell

Mod

ell

0,05 0,23 -0,08 K. ZH -0,13 Kein ZH

Beruf

Mod

ell

Mod

ell

Mod

ell

Mod

ell

-0,04 0,18 Kein ZH -0,05 Kein

ZH -0,04

Privat-leben

Mod

ell

Mod

ell

Mod

ell

Mod

ell

-0,06 0,05 Kein ZH K. ZH Kein

ZH 0,18

Koll. Ver-bdk.

Mod

ell

Mod

ell

Mod

ell

Mod

ell Kein

ZHKein

ZH 0,22 0,03 0,33 0,14

Ab-hän-gigkeit

Mod

ell

Mod

ell

Mod

ell

-0,13 Kein ZH

Kein ZH

Indi-vid. Det.

Mod

ell

Mod

ell

Mod

ell

-0,13 -0,6 Kein ZH

Soz. Enga-ge-ment

Mod

ell

Mod

ell

Mod

ell

0,16 0,17 0,03

Eine analoge Überprüfung wurde auch für die 94er Daten durchgeführt (s. Anhang). Alle Faktoranalysen erlauben gleiche oder zumindest ähnliche Klassifizierungen,

8 Faktorwerte innerhalb eines Modells (=Bereichs) korrelieren trivialer bzw. in durch den Algo-

rithmus bedingter Weise zu null. Aufgenommen wurden nur signifikante Korrelationen. Die an-deren wurden mit KZH = Kein Zusammenhang markiert. Signifikanzen werden aufgrund der großen Fallzahl schon bei kleinen Korr. ausgegeben, sind also nur begrenzt aussagefähig. Zu-sammenhänge sind u.E. ab Korr>2 diskutierbar.

Page 112: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 113

weshalb auf die Berechnung von Faktorstrukturvergleichen (die außerdem genau identische Items voraussetzen, was zwischen den Wellen nicht ganz der Fall war) verzichtet wurde (vgl. Harney und Koch 2003). Hervorzuheben ist, dass alle Fak-toranalysen den Partizipationsfaktor wie auch die Faktoren Kultur, Hilfe und Gesel-ligkeit, Beruf und Arbeit, Lebensstandard, Abhängigkeit und Individualistische De-termination in gleicher oder ähnlicher Weise hervorbringen (s. Anhang). Hervorzu-heben sind auch die sinnhaften Zusammenhänge zwischen den Dimensionen, wie z.B. Partizipation/Kollektive Verbindlichkeiten oder Lebensstandard und der Glaube an die individualistische Determination des Lebens (Übersicht 4).

Exemplarisch haben wir bei der themenbereichsspezifisch vorgenommenen Faktor-analyse (1999) die Kommunalitäten näher betrachtet. Die Kommunalitäten, die die Aufklärung der einzelnen Variablen durch die Faktoren angeben, informieren dar-über, wie gut das Faktorenmodell in den Variablen wiederkehrt und diese positioniert. Eine hohe Kommunalität zeigt an, dass die Variable eine unter Zugrundelegung des Faktorenmodells stabile Auftretensverlässlichkeit hat. Die Werte der Kommunalitäten sind gemessen an den erreichten Varianzaufklärungen (Übersicht 3 und 3a)9 zufrieden stellend. Bei den gut ladenden Variablen liegen sie in der Regel zwischen 0,5 und 0,7 (zur näheren Diskussion s. Anm.9).10 Die in den Bereichen jeweils relativ begrenzte

9 Backhaus u.a. (2000, S. 308/309) geben in ihrem Lehrbuchbeispiel Kommunalitäten von 0.5 als

zu niedrig an und empfehlen den Ausschluss entsprechender Variablen. Hierbei gehen sie aller-dings von einer Varianzaufklärung des Faktorenmodells von 75,3% und damit von einem ande-ren Niveau der für ein solches Modell typischen Kommunalitäten als in unserem Fall aus. Bei inhaltlich vertretbaren niedrigeren Aufklärungsraten ergibt sich auch ein im Hinblick auf die Angemessenheit niedrigeres Kommunalitätenniveau, das akzeptabel ist. Außerdem kommt es nicht nur auf die Höhe, sondern zur Betrachtung der Stärke des Zusammenhangs mit dem aus-gewählten Faktorenmodell auch auf den Vergleich der Kommunalitäten der einzelnen Variablen an. Zur Problematik der Kommunalität vgl. Rohwer/Pötter 2002, S.239 ff.

10 Im Faktorenmodell der Zufriedenheitsbedingungen besitzt die für den Faktor Orientierung am Gemeinschaftsleben zentrale Variable Umweltschutz etc eine Kommunalität von 0,52. Glaube, Religion hat eine Kommunalität von 0,45. Im selben Bereich der Zufriedenheitsbedingungen sind die im Faktor Lebensstandard anzutreffenden Kommunalitäten deutlich höher: Arbeit liegt bei 0,67, Berufserfolg bei 0,64 und Einkommen bei 0,57. Inhaltlich ist plausibel, dass Glaube und Religion auf Zusammenhänge verweisen können, die ein über den Lebensstandard aufge-bautes Faktorenmodell nicht enthält. Einen Hinweis darauf liefert der Vergleich der Kommuna-litäten für Glaube und Religion mit dem über alle Items gerechneten Faktorenmodell: In diesem Modell laden Glaube/Religion als Zufriedenheitsbedingung und Kirchgang als Lebensgewohn-heit >,7 auf einem gemeinsamen Faktor. Trennt man die Faktorenmodelle, wie oben geschehen, nach Bereichen, können sich Faktoren nicht aus Variablen verschiedener Bereiche zusammen-setzen und damit auch nichts zur Kommunalität beitragen. Unter individualisierten und säkula-risierten Lebensverhältnissen erwartbar ist der Nebenbefund: dass nämlich Glaube und Religion als Zufriedenheitsbedingungen für das eigene Leben mit dem Kirchgang als Lebenspraxis eng zusammenhängen. Dieses fast schon triviale Resultat des Faktorenmodells über alle Bereiche ist von methodischer Bedeutung: Es verweist auf die Verschiebung der Faktoren als Achsen im n-dimensionalen Raum in Abhängigkeit von bereichsabhängig oder bereichsunabhängig gerech-neten Faktorenmodellen. Im über alle Items, also bereichsunabhängig gerechneten Modell wird der Kirchgang aus dem Partizipationsfaktor herausgelöst und mit Religion als Zufriedenheitsbe-

Page 113: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

114 ZA-Information 53

Variablenanzahl führt dazu, dass fast alle Variablen auf die extrahierten Faktoren beziehbar sind, mit den Variablen also auch die Variablenanzahl pro Bereich der Übersicht 3a entnommen werden kann.

3.2 Ergebnisse der Clusteranalyse

Die Clusteranalyse der Faktorwerte bildet dann im nächsten Schritt möglichst gut trennende Gruppen auf der Grundlage der Intergruppenheterogenität aus. Für die Fest-legung der Clusteranzahl gibt es unterschiedliche Berechnungsverfahren. Die meisten davon basieren auf euklidischen Abstandsberechnungen, die bei der N-Lösung begin-nen, die Cluster schrittweise fusionieren, dadurch eine zunehmende Steigerung der Heterogenität bewirken und es somit erlauben, die optimale Cluster-Anzahl in Ab-hängigkeit vom Anstieg der Innerclusterheterogenität festzulegen. Das so gegebene Verschmelzungsniveau bezieht sich auf den Wert der Distanz zwischen den für die Verschmelzung der Cluster ausgewählten/relevanten Clusterobjekten im Ver-schmelzungsschema (Bacher 2002: S. 157, s.a. Tab. 1). Das Verschmelzungsniveau selbst ist monoton steigend (mit Ausnahme beim Zentroid, Median und Within-Average-Linkage-Verfahren), d.h. mit abnehmender Clusterzahl bzw. zunehmender Verschmelzung/Zusammenführung der Untersuchungsobjekte zu Clustern, steigt das Verschmelzungsniveau.

Cluster-Lösungen werden also durch deutliche Veränderungen des Heterogenitäts-zuwachses nahe gelegt und ermöglichen bei relativ flachen Anstiegen oder auch bei Mehrfachanstiegen die inhaltliche Auseinandersetzung mit unterschiedlichen Lö-sungsmöglichkeiten. Diese Schwierigkeit wird im Folgenden als Chance ausgenutzt,

dingung dimensional zusammengeführt. Beide Modelle, das bereichsabhängige und das -unab-hängige lassen sich nicht gegeneinander ausspielen, sondern zeigen auf, dass Variablenver-knüpfungen vom durch die Variablen insgesamt aufspannbaren dimensionalen Raum kontext-abhängig variieren können. Im Bereich der Lebensgewohnheiten liegt die für den zweiten Fak-tor Partizipation wichtige Variable Ehrenamtliche Tätigkeit bei einer Kommunalität von 0,64, die den Faktor ebenfalls auszeichnenden Variablen Beteiligung an Bürgerinitiativen und Kirch-gang liegen bei 0,55 und 0,42. Auch hier sieht man, dass die Ausprägung der Variable Glaube, Religion im Verhältnis zum Faktorenmodell für die Zufriedenheitsbedingungen individueller ausfällt als z.B. das Ehrenamt im Verhältnis zum Faktorenmodell für die Lebensgewohnheiten. Im selben Bereich haben die für den ersten Faktor Kulturangebote zentralen Variablen, nämlich Disco/Kino; Sport und Konzert/Theater etc. Kommunalitäten von 0,65, 0,50 und 0,51. Ähnlich hohe Kommunalitäten zeigen die Variablen des dritten Faktors Orientierung am Privatleben mit 0,69 und 0,68 Faktorenmodells für die Zufriedenheitsbedingungen.

D.h.: Im Bereich der Lebensgewohnheiten ist mit der Aufteilung Kultur vs. Partizipation und Privatleben eine etwas stabilere Dimensionalisierung möglich als im Bereich der stärker ein-schätzungsabhängigen Zufriedenheitsbedingungen. Im Bereich der Lebenskontrolle liegt die Kommunalität der Engagementvariable bei 0,91. Hier ist die Variable allein faktorbildend und sondert sich von den anderen Faktoren (Abhängigkeit von äußeren Mächten und Individualisti-sche Determination) deutlich ab, worauf auch die hohe Kommunalität zurückzuführen ist.

Page 114: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 115

um die Stabilität weiterbildungswirksamer Trennvariablen unterschiedlichen Grup-penteilungen gegenüber zu überprüfen.

Die Problematik der Clusteranalyse besteht im Rechenaufwand, so dass bei großen Datensätzen (N > 1000) die Clusteranzahl im Rahmen der üblichen Software (SPSS) voreingestellt werden muss. Da andererseits die Festlegung der Clusteranzahl zum Ergebnis der Clusteranalyse gehört, bedarf es zusätzlicher Auswertungsschritte zur Absicherung der Voreinstellung. In der Literatur wird die Vorschaltung einer Zu-fallsstichprobe empfohlen (Voß 1997, S. 294), so dass die rechnerische Ermittlung der Clusteranzahl bei ausreichend kleinem N erfolgen kann. Auf diese Möglichkeit wurde zunächst zurückgegriffen (10%-Stichprobe).11 Bei der Clusteranalyse ist wei-terhin festzulegen, mit welchem Verfahren gearbeitet werden soll. Die Verfahren unterscheiden sich im Hinblick auf ihre Tendenz zur Bildung ähnlicher Gruppen-größen bzw. im Hinblick auf ihre Sensibilität gegenüber Ausreißern und Kleingrup-penlösungen (Backhaus u.a. 2000, S. 354 ff.). Beim Hinzutreten einer neuen Gruppe zur jeweils vorhergehenden Aufteilung begünstigt das zugrunde gelegte Verfahren „Zentroid Linkage“ die Vermeidung kleiner Gruppengrößen (Schlosser 1976, S. 168; Backhaus u.a. 2000, S. 365), was auf der Linie des Schemabegriffs liegt, für den die Unterscheidung größerer Cluster Sinn macht. Bei „Zentroid Linkage“ handelt es sich um ein so genanntes hierarchisches Verfahren der Clusteranalyse (Fußnote. 12), das zur Ermittlung der Voreinstellung angewandt wurde. Der Koeffizientenver-gleich zeigt Heterogenitätssprünge bei der Drei- und Zwei-Clusterlösung (Tabelle 1). Am deutlichsten ergibt sich die Drei-Clusterlösung.

Die voreingestellte Clusteranalyse über den gesamten Datensatz erfolgte dann auf der Grundlage eines nicht-hierarchischen Algorithmus („k-means“) (Fußnote 11). Die Absicht, die Stabilität des Partizipationsschemas im Vergleich unterschiedlicher Cluster-Lösungen zu überprüfen, wird durch die Anwendung eines solchen Algo-rithmus besser unterstützt.12 Auf der Grundlage dieses Verfahrens (10%-Stichprobe

11 Eine Drei-Clusterlösung ergab sich ebenfalls bei einer zur Kontrolle durchgeführten 5%-

Stichprobe auf der Grundlage der über alle Items gebildeten Faktoren, deren Werte nicht im Einzelnen, sondern nur beschränkt auf die letzten sieben Schrittfolgen aufgeführt werden: 16,0034037, 16,4176331, 18,0032501, 18,9224739, 18,9444561, 25,9225597, 26,3117523. Die Werte zeigen einen ersten Heterogenitätszuwachs nach sechs Clustern.

12 Das Zentroid-Linkage-Verfahren ist ein hierarchisch-agglomeratives Verfahren der Zusammen-führung/Verschmelzung von Objekten zu Clustern. Dieses Verfahren benutzt in seinem Zu-sammenführungsalgorithmus die euklidische Distanz. Durch die beim Zentroid-Verfahren er-forderliche Mittelwertbildung kann sich eine Verschiebung des für die Clusterbildung zu be-rücksichtigenden „virtuellen“ Objekts, repräsentiert durch den Mittelwert der Clusterobjekte des neuen Clusters, ergeben. Liegt der neue Mittelwert „näher“ an den Rändern des neuen Clusters als die einzelnen Mittelwerte der zusammengeführten Cluster, so sinkt das Verschmelzungsni-veau. Daher kann das Verschmelzungsniveau beim Zentroid-Verfahren nicht monoton sein. Ur-

Page 115: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

116 ZA-Information 53

Tabelle 1 Abschließende zwanzig Schrittfolgen von Zentroid Linkage bei 10%

Zufallsauswahl (bereichsspezifisch gebildete Faktoren 99)

Zusammengeführte

Cluster Erstes Vorkommen

des Clusters

Schritte Cluster 1 Cluster 2

Koeffizient

Cluster 1 Cluster 2

Nächster Schritt

460 799 2785 12,989624 0 0 473 461 17 2443 13,1531754 459 0 464 462 1683 2942 13,3919706 0 0 467 463 100 551 13,4568405 397 434 464 464 17 100 13,6144476 461 463 466 465 330 3295 14,5892391 0 0 476 466 17 2454 14,8554878 464 0 469 467 540 1683 15,0286789 419 462 468 468 540 842 14,03549 467 0 472 469 17 1416 16,1302223 466 0 471 470 1756 2313 16,6371346 0 0 471 471 17 1756 14,5267591 469 470 472 472 17 540 17,3769932 471 468 473 473 17 799 17,7789021 0 460 474 474 17 2342 18,6233025 473 0 475 475 17 188 19,2084084 474 438 476 476 17 330 20,2148952 475 465 477 477 17 1625 20,8884335 476 0 478 478 17 2597 32,3548813 477 0 479 479 17 637 37,0960884 478 0 0

zur Ermittlung der Gruppenanzahl mit „Zentroid Linkage“ plus Gruppenbildung mit „k-means“ bei voreingestellter Gruppenanzahl) kommt eine durch unterschiedliche Objektreihenfolgen überprüfte Drei-Clusterlösung infrage (Fußnoten 11 und 12).

sache für eine solche Verschiebung ist die Unterschiedlichkeit der Anzahl der in den Clustern befindlichen Objekte. Die benutzte SPSS Prozedur „Quick Cluster“ beruht auf dem k-means Verfahren (Voß 1997, S. 296). Während hierarchische Verfahren wie „Zentroid Linkage“ eine einmal vorgenommene Zuordnung eines Objekts (Person) zu einem Cluster beibehalten, revi-dieren nicht-hierarchische Verfahren die Zuordnung der Objekte so lange, bis die homogenste Anordnung pro Cluster erreicht ist (vgl. Bortz 1999, S. 560; Bacher 2001). Um die Stabilität der gefundenen Cluster-Lösung zu überprüfen, wurde die Prozedur „Quick Cluster“ mit den Krite-rien k-means, missing listweise, Iterationen max. 100, Konvergenz 0 (bereichsspezifische Fak-torwerte 1999) insgesamt viermal mit unterschiedlichen Reihenfolgen der Objekte durchgeführt. Dies führte nicht zu veränderten Clusterzentren.

Page 116: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 117

Tabelle 2a Clusteraufteilung/Clustermittelwerte auf der Basis der über alle Items

1999 berechneten Faktorwerte der Drei-Clusterlösung mit Anteil von N und WB-Beteiligung in %:

Faktoren

Cluster

Lebe

nsst

anda

rd

Abh

ängi

gkei

t von

äuß

eren

M

ächt

en

Kul

tur

Rel

igiö

se P

raxi

s

Ber

ufse

rfolg

Hilf

e un

d G

esel

ligke

it

Par

tizip

atio

n

Indi

vid.

Det

. des

Leb

ens

Pol

itisc

hes

E

ngag

emen

t

Lebensstandard -0,10 0,08 -0,17 -0,13 -0,84 -0,13 -0,30 -0,07 -0,11

Sampleanteil: 42,1; WB-Beteiligung 21,3

Partizipation 0,05 0,07 0,39 0,52 0,01 0,19 1,62 -0,10 0,10

Sampleanteil: 17,6; WB-Beteiligung: 34,0

Lebensstandard 0,11 -0,04 0,00 -0,09 0,80 0,05 -0,39 0,11 0,06

Sampleanteil: 40,2¸ WB-Beteiligung 16,0

Tabelle 2b Clusteraufteilung/Clustermittelwerte auf der Basis der über Bereiche 1999 berechneten Faktorwerte der Drei-Clusterlösung mit Anteil von N und WB-Beteiligung in %:

Faktoren

Cluster

Lebe

nsst

anda

rd

Ber

ufse

rfolg

Orie

ntie

rung

am

P

rivat

lebe

n

Orie

ntie

rung

an

kolle

ktive

n V

erbi

ndlic

hkei

ten

Kul

tur

Par

tizip

atio

n

Hilf

e un

d G

esel

ligke

it

Abh

ängi

gkei

t von

äu

ßere

n M

ächt

en

Indi

vidu

alis

tisch

e D

eter

-m

inat

ion

des

Le

bens

E

influ

ss s

ozia

len

Eng

a-ge

men

ts

Lebensstandard 0,62 0,37 0,17 -,15 -0,36 -0,36 0,12 -0,06 0,73 -0,28

Sampleanteil: 35,8; WB-Beteiligung 14,7

Partizipation -0,31 -0,08 0,05 0,89 0,14 1,32 0,25 -0,04 -0,15 0,53

Sampleanteil: 22,5; WB-Beteiligung: 32,2

Abstand -0,38 -0,27 -0,17 -0,36 0,25 -0,41 -0,22 -0,08 -0,55 -0,05

Sampleanteil: 41,6; WB-Beteiligung 21,4

Page 117: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

118 ZA-Information 53

Tab. 2a gibt die Gruppenaufteilung auf der Basis der über alle Items 1999 berechne-ten Faktorwerte wieder. Tab. 2b enthält die gleiche Analyse auf der Grundlage der bereichsspezifisch vorgeordneten Items und Faktoren.

Um die Robustheit der Cluster-Lösungen zu kontrollieren, wurde für die Daten 1999 neben dem angesprochenen Verfahren ein von Bacher (2001) vorgeschlage-nes alternatives Verfahren zur Ermittlung der optimalen Clusteranzahl eingesetzt. Dies geschah paradigmatisch13 an den bereichsspezifisch ermittelten Faktorwerten aus der Erhebung von 1999. Das Bacher-Verfahren ermöglicht die Abwägung ver-schiedener Lösungen auf der Grundlage der F- und Eta- Statistik. Das Verfahren von Bacher benutzt Maßzahlen der Varianzanalyse, um die Eignung verschiedener Cluster-Lösungen – beginnend bei der Ein-Clusterlösung – festzustellen. Der Grundgedanke dabei ist, dass die Ein-Clusterlösung die Varianz zu null aufklärt (s.o.), und dass bei zunehmender Aufteilung aller Untersuchungspersonen in ver-schiedene Cluster die Varianzaufklärung innerhalb der Cluster wächst. Wenn jede Person ein Cluster für sich selbst bildet, ist die Varianzaufklärung am höchsten. Sie enthält dann aber auch keinerlei Information mehr.

Bacher (2001, S. 80 ff.) verwendet die Eta- und F-Statistik aus der Varianzanalyse. Die Eta-Statistik bezieht sich auf die durch die Streuung in den Clustern aufgeklärte Gesamtvarianz. Bei zehn Clustern wird wie bei der F-Statistik auch kein Fortschritt mehr erreicht: 0,00; 0,10; 0,16; 0,21; 0,25; 0,28; 0,28; 0,33; 0,32; 0,35. Der Anstieg flacht nach dem dritten, nach dem sechsten Mal und nach dem achten Mal ab. Die parallel eingesetzte F-Statistik bezieht sich auf den Fortschritt der erklärten Streu-ung bei fortschreitender Clusteranzahl. Bei dieser Maßzahl bildet der höchste Wert den Maßstab: -99,00; 506,62; 447,86; 417,87; 390,99; 362,04; 304,09; 320,23; 275,50; 276,68. Hier bietet sich die Zwei-Clusterlösung an. Aber auch die Drei-Clusterlösung erreicht einen vergleichsweise passablen Wert. Nach der Sechs-Clusterlösung verschlechtert sich die erklärte Streuung deutlich. Unter Zugrundele-gung der Maßzahlen bietet sich der Vergleich mit der Zwei- und mit der Sechs-Clusterlösung an. Unter Anwendung des Konzepts von Bacher (2001) sind Zwei-Drei- und Sechs-Clusterlösungen vertretbar.14 Da sich die beiden Verfahren, also das Bacher-Verfahren und das Verfahren Vorauswahl mit „Zentroid Linkage“ plus voreingestellte Endanalyse mit „k-means“ (s.o.) in der Drei-Clusterlösung über-

13 Auf Grund der sowohl zwischen den Wellen wie auch zwischen den Faktor- und Clustermodel-

len stabilen Lösungen wurde eine auf die Welle 99 beschränkte Anwendung des Bacher-Verfahrens zur Überprüfung der Robustheit für ausreichend gehalten.

14 Zum Vergleich verschiedener Cluster-Lösungen in der Milieuforschung vgl. auch Giegler (1994, S.259), der die Eta-Statistik benutzt.

Page 118: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 119

schneiden, wird diese Lösung inhaltlich ausgewertet. Die Zwei- und Sechs-Cluster-lösungen werden als „Testfälle“ präsentiert.

Die Benennung der Cluster ergibt sich aus der clusterspezifischen Kombination der Faktorwerte und der durch sie vertretenen Bündelung von Faktoren zu Clustern (Tab. 3).

Im Cluster „Abstand“ findet man vor allem Personen, die weder von der individua-listischen Bestimmbarkeit des Lebens überzeugt sind noch davon, dass nur externe Mächte das Leben regieren, für die Merkmale des Lebensstandards nicht oder nicht mehr zufriedenheitsrelevant sind.

Im Vergleich zum Cluster „Lebensstandard“ ist die Bedeutung von lebensstandard-bezogenen Merkmalen (Wohnung, Einkommen, Mobilität) für die eigene Zufrie-denheit in den Clustern „Partizipation“ und „Abstand“ deutlich geringer.

Öffentliche Räume werden durch beide Cluster nahezu komplementär besetzt. Im einen Fall fungiert das öffentliche Leben in Parteien, Bürgerinitiativen, Kirchen etc. als Partizipationsschema, das sich mit ausgeprägter Kollektivorientierung und mit der Bejahung sozialen Engagements verbindet; im anderen Fall werden diese Orien-tierungen negativ besetzt.

Die als milieuspezifische Schemata interpretierten objektbezogenen Zusammenfas-sungen der Faktoren zu Clustern werfen die Frage auf, welche Faktoren statistisch als besonders schema- bzw. typenbildend gelten können. Dies allein über die Höhe der Clusterzentren und die Ausprägung der von der Clusterzugehörigkeit abhängig gemachten Weiterbildungsvariable zu entscheiden, ist unvollständig. Schemabil-dende Faktoren sollten sich dadurch auszeichnen, dass ihre Varianz mittels der Clusterzugehörigkeit nennenswert aufklärbar ist. Tabelle 2 zeigt die Faktoren mit Werten jeweils >,2 (Eta2 ).

Page 119: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

120 ZA-Information 53

Tabelle 3 Bereichsspezifisch (im Vergleich der Cluster-Lösungen 2,3 und 6

Cluster in Klammern) und über alle Items (Drei-Clusterlösung, Spalte 3) gebildete Faktoren 1999 mit jeweils Eta2 >,2 (Varianzaufklä-rung durch die Unterschiedlichkeit der clusterspezifischen Ausprä-gungen im Drei-Clustermodell)

Faktor Lebensstandard 0,06 (2)/0,22(3)/0,205(6)

Faktor Orientierung an kol-lektiven Verbindlichkeiten 0,307(2)/0,242(3)/0,286(6)

Faktor Individualistische De-termination 0,025(2)/0,332(3)/0,261(6) 0,234

Faktor Partizipation 0,222/(2)0,505(3)/0,577 (6) 0,258

Faktor Religiöse Praxis 0,228

Schemabildend in diesem Sinne sind die Faktoren „Lebensstandard“, „Partizipation“, „Orientierung am Gemeinschaftsleben“ und „Individualistische Determination“, deren Bezeichnungen sich mit Ausnahme des Clusters „Abstand“ auch in den Cluster-namen der Drei-Clusterlösung niederschlagen. Die Streuung des Faktors Partizi-pation lässt sich im Vergleich der Faktoren am besten so auf die Cluster verteilen, dass es zu vergleichsweise homogenen Ausprägungen innerhalb der Cluster kommt und infolgedessen auch die jeweiligen Clusterzentren des Faktors den relativ zu den anderen Faktoren höchsten Informationsgehalt über die in den einzelnen Clustern versammelten Ausprägungen bieten. Die Varianzaufklärungsleistung des Faktors Partizipation lässt sich unter allen der hier zugrunde gelegten Variationsbedingungen (unterschiedliche Cluster-Lösungen, Faktorberechnung über alle Items) reprodu-zieren (Tabelle 3). Bei der Sechs-Clusterlösung ist die Zahl der schemabildenden Faktoren am höchsten und damit die durch die Dimensionen herbeigeführte Diffe-renzierung der Cluster am stärksten ausgeprägt. Die Faktoren Kultur (0,344) und Orientierung am Privatleben (0,488) kommen dann noch hinzu.

Die Cluster unterscheiden sich hinsichtlich der Berufserfolgsorientierung: Das Par-tizipationsschema weist eine durchschnittliche, das Abstandsschema eine unter-durchschnittliche Ausprägung des Faktors auf (-0,08; -0,27). Das Partizipations-schema ist relativ gesehen eher mit Berufserfolg als mit Lebensstandard verknüpft. Hier ist denkbar, dass nicht-instrumentelle, am Öffentlichkeitscharakter des Berufs orientierte Haltungen sich in den Ausprägungen des Partizipationsschemas bemerk-bar machen und für die angesprochene faktorenbezogene Zuordnung des Einkom-mens zum Lebensstandard – und nicht zum Berufserfolg – mit verantwortlich sind.

Page 120: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 121

3.2.1 Resultate der Zwei- und Sechs-Clusterlösung

Als Resultat der Drei-Clusterlösung kann man festhalten: Öffentliche Räume von Bürgerinitiativen, Parteien, Kirchen etc. stellen Zusammenhänge bereit, die zur Wei-terbildungsbeteiligung anregen und sich im Medium einer erhöhten Weiterbildungs-bereitschaft mit dem Lebensstil von Personen verknüpfen. Bindungen an solche Zusammenhänge des öffentlichen Lebens fördern die Weiterbildungsbeteiligung. Ihre Koppelung mit einer eher zurückhaltend-indifferenten Ausprägung von Fak-torwerten des Lebensstandards und Berufserfolgs macht die Präferenzen sichtbar und prägt den Typus aus, der das Cluster Partizipation sozio-logisch auszeichnet. Der Übergang zur Sechs-Clusterlösung spitzt die Bedeutung des Partizipationsfak-tors für die Clusterbildung zu, dessen Mittelwert im entsprechenden Cluster auf das Zweifache der Streuung (bezogen auf den gesamten Datensatz) ansteigt. Die das Profil definierenden Mittelwerte der anderen Faktoren (unterdurchschnittliche Ori-entierung am Lebensstandard, durchschnittliche Bedeutung des Berufserfolgs und des Privatlebens, Orientierung an kollektiven Verbindlichkeiten, Einfluss sozialen Engagements) bleiben der Tendenz nach erhalten. Die durchschnittliche Beteiligung am Kulturkonsum vergrößert sich. Gleichzeitig steigt die Weiterbildungsbeteiligung im nunmehr verkleinerten Cluster an (s. Tab. 4). Die schärfere Profilierung führt im Gegencluster dazu, dass dort von einem Partizipationsindifferenzschema gespro-chen werden kann: Unterdurchschnittlicher Kulturkonsum verbindet sich mit deut-lich negativen Ausprägungen der direkt/indirekt auf Beteiligung beziehbaren Faktoren (Orientierung an kollektiven Verbindlichkeiten, Partizipation, Hilfe und Gesellig-keit, Einfluss sozialen Engagements).

Die obigen Auswertungen (Tab. 2a, 2b und 3) zeigen, dass eine generelle Orientie-rung der Lebenspraxis an Kulturangeboten clusteranalytisch auf positive Zusam-menhänge mit den Ausprägungen des Partizipationsschemas hindeutet. Wer in Bür-gerinitiativen, Vereinen, Parteien, Verbänden etc. tätig ist, bewegt sich durchschnitt-lich auch auf einem höheren Niveau der Wahrnehmung von Kulturangeboten – und umgekehrt. Allerdings sind solche Aussagen, wenn sie auf der Grundlage des Ver-gleichs von Clusterzentren, also von Lagemaßen, getroffen werden, lediglich Aus-sagen über Zusammenhänge zwischen Gruppen. Inwieweit ein solcher Zusammen-hang auch zwischen Faktoren besteht, kann man nicht feststellen, wenn bei ortho-gonaler Aufstellung der Variablen und Faktoren die Faktoren einem gemeinsamen Faktorenmodell entstammen.

Für begründet ausgewählte Teilsegmente aus N ist eine solche Feststellung jedoch möglich. Grundsätzlich kann man hier einen durch die Objektklassifikation nach Clustern im Unterschied zur Variablenklassifikation nach Faktoren erzeugten Infor-

Page 121: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

122 ZA-Information 53

mationsvorteil nutzen: Zusammenhängende Ausprägungen zwischen Variablen und ihre Bündelung zu Faktoren ergeben sich über die Gesamtzahl der Objekte einer Population oder Teilpopulation. Schneidet man aus der Gesamtzahl einer Populati-on/Teilpopulation Gruppen (z.B. zwei Cluster mit auseinander liegenden Cluster-zentren) aus, können im ersten Schritt durch den Vergleich der Clusterzentren indi-zierte Abhängigkeiten in Teilsegmenten sichtbar werden – wie ein Vergleich zwi-schen dem Partizipationsindifferenz- und dem Partizipationstypus in der Sechs-Clusterlösung verdeutlicht (Tab. 4). (Die Umbenennung in Partizipationsindifferenz wird durch die andere Clusterzahl nahe gelegt. Es entspricht dem Cluster Lebens-standard der Drei-Clusterlösung.) Nachvollziehen auf Variablenebene lassen sich derartige Abhängigkeiten dann im zweiten Schritt durch die Berechnung von Korre-lationen zwischen Faktorwerten auf der Grundlage der dafür durch Ausnutzung der Clustertrennungen ausgeschnittenen Teilsegmente der Untersuchungsgesamtheit. Fasst man die Cluster (Tab. 4) mit jeweils hoher und niedriger Ausprägung der Clusterzentren für die Faktoren „Kultur“ und „Partizipation“ zusammen und be-rechnet dann die Korrelationen in dem so gebildeten Teilsegment, geht also vom Zusammenhang zwischen Lage- auf den zwischen Dispersionsmaßen (Kovarianz, Korrelation) über, dann zeigt sich eine negative Zusammenhangsrichtung (und zwar im Unterschied zu den Clusterzentren, die auf Aggregatebene einen positiven Zu-sammenhang ergeben). Die Interpretation dazu ist folgende: Personen mit über-durchschnittlicher Kulturorientierung im nunmehr aus zwei Clustern der Sechs-Clusterlösung neu gebildeten Teilsegment zeigen eine unterdurchschnittliche Orien-tierung an Partizipation – und umgekehrt. Der positive Zusammenhang zwischen den Aggregatwerten kann z.B. damit erklärt werden, dass Personen im Cluster Par-tizipation unter das dort geltende hohe Durchschnittsniveau fallen, wenn sie sich stark an Kultur beteiligen – und vice versa. Es handelt sich also um eine zwischen Kontext- und Individualebene unterscheidbare, auf den Umgang mit Belastung und Zeit verweisende Mehrebenenthematik, die sich hier andeutet, aber nicht näher verfolgt werden kann.15

In anderer – nämlich positiver Richtung – gilt der Zusammenhang auch für die Be-ziehung zwischen „Partizipation“ und „Orientierung an kollektiven Verbindlichkei-ten“ (s. Fußnote 15).

15 Korr. –0,26 zwischen Partizipation und Kultur für die Cluster mit dem höchsten und niedrigsten

Wert für Partizipation innerhalb der Sechs-Clusterlösung. Bei den Variablen Partizipation und Orientierung an kollektiven Verbindlichkeiten: Korr. 0,47

Page 122: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 123

Tabelle 4 Clusteraufteilung/Clustermittelwerte (bereichsspezifische Faktorwerte

1999) in der Sechs-Clusterlösung. Cluster mit der höchsten und nied-rigsten Weiterbildungsbeteiligung

Faktoren

Cluster

Lebe

nsst

anda

rd

Ber

ufse

rfolg

Orie

ntie

rung

am

Priv

atle

ben

Orie

ntie

rung

an

kolle

ktiv

en

Ver

bind

lichk

eite

n

Kul

tur

Par

tizip

atio

n

Hilf

e un

d G

esel

ligke

it

Abh

ängi

gkei

t von

äuß

eren

M

ächt

en

Indi

vidu

alis

tisch

e

Det

erm

inat

ion

des

Lebe

ns

Ein

fluss

soz

iale

n

Eng

agem

ents

Partizipati-onsindif-ferenz

,10 ,32 ,13 -,82 -,60 -,35 -,62 ,03 ,11 -,75

Sampleanteil: 20,7; WB-Beteiligung 13,8

Partizi-pation -,29 -,01 ,01 ,92 ,34 2,13 -,10 -,10 -,22 ,59

Sampleanteil: 10,7; WB-Beteiligung: 36,2

Tabelle 5 Clusteraufteilung/Clustermittelwerte (Faktorwerte 1999) der Zwei-

Clusterlösung mit Anteil von N und Weiterbildungsbeteiligung in v.H.

Faktoren

Cluster

Lebe

nsst

anda

rd

Ber

ufse

rfolg

Orie

ntie

rung

am

Priv

atle

ben

Orie

ntie

rung

an

kolle

ktiv

en

Ver

bind

lichk

eite

n

Kul

tur

Par

tizip

atio

n

Freu

nde

Abh

ängi

gkei

t von

äuß

eren

M

ächt

en

Indi

vidu

alis

tisch

e D

eter

min

atio

n

des

Lebe

ns

Ein

fluss

soz

iale

n E

ngag

emen

ts

Partizipationsindifferenz ,21 ,09 -,07 -,51 -,22 -,42 -,21 ,03 ,14 -,43

Sampleanteil: 55,1; WB-Beteiligung 16,3

Partizipation -,28 -,10 ,09 ,60 ,29 ,55 ,27 -,03 -,18 ,53

Sampleanteil: 44,9; WB-Beteiligung: 27,7

Page 123: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

124 ZA-Information 53

Der Übergang zur Zwei-Clusterlösung (Tab. 5) entdifferenziert die Profile zwar, die Grundstruktur des Partizipationsschemas bleibt jedoch erhalten. Das Partizipations-schema unterscheidet die beiden Cluster voneinander und sorgt für eine erkennbare Separierung der Beteiligungsquoten, die bei dann bei fortschreitender Clusterausdif-ferenzierung zunimmt.

4 Partizipationsschema und berufsinstrumentelle Rahmung als unabhängige Variablen in einem Regressionsmodell

Die Frage, die im nächsten Schritt aufgegriffen wird, bezieht sich auf äußere berufs-instrumentelle Stimuli: inwieweit nämlich solche Stimuli den in der milieuspezifischen Grundlegung der Weiterbildungsbeteiligung begründeten Effekt vermindern bzw. ihm hinzutreten (= Haupteffekt); oder aber: inwieweit sie nicht nur von außen ein-wirken, sondern gleichzeitig innerer Bestandteil der milieuspezifischen Grund-legung selbst sind, dort also bereits in Form einer korrespondierenden, im Milieu bereits ausgeprägten Disposition (= Interaktion) existieren.

Das Verfahren der Logit-Modellbildung versucht die empirischen Beobachtungs-werte mit möglichst wenig Variablen bzw. Merkmalen vorherzusagen. Ziel der Lo-git-Analyse ist es, die empirischen Beobachtungswerte mit möglichst wenig Variab-len bzw. Merkmalen vorherzusagen. Folglich besteht immer auch eine Vorhersage-lücke, in der die Empirie unbekannter Merkmale wie auch derjenigen Merkmale untergebracht ist, die aufgrund ihrer geringen Bedeutung im Modell selbst keinen Platz haben (im Einzelnen vgl. Urban 1993). Die in Tabelle 4 angegebenen Effekt-koeffizienten beziehen sich auf das Verhältnis, in dem sich die Wahrscheinlichkeit des Auftretens der abhängigen Variable verändert, wenn sich die Ausprägung der betreffenden unabhängigen Variable um eine Einheit erhöht, also bei 0/1 dichotomi-sierten Variablen z.B. von null auf eins springt. Die Logit-Regression kann hier aufgrund der vorgabebedingten Restriktionen keinen umfassenden Anspruch auf Modellbildung erheben, sondern wird ihrem Anspruch nach auf die Indizierung, vor allem aber auf den Vergleich von Variablen im Hinblick auf den Wahrscheinlich-keitsübergang begrenzt. Vorgestellt werden vier Modelle mit der Drei-Cluster-lösung (bereichsspezifische Faktorwerte 1999) bei Lebensstil/Milieu.16 Berechnet wurden die Modelle auch über die anderen Cluster-Lösungen (Fußnote 16).

16 Logistische Regressionen wurden auch auf der Basis der Zwei-Drei und Sechs-Clusterlösungen

berechnet. Diese Lösungen ergeben kein anderes Modell. Bei der Zwei-Clusterlösung liegt der Effektkoeffizient des Partizipationsclusters bei 1,004, bei der Sechs-Clusterlösung bei 2.033 (jeweils Modell 4). Die Unabhängigkeit der Faktoren für die beruflich instrumentelle Rahmung bleibt in beiden Fällen erhalten. Bei der Sechs-Clusterlösung kommt es zum gleichen Modell

Page 124: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 125

Tabelle 6 Binäres Logit-Modell der Weiterbildungsbeteiligung; delogarithmierte

unstandardisierte Regressionskoeffizienten nach Variablen

Haupteffekte Zeilen 1-7

Interaktionen Zeilen 8-9

Modell 1 Modell 2 Modell 3 Modell 4

Cluster 1 (“Lebensstandard”) .802 .822 .814 .823

Cluster 2 (“Partizipation”) 1.808 1.792 1.808 1.805

Cluster 3 (“Abstand”)

Referenz-kategorie

Referenz-kategorie

Referenz-kategorie

Referenz-kategorie

Anpassungs- und aufstiegsbezogene berufliche Rahmung (Faktorwerte)

6.666 6.897 6.666 5.780

Wechselbezogene berufliche Rahmung (Faktorwerte)

1.186 1.239 1.186 1.466

Alter Ohne 1.310 Ohne Nicht im Modell

Geschlecht Ohne Nicht im Modell Ohne Nicht im Modell

Zeile 4/Cluster Ohne Ohne Nicht im Modell Nicht im Modell

Zeile 5/Cluster Ohne Ohne Nicht im Modell Nicht im Modell

Zeile 4/Alter Ohne Ohne Ohne Nicht im Modell

Zeile 5/Geschlecht/Alter Ohne Ohne Ohne 1.340

Nagelkerke-R 0,21 0,21 0,21 0,22

Die delogarithmierten Koeffizienten stellen Gewichte für den Wahrscheinlichkeits-übergang aus den Kovariaten (= den durch die Variablenausprägungen gebildeten Gruppen) in die Gruppe der Weiterbildungsbeteiligten dar. Mit 21% (Nagelkerke-R) ist die Varianzaufklärung in allen Modellen mäßig, liegt aber durchaus innerhalb der auch von Behringer (1999, S. 336 ff.) bei ihren SOEP-Analysen erzielten Mo-dellverbesserung. Die Interaktionen wurden aufgrund ihrer inhaltlichen Bedeutung

wie bei der Drei-Clusterlösung. Zusätzlich zur Varianzaufklärung ist der goodness of fit ein Maß für die Modellgüte. Sie ist dann gegeben, wenn die Nullhypothese gegenüber dem saturier-ten Modell, das der Realität entspricht, nicht zurückgewiesen werden kann. SPSS gibt das Hos-mer-Lemeshow Maß an, eine spezifische Variante des goodness of fit, das mit p = 0,544 für das Modell mit der Drei-Clusterlösung zufrieden stellend ausfällt (Backhaus u.a., a.a.O., S. 141).

Page 125: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

126 ZA-Information 53

aufgenommen. Für die erklärende Kraft des Modells sind sie verzichtbar, da 21% Varianzaufklärung schon mit den Haupteffekten erreicht werden. Im Rahmen des Logit-Modells führt die Zugehörigkeit zu den Ausprägungen des ersten Faktors der beruflich instrumentellen Rahmung am ehesten den Wahrscheinlichkeitsübergang zur Gruppe der Weiterbildungsbeteiligten bzw. der Weiterbildungsabstinenten her-bei. Dieser Faktor repräsentiert den Reproduktions- und Steigerungsaspekt des indi-viduell erworbenen Humankapitals. Er verweist auf die in der Personalökonomie hervorgehobene Stabilität der beruflichen Strukturierung des Arbeitsvermögens (vgl. Sadowski 2002, S. 330). Den zweitstärksten Prädiktor stellt das Partizipations-schema.

Vom Geschlecht und vom Alter geht jeweils kein nennenswerter Zusammenhang aus. Er kommt deshalb in den Modellen als Haupteffekt nur mäßig ausgeprägt beim Alter in Modell 2 vor.17 Der Effekt des Alters in Modell 2 geht in Modell 4 auf die Interaktion mit wechselbezogener beruflicher Rahmung über. Dieser zweite Faktor der beruflich instrumentellen Rahmung repräsentiert den Mobilitätsaspekt des indi-viduell erworbenen Humankapitals.

Die Ergebnisse der Logistischen Regression sollen die These von der dualen, zwi-schen Milieuabhängigkeit und beruflich instrumenteller Rahmung aufgeteilten Be-teiligungsstruktur der Weiterbildung stützen. Man kann die Modelle dann, wie folgt, lesen: Modell 1 prüft den eigenständigen Beitrag der unabhängigen Variablen; Modell 2 dient der Absicherung des Modells gegenüber Alter und Geschlecht als Drittvariablen; Modell 3 kontrolliert die Unabhängigkeit der Wirkung gegenüber Interaktionen; Modell 4 dient der Absicherung von Modell 3 gegenüber Alter und Geschlecht als Drittvariablen. Es zeigt sich, dass Alter und Geschlecht nur über eine dreistellige Interaktion (wechselbezogene berufliche Rahmung/Alter/Geschlecht) in das Modell eingehen: Bei geplantem Stellenwechsel gibt es einen leichten Weiter-bildungsbias zugunsten jüngerer Frauen (vgl. dazu Becker/Schömann 1999, S. 104). (Eine kontrollhalber durchgeführte weitere Logit-Analyse, die die Weiterbildungs-beteiligung von Teilzeit- und Vollzeitbeschäftigten untersuchte, und die hier nicht

17 Auf Kreuztabellenebene findet man folgenden Zusammenhang: 22,7% der Männer, 19,9% der

Frauen im Datensatz geben an, sich an Ausbildung, Weiterbildung o.ä. zu beteiligen. Im Cluster Partizipation (Drei-Clusterlösung) beteiligen sich 30,0% der Frauen, 33,6% der Männer, was in diesem Zusammenhang den sozusagen querschnittlichen Charakter der Partizipationsvariable verdeutlicht. Unabhängigkeit bedeutet, dass Partizipation sich sozusagen querschnittlich zu an-deren ebenfalls weiterbildungsrelevanten Variablen verhält. Diese definieren dann das Niveau, auf dem sich der Zusammenhang darstellt. Als Beispiel mögen die Weiterbildungsbeteiligungs-raten von niedrig qualifizierten Erwerbstätigen in den Clustern gelten: Lebensstandard 7,2; Par-tizipation 13,1; Abstand 6,2.

Page 126: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 127

mehr im Einzelnen dokumentiert wird, ergab keine Unterscheidung dieser beiden Gruppen bzgl. ihrer Weiterbildungsbeteiligungen.)

5 „Lebensstandard“, „Partizipation“ und „Abstand“ als Schemata: An-schlussfähigkeit und Stabilität im Hinblick auf die Milieuforschung

Die direkte Vergleichbarkeit der Schemata mit der Spezifikation von Milieukonzepten anderer Studien ist nicht unmittelbar möglich. Deshalb bereitet es Schwierigkeiten, von Milieus in einem verallgemeinernden Sinne zu sprechen. Allerdings ist es möglich, auf Entsprechungen bzw. Widersprüche zu achten und auf Milieugrenzziehungen in vorliegenden Untersuchungen hinzuweisen, die sich auch mit Hilfe der SOEP-Items identifizieren lassen. Entscheidend ist, dass Primäranalysen von Milieus das Milieu-konzept stärker ausdifferenzieren und problemspezifisch auswerten können. Schulze (1992) hat in seiner Studie die Unterscheidbarkeit von Erlebnismilieus in den Vor-dergrund stellen und dabei zwischen Selbstverwirklichungs-, Unterhaltungs-, Integrations-, Niveau- und Harmoniemilieus trennen können. Diesen Differenzie-rungen lassen sich die angegebenen Cluster „Lebensstandard“, „Partizipation“ und „Abstand“ als Schemata sinngemäß und auf empirisch erwartbarerweise unter-schiedlichem Niveau zuordnen. (Gleiches gilt für die beruflich instrumentelle Rah-mung als Schema, was in der bildungsbezogenen Milieuforschung mit dem Vorlie-gen von Abhängigkeiten gelegentlich verwechselt wird.)

Unterhalb der Schemata „Lebensstandard“, „Partizipation“ und „Abstand“ sind sehr unterschiedliche Subdifferenzierungen denkbar, die je nach Aggregation und Vari-ablenzusammenstellung an das Konzept der Erlebnismilieus oder an andere Kon-zepte der Milieuabgrenzung grundsätzlich angeschlossen werden können. Inwieweit dies tatsächlich möglich ist, lässt sich nicht direkt feststellen, es sei denn, man führt eine Sekundäranalyse der infrage kommenden Milieuforschung durch. Auf indirekte Weise kann man jedoch auf hohe Anschließbarkeit an andere Spezifikationen des Milieukonzepts dann setzen, wenn „Partizipation“ in verschiedenen Milieu- und Beteiligungsanalysen auftaucht, „Partizipation“ als Faktor also eine offensichtlich wirksame Makrodimension in der Zusammensetzung von Milieus auch in anderen Studien zum Ausdruck bringt (Übersicht 1; vgl. auch Friebel u.a. 2000, S. 275). Darüber hinaus ist hohe Anschließbarkeit auch deshalb zu erwarten, weil der Faktor Partizipation in Auflösungen mit unterschiedlicher Clusteranzahl wirksam wird und sich als Größe herausstellt, die alternativen, statistisch aber noch vertretbaren Grup-pierungsentscheidungen gegenüber robust bleibt, sich also sowohl differierenden Gruppengrößen wie auch differierenden gruppeninternen Ausprägungen der Merk-male gegenüber bewährt (Tab. 4 und 5).

Page 127: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

128 ZA-Information 53

Die Orientierung an lebensstandardbezogenen Merkmalen findet sich bei Schulze (1992) z.T. im Harmonie- und dann vor allem im Integrationsmilieu wieder. Integ-rationsmilieus werden markiert durch mittleres/gehobenes Bildungsniveau, eigenes Haus, ordentlicher Garten, Mittelklasseauto etc., für Harmoniemilieus kommen niedriges Bildungsniveau, Gemütlichkeit, Fernsehorientierung, Kaffeefahrten, Groß-wohnanlagen auf Mallorca etc. als Markierungen in Betracht. In diesen Milieus kön-nen sich jedoch auch Partizipationsschemata entwickeln, die das jeweilige Milieu subdifferenzieren und in spezifischen öffentlichen Räumen wirksam werden, wie z.B. Analysen über den Beteiligungshintergrund des gewerkschaftsnahen Bildungs-trägers „Arbeit und Leben“ (vgl. Vester u.a. 1997; Harney und Hartz 1999) und über die kirchliche Erwachsenenbildung zeigen (vgl. Harney und Keiner 1992). In den Öffentlichkeiten der Sportvereine, der gewerkschaftlichen Bildungsvereine, der SPD-Ortsgruppen trifft man sowohl Harmonie- wie auch Integrationsmilieus mit partizipationsschematischen Lebensgewohnheiten und Relevanzen an. Partizipations-schemata wird man ebenso in den von Schulze (1992, S. 213) identifizierten Selbst-verwirklichungsmilieus finden können.

Der inhaltliche Zusammenhang bestätigt sich auch in den Ergebnissen einer cluster-analytischen Milieustudie von Giegler (1994, S. 262 ff.), der Lebensstile in Ham-burg untersucht hat. Bei Giegler entsprechen die Merkmale der „urban professio-nals“ teils den Merkmalen des Selbstverwirklichungsmilieus, teils denen des Niveau-milieus bei Schulze (1992).

Den Arbeiten von Barz (2000) sowie von Tippelt u.a. (2003) kann man entnehmen, dass allein schon die Volkshochschule als Institution von sehr unterschiedlichen Milieus beansprucht wird: vom konservativ-gehobenen, vom kleinbürgerlichen Milieu über das neue Arbeitnehmer-, das Aufstiegs-, das Selbstverwirklichungsmilieu, das alternative Milieu bis hin zum technokratisch-liberalen Milieu und zum traditi-onellen Arbeitermilieu. Gleiches gilt auch für die Inanspruchnahme anderer Träger der Weiterbildung, deren Angebote dann aber nicht im gesamten Spektrum, sondern in den eher milieunahen Segmenten bekannt sind und angenommen werden. Ledig-lich das traditionslose Arbeitermilieu, das sich generell durch Bildungsabstinenz auszeichnet, bleibt den Weiterbildungsinstitutionen im Großen und Ganzen fern (ebenda, S. 97 ff.).

In den milieubezogenen Weiterbildungsbeteiligungsanalysen werden milieu- bzw. lebensstilunspezifische Impulse der Beteiligung nicht ausgewiesen. In gewisser Weise wird alles zum Milieu. Solche Impulse wie auch ihre Unterscheidbarkeit von lebensstilspezifischen Impulsen lassen sich vor dem Hintergrund der Analyse der SOEP-Daten jedoch begründet vermuten. Im Vergleich unterschiedlicher Aggrega-

Page 128: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 129

tionen der SOEP-Daten sowohl auf der Ebene der Variablen- wie auch auf der Ebe-ne der Objektzusammenfassungen erweist sich die Unterscheidung als stabil.

Lebensstilunspezifische, beruflich gerahmte Impulse der Weiterbildungsbeteiligung sind quer durch die milieuspezifischen Schemata hindurch fassbar und stützen sich auf einen die Zukunft der eigenen Erwerbsarbeit definierenden Zweck-Mittel-Zusammenhang. Unter soziologischen Gesichtspunkten ist durchaus vorstellbar, dass sich diese einem zukunftsbezogenen Kalkül untergeordnete beruflich instru-mentelle Rahmung der Weiterbildungsbeteiligung mit milieuspezifischen Schemata durchmischt und lediglich als Durchschnittsmenge (Interaktion) die Weiterbil-dungsbeteiligung über die von den Randsummen her erwartbare Beteiligungswahr-scheinlichkeit hinaus erhöht. In diesem Fall würde es eine von Milieus und Lebens-stilen unabhängige Beteiligung an der Weiterbildung nicht geben. Die hier vertrete-ne These lautet demgegenüber, dass es eine solche Unabhängigkeit gibt, und dass demzufolge die Weiterbildung eine unter Aneignungsgesichtspunkten zwischen lebensstilunspezifischen und lebensstilspezifischen Beteiligungsformen angelegte duale Struktur aufweist. Die Beteiligung bindet sich an eine alltagspraktischen Ver-ankerungen gegenüber indifferente und deshalb zwischen unterschiedlichen Mus-tern der Lebensführung verschiebbare Utilität, was sie von der lebensstilspezifi-schen Beteiligung grundsätzlich trennt.

Der weitergehende empirische Beleg der so gestützten Annahme ist gleichwohl an die Analyse von Milieus selbst gebunden. Empirisch kann man nicht ausschließen, dass Variablen und durch sie zustande gebrachte Dimensionalisierungen auffindbar sind, die den Partizipationsfaktor und seine typologische Bedeutung als milieuspezi-fisches Schema zugunsten anderer Aggregationen auflösen. Einen solchen Erkennt-nisgewinn kann man methodisch jedoch nur hervorbringen, wenn man dem Partizi-pationsfaktor eine besondere Bedeutung im Forschungsdesign gibt: z.B. indem man entsprechende Variablen im Design stark ausdifferenziert, die Variablen dann un-abhängig von Milieuclusterungen ordnet und anschließend einer Zusammenhangs-analyse mit milieuspezifischen Gruppenzugehörigkeiten wie auch mit Variablen der beruflich instrumentellen Rahmung unterzieht. Für das dazu erforderliche Daten-analyseniveau wird neben dem inhaltlichen Hinweis auf die kategoriale, der Wei-terbildungsforschung bislang fremde (vgl. Tippelt u.a. 2003) Unterscheidung von Milieu und Nicht-Milieu mit der vorliegenden Untersuchung auch ein methodisch konzeptioneller Vorschlag gemacht, der den Vergleich von Aggregationsebenen sowohl der Cluster- wie auch der Faktoranalyse einschließt.

Page 129: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

130 ZA-Information 53

Anhang

Tabelle A1 Faktoranalyse über alle Variablen 1994 (Items mit Ladungen >.5)

1. Faktor Abhängigkeit von äußeren Mächten

Varianzaufkl. 9,9

2. Faktor Orientierung am gesunden und angenehmen Leben

Varianzaufkl. 8,0

3. Faktor Kultur im Alltagsleben

Varianzaufkl. 7,2

4. Faktor Beruf und Arbeit

Varianzaufkl. 7,0

Es kommt etwas Un-erwartetes dazwischen

Es kommt immer an-ders, als man denkt

Pläne lassen sich nicht realisieren

Keiner kann seinem Schicksal entgehen

Wenn ich etwas be-komme, dann aus Glück

Freizeit wichtig für Zufriedenheit

Gesundheit wichtig für Zufriedenheit

Umweltschutz wichtig für Zufriedenheit

Wohnung wichtig für Zufriedenheit

Kino, Tanz-, Sportver-anstaltungen

Aktiver Sport

Besuch kultureller Veranstaltungen

Arbeit wichtig für Zu-friedenheit

Berufl. Erfolg wichtig für Zufriedenheit

Einkommen wichtig für Zufriedenheit

5. Faktor Glaube und Religion

Varianzaufkl. 6,5

6. Faktor Individualistische De-termination des Le-bens

Varianzaufkl. 6,1

7. Faktor Hilfe und Geselligkeit im Alltagsleben

Varianzaufkl. 5,6

8. Faktor Partizipation im All-tagsleben

Varianzaufkl. 5,5

Kirchgang, religiöse Veranstaltungen

Religion wichtig für Zufriedenheit

Bestimme Leben selbst

Leben vom Verhalten bestimmt

Das Geplante wird auch zur Wirklichkeit

Mithelfen bei Freun-den, Verwandten, Nachbarn

Geselligkeit mit Freun-den, Verwandten, Nachbarn

Beteiligung in Bürger-initiativen, Parteien, Kommunalpolitik

Ehrenamtliche Tätigkeiten

Page 130: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 131

Tabelle A2 Clusteraufteilung/Clustermittelwerte auf der Basis der über alle Items

1994 berechneten Faktorwerte der Drei-Clusterlösung mit Anteil von N und WB-Beteiligung in %:

Faktoren

Cluster

Ang

eneh

mes

und

ge

sund

es L

eben

Abh

ängi

gkei

t von

äu-

ßere

n M

ächt

en

Kul

tur

Rel

igiö

se P

raxi

s

Ber

ufse

rfolg

Hilf

e un

d G

esel

ligke

it

Par

tizip

atio

n

Indi

vidu

alis

tisch

e

Det

erm

inat

ion

des

Le

bens

Abstand -0,71 -0,27 0,51 0,05 -0,18 -0,31 -0,30 0,17

Sampleanteil: 35,1; WB-Beteiligung: 10,2

Partizipation 0,39 0,42 -0,05 0,17 0,37 0,16 0,63 0,69

Sampleanteil: 29,0; WB-Beteiligung: 20,0

Lebensstandard 0,37 -0,07 -0,45 -0,19 -0,11 0,17 0,22 -0,73

Sampleanteil: 35,9; WB-Beteiligung: 25,4

Tabelle A3 Faktorenmodell über bereichsspezifisch vorgeordnete Items 1994 (Items mit Ladungen > .5)

Themenbereich Relevanz von Lebens-bedingungen für Zufriedenheit und Wohlbefinden

Themenbereich Relevanz von Lebens-bedingungen für Zufriedenheit und Wohlbefinden

Themenbereich Relevanz von Lebens-bedingungen für Zufriedenheit und Wohlbefinden

Themenbereich Relevanz von Lebens-bedingungen für Zufriedenheit und Wohlbefinden

1. Faktor Orientierung am Lebensstandard

2. Faktor Orientierung am gesunden Leben

3. Faktor Orientierung an Karriere und Einfluss

4. Faktor Orientierung an Religion

Varianzaufkl. 18,0 Varianzaufkl. 15,2 Varianzaufkl. 12,7 Varianzaufkl. 10,9

Einkommen Wohnung Arbeit Familie

Freizeit Gesundheit Umweltschutz

Entscheidungseinflussberuflicher Erfolg

Religion

Page 131: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

132 ZA-Information 53

Themenbereich Lebensgewohnheiten

Themenbereich Lebensgewohnheiten

Themenbereich Lebensgewohnheiten

1. Faktor Kultur im Alltagsleben

2. Faktor Partizipation im Alltagsleben

3. Faktor Hilfe und Geselligkeit im Alltagsleben

Varianzaufkl. 21,9 Varianzaufkl. 18,1 Varianzaufkl. 17,2

Kino, Tanz-, Sportver-anstaltungen

Aktiver Sport

Besuch kultureller Ver-anstaltungen

Ehrenamtliche Tätigkeiten

Beteiligung in Bürgerini-tiativen, Parteien, Kom-munalpolitik

Kirchgang, religiöse Veranstaltungen

Mithelfen bei Freunden, Verwandten, Nachbarn

Geselligkeit mit Freun-den

Bereich Lebenskontrolle

Bereich Lebenskontrolle

1. Faktor Abhängigkeit von äußeren Mächten

2. Faktor Individualistische Determination des Lebens

Varianzaufkl. 32,4 Varianzaufkl. 20,6

Items mit Ladungen> .5

Es kommt etwas Uner-wartetes dazwischen Es kommt immer an-ders, als man denkt Keiner kann seinem Schicksal entgehen Pläne lassen sich nicht realisieren Wenn ich etwas be-komm, dann aus Glück

Items mit Ladungen> .5

Bestimme Leben selbstLeben vom Verhalten bestimmt Das Geplante wird auch zur Wirklichkeit

Page 132: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 133

Tabelle A4 Clusteraufteilung/Clustermittelwerte auf der Basis der themenbe-

reichsspezifisch berechneten Faktorwerte 94 der Drei-Clusterlösung mit Anteil von N und WB-Beteiligung in %:

Faktoren

Cluster

Lebe

nsst

anda

rd

Abh

ängi

gkei

t von

äuß

eren

M

ächt

en

Kul

tur

Rel

igiö

se P

raxi

s

Kar

riere

und

Ein

fluss

Hilf

e un

d G

esel

ligke

it

Par

tizip

atio

n

Indi

vidu

alis

tisch

e

Det

erm

inat

ion

des

Lebe

ns

Ges

unde

s Le

ben

Partizipation -0,46 -0,35 0,61 0,57 -0,18 0,29 0,99 0,08 0,04

Sampleanteil: 27,2; WB-Beteiligung: 29,7

Abstand -0,12 -0,37 0,10 -0,66 -0,17 -0,55 -0,41 -0,30 -0,30

Sampleanteil: 41,3; WB-Beteiligung: 21,2

Lebensstandard 0,54 0,77 -0,39 0,03 -0,19 0,18 -0,28 0,32 0,39

Sampleanteil: 31,5; WB-Beteiligung: 10,2

Abweichend von den sonstigen Clusteranalysen weist die Analyse auf der Basis der Faktorwerte 94 (über alle Items) eine höhere Weiterbildungsbeteiligung im Cluster „Lebensstandard“ auf (Tab. A2). Gleichzeitig ist der Partizipationsfaktor in diesem so gebildeten Cluster mit einem ebenfalls nach oben abweichenden, größeren Mit-telwert vertreten. Alle anderen Lebensstandardcluster weichen bei den Faktorwerten für Partizipation nach unten ab (Tab. A4; 2a; 2b). Hinter der Benennung des Faktors „Orientierung am angenehmen und gesunden Leben“ in der 94er Analyse über alle Items verbirgt sich eine von den in den anderen Analysen mit „Lebensstandard“ benannten Faktoren abweichende Bedeutung: In der 94er Analyse über alle Items (Tab. A2) erhält der Begriff eine ökologische Konnotation. Damit ist die Zuordnung des Faktors zu einem mit dem Begriff „Lebensstandard“ bezeichneten Cluster zwar immer noch gerechtfertigt. Das Cluster hat dann aber eine andere, weniger den Wohlstand und statt dessen mehr die Gesundheit und den Umweltschutz einschlie-ßende Bedeutung, was man an der Zusammensetzung des Faktors aus den Items ablesen kann: Das Item Einkommen wandert in den Faktor Beruf und Arbeit ab, während das Item Gesundheit wie auch das Item Umweltschutz den Faktor „Orien-tierung am angenehmen und gesunden Leben“ mit begründet. Auf diese Weise än-dert sich das Clusterprofil: In einem auf angenehmes und gesundes Leben gestütz-ten Cluster „Lebensstandard“ herrscht ein anderes Lebensstandardkonzept vor als in

Page 133: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

134 ZA-Information 53

einem Cluster, das sich auf Einkommen, Wohnung, Beruf, Wohngegend etc. stützt. Aus diesem Grund erhält das Cluster Lebensstandard einen höheren Wert für Parti-zipation und das Cluster Partizipation einen höheren für Lebensstandard. Ange-sichts der Bedeutung des Partizipationsfaktors für die Weiterbildungsbeteiligung wird die mit diesem Faktor zusammenhängende Beteiligungsmasse infolgedessen zwischen den Clustern aufgeteilt. Die kreuztabellarische Überprüfung lässt die Auf-teilungsbeziehung zwischen den beiden jeweils auf verschiedene faktoranalytische Grundlagen (über alle Items; über bereichsspezifische Items pro Bereich) aufbauen-de Untersuchungen hervortreten.18 Die Problematik der Transformation numeri-scher Größenbeziehungen in eine qualitative, textliche Benennungspraxis wird hier deutlich. Man hätte an dieser Stelle die Benennung der beiden Cluster auch vertau-schen können: Die Clusterzentren für Lebensstandard sind fast gleich hoch, die für Partizipation liegen in beiden Fällen über dem Mittelwert.

Literatur

Ahlene, Eva/Dobischat, Rolf: Betriebliche Weiterbildung benötigt veränderte Zeitreglements. Die Verknüp-fung von Lern- und Arbeitszeiten im Spiegel einer empirischen Betriebserhebung. In: Rolf Dobischat, Eva Ahlene, Hartmut Seifert (Hrsg.): Integration von Arbeiten und Lernen. Erfahrungen aus der Praxis des le-benslangen Lernens. Berlin 2003 S. 149 – 188: Sigma Bacher, Johann: Teststatistiken zur Bestimmung der Clusterzahl für Quick Cluster. In: ZA-Information 48 (2001),1, S. 71 – 97 Bacher, Johann: Clusteranalyse. Anwendungsorientierte Einführung. München/Wien 2002: Oldenbourg (2. Auflage) Backhaus, Klaus/Erichson, Bernd/Plinke, Wulff/Weiber, Rolf: Multivariate Analysemethoden. Eine anwen-dungsorientierte Einführung. Berlin/Heidelberg/New York 2000 (Neunte Auflage): Springer Barz, Heiner: Weiterbildung und soziale Milieus. Neuwied 2000: Luchterhand Barz, Heiner: Kultur und Lebensstile. In: Rudolf Tippelt (Hrsg.) Handbuch Bildungsforschung. Opladen 2002, S. 725 – 744: Leske und Budrich Becker, Rolf/Schömann, Klaus: Berufliche Weiterbildung und Einkommenschancen im Lebensverlauf: Empirische Befunde für Frauen und Männer. In: Doris Beer u.a. (Hrsg.): Die wirtschaftlichen Folgen der Aus- und Weiterbildung. München/Mering 1999: Hampp Behringer, Friederike: Beteiligung an beruflicher Weiterbildung. Humankapitaltheoretische und handlungs-theoretische Erklärung und empirische Evidenz. Opladen 1999: Leske und Budrich Bortz, Jürgen: Statistik für Sozialwissenschaftler. Berlin 1999 (5. Auflage): Springer Friebel, Harry/Epskamp, Heinrich/Knobloch, Brigitte,/Montag, Stefanie/Toth, Stephan: Bildungsbe-teiligung: Chancen und Risiken. Eine Längsschnittstudie über Weiterbildungskarrieren in der “Moderne”. Opladen 2000: Leske und Budrich

18 Zwischen dem Cluster Partizipation wie auch dem Cluster Lebensstandard (jeweils Basis Fakto-

ren über alle Items 94) einerseits und dem Cluster Partizipation (Basis Faktoren über bereichs-spezifische Items 94) andererseits lassen sich jeweils Schnittmengen bilden. In diesen Schnitt-mengen ist die Weiterbildungsbeteiligung überdurchschnittlich hoch (31,6 %; n = 122; 31,7 %; (n=124). Insgesamt werden 39,5% der Fälle im Cluster Partizipation (Basis Faktoren über be-reichsspezifische Items 94) dem Cluster Partizipation (Basis Faktoren über alle Items 94) und 40,02% jener Fälle dem Cluster Lebensstandard (Basis Faktoren über alle Items 94) zugeschlagen.

Page 134: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 135

Giegler, Helmut: Lebensstile in Hamburg. In: Jens Dangschat/Jörg Blasius (Hrsg.): Lebensstile in Städten. Konzepte und Methoden. Opladen 1994, S. 255 - 272: Leske und Budrich Harney, Klaus/Hartz, Stefanie: Weiterbildungsbeteiligung. Erste Ergebnisse einer Analyse der Beteiligungs-struktur im Kernbereich des Bildungsangebots von Arbeit und Leben NRW. In: Franz-Josef Jelich/Günter Schneider (Hrsg.): Orientieren und Gestalten in einer Welt der Umbrüche. Essen 1999, S. 349 – 360: Klartext Harney, Klaus/Keiner, Edwin: Zum Profil nicht-hauptberuflicher Arbeit in der evg. Erwachsenenbildung. In: Dieter H. Jütting (Hrsg.): Situation, Selbstverständnis, Qualifizierungsbedarf. Nicht-hauptberufliche Mitar-beiterInnen in der Deutschen Evangelischen Arbeitsgemeinschaft für Erwachsenenbildung. Empirische Stu-dien. Frankfurt/M. 1992, S. 197 – 227: Peter Lang Harney, Klaus/Koch, Sascha: Organisations- und Akteurrationalität im Schulsystem. Eine empirische Re-konstruktion. In: Dirk Rustemeyer (Hrsg.): Erziehung in der Moderne. Würzburg 2003, S. 423-438. Königs-hausen und Neumann Hradil, Stefan: Sozialstrukturanalyse in einer fortgeschrittenen Gesellschaft. Opladen 1987: Leske und Budrich Kade, Jochen: Von einer Bildungsinstitution zur Infrastruktur subjektiver Lebensführung – teilnehmer- und aneignungstheoretische Sichten der Erwachsenenbildung. In: Rainer Brödel (Hrsg.): Erwachsenenbildung in der Moderne. Opladen 1997, S. 300 – 316: Leske und Budrich Noller, Peter: Globalisierung, Stadträume und Lebensstile. Kulturelle und lokale Repräsentationen des globalen Raums. Opladen 1999: Leske und Budrich. Rohwer, Götz/Pötter, Ulrich: Methoden sozialwissenschaftlicher Datenkonstruktion. Weinheim/München 2002: Juventa Sadowski, Dieter: Personalökonomie und Arbeitspolitik. Stuttgart 2002: Schaeffer-Poeschel Schlosser, Otto: Einführung in die sozialwissenschaftliche Zusammenhangsanalyse. Reinbek 1976: Rowohlt Schnell, Rainer/Hill, Paul B./Esser, Elke: Methoden der empirischen Sozialforschung. München/Wien 1999: Oldenbourg Schrader, Josef: Abschied vom korporativen Pluralismus? Zum Wandel von Weiterbildung und Weiterbil-dungspolitik im Lande Bremen. In: Ekkehard Nuissl/Erhard Schlutz (Hrsg.): Systemevaluation und Poli-tikberatung. Gutachten und Analysen zum Weiterbildungssystem. Bielefeld 2001, S. 136–163: Bertelsmann Schulze, Gerhard: Die Erlebnisgesellschaft. Kultursoziologie der Gegenwart. Frankfurt/M./New York 1992 (2.Auflage): Campus Sobel, Michael E.: Lifestyle and Social Structure. Concepts, Definitions, Analyses. New York u.a. 1981: Academic Press Tippelt, Rudolf: Sozialstruktur und Erwachsenenbildung. In: Rainer Brödel (Hrsg.): Erwachsenenbildung in der Moderne. Opladen 1997, S. 53 – 69: Leske und Budrich Tippelt, Rudolf/Weiland, Meike/Panyr, Sylva/Barz, Heiner: Weiterbildung, Lebensstil und soziale Lage in einer Metropole. Studie zu Weiterbildungsverhalten und -interessen der Münchener Bevölkerung. Bielefeld 2003: Bertelsmann Ueltzhöffer, Jörg/Flaig, Bodo: Spuren der Gemeinsamkeit? Soziale Milieus in Ost- und Westdeutschland. In: Werner Weidenfeld (Hrsg.): Deutschland. Eine Nation – doppelte Geschichte. Köln 1993, S. 61 – 82: Wissenschaft und Politik Urban, Dieter: Logit-Analyse. Statistische Verfahren zur Analyse von Modellen mit qualitativen Response-Variablen. Stuttgart 1993: Fischer Vester, Michael/Lange-Vester, Andrea/Bremer, Helmut/Olbrich, Gaby: Zwischenbericht zum Forschungs-projekt „Arbeitnehmermilieus als Zielgruppen des Bildungsurlaubs. Angebote, Motivationen und Barrieren des Bildungsurlaubsprogramms von Arbeit und Leben Niedersachsen e.V. Hannover 1997 Vester, Michael/von Oertzen, Peter/Geiling, Heiko/Hermann, Thomas/Müller, Dagmar: Soziale Milieus im gesellschaftlichen Strukturwandel. Zwischen Integration und Ausgrenzung. Frankfurt/M. 2001: Suhrkamp Voß, Werner: Praktische Statistik mit SPSS. München/Wien 1997: Hanser Wittpoth, Jürgen: Recht, Politik und Struktur der Weiterbildung. Hohengehren 1997: Schneider Zapf, Wolfgang u.a.: Individualisierung und Sicherheit. Untersuchungen zur Lebensqualität in der Bundes-republik Deutschland. München 1987: Beck

Page 135: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

136 ZA-Information 53

Optische Datenerfassung im praktischen Einsatz

von Peter Kriwy 1

Zusammenfassung

In vielen Forschungseinrichtungen ist es nach wie vor Standard, Daten manuell zu erfassen. In diesem Beitrag werden die Möglichkeiten und Grenzen spezieller Soft-warelösungen zur optischen Datenerfassung vorgestellt. Neben der grundsätzlichen Arbeitsweise dieser Programme (Handschrifterkennung ICR und Ankreuzfelder OMR) werden die Bereiche beschrieben, die sich für die optische Datenerfassung besonders eignen: Fragebögen mit geringer Seiten- und hoher Fallzahl, Fragebögen, die öfters eingesetzt werden (z.B. Lehrevaluationen) und nach Möglichkeit Bögen, die keine oder wenige offene Fragen enthalten. Optische Datenerfassung erfolgt je nach Art des Fragebogens etwa fünf bis fünfzehn Mal schneller als manuelle Datenerfassung, bei deutlich höherer Erfassungsqualität.

Abstract

This article examines the possibility of reducing the present human data entry sys-tem by implementing a new computer procedure which is faster and less prone to human error. Examples are given in this article of optical data collection by using the basic modes of operation and application in the social sciences.

1 Optische Datenerfassung

Datenerfassung ist mit Sicherheit der Teil empirischer Sozialforschung, der am wenig-sten interessiert oder Freude bereitet. Sie wird meist von studentischen Hilfskräften durchgeführt, weil eigentlich kein Forscher seine Zeit oder Energie mit dieser Arbeit verschwenden möchte. Obwohl es sich hierbei um einen enorm wichtigen Schritt handelt, der die Auswertungsqualität einer Studie maßgeblich mitbestimmt, wird der Datenerfassung i.d.R. keine besondere Aufmerksamkeit gewidmet. Eine Möglichkeit, dies nahezu fehlerfrei und vor allem schnell zu bewerkstelligen, soll in diesem Beitrag vorgestellt werden: die optische Datenerfassung.

1 Peter Kriwy (Dipl.-Soz.) ist Mitarbeiter von Prof. Norman Braun am Institut für Soziologie der

LMU-München. E-mail: [email protected]

Page 136: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 137

An der Universität München wird seit mehreren Jahren mit optischer Erfassungs-software gearbeitet. Die Erfahrungen haben gezeigt, dass diese Vorgehensweise zwar nicht für jeden Einsatz gleich gut geeignet ist; in den Bereichen allerdings, die sich gut für optische Erfassungen eignen, ist sie der manuellen Erfassung, bezogen auf Geschwindigkeit und Erfassungsqualität, absolut überlegen. Weiterhin sind die modernen Scanner meist nicht größer als ein Laser-Drucker, so dass die Erfas-sungsarbeit am regulären Arbeitsplatz erfolgen kann.

Im nächsten Abschnitt werden zunächst verschiedene Einsatzbereiche der optischen Datenerfassung vorgestellt. Anschließend gilt das Augenmerk den Hardwareanfor-derungen an Scanner und PC sowie der Funktionsweise der Software. Damit ein-hergehend sollen auch die Kriterien der Fragebögen deutlich werden, die sich besonders gut für die optische Erfassung eignen. Die Abhandlung schließt mit einer Zusammenfassung.

2 Verschiedene Einsatzbereiche im Erfassungsalltag

In diesem Abschnitt werden Beispiele vorgestellt, die sich gut für die optische Er-fassung eignen. Die Daumenregel besagt, dass Fragebögen nach Möglichkeit eine geringe Seiten-, aber hohe Fallzahl vorweisen sollten. Prädestiniert hierfür sind im Bereich der Universität beispielsweise Lehrevaluationen. Evaluationsbögen sind i.d.R. kurz, und es fallen meist hohe Fallzahlen an (bei der Evaluation der Veran-staltungen der sozialwissenschaftlichen Fakultät der LMU München sind dies pro Semester etwa 4000 doppelseitige Fragebögen). Für die Erfassung von 180 Lehr-evaluationen mit insgesamt 4000 Fällen braucht eine Person mit der optischen Vor-gehensweise etwa 14 Stunden. Da meist ein Interesse besteht, die Evaluationsergeb-nisse über Jahre hinweg zu vergleichen, wird ein Evaluationsbogen auch möglichst selten verändert. Somit spart man sich die Zeit, den Bogen für die optische Erfas-sung neu einzurichten.

Ein weiterer nützlicher Einsatzbereich, besonders für Hochschulen, ist die optische Erfassung von Multiple-Choice-Klausuren. Angenommen, es werden 500 Klausu-ren erwartet und pro Klausur sind eine zwölfstellige Matrikelnummer und 48 MC-Fragen zu erfassen, so dauert es vom Scannen des ersten Blattes bis zum fertigen Systemfile etwa 2,5 Stunden. Zu beachten ist hierbei, dass die Arbeit von lediglich einer Person bewerkstelligt wird. Man kann also vormittags die Klausur schreiben lassen und nachmittags die Ergebnisse aushängen.

Ansonsten sind alle Befragungen oder Formulare optisch erfassbar, die viele geschlos-sene Antwortmöglichkeiten und möglichst keine offenen Fragen enthalten. Auch be-stehende Formulare wie z.B. Personalbögen können gescannt werden. Doch bevor die

Page 137: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

138 ZA-Information 53

Feinheiten der Fragebogengestaltung erläutert werden, muss man sich auch mit Hard-wareanforderungen auseinandersetzen, die Thema des nächsten Abschnitts sind.

3 Hardwareanforderungen

Optische Datenerfassung stellt recht hohe Anforderungen an die Rechenkapazität des betreffenden PCs. Es kann hierfür jeder Rechner verwendet werden, der min-destens einen Pentium-III-Prozessor und 700 Megaherz Rechengeschwindigkeit vorweisen kann. Ein weniger leistungsfähiger Rechner würde die Erfassungsge-schwindigkeit deutlich verringern. Als Schnittstelle zwischen Rechner und Scanner wird eine SCSI-Verbindung benötigt. Die Mindestanforderungen an den Scanner sind Stapeleinzug und Duplexfunktion (gleichzeitiges Scannen der Vorder- und Rückseite). Canon-Scanner der „DR“-Serie (3020, 3060) sind preisgünstig und für Fragebögen besonders gut geeignet. Besagte Geräte sind klein, zuverlässig und ha-ben in der Grundausstattung schon einige Extras zu bieten: Beispielsweise eine Pla-tine zur Komprimierung von Bilddaten, die unbedingt notwendig ist und bei ande-ren Herstellern oft extra bezahlt werden muss. Die Verarbeitungsgeschwindigkeit liegt bei ca. 40 Blatt (einseitig) und 20 Blatt (duplex) in der Minute; die Anschaf-fungskosten liegen etwa bei 3000 Euro (+ MwSt). Sicherlich kann man auch 30.000 Euro für einen Hochleistungsscanner ausgeben, der 200 Seiten in der Minute erfas-sen kann. Für den sozialwissenschaftlichen Bereich würde sich diese Investition allerdings nicht lohnen, da der Flaschenhals der optischen Erfassung i.d.R. nicht der Scanner, sondern die weitere Verarbeitung am PC ist.

4 Software

Am deutschen Markt sind zwei Hersteller von optischer Erfassungssoftware zu nen-nen, die sich für den sozialwissenschaftlichen Bereich besonders gut eignen: „Tele-form Elite“ und „Eyes & Hands FORMS“. Diese Anbieter haben ein faires Preis-Leistungsverhältnis und liefern qualitativ hochwertige Software. In vielerlei Hin-sicht sind sich beide Softwarelösungen so ähnlich, dass sie in den grundlegenden Funktionen als gleichwertig bezeichnet werden können. Deshalb werden im Fol-genden Möglichkeiten erläutert, die größtenteils von beiden Softwarelösungen glei-chermaßen angeboten werden.

Es gibt zwei grundsätzlich verschiedene Arten, einen Fragebogen für die optische Erfassung zu erstellen: Entweder man erstellt ihn mit Hilfe der Scansoftware oder man konstruiert ihn mit einem beliebigen Textverarbeitungs- oder Graphik-Programm.

Die Erstellung von Fragebögen mit der Scansoftware ist geeignet für Bögen, die keine hohen Anforderungen an das Layout stellen, denn zur Justierung des Blattes

Page 138: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 139

Warum besuchen Sie diese Lehrveranstaltung?

... weil ich das Thema interessant finde

... weil ich den Schein brauche

trifftnicht zu

stimme vollund ganz zu

stimmeüberhauptnicht zu

benötigen diese Formulare kleine optische Elemente in jedem Eck des Bildrandes und eine Formularnummer. Da diese Ecken und Formularnummern leider nicht be-sonders „schön“ aussehen, ist diese Fragebogenart für schriftliche Befragungen un-geeignet. Weiterhin hegen die Befragten Zweifel an der Anonymität der Studie, weil sie die Formularnummer als ID verdächtigen. Der große Vorteil dieser Frage-bogenart ist allerdings eine besonders hohe Erfassungsgeschwindigkeit bei hoher Erfassungsgenauigkeit.

Für schriftliche Befragungen erstellt man den Bogen beispielsweise mit Word (ohne Ecken und Formularnummer). Zur Justierung einer Fragebogenseite ist dann darauf zu achten, dass horizontale Elemente in eine Seite integriert werden. Hierfür eignen sich durchgezogene Linien zwischen zwei Fragen. Diese Fragebögen funktionieren ähnlich wie die Bögen mit Formularnummer, sind allerdings in der Erfassungsge-schwindigkeit und Nachbearbeitung etwas schlechter, weisen dafür allerdings ein meist ansprechendes Layout vor.

Bei der Einrichtung von Antwortskalen bei vorgegebenem Fragebogen wird zu-nächst ein leerer Bogen eingescannt. Mit der Maus zieht man ein Viereck um eine Antwortskala und das Scanprogramm sucht selbstständig die Kästchen, die zu einer Skala gehören und schlägt eine Codierung vor (z.B. das linke Kästchen „1“, das rechte „5“). Wird ein Fragebogen innerhalb des Scanprogramms erstellt, so beginnt man dort mit einem leeren Blatt. Ähnlich wie bei einer Graphiksoftware werden Textfelder an beliebige Stellen eines Blattes gesetzt. Ebenso frei ist man beim Plat-zieren von Antwortskalen. Die Anzahl der Kästchen einer Skala, die Beschränkung auf eine oder mehrere mögliche Nennungen, wie auch die Codierungen, sind frei wählbar. Ein Beispiel für eine Skala mit Einfachnennung ist in Abbildung 1 dargestellt.

Abbildung 1 Beispiel für eine Skala mit Einfachnennung

Hier kann man jedem Kästchen einen frei wählbaren Zahlenwert zuordnen und bei fehlenden Kreuzen ist es möglich, beispielsweise den Wert „9“ zu vergeben. Wei-terhin definiert man für eine solche Skala Einzelnennungen. Wenn in einer Zeile doch zwei Kreuze stehen und eines davon allerdings durchgestrichen ist, wird das Kreuz gezählt, das weniger „Weiß“ im Inneren eines Kästchens verdeckt, also an-gekreuzt und eben nicht durchgestrichen wurde (siehe Abbildung 2). Angenommen zwei Kästchen einer Skala sind gleichwertig angekreuzt, dann würde dieser Fall in der Nachbearbeitung auf dem Bildschirm erscheinen. In diesem Fall wird manuell

Page 139: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

140 ZA-Information 53

entschieden, welches der beiden Kästchen ausgewählt oder ob ein fehlender Wert gesetzt wird. Abbildung 2 Ein durchgestrichenes Kreuz (Beispiel aus einem Originalfragebogen)

In den meisten Fällen kann die Software das richtig angekreuzte Feld selbst erkennen (siehe Abbildung 2). Falls es allerdings unsicher sein sollte, ob ein Kästchen ange-kreuzt ist oder nicht, wird die betreffende Stelle in einem nächsten Arbeitsschritt zur Überprüfung angezeigt. Dieses Verfahren wird OMR genannt: Optical Mark Recog-nition. Neben OMR ist auch Handschrifterkennung (ICR, Intelligent Character Rec-ognition) möglich. Handschrifterkennung eignet sich bei kurzen offenen Antworten, bei denen „nur“ nach einer Zahl, oder einem Wort gefragt wird, wie beispielsweise das Geburtsdatum oder eine Automarke. D.h. die Handschrifterkennung funktioniert sehr gut, wenn es möglich ist, die Antwort in wenige, dafür vorgesehene Kästchen zu schreiben. Einfache Beispiele hierfür sind in Abbildung 3 angeführt.

Abbildung 3 Beispiel für Handschrifterkennung

Wann sind Sie geboren? 19

Die Marke Ihres Autos ist? (Bitte verwenden Sie Großbuchstaben!)

Beim Beispiel des Geburtsjahres wird die Handschrift auf die deutsche Sprache und auf „Zahlen“ beschränkt. Bei deutschen Zahlen wird eine „1“ als eins gezählt. Bei englischen Zahlen ein “I“ als eins. Wenn die Erfassung auf Zahlen beschränkt ist, muss die Handschrifterkennung nicht abwägen, ob das Geschriebene eine “3“ oder ein “B“ ist. Ähnlich ist es bei dem Beispiel der Frage nach der Automarke. Hier funktioniert die Erfassung am besten, wenn man sich ausschließlich auf Großbuch-staben beschränkt und somit Zahlen und Kleinbuchstaben aus der Erfassung aus-schließt. Der Hinweis „Bitte verwenden Sie Großbuchstaben“ ist unerlässlich und wird auch von den meisten Befragten befolgt. Falls dennoch ein Befragter Klein-buchstaben verwenden sollte, erscheint die gesamte Zeile in der Nachbearbeitung und das Wort muss manuell erfasst werden. An dieser Stelle könnte der Eindruck

Page 140: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 141

entstehen, dass doch an vielen Stellen manuell nachgearbeitet werden muss, was wiederum eine Quelle für Fehler sein könnte. Das stimmt jedoch nicht ganz! Selbst wenn so manches Wort in der Nachbearbeitung erscheint, so ist es schon hilfreich, wenn 90% des Wortes richtig erfasst wurden und nur noch zwei oder drei Buchsta-ben auszubessern sind. Weiterhin ist ein Wort, das manuell nachgebessert werden muss, fest mit der Feldreihenfolge des Datensatzes verknüpft. Auf diese Weise ist ausgeschlossen, dass eine Information in die falsche Zelle geschrieben wird oder die Eingabezeile verrutscht.

Offene Fragen, bei denen die Antwort auf eine oder mehrere Linien frei zu formu-lieren ist, können erfasst werden, solange man mit Codeplänen arbeiten kann. Der Antwortbereich der offenen Frage wird mit der Maus umrandet. Neben der offenen Nennung klappen Codepläne auf, die wie ein Pull-Down-Menü funktionieren. Die Nennung, die am besten zur Befragtenantwort passt, wird angeklickt und somit in den Datensatz geschrieben. Die Auswertungstechnik ist folglich beschränkt auf die quantitative Analyse qualitativer Daten. Weiterhin ist diese Art der Erfassung nur praktikabel, solange die Codepläne nicht zu umfangreich sind (max. 30 Nennungen).

Die Softwarelösungen bieten meist noch viele weitere Extras wie z.B. Barcode-Erkennung, Fax-Empfang, Emailauswertung oder die Möglichkeit der Nutzung von Blindfarben. Für den sozialwissenschaftlichen Bereich sind diese Möglichkeiten allerdings von untergeordneter Bedeutung. Wichtig sind Ankreuzfelder für Skalen und Felder für kurze handschriftliche Nennungen, wie z.B. das Geburtsdatum in Jahren oder die Nennung der Automarke. Der krönende Abschluss ist die Erstellung eines Files, das für die weitere Verarbeitung mit Statistikprogrammen geeignet ist. Hier kann man wählen, ob die Daten in einem bestimmten Datenbankformat, als z.B. ASCII, Excel oder SPSS-File exportiert werden sollen.

Bei der Entscheidung, ob eine bestimmte Studie optisch oder manuell erfasst wer-den soll, ist die Seiten- und Fallzahl ein entscheidendes Kriterium. Ein etwa achtsei-tiger Fragebogen mit ca. 200 Variablen ist für einen Geübten in 2 bis 3 Stunden für die optische Datenerfassung vorbereitet. Je nach Komplexität der Antwortmöglich-keiten kommt noch eine etwa 30 Minuten lange Testphase zur Überprüfung hinzu, ob auch alles so gelesen wird, wie es gelesen werden soll. Hier wird klar, dass sich Studien mit vielleicht „nur“ 100 Fällen nicht für die optische Erfassung eignen, da in der Zeit, bis der Fragebogen eingerichtet und getestet ist, viele Bögen schon ma-nuell erfasst werden können. Manuelle Erfassung ist mit studentischer Unterstüt-zung auch leicht an 10 PCs gleichzeitig zu bewerkstelligen. Für die optische Daten-erfassung steht meist nur ein Arbeitsplatz zur Verfügung, weil die Lizenzen nicht gerade günstig sind. Bezogen auf die Beispielstudie mit 100 Fällen würde es bedeu-ten, dass 10 Hilfskräfte mit manueller Erfassung vermutlich schneller wären, als eine Person mit optischer Erfassung. Hingegen wendet sich das Blatt bei entspre-

Page 141: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

142 ZA-Information 53

chend hoher Fallzahl. Sind bei gleichem Fragebogenumfang 2000 Fälle und mehr zu erfassen, so ist die optische Erfassung der manuellen weit überlegen, selbst wenn viele studentische Hilfskräfte gleichzeitig Erfassungsarbeit leisten.

Bei schriftlichen Befragungen muss man berücksichtigen, dass die Fragebögen meistens gefaltet zurückgeschickt werden. Deshalb empfiehlt es sich 1 bis 2 Tage zu warten, weil die Bögen nach dem Auffalten noch unter dem Druck einiger Tele-fonbücher geglättet werden sollten. Dies ist besonders bei engem Zeitplan zu be-rücksichtigen. Es gibt zwar Scanner, die auch mit gefaltetem Papier problemlos umgehen können, diese sind in den Anschaffungskosten allerdings überproportional teuer. Weiterhin ist bei den Studien darauf zu achten, dass 80-Gramm Papier ver-wendet wird. Gerne nimmt man bei schriftlichen Befragungen leichteres Papier, damit bei gleichen Portokosten Bögen mit höherer Seitenzahl zurückgesandt werden können. Dies ist zumindest bei günstigen Scannern nicht zu empfehlen, da sie oft Schwierigkeiten haben, das dünne Papier einzuziehen. Weiterhin kann es passieren, dass bei dünnem Papier ein Kreuz der Rückseite auf der Vorderseite gelesen wird, wenn es durch das Papier „durchscheint“. In diesem Fall ist darauf zu achten, dass Ankreuzfelder der einen Seite nicht mit Erfassungsfeldern der anderen Seite über-einstimmen. Unabhängig von der Dicke des Papiers, müssen die Befragten darauf hingewiesen werden, einen normalen blauen oder schwarzen Kugelschreiber zu verwenden. Das verringert die Wahrscheinlichkeit, dass Bögen z.B. mit gelbem Filzstift oder gar mit Edding ausgefüllt werden. In diesen (zum Glück seltenen) Fäl-len müssen entweder Kreuze mit Kugelschreiber nachgezogen oder im Falle des Edding auf einen leeren Bogen übertragen werden.

Ein weiterer Punkt ist das Vorgehen bei gehefteten oder gebundenen Fragebögen. Bögen, die mehr Seiten vorweisen als Vorder- und Rückseite, müssen vor der Er-fassung geschnitten werden. Bei einer Heftklammer links oben kann man die ge-samte Ecke abschneiden. Bei gebundenen Fragebögen wird die gesamte Bindung abgeschnitten. Dann allerdings ist streng darauf zu achten, dass kein Windstoß den Stapel durcheinanderbringt, da sonst das große Problem besteht, die einzelnen Sei-ten den konkreten Fällen zuzuordnen. Das Scannen setzt voraus, dass beispielsweise 8 Seiten hintereinander zu einem Fragebogen gehören. Diese 8 Seiten können dabei auch in unterschiedlicher Reihenfolge eingescannt werden. Sicherheitshalber scannt man kleine Stapel, z.B. immer 5 Fragebögen à 8 Seiten. Wenn dann die Statistik 40 gescannte Blätter anzeigt, wurde kein Blatt vergessen bzw. keine zwei Blätter gleichzeitig in den Scanner eingezogen.

Am Anfang dieses Abschnittes wurden für den Bereich der empirischen Sozialfor-schung die Softwarelösungen „Teleform“ und „Eyes and Hands“ genannt. Es ist im Rahmen eines recht kurzen Beitrags fast unmöglich darzulegen, welches der beiden

Page 142: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 143

Produkte für welchen konkreten Anwendungsfall besser geeignet ist. In der grund-legenden Funktionsweise sind beide Produkte absolut gleichwertig. Die günstigste Version ist für ca. 5000 Euro (+ MwSt) zu haben. Teurere Varianten zeichnen sich vor allem durch eine höhere Erfassungsgeschwindigkeit aus, bei der man im Zwei-felsfall allerdings nicht sparen sollte. Bei höherer Erfassungsgeschwindigkeit liegt man preislich bei etwa 7000 Euro (+ MwSt). Netzwerklösungen sind ebenfalls mög-lich, diese liegen aber in einem weit höheren Preissegment und werden an dieser Stelle nicht besprochen. Die Vertreter dieser Firmen leisten gute Beratungsarbeit, was die Entscheidung allerdings nicht leichter werden lässt. Egal, für welche der beiden Softwares man sich entscheidet, sie funktionieren gut. Vorsicht ist allerdings bei anderen deutlich günstigeren Anbietern geboten, da der Preis hier durchaus ein Maß für Qualität ist.

Ein letztes Wort gilt der Schwierigkeit der Handhabung der Software. Die Handbü-cher sind zwar umfangreich, aber für eine Einführung nicht geeignet. Mit etwas Verhandlungsgeschick bekommt man eine erste Einführung mit dem Kauf des Pro-duktes, wenn ein Vertreter vor Ort die grundlegenden Funktionsweisen erklärt. Die ersten Fragebögen sind auch recht schnell erstellt. Solange man für den Anfang nicht zu komplizierte Erhebungsinstrumente konstruiert, kommt man recht schnell zum gewünschten Erfassungserfolg. Bis man sich allerdings als Meister der Diszip-lin bezeichnen kann, der fast jedes Formular erfasst, vergehen etwa 2 Jahre. Deshalb ist es sinnvoll, die Scananlage einem Studierenden niedrigen Semesters anzuver-trauen, der Zeit und Muße hat, sich hineinzuarbeiten und dann noch genügend lange Hilfskraft ist, um eine Vielzahl von Projekten zu erfassen.

Zusammenfassung

Alles in allem ist die optische Datenerfassung gut ausgereift und für viele Einsatz-bereiche geeignet. Für Institute, die viele verschiedene Studien durchführen, ist die Anschaffung einer solchen Anlage sicherlich ratsam. Zwar hat sich gezeigt, dass sich die optische Erfassung nicht für jeden Einsatzbereich eignet; bei Studien mit besonders hohen Fallzahlen ist die optische Erfassung der manuellen jedoch überle-gen, auch wenn mit vielen Hilfskräften manuell erfasst werden würde. Optische Erfassung wird meistens von einer Person oder zumindest an einem Arbeitsplatz durchgeführt, da die Lizenzen relativ viel Geld kosten. Die hohen Anschaffungskos-ten für Scanner und Software mögen dabei vielleicht etwas abschreckend wirken. Auf lange Zeit gesehen spart es allerdings bares Geld und vor allem Nerven, da nicht viele Studierende, sondern lediglich eine zuverlässige Person Erfassungsarbeit leistet. Weiterhin kann man diese Arbeitsweise den studentischen Hilfskräften mit-geben, die damit für eine entsprechende spätere Tätigkeit z.B. in Marktforschungs-unternehmen eine Schlüsselqualifikation erwerben.

Page 143: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

144 ZA-Information 53

Zur Qualität der sozialwissenschaftlichen Methoden-

ausbildung – am Beispiel statistischer Datenanalyse

von Wolfgang Ludwig-Mayerhofer1

Zusammenfassung

In jüngster Zeit werden Vorschläge für die Methodenausbildung gemacht, die auf der Grundlage von empirischen Erhebungen die in der Forschungspraxis verwen-deten Verfahren zum Maßstab einer gelingenden Methodenausbildung machen. Die Qualität der Ausbildung kann sich aber nicht nur daran messen lassen, dass die in der beruflichen Praxis erforderlichen Verfahren mehr oder weniger oberflächlich und routinemäßig beherrscht werden. Der Artikel nennt einige Aspekte, bei denen in der gegenwärtigen Praxis der statistischen Datenanalyse Qualitätsdefizite aus-zumachen sind; ebenso werden einige Probleme angeführt, die sich aufgrund unzu-länglicher Darstellungen in Lehr- und Handbüchern in der Ausbildung ergeben.

Abstract

Recent contributions to debates about university training argue that the current practice of social research should serve as a guideline to determine the contents of research methods training. However, the quality of training cannot only be meas-ured by the degree to which it is in line with the typical superficial routine applica-tion of a certain array of established procedures. The article outlines a number of features concerning which current research practice doesn’t always follow highest standards and thus cannot be used as a criterion against which to judge the training in research methods; also, some problems are outlined that result from inadequate presentations in introductions to data analysis and computer software.

1 Dr. Wolfgang Ludwig-Mayerhofer ist Professor für Soziologie – Empirische Sozialforschung

am Fachbereich 1 der Universität Siegen, Adolf-Reichwein-Str. 2, 57068 Siegen, Telefon: 0271/ 740-4384, E-Mail: [email protected]. Mein Dank gilt Uta Liebes-kind für Vorschläge zur Verbesserung des Textes. Unzulänglichkeiten desselben gehen selbst-verständlich alleine auf mein Konto.

Page 144: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 145

1 Soziologische Methodenausbildung und Praxis

In den jüngsten Diskussionen um die soziologische Methodenausbildung wird zu-nehmend geltend gemacht, dass die zu vermittelnden Inhalte noch besser als bisher an der Praxis sozialwissenschaftlicher Forschung ausgerichtet werden sollten. Ein Beispiel hierfür ist der Aufsatz „Konträr und ungenügend? Ansprüche an Inhalt und Qualität einer sozialwissenschaftlichen Methodenausbildung“ von Manuela Pötsch-ke und Julia Simonson (Pötschke und Simonson 2003) im letzten Heft der ZA-Information.2 Grundlage ihrer Argumentation ist eine Umfrage unter „Sozialfor-schern“ (S. 76; wie ich vermute, auch einigen Sozialforscherinnen), die entweder der „Wissenschaft“ oder der „kommerziellen Markt- und Meinungsforschung“ an-gehörten (dazu S. 77), sowie eine Inhaltsanalyse dreier deutschsprachiger soziologi-scher Fachzeitschriften hinsichtlich der in den empirischen Beiträgen verwendeten Verfahren der Datenerhebung, Stichprobengewinnung und Datenanalyse. Pötschke und Simonson stellen einerseits in vielen Bereichen eine Übereinstimmung zwi-schen ihren Ergebnissen und den (mutmaßlich) in der Methodenausbildung vermit-telten Inhalten fest, andererseits können sie auf Punkte hinweisen, die wohl zumin-dest teilweise in der gegenwärtig praktizierten Methodenausbildung und auch in Lehrbüchern zu wenig berücksichtigt werden. Zu letzteren gehören etwa die beson-deren Bedürfnisse der Markt- und Meinungsforschung (S. 90 f.) oder der Umgang mit Sekundärdaten (SOEP, ALLBUS etc. [S. 91]).

Auf dieser Grundlage sind – so die Autorinnen – Vorschläge zu den Inhalten der Methodenausbildung möglich, die nicht nur von den individuellen Vorlieben ein-zelner Personen abhängen, sondern möglichst umfassend das Spektrum der in der Forschungspraxis einzusetzenden Verfahren widerspiegeln. Die Auseinanderset-zungen um einen „Kanon“ für die Methodenausbildung sind damit sicher nicht ab-geschlossen, die Übersicht über die in der Berufspraxis häufig verwendeten Verfah-ren gibt aber zumindest eine Grundlage für weitere Diskussionen ab. Zu wenig Be-achtung findet jedoch meines Erachtens, dass die Orientierung an der gegenwärti-gen Praxis auch problematisch sein kann: Auch wenn feststeht, welche methodi-schen Verfahren in der beruflichen Praxis angewandt werden, so ist damit noch nichts über die Qualität der Anwendung gesagt. Es kommt ja nicht nur darauf an, dass etwa im Bereich der statistischen Datenanalyse – auf den ich mich im Folgenden

2 Dieser Aufsatz fasst Ergebnisse zusammen, die in ähnlicher Form bereits in einem von Uwe

Engel (Engel 2002a) herausgegebenen Sammelband veröffentlicht wurden (Engel 2002b; Si-monson und Pötschke 2002a, b),

Page 145: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

146 ZA-Information 53

hauptsächlich beziehen werde3 – Verfahren der deskriptiven Statistik oder der mul-tivariaten Analyse wie die OLS-Regression gelehrt werden, sondern dass die Anwendung dieser Verfahren möglichst hohen Standards entspricht.

Genau dies ist meines Erachtens nicht der Fall. Die Datenauswertungsverfahren, die ich, wie erwähnt, hier ins Zentrum stellen möchte, werden nur teilweise nach dem aktuellen Stand des Wissens durchgeführt (oder publiziert) und geben in diesem Sinne nicht immer ein gutes Vorbild für die Ausbildung in diesen Verfahren. Hinzu kommt – ein Aspekt, der für die Qualität der Ausbildung gleichfalls von großer Be-deutung ist –, dass auch einschlägige Lehrbücher in manchen Aspekten defizitär sind. Wohlgemerkt: defizitär, also keineswegs rundum schlecht. Wenn aber diese Defizite sich in den publizierten Forschungsresultaten und/oder in den Lehrbüchern bemerkbar machen, so sollte die Methodenausbildung darauf drängen, diese Defizi-te künftig zu verringern oder aufzuheben. Den Maßstab hierfür müssen aber Quali-tätsstandards bilden, die sich gerade nicht aus den gegenwärtig praktizierten Vorge-hensweisen, sondern aus dem (selbstverständlich mindestens teilweise umstrittenen und ständig im Fluss befindlichen) Stand der einschlägigen Fachwissenschaften ableiten lassen – im Bereich der Analyse standardisierter Daten also der Statistik.

Mit meiner Kritik stehe ich keineswegs alleine. Beispielsweise hat Rainer Schnell (Schnell 2002) die Ausbildung in Statistik als „veraltet und simplizistisch“ qualifi-ziert. In der Wortwahl scheint mir dies etwas überzogen, in der Richtung aber zu-treffend. Es ist daher erforderlich, genauer die Aspekte herauszuarbeiten, in denen die Ausbildung zu verbessern ist. Meine folgenden Ausführungen können sich aller-dings nicht auf empirische Erkenntnisse stützen, was in der Methodenausbildung faktisch gelehrt wird. Daher gehe ich einen indirekten Weg: Wenn empirische Pub-likationen in sozialwissenschaftlichen Fachzeitschriften oder Büchern nicht immer den vorhandenen Standards genügen, so ist anzunehmen, dass die entsprechenden Standards auch in der Ausbildung zu kurz gekommen sind.4 Was die Lehrbücher angeht, stütze ich mich auf eigene Erfahrungen in der Methodenausbildung, denen

3 Damit will ich nicht sagen, dass hinsichtlich der Datenerhebungsverfahren und der Stichproben-

ziehung keine Probleme in Ausbildung und Anwendungspraxis festzustellen wären. Ich habe jedoch den Eindruck, dass die Defizite deutlicher gesehen und thematisiert werden.

4 Alternative Erklärungen wären denkbar: Erstens könnte es sein, dass die Standards in der Ana-lysepraxis zwar verfolgt werden, die Darstellung der Ergebnisse für die Publikation jedoch auf jenes Maß „zurechtgestutzt“ wird, das der gängigen Publikationspraxis entspricht. Zweitens wä-re möglich, dass Sozialwissenschaftler und Sozialwissenschaftlerinnen die Standards zwar ken-nen, aber ihnen nicht immer im vollen Umfang folgen, weil sie den Eindruck haben, dass die Erfüllung der Standards gar nicht erwartet wird. Vor allem die zweite Möglichkeit halte ich für nicht gänzlich unplausibel. Umso wichtiger wäre aber, schon in der Ausbildung auf die Einhal-tung der Standards zu drängen.

Page 146: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 147

zufolge Studierende in den Lehrbüchern wenig Anhaltspunkte finden, wie bei der Datenanalyse ganz konkret vorzugehen ist – und in manchen Werken, nicht zuletzt solchen, die sich als ergänzende Handbücher zu verbreiteter Statistik-Software ver-stehen, durch die enge Anlehnung an die Vorgaben der jeweiligen Programme teil-weise sogar in die Irre geführt werden.

Im Folgenden möchte ich einige wichtige Schwachstellen der statistischen Daten-auswertung ansprechen; mein Anspruch ist nicht, sämtliche wichtigen Probleme zu erörtern oder diese gar ausführlich zu diskutieren, sondern nur durch eine kurze Auflistung einen ersten Anstoß zur Diskussion zu geben. Auch möchte ich beson-ders strittige oder schwierige Fragen wie den Umgang mit fehlenden Werten (Item-Non-Response) oder die Korrektur von Selbst- oder Fremdselektionseffekten nach Heckman (1979) nur an dieser Stelle kurz erwähnen, aber im Folgenden nicht wei-ter besprechen – nicht weil diese unwichtig wären, sondern weil hier der Stand der Forschung wenig eindeutig ist (siehe etwa Stolzenberg und Relles 1997).

Um einem denkbaren Missverständnis entgegen zu treten, möchte ich betonen, dass es hier darum geht, die Überlegungen von Pötschke und Simonson zu erweitern und zu präzisieren. Mein Beitrag darf nicht so verstanden werden, als hätten sich die Autorinnen gegen Qualitätsstandards oder die nachfolgend angesprochenen Verfah-rensweisen ausgesprochen. Auffällig ist allerdings, dass im Titel ihres Aufsatzes explizit „Inhalt und Qualität“ der Methodenausbildung genannt werden, der Aspekt der Qualität jedoch im Text keine Rolle spielt. Ob Pötschke und Simonson der Auf-fassung sind, dass die aktuelle Praxis den wichtigsten Qualitätsstandards entspricht oder nicht, geht dementsprechend aus ihren Ausführungen nicht hervor.

2 Probleme der Praxis statistischer Datenanalyse und ihrer Vermittlung in der Lehre

1. Zunächst ist auf die weitgehende Vernachlässigung (numerischer und graphi-scher) explorativer Verfahren der Datenanalyse hinzuweisen. Rainer Schnell hat in dieser Hinsicht bereits mehrfach – wenn auch, wie es scheint, weitgehend ungehört – das Nötige gesagt (Schnell 1994, 2000). Daher nur in wenigen Worten: Mit der auf Tukey (1977) zurückgehenden und inzwischen auch in Publikationen mit Lehr-buchcharakter (Erickson und Nosanchuk 1992; Marsh 1988) zugänglichen explo-rativen Datenanalyse liegen Werkzeuge vor, mit denen Daten nach auffälligen Strukturen gemustert werden können. Ferner können diese Verfahren wichtige Hil-festellung geben, wenn es darum geht, Daten zu transformieren und statistische Modelle auszuwählen, die der Datenstruktur entsprechen (oder anders formuliert: wenn zu prüfen ist, ob die Voraussetzungen für die Anwendung bestimmter statisti-

Page 147: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

148 ZA-Information 53

scher Modelle gegeben sind). In der Forschungspraxis, soweit sie sich in sozialwis-senschaftlichen Publikationen niederschlägt, überwiegt jedoch ein Vorgehen bei der Datenanalyse, das sich auf die routinemäßige (aber ungeprüfte, siehe unten) An-wendung einiger statistischer Modelle reduziert.

2. Weiterhin sind Lehrbücher und Forschungspraxis größtenteils hinsichtlich der Verbindung von Stichprobenziehung und statistischer Datenanalyse blind. Ich beziehe mich auf die Tatsache, dass sozialwissenschaftliche Datensätze häufig nicht auf einfachen Zufallsstichproben beruhen, dass aber die in der gängigen Software zur Datenanalyse implementierten Signifikanztests entweder durchgängig oder zu-mindest als Voreinstellung genau solche Stichproben unterstellen.5 Angesichts der häufigen Verwendung von Klumpenstichproben bzw. mehrfach geschichteter Aus-wahlen werden so die Standardfehler (und damit die Konfidenzintervalle) in der Regel deutlich unterschätzt (sog. Design-Effekt, siehe Kish 1995).6

3. Auch sonst finden Fragen der statistischen Signifikanztests zu wenig Aufmerk-samkeit. Wozu quälen wir in der Statistikausbildung Studierende mit dem Problem einseitiger oder zweiseitiger Hypothesen, wenn in der Forschungspraxis im Allge-meinen mehr oder weniger blind die Signifikanztests der Softwarepakete übernom-men werden, die standardmäßig stets auf zweiseitige Fragestellungen bezogen sind? Dabei liegen häufig einseitige Fragestellungen vor, auch wenn diese nicht immer explizit als solche benannt werden; beispielsweise wird wohl derzeit kaum ein For-scher oder eine Forscherin, der oder die sich mit Lohnunterschieden von Frauen und Männern beschäftigt, die zweiseitige Hypothese prüfen, dass die Löhne der beiden Gruppen sich in nicht vorhersehbarer Richtung unterscheiden.

4. Während Verfahren der Stichprobenziehung in den Lehrbüchern ausführlich dar-gestellt werden, wird verblüffenderweise Fragen der Stichprobengröße wenig Auf-merksamkeit geschenkt (mit Ausnahme etwa allgemeiner Hinweise auf die Abhän-gigkeit statistischer Schlussfolgerungen vom Umfang der Stichprobe gemäß dem „Wurzel-n-Gesetz“, nach dem der Standardfehler von Schätzern nicht proportional zum Stichprobenumfang n abnimmt, sondern nur proportional zu √n). Die Folge: Die Forschungspraxis frönt einer Art Zahlenmagie – denn wie sonst ist zu erklären, dass als Stichprobenumfang so häufig ein ganzzahliges Vielfaches von 1 000 festge-

5 STATA ist eines der wenigen Programme, das Nutzern und Nutzerinnen Optionen anbietet, der

„Clusterung“ von Fällen im Datensatz gerecht zu werden. – Positiv hervorzuheben ist hier das Lehrbuch von Kühnel und Krebs (2001), welches immerhin auf dieses Problem wiederholt hinweist.

6 Rainer Schnell hat zu solchen Fragestellungen zwei Forschungsprojekte durchgeführt – aber bislang bedauerlicherweise wenig Ergebnisse publiziert.

Page 148: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 149

legt wird? Ein rationaler Umgang mit Problemen der Stichprobengröße würde sich auf Überlegungen hinsichtlich der zu erwartenden Effektgröße und des zu tolerie-renden Fehlers 2. Art stützen, wie sie unter dem Begriff der statistischen „Power“ oder Teststärke behandelt werden (Cohen 1988; Buchner, Erdfelder und Faul 1996). Gewiss sind entsprechende Überlegungen, die sich häufig auf experimentelle Forschungsdesigns beziehen, nicht ohne weiteres auf die meist komplexen Daten-strukturen der Soziologie zu übertragen, doch kann dies kein Grund sein, diesen Aspekt überhaupt nicht zu thematisieren.

5. Dieser Punkt führt zu grundlegenden Diskussionen, die seit langer Zeit (siehe schon Morrison und Henkel 1970) über die Rolle von Signifikanztests geführt wer-den und mit überzeugenden Gründen die gängige Praxis der Signifikanztests über-haupt, zumindest aber deren unreflektierte Routineanwendung ablehnen (viele neuere Beiträge sind in Harlow, Mulaik und Steiger 1997 versammelt). Selbst wenn man sich diesen Argumenten7 nicht oder nicht vollständig anschließt, wäre aus dieser Diskussion zumindest die Anregung zu übernehmen, in den Veröffentlichungen nicht Signifikanzniveaus, sondern Konfidenzintervalle (oder wenigstens Standard-fehler) auszuweisen. So könnte man auch die übliche, aber dennoch statistisch ge-sehen sinnlose Praxis der Kennzeichnung verschiedener Signifikanzniveaus durch eine unterschiedliche Zahl von „Sternchen“ einstellen (dazu schon Guttman 1977). Gleichzeitig würde man die für die auch in der Soziologie zukünftig wohl wichtiger werdenden Meta-Analysen erforderlichen Informationen zur Verfügung stellen.

6. Den meisten Sozialwissenschaftlern und Sozialwissenschaftlerinnen, die die gän-gigen multivariaten Verfahren (insbesondere die verschiedenen Arten der Regressi-onsanalyse) anwenden, dürfte bewusst sein, dass es sich dabei um Modelle handelt. Es kann also nicht ohne weiteres davon ausgegangen werden, dass die Struktur eines gegebenen Datensatzes den durch die Wahl eines bestimmten Modells vorgegebe-nen Annahmen entspricht. Mit Verfahren der Modelldiagnostik kann zumindest an-satzweise geprüft werden, ob das gewählte Modell mit den Daten einigermaßen kompatibel ist. Im OLS-Regressionsmodell wären dies etwa: Prüfung der Normal-verteilung der Residuen, Kontrolle auf Vorliegen von Autokorrelation sowie Hetero-skedastizität, Ermittlung von Multikollinearität und Prüfung ihrer möglichen Aus-wirkungen, Prüfung von partiellen Residuenplots auf Linearität der Zusammenhänge

7 Zu den wichtigsten Gründen zählt neben der zumeist fehlenden Berücksichtigung der Teststärke

(und damit des Fehlers 2. Art), dass (a) die den statistischen Tests zugrunde liegende Nullhypo-these (die „nil hypothesis“, so Cohen 1997, S. 27) im Allgemeinen unplausibel ist, so dass de-ren Ablehnung kaum Aussagekraft besitzt, und (b) das schematische Festhalten an einer vorge-gebenen Irrtumswahrscheinlichkeit (meist 0,05) zu problematischen Entweder-Oder-Entscheidungen – nämlich „Beibehalten“ oder „Verwerfen“ von Hypothesen – führt.

Page 149: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

150 ZA-Information 53

und mögliche Ausreißer bzw. einflussreiche Fälle, Test auf solche Fälle anhand von Statistiken wie Leverage und Cook’s D (siehe im Detail Brüderl 2000; Fox 1991, 1997).8 In nahezu allen Veröffentlichungen, die Ergebnisse einschlägiger Modell-schätzungen berichten, wird jedoch nicht einmal angegeben, ob solche Verfahren angewandt wurden, geschweige denn, dass Näheres über deren Ergebnisse mitge-teilt würde.

7. Schließlich möchte ich auf den nicht unbedingt zentralen, aber auch nicht zu ver-nachlässigenden Aspekt der Darstellung von Daten und Analyseergebnissen einge-hen. Nur zwei Beispiele: Es lassen sich (erstens) immer noch abschreckende Bei-spiele für Präsentationsgraphiken finden – und dies nicht nur, aber auch in Lehrbü-chern zur Datenauswertung. Dass mir hier Beispiele aus der akademischen For-schungspraxis weniger geläufig sind, liegt vielleicht auch daran, dass Präsentations-graphiken dort wenig eingesetzt werden – m. E. zu wenig, zumindest wenn man (wie ich) die Grenzen zwischen explorativer und Präsentationsgraphik weniger scharf sieht und berücksichtigt, dass sich z. B. bivariate Zusammenhänge ausge-zeichnet zur graphischen Darstellung eignen. Was (zweitens) die numerische Dar-stellung deskriptiver Daten etwa in Kreuztabellen angeht,9 so möchte ich der Ein-fachheit halber auf den Beitrag von Pötschke und Simonson (etwa Tabelle 1, S. 79) zurückgreifen; die im folgenden angeführten Probleme ließen sich auch an vielen anderen Beispielen verdeutlichen. Einerseits wird in der genannten Tabelle das Pro-zentzeichen hinter jeder einzelnen Prozentzahl wiederholt (was nicht zwingend nötig scheint und die Tabelle etwas schwer zu lesen macht), andererseits findet sich kein Hinweis, welche der Prozentwerte Spalten- und welche Zeilenprozente wie-dergeben (was sich schnell herausfinden lässt, aber auch als Legende zur Tabelle angegeben werden könnte). Auch werden die Prozentwerte mit einer Nachkomma-stelle angegeben; da die Daten (angesichts der methodischen Vorgehensweise ver-ständlicherweise) auf einer relativ kleinen Stichprobe mit nicht gut zu beurteilender Stichprobenqualität beruhen – wie die Autorinnen selbst zu Recht bemerken –, han-delt es sich hier möglicherweise um Scheinexaktheit. Ferner scheint es nicht nötig, in allen Zellen zusätzlich zu den Prozentwerten die absoluten Zahlen auszuweisen; eine Beschränkung auf die Randverteilungen wäre hier ausreichend. Schließlich

8 Insbesondere Verfahren der Residuenanalyse (die eine erste Auskunft darüber geben, ob das

gewählte Modell den Daten nicht allzu „fremd“ ist) sowie der Analyse einflussreicher Fälle lie-gen auch für andere häufig verwendete statistische Modelle vor, etwa die logistische Regression (Pregibon 1981) oder die Analyse von Verlaufsdaten (Collett 1994).

9 Siehe dazu auch Ludwig-Mayerhofer (1994).

Page 150: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 151

könnte man darauf verzichten, sämtliche Zellen der Tabelle durch horizontale und vertikale Linien voneinander zu trennen.10

Abschließend möchte ich noch auf einige Probleme eingehen, die sich aus fehlen-den oder unzulänglichen Darstellungen in den Lehrbüchern insbesondere im Be-reich der statistischen Modellierung ergeben. Es stehen hier also weniger Quali-tätsmängel der Forschungspraxis im Vordergrund, sondern die Tatsache, dass die genannten Fragen in den Lehrbüchern nicht ausreichend oder falsch erörtert, in wis-senschaftlichen Publikationen jedoch meist schon vorausgesetzt werden, so dass es in der Lehre oftmals eines erheblichen Aufwandes bedarf, bis die angeführten Punk-te wenigstens einem Teil der Studierenden hinlänglich verdeutlicht worden sind.

8. Bildung und Interpretation von Dummy-Variablen: Zumindest Studierenden (ge-legentlich aber auch Forschungspraktikern) ist nicht ohne weiteres bewusst, wie sehr die auf Dummy-Variablen bezogenen Testergebnisse von der Wahl der Refe-renzkategorie abhängig sind. Eine ungeschickte Wahl der Referenzkategorie kann die inferenzstatistischen Schlussfolgerungen beeinträchtigen (ist die Referenzkate-gorie nur sehr schwach besetzt, führt dies zu hoher Multikollinearität unter den Dummy-Variablen und zu entsprechend hohen Standardfehlern). Auch muss immer wieder verdeutlicht werden, dass die Koeffizienten für die Dummy-Variablen nur mit Blick auf die Referenzkategorie Aussagekraft haben. Nicht zuletzt ist es wichtig zu betonen, dass ein Set von Dummy-Variablen Einfluss haben kann, auch wenn die einzelnen Koeffizienten nicht signifikant von null verschieden sind – nämlich dann, wenn sich die Schätzwerte für die Regressionskoeffizienten zwar nicht signifikant von null (d.h. der Referenzkategorie), aber untereinander unterscheiden.

9. Nicht-lineare Zusammenhänge: Einige nicht-lineare Zusammenhänge können relativ einfach durch polynomische Terme (meistens bereits durch Aufnahme eines quadrierten Terms) angenähert werden; ein typisches Beispiel ist der Befund, dass der Arbeitslohn nicht linear vom Alter oder der Betriebszugehörigkeitsdauer abhängt, da irgendwann Sättigungs- oder andere Effekte eintreten, die die Einkommenszu-wächse verlangsamen oder sogar anhalten. Obwohl die grundlegenden mathemati-schen Zusammenhänge nicht gerade kompliziert sind, scheinen sie doch für viele Studierende eine große Herausforderung darzustellen. Hilfe in den Lehrbüchern ist jedoch nicht zu finden.

10 Insgesamt scheint sich die Tabelle stark am Vorbild der Outputs eines populären Datenanalyse-

paketes zu orientieren. Aber wenn sogar Lehrbücher solche Tabellen einfach unkommentiert und unkritisiert aus dem Programm-Output kopieren (siehe etwa Atteslander 2003, S. 349), ist es kein Wunder, wenn sich solche Praktiken auch bei anderen finden.

Page 151: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

152 ZA-Information 53

10. Praxis der Modellierung: Studierende, die sich bis zur multivariaten Modellie-rung vortasten, wählen immer wieder Verfahren der automatischen Variablenselek-tion wie etwa den schrittweisen Einschluss von Variablen. Automatisierte Verfah-ren mögen in Einzelfällen gerechtfertigt sein, wenn etwa die Wahl eines „besten Modells“ besonders schwierig ist – sofern im Anschluss eine sorgfältige Abwägung unter verschiedenen Modellschätzungen erfolgt. Verfahren des schrittweisen Ein-schlusses von Variablen gehören aber sicher nicht zu den besser geeigneten Selekti-onsalgorithmen; sie werden, soweit ersichtlich, vor allem deshalb gewählt, weil ein-schlägige Einführungen in den Umgang mit SPSS diese Verfahren erwähnen oder gar empfehlen. Bei der Anwendung des schrittweisen Einschlusses besteht die Ge-fahr, dass wichtige Prädiktoren irrtümlich nicht in das Modell aufgenommen wer-den; Gründe hierfür können sein, dass sie wegen (möglicherweise leicht zu behe-bender) Multikollinearität das den Einschlussalgorithmen zugrunde liegende Signi-fikanzkriterium nicht überschreiten, oder dass zwei Merkmale nur gemeinsam Ein-fluss haben, der Selektionsalgorithmus jedoch alle Variablen nur einzeln hinsicht-lich ihres Erklärungsbeitrages prüft. Eine wesentlich bessere Modellierungsstrategie besteht m. E. darin, vom vollen Modell (dem Modell mit allen als hypothetisch rele-vant ausgewählten Variablen) auszugehen und nach Prüfung, ob die Anwendungs-voraussetzungen dieses Modells gegeben sind, Variablen ohne Erklärungsbeitrag (möglichst einzeln) aus dem Modell auszuschließen.11

3 Einige abschließende Bemerkungen

Meine kurzen Anmerkungen sollten verdeutlichen, dass eine Ermittlung des Bedarfs an bestimmten Verfahren nur eine erste – gewiss sehr wichtige – Orientierung für eine Verbesserung der Methodenausbildung darstellt. Die Qualität der Ausbildung kann sich jedenfalls nicht nur daran messen lassen, dass die in der beruflichen Pra-xis erforderlichen Verfahren mehr oder weniger oberflächlich und routinemäßig beherrscht werden; zumindest für die wissenschaftliche Praxis kann das nicht aus-reichen.12 Wenn die Praxis sich als ungenügend erweist, ist eine Orientierung aus-

11 Die in sozialwissenschaftlichen Veröffentlichungen häufig zu findende Wiedergabe ausschließ-

lich des vollen Modells ist ebenfalls problematisch, insbesondere wenn weitere Modellprüfun-gen unterbleiben. Irrelevante Prädiktoren können infolge von Multikollinearität die Standard-fehler anderer, möglicherweise relevanter Prädiktoren in die Höhe treiben, so dass letztere als nicht signifikant ausgewiesen werden, obwohl sie nach Entfernung der irrelevanten Prädiktoren tatsächlich signifikant wären.

12 Selbstverständlich sollte – und dürfte – auch die Markt- und Meinungsforschung hohe Quali-tätsstandards anstreben. Deren Schwerpunkte liegen aber möglicherweise anderswo, so wie nach den Ergebnissen von Pötschke und Simonson dort auch vielfach andere Datenanalysever-

Page 152: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 153

schließlich an deren etablierten Verfahrensweisen für die Weiterentwicklung sozi-alwissenschaftlicher Ausbildung eher problematisch. Ich habe an einigen Beispielen aus dem Bereich der statistischen Datenanalyse zu verdeutlichen versucht, dass tat-sächlich sowohl die Praxis – wie sie sich in sozialwissenschaftlichen Publikationen niederschlägt – als auch manche Lehrbücher den Studierenden (aber auch den be-reits als Sozialforschern und Sozialforscherinnen Tätigen) nicht immer hilfreiche Anhaltspunkte, sondern manchmal zu wenig oder gar irreführende Anleitung bieten.13

Es sollte offenkundig sein, dass die genannten (und denkbare weitere) Probleme einen Anlass darstellen, die Ausbildung in Verfahren der statistischen Datenanalyse eher zu intensivieren – wie dies ja in letzter Zeit vielfach gefordert wurde (vgl. die meisten Beiträge in Engel 2002a). Abschließend sei jedoch darauf hingewiesen, dass dies natürlich auch für Verfahren qualitativer Datenanalyse gilt. Ein von der AG (inzwischen Sektion) Methoden der qualitativen Sozialforschung in der DGS eingesetzter Arbeitskreis hat bekanntlich Vorschläge für eine Methodenausbildung gemacht, die qualitativen Verfahren einen Platz einräumt, der dem der standardi-sierten Verfahren gleichwertig ist (AG Methoden der qualitativen Sozialforschung 2002). Diese Vorschläge wurden von den Vertretern der standardisierten Forschung (meist in der Methoden-Sektion der DGS versammelt) nicht zuletzt mit dem Hin-weis auf den geringen Stellenwert abgewertet, den diese Verfahren in der For-schungspraxis haben. Auch hier liegt eine (erstaunliche) Gleichsetzung falsch ver-standener Praxisrelevanz mit Qualität vor.14 Denn auch wenn qualitative Verfahren möglicherweise weniger zum Einsatz kommen als solche der standardisierten

fahren zum Einsatz kommen. Mangels ausreichender Bekanntschaft mit diesem Berufsfeld kann ich mich hierzu nicht kompetent äußern.

13 Das kann in Einzelfällen auch Bücher betreffen, die zu Recht weite Verbreitung und Anerken-nung finden. Beispielsweise haben Pötschke und Simonson bei ihrer Inhaltsanalyse von Zeit-schriftenaufsätzen die Intercoderreliabilität geprüft, dabei aber dem Lehrbuch von Andreas Diekmann (1995) eine Maßzahl entnommen, deren Problematik von ihnen selbst gesehen wur-de (S. 80, Fn. 10). Ein besser geeignetes Maß – Kappa –, welches einen Korrekturfaktor für jene Übereinstimmungen enthält, die sich alleine aus den Randverteilungen ergeben, wurde bereits vor über 40 Jahren von J. Cohen (Cohen 1960) entwickelt, es ist seit langer Zeit in Übersichts-artikeln in deutscher (Wegner 1976) und englischer Sprache (Tinsley und Weiss 1975; Bartko und Carpenter 1976) ausführlich dargestellt und auch seit vielen Jahren etwa im Programm SPSS implementiert – aber in der deutschen Sozialforschung offensichtlich immer noch weitge-hend unbekannt.

14 Aus wissenschaftssoziologischer Sicht müsste man natürlich noch weiter gehen und prüfen, ob die geringe Bedeutung qualitativer Verfahren unter den Forschungsberichten, die in den wich-tigsten Zeitschriften publiziert werden, nicht Resultat von Prozessen der Bildung wissenschaft-licher Schulen und der Auseinandersetzung zwischen diesen ist. Ebenso könnte es sein, dass deshalb weniger Arbeiten publiziert werden, die auf qualitativen Verfahren beruhen, weil die Ausbildung in diesen Verfahren (und dementsprechend die Qualität der Ergebnisse) unzuläng-lich ist. Beide Möglichkeiten verweisen auf weitere Grenzen einer starken Orientierung an der bestehenden Forschungs- und Publikationspraxis als Maßstab.

Page 153: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

154 ZA-Information 53

Datenauswertung, so müssen diejenigen, die sie anwenden sollen, darin ebenso gut ausgebildet werden wie jene, die standardisierte Verfahren einsetzen.

Literatur

Arbeitsgruppe Methoden der qualitativen Sozialforschung 2002: Jahresbericht 2001/2002. In: Soziologie. Forum der Deutschen Gesellschaft für Soziologie 3/2002, S. 94-106.

Atteslander, Peter unter Mitarbeit von Jürgen Cromm, Busso Grabow, Harald Klein, Andrea Maurer, Gabriele Siegert 2003: Methoden der empirischen Sozialforschung. 10. neu bearbeitete und erweiterte Auf-lage. Berlin, New York: de Gruyter.

Bartko, J. J.; Carpenter, W. T. 1976: On the methods and theory of reliability. In: Journal of Nervous and Mental Disease 163, S. 307-317.

Brüderl, Josef 2000: Regressionsverfahren in der Bevölkerungswissenschaft, in: Ulrich Mueller; Bernhard Nauck; Andreas Diekmann (Hg.), Handbuch der Demographie 1. Modelle und Methoden, Berlin: Springer, S. 589-642.

Buchner, Axel; Erdfelder, Edgar; Faul, Franz 1996: Teststärkeanalysen, in: Edgar Erdfelder; Rainer Mausfeld; Thorsten Meiser; Georg Rudinger (Hg.), Handbuch Quantitative Methoden, Weinheim: Beltz – PsychologieVerlagsUnion, S. 123-136.

Cohen, Jacob 1960: A coefficient of agreement for nominal scales. In: Educational and Psychological Meas-urement 20, S. 37-46.

Cohen, Jacob1988: Statistical power analysis for the behavioral sciences (2. Aufl.). Hillsdale: Erlbaum.

Cohen, Jacob 1997: The earth is round (p < .05), in: Lisa L. Harlow; Stanley A. Mulaik; James H. Steiger (Hg.), What if there were no significance tests?, Mahwah, New Jersey; London: Lawrence Erlbaum Associ-ates, S. 21-35.

Collett, David 1994: Modelling Survival Data in Medical Research. London: Chapman & Hall.

Diekmann, Andreas 1995: Empirische Sozialforschung. Grundlagen, Methoden, Anwendungen. Reinbek bei Hamburg: Rowohlt.

Engel, Uwe (Hg.) 2002a: Praxisrelevanz der Methodenausbildung (Sozialwissenschaftliche Tagungsberichte Band 5), Bonn: Informationszentrum Sozialwissenschaften.

Engel, Uwe 2002b: Methodenlehre empirischer Sozialforschung. Bedarf und Reformperspektiven, in: Uwe Engel (Hg.), Praxisrelevanz der Methodenausbildung (Sozialwissenschaftliche Tagungsberichte Band 5), Bonn: Informationszentrum Sozialwissenschaften, S. 19-34.

Erickson, Bonnie H.; Nosanchuk, Terry A. 1992: Understanding Data. Maidenhead, Philadelphia: Open University Press.

Fox, John 1991: Regression Diagnostics (Series: Quantitative Applications in the Social Sciences). London: Sage.

Fox, John 1997: Applied Regression Analysis, Linear Models, and Related Methods. Newbury Park: Sage.

Guttman, Louis 1977: What is not what in statistics. In: The Statistician 26, S. 81-107.

Harlow, Lisa L.; Mulaik, Stanley A.; Steiger, James H. (Hg.) 1997: What If There Were No Significance Tests? Mahwah, NJ: Erlbaum.

Heckman, James J. 1979: Sample selection bias as a specification error. In: Econometrica 47, S. 153-161.

Kish, Leslie 1995: Methods for design effects. In: Journal of Official Statistics 11, S. 55-77.

Page 154: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 155

Kühnel, Steffen; Krebs, Dagmar 2001: Statistik für die Sozialwissenschaften. Grundlagen, Methoden, An-wendungen. Reinbek bei Hamburg: Rowohlt.

Ludwig-Mayerhofer, Wolfgang 1994: Kleine Anmerkung, die Verbesserung der Darstellung von Kreuzta-bellen betreffend. In: Kölner Zeitschrift für Soziologie und Sozialpsychologie 46, S. 12-129.

Marsh, Catherine 1988: Exploring Data. Cambridge: Polity Press.

Morrison, Denton E.; Henkel, Ramon E. (Hg.) 1970: The Significance Test Controversy, Chicago: Aldine.

Pötschke, Manuela; Simonson, Julia 2003: Konträr und ungenügend? Ansprüche an Inhalte und Qualität einer sozialwissenschaftlichen Methodenausbildung. In: ZA-Information 52, S. 72-92.

Pregibon, D. 1981: Logistic regression diagnostics. In: The Annals of Statistics 9, S. 705-724.

Schnell, Rainer 1994: Graphisch gestützte Datenanalyse. München, Wien: Oldenbourg.

Schnell, Rainer 2000: Less frequently asked questions: Nutzen und Notwendigkeit grafisch gestützter Da-tenanalyse. In: Österreichische Zeitschrift für Soziologie 25, S. 5-25.

Schnell, Rainer 2002: Ausmaß und Ursachen des Mangels an quantitativ qualifizierten Absolventen sozial-wissenschaftlicher Studiengänge, in: Uwe Engel (Hg.), Praxisrelevanz der Methodenausbildung (Sozialwis-senschaftliche Tagungsberichte Band 5), Bonn: Informationszentrum Sozialwissenschaften, S. 35-44.

Simonson, Julia; Pötschke, Manuela 2002a: Zur Praxisrelevanz der Methodenausbildung: Ergebnisse einer Online-Befragung, in: Uwe Engel (Hg.), Praxisrelevanz der Methodenausbildung (Sozialwissenschaftliche Tagungsberichte Band 5), Bonn: Informationszentrum Sozialwissenschaften, S. 131-158.

Simonson, Julia; Pötschke, Manuela 2002b: Zur Bedeutung empirischer Methoden im Spiegel ausgewählter soziologischer Fachzeitschriften, in: Uwe Engel (Hg.), Praxisrelevanz der Methodenausbildung (Sozialwis-senschaftliche Tagungsberichte Band 5), Bonn: Informationszentrum Sozialwissenschaften, S. 171-182.

Stolzenberg, Ross M.; Relles, Daniel A. 1997: Tools for intuition about sample selection bias and its correc-tions. In: American Sociological Review, 62, S. 494-507.

Tinsley, H. E. A.; Weiss, D. J. 1975: Interrater reliability and agreement of subjective judgments. In: Journal of Counseling Psychology 22, S. 358-376.

Tukey, John W. 1977: Exploratory data analysis. Reading, MA: Addison & Wesley.

Wegner, Reinhard 1976: Ratingmethoden, in: Jürgen van Koolwijk; Maria Wieken-Mayser (Hg.), Techni-ken der empirischen Sozialforschung, München: Oldenbourg, S. 103-130.

Page 155: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

156 ZA-Information 53

Das Teilprojekt "Ostdeutsche Lebensverläufe im

Transformationsprozess (LV-Ost)" der Deutschen

Lebensverlaufsstudie

von Britta Matthes 1

Zusammenfassung

Mit den Daten des Teilprojekts „Ostdeutsche Lebensverläufe im Transformations-prozess (LV-Ost)" können die Folgen der ostdeutschen Transformation für die Le-bensverläufe der DDR-Geburtskohorten 1929-31, 1939-41, 1951-53 und 1959-61 sowie 1971 untersucht werden. Dieses Teilprojekt ist integraler Bestandteil des um-fassenderen Forschungsvorhabens „Lebensverläufe und gesellschaftlicher Wandel“, aus dem unter der Leitung von Karl Ulrich Mayer die Deutsche Lebensverlaufs-studie (German Life History Study, GLHS) hervorgegangen ist. Im Teilprojekt LV-Ost-Panel (ZA-Studiennummer 3925) konnten 1.407 Personen befragt werden, die bereits am Teilprojekt „Lebensverläufe und historischer Wandel in der ehemaligen DDR (LV-DDR)“ (ZA-Studiennummer 2644) teilgenommen hatten. Darüber hinaus wurden im Teilprojekt LV-Ost 71 (ZA-Studiennummer 3926) 610 Frauen und Männer der DDR-Geburtskohorte 1971 interviewt.

Abstract

Data collected in the research project "East German Life Courses after Unification (LV-Ost)" enables investigation about the consequences of the East German trans-formation process on the life courses of the 1929-31, 1939-41, 1951-53 and 1959-61 as well as 1971 cohorts. This study is part of the German Life History Study (GLHS) directed by Karl Ulrich Mayer at the Center for Sociology and the Study of the Life Course. In the study LV-Ost-Panel (ZA-study number 3925) we succeeded in re-interviewing 1.407 participants of the follow-up study of the former project

1 Dr. Britta Matthes ist Wissenschaftliche Mitarbeiterin am Max-Planck-Institut für Bildungs-

forschung, Berlin, Forschungsbereich Bildung, Arbeit und gesellschaftliche Entwicklung. E-mail: [email protected]

Page 156: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 157

"Life Courses and Historical Change in the German Democratic Republic (LV-DDR)" (ZA-study number 2644). In addition, in the study LV-Ost 71 (ZA-study number 3926) 610 men and women who were born in 1971 were asked about their entire life.

1 Die Deutsche Lebensverlaufsstudie und ihr Teilprojekt "Ostdeutsche Lebensverläufe im Transformationsprozess (LV-Ost)"

Das Teilprojekt "Ostdeutsche Lebensverläufe im Transformationsprozess (LV-Ost)" ist die Nachfolgestudie des Forschungsprojektes „Lebensverläufe und historischer Wandel in der ehemaligen DDR (LV-DDR)“ (ZA-Studiennummer 2644). Diese Teilprojekte sind integraler Bestandteil des umfassenderen Forschungsvorhabens „Lebensverläufe und gesellschaftlicher Wandel“, aus dem unter der Leitung von Karl Ulrich Mayer am Forschungsbereich „Bildung, Arbeit und gesellschaftliche Entwicklung“ des Max-Planck-Instituts für Bildungsforschung in Berlin die Deut-sche Lebensverlaufsstudie (German Life History Study, GLHS) hervorgegangen ist.2 In dem Teilprojekt LV-Ost-Panel (ZA-Studiennummer 3925) wurden von März 1996 bis Januar 1998 dieselben Personen zu ihrem Leben seit Dezember 1989 be-fragt, die bereits 1991/92 an der LV-DDR-Studie teilgenommen hatten. Von den 2.331 Befragten der LV-DDR-Studie konnten 1.407 Personen für ein weiteres, tele-fonisches oder persönliches computergestütztes Interview gewonnen werden. Gleichzeitig wurde die Studie auf die Geburtskohorte 1971 ausgedehnt, indem in der LV-Ost 71 (ZA-Studiennummer 3926) 610 Frauen und Männer, die 1971 in der DDR geboren wurden und im Oktober 1990 noch in Ostdeutschland lebten, von Mai 1996 bis Januar 1998 interviewt wurden (vgl. Tabelle 1).

Während sich die LV-DDR auf die Rekonstruktion der DDR-Sozialgeschichte kon-zentrierte, fokussiert die LV-Ost auf die Auswirkungen des ostdeutschen Trans-formationsprozesses. Dabei wird die ostdeutsche Transformation als Prozess be-trachtet, der sowohl durch die Erblasten der DDR-Ausgangsgesellschaft als auch durch die Folgen der Inkorporation in das westdeutsche Institutionengefüge be-stimmt wird (Diewald/Mayer 1996). Im Mittelpunkt des Analyseinteresses stand der Wandel der Sozialstruktur (Mayer 2001). Welche sozialen Positionen sind wäh-rend der ostdeutschen Transformation verschwunden, welche neu entstanden? Wie haben sich die Allokationskriterien und -mechanismen für die Zuordnung von Personen zu diesen Positionen verändert?

2 Im Rahmen dieses Forschungsvorhabens wurden darüber hinaus die Lebensverläufe ver-

schiedener westdeutscher Geburtskohorten erfasst (Wagner 1996 und Hillmert in diesem Heft). Die Daten der Deutschen Lebensverlaufsstudie ermöglichen damit detaillierte historische und gesellschaftsvergleichende Analysen deutscher Lebensverläufe des gesamten 20. Jahrhunderts.

Page 157: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

158 ZA-Information 53

Tabelle 1 Die ostdeutschen Teilprojekte der Deutschen Lebensverlaufsstudie

Teilprojekt Lebensverläufe und histo-rischer Wandel in der ehe-maligen DDR (LV-DDR)

Ostdeutsche Lebensver-läufe im Transformations-prozess (LV-Ost-Panel)

Ostdeutsche Lebensver-läufe im Transformations-prozess (LV-Ost 71)

ZA-Studien-nummer 2644 3925 3926

Feldzeitraum August 1991 bis November 1992

März 1996 bis Januar 1998

Mai 1996 bis Januar 1998

Realisierte Fälle

1929-31: 592 1939-41: 586 1951-53: 578 1959-61: 572

1929-31: 329 1939-41: 366 1951-53: 343 1959-61: 369

1971: 610

Erhebung persönliches Fragebogen-Interview

telefonisches bzw. persön-liches computergestütztes Interview

telefonisches bzw. persön-liches computergestütztes Interview

Grundgesamtheit Deutsche Wohnbevölkerung der entsprechenden Geburtsjahrgänge in Privathaus-halten in der DDR im Oktober 1990

Weil sich vor allem der ostdeutsche Arbeitsmarkt durch die Wiedervereinigung ver-ändert hat, konzentrierte sich das Projekt auf die Frage, wer nach 1989 noch gute Arbeitsmarktchancen hatte und wer mit Benachteiligungen rechnen musste (Diewald/ Solga 1997b). Von besonderem Interesse waren der Einfluss des branchenspezi-fischen Beschäftigungsabbaus und -wachstums auf die Erwerbschancen (Goedicke 2002), die Verwertbarkeit der in der DDR erworbenen Qualifikationen (Zühlke 2000, Solga/Diewald 2001), der Zusammenhang zwischen Beschäftigungssituation und Persönlichkeitsentwicklung (Diewald 1999) sowie die Arbeitsmarktchancen unterschiedlicher Bevölkerungsgruppen (insbesondere von Frauen (Trappe 1997) und von Parteimitgliedern und ehemaligen Leitungskadern (Solga 1997)). Um die Besonderheiten des ostdeutschen Transformationsprozesses abbilden zu können, wurden darüber hinaus vergleichende Analysen mit Westdeutschland (z.B. Diewald/ Solga 1997a, Rosenfeld/Trappe 2002) und Polen (z.B. Diewald/Mach/Solga 2000) durchgeführt.

Mit der Erweiterung dieses Anschlussprojektes um die 1971 in der DDR Geborenen sollte vordergründig der Frage nachgegangen werden, ob die Befunde der Trans-formationsforschung auch auf die noch nicht vollständig ins DDR-Beschäftigungs-system Integrierten zutreffen (Matthes 2002). Das Besondere an den Angehörigen der Geburtskohorte 1971 ist, dass sie im Jahre 1989 ihr 18. Lebensjahr vollendeten. Diejenigen, die in der DDR keinen Zugang zu den höheren Bildungseinrichtungen suchten bzw. bekamen, hatten ihre Berufsausbildung also noch vor dem Beitritt der

Page 158: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 159

neu gebildeten ostdeutschen Länder zur Bundesrepublik abgeschlossen und standen vor der Herausforderung, die in der DDR erworbenen Qualifikationen und Aus-bildungszertifikate unter den sich rasch verändernden (wirtschafts-)strukturellen Rahmenbedingungen zu verwerten. Diejenigen, die zu diesem Zeitpunkt noch eine Ausbildung absolvierten, mussten entscheiden, ob der eingeschlagene Bildungs- und Berufsweg noch aussichtsreich und gangbar erschien. Unter welchen Bedin-gungen wurden die Bildungs- und Berufsentscheidungen revidiert, die vor der Wende unter völlig anderen gesellschaftlichen Bedingungen zustande gekommen und mit anderen Zukunftsvorstellungen verbunden waren?

Koordiniert wurde dieses Teilprojekt von Martin Diewald und Heike Solga. Weitere Projektmitarbeiter waren Anne Goedicke, Britta Matthes und Sylvia Zühlke.

2 Frageprogramm und Stichprobendesign

Auf der Grundlage des Erhebungsinstruments der LV-DDR-Studie wurde ein stan-dardisiertes, computergestütztes Befragungsprogramm entwickelt, mit dem sowohl telefonisch als auch persönlich Interviews (CATI-/CAPI-Methodenmix) durchge-führt werden konnten. In einem Pretest wurde das Erhebungsinstrument auf Ver-ständlichkeit und Akzeptanz unter den Zielpersonen sowie auf Handhabbarkeit sei-tens der Interviewer getestet.

In dem Erhebungsinstrument der LV-Ost-Panel (vgl. Goedicke/Lichtwardt/Mayer 2003, Teil 1: 38 ff.) wurde besonderer Wert auf die Erfassung der Erwerbsgeschichte nach 1989 gelegt, so dass getrennt für die Geburtskohorte 1929-31 die aktuelle Er-werbssituation bzw. bei Ruhestand die letzte Erwerbstätigkeit sowie die Alltags-gestaltung im Ruhestand und für die Geburtskohorten 1939-41, 1951-53 und 1959-61 der Erwerbsverlauf inklusive der Aus- und Weiterbildungsgeschichte er-fragt wurden. Darüber hinaus wurden Angaben zu Veränderungen der Wohnsitu-ation seit 1989, den aktuellen Mitgliedschaften in Organisationen, den sozialen Kontakten und Freundschaften vor und nach 1989 und den Veränderungen in Ehe und Partnerschaft seit 1989 ermittelt.

Im Erhebungsinstrument der LV-Ost 71 (vgl. Matthes/Lichtwardt/Mayer 2003, Teil 1: 40 ff.) wurde retrospektiv und in empirisch-quantitativer Weise um detaillierte An-gaben zur Herkunftsfamilie, zur Wohn-, Schul- und Ausbildungs-, Erwerbsgeschichte, zu Partnerschaften, Kindern sowie zu Mitgliedschaften in Organisationen und poli-tischen Vereinigungen, zu aktuellen Einstellungen zu Parteien, zu sozialen Netz-werken und zu den Zukunftsperspektiven gebeten. Diese Angaben ermöglichen eine detaillierte Rekonstruktion der Lebensverläufe der 1971 in der DDR Geborenen.

Page 159: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

160 ZA-Information 53

Den Ausgangspunkt für die Panelerhebung bildete der Adressenbestand der 2.328 realisierten Fälle der LV-DDR. Die Stichprobe für diese Erhebung stammte aus einem Mastersample, das von INFAS im Oktober 1990 aus dem zentralen DDR-Einwohnermelderegister gezogen worden war (Solga 1996: 33). Zu beachten ist, dass – weil das Mastersample im Oktober 1990 gezogen wurde – nur Personen be-fragt wurden, die zu diesem Zeitpunkt noch in der DDR lebten. Personen, die bis Oktober 1990 in die alten Bundesländer übergesiedelt waren, sind daher nicht in der Stichprobe enthalten. Aufgrund von Panelmortalität reduzierte sich dieser Adres-senbestand auf eine Bruttostichprobe von 2.159 Adressen (vgl. Methodenbericht in Goedicke/Lichtwardt/Mayer 2003, Teil 2: 8 ff.).

Dieses Mastersample stellte auch die Basis für die Erhebungen der Lebensverläufe der 1971 in der DDR Geborenen dar. Damit konnte sichergestellt werden, dass die regional mobilen Zielpersonen, d.h. jene Personen, die nach dem Oktober 1990 nach Westdeutschland verzogen waren, bei der Ziehung noch berücksichtigt und nach einer Recherche der neuen Adressen auch am neuen Wohnort befragt werden konnten. Allerdings stellte sich bei der Überprüfung der Adressen anhand des Da-tenbestandes des Statistischen Bundesamtes (1992) heraus, dass im Mastersample zu wenige Adressen der kleinsten Ortsgrößenklasse vorhanden waren. Daher wurde diese Ortsgrößenklasse bei der Ziehung um 30 Prozent aufgestockt. Ferner wurde die Anzahl der Frauen leicht erhöht, um die Relation 50:50 zwischen den Ge-schlechtern zu erhalten. Aus diesem leicht modifizierten Mastersample wurde die Stichprobe für die 1971 in der DDR Geborenen gezogen (vgl. Methodenbericht in Matthes/Lichtwardt/Mayer 2003, Teil 2: 6 ff.).

Vor und während der Anschlusserhebung wurden intensive Bemühungen unter-nommen, die Anzahl neutraler Ausfälle zu minimieren. Deshalb wurden die Ziel-personen in Vorbereitung auf die Erhebung ausführlich über das Thema und die Methode der Studie informiert und für eine Teilnahme ein Los der „Aktion Sorgen-kind“ angeboten. Im November 1996 wurde der Anreiz für ein vollständig realisiertes Interview erweitert, indem eine Aufwandsentschädigung von 50,- DM angeboten wurde.

3 Datenerhebung und -edition

Die LV-Ost-Panel-Datenerhebung dauerte von März 1996 bis Januar 1998. Die Zahl der realisierten und auswertbaren Fälle beträgt 1.407 Personen, mit jeweils ca. 330 Interviews pro Kohorte und nahezu gleichen Anteilen an Männern und Frauen. Die Ausschöpfungsquote beträgt damit bezogen auf die um die neutralen Ausfälle bereinigte Stichprobe 74 Prozent (vgl. Tabelle 2).

Page 160: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 161

Tabelle 2 Grunddaten zur LV-Ost-Panel (ZA-Studiennummer 3925)

Teilprojekt Ostdeutsche Lebensverläufe im Transformationsprozess (LV-Ost-Panel)

Grundgesamtheit Deutsche Wohnbevölkerung der entsprechenden Geburtsjahrgänge in Privathaushalten in der DDR im Oktober 1990

Stichprobe Realisierte Interviews aus der LV-DDR (N=2.328)

Erhebungszeitraum März 1996 bis Januar 1998

Erhebungsmethode Telefonisches (CATI: N=996) bzw. persönliches (CAPI: N=398) computergestütztes Interview

Durchschnittliche Inter-viewdauer (in Minuten)

CATI 1929-31: 50; andere: 65 CAPI 1929-31: 60; andere: 75

Bruttostichprobe Neutrale Ausfälle Realisierte Fälle Auswertbare Fälle Ausschöpfungsquote

2.159 261 1.438 1.407 74 Prozent

Damit konnten für etwa 60 Prozent der 1991/92 in der LV-DDR befragten Personen die Lebensverläufe bis 1996/98 „fortgeschrieben“ werden.

Bei der Befragung der 1971er DDR-Geburtskohorte, die von Mai 1996 bis Januar 1998 dauerte, kamen 1.816 Adressen zum Einsatz. Die Zahl der realisierten und auswertba-ren Interviews beträgt 610, was (bezogen auf die um die neutralen Ausfälle bereinigte Stichprobe) einer Ausschöpfungsquote von 49,5 Prozent entspricht (vgl. Tabelle 3). Damit liegt sie leicht unter der Quote, die bei der LV-DDR erreicht werden konnte.

Die Erhebung der Lebensverlaufsdaten der LV-Ost erfolgte durch eine computer-gestützte Befragung, bei der die Erstedition noch während der Erhebung durch in das Befragungsinstrument einprogrammierte Datenkontrollen durchgeführt wurde. Zum Beispiel wurden viele Daten sofort bei der Eingabe durch Wertebereichs-definitionen geprüft oder die Konsistenz von Zeitverläufen durch Einblendung von zuvor genannten Daten kontrollierbar gemacht. Nach der problemorientierten Sich-tung der unedierten Datensätze stellte sich jedoch heraus, dass die verbesserte com-putergestützte Datenerhebung der Lebensverlaufsdaten die anschließende Daten-prüfung und -korrektur nicht überflüssig gemacht hatte. Deshalb wurden die Daten einer gründlichen fallweisen Edition unterzogen. Die Prüfung und Korrektur der Lebensverlaufsdaten beschränkte sich dabei nicht auf die Eliminierung inhaltlich nicht definierter Codes oder auf die Korrektur von Filterfehlern, sondern bedeutete v.a. auch akribische inhaltliche Konsistenz- und Plausibilitätsprüfungen. Um ein weitgehend einheitliches Vorgehen der Editeure zu sichern, wurden – ausgehend von den Materialsammlungen und Editionshandbüchern der bereits abgeschlossenen

Page 161: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

162 ZA-Information 53

Tabelle 3 Grunddaten zu LV-Ost 71 (ZA-Studiennummer 3926)

Teilprojekt Ostdeutsche Lebensverläufe im Transformationsprozess (LV-Ost 71)

Grundgesamtheit Deutsche Wohnbevölkerung des Geburtsjahrganges 1971 in Privathaus-halten in der DDR im Oktober 1990

Stichprobe

Einwohnermeldestichprobe (N=1.816) in 427 Gemeinden; Schichtung nach den im Oktober 1990 vorhandenen 217 Stadt- und Landkreisen und 10 Gemeindegrößenklassen; Aufstockung der kleinsten Ortsgrößenklasse um 30 Prozent, leichte Erhöhung der Anzahl der Frauen

Erhebungszeitraum Mai 1996 bis Januar 1998

Erhebungsmethode Telefonisches (CATI: N=370) bzw. persönliches (CAPI: N=243) computergestütztes Interview

Durchschnittliche Interview-dauer (in Minuten)

CATI: 102 CAPI: 112

Bruttostichprobe Neutrale Ausfälle Realisierte Fälle Auswertbare Fälle Ausschöpfungsquote

1.816 583 613 610 49 Prozent

Teilprojekte der Deutschen Lebensverlaufsstudie – Editionsregelwerke entwickelt, die sukzessive um Regeln und Erläuterungen, die sich aus dem Editionsprozess er-gaben, erweitert wurden.

Besondere Schwierigkeiten für die Datenedition der LV-Ost-Panel ergaben sich daraus, dass für den Zeitraum von 1989 bis 1991/92 auch Daten aus der LV-DDR vorlagen, die nicht immer identisch mit den neu erhobenen Angaben waren, die es jedoch zu einer widerspruchsfreien Struktur zusammenzufügen galt. Die Daten-prüfung und -korrektur der LV-Ost-Panel erstreckte sich von Frühjahr 1997 bis Sommer 1999 und konzentrierte sich insbesondere auf die Themenbereiche Er-werbsgeschichte, Aus- und Weiterbildung, Nebentätigkeiten sowie Partnerschaft, Kinder und Mitgliedschaft in Organisationen (vgl. Editionsregeln in Goedicke/ Lichtwardt/Mayer 2003, Teil 2: 38 ff.). Die Datenedition wurde von etwa 10 stu-dentischen Hilfskräften unter der Supervision von Sonja Menning durchgeführt. Zur Klärung von auch nach der Zweit- und Drittedition weiterhin bestehenden Uneindeutigkeiten und Widersprüchlichkeiten erfolgte anschließend eine Nach-recherche, für die zunächst Karin Visser und später Sandra Wagner verantwortlich zeichneten (vgl. Nachrecherchebericht in Goedicke/Lichtwardt/Mayer 2003, Teil 2: 64 ff.). Daran schloss sich ein intensiver Datenprüfungsprozess an, bei dem insbe-sondere die Filterführung und Datenbereiche, aber auch die Zulässigkeit zeitlicher Überschneidungen von Episoden in unterschiedlichen Themenbereichen nochmals überprüft wurden (vgl. Bericht über die Prüfung der Daten in Goedicke/Lichtwardt/

Page 162: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 163

Mayer 2003, Teil 2: 106 ff.). Diese Datenkorrektur und -prüfung wurden von Ralf Künster durchgeführt und angeleitet. Parallel dazu erfolgte die Codierung offener Angaben zu den beruflichen Tätigkeiten und zu den Wirtschaftsbereichen (vgl. Be-richt über die Codierung in Goedicke/Lichtwardt/Mayer 2003, Teil 2: 100 ff.).

Andere Probleme ergaben sich bei der LV-Ost 71. Bei der problemorientierten Sichtung der Daten stellte sich z.B. heraus, dass sich in vielen Lebensverläufen „Datenlöcher“, d.h. Zeiträume, in denen keine Informationen über die Aktivitäten der Zielperson vorhanden waren, ergeben hatten. Diese Datenlöcher waren vor al-lem dadurch entstanden, dass Befragte in der DDR begonnene bzw. abgeschlossene Ausbildungen nicht berichteten, wenn sie für den Lebensverlauf nach 1989 nur noch eine untergeordnete Bedeutung besaßen. Eine Datenedition war demnach un-bedingt erforderlich und wurde unter der Federführung von Britta Matthes von Ok-tober 1997 bis Januar 1998 mit 11 meist studentischen Teilzeitkräften durchgeführt. Erika Brückner leistete in allen Stadien des Dateneditionsprozesses, vor allem aber bei der Schulung der Editeure und bei den Diskussionsrunden große Hilfe. Beate Lichtwardt und Petra Spengemann unterstützten mit großem Engagement die or-ganisatorischen Vorbereitungen für die Schulungen. Außerdem waren sie bei der Durchführung der Schulungen, der Supervision und nicht zuletzt bei der Dokumen-tation der Editionsergebnisse beteiligt (vgl. Editionsbericht in Matthes/Lichtwardt/ Mayer 2003, Teil 2: 28 ff.). Durch die anschließend erfolgte umfangreiche Nachbe-fragung, deren Leitung Beate Lichtwardt oblag, konnten die nach der Datenedition noch bestehenden Lücken überwiegend gefüllt bzw. Widersprüche weitgehend ge-klärt werden (vgl. Nachrecherchebericht in Matthes/Lichtwardt/Mayer 2003, Teil 2: 96 ff.). Parallel zu den und im Anschluss an die Editions- und Nachrecherchear-beiten wurden offene Angaben codiert. Insbesondere bei den halboffenen Fragen wurden Codierungen, sofern diese offenen Angaben mit dem vorhandenen Katego-rienschema verschlüsselt werden konnten, bereits während der Edition und Nachre-cherche vorgenommen (vgl. Bericht über die Codierung in Matthes/Lichtwardt/ Mayer 2003, Teil 2: 142 ff.). An die Eingabe der bereinigten Daten mittels eines eigens dafür von Ralf Künster entwickelten Datenkorrekturprogramms schloss sich ein umfangreicher Datenprüfungsprozess an, bei dem insbesondere die Filterfüh-rung und Datenbereiche, aber auch die Zulässigkeit zeitlicher Überschneidungen von Episoden in unterschiedlichen Themenbereichen nochmals überprüft wurden (vgl. Bericht über die Prüfung der Daten in Matthes/Lichtwardt/Mayer 2003, Teil 2: 162ff.).

Page 163: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

164 ZA-Information 53

4 Repräsentativität und Besonderheiten des verfügbaren Datensatzes

Zur Überprüfung der Repräsentativität der LV-Ost-Panelstudie wurden einerseits Unterschiede zwischen Panelteilnehmern und Nicht-Panelteilnehmern analysiert und andererseits ausgewählte Randverteilungen zwischen der Panelstudie und dem Mikrozensus 1995 verglichen (vgl. Wehner 2003). Abgesehen von einem – in der Lebensverlaufsforschung schon häufiger festgestellten – Bildungseffekt und einer erhöhten regionalen Mobilität vor allem der jüngeren, ledigen Männer sind kaum Unterschiede zwischen den Panelteilnehmern und den Nicht-Panelteilnehmern so-wie dem Mikrozensus 1995 festzustellen. Allerdings muss bei Analysen der LV-Ost-Paneldaten immer in Betracht gezogen werden, dass die (ledigen) Männer der 1950er und 1960er Geburtskohorte sowie die Facharbeiter unterrepräsentiert sind. Die höheren Anteile von Angestellten in der Panelstudie spiegeln zum einen die größere Teilnahmebereitschaft von Personen mit höherem Bildungsniveau wider, sind aber auch auf individuelle Zuordnungsprobleme hinsichtlich der beruflichen Stellung zurückzuführen. Dieses Problem taucht gehäuft bei Studien über ostdeut-sche Personen auf, da die Unterscheidung zwischen Arbeitern und Angestellten in der DDR nicht so deutlich war und Ausbildungsberufe in der Regel die Bezeich-nung “Facharbeiter für ...” unabhängig von der mit der Tätigkeit verbundenen be-ruflichen Stellung trugen.

Bei der LV-Ost 71 lag nicht nur der Anteil der Zielpersonen, die eine Teilnahme an der LV-Ost-71-Studie verweigert hatten, mit 41,5 Prozent sehr hoch. Auch der An-teil stichprobenneutraler Ausfälle (Adresse unbekannt, Wohnung unbewohnt, Ziel-person unbekannt, Zielperson neue Adresse, Zielperson verstorben) war, da der Zeitraum zwischen dem Zeitpunkt der Stichprobenziehung (Oktober 1990) und dem Interview (Mai 1996 bis Januar 1998) relativ lang war, mit 32,1 Prozent – trotz ver-stärkter Anstrengungen bei der Recherche der aktuellen Adressen – deutlich höher als der bei Lebensverlaufsuntersuchungen übliche Prozentsatz. Zwar geht man bei stichprobenneutralen Ausfällen davon aus, dass diese zufälliger und nicht systema-tischer Art sind, so dass sich durch solche Ausfälle keine Verzerrungen der ur-sprünglichen Stichprobe ergeben. Allerdings ist dieser Zusammenhang bisher nur unzureichend analysiert worden. Unter der Annahme, dass insbesondere regional mobile Zielpersonen viel schwerer zu erreichen sind und dass regionale Mobilität sozial selektiv erfolgt, ist eine Stichprobenverzerrung durch diese "stichproben-neutralen“ Ausfälle vor allem bei der hier befragten Geburtskohorte nicht auszu-schließen. Vor diesem Hintergrund erschien es uns angebracht, die Repräsentativität der realisierten Stichprobe der LV-Ost 71 durch einen Vergleich mit den Mikrozen-sen 1991, 1993, 1995 und 1996 analytisch zu überprüfen. Überraschenderweise för-derte dieser Vergleich - abgesehen von für solche Erhebungen typischen Abwei-

Page 164: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 165

chungen – keine markanten Stichprobenverzerrungen zu Tage (Matthes/Wehner 2002). Offensichtlich garantierte die auf der Basis einer nach Ortsgröße geschich-teten Gemeindestichprobe erfolgte Stichprobenziehung das geringe Ausmaß von Verzerrungen.

Die im Zentralarchiv vorliegenden Datensätze der Studien „Ostdeutsche Lebens-verläufe im Transformationsprozess (LV-Ost-Panel)“ und „Ostdeutsche Lebensver-läufe im Transformationsprozess (LV-Ost 71)“ stehen ab sofort allen interessierten Wissenschaftlern für Analysezwecke zur Verfügung. Sie bestehen – getrennt für die LV-Ost-Panel und die LV-Ost 71 – aus einzelnen SPSS-Datenfiles für die jeweili-gen Lebensbereiche, wobei Quer- (Kennzeichnung durch -q) und Längsschnittdaten (Kennzeichnung durch -l) in unterschiedlichen Teildatensätzen abgelegt sind. Die Datensätze wurden identischen, datenschutzbedingten technisch-formalen Verän-derungen unterworfen, wie die Daten der Vorgängerstudie LV-DDR. In diesen Daten-files sind alle direkten Ortsbezüge sowie alle offenen Texte nicht mehr enthalten. Die in der Befragung verwendete „Fragebogennummer“ wurde durch eine neue künst-liche Personenidentifikations-Variable ersetzt, deren Werte mit Hilfe eines Zufallsge-nerators erzeugt wurden. Außerdem wurde die Sortierung der Fälle geändert, so dass kein direkter Bezug zwischen Datenfiles und Fragebögen hergestellt werden kann.

Die sowohl für das LV-Ost-Panel als auch die für die LV-Ost 71 erstellten Daten-dokumentationen (Goedicke/Lichtwardt/Mayer 2003, Teil 1; Matthes/Lichtwardt/ Mayer 2003, Teil 1) ermöglichen einen schnellen und zielgerichteten Überblick über die Daten, ihre Erhebung, Prüfung und Korrektur. Im ersten Teil dieser Doku-mentation findet sich u.a. eine überarbeitete und nutzerfreundlich vereinfachte Fas-sung des Erhebungsinstrumentariums. Diese enthält sowohl die Original-Fragen, die zugehörigen Variablen, Codes und tatsächlichen Filterführungen als auch die im Editionsprozess hinzugekommenen Codes und Korrekturvariablen. Informationen über das Vorhandensein von Editionsregeln für die jeweilige Variable sind ebenfalls aufgeführt. Um Wissenschaftlern, die nicht selbst an der Entstehung der Daten be-teiligt waren, einen Einblick in die verwendeten Materialien zu geben, wurden dar-über hinaus die von INFAS erstellten Methodenberichte, die ausführlichen Edi-tionsberichte, die Nachrechercheberichte sowie die Berichte über die Codierung und Prüfung der Daten in einem zweiten Teil dokumentiert (Goedicke/Lichtwardt/ Mayer 2003, Teil 2; Matthes Lichtwardt/Mayer 2003, Teil 2).

Ansprechpartner für die Studie beim Zentralarchiv für empirische Sozialforschung in Köln (http://www.gesis.org/ZA/) ist Horst Weinen ([email protected]). Ansprechpartner für die Studie beim Max-Planck-Institut für Bildungsforschung in Berlin sind Ralf Künster ([email protected]) und Karola Rockmann ([email protected]).

Page 165: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

166 ZA-Information 53

Literatur

Diewald, Martin (1999). Aufbruch oder Entmutigung? Kompetenzentfaltung, Kompetenzentwertung und subjektive Kontrolle in den neuen Bundesländern. In: Manfred Schmitt & Leo Montada (Hrsg.), Gerechtig-keitserleben im wiedervereinigten Deutschland. Opladen: Leske + Budrich, 99-132. Diewald, Martin & Karl Ulrich Mayer (Hrsg.) (1996). Zwischenbilanz der Wiedervereinigung. Struktur-wandel und Mobilität im Transformationsprozeß, Opladen: Leske + Budrich Diewald, Martin & Heike Solga (1997a). Berufliche Transformationsprozesse in Ost- und Westdeutschland. Ergebnisse und Desiderate der sozialstrukturellen Transformationsforschung. In: Jan Wielgohs & Helmut Wiesenthal (Hrsg.), Einheit und Differenz. Die Transformation Ostdeutschlands in vergleichender Perspek-tive, Berlin: Berliner Debatte INITIAL, 221-238. Diewald, Martin & Heike Solga (1997b). Nach dem Sturm folgte zwar Ruhe, jedoch nicht der Sonnenschein! Mobilitätsprozesse und Allokationskriterien auf dem ostdeutschen Arbeitsmarkt nach 1989. In: Sabine Schenk (Hrsg.), Ostdeutsche Erwerbsverläufe zwischen Kontinuität und Wandel. Opladen: Leske + Budrich, 153-277. Diewald, Martin & Bogdan Mach & Heike Solga (2000). Erfolge und Probleme der ostdeutschen Arbeits-markttransformation in vergleichender Perspektive. In: Roland Habich & Heinz-Herbert Noll (Hrsg.), Vom Zusammenwachsen einer Gesellschaft: Analysen zur Angleichung der Lebensverhältnisse in Deutschland, Frankfurt/Main: Campus, 107-132. Goedicke, Anne (2002). Beschäftigungschancen und Betriebszugehörigkeit: die Folgen betrieblichen Wan-dels für ostdeutsche Erwerbstätige nach 1989. Wiesbaden: Westdeutscher Verlag. Goedicke, Anne/Lichtwardt, Beate/Mayer, Karl Ulrich (2003). Dokumentationshandbuch 'Ostdeutsche Le-bensverläufe im Transformationsprozess (LV-Ost Panel)'. Berlin: Max-Planck-Institut für Bildungsforschung. Matthes, Britta (2002). Brücken und Stolpersteine auf dem Weg ins Erwerbsleben : die Folgen der Trans-formation für den Erwerbseinstieg ostdeutscher Jugendlicher. Berlin, Freie Universität, Dissertation. Matthes, Britta/Wehner, Sigrid (2002). Repräsentativität der Lebensverlaufsstudie Ost (Geburtskohorte 1971) - ein Vergleich ausgewählter Randverteilungen mit den Erhebungen des Mikrozensus. (Arbeitsbericht 1 aus dem Projekt Ostdeutsche Lebensverläufe im Transformationsprozess) Berlin. Max-Planck-Institut für Bildungsforschung. Matthes, Britta/Lichtwardt, Beate/Mayer, Karl Ulrich (2003). Dokumentationshandbuch 'Ostdeutsche Le-bensverläufe im Transformationsprozess (LV-Ost 71)'. Berlin: Max-Planck-Institut für Bildungsforschung. Mayer, Karl Ulrich (2001). Soziale Mobilität und Erwerbsverläufe in der Transformation Ostdeutschlands. In: Wolfgang Schluchter & Peter E. Quint (Hrsg.), Der Vereinigungsschock – Zehn Jahre danach. Eine vergleichende Betrachtung. Weilerswist: Velbrück Wissenschaft, 336-365. Rosenfeld, Rachel A. & Trappe, Heike (2002). Occupational sex segregation in state socialist and market economies : levels, patterns, and change in East and West Germany; 1980s and 1998. In: K. T. Leicht (Hrsg.), Research in social stratification and mobility. Vol. 19. The future of market transition. Greenwich, Conn.: JAI Press, S. 231-267. Solga, Heike (1996). Lebensverläufe und historischer Wandel in der ehemaligen DDR. In: ZA-Information 38: 28-38. Solga, Heike (1997). Der Verbleib der Angehörigen der oberen Dienstklasse der DDR nach 1989: Heißt ihr Schicksal nach der Wende beruflicher Abstieg? In: Stefan Hradil, Eckardt Pankoke (Hrsg.). Aufstieg für alle? Opladen: Leske + Budrich, 321-382. Solga, Heike & Martin Diewald (2001). The East German Labour Market After German Unification: A Study of Structural Change and Occupational Matching. In: Work, Employment & Society 15 (1), 95-126. Trappe, Heike (1997). Transformation der Erwerbsbeteiligung ostdeutscher Frauen? In: Michael Corsten & Hel-mut Voelzkow (Hrsg.), Transformation zwischen Markt, Staat und Drittem Sektor. Marburg: Metropolis, 163-179. Wagner, Michael 1996: Lebensverläufe und gesellschaftlicher Wandel: Die westdeutschen Teilstudien. ZA-Information 38, 20-27. Wehner, Sigrid (2003). Stichprobengüte der Panelstudie "Ostdeutsche Lebensverläufe im Transformations-prozess (LV-Ost Panel)". Berlin: Max-Planck-Institut für Bildungsforschung (Technischer Arbeitsbericht aus dem Projekt Ostdeutsche Lebensverläufe im Transformationsprozess 9/2003). Zühlke, Sylvia (2000). Beschäftigungschancen durch berufliche Mobilität? Arbeitslosigkeit, Weiterbildung und Berufswechsel in Ostdeutschland. Berlin : Edition Sigma.

Page 166: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 167

„Ausbildungs- und Berufsverläufe der Geburtskohorten

1964 und 1971 in Westdeutschland“: die jüngste Teilstudie

der Lebensverlaufsstudie als Scientific Use File

von Steffen Hillmert 1

Zusammenfassung

Das Projekt ‚Ausbildungs- und Berufsverläufe der Geburtskohorten 1964 und 1971 in Westdeutschland’ ist die jüngste Teilstudie des Forschungsprogramms ‚Lebens-verläufe und gesellschaftlicher Wandel’ am Forschungsbereich Bildung, Arbeit und gesellschaftliche Entwicklung des Max-Planck-Instituts für Bildungsforschung, Ber-lin. Die Individualdaten dieses Projekts wurden 1998/99 erhoben. Der Scientific Use File (Studien-Nummer 3927) enthält Informationen über 2909 Lebensverläufe und erlaubt detaillierte Längsschnittanalysen, insbesondere zum Ausbildungsver-halten, zu Arbeitsmarkteinstieg und Erwerbsverläufen sowie zu Prozessen der Familienbildung in den achtziger und neunziger Jahren.

Abstract

The Project ‚Education, Training, and Occupation: Life Courses of the 1964 and 1971 Birth Cohorts in West Germany’ is the most recent part of the German Life History Study (GLHS), conducted by the Max Planck Institute for Human Develop-ment, Center for Sociology and the Study of the Life Course, Berlin. Data collection was in 1998/99. The Scientific Use File (study number 3927) contains individual-level information on 2909 life courses and enables the analyses of detailed longitu-dinal studies particularly on training, labour market entry, employment careers, and family formation during the 1980s and 1990s.

1 Dr. Steffen Hillmert ist Wissenschaftlicher Assistent an der Universität Bamberg und Gastwis-

senschaftler am Max-Planck-Institut für Bildungsforschung, Berlin. Er hat hier von 2000 bis 2003 die Arbeiten an dieser Teilstudie koordiniert. Korrespondenzadresse: c/o Max-Planck-Institut für Bildungsforschung, Forschungsbereich Bildung, Arbeit und gesellschaftliche Ent-wicklung, Lentzeallee 94, 14195 Berlin.

Page 167: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

168 ZA-Information 53

1 Die Deutsche Lebensverlaufsstudie und ihre jüngste Teilstudie

Die Deutsche Lebensverlaufsstudie (German Life History Study/GLHS) ist aus Arbeiten am Sonderforschungsbereich 3 ‘Mikroanalytische Grundlagen der Gesell-schaftspolitik’ an den Universitäten Mannheim und Frankfurt/M. hervorgegangen und wird unter der Leitung von Karl Ulrich Mayer seit 1979 durchgeführt, ab 1983 am Max-Planck-Institut für Bildungsforschung in Berlin. Die Datenbasis setzt sich – mit Ausnahme einer Panelbefragung 1996/97 im Rahmen der ostdeutschen Teil-studien – aus einer Reihe einmaliger, teilweise auch mehrmaliger Retrospektivbe-fragungen von Personen aus ausgewählten Geburtsjahrgängen zusammen (s. Abbil-dung 1; für Westdeutschland vgl. auch Tabelle 1 und Wagner 1996). Die betreffenden Geburtskohorten wurden aufgrund von Vorinformationen zu ihrer kollektiven Lebenssituation (nach Zensusdaten) ausgewählt. In ihrer Gesamtheit erlauben die Lebensverlaufsdaten für Deutschland detaillierte und historisch weiter zurückrei-chende Analysen, die das gesamte 20. Jahrhundert erfassen können2.

Abbildung 1 Die Deutsche Lebensverlaufsstudie (Übersicht)

2 Vgl. dazu http://www.mpib-berlin.mpg.de/de/forschung/bag/index.htm; s.a. Brückner/Mayer

1998.

Page 168: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 169

Die früheren Teilstudien sind bereits seit längerer Zeit beim ZA verfügbar (ZA-Studien-Nummern 2645-2648 für Westdeutschland und 2644 für Ostdeutschland; zu den jüngeren ostdeutschen Teilstudien vgl. den Beitrag von Britta Matthes in diesem Heft). In der neuesten westdeutschen Teilstudie (zur Programmatik des Projekts vgl. auch Corsten/Hillmert 2001) wurden die bis Ende der achtziger Jahre in der alten Bundesrepublik durchgeführten Befragungen durch Daten ergänzt, die die Bildungs- und Erwerbsverläufe der Geburtsjahrgänge 1964 und 1971 bis Ende der neunziger Jahre verfolgen.

Inhaltlicher Ausgangspunkt dieser Teilstudie war die phasenweise sehr schwierige Lage auf dem Ausbildungs- und Arbeitsmarkt der achtziger und neunziger Jahre. Hinzu kommt die besondere demographische Situation des Jahrgangs 1964. Da es sich hierbei um die größte Kohorte seit dem Bestehen der Bundesrepublik handelt, ist eine besondere Konkurrenzsituation innerhalb der Bildungsinstitutionen und beim Einstieg in den Arbeitsmarkt zu vermuten (vgl. auch Hillmert 2001). Im Ge-gensatz dazu ist der Jahrgang 1971 bereits deutlich kleiner gewesen. Schließlich erlaubt die Wahl der Geburtskohorte 1971 den direkten Vergleich mit der entspre-chenden Teilstudie in Ostdeutschland.

Gegenüber den bisherigen Lebensverlaufsstudien weist die jüngste Erhebung eine Reihe von Innovationen auf. Den Schwerpunkt der Studie bildet die genaue Rekon-struktion der Ausbildungs- und Erwerbsphasen einschließlich der vielfältigen Über-gänge zwischen Ausbildungen und Erwerbstätigkeiten. Stichproben- und Befra-gungsdesign wurden leicht verändert. So wurden im Gegensatz zu den bisherigen Lebensverlaufsstudien auch in Deutschland lebende (Deutsch sprechende) Ausländer in die Untersuchung einbezogen. Außerdem wurden auch zeitlich parallele Verläufe von Ausbildung und Erwerbstätigkeit monatsgenau aufgenommen. Schließlich wurde mit dieser Studie auch in methodischer Hinsicht Neuland betreten. Dies galt zum einen für die automatisierte Datenprüfung während des Interviews. Zum anderen wurde für die Möglichkeit einer Verknüpfung der erhobenen Daten mit Informatio-nen aus der Beschäftigtenstatistik die Zustimmung der Befragten eingeholt. Ansons-ten hat sich das Fragenprogramm aber an den bisherigen Teilstudien orientiert, und dies erlaubt langfristige Vergleiche zwischen den einzelnen Geburtskohorten.

Die Erhebung für die Teilstudie der 1964 und 1971 Geborenen in Westdeutschland wurde gemeinsam vom Institut für Arbeitsmarkt- und Berufsforschung in Nürnberg und dem Max-Planck-Institut für Bildungsforschung in Berlin in Auftrag gegeben. Die Haupterhebung der Daten erfolgte in den Jahren 1998 und 1999 in Kooperation mit dem Umfrageinstitut Infas (s. Infas 1999). Der Anhang enthält eine Übersicht über die am Projekt beteiligten Personen.

Page 169: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

170 ZA-Information 53

Tabelle 1 Die westdeutschen Teilstudien der Lebensverlaufsstudie

Teilstudie Lebensverläufe und Wohlfahrts-entwicklung (LV I)

Die Zwischenkriegs-kohorte im Über-gang zum Ruhe-stand (LV II)

Berufszugang in der Beschäfti-gungskrise (LV III)

Ausbildungs- und Berufsverläufe der Geburtsko-horten 1964 und 1971

ZA-Studien-nummer

2645 2646/2647 2648 3927

Feldzeitraum

1981-83 1985/86 (LV IIA) 1987/88 (LV II/TEL)

1989 1998-99

Geburtskohorten

1929-31, 1939-41 1949-51

1919-21 1954-56, 1959-61 1964, 1971

Realisierte Fälle

Kohorte 1929-31: 709Kohorte 1939-41: 733Kohorte 1949-51: 729

LV IIA: 407 LV II/TEL: 1005

Kohorte 1954-56: 1008 Kohorte 1959-61: 1000

Kohorte 1964: 1474 Kohorte 1971: 1435

Erhebung

Persönliche Inter-views

Persönliche (LV IIA) bzw. telefonische Interviews (LV II/ TEL)

Telefonische Interviews

Größtenteils telefonische Interviews

Grundgesamtheit Deutsche Wohnbevölkerung der entsprechenden Geburtsjahrgänge in Privathaushalten in der Bundesrepublik Deutschland

Deutschsprachige Wohnbevölkerung dieser Geburtsjahr-gänge in Privat-haushalten in den alten Bundeslän-dern

Angesichts ihrer Detailliertheit bedurfte die Erhebung der Lebensverlaufsdaten einer längeren Vorbereitung. Nach der Erhebung, ab Anfang 1999, wurden die Daten im Max-Planck-Institut für Bildungsforschung genau geprüft und ediert. Falls nötig, wurden die Zielpersonen noch einmal telefonisch kontaktiert und um ergänzende Informationen gebeten. Ende 2002 war diese Phase dann weitgehend abgeschlossen.

2 Ablauf der Lebensverlaufsstudie 1964/71

Auf der Grundlage der am Max-Planck-Institut für Bildungsforschung bereits durchgeführten Lebensverlaufsstudien wurde im Februar 1997 mit der Fragebogen-entwicklung und der Konzeption der Studie begonnen.

Zunächst wurde ein Methodentest durchgeführt, um die Ausschöpfung bei der Ein-willigung zur Zuspielung der Sozialversicherungsdaten verbessern zu helfen; das Stichprobendesign wurde gleichzeitig für den Methodentest und die Hauptstudie festgelegt. Nach einer mehrwöchigen Testphase wurde eine Kurzfassung des ge-planten Erhebungsinstruments mit den wichtigsten Fragemodulen von Mai bis Juni 1997 getestet (s. im Einzelnen: Infas 1997). Im ersten großen Pretest wurden dann

Page 170: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 171

im September und Oktober 1997 insgesamt 104 Interviews durchgeführt, davon 98 vollständig. Anschließend wurden die Tonbandaufzeichnungen der Interviews am Max-Planck-Institut ausgewertet und kommentiert. Außerdem wurden die bereits vorliegenden Daten und das Erhebungsinstrument (Computerprogramm) geprüft, um Fehler und Probleme an das Erhebungsinstitut zurückmelden zu können. Nach zahlreichen weiteren Tests und daraus resultierenden Änderungen des Erhebungsin-struments – einschließlich der Einführung einer automatischen Prüfung der chrono-logischen Konsistenz – wurde ein zweiter Pretest durchgeführt. Hierbei wurden noch einmal 43 Interviews, davon 39 vollständig, durchgeführt. Von März bis Mai 1998 wurden erneute Überarbeitungen vorgenommen und dann ab Juni 1998 die ersten Telefoninterviews für die Hauptstudie mit der aktualisierten Version des Er-hebungsinstruments durchgeführt. Auch nach Feldbeginn waren noch Änderungen nötig, die gesondert dokumentiert wurden. Die meisten Interviews erfolgten telefonisch.

Tabelle 2 Grunddaten zur Lebensverlaufsstudie 1964/71 (ZA-Studien-Nr.: 3927)

Grundgesamtheit Deutschsprachige Wohnbevölkerung der Geburtsjahrgänge 1964 und 1971 in Privathaushalten in den alten Bundesländern (inkl. West-Berlin)

Stichprobe Einwohnermeldestichprobe (n=6519) in 97 ausgewählten Gemeinden, gezogen Juni 1997 - Dezember 1997

Schichtung nach Bundesland, Regionstyp und Geburtskohorte

Erhebungszeitraum Mai 1998 – Januar 1999

Erhebungsmethode Mündliche, computerunterstützte Befragung (CATI, bei 249 von 2911 auswertbaren Interviews CAPI)

Durchschnittliche Interview-dauer (netto)

69 Minuten

Verfügbare Interviews (nach Abschluss der Edition)

N=2909

Ausschöpfungsquote Bezogen auf Bruttostichprobe (n=6519): Nach Erhebung 45%, nach Prüfung und Edition 45%

Bezogen auf bereinigte Stichprobe3 (n=4404): Nach Erhebung 67%, nach Prüfung und Edition 66%

3 Abgezogen sind hier u.a. die Ausfallgründe ‚falsche Zielperson’ (nicht Deutsch sprechende

Ausländer) und ‚(neue) Adresse nicht ermittelbar’ (vgl. Infas 1999: 36); verbleibende Ausfall-gründe sind insbesondere Nichterreichbarkeit und Verweigerungen.

Page 171: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

172 ZA-Information 53

Darüber hinaus wurde aus Vergleichsgründen eine Reihe persönlicher Interviews geführt. Zu diesem Zweck wurden im Juli zusätzliche Interviewer geschult. Insge-samt wurden im Rahmen der Erhebung 2.935 Interviews von 53 Interviewerinnen und Interviewern durchgeführt. Um die Ausschöpfung zu erhöhen, wurde im September 1998 zusätzlich mit einer Non-Response-Studie begonnen (s. dazu im Einzelnen: Infas 1999: 41ff.). Die Tabelle 2 stellt wichtige Merkmale der Haupt-erhebung zusammen.

3 Charakterisierung der Stichprobe

Mit einer Ausschöpfungsquote von ca. 45% (brutto) bzw. 66% (netto) liegt die Stu-die über den Quoten vergleichbarer Befragungen. Durch die spätere Nachbefragung konnten darüber hinaus die Lücken in einzelnen Fragen überwiegend gefüllt werden.

Um herauszufinden, wie repräsentativ die Stichprobe ist, wurden bereits in einer frühen Phase ausgewählte, auf Basis der Lebensverlaufsstudie gewonnene, jeweils altersspezifische Verteilungen mit verschiedenen Jahrgängen des Mikrozensus (Scientific Use Files) verglichen (vgl. Hillmert/Kröhnert 2001). Angesichts der dort vorhandenen Fallzahlen (der Mikrozensus ist eine 1%-Stichprobe der Haushalte in der Bundesrepublik Deutschland) und der Pflicht zur Teilnahme an dieser Befra-gung steht eine umfassende Vergleichsgrundlage zur Verfügung. Bei der Gegen-überstellung der einfachen Merkmalsverteilungen (Nutzerdatensätze des Mikrozen-sus) finden sich einige - im Übrigen für Surveys typische - Abweichungen zwischen Mikrozensus und Lebensverlaufsstudie. So sind in den Lebensverlaufsdaten Perso-nen ohne oder mit nur geringer Schul- und Berufsausbildung offenbar unterreprä-sentiert, Personen mit mittleren Bildungsabschlüssen hingegen etwas überrepräsen-tiert. Auch sind die jeweils errechneten Arbeitslosenquoten in den Lebensverlaufs-daten durchweg geringer. Allerdings können auch große Datenbasen wie der Mik-rozensus nicht in jedem Fall als objektive Referenz gelten. So sind die resultierenden Merkmalsverteilungen jeweils nicht nur von der Art der Stichprobe, sondern auch vom Design und der Qualität der Erhebung abhängig. Bei den beiden letzteren Gesichtspunkten ist die Lebensverlaufsstudie mit ihrem differenzierten Fragenpro-gramm und der einzelfallorientierten Datenprüfung klar im Vorteil.

In den Daten finden sich insgesamt 158 Personen (=5,4%) mit einer ausländischen Staatsangehörigkeit (1964: 3,9%; 1971: 7,0%). Dies sind deutlich weniger Ausländer, als eigentlich zu erwarten wäre. Eigene Berechnungen mit dem Mikrozensus 1998 (alte Bundesländer einschließlich Gesamtberlin; hochgerechnet) weisen für die Ko-horten 1964 und 1971 Anteile von 12,3% bzw. 18,3 % aus (vgl. Seibert 2003: 12). Allerdings sind auch die Zielpopulationen unterschiedlich: die Lebensverlaufsstudie

Page 172: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 173

hat von vornherein nur Deutsch sprechende Ausländer eingeschlossen, mit denen die relativ komplexen Telefoninterviews geführt werden konnten.

4 Datenedition

Im Anschluss an die Erhebung wurden die Daten einem aufwändigen Editionspro-zess unterzogen. Hierbei wurden alle Fälle einzeln im Hinblick auf fehlende oder unplausible Angaben geprüft (zum Prozess der Edition in dieser Teilstudie und Konsequenzen für inhaltliche Analysen vgl. ausführlich Hillmert 2002a). Bereits im Juli 1998 wurde mit einer Voredition der bereits verfügbaren Daten begonnen. Die eigentliche Edition der Daten wurde am Max-Planck-Institut für Bildungsforschung Anfang Januar 1999 begonnen. Sie dauerte einschließlich Nachrecherche, Eingabe der Korrekturdaten und Datenprüfung bis Ende 2002. An der Edition (einschließlich Voredition) waren insgesamt 21 Mitarbeiterinnen und Mitarbeiter beteiligt. Ferner wurden diverse offen erhobene Daten (Texte) codiert. Im Januar 2000 wurde mit der Codierung der Berufsangaben begonnen, weitere Vercodungen folgten in unre-gelmäßigen Abständen.

Für die Edition wurde ein differenziertes Regelwerk konstruiert, das sukzessive ange-passt wurde. Auftretende Inkonsistenzen und neue Probleme wurden in der Arbeits-gruppe diskutiert und entschieden, und die einzelnen Bearbeiter erhielten Supervision. Die Datenedition hat sich hier in mehreren Phasen über einen Zeitraum von etwa dreieinhalb Jahren erstreckt, was den zeitlichen Abstand zwischen Erhebung und Verfügbarkeit der Daten erklärt. Eine wichtige Informationsmöglichkeit war ferner die telefonische Nachrecherche bei ca. 1.000 Zielpersonen. Diese wurden noch einmal um klärende oder ergänzende Informationen gebeten.

Durch die systematische Edition sind qualitative Verbesserungen der Datenbasis auch und gerade in einer Phase möglich, in der die eigentliche Datenerhebung be-reits abgeschlossen ist. Dies trägt dazu bei, den Gesamtfehler im Forschungsprozess zu minimieren. Gleichzeitig wird dabei von der linearen Struktur des Forschungs-prozesses, die durch das idealtypische Modell nahegelegt wird, zugunsten einer Wiederholung beziehungsweise Korrektur einzelner Projektschritte und Entschei-dungen abgewichen.

5 Datenstruktur und bisherige Arbeiten

Ähnlich wie bei den vorangegangenen Teilstudien wurden die Daten in nach Le-bensbereichen differenzierten Modulen erhoben (vgl. Tabelle 3). Die Informationen

Page 173: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

174 ZA-Information 53

wurden jeweils in quer- und längsschnittorientierten Teildatensätzen abgelegt, die jeweils durch die Extension -q bzw. -sp gekennzeichnet sind.

Während erstere zeitlich unveränderliche Merkmale oder zusammenfassende Infor-mationen über individuelle Verläufe enthalten, sind letztere nach einzelnen Abschnit-ten (‚Spells’ oder ‚Episoden’) gegliedert.

Tabelle 3 Lebensverlaufsstudie 1964/71: Zentrale Module der Befragung

Themenbereich Module

Allg. Personenmerkmale und Einstellungen Persönliche Angaben Kontrollüberzeugungen

Schul- und Berufsausbildung Allgemeinbildende Schulphasen Berufsausbildungen Aus- und Weiterbildungen

Erwerbstätigkeiten und Phasen der Nichterwerbstätigkeit

Erwerbstätigkeiten Nebentätigkeiten Arbeitslosigkeitsepisoden Lücken

Familie

Eltern Geschwister Partnerschaften Kinder

Haushalt und Wohnen Bisherige Wohnorte Aktuelles Haushaltseinkommen

Für jede dieser Episoden wurden jeweils gleichartige, umfassende Informationen er-hoben. Dadurch ist es möglich, Lebensverläufe sowohl in ihrer zeitlichen als auch ihrer inhaltlichen Komplexität genau zu beschreiben. Da beispielsweise für jeden Ausbildungsabschnitt Dauer, Fachrichtung und Ausbildungseinrichtung erfasst wur-den, lassen sich vollständige Ausbildungsverläufe hinsichtlich ihrer fachlichen oder institutionellen Kontinuität beschreiben (vgl. Hillmert/Jacob 2003a). Darüber hin-aus können empirische Bezüge zwischen Entwicklungen in verschiedenen Lebens-bereichen hergestellt werden.

Die bisherigen Analysen haben sich konzentriert auf Fragen von Bildung und Aus-bildung (Hillmert/Jacob 2003b, Jacob 2003, Seibert 2003) sowie Muster des Ar-beitsmarkteinstiegs und frühere Erwerbskarrieren (Bender/Dietrich 2001, Hillmert 2002b), insbesondere auch unter dem Aspekt unterwertiger Beschäftigung (Büchel/ Pollmann-Schult 2002, Pollmann-Schult/Büchel 2002). Als Vorteil der Daten er-weist sich dabei die Möglichkeit zu innerdeutschen West-Ost-Vergleichen (Trappe/ Goedicke 2003) und längerfristigen Kohortenvergleichen (Mayer/Hillmert 2003).

Page 174: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 175

Einen Überblick über zentrale Projektergebnisse gibt das Buch von Hillmert/Mayer (im Erscheinen).

Die Daten stehen ab sofort interessierten Wissenschaftlern für Analysezwecke zur Verfügung (ZA-Studien-Nummer 3927). Im Zuge der notwendigen Anonymisie-rung wurden hierfür einige Veränderungen vorgenommen. So wurden etwa offene Textangaben (Ausbildungs- und Arbeitsstätten, Wohnorte etc.) entfernt, die Fall-nummern geändert und bei verschiedenen Variablen Kategorien zusammengefasst.

Um auch externen Wissenschaftlern die Nutzung der Daten zu erleichtern, ist eine vollständige Dokumentation vorhanden (Hillmert et al., im Erscheinen), die zu-sammen mit den Daten an die Nutzer abgegeben wird. Sie enthält ausführliche In-formationen zur Datenstruktur und zu den einzelnen Variablen (einschließlich gene-rierter Variablen) sowie den detaillierten Fragebogen. Die in die Dokumentation integrierten Methodenberichte liefern Informationen zur Stichprobe, das Editions-handbuch enthält die Regeln und (Einzelfall-)Entscheidungen der Datenedition. Darüber hinaus wird der Verlauf von Erhebung, Prüfung und Edition der Daten dar-gestellt.

6 Fazit

Zusammenfassend lässt sich festhalten, dass die vorliegende Studie ein ganz spezi-fisches Informationspotential hat. Es gibt eine Reihe von immanenten Beschrän-kungen des gewählten Designs der Studie, wie etwa die Konzentration auf zwei große Kohorten, um für die Analysen hinreichend große Fallzahlen in altershomo-genen Gruppen zu bekommen. Zu den Besonderheiten bzw. Stärken dieser Studie zählt indes die besondere Datenqualität, die durch aufwändige Vorbereitung, Erhe-bung und Edition der Daten gesichert wird. Hinzu kommt die Detailliertheit der Angaben, die für eine Vielzahl von Variablen Längsschnittanalysen ermöglicht. Die zentralen verlaufsrelevanten Merkmale wurden jeweils gesondert für jede einzelne (Teil-)Episode erhoben. Darüber hinaus ermöglicht es der modulweise Aufbau der Erhebung, Querbezüge zwischen parallelen Aktivitäten bzw. unterschiedlichen Le-bensbereichen herzustellen. Schließlich besteht noch die Möglichkeit, die Daten auf Individualebene mit prozessproduzierten Daten zu verknüpfen (vgl. Bender et al. 2001), um sie einerseits zu validieren4 und andererseits mit zusätzlichen Informati-onen anzureichern. Diese Möglichkeit steht externen Nutzern allerdings nicht zur Verfügung. Insgesamt jedoch stellen die Daten des Projekts Ausbildungs- und Be-

4 Im Rahmen eines Dissertationsprojekts wurde dieser Vergleich auch für Aussagen über mögli-

che Gedächtniseffekte bei Retrospektivbefragungen genutzt (Reimer 2003).

Page 175: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

176 ZA-Information 53

rufsverläufe der Geburtskohorten 1964 und 1971 in Westdeutschland die derzeit wohl differenziertesten, aktuellen und repräsentativ erhobenen Informationen über Lebensverläufe in (West-)Deutschland dar.

Ansprechpartner für die Studie im Zentralarchiv: Horst Weinen 0221/47694-15; E-mail: [email protected] Ansprechpartner beim Max-Planck-Institut für Bildungsforschung: Ralf Künster 030/82406-378; E-mail: [email protected] Petra Spengemann 030/82406-377; E-mail: [email protected]

Literatur Bender, Stefan/Brand, Ruth/Bacher, Johann 2001: Re-identifying register data by survey data: an empirical study. Statistical Journal of the United Nations 18, No. 4, 373-381.

Bender, Stefan/Dietrich, Hans 2001: Unterschiedliche Startbedingungen haben langfristige Folgen. Der Einmündungsverlauf der Geburtskohorten 1964 und 1971 in Ausbildung und Beschäftigung. IAB-Werk-stattbericht 11/2001. Nürnberg: Institut für Arbeitsmarkt- und Berufsforschung (http://www.iab.de).

Brückner, Erika/Mayer, Karl Ulrich 1998: Collecting life history data: Experiences from the German life history study. In: Giele, Janet Z./Elder, Glen H. Jr. (Hg.): Methods of life course research: Qualitative and quantitative approaches. Thousand Oaks: Sage, 152-181.

Büchel, Felix/Pollmann-Schult, Matthias 2002: Overcoming a period of overeducated work – does the quality of apprenticeship matter? Applied Economics Quarterly – Konjunkturpolitik 48: 304-316.

Corsten, Michael/Hillmert, Steffen 2001: Qualifikation, Berufseinstieg und Arbeitsmarktverhalten unter Bedingungen erhöhter Konkurrenz. Was prägt Bildungs- und Erwerbsverläufe in den achtziger und neunziger Jahren? Arbeitspapier Nr. 1 des Projektes Ausbildungs- und Berufsverläufe der Geburtskohorten 1964 und 1971 in Westdeutschland. Berlin: Max-Planck-Institut für Bildungsforschung (http://www.mpib-berlin.mpg.de).

Hillmert, Steffen 2001: Kohortendynamik und Konkurrenz an den zwei Schwellen des dualen Ausbildungs-systems. Arbeitspapier Nr. 2 des Projektes Ausbildungs- und Berufsverläufe der Geburtskohorten 1964 und 1971 in Westdeutschland. Berlin: Max-Planck-Institut für Bildungsforschung (http://www.mpib-berlin.mpg.de).

Hillmert, Steffen 2002a: Edition von Lebensverlaufsdaten: zur Relevanz einer systematischen Einzelfallbe-arbeitung bei standardisierten Befragungen. ZUMA-Nachrichten 26/H. 51, 120-140.

Hillmert, Steffen 2002b: Stabilität und Wandel des ‚deutschen Modells’: Lebensverläufe im Übergang zwi-schen Schule und Beruf. In: Wingens, Matthias/Sackmann, Reinhold (Hg.): Bildung und Beruf. Ausbildung und berufsstruktureller Wandel in der Wissensgesellschaft. Weinheim: Juventa, 65-81.

Hillmert, Steffen/Jacob, Marita 2003a: Bildungsprozesse zwischen Diskontinuität und Karriere: das Phä-nomen der Mehrfachausbildungen. Zeitschrift für Soziologie 32, 4/2003, 325-345.

Hillmert, Steffen/Jacob, Marita 2003b: Social inequality in higher education: is vocational training a path-way leading to or away from university? European Sociological Review 19, 3/2003, 319-334.

Hillmert, Steffen/Kröhnert, Steffen 2001: Vergleich der Lebensverlaufsstudie 64/71-West mit Erhebungen des Mikrozensus auf Basis ausgewählter Randverteilungen. Technischer Arbeitsbericht. Berlin: Max-Planck-Institut für Bildungsforschung (http://www.mpib-berlin.mpg.de).

Hillmert, Steffen/Künster, Ralf/Spengemann, Petra/Mayer, Karl Ulrich, im Erscheinen: Lebensverläufe und gesellschaftlicher Wandel, Projekt ‚Ausbildungs- und Berufsverläufe der Geburtskohorten 1964 und 1971 in Westdeutschland’: Dokumentation. Berlin: Max-Planck-Institut für Bildungsforschung.

Page 176: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 177

Hillmert, Steffen/Mayer, Karl Ulrich, im Erscheinen: Geboren 1964 und 1971: Neuere Untersuchungen zu Ausbildungs- und Erwerbschancen in Westdeutschland. Wiesbaden: Westdeutscher Verlag.

Infas, 1997: Ausbildungs- und Berufsverläufe der Geburtskohorten 1964 und 1971 in Westdeutschland. Methodentest (Manuskript). Bonn: Institut für angewandte Sozialwissenschaft.

Infas, 1999: Ausbildungs- und Berufsverläufe der Geburtskohorten 1964 und 1971 in Westdeutschland. Methodenbericht zur Hauptstudie. Bonn: Institut für angewandte Sozialwissenschaft.

Jacob, Marita 2003: Ausmaß, Strukturen und Ursachen von Mehrfachausbildungen. Eine Analyse von Ausbil-dungsverläufen in den achtziger und neunziger Jahren in Westdeutschland. Dissertation, Freie Universität Berlin.

Mayer, Karl Ulrich/Hillmert, Steffen 2003: New ways of life or old rigidities? Recent changes in social structures and life courses in Germany and their political impacts. In: Kitschelt, Herbert/Streeck, Wolfgang (Hg.): Germany beyond the stable state. Special issue of West European Politics.

Pollmann-Schult, Matthias/Büchel, Felix 2002: Ausbildungsinadäquate Erwerbstätigkeit: eine berufliche Sackgasse? Eine Analyse für jüngere Nicht-Akademiker in Westdeutschland. Mitteilungen aus der Arbeits-markt- und Berufsforschung 35, 371-384.

Reimer, Maike 2003: Autobiografisches Gedächtnis und retrospektive Datenerhebung: die Rekonstruktion und Validität von Lebensverläufen. Dissertation, Freie Universität Berlin. Seibert, Holger 2003: „Wer zu spät kommt...“ Schulausbildung und der Erwerbseinstieg von Ausbildungsab-solventen ausländischer Herkunft in Deutschland. Arbeitspapier Nr. 6 des Projektes Ausbildungs- und Be-rufsverläufe der Geburtskohorten 1964 und 1971 in Westdeutschland. Berlin: Max-Planck-Institut für Bil-dungsforschung (http://www.mpib-berlin.mpg.de).

Trappe, Heike/Goedicke, Anne 2003: Ein Land - zwei Erwerbssysteme? Die Folgen geschlechtstypischer Berufsentscheidungen in Ost- und Westdeutschland. In: Allmendinger, Jutta (Hg.): Entstaatlichung und soziale Sicherheit: Verhandlungen des 31. Kongresses der Deutschen Gesellschaft für Soziologie in Leipzig 2002. Opladen: Leske + Budrich.

Wagner, Michael 1996: Lebensverläufe und gesellschaftlicher Wandel: Die westdeutschen Teilstudien. ZA-Information 38, 20-27.

Anhang

An Projektplanung, Datenerhebung und Edition waren in verschiedenen Projekt-phasen am Max-Planck-Institut für Bildungsforschung, Berlin folgende Mitarbeite-rinnen und Mitarbeiter beteiligt: Monika Albin, Erika Brückner, Felix Büchel, Michael Corsten, Henriette Engelhardt, Steffen Hillmert, Anke Höhne, Karl Ul-rich Mayer, Sonja Menning, Ralf Künster, Antje Mertens, Götz Rohwer, Petra Spengemann, Heike Trappe, Anette Veauthier und Katja Winkler.

Kooperationspartner am Institut für Arbeitsmarkt- und Berufsforschung, Nürnberg (in diesem Zusammenhang gefördert durch Mittel des Europäischen Sozialfonds) waren Stefan Bender und Hans Dietrich.

Kooperationspartner am Institut für angewandte Sozialwissenschaft, Bonn waren insbesondere Doris Hess, Bernd Schneider und Jacob Steinwede.

Page 177: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

178 ZA-Information 53

Der DJI-Familiensurvey 1988 - 2000 auf CD-ROM

von Evelyn Brislinger

Die CD-ROM „Familiensurvey 1988-2000“ des DJI München enthält die Daten und Forschungsdokumente sowie inhaltliche und methodische Informationen zu den drei Wellen des Familiensurvey. Darüber hinaus sind eine Reihe von Zusatzstudien zu speziellen Themen enthalten, die zum Teil auf der Stichprobe des Familiensurvey aufsetzen bzw. mit eigenen Stichproben durchgeführt wurden (siehe Abbildung 1). Die Studien sind Teil des Projektes „Wandel und Entwicklung familialer Lebens-formen“, das im Auftrag des Bundesfamilienministeriums durchgeführt wird. Familiensurvey III. Welle (2000) ZA-Nr. 3920 Familiensurvey II. Welle (1994) ZA-Nr. 2860 Familiensurvey I. Welle (Ost 1990) ZA-Nr. 2392 Familiensurvey I. Welle (West 1988) ZA-Nr. 2245 Stieffamilien in Deutschland (2000) ZA-Nr. 3921 Persönlichkeit und soziale Beziehungen (1995) ZA-Nr. 3212 Kinder in nichtehelichen Lebensgemeinschaften (1995) ZA-Nr. 3211 Singularisierungsstudie (1993) ZA-Nr. 2790 Beziehungen in modernen Mehrgenerationenfamilien (1990) ZA-Nr. 2516

1 Familiensurvey 1988/1990, 1994, 2000

Mit dem Ziel, den Wandel und die Entwicklung familialer Lebensformen darzustel-len, wurde 1988 die erste Befragung zur familialen Situation der Bürger in den alten Bundesländern und 1990 eine äquivalente Befragung in den neuen Bundesländern durchgeführt. Die zweite Welle des Familiensurvey (1994) und die dritte Welle aus dem Jahr 2000 setzen inhaltlich auf dieser Befragung auf 1.

Der dritte Familiensurvey aus dem Jahr 2000 umfasst einen replikativen Survey und stellt gleichzeitig die dritte Panelwelle dar. Wiederholt wurde die Gruppe der 18-

1 Die CD-ROM „Familiensurvey 1988-1995“ wurde in der ZA-Information 46, 2000, S.154-157

vorgestellt.

Page 178: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 179

bis 55-Jährigen in den alten und neuen Bundesländern (n=8.091) befragt, für die Gruppe der 30- bis 67-Jährigen Befragten (n=2.002) aus den alten Bundesländern steht mit dieser Studie die dritte Panelwelle zur Verfügung. Im Gegensatz zu den früheren Wellen des Familiensurvey wurden im Jahr 2000 auch deutschsprachige Ausländer in die Untersuchung aufgenommen und die Stichprobe um eine spezielle Befragung von Jugendlichen im Alter von 16 und 17 Jahren (225 Befragte) aus den Haushalten der erwachsenen Surveyteilnehmer ergänzt.

Abbildung 1 Struktur der Studien des DJI-Familiensurvey2

2 Quelle: CD-ROM „DJI-Familiensurvey 1988-2000“ Hinweis: Die Daten der Studie "Familien

in prekären Situationen 2002" sind noch nicht freigegeben und auch nicht auf der CD-ROM ent-halten.

Page 179: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

180 ZA-Information 53

2 Stieffamilien in Deutschland -

Übersicht, Lebenssituation, Perspektiven (2000)

Die Untersuchung über Stieffamilien ist eine Ergänzung zur dritten Welle des Fami-liensurvey und basiert auf 58 west- und ostdeutschen Stiefvaterfamilien. Das Projekt, das aus einer Reanalyse der zweiten und dritten Welle des Familiensurvey sowie einer vertiefenden qualitativen Analyse bestand, war vorrangig auf die systemati-sche Beschreibung der Lebensverhältnisse und der Kommunikationsstrukturen von Stieffamilien gerichtet. Befragt wurden vier Personen je Konstellation: leibliches Elternteil, Stiefelternteil, Stiefkind und externes leibliches Elternteil.

3 Persönlichkeit und soziale Beziehungen 1995

Die Studie "Persönlichkeit und soziale Beziehungen" besteht aus zwei Wellen. In der ersten Welle wurden Personen aus dem Familiensurvey 1994 (n=2.002) ange-schrieben und gebeten, Fragen zu Netzwerk, zur Persönlichkeit und zur Beurteilung der Partnerschaft zu beantworten. Die Personen (n=385), die angegeben hatten, dass sie seit mindestens einem Jahr in einer festen Partnerschaft leben, wurden in der zweiten Welle gebeten, den Partnerfragebogen von ihrem Partner (n=214) beant-worten zu lassen. Der Partnerfragebogen enthält Fragen zur Beurteilung der Part-nerschaft und zur Partnerbeziehung.

4 Kinder in nichtehelichen Lebensgemeinschaften (NEL) 1995

Die Untersuchung nichtehelicher Lebensgemeinschaften mit Kindern (n=1.526) ist ein selbstständiges, den Familiensurvey ergänzendes Projekt. In dieser Studie geht es in erster Linie um eine Schätzung der Auftretenshäufigkeiten der Konstellatio-nen, in denen Kinder in NEL aufwachsen sowie um die Häufigkeit zu erwartender Veränderungen der Lebensform. Ergänzend hierzu ermöglichen die Daten des Familiensurvey die Beschreibung der Lebensverhältnisse in den einzelnen Aus-prägungen von NEL mit Kindern.

5 Singularisierungsstudie – Lebensführung als Alleinlebende/älterer Menschen 1993

Die Singularisierungsstudie (n=4.130) ist eine Ergänzungsstudie zum ersten Famili-ensurvey und basiert auf einer Quotenstichprobe von alleinlebenden und nicht-alleinlebenden Personen in zwei Altersgruppen (55 bis 64 Jahre und 65 bis 79 Jahre) in privaten Haushalten. Ziel dieses Designs war es, die Lebenssituationen von Allein-

Page 180: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 181

lebenden und Nichtalleinlebenden getrennt nach Altersgruppen und Geschlecht in den alten und neuen Bundesländern vergleichbar zu machen.

6 Beziehungen in modernen Mehrgenerationenfamilien 1990

Diese Studie baut auf der ersten Welle des Familiensurvey auf. Als Startperson für die Netzwerkbefragung wurden aus der Stichprobe des Familiensurvey 1988 alle Personen ausgewählt (n=1.285), die bei der Haupterhebung zwischen 18 und 32 Jahren alt waren, zu diesem Zeitpunkt mit einem (Ehe-)Partner zusammenlebten und für die mindestens eine Person der Elterngeneration (Eltern oder Partnereltern) und der Großelterngeneration (eigene oder Partnergroßeltern) vorhanden waren. In die Netzwerkbefragung einbezogen wurden neben der Startperson ein eigener Eltern-teil sowie ein Partnerelternteil und eine Person der Großelterngeneration.

7 Daten und Dokumente auf CD-ROM

Die Daten und Forschungsdokumente sind auf der CD-ROM unter einer HTML-Oberfläche benutzerfreundlich abgelegt und mit ausführlichen inhaltlichen, metho-dischen und technischen Informationen auf Studienebene verbunden. Eine schnelle Orientierung in dem Datenmaterial wird durch die Variablenlisten unterstützt, in denen die Variablen der einzelnen Studien nach inhaltlichen Kriterien zusammen-gefasst sind.

Alle Variablen auf der CD-ROM sind ausführlich durch den Fragen- und Antwort-text, ihre Position im Datensatz, Kennzahlen und Statistiken sowie Grafiken be-schrieben. Durch Links wird darüber hinaus das Auffinden von gleichen oder ver-gleichbaren Variablen in den Wellen des Familiensurvey sowie den Zusatzstudien ermöglicht.

Die CD-ROM ist beim Zentralarchiv für 25 Euro erhältlich. Anfragen richten Sie bitte an:

Evelyn Brislinger E-mail: [email protected]

Page 181: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

182 ZA-Information 53

Sekundäranalysen der Daten der Media-Analyse

mit Hilfe des Serviceangebots des Medienwissen-

schaftlichen Lehr- und Forschungszentrums (MLFZ)

von Jörg Hagenah und Haluk Akinci 1

1 Einleitung

Die Daten der Media-Analyse (ma) werden vom Medienwissenschaftlichen Lehr- und Forschungszentrum (MLFZ) für wissenschaftliche Sekundäranalysen aufbereitet. Zur Verfügung stehen dabei die Dateien ab dem Jahr 1972 und werden in Zusam-menarbeit mit dem Zentralarchiv für Empirische Sozialforschung (ZA) technisch aufbereitet. Das durch Mittel des Landes Nordrhein-Westfalen geförderte MLFZ hat es sich zur Aufgabe gemacht, diese Daten einem breiteren wissenschaftlichen Publikum zur Verfügung zu stellen. Dazu wurden und werden einige Servicetools erstellt, die den Umgang mit den umfangreichen und datentechnisch äußerst kom-plizierten Datensätzen erleichtern sollen.

In diesem Beitrag wird zuerst auf die Bedeutung der Media-Analysen eingegangen, in dem deren Inhalt genauer beschrieben wird. Anschließend wird die bisherige Arbeit des MLFZ vorgestellt. Schließlich wird erläutert, wie interessierte Datennutzer individuell angepasste Datensätze erhalten können.

2 Die Media-Analyse

Seit 1968 erstellen die sog. „Media-Analysen“ jährlich repräsentative Bevölke-rungsumfragen. Sie bilden das Mediennutzungsverhalten der erwachsenen Bevölke-rung (ab 14 Jahren) in Deutschland ab. Die Ursprünge der ma gehen jedoch noch viel weiter zurück. Bereits 1954 wurde die Arbeitsgemeinschaft Leseranalyse e.V.

1 Jörg Hagenah und Haluk Akinci sind Wissenschaftliche Mitarbeiter beim Medienwissen-

schaftlichen Lehr- und Forschungszentrum der Wirtschafts- und Sozialwissenschaftlichen Fakultät der Universität zu Köln, Lindenburger Allee 15, 50931 Köln E-Mail: [email protected], http://www.wiso.uni-koeln.de/medien/.

Page 182: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 183

(AGLA) gegründet, um Daten zur Größe und Struktur der Leserschaft von Publi-kumszeitschriften zu erhalten. Die daraus entstandene Leseranalyse (LA) für Publi-kumszeitschriften und Zeitungen wurde bis 1960 alle zwei Jahre und dann bis 1971 jährlich veröffentlicht. 1968 wurde die Media-Micro-Census GmbH (MMC) als eine Tochtergesellschaft gegründet. Sie war verantwortlich für die komplette orga-nisatorische und kaufmännische Abwicklung der gesamten Forschungsvorhaben. Die Umbenennung der AGLA in AG.MA erfolgte erst im Jahre 1972, als Anfang der siebziger Jahre die elektronischen Medien in die Erhebung aufgenommen wurden. Die gleichzeitige Untersuchung von elektronischen Medien und Pressemedien trägt aus diesem Grund erst ab 1972 den Namen Media-Analyse. Somit stellt „die Media-Analyse (…) eine Erweiterung der LA auf die elektronischen Medien Fernsehen und Hörfunk dar (Buß 1998: 77).“ Mittlerweile ist die AG.MA ein Zusammen-schluss von mehr als 250 Unternehmen der deutschen Werbewirtschaft, die für die Erhebungen jährlich mehr als 8 Millionen Euro ausgeben. Zu den Mitgliedern zählen Werbungtreibende, Werbe- und Media-Agenturen, Pressemedien, Elektronische Medien und Mitglieder der Gruppe Plakat.

Die Datensätze der ma gelten als sog. Werbewährung insbesondere für die Radio-sender und die Pressemedien. Sie dienen allen Programmanbietern und auch der Werbewirtschaft als eine Art zentrale Informationsquelle. Die von der AG.MA-Tochtergesellschaft Media-Micro-Census GmbH herausgegebenen Ergebnisse bein-halten die aktuellen Nutzungsdaten für die Mediengattungen Radio, Fernsehen, Zei-tungen/Zeitschriften, Kino, Lesezirkel, Konpress und zukünftig auch für Plakate und Onlineangebote. Außerdem enthalten sind Angaben zur Ausstattung der Haus-halte, zu Freizeitpräferenzen, soziodemographische Variablen und Konsumpräfe-renzen. Seit 1987 werden zusätzlich Tagesablaufdaten erhoben, die für jede Viertel-stunde ab 5.00 Uhr (bis 24.00 Uhr) mediale und nichtmediale Tätigkeiten der Befrag-ten messen. Die jeweils aktuellen Daten aus dem zurückliegenden Erhebungsjahr ste-hen zunächst nur den Mitgliedern der AG.MA für planungsrelevante Entscheidungen zur Verfügung. Nach einer gewissen Karenzzeit sind die gesamten Datensätze stets an das Zentralarchiv zur wissenschaftlichen Verwendung weitergegeben worden. Bislang wurden die ma-Dateien von 1972 bis 2001 ins Zentralarchiv geliefert.

Die Daten der ma stehen den Mitgliedern der AG.MA zur Verfügung, und Stan-dardergebnisse werden regelmäßig in der Zeitschrift Media Perspektiven publiziert. Durch die Berücksichtigung von bisher unbeachteten Variablen und der Verlegung von Untersuchungsschwerpunkten haben die ma-Datensätze auch für universitäre wissenschaftliche Untersuchungen eine besondere Relevanz. Schon seit einiger Zeit besteht die Möglichkeit, die im ZA archivierten ma-Daten für entsprechende Analy-sen im akademischen Bereich zu verwenden. „Obwohl diese Verfügbarkeit der Da-

Page 183: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

184 ZA-Information 53

ten zu einer verbesserten Kumulation der Forschungsbefunde in diesem Bereich beitragen kann, zeigt eine aktuelle Bestandsaufnahme zur Praxis von Sekundärana-lysen in der Kommunikationswissenschaft Gegenteiliges. So soll es derzeit noch sowohl an der Bereitschaft der Institutionen, die über Daten verfügen, als auch an dem Engagement und der Initiative der akademischen Forschung, sich die verfügba-ren Daten zu beschaffen und sie für innovative Fragestellungen fruchtbar zu ma-chen, hapern“ (Hasebrink 2002: 9/10). Das liegt vor allen Dingen an der Sozialwis-senschaftlern weniger vertrauten binären Datenstruktur der Originaldateien aus dem Rechenzentrum der AG.MA. Diese an das Zentralarchiv gelieferten Daten verfügen nicht über direkte SPSS-Kompatibilität. Darüber hinaus beinhalten die insgesamt 50 archivierten ma-Erhebungen eine derart große Zahl an Variablen, dass einem inter-essierten Datennutzer in der bisher vorliegenden Datensatzform kein schneller Ein-stieg in den „Datendschungel“ möglich war. Die Abbildung 1 vermittelt einen Ein-druck von den zu bewältigenden Informationsmengen: Die Variablenanzahl ist im Laufe der Zeit von ca. 500 Variablen (1972) auf über 17.000 Variablen im Jahr 2000 gestiegen.

Abbildung 1 Entwicklung der Variablenanzahl der ma-Erhebungen von 1972 bis 2000

17092170141719217755

13673

10460

264225112847244019671487

728544566

9533

0

2000

4000

6000

8000

10000

12000

14000

16000

18000

20000

ma 72/I

ma 72/I

I

ma 74

ma 76

ma 78

ma 80

ma 82

ma 84

ma 86

ma 88 E

M+PM

ma 90 E

M+PM

ma 92 E

M+PM

ma 94 E

M+PM

ma 96 E

M+PM

ma 98 E

M+PM

ma 00 E

M+PM

VARIABLENANZAHL INSGESAMT

Anmerkungen: EM = Elektronische Medien; PM = Pressemedien; ma = Media-Analyse

Das MLFZ arbeitet daran, diesen Zugang zu erleichtern, damit die ma-Daten von akademischen Forschern „problemlos für Sekundäranalysen herangezogen werden können“ (Hasebrink 2002: 31).

Page 184: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 185

3 Die Aufbereitung der ma-Daten durch das MLFZ

In einem ersten Schritt wurden und werden die vom Zentralarchiv bereitgestellten binären Originaldatensätze für eine unmittelbare Weiterverarbeitung mit SPSS kon-vertiert.2 Dies lässt sich mit Hilfe von dem SPSS-Anwender in der Regel selten be-kannten Syntax-Befehlen realisieren. Statt im gängigen ASCII-Format, ist ein Groß-teil der Daten in 2- aber auch in 4-Byte-Feldern gespeichert (sog. Integer-Binary-Format). Daher müssen zuerst die einzelnen Bytefeldtypen im Codeplan identifi-ziert werden, um die SPSS-Konvertierungs-Befehle danach ausrichten zu können. Außerdem müssen einige Datei-Informationen wie die konkrete Satzlänge und die Anzahl der Variablen eingesetzt werden, um die richtige Zuordnung der Variablen zu gewährleisten. Diese werden vom Zentralarchiv zusätzlich in folgender Form geliefert (vgl. Tabelle 1):

Tabelle 1 ZA-Dokumentation zu den Originaldateien der ma-Erhebung 2000 EM

Auf der CD-ROM befinden sich folgende Dateien:

ZA3517.ZIP darin enthalten MA2000: Radio

Dateiname Zahl der Fälle Satzlänge Gesamtlänge

(Bytes)

Teil A ZA3517_A.DAT 57 273 2 000 114 546 000

Teil B ZA3517_B.DAT 57 273 10 400 595 639 200

Teil C ZA3517_C.DAT 57 273 5 800 332 183 400

Teil D ZA3517_D.DAT 57 273 5 800 332 183 400

Teil E ZA3517_E.DAT 57 273 10 400 595 639 200

Teil F ZA3517_F.DAT 57 273 5 800 332 183 400

Teil G ZA3517_G.DAT 57 273 5 800 332 183 400

Teil H ZA3517_H.DAT 57 273 2 800 160 364 400

Teil A1 ZA3517_A1.DAT 57 273 800 45 818 400

2 Wir bedanken uns bei Erwin Rose für die Zusammenarbeit, dessen Hilfe für unsere Arbeit un-

entbehrlich ist. In seiner jahrelangen Datenaufbereitungspraxis hat er sich ein Spezialwissen an-geeignet, ohne das die Transformation der Datensätze nicht zu bewerkstelligen gewesen wäre.

Page 185: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

186 ZA-Information 53

Mit Hilfe der Informationen aus dieser Tabelle wird eine SPSS-Syntax erstellt, die für die Umwandlung der Daten notwendig ist. Folgendes Beispiel zeigt die SPSS-Syntax für die ma_2000_EM_E:

Beispiel „SPSS-Syntax“ für die ma_2000_EM_E FILE HANDLE ZA3517_E /NAME='F:\Mediaanalyse\MA_00\ZA3517_E.dat' /RECFORM=Fixed /LRECL=10400 /MODE=IMAGE. DATA LIST FILE=ZA3517_E FIXED RECORDS=1 TABLE /1 F1 1 - 2 (IB) F2 3 - 4 (IB) F3 5 - 6 (IB) F4 7 - 8 (IB) F5_6 9 - 12 (IB) F7_8 13 - 16 (IB) F9 17 - 18 (IB) F10 19 - 20 (IB) F11 21 - 22 (IB) F12 TO F5200 23 - 10400 (IB). DESCRIPTIVES F4. FREQUENCIES F9 TO F11.

Die ma-Rohdaten können nur mit alten SPSS-Versionen (bis zu Version 53) einge-lesen werden. Für die Umwandlung in das gängige SPSS-Format müssen in der Syntax die Feldnummern der späteren und die dazugehörigen IB-Numbers4 der Ori-ginaldatei (.dat) eingetragen werden.

Dieses aufgrund der Dateigrößen bisweilen zeitaufwendige Konvertierungsverfah-ren wurde inzwischen bei allen vom Zentralarchiv an das MLFZ gelieferten Dateien durchgeführt. Dadurch haben sie nun das in der universitären Praxis gängige SPSS-Format (.sav). Die noch wachsende MLFZ-Bestandsliste wird auf der Homepage des Medienwissenschaftlichen Lehr- und Forschungszentrums regelmäßig aktuali-siert. Ein kleiner Ausschnitt davon wird in Tabelle 2 dargestellt.

3 Es ist der Bedachtsamkeit des ZA und besonders Erwin Rose zu verdanken, dass diese Uralt-

version von SPSS, die erste Windows-Version, noch im Archiv aufbewahrt wird. Eine Trans-formation der Daten wäre sonst fraglich gewesen, da neuere SPSS-Versionen nicht mit diesem Datenformat arbeiten.

4 Integer-Binary

Page 186: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 187

Tabelle 2 Ausschnitt aus der Tabelle „Datenbestand“

Datenbestand Erhebungsinformationen ZA-Bestand MLFZ-Bestand

Anzahl Anzahl MLFZ- 15.10.2003 Medium Fallzahl ZA- Nummer

Dateien Dateien Dateinamen

MA 1972/I EM + PM 14641 0848 1 1 ma_72_I

MA 1972/II EM + PM 14802 0849 1 1 ma_72_II

MA 1986 EM + PM 18634 1617 1 0

EM 16677 1618 1 0 MA 1987

PM 18718 1619 1 1 ma_87_PM

EM 57273 3517 8 7 ma_00_EM_A (bis H)

PM I 26026 3518 8 7 ma_00_PM_I_A (bis H) MA 2000

PM II 25959 3519 8 7 ma_00_PM_II_A (bis H)

Summe: 169 72

Anmerkungen: ZA = Zentralarchiv für empirische Sozialforschung; MLFZ = Medienwissenschaftli-ches Lehr- und Forschungszentrum; EM = Elektronische Medien; PM = Pressemedien; aktualisier-te Tabelle: http://www.wiso.uni-koeln.de/medien/

Außerdem wurden einige Servicetools entworfen, die ein Eintauchen in die Daten-flut zusätzlich erleichtern sollen. Ein Überblick über alle Variablen aus den 50 zur Verfügung stehenden Untersuchungen seit 1972 ist in einer ersten Version in der sog. Variablengesamttabelle (madatsyn1.0, vgl. Tabelle 1) zu finden. Sie enthält auf 33.483 Zeilen alle erhobenen Einzelvariablen mit ihren Erhebungszeitpunkten. Der Zugang geschieht dabei über eine inhaltliche Gliederung und Zusammenfassung der Items zu Variablengruppen über drei hierarchische Ebenen. Für jede Erhebung wurde eine Spalte eingerichtet, in der die jeweilige Variablennummer und der dazu-gehörige Speicherort zu finden sind. Somit lässt sich leicht recherchieren, welche Variable wie oft abgefragt wurde und für Re-Analysen nutzbar ist. Am rechten Rand der Tabelle wird der jeweilig erste und letzte Erhebungszeitpunkt jeder ein-zelnen Variable benannt. Anhand der in der Datei enthaltenen Variablentitel lassen sich konkrete Items vorab auswählen. Aufgrund der Größe der Datensätze wurden die Erhebungsdaten aufgesplittet in bis zu neun Teildateien pro Erhebung und werden in dieser Form an das Zentralarchiv geliefert. Analog wurde auch die Vari-ablensynopse aufgeteilt in neun Tabellen plus eine zusätzliche Tagesablaufsdatei (A bis TA; siehe Abbildung 2).

Page 187: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

188 ZA-Information 53

Abbildung 2 Übersicht über die Aufteilung der Variablengesamttabelle

madatsyn1.0

Anmerkungen: EM = Elektronische Medien PM = Pressemedien WTK = Werbeträgerkontakt WMK = Werbemittelkontakt

EM A

PM A

EM B

PM B

EM C

PM C

EM E

PM E

EM F

PM F

EM H

PM H

EM D

PM D

PM K

EM G

PM G

Variablen-gesamt-tabelle ma-datsyn1.0

A: Demographie

D: Varianzen (WTK)

B: p-Werte (WTK)

E: p-Werte (WMK)

F: Kontaktsummen (WMK)

C: Kontaktsummen (WTK)

H: Originärinformationen

G: Varianzen (WMK)

K: Einkaufs-u. Pendlerinfo.

TA: Tagesablauf EM TA

EM gesamt (EM A-TA)

PM gesamt (PM A-K)

EM + PM ge-samt

Page 188: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 189

Tabelle 3 Ausschnitt aus der Variablensynopse „madatsyn1.0“

Nr. MA 72/I MA 85 MA 00

MA 00 n Erstmals

Letztmalig

EM + PM

EM + PM PMI PMII

7079 Monatliche Zeitschriften GF (Generalfilter)

7080

7081 ACE-Lenkrad 2011 31 31 11 1984 2000

7082 ADAC-Motorwelt 1+7 2021 35 35 23 1972/ I 2000

7083 Allegra 39 39 2 2000 2000

7084 Amica 43 43 2 2000 2000

7085 Anna 2031 47 47 5 1984 2000

7088 Automagazin 51 51 3 1995 2000

7089 Beste, Das 1+7 2041 55 55 23 1972/II 2000

7091 Bild der Wissenschaft 2051 59 59 18 1976 2000

7092 Bild der Zeit 2 1972/ II 1976

7094 Bravo Screen Fun 63 63 2 2000 2000

7095 Brigitte Young Miss 67 67 2 2000 2000

7096 Burda Moden 1+7 2061 71 71 22 1972/ II 2000

7097 Capital 1+7 2071 75 75 23 1972/ II 2000

Anmerkungen: n = Anzahl der Erhebungszeitpunkte pro Variable I = erste Erhebungswelle; II = 2. Erhebungswelle

Die monatlich erscheinende Zeitschrift „ACE-Lenkrad“ (Zeile 7081) wurde demnach 1984 in die MA aufgenommen und war auch noch im Jahre 2000 Bestandteil der Untersuchungen. Im Daten-satz „MA 85“ hat diese Zeitschrift bezüglich des Generalfilters („Kenne ich überhaupt nicht“, „nur dem Namen nach bekannt“, „schon mal geblättert oder gelesen“) die Variablennummer 2011. Bei der Erhebung „ma 00 PMI“ hat „ACE-Lenkrad“ die lavendel-markierte Nummer 31 (Farbe 1) in der Datei „ma_2000b“.

Beispielsweise beinhaltet die Umfrage EM 1995 die acht Dateien ma_95_EM_A (farblos5), ma_95_EM_B (Farbe 1) bis ma_95_EM_H (Farbe 2). Farbige Markie-rungen innerhalb der Tabelle kennzeichnen den jeweiligen Speicherort, die Variab-len der jeweiligen A-Datei haben einen farblosen Hintergrund, die übrigen einen systematisch geordneten farbigen. Die einzelnen Zuordnungen lassen sich in der dazugehörigen Legende finden. Ein kleiner Ausschnitt dieser Gesamtdatei wird in Tabelle 3 dargestellt:

5 bezieht sich auf die farbige Darstellung auf der Internet-Seite.

Page 189: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

190 ZA-Information 53

Nicht enthalten in der Tabelle sind die konkreten Frageformulierungen und die Antwortkategorien bzw. Skalierungen. Diese Informationen müssen den bei uns und im Zentralarchiv archivierten dazugehörigen Fragebögen und Codeplänen ent-nommen werden.

Einen schnellen Überblick ermöglicht auch die Tabelle „madat_Untergruppen_1.0“, welche die hierarchisch gegliederten Überschriften der jeweiligen Untergruppen enthält. Diese und weitere Dateien wie ein Analyse-Leitfaden und eine erste Bei-spielanalyse werden interessierten Wissenschaftlern auf Anfrage auf der CD-Rom „madatinfo 1.0“ zur Verfügung gestellt. Aufbauend auf einer Variablen-Vorauswahl werden individuelle ma-Datensätze nach Wunsch extrahiert. Die Betreuung der Nutzer wird während der Projektphase von den Mitarbeitern des Medienwissen-schaftlichen Lehr- und Forschungszentrums übernommen. Später werden die über-arbeiteten und aufbereiteten Datenbestände in das Zentralarchiv rücktransferiert.

Neben dem Datenservice werden im Rahmen des Projektes auch eigene Analysen durchgeführt. Diese zielen auf die Analyse medienwissenschaftlicher und soziologi-scher Fragestellungen. Geplant sind Untersuchungen, die sich u.a. mit dem Einfluss des sich wandelnden Angebots auf die Mediennutzung beschäftigen oder Zusam-menhänge zwischen Rezeption und Konsum thematisieren. Eine weitere Fragestel-lung konzentriert sich auf Persönlichkeitstypen und deren Sportrezeptionsstile. Möglich sind zudem weitere Analysen, die sich bspw. auf die wechselnde Erhe-bungsmethodik (von face-to-face zu CATI) der ma beziehen könnten.

Literatur

Buß, M., 1998: Leistungsfähigkeit und Grenzen der Media-Analyse, in: Lindner-Braun, C. (Hrsg.): Radio-forschung - Konzepte, Instrumente und Ergebnisse aus der Praxis, Opladen: Westdeutscher Verlag

Hasebrink, U., 2002: Status Quo und Perspektiven internationaler akademischer Nutzungsforschung, Ham-burg: Hans-Bredow-Institut

Page 190: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 191

Informationen zum neuen ALLBUS 2002

von Michael Terwey

Nach Abschluss der Basisbearbeitungen an der neuesten Erhebung im ALLBUS-Programm können wir nun eine weitere Studie dieser Serie anbieten: Die Daten des ALLBUS 2002. Diese Erhebung wurde zum zweiten Mal seit Beginn dieses "social monitoring"-Programms computerunterstützt (CAPI) erhoben. Besondere inhaltli-che Schwerpunkte sind Religion, Kirchlichkeit, Weltanschauung und Werte. Ge-meinsam mit der eigentlichen ALLBUS-Erhebung wurden ferner zwei Zusatzbefra-gungen des ISSP (International Social Survey Programme) durchgeführt: "Soziale Beziehungen und Hilfeleistungen" und "Familie in Deutschland".

Studienbeschreibung zum ALLBUS 2002 (ZA-Studien-Nr. 3700)

Erhebungszeitraum: Februar 2002 bis August 2002

Wissenschaftlicher Beirat (2002): Hans-Jürgen Andreß, Universität Bielefeld (Vorsitz) Wilhelm Bürklin, Universität Potsdam Andreas Diekmann, ETH Zürich Hubert Feger, Freie Universität Berlin Johannes Huinink, Universität Rostock Heiner Meulemann, Universität Köln Heike Solga, Max-Planck-Institut für Bildungsforschung

Datenerhebung: INFAS, Bonn

Inhalt Trenderhebung zur gesellschaftlichen Dauerbeobachtung von Einstellungen, Verhalten und sozialem Wandel. Die Schwerpunkte dieser Untersuchung sind für 2002: 1.) Einstellungen zu Familie, Ehe und Partnerschaft 2.) Individuelle und kollektive Wertorientierungen 3.) Einstellungen zu Politik und Wirtschaft 4.) Einstellungen und Kontakte zu in Deutschland lebenden Ausländern 5.) Religiosität und Kirchlichkeit 6.) Sonstiges 7.) ALLBUS-Demographie 8.) Daten zum Interview 9.) Soziale Beziehungen und Hilfeleistungen (ISSP) 10.) Familie in Deutschland (ISSP) 11.) Abgeleitete Indices

Page 191: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

192 ZA-Information 53

Themen: 1.) Einstellungen zu Familie, Ehe und Partnerschaft: Familie als Voraussetzung für Glück; Einstellung zur Heirat bei dauerndem Zusammenleben der Partner; Grund für Heirat Kind. 2.) Individuelle und kollektive Wertorientierungen: Lebensziele (Gesetz und Ordnung res-pektieren, hoher Lebensstandard, Macht und Einfluss, Phantasie und Kreativität entwi-ckeln, Sicherheit, Randgruppen helfen, eigene Bedürfnisse durchsetzen, Fleiß und Ehrgeiz, Toleranz, politisches Engagement, Hedonismus, Gottesglaube, Leistung im Beruf, Selbst-verwirklichung); gesellschaftliche Werte (Fleiß und Leistung, Verantwortung für Mitmen-schen übernehmen, Konformität, Selbstbewusstsein und Kritikfähigkeit, Liberalität, Sicherheit und Wohlstand, politische Beteiligung, Selbstverwirklichung, Religiosität). 3.) Einstellungen zu Politik und Wirtschaft: Politische Partizipation; Parteipräferenz; Ver-trauen in öffentliche Einrichtungen und Organisationen (Gesundheitswesen, Bundes-verfassungsgericht, Bundestag, Kirche, Justiz, Fernsehen, Zeitungswesen, Universitäten, Bundesregierung, Polizei, Parteien); Wahrscheinlichkeiten, diverse Parteien zu wählen; politisches Interesse; Postmaterialismus (Wichtigkeit von Ruhe und Ordnung, Bürgerein-fluss, Inflationsbekämpfung und freier Meinungsäußerung); Selbsteinstufung auf einem Links-Rechts-Kontinuum; politische Unterstützung (Demokratiezufriedenheit in Deutsch-land); Beurteilung der derzeitigen und zukünftigen Wirtschaftslage in Deutschland; Beur-teilung der eigenen derzeitigen und zukünftigen wirtschaftlichen Situation. 4.) Einstellungen und Kontakte zu in Deutschland lebenden Ausländern: Staatsangehörig-keit; Einstellungsskala; Kontakte zu Ausländern in der Familie, am Arbeitsplatz, in der Nachbarschaft oder im Freundeskreis. 5.) Religiosität und Kirchlichkeit: Gottesglaube und Lebenssinn; Wunsch nach kirchlicher Beerdigung; Selbsteinstufung der Religiosität; Häufigkeit von Meditation; Einstellungen zu Religiosität; religiöse Indifferenz; Nachdenken über metaphysische Fragen; Erfahrungen mit und Meinung zu verschiedenen Formen von Glauben, Paraglauben und Aberglauben; Religion vs. Wissenschaft; religiöse Toleranz; Gottesglauben; Befürwortung von Islam-unterricht an Schulen; Einstellung zur Heirat mit Angehörigen verschiedener Konfessionen; Glaubensinhalte; eigenes Bekehrungserlebnis; Sündenlehre; Einstellung zur kirchlichen Trauung; Kirchgangshäufigkeit; Konfession; frühere Konfession; Angehörigkeit zu einer nichtchristlichen Religionsgemeinschaft; Gebetshäufigkeit; Empfang von Sakramenten; Vertrauen in die evangelische bzw. die katholische Kirche; Interesse an kirchlichen Sendungen in den Medien; Taufe, Konfession und Kirchgangshäufigkeit des (Ehe-)Partners und der Kinder; Konfession und Kirchgangshäufigkeit der Eltern; Religiosität der Eltern. 6.) Sonstiges: Subjektive Schichteinstufung; gerechter Anteil am Lebensstandard; allge-meines Vertrauen zu Mitmenschen und zu Politikern; sozialer Pessimismus und Zukunfts-orientierung (Anomia); Meinung zu ausgewählten Delikten und Vergehen bezüglich ihrer Verwerflichkeit; Nationalstolz; Autoritarismus; ehrenamtliche Tätigkeiten; Erfahrungen mit und Einstellungen zu Umfrageforschung. 7.) ALLBUS-Demographie: Angaben zur befragten Person: Geschlecht, Geburtsmonat, Geburtsjahr, Alter, allgemeiner Schulabschluß, berufliche Ausbildung, Erwerbsstatus, Anga-ben zum gegenwärtigen Beruf, Zugehörigkeit zum öffentlichen Dienst, berufliche Leitungs-

Page 192: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 193

funktion, wöchentliche Arbeitsdauer, Dauer von Arbeitslosigkeit, Angaben zum ehemali-gen Beruf, Zeitpunkt der Beendigung hauptberuflicher Erwerbstätigkeit, Familienstand, Scheidungen, Herkunft, Wohndauer und Mobilität, Staatsbürgerschaft (Nationalität), Be-fragteneinkommen, Mitgliedschaft des Befragten in einer Gewerkschaft oder Partei, Wahl-absicht (Sonntagsfrage), Wahlrückerinnerung, Wohnort (Bundesland, Regierungsbezirk, politische Gemeindegröße, BIK-Stadtregion). Angaben zum gegenwärtigen Ehepartner: Alter, allgemeiner Schulabschluß, berufliche Ausbildung, Erwerbsstatus, Angaben zum gegenwärtigen Beruf, Nichterwerbsstatus. Angaben zu nichtehelichen Lebenspartnern: Alter, allgemeiner Schulabschluß, berufliche Ausbildung, Erwerbsstatus, Angaben zum gegenwärtigen Beruf, Nichterwerbsstatus. Angaben zu den Eltern des Befragten: Allge-meiner Schulabschluss, Universitätsbesuch, Konfession, Kirchgangshäufigkeit, Religiosi-tät, Angaben zum Beruf des Vaters. Haushaltsbeschreibung: Haushaltsgröße, Anzahl von über 17-jährigen Haushaltspersonen (reduzierte Haushaltsgröße), Haushaltseinkommen; Wohnungstyp. Angaben zu den einzelnen Haushaltspersonen (Haushaltsliste): Verwandt-schaft der Haushaltspersonen zum Befragten, Geschlecht der Personen, Alter, Familien-stand, Taufe, Konfession, Kirchgangshäufigkeit. Angaben zu Kindern außerhalb des Haus-halts: Geschlecht, Alter, Taufe, Konfession, Kirchgangshäufigkeit. 8.) Daten zum Interview: Interviewdauer und Interviewdatum; Korrekturhäufigkeit; Anwe-senheit Dritter beim Interview (Anwesenheit von Ehegatte, Partner, Kindern, Familien-angehörigen, sonstigen Personen); Eingriff Dritter in das Interview; Kooperationsbereit-schaft und Zuverlässigkeit der Angaben der befragten Person; Einfluss des Incentive auf die Interviewteilnahme; Bereitschaft zu einer Panelteilnahme; Erreichbarkeit der Befra-gungsperson; Angaben zum Wohngebäude des Befragten; Teilnahme an den ISSP-Zusatzbefragungen. Angaben zum Interviewer: Geschlecht, Alter, Schulabschluß, Identifi-kationsnummer, Interviewerfahrung. 9.) Soziale Beziehungen und Hilfeleistungen (ISSP): Häufigkeit von persönlichen (Besu-che, Treffen) und nicht-persönlichen Kontakten (Telefon, Brief, Fax oder E-Mail) mit den Eltern, Geschwistern und eigenen Kindern; Zeit für die Anreise zur Mutter; Häufigkeit der Kontakte zu Verwandten. Anzahl der engen Freunde aus dem Kollegenkreis, aus der Nachbarschaft und allgemein; Geschlecht des besten Freundes; Häufigkeit von persönli-chen und nicht-persönlichen Kontakten mit dem besten Freund; präferierte Eigenschaften von engen Freunden; Gespräche über Politik mit Freunden. Einbindung in verschiedene Gruppen und Organisationen (Partei, Gewerkschaft, Kirche, Verein, Nachbarschaftsgruppe und andere); erster und zweiter Ansprechpartner für Hilfeleistungen im Haushalt, bei Geldproblemen, Niedergeschlagenheit; eigene Hilfeleistung im Haushalt, bei Geldproble-men, Niedergeschlagenheit und Arbeitsplatzsuche; wie von gegenwärtigem Arbeitsplatz erfahren; Meinungen zur Verpflichtung zu Hilfeleistungen; Meinung zur staatlichen Ver-antwortung für Kinderbetreuung und Sicherung des Lebensstandards; persönliche Glückseinschätzung; Gefühl der Überforderung; Vertrauen in Mitmenschen; Wohndauer; Einfluss auf lokale Angelegenheiten und auf die Politik allgemein; subjektive Schichteinstufung; Anzahl minderjähriger Kinder. 10.) Familie in Deutschland (ISSP): Einstellung zur Berufstätigkeit von Müttern und ver-heirateten Frauen; Rollenverteilung von Mann und Frau in Beruf und Haushalt; präferierter Umfang der Berufsausübung von Frauen während verschiedener Phasen der Kinderer-

Page 193: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

194 ZA-Information 53

ziehung; Einstellungen zu Ehe, Alleinerziehenden, Zusammenleben vor der Ehe und Scheidung; Ansichten zur Bedeutung von Kindern für das Leben; Einstellung zu Mutter-schaftsurlaub und Kindergeld; Einkommensverwaltung in der Ehe oder Partnerschaft; Auf-gabenteilung im Haushalt und der Familie; Hauptverdiener; Belastung durch Familie, Arbeit, Hausarbeit; persönliche Glückseinschätzung; Zufriedenheit mit Beruf und Familie; Berufstätigkeit der Mutter während der Kindheit des Befragten; Erwerbstätigkeit in ver-schiedenen Phasen der Kindererziehung; Selbsteinstufung auf einer Oben-Unten-Skala; Partner im öffentlichen Dienst; Wochenarbeitszeit des Partners. 11.) Abgeleitete Indizes: Postmaterialismus-Index (nach Inglehart); Familientypologie, Haushaltsklassifikationen (nach Porst und Funk); Berufsvercodung gemäß ISCO (Inter-national Standard Classification of Occupations) 1968 und 1988; Berufsprestige (nach Treiman); SIOPS (nach Ganzeboom); ISEI (nach Ganzeboom); Magnitudeprestige (nach Wegener); Einordnungsberufe (nach Terwey); Klassenlagen (nach Goldthorpe); Ost-West-Gewicht für gesamtdeutsche Auswertungen.

Grundgesamtheit und Auswahl: Untersuchungsgebiet: Bundesrepublik Deutschland Personenstichprobe: Zweistufige, disproportional geschichtete Zufallsauswahl in West- (incl. West-Berlin) und Ostdeutschland (incl. Ost-Berlin) aus allen deutschsprachigen Personen, die zum Befragungszeitpunkt in Privathaushalten lebten und vor dem 01.01.84 geboren sind. In der ersten Auswahlstufe wurden Gemeinden in Westdeutschland und in Ostdeutschland mit einer Wahrscheinlichkeit proportional zur Zahl ihrer erwachsenen Ein-wohner ausgewählt, in der zweiten Auswahlstufe wurden Personen aus den Einwohner-meldekarteien zufällig gezogen.

Erhebungsverfahren: Mündliche Befragung mit standardisiertem Frageprogramm (CAPI - Computer Assisted Personal Interviewing) und schriftliche Zusatzbefragung (drop off) im Rahmen des ISSP (zwei Split-Versionen)

Datensatz: 2820 Befragte und 722 Variablen

Weitere Hinweise: Befragte aus dem Bereich der neuen Bundesländer sind in den Daten überrepräsentiert (oversample). Eine in der ALLBUS-Demographie vereinfachte Version des Datensatzes ist als ALLBUScompact 2002 (ZA-Nr. 3701) zusätzlich vorhanden. Angeboten wird das bisher vorliegende Material zum ALLBUS 2002 (CAPI) als SPSS-Datei (Windows), SPSS-Portable und als PDF-Dokumentation. Ein günstiges Weitergabe-medium ist wie bisher das Komplettangebot 1980-2002 auf CD-ROM, das für persönliche, akademische Anwendungen aktuell gegen eine Gebühr von 25 Euro geliefert werden kann. Daneben gibt es die Materialien aber auch bereits in unseren ALLBUS-Downloads (einschließ-lich ALLBUScompact), die den Zugriff auf ALLBUS ohne jede Archivgebühr ermöglichen.

Auskünfte zum vorhandenen ALLBUS-Archivmaterial gibt: Michael Terwey, Tel.: 0221 / 4 76 94-22. E-Mail: [email protected]

Page 194: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 195

Zum aktuellen Wandel im Zugriff auf ALLBUS-

Materialien und zur ALLBUS-Nutzung in Publikationen

von Michael Terwey

Das ALLBUS-Programm soll neben der Erhebung von hochwertigen Daten über soziale Verhältnisse, Einstellungen und Verhaltensweisen insbesondere eine kos-tengünstige und nutzerfreundliche Bereitstellung der Materialien für wissenschaft-lich interessierte Personen gewährleisten (Davis et al. 1994; Terwey 2000). Ein An-liegen der den ALLBUS tragenden Institutionen ist es, Informationen über den Er-folg dieses Vorhabens zu erhalten und den Zugang weiter zu optimieren. In diesem Kontext wurde bereits früher u.a. eine schriftliche Nutzerumfrage durchgeführt, und darüber hinaus wurden statistische Auswertungen der Daten aus dem ZA-Service veröffentlicht (vgl. Trometer 1993; KVI 2001; Terwey 1998, 2002). Allgemein kann daraus gefolgert werden, dass ALLBUS-Materialien die am häufigsten ausge-lieferten bzw. verwendeten Studien aus dem GESIS-Angebot sind (vgl. KVI 2001: 187; Klein 2002: 119). Bereits in den ersten Jahren seiner Verfügbarkeit waren für ALLBUS im Vergleich zu vielen anderen sozialwissenschaftlichen Datensätzen beachtlich hohe Nutzungshäufigkeiten zu verzeichnen. Einige kleinere Schwankungen im Zweijahreszyklus beruhen auf dem Auslieferungszeitpunkt der jeweils neuesten ALLBUS-Einzelerhebung, welcher zumeist zu Anfang des Folgejahres lag.

Bei den ausgelieferten Materialien handelte es sich bis zum Ende der 80er Jahre nahezu ausschließlich um Datensätze auf Magnetband (schwarze Balken in Abbildung 1, Maßstab Y1 links in Abbildung 1) und gebundene Codebücher (schraffierte Balken, Maßstab Y1). Laut Ergebnis des ALLBUS 1986 hatten zwar knapp 9% aller westdeutschen Haushalte bereits einen Heimcomputer bzw. PC, doch waren viele dieser derzeitigen Heimgeräte wohl kaum in der Lage, einen Daten-satz von der Größe eines ALLBUS befriedigend auszuwerten, und die Dokumente lagen derzeit noch nicht in einer einfach maschinenlesbaren Form vor. Gerechnet wurde derzeit vorwiegend im Kontext von Rechenzentren mit so genannten Groß-rechnern.

Page 195: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

196 ZA-Information 53

Abbildung 1 Der ALLBUS von 1980 bis 2003

In den Jahren nach 1989 stieg die registrierte ALLBUS-Weitergabe fast in jedem Jahr nochmals deutlich an. Neben der weiteren Verbesserung der Produktqualität und der sich abzeichnenden Etablierung von ALLBUS als deutscher Referenzstudie für Querschnittsdatensätze sind weitere Erklärungsfaktoren zunächst für den Beginn der 90er Jahre zu berücksichtigen. Es ergab sich nach der deutschen Vereinigung eine nennenswert vergrößerte gesamtdeutsche Interessentengruppe1 und ein ver-stärktes Interesse an sozialwissenschaftlichen Daten zur Analyse der neuen Situation im vereinten Deutschland. Nicht zuletzt kam aber auch die zunehmende Verbrei-tung des Computergebrauchs (PC) in weiten Bevölkerungskreisen hinzu. Die Dis-kette und der Einsatz entsprechender Komprimierungsprogramme stellten wichtige Schritte zur erweiterten Distribution dar. Die letzten ALLBUS-Servicevorgänge mit Datenweitergabe auf Band fanden von einer vereinzelten Ausnahme (1995) in 1993 statt.

1 Es entfallen seit 1990 ca. 11% aller Vorgänge im ALLBUS-Nutzerservice des ZA auf das Ausland, ca.

14% auf die neuen und ca. 75% auf die alten Bundesländer. Insgesamt verteilten sich die über 13000 Vorgänge auf weltweit 48 Länder, wobei die häufigsten Auslandsvorgänge in den USA (über 500) zu verzeichnen waren (vgl. zur Darstellung weiterer Nutzerkategorien Terwey 1998).

Y1 - Einzelne ALLBUS-Produkte (diverse Datenträger und Print) ALLBUS-Kollektionen auf CD - Y2 (in tausend)

1980 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 00 01 02 030

500

1.000

1.500

2.000

0

1

2

3

4

Einzelne Datensätze

Einzelne Dokumente

ALLBUS in Kollektionen

Zentralarchiv für Empirische Sozialforschung an der Universität zu Köln (Stand 24.11.2003)

Page 196: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 197

Ab etwa 1996 zeichnet sich in Abbildung 1 wiederum eine neue Entwicklung ab: Die Zahlen der registrierten Lieferungen von einzelnen Datensätzen und Dokumen-tationen gehen zunächst etwas zurück. Gleichzeitig tritt aber als neues Distributi-onsmedium die CD-ROM auf, die im Interesse einer möglichst einfachen und voll-ständigen Versorgung von ALLBUS-Interessenten zumeist jeweils ein Komplettan-gebot aller frei verfügbaren ALLBUS-Materialien aus dem ZA enthält. Die Zahl der auf diese Weise jeweils in Kollektion ausgelieferten Materialien ist mit jener der zuvor angesprochenen Einzelmaterialien nur sehr begrenzt vergleichbar und wird daher in Abbildung 1 mit einem neuen grauen Balken und einem eigenen Maßstab (Y2 rechts in Abbildung 1) dargestellt. Von 35 CDs mit insgesamt ca. 400 ALLBUS-Studien in 1996 stieg die Auslieferung auf diesem Wege bis 2001 auf einen vorläufigen Höchstwert an (250 CDs mit insgesamt ca. 3500 Datensätzen).2

Nachdem die CD als weiteres Medium der Auslieferung angeboten wird, sinkt also konsequenterweise zunächst die Lieferung von Einzelmaterialien (auf Disketten) vorläufig etwas ab. Im letzten Quartal 1999 beginnt sich jedoch abermals eine neue Entwicklung abzuzeichnen. Es handelt sich dabei um Zugriffe auf ein neues kosten-loses, permanent verfügbares Download. Dieses wurde als Pilotprojekt mit den ALLBUS-Studien 1994 und 1996 in der zweiten Hälfte des Jahres 1999 eingerich-tet. Im Jahr 2000 kommt die Nachfrage in diesem Online-Download voll zum Tra-gen: Die Zahl der registrierten Einzeldatensatzlieferungen liegt erstmals über 1000 und damit nochmals weit über allen bisherigen Jahreshäufigkeiten in dieser Kate-gorie. Die CD-ROM-Lieferungen bleiben andererseits bis 2002 auf einem hohen Niveau, die Zahl der distribuierten Einzelmaterialien sinkt aber von 2000 bis

2 Damit kann selbstverständlich nicht belegt werden, dass immer alle der im Komplettangebot auf

CD ausgelieferten Daten und Dokumente seitens der bestellenden Personen unmittelbar von Interesse sind. Es würde die ohnehin schon recht arbeitsaufwendige Nutzerstatistik noch weiter erheblich belasten, wenn bei jeder Bestellung ermittelt wird, welche Studie prima facie von Belang ist. Erstens würde eine solche Befragung die Geduld vieler Interessenten über-strapazieren. Zweitens wissen Anfragende oft noch gar nicht genau, welches Informationspoten-tial ALLBUS insgesamt bietet. Nach weiterer Inspektion der jeweils auf CD vorhandenen Materialien werden später in vielen Fällen auch andere Materialien als eingangs fokussiert Verwendung finden. Schließlich kann, trotz der Bestimmungen zur Nutzung (keine Weitergabe an Dritte) doch bislang nicht ausgeschlossen werden, dass Dritte auf das Material zugreifen (z.B. bei Einspeisung von ALLBUS auf einen Institutsserver bzw. bei Verwendung der Daten in der Lehre). Unter den gegebenen Bedingungen kann man nur mit etwas Zurückhaltung daran gehen, eine mancherorts zu vermutende nicht registrierte Diffusion von Daten zu verringern. Hervorzuheben ist immerhin, dass insgesamt gesehen nicht nur die Zahl der ausgelieferten ALLBUS-Datensätze und Dokumente stark gestiegen ist, sondern dass auch eine starke Vermehrung registrierter Nutzer durch die Nutzerstatistik belegt wird (Terwey 2002: 104).

Page 197: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

198 ZA-Information 53

2002 wieder ab. Das in der Download-Pilotanwendung angebotene Material (ALLBUS 1994 und 1996) verliert an Aktualität und damit auch an Interesse.

Im vierten Quartal von 2002 kommt es dann aber zu einer erneuten, sehr weitrei-chenden Änderung im Angebots- und Nachfragebereich. Zwei neue Download-Systeme werden etabliert: (a) Ein permanentes Download-Angebot für die neue, im Umfang reduzierte Serie ALLBUScompact. Die elementaren Angaben bei der Selbstregistrierung der Nutzer in diesem System werden abgespeichert, aber nicht automatisch vor dem Datenzugriff auf Korrektheit geprüft. Die Weitergabe des demographisch vereinfachten ALLBUScompact birgt hinsichtlich des Daten-schutzes für die Befragten keine wirkliche Gefahr in sich; (b) Ein kontrolliertes Download für die ALLBUS-Vollversion mit kompletter Demographie, das gestattet, Angaben der Nutzer vorab zu überprüfen und auch danach noch bei Bedenken oder offenen Fragen den Zugang zu sperren. Eine weitreichende Änderung in der Distri-butionsweise ist aktuell die Folge: Die Menge der in 2003 bislang ausgelieferten ALLBUS-Materialien in Kollektionen auf CD-ROM verringert sich (grauer Balken in Abbildung 1 rechts). Währenddessen steigt der Bezug von einzelnen Daten und Dokumentationen sprunghaft auf jeweils weit über tausend an (schwarzer und schraffierter Balken).

Eine modifizierte Sichtweise veranschaulicht den ab 2002 eingetretenen Wandel nochmals deutlich. In Abbildung 2 werden die einzelnen Vorgänge (Abrufe bzw. Lieferungen von einzelnen Dokumenten, Datensätzen via Download, CD, Brief, E-Mail oder persönliche Weitergabe), die in die Nutzerstatistik des ALLBUS-Datenservice eingehen, dargestellt. Nachdem 2000 ein relativ hohes Niveau von über 1200 Vorgängen erreicht und bis 2002 gehalten wurde, stiegen die Vorgänge infolge der erweiterten neuen Downloads nochmals sprunghaft an auf bislang über 4000 in 2003. Hochgerechnet können wir für 2003 eine etwa zwanzigfach höhere Zahl an Distributionsvorgängen erwarten als 1990, obgleich auch damals bereits eine vergleichsweise große ALLBUS-Nachfrage der Fall war (vgl. u.a. Abbildung 1).

Wenn wir näher hinterfragen, wie sich die Distributionsvorgänge auf die verschie-denen Vertriebswege in 2003 verteilen, so finden wir gemäß des bereits angespro-chenen Wandels verstärkt Weitergaben via Download gegenüber dem Versand per Post, per E-Mail oder der persönlichen Übergabe bei ZA-Besuchen etc. Gut 35% der Vorgänge entfallen auf das weniger streng reglementierte Download von ALLBUScompact, während im kontrollierten Download (ALLBUS-Vollversion) ca. 55% der Vorgänge anfielen. Andererseits ist die Zahl der am Download von ALLBUScompact beteiligten Personen höher als im kontrollierten Download. D.h.

Page 198: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 199

Abbildung 2 Vorgänge in der Distributionsstatistik des ALLBUS

pro registrierter Person im kontrollierten Download fallen im Schnitt mehr Vorgän-ge an. Diese unterschiedliche Nutzungsweise resultiert zum einen aus dem größeren Spektrum unterschiedlicher Materialien im kontrollierten Download, sie entspricht aber auch der unterschiedlichen Konzeption dieser beiden Einrichtungen. Kürzere, etwas weniger anspruchsvolle Anwendungen sind mit ALLBUScompact in der Re-gel gut zu bewältigen, während anspruchsvollere, mit intensiver Nutzung diverser Zusatzmaterialien (z.B. ALLBUS-Methodenbericht) verknüpfte Analysen sich eher auf die ALLBUS-Vollversion konzentrieren sollten. Zurzeit beabsichtigen 35% der im kontrollierten Download eingetragenen Personen Anwendungen in der wissen-schaftlichen Forschung, 4% in der Lehre, 17% in Forschung und Lehre sowie 43% in der eigenen Ausbildung (z.B. Studenten).

Wie bereits angedeutet, kann mit der ZA-Vertriebsstatistik die Nutzung von ALLBUS nicht mit einer einzigen simplen Auszählung dargestellt und nur ansatz-weise quantifiziert werden (vgl. auch Terwey 1998, 2002). Besonders wichtig und relativ eindeutig interpretierbar für den Nachweis der Nutzung ist ein weiterer

In tausend

1990 91 92 93 94 95 96 97 98 99 2000 2001 2002 20030

1

2

3

4

Zentralarchiv für Empirische Sozialforschung - Universität zu Köln (vorläufiger Stand 24.11.2003)

Page 199: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

200 ZA-Information 53

Indikator: Die Zahl der bekannt gewordenen Publikationen unter Verwendung von ALLBUS. Nach aktuellem Kenntnisstand sind dazu in der ZA-Bibliotheks-datenbank ca. 1370 Fundstellen nachgewiesen. Ca. 1000 davon enthalten explizite Hinweise darauf, welcher ALLBUS-Jahrgang bzw. welche ALLBUS-Jahrgänge speziell verwendet worden sind. Abbildung 3 gibt einen Überblick, wie oft einzelne Jahrgänge explizit in den Publikationen verwendet wurden.

Abbildung 3 Der ALLBUS in den Publikationen (Mehrfachnennungen von ALLBUS-Jahrgängen pro Publikation sind enthalten)

Um zwischen der frühen Phase der Publikationen (vgl. den besonderen Status dieser Phase in Abbildung 1) und den späteren ALLBUS-Jahren unterscheiden zu können, werden die Publikationen in Abbildung 3 teilweise zeitlich differenziert dargestellt. Der erste linke schraffierte Balken zeigt, dass im Zeitraum von 1980 bis 2003 der ALLBUS-Jahrgang 1980 in 181 Publikationen herangezogen wurde. Ähnlich wie der Jahrgang 1982 gehört er damit zu den fünf bislang in Veröffentlichungen am meisten verwendeten (1980, 1982, 1991, 1994, 1996) in dieser Serie. Allerdings ist hier zu berücksichtigen, dass bei den ersten Jahrgängen auch eine längere Zeit für

ALLBUS-Jahrgänge

Balken für Publikationsperioden 1980-2003 und 1990-2003 gesondert dargestellt

1980 82 84 86 88 1990 91 92 94 96 98 2000 02 Kumulation0

50

100

150

200

250

1980-2003

1990-2003

Zentralarchiv für Empirische Sozialforschung an der Universität zu Köln (Stand 11.11.2003)

Page 200: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 201

Publikationen zur Verfügung stand und dass ein Teil dieser Veröffentlichungen mit den später im ZA zusammengeführten Zeitreihen-Daten (ALLBUS-Kumulationen) ohne deren explizite Nennung erstellt worden sein dürfte. Die grauen Balken bilden den Publikationszeitraum 1990 bis 2003 (Oktober) gesondert ab. Wir stellen fest, dass jeweils etwa die Hälfte aller Publikationen mit den ersten ALLBUS-Jahr-gängen (1980-84) noch nach Ablauf von ca. 10 Jahren und mehr erschienen sind. Die Daten haben offenbar auch lange nach ihrer Erhebung noch Relevanz für die Profession behalten. Der Spitzenreiter unter den ALLBUS-Jahrgängen ist 1991. Darin zeigt sich die besondere Relevanz dieser außerhalb des zweijährigen Erhe-bungsturnus von der DFG finanzierten "Basisumfrage". Vergleichbar hoch ist die Zahl von Zeitreihenauswertungen (ALLBUS-Kumulationen). Diese Kumulations-anwendungen haben sich offenbar nach 1989 vermehrt eingestellt, d.h. nach Vorlie-gen längerer, besonders profund aufbereiteter Zeitreihen. ALLBUS 2000 und ALLBUS 2002 sind schlichtweg noch zu neu, als dass mit diesen Daten bereits viele Publikationen vorliegen könnten.3

Kommen wir zu einem Zwischenfazit der neuen Angebote: ALLBUS-Dokumente können im Netz und auf CD problemlos recherchiert werden. Alle Datensätze und Dokumentationen der Einzelerhebungen und Kumulationen stehen im Download online zur Verfügung. Hinsichtlich der Forschungsergebnisse können bibliographi-sche Angaben und Abstracts zu den Publikationen bei ZUMA, ZA und IZ online recherchiert werden. Neben den Dokumenten sind auch die Daten via Internet un-verzüglich weltweit abrufbar. Die nach einer englischen Untersuchung (Rice et al. 2001) drei häufigsten Hindernisse für die Nutzer lack of awareness of materials, lack of time for preparation, difficult registration procedures sind weitgehend mi-nimiert worden, so weit dies für einen komplexen Survey wie ALLBUS möglich ist.

Die CD-ROM als wichtigste Alternative zu den beiden nun die vollständige Pro-duktpalette umfassenden ALLBUS-Downloads ist in ihrer Distribution nach 2001 zurückgegangen (vgl. die gesunkene Zahl von via CD-ROM-Kollektionen ausgelie-

3 Am Rande sei darauf hingewiesen, dass auch mit dieser Publikationsstatistik, kein vollständig

erschöpfender Nachweis der Nutzung von ALLBUS gegeben werden kann, obschon die wissen-schaftliche Nutzung in Veröffentlichungen ein wichtiger Indikator für den Erfolg eines Daten-generierungsprogramms ist. Gerade wenn der Zugang zu einem Datensatz infolge Bekanntheit, Aufbereitung und Zugriffserleichterung erhöht wird, steigt auch die Nutzung in den Bereichen organisierter und individueller Ausbildung (vgl. u.a. diverse Lehrbücher unter Verwendung von ALLBUS). Die häufigsten registrierten Distributionsvorgänge sind beim ALLBUS 1996, den ALLBUS-Kumulationen und ALLBUS 1994 zu finden. Dazu hat neben der Verfügbarkeitszeit insgesamt (Kumulation) auch die leichte Zugänglichkeit der 96er und 94er Daten über das erste konstant online verfügbare Download beigetragen (vgl. die weiter oben angesprochene Pilot-anwendung).

Page 201: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

202 ZA-Information 53

ferten Datensätzen in Abbildung 1). Dennoch gibt es weiter Interessenten für die kompakte Zusammenfassung des Gesamtangebots. Gegenwärtig zeichnet sich u.a. im Kontext mit der Informationsarbeit zur Promotion des ALLBUS 2002 eine wie-der zunehmende Zahl von CD-Bestellungen ab. Daneben gibt es auch ganz andere, hier nicht im Detail darzustellende Innovationen in der ALLBUS-Distribution, die für die allgemeine "data literacy" große Bedeutung haben. So wurden in einer Zu-sammenarbeit zwischen der Bundeszentrale für politische Bildung, der Universität Münster und ALLBUS ca. 40.000 ALLBUS-Subsets neben diversen anderen In-formationsmaterialien an Schulen weitergegeben.4 Auch im außeruniversitären Bereich hat ALLBUS einen hohen Stellenwert für die Ausbildung.

Michael Terwey Tel.: 0221 / 4 76 94 - 22 E-Mail: [email protected]

Literatur

Davis, James Allan, Peter Ph. Mohler und Tom W. Smith 1994: Nationwide General Social Surveys, in: Ingwer Borg und Peter Ph. Mohler (Hg.), Trends and Perspectives in Empirical Social Research, Berlin und New York: Walter de Gruyter: 17-25.

Klein, Markus 2002: Das Zentralarchiv für Empirische Sozialforschung im Urteil von Soziologieprofessorin-nen und -professoren aus Deutschland, Österreich und der Schweiz, ZA-Information 50: 103-129.

KVI (Hg.; Kommission zur Verbesserung der informationellen Infrastruktur zwischen Wissenschaft und Statis-tik) 2001: Wege zu einer besseren informationellen Infrastruktur, Nomos: Baden-Baden.

Rice, Robin, Peter Burnhill, Melanie Wright und Sean Townsend 2001: An enquiry into the use of numeric data in learning & teaching, http://datalib.ed.ac.uk/projects/datateach/DataReport.pdf.

Terwey, Michael 1998: Analysen zur Verbreitung von ALLBUS, in: ZA-Information 42: 44-52.

Terwey, Michael 2000: ALLBUS: A German General Social Survey, in: Schmollers Jahrbuch 120: 151-158.

Terwey, Michael 2002: Analysen zur registrierten Nutzung von ALLBUS, in: ZA-Information 51: 100-105.

Trometer, Reiner 1993: Ergebnisse der Umfrage zum ALLBUS, in: ZUMA Nachrichten 33: 114-122.

4 Diese CD-ROM "Forschen mit GrafStat" richtet sich zunächst an Lehrer als Multiplikatoren - d.h. sie

verwenden die Gesamt-CD in ihrem Unterricht und geben dabei Material gemäß der didaktischen Erfordernisse vor Ort an die Schüler weiter. Mit dem ALLBUS-Subset soll es den Schülern ermöglicht werden, eigene Erhebungen in ihrem Umfeld mit repräsentativen deutschen Daten zu vergleichen. Weitere Information zu diesem Projekt finden Sie unter: http://egora.uni-muenster.de/FmG/forschen_ueberfmg.shtml Sowie zu einem anderen Kooperationsprojekt für Schulen: http://www.learn-line.nrw.de/angebote/selma/

Page 202: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 203

Neue Studien im ZHSF

Das ZHSF (Zentrum für Historische Sozialforschung) ist eine Abteilung des Zentral-archivs für Empirische Sozialforschung. Zu seinen Aufgaben gehören Akquisition, Aufbereitung, Archivierung und Dokumentation maschinenlesbarer Forschungs-daten, die im Rahmen historischer Studien entstanden sind. Zurzeit sind ca. 170 Studien archiviert, von denen unter der Web-Adresse: www.gesis.org/Datenservice/Suche/Daten/index.htm ca. 150 Studien recherchierbar sind. Handelt es sich bei den Daten der Studie um Zeitreihen zur Historischen Sta-tistik, dann werden diese vom ZHSF in die Internet-Datenbank „HISTAT“ impor-tiert, womit die Zeitreihen online recherchierbar und downloadbar sind. Neben den um ausführliche Anmerkungen versehenen Zeitreihen enthält die Datenbank weitere Angaben zu den betreffenden Studien, wie z.B. eine ausführliche Beschreibung von Zielen und Inhalt der Studien, verwendete Quellen und Literatur. In der Datenbank werden die Studien themenorientiert angeboten, wobei gegenwärtig folgende The-men berücksichtigt sind: Demografie, Bildung und Wissenschaft, Geld und Kredit, Innovation, Kommunikation und Verkehr, Gesundheitswesen, Preise, Sozialer Wandel, Staat und öffentliche Ausgaben, Unternehmen, Wachstum und Konjunktur. Diese Themenliste wird erweitert. HISTAT kann unter der Web-Adresse www. histat.gesis.org/ eingesehen werden. Da sich die Datenbank gegenwärtig noch im Aufbau bzw. in der Erprobung befindet, ist sie durch ein Passwort geschützt.

Übersicht über die neu akquirierten Studien in der Zeit von November 2002 bis November 2003

ZA-Studien-Nr. 8085 Tod und Gesellschaft. Todesanzeigen als Grundlage einer empirischen Untersuchung Primärforscher: Grümer, Karl-Wilhelm / Helmrich, Robert Untersuchung über das Verhältnis des modernen Menschen zum Tod. Inhalt: Zwei Fragen standen im Vordergrund dieser Studie: Zum einen wurden die inhaltlichen und formalen Schwerpunkte von Todesanzeigen und deren Verände-rungen über einen historischen Zeitraum bis zur Gegenwart untersucht. Zum ande-ren wird der allgemeinen Frage nach der analytischen Reichweite dieses Quellen-typs als Datenmaterial für eine Inhaltsanalyse nachgegangen, um Aussagen über die

Page 203: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

204 ZA-Information 53

Entwicklung von Verhaltensmustern im Umgang mit Tod und Sterben zu gewinnen. Es wurden Todesanzeigen verschiedener Tageszeigungen erhoben und ausgewertet, vor allem die Kölnische Zeitung bzw. der Kölner Stadtanzeiger und für die Gegen-wart überregionale Zeitungen wie die Frankfurter Allgemeine Zeitung. Zugrunde gelegt wird der Zeitraum 1814-1979, 1983 und 1992. Schlagworte: Sozialgeschichte, Sozialer Wandel, Tod und Sterben.

ZA-Studien-Nr. 8100 Sozialökologische Analyse der Kriminalität in Deutschland am Ende des 19. Jahrhunderts unter besonderer Berücksichtigung der Jugendkriminalität Primärforscher: Thome, Helmut Ziel und Inhalt: Die Studie beinhaltet Daten zur Kriminalität im Kaiserreich. Die Untersuchungseinheiten sind die Stadt- und Landkreise des Deutschen Reiches un-ter Berücksichtigung der Gebietsänderungen. Für alle erfassten Kreise werden Kri-minalitätsraten in den Kategorien Gesamtkriminalität, gefährliche Körperverletzung sowie einfacher und schwerer Diebstahl erhoben. Der Erhebungszeitraum umfasst die Jahre von 1883-1902. Schlagworte: Sozialgeschichte, Historische Sozialindikatoren, Kriminalität.

ZA-Studien-Nr. 8152 Deutschlands Krise und Konjunktur 1924-1934. Binnenkonjunktur, Auslands-verschuldung und Reparationsproblem zwischen Dawes-Plan und Transfersperre Primärforscher: Ritschl, Albrecht Ziel und Inhalt: Der Autor geht der Frage nach, warum über Deutschland nach der viel versprechenden Stabilisierung der Mark 1923/24 und dem anschließenden Auf-schwung eine Wirtschaftskrise von ungekanntem Ausmaß hereinbrach. Unter Ver-wendung von Daten zur deutschen Wirtschaft für den Zeitraum von 1923 bis 1938 (Konsum, Investitionen, Daten zu Wachstum und Produktivität, Arbeitsmarkt, Staatsverschuldung, etc.) untersucht er die inneren und äußeren Sonderfaktoren der deutschen Konjunkturentwicklung seit 1924. Er kommt zu dem Schluss, dass die ungewollten Anreizwirkungen des Dawes-Plans die Zwangslagen und Handlungs-spielräume der deutschen Krisenpolitik ab 1929 wesentlich vorherbestimmt haben. Albrecht Ritschl legt in seiner Arbeit eine neue Deutung der Brüningschen Deflati-onspolitik vor, in der sich der Schwerpunkt der Kritik an der deutschen Konjunk-turpolitik in die Phase des Dawes-Plans verlagert. Zugleich ergibt sich damit eine neue Interpretation der Borchardt-Thesen zur deutschen Konjunkturpolitik der letzten

Page 204: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 205

Jahre Weimars. Die ungebremste Auslandsverschuldung Deutschlands ab 1924 spielt eine Schlüsselrolle bei der Erklärung von Deutschlands Krise und Konjunktur zwischen dem Dawes-Plan und der Transfersperre. Schlagworte: Wirtschaftsgeschichte, Weltwirtschaftskrise, Wachstum und Kon-junktur, Geldpolitik, Wirtschaftspolitik, Staat und öffentliche Ausgaben.

ZA-Studien-Nr. 8153, HISTAT Wirtschaftskrisen und die europäischen Revolutionen von 1848 Primärforscher: Berger, Helge / Spoerer, Mark Ziel und Inhalt: Neuere historische Forschungen tendieren dazu, die Revolutionen von 1848 durch das Aufkommen radikaler Ideen und eine lang andauernde Phase sozio-ökonomischer Probleme begründet zu sehen. Viele zeitgenössische Beobach-ter interpretierten die Geschehnisse dagegen als eine Konsequenz von unmittelbaren wirtschaftlichen Gründen, insbesondere der dramatischen Lebensmittelknappheit, die der Kontinent zwischen 1845 und 1847 zu erleiden hatte, und den darauf fol-genden Einbruch in der industriellen Produktion. Indem quantitative Standardme-thoden auf einen Datensatz von 27 europäischen Ländern angewandt werden, zei-gen Spoerer und Berger, dass es hauptsächlich unmittelbar vorangegangene Miss-stände und die Angst vor denselben waren, die die europäischen Revolutionen von 1848 ausgelöst hatten. Die Studie enthält die Getreidepreise in Europa für die Jahre von 1815 bis 1860. Schlagworte: Wirtschaftsgeschichte, Revolutionen, Industrialisierung, Preise, Ge-treidepreise, Wirtschaftskrise, Wachstum und Konjunktur, Produktion, Sozialer Wandel.

ZA-Studien-Nr. 8154 Zollverein und Innovation. Die Reaktion württembergischer Textilindustrieller auf den deutschen Zollverein 1834-1874 Primärforscher: Kollmer, Gert Ziel und Inhalt: Die Studie leistet einen Beitrag zur württembergischen Industriali-sierungsgeschichte, indem sie sich mit den Auswirkungen der Deutschen Zollunion auf die württembergische Textilindustrie beschäftigt. Unter Anwendung eines mikro-ökonomischen Ansatzes wird die Frage untersucht, mit welchen (innovativen) Stra-tegien sich die württembergische Textilindustrie auf dem neuen Markt behauptete. Untersuchungsgebiet der Studie ist das Königreich Württemberg und seine Textil-industrie.

Page 205: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

206 ZA-Information 53

Schlagworte: Wirtschaftsgeschichte, Deutsche Zollunion, Innovation, Unternehmen, Textilindustrie, Sektor Textil.

ZA-Studien-Nr. 8155, HISTAT Das westeuropäische Wirtschaftswachstum nach dem Zweiten Weltkrieg. Eine Analyse unter besonderer Berücksichtigung der Planification und der Sozialen Marktwirtschaft Primärforscher: Bittner, Thomas Ziel und Inhalt: Es soll im Rahmen dieser Arbeit die Erklärungskraft verschiedener gesamteuropäischer und nationaler theoretischer Ansätze am Beispiel des westeuro-päischen Nachkriegswachstums zwischen 1950 und 1973 überprüft werden. Theorien, die in spezifisch nationalen Erklärungsfaktoren den Schlüssel zum Verständnis des europäischen Wachstumsverlaufs sehen, kommt eine herausragende Rolle zu. Es wurden Daten zu Exportvolumen, Technologieindikatoren, Produktionsniveau der Handelspartner und der Außenwerte für Deutschland und Frankreich erhoben. Schlagworte: Wirtschaftsgeschichte, Konjunktur und Wachstum, Wirtschaftswunder, Außenhandel, Montanunion, Produktion, Export, Technischer Fortschritt, Soziale Marktwirtschaft.

ZA-Studien-Nr. 8156, HISTAT Von Ford lernen? Automobilbau und Motorisierung bis 1933 Primärforscher: Flik, Rainer Ziel und Inhalt: Deutschland blieb bei der Einbürgerung des Automobils trotz sei-ner führenden Stellung in der Entwicklung des Verbrennungsmotors und der Auto-mobiltechnik im Vergleich zu den USA lange zurück. Der Autor wendet einen Erklärungsansatz an, der konsequent marktbezogen ist und Unterschiede in der Nachfrage auf unterschiedliche Kosten und Nutzen der Automobilhaltung zurück-führt. Als Determinanten der Automobilnachfrage werden z.B. die Siedlungsstruktur, die Einkommensverhältnisse oder die Kraftverkehrspolitik behandelt. Im zweiten Teil wird die Entwicklung der Personenkraftwagenindustrie in Deutschland bis 1933 dargestellt. Schlagworte: Wirtschaftsgeschichte, Technischer Fortschritt, Automobilnachfrage, Verkehr, Verkehrspolitik, Sektor Auto.

Page 206: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 207

ZA-Studien-Nr. 8157, HISTAT Historische Statistik der Binnenschifffahrt in Deutschland 1835-1989 Primärforscher: Kunz, Andreas Ziel und Inhalt: Die Zeitreihendaten sind im Rahmen des von der DFG geförderten Projektes "Historische Verkehrsstatistik von Deutschland 1835-1989" erhoben wor-den und beziehen sich auf die Einsatzfaktoren (Kapitalstock, Betriebsstoffe, Ar-beitskräfte) sowie auf das Produktionsergebnis (Transportleistung) der Binnen-schifffahrt. Neben Informationen zu Länge und Ausbau der Wasserstrassen, zum Schiffsbestand, Güterumschlag, Verkehrsaufkommen und Verkehrsleistung der Binnenwasserstrassen werden Verkehrsaufkommen und Güterumschlag von Häfen und Durchgangsstellen noch einmal gesondert für die Zeit des Deutschen Bundes und des Deutschen Reiches betrachtet. Erhebungsgebiet ist das Deutsche Reich in den Grenzen von 1871 bzw. dessen Vorläufer (Deutscher Bund ohne Österreich, Deutscher Zollverein) und Nachfolgestaaten (Bundesrepublik, ehemalige DDR). Schlagworte: Wirtschaftsgeschichte, Historische Statistik, Verkehr, Transport, Bin-nenschifffahrt.

ZA-Studien-Nr. 8158, HISTAT Deutsche Geldpolitik in der Ära Bretton Woods Primärforscher: Alecke, Björn Ziel und Inhalt: Die vorliegende Studie beschäftigt sich mit den ersten 25 Jahren deutscher Geldpolitik von 1948 - 1973. In der öffentlichen Meinung wird kaum be-zweifelt, dass die Stabilität der Währung, die Unabhängigkeit der Notenbank und der wirtschaftliche Wiederaufstieg der Bundesrepublik in diesem Zeitraum untrenn-bar miteinander verbunden sind. Dagegen wird in der Wirtschaftshistoriographie der Beitrag der Geldpolitik zum deutschen Nachkriegswachstum kontrovers disku-tiert. Die dort aufgeworfenen Fragen nach den Handlungsspielräumen und Wirkun-gen der deutschen Geldpolitik im Bretton-Woods-System fester Wechselkurse wer-den in dieser Studie mit Hilfe von traditionellen und neueren empirischen Methoden analysiert. Besonderes Augenmerk wird dabei auf die Kointegrationsanalyse gelegt, die in der ökonometrischen Literatur als Revolution für die empirische Forschung angesehen wird, in der deutschen Cliometrie aber eine bisher noch untergeordnete Rolle spielt. Es zeigt sich, dass die Formulierung eines strukturellen Fehlerkorrek-turmodells für den monetären Bereich der bundesrepublikanischen Wirtschaft in der Lage ist, die theoretischen Aussagen über die Geldpolitik in einer kleinen offenen Volkswirtschaft bei festen Wechselkursen zu bestätigen.

Page 207: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

208 ZA-Information 53

Schlagworte: Wirtschaftsgeschichte, Geld und Währung, Geldpolitik, Wechselkurse, Notenbank, Bretton-Woods-System, DM-Einführung.

ZA-Studien-Nr. 8159, HISTAT Demographischer Wandel und Modernisierung in Wien Primärforscher: Weigl, Andreas Ziel und Inhalt: Die Studie versucht die historisch-demographische Entwicklung Wiens vor allem unter Heranziehung bevölkerungs-, wirtschafts- und sozialstatisti-scher Quellen in ihrem komplexen Gesamtzusammenhang zu erfassen. Anhand der Entwicklung von Migration, generativem Verhalten und Sterblichkeit wird der Ver-lauf der Wiener Bevölkerungsgeschichte nachgezeichnet und wichtige Einflussfak-toren (Städtesanierung, Ernährungsgewohnheiten, Seuchen und Epidemien etc.) behandelt. Die bedeutende Rolle von Modernisierungsprozessen steht dabei im Mit-telpunkt der Betrachtung. Die Zeitreihen zum Thema Bevölkerung decken den Zeit-raum von 1500 bis 2000 ab. Schlagworte: Sozialgeschichte, Historische Demografie, Bevölkerung, Migration, Fertilität, Mortalität.

ZA-Studien-Nr. 8160 Statistik der Professionisten im Kurfürstentum Baiern nach der Dachs-berg’schen Volksbeschreibung (1771-1781) Primärforscher: Denzel, Markus Ziel und Inhalt: Die Daten stammen aus der Dachsberg'schen Volksbeschreibung, einer umfassenden Statistik Kurbaierns, die Auskunft über die Wirtschafts- und So-zialstruktur dieses Staates im ausgehenden Alten Reich gibt. Diese Daten wurden zwischen 1771 und 1781 erhoben und stellen eine kombinierte Bevölkerungs- und Gewerbestatistik dar. Der gewerbestatistische Teil wurde für die vorliegende Arbeit vom Datengeber in maschinenlesbarer Form aufbereitet, wobei bevölkerungsstatis-tische Angaben dann berücksichtigt wurden, wenn diese zum Verständnis und zur Auswertung der Professionistenstatistik (das heißt: die Gewerbestatistik) erforder-lich sind. Die Daten sind für das Territorium des bairischen Landsherrn – d.h. in Kurbaiern, in der Kuroberpfalz und den schwäbischen Besitztümern der Wittelsba-cher – erhoben worden. Im Einzelnen wurde bei der Bearbeitung der Daten in je-weils 5 Abschnitten vorgegangen: Gliederung des Gerichts (bzw. Herrschaftskom-plexes) zur Datenerfassung, Rahmendaten (Einwohnerzahl; Anzahl der Meister, Gesellen und Lehrjungen; Anzahl der Tagwerker), Gewerbedaten, Verteilung der

Page 208: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 209

Gewerbe innerhalb des Herrschaftskomplexes sowie die Gewerbedichte (Gewerbe pro 1000 Einwohner). Schlagworte: Wirtschaftsgeschichte, Wirtschafts- und Sozialstruktur, Bevölke-rungs- und Gewerbestatistik.

ZA-Studien-Nr. 8161, HISTAT Wachstumszyklen technisch-wissenschaftlicher Kreativität. Eine quantitative Studie unter besonderer Beachtung der Mathematik Primärforscher: Wagner-Döbler, Roland Ziel und Inhalt: Moderne Ökonomen sehen die wirtschaftliche Großwetterlage eng verknüpft mit der Entwicklung von technologischen Innovationen und Basisinnova-tionen. Aus der Perspektive der Wissenschaftsforschung unterscheidet der Autor zwischen wissenschaftlichen Entdeckungen, technologischen Innovationen und ökonomisch umsetzbaren Innovationen. Viele Quellen wurden vom Autor erstmals statistisch analysiert und zeigen, dass nicht nur die Wirtschaft zyklischen Schwan-kungen unterliegt, sondern auch Erfindungen und Entdeckungen. Schlagworte: Wirtschaftsgeschichte, Innovationen, Technischer Fortschritt, Diffu-sion, Konjunktur.

ZA-Studien-Nr. 8162 Duisburg im 18. Jahrhundert. Sozialstruktur und Bevölkerungsbewegung ei-ner niederrheinischen Kleinstadt im Ancien Régime (1713-1814) Primärforscher: Jägers, Regina Ziel und Inhalt: Hauptthema der Arbeit ist die Darstellung der Bevölkerungsent-wicklung der Stadt Duisburg und ihre sozialen Strukturen im 18. und anbrechenden 19. Jahrhundert mit Hilfe der kirchlichen Register. Über die empirisch-statistische Auswertung hinaus wird versucht, das Zahlenwerk zu den sozioökonomischen, politisch-rechtlichen und nicht zuletzt konfessionellen Bedingungen der Zeit und des Raumes in Beziehung zu setzen. Mit Hilfe der Bevölkerungszählungen von 1714 und 1811 sowie einer Reihe von fiskalisch motivierten Erhebungen werden sozioprofessionelle Schichtmodelle der Duisburger Bevölkerung erstellt. Daneben werden auch die drei konfessionellen Bevölkerungsgruppen, ihr Umfang ebenso wie ihre politische und ökonomische Situation vorgestellt. Daran schließt sich die Fragestellung an, inwieweit die Konfessionszugehörigkeit das Bevölkerungsverhalten (Geburten, Eheschließungen, Sterblichkeit) und das Wanderungsverhalten beeinflusste.

Page 209: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

210 ZA-Information 53

Schlagworte: Sozialgeschichte, Sozialer Wandel, Sozialstruktur, konfessionelle Gruppen, Demografie, Migration.

ZA-Studien-Nr. 8163, HISTAT Kraftfahrzeugbestand der BRD 1948-1992 Primärforscher: Flik, Rainer Ziel und Inhalt: In diesem Datensatz wird die Entwicklung des Kfz-Bestandes in der BRD erfasst. Ziel der Untersuchung ist, Änderungen der amtlichen Erfassungs-Systematik im Verlauf der Entwicklung nachzuvollziehen bzw. kenntlich zu ma-chen. So wurden zum Beispiel für einige Jahre die nicht zulassungspflichtigen Fahrzeuge mit amtlichen Kennzeichen gesondert ausgewiesen. Später jedoch wur-den diese Fahrzeuge den zulassungspflichtigen Fahrzeugen zugeordnet. Das ergab einen starken Anstieg der Kfz-Bestände für 1980, was jedoch nicht auf eine erhöhte Anschaffungsrate zurückzuführen ist. Schlagworte: Wirtschaftsgeschichte, Verkehr, Kraftfahrzeugbestand, Kfz-Erfas-sungs-Systematik.

ZA-Studien-Nr. 8164 Berlin 1650-1800. Sozialgeschichte einer Residenz Primärforscher: Schultz, Helga (unter Mitarbeit von Jürgen Wilke) Ziel und Inhalt: Auf der Grundlage von Kirchenbüchern sowie zahlreicher zeitge-nössischer Quellen wird das wirtschaftliche und kulturelle Leben in der Residenz-stadt Berlin aufgearbeitet. Exemplarisch für die Entwicklung Berlins wurden zwei Berliner Kirchengemeinden ausgewählt: das innerstädtische Nikolai-Kirchspiel und das vorstädtische Kirchspiel St. Georgen. In beiden Parochien gemeinsam lebten um die Mitte des 18. Jahrhunderts 14 Prozent der lutherischen Berliner. Im Zusam-menhang mit der Studie wurden historisch-demografische Daten erhoben, die de-taillierte Auskunft über die Berufe, die Geburten, Hochzeiten und Beerdigungen der Mitglieder der beiden Kirchengemeinden geben. Da neben der beruflichen Stellung der Eltern bzw. der Hochzeitpaare auch die berufliche Stellung der Paten bzw. der Familienangehörigen erhoben wurden, können anhand dieser Daten die sozialen Beziehungen der Angehörigen verschiedener gesellschaftlicher Schichten nachvoll-zogen werden. Schlagworte: Sozialgeschichte, Historische Demografie.

Page 210: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 211

ZA-Studien-Nr. 8165 NS-Zwangsarbeiter im Deutschen Reich. Eine Statistik vom 30. September 1944 nach Arbeitsamtsbezirken Primärforscher: Spoerer, Mark Ziel und Inhalt: Anlässlich der Entschädigungsverhandlungen der ehemaligen Zwangsarbeiter, die während des Zweiten Weltkrieges für die deutsche Kriegswirt-schaft arbeiten mussten, wuchs der Bedarf an quantitativen Informationen. Hierbei sind die von der nationalsozialistischen Arbeitseinsatzverwaltung regelmäßig publi-zierten statistischen Erhebungen über den Ausländereinsatz von Bedeutung. Das Reichsarbeitsministerium, die Landes- und die Gauarbeitsämter veröffentlichten regelmäßig statistische Übersichten. Diese Veröffentlichungen, die eine bedeutende quantitative Quelle z.B. für die Regionalforschung darstellen, sind bedauerlicher-weise nicht mehr vollständig verfügbar. Daher beziehen sich die vorliegenden Daten nur auf die ausländischen Zivilarbeiter und deren Aufteilung auf die verschiedenen Arbeitsamtsbezirke zum Zeitpunkt September 1944. Der Autor betont, dass die Zahlen nur die unteren Grenzen der tatsächlichen Anzahl aller ausländischen Zivil-arbeiter darstellen. Über die zeitliche Fluktuation ist wenig bekannt, so dass von der erfassten Zahl auch nicht die Gesamtzahl der Zivil- bzw. Zwangsarbeiter eines Bezirks abgeleitet werden kann. Schlagworte: Politische Geschichte, Nationalsozialismus, NS-Zwangsarbeiter.

ZA-Studien-Nr. 8166 Gesellschaft und Wirtschaft in Darmstadt. Die Entwicklung von 1800 bis 1980 Primärforscher: Wiest, Ekkehard Ziel und Inhalt: Diese Arbeit beschreibt die gesellschaftliche und wirtschaftliche Entwicklung Darmstadts in den Jahren 1800 bis 1980, die sich von einer Residenz-Stadt über eine Industriestadt Mitte des 19. Jahrhunderts zu einer immer stärker vom Dienstleistungssektor geprägten Stadt wandelt. Grundlage für die Datenerhe-bung waren die Adressbuch-Statistiken bis 1980, in denen die Merkmale der Haus-haltsvorstände erfasst wurden. Die vorliegende Darstellung beschreibt kollektive Lebensverläufe: Die Entwicklung von Darmstädter Berufen und Gesellschafts-schichten, von Bewohnern der städtischen Regionen und Bezirke. Schlagworte: Sozialgeschichte, Sozialer Wandel, Sozialstruktur.

Page 211: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

212 ZA-Information 53

ZA-Studien-Nr. 8167, HISTAT Realeinkommen in Deutschland 1810-1914 Primärforscher: Gömmel, Rainer Ziel und Inhalt: Um die Entwicklung des Lebensstandard in Deutschland währen des 19. Jh. quantitativ darstellen zu können, berechnet der Autor lange Realein-kommensreihen neu. Die Neuberechnung ergibt sich aus der Kritik des Autors an den schon vorgelegten berechneten Realeinkommensreihen anderer Forscher, wie z.B. Jürgen Kuczynski (1961, 1962). Die Einkommensreihen umfassen den Zeit-raum von 1810 bis 1914. Schlagworte: Wirtschaftsgeschichte, Lebensstandard, Einkommen, Wachstum und Konjunktur.

ZA-Studien-Nr. 8168 Politische Gefangene in der DDR - Eine quantitative Analyse Primärforscher: Schroeder, Wilhelm H./Wilke, Jürgen Ziel und Inhalt: Aufgrund der strengen Geheimhaltung der Gefangenen- und Kri-minalitätsstatistik von Seiten der Behörden der ehemaligen DDR kann heute die einfache Frage nach der Anzahl politischer Strafgefangener nicht einfach beantwor-tet werden. Bisherige Schätzungen weichen je nach verwendeten Quellen, Begriffs-definitionen, Schätzmethoden und Untersuchungszeitraum voneinander ab. Daher ist das Hauptziel der Forscher, die Möglichkeit einer Analyse dieser sehr komple-xen Materie auszuloten und erste quantitative Ergebnisse vorzulegen. Schlagworte: Politische Geschichte, Rechtssystem, politische Strafgefangene, DDR.

Gabriele Franzmann Zentralarchiv für Empirische Sozialforschung Abteilung: Zentrum für Historische Sozialforschung, Köln.

E-mail: [email protected]

Page 212: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 213

Complex Modelling 33rd Spring Seminar at the Zentralarchiv, March 1-19, 2004

The Spring Seminar is a training course for social scientists interested in advanced techniques of data analysis and in the application of these techniques to data. Par-ticipants must have a sound basic knowledge of statistics as well as experience in the handling of PCs and of working with statistical packages like SPSS. Please note that for the third week the program package STATA will be used.

For news and updates concerning the Spring Seminar, please refer to the following website: http://www.gesis.org/za1

Topics, Reading-Lists and Course Descriptions:

Multilevel Analysis

1-5 March 2004

Professor Tom A. B. Snijders, Rijksuniversiteit Groningen/The Netherlands

Multilevel analysis is the statistical methodology for analysing data with several sources of variability, used especially when these sources have a nested structure: e.g., pupils in schools, voters in precincts, patients in doctors in hospitals, etc. The fact that there are several sources of variability implies violations of the statistical independence assumptions that are basic to techniques such as linear regression analysis. The main statistical tool of multilevel analysis is the Hierarchical Linear Model, in which the various sources of variability are represented by nested random coefficients. This course will give an introduction to multilevel analysis using MLwiN.

It is assumed that participants know how to work with linear regression analysis, but no previous knowledge of multilevel analysis is required.

1 Due to the fact that the seminar is almost fully booked we would like to draw your attention to

other postgraduate programmes in data reduction techniques for social scientists (see the follow-ing paragraph on the ICPSR summer program). Furthermore, try the following website of Essex Summer School in Social Science Data Analysis: http://www.essex.ac.uk/methods/

Page 213: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

214 ZA-Information 53

Literature:

Multilevel Analysis: An introduction to basic and advanced multilevel modelling, by Tom Snijders and Roel Bosker (Sage, 1999).

For those participants who also wish to look at other literature:

D.R. Cox and P.J. Solomon, Components of Variance, Chapman & Hall/CRC, 2002.

H. Goldstein, Multilevel Statistical Models. London: Arnold, 3rd ed., 2003.

J.J. Hox, Multilevel Analysis, Techniques and Applications, Lawrence Erlbaum Associates, 2002.

A.H. Leyland and H. Goldstein (eds.), Multilevel Modelling of Health Statistics, New York: Wiley, 2001.

Stephen W. Raudenbush and Anthony S. Bryk, Hierarchical Linear Models. Appli-cations and Data Analysis Methods. Newbury Park, CA: Sage, 2nd ed., 2002.

G. Verbeke and G. Molenberghs, Linear Mixed Models for Longitudinal Data, New York: Springer, 2000.

Mixture Modelling

8-12 March 2004

Dr. Petra Stein (and Kai Kelleter, Dipl.-Soz., PC sessions), University of Duis-burg-Essen, Campus Duisburg/Germany

A central topic of empirical social research is the problem of unobserved heteroge-neity. To solve this problem at least partially, a new statistical model is presented, the finite mixture of conditional mean and covariance structures. In this workshop we specify models of finite mixture of multivariate normal densities conditional on regressor variables. The expected values and covariance matrices of the mixture components are parameterized using conditional mean- and covariance structures. We discuss three different strategies to estimate the parameters of the model and testing the number of mixture components. Finally we give three empirical exam-ples. For computation we use the GAUSS program MECOSA 3.

Literature:

Mixtures of Conditional Mean- and Covariance Structure Models, in Zusammenar-beit mit Gerhard Arminger und Jörg Wittenberg, in: Psychometrika, Jg. 64 (4/1999), S. 475-494.

Page 214: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 215

Finite Mixtures of Covariance Structure Models with Regressors, in Zusammenarbeit mit Gerhard Arminger, in: Sociological Methods & Research, Jg. 26 (2/1997), S. 148-182.

Konstruktion und sozialwissenschaftliche Anwendung finiter Mischungen von Ko-varianzstrukturmodellen. Köln: Josef Eul Verlag, 1997.

Mediennutzung und politische Partizipation. Eine Analyse finiter Mischungen kon-ditionaler LISREL-Modelle zur Identifikation heterogener Subpopulationen, in Zu-sammenarbeit mit Kai Kelleter, in Kölner Zeitschrift für Soziologie und Sozialpsy-chologie, Jg. 54 (2/2002), S. 281-303.

Modelle zur Aufdeckung unbeobachteter Heterogenität bei der Erklärung von Lebenszufriedenheit, in: Zeitschrift für Soziologie, Jg. 29 (2/2000), S.138-159.

Generalized Linear Latent and Mixed Models (GLLAMM)

15-19 March 2004

Professor Dr. Andrew Pickles, University of Manchester/United Kingdom

The course describes how an extensive range of models can be seen as special cases of the generalized linear latent and mixed model and illustrates this with a series of examples using the STATA procedure gllamm. These models include confirma-tory factor analysis, random effects, structural equation and mixture distribution models for a range and a mixture of response data types. The course will end with a consideration of more novel model types, such as multilevel structural equation and non-ignorable non-response models.

Literature:

Bijleveld, C. and van der Kamp, L., (1998) Longitudinal Data Analysis: Designs, models and methods. London, Sage.

Rabe-Hesketh, S. and Everitt, B. (2000) A Handbook of Statistical Analyses using STATA. London, Chapman & Hall.

For questions please refer to: Zentralarchiv für Empirische Sozialforschung, Universität zu Köln Bachemer Str. 40, 50931 Köln

Spring Seminar secretariat: Friederika Priemer, phone: +49-221-4769433, e-mail: [email protected] Scientific coordinator: Maria Rohlinger, phone: +49-221-4769445, e-mail: [email protected], Facsimile: +49-221-4769444

Page 215: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

216 ZA-Information 53

33rd ZA Spring Seminar: “Complex Modelling” 1 - 19 March 2004 in Cologne

Timetable of the 1st week: “Multilevel Analysis” Prof. Dr. Tom A. B. Snijders, University of Groningen, The Netherlands

Monday 1-03-04

Tuesday 2-03-04

Wednesday 3-03-04

Thursday 4-04-04

Friday 5-03-04

9.00

– 1

2.30

Opening address

• Purposes and applications of multilevel modelling.

• The random intercept model.

• The random slope model.

• Deviance tests.

• Posterior means and slopes.

• Models with more than 3 levels.

• Cross-Classi- fied random effects.

• Applications to longitudinal data.

• Model checks.

• Binary and count data.

• MCMC esti- mation.

• MCMC estimation by MLwiN.

Break

15.0

0 –

18.0

0

PC Pool

• Introduction into MLwiN.

• Specifying and estimating two- level random intercept mod- els.

PC Pool

• Specifying and estimating two- level random slope models.

• Testing with MLwiN.

PC Pool

• Calculating posterior means and slopes in MLwiN.

PC Pool

• Exercises with an extensive ex-ample.

1

8.00

Informal Get-Together with “Kölsch” and snacks

19.0

0

Dinner at a restaurant

Page 216: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 217

33rd ZA Spring Seminar: “Complex Modelling” 1 - 19 March 2004 in Cologne

Timetable of the 2nd week: “Mixture Modelling” Dr. Petra Stein (and Kai Kelleter, Dipl.-Soz., PC sessions), University of Duisburg-Essen, Germany

Monday 8-03-04

Tuesday 9-03-04

Wednesday 10-03-04

Thursday 11-03-04

Friday 12-03-04

9.00

– 1

2.30

• Basic Con- cepts:

Mean and covariance structure mod- els

• Observed het- erogeneity: A LISREL-type model with the multiple group option

• The problem of unobserved het- erogeneity

• Mixture models - Mixtures of conditional normal densi- ties

- Regression models for conditional finite mixtures

• Covariance structure models for uncondi- tional finite mixtures:

- Confirmatory factor analysis

- LISREL- formulation for mixtures of multivariate normal distribu- tion

• Mean and co- variance struc- ture models for conditional mixtures

• Three estima- tion strategies:

- Two stage estimation procedure

- Direct EM algorithm

- Gradient EM algorithm

• Mixture mod- els of condi- tional mean and covari- ance structure models: simulation studies

• Mixture mod-els in empir-ical research:

- life-style

- relationships between use of media and political par- ticipation

- satisfaction with differ- ent areas of life and the influence of satisfaction with life style in general

• Testing the number of components

• Fit indices and model modifi- cation

Break

15.0

0 –

18.0

0 PC Pool

Introduction to MECOSA 3

PC Pool

Excercises on special models with MECOSA 3

PC Pool

Exercises on full model with ME-COSA 3

PC Pool

Exercises on full model with MECOSA 3

1

8.00

Informal Get-Together with “Kölsch” and snacks

19.0

0 Dinner at a restaurant

Page 217: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

218 ZA-Information 53

33rd ZA Spring Seminar: “Complex Modelling” 1 - 19 March 2004 in Cologne

Timetable of the 3rd week: “Generalized Linear Latent And Mixed Models (GLLAMM)” Prof. Dr. Andrew Pickles, University of Manchester, United Kingdom

Monday 15-03-04

Tuesday 16-03-04

Wednesday 17-03-04

Thursday 18-03-04

Friday 19-03-04

9.00

– 1

2.30

• Generalized Linear Models

• Generalized Linear Mixed Models with continuous and discrete random effects

• Measurement Models

• Confirmatory Factor Analysis and Item Re- sponse Theory

• Latent Class Analysis

• Structural Equation Mod- elling with continuous latent variables

• MIMIC

• Covariate measurement error

• Non-parametric maximum like- lihood

• Structural Equation Mod- elling with discrete latent variables

• Growth trajec- tory classes

• Latent transi- tion/hidden Markov models

• CACE: Com- plier Average Causal Effect

• ‘Serious Mod- elling’

• Multilevel SEM

• Models for individual and tabulated aggre- gate data

• Multilevel se- lection models

• Multinomial and rank re- sponses

• Probability weights and clustering

Break

15.0

0 –

18.0

0

PC Pool

Introduction to STATA

Random inter-cepts and random coefficients

PC Pool

Item response

Latent growth curve

PC Pool

Mimic

Covariate meas-urement error

PC Pool

Growth classes

Latent transitions

1

8.00

Informal Get-Together with “Kölsch” and snacks

19.0

0 Dinner at a restaurant

Page 218: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 219

Weiterbildung in statistischer Datenanalyse beim

ICPSR Summer Program 2004, June 28 – August 20 Im Rahmen der deutschen Mitgliedschaft im Inter-university Consortium for Political and Social Research (ICPSR) koordiniert das Zentralarchiv die Anmeldung für das jährlich stattfindende Summer Program in Ann Arbor, Michigan, USA. Das acht-wöchige Ausbildungsprogramm (kann u.U. auch in zwei vierwöchige 'terms' auf-geteilt werden) besteht aus einer Reihe von Kursen, die nach den Vorkenntnissen in Mathematik, Statistik und Methoden der empirischen Sozialforschung in unter-schiedliche Schwierigkeitsstufen (tracks) eingeteilt sind. Das Lehrprogramm sieht Vorlesungen und Workshops vor. In diesen Workshops wird der theoretisch/ statisti-sche Lehrstoff direkt – im Sinne des learning by doing – mit der Datenauswertung verbunden. Übungsdaten, die gängigen Datenanalysepakete (SPSS, SAS, STATA etc.) sowie spezialisierte Einzelprogramme stehen zur Verfügung. Folgende Work-shops, darunter auch sehr spezielle Themen, werden angeboten (Auswahl): 1 First Term Mathematical Models: Game Theory; Quantitative Historical Analysis; Introduction to Statistics and Data Analysis I; Introduction to Regression Analysis; Regression Analy-sis; Advanced Multivariate Statistical Methods; Maximum Likelihood Estimation for Generalized Linear Models; Quantitative Analysis of Crime and Criminal Justice; Event History Analysis; Bayesian Methods for the Social and Behavioural Sciences. 2 Second Term Time Series Analysis; Scaling and Dimensional Analysis; Mathematical Models: Rational Choice; Introduction to Statistics and Data Analysis II; Categorical Data Analysis; "LISREL" Models: General Structural Equations; Complex System Mod-els in the Social Sciences; Simultaneous Equation Models; Regression Analysis.

Das Programm ist umfangreicher als hier dargestellt. Das ICPSR veröffentlicht das gesamte Ausbildungsangebot auf seinen Internetseiten. Wenngleich sich unsere Darlegung auf das diesjährige Summer Program bezieht, kann im Allgemeinen da-von ausgegangen werden, dass sich an der Grundstruktur des Angebotes im kom-menden Jahr wenig ändert. Die Programmübersicht für das Jahr 2004 wird in der Regel im März verfügbar gemacht. Die Anmeldung erfolgt bis Ende April. Über Möglichkeiten der Finanzierung eines Aufenthaltes in Ann Arbor sollten sich Inte-ressenten bereits zum Ende dieses Jahres orientieren. Ansprechpartnerin im Zentralarchiv ist, auch für Hinweise auf Förderhilfen: Maria Rohlinger Tel.: 0221 / 4 76 94 - 45, Sekr. -33, e-mail: [email protected]; Summer Program im World Wide Web: http://www.icpsr.umich.edu

Page 219: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

220 ZA-Information 53

International Seminar 2003: Empirical Analysis of

Labor Markets:1

Rückblick und Ergebnisse der Seminar-Evaluation

von Nicole Thaller

1 Ein neues Seminar

Neben den regelmäßig stattfindenden Frühjahrs- und Herbstseminaren wurde vom ZA in diesem Jahr ein neues Seminar angeboten. Vom 1.-12. September 2003 fand in Köln ein vom Zentralarchiv für Empirische Sozialforschung (ZA) und dem For-schungsinstitut zur Zukunft der Arbeit (IZA, Bonn) offeriertes Methoden- und The-orie-Seminar statt. Dieses international orientierte Seminar verband fortgeschrittene Methodenausbildung mit einem Theoriethema, mit dem sich sowohl Sozialwissen-schaftler als auch Wirtschaftswissenschaftler identifizieren können, mit dem Ziel, die interdisziplinäre Zusammenarbeit zu fördern. Inhaltlich wurde diesmal der Be-reich Arbeitsmarktforschung behandelt für die Zielgruppe Graduierte, Doktorandin-nen und Doktoranden mit einem speziellen Fokus auf Mikrodaten.

Jeder der insgesamt sechs Kurse war in einen theoretischen Teil am Vormittag und einen praktischen Teil (PC Labor) am Nachmittag aufgeteilt. Pro Woche wurden jeweils drei parallel stattfindende 5-Tages-Kurse zu folgenden Themen angeboten: „Labor Supply“ (Kurs I, Dozenten: Dr. Holger Bonin und Dr. Hilmar Schneider), „The Economics of Schooling (Theory)” (Kurs II, Dozenten: Dr. Thomas Bauer und Dr. Michael Fertig) und „Econometric Evaluation of Labor Market Pro-grammes“ (Kurs III, Dozenten: Prof. Dr. Michael Lechner und Prof. Dr. Jeffrey A. Smith) in der ersten Seminarwoche und in der zweiten Woche „Simulation of Labor Supply Reponses to Policy Reform“ (Kurs IV, Dozenten: Dr. Holger Bonin und Dr. Hilmar Schneider), „The Economics of Schooling (Empirical Analysis)” (Kurs V, Dozenten: Dr. Thomas Bauer und Dr. Michael Fertig) und „Empirical Analysis of Labor Market Interventions” (Kurs VI, Dozent: Dr. Lutz Bellmann). Die Kurse der zweiten Woche bauten auf denen der ersten Woche auf. Daher waren die Teilneh-

1 Vgl. Vorankündigung ZA-Information 52, Mai 2003: 199-205.

Page 220: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 221

menden darauf hingewiesen worden, die Kurse der zweiten Woche nicht ohne vor-herigen Besuch der Kurse der ersten Woche zu belegen.

2 Evaluation

Insgesamt nahmen 42 Personen am International Seminar 2003 teil. Ökonomie, be-sonders VWL, und Soziologie bildeten den Schwerpunkt des fachlichen Hinter-grunds, aber auch die Disziplinen Politologie, Pädagogik, Psychologie und Geogra-fie waren vertreten.

Jeweils am Tag vor den beiden Seminarwochen wurde den Teilnehmerinnen und Teilnehmern die Möglichkeit einer vierstündigen STATA- bzw. GAUSS-Einfüh-rung offeriert, falls mit diesen Statistikprogrammen bisher noch nicht gearbeitet worden war.

Die Verbindung von Theorie und praktischer Methodenanwendung fand in der Se-minarplanung ihren Niederschlag: So wurden in den Vorlesungen am Vormittag die theoretischen Modelle des aktuellen Stands der Forschung besprochen, und in den Übungen am Nachmittag konnte mit verschiedenen Datensätzen das theoretisch Erlernte praktisch am PC umgesetzt werden. Einige der teilnehmenden Personen nutzten die Veranstaltung auch gezielt, um spezifische Datensätze kennen zu lernen wie das German Socio-Economic Panel oder das IAB-Betriebspanel.

3 Fragebogenauswertung

Gegen Ende des Seminars wurden die Teilnehmerinnen und Teilnehmer gebeten, einen ausführlichen halbstandardisierten Fragebogen2 auszufüllen, um dem ZA die Möglichkeit zu geben, ein genaueres Bild davon zu ermitteln, wie das Seminar bei den Teilnehmenden angekommen ist, ob ihre Erwartungen erfüllt wurden, was den Teilnehmerinnen und Teilnehmern besonders gut gefiel und in welchen Teilen sie Verbesserungsvorschläge für die Zukunft haben. Insgesamt 293 von 42 Personen, also 69 Prozent, haben den Fragebogen ausgefüllt. Davon besuchten 13 Personen

2 Der Fragebogen enthielt die Themenkomplexe Computer Service, Bibliothek, das Seminar Pro-

gramm im Generellen, Fragen zum Statistikniveau etc. Zusätzlich gab es noch die Möglichkeit, allgemeine und spezifische Kommentare zu den einzelnen Punkten sowie Themenwünsche zu äußern.

3 Die geringe Stichprobengröße (n = 29) lässt nur eingeschränkte statistische Auswertungen zu. So werden hier vor allem Häufigkeiten ausgewiesen.

Page 221: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

222 ZA-Information 53

das komplette zweiwöchige Seminar, während die übrigen 16 an einer Woche teil-nahmen.

Auf die Frage, ob das Seminar den Erwartungen entsprochen habe, antworteten drei Viertel der Teilnehmerinnen und Teilnehmer, dass die Erwartungen weitgehend oder komplett erfüllt wurden. Niemand äußerte, dass das Seminar überhaupt nicht den eigenen Erwartungen entsprochen habe.

Der Fragenkomplex „Computer Service“ setzt sich aus sieben Einzelfragen zusam-men und wurde insgesamt positiv bewertet. Bei den Einzelfragen wurden die tech-nische Kompetenz und die adäquaten Computer-Ressourcen für solch ein Seminar-Programm besonders hervorgehoben. Spezielle Einführungsveranstaltungen in die Software-Programme STATA und GAUSS wurden als nützliche Propädeutik für das Seminar Programm bezeichnet. Die Intention, allen Teilnehmenden ein ver-gleichbares Niveau zu ermöglichen, erscheint vor allem im Hinblick auf die bei sol-chen Seminaren zu erwartende Heterogenität des Kenntnisstandes von Analyse-Software sinnvoll. Jedoch ergab die Evaluation, dass vom Veranstalter zu wenig Zeit für die Software-Einführung kalkuliert worden war. Eine ausführlichere Soft-ware-Einführung könnte hier also möglicherweise bereits zu einer angemesseneren Kursvorbereitung führen. Dieser Seminarbestandteil wird daher in zukünftigen Konzepten zu berücksichtigen sein.

Eine positive Bewertung fanden die Mitarbeiterinnen und Mitarbeiter des ZA, die Unterkunftsmöglichkeiten, die sozialen Events, die Programm-Umgebung und die Erweiterung der eigenen Kompetenzen. Die eigens für die Kurse erstellten Skripte sowie die zur Verfügung gestellte Literaturliste wurden für so umfassend befunden, dass die Teilnehmenden auf eine zusätzliche Bibliotheksnutzung verzichten konnten.

Die Menge des behandelten Stoffes in den Vorlesungen wurde von etwa 3/4 als ge-nau richtig bezeichnet. Bei den praktischen Übungen sind die Meinungen heteroge-ner: Hier war für je etwa ein Drittel der behandelte Stoff zu viel beziehungsweise genau richtig gewesen und für ein knappes Drittel sogar zu wenig.

Die Fragebogen-Antworten der Teilnehmerinnen und Teilnehmer zeigen, dass sich gut die Hälfte mehr Zeit zum Nachlesen der ausgegebenen Papiere und zur indivi-duellen Nacharbeit während des Seminars wünscht. Ein derart kompakt mit Veran-staltungsterminen versehenes Seminar hatte den Teilnehmenden wenig Zeit für das Eigenstudium geboten.

Für die Veranstalter des Seminars war es besonders wichtig zu erfahren, ob das Zu-sammenspiel von Theorie und Praxis in den Augen der Teilnehmenden gelungen

Page 222: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

ZA-Information 53 223

war. Die Auswertung ergibt folgendes Bild: 83 Prozent der Befragten hielten die Umsetzung der Themen aus den Vorlesungen in die praktische Arbeit im PC-Labor für angemessen und fast drei Viertel stuften das Präsentationsniveau der statisti-schen Verfahren eben so ein.

Als Erfolg werten die Veranstalter, dass die befragten Personen zu 79 Prozent der Meinung sind, dass das Seminar für ihre weitere Arbeit nützlich sein wird. Die üb-rigen haben angegeben, dass das Seminar zumindest in Teilen für die eigene Arbeit hilfreich ist. Eine Auswertung der Kommentare bestätigt das Antwortverhalten bei den geschlossenen Fragen und geht teilweise in der Differenzierung über diese hin-aus. Ausführlich dargestellt werden im Folgenden die Verbesserungsvorschläge sowie das, was den Teilnehmerinnen und Teilnehmern besonders gut am Seminar gefallen hat.

4 Ausblick

Für verbesserungswürdig halten die Teilnehmenden vor allem folgende Punkte: Die Daten, die von den jeweiligen Dozenten der Kurse mitgebracht wurden, sollten be-reits analysefertig vorbereitet sein. Hinweise zur und Probleme der Datenaufberei-tung sollten im Kurs nur kurz vorgestellt werden. Zudem sollten Musterlösungen für eventuelle Übungsaufgaben bereitgestellt werden.

Die Teilnehmenden hatten zum Teil recht unterschiedliche Einstiegsniveaus, was zu heterogenen Gruppen führte. Künftig wäre es günstiger, den jeweiligen Hintergrund der teilnehmenden Personen im Vorfeld noch eingehender zu erfragen, um gezielter eine Einzelbetreuung anbieten zu können.

In Zukunft würden sich vor allem die Teilnehmerinnen und Teilnehmer der nicht ökonomischen Disziplinen weniger Fokussierung auf ausschließlich wirtschaftswis-senschaftliche Fragen und eine engere Verzahnung etwa mit der Soziologie oder der Politikwissenschaft wünschen. Hier wäre für zukünftige Konzepte anzusetzen, um den Dialog der wissenschaftlichen Disziplinen untereinander zu fördern.

Insgesamt werden mehr Beratungs- und Diskussionsmöglichkeiten gewünscht. Ver-einzelt wurde die Meinung geäußert, dass die Menge des zu behandelnden Stoffs und der Übungen reduziert werden sollte, um dann genauer auf spezielle Probleme, Fragen etc. eingehen zu können. Auch könnte eine individuelle Beratung der Teil-nehmerinnen und Teilnehmer im Vorfeld dahingehend sinnvoll sein, welche Vor-kenntnisse für eine erfolgreiche Teilnahme erforderlich sind und welche Erwartun-gen an das Seminar gestellt werden können.

Page 223: ZA-Information 53 November 2003 - gesis.org · ZA-Information 53 November 2003 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Das Zentralarchiv ist

224 ZA-Information 53

5 Zusammenfassung und Fazit

Zu den besonders positiv hervorzuhebenden Aspekten des Seminars äußerten sich die Teilnehmerinnen und Teilnehmer zusammenfassend: Man hat mehr Einblicke dahingehend gewonnen, wie in den empirischen Wissenschaften gearbeitet wird. Das Seminar hat nicht nur die methodischen, sondern auch die theoretischen Kennt-nisse im Bereich Arbeitsangebot und Arbeitsmärkte verbessert.

Die Teilnehmenden hatten die Chance, Personen kennen zu lernen, die an ähnlichen Forschungsthemen arbeiten. Dazu gehörte auch der Austausch von Erfahrungen und vergleichbaren Problemen. Allgemein wurden der Aufbau von Netzwerken sowie die angenehme und konstruktive Atmosphäre als besonders erwähnenswert hervor-gehoben. Der Netzwerk-Gedanke des Seminars scheint aufgegangen zu sein, nicht nur unter den Vertretern eines Fachbereichs, sondern auch interdisziplinär sowie zwischen primär wissenschaftlich Arbeitenden und den Anwendern. Das Seminar diente so dem Aufbau eines Netzwerkes für den Austausch der Teilnehmerinnen und Teilnehmer sowie der Dozierenden über die Dauer des Seminars hinweg.

Vereinzelt wurde Erstaunen darüber geäußert, dass das ZA ein sehr stark ökono-misch ausgerichtetes Seminar anbietet, doch fanden die Teilnehmenden sowohl das Konzept – gerade die Kombination von Theorie und praktischem Training – als auch die inhaltliche Ausrichtung als gelungen. Zu dieser Einschätzung haben auch die Dozierenden beigetragen, die als „hoch qualifiziert“ beschrieben wurden.

Die Organisation des Seminars auf der Basis eines Tutoren-Systems fand positive Bewertung. Jeweils ein Tutor betreute einen Kurs und stand als Ansprechpartner für Fragen aller Art zur Verfügung.

Generell erhielt das Seminar-Programm eine positive Gesamtnote. Die Bereitstel-lung von Artikeln im Internet wurde als besonders hilfreich angesehen. Die Teil-nehmenden sind der Meinung, dass die Kombination von Theorie und praktischen Übungen, die „gut strukturierten“ Vorlesungen am Vormittag und die enge Ab-stimmung mit den praktischen Übungen am Nachmittag zu den besten Seminaras-pekten gehörten. In diesem Zusammenhang sind auch das Erlernen neuer methodi-scher Grundlagen und der Stand der aktuellen Forschung, über den referiert wurde, zu nennen.

Insgesamt hat das International Seminar 2003 als Veranstaltung mit seiner Zielset-zung der interdisziplinären Methoden- und Theorieausbildung von Wirtschafts- und Sozialwissenschaftlerinnen und -wissenschaftlern gezeigt, dass Bedarf für diese Art von Seminaren vorhanden ist.