Institut für Statistik - Arbeitsgruppe...
-
Upload
trinhtuong -
Category
Documents
-
view
214 -
download
0
Transcript of Institut für Statistik - Arbeitsgruppe...
Ludwig-Maximilians-UniversitätInstitut für Statistik
Non-Response-Analyse(Vorbereitungsmaterial)
Vortrag am 22.Dezember 2010
von Benjamin Knöferl
Betreuerin: Andrea Wiencierz
im Rahmen des Seminars
„Statistische Herausforderungen sozialwissenschaftlicher Studien“
1
Gliederung
1. Einleitung
2. Einführung in die Problematik
2.1 Definitionen
2.2 Der Non-response Bias
3. Non-response adjustment
3.1 Definition
3.2 Korrelation der Zusatzvariablen mit Survey-Variablen & response-Indikator
3.3 Richtungswechsel und Effekt auf die Varianz
4. Berechnung der Response-Anteile
5. Reduzierung des Non-response Bias
6. Literaturverzeichnis
2
1. EinleitungIn der Non-Response-Analyse geht es um die Untersuchungen derjenigen Merkmale,
welche Personen inne haben, die an einer Survey nicht teilnehmen, sowie der
Auswirkung der Non-response. Es gibt verschiedene Formen dieser Umfrage,
angefangen mit dem fac-to-face Interview bis hin zu Mail Surveys.
Ein kurzes Beispiel soll die Problematik der Non-response einläuten:
Man nehme an, dass in einem Büro für einen Tag Fragebögen bereit liegen, auf denen die
Büromitarbeiter ihre Arbeitsbelastung dokumentieren können. Je nach Arbeiter ist diese
(etwas) verschieden. Gemessen werden soll die durchschnittliche Arbeitsleistung. Des
weiteren gibt es ein Gruppe A von Mitarbeitern die aufgrund ihrer hohen
Arbeitsbelastung keine Gelegenheit besitzen den Fragebogen auszufüllen, was im
Rückschluss bedeutet, dass der hohe Messwert der Personen aus A nicht in das
Endergebnis einfließt. Er wird also sozusagen verschwiegen. Ein Gruppe B von
Büromitarbeitern mit geringer Arbeitsbelastung hat hingegen Zeit den Fragebogen
auszufüllen. Das heißt ihr geringer Messwert fließt im Gegensatz zu dem hohen der
Gruppe A in das Ergebnis mit ein.
Das Endergebnis der durchschnittlichen Arbeitsbelastung wird also dadurch das Gruppe
A nicht an dieser Umfrage teilnimmt verzerrt, da die Personen daraus wahrscheinlich
eine andere Antwort als die der Gruppe B gegeben hätten. Diese Verzerrung nennt man
den Non-response Bias. Kennt man die Merkmale der Nonrespondenten, so kann man
mögliche Verzerrungen korrigieren.
Der Non-response Bias hängt wie man an diesem Beispiel sieht zum einen von den
Unterschieden bezüglich der untersuchten Merkmale der Antwortgeber und der
„Antwortverschweiger“ ab, sowie sinnvollerweise zum anderen vom Anteil der
Letztgenannten.
3
2. Einführung in die Problematik
2.1 Definitionen Non-response erscheint dann wenn keine bzw. keine vollständige Datenerhebung bei den
ausgewählten Individuen gelingt.
Es gibt zwei verschiedene Typen der Non-response:
➢ unit Non-response:
◦ Alle Angaben der Zielperson fehlen
(Beispielsweise wird ein Interview verweigert oder ein Fragebogen nicht
ausgefüllt)
➢ item Non-response:
◦ Einzelne Angaben der Zielperson fehlen
(Beispielsweise werden bei einem Fragebogen nicht alle Fragen beantwortet oder bei
einzelnen Fragen in einem Interview wird die Antwort verweigert)
Da es keine klaren Richtlinien gibt, wann genau eine Person Respondent oder
Nonrespondent ist, ist es empfehlenswert Kriterien zu entwickeln die erfüllt sein müssen,
damit jemand ein Antwortgeber ist. Beispiele für diese Kriterien sind die Beantwortung
der Schlüsselfragen im jeweiligen Survey, sowie der Anteil der beantworten Fragen.
Oftmals ist es die Aufgabe der Forscher der Survey zu entscheiden, ab wann eine Person
nun Antwortgeber oder Antwortverschweiger ist.
Der Non-response Bias (Schweigeverzerrung) bezeichnet eine Verzerrung des
Ergebnisses, die dadurch entsteht, dass Respondenten andere Antworten geben als
Nonrespondenten. Seine Ursache ist somit ein systematischer Antwortausfall.
4
Y = tr Yr + tnr Ynr
Y : Mittelwert der Gesamtpopulation
Ynr : Mittelwert der Nonrespondenten
tnr : Erwarteter Anteil der Nonrespondenten in der Gesamtpopulation
Yr : Mittelwert der Respondenten
tr : Erwarteter Anteil der Respondenten in der Gesamtpopulation
Des weiteren gilt:
1 – tr = tnr
tnr =MN
M : Anzahl der Nonrespondenten
N: Gesamtanzahl der Population
Die graue Box auf der symbolisiert den Anteil an Personen, die unter der aktuellen
Methode nicht antworten. Die Respondenten der Stichprobe sind aus dem weißen
Bereich.
Zieht man eine Stichprobe aus einer Population, so ignoriert der Ziehungsprozess die
Unterscheidung zwischen Antwortgebern und Personen von denen man keine Antworten
5
bekommt, solange man diese beiden Gruppen nicht unterscheidet. Das kann man
allerdings erst, nachdem man die einzelnen Personen versucht hat zu kontaktieren und
gegebenenfalls zur Teilnahme an der Survey zu überreden.
→ Letzten Endes hat man also nur Daten von den Respondenten
Die gedankliche Teilung in diese zwei Gruppen ist ein einfaches deterministisches
Modell. In der Realität ist es allerdings deutlich komplizierter, da etwa verschiedene
Befragungsverfahren zu unterschiedlichen Aufteilungen der Population in Respondenten
und Nonrespondenten führen.
Dadurch, dass Response-Anteile derselben Population bei verschiedenen Studien stark
variieren kommt man zur Ansicht, dass jede Person der Stichprobe ein potentieller
Nonrespondent oder Respondent, abhängig von der jeweiligen Situation, ist.
Das bedeutet, jeder hat eine nicht überwachbare Wahrscheinlichkeit ein Respondent oder
eben Nonrespondent zu sein. Diese soll im folgenden als ρi dargestellt sein.
Unter diesen Gesichtspunkt gibt es einen weiteren Ausdruck, der eine Approximation des
bias vom Mittelwert der Respondenten ist:
Bias ( Yr) = ( σyρ / ρ )
wobei σyρ : Kovarianz zwischen dem Untersuchungsmerkmal y und der
Antwort-“Neigung“ ρ
und ρ : Mittelwert der „Neigung“ in der Zielpopulation über
Stichprobenrealisationen
→ Der Non-response Bias erscheint als Funktion, wie stark die Korrellation zwischen der
„Neigung“ und den untersuchten Attributen ist
Es gibt aber noch andere Ausdrücke für den Bias. Ein Beispiel dafür ist die Differenz der
mittleren Anzahl an Arztbesuchen bei Frauen und Männern. Das heißt es gibt zwei
Untergruppen in der Stichprobe. Der oben genannte Ausdruck wird hier erweitert zu:
Bias (Yr1 – Yr2) ≈ ( σy1ρ1 / ρ1 ) - ( σy2ρ2 / ρ2 )
wobei die Indexe 1 und 2 für die zwei Unterklassen (Frauen und Männer) stehen.
6
2.2 Der Non-response Bias
BNR = (1 – tr) (Yr – Ynr)
RBNR = (1 – tr) (Yr – Ynr) / Y
(Yr – Ynr) : Differenz der Mittelwerte bezüglich des untersuchten Merkmals
Beispiel 1:
Man nehme an, dass bei einer Telefonumfrage der Response-Anteil bei 90% liegt.
→ tr = 0,9 → tnr = 1 - tr = 0,1
Des weiteren weiß man dass das durchschnittliche Einkommen der Respondenten bei
107.000€ und das der Nonrespondenten bei 89.000€ liegt.
Also: Yr = 107.000€ , Ynr = 89.000€
→ (Yr – Ynr) = 107.000€ – 89.000€ = 18.000€
Y = 0,9 x 107.000€ + 0,1 x 89.000€ = 105.200€
und RBNR = 0,1 x 18.000 / 105.200 = 0,017
Das heißt, der relative bias liegt bei 1,7% wenn an dieser Survey 10% der Befragten nicht
teilnehmen und der Unterschied (Yr – Ynr) 18.000€ beträgt.
Beispiel 2:
Gegeben seien:
Yr = 100.000€ , Ynr = 65.000€
sowie tr = 0,7 → tnr = 1 - tr = 0,3
→ (Yr – Ynr) = 100.000€ – 65.000€ = 35.000€
Y = 0,7 x 100.000€ + 0,3 x 65.000€ = 89.500€
und RBNR = 0,3 x 35.000 / 89.500 = 0,117
7
Durch die wesentlich größere Differenz (Yr – Ynr) und den höheren Anteil an
Nonrespondenten ist der relative Bias hier mit 11,7% wesentlich höher als in Beispiel 1.
Das bedeutet die Verzerrung des Ergebnisses ist sehr viel größer!
Es kann auch vorkommen, dass man den Bias für höhere bzw. geringere Antworter-
Anteile oder auch für unterschiedliche Differenzen (Yr – Ynr) auswerten möchte. Für
dieses Problem betrachten wir folgende Grafik:
Diese Grafik veranschaulicht die Beziehung zwischen dem relativen BNR (y-Achse in %)
und der relativen Differenz zwischen den Respondenten und den Nonrespondenten auf
der x-Achse ( (Yr – Ynr) / Y ).
Beispiel:
Man betrachte den Graphen für tr = 0,7 (70% der Befragten nehmen an der Survey teil).
Vermutet man die relative Differenz zwischen Antwortgebern und Nonrespondenten liege
zwischen 20% und 30%, so erhält man für die untere Grenze (20%) einen RBNR von ca.
6% und für die obere Grenze (30%) einen RBNR von ca. 9%. Unser Bereich für den RBNR
liegt also zwischen 6 und 9%.
→ RBNR ϵ [0.06 , 0.09]
8
Diese Grafik veranschaulicht, dass der Bias nicht nur eine Funktion der Response-Rate
ist.
Zwar liegt ein großes Augenmerk auf den Antworter-Anteilen in Surveys – manche
wurden aufgrund geringer Response-Anteile sogar eingestellt ohne den bias auszuwerten
– aber der bias hängt sehr wohl auch von der Differenz (Yr – Ynr) ab. Ist diese gleich
Null, so gibt es logischerweise keine Verzerrung des Ergebnisses, also keinen Bias.
In der Realität ist es dementsprechend sogar möglich, dass der Bias trotz einer unerwartet
niedrigen Antworter-Rate akzeptabel ist.
Fazit: Der BNR ist eine Funktion des Non-response-Anteils, sowie der Differenz zwischen
Respondenten und Nonrespondenten bezüglich des untersuchten Merkmals.
9
3. Non-response adjustment3.1 Definition
In diesem Kapitel geht es um die mögliche Korrektur des Non-response Bias.
Das Ziel der Non-response adjustment ist es mit Hilfe von Zusatzvariablen den Bias zu
reduzieren, ohne dabei die Varianz zu erhöhen.
Mittlerweile werden bei vielen Studien Zusatzdaten, wie beispielsweise Beobachtungen
und Eindrücke des Interviewers gesammelt. Haben diese ergänzenden Variablen eine
hohe Korrelation mit dem interessierenden Merkmal und mit dem response-Indikator so
sind sie vielversprechende Kandidaten für die Non-response Korrektur.
Ein Hauptaspekt der Non-response adjustment ist das „weighting“.
Eine Simulation von Little & Vartivarian hat gezeigt, dass weighting sehr effektiv in der
Reduzierung des Bias ist ohne dabei die geschätzte Varianz zu erhöhen. Allerdings ist das
nur der Fall, wenn die für die Konstruktion der Gewichte verwendeten Variablen, stark
korreliert sind mit dem interessierenden Merkmal, sowie mit der Neigung, auf die Survey
zu antworten.
10
3.2 Korrelation der Zusatzvariablen mit Survey-Variablen & dem response-
Indikator
Um die angesprochenen Korrelationen zu veranschaulichen betrachten wir folgende
Grafik, für die fünf verschiedene Studien (UMTRI, MEPS, ESS, ANES und NSFG)
verwendet wurden:
x-Achse: Korrelation zwischen dem response-Indikator r und der Zusatzvariable z
y-Achse: Korrelation zwischen der jeweiligen Zusatzvariable z und einer ausgewählten
Anzahl an Survey-Variablen y
Man kann sehen, dass die meisten Zusatzvariablen nur einen schwachen Zusammenhang
mit dem response-Indikator r besitzen. Lediglich für die ANES-Studie ist die Schätzung
der Korrelation zwischen z und r (|ρ (z,r)|) größer als 0,1.
11
Die geschätzten Korrelationen auf der y-Achse sind allesamt kleiner als 0,5 was bedeutet,
dass zwischen den Zusatzvariablen und den interessierenden Merkmalen kein sehr großer
Zusammenhang besteht.
Des weiteren erkennt man das |ρ (z,y)| für fast jede gegebene Schätzung von |ρ (z,r)| stark
variiert. Das weißt auf die Schwierigkeit hin, eine einzige passende Variable zu finden,
die das Potential hat den Bias in Bezug auf sämtlichen Survey-Variablen, zu reduzieren.
3.3 Richtungswechsel und Effekt auf die Varianz
Bislang haben die Zusatzvariablen nur ein mäßige Potential im Hinblick auf ihre
Nützlichkeit für die Non-response Korrektur, gezeigt.
Jetzt stellt sich die Frage ob die Hinzunahme dieser zusätzlichen Variablen zu den
bestehenden weighting-Prozeduren zu einer Veränderung der geschätzten Mittelwerte
führt, wenn ja, ob diese Veränderungen zu einer Reduzierung des Bias gelangen, und was
die Konsequenzen für die geschätzten Varianzen sind.
Betrachten wir im folgenden die UMTRI-Studie näher.
UMTRI ist eine Studie an der junge Erwachsene welche einen gültigen Führerschein
besitzen teilnehmen. Das UMTR Institut konnte die Stichprobe dieser Survey mit Hilfe
der Verkehrssünder-Kartei von Michigan erweitern.
In der Befragung geht es um die verschiedenen Fahrgewohnheiten sowie die
Risikobereitschaft. Es sind Informationen über Alter und Geschlecht vorhanden, die für
die Non-response adjustment verwendet werden.
Es wurden fünf Zusatzvariablen aufgezeichnet:
– Punkte in der Verkehrssünder-Kartei
– Ernsthafte Verkehrsdelikte
– Normale Verkehrsdelikte
– Unfälle
– Ernsthafte Unfälle
wobei alle fünf Zusatzvariablen für den Zeitraum der vergangenen 12 Monate betrachtet
werden.
12
Die interessierenden Merkmale dieser Studie sind:
– Anzahl an Punkten in der Verkehrssünder-Kartei
– Wurde der Führerschein bereits entzogen (binär)
– Bei Kurzstrecken nie einen Gurt tragen (binär)
– Bei Langstrecken nie einen Gurt tragen (binär)
Untersuchungen dieser Studie vermuten, dass es Personen gibt die Bedenken habe
eventuell gesellschaftlich unerwünschte Informationen preiszugeben (beispielsweise nie
einen Gurt zu tragen). Daher erwartet man nach der Einberechnung der Zusatzvariablen
eine Erhöhung in den Mittelwerts-Schätzungen.
Die folgende Tabelle zeigt den nicht-korrigierten Mittelwert, die korrigierten Mittelwerte
sowie die Standardabweichungen dieser beiden, für die vier Survey-Variablen:
Hier sieht man beispielsweise, dass die „nicht-korrigierte“ Schätzung des Anteil an
jungen Erwachsenen, denen der Führerschein schon einmal entzogen wurde bei 18,80%
liegt. Unter Verwendung der ursprünglich eingeplanten Gewichtung (das heißt unter
Einbeziehung der Variablen Alter und Geschlecht) erhält man einen geschätzten Anteil
von 19,43%. Fügt man auch noch die fünf Zusatzvariablen hinzu, so gelangt man zu
einem Wert von 19,85%.
Das bedeutet, dass man eine Veränderung in die richtige Richtung erhält, woraus eine
Reduzierung des Bias folgt.
13
Betrachtet man die Standardabweichung, so erkennt man, dass sich diese bei der
Hinzunahme der Zusatzvariablen nur leicht erhöht.
Das Resultat daraus ist, dass das Verhältnis R geringfügig kleiner als 1 ist, wobei R die
geschätzte Varianz zu Beginn, dividiert durch die geschätzte Varianz nach Hinzunahme
aller Zusatzvariablen ist. Folglich bedeutet ein Wert der gegen 1 geht, dass sich die
Varianz gering bis gar nicht verändert hat.
Zusammenfassend kann man bei dieser Studie feststellen, dass die Verwendung der
Zusatzvariablen in der Gewichtung ihren Zweck, den Bias zu reduzieren erfüllt haben,
während sich die Varianz nur sehr leicht erhöht.
14
4. Berechnung der Response-AnteileDa die Neigung eines jeden Stichprobenelements nicht genau bestimmt werden kann,
d.h. ob die Person zu den Antwortgebern oder den Antwortverschweigern gehört, gibt es
keine allgemein gültige Definition von Response-Anteilen.
Zur Erinnerung: Der Response-Anteil ist eine Schätzung der Quantität tr (erwarteter
Response-Anteil). Wenn wir tr genau schätzen können, so haben wir die bestmögliche
Information um den Bias zu bestimmen.
Die Grafik auf der nächsten Seite wurde von Hidiroglou et al. (1993) angepasst um ein
Model zur Berechnung von Response-Anteilen zu erörtern. Zum Verständnis sind im
folgenden wichtige Definitionen aufgeführt:
- In scope:
Eine Person in scope ist ein Teilnehmer der Zielpopulation und sollte deshalb in der
Stichprobe sein
- Out of scope:
Nicht in der Zielpopulation
Beispiel: Bei einer Studie über Agrarwirtschaft sind die Haushalte ohne Landwirtschaft
out of scope, da sie nicht Teil der Grundgesamtheit sind.
- RDD (Random-Digit-Dialing)-Verfahren:
Bei einem eingetragenen privaten Telefonanschluss werden die letzten Ziffern durch
zufällig generierte Ziffern ersetzt. Dieses Verfahren wird angewandt, damit auch solche
Haushalte in die Stichprobe gelangen können, die nicht im Telefonbuch verzeichnet sind.
Ein Problem bei der Bestimmung der Response-Anteile ergibt sich oft dadurch, dass man
keine Informationen über das untersuchte Merkmal besitzt. Das ist gewöhnlich für das
RDD-Verfahren, da man hier oft keine Antwort und somit keine Information von den
ausgewählten Individuen bekommt. Man weiß beispielsweise nicht ob der
Telefonanschluss zu einer Hotline, einem normalen Haushalt oder einem Unternehmen
gehört, wenn niemand an das Telefon geht. Hat man keine Informationen, so kann man
auch nicht entscheiden ob jemand/etwas in oder out of scope ist.
15
Erklärung:
- Total units (1): Repräsentiert die komplette Stichprobe
- Resolved (2): Es wurde bereits bestimmt ob das Stichprobenelement in oder out
of scope ist
- Unresolved (3): Man kann nicht sagen ob die Einheit in oder out of scope ist (Siehe
Problematik bei RDD-Verfahren)
• Estimated Units in scope (3A)
• Estimated Units out of scope (3B)
Resolved units in scope(4):
- Respondents (6):
• Refusial Conversion (11): Personen die zunächst verweigert haben, dann aber
doch an der Studie teilgenommen haben
• Other Respondents (12): Haben nie verweigert sondern von Beginn an bei der
Studie teilgenommen
- Nonrespondents (7):
• Refusals (13): Personen die weiterhin ihre Teilnahme verweigern
• Noncontacts (14): Es konnte kein Kontakt aufgenommen werden
• Other Nonrespondents (15): Personen die aufgrung von Sprachbarrieren,
Krankheit, etc. nicht teilnehmen konnten bzw. nicht erreichbar waren
16
Resolved units out of scope(5):
- Nonexistent units (8): Einheiten sind zwar immer noch auf dem Frame,
existieren aber bereits nicht mehr
- Temporarily out of scope units (9): Personen die früher in scope waren, jetzt aber
out of scope sind (Bsp.: Ehemalige Landwirte die
mit der Agrarwirtschaft aufgehört haben)
- Permanently out of scope (10): Einheiten out of scope, die keine Perspektive haben,
jemals zur Zielpopulation zu gehören
Der Response-Anteil ist die Anzahl von Respondenten, dividiert durch die Anzahl der
Stichprobenelemente in scope. Dies ist auch der beste Schätzer für tr, bei Stichproben in
denen jedes Element mit gleicher Wahrscheinlichkeit ausgewählt wird. Falls dies nicht
der Fall ist verwendet man gewichtete Schätzer.
Da der Nenner einer beliebigen Messung eines Response-Anteils die Anzahl an
Elementen in scope ist, muss man zur Berechnung der Antworter-Rate den Anteil der
unresolved units schätzen, der wirklich in scope ist.
Falls keine Information vorhanden ist, gibt es eine sehr grobe Lösung dieses Problems:
Bezeichne pres. den Anteil von resolved units in scope und nunres. die Anzahl der
unresolved units.
→ Anteil an resolved units in scope ≈ (pres. x nunres.)
Dies ist aber eine sehr unelegante und äußerst grobe Lösung dieses Problems.
Man stelle sich beispielsweise eine Stichprobe von 3300 Personen vor von welchen 1800
zu den resolved units in scope gehören, sowie 4000 von 8000 unresolved Personen als in
scope geschätzt werden.
→ 4000 ≈ 8000 x (1800 / 3300) = 4360
Ein Hauptgrund warum Standards zur Berechnung des Response-Anteils nicht allgemein
angenommen werden ist die Schwierigkeit den Nenner der Antworter-Rate zu berechnen.
Grund dafür ist die Existenz der unresolved units in der Stichprobe. Daher addiert man
die resolved units in scope mit den geschätzten unresolved units in scope, um auf den
Response-Anteil zu kommen.
17
Für unsere Grafik bedeutet dass:
Response-Anteil = (6) / ( (4) + (3A))
In der Realität gibt es allerdings einige Fehler, die hierbei auftreten. Manchmal werden
die geschätzten units in scope vergessen, oder es wird angenommen, dass alle unresolved
units out of scope sind. Ein Beispiel für Letztgenanntes findet sich oftmals im RDD-
Verfahren wieder. Hier werden beispielsweise Personen angerufen, die im Urlaub sind
oder aus anderen Gründen unkontaktiert beigelegt werden. Diese Menschen müssen nicht
zwangsläufig out of scope sein, allerdings wird das immer wieder angenommen.
Besitzt man keine andere nützliche Information um die Anzahl der unresolved units in
scope zu schätzen, so gibt es eine einfache und weitgehend akzeptierte Annäherung
dafür:
(3A) = (5) / ((2) x (3))
und (3B) = (3) – (3A)
Im folgenden steht eine kurze Zusammenfassung oft ausgerechneter Anteile:
Response-Anteil = (6) / ((4) + (3A))
Kooperations-Anteil = (6) / ((6) + (13))
Verweigerer-Anteil = (13) / (4)
Non-response-Anteil = ((7) + (3A)) / ((4) + (3A))
Noncontact-Anteil = ((14) + (3A)) / ((4) + (3A))
Bisher wurden nur ungewichtete Antworter-Anteile besprochen. Wenn die Stichprobe
allerdings gewählt ist, unter Verwendung verschiedener Wahrscheinlichkeiten der
Auswahl, so sind gewichtete Response-Anteile geeignetere Schätzungen von tr und
dadurch eine bessere Messung des potentiellen Bias-Effekts.
18
Variiert die Auswahlwahrscheinlichkeit für Stichprobenelemente erheblich, so sind
gewichtete und ungewichtete Antworter-Anteile womöglich sehr unterschiedlich.
Beispiel:
Es wird eine Stichprobe gezogen, in der Personen die in den vergangenen Jahren
verhaftet wurden überrepräsentiert sind.
Die Teilgesamtheit sei etwa 3% der Grundgesamtheit. Aber in der Stichprobe sind es 50%
der Stichprobe. Man nehme an, dass der Response-Anteil dieser Gruppe bei 40% und der
für den Rest bei 80% liege.
Die ungewichtete Antworter-Rate ist der Mittelwert dieser beiden und beträgt damit 60%.
Der gewichtete Response-Anteil geht jedoch auf die Grundgesamtheit ein und berechnet
sich wie folgt:
0,03 x 40% + 0,97 x 80% = 78,8%
wobei 0,03 für die 3% der Grundgesamtheit steht (→ 1 – 0,03 = 0,97), 40% dem
Response-Anteil der Häftlinge entspricht und 80% der Antworter-Anteil der Nicht-
Häftlinge ist.
Das ergibt also einen Unterschied von 78,8% - 60% = 18,8%
Der gewichtete Response-Anteil ist in Stichproben mit nicht gleich-wahrscheinlichen
Elementen eine Schätzung von tr, hingegen der ungewichtete nicht.
19
5. Reduzierung des Non-response BiasDer Bias hängt sowohl vom Non-response-Anteil als auch von der Differenz (Yr – Ynr) ab. Da der Anteil der Antwortverschweiger leichter zu reduzieren ist, liegt unser
Hauptaugenmerk darauf.
Oftmals stellt sich die Frage, was denn ein akzeptabler Antworter-Anteil ist. Diese Frage
ist aber kaum zu beantworten, da der Bias schließlich auch von der Differenz der
Mittelwerte der Respondenten und Nonrespondenten, bezüglich des untersuchten
Merkmals abhängt.
→ Es ist nicht sinnvoll über akzeptable/inakzeptable Non-response-Anteile zu sprechen
solange man nichts über (Yr – Ynr) weiß.
➢ Ursachen und Effekt der Non-response:
Es gibt eine Vielzahl an Faktoren die den Non-response-Anteil beeinflussen.
Einige davon werden im folgenden aufgelistet:
In Haushaltsstudien oder Befragungen von Einzelpersonen:
• Fehlende Motivation
• Zeitmangel
• Angst registriert zu werden
• Nichtverfügbarkeit (wg. Krankheit, Urlaub, Arbeit, etc.)
• Sprachbarrieren
Bei Umfragen in Unternehmen:
• Vorgesehene Person zunächst antreffen und anschließend die Erlaubnis bekommen ihre
Daten zu erfassen
• Personalveränderungen
• Geringe Priorität auf Seiten des potentiellen Antwortgebers
• Mangelndes Wissen
20
Des weiteren gibt es innerhalb der Survey-Organisationen Faktoren die den Bias
beeinflussen:
• Auslastung des Interviewers
• Zu kurze Zeitperioden für die Datenerfassung
• Langweilige/Lästige/Komplizierte Fragebögen
Aus Erfahrung weiß man, dass eine Einteilung der Non-response in verschiedene
Kategorien sehr nützlich sein kann, da die Methoden zur Reduzierung von Typ zu Typ
variieren.
Beispielsweise werden Personen die schwer zu kontaktieren sind („Noncontact“) mit
effektiven Rückverfolgungsprozeduren angesprochen, wohingegen man Verweigerern
(„Refusal“) oft überzeugende Argumente entgegenbringt, oder auch die Befragung so
angenehm wie möglich macht, um sie zur Teilnahme zu überreden. Bei anderen Ursachen
der Non-response, wie Krankheit, Urlaub, Sprachbarrieren, etc. („Other“) befragt man oft
Personen, die im Namen des eigentlichen Stichprobenelements antworten.
Es gibt dementsprechend drei verschiedene Kategorien:
◦ Refusal
◦ Noncontact
◦ Other
Diese Kategorisierung macht es einfacher den jeweiligen Fällen geeignete Methoden zur
Reduzierung des Non-response-Anteils zuzuordnen.
21
Betrachten wir im folgenden die beiden Hauptkategorien (Refusal und Noncontact)
näher:
Noncontact:
Als Beispiel nehme man eine telefonische Umfrage. Dabei versucht der Interviewer die
Anzahl der Noncontacs zu reduzieren, indem er mehrmals an verschiedenen Tages-
Zeitpunkten sowie verschiedenen Wochentagen die Person anruft, um Kontakt
herzustellen. Bei einem Feld-Interview läuft diese Prozedur ähnlich ab, nur dass der
Interviewer direkt zur vorgegebenen Adresse fährt, um die Person zu erreichen.
Das heißt man kann den Beitrag der Nocontacts am Non-response-Anteil nur dadurch
verringern, dass man hartnäckig bleibt und die Personen mehrmals versucht zu erreichen,
bis man schließlich aufgeben muss.
Refusal:
Die Verweigerer stellen in Gegensatz zu den Noncontacts ein komplexeres Problem dar.
Es gibt viel Information darüber, warum manche Menschen an einer Studie nicht
teilnehmen wollen. Oft wird diese Information auf einem sogenannten regular Bias
gesammelt. Das bedeutet, dass der Interview diejenigen Personen die verweigert haben
nach dem Grund dafür befragt. Erstaunlicherweise nennen die meisten der Refusals einen
Grund dafür, warum sie verweigern.
Laut einer Umfrage des Research Triangle Instituts, sagten 42,7% der Verweigerer dass
sie nicht interessiert seien. Solche Surveys sind zwar interessant, aber nicht besonders
hilfreich, da man nicht viele Möglichkeiten hat die Personen zu überreden, wenn das
Thema tatsächlich einen Großteil der Bevölkerung nicht interessiert.
Groves (1992) nennt eine Anzahl an Faktoren, welche die möglichen Verweigerungen
beeinflussen:
• Stichprobendesign
• Art der Datenerhebung
• Entscheidung des potentiellen Antwortgebers
• Länge des Interviews
• Thema der Studie
• Design des Fragebogens
22
Groves sagt weiter, dass die Charakteristiken von Respondenten und Interviewern einen
Einfluss haben.
Dazu gehören bei den möglichen Antwortgebern:
• Alter
• Geschlecht
• Einkommen
• Gesundheit
• Wohnort (Stadt – Land)
• Kriminalitätsrate am Wohnort
• Bildung
Bei den Interviewern:
• Alter
• Geschlecht
• Rasse
• Vermeintliches (vom Respondenten wahrgenommenes) Einkommen
• Erfahrung
• Umgang mit abgeneigten Respondenten
• Selbstbewusstsein
• Kürzliche Erfahrung
• Motivation (möglicherweise gering bei schlechter Bezahlung)
Zudem gibt es noch gesellschaftliche Faktoren:
• Gesellschaftliche Verantwortung
• Rechtmäßigkeit der Studie (objektiv)
Im folgenden sind einige Theorien der Studien-Teilnahme aufgeführt, die das
Verweigerer-Problem verdeutlichen und mögliche Lösungen darstellen. Cialdini (1984)
beschrieb dazu 6 psychologische Faktoren, die großen Anteil am Refusal-Anteil besitzen.
23
6 Psychologische Faktoren:
1. Reciprocation:
Cialdini sagt, dass Menschen mehr dazu geneigt sind, an einer Umfrage teilzunehmen,
wenn sie die Beantwortung der Fragen als eine Art Rückzahlung für ein Geschenk/eine
Bezahlung ansehen, oder wenn die Personen denken, die Teilnahme an der Studie bringe
ihnen einen Nutzen. Dies ist die wissenschaftliche Grundlage, warum man Respondenten
teilweise „Fördermittel“ gibt.
Detaillierte Forschungen (Berk et al. 1987) haben gezeigt, dass vorausgezahlte
„Fördermittel“ wesentlich effektiver sind als versprochene. Letztgenannte bewirken oft
sogar das Gegenteil, das heißt, dass es noch mehr Verweigerer gibt, da der potentielle
Antworter die Bezahlung für unangemessen sieht.
Die reciprocation-Theorie sagt wie oben erwähnt auch, dass eine Person eher dazu gewillt
ist Teilzunehmen, wenn sie denkt, die Teilnahme begünstige sie.
2. Consistency:
Hier versucht der Interviewer Übereinstimmungen des Survey-Themas mit den
Einstellungen des Respondenten zu finden. Sagt ein möglicher Antwortgeber von Beginn
an, er habe große Sorgen um die Umwelt, so versucht sich der Interviewer einen Vorteil
aus dieser Zusatzinformation zu schaffen und beschreibt, wenn irgendwie möglich,
warum die Teilnahme an der Studie einen Vorteil für die Umwelt bringt
3. Social validation:
Social validation bedeutet, dass viele Menschen mehr Bereitschaft zeigen an einer Studie
teilzunehmen, wenn sie denken, dass auch sehr viele andere daran teilnehmen. Das
spiegelt sich bei Interviewern die von Tür zu Tür gehen wieder. Sie erklären dem
Antworter, dass einige Personen aus der Nachbarschaft an der Studie teilgenommen
haben, da sie überzeugt von der Wichtigkeit dieser seien. Obwohl der Angesprochene
eventuell noch nichts über die Survey weiß, weckt das sein Interesse daran.
24
4. Authority
Die Einwilligung zur Teilnahme an der Studie ist wahrscheinlicher, wenn die Anfrage von
einer rechtmäßigen Autorität kommt. Nach Biemer & Lymberg (2003) haben ältere
Untersuchungen gezeigt, dass staatlich unterstützte Studien einen geringeren Anteil an
Verweigerern besitzen als Surveys die von Privatorganisationen ausgeführt werden.
Allerdings ist das nicht in allen Ländern so, da nicht jede Regierung einen guten und
seriösen Ruf hat.
5. Scarcity
Häufig scheint es dass jemand eher bereit ist, an einer Umfrage teilzunehmen, wenn er es
als seltene Möglichkeit sieht. Daher sagen einige Interviewern den Respondenten, dass es
der letzte Tage dieser Befragung ist, oder dass nur jeder tausendste kontaktiert wird und
die Antworten jetzt benötigt werde, sonst komme eine Teilnahme nicht mehr in Frage.
6. Liking
Es wird meist eine höhere Bereitschaft zur Teilnahme erreicht, wenn der Interviewer
sympathisch auf den Antworter wirkt, gleiche Werte und Einstellungen hat, dieselbe
Sprache spricht (eventuell Dialekt), und denselben sozialen Hintergrund oder
persönlichen Style hat. Viele Interviewer haben daher gelernt, sich in Gegenden mit
geringen Einkommen lockerer anzuziehen und in Gebieten mit hohem Einkommen
dementsprechend besser zu kleiden.
➢ Diskretion und Datenschutz
Unter Diskretion versteht man das Ausmaß, in welchem bereits gesammelte
Informationen vor dem Zugriff Unbefugter geschützt sind.
Datenschutz bedeutet, dass die Individuen und Unternehmen das Recht besitzen, selbst zu
entscheiden, welche Informationen über sie gesammelt werden dürfen.
Durch die Verwendung von sensiblen Fragen in einer Befragung resultiert häufig eine
Item-Non-response. Hierbei kann es vorkommen, dass der Respondent diese Fragen nicht
beantworten will. Sollte man für die Studie jedoch eine Antwort benötigen, ist es oft
25
hilfreich, anstatt einer genauen Antwort auf ein Intervall auszuweichen. Dabei gilt die
einfache Regel: Je größer das Intervall, desto weniger Personen verweigern ihre Antwort.
Zudem kann sich eine gut gewählte Reihenfolge der Fragen, positiv auf die Item-
Response auswirken.
Wenn alle Fragen gut ausformuliert sind, ist es allgemein empfohlen sensible Fragen erst
am Ende der Befragung zu stellen um Unit-Non-response zu vermeiden, da eine zu
Beginn gestellte sensible Frage möglicherweise Personen dazu veranlasst, den Rest des
Fragebogens nicht mehr zu betrachten und somit nicht auszufüllen.
Ist die Beantwortung der sensiblen Frage sehr wichtig für die Studie, so sollte des
bestmögliche Datenschutz gewährleistet sein, damit den Respondenten versichert ist, dass
ihre Antworten vertraulich behandelt werden.
Es gibt eine Anzahl an Methoden, welche die Vertraulichkeit der Befragungsdaten
garantieren. Fienberg & Willenbourg (1998) haben einige dieser Methoden näher erläutert
wovon fünf Methoden im folgenden aufgeführt sind.
1. Anonymization:
Merkmale die eine Person identifizieren können werden vom Datensatz entfernt
(Sozialversicherungsnummer, Adresse,...)
2. Suppression:
Ein veränderbarer Wert wird für einige oder alle Respondenten gelöscht.
3. Internal Values:
Der wahre Wert wird durch ein Intervall in dem er liegt ersetzt
4. Adding noise:
Ein wahrer Wert X wird durch einen Wert X + a ersetzt, wobei a eine sehr kleine
Zufallszahl ist
5. Encryption:
Daten werden mit einem Verschlüsselungs-Algorithmus kodiert
26
➢ Wahl der Datenerfassungsmethode
Die Wahl der Methode zur Datenerfassung ist wichtig um den Non-response-Anteil zu
reduzieren. Eine allgemein akzeptierte Ordnung der Methoden nach ihren erwarteten
Response-Anteilen ist:
1. face-to-face-Befragung
2. Telefonische Umfragen
3. Mail-Surveys und andere selbst verwaltende Methoden
Wobei die face-to-face Befragung den größten Response-Anteil besitzt.
Viele Studien zeigen allerdings, dass die meisten Respondenten lieber eine Mail-Survey
ausfüllen als interviewt zu werden. Auf der anderen Seite ist es für einen Antwortgeber
allerdings schwerer die Anfrage eines Interviewers abzulehnen, als die Fragen in einer
Mail-Umfrage nicht auszufüllen.
Die Erhebungsmethode wird auch nicht allein vom Antworter-Anteil beeinflusst. Hinzu
kommen Kostenaspekte, Messaspekte, Pünktlichkeit, etc.
Häufig werden mehrere Methoden (mixed-mode) genutzt. Nach Verwendung einer
Hauptmethode die am geeignetsten für die Studie scheint wird eine andere Methode
angewandt. Dieser mixed-mode ist sehr effektiv, da er einen Vorteil aus der Tatsache, dass
die Vorlieben bezüglich der Befragungsmethode unter den potentiellen Antwortgebern
variieren, schafft. Zudem macht es den Antwortern möglicherweise bewusst, dass die
Survey wichtig ist.
Wenn der Kostenaspekt eine wichtige Rolle spielt, so wird bei einem mixed-mode
gewöhnlicherweise mit einer kostengünstigen Methode (z.B. Mail-Survey) begonnen und
anschließend mit einer teuren (z.B. Telefonische Befragung) fortgefahren. Es können aber
auch kostengünstige Methoden mit einem wichtigen Faktor, wie einem geringen
Messfehler übereinstimmen. Man weiß beispielsweise, dass Antworten auf sensible
Fragen möglicherweise in Mail-Surveys genauer beantwortet werden, als bei face-to-
face-Interviews.
27
➢ Belastung der Respondenten
Ein wichtiger Zusammenhang zur Non-response ist die Belastung die ein Antwortgeber
wahrnimmt, wenn er an einer Studie teilnimmt.
Diese Belastung besteht unter anderem aus:
• Länge des Interviews/Fragebogens
• Arbeitsbelastung (Zeit und Aufwand)
• Möglicher Druck der auf dem Respondenten lastet, wenn er Fragen gestellt
bekommt
• Anzahl an Anfragen zur Teilnahme an einer Studie, die der Antwortgeber
innerhalb eines bestimmten Zeitraums erhält
Daher sollte die benötigte Zeit zum Beantworten der Fragen so gering wie möglich sein.
Man sollte sich bei der Entwicklung des Fragebogens für jede Frage folgendes überlegen:
• Ist die Frage notwendig
• Für wen antwortet der Respondent (sich selbst, Unternehmen,..)
• Ist die Frage mit einem vertretbaren Aufwand zu beantworten
• Ist sie überhaupt beantwortbar (Hätte man selbst Probleme mit der Beantwortung)
• Leitet der Fragebogen eindeutig und verständlich von Frage zu Frage
Hat man alles gemacht um die Belastung für einen Antworter so gering wie möglich zu
halten so kann es je nach Erfolg noch notwendig sein sogenannte Fördermittel zu
verwenden um den Response-Anteil zu erhöhen. Oft werden dabei Lotterie-Tickets oder
Kalender verwendet um den Willen zur Teilnahme zu erhöhen. Dies führt wieder zur
reciprocation, die bereits angesprochen wurde.
28
➢ Rückverfolgungen
Sind Personen aus der Stichprobe abgeneigt zu antworten und verweigern zunächst, so
versucht man sie erneut zu kontaktieren und zur Teilnahme zu überreden. Es gibt
verschiedene Formen dieser Rückverfolgung. In Mail-Surveys erhalten Nonrespondenten
mehrere Erinnerungsschreiben, wobei zu beachten ist, dass diese nicht identisch sind.
In telefonischen Umfragen oder auch face-to-face Befragungen mit telefonischer
Rückverfolgung sollte der Interviewer hartnäckig bleiben. Wichtig ist es dabei nicht
immer zur selben Zeit anzurufen.
Kulka & Weeks (1988) haben die besten Kombination an Anrufzeiten entwickelt, wenn
man drei Anrufversuche hat.
Am besten ist:
Wochentag (Abends), Sonntag, Sonntag
Am schlechtesten:
Wochentag (Nachmittag), Wochentag (Nachmittag), Wochentag (Nachmittag)
Eine face-to-face Rückverfolgung hingegen ist aufgrund der damit verbundenen Kosten
äußerst ungewöhnlich, es sei denn der Interviewer führt in der Nachbarschaft des
Nonrespondenten Befragungen durch.
➢ Korrigierung der Non-response
Trotz aller Bemühungen Non-response zu minimieren nehmen normalerweise weniger,
meist sogar erheblich weniger als 100% der Befragten an einer Studie teil.
Es gibt auch nach der Datenerhebung Methoden, um den Effekt der Non-response auf
die Schätzung zu reduzieren.
29
Dabei gibt es zwei Hauptgruppen:
- Weighting (siehe Kapitel 3)
- Imputation (≈ Zurechnung)
Imputation wird vor allem bei Item-Non-response verwendet. Dillman (2002) erläuterte
einige Beispiele der Imputation. Drei davon sind im folgenden dargestellt:
• In hot deck imputation:
Fehlende Werte werden durch die eines anderen Respondenten ersetzt.
Meist wählt man dabei einen Antwortgeber aus, der ähnliche Eigenschaften
besitzt
• Nearest-neighbor imtputation:
Der fehlende Wert wird von dem Respondenten der dem Nonrespondenten am
nächsten ist (Distanz) verwendet
• In direct modeling:
Ein Modell wird entwickelt, dass den fehlenden Wert vorhersagt. Dabei werden
Punkte der Studie verwendet, die eine hohe Korrelation zu der fehlenden
Eigenschaft besitzen. Beispielsweise sagt ein Imputation Modell für das
Einkommen, das fehlende Einkommen für einen Respondenten, unter
Verwendung der Werte von Ausbildung, Alter, Geschlecht, etc. voraus
30
6. Literaturverzeichnis
• Journal of the Royal Statistical Society A (2010) 173, Part2
• Robert M. Groves: Nonresponse rates and nonresponse bias in household surveys
Public Opinion Quarterly, Vol. 70, No. 5, Special Issue 2006
• Paul Biemer, Lars E. Lyberg: Introduction to Survey Quality
Wiley Series in Survey Metodology (2003)
• Roderick T. A. Little: Nonresponse Adjustments for Estimates of Means
International Statistical Review Vol.54, No.2 (1986)
31