Theorien und Methoden der Skalierung fileVorwort Dies ist die 4. Auflage der Theorien und Methoden...

20

Transcript of Theorien und Methoden der Skalierung fileVorwort Dies ist die 4. Auflage der Theorien und Methoden...

Page 1: Theorien und Methoden der Skalierung fileVorwort Dies ist die 4. Auflage der Theorien und Methoden der Skalierung.DasBuchist mittlerweile reichlich dick geworden. Das sollte den Leser
Page 2: Theorien und Methoden der Skalierung fileVorwort Dies ist die 4. Auflage der Theorien und Methoden der Skalierung.DasBuchist mittlerweile reichlich dick geworden. Das sollte den Leser

Ingwer BorgThomas Staufenbiel

Theorien und Methodender Skalierung

Eine Einführung

Vierte, neu bearbeitete Auflage

Verlag Hans HuberBern Göttingen Toronto Seattle

© 2007 by Verlag Hans Huber, Hogrefe AG, BernIngwer Borg, Thomas Staufenbiel: Theorien und Methoden der Skalierung - Eine Einführung, Vierte, neu bearbeitete Auflage

Page 3: Theorien und Methoden der Skalierung fileVorwort Dies ist die 4. Auflage der Theorien und Methoden der Skalierung.DasBuchist mittlerweile reichlich dick geworden. Das sollte den Leser

© 2007 by Verlag Hans Huber, Hogrefe AG, BernIngwer Borg, Thomas Staufenbiel: Theorien und Methoden der Skalierung - Eine Einführung, Vierte, neu bearbeitete Auflage

Page 4: Theorien und Methoden der Skalierung fileVorwort Dies ist die 4. Auflage der Theorien und Methoden der Skalierung.DasBuchist mittlerweile reichlich dick geworden. Das sollte den Leser

Vorwort

Dies ist die 4. Auflage der Theorien und Methoden der Skalierung. Das Buch istmittlerweile reichlich dick geworden. Das sollte den Leser aber nicht einschüchtern.Es gilt nämlich nach wie vor, was wir 1989 im Vorwort zur 1. Auflage geschriebenhaben: „Dieses Buch stellt eine vorwiegend konzeptionell orientierte Einführung indie Theorien, Modelle und Methoden der Skalierung dar. Die Darstellung erfolgtmit vielen Beispielen, ist überwiegend geometrisch-anschaulich gehalten und enthältwenig Formeln. Vorausgesetzt werden elementare Kenntnisse in Statistik.“

Dass das Buch jetzt so umfangreich ist, liegt daran, dass wir eine Menge neuesMaterial wie z.B. Übungsaufgaben und Lösungen, aber auch zahlreiche zusätz-liche Beispiele oder Diskussionen darüber, welche Überlegungen in der inhaltlich-konkreten Anwendungspraxis entstehen, aufgenommen haben. Zusätzlich darge-stellt haben wir auch neue Entwicklungen der Skalierung, die sich in der Praxisund in der Literatur durchgesetzt haben oder die jedenfalls zur Zeit viel verwen-det werden. Dies schlägt sich in gänzlich neuen Kapiteln nieder (z.B. zu den ItemResponse Theorien, zu denen die Rasch-Skalierung zählt) und auch in solchen, dieerheblich erweitert wurden (z.B. zur Strukturgleichungsmodellierung).

Der Leser muss dieses Buch nicht von A bis Z lesen. Die einzelnen Kapitel stehenvielmehr weitgehend auf eigenen Füßen. Wen also z.B. das Conjoint Measurementinteressiert, kann sich dieses Kapitel direkt vornehmen. Wer nur wissen will, umwas es dabei überhaupt geht, der sollte auch mit den ersten paar Seiten genügendInformation bekommen, um sich ein Bild machen zu können.

Die Reihung der verschiedenen Kapitel erfolgte nach der folgenden Logik:

• Grundbegriffe. Zunächst diskutieren wir, was unter der Überschrift „Skalie-rung“ in Forschung und Praxis gemacht wird. Zudem gehen wir auf das Konzeptdes Skalenniveaus ein.

• Skalierung als Datenerhebung und Datenvisualisierung. Im Kapitel 2behandeln zunächst die Skalierung im Sinne eines Etikettierens von Objektenmit Zahlenwerten nach irgendeiner Regel. Im Kapitel 3 gehen wir auf Methodenein, die dazu dienen, derartige Daten in anschaulicher Form zu visualisieren.

• Klassische Skalierungsmodelle mit Erweiterungen. In den Kapiteln 4bis 8 behandeln wir die Klassiker der Skalierungsmethodik: Die Magnitude-Skalierung, die Fechner-Skalierung und die Guttman-Skalierung (Skalogramm-Analyse), inklusive wichtiger Erweiterung dieser Modelle auf den mehrdimen-sionalen bzw. hierarchischen Fall.

© 2007 by Verlag Hans Huber, Hogrefe AG, BernIngwer Borg, Thomas Staufenbiel: Theorien und Methoden der Skalierung - Eine Einführung, Vierte, neu bearbeitete Auflage

Page 5: Theorien und Methoden der Skalierung fileVorwort Dies ist die 4. Auflage der Theorien und Methoden der Skalierung.DasBuchist mittlerweile reichlich dick geworden. Das sollte den Leser

iv Vorwort

• Multidimensionale Skalierung und Unfolding. In den Kapiteln 9 und 10erörtern wir die Multidimensionale Skalierung (MDS) und eine Variante derMDS, das Unfolding.

• Faktorenanalyse und Strukturgleichungsmodellierung. In Kapitel 11 be-handeln wir die Faktorenanalyse, das vielleicht am häufigsten verwendete Skalie-rungsverfahren. In Kapitel 12 wird die heute ebenfalls häufig eingesetzte Struk-turgleichungsmodellierung dargestellt.

• Conjoint Measurement. In Kapitel 13 stellen wir einen (nicht-geometrischen)Sonderfall der Skalierung dar, das Conjoint Measurement, das vor allem in derMarktforschung recht populär ist.

• Skalenkonstruktion und Testtheorie. Die Kapitel 14 und 15 behandeln diefür Psychologen wichtige Thematik, wie man eine aus vielen Items bestehendeSkala konstruiert. Dazu werden die klassische Methode der summativen Skalie-rung und die neueren Ansätze der probabilistischen Testtheorie (z.B. die Rasch-Skalierung) dargestellt.

• Konzepte der Skalierung. Zuletzt betrachten wir in Kapitel 15 nochmals, nunvon höherer Warte aus, die verschiedenen Varianten des Begriffs der Skalierung.

Weitere Informationen zu den hier dargestellten Analysen (Datensätze, Hin-weise auf die verwendete Software usw.) finden sich im Internet unterhttp://www.skalierung.uni-osnabrueck.de/. Dort besteht auch die Mög-lichkeit, Kommentare und Anregungen zum Buch zu geben.

Mannheim und Osnabrück, Mai 2007Ingwer Borg und Thomas Staufenbiel

© 2007 by Verlag Hans Huber, Hogrefe AG, BernIngwer Borg, Thomas Staufenbiel: Theorien und Methoden der Skalierung - Eine Einführung, Vierte, neu bearbeitete Auflage

Page 6: Theorien und Methoden der Skalierung fileVorwort Dies ist die 4. Auflage der Theorien und Methoden der Skalierung.DasBuchist mittlerweile reichlich dick geworden. Das sollte den Leser

Inhaltsverzeichnis

Vorwort . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii

1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.1 Zum Begriff Skalierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 Skalenniveaus als Transformierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . 31.3 Skalenniveaus in der empirischen Forschung . . . . . . . . . . . . . . . . . . . . . 71.4 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2 Skalierung als numerisches Etikettieren . . . . . . . . . . . . . . . . . . . . . . . . 112.1 Regelgeleitetes Klassifizieren und Quantifizieren . . . . . . . . . . . . . . . . . 112.2 Items: Fragen und zulässige Antworten . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.2.1 Itemformen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152.2.2 Zur Formulierung von Items . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152.2.3 Qualitative Items . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172.2.4 Quantitative Items . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202.2.5 Likert-Items . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212.2.6 Kunin-Gesichter, BARS und semantisches Differential . . . . . . 22

2.3 Antwortformate bei Kategorienskalen . . . . . . . . . . . . . . . . . . . . . . . . . . 252.3.1 Anzahl der Skalenkategorien . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262.3.2 Verbale Etikettierung der Antwortskalen . . . . . . . . . . . . . . . . . 262.3.3 Numerische Etikettierungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 302.3.4 Die mittlere Skalenkategorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322.3.5 Weiß-Nicht Kategorien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

2.4 Rankings . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332.5 Paarvergleiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 362.6 Zur Psychologie der Beantwortung von Items . . . . . . . . . . . . . . . . . . . 372.7 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

3 Triviale Skalierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413.1 Ikonen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

3.1.1 Standardformen von Ikonen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 423.1.2 Komplexere Ikonen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 463.1.3 Optimierung von Ikonen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

3.2 Clusteranalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503.2.1 Grundprinzip der hierarchischen Clusteranalyse . . . . . . . . . . . 503.2.2 Clusterkriterien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

© 2007 by Verlag Hans Huber, Hogrefe AG, BernIngwer Borg, Thomas Staufenbiel: Theorien und Methoden der Skalierung - Eine Einführung, Vierte, neu bearbeitete Auflage

Page 7: Theorien und Methoden der Skalierung fileVorwort Dies ist die 4. Auflage der Theorien und Methoden der Skalierung.DasBuchist mittlerweile reichlich dick geworden. Das sollte den Leser

vi Inhaltsverzeichnis

3.2.3 Clusteranalyse am Beispiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 553.2.4 Ähnlichkeitsmaße für Clusteranalysen . . . . . . . . . . . . . . . . . . . . 573.2.5 Weitere Clusteranalyse-Varianten . . . . . . . . . . . . . . . . . . . . . . . . 603.2.6 Anwendung und Bewertung der Clusteranalyse . . . . . . . . . . . . 60

3.3 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

4 Magnitude-Skalierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 634.1 Klassische Magnitude-Skalierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 634.2 Magnitude-Schätzwerte und objektive Größen . . . . . . . . . . . . . . . . . . . 644.3 Cross-Modality Matching . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 674.4 Fehler und Bias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 684.5 Magnitude- und Kategorien-Skalen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 694.6 Magnitude- und Absolut-Skalierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 724.7 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

5 Saaty-Skalierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 755.1 Magnitude-Skalierung für vollständige Paarvergleiche . . . . . . . . . . . . 755.2 Skalen für inkonsistente Paarvergleiche . . . . . . . . . . . . . . . . . . . . . . . . . 775.3 Statistische Signifikanz der Konsistenz . . . . . . . . . . . . . . . . . . . . . . . . . 805.4 Hierarchische Modelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 825.5 Datenerhebung und Skalierung bei vielen Objekten . . . . . . . . . . . . . . 865.6 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

6 Fechner-Skalierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 916.1 Die Grundidee der Fechner-Modelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . 916.2 LCJ-Skalierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

6.2.1 Wahrnehmungsverteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 936.2.2 Dominanzurteile bei zwei Reizen . . . . . . . . . . . . . . . . . . . . . . . . 946.2.3 Wahrscheinlichkeitsverteilung der subjektiven Differenzen . . 966.2.4 Dominanzwahrscheinlichkeiten und subjektive Differenzen . . 976.2.5 Eine Anwendung: Skalierung der Schwere von Verbrechen . . . 996.2.6 Güte der LCJ-Skala . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1016.2.7 Existenz und Skalenniveau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1036.2.8 Ein komplexeres Anwendungsbeispiel . . . . . . . . . . . . . . . . . . . . 1056.2.9 Alternative Formen der Datenerhebung . . . . . . . . . . . . . . . . . . 1066.2.10 Probleme der LCJ-Skalierung . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

6.3 BTL-Skalierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1076.3.1 Das Auswahlaxiom und seine Folgen . . . . . . . . . . . . . . . . . . . . . 1076.3.2 BTL-Skalenwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1086.3.3 BTL- versus LCJ-Skala . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1096.3.4 Güte der BTL-Skala . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110

6.4 Direkte Fechner-Skalierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1116.4.1 Direktes Skalieren durch Probieren . . . . . . . . . . . . . . . . . . . . . . 1126.4.2 Skalierungs-Kriterien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1146.4.3 Metrische Fechner-Modelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1156.4.4 Computerprogramme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1166.4.5 Direkte Skalen versus LCJ-Skalen . . . . . . . . . . . . . . . . . . . . . . . 1166.4.6 Skalenniveaus der direkten Modelle . . . . . . . . . . . . . . . . . . . . . . 1186.4.7 Einige Schlussbemerkungen zu Fechner-Modellen . . . . . . . . . . 119

6.5 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120

© 2007 by Verlag Hans Huber, Hogrefe AG, BernIngwer Borg, Thomas Staufenbiel: Theorien und Methoden der Skalierung - Eine Einführung, Vierte, neu bearbeitete Auflage

Page 8: Theorien und Methoden der Skalierung fileVorwort Dies ist die 4. Auflage der Theorien und Methoden der Skalierung.DasBuchist mittlerweile reichlich dick geworden. Das sollte den Leser

Inhaltsverzeichnis vii

7 Skalogramm-Analyse (Guttman-Skalierung) . . . . . . . . . . . . . . . . . . . 1237.1 Die perfekte Skala . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1237.2 Bestimmung der Fehler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1257.3 Der Reproduzierbarkeitskoeffizient als Gütemaß . . . . . . . . . . . . . . . . . 127

7.3.1 Maximal mögliche Fehler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1287.3.2 Eine Anwendung: Skalierung von Symptomen der

Gefechtsangst . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1297.3.3 Varianten bei der Fehlerbestimmung . . . . . . . . . . . . . . . . . . . . . 129

7.4 Vorgehen bei Nicht-Skalierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1307.4.1 Halbordnung und lineare Ordnung von Profilen . . . . . . . . . . . 1307.4.2 Skalenanalyse versus Skalenkonstruktion . . . . . . . . . . . . . . . . . . 1327.4.3 Dominante Guttman-Skala . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132

7.5 Einschränkungen und Erweiterungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 1337.5.1 Guttman-Skalierung von Einstellungsitems . . . . . . . . . . . . . . . 1337.5.2 Mehrkategorielle Erweiterungen . . . . . . . . . . . . . . . . . . . . . . . . . 134

7.6 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136

8 Mehrdimensionale Struktupelanalyse . . . . . . . . . . . . . . . . . . . . . . . . . . 1398.1 Halbordnungs-Struktupelanalyse (POSAC) . . . . . . . . . . . . . . . . . . . . . 139

8.1.1 Eine kleine Batterie von Rechenaufgaben . . . . . . . . . . . . . . . . . 1398.1.2 Basiskoordinaten und Rollen der Facetten . . . . . . . . . . . . . . . . 1418.1.3 Eine Anwendung: Kommunikation bei Geiselnahmen . . . . . . . 143

8.2 Multidimensionale Struktupelanalyse (MSA) . . . . . . . . . . . . . . . . . . . . 1458.2.1 Prinzipien der MSA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1468.2.2 Eine Anwendung: Reaktionen auf Frustrationen . . . . . . . . . . . 147

8.3 Handlösungen von Skalierungsproblemen . . . . . . . . . . . . . . . . . . . . . . . 1508.4 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151

9 Multidimensionale Skalierung (MDS) . . . . . . . . . . . . . . . . . . . . . . . . . . 1539.1 Erstellung einer MDS-Konfiguration aus Distanzen . . . . . . . . . . . . . . 153

9.1.1 Rekonstruktion einer Karte aus einer Entfernungstabelle . . . 1539.1.2 Verallgemeinerung der Karten-Rekonstruktion . . . . . . . . . . . . 155

9.2 MDS in der psychologischen Forschung . . . . . . . . . . . . . . . . . . . . . . . . . 1569.2.1 MDS als psychologisches Modell . . . . . . . . . . . . . . . . . . . . . . . . . 1579.2.2 MDS zur Strukturanalyse von Proximitätsstrukturen. . . . . . . 159

9.3 Durchführung einer MDS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1619.3.1 Güte der MDS-Darstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1619.3.2 Bewertung des Stress . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1639.3.3 MDS-Modelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1659.3.4 MDS-Algorithmen und degenerierte Lösungen . . . . . . . . . . . . . 1679.3.5 Probleme fehlender und grob gerasterter Daten . . . . . . . . . . . 169

9.4 Interpretationsansätze in der MDS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1709.4.1 Dimensionen, Richtungen, Regionen und Cluster . . . . . . . . . . 1709.4.2 MDS-Interpretation mit externen Hilfen . . . . . . . . . . . . . . . . . . 174

9.5 Prokrustische Transformationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1759.6 Individuelle Unterschiedsmodelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1779.7 Bewertung von MDS-Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178

9.7.1 Modellfit und Stress . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1789.7.2 Konfirmatorische MDS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180

9.8 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182

© 2007 by Verlag Hans Huber, Hogrefe AG, BernIngwer Borg, Thomas Staufenbiel: Theorien und Methoden der Skalierung - Eine Einführung, Vierte, neu bearbeitete Auflage

Page 9: Theorien und Methoden der Skalierung fileVorwort Dies ist die 4. Auflage der Theorien und Methoden der Skalierung.DasBuchist mittlerweile reichlich dick geworden. Das sollte den Leser

viii Inhaltsverzeichnis

10 Unfolding . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18510.1 Prinzipien des Unfoldings . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185

10.1.1 Falten und Entfalten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18610.1.2 I-Skalen und J-Skalen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189

10.2 Unfolding-Daten als Ähnlichkeitsdaten . . . . . . . . . . . . . . . . . . . . . . . . . 19010.2.1 Zur MDS von Unfolding-Daten . . . . . . . . . . . . . . . . . . . . . . . . . . 19110.2.2 Unfolding verschieden verzahnter Daten . . . . . . . . . . . . . . . . . . 192

10.3 Eine Anwendung: Skalierung von Parteipräferenzen . . . . . . . . . . . . . . 19510.4 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198

11 Faktorenanalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20111.1 Ein einfaches Beispiel zur Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . 201

11.1.1 Beobachtete Scores und latente Faktoren . . . . . . . . . . . . . . . . . 20111.1.2 Faktorwerte, Faktorextraktion und Faktorladungen . . . . . . . . 20211.1.3 Faktor-Rotation und Interpretation . . . . . . . . . . . . . . . . . . . . . . 20511.1.4 Faktorenanalyse von fehlerbehafteten Daten . . . . . . . . . . . . . . 206

11.2 Geometrische Betrachtungen der Faktorenanalyse . . . . . . . . . . . . . . . . 20711.2.1 Variablen- und Personenraum . . . . . . . . . . . . . . . . . . . . . . . . . . . 20811.2.2 Dimensionalität einer Vektorkonfiguration . . . . . . . . . . . . . . . . 21011.2.3 Rotation der Vektorkonfiguration . . . . . . . . . . . . . . . . . . . . . . . . 21211.2.4 Faktoren im Personenraum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21311.2.5 Approximation komplexer Daten durch Hauptkomponenten . 214

11.3 Algebraische Darstellung der Faktorenanalyse . . . . . . . . . . . . . . . . . . . 21811.4 Eine Anwendung: Analyse der Wortbedeutung bei Kindern . . . . . . . 219

11.4.1 Festlegung der Zahl der Faktoren . . . . . . . . . . . . . . . . . . . . . . . . 21911.4.2 Schiefwinklige Drehungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22411.4.3 Prokrustische Drehungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227

11.5 Faktorenanalyse gemeinsamer Faktoren . . . . . . . . . . . . . . . . . . . . . . . . . 22911.5.1 Intelligenzmodelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23011.5.2 Bestimmung der Kommunalität . . . . . . . . . . . . . . . . . . . . . . . . . 23111.5.3 Hauptkomponentenanalyse versus Faktorenanalyse

gemeinsamer Faktoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23211.6 Faktorenanalyse, MDS und Clusteranalyse . . . . . . . . . . . . . . . . . . . . . . 23311.7 Explorative versus konfirmatorische Faktorenanalyse . . . . . . . . . . . . . 23411.8 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236

12 Strukturgleichungsmodellierung (SEM) . . . . . . . . . . . . . . . . . . . . . . . . 23912.1 Faktorenanalyse und Strukturgleichungsmodellierung . . . . . . . . . . . . 239

12.1.1 Hauptkomponentenanalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24012.1.2 Faktorenanalyse gemeinsamer Faktoren . . . . . . . . . . . . . . . . . . 24112.1.3 Ein einfaktorielles Modell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24312.1.4 Zwei zweifaktorielle Modelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245

12.2 Modelle mit endogenen Faktoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24712.3 Erstellung von Pfaddiagrammen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24912.4 Rückrechnung von Korrelationen aus Pfadgewichten . . . . . . . . . . . . . 25112.5 SEM von Varianz-Kovarianz-Daten . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25212.6 Fitindizes und ihre Beurteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25312.7 Eine Anwendung: Zum Zusammenhang von Arbeitszufriedenheit

und Leistung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25612.8 Strategien der Modellierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262

© 2007 by Verlag Hans Huber, Hogrefe AG, BernIngwer Borg, Thomas Staufenbiel: Theorien und Methoden der Skalierung - Eine Einführung, Vierte, neu bearbeitete Auflage

Page 10: Theorien und Methoden der Skalierung fileVorwort Dies ist die 4. Auflage der Theorien und Methoden der Skalierung.DasBuchist mittlerweile reichlich dick geworden. Das sollte den Leser

Inhaltsverzeichnis ix

12.9 Probleme der Strukturgleichungsmodellierung . . . . . . . . . . . . . . . . . . . 26412.10 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267

13 Conjoint Measurement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27113.1 Grundideen des Conjoint Measurements . . . . . . . . . . . . . . . . . . . . . . . . 27113.2 Ein einfaches Beispiel zur Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . 27213.3 Eine typische Anwendung des CM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27513.4 CM-Modelle und Skalenniveau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27813.5 Rechentechnische Aspekte des ordinalen CM . . . . . . . . . . . . . . . . . . . . 280

13.5.1 Iterative Optimierung der Modellanpassung . . . . . . . . . . . . . . . 28013.5.2 Degenerierte Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281

13.6 Lineares Conjoint Measurement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28213.7 Bedeutsamkeit einer CM-Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28613.8 Normierung der Teilnutzenskalen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28713.9 Varianten der Datenerhebung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 288

13.9.1 Die Trade-Off Methode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28813.9.2 Reduzierte Erhebungspläne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29113.9.3 Adaptives Conjoint Measurement . . . . . . . . . . . . . . . . . . . . . . . . 29313.9.4 Paarvergleiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295

13.10 Prüfung der CM-Skalierbarkeit ohne Skalierung . . . . . . . . . . . . . . . . . 29513.11 Zur Gültigkeit des CM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29813.12 Erweiterungen und verwandte Methoden . . . . . . . . . . . . . . . . . . . . . . . 29913.13 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 300

14 Skalenkonstruktion und Klassische Testtheorie . . . . . . . . . . . . . . . . . 30314.1 Items und Skalen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30314.2 Merkmale von Items . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 306

14.2.1 Formen von Items . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30614.2.2 Lösung eines Items . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30714.2.3 Itemcharakteristiken . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 307

14.3 Verfahren der Skalenkonstruktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30814.3.1 Methode der gleicherscheinenden Intervalle . . . . . . . . . . . . . . . 30914.3.2 Methode der sukzessiven Intervalle . . . . . . . . . . . . . . . . . . . . . . 31114.3.3 Methode der summierten Ratings . . . . . . . . . . . . . . . . . . . . . . . . 31314.3.4 Klassische Testtheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313

14.4 Schritte bei der Skalenkonstruktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31514.4.1 Festlegung des Gegenstandsbereichs . . . . . . . . . . . . . . . . . . . . . 31614.4.2 Konstruktion einer Testrohform . . . . . . . . . . . . . . . . . . . . . . . . . 31714.4.3 Erprobung der Testrohform an einer Analysestichprobe . . . . 31914.4.4 Itemanalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32014.4.5 Überprüfung der Qualität des Tests . . . . . . . . . . . . . . . . . . . . . . 32414.4.6 Skalierung des Merkmals bei Personen . . . . . . . . . . . . . . . . . . . 339

14.5 Einzelitems und sehr kurze Skalen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34114.6 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342

15 Probabilistische Testtheorien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34515.1 Itemcharakteristiken und Itemkennwerte . . . . . . . . . . . . . . . . . . . . . . . . 34515.2 Das Rasch-Modell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 348

15.2.1 Invarianzeigenschaften des Rasch-Modells . . . . . . . . . . . . . . . . 35015.2.2 Anwendung auf die Daten zur Gefechtsangst . . . . . . . . . . . . . . 351

© 2007 by Verlag Hans Huber, Hogrefe AG, BernIngwer Borg, Thomas Staufenbiel: Theorien und Methoden der Skalierung - Eine Einführung, Vierte, neu bearbeitete Auflage

Page 11: Theorien und Methoden der Skalierung fileVorwort Dies ist die 4. Auflage der Theorien und Methoden der Skalierung.DasBuchist mittlerweile reichlich dick geworden. Das sollte den Leser

x Inhaltsverzeichnis

15.2.3 Voraussetzungen des Rasch-Modells . . . . . . . . . . . . . . . . . . . . . . 35315.3 Weitere Modelle für dichotome Daten . . . . . . . . . . . . . . . . . . . . . . . . . . 354

15.3.1 Das Birnbaum-Modell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35515.3.2 Das drei-parametrische logistische Modell . . . . . . . . . . . . . . . . . 35615.3.3 Rasch, Birnbaum oder 3PL? . . . . . . . . . . . . . . . . . . . . . . . . . . . . 357

15.4 Bestimmung der Skalenwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35815.4.1 Bestimmung der Likelihood . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35815.4.2 Bestimmung der Personenscores . . . . . . . . . . . . . . . . . . . . . . . . . 36015.4.3 Bestimmung der Itemscores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 362

15.5 Bewertung des Modellfits . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36215.5.1 Likelihoodquotiententests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36315.5.2 Globale Tests von Voraussetzungen und Eigenschaften . . . . . 36515.5.3 Item- und Personenindizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 368

15.6 Weitere probabilistische Modelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37115.6.1 Modelle für Items mit geordneten Antwortkategorien . . . . . . . 37115.6.2 Erweiterungen und Spezialfälle . . . . . . . . . . . . . . . . . . . . . . . . . . 375

15.7 Informationsfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37715.8 Speziellere Anwendungsfelder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 378

15.8.1 Differential Item Functioning . . . . . . . . . . . . . . . . . . . . . . . . . . . 37815.8.2 Computeradaptives Testen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38115.8.3 Itemanalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 384

15.9 Probabilistische versus Klassische Testtheorie . . . . . . . . . . . . . . . . . . . 38515.10 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 386

16 Abschließende Anmerkungen zum Begriff Skalierung . . . . . . . . . . 38916.1 Traditionelle Unterscheidungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38916.2 Fünf allgemeinere theoretische Perspektiven . . . . . . . . . . . . . . . . . . . . 391

16.2.1 Skalierung und fundamentales Messen . . . . . . . . . . . . . . . . . . . . 39116.2.2 Skalierung als bedingtes Messen . . . . . . . . . . . . . . . . . . . . . . . . . 39216.2.3 Skalierung als Testen von Strukturhypothesen . . . . . . . . . . . . . 39316.2.4 Skalierung als Mittel der Exploration . . . . . . . . . . . . . . . . . . . . 39416.2.5 Skalierung als Indexbildung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 395

16.3 Empirische Gesetze und mathematische Modellierung . . . . . . . . . . . . 39616.4 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 398

17 Lösungen zu Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 399

18 Tabellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42918.1 Normalverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43018.2 χ2-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432

Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433

Namenverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 455

Stichwortverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 461

© 2007 by Verlag Hans Huber, Hogrefe AG, BernIngwer Borg, Thomas Staufenbiel: Theorien und Methoden der Skalierung - Eine Einführung, Vierte, neu bearbeitete Auflage

Page 12: Theorien und Methoden der Skalierung fileVorwort Dies ist die 4. Auflage der Theorien und Methoden der Skalierung.DasBuchist mittlerweile reichlich dick geworden. Das sollte den Leser

© 2007 by Verlag Hans Huber, Hogrefe AG, BernIngwer Borg, Thomas Staufenbiel: Theorien und Methoden der Skalierung - Eine Einführung, Vierte, neu bearbeitete Auflage

Page 13: Theorien und Methoden der Skalierung fileVorwort Dies ist die 4. Auflage der Theorien und Methoden der Skalierung.DasBuchist mittlerweile reichlich dick geworden. Das sollte den Leser

1

Einleitung

Es ist wenig sinnvoll, eine Definition der Begriffe Skala und Skalierung an den An-fang dieses Buches zu stellen. Eine anspruchsvollere Definition würde nämlich rechtabstrakt sein und schon einiges Wissen voraussetzen. Eine bescheidenere Charak-terisierung, die alle gängigen Varianten des Begriffs umfasst, wäre dagegen so vage,dass sie praktisch nutzlos wäre. Wir werden uns daher in diesem Kapitel dem Gegen-stand zunächst pragmatisch nähern und im letzten Abschnitt des Buches noch ein-mal vertiefend auf verschiedene Konzeptionen von Skalierung zurückkommen.

1.1 Zum Begriff Skalierung

Betrachten wir also zunächst, was man im Bereich der Skalierung macht bzw. wofürman den Begriff Skalierung in der Praxis verwendet.

1. Skalierung als Erhebung numerischer Urteile. Von Skalierung wirdvielfach dann gesprochen, wenn Urteile direkt in numerischer Form erhoben werden.Ein bekanntes Beispiel hierfür ist die in regelmäßigen Zeitabständen gemesseneBeliebtheit von Politikern. Hierzu werden von der Forschungsgruppe Wahlen zu-fällig ausgewählte Personen aus ganz Deutschland telefonisch kontaktiert. Diesewerden gebeten, einige prominente Politiker auf einer als Politbarometer bezeich-neten Skala zu bewerten. Die Frage lautet »Was halten Sie von ...« und die Skalareicht von −5=„halte überhaupt nichts von diesem Politiker“ bis +5=„halte sehrviel von diesem Politiker“. Die befragte Person kann also z.B. die BundeskanzlerinMerkel bewerten mit +3 oder mit −2.

Ein zweites Beispiel ist die Vergabe von Schulnoten. Die hier verwendete Skalaist meist 6-stufig, mit den Abstufungen 1=„sehr gut“, 2=„gut“, 3=„befriedigend“,4=„ausreichend“, 5=„mangelhaft“ und 6=„ungenügend“. Was genau mit einer Kate-gorie wie z.B. „befriedigend“ gemeint ist bleibt offen. Man hofft jedoch, dass dieVerwender der Skala die Bedeutung der Einstufungen mehr oder weniger gleichverstehen. Ob das so ist, kann man gegebenenfalls prüfen.

Allgemeiner ausgedrückt kann man untersuchen, was solche Skalen bzw. die mitihnen erhobenen Skalenwerte (Scores) wert sind. Was kann man z.B. aus den Scoresder Politiker auf der Beliebtheitsskala schließen? Kann man sie ernst nehmen und,falls ja, in welchem Sinn? Fragen dieser Art sind zentral für jede Skalierung. Bei derPolitikerskala kann man z.B. vermuten, dass die Einstufungen das Verhalten derBefragten an der Wahlurne vorhersagen. Bei den Schulnoten kann man in ähnlicher

© 2007 by Verlag Hans Huber, Hogrefe AG, BernIngwer Borg, Thomas Staufenbiel: Theorien und Methoden der Skalierung - Eine Einführung, Vierte, neu bearbeitete Auflage

Page 14: Theorien und Methoden der Skalierung fileVorwort Dies ist die 4. Auflage der Theorien und Methoden der Skalierung.DasBuchist mittlerweile reichlich dick geworden. Das sollte den Leser

2 1 Einleitung

Weise fragen, welche anderen Variablen man mit ihnen vorhersagen kann (z.B. denspäteren Erfolg im Studium).

2. Skalierung als Größenänderung . Unter Skalierung wird häufig auchein Verkleinern oder Vergrößern eines Objekts verstanden. So kann man z.B. inGraphiksoftware ein ausgewähltes Graphikobjekt auf die Größe 175% oder 33%skalieren, um so z.B. die zur Verfügung stehende Fläche des Computerbildschirmsganz auszunutzen.

Skalierung in diesem Sinn gibt es auch in der numerischen Mathematik. Dorttritt bei der Lösung von Gleichungssystemen bisweilen das Problem auf, dass dieKoeffizienten sehr unterschiedlich groß sind. Das kann bei den üblichen Lösungs-methoden dazu führen, dass wichtige Dezimalstellen verloren gehen. Die Folge kannein ungenaues Ergebnis bei der Lösung der Gleichungssysteme sein. Mathematikerverringern das Problem durch wiederholte Skalierungen der Koeffizienten der ein-zelnen Gleichungen. Skalierung ist hier in der Regel eine Verschiebung der Komma-stelle der Koeffizienten, also ein Multiplizieren der Koeffizienten mit der Absicht,die Rechengenauigkeit zu erhöhen.

3. Skalierung als Maßstabsänderung . In den empirischen Wissenschaftengibt es ebenfalls die Skalierung in Form einer Größenänderung, allerdings meist nurim Sinne der Umrechnung einer bestimmten Skala auf eine andere. Ein Beispieldafür ist die Umrechnung einer in Grad Celsius gemessenen Temperatur x in denentsprechenden Wert auf der Fahrenheitskala x′. Diese Transformation erfolgt überdie Gleichung x′ = 32 + 1.8 · x.

4. Skalierung als Skalenkonstruktion . Die Transformation der beiden Tem-peraturskalen ineinander ist möglich, weil beide in vergleichbarer Weise konstruiertwurden. In beiden Fällen sind jeweils zwei Punkte auf der Skala empirisch verankert.Fahrenheit, der das Quecksilberthermometer erfand, definierte den Nullpunkt seinerSkala als den Punkt, zu dem sich die Quecksilbersäule nach Eintauchen des Ther-mometers in ein Salz-Eis-Gemisch bewegt, und 100 Grad als den Punkt, den dieQuecksilbersäule für die normale Körpertemperatur erreicht. Celsius dagegen defi-nierte 0 und 100 Grad als die Punkte der Quecksilbersäule, an denen reines Wasserauf Meereshöhe friert bzw. kocht. In beiden Fällen war mit diesen zwei Punkteneine Art Urmeter definiert, eine Messlatte, die man durch einfaches Hintereinander-Anlegen von Gradeinheiten nach oben und unten erweitern und zudem noch feinerrastern kann, so dass sich jede Temperatur darauf abbilden und somit messen lässt.

Ganz ähnlich geht man in den Sozialwissenschaften vor. Es liegt nahe, das Ther-mometer auch als Modell für Empfindungsstärken, Einstellungen oder Intelligenzzu verwenden. In einem Intelligenztest könnte der Quecksilbersäule der Prozentsatzder richtig gelösten Aufgaben entsprechen. Empirische Bezugspunkte ließen sich füreinen bestimmten Intelligenztest z.B. dadurch definieren, dass man ermittelt, welcheProzentsätze im Durchschnitt fünfjährige Kinder oder Erwachsene erreichen.

Allgemeiner betrachtet führt das Beispiel der Intelligenzmessung zur Frage, nachwelchen Gesichtspunkten und Verfahrensweisen man die hierbei verwendeten Test-aufgaben auswählen und gestalten soll. Auch bei der Messung von Einstellungenund anderen Merkmalen verwendet man meist nicht nur eine Frage, sondern eineganze Batterie von Items (=Fragen mit den zugehörigen Antwortmöglichkeiten).Diese werden meist aufwendig konstruiert und überprüft, so dass man sicher stellenkann, dass die mit ihnen erhobenen Skalenwerte eine hohe Qualität aufweisen.

5. Skalierung als Skalenanalyse. Stellt man verschiedene Testaufgaben füreinen Intelligenztest zusammen, dann wird man meist feststellen, dass verschiedenePersonen ihre Gesamtleistung im Test verschieden erreichen. Während die eine

© 2007 by Verlag Hans Huber, Hogrefe AG, BernIngwer Borg, Thomas Staufenbiel: Theorien und Methoden der Skalierung - Eine Einführung, Vierte, neu bearbeitete Auflage

Page 15: Theorien und Methoden der Skalierung fileVorwort Dies ist die 4. Auflage der Theorien und Methoden der Skalierung.DasBuchist mittlerweile reichlich dick geworden. Das sollte den Leser

1.2 Skalenniveaus als Transformierbarkeit 3

Testperson z.B. alle Rechenaufgaben richtig löst, löst eine andere alle Aufgaben zumgeometrischen Vorstellungsvermögen und erreicht damit den gleichen oder einenähnlichen Intelligenzgesamtwert. Der Score einer Person in einem Intelligenztest istdann ein Mischwert, der sich zusammensetzt aus den Scores, die die Testperson aufverschiedenen Dimensionen der Intelligenz erreicht. Ob ein Phänomenbereich ein-oder mehrdimensional ist, ist eine Frage, mit der sich die Skalenanalyse beschäftigt.Die Dimensionen selbst werden oft aus gewissen Eigenschaften der empirischenBeobachtungen (wie z.B. der Ähnlichkeit der Antworten auf die Testaufgaben) mitHilfe dimensionsanalytischer Verfahren (wie z.B. der Faktorenanalyse) erschlossen.Man kommt so vom Bild eines Thermometers zum mehrdimensionalen Messen mitmehreren Thermometern gleichzeitig.

6. Skalierung als Datenanalyse. Historisch betrachtet zeigte sich, dass Ska-lierungsverfahren, die für die Skalenanalyse entwickelt wurden, allgemeiner ver-wendbar sind. Dimensionale Strukturen sind nämlich nur Spezialfälle von allge-meineren Organisationsprinzipien. So verwendet man z.B. das Verfahren der multi-dimensionalen Skalierung (MDS) heute überwiegend für die Visualisierung der Zu-sammenhänge zwischen vielen Variablen, d.h. zur Erstellung von Bildern, die dieStruktur dieser Zusammenhänge graphisch darstellen und sie so dem Auge für eineweitere Erkundung zugänglich machen. Die ursprüngliche dimensionsanalytischeAbsicht der MDS spielt dabei keine Rolle mehr. Ob man diese Methodik dann trotz-dem noch als Skalierung bezeichnen will, ist diskutierbar. Jedenfalls ergibt sich soeine unscharfe Abgrenzung des Gebiets der Skalierung von dem der multivariatenStatistik oder Datenanalyse.

1.2 Skalenniveaus als Transformierbarkeit

Zu den Aspekten der Skalierung, mit denen der Leser vermutlich schon zuvor inKontakt getreten ist, gehört die Unterscheidung verschiedener Skalenniveaus. DasSkalenniveau bezeichnet die Transformierbarkeit einer Skala. Hat man z.B. Tempe-raturwerte mit der Celsiusskala gemessen, dann ist klar, dass man sie ebenso gutauch in Fahrenheit ausdrücken könnte, ohne dass dadurch irgend etwas von Be-deutung verloren ginge. Was aber ist von Bedeutung? Die formale Antwort lautet:Genau die Relationen der Messwerte, die auf verschiedenen Temperaturskalen gleichbleiben. Wenn wir z.B. heute 20 Grad in Celsius messen, während es vor einem Jahrnur 10 Grad waren, dann ist es heute also doppelt so warm wie vor einem Jahr.Richtig? Fragen wir dazu, ob dieses Verhältnis gleich (invariant) bleibt, wenn wirdie Messwerte in die Fahrenheitskala überführen (transformieren). Die Transfor-mation lautet allgemein: s(x) Grad Celsius entsprechen s′(x) = 32 + 1.8 · s(x)Grad Fahrenheit1. Also entsprechen 20 Grad Celsius 68 Grad Fahrenheit und 10Grad Celsius 50 Grad Fahrenheit. Ausgedrückt in Fahrenheit-Werten lautet dasobige Temperaturverhältnis 68 : 50. Dieses Verhältnis ist aber nicht mehr gleich 2.Wir sehen daher, dass Aussagen über Verhältnisse auf der Temperaturskala empi-risch bedeutungslos sind, weil das Temperaturverhältnis ja nicht abhängig von derwillkürlich gewählten Skala sein soll, auf der es einmal 2, ein andermal 1.36 ist.Verhältnisbildungen auf diesen Temperaturskalen sind also nicht sinnvoll2.1 Mit s(x) bezeichnen wir einen Skalenwert der Temperatur x (hier in Grad Celsius) und

mit s′(x) einen anderen Skalenwert der gleichen Temperatur (hier in Grad Fahrenheit).2 Wenn diese Aussagen stets als auf die Skala bezogen verstanden werden, auf der die

Messungen erfolgen, ergeben sich keine Kommunikationsprobleme. Wenn aber ein Ame-

© 2007 by Verlag Hans Huber, Hogrefe AG, BernIngwer Borg, Thomas Staufenbiel: Theorien und Methoden der Skalierung - Eine Einführung, Vierte, neu bearbeitete Auflage

Page 16: Theorien und Methoden der Skalierung fileVorwort Dies ist die 4. Auflage der Theorien und Methoden der Skalierung.DasBuchist mittlerweile reichlich dick geworden. Das sollte den Leser

4 1 Einleitung

Tabelle 1.1. Die wichtigsten Skalenniveaus und ihre Eigenschaften.

grundlegende empirischeSkalentyp zulässige Transformationen Tests der Skalenwerte

Nominal-skala

Jede Transformation, die die Ver-schiedenheit und Gleichheit derDaten erhält.

Transitivität der Äquivalenzrelation:Wenn x und y als gleich (äquivalent)in irgendeinem Sinn beurteilt werdenund ebenso y und z, werden dannauch x und z als äquivalent beurteilt?

Ordinal-skala

Jede ordnungserhaltende Transfor-mation, also jede Transformation, diezu Werten führt, die wie die ur-sprünglichen Daten geordnet sind.

Transitivität der Ordnungsrelation:Wenn x nach Meinung des Beurtei-lers über y dominiert und y über z,dominiert dann auch x über z?

Intervall-skala

Jede lineare Transformation, also je-de Transformation s′(x) = k ·s(x)+c,wobei k und c reelle Zahlen sind undk > 0 ist. Bsp.: s′(x) = 7 · s(x)− 1.25

Additive Verkettung von Unterschie-den: Wenn der wahrgenommene Un-terschied von x und y gleich v undder Unterschied von y und z gleichw ist, ist dann der Unterschied von xund z gleich v + w?

Verhältnis-skala

Jede Streckung oder Schrumpfung,also jede Transformation s′(x) = k ·s(x), wobei k eine positive reelle Zahlist. Bsp.: s′(x) = 7.23 · s(x)

Multiplikative Verkettung von Domi-nanzstärken: Wenn x als v-mal sogroß beurteilt wird wie y, und y alsw-mal so groß wie z, wird dann x alsv · w-mal so groß beurteilt wie z?

Hierzu sind vielmehr stärkere Skalen (nämlich: Verhältnisskalen) erforderlich,die einen festen Nullpunkt haben. Die Temperaturskalen erlauben lediglich sinnvolleAussagen über das Verhältnis von Temperatur-Unterschieden und liegen damit aufeiner Intervallskala.

Tabelle 1.1 zeigt eine Übersicht der vier bekanntesten Skalenniveaus. Die zu-lässigen Transformationen bezeichnen die Möglichkeiten, gegebene Skalenwertedurch andere zu ersetzen, die die bedeutsamen Informationen ebenso gut aus-drücken. Diese Transformationen sehen auf den verschiedenen Skalenniveaus wiefolgt aus:

• Bei Daten auf nominalem Skalenniveau ist nur bedeutsam, ob zwei Objekte xund y gleich (äquivalent) oder verschieden sind. Entsprechend sind alle Trans-formationen der Skalenwerte zulässig, für die gilt s′(x) �= s′(y), wenn x und yhinsichtlich eines Merkmals verschieden sind und s′(x) = s′(y), wenn x und yäquivalent sind. Ordnen wir z.B. bei dem nominalen Merkmal ,Geschlecht‘ dieSkalenwerte s(x) = 1 zu, wenn x ein Mann ist und s(y) = 2, wenn y weiblichist, so sind die Skalenwerte s′(x) = 1.2 und s′(y) = 0 ebenso gut. Es kommtnur darauf an, dass alle Männer den gleichen Skalenwert bekommen und dieserverschieden ist von dem, den alle Frauen bekommen. Dass der eine Wert größerals der andere ist, hat keine Bedeutung.

• Bei ordinalen Daten ist jede Transformation zulässig, die zu neuen Werten führt,die genauso geordnet sind wie die Ausgangswerte. Wenn also die Skalenwertefür x und y auf der Skala s gleich s(x) = 1 und s(y) = 3 sind, dann könnten sie

rikaner einem Deutschen erklärt, in Florida sei es heute „doppelt so warm“ wie hier inOberammergau, sollte man unter Umständen rückfragen, wie das gemeint ist.

© 2007 by Verlag Hans Huber, Hogrefe AG, BernIngwer Borg, Thomas Staufenbiel: Theorien und Methoden der Skalierung - Eine Einführung, Vierte, neu bearbeitete Auflage

Page 17: Theorien und Methoden der Skalierung fileVorwort Dies ist die 4. Auflage der Theorien und Methoden der Skalierung.DasBuchist mittlerweile reichlich dick geworden. Das sollte den Leser

1.2 Skalenniveaus als Transformierbarkeit 5

auf einer neuen, gleich guten Ordinalskala z.B. die Werte s′(x) = 1.14 unds′(y) = 1.87 annehmen. Viele andere s′ sind möglich, so lange gilt: Wenns(x) < s(y), dann auch s′(x) < s′(y) und wenn s(x) = s(y), dann auchs′(x) = s′(y), für alle x, y. Betrachten wir beispielsweise das Merkmal ,Schulbil-dung‘ als ordinal und weisen Personen in Abhängigkeit von ihrem Abschluss dieSkalenwerte s = 1 (ohne Schulabschluss), 2 (Hauptschulabschluss), 3 (Real-schulabschluss) und 4 (Abitur) zu, so sind die Skalenwerte s′ = −1 (ohneSchulabschluss), 0.2 (Hauptschulabschluss), 0.3 (Realschulabschluss) und 44.0(Abitur) ebenfalls zulässig. Aus den Skalenwerten kann man dann immer nochentnehmen, ob zwei Personen den gleichen Schulabschluss haben oder wer vonbeiden den höheren Schulabschluss aufweist. Es kommt also nur auf die Rang-ordnung der Skalenwerte an, deren Abstand ist ohne Bedeutung. Wenn wie beider ersten Zuordnung der Skalenwerte s die Differenz zwischen zwei aufeinander-folgenden Schulabschlüssen jeweils gleich ist (im Beispiel 1), so ist dies auf ordi-nalem Skalenniveau ohne Belang. Dies macht auch Sinn, denn es ist nicht plau-sibel, dass beispielsweise der Unterschied zwischen einem fehlenden und einemHauptschulabschluss in irgendeinem Sinne genauso groß ist wie der zwischeneinem Realschulabschluss und dem Abitur. Die Eigenschaften der Zahlen habenalso in dieser Hinsicht keine Entsprechung in der Empirie.

• Bei Daten auf Intervallskalenniveau dürfen die Skalenwerte derart linear trans-formiert werden, dass man zu allen Skalenwerten eine beliebige reelle Zahlc addieren und die Skalenwerte mit einer beliebigen positiven reellen Zahl kmultiplizieren darf. Wir haben die Temperaturskala als eine solche Intervall-skala bereits erörtert. Statt die Temperatur in Celsiuswerten anzugeben, kannman auch beliebige andere, linear transformierte Skalenwerte verwenden. DieFahrenheit-Skala ist dafür ein Beispiel, die lineare Transformation lautet, wiegezeigt, s′(x) = 32 + 1.8 · s(x). Der Temperatur-Intervallskala kann man nichtnur entnehmen, ob eine Temperatur höher, niedriger oder gleich einer anderenist. Unter allen linearen Transformationen bleibt auch das Verhältnis von Dif-ferenzen zwischen Skalenwerten gleich. Ist etwa der Unterschied zwischen zweiTemperaturen s(x)− s(y) doppelt so groß wie der zwischen zwei anderen Tem-peraturen s(v)−s(w), so ist auch s′(x)−s′(y) doppelt so groß wie s′(v)−s′(w),gleichgültig, welche Konstanten c und k man wählt. Nicht von Bedeutung sindhingegen – wie oben bereits dargestellt – die Verhältnisse der Skalenwerte selbst:Ist etwa s(x) doppelt so groß wie s(y), so können wir dies nicht deuten.

• Bei einer Verhältnisskala schließlich ist nur noch die Multiplikation der Skalen-werte mit einer positiven reellen Konstanten zulässig. Ein Beispiel dafür ist dieLängenskala. Statt die Länge eines Objekts in Metern anzugeben, kann beispiels-weise auch eine Angabe in Zoll erfolgen. Die Skalenwerte in Zoll ergeben sich ausdenen in Metern durch die Multiplikation mit der Konstanten 0.0254. Eine addi-tive Konstante ist hier nicht mehr zugelassen, weil der Nullpunkt s(x) = 0 eineBedeutung hat: Er wird einem Objekt zugeordnet, das eine Länge/Ausdehnungvon Null aufweist. Deswegen finden sich in verschiedenen Ländern zwar (aushistorischen Gründen) unterschiedliche Maßstäbe für Längen (Meter, Zoll, Fuß,Meile usw.), ein Objekt ohne Ausdehnung erhält aber immer den Wert 0.

Wie man sieht, sind die vier dargestellten Skalenniveaus geordnet. Die Nominal-skala ist der schwächste Typ, die Verhältnisskala der stärkste. Auf einer stärkerenSkala liegen die Skalenwerte weitgehender fest, d.h. sie sind nur eingeschränktertransformierbar. Alle Transformationen, die für einen Skalentyp zulässig sind, sind

© 2007 by Verlag Hans Huber, Hogrefe AG, BernIngwer Borg, Thomas Staufenbiel: Theorien und Methoden der Skalierung - Eine Einführung, Vierte, neu bearbeitete Auflage

Page 18: Theorien und Methoden der Skalierung fileVorwort Dies ist die 4. Auflage der Theorien und Methoden der Skalierung.DasBuchist mittlerweile reichlich dick geworden. Das sollte den Leser

6 1 Einleitung

auch für alle schwächeren Skalentypen zulässig. Bei einem rangskalierten Merkmalsind also lineare Transformationen immer zulässig.

Warum ist die Frage nach dem Skalenniveau wichtig? Aus dem Skalenniveau er-gibt sich, welche Informationen man den Skalenwerten entnehmen kann. Bedeutenzwei unterschiedliche Skalenwerte s(x) = 0 und s(y) = 1 nur, dass sich x und yin dem betrachteten Merkmal unterscheiden? Oder kann man auch sagen, dass ymehr von dem Merkmal aufweist als x, oder eventuell sogar, dass x das Merkmalüberhaupt nicht aufweist? Je höher das Skalenniveau, umso mehr Informationenkann man den Skalenwerten entnehmen. Mit zunehmendem Skalenniveau sind auchmehr Rechenoperationen und Analysen sinnvoll. Liegt beispielsweise die Augen-farbe als ein nominal skaliertes Merkmal vor (etwa mit Skalenwerten s = 1 für„blau“, s = 2 für „grün“, s = 3 für „braun“ usw.), so lassen sich beispielsweise Häu-figkeiten der Skalenwerte angeben, eine Mittelwertsbildung über die Skalenwertemacht aber keinen Sinn: Eine mittlere Augenfarbe von 1.7 in einer Personenstich-probe ist eine unsinnige Statistik, die zudem auch bei zulässigen Transformationenimmer anders ausfällt. Meist wird heute in der Forschung angestrebt, psycholo-gische Merkmale auf Intervallskalenniveau zu erfassen. Dieses Skalenniveau wirdauch von einem Großteil der univariaten und bivariaten Statistiken (z.B. Mittel-wert, Varianz, Produkt-Moment-Korrelation) oder darauf aufbauenden Analysen(z.B. Varianzanalysen, Faktorenanalysen, Strukturgleichungsmodellierung) voraus-gesetzt. Natürlich stehen Kennwerte und Analyseverfahren auch für schwächereSkalenniveaus zur Verfügung. Im Allgemeinen ermöglicht aber ein höheres Skalen-niveau eine präzisere Erfassung von Zusammenhängen zwischen Variablen, was eineanspruchsvollere Modellbildung ermöglicht.

Woher weiß man aber, welches Skalenniveau gegebene Daten haben? Die Ant-wort findet man dadurch, dass man die Eigenschaften, die die Skalenwerte aufdem vermuteten Skalenniveau haben, empirisch überprüft, oder zumindest plau-sibel macht, zu welchem Ergebnis eine solche Prüfung führen würde. Dabei wirdgetestet, ob die Relationen der Skalenwerte gewisse empirische Relationen getreu-lich darstellen. Nehmen wir z.B. an, wir hätten eine Person gebeten, die verschiede-nen Speisen eines Imbissstands auf einer Schulnotenskala einzustufen. Dabei seienx = Käsebrötchen, y = Schinkenbrötchen und z = Fischbrötchen, und s(x), s(y)und s(z) die Noten, die die Person diesen Brötchen auf der 6-stufigen Beurteilungs-skala gegeben hat. Wenn nun z.B. s(x) = 3, s(y) = 3 und s(z) = 2 ist, dann solltedaraus folgen, dass die Person Käse- und Schinkenbrötchen im direkten Vergleichals gleich gut beurteilt, und dass sie Fischbrötchen bei einer Wertigkeitsreihungan erste Stelle setzt. Ob das so ist oder nicht, kann man empirisch testen. Geltensolche Beziehungen, dann kann man begründet argumentieren, dass zumindest dieOrdnungsbeziehungen der Skalenwerte vergleichbaren empirischen Beziehungen ent-sprechen.

Die in der mittleren Spalte von Tabelle 1.1 gezeigten empirischen Tests könnenalso in Fragen (Hypothesen) umgesetzt werden, mit deren Hilfe man das ange-nommene Skalenniveau zu begründen versucht. Getestet werden Relationen im Be-reich der empirischen Beobachtungen, die denen der Skalenwerte entsprechen sollen.Eine naheliegende Frage bei solchen Prüfungen ist die nach einem Entscheidungs-kriterium: Wie viele Tests dürfen negativ ausfallen, bevor man die Hypothese einesbestimmten Skalenniveaus verwerfen muss? Hierauf gibt es keine allgemeine Ant-wort. Die Bewertung von Widersprüchen zwischen den Relationen der Skalenwerteund entsprechenden empirischen Relationen hängt letztlich davon ab, was mit denSkalenwerten gemacht werden soll.

© 2007 by Verlag Hans Huber, Hogrefe AG, BernIngwer Borg, Thomas Staufenbiel: Theorien und Methoden der Skalierung - Eine Einführung, Vierte, neu bearbeitete Auflage

Page 19: Theorien und Methoden der Skalierung fileVorwort Dies ist die 4. Auflage der Theorien und Methoden der Skalierung.DasBuchist mittlerweile reichlich dick geworden. Das sollte den Leser

1.3 Skalenniveaus in der empirischen Forschung 7

1.3 Skalenniveaus in der empirischen Forschung

Die obigen Überlegungen zum Skalenniveau haben einen eher engen Fokus. Er istletztlich zu eng, sowohl für die Wissenschaft wie für die Anwendung. Das wirddeutlich, wenn man die inhaltlichen Illustrationen etwas genauer durchdenkt. Dieobigen Käse-, Schinken- und Fischbrötchen „haben“ nämlich nicht, wie man meinenkönnte, ein bestimmtes Skalenniveau3. Vielmehr kann man das Skalenniveau alsRollenzuweisung (Velleman & Wilkinson, 1994) verstehen, die aufgrund von Hypo-thesen darüber gemacht wird, wie diese Werte mit anderen Beobachtungen zusam-menhängen (Guttman, 1971). Eine solche Hypothese könnte z.B. lauten, dass dieper Beurteilungsskala erhobenen Skalenwerte der Brötchen das Wahlverhalten derPersonen am Imbissstand vorherzusagen erlauben. Also etwa: Eine Person wähltdas Brötchen mit Wahrscheinlichkeit 1, das den besten Notenwert bekommen hat(also z); gibt es dieses Brötchen nicht mehr, dann wählt sie mit Wahrscheinlichkeit0.5 eines der beiden anderen (x oder y).

Betrachten wir ein anderes Beispiel. Die numerische Codierung oder Skala derFarben 1=„rot“, 2=„gelb“, 3=„grün“, 4=„blau“ und 5=„purpur“ würde man wohlspontan als nominal bezeichnen. Andererseits hat man im Zusammenhang mitÄhnlichkeitsurteilen über Farben gefunden, dass die Farben in solchen Urteilenentsprechend den hier gewählten Skalenwerten geordnet erscheinen – und zwar inkreisförmiger Weise, d.h. die Farbe Rot mit dem Skalenwert 1 ist Nachbar derFarbe Purpur mit dem Skalenwert 5. Im Hinblick auf ihre physikalischen Wellen-längen sind die Skalenwerte der Farben dagegen linear geordnet. Man sieht also,dass der Beobachtungszusammenhang bei solchen Betrachtungen über das Skalen-niveau nicht einfach vernachlässigt werden kann. Den Farben wird vielmehr einSkalenniveau zugewiesen auf Grund einer Hypothese, die die gewählten Skalenwertemit anderen Beobachtungswerten in Beziehung setzt.

Anwender fragen bisweilen, ob man mit gegebenen Daten bestimmte Verfahrenrechnen „kann“ oder „darf“. Beide Fragen zielen auf das Skalenniveau ab. Zur„Kann“-Frage ist festzuhalten, dass der Computer nichts über die Daten weiß: Erbehandelt die eingegebenen numerischen Codes als Zahlen. Zur „Darf“-Frage sollteder Forscher klären, welche Hypothese er für den Zusammenhang der gegebenenSkalenwerte mit bestimmten anderen Beobachtungen hat. Wenn er meint, dass dieRückennummern von Fußballspielern mit der Zahl der geschossenen Tore linearkorrelieren, dann „darf“ er diese Variablen mit dem Produkt-Moment-Koeffizientenkorrelieren. Dabei wird er finden, dass es zumindest früher so war, dass die Rücken-nummern deutlich positiv mit den geschossenen Toren korrelieren. Diese Nummernwurden nämlich so verteilt, dass der Torwart die 1 bekam, der Linksaußen die 11.Da Stürmer normalerweise mehr Tore schießen als Abwehrspieler, korrelieren dieRückennummern positiv mit der Zahl der erzielten Tore. Das mag keine beson-ders interessante Erkenntnis sein, zeigt aber, dass die Zuweisung von Skalenniveauszu gegebenen Datenwerten nicht aus dem Zusammenhang der anstehenden Frage-stellung gelöst werden sollte.

Fundamentale Vorab-Nachweise des Skalenniveaus sind also nicht unbedingterforderlich als Voraussetzung für die weitere Verwendung von Skalenwerten. DieNaturwissenschaften haben sich prächtig entwickelt, ohne sich lange mit Überlegun-gen zum Skalenniveau ihrer Messwerte aufzuhalten. Was letztlich zählt, sind stabile,3 So liest man oft in Lehrbüchern zur Statistik, dass z.B. Telefonnummern nominalska-

lierte Werte „sind“ oder Grad Celsius intervallskaliert „ist“.

© 2007 by Verlag Hans Huber, Hogrefe AG, BernIngwer Borg, Thomas Staufenbiel: Theorien und Methoden der Skalierung - Eine Einführung, Vierte, neu bearbeitete Auflage

Page 20: Theorien und Methoden der Skalierung fileVorwort Dies ist die 4. Auflage der Theorien und Methoden der Skalierung.DasBuchist mittlerweile reichlich dick geworden. Das sollte den Leser

8 1 Einleitung

gesetzmäßige Beziehungen der gegebenen Skalenwerte mit den Werten anderer Vari-ablen. Ein Beispiel hierfür sind in der Physik die Formeln für den freien Fall, die dieHöhe h, die Zeit bis zum Aufschlag t und die Geschwindigkeit beim Aufschlag v wiefolgt verknüpfen: h = 1/2 ·g ·t2 und v = g ·t, mit der Konstanten g ≈ 10m/s2. Hier-bei wird nicht nur ein bestimmtes Skalenniveau der Variablen, sondern z.B. auchein bestimmter Begriff von Zeit und eine damit verbundene Auffassung des Messensvon Zeit „mit der Stoppuhr“ unterstellt. Diese werden aber in der Physik keines-wegs durchgängig verwendet. So erscheint es unter Umständen sinnvoll, Zeit ganzanders zu definieren als dies unserer natürlichen Vorstellung entspricht: „Time isdefined so that motion looks simple“ (Misner, Thorne & Wheeler, 1973, S. 23). DieGrundbegriffe, die Messungen und die Beziehungen der Variablen des interessieren-den Gegenstandsbereichs sind also in komplexen Wechselbeziehungen miteinanderverknüpft, in denen man nicht ohne weiteres angeben kann, was zuerst und wasdanach kommt.

Eine genauere Analyse dessen, was in Natur- und Sozialwissenschaften tatsäch-lich gemacht wird, wenn gemessen wird, hat Guttman (1971) zu seiner Definitionvon Measurement as Structural Theory geführt. Darin spielt die Absicht, empirischeGesetze zu finden und zu verfeinern, die entscheidende Rolle: Die Skalenwerte unddie theoretischen Konzepte werden in einer Art Ping-Pong-Beziehung so gewählt,dass diese „Wenn-Dann-Gegeben dass“-Gesetze so gut wie möglich (also replizier-bar, möglichst einfach, präzise, für klar definierte Phänomenbereiche, mit genauausformulierten Randbedingungen usw.) etabliert werden.

Eine dritte Sichtweise des Skalenniveaus ist mit dem Konzept des konditionalenMessens verbunden. Hier wird zunächst ein bestimmtes Skalenniveau angenommen.Dann wird geprüft, ob sich diese damit in definierter Weise transformierbarenSkalenwerte in ein bestimmtes Skalierungsmodell einbetten lassen. Diese Einbett-barkeit ist nur dann möglich, wenn die Werte eine bestimmte Struktur aufweisen(Schönemann & Borg, 1983).

Diese verschiedenen Auffassungen zum Skalenniveau reflektieren verschiedeneBetrachtungswinkel der Thematik, angefangen von einer, die vor allen weiteren Ver-wendungen der Skalenwerte zunächst einen Nachweis ihrer Bedeutsamkeit fordert,bis zu solchen, die mehr die Rolle der Skalenwerte in der wissenschaftlichen Theorie-oder Modellbildung betonen. Allen Ansätzen ist gemeinsam, dass sie über dieSkalenwerte selbst hinausgehen und fragen, ob diese Werte bestimmte Eigenschaf-ten aufweisen. Der Grund für diese Überlegungen ist letztlich immer die Frage,ob man dann, wenn man mit den Skalenwerten „rechnet“ (z.B. Mittelwerte bildetoder Korrelationen berechnet), zu Ergebnissen kommt, die auch für den eigentlichinteressierenden Gegenstand, „die Welt draußen“, gelten. Der Ingenieur setzt seineMesswerte in verschiedene Formeln ein, und das Raumschiff kommt tatsächlich zumberechneten Zeitpunkt an der Raumstation an. Gilt Ähnliches auch für die Mess-werte in der Psychologie? Man kann nicht einfach annehmen, dass die SkalenwerteZahlen sind, mit denen man rechnen kann wie mit den Zahlen eines Zahlenkörpersund damit dann zu empirisch gültigen Einsichten kommt. Sie sind zunächst nurCodes, deren Eigenschaften bzw. deren Nützlichkeit jeweils zu klären sind.

1.4 Übungsaufgaben

1.1. Nunnally und Bernstein (1994) führen folgende Beispiele für Skalenniveaus an:[1] Nominal: Telefonnummern; [2] Ordinal: Härtegrade von Mineralien; [3] Intervall:

© 2007 by Verlag Hans Huber, Hogrefe AG, BernIngwer Borg, Thomas Staufenbiel: Theorien und Methoden der Skalierung - Eine Einführung, Vierte, neu bearbeitete Auflage