modelle (SEM) mit Mplus - Weingarten...Kaplan, D. (2000). Structural Equation Modeling: Foundations...
Transcript of modelle (SEM) mit Mplus - Weingarten...Kaplan, D. (2000). Structural Equation Modeling: Foundations...
Bad Herrenalb, den 19. & 20.2.2019 Folie 1Balingen, 12.11.2007 Folie 1
Workshop bei der Winterakademie der
Graduiertenakademie Pädagogische
Hochschulen BW am 19./20.2.2019 in
Bad Herrenalb
Prof. Dr. Stefan König
„Strukturgleichungs-
modelle (SEM) mit
Mplus“
Prof. Dr. S. König
Teil 1:
Einführung in den Kurs und die Thematik
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 2
Kleine Informationsrunde zu Beginn
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 3
Überblick über die Gesamtthematik
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 4
Datum & Zeit Themen Materialien
1 19.02., 14:00 – 16:00 Einführung in die Thematik
und den Kurs
Präsentation
2 19.02., 16:30 – 18:30 Einführung in den SPSS-
Datensatz; Explorative
Faktorenanalyse
Healthworkers.sav
Syntax_1 + _2.sps
Arbeitsblätter_1 bis 2
3 20.02., 08:30 – 10:30 CFA/SEM mit Mplus
4 20.02., 11:00 – 13:00 Übungen Übungsdatensatz_1
Übungsdatensatz_2
5 20.02., 14:30 – 16:00 Weitere Modellansätze (1):
Multilevel Modeling
Companydata_emp-
level.dat
6 20.02., 16:30 – 18:00 Weitere Modellansätze (2)
Diskussion & Summary
Support_emplevel.dat
1.1 Einleitende Überlegungen
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 5
Einführung in Strukturgleichungsmodelle (1)
„Structural equation modeling (SEM) can perhaps best be
defined as a class of methodologies that seeks to represent
hypotheses about the means, variances and co-variances
of observed data in terms of a smaller number of
structural parameters defined by a hypothesized model.“
Kaplan, D. (2000). Structural Equation Modeling: Foundations and
Extensions.
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 6
Einführung in Strukturgleichungsmodelle (2)
„SEM takes into account the modeling of … multiple latent
independents each measured by multiple indicators, and
one or more latent dependents each with multiple
indicators.
SEM may be used as a more powerful alternative to
multiple regression, path analysis, factor analysis, and time
series analysis.“
From: http://www.statisticalassociates.com
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 7
Einführung in Strukturgleichungsmodelle (3)
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 8
Einführung in Strukturgleichungsmodelle (4)
Die genannten latenten Variablen (auch als Konstrukte
oder Faktoren bezeichnet) sind nicht beobachtbare und
oft auch nicht messbare Variablen, welche durch
beobachtbare, sprich messbare, Variablen (auch als
Indikatoren bezeichnet) gemessen werden.
Beispiel:
Arbeitsplatzzufriedenheit oder Lehrergesundheit sind
(derzeit) als Konstrukt nicht wirklich messbar.
Messbar hingegen sind Items, wie z. B. Zufriedenheit
mit der Unterstützung durch Kollegen oder mit der
kollegialen Zusammenarbeit, etc. über Ratingskalen.
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 9
Einführung in Strukturgleichungsmodelle (5)
Structural Equation Modeling is often defined as a type of
Path Analysis; the latter definition encompassing any
regression technique which enables the simultaneous
modeling of several related regression relationships.
SEM family:
a priori
differentiating between observed and latent variables
ability to analyze co-variances as well as means
requires large samples
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 10
Einführung in Strukturgleichungsmodelle (6)
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 11
1.2 EFA CFA SEM
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 12
1.2.1 Begrifflichkeiten
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 13
Explorative Faktorenanalyse (EFA)
In einer EFA versucht man herauszufinden, welche
Variablen ‚tiefer liegende‘ Faktoren oder latente
Variablen beschreiben, und die Bedeutung dieser
Faktoren zu interpretieren.
Eine EFA ist ein exploratives Verfahren, um Modelle zu
entwickeln und die Beziehungen zwischen den Variablen
zu beschreiben; diese Beziehungen werden als Faktor-
ladungen bezeichnet.
Normalerweise wird eine EFA durchgeführt, um die oder
mehrere ‘best’-Lösungen für die Beziehung der
beobachteten und tiefer liegenden Variablen zu finden.
‘Best’ meint inhaltliche Sinnhaftigkeit (‚qualitizing‘).
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 14
EFA: Grundidee
FaktorItem 1
Item 2
Item 3
…
Item n
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 15
EFA: Beispiel (Gageur, i. Vb.)
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 16
Schularten: Grundschule: 859
Hauptschule: 282
Realschule: 322
Gemeinschaftsschule:
295
Gymnasium: 448
Sonderpädagogische
Zentren: 271
Online-Befragung im
Raum Baden-
Württemberg mittels
Fragebogen, der aus
verschiedenen Skalen
besteht.
EFA: Beispiel (Gageur, i. Vb.)
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 17
Konfirmatorische Faktorenanalyse (CFA)
CFA gelten als Messmodelle; d. h., sie legen dar, wie
Indikatoren (beobachtete Variablen) tiefer liegende
Konstrukte messen.
Eine CFA wird verwendet, um zu testen, wie gut ein
solches Messmodell ist, d. h. wie gut ein Modell zu den
Daten passt.
In einer CFA wird ein Modell zu Beginn des
Analyseprozesses definiert („Theories first“); d. h., es gibt
ein Modell, das bspw. aus einer Kombination einer
vorher durchgeführten EFA, einer Literaturrecherche
und eigenen theoretischen Analysen entwickelt wurde.
Dieses Modell soll ‘bestätigt’ werden.
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 18
Konfirmatorische Faktorenanalyse (CFA)
Hierbei ist die Anzahl der Variablen und Faktoren sowie
deren Beziehung festgelegt. Bestimmte Variablen stehen
mit bestimmten Faktoren in Zusammenhang.
Beispiel: Messmodell ‚kognitive Fähigkeiten‘
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 19
Aus: Geiser (2011, S. 56)
0,48
Strukturgleichungsmodelle (SEM)
Das Prüfen eines Messmodells mittels CFA ist der erste
Schritt, ein SEM zu modellieren; in anderen Worten: Eine
CFA sollte einem SEM stets vorausgehen.
Ein SEM ‘erweitert’ eine CFA, indem Kausalitäten
(Pfade) zwischen den Faktoren ergänzt werden.
ACHTUNG: Falls schon das Messmodell eine eher
schlechte Passung mit den Daten hat (d. h., die Variablen
sind keine wirklich guten Messungen der tiefer liegenden
Faktoren), dann ist es unwahrscheinlich, dass irgendeine
Erweiterung um kausale Abhängigkeiten von Faktoren
das Modell besser macht.
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 20
Messmodelle und Strukturmodelle
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 21
Y = β0 + β1x + e
β0 = Intercept
β1 = Slope
e = Residuum
η2 = β0 + β1η1 + ζ
1.2.2 Beispiel
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 22
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 23
Begriffsklärung: Messmodell, Strukturmodell und
Strukturgleichungsmodell am Beispiel einer fiktiven Evaluation (schriftliche
Befragung, Rating-Skalen) einer Lehrveranstaltung zu statistischen
Themen
Lehrqualität
Lernzuwachs
bei Teilnehmern
Zufriedenheit
der Teilnehmer
mit Seminar
Motivation zur
eigenständigen Be-
schäftigung mit
Statistik
Zufriedenheit mit
Studium
Einschätzung
PH Weingarten
gute Wahl
Weiter-
empfehlung
PH Weingarten
Gute Berufs-
vorbereitung
Messmodell 1 Messmodell 2
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 24
Begriffsklärung: Messmodell, Strukturmodell und Strukturgleichungsmodell
Lehrqualität Zufriedenheit mit
Studium
Strukturmodell
Lernzuwachs
bei Teilnehmern
Zufriedenheit
der Teilnehmer
mit Seminar
Motivation zur
eigenständigen
Beschäftigung
mit Statistik
Einschätzung
PH Weingarten
gute Wahl
Weiter-
empfehlung
PH Weingarten
Gute Berufs-
vorbereitung
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 25
Begriffsklärung: Messmodell, Strukturmodell und Strukturgleichungsmodell
Lehrqualität Zufriedenheit mit
Studium
Messmodell 1 Messmodell 2
Strukturgleichungsmodell
Lernzuwachs
bei Teilnehmern
Zufriedenheit
der Teilnehmer
mit Seminar
Motivation zur
eigenständigen
Beschäftigung
mit Statistik
Einschätzung
PH Weingarten
gute Wahl
Weiter-
empfehlung
PH Weingarten
Gute Berufs-
vorbereitung
UV AV
1.2.3 Modelldarstellung
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 26
Grundsätzliches
Bei der Konstruktion bzw. beim Prüfen von
Pfadanalysen, wie z. B. CFA, SEM oder auch einer
einfachen Regression mit beobachteten Daten,
empfiehlt es sich, ein Modell sowohl grafisch als auch in
Form von Gleichungen darzustellen.
“Literature … recommends an initial examination of empirical …
plots of the whole sample or a randomly selected subsample of
individuals …, because this conveys a first exploratory impression
of change over time” (Singer & Willett, 2003, p. 24).
Bei der grafischen Darstellung einer Pfadanalyse gibt es
weitverbreitete Bezeichnungen und Definitionen.
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 27
Gleichungen
Zur Darstellung in Form von Gleichungen nehmen wir an,
dass wir sechs Variablen, V1 bis V6, haben. Eine
durchgeführte EFA hat vorgeschlagen, dass diese sechs
Variablen auf zwei Faktoren laden.
Formale Schreibweise:
– V1 to V3 on F1
– V4 to V6 on F2
Gleichungen (drei ausgewählt):
(1) V1 = β01 + β11*F1 + errV1
(2) V2 = β02 + β12*F1 + errV2
(3) V3 = β03 + β13*F1 + errV3
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 28
Pfaddiagramme (1)
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 29
F1
F2
V2
ErrV1 V1
V3
ErrV2
ErrV3
V1
V1
V1
ErrV4
ErrV6
ErrV5
β1
β4
β3
β2
β5
β6
r
Pfaddiagramme (2)
• Rechtecke stellen ‘beobachtete Variablen’ dar.
• Ovale stellen latente Konstrukte dar, d. h. Faktoren und
Varianzen.
• Einfache Pfeile zeigen kausale Beziehungen
zwischen Variablen (UV AV).
• Doppelpfeile stehen für Korrelationen
zwischen Variablen.
• Abhängige Variablen, d. h. Variablen, auf die wenigstens
ein Pfeil zeigt, werden als endogen definiert. Solche, auf
die kein Pfeil zeigt, als exogen.
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 30
Zusammenfassung
Während ein Messmodell, das einen oder mehrere
Faktoren beschreibt, die durch ein Set an beobachteten
Variablen gemessen werden, einen Teil eines SEM
bildet, enthält ein SEM Kausalitäten (Pfade) zwischen
den Faktoren und/oder beobachteten Variablen.
Dementsprechend können SEM als Anpassungen bzw.
Erweiterungen von CFA konzipiert werden, die anstatt
reinen Korrelationen kausale Beziehungen zwischen den
Faktoren festlegen.
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 31
1.3 Überlegungen und Parameter zur
Modellgüte
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 32
Test Parameter und Model Fits
Für ein Pfadmodell liefert der Output des ausgewählten
Softwarepakets Schätzer von allen Parametern des
Modells, die frei geschätzt werden können.
Beispiel: Mplus liefert für die geschätzten Parameter in
der CFA (path coefficients β1 to β6, intercepts α1 to α6,
variance of err Y1 to errY6, correlation ρ) folgende
zusätzlichen Koeffizienten:
– Standardfehler für die Schätzung
– Ein Verhältnis dieser Schätzung, d. h. der Quotient aus
“‚standardized estimation‘/‚standard error’”, der sich einer Z-
Statistik annähert
– Einen p-Wert, bezogen auf die Testung der Nullhypothese, dass
die Schätzung “0” beträgt
– Vertrauensintervalle (wenn angefordert)
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 33
Beispiel Mplus
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 34
Konfidenzintervalle fehlen hier, sie sind durch einen
spezifischen Unterbefehl (CINTERVAL) anzufordern.
Beispiel Mplus – Erläuterungen
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 35
σ𝑖=1𝑖=𝑛 𝑥𝑖 − 𝑥 2
𝑛 − 1s2 =
S.E. = s/ 𝑛
Die Streuung der
Stichprobenkennwerte-
verteilung heißt
Standardfehler des
Mittelwerts. Trägt man den
Standardfehler zu beiden
Seiten des Mittelwerts auf,
liegt mit etwa 67 %
Wahrscheinlichkeit der
Mittelwert der
Grundgesamtheit in
diesem Intervall.
R2-Statistik
Für jede der abhängigen Variablen (in unserem Beispiel
V1 bis V6) wird ebenfalls die R2-Statistik ausgegeben.
R2 als Quotient von durch die Regression erklärter
Varianz und Gesamtvarianz. Wert R2 < 1.
Beispiel aus Mplus:
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 36
Frage nach der Modellgüte
Eine wichtige Frage ist, wie wir bewerten können, wie gut
unser Modell zu den Daten passt. Prinzipiell ist das die
Priorität in der CFA.
Wir prüfen, wie gut die gemessene (beobachtete)
Kovarianz-Matrix der Variablen des Modells mit dem
zusammenpasst, was wir unter der Annahme, dass das
Modell eine perfekte Abbildung der Daten ist, erwarten.
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 37
Chi-Quadrat-Statistik (1)
Die grundlegendste Fit-Statistik für jegliche Pfadanalyse
ist die Chi-Quadrat-Statistik (χ2).
Sie wird in einem großen Bereich von statistischen
Testszenarien angewendet (z. B. auch Mplus, HLM), um
zu prüfen, ob die “beobachteten Daten" (d. h. unser
Datensatz) von dem abweicht, was unter dem
vorgeschlagenen Modell erwartet wird.
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 38
Chi-Quadrat-Statistik (2)
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 39
𝑍𝑒𝑖𝑙𝑒𝑛𝑠𝑢𝑚𝑚𝑒 ∗ 𝑆𝑝𝑎𝑙𝑡𝑒𝑛𝑠𝑢𝑚𝑚𝑒
𝐺𝑒𝑠𝑎𝑚𝑡𝑠𝑢𝑚𝑚𝑒 𝑑𝑒𝑟 𝐻ä𝑢𝑓𝑖𝑔𝑘𝑒𝑖𝑡Erwartete Anzahl =
Chi-Quadrat-Statistik (3)
Falls die Chi-Quadrat-Statistik signifikant sein sollte (p <
.05), dann bedeutet dies, dass sich die Zusammenhänge
zwischen den Variablen im Modell signifikant von den
Werten unterscheiden, die wir erwartet hätten, falls das
Modell eine wahre Abbildung wäre.
Bitte beachten: Selbst im Falle einer mäßig großen
Stichprobe können Unterschiede zwischen den
beobachteten und erwarteten Kovarianz-Matrixen, die
eigentlich als trivial betrachtet werden könnten,
signifikante Chi-Quadrat-Statistiken verursachen.
Folglich sind weitere Indizes entwickelt worden, um den
Fit unseres Modells beurteilen zu können.
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 40
Chi-Quadrat-Statistik (4)
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 41
Model Fits (1)
Solche Model Fits verwenden eine ganze Reihe an
Methoden, zum Beispiel Vergleich gegen das Null-Modell
oder Beurteilung von Residuen und Fehlertermen.
Sie können in zwei Gruppen unterteilt werden:
– Absolute Fit Indizes
– Inkrementelle Fit Indizes
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 42
Model Fits (2)
Absolute FI Inkrementelle FI
Definition Absolute fit indices are
simply derived from the fit
of the observed and
expected covariance and
the ML minimization
function.
Incremental fit indices compare a
chi-square for the model tested with
the chi-square from a so-called null
model (also called a "baseline"
model or "independence" model).
The null model generally specifies
that all observed variables are
uncorrelated (there are no latent
variables).
Value: 0 – 1.
Beispiele AGFI, Hoelter‘s CN, AIC,
BIC, ECVI, RMR, SRMR,
RMSEA
IFI, CFI, TLI, NFI.
Relevant
für uns
AIC, BIC, RSMEA CFI, TLI
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 43
Model Fits (3)
In der statistischen Forschung wurden relativ viele
Analysen durchgeführt, um herauszufinden, …
– … welche Model Fits aus der vorhandenen Vielzahl
am besten verwendet werden sollen und
– … welche angemessenen Grenz-Werte für jeden
Index festgelegt werden sollen, die einen
hinreichenden Model Fit garantieren.
Hu und Bentler (1999) haben verschiedene Cut-offs für
viele dieser Koeffizienten unter verschiedensten
Bedingungen untersucht (veränderte Stichprobengrößen,
Modellkomplexität, etc.). Sie schlagen eine Kombination
vor, um α- und β-Fehler zu vermeiden.
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 44
Model Fits (4)
Gruppe Model Fit Cut-off Mplus
Chi-Quadrat-
Statistik
Chi-Quadrat-Test P < .05 bedeutet,
dass das Modell
nicht zur
Population passt
Absolute Fit
Indizes
SRMR < 0.08
RMSEA < 0.06
Inkrementelle Fit
Indizes
CFI > 0.95 (0.97)
TLI > 0.95 (0.97)
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 45
Weitere Model Fits finden sich bei Geiser (2010); vgl. auch
Arbeitsblatt 1.
Zusammenfassung und Fragerunde
Grundidee und zentrale Merkmale von
Strukturgleichungsmodellen
Vergleich, Abgrenzung und Zusammenhänge von EFA,
CFA und SEM
Überlegungen und Parameter zur Modellgüte
------------------------------------------------------------------
Fragen
Anmerkungen
Wie geht es weiter?
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 46
Teil 2 (1):
Einführung & Vorbereitung
SPSS-Datensatz
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 47
Schritt 1:
Informationen über den Datensatz
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 48
Informationen zum Datensatz
Der Datensatz liegt als SPSS-Datei vor (healthworkers.sav).
Der Datensatz besteht aus 49 Variablen.
Diese entsprechen Antworten, die von 600 Beschäftigten im Rahmen
einer schriftlichen Befragung zum betrieblichen Gesundheitswesen
gegeben wurden (verschiedene Skalen).
Die Variablen setzen sich zusammen aus …
– … verschiedenen Demografischen Messungen bzw.
Hintergrundinformationen,
– … 7 Skalen mit Items zu „Arbeitsmessungen“ (z. B. Teamwork,
Feedback, etc.) sowie
– … 2 Skalen zum Wohlbefinden.
Ein Ausschnitt des Datensatzes befindet sich in der nächsten
Abbildung.
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 49
Ausschnitt aus SPSS Datensatz
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 50
Überblick über den Datensatz
Ziel: Informationen über den Datensatz erhalten („getting
familiar with“), da Mplus einen Nachteil hat: Die Software
ist bezüglich eines Überblicks über die vorhandenen
Daten eher ungeeignet!
Vorgehen
– Datensatz öffnen
• Menügesteuert
• Syntax: get file = `Pfad´.
– Häufigkeiten berechnen
– Deskriptive Statistiken berechnen
Bitte einlesen!
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 51
Schritt 2:
Aufbereitung des Datensatzes
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 52
Datensatz kennenlernen & vorbereiten
Die folgenden Arbeitsschritte sind drei Gründen
geschuldet:
– Bereinigung des Datensatzes
– Vorbereitung des Datensatzes für mögliche Analysen
– Besonderheiten von Mplus mitdenken
Bitte Datensatz „healthworkers_0.sav“ laden [Syntax_1]:
– Bitte genau anschauen
– Schwächen des Datensatzes?
– Mögliche Zusatzvariablen?
– Formatierungen?
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 53
Aufbereitung des Datensatzes (vgl. AB_1)
Datensatz in zwei Hälften teilen: EFA vs. CFA [Syntax_2; Syntax_3]
Neue Variablen generieren
Datensatz vervollständigen
Variablen umbenennen (Mplusakzeptiert nur Variablen mit 8 Zeichen)
Fehlende Werte eintragen
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 54
Aufgaben
Bitte die Syntax_1 über den Datensatz
„healthworkers.sav“ laufen lassen.
Abspeichern der neuen Datei unter „healthworkers2-sav“.
Vergleich => Welche Unterschiede lassen sich
feststellen?
Öffnen der Datei „healthworkers_0.dat“ mit dem
Texteditor. Vergleichen Sie den SPSS-Datensatz mit
dem Texteditor
Besprechen der Besonderheiten von Mplus.
Nächster Schritt: Berechnen einer explorativen
Faktorenanalyse in SPSS.
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 55
Teil 2 (2):
Explorative Faktorenanalyse
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 56
Exploratory Factor Analysis (1)
In einer EFA wird versucht zu identifizieren, welche
Variablen am besten eine „Tiefenstruktur“ an latenten
Variablen (Faktoren) messen.
Die Bedeutung dieser Faktoren muss interpretiert werden
(„Qualitizing“ – vgl. Kuckartz, 2014).
EFA gilt als exploratives Verfahren, das Modelle
entwickelt („model building“) und Beziehungen zwischen
Variablen beschreibt.
Ziel einer EFA ist, ein sogenanntes „best“-Modell für das
Verhältnis der beobachteten Variablen und der ihnen
zugrunde liegenden Faktoren abzuleiten.
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 57
Explorative Faktorenanalyse (vgl. AB_2)
Vorüberlegung??
Analysieren
Datenreduktion
Faktorenanalyse
Variablen auswählen: Item 1 bis Item 18
Deskriptive Statistik
Ausgangslösung
Extraktion
Screeplot
Rotation
Varimax
Scores
Als Variable speichern
Optionen
Kleine Koeffizienten unterdrücken (vgl. nächste Seite)
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 58
Vorüberlegungen
Wenn in der Planungsphase dafür gesorgt wurde, dass auf jeden zu
erwartenden Faktor zehn oder mehr Variablen entfallen, ist ein
Stichprobenumfang von n = 150 ausreichend.
Wenn auf jeden bedeutsamen Faktor mindestens vier Variablen
Ladungen über 0,60 aufweisen, kann die Faktorenstruktur
ungeachtet der Stichprobengröße generalisierend interpretiert
werden.
Das Gleiche gilt für Strukturen mit Faktoren, auf die jeweils zehn bis
zwölf Variablen mit Ladungen um 0,40 oder darüber laden.
Faktorenstrukturen, auf denen nur wenige Variablen geringfügig
laden, sollten nur interpretiert werden, wenn n ≥ 300 ist. Für n ˂ 300
ist die Interpretation der Faktorenstruktur von den Ergebnissen einer
Replikation abhängig zu machen.
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 59
Schritt 3:
Theorieentwicklung mittels EFA in SPSS
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 60
Modellentwicklung und Modellprüfung
Ziel unseres Vorgehens ist, ein Modell mittels einer
explorativen Faktorenanalyse zu entwickeln und dieses
Modell mit einer konfirmatorischen Faktorenanalyse zu
prüfen.
Beide Schritte können nicht mit demselben Datensatz
durchgeführt werden!
In anderen Worten: Wir brauchen einen anderen
Datensatz.
Lösungsmöglichkeit: Teilen des Datensatzes in zwei
Hälften.
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 61
Analysieren: Variablen auswählen
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 62
Deskriptive Statistik
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 63
Extraktion
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 64
Kaiser-Guttman-Kriterium
Eigenwerte = Summe der
quadrierten Faktorladungen eines
Faktors über alle Variablen, d. h.
EW = σ𝑗 𝑎 2𝑗𝑞
(wird von SPSS
automatisch berechnet).
Rotation
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 65
Optionen
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 66
Wie handeln wir „missing
values“?
Kleine Koeffizienten (vgl.
Folie 58)
Exkurs: Fehlende Werte (FW)
„The only really good solution to the missing data problem is
not to have any“ (Allison, 2001)
Klassische Verfahren (SPSS):
– Listenweiser Fallausschluss: Person fällt bei der Berechnung
aller Koeffizienten heraus.
– Paarweiser Fallausschluss: Person fällt bei der Berechnung des
entsprechenden Kennwertes heraus.
– Mittelwertersetzung (=> Varianzvernichtung)
Imputationsverfahren:
– Regression (=> Überschätzung des Zusammenhangs)
– LOCF
– (Multiple) Imputationen
Grenzwert: < 5 %
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 67
FW: Ersetzung durch Mittelwert
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 68
FW: Ersetzung durch Regressionsgerade
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 69
1. Voreinstellung: „x“ Faktoren
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 70
Ergebnisse EFA_1: Screeplot
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 71
Berechnen einer EFA mit drei Faktoren
Bitte Syntax_2 laden
Hinweise auf Änderung
Berechnen
Ergebnisse
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 72
EFA (1)
Modellentwicklung
– Aufgrund der von uns durchgeführten explorativen
Faktorenanalyse haben wir ein Modell zur
„Arbeitsplatzzufriedenheit“ entwickelt, welches aus
drei Faktoren besteht.
Modellvalidierung bzw. -testung
– Die von uns als
• „Faktor 1“,
• „Faktor 2“ und
• „Faktor 3“
bezeichneten Faktoren sind nun mittels CFA zu
prüfen. Dieser Schritt erfolgt mit Mplus.
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 73
EFA (2)
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 74
Vgl. Arbeitsblatt 3
Interpretation der Faktoren (Qualitizing)???
– F 1:
– F 2:
– F 3:
Wichtig: Widerspruch zu Döring und Bortz
(2010).
Interpretation & Ergebnisse der EFA
Eigene Zusammenfassung bzw. Interpretation der
Ergebnisse mit Blick auf:
– Kommunalitäten
– Screeplot
– Rotierte Komponentenmatrix
– Inhaltliche Benennung der Faktoren
Entscheidung für ein Modell mit drei Faktoren, die
folgende Bezeichnungen haben und aus folgenden
Variablen bestehen:
– Faktor 1:
– Faktor 2:
– Faktor 3:
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 75
Teil 3:
Konfirmatorische Faktorenanalyse
- Theorie & Empirie -
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 76
Confirmatory Factor Analysis (1)
Eine CFA wird verwendet, um zu prüfen, wie gut die
explorativen Modelle tatsächlich sind.
In einer CFA wird zuerst das Modell definiert, das von
einer EFA, eigenen theoretischen Annahmen und einer
Literaturanalyse abgeleitet wurde.
Die Anzahl der Variablen und Faktoren sowie deren
Beziehungen sind festgelegt.
ACHTUNG: Eine CFA kann nicht mit denselben Daten
erfolgen wie die EFA => Random50 = 0
Eine CFA ist der erste Schritt bei der Entwicklung eines
Strukturgleichungsmodells, d. h., ein SEM hat noch
etwas „mehr“ als eine CFA.
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 77
Confirmatory Factor Analysis (3)
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 78
Unser Modell
F 1 „Teamwork“
Item 1_1 (TEAMWORK1)
Item 1_2 (TEAMWORK2)
F 2 „Soziale Unterstützung“
Item 2_1 (SOCSUP1)
Item 2_2 (SOCSUP2)
F 3 „Jobzufriedenheit“
Item 3_1 (JOBSAT1)
Item 3_2 (JOBSAT2)
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 79
Vorgehen
CFA/SEM-Wiederholung
Kennenlernen von Mplus
Schreiben einer ersten Syntax
Syntax für CFA
Ergebnisinterpretation
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 80
CFA/SEM-Wiederholung
In einer CFA wird zuerst ein Modell definiert, das von
einer EFA, eigenen theoretischen Annahmen und einer
Literaturanalyse abgeleitet wurde.
Im Idealfall wird das Modell gegenüber Alternativ-
Modellen getestet. Ziel ist herauszufinden, welches
Modell das Beste ist.
Verfahren: Goodness-of-fit Tests (fit indices)
– AIC/BIC
– CFI/TLI
– RMSEA [Root Mean Square Error of Approximation]
SEM: Erweiterung einer CFA, indem Kausalitätspfade
eingebaut werden (Pfadanalyse!). Effektprüfung!
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 81
Eigene theoretische Vorüberlegungen
Faktor 1 Faktor 2 Faktor 3
Item 1_1 0,912
Item 1_2 0,891
Item 2_1 0,904
Item 2_2 0,767
Item 3_1 0,894
Item 3_2 0,744
Bezeichnung Soziale
Unterstützung
Teamwork Jobzufriedenheit
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 82
Softwarepaket Mplus 8.1 Demo
Es gibt kein spezifisches Mplus Datenformat, so wie etwa
bei SPSS (*.sav).
Mplus kann aber mit Datensätzen aus SPSS und Stata
arbeiten, allerdings kann es diese nicht direkt laden.
Wir benötigen Datensätze in ASCII-Format (American
Standard Code for Information Interchange) als externen
Datensatz.
Dies und anderer Besonderheiten erfordern eine
entsprechende Vorbereitung des Datensatzes.
Datensatz „coaching.dat“ wird verwendet.
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 83
Softwarepaket Mplus 8.1 Demo
Die von uns benutzte Demoversion kann
– 6 abhängige Variablen
– 2 unabhängige Variablen und
– 2 „between variables“ für eine 2-Ebenen-Analyse
bearbeiten.
Allerdings kann Mplus wesentlich mehr Variablen
einlesen, sodass wir einen umfangreicheren SPSS-
Datensatz vorbereiten können.
Variablennamen in Mplus sollten nur 8 Zeichen haben;
bitte Umlaute vermeiden.
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 84
Syntax: Befehle und Unterbefehle
TITLE:
DATA:
VARIABLE:
DEFINE:
ANALYSIS:
MODEL:
OUTPUT:
SAVEDATA:
PLOT:
MONTECARLO:
-----------------------------
Diese Befehle werden in den Mplus Editor geschrieben und durch
einen Doppelpunkt beendet; dann erscheinen sie in blauer Schrift!
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 85
!! Von diesen 6 Befehlen sind
die fettgedruckten diejenigen,
die am häufigsten verwendet
werden !!
Weiteres Vorgehen
CFA unseres Modells
Programmschritte
– Daten einlesen (Syntax 1)
• Deskriptive Statistik
– Modellprüfung
• Der ANALYSIS Befehl
• Der MODEL Befehl
Analyse und Bewertung des Modells
Erweiterung des Modells zu einem SEM
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 86
Schritt 4:
Theorieprüfung mittels CFA in Mplus
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 87
Mptext1: Daten einlesen und prüfen
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 88
Bitte genau prüfen!!!
Mptext2: „Analysis“ & „Model“-Befehl
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 89
Einige Unterbefehle für
„Model“:
by = defining a factor
on = regressed upon
with = correlate with
Grafische Darstellung der CFA
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 90
Erläuterungen Doppelpfeile zwischen den
Faktoren: Korrelationen
(SE)
Werte links von Faktoren:
Varianzen (SE)
Werte bei einfachen
Pfeilen links:
Faktorladungen (SE)
Werte bei einfachen
Pfeilen rechts:
Residualvarianzen (SE)
Interpretation des Messmodells (CFA)
Bitte formulieren Sie Ihre eigene Interpretation hier:
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 91
Teil 4:
Strukturgleichungsmodelle mit Mplus
– Theorie & Empirie –
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 92
Structural Equation Model (1)
Eine CFA sollte einem SEM immer vorausgehen, aber
ein SEM erweitert ein Messmodell, indem Kausalitäten
zwischen den Faktoren hinzugefügt werden.
Ein SEM wird auch als Pfadmodell bezeichnet und ist
deshalb an weithin akzeptierte Definitionen und
Notationen gebunden.
– Rechtecke repräsentieren beobachtete Daten.
– Ovale repräsentieren latente Konstrukte, also z. B.
Faktoren.
– Einfache Pfeile stehen für kausale Zusammenhänge.
– Bipolare Pfeile stehen für Korrelationen zwischen
Variablen.
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 93
SEM (2): Erweiterung des Modells CFA
Herstellen von Kausalität mit dem Ziel einer
konsistenteren Theorie
Grundidee:
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 94
Faktor 1 Faktor 2
Item 1 Item 2 Item 3 Item 4
Effekt
SEM (3): Unser Modell
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 95
Item 1_2
Item 1_1
Item 2_1
Item 2_2
Item 3_2
Item 3_1
F1
F2
F3a
b
C‘
Testing for mediation: Total effect c = a*b + c‘
Error terms missing!!!
Zwischenfazit
Strukturgleichungsmodelle …
– … werden als eine Klasse von Methodologien
definiert, die versuchen, Hypothesen über Mittelwerte,
Varianzen und Kovarianzen von beobachteten Daten
in Bezug auf eine geringere Anzahl an Parametern
darzustellen,
– … beschreiben und erklären Kausalitäten,
– … gelten deshalb als Erweiterung von
konfirmatorischen Faktorenanalysen und
– … werden als deutlich stärkere Alternative zu
multiplen Regressionen gesehen.
Sie erfordern den Einsatz spezieller Software!
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 96
Schritt 5:
Kausalität mittels SEM in Mplus
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 97
Vorüberlegungen
Direkte und indirekte Effekte:
Faktoren (latente Konstrukte)
– Faktor 1:
– Faktor 2:
– Faktor 3:
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 98
Faktor 1 Faktor 2
Faktor 3a b
C´
Vorüberlegungen
Direkte und indirekte Effekte:
Syntax
– Model constraint:
– New(c);
– c = a*b;
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 99
Faktor 1 Faktor 2
Faktor 3a b
C´
Hypothesen
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 100
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 101
Mptext3 input
Messmodell durch konfirmatorische
Faktorenanalyse
Strukturgleichungsmodell durch
Einbau von Kausalitäten
Mptext3 output graph
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 102
Interpretation des Modells
Bitte formulieren Sie Ihre eigene Interpretation hier:
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 103
Modifikation des Modells
Welche Modellalternativen sind theoretisch denkbar?
Berechnen Sie ein solches Modell.
Vergleichen Sie die Modellgüte anhand der Fit Indizes.
-------------------------------------------------------------------------------
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 104
Zusammenfassung & Interpretation
Ziel war die Entwicklung und Prüfung einer
konsistenteren Theorie.
Was wissen wir nach der Entwicklung eines
SEM mehr – im Vergleich zu einem reinen
ANOVA-Ansatz?
– Ziele des ANOVA-Ansatzes?
– Ziele des SEM-Ansatzes?
– Inhaltliche Verbesserung unseres Modells?
– Mögliche weitere Steigerung?
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 105
Teil 5:
Übungen
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 106
Übungsdatensatz „Lehrergesundheit“
SPSS
• Schreiben Sie eine kurze Syntax für Ihr Vorhaben
• Verschaffen Sie sich einen Überblick über den Datensatz
• Erstellen Sie einen Datensatz im free format
• Berechnen Sie eine EFA
Mplus
• Vergleichen Sie die deskriptiven Koeffizienten
• Berechnen Sie eine CFA
• Entwickeln Sie ein SEM (theoriegeleitet)
• Berechnen Sie ein SEM
• Was sind Modellalternativen?
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 107
Teil 6:
Weitere Modellansätze
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 108
SEM
Mehrebenen-Ansätze
KMFA
Veränderungs-messungen
Analyse von Variabilität
Messung von Trait-
Veränderungen
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 109
Untersuchungsdesigns
Kohorte
1920 20 40 60 80
1940 0 20 40 60 80
1960 0 20 40 60 80
1980 0 20 40 60
2000 0 20 40
Testzeit 1940 1960 1980 2000 2020 2040
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König 110
Querschnitt
Längsschnitt
„Nested data“ – Mehrebenen-Ansätze
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 111
Ein fiktives Beispiel
Prof. Dr. S. König Folie 112Bad Herrenalb, den 19. & 20.2.2019
Das Ein-Ebenenmodell
Alter in Jahren
W_SpU
4
3
2
1
0
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 113
Das Zwei-Ebenenmodell
Alter in Jahren
Nicht_Gym
GymW_SpU
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 114
Die inhaltliche
Perspektive
Prof. Dr. S. König Folie 115Bad Herrenalb, den 19. & 20.2.2019
Datenstruktur in den Sozialwissenschaften
Daten aus Studien in den Verhaltens-, Sozial-
oder Wirtschaftswissenschaften zeigen sehr
häufig hierarchische Strukturen, weil Individuen
in größeren Einheiten bzw. Gruppen
zusammengefasst sind.
Beispiele (vgl. Luke, 2004)
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 116
„Nested data structure“
Studien zur Unterrichtsforschung haben häufig den Nachteil, dass
die Stichproben nicht repräsentativ oder/und zufällig sind. Vielmehr
werden ganze Klassen herangezogen, die wiederum
Organisationseinheiten bestimmter Schulen sind.
„Nested data structure“ (Singer & Willett, 2003; Luke, 2004; Snijders
& Bosker, 2012).
“Intact subgroups” (Campbell & Stanley, 1963; Newman, Newman &
Salzman, 2010; Schoonenboom, 2016).
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 117
Mögliche konzeptuelle Probleme
Gemessene Werte von Individuen werden
letztendlich auch durch die aggregierte Einheit
beeinflusst, z. B. das Lernklima (Helmke, 2007) in
einer Klasse oder die Sozialstruktur einer
Wohngegend (Onwuegbuzie & Hitchcock, 2015).
Die Missachtung einer hierarchischen Datenstruktur
führt zu konzeptuellen Problemen (Hox, 2010, S. 3f),
wie etwa
– einem ökologischen Fehlschluss oder
– einem atomistischen Fehlschluss bzw. Simpson‘s
Paradox
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 118
Mögliche konzeptuelle Probleme
Gemessene Werte von Individuen werden
letztendlich auch durch die aggregierte Einheit
beeinflusst, z. B. das Lernklima (Helmke, 2007) in
einer Klasse oder die Sozialstruktur einer
Wohngegend (Onwuegbuzie & Hitchcock, 2015).
Die Missachtung einer hierarchischen Datenstruktur
führt zu konzeptuellen Problemen (Hox, 2010, S. 3f),
wie etwa
– einem ökologischen Fehlschluss oder
– einem atomistischen Fehlschluss bzw. Simpson‘s
Paradox.
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 119
Inhaltliche Zielsetzung eines MLM
Grundidee MLM ist, den Einfluss einer jeweils
höheren Ebene auf die darunter liegende Ebene zu
modellieren bzw. zu schätzen.
In anderen Worten: Ziel von Mehrebenen-
Modellierungen ist, die abhängige Variable, die sich
auf der untersten Ebene befindet, durch Prädiktoren
auf verschiedenen Ebenen zu schätzen.
Solche Schätzungen sind statistisch durch
verschiedene Verfahren möglich, wobei
Regressionsmodelle und Kovarianz-Modelle zentral
sind.
Bad Herrenalb, den 19. & 20.2.2019Prof. Dr. S. König Folie 120
Die statistische
Perspektive
Prof. Dr. S. König Folie 121Bad Herrenalb, den 19. & 20.2.2019
Statistische Argumente
Traditionelle Methoden, wie z. B. Regressions-
oder Varianzanalyse, sind sogenannte
Ein-Ebenen-Methoden; das heißt, sie nehmen
an, dass Werte von Individuen unabhängig sind.
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 122
Verletzung dieser Annahme
Verzerrungen bei statistischen Schätzungen
Zweifelhafte Signifikanzen
Hauptfehler: Aggregation & Disaggregation
Variablenverschiebung
Aggregation
Die Daten der Ebene 1
werden zusammengefasst
und auf der Ebene 2
betrachtet.
Konsequenzen:
– ‚Bedeutungsveränderung‘
– ‚Inhaltliche Fehlschlüsse‘
– „Cross-level interaction“ wird
ausgeschlossen
Disaggregation
Die Daten der Ebene 2
werden nicht betrachtet,
lediglich Ebene 1 wird
ausgewertet.
Konsequenzen:
– Stichprobeneffekt wird
künstlich erhöht, was zu
Verzerrungen führt.
– ‚Vernichtung‘ der
Zusammenhänge
Prof. Dr. S. König Folie 123Bad Herrenalb, den 19. & 20.2.2019
Grundprinzip der MLMs
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 124
Es ist zu prüfen, ob die Varianz zwischen den Gruppen
(„between“) größer ist als die Varianz innerhalb der Gruppen
(„within“). Ist dies der Fall, ist ein MLM angezeigt. Prüfung
durch …
… grafische Datenanalyse oder/und
… Berechnung des ICC.
Grafische
Datenanalyse
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 125
Der Intraclass Correlation Coefficient (ICC)
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 126
Zwischenfazit
In den Sozialwissenschaften und Fachdidaktiken
liegen häufig geschachtelte Datensätze vor;
d. h., die Probanden sind auf einer „höheren“
Ebene aggregiert.
Das ist nicht bedeutungslos, da etwa Klassen-
oder Schulkontext Einstellungen auf
Individualebene beeinflussen können.
MLMs modellieren den Kontexteinfluss, der
durch die Gruppe, der ein Individuum angehört,
erzeugt wird.
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 127
Transfer auf
„healthworkers“
Prof. Dr. S. König Folie 128Bad Herrenalb, den 19. & 20.2.2019
Transfer „healthworkers“ (1)
Unsere Analysen haben ein drei-faktorielles SEM
ergeben, das „Jobzufriedenheit“ über „Teamwork“ und
„social support“ und auf der Basis von n = 600 erklärt.
Analog zu den einleitenden Überlegungen haben wir die
jeweilige Firma nicht berücksichtigt; dies kann zu
Verzerrungen („bias“) führen.
Lösung: Modell, welches Zusammenhänge und
Kausalitäten auf zwei, die, … Ebenen abbildet und
zusätzlich deren Zusammenhang modelliert.
Dieser Ansatz funktioniert für verschiedene Verfahren
und kann mit unterschiedlicher Software durchgeführt
werden.
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 129
Transfer „healthworkers“ (2)
Neuer Datensatz: „companydata_emplevel.dat“
Merkmale:
– N Employees = 841
– N Companies = 44
Geschlecht:
– Weiblich (0) = 127
– Männlich (1) = 714
Weitere Variablen: cf. Arbeitsblatt 4
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 130
Transfer (3)
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 131
Firmen werden dummy-kodiert, wobei die beiden Dummies folgende
Kategorisierung vornehmen:
C_TPDUM1 = company training provider outsourced vs. inhouse
C_TPDUM2 = company training provider mixed vs. inhouse
TENURE = length of time employed at this company (years)
JOBSAT = Mean Score – Job Satisfaction (high score = high
satisfaction)
Effects modelled as random: intercept
Modellbildung
Bei unseren bisherigen Analysen haben wir eine
Strategie statistischer Modellbildung noch nicht
betrachtet: Die „Suche“ nach einem ‚best model‘; d. h. es
werden mehrere theoretisch hergeleitete Modelle
(„Theories first“) verglichen.
Diese „model testing strategy“ funktioniert „bottom up“.
Dies erfolgt aufgrund der eingangs besprochenen fit
indizes sowie einem Vergleich einzelner Modelle mittels
chi2-Test (=> Excel-Datei!).
Vergleich lineare Regression: „R2“
Ziel: Das Modell zu finden, dass am besten zu den
beobachteten Daten passt.
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 132
Multilevel Models
Prof. Dr. S. König Folie 133Bad Herrenalb, den 19. & 20.2.2019
Model Testing Strategy
Unconditional model [4_1]
Adding potentially confounding variables [4_2]
Adding the main effect of amount of training [4_3]
Adding the main effect of quality of training [4_4]
Allowing the amount of training to become random [4_5]
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 134
Modell 1: „unconditional model“ [4_1]
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 135
Modell 2: Hintergrundfaktoren [4_2]
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 136
Modell 3: + Fortbildungshäufigkeit (W) [4_3]
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 137
Modell 4: + Fortbildungsqualität (B) [4_4]
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 138
Modell 5: „Slopes at random“ [4_5]
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 139
Modell 5: „Slopes at random“ [4_5]
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 140
Zusammenfassung MLM
Vorgehen nach einer „bottom up testing strategy“.
ABER: Modelle müssen theoretisch begründet bzw.
abgeleitet sein („theories first“).
Vergleich der Modelle mittels verschiedener Koeffizienten
und chi2-testing.
Ziel: „best model“, aber vermeiden von sog. „model
overloading“ => Sparsamkeit!
Wichtige Mplus Befehle (zusätzlich zu den bisherigen):
within, between, center.
Derzeit keine grafischen Möglichkeiten bei Mplus!
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 141
Multilevel CFA
Prof. Dr. S. König Folie 142Bad Herrenalb, den 19. & 20.2.2019
Datensatz „Support_emplevel.dat“
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 143
Modell 1: Nullmodell, ICC [5_0]
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 144
Datenimport und ICC (1)
Variable Residual
variance
Between
Department
Variance
ICC (1) Variable Residual
variance
Between
Department
Variance
ICC (1)
JOBSAT1 Support1
JOBSAT2 Support2
JOBSAT3 Support3
TMWork1 Support4
TMWork2 Support5
TMWork3 Support6
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 145
For further details see:
http://www.statmodel.com/Download/ICC.pdf
Modell 2: Messmodell „4F“ auf Level 1
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 146
Modell 3: Messmodell „3F“ auf Level 1
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 147
Modell 4: Messmodell auf W & B
Hox (2010) empfiehlt, zuerst zwei Benchmark Modelle zu rechnen,
und zwar das einfachste und das beste Modell.
Als einfachstes Modell gilt das Modell, welches als „independence
model“ bezeichnet wird, d. h. es gibt keine Bezüge zwischen den
Variablen.
– Sollte dieses Modell zutreffen, würde das bedeuten, dass es auf
der Ebene „department“ kein schlüssiges Konzept gibt.
Als bestes Modell wird das „saturated model“ bezeichnet, welches
unabhängige Korrelationen zwischen jedem einzelnen Variablenpaar
spezifiziert (relativ komplex).
Sollte dieses Modell zutreffen, würde das bedeuten, dass jede
beobachtete Variable mit jeder zusammenhängt.
Diese beiden Modelle stellen den unteren bzw. oberen Richtwert für
ein realistischeres, sprich einfacheres Modell dar.
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 148
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 149
Model Chi-sq,
df
Chi-sq
change, df
change
CFI RMSEA SRMR
a) Four factor model at the
employee level,
independence model at
the department level
b) Four factor model at the
employee level, three
factor model at the
department level
c) Four factor model at the
employee level, four
factor model at the
department level
d) Four factor model at the
employee level,
saturated model at the
department level
Modell 5_4a
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 150
Modell 5-4d
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 151
Modell 5_4b
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 152
Modell 5_4c
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 153
Zusammenfassung MCFA
MCFA ist eine Verknüpfung der Ansätze MLM und CFA,
die ebenfalls nach einer „bottom up“-Strategie vorgeht.
Entscheidend ist auch hier der Ansatz „theories first“, der
sich auf Faktorenstrukturen auf beiden Ebenen bezieht.
Üblicherweise wird zuerst die untere Ebene modelliert,
danach wird mit dem besten level 1 Modell die höhere
Ebene modelliert. Hierbei stellen Nullmodell und
saturiertes Modell die beiden benchmarks dar.
Folglich können auf den beiden Ebenen unterschiedliche
Mediatoren und Faktorenstrukturen angenommen
werden.
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 154
Teil 7:
Zusammenfassung & Diskussion
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 155
SEM
– gelten als eine “class of methodologies that seeks to
represent hypotheses about the means, variances and
co-variances of observed data in terms of a smaller
number of structural parameters defined by a
hypothesized model”
– take into account the modeling of … multiple latent
independents (factors) each measured by multiple
indicators, and one or more latent dependents each
with multiple indicators.
Als übliches Procedere gelten EFA CFA SEM
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 156
Grundprinzip: Suche eines “best model” nach dem
“bottom up” Prinzip
SEM werden theoretisch begründet und empirisch mittels
verschiedener „fit indices“ verglichen.
SEM existieren in verschiedenen Varianten
– Cross-sectional models
– Multilevel models
– Longitudinal models
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 157
Teil 8:
Literaturvorschläge
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 158
Quellen & Hinweise
Backhaus, K., Erichson, B., Plinke, W. & Weiber, R. (2006). Multivariate
Analysemethoden. Eine anwendungsorientierte Einführung (11. Aufl.). Berlin,
Heidelberg, New York: Springer.
Bortz, J. & Schuster, C. (2010). Statistik für Human- und
Sozialwissenschaftler (7. Aufl.). Berlin, Heidelberg: Springer.
Bühl, A. (2012). SPSS 20. Einführung in die moderne Datenanalyse (13.,
aktualisierte Aufl.). München: Pearson.
Geiser, C. (2011). Datenanalyse mit Mplus. Eine anwendungsorientierte
Einführung (2. Aufl.). Wiesbaden: VS Verlag.
Hox, J. J. (2010). Multilevel Analysis: Techniques and Applications. Oxford:
Routledge Academic.
Kline, R. B. (2005). Principles of Practice of Structural Equation Modeling
(2nd ed.). New York/London: Guilford Press.
Lüdtke, O., Trautwein, U., Schnyder, I. & Niggli, A. (2007). Simultane
Analysen auf Schüler- und Klassenebene. Zeitschrift für
Entwicklungspsychologie und Pädagogische Psychologie, 39(1), 1–11.
Bad Herrenalb, den 19. & 20.2.2019 Prof. Dr. S. König Folie 159
Folie 160Weingarten, den 07. JUli 2009 Folie 160
Herzlichen Dank für
Ihre Aufmerksamkeit.
www.ph-weingarten.de
Bad Herrenalb, den 19. & 20.2.2019 Folie 160Prof. Dr. S. König