MEHREBENENANALYSE: ANGEMESSENE MODELLIERUNG VON … · 2009-05-13 · Dr. Manuela Pötschke Lehre...

21
Dr. Manuela Pötschke MEHREBENENANALYSE: ANGEMESSENE MODELLIERUNG VON EVALUATIONSDATEN Potsdam 27. März 2009

Transcript of MEHREBENENANALYSE: ANGEMESSENE MODELLIERUNG VON … · 2009-05-13 · Dr. Manuela Pötschke Lehre...

Page 1: MEHREBENENANALYSE: ANGEMESSENE MODELLIERUNG VON … · 2009-05-13 · Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009 HIERARCHISCHE

Dr. Manuela Pötschke

MEHREBENENANALYSE:ANGEMESSENE MODELLIERUNG VON EVALUATIONSDATEN

Potsdam 27. März 2009

studeval
Textfeld
10. Jahrestagung des Arbeitskreises Evaluation und Qualitätssicherung Berliner und Brandenburger Hochschulen Lehre und Studium professionell evaluieren: Wie viel Wissenschaft braucht die Evaluation? Universität Potsdam, 26.03.-27.03.2009 Forum 5: Evaluation und fortgeschrittene Analyseinstrumente
Page 2: MEHREBENENANALYSE: ANGEMESSENE MODELLIERUNG VON … · 2009-05-13 · Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009 HIERARCHISCHE

Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009

Neue Anforderungen an Evaluation (hier aus Fachbereichssicht)

- Berichterstattung - Mittelzuweisung- Flächendeckende Evaluationen- Konsequenzen?- Bezug der Beurteilung?- Kriterien der Beurteilung?- Komplexität der erhobenen Daten

HINTERGRUND

2

Page 3: MEHREBENENANALYSE: ANGEMESSENE MODELLIERUNG VON … · 2009-05-13 · Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009 HIERARCHISCHE

Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009

HIERARCHISCHE DATENSTRUKTUR

Eval1

Eval10Eval2

Eval3

Eval9Eval12

Eval14 Eval15

Eval13

Eval11

Eval5

Eval7 Eval8

Eval6

Eval4

Veranstaltung 1 Veranstaltung 2 Veranstaltung 3 Veranstaltung 4

Dozent 1 Dozent 1

1. Ebene: studentisches Urteil (N≈2300)

2. Ebene: Veranstaltung (N=150)

3. Ebene:Dozent (N=60)

Page 4: MEHREBENENANALYSE: ANGEMESSENE MODELLIERUNG VON … · 2009-05-13 · Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009 HIERARCHISCHE

Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009

DAS EMPIRISCHE BEISPIEL: ERKLÄRUNG INDIVIDUELLER LEHREVALUATIONSURTEILE

studentisches Urteil (N≈2300)

Veranstaltung (N=150)

Dozent (N=60)

Unabhängige Variablen Abhängige Variable

Studentisches Evaluationsurteil

GeschlechtStatusgruppe: Professor, Promovierter Mitarbeiter, nicht promovierter MitarbeiterPersönlichkeitseigenschaften: Sympathie, Kreativität, Offenheit, Attraktivität, Kompetenz (N=30)

Fach: Soziologie, Politikwissenschaft, Geographie, Religionswissenschaft, Master PolitikVeranstaltungstyp: Vorlesung, Seminar, Übung

Aussagen zur Veranstaltung, dem Stoff und dem DozentAussagen zur Lernatmosphäre und dem Verhältnis zu anderenEigene LeistungsbeurteilungGeschlecht, Fach

Page 5: MEHREBENENANALYSE: ANGEMESSENE MODELLIERUNG VON … · 2009-05-13 · Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009 HIERARCHISCHE

Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009

VERNACHLÄSSIGUNG DER DATENSTRUKTUR

5

Beispiel: Wie wirkt sich die eigenen Leistungsbeurteilung auf die Veranstaltungsbeurteilung aus?

Veranstaltungsbeurteilung: Alles in allem, wie beurteilen Sie die Qualität der Veranstaltung insgesamt? (1=sehr schlecht bis 11=sehr gut)

Leistung: eigene Leistungsbeurteilung der Studierenden (1=sehr gut bis 5= sehr schlecht)

Probleme:Unterstellung der Unabhängigkeit aller Beurteilungen der Studierenden über die Veranstaltungen und Dozenten hinwegglobales und wenig aussagekräftiges Bild, durch die ausschließliche Orientierung am Gesamtmittelwert über alle Veranstaltungen und alle Dozenten hinweg

05

10V

eran

stal

tung

sbeu

rteilu

ng

1 2 3 4 5eigene Leistungsbeurteilung

R2=0,0048 y=7,411-0,3082x+e (***)

Page 6: MEHREBENENANALYSE: ANGEMESSENE MODELLIERUNG VON … · 2009-05-13 · Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009 HIERARCHISCHE

Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009

AGGREGIERUNG DER INDIVIDUALDATEN

6

Probleme:• Durch die Aggregierung der Daten geht viel

Information, insbesondere aber die Varianzen innerhalb der Aggregateinheiten verloren.

• Die Aggregate werden im Rahmen eines solchen Vorgehens als in sich homogen betrachtet, was extrem fragwürdig ist.

• Die Ergebnisse auf der Aggregatebene weichen von den Ergebnissen auf der Individualebene teilweise erheblich ab (sog. aggregation bias)

• Die Untersuchung des Zusammenwirkens von Individual- und Aggregatvariablen ist nicht möglich

• Die Ergebnisse einer Aggregatanalyse lassen sich theoretisch nur schwer interpretieren. Jede Kausalinterpretation muss eigentlich auf individueller Ebene argumentieren, die Information über diese wurde durch die Aggregation jedoch fallen gelassen.

24

68

10

2 2.5 3 3.5mittelleist

R2=0,0005 y=5,963+0,2235x+e (n.s.)

Page 7: MEHREBENENANALYSE: ANGEMESSENE MODELLIERUNG VON … · 2009-05-13 · Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009 HIERARCHISCHE

Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009

DURCHFÜHRUNG SEPARATER REGRESSIONSANALYSEN

7

Probleme: • Hier wird zwar zugelassen, dass in den

verschiedenen Aggregateinheiten unterschiedliche Beziehungsstrukturen existieren, doch ist ein solches Vorgehen nur bei einer kleinen Zahl von Level-2-Einheiten praktikabel.

• Es ist im Rahmen dieses Vorgehens nicht möglich, den Einfluss von Aggregatvariablen auf die abhängige Variable (Kontexteffekt) und die Stärke des Effekts von Mikrovariablen (Cross-Level-Interaktion) zu untersuchen.

05

100

510

05

100

510

05

100

510

05

100

510

05

100

510

05

10

1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5

1 2 3 4 5 1 2 3 4 5 1 2 3 4 5

1 2 3 4 5 6 7 8 9 10 11 12

13 14 15 16 17 18 20 21 22 26 27 29

30 31 32 34 35 36 37 38 39 40 41 42

43 44 45 46 48 51 52 53 54 55 57 58

60 61 62 63 64 66 67 68 69 70 71 72

73 74 75 76 79 80 81 82 83 85 86 87

88 89 90 92 93 96 97 98 100 101 102 103

104 106 107 108 110 111 112 113 114 115 116 117

118 119 120 121 122 123 125 128 130 132 133 134

135 136 137 138 139 140 141 142 143 144 145 146

147 149 150

LeistungGraphs by Titlcode

Page 8: MEHREBENENANALYSE: ANGEMESSENE MODELLIERUNG VON … · 2009-05-13 · Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009 HIERARCHISCHE

Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009

„SLOPES AS OUTCOMES“-ANALYSEN

8

Probleme:• Die Koeffizienten der Regressionsmodelle innerhalb der Aggregateinheiten basieren in

der Regel auf sehr geringen Fallzahlen. Die Schätzwerte für Regressionskonstante und -koeffizienten sind daher nicht sehr reliabel. Wenige „Ausreißer“ können eine erhebliche Fehlervarianz bewirken („bouncing betas“)

• Angemessene Mehrebenenmodelle müssen daher die Stichprobengrößen, auf denen die Schätzer der Koeffizienten basieren, berücksichtigen.

• Keine Analyse von Cross-Level-Interaktionen möglich• Die „Slopes as Outcomes“-Analyse ist in der Regel beschränkt auf die Analyse einer

unabhängigen Mikro-Variablen.

Modellidee:Nachdem für jede Einheit der 2. Ebene ein separates Regressionsmodell geschätzt wurde, werde die Regressionsparameter Intercept und Slope aus diesen Regressionsmodellen durch Merkmale der 2. Ebene erklärt.

Page 9: MEHREBENENANALYSE: ANGEMESSENE MODELLIERUNG VON … · 2009-05-13 · Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009 HIERARCHISCHE

Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009

BEGRIFF UND IDEE DER MEHREBENENANALYSE

Man spricht immer dann von einer Mehrebenenanalyse, wenn „Objekte verschiedener Ordnung gleichzeitig zum Gegenstand der Analyse werden“ (Hummell 1972: 13) und ihre Wirkung auf eine abhängige Variable simultan bestimmt wird.

9

Mehrebenenanalysen als angemessenes Verfahren:

• spiegelt die Datenstruktur wieder und kommt deshalb zu korrekten Schätzungen• erlaubt die Analyse und Darstellung komplexer Datenstrukturen

Inhaltliche Begründung aus empirischen Studien und theoretischen ÜberlegungenMethodische Begründungen

Page 10: MEHREBENENANALYSE: ANGEMESSENE MODELLIERUNG VON … · 2009-05-13 · Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009 HIERARCHISCHE

Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009

LINEARE EINFACHREGRESSION

0 0τ =1 0τ =

ijy

ijx1

i 0 1 1i iy x e= β +β +

Page 11: MEHREBENENANALYSE: ANGEMESSENE MODELLIERUNG VON … · 2009-05-13 · Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009 HIERARCHISCHE

Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009

RANDOM INTERCEPT

11

0 0τ ≠ 1 0τ =

ijy

ijx1

00γRandom intercept

ijijjjij exy ++= 110 ββ

0 j 0 0 0 juβ = γ +wobei:

00 00γ − τ 00 00γ + τ00γ

Page 12: MEHREBENENANALYSE: ANGEMESSENE MODELLIERUNG VON … · 2009-05-13 · Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009 HIERARCHISCHE

Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009

RANDOM SLOPES

12

0 0τ = 1 0τ ≠

ijy

ijx1

Random slopes

10γ

ijijjjij exy ++= 110 ββ

1j 10 1juβ = γ +wobei:

10 11γ − τ 10 11γ + τ10γ

Page 13: MEHREBENENANALYSE: ANGEMESSENE MODELLIERUNG VON … · 2009-05-13 · Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009 HIERARCHISCHE

Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009

RANDOM SLOPE AND RANDOM INTERCEPT

0 0τ ≠ 1 0τ ≠

ijy

ijx1

001 <τ

ijijjjij exy ++= 110 ββ

0 j 0 0 0 juβ = γ +1j 10 1juβ = γ +

wobei:und

0 0τ ≠ 1 0τ ≠

ijy

ijx1

001 >τ

ijijjjij exy ++= 110 ββ

0 j 0 0 0 juβ = γ +1j 10 1juβ = γ +wob

ei:und

Page 14: MEHREBENENANALYSE: ANGEMESSENE MODELLIERUNG VON … · 2009-05-13 · Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009 HIERARCHISCHE

Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009

ni ,...,1=Jj ,...,1=

Einfügen von ...

jj u000 += ββ jj u111 += ββ

in ...

ergibt...

und

ijijjjij exy ++= 110 ββ

ijijjijjij exuxuy ++++= 111100 ββ

umgestellt:

MIXED FORM

ijijjjijij exuuxy ++++= 110110 ββ‚Random Part‘‚Fixed Part‘

Page 15: MEHREBENENANALYSE: ANGEMESSENE MODELLIERUNG VON … · 2009-05-13 · Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009 HIERARCHISCHE

Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009

MÖGLICHE EFFEKTE

15

Effekte von Individualvariablen

Effekte von Aggregatvariablen

Cross-Level-Interaktionen

3. Ebene

2. Ebene

1. Ebene

w

z

x y

3. Ebene

2. Ebene

1. Ebene

w

z

x y

3. Ebene

2. Ebene

1. Ebene

w

z

x y

Page 16: MEHREBENENANALYSE: ANGEMESSENE MODELLIERUNG VON … · 2009-05-13 · Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009 HIERARCHISCHE

Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009

WARUM MEHREBENENANALYSEN? POTENTIALE

16

• die Zerlegung der Gesamtvarianz in die durch die einzelnen Ebenen erklärbaren Varianzanteile.

• die gleichzeitige Untersuchung von Effekten unterschiedlicher Merkmale aus verschiedenen Aggregatebenen.

• den Einbezug von Wechselwirkungen über unterschiedliche Aggregatebenen hinweg(Cross-Level-Wechselwirkungen).

• die gleichzeitige Berücksichtigung zufälliger Variationauf unterschiedlichen Ebenen.

• die korrekte Schätzung von Standardfehlern in mehrstufigen Zufallsauswahlen.

Empty Model

Random Intercept Model

Cross Level Effect Model

Random Coefficient Model

Designeffekt

Page 17: MEHREBENENANALYSE: ANGEMESSENE MODELLIERUNG VON … · 2009-05-13 · Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009 HIERARCHISCHE

Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009

Leeres Modell ohne erklärende Variable(n)

ijk 0 0k 0 jk ijkVeranstaltungsevaluation r u e= β + + +

NULLMODELL: EMPIRISCHES BEISPIEL

17

Varianzzerlegung auf die Ebenen:

Dozent: 10,22 %Veranstaltung: 60,64 %Studierende: 29,14 %

Mittlere Schätzung über alle Personen in allen Gruppen hinweg: 6,42

Modellgüte: -2ll=8822,3916

var(r) = 1,2609τ00 = 7,4835σ2

e = 3,5968

Page 18: MEHREBENENANALYSE: ANGEMESSENE MODELLIERUNG VON … · 2009-05-13 · Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009 HIERARCHISCHE

Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009

VORLÄUFIGE EMPIRISCHE ERGEBNISSEErklärungen durch Variablen der ersten Ebene

Über die Ziele wurde gut informiert.(fünfstufig: stimme nicht zu - stimme zu)

Die Basisliteratur verstehe ich gut.(fünfstufig: stimme nicht zu - stimme zu)

Die Studierenden wurden gut betreut.(fünfstufig: stimme nicht zu - stimme zu)

Atmosphäre insgesamt(fünfstufig: sehr gut – sehr schlecht)

Ich bin schnell abgelenkt(fünfstufig: stimme nicht zu - stimme zu)

0,293***

0,161***

0,364***

-0,402***

-0,250*** -2ll = 6712,437***(zum Nullmodell)

var(r) = 0,8952τ00 = 8,7417σ2

e = 3,242

Page 19: MEHREBENENANALYSE: ANGEMESSENE MODELLIERUNG VON … · 2009-05-13 · Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009 HIERARCHISCHE

Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009

VORLÄUFIGE EMPIRISCHE ERGEBNISSEErklärungen durch Variablen der zweiten Ebene

Kein signifikanter Einfluss des Veranstaltungstyps, wenn um die Atmosphäre kontrolliert wird.

Über die Ziele wurde gut informiert.(fünfstufig: stimme nicht zu - stimme zu)Die Basisliteratur verstehe ich gut.(fünfstufig: stimme nicht zu - stimme zu)Die Studierenden wurden gut betreut.(fünfstufig: stimme nicht zu - stimme zu)Atmosphäre insgesamt(fünfstufig: sehr gut – sehr schlecht)Ich bin schnell abgelenkt(fünfstufig: stimme nicht zu - stimme zu)

Referenz Master PolitikSoziologiePolitikwissenschaftGeographieReligion

0,293***

0,163***

0,366***

-0,406***

-0,250***

5,1***3,898***4,923*3,533** -2ll = 6691,9616 ***

(zum letzten Modell und zum Nullmodell)

var(r) = 1,5149τ00 = 7,6337σ2

e = 3,2415

Page 20: MEHREBENENANALYSE: ANGEMESSENE MODELLIERUNG VON … · 2009-05-13 · Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009 HIERARCHISCHE

Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009

VORLÄUFIGE EMPIRISCHE ERGEBNISSEErklärungen durch Variablen der dritten Ebene

Keine signifikanten Einflüsse des Geschlechts des Dozenten.

Über die Ziele wurde gut informiert.(fünfstufig: stimme nicht zu - stimme zu)Die Basisliteratur verstehe ich gut.(fünfstufig: stimme nicht zu - stimme zu)Die Studierenden wurden gut betreut.(fünfstufig: stimme nicht zu - stimme zu)Atmosphäre insgesamt(fünfstufig: sehr gut – sehr schlecht)Ich bin schnell abgelenkt(fünfstufig: stimme nicht zu - stimme zu)Referenz Master PolitikSoziologiePolitikwissenschaftGeographieReligion

Referenz AssistentProfessorNicht promovierter Mitarbeiter

0,293***

0,163***

0,367***

-0,406***

-0,250***

5,342***3,732***5,732** 3,58**

1,474*0,627

Keine signifikanten Einflüsse der Persönlichkeitsmerkmale der Dozenten.

-2ll = 6686,1536 ***(zum Nullmodell)

var(r) = 1,2269τ00 = 7,7392σ2

e = 3,2412

Page 21: MEHREBENENANALYSE: ANGEMESSENE MODELLIERUNG VON … · 2009-05-13 · Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009 HIERARCHISCHE

Dr. Manuela Pötschke Lehre und Studium professionell evaluieren. Potsdam 26. bis 27. März 2009

FAZIT

21

Probleme mit/ in Mehrebenenmodellen• Hohe Anforderungen an die Struktur der Daten und die Stichprobenziehung• Konsequenzen der Verletzung von Modellannahmen noch nicht ausreichend untersucht• Inhaltliche gehaltvolle Variablen auf unterschiedlichen Aggregatebenen• Komplexität der impliziten Modellbeziehungen

Inhaltliche Schlussfolgerungen• Hinweise auf angemessene Schätzungen durch Mehrebenenmodelle, die erweiterte

Interpretationen zulassen• Ambivalente Befunde zu den Einflüssen von Persönlichkeitseigenschaften der Dozenten

bleiben bestehen• Keine Unterschiede in der Beurteilung von Frauen und Männern

Potentiale• Mehrebenenmodelle sind der Evaluationsdatenstruktur angemessen• Inhaltlich relevante zusätzliche Informationen für größere Einheiten• Informationen sind übersichtlich zu präsentieren• Einflüsse der Struktur und individueller Merkmale werden gleichzeitig einbezogen