In den 70er Jahren gab es eine Welle der Kritik an Tests: -Kritik an möglichen Nebenwirkungen von...

25
70er Jahren gab es eine Welle der Kritik an Tests: k an möglichen Nebenwirkungen von Testergebnissen ssung des Menschen mstabilisierung erung von Angst- und Konkurrenzdenken lschaftskritik der Kritik: ische Kritik an der Wachstumsgesellschaft als neomarxistische k am Kapitalismus Kritik an der empirisch orientierten Sozialwissenschaft k gegen quantitative Verfahren der empirisch orientierten Vorgehensw die Vertreter der Kritischen Theorie k technologischer Vorgehensweisen und die Betonung des Vorrangs von ktivität und subjektivem Verstehen.

Transcript of In den 70er Jahren gab es eine Welle der Kritik an Tests: -Kritik an möglichen Nebenwirkungen von...

Page 1: In den 70er Jahren gab es eine Welle der Kritik an Tests: -Kritik an möglichen Nebenwirkungen von Testergebnissen -Vermessung des Menschen -Systemstabilisierung.

In den 70er Jahren gab es eine Welle der Kritik an Tests:

-Kritik an möglichen Nebenwirkungen von Testergebnissen-Vermessung des Menschen-Systemstabilisierung-Steigerung von Angst- und Konkurrenzdenken-Gesellschaftskritik

Quelle der Kritik:

-politische Kritik an der Wachstumsgesellschaft als neomarxistische Kritik am Kapitalismus

-eine Kritik an der empirisch orientierten Sozialwissenschaft

-Kritik gegen quantitative Verfahren der empirisch orientierten Vorgehensweise durch die Vertreter der Kritischen Theorie

-Kritik technologischer Vorgehensweisen und die Betonung des Vorrangs von Subjektivität und subjektivem Verstehen.

Page 2: In den 70er Jahren gab es eine Welle der Kritik an Tests: -Kritik an möglichen Nebenwirkungen von Testergebnissen -Vermessung des Menschen -Systemstabilisierung.

Geschichtliche Aspekte der Pädagogischen Diagnostik

Aufgabenschwerpunkte, die sich im Laufe der Jahrhunderte herauskristallisierthaben:

-Diagnostik zur Verbesserung des Lernens-Diagnostik zur Erteilung von Qualifikationen

Eine Verbesserung des Lernens in einem planmäßigen Lehrvorgang schloss eine Beobachtung der Reaktionen des Lernenden auf den „Unterricht“ (Lernerfolg) immer schon ein.

Merkmale dieser frühen Beobachtung des Lernerfolgs in informellen Unterrichtssituationen:

-intuitiv und -ohne wissenschaftliche Reflexion.

Page 3: In den 70er Jahren gab es eine Welle der Kritik an Tests: -Kritik an möglichen Nebenwirkungen von Testergebnissen -Vermessung des Menschen -Systemstabilisierung.

Heute wird die Sicherung diagnostischer Gütekriterien (im Sinne von formalisierten Qualitätsmerkmalen) u.a. durch Ausbildungsregelungen, Prüfungsvorschriften und Aufsichtsbehörden unterstützt. Die Absicht einer stärkeren Regelung besteht darin, Willkür und Protektionzu verringern.

Die Diagnostik zur Verbesserung des Lernens konzentrierte sich im Laufe derZeit auf folgende Aufgaben:

„ 1. der Selbst- und Fremdkorrektur falscher Lernergebnisse, 2. dem Erkennen von Lerndefiziten, 3. der Bestätigung erfolgreicher Lernschritte, 4. der Planung nachfolgender Lernschritte, 5. der Motivierung durch Hinweis auf Lernerfolge und Steuerung des Schwierigkeitsgrads der nächsten Lernschritte, 6. der Verbesserung der Lernbedingungen.“ (Ingenkamp, 2005, S. 21)

Page 4: In den 70er Jahren gab es eine Welle der Kritik an Tests: -Kritik an möglichen Nebenwirkungen von Testergebnissen -Vermessung des Menschen -Systemstabilisierung.

Mit der Formalisierung des „Pflicht- und Massenunterrichts“ wurden diese Aufgaben in didaktische Systeme eingebaut bzw. eine Verfeinerungdiagnostischer Methoden vorangetrieben.

Der Anspruch auf Optimierung der Abstimmung individuellen Lernvoraussetzungenund den Lernangeboten brachte eine Reihe von Modellen zu Tage, dieunter dem Sammelbegriff „Adaptiver Unterricht“ (Schwarzer u.a., 1975) Eingang in die Literatur fanden. Ihre didaktischen Ausformungen hießen - „Programmierter Unterricht“,- zielerreichendes Lernen,- Aptitude-Treatment-Interaktion oder auch- „Computerunterstützes Lernen“ u.a.

Anspruch: Schaffung eines Arsenals möglichst genauer diagnostischer Verfahrensweisen, die ihrerseits den Gütekriterien - der Objektivität, - Zuverlässigkeit und - Gültigkeit Rechnung tragen.

Page 5: In den 70er Jahren gab es eine Welle der Kritik an Tests: -Kritik an möglichen Nebenwirkungen von Testergebnissen -Vermessung des Menschen -Systemstabilisierung.

Aptitude-Treatment-Interaktion, Begriff aus der Pädagogischen Psychologie; bezeichnet die Tatsache, daß die Effektivität bestimmter instruktionaler Maßnahmen (treatment) von Merkmalen der Lernenden (aptitude) abhängt. Mit anderen Worten: Es gibt kein Lernarragement, das für alle Lernenden optimal ist. Die Forschung zu Aptitude-Treatment-Interaktionen hat neben der Theorieentwicklung somit vor allem die Funktion, Wissen darüber bereitzustellen, welche Art von Lernenden wie am besten lernt. Obgleich die Annahme, daß die Gestaltung von Lernarrangements an die Eingangsvoraussetzungen der Lernenden angepaßt sein müssen, sowohl intuitiv als auch theoretisch plausibel ist, hat eine Vielzahl von Untersuchungen zu Aptitute-Treatment-Interaktionen eher heterogene und nicht leicht zu interpretierende Ergebnisse erbracht. Dennoch lassen sich aus den Befunden einige gut abgesicherte Verallgemeinerungen treffen. a) Je ungünstiger die Lernvoraussetzungen sind (niedrige Intelligenz, geringes domänenspezifisches Vorwissen und ausgeprägte Leistungsängstlichkeit), um so günstiger sind stark strukturierte und lehrergesteuerte Lernarrangements. b) Bei günstigen Lernvoraussetzungen ist es von Vorteil, den Lernenden Freiheitsgrade bei der Steuerung ihres Lernens zur Verfügung zu stellen. c) Zudem zeigte es sich, daß Lernende mit hoher Intelligenz und gutem Vorwissen weniger durch schlechte Lehre beeinträchtigt werden als Lernende mit ungünstigeren Voraussetzungen. A.R.

Literatur

Snow, R. E. (1989). Aptitude-treatment interaction as a framework of research in individual differences in learning. In P. L. Ackerman, R. J. Sternberg, & R. Glaser (Eds.), Learning and individual differences (pp. 13-59). New York, NY: Freeman.

Page 6: In den 70er Jahren gab es eine Welle der Kritik an Tests: -Kritik an möglichen Nebenwirkungen von Testergebnissen -Vermessung des Menschen -Systemstabilisierung.

Erteilung von Qualifikationen

Es besteht ein enges Verhältnis zur gesellschaftlichen Struktur und den als notwendig erachteten Qualifikationsanforderungen.

(z.B. die Einführung von Examina zur Besetzung von Ämtern in der prosperierenden Bürokratie und als Zugangsberechtigung zum Militär)

Mit der Pädagogischen Diagnostik zur Feststellung von Qualifikationenwar bis in die zweite Hälfte des 20. Jahrhunderts hinein ein eminent gesellschaftspolitisches Reformpotenzial zur Liberalisierung desindividuellen Aufstiegs verbunden. Karrieren sollten von den alten Erbhöfen losgelöst werden, d.h. nicht mehr Geburt, Religion, Geschlecht, Rasse, o.ä. sollten über den Zugang Zu gesellschaftlichen Positionen entscheiden, sondern alleine die individuelle Leistung/Qualifikationen.

Page 7: In den 70er Jahren gab es eine Welle der Kritik an Tests: -Kritik an möglichen Nebenwirkungen von Testergebnissen -Vermessung des Menschen -Systemstabilisierung.

Die Kennzeichnung der erworbenen persönlichen Qualifikationen erfolgte über das „Zeugnis“, in der Zensuren als eine Art Grobeinteilung Auskunft über den Abschluss eines „Lehrganges“ gaben und eine „Vorsortierung“ von Bewerbern unterstützten.

Schulische Begutachtung wird entscheidend für den Übergang zu denSekundarschulen:

-1850 Durchsetzung der Jahrgangsklassen -1920 Einführung der allgemeinen vierjährigen Grundschulzeit

Page 8: In den 70er Jahren gab es eine Welle der Kritik an Tests: -Kritik an möglichen Nebenwirkungen von Testergebnissen -Vermessung des Menschen -Systemstabilisierung.

Die Übertragung der Erteilung von Qualifikationen und Berechtigungen aufdie Schule hatte z.T. weitreichende Konsequenzen für die Pädagogische Diagnostik.

Zensur als

-Grobentscheidung des Berechtigungswesens-vorherrschendes Verfahren zur Kennzeichnung von Lernerfolgen

Kritik:

Zensuren enthalten zur wenige Informationen zur Verbesserung von Lernprozessen.

Analysen der Beurteilungspraxis führten bereits 1930 zur Entwicklung vonergänzenden Schultests im angelsächsischen Bereich.

In der Zeit des Nationalsozialismus waren vermeintlich objektive diagnostischeMethoden unerwünscht – Subjektivismus und weltanschauliche Gesinnungsforschungprägten die Praxis der Zensurengebung.

Page 9: In den 70er Jahren gab es eine Welle der Kritik an Tests: -Kritik an möglichen Nebenwirkungen von Testergebnissen -Vermessung des Menschen -Systemstabilisierung.

Neuansätze nach dem 2. Weltkrieg

ab 1960 bis 1980

-Schulleistungstests

-Einschulungstests

-Intelligenztests

-Eignungstests

-Konzentrationstests

Testkritik der 1970er Jahre

Page 10: In den 70er Jahren gab es eine Welle der Kritik an Tests: -Kritik an möglichen Nebenwirkungen von Testergebnissen -Vermessung des Menschen -Systemstabilisierung.

ab 1970

-Suche nach Beurteilungsalternativen - Diagnosebogen (Verbindung der Vorteile objektiver Instrumente mit traditionellen Beurteilungsformen)

-ziffernlose Zeugnisse und Zeugnisberichte

-Portfoliobeurteilung

ab ungefähr 1980 bis 2000 neue Verfahren

-Beurteilungsbogen zur Schulfähigkeit-curriculare Tests-Sprachstandserhebung-Evaluation von Fördermaßnahmen-Kriteriumstests-soziometrische Verfahren-Diagnosetests zur Studierfähigkeit

Page 11: In den 70er Jahren gab es eine Welle der Kritik an Tests: -Kritik an möglichen Nebenwirkungen von Testergebnissen -Vermessung des Menschen -Systemstabilisierung.

Diese Übersicht macht deutlich, dass die Pädagogische Diagnostik keine abgegrenzte, eigenständige und kontinuierliche Entwicklung als Teildisziplinerlebt hat, sondern sehr stark an die Entwicklungen ihrer Nachbardisziplinen gebunden bzw. von politischen und kulturellen Einflussgrößen abhängig ist.

Die Abhängigkeit der Pädagogischen Diagnostik lässt sich anhand derVorgehensmodellen in den Nachbardisziplinen diskutieren und mittels der Darlegung von kontrastierenden Positionen verdeutlichen.

Page 12: In den 70er Jahren gab es eine Welle der Kritik an Tests: -Kritik an möglichen Nebenwirkungen von Testergebnissen -Vermessung des Menschen -Systemstabilisierung.

1. Eigenschafts- versus Verhaltensdiagnostik

2. Ergebnis- versus Prozessdiagnostik

3. Selektions- versus Förderdiagnostik

4. Norm- versus Kriterienorientierung

Page 13: In den 70er Jahren gab es eine Welle der Kritik an Tests: -Kritik an möglichen Nebenwirkungen von Testergebnissen -Vermessung des Menschen -Systemstabilisierung.

Eigenschafts- versus Verhaltensdiagnostik

Pädagogische Diagnostik kann den Lernenden nur unter Berücksichtigungseiner Lernumgebung angemessen erfassen und muss die Wechselwirkungenberücksichtigen.

Die Messung unveränderbarer Eigenschaften (wenn es sie gibt) ist für diePädagogische Diagnostik uninteressant, da Pädagogik sich auf dasVeränderbare konzentriert.

Die Untersuchung rein situativ bestimmten Verhalten (wenn es das gibt) ist für die Pädagogik von geringem Interesse, denn es geht um relativüberdauernde Verhaltensweisen.

Page 14: In den 70er Jahren gab es eine Welle der Kritik an Tests: -Kritik an möglichen Nebenwirkungen von Testergebnissen -Vermessung des Menschen -Systemstabilisierung.

Ergebnis- versus Prozessdiagnostik

Es geht um die Registrierung des aktuellen Verlaufs des Unterrichtensund Erziehens, was zu einer Vielzahl von methodischen Problemenführt.

Das Festhalten von Ergebnissen in gewissen Abständen ist ebensoerforderlich und abhängig von der aktuellen Aufgabenstellung.

Page 15: In den 70er Jahren gab es eine Welle der Kritik an Tests: -Kritik an möglichen Nebenwirkungen von Testergebnissen -Vermessung des Menschen -Systemstabilisierung.

Selektions- versus Förderdiagnostik

„Die Pädagogik hat Selektion nie im Sinne von Wirtschaftsunternehmenbetrieben, sondern eher zwecks einer Modifikationsstrategie. Die Förderungder individuellen Entwicklung ist ein wichtiges Ziel der Pädagogik, aberebenso wichtig sind Selektion (und Platzierung). PädagogischeDiagnostik muss daher je nach Zielsetzung unterschiedliche Strategien einsetzen.“ ((Ingenkamp, 2005, S. 38)

Page 16: In den 70er Jahren gab es eine Welle der Kritik an Tests: -Kritik an möglichen Nebenwirkungen von Testergebnissen -Vermessung des Menschen -Systemstabilisierung.

Resümee aus der Sicht einer um „Objektivität“ bemühten empirischorientierten Pädagogischen Diagnostik:

„Die Modelldiskussion zeigt, dass die gegensätzlichen Vorgehensweisenkeine einander ausschließende Alternativen sind, sondern komplementäre Möglichkeiten darstellen. Zusammen ergeben sie ein vollständigeresAbbild der Realität.“ (ebd.)

Page 17: In den 70er Jahren gab es eine Welle der Kritik an Tests: -Kritik an möglichen Nebenwirkungen von Testergebnissen -Vermessung des Menschen -Systemstabilisierung.

Methodenfragen

Im Folgenden geht es um Informationen zu den Normen, diagnostischenVorgehensweisen von der Beobachtung bis zur Testmethodik, ihre Einsatzmöglichkeiten und deren Grenzen.

Diagnostisches Handeln richtet sich vor allem auf beobachtetes Verhaltendurch:

-Vergleich,-Analyse,-Prognose,-Interpretation,-Mitteilung,-Wirkungskontrolle.

Page 18: In den 70er Jahren gab es eine Welle der Kritik an Tests: -Kritik an möglichen Nebenwirkungen von Testergebnissen -Vermessung des Menschen -Systemstabilisierung.

Vergleich-mit früherem Verhalten des gleichen Menschen-mit dem Verhalten anderer Menschen-mit Verhaltensbeschreibungen oder –standards

Analyse-um Gründe für Abweichungen des Verhaltens erkennen zu können

Prognose-um auf Verhalten in anderen Situationen oder in der Zukunft schließen zu können

Interpretation-damit wir nach Gewichtung und Wertung der vorliegenden Informationen über Verhalten zu einem Urteil kommen.

Mitteilung-Verhaltensbeurteilungen werden mit der Absicht gegeben, zukünftiges Verhalten zu beeinflussen.

Kontrolle-um die Wirkung der Mitteilung zu kontrollieren und zu bewerten.

Page 19: In den 70er Jahren gab es eine Welle der Kritik an Tests: -Kritik an möglichen Nebenwirkungen von Testergebnissen -Vermessung des Menschen -Systemstabilisierung.

Grundfragen des Messens und Skalierens

„Messen ist die Bestimmung der Ausprägung einer Eigenschaft eines (Mess-)Objekts (Gegenstand, Ereignis, Person, Situation, Beurteilungssachverhalt) und erfolgt durch eine Zuordnung von Zahlenzu Messobjekten.“ (Orth 1995, S. 286)

Zweck der Messung: Erhalt von Informationen über Merkmale/Attribute von Objekten, Organismen oder Ereignissen.

Sinn der Messung: Erhalt von Messdaten zur exakteren und vergleichbareren Beschreibungen von Objekten, Organismen oder Ereignissen als ohne solche Daten.

Page 20: In den 70er Jahren gab es eine Welle der Kritik an Tests: -Kritik an möglichen Nebenwirkungen von Testergebnissen -Vermessung des Menschen -Systemstabilisierung.

Zuordnung von Zensurenziffern zu Ausprägungsgraden eines Verhaltens wird im Bildungswesen als praktisch wahrgenommen, beinhalteteaber eine Vergröberung und Vereinfachung einer (womöglich)differenzierten Beobachtung.

Page 21: In den 70er Jahren gab es eine Welle der Kritik an Tests: -Kritik an möglichen Nebenwirkungen von Testergebnissen -Vermessung des Menschen -Systemstabilisierung.

„Messen ist eine homomorphe Abbildung eines empirischen Relativs in ein nummerisches Relativ.“ (Orth, 1995, S. 289)

-empirisches Relativ = eine Menge empirischer Dinge mit bestimmten Relationen-nummerisches Relativ = bestimmte Beziehungen zueinander (z.B. „ist gleich“)

„Eine homomorphe Abbildung ist eine Abbildung von einer Menge eines empirischen Relativs mit folgender Eigenschaft: Wenn Messobjekte in einer Relation des empirischen Relativs stehen, dann und nur dann stehen die ihnenzugeordneten Messwerte in einer Relation des numerischen Relativs.“ (ebd., S. 288)

Page 22: In den 70er Jahren gab es eine Welle der Kritik an Tests: -Kritik an möglichen Nebenwirkungen von Testergebnissen -Vermessung des Menschen -Systemstabilisierung.

Diese Art der Messung wäre für ein Diktat möglich (z.B. richtige Wörter),aber nicht für die Qualität eines Gedichtvortrags (unterschiedlichesExaktheitsniveau).

Die unterschiedlichen Niveaus (auf dem Messungen stattfinden) lassensich in vier Skalen festschreiben:

- die Nominalskala,

- die Ordinal- oder Rangskala,

- die Intervallskala und

- die Verhältnis- oder Proportionalskala.

Page 23: In den 70er Jahren gab es eine Welle der Kritik an Tests: -Kritik an möglichen Nebenwirkungen von Testergebnissen -Vermessung des Menschen -Systemstabilisierung.

„Wer etwas über die unterschiedlichen Skalenniveaus weiß, erkennt deutlicherdie Grenzen, die den Möglichkeiten des Messens in der Pädagogischen Diagnostik gezogen sind. Er sieht auch, dass wir in der gegenwärtigen Praxisoft eine Scheinexaktheit vortäuschen, wenn z.B. für Prüfungen oder Zulassungen arithmetische Mittelwerte von Zensuren berechnet werden.

Je nach Skalenniveau muss man andere Werte zur Kennzeichnung derzentralen Tendenz berechnen.

Bei der Nominalskala kann man nur den Modalwert, den am häufigstenauftretenden Wert, angeben.

Bei der Ordinal- oder Rangskala darf man den Median berechnen, jenenWert, oderhalb und unterhalb dessen gleich viele Werte liegen.

Erst bei Intervall- und Verhältnisskalen ist es zulässig, arithmetische Mittelwerte zu berechnen.“ (Ingenkamp, 2005, S. 50)

Page 24: In den 70er Jahren gab es eine Welle der Kritik an Tests: -Kritik an möglichen Nebenwirkungen von Testergebnissen -Vermessung des Menschen -Systemstabilisierung.

Gütekriterien der Messungen

1. Objektivität Ein Test ist objektiv, wenn das Testergebnis vom Beurteiler unabhängig ist (z.B. wenn verschiedene Beurteiler beim gleichen Schüler unabhängig voneinander zum gleichen Ergebnis kommen).

2. Reliabilität (Zuverlässigkeit, Genauigkeit) Reliabilität meint den Grad der Genauigkeit, mit dem ein Test das misst, was er misst, ohne Rücksicht darauf, was er zu messen vorgibt.

3. Validität (Gültigkeit) Ein Test ist valide, wenn er das misst, was er zu messen vorgibt.

weitere Gütekritierien für Messungen: -Normierung eines Tests-Vergleichbarkeits von Tests-Ökonomie eines Tests-Nützlichkeit eines Tests

Page 25: In den 70er Jahren gab es eine Welle der Kritik an Tests: -Kritik an möglichen Nebenwirkungen von Testergebnissen -Vermessung des Menschen -Systemstabilisierung.

In der Pädagogischen Diagnostik werden Informationen gesammelt, die eine Beurteilung eines Lernenden möglich machen sollen. Dazu werden Bezugspunkte, Maßstäbe, Normen benötigt um Vergleiche (z.B. von Lernergebnissen) zu ermöglichen:

-soziale Bezugsnorm (Vergleich mit Ergebnissen anderer Lernenden),

-individuelle Bezugsnorm (mit früheren Lernergebnissen),

-sachliche Bezugsnorm (mit den gesetzten Lernzielen (Kriterien)).