Post on 17-Sep-2018
© Psychologie des Lehrens und Lernens, TU Dresden
„Operantes Konditionieren“
Prof. Dr. Hermann KörndleProfessur für die Psychologie des Lehrens und Lernens
Technische Universität Dresden
© Psychologie des Lehrens und Lernens, TU Dresden2
Edward Lee Thorndike (1874-1949)
Formulierung „Law of Effect“Verhaltensweisen, die einen befriedigenden Zustand zur Folge haben, werden mit höherer Wahrscheinlichkeit in gleichen oder ähnlichen Situationen wiederholt.
Operantes KonditionierenVertreter I - Thorndike
© Psychologie des Lehrens und Lernens, TU Dresden3
Burrhus Frederic Skinner (1904-1990)
Unterscheidung operanten und reaktiven Verhaltensoperantes Verhalten: Verhalten, dem kontingent Verhaltens-konsequenzen folgen und das nicht unmittelbar durch externe Reize ausgelöst wird reaktives Verhalten: Verhalten, das unmittelbar durch einen Reizausgelöst wird.
Operantes KonditionierenVertreter II - Skinner
© Psychologie des Lehrens und Lernens, TU Dresden4
Grundprinzip des Operanten Konditionierens
Prinzip des Operanten Konditionierens:Die Auftretenswahrscheinlichkeit eines Verhaltens wird durch die dem Verhalten folgenden Konsequenzen verändert. Folgt einem Verhalten eine angenehme Konsequenz, so erhöht sich die Wahrscheinlichkeit, dass dieses Verhalten in gleichen oder ähnlichen Situationen wieder gezeigt wird. Folgt einem Verhalten eine unangenehme Konsequenz, so verringert sich die Wahrscheinlichkeit, dass dieses Verhalten ingleichen oder ähnlichen Situationen wieder gezeigt wird.Bedingungen:Kontiguität und Kontingenz zwischen dem Verhalten und dessen Konsequenz.
© Psychologie des Lehrens und Lernens, TU Dresden5
Experimentalparadigma
die Auftretenswahrscheinlichkeit eines Verhaltens wird durch die dem Verhalten folgenden Konsequenzen verändert.
Phasen eines Experiments zum Operanten Konditionieren1) Kontrollphase2) Lernphase3) Löschungsphase4) Spontanerholungsphase
© Psychologie des Lehrens und Lernens, TU Dresden6
Stimulus lightFood pellet reservoir
Foot container
Lever
Operantes Konditionieren Experimentalparadigma - Skinnerbox
© Psychologie des Lehrens und Lernens, TU Dresden7
Operantes KonditionierenExperimentalparadigma - Untersuchungsphasen
Verh
alte
nsra
te
Kontrollphase Lern-/Trainingsphase Löschungsphase SpontanerholungZeit
keine Verhaltens-
konsequenzen
keine Verhaltens-
konsequenzen
auf Verhalten folgen angenehme
Konsequenzen
© Psychologie des Lehrens und Lernens, TU Dresden8
Operantes KonditionierenPrinzipien des Operanten Konditionierens
BezeichnungHerstellung der
Verhaltens-konsequenz
Wirkung
positiveVerstärkung
angenehmer Reizwird hinzugefügt
Verstärkungnegative
Verstärkungunangenehmer Reizwird entfernt
Erhöhung derVerhaltensrate
BestrafungTyp I
unangenehmer Reizwird hinzugefügt
BestrafungBestrafung
Typ IIangenehmer Reizwird entfernt
Reduktion derVerhaltensrate
Löschung Löschung auf Verhalten folgtkeine Konsequenz
Reduktion derVerhaltensrate
© Psychologie des Lehrens und Lernens, TU Dresden9
Kontiguitätzeitliche (und räumliche) Nähe von Verhalten und Konsequenz.
Kontingenzdie Wahrscheinlichkeit des gemeinsamen Auftretens von Verhalten und Konsequenz ist höher als die Wahrscheinlichkeit, dass nur eines von beiden auftritt.
Ein Verhalten wird in seiner Auftretenswahrscheinlichkeit nur dann von Verhaltenskonsequenzen beeinflusst, wenn Kontiguität und Kontingenz zwischen Verhalten und dessen Konsequenzen besteht.
Operantes KonditionierenBedingungen für erfolgreiche Verhaltensbeeinflussung
© Psychologie des Lehrens und Lernens, TU Dresden10
Operantes KonditionierenKontiguität und Kontingenz
Verhalten
KonsequenzZeit
Zeit
© Psychologie des Lehrens und Lernens, TU Dresden11
Unabhängige Variablen Das Kontiguitätsprinzip (Grice, 1948)
Anzahl der Versuchsdurchgänge
100%
30%
40%
50%
60%
70%
80%
90%
0 100 200 300 400 500 600 700
0 sec 0,5 sec 1,2 sec 2 sec
5 sec
10 sec
Proz
ent r
icht
iges
Ver
halte
n
© Psychologie des Lehrens und Lernens, TU Dresden12
Unabhängige Variablen Quantität der Verhaltenskonsequenz (Crespi, 1942)
0
1
2
3
4
0 5 10 15
Versuchsdurchgänge
Dur
chsc
hnitt
sges
chw
indi
gkei
t
(feet
/sec
)
256
64
16
© Psychologie des Lehrens und Lernens, TU Dresden13
Operantes Konditionieren - UVVerstärkungspläne I
Verstärkungspläne sind Festlegungen des Experimentators, in denen angegeben wird, wie regelmäßig und wie häufig die Konsequenzen einem Verhalten folgen.
Häufigkeit:kontinuierlich vs. intermittierend
Regelmäßigkeit:fixiert vs. variabelQuote vs. Intervall
© Psychologie des Lehrens und Lernens, TU Dresden14
0
250
500
750
1000
0 10 20 30 40 50 60 70 80
Time (minutes)
Num
bero
f res
pons
es
A B
C
D
A Fixed ratio C Fixed interval
B Variable ratio D Variable interval
Operantes Konditionieren - UVWirkung von Verstärkungsplänen I
© Psychologie des Lehrens und Lernens, TU Dresden15
Operantes Konditionieren - UVWirkung von Verstärkungsplänen II
Kontinuierliche Verstärkung hohe Lerngeschwindigkeit; geringer Löschungswiderstand
Intermittierende Verstärkungniedrige Lerngeschwindigkeit; hoher Löschungswiderstand
© Psychologie des Lehrens und Lernens, TU Dresden16
Operantes Konditionieren - UVWirkung von Verstärkungsplänen III
Fixierte Verstärkung - wechselnde Verhaltensrate; - geringerer Löschungswiderstand als
variable Verstärkungspläne
Variable Verstärkung - gleichmäßige Verhaltensrate; - höherer Löschungswiderstand als
fixierte Verstärkungspläne
Quotenpläne - höhere Verhaltensrate als Intervallpläne - höhere Lerngeschwindigkeit als
Intervallpläne
Intervallpläne - niedrigere Verhaltensrate als Quotenpläne
- geringere Lerngeschwindigkeit als Quotenpläne
© Psychologie des Lehrens und Lernens, TU Dresden17
Unabhängige Variablen Wirkung von Verstärkungsplänen IV
SaisonarbeitseffektCumulation of bills passedby the U.S. Congress
Weisberg, P. & Waldrop, P.B. (1972).Fixed-interval work habits of congress.Journal of Applied Behavior Analysis.(n. Anderson, J.R. (1995). Learning andMemory. New York: Wiley, S. 23.)
© Psychologie des Lehrens und Lernens, TU Dresden18
Unabhängige Variablen Wirkung von Verstärkungsplänen V
0
50
100
150
200250
300
350
400
450
500
1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
GesetzeRechtsverordnungenSeitenanzahl insg. im BGBI (geteilt durch 10)
© Psychologie des Lehrens und Lernens, TU Dresden19
Operantes Konditionieren - UVDiskriminative Hinweisreize (cues, Signalreize)
Definition:Diskriminative Hinweisreize sind Reize, die bestimmte Verhaltenskonsequenzen signalisieren.
Beispiele:Bei Lehrer Müller wird das Verhalten „im Unterricht reden“ nicht bestraft, bei Lehrer Meier wird es bestraft. Die Schüler reden bei Herrn Meier nicht im Unterricht.
Eine Ratte erhält nur dann eine Belohnung (Futter), wenn vorher eine Lampe aufleuchtete.
© Psychologie des Lehrens und Lernens, TU Dresden20
Operantes KonditionierenBestrafung (Estes, 1944)
Zeit
Verh
alte
nste
nden
z
nicht bestraftes Verhalten
100%
75%
50%
25%
0%1 2 3 4
© Psychologie des Lehrens und Lernens, TU Dresden21
Operantes KonditionierenBestrafung (Estes, 1944)
1 2 3 4
Verh
alte
nste
nden
z
nicht bestraftes Verhalten in Phase 2 bestraftZeit
100%
75%
50%
25%
0%
© Psychologie des Lehrens und Lernens, TU Dresden22
Kontrasteffektesprunghafte Veränderungen der Verhaltensrate in Abhängigkeit einer massiven Änderung der Quantität, d. h. der Menge der Verhaltenskonsequenz.
Positiver KontrasteffektErhöht man eine zu Beginn geringe Verstärkungsmenge, so erhöht sich die Verhaltensrate sprunghaft über die zu erwartende Verhaltensrate.
Negativer KontrasteffektReduziert man eine zu Beginn hohe Verstärkungsmenge, so verringert sich die Verhaltensrate sprunghaft unter die zuerwartende Verhaltensrate.
Operantes KonditionierenDifferenzierungen - Kontrasteffekte
© Psychologie des Lehrens und Lernens, TU Dresden23
Operantes KonditionierenNegativer Kontrasteffekt (Crespi, 1942)
16
16
16
Dur
chsc
hnitt
sges
chw
indi
gkei
t (fe
et/s
ec)
0
0,5
1
1,5
2
2,5
3
3,5
4
4,5
0 15 16 17 18 19 20 1 2 3 4 5 6 7 8
Versuchsdurchgänge
256
64
16
256 auf 16
64 auf 16
Änd
erun
g de
r Ver
stär
-ku
ngsm
enge
(Fut
erpi
llen)
© Psychologie des Lehrens und Lernens, TU Dresden24
Tokensysteme
Tokens sind sekundäre Verstärker, die gegen primäre Verstärker oder andere sekundäre Verstärker eingetauscht werden können.
© Psychologie des Lehrens und Lernens, TU Dresden26
Klassisches / Operantes Konditionieren
Klassisches Konditionierengelernt wird die Auslösung von schon im Verhaltensrepertoire des Organismus vorhandenen Reaktionen durch neue Reize
Operantes Konditionierendurch die Verfahren des operanten Konditionierens wird die Auftretenswahrscheinlichkeit von Verhaltensweisen verändert
© Psychologie des Lehrens und Lernens, TU Dresden27
Klassisches Konditionieren:
unabhängige Variablen: die Bedingungen, unter denen der mit dem unkonditionierten Reiz gekoppelte, zu konditionierende Reiz dargeboten wird (z.B. Zeitdauer oder Zeitpunkt zwischen Aufleuchten einer Lampe und Futtergabe)
abhängige Variablen: Ausmaß der durch den konditionierten Reiz ausgelösten Reaktion (z.B. Menge des Speichelflusses)
Operantes Konditionieren:
unabhängige Variablen: Art der Verhaltenskonsequenz; Quantität und Qualität der Verhaltenskonsequenz; zeitlicher Abstand zwischen Verhalten und dessen Konsequenzen; diskriminative Hinweisreize; Verstärkungspläne
abhängige Variablen: Lerngeschwindigkeit; Verhaltensrate; Löschungswiderstand
Experimentalparadigma - Vergleich Klassisches und Operantes Konditionieren