Post on 06-Apr-2015
Wahrn TEIL 1.ppt 1
WAHRNEHMUNG
Wie werden Objekte, Lebewesen etc. erkannt ?
Frage der Identität (wahrgenommene Welt-wirkliche Welt)
objektive Welt in uns repräsentiert subjektive Repräsentation
subjektive Repräsentation = objektive Wirklichkeit ???
Dagegen, z.B.: Wahrnehmungstäuschungen , z.B. Müller-LyerDreieckstäuschungWasserfalltäuschungBewegung im FilmBlinder Fleck
2
Müller-Lyer (1889)
3
4
Poggendorf (1860)
5
Blinder Fleck - z.B. from: Glynn: An anatomy of thought (1999)
6
Trotz der Wahrnehmungstäuschungen:
Übereinstimmung zwischen Realität und subjektiver Repräsentation muss hoch sein, sonst wäre Überleben ernstlich gefährdet_____________________________________________________
7
spezielle Literatur zur Wahrnehmung:
Bruce,V., Green, P.R & Georgeson, M.A. .: Visual Perception. 4th ed. Hove and London: Erlbaum, 2003
Schiffman,H.R.: Sensation and Perception: An integrated approach. 5th ed. New York: Wiley, 2000
LINKS:
http://www.yorku.ca/eye/http://Krantzj.hanover.edu/krantz/art/http://psychlab1.hanover.edu/classes/Sensation/
8
VORSCHAU (Aus Zeitgründen Beschränkung auf visuelle Wahrnehmung)
Entdeckung von Einfachen Signalen1 (klassische) Psychophysik2 Signalentdeckungstheorie ( Spada, 2006, Kap.2.3.1)
Tiefenwahrnehmung
1 Monokulare Hinweisreize2 binokulare Hinweisreize3 Hinweisreize aus der Eigenbewegung4 Kombination von Hinweisreizen
Erkennen von Objekten
Eysenck & Keane
Kap 2 & 3
9
Erkennen von Objekten
1 Gestaltpsychologie
2 Mustererkennen ( Pattern Recognition )2.1 Schablonentheorien - Template theories2.2 Merkmalsanalyse - Feature Theories2.3 Strukturbeschreibung - Structural Description
3 Computationale Theorie der Visuellen Wahrnehmung3.1 Grundsätzliche Überlegungen zum Wahrnehmungsprozess3.2 Basisprozesse
3.3 Objekterkennung
10
Ziel
Aneignung von Grundwissen zur Wahrnehmung
Die wichtigsten theoretischen Ansätze und ihren empirischen Status kennen
Erkennen der Komplexität bereits der einfachen
Reizwahrnehmung
11
ENTDECKUNG VON EINFACHEN SIGNALEN
1 (KLASSISCHE) PSYCHOPHYSIK
Fechner (1860) Elemente der Psychophysik
physikalischer Reiz (Stimulus)
Sinnessystem
Transformierung der Stimulusenergie in
neurale Ereignisse
Entdeckung des Signales
subj. Intensität des wahrgenommenen Stimulus
12
Grundproblem :
Verhältnis:
physikalische Stimulusintensität - subjektive Empfindung
z.B.wahrgenommenes Gewichtwahrgenommene Länge von Streckenwahrgenommene Süssewahrgenommene Lautstärkesubjektiver Geldwert
13
FECHNER:
• Wie stark muss ein Reiz sein (über obj. Nullpunkt) , damit er überhaupt wahrgenommen wird?
Absolutschwelle – “eben merkliche Empfindung”
• Wie gross muss der Mindestunterschied zwischen zwei Reizen sein, damit sie als verschieden wahrgenommen werden?
Unterschiedsschwelle - "eben merklicher Unterschied" jnd - just noticeable difference
Bestimmung der Schwellenwerte: 3 Methoden
Herstellungsmethode (Reize gleich machen) Grenzmethode (auf-absteigende Serien, ab wann) Konstanzmethode (zufällige Abfolge, ja/nein)
14
Hypothese über Verhältnis: physikalische Stimulusintensität - subjektive Empfindung
historisch: Fechnersches-Gesetz (Weber-Fechnersches-Gesetz)
Aktuell: POWER LAW Stevens (1961) (Potenzgesetz)
S = k Ib
S ... subj Empfindungsstärke/ subj.Grösse I ... physik. Stimulusintensität /obj. Grösse k ... Konstante b ... Exponent, konstant für: Sinnesdimension
Person
Exponent b: >, <, oder = 1
15
Beispiel: obj. Geldbetrag - subj.Wert
W = aGb mit a=1 und b=0.5: W = G.5 ( x0.5 = x )
G (obj.Betrag) W (subj.Wert)
0 0.00
1 1.00
5 2.24
10 3.16
100 10.00
259...
16.09...
16
0
1
2
3
4
5
6
7
8
obj. Geldbetrag
subj. Wert
W = G0.5
10 20 30 40
Berechnung von b aus bekannten objektiven und subjektiven Werten
17
Exponent b > 1, b < 1, b = 1
0
10
20
30
40
50
60
70
80
90
100
0 10 20 30 40 50 60 70 80 90 100 (willkürliche Einheiten)
b > 1
b < 1
b = 1
18
Table 2.5 aus: Schiffman (1982):
Representative exponents of the power functions relating psychological magnitude to stimulus magnitude
MeasuredContinuum Exponent Stimulus Condition
Loudness 0.6 BinauralLoudness 0.54 MonauralBrightness 0.33 5º1 target, dark-adapted eyeBrightness 0.5 Very brief flashSmell 0.55 CoffeeSmell 0.6 HeptaneTaste 1.3 Sucrose, human subjectsTaste 1.3 SaltTemperature 1.0 Cold on armTemperature 1.6 Warmth on arm
19
Fortsetzung
MeasuredContinuum Exponent Stimulus Condition
Vibration 0.95 60 Hz on finger
Vibration 0.6 250 Hz on finger
Duration 1.1 White noise stimuli
Finger span 1.3 Thickness of blocks
Pressure on palm 1.1 Static force on ski
Heaviness 1.45 Lifted weights
Force of handgrip 1.7 Hand dynamometer
Electric shock 3.5 Current through fingers
Tactual roughness 1.5 Rubbing emery cloths
Tactual hardness 0.8 Squeezing rubber
Visual length 1.0 Projected line
Visual area 0.7 Projected square
20
Vorteil der Exponentialfunktion des Power-Laws:
Verhältnis zweier Signale,
z.B. Verhältnis gedruckter Buchstabe - Papier,
bleibt unverändert bei unterschiedlichen
Beleuchtungsbedingungen!
Beweis siehe Ylmaz (1967)
21
2 SIGNALENTDECKUNGSTHEORIE
Swets & Tanner (1961)
Überblick: Spada Schiffman
Entdeckung eines schwachen Signals (geringe Intensität)
Signal vermischt mit Störsignalen (Rauschen)
22
Reaktion des Beobachters nicht nur von Reizintensität abhängig
d.h. es gibt keine konstante Schwelle i.S der Psychophysik
notwendige UNTERSCHEIDUNG:
Beobachter Beobachter als Sensor als Entscheider Wahrnehmungsschwelle - Reaktionsschwelle
klassische Psychophysik untersucht nur Reaktionsschwelle
23
Reaktion des Beobachters abhängig von
1 objektive Signalstärke: objektives Verhältnis Signal-Rauschen
2 Beobachter:
(1) Sensitivität (Beobachter als Sensor)
(2) Erwartung des Beobachter z.B.: heute viele Vögel auf Radarschirm, weil Flugzeit
weint mein Kind häufig? ist der Brandalarm so eingestellt,
dass er sehr leicht anspricht
(3) Bewertung der Konsequenzen Ist das Signal wichtig für mich ist es schlimm, wenn ich es
übersehe
24
KONSEQUENZENMATRIX:
REAKTION DES BEOBACHTERS
JA("Signalvorhanden")
NEIN("Signal NICHTvorhanden")
STIMULUS
SIGNAL(Signal +Rauschen)
TREFFER(HIT)
VERPASSER(MISS)
KEIN SIGNAL(nurRauschen)
FALSCHERALARM
KORREKTEVERNEINUNG
25
im Labor: subj Wert der Konsequenzen und Erwartung
leicht variierbar
Beispiel: Variationen des subj Wertes der Konsequenzen (z.B. durch Geld Belohnung oder Strafe)
Reaktion des Beob Ja Nein Signal vorh. Signal nicht vorh. _____________________________________
Signal +5 -5 _____________________________________
kein Signal -5 +5 _____________________________________
26
Reaktion des Beob Ja Nein Signal vorh. Signal nicht vorh. ____________________________________
Signal +25 -8 ____________________________________
kein Signal -5 +7 ____________________________________
Konsequenzen begünstigen JA-Reaktion
27
Reaktion des Beob Ja Nein Signal vorh. Signal nicht vorh. ____________________________________ Signal +5 -5 ____________________________________ kein Signal -50 +5 ____________________________________
Konsequenzen begünstigen NEIN-Reaktion
28
Generell: Ergebnisse der Signalentdeckungstheorie gut bestätigt:
Wahrsch für Signaldetektion (d.h. Reaktion "ja") steigt mit
SensitivitätErwartung: subj Wahrsch für AuftretenKonsequenzen: in Abhängigkeit davon, welche
Konsequenz belohnt/bestraft wird
Anwendung signalentdeckunstheoretischer Ideen
z.B.: GedächtnispsychologieDiagnostikRechtssprechung
29
Wichtige Konsequenz der Resultate der Signalentdeckungstheorie
Bereits bei elementaren Signalentdeckungsaufgaben:kognitive und motivationale Komponenten
Problem:Elementare Signalentdeckungsaufgaben behandeln nur Detail des Wahrnehmungsprozesses.
Ihre Untersuchung trägt kaum etwas bei zur Klärung der Frage:Wie werden Objekte, Lebewesen etc. erkannt ?
30
TIEFENWAHRNEHMUNG
Netzhautbild allein kann über Form, Lage, Grösse und Entfernung von Gegenständen keine eindeutige Antwort geben.
Relevant für Objekterkennung - von mehreren Faktoren determiniert
31
Daher: andere Grundlagen der Raumwahrnehmung notwendig.
3 Typen von Hinweisreizen (cues) für die Wahrnehmung von Tiefe
Monokulare Hinweisreize
Binokulare Hinweisreize
Hinweisreize aus der Eigenbewegung
Kombination von Hinweisreizen
32
1 MONOKULARE HINWEISREIZE
z.B.
Überlappung/VerdeckungNahe Objekte verdecken oft
fernere Objekte.
Schattierung Dreidimensionale Formen meist
nicht überall gleich beleuchtet.
33
Lineare PerspektiveFluchtpunkt, systematisches Kleinerwerden nach hinten
Texturinsbes. Gibson (1950)
viele Oberflächen haben Feinstruktur (=Textur),z.B.: Fell, Stoff, Rinde, Baumkrone, Gras
Elemente der Textur
rücken mit wachsender Entfernung näher zu- sammen & werden kleiner
34
35
relative Grösse
36
2 BINOKULARE HINWEISREIZE
optische Achsen der zwei Augen treffen sich im FixationspunktFovea centralis (empfindlichster Bereich in Netzhaut, die meisten Sehzellen, schärfstes Sehen)
Augen werden auf Fixationspunkt so eingestellt, dass Bild auf fovea centralis projiziert wird
Bilder auf Netzhaut verschieden
37
Konvergenzwinkel
verändert sich mit Entfernung zum Fixationspunkt
je näher, desto grösser ("Schielen")
jedoch: Konvergenzwinkel erlaubt nur sehr grobe Bestimmung der Entfernung (nah-fern)
38
Steropsis
Querdisparation (binoculare Parallaxe)
Augenabstand ca. 5 - 7.6 cm (beim Menschen)
daher: Augen liefern leicht verschiedene Bilder
aus dieser Differenz auch Info über Entfernung
39
3 HINWEISREIZE AUS DER EIGENBEWEGUNG
VerschiebungBilder aus verschiedenen Standpunkten liefern räumliche Info(analog zur Querdisparation)
optisches Flussmuster / Fliessmuster (Gibson, 1950, 1982)mit Bewegung des Betrachters entstehen Muster von kontinuierlichen Veränderungen (Flussmuster)daraus auch räumliche Info ableitbar
Fliessmuster abhängig von1 Richtung und Geschwindigkeit der Eigenbewegung2 Lage des Fixationspunktes3 räumliche Verteilung der Oberflächen relativ zur
Blicklinie
40
Eigenbewegung
41
Eigenbewegung
42
Eigenbewegung
43
Eigenbewegung
44
Eigenbewegung
45
KOMBINATION von HINWEISREIZEN
Additive Verknüpfung oder Selektion?
Experimente von Bruno & Cutting (1988) legen nahe, dass meist additiv verknüpft wird ( hilft, Fehler zu minimieren)
Wahrn TEIL 2.ppt 46
1 Gestaltpsychologie
2 Mustererkennen ( Pattern Recognition )
3 Computationale Theorie der Visuellen Wahrnehmung
GESTALTPSYCHOLOGIEca. 1890-1920 Max Wertheimer, Wolfang Köhler, Kurt Koffka
Zwei Phänomene der Wahrnehmung müssen erklärt werden:
Formkonstanz
Grössenkonstanz
ERKENNEN VON OBJEKTEN
47
FormkonstanzWahrgenommene Form eines Objektes ändert sich nicht, auch wenn sich Netzhautbild ändert (z.B. bei Änderung des Blickwinkels)
Grössenkonstanz Wahrgenommene Grösse eines Objektes ändert sich nicht, auch wenn sich die Grösse des Netzhautbildes ändert (z.B. bei zunehmender Entfernung)
Annahme der Gestaltpsychologie:
Elementare Reize im Wahrnehmungsfeld werden durch
Organisationsgesetze (= Gestaltgesetze)
strukturiert.
48
Einige wichtige Regeln:
Figur und GrundIm Wahrnehmungsfeld heben sich bestimmte Teile von anderen ab.Teil, der sich mit scharfen Umgrenzungen und bestimmter Form abhebt, ist Figur, der Rest ist Grund.
49
BinnengliederungÜbereinandergelegte Figuren werden in der Regel in möglichst einfache Figuren zerlegt
50
Prägnanzprinzip (Prinzip der guten Gestalt)
Wichtiges Gliederungsprinzip der GestalttheorieWenn mehrere alternative Strukturierungen möglich: es setzt sich diejenige durch, welche die einfachste, einheitlichste, "beste" Gestalt ergibt.
51
z.B. Prinzip der Nähe:
Reize, die einander nahe sind, werden als zusammengehörig betrachtet
. . . . .. .. .. ..
Probleme der Gestaltpsychologie
• Keine Erklärung, wie natürliche Objekte erkannt werden
• Die explizite Annahme (zumind. frühe Gestaltpsych), dass nur Reizkonfiguration für Wahrnehmungsinhalt verantwortlich, nicht haltbar
• Für jedes Gestaltgesetz Gegenbeispiele, daher immer neue Annahmen notwendig
52
. . . . . . . . .. . . .
lt. Gesetz der Nähe gehören diesebeiden Punkte zusammen,
trotzdem werden sie als zu den beiden verschiedenen Balken des Y gehörend wahrgenommen
53
2 MUSTERERKENNEN( Pattern Recognition )
Hauptsächlich mit zweidimensionalen Stimuli erforscht(z.B.: Buchstaben)
Schablonentheorie
Merkmalsanalyse
Strukturbeschreibung
54
2.1 SCHABLONENTHEORIEN - Template theory
Schablone: mentale Kopie des wahrgenommenen Objektes die im LZG gespeichert ist
Stimuli
SchablonenA B C …
R E A S
55
ABRR E A S
R E A SR E A S
Schablonen:
A B C …
56
Probleme mit Drehung, kursiv, Grösse,...durch Transformation lösbar
B K A I F
57
Probleme:unsaubere Buchstabenverkehrte, unvollständige BuchstabenKontext-Effekte
BANK BERN
58
59
Hauptkritik an Schablonenvergleich-Theorie
1 Verzerrungen bei realistischem 3-dimensionalem Input nicht durch einfache Transformation umkehrbar
2 Schablonenvergleich funktioniert nur bei klar isolierten zweidimensionalen Wahrnehmungsobjekten (z.B. Buchstaben auf Papier)
3 Schon bei einfachen zweidimensionalen Stimuli treten Probleme auf, die zeigen, dass die Schablonentheorie nicht stimmen kann
60
2.2 MERKMALSANALYSE - Feature Theories
- einzelne Merkmale (z.B.) von Buchstaben analysisert
- Mini-Schablonen für einfache geometrische Merkmalez.B.:
z.B.: A
H
61
Was spricht für die Merkmalsanalyse ?
1 Neurophysiologie
neurale Detektoren für Kanten, Striche, etc. ( Hubel & Wiesel, 1963 )auf höherer Ebene unabhängig von der Lokation auf Retina
2 Fehleranalyse beim Erkennen von Buchstaben
Vorhersage von mehr Fehlern je mehr gemeinsame Merkmale
z.B. 250 Paare von Buchstaben präsentiert
E F 39 Verwechslungen
T I 22 Verwechslungen
E W 3 Verwechslungen
T O 0 Verwechslungen
62
Probleme der Merkmalsanalyse
1 Minischablonen für natürliche Formen?z.B.: Pferd [globale Merkmale (Kopf) unbrauchbar]
2 räumliche Beziehung zwischen Merkmalen unberücksichtigt ( nur Art und Zahl )
A oder 3 3-dimensionale Objekte
63
2.3 STRUKTURBESCHREIBUNG - Structural DescriptionBruce & Green (1990)
Berücksichtigt Relationen zwischen Merkmalen
Strukturbeschreibungen aus elementaren Propositionen (Aussagen)
Beschreibt Komponenten einer Konfiguration und deren Anordnung
64
z. B.: Strukturbeschreibung eines T
Es gibt zwei TeileEin Teil ist eine horizontale LinieEin Teil ist eine vertikale LinieDie vertikale Linie trägt die horizontaleDie vertikale Linie halbiert die horizontale
65
Probleme der Strukturbeschreibung
1 Strukturbeschreibung für natürliche Formen?
2 3-dimensionale Objekte
66
3 COMPUTATIONALE THEORIE DER VISUELLEN WAHRNEHMUNG
Marr, D.: Vision. San Francisco: Freeman, 1982
Zwei fundamentale Probleme der traditionellen Ansätze
1 Keine klare Abgrenzung von Perzeption und Kognition
z.B.:
Erkennen des Quadrates ist unabhängig von der Art, wie Begrenzung identifiziert wirdBegrenzung kann gesehen werden, ohne dass Figur erkannt zu werden braucht
d.h. diese Prozesse (Identifikation von Begrenzungen, Erkennen von Formen) sind unabhängig voneinander
67
a a a a a a a a a a a aa aa aa aa aa a a a a a a a a a
erkennbar:
• Form unabhängig von Begrenzung
• Begrenzung unabhängig von Form
68
Zwei fundamentale Probleme der traditionellen Ansätze
2 Keine klare Problemanalyse
d.h. es wird nicht spezifiziert, was man durch die Theorie erreichen will
welcher Prozess soll erklärt werdenwelcher Input, welches Ergebnis
69
3.1 GRUNDSÄTZLICHE ÜBERLEGUNGEN ZUM WAHRNEHMUNGSPROZESS
Aufgabe des Wahrnehmungsprozesses:
Dreidimensionale Wirklichkeit muss aus zweidimensionalem Netzhautbild rekonstruiert werden
dabei Schwierigkeiten, z.B.Teile des Gegenstandes können auf Netzhautbild
verdeckt sein Gegenstände verschieden scharf
Schatten, Spiegelungen, Oberflächenstrukturen, ...
70
Unterscheidung von zwei globalen Verarbeitungsstufen:
Basisprozesse (visuelle Perzeption)eher von Sinnesdaten und allgemeinen Verarbeitungsprinzipien bestimmtProzess der Extraktion von Informationen aus Daten, ohne spezielle Annahmen über wahrgenommene ObjekteEher datengetrieben (bottom-up)
Objekterkennung (visuelle Kognition) Prozess der ErkennungInformation aus den Basisprozessen mit der im Gedächtnis gespeicherten Information verglichen eher erwartungsgetrieben (top-down), d.h.: spezielle Annahmen und spezielles Wissen über wahrgenommene Objekte einbezogen
71
Annahme Marr’s: Wahrnehmungsprozess beinhaltet eine Serie von Repräsentationen unserer visuellen Umwelt, die zunehmend detailliertere Informationen enthält.
bei Marr 3 Haupttypen der Repräsentation:
• Erstskizze (Primal sketch)
• 2 1/2-D Skizze
• Repräsentation in Form eines 3-D Modelles
72
Erstskizze (Primal sketch)2-dimensionale Beschreibung von Änderungen der Licht-Intensität im visuellen Input, dazu Information über Kanten, Konturen und Fleckenbeobachterzentriert
2 1/2-D SkizzeBeschreibung der sichtbaren Oberflächen, ihre Tiefe (Entfernung) und Orientierung (unter Ausnutzung der Hinweisreize zur Tiefenwahrnehmung)beobachterzentriert
Repräsentation in Form eines 3-D ModellesBeschreibt 3-dimensional Form und relative Position von ObjektenUnabhängig vom Beobachterstandpunkt!
73
3.3 BASISPROZESSE
ERSTSKIZZE (Primal sketch)
Roh-Erstskizze (Raw Primal sketch)Information über Lichtintensität
Voll-Erstskizze (Full Primal sketch)Linienrepräsentation von Umrissen, Kanten
Oft: Änderung der Lichtintensität an Kanten des Objektesaber: z.B. Schatten, Spiegelungen, TexturDaher nur Änderung der Lichtintensität nicht ausreichend
74
Zerlegung der Bildfläche in kleine Elemente: Pixels.
Problem: Lichtintensität auf jedem Pixel fluktuiert ständig, dadurch könnte die Roh-Erstskizze verzerrt werden.
Lösung: Zusammenfassung (Durchschnitt) der Lichtintensität benachbarter Pixels,
das führt aber zur Vergöberung (Verschwimmen - blurring) der
Bildauflösung.
Daher: Mehrere Analysen des Bildes mit unterschiedlichen Graden von Vergröberung.
Information aus diesen mehrfachen Analysen wird zur Roh-Erstskizze verarbeitet.
75
Ergebnis: einfache Elemente wie Kanten, Balken, Flecken, Enden
Voll-Erstskizze:
Gruppierung derartiger Elemente zu grösseren Einheiten
Gruppierungsprinzipien:NäheAusrichtung
iterativer Prozess
76
nach neueren Ergebnissen: Vermutlich Gruppierung nicht nur im zweidimensionalen Raum
Endergebnis der Erstskizze: Linienrepräsentation
enthält aber auch irrelevante Linien beobachterzentriert
Abbildung (Bild 110 aus Frisby [1979])
77
78
2 1/2 D-SKIZZE
Beschreibung der sichtbaren Oberflächen, ihre Tiefe (Entfernung) und Orientierung
Ausgangspunkt: Bild- "Zellen"Jede Zelle entspricht einem Bildausschnitt aus der Sicht des BetrachtersInformation aus Zellen wird zusammengefasst.
Verwendete Information:Tiefeninformation aus monokularen/binokularen Hinweisreizen etc.
2 1/2D-Skizze enthält Information über die sichtbaren Oberflächen
beobachterzentriert
79
Siehe Abbildung ( Marr, 1982)
80
2 1/2 D-Skizze ermöglicht nicht Vergleich mit Gedächtnisinhalt:
1 Nur sichtbare Oberflächen repräsentiert
2 Alles nur aus einem speziellen Blickwinkeld.h. alle Distanzen und Orientierungen relativ zum momentanen BlickpunktÄndert sich Standpunkt des Betrachters, ändert sich auch die Repräsentation
3 Objekte und ihre Teile nicht explizit abgegrenzt
81
Neuropsychologische Hinweise, die als Bestätigung für Annahme einer 2 1/2 D-Skizze interpretiert werden können:
Wenn nur Prozess der Konstruktion der 2 1/2 D-Skizze geschädigt:
•Patient kann Helligkeitsunterschiede, Bewegung kleiner Objekte erkennen (Leistung der Erstskizze)
•Patient kann Objekte mithilfe anderer Sinnesmodalitäten erkennen
(z.B. Tasten, Hören)
•Patient kann Objekt nur mithilfe visueller Information nicht erkennen
Benson & Greenberg (1969)
82
3.4 OBJEKTERKENNUNG
Marr (1982)Biederman (1987)Kosslyn et al. (1990)( Konnektionistische Ansätze )
MARR (1982) , Marr & Nishihara (1978)
3-dim Modell aus Komponenten konstruiert
Basiselemente: Zylinder mit Hauptachse
Hierarchische Organisation: Grobform+Orientierung Details(Hauptachse des globalen Objektes stimmt oft
nicht überein mit Hauptachsen von Details)
3-D Modell wird mit Modellen im Gedächtnis verglichen(dazu Identifikation der Hauptachse notwendig)
83
hierarchische Struktur des menschl KörpersMarr & Nishihara (1978)
84
Orientierung der Hand unterschiedlich bei Bewegung von Schulter und Ellenbogen
Orientierung der Hand auf Retina unterschiedlichrelative Lage von Hand und Unterarm gleich
85
BIEDERMAN (1987, etc.): Recognition-by-components-theory
Objekte aus Basiskomponenten (geons) zusammengesetzt:BlockZylinderKugelBogenKeiletc.
insgesamt 36 geons (Analogie zu Wörtern aus Lauten)
86
87
Verlauf der Objekt-Erkennung nach Biederman
Determination der Geons und ihrer Relationen
Vergleich mit Gedächtnisrepräsentationen(Geon-Beschreibungen von Objekten)
Kanten-Extraktion
Identifikation von nicht-zufälligen Eigenschaften
Zerlegung des Objektes
88
Zerlegung des Objektes (Parsing of regions of concavity)
basiert auf geometrischer Regularität: Wenn Objekt aus zwei Teilen gebildet, an der Verbindgsstelle üblicherweise konkave (nach innen ins Objekt gerichtete) Diskontinuität
Baum
89
Detektion von relevanten (nicht-zufälligen) Eigenschaften(Detection of non-accidental properties)
Charakteristiken, die aus wechselnden Blickwinkeln unverändert bleibenWerden durch Analyse der Kanten identifiziert:
Kurvatur einer Kante
Parallele Kanten
Kanten mit gemeinsamen Endpunkt
Symmetrische Kanten
Gerade Kanten
Geons aus diesen Invarianten konstruiert
Annahme: nicht-zufällige Merkmale in der Repräsentation entsprechen nicht-zufälligen Merkmalen in der Wirklichkeit
90
Warum können Objekte auch unter suboptimalen Bedingungen erkannt werden (schlechte Beleuchtung, Teilverdeckung)?
1 Invariante Merkmale bleiben oft auch unter suboptimalen Bedingungen erhalten
2 Fehlende Teile können ergänzt werden (sofern Konkavität erhalten bleibt)
3 üblicherweise Redundanz
91
Empirischer Status
+ Biederman, Ju & Clapper (1985): Erkennen auch unvollständiger komplexer Objekte ( 90%)
Biederman (1987): Erkennen unvollständiger Objekte schwieriger, wenn Information über Konkavität fehlt.
Erkennen von Objekten wird durch Farbe nicht gefördert (nicht einmal dort, wo Farbe wichtig ist - Banane)
- Komplexe Objekte werden oft zunächst global verarbeitet (z.B. Kimchi, 1992) (wie bei Marr).
Zentrale theoretische Annahmen (derzeit) nicht direkt prüfbar (36 geons).
92
intakte Figur Info über Struktur erhalten
Info über Struktur nicht erhalten
Biederman (1987)
93
Hauptproblem der Theorien von Marr und Biederman:
Behandeln relativ einfache/grobe Erkennungsaufgaben (z.B.: Hund oder Kuh), nicht differenzierte Unterscheidungen (z.B.: bestimmter Schäferhund Rex)Rolle anderer Hinweisreize (ausser den Kanten) noch zu wenig untersucht (z.B. Farbe)
Vorteile
Bisher einzige Theorie des Objekterkennens
auch Kontexteffekte können wenigstens Teilweise erklärt werden (Reihenfolge der Gedächtnissuche),