Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1...

48
Bildverstehen Vorlesung an der TU Chemnitz SS 2012

Transcript of Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1...

Page 1: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Bildverstehen

Vorlesung an der TU ChemnitzSS 2012

Page 2: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Johannes Steinmüller• 1/B309• Tel.: 531 35198• [email protected]• Seite zur Vorlesung:

– http://www.tu-chemnitz.de/informatik/KI/edu/biver/

Page 3: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Buch zur Vorlesung

Steinmüller, J.: Bildanalyse – Von der Bildverarbeitungzur räumlichen Interpretation von BildernSpringer, 2008

Page 4: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Übung• Di, 7.30 – 9.00 Uhr, 1/208• Beginn: 17.04.2012

Page 5: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

1. Einführung

2. Bildverarbeitung

3. Morphologische Operationen

4. Bildsegmentierung

5. Merkmale von Objekten

6. Klassifikation

7. Dreidimensionale Bildinterpretation

8. Bewegungsanalyse aus Bildfolgen

9. PCA (Hauptkomponentenanalyse)

10.ICA (Independent Component Analysis – Unabhängigkeitsanalyse)

Übersicht der Vorlesung

Page 6: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

1 Einführung

Page 7: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

1 Einführung

1.1 Einordnung des Fachgebietes

1.2 Was ist Bildanalyse

1.3 Einige Daten zur Entwicklung des Fachgebietes

1.4 Grundbegriffe und Vorgehensweise bei der Bildanalyse

1.5 Anwendungen

1.6 Literaturhinweise

Page 8: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

1.1 Einordnung des Fachgebietes

Page 9: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Einordnung des Fachgebietes• Analyse und Interpretation von visueller Information• Bilder oder Bildfolgen • eines der schwierigsten Teilgebiete der Informatik

(Künstliche Intelligenz)• neben der Bearbeitung von Bildern geht es bei der

Bildanalyse (Bildverstehen) auch darum, auf den Bildern etwas zu erkennen (Objekte)

• noch viele Fragen offen

Page 10: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Einordnung des Fachgebietes

• Es existieren noch keine maschinellen Sehsysteme, die auch nur annähernd die Leistungsfähigkeit des menschlichen Sehsystems erreichen.

• Gründe:– Die Konzepte wandelten sich in der Vergangenheit

mehrfach grundlegend und sind auch heute noch im Fluss.

– Hohe Ansprüche an das formale Rüstzeug der Wissenschaftler.

– Die Funktionsweise biologischer Sehsysteme ist erst wenig verstanden.

– Oft benötigt man Systeme, die in kurzer Zeit viele Bilder auswerten müssen.

Page 11: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Beispiel• ein kleines Kind kann aus 100 Bildern verschiedener

Frauen problemlos das mit seiner Mutter herausfinden• ein Computerprogramm, das 10 geometrische Figuren

unterscheiden soll, ist schon aufwendig

Page 12: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Verschiedene Herangehensweisen

• Informatik

– Künstliche Intelligenz

– Digitale Bildverarbeitung

– Mustererkennung

• Neurokognition (Verhalten und Erleben der Menschen)– Vorlesungen von Prof. Hamker

• Neurophysiologie (Lebensvorgänge und Funktionen des menschlichen Nervensystems)

Page 13: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Einordnung des FachgebietesInnerhalb der graphischen Datenverarbeitung ordnen wir uns wie folgt ein:

Bild(er) Beschreibung

Bild(er) Bildverarbeitung Computergrafik

Beschreibung BildanalyseBildverstehen Alles Andere

Eingabe

Ausgabe

Page 14: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

1.2 Was ist Bildanalyse?

Page 15: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Bildverstehen

Rekonstruktion und Deutung einer Szene anhand von BildernRekonstruktion und Deutung einer Szene anhand von Bildern

BildBildfolge

FragestellungAufgabe

Anwendung

BildBildfolge

FragestellungAufgabe

Anwendung

Szenen-beschreibung

Szenen-beschreibung

Bildverstehen

Computergrafik

Page 16: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Wie versteht man dieses Bild?

• ein Binärbild• eine Kreislinie, und 25 Strecken• 1 Kreis, 4 Rechtecke und 10

einzelne Linien• Sonne und Haus• es ist schönes Wetter, die Sonne

scheint

Page 17: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Einige mögliche und schon anspruchsvollere Fragestellungen – Anwendungen

• kollisionsfreies Navigieren eines Roboters in der Szene

• planmäßiges Greifen und Manipulieren von Objekten in der Szene durch einen Industrieroboter

• Ausgabe von Warnsignalen bei gefährlichen Situationen

• inhaltsbasierte Bildsuche im Internet• Ausgabe einer sprachlichen Szenenbeschreibung• Beantworten sprachlicher Anfragen bezüglich der

Szene

Page 18: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

1.3 Entwicklung des Fachgebietes

Page 19: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Entwicklung des Fachgebietes• 1955: Aufbereitung von Luftbildern• 1960: Zeichenerkennung, Mustererkennung (Klassifikation)• 1965: Analyse von Polyederszenen (Blockswelt)• 1975: Rekonstruktion dreidimensionaler Informationen aus

zweidimensionalen Bildern, Klassifizierung von Knoten und Kanten in Blocksweltszenen

• 1979: Analyse von Straßenverkehrsszenen• 1982: Untersuchung biologischer Systeme, Einbeziehung von

Forschungsergebnissen aus der Neurophysiologie und Psychophysik für das Bildverstehen, Orientierung an kognitiven Zielen (Modell von Marr)

• 1990: Modellierung eines Sehsystems als aktiv handelnder Agent

• 1990: Anwendung neuronaler Netze• 1992: automatische Fahrzeugsteuerung

Page 20: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

1.4 Grundbegriffe und Vorgehensweise bei der

Bildanalyse

Page 21: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Grundbegriffe und Vorgehensweise

• Wir betrachten 2 Modelle, um wesentliche Begriffe und die prinzipielle Vorgehensweise der Bildanalyse zu demonstrieren.

1. Modell nach Marr

2. Modell der Bildanalyse

Page 22: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Modell nach Marr

Bild

primäre Skizze

2½D-Skizze

3D-Modellrepräsentation

Page 23: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Modell nach Marr• Bild: digitales Rasterbild mit radiometrischen

Eigenschaften jedes Bildpunktes, wie:– Grauwert– Farbe

• primäre Skizze: erster Eindruck, die sehr große Datenmenge des Bildes soll sinnvoll reduziert werden, ohne wesentliche Informationen für die nachfolgenden Verarbeitungsschritte zu verlieren, z.B.:– Grauwertänderungen, Kanten– lokale 2D-Geometrie einfacher Bildelemente– Gruppierung einfacher Elemente

Page 24: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Modell nach Marr• 2½D-Skizze: geometrische und photometrische

Eigenschaften der sichtbaren Oberflächen:– partielle Form- und Geometriekonstruktion– Tiefeninformation– Orientierung der sichtbaren Oberflächen (Normalvektoren)– Konturen von Oberflächendiskontinuitäten

(Orientierungssprünge, Entfernungsänderungen)

• 3D-Repräsentation:– Integration mehrerer 2½D-Skizzen– Aussagen über verdeckte Teile– Szenenbeschreibung (Objekte und deren Relationen

zueinander)

Page 25: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Modell zum Bildverstehen

Szenen-beschreibung

Szenen-beschreibung

Bild-beschreibung

Bild-beschreibung

Welt-beschreibung

Welt-beschreibung

SzeneSzene

BildBildWeltWelt

Computer

RealitätBildverarbeitungSegmentierung

BildanalyseObjekterkennung

Interaktion

HöhereBilddeutung

AufnahmeSzenenauswahl

Page 26: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Repräsentationsebenen• Welt:

– physikalische Objekte mit Attributen– Objektkonfigurationen– Bewegung der Objekte

• Szene:– 3D-Ausschnitt der Welt– bestimmter Zeitpunkt

• Bild:– 2D-Abbild einer Szene

Page 27: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Repräsentationsebenen• Bildbeschreibung:

– vom Bild ausgehend (Bottom – up)– 2D-Bildelemente (Kanten, Segmente)– ohne Vorerwartungen

• Szenenbeschreibung:– Interpretation der Bildelemente als Szenenelemente, z.B.:– Bildkante — Hauskante oder Schattengrenze– rotes Segment — Hauswand– grünes Segment — Gras

• Weltbeschreibung:– von einer Fragestellung ausgehend (Top – down)– es wird Vorwissen (Hintergrundwissen) benötigt

Page 28: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Szenenauswahl

• Was soll betrachtet werden ?• Wann wird betrachtet ?

Welt Szene

Szenenauswahl

Page 29: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Bildaufnahme

• Wie soll die Szene betrachtet werden ?• Sensorauswahl• Probleme der Bildaufnahme siehe Kapitel 7

Szene Bild

Bildaufnahme

Page 30: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Bildverarbeitung – Bildsegmentierung

• Bildverbesserung• Bild zu Bild Transformationen• Finden von Kanten• Finden von homogenen Bildbereichen (Bildsegmentierung)• Kapitel 2, 3 und 4

Bild Bildbeschreibung

Bildverarbeitung, Bildsegmentierung

Page 31: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Bildanalyse – Objekterkennung

• Gruppierung einfacher geometrischer Objekte (parallele Linien, Punkte auf gegebenen Kurven)

• Berechnung von Objektmerkmalen• Klassifikation von Objekten• Shape from X (die Form wird aufgrund einer bestimmten

Methode X errechnet)• 2½D – Rekonstruktion der Szene• Kapitel 5, 6 und 7

Bildbeschreibung Szenenbeschreibung

Bildanalyse, Objekterkennung

Page 32: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Höhere Bilddeutung

• Repräsentation und Prozesse oberhalb der Ebene erkannter Objekte

• Objektkonfigurationen• Situationen• Bewegungsabläufe• Episoden

Szenenbeschreibung Weltbeschreibung

Höhere Bilddeutung

Page 33: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Interaktion

• direkte Interaktion mit der Umwelt• Umwelt verändern• Richtigkeit des bildverstehenden Systems verifizieren• aktiver Roboter

Weltbeschreibung Welt

Interaktion

Page 34: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

1.5 Anwendungen

Page 35: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Spezielle Anwendungen

• Zeichenerkennung• Qualitätsprüfung in der industriellen Produktion• Medizinische Bildanalyse• Luftbildauswertung• Fahrzeugsteuerung• Gesichtserkennung• Robotik• Inhaltsbasierte Bildsuche im Internet (Suche nach

vermissten Kindern, Suche nach staatsfeindlichen Symbolen)

Page 36: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Zeichen- und Texterkennung

Page 37: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Schrifterkennung

Page 38: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Schrifterkennung

Page 39: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Schrifterkennung

Page 40: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Schrifterkennung

Page 41: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Maßprüfung - Gewindetiefe

Page 42: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Maßprüfung - Gewindetiefe

Page 43: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Anwesenheitskontrolle

Page 44: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Anwesenheitskontrolle

Page 45: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Inhaltsbasierte Bildsuche im Internet

• Texterkennung in Bildern• Gesichtserkennung (Personensuche)• Symbolerkennung

Page 46: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Inhaltsbasierte Bildsuche im Internet

Page 47: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

Inhaltsbasierte Bildsuche im Internet

• Suche nach vermissten Kindern • Suche nach staatsfeindlichen Symbolen

Page 48: Vorlesung an der TU Chemnitz SS 2012 · Übersicht der Vorlesung. 1 Einführung. 1 Einführung 1.1 Einordnung des Fachgebietes 1.2 Was ist Bildanalyse ... Computergrafik. Wie versteht

1.6 Literaturhinweise

siehe Buch