ISWeb - Information Systems & Semantic Web Marcin Grzegorzek [email protected] 4 Multimedia...

73
<is web> ISWeb - Information Systems & Semantic Web Marcin Grzegorzek [email protected] 1 4 Multimedia Information Retrieval 1. Einführung 2. Ablauf des Multimedia Information Retrievals 3. Daten eines Multimedia-Retrieval-Systems 4. Features 5. Eignung verschiedener Retrieval-Systeme

Transcript of ISWeb - Information Systems & Semantic Web Marcin Grzegorzek [email protected] 4 Multimedia...

Page 1: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 1

4 Multimedia Information Retrieval

1. Einführung

2. Ablauf des Multimedia Information Retrievals

3. Daten eines Multimedia-Retrieval-Systems

4. Features

5. Eignung verschiedener Retrieval-Systeme

Page 2: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 2

4.1 Einführung

Besonderheiten der Verwaltung und des Retrievals von Multimedia-Daten

Page 3: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 3

Besonderheiten

der Verwaltung und des Retrievals von Multimedia-Daten

im Vergleich zu Textdokumenten

Datenvolumen: großer Speicherplatzbedarf (z.B. Video-Objekte)

implizierte Semantik: nutzerrelevante Semantik implizit in Medien-Objekten

Heterogenität: viele Medien-Typen und Speicherformate

Page 4: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 4

Besonderheiten

der Verwaltung und des Retrievals von Multimedia-Daten

im Vergleich zu Textdokumenten (Forts.)

komplexe Multimedia-Objekte: Kombination verschiedener Medien-Typen, Referenzen und Einbettung

Ein-/Ausgabegeräte: Geräte für Datenimport und Darstellung

Page 5: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 5

Datenvolumen

Reduzierung des Datenvolumens durch Komprimierung verlustfrei versus verlustbehaftet

schnelle Algorithmen für Vorverarbeitung der Medien-Objekte und Ähnlichkeitsberechnung

zeitkritische Medien-Typen erfordern ausgeklügelte Resourcen-Verwaltung

kompakte Präsentation (etwa Thumbnails)

Page 6: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 6

Implizite Semantik

nutzerrelevante Semantik ist häufig nicht explizitz.B. Bildobjekte implizit in Pixeldaten

Extraktion von Feature-Werten nötig zur expliziten Quantifizierung bestimmter Eigenschaften

Page 7: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 7

Implizite Semantik (2)

Problem: Semantik ist subjektivz.B. Rasterbilder: ein Nutzer interessiert sich für Gebäude, der andere für Personen

Ideal: exakte, objektive, semantik-unterstützende Feature-Extraktion

jedoch: wenn automatisch

→ ungenau und low-level Semantik wenn manuell

→ aufwändig, subjektiv, aber high-level Semantik

Anfragesprache muss Spezifikation von Suchbedarf ermöglichen

Page 8: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 8

Heterogenität

unterschiedliche Medien-Typen und Speicherformate erfordern unterschiedliche Feature-Extraktion und Ähnlichkeitsberechnungen

System muss Erweiterung um neue Typen und Formate ermöglichen

Datenunabhängigkeit: medientyp- und speicherformatunabhängige Anfragenz.B. zeige alle Medien-Objekte zu einer Person an

Page 9: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 9

Heterogenität (2)

Medien-Umsetzung: etwa Umwandlung Text in Audio

Speicherformatumwandlung

spezielle Metadaten bzgl. Medien-Typ und Speicherformat notwendig

Page 10: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 10

Komplexe Multimedia-Objekte

komplexes Medien-Objekt: enthält mehrere eigenständige Medien-Objekte

Aggregation durch Referenzierung und Einbettung

für Verwaltung: Zerlegung in nichtkomplexe Medien-Objekte und Strukturdaten

Page 11: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 11

Komplexe Multimedia-Objekte (2)

Verwaltung von Strukturdaten zur Rekonstruktion und Retrieval Beispiel: Word-Dokument enthält Text und Bilder Beispiel: Comics enthalten Figuren und Sprechblasen

(Text)

Aggregation aufgrund Segmentierung Beispiel: Segmentierung auf Bildern in

Vordergrundobjekte und Hintergrund

Page 12: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 12

Vor der Segmentierung

Page 13: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 13

Segmentiert

Page 14: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 14

Ein-/Ausgabegeräte

Abhängigkeit von Medien-Typ und Speicherformat Bild → Bildschirm, Ton → Lautsprecher, ..

System muss Gerät des Nutzers kennen→ Nutzer- und Hardware-Profile mit Präferenzen

Page 15: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 15

Ein-/Ausgabegeräte (2)

System verwendet Profil zur Unterstützung der Anfrageformulierung garantierten Darstellbarkeit von Anfrageergebnissen

erfordert u.U. Medienumsetzung oder Speicherformatumwandlung

Optimierung: Reduzierung benötigter Resourcenetwa Netzwerkbandbreite

Page 16: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 16

Zusammenfassung

Page 17: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web> Information Systems & Semantic Web

University of Koblenz ▪ Landau, Germany

4.2 Ablauf des Multimedia Information Retrieval

Page 18: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 18

5 Aktionen

1. Einfügen in die Multimedia-Datenbank

2. Extraktion der Feature-Werte

3. Aufbereitung der Anfrage

4. Anfragebearbeitung und Ähnlichkeitsberechnung

5. Ergebnisaufbereitung

Page 19: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 19

Verwaltung & Retrieval von Multimedia-Daten:

Ablauf (1)

Page 20: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 20

Verwaltung & Retrieval von Multimedia-Daten:

Ablauf (1)

Page 21: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 21

Einfügen in die Multimedia-Datenbank

Unterscheidung Multimedia-Objekte, Metadaten, Strukturdaten und relationale Daten

Metadaten: etwa bzgl. Medien-Typ, Speicherformat, Profildaten

relationale Daten: etwa Namen von abgebildeten Personen, Aufzeichnungszeitpunkt

Page 22: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 22

Einfügen in die Multimedia-Datenbank (2)

Zerlegung komplexer Multimedia-Objekte in nichtkomplexe Multimedia-Objekte und Strukturdaten

Normalisierung der Medien-Objekte zur Unterdrückung von Störfaktorenz.B. Verzerrungen bei Bildaufnahmen, Hintergrundgeräusche bei Audio-Daten

Segmentierung der Medien-Objektez.B. Bildsegmentierung in Regionen, Videosegmentierung in Szenen

Page 23: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 23

Extraktion der Feature-Werte

Feature-Erkennung: Algorithmen zur Ableitung von Feature-Werten Abhängigkeit von Medien-Typ und Speicherformat,

beabsichtigte Ähnlichkeitsberechnung Beispiel: Gabor-Filter für Texturen,

Bewegungsvektoren in Video-Objekten

Page 24: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 24

Extraktion der Feature-Werte (2)

Feature-Aufbereitung Skalierung Entfernen von Abhängigkeiten Entfernen überflüssiger oder vernachlässigbarer

Feature-Wertez.B. KLT, LSI

Ablegen im Feature-Index

Page 25: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 25

Dynamische vs statische Feature-Extraktion

statisch: Anfrageaufbereitung nach der Feature-Extraktion Vorteil: Geschwindigkeit durch

Verwendung spezieller Indexstrukturen

Nachteil: unflexibel bzgl. unvorhersehbaren Ähnlichkeitsanfragenvordefinierte Features: z.B. in ORDBMS Farbverteilung, Textur, Gestalt

dynamisch: Feature-Extraktion nach der Anfrageaufbereitung

Vorteil: flexible Anpassung der Feature-Extraktion an Anfrage

Nachteil: hoher Aufwand

Kombination vorhandene Feature-Werte verwenden wenn nötig, neue extrahieren und aufbewahren

Page 26: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 26

Aufbereitung der Anfrage

Anfrage zerlegbar in klassische und Ähnlichkeitsanfrage

Optimierung der klassischen Anfrage

Ähnlichkeitsanfrage anhand Anfrageobjekt: Schritte wie beim Einfügen in Datenbank und Extraktion

Page 27: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 27

Anfragebearbeitung & Ähnlichkeitsberechnung

Ähnlichkeitsanfrage: Berechnung der ähnlichen Objekte anhand Ähnlichkeitsfunktion unter Ausnutzung Feature-Index

bei komplexen Ähnlichkeitsanfragen: Zerlegung und anschließende Kombination der Ergebnissequenzen

Page 28: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 28

Anfragebearbeitung & Ähnlichkeitsberechnung

(2)

Kombination auch mit Ergebnis der klassischen Datenbankanfrage

Beispiel: Suche nach Gemälde von Caspar David Friedrich mit Abendstimmung

Problem:klassisches Retrieval + Ähnlichkeitssuche(mögliche Erweiterungen: probabilistische Relationale Algebra, Fuhr et al.)

Page 29: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 29

Kombination von Ergebnissequenzen

Suche nach Bildern mit Sonnenuntergang

Page 30: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 30

Ergebnisaufbereitung

Anpassung an Vorgaben des Anwenders (Nutzer- und Geräteprofile)

Medienumsetzung, Formatumwandlung, Transformationen, Rekonstruktion komplexer Objekte

Optimierung Medien-Daten in verschiedenen Formaten vor Anfrage

anlegen Reihenfolge von Transformationsschritten

Page 31: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 31

Ergebnisaufbereitung (2)

zeitliche und räumliche Anordnung der Ergebnisobjekte

Interaktion mit Nutzer gewährleistenz.B. play, stop, rewind bei Video-Objekten

Page 32: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 32

Relevance Feedback

Ergebnisbewertung

Anpassung von Parametern des Systems anhand der Bewertungen

Durchführung der Iterationen

Page 33: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 33

4.3 Daten eines Multimedia-Retrieval-Systems

Page 34: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 34

Klassifikation der Daten

Medien-Objekt: Daten eines Medien-Typs textuell oder nicht-textuell

Multimedia-Objekt: Kombination mehrerer Medien-ObjekteZerlegung in Medien-Daten und Strukturdaten sinnvoll

Page 35: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 35

Klassifikation der Daten (2)

Strukturdaten: nicht-textuell durch Graphen oder textuell, etwa durch Hypertext-mechanismen von Markup-Sprachen

weitere Daten

Page 36: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 36

Beispiel: Zerlegung eines Multimedia-Objekts

HTML-Datei:

Page 37: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 37

Beispiel: Zerlegung eines Multimedia-Objekts (2)

Zerlegung in mo-001.html:

Page 38: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 38

Beispiel: Zerlegung eines Multimedia-Objekts (3)

und Strukturdaten:

Page 39: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 39

Klassifikation der Metadaten

Page 40: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 40

Klassifikation der Metadaten (2)

inhaltsunabhängig:wichtig für Verwaltung und Interpretation

inhaltsbezogen:Semantik auf niedriger Abstraktionsstufe, aber automatisch Extrahierbar

Page 41: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 41

Klassifikation der Metadaten (3)

inhaltsbeschreibend: Semantik auf hoher Abstraktionsstufe, kaum automatisch extrahierbar objektbeschreibend: Beschreibung einzelner Medien-

Objekte kontextbezogen: Beschreibung von Medien-Objekten

bezogen auf Kollektion von Medien-Objekten kontextbeschreibend: Beschreibung einer Kollektion

von Medien-Objekten

Page 42: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 42

Beispiel inhaltsunabhängige und -bezogene Metadaten

Page 43: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 43

Beispiel inhaltsbeschreibende Metadaten

textuelle Objektbeschreibung: Multimedia-Objekt enthält Kontaktinformation und Passfoto von Mitarbeiter Franz Klammer

nicht-textuelle Objektbeschreibung: Relation mit Namen und Adressen von auf Passfotos dargestellten Personen

Page 44: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 44

Beispiel inhaltsbeschreibende Metadaten (2)

kontextbeschreibende Metadaten: Kollektion enthält Mitarbeiterdaten einer Abteilung

kontextbezogene Metadaten: Zeitpunkt der Aufnahme der jeweiligen Fotos

Page 45: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 45

4.4 Features

Feature-Extraktion und Invarianzen

Feature-Datentypen

Feature-Aufbereitung

Page 46: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 46

Feature-Extraktion und Invarianzen

Anforderungen an Feature-Extraktion

Adäquatheit: Werte müssen Eigenschaft angemessen ausdrücken

effiziente Berechnung

Berücksichtigung von Invarianzen:Unabhängigkeit von ungewollten Eigenschaften

Page 47: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 47

Feature-Extraktion und Invarianzen

Anforderungen an Feature-Extraktion (Forts.)

Minimalität: minimale Anzahl von Feature-Werten

Orthogonalität: orthogonale Feature-Werte

Page 48: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 48

Invarianzen

Beispiele von Störungen:

verfälschende Lichtverhältnisse bei Foto-Aufnahmen

Knackgeräusche bei Tonaufnahmen

Artefakte bei Videoaufzeichnungen

Page 49: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 49

Invarianzen (2)

Unabhängigkeit von bestimmten Operationen, z.B.:

Rotation, Translation, Skalierung von Bildern

Farbverschiebung bei farbbasierten Features

Lautstärkeänderung bei gesprochenen Texten

Page 50: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 50

Invarianzen und Haar-Integral

Feature-Extraktionsfunktionsoll unabhängig von parametrisierbarer Transformationsfunktion g sein

Menge G enthalte alle anhand g parametrieierten Transformationsfunktionen

Page 51: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 51

Invarianzen und Haar-Integral (2)

invariante Extraktionsfunktion:

diskrete Parametrisierung:

Page 52: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 52

Allgemeine und spezielle Invarianzen

allgemeine Invarianzenwerden eher generell für Feature gefordert (etwa Störfaktoren) Normalisierung beseitigt Störfaktoren Beispiel: Unabhängigkeit von Textlänge bei

Textdokumenten Beispiel: Auflösung und Dateiformat von Rasterbildern

Page 53: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 53

Allgemeine und spezielle Invarianzen

spezielle Invarianzenwerden eher für bestimmte Feature gefordert Beispiel Meeresaufnahmen: Ausrichtung der Wellen sei

irrelevant Beispiel Suche nach Stoffmustern: Invarianz bzgl. Rotation

Page 54: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 54

Allgemeine und spezielle Invarianzen

spezielle Invarianzen (Forts.) Problem mit speziellen Invarianzen: Abhängigkeit von

konkreter Anfrage → schwer vorhersehbar → dynamische Feature-Extraktion

Page 55: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 55

Feature-Datentypen

Abhängigkeit von gewünschter Eigenschaft und Extraktionsalgorithmushäufige Datentypen:

Page 56: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 56

Umwandlung in Punktdatentyp

Punktdatentyp ist relativ universell und Ausgangspunkt vieler mathematischer und algorithmischer Verfahren

Intervall: pro Intervall zwei Dimensionen unten, oben sind einzelne Werte

Problem Abhängigkeit: unten ≤ oben Mittelwert und Intervallbreite

Problem Abhängigkeit am Rand des Wertebereichs

Page 57: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 57

Umwandlung in Punktdatentyp (2)

Binärdaten: pro Eigenschaft eine Dimension mit Wertebereich {0,1}

Sequenz und Region:Problem variable Werteanzahl; ein Ausweg: Anwendung diskreter Fouriertransformation Abbilden auf feste Anzahl Fourierkoeffizienten Vorteil: Kompaktheit, Abbildungsfehler nicht lokalisierbar

Page 58: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 58

Feature-Datentyp Histogramm

häufig verwendeter Datentyp

legt Menge disjunkter n-dimensionaler Intervalle (Bins) fest

pro Bin ein Häufigkeitswert

Beispiel: Farbhistogramm im 3-dimensionalen Farbraum

Page 59: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 59

Feature-Datentyp Histogramm (2)

Varianten von Histogrammen: feste Anzahl einheitlicher Intervalle

→ Punkdatentyp variable Anzahl und variable Intervalle

oder Darstellung Intervall durch Zentroid (Punkt)

Page 60: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 60

Feature-Datentyp Histogramm (2)

Varianten von Histogrammen (Forts.): Invarianz durch relative statt absolute Häufigkeiten (real

statt integer)

Page 61: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 61

Feature-Aufbereitung

Motivation Aufbereitung

fehlende Minimalität hoher Speicherplatzverbrauch hoher Berechnungsaufwand ineffiziente Indexstrukturen (Fluch der hohen Dimensionen)

Page 62: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 62

Feature-Aufbereitung (2)

fehlende Orthogonalität Abhängigkeiten innerhalb Feature-Werte möglich Problem: keine Manipulation von Werten isoliert möglich

→ schwere Realisierung etwa von Invarianzen

Page 63: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 63

4.5 Eignung verschiedener Retrieval-Modelle

boolsches Modell

Fuzzy-Modell

Vektorraummodell

klassische Retrieval-Modelle wurden für Text-Retrieval entwickelt

Page 64: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 64

Boolesches Modell

Eignung:

basiert auf Mengentheorie und boolescher Algebra

keine Unterstützung gradueller Ähnlichkeitswerte

Page 65: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 65

Boolesches Modell (2)

Semantik ist für viele Anwendungen zu scharf

Negativbeispiel: Bildähnlichkeitssuche

Vorteil: Konstruktion komplexer Anfragen mittels boolescher Junktoren

Page 66: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 66

Fuzzy-Modell

Eignung:

Verallgemeinerung boolesches Modell um graduelle Zugehörigkeitswerte (Ähnlichkeitswerte)

Junktoren auf Zugehörigkeitswerten ermöglichen Konstruktion komplexer Anfragen

Page 67: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 67

Import von Zugehörigkeitswerten (Ähnlichkeitswerten) aus Vektorraummodell

ermöglicht Einbindung relationaler Anfragen

Beispiel: Suche nach Gemälde von Caspar David Friedrich mit Abendstimmung

Fuzzy-Modell (2)

Page 68: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 68

Vektorraummodell

Eignung:

Feature-Werte von Medienobjekten als geometrische Objekte im Vektorraum

Verfahren der linearen Algebra für Retrieval einsetzbar

Page 69: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 69

Vektorraummodell (2)

gute Grundlage zur Ermittlung von Ähnlichkeitswerten

viele Distanz- und Ähnlichkeitsfunktionen verfügbar

Page 70: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 70

Multimedia-Ähnlichkeitsmodell

viele Möglichkeiten zur Berechnung von Ähnlichkeitswerten

hier vereinfachtes, verallgemeinertes Multimedia-Modell

Page 71: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 71

Voraussetzungen: Feature-Werte gruppiert nach Feature und

Extraktionsverfahren Ähnlichkeitswert (RSV für retrieval status value) pro

Medienobjekt und Ähnlichkeitsanfrage ein Ähnlichkeitswert aus [0,1]

Multimedia-Ähnlichkeitsmodell (2)

Page 72: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 72

Voraussetzungen (Forts.): mehrere Feature-Gruppen: Anfrage mit mehreren Gruppen mehrere Anfrageobjekte

z.B. aufgrund Nutzerprofil, positiv bewertete Objekte bei Anfrage-Iteration

Multimedia-Ähnlichkeitsmodell (3)

Page 73: ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia.

<is web>

ISWeb - Information Systems & Semantic Web

Marcin [email protected] 73

Multimedia-Ähnlichkeitsmodell (4)