Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese...

31
Seite 1 Universität Marburg IDBS 12. Information Retrieval und Multimedia-Datenbanken Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung Multimedia-Datenbanken dar, die Herr Dr, Ingo Schmitt an der Uni Magdeburg gehalten hat. Medium Medium vermittelt zwischen zwei oder mehreren Kommunikationspartnern Sender erzeugt Signale auf Medium Empfänger (Rezeptor) nimmt Signale auf zur • Interpretation • Wandlung • Weiterleitung Medium ist Nachrichtenträger Physische Medien • Schall in festen, flüssigen und gasförmigen Stoffen • elektromagnetische Wellen

Transcript of Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese...

Page 1: Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung.

Seite 1

Universität MarburgIDBS

12. Information Retrieval und Multimedia-Datenbanken

Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung Multimedia-Datenbanken dar, die Herr Dr, Ingo Schmitt an der Uni Magdeburg gehalten hat.

Medium– Medium vermittelt zwischen zwei oder mehreren

Kommunikationspartnern– Sender erzeugt Signale auf Medium– Empfänger (Rezeptor) nimmt Signale auf zur

• Interpretation• Wandlung• Weiterleitung

Medium ist Nachrichtenträger– Physische Medien

• Schall in festen, flüssigen und gasförmigen Stoffen• elektromagnetische Wellen

Page 2: Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung.

Seite 2

Universität MarburgIDBS

Medium Medium vermittelt zwischen zwei oder mehreren Kommunikationspartnern

– Sender erzeugt Signale auf Medium

– Empfanger (Rezeptor) nimmt Signale auf zur�• Interpretation

• Wandlung

• Weiterleitung Medium ist Nachrichtenträger

– Physikalische Medien

• Schall in festen, flüssigen und gasförmigen Stoffen

• elektromagnetische Wellen

EmpfängerMediumerzeugt interpretiert

Sender

Page 3: Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung.

Seite 3

Universität MarburgIDBS

Abstrakte Medien Unter Verwendung von physikalischen Medien werden abstrakte Medien

erzeugt.

erzeugt interpretiertSender Empfänger

Multimedia

– Komposition verschiedener Medien

– Darstellungsmächtigkeit z.B. Geruch versus Bild

– Medienumsetzung oft möglich

Page 4: Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung.

Seite 4

Universität MarburgIDBS

Klassifizierung der Medien (1)

nach Sinnesorganen visuell (optisch)

– sprachlich (symbolgebunden)

• Text

• Piktogramme

– nicht-sprachlich

• Grafiken

• Gotos akustisch

– Sprache

– Musik haptisch (tasten) gustorisch (schmecken) olfaktorisch (riechen)

Page 5: Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung.

Seite 5

Universität MarburgIDBS

Klassifizierung der Medien (1)

nach Zeit relativ zeitinvariant (statisch): Text, Bild, Photos, ... relativ zeitgebunden (dynamisch): gesprochene Sprache, Video,

engl.: continuous media

Page 6: Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung.

Seite 6

Universität MarburgIDBS

Medien auf Computern Text Grafik Rasterbild Tonaufnahmen (Audio) Bewegte Bilder (Video)

Begriffe Dokument: logisch zusammenhängender, digital kodierter Text Multimedia-Dokument: besteht aus Text und anderer Medien-Typen Multimedia-Objekt

– computerverwaltete logische Informationseinheit in einem oder mehreren Medien (mindestens ein Medium ist nicht alphanumerisch)

Medien-Daten bzw. Multimedia-Daten

– heterogene Menge von Medien-Objekten bzw. Multimedia-Objekten

Page 7: Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung.

Seite 7

Universität MarburgIDBS

Multimedia-Datenbank-Managementsystem

= DBMS

+ Multimedia-Datenbankmodell

– Medien-Typen: Darstellung + Operationen

– Substitutions- und Synchronisationsbeziehungen

+ Information Retrieval (inhaltsbasierte, unscharfe Suche)

+ Multimediadatenunabhängigkeit

– Medienabstraktion

– Unabhängigkeit von Speicherformaten

– Unabhängigkeit von Speichergeräten

– Präsentationsunabhängigkeit

+ Speicher- und Ein-/Ausgabegeräte

+ Zeitaspekt (etwa Echtzeit für dynamische Medien)

+ Benutzerschnittstellen

Page 8: Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung.

Seite 8

Universität MarburgIDBS

Beispielanwendung Polizeiinformationsystem

– Relationale Daten– Dokumente– Bilddaten– Überwachungsvideos– Telfondaten

Anfragen Image-Query:

– Suche alle Bilder, die die selbe Person zeigen wie auf diesem Bild!• entweder über Beschreibungsinformationen oder Bildverarbeitung

Audio-Query: – Kann Person zu gesprochener Stimme identiziert werden? Hat die selbe Person andere

Gespräche geführt?• Unter Verwendung von Sprachvektoren

Text-Query: – Finde alle Dokumente, bei denen es um Drogenkartell-Finanztransaktionen mit Firma

ABC geht!• keine reine Stichwortsuche Berücksichtigung von Semantik

Video-Query: – Finde alle Videosegmente, wo das Angriffsopfer erscheint!

Page 9: Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung.

Seite 9

Universität MarburgIDBS

Komplexe Anfragen heterogene Query

– Finde alle Personen, die des versuchten Mordes in Nordamerika überführt wurden und elektronische Geldüberweisung auf deren Konto von der ABC Corp. kommen!

• mehrere heterogene Datenbanken heterogene Multimedia-Query:

– Finde alle Personen, die mit Jose Smith photographiert wurden und als versuchte Mörder in Nordamerika überführt wurden und von ABC Corp. Geld bekommen haben!

Unscharfe heterogene Multimedia-Query:

– Finde alle interessanten Personen, die Kontakt zu Jose Smith hatten

Page 10: Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung.

Seite 10

Universität MarburgIDBS

Prinzipien des Information Retrieval

Einführung Information-Retrieval-Modelle Relevance Feedback Bewertung von Retrieval-Systemen Nutzerprole Literaturempfehlungen

Page 11: Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung.

Seite 11

Universität MarburgIDBS

Motivation Besonderheit: Verwaltung von Daten anhand ihrer Interpretation Suche von relevanten Dokumenten notwendig zur Suche von Multimedia-Objekten in Datenbanken

– z.B. Bild mit Flusslandschaft Information Retrieval versus Daten Retrieval

– Datenbankanfrage anhand exakt formulierter Bedingungen

select ISBN

from Buch

where Titel = "Multimedia-Datenbanken".

– unscharfe Formulierung in IRS

Finde alle Text-Dokumente, die sich mit dem Thema "Multimedia-Datenbanken" beschäftigen.

Information-Retrieval-System (IRS)

Page 12: Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung.

Seite 12

Universität MarburgIDBS

Historie von IRS Einsatz in Bibliotheken seit 70er Jahren Stärke bei Verwaltung schwachstrukturierter Daten, etwa

– Text-Dokumente

– XML Aufgrund Datenflut:

– Problem des Findens geeigneter Informationen Thema hatte lange Zeit kaum Relevanz, aber erfährt derzeit wieder eine

Art Wiedergeburt!

– Internet-Suchmaschinen

Page 13: Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung.

Seite 13

Universität MarburgIDBS

Grundproblem

Inhalt von Dokumenten und Medien-Objekten oft nur schwer anhand Datenbankschema strukturierbar und erschließbar

Lösungsansatz: Ähnlichkeitssuche mittels IR-Techniken

Formulierung einer Anfrage als Dokument (Ähnlichkeitssuche oder query by example)

– Liefere alle Text-Dokumente, die zum Text-Dokument #0815 ähnlich sind.

– Liefere alle Text-Dokumente die ähnlich zum Multimedia-Dokument "Urlaub Sommer Mittelmeer" sind.

als Anfrage (Eingrenzung durch Bedingungen)

– Datenbank and (Bild or Video)

Page 14: Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung.

Seite 14

Universität MarburgIDBS

Daten versus Information Retrieval Daten sind unstrukturiert implizit formulierte Information

– erfordert Interpretation Suche nach Dokumenten, die ausreichend wahrscheinlich relevant bzgl.

Anfrage sind

– z.B. Suche von Text-Dokumenten anhand eines Texts Toleranz bzgl. Fehler bei Anfrageformulierung

auch irrelevante Ergebnisse möglich

– Wiederholung der Anfrage unter Verwendung der bisher erzielten Ergebnisse

Ergebnisreihenfolge ist wesentlich Einschränkung der Ergebnisgröße durch

– Schwellwert

– Ergebnisanzahl

Page 15: Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung.

Seite 15

Universität MarburgIDBS

Zusammenfassung der UnterschiedeMerkmal Daten Retrieval Information Retrieval

Information explizit implizitErgebnisse exakt unscharfAnfrage einmalig iterativ verfeinerndFehlertoleranz keine vorhandenErgebnistypMenge Liste

Page 16: Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung.

Seite 16

Universität MarburgIDBS

Schritte des IRStatt eines direkten Vergleichs zwischen Anfrage und Dokumenten:

1. Überführung Anfrage und Dokumente in interne Darstellung

– Extraktion von Daten, welche Semantik der Dokumente beschreiben

– relevante Informationen explizit und kompakt

• z.B.: Zusammenfassungen von Texten

2. Vergleich der internen Darstellungen durch Ähnlichkeitsfunktion

– numerischer Relevanzwert drückt Ähnlichkeit aus

• abhängig von Distanzfunktion

3. Ergebnis

– Dokumente mit höchsten Relevanzwerten absteigend sortiert

– Einschränkung der Ergebnisliste durch Schwellwert bzw. Ergebnisanzahl

4. Relevanzbewertung und Feedback, wenn Ergebnis nicht zufriedenstellend

– Anfrage-Iteration

– Modifikation der Anfrage

– Modifikation der internen Darstellung

Page 17: Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung.

Seite 17

Universität MarburgIDBS

Information-Retrieval-Modelle IR-Modell definiert

– interne Dokumentdarstellung,

– Anfrageformulierung und interne Anfragedarstellung,

– Vergleichsfunktion zwischen jeweils zwei Dokumenten beziehungsweise zwischen Anfrage und jeweils einem Dokument.

Text-Retrieval

– Modelle wurden ursprünglich für Text-Retrieval entwicklt.

– Indexvokabular

• vordefinierte Menge von Indextermen

– Darstellung eines Dokumentes über auftretende Indexterme

– verschiedene Arten von Termgewichten Text-Model lässt sich auch auf andere Medien-Typen anwenden.

Page 18: Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung.

Seite 18

Universität MarburgIDBS

Traditionelle IR-Modelle Boole'sches Modell Fuzzy-Modell Vektorraummodell

Boole'sches Modell basiert auf Mengentheorie und Boole'scher Algebra sehr einfaches Modell mit klarer Semantik Dokumente als Mengen von Indextermen

– Termgewichte sind binÄR: im Dokument enthalten oder nicht enthalten

Test auf Enthaltensein als Vergleichsfunktion Verknüpfung von Enthaltenseinsbedingungen mittels

– Boole'scher Junktoren

– and (Mengendurchschnitt), or (Mengenvereinigung), not (Mengendifferenz)

Page 19: Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung.

Seite 19

Universität MarburgIDBS

Beispiel

Indexvokabular {Korsika, Sardinien, Strand, Ferienwohnung, Gebirge}

– Dokument d1 : {Sardinien, Strand, Ferienwohnung}

– Dokument d2 : {Korsika, Strand, Ferienwohnung}

– Dokument d3 : {Korsika, Gebirge}

Anfrage

– Korsika liefert {d2, d3}

– Ferienwohnung liefert {d1, d2}

– Ferienwohnung and Korsika liefert {d2}

– Ferienwohnung or Korsika liefert {d1, d2, d3}

– Ferienwohnung and not Korsika liefert {d1}

Page 20: Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung.

Seite 20

Universität MarburgIDBS

Neue Anfragesyntax

but-Junktor Anfrage: not Korsika liefert alle Dokumente, die "Korsika" nicht enthalten,

– u.U. qualifiziert sich die ganze Dokumentkollektion

– Statt dessen Verwendung but-Junktor

• (entspricht and not, also Komplement bzgl. einer Vorauswahl)

• Beispiel:Ferienwohnung but Korsika

of-Konstrukt Suche nach Dokumenten, die m von n (m < n) Termen enthalten

– 2 of (Korsika, Strand, Ferienwohnung) Ersetzt den komplexen Boole'schen Ausdruck

– (Korsika and Strand) or (Korsika and Ferienwohnung) or (Strand and Ferienwohnung)

Page 21: Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung.

Seite 21

Universität MarburgIDBS

Naive Anfrageauswertung jeder Term liefert Menge von Dokumenten, die diesen Term enthalten komplexe Anfrage: Kombination der Dokumentmengen durch

entsprechende Mengenoperationen Normalisierung der Anfrage durch Überführung in DNF

– kleine Zwischenergebnisse (zuerst Durchschnitt, dann Vereinigung)

Page 22: Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung.

Seite 22

Universität MarburgIDBS

Nachteile des Boole'schen Modells exaktes Modell aufgrund binärer Gewichte

– Entspricht eher Daten-Retrieval

– keine Ähnlichkeitssuche durch zu scharfe Suche Größe des Ergebnisses

– alle Dokumente sind bzgl. Anfrage gleichrangig Präsentation der gesamten Ergebnismenge

– Ergebnismenge in Abhängigkeit von Anfrage oft zu groß oder zu klein bzw. leer

Boole'sche Junktoren

– schwierige Anwendung Boole'scher Junktoren

– Verwechslung mit "und", "oder" und "nicht"

Page 23: Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung.

Seite 23

Universität MarburgIDBS

Milderung Problem "Größe des Ergebnisses"

faceted query

– zweistufiges Suchverfahren

• Formulierung und Verfeinerung der Anfrage anhand benannter Anfragen und Ergebnisanzahl

• Ergebnis zur finalen Anfrage anzeigen

Beispiel:

– Korsika liefert Q1: 1345Q1 and Strand liefert Q2: 13

– Anzeige Q2 liefert die 13 Ergebnisdokumente

Page 24: Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung.

Seite 24

Universität MarburgIDBS

Fuzzy-Modell Erweiterung des Boole'schen Modells um Unschärfe (fuzzy) Verallgemeinerung Boole'scher Junktoren Unschärfe durch graduelle Zugehörigkeit von Dokumenten zu Termen

Definition: Eine Fuzzy-Menge A = {(u,A(u)} über einem Universum U ist durch eine

Zugehörigkeitsfunktion A: U [0; 1] charakterisiert, welche jedem Element u des Universums U einen Wert A(u) aus dem Intervall [0; 1] zuordnet.

Fuzzy-Mengen beim IR

– Universum ist Menge aller gespeicherten Dokumente

– Term definiert Fuzzy-Menge

– Zugehörigkeit (Fuzzy-Wert) des Dokuments d zu Term t durch Wert t(d)

• 0 für keine Relevanz

• 1 für maximale Relevanz

• Zwischen 0 und 1: graduelle Relevanz

Page 25: Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung.

Seite 25

Universität MarburgIDBS

Beispiel Universum umfasst 3 Dokumente {d1, d2, d3}

– Dokument d1 : {Sardinien, Strand, Ferienwohnung}

– Dokument d2 : {Korsika, Strand, Ferienwohnung}

– Dokument d3 : {Korsika, Gebirge} Fuzzy-Mengen Korsika bzw. Strand drücken Zugehörigkeit zu Term

"Korsika" bzw. "Strand" aus:

– Korsika = {(d1, 0,1), (d2, 0,6), (d3, 1)}

– Strand = {(d1, 0,3), (d2, 0,2), (d3, 0,8)}

Page 26: Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung.

Seite 26

Universität MarburgIDBS

Fuzzy-Junktoren Jedes Dokument ist in jeder Fuzzy-Menge vertreten

– übliche Mengenoperationen nicht anwendbar Junktoren ermitteln neue Zugehörigkeitswerte

– and durch Min-Funktion A B(u) = min(A(u), B(u))

– or durch Max-Funktion A B(u) = max(A(u), B(u))

– not durch Subtraktion von 1: A(u) = 1 - A(u)

Beispiel

1. Q1 = Korsika and Strand

2. Q2 = Korsika or Strand

3. Q3 = not Korsika

Anfrage d1 d2 d3

Korsika 0,1 0,6 1

Strand 0,3 0,2 0,8

Q1 Korsika Strand 0,1 0,2 0,8

Q2 Korsika Strand 0,3 0,6 1

Q3 Korsika 0,9 0,4 0

Page 27: Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung.

Seite 27

Universität MarburgIDBS

Fuzzy-Anfrageverarbeitung Überführung der Anfrage in disjunktive Normalform Jeder Suchterm induziert eine Fuzzy-Menge Anwendung entsprechender Fuzzy-Operationen auf Fuzzy-Mengen Erstellung der Rangliste der Ergebnisse:

– Dokumente absteigend sortieren nach Zugehörigkeitsgrad

Begrenzung Fuzzy-Ähnlichkeitsanfrage Ergebnis umfasst alle Dokumente des Universums Begrenzung der Anzahl durch

– Schwellwert für Zugehörigkeitswerte

– vorgegebene Anzahl von Ergebnisdokumenten Beispiel: Korsika and Strand

– Schwellwert 0,5 liefert d3

– Anzahl 2 liefert d2; d3

Page 28: Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung.

Seite 28

Universität MarburgIDBS

Berechnung von Zugehörigkeitswerte viele Möglichkeiten Beispiel (Ansatz von Ogawa, Morita, Kobayashi):

– mittels Term-zu-Term-Korrelationsmatrix

– Zeile entspricht Term i und Spalte entspricht Term j Parameter

– ni,j = Anzahl der Dokumente, welche die Terme ti und tj enthalten

– ni = Anzahl Dokumente, welche Term ti enthalten

Matrixelemente:ci,j = ni,j / (ni + nj - ni,j)

Zugehörigkeitsgrad eines Terms ti zu einem Dokument dj

ti(dj) = 1 - (1-ci,k)

k=1,2,..

Page 29: Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung.

Seite 29

Universität MarburgIDBS

Beispiel (Term-zu-Term Korrelationsmatrix) Dokumente

– d1 : {Sardinien, Strand, Ferienwohnung}

– d2 : {Korsika, Strand, Ferienwohnung}

– d3 : {Korsika, Gebirge} Korrelationsmatrix

tSardinien tStrand tFerienwohnung tKorsika tGebirge

tSardinien 1 0,5 0,5 0 0

tStrand 0,5 1 1 0,33 0

tFerienwohnung 0,5 1 1 0,33 0

tKorsika 0 0,33 0,33 1 0,5

tGebirge 0 0 0 0,5 1

Page 30: Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung.

Seite 30

Universität MarburgIDBS

Vektorraummodell weit verbreitetes Retrieval-Modell Dokumente als Vektoren eines Vektorraums

– Überführung Retrieval-Problem in Gebiet der linearen Algebra Voraussetzung

– Abbildung des Medien-Objekt auf eine feste Anzahl von numerischen Merkmalswerten

Beispiel (Bild-Retrieval):

– Vektorwerte etwa anhand Farbverteilung Beispiel Text-Retrieval:

– jeder Indexterm eine eigene Dimension

– Termgewicht (meist Häufigkeiten) als Vektorwert einer Dimension

Page 31: Universität Marburg IDBS Seite 448 12. Information Retrieval und Multimedia-Datenbanken Diese Folien stellen eine Auswahl des Foliensatzes der Vorlesung.

Seite 31

Universität MarburgIDBS

Ähnlichkeit im Vektorrraum Darstellung der Anfrage selbst als Vektor

– Ähnlichkeit zwischen Anfrage q und Dokument d über deren Vektoren Kosinusmaß

– Kosinus des eingeschlossenen Winkels als Ähnlichkeitsmaß