Fachhochschule Potsdam Institut für Information und...

59
Fachhochschule Potsdam Institut für Information und Dokumentation Fortbildung zum/zur wissenschaftlichen Dokumentar/in Kurs C/2001 Bildretrieval: Recherchestrategien am Beispiel der Bilddatenbanken der Deutschen Presse Agentur und der Associated Press Lehrgebiet: Information Retrieval Gabriela Mirescu Wittelsbacherallee 149 60385 Frankfurt am Main Frankfurt am Main im Januar 2002

Transcript of Fachhochschule Potsdam Institut für Information und...

Page 1: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Fachhochschule Potsdam

Institut für Information und Dokumentation

Fortbildung zum/zur wissenschaftlichen Dokumentar/in

Kurs C/2001

Bildretrieval: Recherchestrategien am Beispiel der Bilddatenbanken der Deutschen Presse Agentur und der Associated Press

Lehrgebiet: Information Retrieval

Gabriela Mirescu

Wittelsbacherallee 149

60385 Frankfurt am Main

Frankfurt am Main im Januar 2002

Page 2: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Abstract

Diese Arbeit befaßt sich mit den in den Bilddatenbanken der Deutschen

Presse Agentur und der Associated Press eingesetzten Retrievaltechniken

und Recherchestrategien. Ein besonderes Augenmerk gilt den in diesen bei-

den Presseagenturen verwendeten Bildbeschreibungsverfahren und der

damit einhergehenden Indexierungspraxis. Ausführlich werden die verschie-

denen Handhabungen der Recherchesoftware und der damit verbundenen

Retrievalmethoden dargestellt. Weiterführende Recherchestrategien sowie

die neuesten Entwicklungen zum Image Retrieval werden in Bezug auf die

Verbesserung der Vollständigkeit (recall) und der Genauigkeit (precision) der

Rechercheergebnisse angeführt.

Page 3: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Einleitung

Einleitung Dem Pressebild als Instrument der Dokumentation und Information kommt in

den Massenmedien eine wachsende Bedeutung zu. Durch die technische

Entwicklung der Fotografie - vornehmlich der digitalen Fotografie - und der

damit einhergehenden massenhaften Reproduzierbarkeit, wird die Bilderflut

immer unüberschaubarer. Pressebildagenturen, die täglich hunderte von

tagesaktuellen Fotos über ihre Bilderdienste an ihre Abonnenten verschicken

und größtenteils auch über ein konventionelles Bildarchiv verfügen, haben

Mitte der Neunziger Jahre angefangen, ihr Bildmaterial in Bilddatenbanken

zu erfassen. Diese digitale Archivierung, deren Grundlagen die Bilderfassung

und –betextung sowie ihre Speicherung und Übermittlung darstellen,

erleichtert nicht nur die Redaktionsarbeit, sondern ermöglicht auch ihre

wirtschaftliche Verwertung, d.h. den Verkauf an externe Nutzer/innen.

Das digital gespeicherte Bild, das angeboten wird, soll und wird von den

Kunden/innen selbstständig gesucht und muss natürlich auch von ihnen

gefunden werden. Sie werden nur dann zufriedenstellende Ergebnisse bei

der Suche und Bildbeschaffung erzielen, wenn sie komfortabel, schnell und

zielgerecht an die gewünschten Bilder kommen. Daher ist die wichtigste

Aufgabe der Bilddokumentare/innen und –archivare/innen, das vorhandene

Bildmaterial so zu erschließen, dass ein Höchstgrad an Genauigkeit

(precision) und Vollständigkeit (recall) der Recherche ermöglicht wird. Die

Verbesserung des Bildretrievals durch Anwendung verschiedener Recher-

chemethoden und –strategien hat dabei oberste Priorität. Das fotografische

Gedächtnis und die Erfahrung der Bilddokumentare/innen im Umgang mit

den täglichen, teilweise sehr unpräzisen Anfragen der Abonnenten/innen und

Nutzer/innen ist nicht zu unterschätzen, ebenso ihre Kenntnis des Daten-

bankbestandes und ihr Einfühlungsvermögen, was die Wünsche der

Kunden/innen betrifft.

Im Rahmen eines sechswöchigen Praktikums in der Bilddokumentation der

Deutschen Presse Agentur hatte ich Gelegenheit, die inhaltliche Erschlies-

sung von Bildern, wie auch die bei der Recherche angewandten Retrieval-

1

Page 4: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Einleitung

techniken kennen zulernen. Meine dabei gesammelten Erfahrungen konnte

ich während eines weiteren sechswöchigen Praktikums im Bildarchiv der

Associated Press einbringen und vertiefen.

Die vorliegende Arbeit befasst sich mit Recherchestrategien in den Bild-

datenbanken beider Presseagenturen. Dem geht eine Beschreibung der

Datenbanken, der Indexierpraxis und eine Darstellung angewandter Retrie-

valtechniken voraus.

Eine besondere Herausforderung stellte das Erkennen der Recherchestrate-

gien dar, denn im hektischen Tagesablauf der Agenturen waren einzelne

Schritte der Recherche kaum ersichtlich. Im Anschluß an die Darstellung der

angewandten Strategien stelle ich weiterführende und neue Recherche-

strategien vor.

2

Page 5: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Die Bilddatenbank der Deutschen Presse Agentur

2. Die Bilddatenbank der Deutschen Presse Agentur

Die Deutsche Presse Agentur GmbH1, als führende Nachrichtenagentur in

Deutschland und eine der großen internationalen Presseagenturen, liefert

rund um die Uhr aktuelle Nachrichten- und Bilderdienste hauptsächlich an die

Medien im In - und Ausland. Unverzichtbarer Bestandteil der Arbeit in der

dpa - Redaktion und - Dokumentation ist die Bilddatenbank, in der mittler-

weile über 1,2 Millionen Bilder zur Verfügung stehen. Täglich erweitern rund

700 aktuelle Bilder aus der Bildredaktion sowie dokumentarisch relevante

Bilder aus dem konventionellen Archiv diesen digitalen Bildbestand. Das kon-

ventionelle Archiv umfasst mehrere Millionen Schwarz/Weiß- und Farbfotos,

Filmnegative und Dias, die mehr als 100 Jahre Zeitgeschehen in allen Berei-

chen des öffentlichen Lebens dokumentieren. Dieser Bestand soll nach und

nach durch das elektronische Speicher- und Abrufsystem der dpa – Bild-

datenbank abgelöst werden.

Die dpa – Bilddatenbank enthält folgende Speicher:

- dpa – ( Farb - ) Bildfunk

- dpa – Fotoreport

- dpa – Archivreport

- Zentralbild – Fotoreport

- dpa – Sportreport

- dpa – Berlinreport

- Berlin Picture Gate ( BPG )

Screenshot der Speicher der dpa - Bilddatenbank

1 Im Folgenden wird die Abkürzung dpa verwendet, da diese Abkürzung den bekannteren und somit gebräuchlicheren Namen der Deutschen Presse Agentur darstellt. Die dpa – Bilddatenbank ist im Internet zu finden unter http://bilddatenbank.dpa.de

3

Page 6: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Die Bilddatenbank der Deutschen Presse Agentur

Der dpa – ( Farb - ) Bildfunk umfaßt alle Bilder des dpa – Bildfunks, die seit

dem 1. Januar 1995 unmittelbar nach der Ausstrahlung per Satellit, in die

Datenbank übernommen werden und somit sofort recherchierbar2 sind.

Dieser Bildbestand von zur Zeit 600.000 Motiven, erweitert sich täglich um

rund 250 aktuelle Bilder aus allen Ressorts.

Der dpa – Fotoreport bietet bei einem Bestand von über 65.000 Bildern

bzw. Bildserien, die nach folgenden Gesichtspunkten zusammengestellt sind:

„bunte“ Themen aus den Bereichen Gesellschaft, Politik, Wirtschaft, Kultur

und Vermischtes3. Täglich kommen etwa 150 Porträts, Symbolbilder,

Features, Logos etc. hinzu.

Der dpa – Archivreport beinhaltet über 150.000 Motive von bleibendem

historischen Wert aus mehr als 50 Jahren Zeitgeschichte, die aus den Be-

ständen der konventionellen Archive und anderen Quellen (dpa - Bildfunk

und dpa – Fotoreport) kontinuierlich aufgenommen werden.

Der Zentralbild – Fotoreport stellt über die dpa Tochteragentur Zentralbild,

mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60

Neuzugängen, einen Bestand von mittlerweile 70.000 Bildern zur Verfügung.

Der dpa – Sportreport bietet mehr als 130.000 Bilder zur Vorschau und

Dokumentation internationaler und nationaler Sportereignisse, darunter

Porträts, Aktionsfotos, Bildserien, Logos und Symbolbilder. Täglich werden

ca. 120 neue Bilder in den Bestand aufgenommen.

Der dpa – Berlinreport informiert mit rund 70 Bildern täglich über das

aktuelle, nicht nur politische und wirtschaftliche Geschehen in und um Berlin.

Die dpa – Bilderdienste vermarkten exklusiv über das Berlin Picture Gate (BPG) Bilder der Berliner Verlag GmbH & Co. und umfassendes Bildmaterial

2 Zur Erschließung und Übernahme der Bilder in die Bilddatenbank siehe hierzu die Ausführungen in Kapitel 5.1. 3 Zu den oben genannten Kategorien siehe Kapitel 4.1. und Stichwortliste im Anhang.

4

Page 7: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Die Bilddatenbank der Deutschen Presse Agentur

sowohl zur Geschichte und zu den Medien der DDR als auch Bildmaterial der

Archive der wichtigsten DDR – Zeitschriften.

Die dpa – Bilddatenbank gründet sich auf ein Datenbanksystem der Firma

Digital Collections GmbH Hamburg, das den journalistischen Anforderungen

der dpa angepaßt wurde. Die Bilddatenbank ist netzwerkfähig und zugäng-

lich sowohl über einen Macintosh – Computer wie auch über ein PC/IBM

kompatibles System. Die dpa stellt eine entsprechende Client – Software

bereit, mit deren Hilfe Abonnenten/innen und Nutzer/innen über ISDN Bilder

und Bildtexte online recherchieren und ihre Ergebnisse auf ihren Computer

laden können. Die Konzeption der dpa – Bilddatenbank ist auf journalistische

Nutzung ausgerichtet, wobei Schnelligkeit und Aktualität eine entscheidende

Rolle spielen. Dementsprechend sollen die gesuchten Bilder mit geringem

Zeitaufwand und durch Eingabe von natürlichsprachigen Suchbegriffen, wie

Substantiven, Adjektiven, Verben und Namen in allen Textelementen des

Bildes (Bildunterschrift und IPTC Datenfelder4) schnell und effektiv recher-

chierbar sein. Ein Linguistikprogramm führt die angewandten Textwörter auf

ihre Grundform zurück; Flexionsendungen bleiben unberücksichtigt und

Komposita werden in ihre Bestandteile zerlegt. Optimale Rechercheergeb-

nisse werden durch feldorientierte Suchmöglichkeiten, z. B. nach Stichwor-

ten, Kategorien, Bildtypen, Datum, Fotograf/in etc. erzielt5. Die miniaturhafte,

„thumbnail“-Ansicht der recherchierten Bilder läßt sich in einer Layout–

Version (ca. 500 KB) und in einer hochauflösenden Version (high resolution

bis zu 17,9 MB) auf den Rechner herunterladen. Dabei werden standardi-

sierte Datenformate wie JPEG6, TIFF7und IPTC (Textdatenfelder) ange-

boten. Die Layout - und high resolution – Versionen werden in Anlehnung an

4 International Press Telecommunications Council – ein Standard der sowohl die technische als auch die inhaltliche Form von Bildbetextungen festlegt. Näheres dazu in Kapitel 5. Internetadresse: www.IPTC.org 5 Siehe hierzu die Ausführungen und Beispiele in Kapitel 5.1., wie auch das Benutzerhandbuch der dpa – Bilddatenbank vom 01. Januar 1996, S. 33. 6 Standard Bildkompressionsverfahren, das von der Joint Photographic Experts Group entwickelt wurde. 7 Tag Image File Format ist ein unkomprimiertes hochauflösendes Bilddatenformat.

5

Page 8: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Die Bilddatenbank der Deutschen Presse Agentur

die Honorarübersicht der BVPA8 berechnet. Für Bezieher/innen des dpa –

Bildfunks ist der Abdruck von Bildern aus der dpa – Bildfunk - Datenbank

honorarfrei.

8 Bundesverband der Pressebild – Agenturen und Bildarchive Internetadresse: www.bvpa-ev.de

6

Page 9: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

The Associated Press Photo Archive

3. The Associated Press Photo Archive

1941 erwarb The Associated Press9, eine der größten Nachrichtenagenturen

in den USA, eine seit Anfang des 19. Jahrhunderts gewachsene fotogra-

fische Sammlung mit einem Bestand von 7 Millionen Fotografien und Film-

negativen. Das war der Anfang einer der weltweit umfangreichsten Quellen

historischer und journalistischer Fotografie. Täglich erweitern hunderte von

Bildern aus allen Bereichen (z.B. Nachrichten, Sport, Unterhaltung) und

Reportagefotos zu bestimmten Themen diesen immensen Bestand. Ein

großer Teil davon fließt in digitalisierter Form in die Bilddatenbank des

Fotoarchivs. Diese, seit 1995 eingeführte Bilddatenbank, The Associated

Press Photo Archive10, enthält eine Anzahl von ungefähr 700 000 zeitgenös-

sischen Bildern. Aktuelle, meist zur Bebilderung von internationalen

Nachrichten genutzte Fotografien und Grafiken machen den größten Teil

dieses Bestandes aus. Wöchentlich kommt eine Auswahl an historisch

relevanten, meist auf Anfrage von Abonnenten/innen und Nutzern/innen aus

der fotografischen Sammlung eingescannten Fotografien hinzu. Das digitale

Fotoarchiv besteht aus den vier folgenden Bilddatenbanken, die einzeln an-

gewählt werden können:

- International Archive

- European/Asian Archive

- Photo Archive Showcase

- Topic Gallery

Die International Archive - Datenbank hat mittlerweile einen Bestand von

400 000 Fotografien. Seit ihrer Einführung 1995 beinhaltet sie alle aktuellen

regionalen Bilder aus Nordamerika, die in den Vereinigten Staaten über

Photostream, eine Art Bildfunk vertrieben werden. Hinzu kommen die besten

Fotografien aus dem internationalen Fotoreport (insgesamt 800 täglich), die 9 Im Folgenden wird die Abkürzung AP verwendet, da diese Abkürzung unter Nachrichtenagenturen und Fotoreporter/innen den bekannteren und somit gebräuchlicheren Namen von Associated Press darstellt. Im Internet zu finden unter http://www.apwideworld.com (Fotografische Sammlung) und http://photoarchive.ap.org (Bilddatenbank). 10 Im Folgenden wird die Bezeichnung AP Photo Archive verwendet.

7

Page 10: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

The Associated Press Photo Archive

für mindestens ein Jahr in der Datenbank verbleiben. Danach werden sie von

speziell dafür ausgebildeten Fachkräften auf eine Menge von etwa 200 Fotos

pro Tag reduziert und indexiert. Die restlichen Fotos werden nach 12 Mona-

ten endgültig gelöscht. Im Gegensatz dazu ist der Anteil an digitalen, histo-

rischen Fotografien relativ gering, aber im stetigen Wachstum begriffen.

Die European/Asian Archive – Datenbank hat einen Bestand von mehreren

tausend Bildern aus dem europäischen und asiatischen Fotoreport und eine

strenge Auswahl an regionalen historischen Fotos. 300 Bilder werden täglich

in der Datenbank gespeichert, wobei sie nach einem Jahr nach denselben

Auswahl- und Indexierkriterien wie im International - Archive auf ca. 100 pro

Tag reduziert und endgültig in die Archivdatenbank übernommen werden.

Die Photo Archive Showcase (Schaukasten) - Datenbank beinhaltet Foto-

serien und Features zu einem bestimmten Thema, Geschäftsbedingungen,

Konditionen und Preislisten dieser Serien.

In der Topic Gallery (Themengalerie) - Datenbank werden Promotions- und

Werbefotos ebenso wie Logos von Unternehmen honorarfrei für Veröffent-

lichungszwecke angeboten.

Alle AP – Datenbanken sind über eine Personal Library Software sowohl von

einem Macintosh – wie auch über ein PC/IBM kompatibles System zugäng-

lich. Für die Online - Recherche über das Internet wird der Browser Netscape

Communicator 4.04 oder höher benötigt. Da die AP Datenbanken auf journa-

listische Nutzung ausgelegt sind, reicht die Eingabe natürlichsprachiger

Suchbegriffe, wie Substantive, Adjektive, Verben und Namen, um in allen

Textelementen des Bildes (Bildunterschrift und IPTC Datenfelder) recher-

chieren zu können. Die gesuchten Bilder werden dann innerhalb von 30

Sekunden als „thumbnails“ angezeigt. Das Herunterladen der im JPEG –

Format komprimierten Fotos (500 KB für zeitgenössische und 1,5 MB für

historische Fotografien) auf den eigenen Rechner erfolgt über ISDN. Abo-

nnenten/innen des US-amerikanischen Photostream - Dienstes können die

8

Page 11: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

The Associated Press Photo Archive

schon gesendeten Bilder im Rerun - Archive11 nochmals aufrufen bzw.

suchen. Diese Datenbank hält die gesendeten Fotos über einen Zeitraum

von zwei Wochen bereit.

Während die Preise für das Herunterladen und Verwenden der gefundenen

Bilder regional variieren, hält sich das AP - Bildarchiv in Deutschland, mit Sitz

in Frankfurt am Main, zumindest an die Honorarübersicht der BVPA.

11 Im Internet zu finden unter http://photorerun.ap.org

9

Page 12: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Retrievaltechniken in Bilddatenbanken

4. Retrievaltechniken in Bilddatenbanken

Grundsätzlich gelten in Bilddatenbanken dieselben Retrievaltechniken, die in

Volltextdatenbanken angewendet werden, da die Recherche nach Bildern

nur über die gespeicherten Texte bzw. Bildbeschreibungen erfolgen kann.

Umso wichtiger ist dabei eine einheitliche Indexierpraxis, denn im Idealfall

wird bei der Verschlagwortung und beim Retrieval auf dasselbe definierte

Vokabular zurückgegriffen.12 Folgende Retrievaltechniken werden in den

meisten Retrievalsystemen angewandt (bis auf die Vergleichsoperatoren und

die statistische Aufbereitung von Ergebnissen werden sie auch bei der

Recherche in der dpa – Bilddatenbank und dem AP Photo Archive benutzt):

- Feldsuche

- Boolesche Operatoren

- Trunkierung

- Maskierung

- Abstandsoperatoren

- Vergleichsoperatoren

- Klammerung

- Statistische Aufarbeitung von Ergebnissen

- Crossover - Recherche

- Ranking

Bei der Feldsuche werden natürlichsprachliche Begriffe in vordefinierte

Datenfelder eingegeben, die je nach Aufbau der Suchmaske unterschiedlich

sein können. In Bilddatenbanken haben sich folgende Suchfelder bewährt13:

- Aufnahmeort

- Aufnahmedatum

- Person/Gegenstand

- Fotograf/in

- Bildtyp

12 Zur inhaltlichen Erschließung von Bildern s. Kap.5 13 Genutzt werden bei einer Recherche häufig jedoch nur die bekannten 4 „Ws“: Wer, Was, Wann, Wo.

10

Page 13: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Retrievaltechniken in Bilddatenbanken

Die Booleschen logischen Operatoren AND, OR, NOT, NOR werden zur

Verknüpfung mehrerer Begriffe in einer Suchanfrage eingesetzt. Der

Operator AND entspricht einer Schnittmenge, OR einer Vereinigungsmenge,

NOT einer Restmenge und NOR einer Vereinigungsmenge minus der

Schnittmenge.

Die Trunkierung bzw. Maskierung eines Suchbegriffes erfolgt durch Ein-

gabe eines Platzhalters an einer sinnvollen Stelle im Wort, üblicherweise am

Wortanfang oder Wortende. Dadurch bleibt die Zeichenkette des Such-

begriffs unspezifiziert und ermöglicht die Zulassung weiterer Zeichen bzw.

Begriffe in der Suchanfrage.

Mit Hilfe des Abstandsoperators ADJ (Adjacent) und dem Mehrwort-

begriffsoperator WITH wird die Reihenfolge und die Distanz der gesuchten

Begriffe zueinander innerhalb eines Textes festgesetzt. Dies gewährleistet

das Auffinden von sinngemäß zusammenhängenden Worten mit einer

Genauigkeit, die der Boolesche Operator AND nicht gewährleisten kann.

Vergleichsoperatoren <, >, =,<=, => können nur bei numerischen Feldern

eingesetzt werden, beispielsweise bei der Suche nach einem bestimmten

Zeitabschnitt (z. B. Publikationsdatum py = 1995-2000).

Um die Reihenfolge der Abarbeitung der Booleschen Operatoren durch das

Retrievalsystem zu variieren, werden Klammern in der Suchanfrage einge-

setzt. Die Operatoren haben üblicherweise festgesetzte Wertigkeiten, die bei

Anwendung dieser Retrievaltechnik entfallen, da die geklammerten Begriffe

zuerst berücksichtigt werden.

Die statistische Aufarbeitung von Ergebnissen ist eine wesentliche Hilfe

bei der Bewertung von Recherchen auf ihre Relevanz. Dazu gehören Ge-

nauigkeit (precision), Vollständigkeit (recall) und Ausfallquote (fallout ratio)

eines Information Retrieval Systems.

11

Page 14: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Retrievaltechniken in Bilddatenbanken

Die Crossover – Recherche erfolgt über mehrere Datenbanken bzw. Spei-

cher einer Datenbank gleichzeitig. Beim AP Photo Archive kann jedoch nur

eine der genannten Datenbanken angewählt werden.

Die Bildung eines Ranking (Rangreihe) erhöht die Retrievalpräzision, indem

eine gewichtete Deskribierung eingesetzt wird. Dadurch steigt letztendlich die

Benutzerzufriedenheit, denn im Rechercheergebnis werden auf diese Art und

Weise die relevanten Bildern vor den irrelevanten angezeigt.

4.1. Die Retrievaltechniken in der Bilddatenbank der Deutschen Presse Agentur

Eine der grundlegenden Software-Voraussetzungen für die Arbeit mit der

Bilddatenbank der dpa, ist das von der Firma Digital Collections in Hamburg

entwickelte Software-Programm PictureDesk. Die dokumentarischen Be-

zugseinheiten bilden die digitalisierten, unmittelbar nach ihrer Ausstrahlung

per Satellit in die Datenbank übernommenen, aktuellen Bilder aller Ressorts.

Der Zugriff auf die in der Datenbank gespeicherten Fotografien erfolgt über

den Bildtext, wobei grundsätzlich alle Elemente der Bildbeschreibung

(Bildtext und Daten) recherchierbar sind. Das Regal bildet die Arbeitsfläche

für die Volltextrecherche und gliedert sich in folgende Bereiche:

- Archivliste

- Suchfeld

- Statusfelder

- Titelliste

12

Page 15: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Retrievaltechniken in Bilddatenbanken

Screenshot vom Regal des dpa - Bildfunks

� Archivliste � Suchfeld � Statusfeld

� Titelliste

Die Archivliste zeigt alle recherchierbaren zeitlichen Archive des Regals.

Auch eine Kombination von mehreren Archiven ist möglich. Die Auswahl er-

folgt durch Anklicken des entsprechenden Archivs.

Im Suchfeld, welches maximal 256 Zeichen erfaßt, werden die Suchbegriffe

eingegeben14.

Im Statusfeld werden Meldungen der Datenbank (z.B. „Die Abfrage wird

bearbeitet...“) und die Anzahl der gefundenen Bilder angezeigt.

In der Titelliste werden alle gefundenen Titel (ganz oder in Auszügen) in ab-

steigender Reihenfolge gezeigt, beginnend mit dem aktuellsten. Der gesamte

14 Suchbegriffe können alle natürlichsprachlichen Begriffe sein. Listen mit Schlagwörtern, Stichwörtern und Bildtypen befinden sich im Anhang.

13

Page 16: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Retrievaltechniken in Bilddatenbanken

Bildtext eines ausgewählten Titels wird durch Öffnen eines Dossiers ange-

zeigt.

Das Bild – Dossier genannte Rechercheergebnis enthält das gefundene Bild

als Miniatur sowie die dazugehörige Beschreibung. Um ein Bild bearbeiten

oder öffnen zu können, wird es auf den „Schreibtisch“ (Desktop) durch „drag

& drop“15 gelegt. Die Fotografien können nicht nur in einer kleinformatigen

Voransicht (thumbnail) angezeigt werden, sondern auch als Layoutbild (Post-

kartengröße) oder in bestimmten festgelegten Ausschnitten nach Bedarf

bearbeitet werden. Außerdem kann das Bild gespiegelt, rotiert und vom Farb-

bild in ein schwarz/weiß Bild umgewandelt werden.

Die Bildparameter16 können schon vor dem Abruf aus der dpa – Bilddaten-

bank bestimmt werden. Sie sind abhängig von den spezifischen Wünschen

und Anforderungen der Nutzer/innen oder dem jeweiligen Redaktionssystem.

Zur endgültigen Weiterverarbeitung werden die Bilder über eine ISDN –

Verbindung mit Hilfe der Software Leonardo Pro bzw. Leonardo Express

oder per Email im JPEG – Format bzw. als Layoutbild auf die lokale Fest-

platte des Computers übertragen.

In der Bilddatenbank der dpa gibt es zwei Wege um nach Bildern zu suchen:

- Recherchieren in der Bildbeschreibung

- Suchen in der Galerie

Mit Hilfe der Volltextrecherche in der Bildbeschreibung und den

Deskriptoren17 läßt sich ein bestimmtes Bild bzw. Bilder zu einem be-

15 Englische Bezeichnung der „Ziehen – und – Ablegen“ – Technik mit der Maus, bei der ein markiertes Objekt mit dem Mauszeiger und gedrückter Maustaste in eine neue Position oder in einen neuen Ordner gezogen wird. 16 Die Bildparameter sind technische Angaben wie z. B. Rasterweite und Bildgröße. Die Felder „Licht“, „Tiefe“ und „Schärfen“ sind für schwarz/weiß Bilder vorgesehen. 17 „Ein Deskriptor ist eine für ein (das jeweilige) Informationssystem genormte Bezeichnung, die für die Indexierung und das Retrieval gleichermaßen zugelassen und verbindlich ist.(...) D. sind verbindliche Schlagwörter, die zur inhaltlichen Kennzeichnung (Indexierung) von Dokumenten verwendet werden. Sie dienen dem gezielten Wiederauffinden (Retrieval) von

14

Page 17: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Retrievaltechniken in Bilddatenbanken

stimmten Thema oder aus einem bestimmten Zeitabschnitt finden. Diese

Deskriptoren sind formale Datenfelder bzw. Ordnungsnamen, die jedes Bild

kategorisieren. Selbstverständlich können mehrere Deskriptoren ein Bild

„beschreiben“. Durch logische Verknüpfung18 derselben erhöht sich die Rele-

vanz des Rechercheergebnisses in erheblichem Maße. Die Deskriptoren sind

zugleich die Daten, die den Funkbildern entsprechend den deutschen Namen

des IPTC beigefügt wurden; weitere Deskriptoren können von der Bildredak-

tion hinzugenommen werden. Mit welchen Deskriptoren im Regal dpa – Bild-

funk recherchiert werden kann, und welche Bedeutung diese haben, veran-

schaulicht die folgende Übersicht.

Informationen in einer Datenbank.“ Aus Ladewig, Christa: Grundlagen der Inhaltlichen Erschließung, Potsdam 1997, S.138. 18 Zu der „logischen Verknüpfung“ mittels Boolescher Operatoren s. Abschnitt „Die logischen Verknüpfungen“ in diesem Kapitel.

15

Page 18: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Retrievaltechniken in Bilddatenbanken

Bei der Recherche in den Bildtexten sind Groß- oder Kleinschreibung sowie

Umlaute von Suchbegriffen beliebig. Als grammatikalische Regeln gelten:

Substantive werden im Nominativ – Singular, Verben im Infinitiv und

Adjektive in Positiv – Form eingegeben.

Name des Deskriptoren-

feldes

Beispiel

Suche nach...

Ressort Ressort = Politik

Ressort = pl

allen Bildern des Ressorts Politik.

Weitere Ressorts: wi/Wirtschaft,

vm/Vermischtes, sp/Sport, ku/Kultur

und gr/Grafik

Stichwort Stichwort = Umwelt allen Bildern mit dem Stichwort

Umwelt. Die Recherche kann auch

nach mehreren Stichwörtern ge-

mäß der Stichwortliste im Anhang

erfolgen.

Dienst Dienst = fra02 Bilder mit der Bildnummer „fra02“

Datum Datum = 01.01.2002 Bildern, die am 01. Januar 2002

verbreitet wurden

Quelle Quelle = zb Zentralbild

Farbe Farbe = 4c

Farbe = sw

allen Farbbildern

allen schwarz/weiß Bildern

Fotograf Fotograf = xyz allen Bildern des/der Fotograf/in xyz

Land Land = Deutschland allen Bildern, die in Deutschland

aufgenommen wurden

Provinz Provinz = Hessen allen Bildern, die in Hessen

aufgenommen wurden

Produkt Produkt = basis „General – Service“ im dpa-Bildfunk

Format Format = hoch

Format = quer

hochformatigen Bildern

querformatigen Bildern

Bei der trunkierten Recherche kann der Suchbegriff derart beschnitten

werden, daß Komposita entweder ganz ausgeschlossen werden oder die

Recherche auf Komposita beschränkt wird. Die Trunkierung kann dabei am

16

Page 19: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Retrievaltechniken in Bilddatenbanken

Anfang (Linkstrunkierung) oder am Ende (Rechtstrunkierung) des Suchbe-

griffes stehen. Als Trunkierungszeichen wird ein Punkt verwendet. Beispiels-

weise werden bei der Eingabe „.minister.“ sowohl Bildtexte mit „Minister“ als

auch solche mit „Außenminister“, „Ministerpräsident“ und „Ministerium“ ange-

zeigt.

Für die phonetische Recherche bildet die Umsetzung von Phonemen nach

den laut Duden verbindlichen Transkriptions- und Transliterationssystemen

die Grundlage. Bestehen Unsicherheiten in der Schreibweise, wird der Such-

begriff mit einem Fragezeichen ergänzt. So ergibt beispielsweise die Eingabe

„Sarajevo?“ alle Fundstellen, die den Namen „Sarajevo“ und „Sarajewo“ bein-

halten.

Das Linguistikprogramm ermöglicht eine synonyme Recherche, indem den

Suchbegriffen ein oder mehrere Ausrufungszeichen angefügt werden. So

ergibt die Eingabe „Alkohol!!“ alle Fundstellen, die im Bildtext jeweils folgen-

de Wörter enthalten: „Alkohol, Wein, Bier, Drogen, Betäubungsmittel,

Rauschgift, Haschisch, Crack, Heroin, Kokain“.

Die trunkierte und synonyme Recherche kann zu unbeabsichtigten Fund-

stellen führen, da in der Volltextrecherche alle Felder in den Bildbeschreibun-

gen durchsucht werden. So zeigt beispielsweise die synonyme Suche nach

„Frühling!“ nicht nur alle Bilder, die die Jahreszeit betreffen, sondern auch

alle Bilder des Fotografen namens Lenz (Fotograf = Lenz).

Die Recherche nach einem bestimmten Datum bzw. nach einem Datum

innerhalb eines bestimmten Zeitraumes, erfolgt durch Eingabe von: datum =

tt.mm.jjjj, jahr = jjjj, monat = Wort oder Zahl (z.B. jan oder 01).

Nutzer/innen von Retrievalsystemen in Datenbanken sind normalerweise

daran interessiert, die Zahl der gefundenen Bilder möglichst zu minimieren.

Dazu werden mehrere Begriffe in der Suchanfrage mit logischen Operatoren

auf Grundlage der Booleschen Algebra verknüpft. In der dpa – Bilddatenbank

werden alle drei Operatoren: UND (dargestellt durch „&“ oder ein Leer-

17

Page 20: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Retrievaltechniken in Bilddatenbanken

zeichen), ODER (dargestellt durch „I“) und NICHT (dargestellt durch „\“) zur

Einschränkung des Rechercheergebnisses verwendet. Werden in einer lo-

gischen Verknüpfung sowohl ein logisches UND als auch ein logisches

NICHT benutzt, muß eine Klammerung vorgenommen werden. Entscheidend

ist dabei die Reihenfolge, in der die Operatoren ausgeführt werden, d.h. in

diesem Fall, daß die Operatoren, die in Klammern stehen, zuerst ausgeführt

werden. Also findet die Eingabe: „(Schröder\Clinton) & Washington“ alle Bild-

texte in denen sowohl „Schröder“ als auch „Washington“, nicht aber „Clinton“

vorkommt. Die Eingabe : „Schröder \ (Clinton & Washington) wiederum findet

alle Bildtexte in denen „Schröder“, aber nicht „Clinton“ und „Washington“

vorkommen.

Eine Galerie ist eine Übersicht, in der Bilder als Miniaturen aufgelistet

werden (siehe nachfolgenden screenshot), die entweder online von der dpa

empfangen wurden oder zur Ausgabe einer bestimmten Publikation gehören.

In jeder Galerie werden bis zu 150 Bilder gleichzeitig gespeichert. Um das

gewünschte Bild zu finden, werden die thumbnails durch Blättern im Galerie-

fenster betrachtet. Mit dem Befehl „Öffne Information“ öffnet sich das Infor-

mationsfenster mit allen Daten bzw. Bildtexten, die zum jeweiligen Bild ge-

hören.

18

Page 21: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Retrievaltechniken in Bilddatenbanken

Screenshot einer Galerie des dpa - Bildfunks vom 15.01.2002

4.2. Die Retrievaltechniken in der Bilddatenbank AP Photo Archive

Die Bilddatenbank des AP Photo Archive ist auf einen IBM RS/6000 Rechner

aufgelegt und über die Personal Library – Software zu bedienen. Die für

archivierungswürdig befundenen Bilder des Bildfunkdienstes (Photostream

bzw. AP News) bilden die dokumentarische Bezugseinheit. Die verwendete

Software ermöglicht eine einfache Online - Recherche nach Fotografien mit

Hilfe natürlichsprachlicher Suchbegriffe ebenso wie eine erweiterte Suche mit

Deskriptoren in bestimmten Datenfeldern. Um die Relevanz des Recherche-

19

Page 22: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Retrievaltechniken in Bilddatenbanken

ergebnisses zu erhöhen, werden logische Verknüpfungen und Trunkierung

eingesetzt19.

Die Arbeitsfläche für die Recherche bildet die search page (Suchseite), die

sowohl die einfache als auch die erweiterte Suche ermöglicht. Der anschlie-

ßende screenshot zeigt alle für die Recherche relevanten Datenfelder, die

sowohl einzeln als auch in Kombination untereinander zu benutzen sind:

- What (was)

- When (wann)

- Where (wo)

Screenshot der search page in der AP Photo Archive – Bilddatenbank

19 In Anlehnung an die im Internet unter http://photoarchive.ap.org/Intro/guide.html bereitgestellten Informationen zur Bildarchivdatenbank und Recherche (mit praktischen Tips und Beispielen)

20

Page 23: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Retrievaltechniken in Bilddatenbanken

Die gefundenen Bilder erscheinen dabei als thumbnails, ein Miniaturformat,

das durch Anklicken auf Postkartenformat vergrößert werden kann. Zu jedem

Bild gehören verschiedene Optionen:

- „Info“ beinhaltet Bilddaten wie Größe und Downloadgeschwindigkeit

- „Download“ leitet das Herunterladen des markierten Bildes im JPEG –

Format ein. Die Übertragung erfolgt mit Hilfe der Leonardo-Software

über eine ISDN – Verbindung oder per Email.

- „Lightbox“ (Leuchtkasten) ermöglicht das Ablegen und Betrachten von

bis zu 25 Fotos in maximal 4 Leuchtkästen. Dies ist eine Möglichkeit

vor dem endgültigen Herunterladen und somit Erwerb des Bildes, das

einzelne Bild überprüfen zu können.

- „Caption“ (Bildüberschrift) kann nicht nur in Englisch (in der

International Archive - Datenbank), sondern auch beispielsweise in

Deutsch (in der European/Asian Archive - Datenbank) verfaßt sein. Da

üblicherweise in Englisch indexiert und recherchiert wird, ist dies bei

der Auswahl von Suchbegriffen zu berücksichtigen und sind diese ge-

gebenenfalls fremdsprachig einzugeben.

Die Suchseite enthält am linken Rand weitere Angaben, die von Bedeutung

sind:

- „Image Hits“ zeigt die Anzahl der gefundenen Bilder.

- „Image Pages“ gibt die aktuelle Seite an; rote Pfeile ermöglichen das

Vor- und Zurückblättern. Die gesuchte Seite kann auch numerisch ein-

gegeben werden.

- „Display Images“ variiert die Anzahl der thumbnails pro Seite mittels

eines „pull down“ Menüs20. So können 4, 12 oder 36 Bilder pro Bild-

schirmseite angezeigt werden. Dabei reduziert sich die Länge der

Bildüberschrift.

- „Sort Images“ nimmt wahlweise eine Sortierung des Recherche-

ergebnisses nach Relevanz oder Datum vor (die neueingegangenen

Fotografien werden zuerst gezeigt). 20 Menüelement in Form eines kleinen schwarzen Dreiecks, das ein Untermenü enthält, welches automatisch aufklappt, sobald der Mauszeiger auf den Befehl zeigt.

21

Page 24: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Retrievaltechniken in Bilddatenbanken

- „Image Archives“ ermöglicht die Auswahl einer bestimmten Daten-

bank. Entweder International Archive oder European/Asian Archive.

- „Status“ enthält Meldungen der Datenbank.

- „Search“ startet die Suche.

- „Clear Selection“ ermöglicht eine neue Suchanfrage.

- „View Lightbox“ zeigt alle im Leuchtkasten vorhandenen Bilder.

- „Help“ ist die Hilfe für Nutzer/innen und enthält Datenbankinforma-

tionen und Recherchetips.

Eine einfache Suche im Bildtext und in den Bilddaten bedient sich der

„What“-, „When“- und „Where“- Datenfelder durch Eingabe natürlich-

sprachiger Begriffe. Dabei müssen im „What“ – Feld beispielsweise Vor- und

Nachnamen einer gesuchten Person in einfachen Anführungszeichen gesetzt

werden, Bsp.: ´Gerhard Schroeder´ oder auch ´President Clinton´. Wird nach

einem bestimmten Thema gesucht, empfiehlt sich eine einfache Beschrei-

bung des Gewünschten, eine sogenannte Phrasensuche, Bsp.: children

smoking cigarettes oder ´Laura Bush´ huging children.

Im “When” – Feld wird ein genaues Datum oder ein bestimmter Zeitraum in

numerischer Form in englischer Schreibweise eingegeben, Bsp:. m/tt/jjjj oder

from m/tt/jjjj to m/tt/jjjj. Einzelne Wochentagsbenennungen, “today“ oder

”yesterday” können auch verwendet werden.

Mit Hilfe des „Where“ – Feldes wird nach Städten und Ländern gesucht,

wobei Abkürzungen bei der Eingabe nicht erlaubt sind. Eine Recherche über

diese drei Suchfelder kann folgendermaßen aussehen:

What: ´J. Fischer´

When: 12/12/2001

Where: ´United States´

22

Page 25: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Retrievaltechniken in Bilddatenbanken

Für die erweiterte Suche in der AP Photo Archive – Datenbank werden

Boolesche Operatoren zur logischen Verknüpfung der einzelnen Suchbe-

griffe und der Deskriptoren eingesetzt sowie eine Rechts- und Links-

trunkierung mit dem * Zeichen21.

Mit welchen Deskriptoren im „What“ – Feld der Bilddatenbank recherchiert

werden kann, veranschaulicht folgende Übersicht der Deskriptoren und ihrer

Bedeutung.

Deskriptor Bedeutung Phototype (Bildtyp) portrait: left, right, center (Porträt: links,

rechts, Mitte)

silhouette (Profil)

pattern, square, vertikal, horizontal

(Bildformat: Kombo, quadratisch, hoch,

quer)

aerial (Luftaufnahme)

Deskriptor Bedeutung

Hue (beherrschender Farbton)

red (Rot), yellow (Gelb), green (Grün),

orange (Orange), white (Weiß), black

(Schwarz), brown (Braun), purple (Violett),

pink (Rosa), blue (Blau)

Concept (Schlagwörter) Von “adulation“ (Schmeichelei) bis „youth“

(Jugend)22

Categories (Kategorien) sports (Sport)

international (International)

business (Geschäftsleben)

news (Nachrichten)

21 Zu dem Einsatz von logischen Operatoren und Trunkierung s. die Ausführungen zur dpa – Bilddatenbank im Kap. 4.1. Zusätzlich zu den Operatoren OR, AND und NOT bietet die „AP Photo Archive“ – Datenbank den Abstandsoperator NEAR an, wodurch der Wortabstand von zwei Suchbegriffen in einem Bildtext festgesetzt werden kann. Bsp. Die Eingabe im „What“ – Feld: murder near/3 gun findet alle Bildtexte in denen „gun“ innerhalb von 3 Wörtern in beiden Richtungen des Textes vor oder nach „murder“ auftaucht. Der Abstandsoperator W/n findet Wortpaare in denen das zweite Wort innerhalb von „n“- Wörtern auf das erste Wort folgt. Bsp. „What“ – Feld: rescue W/2 device findet alle Bilder in denen “device” innerhalb von 2 Wörter auf „rescue“ folgt. 22 Eine komplette Liste der Schlagwörter befindet sich im Anhang.

23

Page 26: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Retrievaltechniken in Bilddatenbanken

Fortsetzung der Übersicht der Deskriptoren und ihrer Bedeutung:

Deskriptor Bedeutung Suppcats (Unterkategorien) feature (Feature); weather (Wetter)

entertainment (Unterhaltung)

Selected Categories

(Ausgewählte Kategorien

thematisch zusammengefasst)

industry (Industrie)

economy (Wirtschaft)

crime (Kriminalität)

politics (Politik)

astronomy (Astronomie)

animals (Tiere)

travel (Reisen)

nature (Natur)

Narrowing Your Search

(Eingrenzen der Suche)

interior (Innenaufnahme)

exterior (Außenaufnahme)

overview (Übersicht)

overall (Überblick)

action (Aktion)

full length (ganze Figur)

formal (Gesellschaftskleidung)

casual (Freizeitkleidung)

24

Page 27: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Recherchestrategien in Bilddatenbanken

5. Recherchestrategien in Bilddatenbanken Im Wesentlichen gibt es keine Unterschiede zwischen den Recherchestrate-

gien in Bilddatenbanken im Vergleich zu den Volltextdatenbanken, da die

Suche nach Bildern zu einem bestimmten Thema über die gespeicherten

Texte, der Bildbeschreibung und des IPTC – Formats23 erfolgt. Um ein Such-

problem zu lösen, sollten folgende Faktoren berücksichtigt werden:

- konkrete Recherchesituation

- Suchziel

- Anwendbarkeit der Strategie in den ausgewählten Datenbanken.

Für ein erfolgreiches Suchergebnis können folgende Recherchestrategien

eingesetzt werden:

- freitextbasierte Suche

- dokumentationssprachenbasierte Suche

- freitext- und dokumentationssprachenbasierte Suche

- datenbankübergreifende Suche

- hostübergreifende24 Suche

Diese Strategien sind in Abhängigkeit vom Suchziel einzusetzen, da sie zu

unterschiedlichen Ergebnissen führen. So liefert eine freitextbasierte Suche

mit natürlichsprachlichen Suchbegriffen schnell ein Bild, während die doku-

mentationssprachenbasierte Suchstrategie schnell mehrere Bilder liefert. Bei

der Kombination von freitext- und dokumentationssprachenbasierte Suche

erhöht sich die Wahrscheinlichkeit, daß viele relevante Fotos gefunden wer-

den. Die größte Anzahl relevanter Bilder ergibt die Suche mittels der daten-

bankübergreifenden Strategie.

23 Die Agenturen Reuters, AP, AFP und dpa entwarfen das IPTC/NAA-IIM – Format, das eine genormte, inhaltliche Bildbeschreibung über subject – codes (Themen – Codes) ermöglichen. Diese codes sind zweistufig hierarchisch angelegt: erstens subject – Name (Thema), und zweitens subject – matter (Stichwort). Differenzierungen dieser beiden sind zusätzlich möglich. 24 In diesem Fall fällt die hostübergreifende Retrievalstrategie weg, da Bilddatenbanken normalerweise nur über einen Host bzw. einen Anbieter laufen.

25

Page 28: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Recherchestrategien in Bilddatenbanken

Die freitextbasierte Suche hat einige Vorteile für die Abonnenten/innen,

darunter die einfache Recherche durch Eingabe nicht gebundener Suchbe-

griffe in die entsprechenden Felder. Dies ist eine sehr benutzerfreundliche

Möglichkeit, da keine Dokumentationssprache angewendet werden muß. Die

Treffsicherheit der freigewählten Suchtermen ist jedoch fraglich. Falls die

Wortlisten einzelner Kategorien nicht online einsehbar sind, müssen

Synonyme, Komposita, Unterbegriffe und eventuell englische Synonyme

ermittelt werden. Weitere Vorteile sind die dialogorientierte Bedienung und

der datenbankunabhängige Einsatz.

Die dokumentationssprachenbasierte Suche, die datenbankabhängig ist,

bedient sich eines strukturierten und normierten Wortschatzes. Daher sind

einige Vorbereitungen nötig, bevor eine solche Suchanfrage eingegeben

wird: das Prüfen des gebundenen Vokabulars sowie die Präzisierung und ge-

gebenenfalls eine Erweiterung oder Einschränkung der Suchfrage. Ein Nach-

teil der Dokumentationssprachen, sei es Thesaurus oder Klassifikation, wird

ihre Inflexibilität bleiben. Sie veralten schnell, da neue Wörter erst nach län-

gerer Zeit aufgenommen werden. Außerdem sind die Sprachen im

Allgemeinen nicht detailliert genug. Vorteile der dokumentationssprachen-

basierten Suche sind Verweise auf Synonyme und das Bilden von Begriffs-

familien, die Anregungen für die Reformulierung einer Suchanfrage bieten.

Die Kombination der freitext- und dokumentationssprachenbasierten Suche hingegen verbindet die Vorteile beider Suchstrategien und reduziert

erheblich die Nachteile. So können Freitextbegriffe in Verbindung mit einem

Klassifikationscode in einen bestimmten Kontext gestellt werden. Falls

Thesauri und Klassifikationen nicht in gedruckter Form vorliegen, empfiehlt

sich ein Freitexteinstieg in die Recherche, verbunden mit einer Feldsuche.

Der Einstieg in eine Suche über die Dokumentationssprache ist möglich,

wenn zu den ermittelten Bildern die Klassen und Deskriptoren mit ausge-

geben werden. Umgekehrt gibt es die Möglichkeit, bei der Recherche einen

direkten Dokumentationsspracheneinstieg zu erwägen, falls Thesauri und

Klassifikationen gedruckt vorliegen. Im Ergebnis wird die Bildüberschrift und

der Bildtext erkennbar sein, wodurch ein Freitexteinstieg über die gefun-

26

Page 29: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Recherchestrategien in Bilddatenbanken

denen freien Suchbegriffe ermöglicht wird. Letztendlich hängt die Qualität

des Rechercheergebnisses nicht nur vom Vorhandensein und dem Benutzen

einer Dokumentationssprache ab, sondern auch von der damit zusammen-

hängenden Indexierung, denn die Zuordnung der Schlagworte zu einem Bild

erfolgt methodisch analog zur Abfrage. Jedes in der Datenbank gespeicherte

Bildmotiv kann durch eine Auswahl beliebig vieler Begriffe, die es beschrei-

ben, gekennzeichnet und somit auffindbar gemacht werden. Diese subjektive

Verschlagwortung birgt jedoch die Gefahr einer Inkonsistenz der Daten-

archivierung durch unterschiedliches Indexierverhalten und kann dadurch zu

einem ungenauen Rechercheergebnis führen. Um dieses zu umgehen,

halten sich die Bilddokumentare/innen bei der inhaltlichen Erschließung von

Neuzugängen der Bilddatenbank an vorgegebene Stichwörter und

Deskriptoren (z.B. Ressort, Format, Bildtyp usw.).25

Folgende Recherchestrategien in Datenbanken, die in Abhängigkeit von der

Formulierung des Suchprofils eingesetzt werden, sind nicht uneingeschränkt

in Bilddatenbanken anwendbar:

- Zitatbasierte Erweiterungsstrategie ( citation pearl growing approach)

- Spezifische – Wörter – Priorität – Strategie (most specific first)

- Schrittweise Verfeinerungsstrategie (successive fractions approach)

- Blockbildungsstrategie (block building approach)

Die Zitatbasierte Erweiterungsstrategie benennt das wiederholte Heran-

tasten an das Suchprofil durch Variation und schrittweise Erweiterung der

Suchfrage und wird bei Anfragen mit vagen Suchkriterien angewandt.

Bei der Spezifischen – Wörter – Priorität – Strategie wird der prägnanteste

Begriff (most specific facet) in die Suchfelder eingegeben. Dieses Vorgehen

führt zu einem schnellen Rechercheergebnis, welches durch Eingabe eines

weiteren prägnanten Suchbegriffes (next most specific facet) verbessert

werden kann.

25 Zur inhaltlichen Erschließung von Bildern siehe Kapitel 5.1 und 5.2.

27

Page 30: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Recherchestrategien in Bilddatenbanken

Die Strategie der schrittweisen Verfeinerung der Recherche wird häufig

mittels formaler Angaben eingesetzt. Hierbei werden mit Hilfe von Filtern und

Einschränkungen so lange Teilmengen der ursprünglichen Recherche gebil-

det, bis das gewünschte Ergebnis erreicht wird.

Die Blockbildungsstrategie wird oft bei komplexen, umfangreichen Anfra-

gen angewandt, indem das Suchproblem durch ein vorformuliertes, in

Blöcken strukturiertes Suchprofil dargestellt wird. Nach dem Ermitteln der

Hauptaspekte der Anfrage, erfolgt die Blockbildung für die einzelnen Such-

felder.

5. 1. Die Recherchestrategien in der Bilddatenbank der Deutschen Presse Agentur Da ein Bild nur dann als Rechercheergebnis vom Datenbanksystem geliefert

werden kann, wenn das System zu jedem Begriff in der Anfrage eine Be-

griffsausprägung enthält, die der Beschreibung dieses bestimmten Bildes

entspricht, ist eine einheitliche Terminologie der Indexierung und der Recher-

che unerläßlich. Verschiedene digitale Bildarchivierungssysteme bieten bei

der Erfassung der Bildbeschreibungen maschinelle Unterstützung. So sind

auch in der Erfassungsmaske der dpa – Bilddatenbank wichtige beschrei-

bende Elemente im System hinterlegt (kleine graue Dreiecke), die nur noch

angeklickt werden müssen. Auf diese Weise können z.B. Gesichtsausdruck

oder Kleidung einer Person mit genau definierten Adjektiven26 beschrieben

werden.

26 Siehe Liste der hinterlegten Schlag- und Stichwörter, wie auch Bildtypen im Anhang

28

Page 31: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Recherchestrategien in Bilddatenbanken

Screenshot einer leeren Erfassungsmaske eines Neuzugangs der dpa -

Bilddatenbank

Screenshot eines erschlossenen Neuzugangs der dpa - Bilddatenbank

29

Page 32: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Recherchestrategien in Bilddatenbanken

Die digitale Bilddatenbank der dpa wird überwiegend von externen

Nutzern/innen in Anspruch genommen, die sich mittels einer „User ID“ und

eines Passwortes online in die Datenbank einloggen. Sie ist durch ihr Such-

und Abrufsystem speziell für die Arbeit in Redaktionen von Zeitungen, Zeit-

schriften und Fernsehsendern entwickelt worden. Da die aktuellen Ereignis-

bilder schnell gefunden werden müssen, ist die überwiegend eingesetzte

Recherchestrategie die freitextbasierte Suche. Bei komplexen Suchfragen

oder umfangreichen Themen kommen allerdings auch das Wissen und die

Erfahrung der professionellen Bilddokumentare/innen der dpa zum Einsatz.

Sie stellen beispielsweise sogenannte Specials27 zu einem bestimmten

Thema zusammen, wobei sie die Kombination von freitext- und dokumen-

tationssprachenbasierten Recherchestrategie anwenden. Bei der Suche

nach historischen Bildern von Ereignissen, die einen längeren Zeitraum um-

fassen, wird die datenbankübergreifende Recherchestrategie durchgeführt,

um die Vollständigkeit (recall) des Rechercheergebnisses zu gewährleisten.

Nicht zuletzt sind eine systematische Vorgehensweise, eine durchdachte Re-

cherchestrategie, das Kennen des Bildbestandes und schließlich das Einfüh-

lungsvermögen der Bilddokumentare, den Kern der Suchanfrage zu erfas-

sen, imanente Voraussetzungen für ein erfolgreiches Rechercheergebnis.

5.2. Die Recherchestrategien in der Bilddatenbank AP Photo Archive

Da von AP News gesendete Bilder erst nach einem Jahr endgültig in die AP

Photo Archive – Datenbank übernommen werden, nutzen die Indexierer/in-

nen diesen zeitlichen Abstand zu den abgebildeten Ereignissen, um nur die

relevanten Fotografien nach dokumentarischen Gesichtspunkten auszuwäh-

len und zu verschlagworten. Die Bilddokumentare/innen sind regional spe-

zialisiert: in New York werden die Bilder, die in die International Archive –

Datenbank einfließen indexiert, in Frankfurt am Main die Bilder, die in die

27 Specials sind Bilderserien, die zu einem bestimmten Thema, meist für einen besonderen Publikationszweck aufgestellt werden. Bsp. „Sommer am Meer“ mit eher symbolischen Bildern oder die Illustration von Buchtexten. Beliebte Themen der sogenannten „yellow press“ drehen sich oft um Prominente; so haben z.B. Anfragen wie: „Prominente mit Bart“ oder „Kinder berühmter Schauspieler“ keinen Seltenheitswert.

30

Page 33: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Recherchestrategien in Bilddatenbanken

European/Asian Archive – Datenbank aufgenommen werden. Die inhaltliche

Erschließung der Neuzugänge im AP Photo Archive erfolgt hauptsächlich mit

einem freien Vokabular, enthält aber auch standardisierte Bildbeschreibungs-

elemente, z.B. category (Kategorie), concept (Schlagwörter) oder photo type

(Bildtyp).

Screenshot der für einen bestimmten Tag für archivierungswürdig

befundenen Bilder von AP News

Screenshot eines erschlossenen Neuzugangs der European/Asian Archive –

Datenbank

31

Page 34: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Recherchestrategien in Bilddatenbanken

Sowohl die International Archive - Datenbank wie auch die European/Asian –

Datenbank wird hauptsächlich von externen Nutzern/innen in Anspruch ge-

nommen, die sich mit einem „User ID“ und einem Passwort online in die

Datenbank einloggen. Die drei Suchfelder What, When und Where ermög-

lichen eine freitextbasierte Recherchestrategie, die in den meisten Fällen die

gesuchten Bilder liefert. Eine einfache Bildsuche wird oft mit Hilfe der

Spezifischen – Wörter – Priorität – Strategie erfolgreich durchgeführt. Ist die

Anfrage allerdings unpräzise, vielschichtig oder zu umfangreich, ist Wissen,

Erfahrung und in manchen Fällen auch das fotografische Gedächtnis der

Bildarchivare/innen gefragt. Hierbei ist von Vorteil, daß die Bilddokumen-

tare/innen bei AP sowohl die Indexierung als auch die Recherche über-

nehmen, so daß sie die zugeordneten Suchbegriffe kennen. Die erfolgver-

sprechendste Strategie ist die Kombination von freitext- und dokumentations-

sprachenbasierter Suche. Gezieltes Nachfragen und Sensibilität im Umgang

mit Kundenwünschen erhöht insofern den Erfolg der Recherche, da eine

genau formulierte Anfrage ein gutes Rechercheergebnis liefert.

5.3. Ausblick

Im Folgenden werden neue Recherchestrategien angerissen, die das

Rechercheergebnis verbessern, da in beiden Datenbanken mittels der be-

schriebenen Strategien nachweislich nur 80 % der relevanten Bilder gefun-

den werden.

Weiterentwickelte Retrievalstrategien wie z.B. die Erweiterung des

Booleschen Retrievals durch Einführung einer Gewichtung der Deskriptoren,

eine Rangreihenbildung oder die Modifizierung des Feedbackverfahrens,

könnten die Vollständigkeit und die Genauigkeit eines Rechercheergebnisses

in beiden Bilddatenbanken erhöhen.

Wünschenswert wäre eine dynamische Suchanfragemodifikation, bei der die

Nutzer/innen der Bilddatenbank einbezogen werden. Wenn das System eine

Liste neuer Suchbegriffe bieten würde, welche die Deskriptoren beinhaltet,

32

Page 35: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Recherchestrategien in Bilddatenbanken

die aus den Bildbeschreibungen der relevanten Fotos übernommen wurden,

könnten die Nutzer/innen ihre Anfrage reformulieren und dadurch ein genau-

eres Rechercheergebnis erzielen.

Die Reformulierung einer Suchanfrage bzw. die Auswahl neuer Suchbegriffe

läßt sich durch Clustering wesentlich vereinfachen. Bei diesem Verfahren

werden inhaltlich eng beieinander liegende Bilder über die Indexierung der

Deskriptoren hinweg gruppiert ausgegeben. Da das Bilden der thematisch

zusammenhängenden Gruppen sehr zeitaufwendig ist, wird diese Strategie

in beiden Datenbanken bisher nicht angewandt.

Durch die Relevanzrückkoppelung ließe sich die Nutzerzufriedenheit und die

Retrievalpräzision nachweislich erhöhen, da die relevanten Dokumente vor

den irrelevanten Dokumenten nachgewiesen werden. Diese Anordnung führt

dann umgekehrt zur Generierung neuer, präziserer Suchanfragen28.

Das relevance ranking (Anordnen der Dokumente nach absteigender Rele-

vanzwahrscheinlichkeit), welches bei AP eingeführt wurde, ist dem konven-

tionellen Booleschen Retrieval überlegen, bei welchem häufig die AND -

Verknüpfung der Suchbegriffe eine leere und die OR – Verknüpfung eine viel

zu große Dokumentenmenge ergibt.

Neue Ansätze für die Recherchestrategien in Bilddatenbanken ermöglichen

beispielsweise die Entwicklung von Image Retrieval Systemen, die den

Nutzern/innen eine schnelle und effektive Vorauswahl der Bildersammlung

mit einer intuitiven Navigation ähnlich dem Browsen bieten. Diese Art von

Bilddatenbanken basiert auf hierarchisch aufgebauten Clustern29, die durch

Zusammenfügen ähnlicher Dokumente entstehen, welche gruppenweise ab-

gelegt werden.

28 Siehe dazu die Ausführungen von G. Salton und M. McGill in IR – Grundlegendes für Informationswissenschaftler, NY 1987. S. 156 – 161, Rangbildung von Dokumenten und Deskriptorgewichtung. 29 Siehe dazu die Ausführungen von Z. Pecenovic, Minh Do, M. Vetterli und P. Pu in Integrated Browsing and Searching of Large Image Collections In: Robert Laurini (Hrsg.) Advances in Visual Information Systems, 4th International Conference, Visual 2000, Lyon, France, November 2000; Lecture Notes in Computer Science 1929, Springer, Berlin, 2000.

33

Page 36: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Recherchestrategien in Bilddatenbanken

Zu den neue Recherchemethoden in Bilddatenbanken zählt das Auffinden

bestimmter Bilder über einen Mustervergleich. Zur Zeit arbeitet der Informa-

tiker Dr. Odej Kao am Design einer parallelen Bilddatenbank namens Cairo

(Cluster Architecture for Image Retrieval and Organisation), in der ähnlich

der Volltextsuche in einem Textarchiv unter vielen tausend Bildern gerade

jenes herausgesucht werden kann, das ein bestimmtes Motiv zeigt. Bei der

Recherche wird ein Bildausschnitt markiert, den das System mit allen mög-

lichen Ausschnitten der Bilder in der Datenbank vergleicht und ähnliche

Objekte identifiziert.30 Momentan kann eine präzise Suche nach einzelnen

Bildelementen in einer Bilddatenbank nicht durchgeführt werden, da eine

derartige Abfrage die Leistungsfähigkeit der bestehenden Datenbanken bei

weitem übersteigt. Durch die Verdoppelung der Rechneranzahl in dieser

parallelen Bilddatenbank läßt sich die Bearbeitungszeit einer Anfrage auf die

Hälfte reduzieren.

30 Näheres dazu unter http://www.ashland.edu oder http://www.tu-Clausthal.de

34

Page 37: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Zusammenfassung

Zusammenfassung

Die Nachrichtenagenturen der dpa und der AP haben die Vorteile der digita-

len Bildübermittlung und –speicherung erkannt: schnelles downloaden, platz-

und zeitsparende Archivierung und nicht zuletzt optimale Be- und

Weiterverarbeitungsmöglichkeiten. Dennoch ist das Problem der Repräsen-

tation von Bildern durch Worte in Datenbanken in einigen Fällen noch nicht

zufriedenstellend gelöst, denn nicht Eindeutigkeit auf den ersten Blick

sondern Vieldeutigkeit ist das Merkmal eines Bildes. Daher kann die Be-

schreibung eines Bildes oftmals eine subjektive Färbung erhalten. Um dem

entgegenzuwirken wird in Bilddatenbanken eine Schlagwortsystematik zur

spezifischen inhaltlichen Erschließung von Bildmaterial eingesetzt. Leitendes

Prinzip dabei sollte immer die Überlegung sein, unter welchen Aspekten die

jeweils vorliegende Fotografie möglicherweise gesucht wird. Die formale

Erfassung von Bildern durch festgelegte Deskriptoren ist daher Pflicht und

weitestgehend automatisiert. Eine einheitliche Terminologie ist bei der

Indexierung und beim Retrieval unerlässlich, da sie erheblich zur Verbes-

serung des Rechercheergebnisses beiträgt.

Die von den Bilddokumentaren/innen eingesetzten konventionellen Retrieval-

techniken, beispielsweise Boolesche Operatoren und Feldsuche, entspre-

chen dem Suchziel und den Möglichkeiten der Recherchesoftware, sodaß in

den meisten Fällen ein optimales Suchergebnis, zur Zufriedenheit der

Nutzer/innen erzielt wird.

In den Bilddatenbanken der dpa und AP werden üblicherweise die Kombi-

nation von freitext- und dokumentations-sprachenbasierter Suche und die

Spezifische – Wörter – Priorität - Strategie bei der Recherche angewandt.

Diese Strategien haben sich durch ihre Schnelligkeit und Genauigkeit des

Rechercheergebnisses bewährt. Allerdings ist die Vollständigkeit des erziel-

ten Ergebnisses zu optimieren. Die Kunden/innen, die eigenständig recher-

chieren sind mit einem gefundenen Bild zwar schnell zufrieden, jedoch

werden Vollständigkeit und Relevanz des Suchergebnisses von ihnen oft

nicht überprüft.

35

Page 38: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Zusammenfassung

Neue weiterführende Strategien zur Verbesserung des Bildretrievals können

von den Bildarchivaren/innen erst dann übernommen werden, wenn das

Konzept der Retrievalsoftware und die Rechnerarchitektur diesen neuen

Anforderungen entspricht. Um z.B. eine sprachungebundene Nutzung zu

ermöglichen, wäre die Einbindung elektronischer Systeme denkbar, die opti-

sche Merkmale wie ähnliche Motive, Farbkompositionen, Struktur und Muster

erkennen können. Ebenso wird zukünftig eine Erweiterung der Bildspeicher-

kapazität unumgänglich sein, um die tägliche Flut an Bildern archivieren zu

können.

36

Page 39: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Literaturverzeichnis

Literaturverzeichnis

Burneleit, Hans-Dieter: Elektronische Medien und Verlagswesen. Kap. 6.4.4.: Informationserschließung durch den Kunden. In: Grundlagen der praktischen Information und Dokumentation. Ein Handbuch zur Einführung in die fachliche Informationsarbeit. Hrsg. von Buder, Marianne; Rehfeld, Werner; Seeger, Thomas; Strauch, Dietmar Begründet von Laisiepen, Klaus; Lutterbeck, Ernst; Meyer-Uhlenried, Karl-Heinrich, 4. völlig neu gefaßte Ausgabe. München 1997, S. 1015 – 1016.

Bundesverband der Pressebild-Agenturen und Bildarchive (BVPA) (Hrsg.): Der Bildermarkt. Handbuch der Bildagenturen, München 2001.

D´Alleyrand, Marc: Image Storage and Retrieval Systems: A New Approach to Records Management. New York 1989.

Kind, Joachim: Online-Dienste. Kap. C3.2.7.: Durchführung einer Recherche. In: Grundlagen der praktischen Information und Dokumentation. Ein Handbuch zur Einführung in die fachliche Informationsarbeit. Hrsg. von Buder, Marianne; Rehfeld, Werner; Seeger, Thomas; Strauch, Dietmar Begründet von Laisiepen, Klaus; Lutterbeck, Ernst; Meyer-Uhlenried, Karl-Heinrich, 4. völlig neu gefaßte Ausgabe. München 1997, S. 297 – 300.

Krause, Jürgen: Intelligentes Information Retrieval. Rückblicke, Bestandsaufnahmen und Realisierungschancen. In: Experimentelles und praktisches Information Retrieval. Hrsg. von Kuchlen, Rainer. Konstanz 1992. S. 35 – 58.

Leenings, Anke: Audiovisuelle Materialien. In: Grundlagen der praktischen Information und Dokumentation. Ein Handbuch zur Einführung in die fachliche Informationsarbeit. Hrsg. von Buder, Marianne; Rehfeld, Werner; Seeger, Thomas; Strauch, Dietmar Begründet von Laisiepen, Klaus; Lutterbeck, Ernst; Meyer-Uhlenried, Karl-Heinrich, 4. völlig neu gefaßte Ausgabe. München 1997, S. 502 – 517.

Niemann, Annette: Das Recht des Bildes. Untersuchungen zu Auswirkungen

der Digitalisierung auf den Urheberrechtsschutz in der Bildbranche. Materialien zur Information und Dokumentation, Band 6. Hrsg. von von Poetzsch, Eleonore; Thomas, Christina; Harms, Michael; Hempel, Wolfgang; Schmidt, Ralph. 1. Auflage, Potsdam 1998.

Nürnberger, Albrecht: Datenbanken und Recherche. Über Archive, Dokumentationen und elektronische Datenbanken. Reihe: Journalismus & Praxis. Hrsg. von Haller, Michael, Romerskirchen 1993.

37

Page 40: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Literaturverzeichnis

Poetzsch, Eleonore: Information Retrieval. Einführung in Grundlagen und Methoden. Materialien zur Information und Dokumentation, Band 5. Hrsg. von Poetzsch, Eleonore; Thomas, Christina; Harms, Michael; Hempel, Wolfgang; Schmidt, Ralph. 1. Auflage, Potsdam 1998.

Reimer, Ulrich: Neue Formen der Wissenspräsentation. Kap. B7.1.2.3.: Dokument – Retrieval. In: Grundlagen der praktischen Information und Dokumentation. Ein Handbuch zur Einführung in die fachliche Informationsarbeit. Hrsg. von Buder, Marianne; Rehfeld, Werner; Seeger, Thomas; Strauch, Dietmar Begründet von Laisiepen, Klaus; Lutterbeck, Ernst; Meyer-Uhlenried, Karl-Heinrich, 4. völlig neu gefaßte Ausgabe. München 1997, S. 190 – 191.

Salton, Gerard; Mc Gill, Michael: Information Retrieval – Grundlegendes für

Informationswissenschaftler. Hamburg 1987.

Schlieper, Ulrike: Entwurf eines Thesaurus für die Bilddatenbank IMAGO am kunstgeschichtlichen Institut der Humboldt-Universität in Berlin. In: Dokumentation – Präsentation – Qualität. Herta-Schöbel-Preis 1997. Materialien zur Information und Dokumentation, Band 7. Hrsg. von Poetzsch, Eleonore; Thomas, Christina; Harms, Michael; Hempel, Wolfgang; Schmidt, Ralph. 1. Auflage, Potsdam 2000, S. 80 – 133.

38

Page 41: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Anhang

Stichwortliste für die Recherche in den Reportdiensten der dpa-Bilddatenbank vom 18. November 1996 (Pflichtstichwörter und Kann – Stichwörter) A D E L Besitz Hofhaltung Insignien Personal A R B E I T Arbeitsamt Arbeitslose Arbeitsmarkt Arbeitsschutz Arbeitsvermittlung Arbeitszeit Beamte Berufe Berufsausbildung Berufsschulen Demonstrationen Gastarbeiter Gewerkschaften Löhne Mitbestimmung Streik Tarife A U S B I L D U N G BaföG Fachhochschulen Hochschulen Kindergärten Rektorenkonferenz Schulen Schüler Studenten Universitäten

Page 42: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

F O L K L O R E Brauchtum Feste Karneval Trachten G E O G R AF I E Landschaft Gewässer Gebäude Küsten Städte G E S E L L S C H A F T Alkoholiker Armut Ausländer Beerdigungen Behinderte Demonstrationen Deutschorden Elend Elendsquartiere Familie Feiertage Feste Frauen Freimaurer Freizeit Freizeitindustrie Glücksspieler Heilsarmee Hilfsorganisationen Hobbysport Hochzeiten Homosexuelle Hunger Jugend Jugendorganisationen Kinder Kinderarbeit Kleinwüchsige Menschenmassen Minderheiten Mißwahlen Nationalitäten Obdachlose Okkultismus

Page 43: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Prostitution Rekorde Senioren Situationen Soziales Sozialhilfe Sucht Tourismus Typen Vereine Volksfeste Wohnen Zuschauer G E S U N D H E I T Abtreibung Aids Behinderte Drogen Ernährung Forschung Geburt Gentechnik Gesundheitsreform Gesundheitswesen Heilbehandlung Krankenhäuser Krankenkassen Krankenversicherungen Krankheiten Medizin Medizinisches Personal Medizintechnik Messen Operationen Patienten Rettungsdienste Schwangerschaft Seuchen Sucht J A H R E S Z E I T E N Feiertage Frühling Herbst Jahreswechsel Ostern Pfingsten Schnee

Page 44: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Sommer Sommerzeit Sturm Trauertage Weihnachten Wetter Winter J U S T I Z amnesty Anschläge Arbeitsrecht Atomschmuggel Demonstrationen Drogen Entführungen Familiendrama Flugzeugentführungen Geiselnahmen Gerichte Guerilla Kindesentführung Konferenzen Korruption Kriminalität Mafia Menschenrechte Mietrecht Mord Organisierte Kriminalität Prozesse Raub Rechtsextremismus Spionage Strafvollzug Terrorismus Todesstrafe Waffenhandel K A T A S T R O P H E N Atom Bahn Bergbau Brände Chemie Dürre Einstürze Erdbeben Erdrutsche

Page 45: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Explosionen Feuerwehr Flugzeuge Gas Hilfsaktionen Hochwasser IKRK Katastrophenschutz Lawine Naturkatastrophen Öl Opfer Rettungsdienste Schiffe Schnee Sturm Sturmflut Unfälle -Arbeit -Fahrzeuge -Freizeit -Haushalt -Jagd -Tiere Unglücke Unwetter Vergiftungen Vulkane Wasser Zerstörungen K R I S E N Bürgerkrieg Demonstrationen Flüchtlinge Internationale Zwischenfälle Opfer Unruhen K U L T U R Architektur Archive Auktionen Ausstellungen Auszeichnungen Ballett Bibliotheken Bildhauerei Denkmäler

Page 46: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Festspiele Film Fotografie Gebäude Kabarett Konferenzen Kunst Kunstmarkt Literatur Malerei Museen Musical Musik Musikgruppen Musikinstrumente Oper Operette Orchester Show Szene Tanz Theater Zirkus L A N D W I R T S C H A F T Ackerbau Agrar Auktionen Ausstellungen Ernährung Ernte Felder Feldbestellung Fischerei Forstwirtschaft Gartenbau Gebäude Gentechnik Genußmittel Jagd Kaffee Künstliche Bewässerung Lebensmittel Mühlen Produkte Schädlinge Tabak Tierhaltung Weinbau Wiesen

Page 47: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

M E D I E N Auszeichnungen Computer Datenschutz Fernsehen Fernsehproduktionen Fernsehsender Film Filmstudios Fotografie Konferenzen Messen Presse Presserat Rundfunk Sendetürme Stuntmen Technik Teleshopping Verlage Zeitschriften Zeitungen M I L I T Ä R Abrüstung Atomtest Bundeswehr Demonstrationen Flüchtlinge Golfrat Heer Kampfhandlungen Kasernen Krieg Kriegsfolgen Luftschutz Luftwaffe Manöver Marine NATO Opfer Rüstung Vertriebene Waffen Warschauer Pakt Wehrdienst Zerstörungen Zivildienst Zivilschutz

Page 48: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

M O D E Accessoires Ausstellungen Auszeichnungen Damenmode Herrenmode Kindermode Haarmode Historisch Messen Modenschau Pelzmode Schmuck Schuhe N A T U R Artenschutz Blitze Demonstrationen Gewitter Höhlen Klima Meeresschutz Mond Naturerscheinungen Naturschutz Pflanzen Sonne Tiere Tiermedizin Tierschutz Vulkanismus Wasser Wetter Wirbelstürme Wolken P E R S O N E N Auszeichnungen Besitz Besuch Privat Reisen Urlaub

Page 49: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

P O L I T I K Affären Andengruppe Antisemitismus Anschläge Arabische Liga ASEAN Atomtests Ausländer Ausschreitungen Ausschüsse Aussiedler Auszeichnungen Autonomie Asyl Behörden Bürgerinitiativen Bundesfinanzhof Bundesgrenzschutz Bundeskanzler Bundesländer Bundespräsident Bundesrat Bundesrechnungshof Bundesregierung Bundestag Bundesversammlung Bundestagswahl CDU CSU DDR-Unrecht Demonstrationen Entwicklungshilfe EU EU Parlament Europarat Extremismus FDP Flüchtlinge Gedenktage Geheimdienste Geschichte -Kaiserzeit -I. Weltkrieg -Weimarer Republik -II. Weltkrieg -III. Reich -Nachkriegszeit -DDR Gesundheitsreform

Page 50: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Golf-Kooperationsrat (GCC) Grenzen Grüne Guerilla GUS Haushalt Islam-Konferenz (OIC) Jahrestag Juden Kabinett Koalition Kommunalwahl Kommunen Konferenzen Krawalle KSZE Kurden Landtag Menschenrechte Minderheiten Nordischer Rat OAS OAU Ostseerat OSZE Parlament Parteien Parteitag PDS Pflegeversicherung Polizei Präsident Propaganda Rechnungshof Rechtsextremismus Regierung Renten Schulden Separatismus Sozialrecht Sozialversicherung SPD Städte Städtepartnerschaften Städtetag Stasi Steuern Symbole Treuhand UN Unruhen

Page 51: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Verfassung Verträge Vertriebene Volkszählung Wahlen Wahlkampf WEU Zeitgeschichte Zoll R E L I G I O N E N Bauten Buddhismus Evangelische Kirche Friedhöfe Islam Juden Katholische Kirche Kirchen Konferenzen Ostern Pfingsten Religionen Religiöse Kulte Sekten Vatikan Voodoo Weihnachten S P O R T Zuschauer Sportler Sportlerin U M W E L T Altlasten Atommüll Bürgerinitiativen Bodenuntersuchungen Demonstrationen Giftmüll Klima Konferenzen Lärm Lärmschutz Luftuntersuchungen Luftverschmutzung Meeresschutz

Page 52: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Müll Müllabfuhr Ölpest Organisationen Recycling Robbensterben Umweltverschmutzung Umweltschutz Vogelsterben Wasseruntersuchungen Wasserverschmutzung V E R K E H R Bahn Bahnhöfe Demonstrationen Fahrverbot Flughäfen Häfen Historisch Luftfahrt Schiffahrt Schiene Straße Tankstellen Transporte Verkehrsberuhigung Verkehrssicherheit Verkehrsteilnehmer W I R T S C H A F T Anlagenbau APEC ASEAN Atom Atomenergie Atommüll Auktionen Außenhandel Ausstellungen Auto Banken Bau Bekleidung Bergbau Börse Branchen Büroartikel Bundesbank

Page 53: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Chemie Computer Datenverarbeitung DAX Devisen Dienstleistungen Dollar Edelmetalle Effekten EFTA Elektro Elektronik Energie Ernährung EWI EWR Finanzmärkte Flugzeugbau G-7 Gastronomie GATT Geld Geldanlage Getränke Giftmüll Glücksspiele Gold Gummi Handel Handwerk Haushaltswaren Historisch Holz Hotel Immobilien Industrie Investitionen Insolvenzen IWF Kohle Konferenzen Konjunktur Konkurse Kosmetik Kunststoffe Kurse Ladenschluß Leasing Maschinenbau Messen Metall

Page 54: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Mineralöl Möbel NAFTA Ost OECD OPEC Optik Ostdeutschland Papier Patente Personalien Pharma Porzellan Post Rohstoffe Sachverständigenrat Sanitär Schulden Spielwaren Sportartikel Stahl Straßenbau Technik Telekommunikation Terminbörse Textil Treuhand Uhren Unterhaltungselektronik Unternehmen Verbände Verbraucher Verlage Versicherungen Währung Wasser Weltbank Werbung Werften Wettbewerb Wohnungsbau WTO Zinsen Zulieferer Zweirad

Page 55: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

W I S S E N S C H A F T Archäologie Astronomie Atom Atomenergie Auszeichnungen Biologie Chemie Computer Energie Erdaufnahmen Forschung Gentechnik Geologie Geschichte Heraldik Konferenzen Klima Laser Labore Paläontologie Philosophie Physik Planeten Psychologie Raumfahrt Soziologie Sprache Technik Tierversuche Ufos Weltall

Page 56: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Schlagwörter zur Erschließung der Bildneuzugänge in der dpa –

Bilddatenbank

Abendgarderobe

Amtstracht

Ärgerlich

Energisch

Ernst

Erschöpft

Farbig

Freizeitbekleidung

Fröhlich

Gala

Gespräch

Gestik

Händedruck

Komisch

Kopfbedeckung

Kostüm

Lächeln

Männlich

Mimik

Müde

Nachdenklich

Nackt

Neutral

Prominenz

Schmerzverzerrt

Skeptisch

Traurig

Uniform

Weiblich

Page 57: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Bildtypen zur Erschließung der Bildneuzugänge in der dpa – Bilddatenbank

Aktion

Aufführung

Auftritt

Außenaufnahme

Einzel

Feature

Filmszene

Ganze Figur

Gruppe

Innenaufnahme

Luftaufnahme

Nachtaufnahme

Nahaufnahme

Paar

Panorama

Polizeifoto

Porträt

Pose

Profil

Rückansicht

Satellitenaufnahme

Symbolbild

Übersicht

Unterwasser

Zweiergruppe

dpa

Page 58: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Concept bzw. Schlagwortliste der AP Photo Archive – Bilddatenbank Adulation (Beweihräucherung) Aggression Amusement (Unterhaltung, Belustigung, Vergnügen) Anger (Ärger, Zorn) Bizarre (bizarr) Boredom (Langeweile) Burden (Last) Celebration (Feier) Cold (Kälte) Comic (komisch) Concentration (Konzentration) Concern (Sorge, Besorgnis, Unruhe) Confinement (Beschränkung, Einengung) Confrontation (Konfrontation) Content (Zufriedenheit) Contrast (Kontrast) Curious (seltsam, merkwürdig) Cute (niedlich) Defeat (Niederlage) Deserted (verlassen) Despair (Verzweiflung, Hoffnungslosigkeit) Destruction (Zerstörung) Determined (Entschlossenheit) Devout (fromm, herzlich) Diligence (Fleiß, Eifer, Emsigkeit) Dramatic (Dramatik) Dry (trocken) Enjoyment (Genuss, Vergnügen) Excitement (Aufregung) Family (Familie) Fat (dick, fett) Fear (Angst) Freedom (Freiheit) Friendship (Freundschaft) Grief (Trauer) Happy (glücklich) Hot (Hitze) Humor Isolation (Absonderung, Isolation) Live Lonely (einsam) Mature (reif, ausgereift) Meditative (nachdenklich) Nostalgia (nostalgisch) Pain (Schmerz) Passion (Leidenschaft) Peaceful (friedlich) Pensive (nachdenklich, ernst) Poor (Armut)

Page 59: Fachhochschule Potsdam Institut für Information und ...fiz1.fh-potsdam.de/volltext/diplome/05505.pdf · mit dem Schwerpunkt Berlin und Neue Bundesländer, bei täglich rund 60 Neuzugängen,

Power (Stärke, Macht) Pride (Stolz) Reverence (Ehrfurcht) Sad (traurig) Searching (suchend) Serene (ruhig) Shock (Schock) Solemn (feierlich, ernst) Spacious (geräumig, weit, ausgedehnt) Speed (Geschwindigkeit) Stark (steif, starr) Strong (stark) Suffer (Leiden) Surprise (Überraschung) Tension (Spannung) Thin (dünn) Tired (müde) Tranquil (ruhig, gelassen) Vanity (Eitelkeit) Violent (gewalttätig) Weak (schwach) Wealth (Reichtum) Wet (nass) Wonder (Verwunderung) Youth (Jugend)