Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem...

70
Information Seeking & Searching Ingo Frommholz Universität Duisburg-Essen Vorlesung "Information Engineering" SS 2007 UNIVERSITÄT D U I S B U R G E S S E N

Transcript of Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem...

Page 1: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Information Seeking & Searching

Ingo Frommholz

Universität Duisburg-Essen

Vorlesung "Information Engineering"SS 2007

UNIVERSITÄT

D U I S B U R GE S S E N

Page 2: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Organisatorisches

Diese Woche keine Übungen, nächste Woche PräsentationFür Kommedia-Studierende:

Vorlesung kann als 2+1-Veranstaltung belegt werdenTeil des Vorlesungsstoffes daher nicht prüfungsrelevant (/wirdbekannt gegeben)Prüfung z.B. zusammen mit Teilen der Datenbanken-Vorlesung(2+1) im nächstem Semester als "DB, Infosys + IR"Nächstes Semester kein IR!Wir prüfen, ob man IE auch alleine als 3+1-Vorlesung hören kann(für 6 Kreditpunkte)

Ingo Frommholz Information Seeking & Searching IE SS07

Page 3: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Wissensintensive Aufgaben und Suche nachInformation

Letzte Woche: wissensintensive Aufgaben in Prozessen

KnowMore: Bereitstellung relevanten Wissens zur Lösung derAufgabe

Was aber bedeutet überhaupt "relevant"?

Und wie suchen wir eigentlich nach Information?

Ingo Frommholz Information Seeking & Searching IE SS07

Page 4: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Inhaltsverzeichnis

1 Der Begriff der Relevanz

2 Information Seeking Behaviour

3 Information Searching

4 Strategische Unterstützung

Ingo Frommholz Information Seeking & Searching IE SS07

Page 5: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Der Begriff der Relevanz

Page 6: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Relevanz

Ausführungen nachStefano Mizzaro, How many relevances in information retrieval?Interacting with Computers 10(3), S. 303–320, 1998

Ingo Frommholz Information Seeking & Searching IE SS07

Page 7: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Relevanz

Relevanz

Duden:Wichtigkeit, Erheblichkeit

Merriam-Webster:

1 relation to the matter at hand; practical and especially socialapplicability: PERTINENCE

2 the ability (as of an information retrieval system) to retrievematerial that satisfies the needs of the user

Oxford Advanced Learner’s Dictionary of Current English:relevant: connected with what is being disussed

Ingo Frommholz Information Seeking & Searching IE SS07

Page 8: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Relevanz

Relevanz

Wichtig für die Evaluierung von Informationssystemen

Schwierig zu quantifizieren

Relevanz ist subjektiv

Relevanz ist eine Beziehung zwischen zwei Gruppen

Ingo Frommholz Information Seeking & Searching IE SS07

Page 9: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Dimensionen der Relevanz

4 Dimensionen der Relevanz (nach Mizzaro)

1 Ressource2 Repräsentation des Benutzerproblems3 Zeit4 Thema, Aufgabe, Kontext

Ingo Frommholz Information Seeking & Searching IE SS07

Page 10: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Dimensionen der Relevanz

Ressource

Surrogat Repräsentation des Dokuments, z.B. Titel,Schlagwörter, Namen der Autoren, bibliographischeDaten, Zusammenfassung, usw.

Dokument Physische Entität, die der Benutzer bei der Suchebekommt

Information Nicht-physische Entität, die der Benutzer nach demLesen des Dokuments bekommt

Ordnung auf Ressourcen

Surrogat < Dokument < Information

Ingo Frommholz Information Seeking & Searching IE SS07

Page 11: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Dimensionen der Relevanz

Repräsentation des Benutzerproblems

Benutzer braucht Information zur Lösung der Aufgabe

Sie hat damit ein Informationsbedürfnis (Information Need)

"Informationsbedürfnis" hier eher informell, im Ggs. zur formalenSpezifikation von Informationsbedürfnissen in KnowMore!

Ingo Frommholz Information Seeking & Searching IE SS07

Page 12: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Dimensionen der Relevanz

Repräsentation des Benutzerproblems

Real Information Need (RIN) Die Information, die zur Lösung derAufgabe erforderlich ist

Perceived Information Need (PIN) Repräsentation des Problems,implizit im Gedächtnis des Benutzers

Request Repräsentation des PIN in natürlicher Sprache

Query Repräsentation der Nachfrage (Request) in der"Systemsprache"

Ordnung auf Repräsentationen

Query < Request < PIN < RIN

Ingo Frommholz Information Seeking & Searching IE SS07

Page 13: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Dimensionen der Relevanz

Übergangsoperationen zwischen Repräsentationen

PIN

RIN

Request

Query

Perception

Expression

Formalisation

Ingo Frommholz Information Seeking & Searching IE SS07

Page 14: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Dimensionen der Relevanz

Probleme bei Operationen

Übergangsoperationen nicht trivial!Perception:

Benutzer muss etwas suchen, das er/sie nicht kenntDaher u.U. Fehleinschätzung des ProblemsBenutzer weiß daher nicht, was er/sie wissen muss (AnomalousState of Knowledge, ASK)

Expression:Benutzer drückt sein Bedürfnis in Form von "Labeln" oderSchlüsselwörter aus (Label-Effekt (Ingwersen)) und nicht alsvollständige AussageVokabel-Problem (Furnas et al.): Unterschiede im Vokabular desBenutzers und in der Literatur

Formalisation: "Systemsprache"/Anfragesprache mitunter nichtleicht verständlich

Nur partielle Übersetzung zwischen Repräsentationen möglich!Ingo Frommholz Information Seeking & Searching IE SS07

Page 15: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Dimensionen der Relevanz

Relevanz zwischen Ressource und Repräsentation

Relevanz eines Surrogats zu einer Query

Relevanz der Information zum RIN

...

Ingo Frommholz Information Seeking & Searching IE SS07

Page 16: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Dimensionen der Relevanz

2-dimensionale Relevanz

Information

Document

Surrogate

Query Request PIN RIN

InfRes

Repr

Ingo Frommholz Information Seeking & Searching IE SS07

Page 17: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Dimensionen der Relevanz

Zeit

Zeit als dritte Dimension

Ein Surrogat, Dokument oder eine Information nicht relevant zueinem Zeitpunkt, aber relevant zu einem anderen ZeitpunktBeispiel:

Nutzer lernt etwas was ihm erlaubt, das Dokument zu verstehenRIN oder PIN verändert sich

Ingo Frommholz Information Seeking & Searching IE SS07

Page 18: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Dimensionen der Relevanz

Dynamische Übergangsoperationen zwischenRepräsentationen

pin0

q1

… …

… … …

… …

PIN

Request

Query

perc

expr

form form-1

q0

qn

expr-1

rmr0r1

q2

RIN

pinp

rin0

Ingo Frommholz Information Seeking & Searching IE SS07

Page 19: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Dimensionen der Relevanz

Thema, Aufgabe, Kontext

Thema (Topic) Das Themengebiet, das für den Benutzer interessantist, z.B. "das Konzept der Relevanz in denInformationswissenschaften"

Aufgabe (Task) Die Aktivitäten, die der Benutzer mit Hilfe dererhaltenen Information ausführen wird, z.B. "eineVorlesung vorbereiten"

Kontext (Context) Alles außer Thema und Aufgabe, was die Sucheirgendwie beeinflusst

bekannte Dokumentenicht verstehbare Dokumenteverfügbare Zeit und verfügbares GeldGlaubwürdigkeit

Ingo Frommholz Information Seeking & Searching IE SS07

Page 20: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Dimensionen der Relevanz

Partielle Ordnung auf Thema, Aufgabe, Kontext

{Topic,Task,Context}

{Topic,Task} {Task,Context}

{Topic,Context}

{Context}{Task}{Topic}

Topic

Task

Context

Ingo Frommholz Information Seeking & Searching IE SS07

Page 21: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Dimensionen der Relevanz

4-dimensionale Relevanz

Topic

Task

Context

PIN RIN

InfRes

Repr

Information

Document

Surrogate

Query Request

Ingo Frommholz Information Seeking & Searching IE SS07

Page 22: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Dimensionen der Relevanz

4-dimensionale Relevanz

rel(Surrogat,Query , t(q0),{Thema})

Ein Surrogat ist relevant zu einer Anfrage im Zeitpunkt t(q0)hinsichtlich des Themas

rel(Dokument,Query , t(q0),{Thema})

Ein Dokument ist relevant zu einer Anfrage im Zeitpunkt t(q0)hinsichtlich des Themas

→ Relevanz ermittelbar durch typische, nicht-interaktiveSuchalgorithmen

Ingo Frommholz Information Seeking & Searching IE SS07

Page 23: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Dimensionen der Relevanz

4-dimensionale Relevanz

rel(Information,RIN, t(f ),{Thema,Aufgabe,Kontext})

Die erhaltene Information ist relevant zum wahrenInformationsbedürfnis im Zeitpunkt t(f ) hinsichtlich Thema, Aufgabeund Kontext

Die Relevanz, die für den Benutzer interessant ist

Nicht-interaktive Systeme können diese Relevanz nicht erfassen,sind aber dennoch ein wichtiger Baustein

Interaktion des Benutzers mit Informationssystem essentiell!

Ingo Frommholz Information Seeking & Searching IE SS07

Page 24: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Information Seeking Behaviour

Page 25: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Information Seeking Behaviour und Information Searching

Modelle zur Informationssuche

Verschiedene Modelle bezüglich des Benutzerverhaltens zumbesseren Verständnis des Prozesses der InformationssucheKlassisches Information Retrieval

Informationssuche in wenig strukturierten Datenbeständen (Texte,Multimediadaten)Vagheit des Informationsbedürfnisses, unsichere Repräsentationdes Inhalts → Standard-Datenbank-Methoden nicht brauchbarSystembasiert, statisches Informationsbedürfnis

Interaktives Information RetrievalInteraktion des Benutzers mit Informationssystem im VordergrundDynamisches Informationsbedürfnis

Zwei Betrachtungsweisen zum interaktiven IR1 Information Seeking Behaviour2 Information Searching

Ingo Frommholz Information Seeking & Searching IE SS07

Page 26: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Information Seeking Behaviour und Information Searching

Information Seeking Behaviour

Breitere Sicht auf die Informationssuche als inhaltsorientierteIR-Systeme

Verhalten, Motivation und Vorgehen des Benutzers zurBefriedigung einer Aufgabe modelliertZentrale Fragen:

Wodurch wird ein Informationsbedürfnis ausgelöst?Wie verhalten wir Menschen uns daraufhin, um das Problem zulösen?

Ingo Frommholz Information Seeking & Searching IE SS07

Page 27: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Information Seeking Behaviour und Information Searching

Information Searching

Sicht auf die Interaktion des Benutzers mit denInformationsquellen im Allgemeinen

Umfasst klassische IR-Systeme im Sinne einer Suchmaschineund andere Quellen (z.B. das persönliche Umfeld)

Ingo Frommholz Information Seeking & Searching IE SS07

Page 28: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Wilsons Problem-Solving-Modell

Wilsons Problem-Solving-Modell

Ingo Frommholz Information Seeking & Searching IE SS07

Page 29: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Wilsons Problem-Solving-Modell

Wilsons Problem-Solving-Modell

Betont die verschiedenen Gebiete des Information SeekingBehaviour

Suchverhalten als zielorientiertes Verhalten seitens desBenutzers

Sehr allgemein und somit umfassend gehalten.

Ingo Frommholz Information Seeking & Searching IE SS07

Page 30: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Ellis’ Behavioural Model of Information Seeking Strategies

Ellis’ Behavioural Model of Information SeekingStrategies

Generelles Modell zum Suchverhalten

Basiert auf empirischer Evaluation in Sozialwissenschaften undin Ingenieursfirmen

Allgemeine Kategorien oder Eigenschaften des Suchverhaltens:Starting, Chaining, Browsing, Differentiating, Monitoring,Extracting, Verifying, Ending

Ingo Frommholz Information Seeking & Searching IE SS07

Page 31: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Ellis’ Behavioural Model of Information Seeking Strategies

Kategorien des Suchverhaltens nach Ellis (1)

Startingalle Aktivitäten zu Beginn der Suche nach Informationen, zumBeispiel

Auswahl der Informationsquelle (z.B. persönliche Kollektion, aberauch Bibliothek)LiteratursucheBefragung von Kollegen

Überblick über die Literatur

Ingo Frommholz Information Seeking & Searching IE SS07

Page 32: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Ellis’ Behavioural Model of Information Seeking Strategies

Kategorien des Suchverhaltens nach Ellis (2)

Chaining

Aufeinander aufbauende Informationen werden sowohl vorwärts-als auch rückwärtsgerichtet verfolgt

Ähnlich dem Suchen nach Referenzen aus der Literaturliste einesArtikelsFaktoren:

Topikalische RelevanzAutorAktualitätZitierhäufigkeitKosten und Zeit der Beschaffung

Finden neuer Informationsquellen oder gar Neuformulierung desInformationsbedürfnisses

Ingo Frommholz Information Seeking & Searching IE SS07

Page 33: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Ellis’ Behavioural Model of Information Seeking Strategies

Kategorien des Suchverhaltens nach Ellis (3)

Browsing

Basiert auf Informationsquellen und gefundenen Dokumenten

semi-zielorientierte Suche durch Browsen inerfolgversprechenden Bereichen

Verfolgen von Inhaltsverzeichnissen, Listen von Titeln,Überschriften, Namen von Organisationen und Personen,Weblinks, usw.

Findet immer statt, wenn relevante Informationzusammenhängend und zum Thema passend aufbereitet wird

Ingo Frommholz Information Seeking & Searching IE SS07

Page 34: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Ellis’ Behavioural Model of Information Seeking Strategies

Kategorien des Suchverhaltens nach Ellis (3)

Differentiating

Beurteilung von Informationsquellen nach ihrer Art, Qualität,Wichtigkeit, Brauchbarkeit

Dadurch Filterung der Information

Beispiel: Regierungsinformation vs. Information unabhängigerGruppen

Ingo Frommholz Information Seeking & Searching IE SS07

Page 35: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Ellis’ Behavioural Model of Information Seeking Strategies

Kategorien des Suchverhaltens nach Ellis (4)

Monitoring

Sich auf den neuesten Wissenstand halten

Entwicklungen in einem Gebiet verfolgen

Meist wenige ausgewählte Quellen (z.B. bestimmte Magazine,Mailinglisten, aber auch persönliche Kontake)

Extracting

Identifizierung relevanten Materials

Material: Dokumenten, neue Quellen, Passagen

Kognitive Erfassung der Information durch Benutzer

Hintergrundwissen des Benutzers wichtig

Ingo Frommholz Information Seeking & Searching IE SS07

Page 36: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Ellis’ Behavioural Model of Information Seeking Strategies

Kategorien des Suchverhaltens nach Ellis (5)

VerifyingÜberprüfen der Information bzgl. Richtigkeit und Zuverlässigkeit

EndingAbschluss der Suche, Verknüpfen der Information

Ingo Frommholz Information Seeking & Searching IE SS07

Page 37: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Ellis’ Behavioural Model of Information Seeking Strategies

Prozessmodell

Nicht alle Aktivitäten sequentiell

Starting, Browsing, Chaining und Monitoring sindSuchprozeduren

Differentiating ist ein Filterungsprozess

Ingo Frommholz Information Seeking & Searching IE SS07

Page 38: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Ellis’ Behavioural Model of Information Seeking Strategies

Erweiterung nach Meho/Tibbo

Evaluation von Ellis wiederholt und neu analysiert (auch imHinblick auf neue Technologien)

Grundsätzlich wird Ellis’ Modell bestätigt

Aber: Ergänzung um neue Kategorien

Ingo Frommholz Information Seeking & Searching IE SS07

Page 39: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Ellis’ Behavioural Model of Information Seeking Strategies

Neue Kategorien

Accessing

Zugriff auf Volltexte (statt Surrogaten)

Beschaffung der Inhalte auf unterschiedlichem Weg und mitunterschiedlichen Kosten

Networking

Persönliche Kommunikation mit verschiedenen Personen

Diskussion über und Bewertung der gefundenen Information imInternet

Information ManagingAblage, Speicherung und Organisation der gesammelten oderverwendeten Informationen

Ingo Frommholz Information Seeking & Searching IE SS07

Page 40: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Ellis’ Behavioural Model of Information Seeking Strategies

Phasen im Suchverhalten

Ingo Frommholz Information Seeking & Searching IE SS07

Page 41: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Kuhlthaus Stage-Modell

Kuhlthaus Stage-Modell

6 Phasen (Stages) umfassendes Modell:1 Initiation2 Selection3 Exploration4 Formulation5 Collection6 Presentation

Beobachtung der mit der Aufgabe verbundenen Gefühle,Gedanken und Aktionen des Benutzers

Ingo Frommholz Information Seeking & Searching IE SS07

Page 42: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Kuhlthaus Stage-Modell

Phasen (1)

Initiation

Benutzer wird sich seiner Wissenslücke bewusst oder

Notwendigkeit zur Aufgabenbearbeitung durch äußere Einflüsse

Gefühle von Unsicherheit und Besorgnis

Gedanken sind vage und doppeldeutig

Erkenntnis des Informationsbedürfnisses als eigentliche Aufgabedieser Phase (Recognize)

Ingo Frommholz Information Seeking & Searching IE SS07

Page 43: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Kuhlthaus Stage-Modell

Phasen (2)

Selection

Aufgabe: Identifikation des generellen Themengebiets (Identify)

Unsicherheit weicht OptimismusGewichtung der möglichen Themen nach Kriterien wie

Persönliches InteresseNotwendigkeitVerfügbare Information und Zeit

Thema mit der größten Aussicht auf Erfolg wird gewählt

Suche nach Hintergrundinformation im Vordergrund

Ingo Frommholz Information Seeking & Searching IE SS07

Page 44: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Kuhlthaus Stage-Modell

Phasen (3)

Exploration

Die eigentliche Suche

Gefühle wie Konfusion, Unsicherheit und Zweifel

Aufgabe: Auffinden von Information zum jeweiligen Thema, umWissen und Kenntnis zu verbessern

Orientierung und Erlangung ausreichender Information imZentrum der Gedanken, mit dem Ziel der Fokussierung

Benutzer kann Informationsbedürfnis noch nicht genauspezifizieren, daher Kommunikation mit dem SystembeeinträchtigtAktionen des Benutzers beinhalten

Finden relevanter InformationVerarbeitung der InformationBezugnahme zu bekanntem Wissen

Ingo Frommholz Information Seeking & Searching IE SS07

Page 45: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Kuhlthaus Stage-Modell

Phasen (4)

Formulation

Wendepunkt im Prozess

Unsicherheit weicht der Zuversicht

Benutzer bekommt basierend auf Explorationsphase eine klarePerspektive auf die zu lösende Aufgabe

Identifikation und Auswahl von Ideen aus der Information

Aufgabe: Formulierung einer fokussierten Perspektive auf dasThema (Formulate)

Gedanken werden durch gewonnene Erkenntnis klarer definiertund führen zu weiterer, fokussierterer Suche

Ingo Frommholz Information Seeking & Searching IE SS07

Page 46: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Kuhlthaus Stage-Modell

Phasen (5)

Collection

Interaktion zwischen Benutzer und Informationssystem effektivund effizient

Aufgabe: einschlägige Information zum Thema zu sammeln(Gather)

Benutzer hat konkrete Vorstellung über Ablauf der Suche

Genauere Spezifikation des Informationsbedürfnisses, bessereEinschätzung der Relevanz von Dokumenten

Vertrauen steigt, Unsicherheit weicht Interesse am Projekt

Ingo Frommholz Information Seeking & Searching IE SS07

Page 47: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Kuhlthaus Stage-Modell

Phasen (6)

Presentation

Vervollständigung und Beendigung der Informationssuche(Complete)

Vorbereitung zur Präsentation oder Anwendung der Information

Gefühl der Erleichterung, gepaart mit Zufriedenheit oderEnttäuschung

Gedanken konzentrieren sich auf Zusammenfassung derSucheergebnisse mit einem persönlichen Verständnisausgewählter Aspekte des Themas

Ingo Frommholz Information Seeking & Searching IE SS07

Page 48: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Vergleich der Modelle Ellis/Kuhlthau

Vergleich der Modelle

Große Gemeinsamkeiten, aberEllis: Reihenfolge der Kategorien kann sich ändernKuhlthau: Starre Phasen

Informationssysteme sollten möglichst alle Kategorien/Phasenunterstützen

Ingo Frommholz Information Seeking & Searching IE SS07

Page 49: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Digital Library Lifecycle

Digital Library Lifecycle

Beschreibt aufgabenabhängige Phasen des wissenschaftlichenArbeitens

5 Phasen

Ingo Frommholz Information Seeking & Searching IE SS07

Page 50: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Digital Library Lifecycle

Phasen des Digital Library Lifecycle

Discover Erschließen notwendiger Datenquellen

Retrieve Suche nach gewünschter Information

Collate Ablage der gefundenen Information

Interpret Erschließung und kognitive Erfassung der Information

Re-Present Erstellen neuen Wissens aus der Information

Ingo Frommholz Information Seeking & Searching IE SS07

Page 51: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Digital Library Lifecycle

Digital Library Lifecycle

Interpret Retrieve

DiscoverRe−Present

Collate

Ingo Frommholz Information Seeking & Searching IE SS07

Page 52: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Information Searching

Page 53: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Information Searching

Interaktion des Benutzers mit Informationsquellen im Vordergrund

Episodic Interaction Model (Belkin)

Cognitive Model (Ingwersen)

Stratified Interaction Model (Saracevic)

Ingo Frommholz Information Seeking & Searching IE SS07

Page 54: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Belkins Epsiodic Interaction Model

Anomalous State of Knowledge (ASK)

Klassische Suchsysteme: "best-match"-PrinzipBestmögliches System liefert Dokumente zurück, die am bestenzu einer Repräsentation des Informationsbedürfnisses (z.B.Anfrage) passenEine Annahme: Benutzer kann das Informationsbedürfnis exaktspezifizieren

ASK-HypotheseInformationbedürfnis entsteht durch Anomalie im Wissenszustand(state of knowledge) des Benutzers (Anomalous State ofKnowledge)Benutzer kann Informationsbedürfnis zur Beseitigung derAnomalie nicht spezifizierenBesser: Erfassung des ASK statt Spezifikation desInformationsbedürfnissesErfassung kognitiver und situationsbedingter Aspekte nötig, umAnomalie aufzulösen

Ingo Frommholz Information Seeking & Searching IE SS07

Page 55: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Belkins Epsiodic Interaction Model

Episodic Interaction Model

Episodic Interaction Modell dient der Erforschung undÜberwindung des ASKUnterscheidung einzelner Prozesse im SuchverhaltenBenutzerinteraktionen mit IR-Systemen als Sequenzverschiedener Interaktionen innerhalb einer Episode derInformationssucheDurchlauf voneinander abweichender Formen der Interaktion undSuchstrategien, abhängig von Faktoren wie

Aufgabe, Ziele und AbsichtenSuchhistorieArten von Informationsobjektennicht erfassbare andere Faktoren

Interaktionsformen unterstützen eine Reihe von Prozessen wiez.B. Browsen, Interpretation, Modifikation und Beurteilung vonInformationNutzerschnittstelle sollte im Vordergrund stehen

Ingo Frommholz Information Seeking & Searching IE SS07

Page 56: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Belkins Epsiodic Interaction Model

Episodic Interaction Model

Ingo Frommholz Information Seeking & Searching IE SS07

Page 57: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Belkins Epsiodic Interaction Model

Beispielepisode

1 Benutzer erinnert sich an Buch an bestimmter Stelle in Bibliothek2 System erlaubt, eine bestimmte Region virtuell abzusuchen3 Benutzer entdeckt dabei anderes interessantes Buch und möchte

nun ähnliche Bücher finden, weiß aber nicht, wie sie diesbeschreibt

4 System bietet mögliche Vorgehensweisen an5 Benutzer wählt Anzeige des Inhaltsverzeichnisses6 System zeigt Inhaltsverzeichnis7 Benutzer findet dort relevanten Suchbegriff und weist das System

an, nach diesem Begriff zu suchen8 System führt suche durch und zeigt zum Suchbegriff gefundene

Dokumente an

Ingo Frommholz Information Seeking & Searching IE SS07

Page 58: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Ingwersens Cognitive Model

Ingwersens Cognitive Model

Globale PerspektiveUmfasst alle beeinflussenden Faktoren, mit denen der Benutzerinteragiert

Soziales UmfeldIR-SystemInformationsobjekteBenutzerschnittstelleBenutzer

Befasst sich mit kognitiven Strukturen – Manifestationen dermenschlichen Kognition, von Reflektionen oder Ideen

Ingo Frommholz Information Seeking & Searching IE SS07

Page 59: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Ingwersens Cognitive Model

Cognitive Model

Ingo Frommholz Information Seeking & Searching IE SS07

Page 60: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Ingwersens Cognitive Model

Polyrepräsentation

Repräsentation eines Informationsobjekts in verschiedenenFormenRepräsentation korreliert mit kognitiven StrukturenBeispiel: Dokument kann repräsentiert werden durch

Titel (vom Autor gegeben)Schlagwörter (vom Indexierer)Andere Dokumente, die es zitieren (extern)Annotationen (extern)

Anderes Beispiel: verschiedene Indexierungsverfahren, aufdieselbe Kollektion angewandtRetrievalsystem unterstützt mehrere Repräsentationen (unddaher möglichst viele kognitive Strukturen) → intentionalredundancyGutes Suchergebnis, wenn viele Repräsentationen zum selbenDokument zeigen (Overlap)

Ingo Frommholz Information Seeking & Searching IE SS07

Page 61: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Ingwersens Cognitive Model

Polyrepräsentation des kognitiven Raumes desBenutzers

Auch der kognitive Raum des Benutzer kann mittelsPolyrepräsentation dargestellt werden

Einfachstes Beispiel ist die Polyrepräsentation desInformationsbedürfnisses mittels verschiedener Anfragen oderRequests

Aber auch die Aufgabe (work task) kann formal repräsentiertwerden

Ingo Frommholz Information Seeking & Searching IE SS07

Page 62: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Ingwersens Cognitive Model

Globales Modell der Polyrepräsentation

Ingo Frommholz Information Seeking & Searching IE SS07

Page 63: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Saracevics Stratified Model

Saracevics Stratified Model

Ingo Frommholz Information Seeking & Searching IE SS07

Page 64: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Strategische Unterstützung

Page 65: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Information Seeking Behaviour & Information Searching

Suche nach Information findet in verschiedenen, aufeinanderfolgenden Phasen statt

Interaktion des Benutzers mit dem System wichtiger Faktor

Jede Phase und jeder Faktor sollten umgesetzt werden, um denBenutzer effektiv im Suchprozess zu unterstützen

Ansatz: Arbeiten von Marcia Bates zur strategischenUnterstützung und Integration der genannten Modelle

Ingo Frommholz Information Seeking & Searching IE SS07

Page 66: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Suchaktivitäten

Abstraktionsebenen von Suchaktivitäten

Move Identifizierbare Gedanken oder Aktionen.Typischerweise Kommandos, die vom Systemunterstützt werden, wie das Hinzufügen einesSuchbegriffs oder Verfolgen eines Verweises

Tactic Umfasst mehrere Moves zur Verbesserung desSuchergebnisses, z.B. Auswahl von Synonymen undErweiterung der Suchanfrage, wenn zu wenigErgebnisse gefunden wurden

Strategem Umfasst mehrere Taktiken, um Informationsstrukturen ineiner Domäne auszunutzen. Beispiel: Navigieren in denAusgaben einer Zeitschrift oder das Verfolgen vonReferenzen und Fußnoten

Strategies Umfangreiche Pläne, die Moves, Tactics undStrategeme enthalten können. Einfaches Beispiel:Literaturrecherche über ein neues Gebiet

Ingo Frommholz Information Seeking & Searching IE SS07

Page 67: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Suchaktivitäten

Abstraktionsebenen von Suchaktivitäten

Ingo Frommholz Information Seeking & Searching IE SS07

Page 68: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Suchaktivitäten

Sichtweisen des Information Seeking & Searching

Suchaktivitäten stellen weitere Differenzierung desSuchprozesses dar (Information Seeking)

Implementierung von Taktiken ein erster Schritt

Moves, Tactics, Strategemes und Strategies als möglicheInteraktionsebenen (Information Searching)

Frage nach geeigneter Systemunterstützung, d.h. welcheDienste/Aktivitäten werden vom Informationssystem unterstützt?

Ingo Frommholz Information Seeking & Searching IE SS07

Page 69: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Ebenen der Systemunterstützung

Ebenen der Systemunterstützung nach Bates

Ebene Name Eigenschaft

0 Kein System Reine Benutzerebene;keine Vorschläge/Aktionen vom System

1 Möglichkeiten Vorschläge von Möglichkeiten auf Anfrage;auflisten keine Durchführung

2 Aktionen auf Kann Aktionen ausführen (passiv!);Kommando kein Analysieren der Suche

3 Überwachen, Überwachen, Analysieren einer Suche,Vorschläge Vorschläge machen

a - auf Benutzeranfrageb - bei Entdecken

4 Automatische Automatisches Ausführen einer Aktion4 Ausführung Automatisches Ausführen einer Aktion

a - Information an den Benutzerb - Keine Information

Ingo Frommholz Information Seeking & Searching IE SS07

Page 70: Information Seeking & Searching · Information Nicht-physische Entität, die der Benutzer nach dem Lesen des Dokuments bekommt Ordnung auf Ressourcen Surrogat < Dokument < Information

Relevanz Information Seeking Information Searching Strateg. Unterstützung

Ebenen der Systemunterstützung

Matrix aus Systemunterstützung und Suchaktivität

Ingo Frommholz Information Seeking & Searching IE SS07