Suchmaschinen vs. OPAC

33
Suchmaschinen vs. OPAC Prof. Dr. Dirk Lewandowski [email protected] Arbeitstagung der Fraunhofer-Bibliotheken 2009 Bremen, 14.10.2009

description

 

Transcript of Suchmaschinen vs. OPAC

Page 1: Suchmaschinen vs. OPAC

Suchmaschinen vs. OPAC

Prof. Dr. Dirk Lewandowski [email protected]

Arbeitstagung der Fraunhofer-Bibliotheken 2009 Bremen, 14.10.2009

Page 2: Suchmaschinen vs. OPAC

Einführung

Welche Rolle spielen Suchmaschinen im wissenschaftlichen Alltag?

Braucht der Wissenschaftler von heute/morgen da noch einen OPAC?

Wie kann die Suchmaschine praktisch in den Bibliotheksalltag integriert werden?

Fazit: Suchmaschinen - Untergang oder Hoffnungsschimmer?

Gliederung

Page 3: Suchmaschinen vs. OPAC

2 |

Web search: „Always different, always the same“

http://web.archive.org/web/19961023234631/http://altavista.digital.com/

AltaVista 1996

Page 4: Suchmaschinen vs. OPAC

Universal Search

•  x

Page 5: Suchmaschinen vs. OPAC

Universal Search

•  x

News results

ads

organic results

organic results (contd.)

image results

video results

Additional databases

Page 6: Suchmaschinen vs. OPAC

5 |

Page 7: Suchmaschinen vs. OPAC

Einführung

Welche Rolle spielen Suchmaschinen im wissenschaftlichen Alltag?

Braucht der Wissenschaftler von heute/morgen da noch einen OPAC?

Wie kann die Suchmaschine praktisch in den Bibliotheksalltag integriert werden?

Fazit: Suchmaschinen - Untergang oder Hoffnungsschimmer?

Gliederung

Page 8: Suchmaschinen vs. OPAC

Herausforderungen für Bibliotheken

•  Nutzer verwenden Suchmaschinen zur Suche nach „Bibliotheksinhalten“

•  Suchmaschinen „erziehen“ Nutzer zu „schlechtem“ Rechercheverhalten.

•  Suchmaschinen zielen auf Kernbereiche der Bibliotheken – Buchsuche – Wissenschaftliche Inhalte

Page 9: Suchmaschinen vs. OPAC

„Die meisten Nutzer sind nicht willens, bei der Formulierung ihres Suchziels allzu viel kognitive und zeitliche Energie aufzuwenden.“

•  Suchanfragen – Durchschnittliche Länge: 1,7 Wörter – Ca. 50% Einwort-Anfragen – kaum Verwendung von Operatoren und erweiterter Suche

•  Ergebnisseiten – 80% der Nutzer gehen nicht über die erste Ergebnisseite hinaus. – Nutzer betrachten bevorzugt die ersten Ergebnisse (“über dem Knick”). – Pro Session werden bis etwa fünf Dokumente angesehen. – Sessions dauern i.d.R. weniger als 15 Minuten.

•  Nutzer sind meist mit ihren Suchergebnissen zufrieden.

•  Nutzer erwarten, dass alle Systeme so leicht zu bedienen sind wie Google.

(Machill et al. 2003)

Page 10: Suchmaschinen vs. OPAC

9 |

Selektionsverhalten (Top11 Treffer)

(Granka et al. 2004)

Page 11: Suchmaschinen vs. OPAC

10 |

„Most people are looking for quick wins.“

•  Beispiele aus der wissenschaftlichen Suche •  Nutzer kommen über Suchmaschinen, schauen herum und nehmen das mit, was

sie brauchen können. •  Es wird eine Vielzahl von Quellen benutzt. •  Die Hälfte der Nutzer betrachtet nur 1-3 Seiten. •  40% der Nutzer kommen innerhalb von sechs Monaten nicht mehr auf die Website

zurück. •  Nutzer sehen sich Artikel online nur ein paar Minuten lang an, vor allem kurze

Artikel werden gelesen. •  Nutzer sammeln zwar Artikel (als Ausdrucke oder Downloads), lesen sie dann aber nicht.

Was wäre, wenn Ihre Nutzer auch so suchen?

(Nicholas 2008)

(Nicholas 2008)

Page 12: Suchmaschinen vs. OPAC

Wissenschaftliche Inhalte

•  Recherche kostenlos - Inhalte kostenlos – Forschungsportal – Alle Open-Access-Suchmaschinen

•  Recherche kostenlos - Inhalte kostenlos/kostenpflichtig – Google Scholar – Scirus

•  Zugang zur Recherche kostenpflichtig – Thomson Scientific Web Plus

Google ist in der Lage, wissenschaftliche Inhalte in die reguläre Websuche einzubinden.

Page 13: Suchmaschinen vs. OPAC

Google Scholar: Inhalte

Inhalte von Google Scholar

•  Wissenschaftliche Literatur aus dem Web –  Zeitschriftenaufsätze (peer review), Konferenzbeiträge –  Bücher –  Preprints, Postprints –  Reports –  Seminararbeiten –  ...

•  Quellen –  freies Web –  Verlage und Fachgesellschaften (Crawling; keine Feeds!) –  Open-Access-Archive und -Zeitschriften –  Kein Quellenverzeichnis; Umfang der Quellen unklar

Page 14: Suchmaschinen vs. OPAC

Bücher

•  Microsoft hat sein Engagement in der Buchsuche eingestellt.

•  Google Book Search könnte durch die Einigung mit (US-)Verlegern/Autoren zum wichtigsten Anbieter von E-Books werden.

•  Direkter Verkauf und Lizenzierung (z.B. an Bibliotheken).

•  Die Buchsuche wird in die regulären Trefferlisten eingebunden.

Page 15: Suchmaschinen vs. OPAC

Bücher

Page 16: Suchmaschinen vs. OPAC

Fazit Teil 1

Nutzer suchen heute schon mit unterschiedlichen Werkzeugen •  Universalsuchmaschinen •  Spezialsuchmaschinen •  Social Bookmarking / Empfehlungssysteme •  Spezialdatenbanken •  OPACs

OPACs müssen ihren Platz finden zwischen den anderen Diensten

Page 17: Suchmaschinen vs. OPAC

Einführung

Welche Rolle spielen Suchmaschinen im wissenschaftlichen Alltag?

Braucht der Wissenschaftler von heute/morgen da noch einen OPAC?

Wie kann die Suchmaschine praktisch in den Bibliotheksalltag integriert werden?

Fazit: Suchmaschinen - Untergang oder Hoffnungsschimmer?

Gliederung

Page 18: Suchmaschinen vs. OPAC

Welche Bedeutung hat heute eigentlich ein lokaler Bestand?

•  OPAC verfolgt das Konzept des lokalen Bestandsnachweises.

Sucheinstieg „von oben“ vs. „von unten“ •  Erst alle Literatur zum Thema recherchieren, dann ggf. nach Verfügbarkeit

auswählen? •  Wann ist eigentlich eine Recherche nur im lokalen Bestand nötig? Irgendein Werk zum Thema (--> Überblick) Known Item

•  Für welche Art von Suche ist der OPAC heute eigentlich geeignet?

Page 19: Suchmaschinen vs. OPAC

Google Scholar

Page 20: Suchmaschinen vs. OPAC

WorldCat

Page 21: Suchmaschinen vs. OPAC

Wo liegen eigentlich die Stärken der OPACs?

OPAC Suchmaschine

Einfache Suche schwach, da Anordnung der Treffer nach Datum

stark, da gutes Ranking

Erweiterte Suche Guter Funktionsumfang Geringer Funktionsumfang, fehlerhafte Funktionen (!)

Trefferanordnung / Ranking

schlecht, da nur Anordnung nach Datum

gut, da durchdachtes Ranking und Durchmischung der Trefferlisten

Trefferpräsentation wenig flexibel durch Autor/Titel/Jahr

Trefferbeschreibung mit statischen und kontextabhängigen Elementen

Datenbestand nur ein Teilbestand des Bibliotheksangebots

Einbindung aller von der SM aufgebauterer Kolllektionen

Metadaten Mit hohem Aufwand erstellte Qualitätsdaten

Kaum Ausnutzung von Metadaten; keine eigene Erstellung

Page 22: Suchmaschinen vs. OPAC

Wo liegen eigentlich die Stärken der OPACs?

OPAC Suchmaschine

Einfache Suche schwach, da Anordnung der Treffer nach Datum

stark, da gutes Ranking

Erweiterte Suche Guter Funktionsumfang Geringer Funktionsumfang, fehlerhafte Funktionen (!)

Trefferanordnung / Ranking

schlecht, da nur Anordnung nach Datum

gut, da durchdachtes Ranking und Durchmischung der Trefferlisten

Trefferpräsentation wenig flexibel durch Autor/Titel/Jahr

Trefferbeschreibung mit statischen und kontextabhängigen Elementen

Datenbestand nur ein Teilbestand des Bibliotheksangebots

Einbindung aller von der SM aufgebauterer Kolllektionen

Metadaten Mit hohem Aufwand erstellte Qualitätsdaten

Kaum Ausnutzung von Metadaten; keine eigene Erstellung

Page 23: Suchmaschinen vs. OPAC

Probleme der OPACs

•  Unvollständiger Datenbestand – Aufsätze, Literaturdatenbanken fehlen (weitgehend)

•  “Elektronischer Zettelkatalog”?

•  Das Nutzerverhalten hat sich geändert – Kurze Suchanfragen, schnelle Ergebnisse, ein Ergebnisset – Nutzererwartungen werden stark von den Web-Suchmaschinen beeinflusst.

•  Known-Item-Suche vs. thematische Suche – OPACs müssen mit beidem klarkommen.

Page 24: Suchmaschinen vs. OPAC

23 |

Fazit Teil 2

•  OPAC als „echtes Rechercheinstrument“ erscheint nicht mehr zeitgemäß.

•  Der Ansatz „erst Suche, dann lokale Beschränkung“ erscheint vielversprechender.

•  Heutige OPACs setzten auf einen überholten Ansatz (Profirecherche).

Page 25: Suchmaschinen vs. OPAC

Einführung

Welche Rolle spielen Suchmaschinen im wissenschaftlichen Alltag?

Braucht der Wissenschaftler von heute/morgen da noch einen OPAC?

Wie kann die Suchmaschine in den Bibliotheksalltag integriert werden?

Fazit: Suchmaschinen - Untergang oder Hoffnungsschimmer?

Gliederung

Page 26: Suchmaschinen vs. OPAC

Wie der OPAC verbessert werden soll (“Katalog 2.0”)

•  Nutzerpartizipation – Rezensionen – Bewertungen

•  Anreicherung der bibliographischen Daten – Rezensionen –  Inhaltsverzeichnisse

•  Verbesserung der Navigation – Auswahlmenüs auf den Trefferseiten (Kombination von Suche und Browsing)

•  Erweiterung der Datenbasis – Federated search

Page 27: Suchmaschinen vs. OPAC

Kern aller Suchanwendungen: Relevanzranking

•  Web 2.0 Anwendungen verbessern den Katalog, berühren aber den Kern (die Suche) nur am Rand.

•  “Search must work”

•  Nutzererwartungen – Schneller Weg zu den Ergebnissen. – Kein allzu großes Nachdenken über die Formulierung der Suchanfrage. – Keine Suche nach der passenden Datenbank vor der Suche. – Nachdem ein paar Ergebnisse auf der ersten Trefferseite angesehen wurden,

wird entschieden, wie/ob die Recherche fortgeführt wird.

Page 28: Suchmaschinen vs. OPAC

Gemischte Trefferlisten

•  Ranking-Algorithmen bevorzugen „das immer gleiche“. Nutzer verlangen aber nach einer gewissen Vielfalt in der Trefferliste.

•  Beispiel: Allgemeine Anfrage – Nachschlagewerk – Lehrbuch – Einschlägige Datenbank – Aktuelle Literatur – Einschlägige Zeitschriften

Page 29: Suchmaschinen vs. OPAC

28 |

Integration von/in Suchmaschinen

1) Suchmaschine als „zweite Meinung“ zum OPAC •  „Probieren Sie Ihre Suche auch bei...“ - Google, Google Scholar, Google

Buchsuche, ... •  Basis: Man erkennt, dass Nutzer in mehreren Systemen suchen (müssen). •  Bedingung: OPAC liefert initial gute Ergebnisse.

2) Suchmaschinen als „Traffic-Lieferanten“ •  Auslesen von OPAC-Treffern bzw. Trefferlisten in HTML •  Basis: Man erkennt, dass wissenschaftliche Suche in Suchmaschinen stattfindet. •  Bedingung: Suchmaschinen ranken die erstellten Seiten hoch; Konkurrenz nicht allzu

hoch.

Page 30: Suchmaschinen vs. OPAC

29 |

Integration von/in Suchmaschinen

3) Aufbau eigener Wissenschaftssuchmaschinen •  Basis: Man erkennt, dass Qualitätsinhalte aus dem Web mit den „eigenen“

Qualitätsinhalten kombiniert werden müssen. •  Bedingung: Ranking muss funktionieren, Dienst muss eine echte Alternative

zu den allgemeinen Suchmaschinen sein.

4) Erweiterung des eigenen Systems durch Hinzunahme von Daten aus den Universalsuchmaschinen

•  Basis: Man erkennt, dass man nicht alles selbst machen kann. •  Ausnutzung der Suchmaschinen-APIs •  Bedingung: Geeignete APIs stehen zur Verfügung

Page 31: Suchmaschinen vs. OPAC

Einführung

Welche Rolle spielen Suchmaschinen im wissenschaftlichen Alltag?

Braucht der Wissenschaftler von heute/morgen da noch einen OPAC?

Wie kann die Suchmaschine praktisch in den Bibliotheksalltag integriert werden?

Fazit: Suchmaschinen - Untergang oder Hoffnungsschimmer?

Gliederung

Page 32: Suchmaschinen vs. OPAC

31 |

OPACs waren einmal die Spitzenanwendung des Information Retrieval

- sie sollten es wieder werden.

Page 33: Suchmaschinen vs. OPAC

Vielen Dank für Ihre Aufmerksamkeit.

www.bui.haw-hamburg.de/lewandowski.html

Aktuelles Buch: Handbuch Internet-Suchmaschinen (Akademische Verlagsgesellschaft Aka, 2009)

E-Mail: [email protected]