Thesaurusvisualisierung mit ICE-Map und SEMTINEL

26
Thesauruspflege mit ICE-Map und Semtinel ZBW Workshop, Hamburg, 10. März 2011 PETRUS-Workshop Deutsche Nationalbibliothek 21. März 2011 Frankfurt Thesaurusvisualisierung mit ICE-Map und SEMTINEL Kai Eckert Universitätsbibliothek Universität Mannheim

description

PETRUS-Workshop Deutsche Nationalbibliothek 21. März 2011 Frankfurt

Transcript of Thesaurusvisualisierung mit ICE-Map und SEMTINEL

Page 1: Thesaurusvisualisierung mit ICE-Map und SEMTINEL

Thesauruspflege mit ICE-Map und Semtinel

ZBW Workshop, Hamburg, 10. März 2011

PETRUS-WorkshopDeutsche Nationalbibliothek

21. März 2011Frankfurt

Thesaurusvisualisierung mit ICE-Map und SEMTINEL

Kai Eckert

UniversitätsbibliothekUniversität Mannheim

Page 2: Thesaurusvisualisierung mit ICE-Map und SEMTINEL

2/27Kai Eckert

Thesauruspflege mit ICE-Map und Semtinel

ZBW Workshop, Hamburg, 10. März 2011

Forschungsschwerpunkte

● Effizienzsteigerung bei der Thesauruspflege in Bibliotheken.

● Entwicklung von Werkzeugen und Prozessen, um alternative Methoden der Verschlagwortung nutzbar zu machen, ohne die Qualität zu gefährden.

● Durch bestmögliche Automatisierung den Menschen beim Aufbau, der Pflege und der Nutzung eines Thesaurus zu unterstützen.

● Dadurch den Einsatz thesaurusbasierter Suchanwendungen auch in Bereichen ermöglichen, in denen das bislang zu aufwändig ist.

Page 3: Thesaurusvisualisierung mit ICE-Map und SEMTINEL

3/27Kai Eckert

Thesauruspflege mit ICE-Map und Semtinel

ZBW Workshop, Hamburg, 10. März 2011

Visual Datamining

Cholera-Ausbruch 1854.

John Snow entdeckt die Ursache durch Daten-visualisierung.

Motivation für uns: „Ich will das sehen!“

Page 4: Thesaurusvisualisierung mit ICE-Map und SEMTINEL

4/27Kai Eckert

Thesauruspflege mit ICE-Map und Semtinel

ZBW Workshop, Hamburg, 10. März 2011

ICE-Map Visualisierung

● Motivation: „Ich will das sehen!“

● Wie sieht denn der Thesaurus eigentlich aus?

● Welche Begriffe wurden denn zugewiesen?

● Gibt es Bereiche, die hauptsächlich verwendet wurden?

● Wie unterscheiden sich die Zuweisungen, wenn verschiedene Verfahren zum Einsatz kommen (Intellektuell, Automatisch, Tagging, ...)?

Page 5: Thesaurusvisualisierung mit ICE-Map und SEMTINEL

5/27Kai Eckert

Thesauruspflege mit ICE-Map und Semtinel

ZBW Workshop, Hamburg, 10. März 2011

Wo setzen wir an?

Page 6: Thesaurusvisualisierung mit ICE-Map und SEMTINEL

6/27Kai Eckert

Thesauruspflege mit ICE-Map und Semtinel

ZBW Workshop, Hamburg, 10. März 2011

Wie visualisiere ich einen Thesaurus?

Page 7: Thesaurusvisualisierung mit ICE-Map und SEMTINEL

7/27Kai Eckert

Thesauruspflege mit ICE-Map und Semtinel

ZBW Workshop, Hamburg, 10. März 2011

Slice and Dice Algorithmus

Page 8: Thesaurusvisualisierung mit ICE-Map und SEMTINEL

8/27Kai Eckert

Thesauruspflege mit ICE-Map und Semtinel

ZBW Workshop, Hamburg, 10. März 2011

Squarified Layout

Page 9: Thesaurusvisualisierung mit ICE-Map und SEMTINEL

9/27Kai Eckert

Thesauruspflege mit ICE-Map und Semtinel

ZBW Workshop, Hamburg, 10. März 2011

Intuitive Identifikation von problematischen Konzepten

● Sehr hohe Anzahl Zuordnungen:

– Zu allgemein – sollte aufgeteilt werden

– Nicht signifikant

– Fehlerhafte Zuweisungen

● Sehr geringe Anzahl Zuordnungen:

– Zu spezialisiert – sollte mit anderen Begriffen zusammengeführt werden

– Fehlende Synonyme

– Nicht signifikant

– Fehlende Zuweisungen

Page 10: Thesaurusvisualisierung mit ICE-Map und SEMTINEL

10/27Kai Eckert

Thesauruspflege mit ICE-Map und Semtinel

ZBW Workshop, Hamburg, 10. März 2011

Berücksichtigung der Thesaurus-Hierarchie

● Hohe Anzahl Höher in der Hierarchie

– Allgemeinere Begriffe

● Niedrige Anzahl Niedriger in der Hierarchie

– Speziellere Konzepte

Page 11: Thesaurusvisualisierung mit ICE-Map und SEMTINEL

11/27Kai Eckert

Thesauruspflege mit ICE-Map und Semtinel

ZBW Workshop, Hamburg, 10. März 2011

IC Differenz Analyse

D IC c= IC c− IIC c

IC c=−log P c IIC c=−log hypoc1max

Informationsgehalt:● Vorgestellt von Resnik● Basiert auf der Auftrittswahrscheinlichkeit

in der Dokumentenbasis

Intrinsischer Informationsgehalt:● Vorgestellt von Seco, Veale und Hayes● Basiert auf der Anzahl der Unterbegriffe

Alternativ: Referenzset IC● z.B. Manuell vergebene Schlagwörter

Intuitiv: Ein Wert zwischen -1 und 1, der angibt, ob ein Begriff eine auffällige Häufigkeit hat bezüglich seinerPosition im Thesaurus oder im Vergleich zur Referenz.

Page 12: Thesaurusvisualisierung mit ICE-Map und SEMTINEL

12/27Kai Eckert

Thesauruspflege mit ICE-Map und Semtinel

ZBW Workshop, Hamburg, 10. März 2011

ICE-Map Visualisierung

Page 13: Thesaurusvisualisierung mit ICE-Map und SEMTINEL

13/27Kai Eckert

Thesauruspflege mit ICE-Map und Semtinel

ZBW Workshop, Hamburg, 10. März 2011

ICE-Map Visualisierung

Page 14: Thesaurusvisualisierung mit ICE-Map und SEMTINEL

14/27Kai Eckert

Thesauruspflege mit ICE-Map und Semtinel

ZBW Workshop, Hamburg, 10. März 2011

Anwendungen der ICE-Map Analyse

Page 15: Thesaurusvisualisierung mit ICE-Map und SEMTINEL

15/27Kai Eckert

Thesauruspflege mit ICE-Map und Semtinel

ZBW Workshop, Hamburg, 10. März 2011

Begrifflichkeiten

● IC Differenz Analyse: Das statistische Framework zur Berechnung der IC Differenz eines Konzepts.

● ICE-Map Visualisierung: Die Visualierung der IC Differenz Analyse mittels einer Treemap, plus Navigationsunterstützung (Treeview, Rootline)

● SEMTINEL: Die Plattform zur Entwicklung und Nutzung von Analysen und Visualisierungen, also der ganze Rest.

“Sorry für die Verwirrung ;-)”

Page 16: Thesaurusvisualisierung mit ICE-Map und SEMTINEL

16/27Kai Eckert

Thesauruspflege mit ICE-Map und Semtinel

ZBW Workshop, Hamburg, 10. März 2011

SEMTINEL ist...– Eine Plattform zur Entwicklung eigener Anwendungen

● Integration in thesaurusbasierte Suchanwendungen

– Eine erweiterbare Anwendung, für die man eigene Module entwickeln kann

● Analysen, Visualisierungen, Import-/Exportfilter, Editoren, …

– Eine Anwendung zur Entwicklung von Analysen ● Entwicklung zur Laufzeit, noch nicht realisiert.

– Eine Anwendung zum Experimentieren● Kombination von vorhandenen Analysen und

Visualisierungen

– Ein Werkzeug für Thesaurus-Ersteller und -Nutzer● Einsatz der Werkzeuge, die von anderen entwickelt

wurden

Page 17: Thesaurusvisualisierung mit ICE-Map und SEMTINEL

17/27Kai Eckert

Thesauruspflege mit ICE-Map und Semtinel

ZBW Workshop, Hamburg, 10. März 2011

Netbeans Platform

Page 18: Thesaurusvisualisierung mit ICE-Map und SEMTINEL

18/27Kai Eckert

Thesauruspflege mit ICE-Map und Semtinel

ZBW Workshop, Hamburg, 10. März 2011

SEMTINEL Architektur

Page 19: Thesaurusvisualisierung mit ICE-Map und SEMTINEL

19/27Kai Eckert

Thesauruspflege mit ICE-Map und Semtinel

ZBW Workshop, Hamburg, 10. März 2011

SEMTINEL Datenmodell

Page 20: Thesaurusvisualisierung mit ICE-Map und SEMTINEL

20/27Kai Eckert

Thesauruspflege mit ICE-Map und Semtinel

ZBW Workshop, Hamburg, 10. März 2011

Configuration

OutputVisualizations/

AnalysesDatasets

Experiment API

Page 21: Thesaurusvisualisierung mit ICE-Map und SEMTINEL

21/27Kai Eckert

Thesauruspflege mit ICE-Map und Semtinel

ZBW Workshop, Hamburg, 10. März 2011

Konfiguration eines Experiments

Drag and Drop Support.

Erweiterbares Datenmodell.

Mehrfachauswahl möglich.

Register und Register Set.

Page 22: Thesaurusvisualisierung mit ICE-Map und SEMTINEL

22/27Kai Eckert

Thesauruspflege mit ICE-Map und Semtinel

ZBW Workshop, Hamburg, 10. März 2011

Hierarchische Analysen

Page 23: Thesaurusvisualisierung mit ICE-Map und SEMTINEL

23/27Kai Eckert

Thesauruspflege mit ICE-Map und Semtinel

ZBW Workshop, Hamburg, 10. März 2011

Explanation API

● Jede Analyse liefert Informationen:

– Was wird in der Analyse gemacht?

– Auf welchen Analysen baut sie auf?

– Was sind die Eingabewerte?

– Welche Zwischenergebnisse wurden berechnet?

– Welches Ergebnis wird zurückgegeben?

Page 24: Thesaurusvisualisierung mit ICE-Map und SEMTINEL
Page 25: Thesaurusvisualisierung mit ICE-Map und SEMTINEL

25/27Kai Eckert

Thesauruspflege mit ICE-Map und Semtinel

ZBW Workshop, Hamburg, 10. März 2011

Group Management

Gruppierung von Experimenten

Page 26: Thesaurusvisualisierung mit ICE-Map und SEMTINEL

26/27Kai Eckert

Thesauruspflege mit ICE-Map und Semtinel

ZBW Workshop, Hamburg, 10. März 2011

Vielen Dank.

http://www.semtinel.org

Fragen und Anregungen:

[email protected]