VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter...

44
Vernetzung Zum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval Georg Vogeler Zentrum für Informationsmodellierung Universität Graz @GVogeler http://www.i-d-e.de http:// informationsmodellierung.uni-

Transcript of VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter...

Page 1: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter

Information Retrieval

Georg VogelerZentrum für Informationsmodellierung

Universität Graz@GVogeler

http://www.i-d-e.dehttp://informationsmodellierung.uni-graz.at

Page 2: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

Was Sie erwartet

1. Wie sehen die Digitalen Geisteswissenschaften das Problem der Archiverschließung?

2. Überblick über Stand der Diskussion „Suche“ und Konsequenzen für die Erschließung

3. Konkretisierung

Page 3: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

Digital Geisteswissenschaften

Digitales und digitalisiertes Kulturerbe in seiner• menschlichen Aneignung,• geisteswissenschaftlichen Reflexion,• hermeneutischen Kontextualisierung,• informatischen Formalisierung,• technischen Realisierung und• statistischen Berechnung.

Page 4: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

Konsequenzen der IT

Archiv-erschlies-

sung

technische Möglichkeiten

theoretische

Ansprüche

Benutzerkultur

Page 5: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

Z.B. Informationsvisualisierung

• Word Clouds• Statistiken• geographische Karte• hierarchische Bäume• Netzwerke

• Oder kreativere Zugänge:

• Moretti: „Distant reading“

• Stan Ruecker: „Rich-prospect browsing“

Page 6: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

Creative Archive

• John Latham Archive (Velios 2011)– Brüder Karamazov (Mitya, Ivan and Alyosha) als

Einstiegspunkte

Page 7: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

http://www.ligatus.org.uk/aae/

Page 8: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016
Page 9: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

Creative Archive

• John Latham Archive (Velios 2011)– Brüder Karamazov (Mitya, Ivan and Alyosha) als

Einstiegspunkte• Bloodaxe (Schofield et al. 2015)– Erschließung als künstlerisch reflektiertes Ereignis:

Nachträge und Randbemerkungen werden von Automaten „nachgeschrieben“ (Ausstellung, Twitter)

Page 10: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

http:

//bl

ooda

xe.n

cl.a

c.uk

/exp

lore

/#/s

hape

s

Page 11: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

Benutzerkultur

• „Google-Suchschlitz“

Page 12: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

Information Retrieval

• „Bag of Words“– incl. morphologische Normalisierung

• Gewichtung– von der Ähnlichkeit zwischen Such- und

Informationsraum bis zu externen Relevanzkriterien• „Semantische Suche“– Abbildung auf Konzepte

• „Topic Modeling“ (LDA) u.ä.– Statistische Muster

Page 13: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

Benutzererwartungen

• „Google-Suchschlitz“:– Expansion der Suchbegriffe (Lemmatisierung,

semantische Expansion)– Gewichtung (Ranking)

Page 14: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

IR und Geschichswissenschaft

• „Jede Suche wird geprägt vom Vorwissen, das der Suchende mitbringt, von der Kenntnis der entsprechenden Zusammenhänge und Fachbegriffe, von der Erfahrung und der Routine im Umgang mit den Hilfsmitteln.“ (Peter Haber 2011)

Page 15: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

IR und Geschichswissenschaft

• „Jede Suche wird geprägt vom Vorwissen, das der Suchende mitbringt, von der Kenntnis der entsprechenden Zusammenhänge und Fachbegriffe, von der Erfahrung und der Routine im Umgang mit den Hilfsmitteln.“ (Peter Haber 2011)

• Aber: „Although the building of contextual knowledge is time-consuming, requiring broad searches through vast amounts of archival material, it appears to be an essential part of the historical method.” (Duff / Johnson 2002)

Page 16: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

Benutzerkultur: HistorikerInnen

• Iterative (lernende) Suchen

• „Archival Intelligence“ (Yakel / Torres 2003)

=> Kontexte!

Rhee

201

2

Page 17: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

Theoretische Ansprüche: „Tektonik “

1. Archivbildner hat die bestmögliche Informationsstruktur gefunden.

2. Provenienz bildet Entstehungsumstände ab.3. Einzelstücke sind ohne ihren Kontext nicht

verständlich.4. Hierarchie erleichtert die Suche.5. Hierarchische Ordnung erleichtert die

Erschließungsarbeit.

Page 18: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

Theoretische Ansprüche: Klassifikation

(Shi

rky

2005

)

Page 19: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

Benutzerkultur undtechnische Möglichkeiten

• Digitale Aktenführung und Forscherdatenbanken bauen auf Verschlagwortung von Einzeldokumenten auf.

Page 20: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

Theoretische Ansprüche: „Tektonik “

1. Archivbildner hat die bestmögliche Informationsstruktur gefunden.

2. Provenienz bildet Entstehungsumstände ab.3. Einzelstücke sind ohne ihren Kontext nicht

verständlich.4. Hierarchie erleichtert die Suche.5. Hierarchische Ordnung erleichtert die

Erschließungsarbeit.

Page 21: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

Benutzerkultur undtechnische Möglichkeiten

• Digitale Aktenführung und Forscherdatenbanken bauen auf Verschlagwortung von Einzeldokumenten auf.

• Einschränkung von Suchergebnissen über Kategorien („Facettierte Suche“) statt hierarchischer Zugang von oben nach unten.

Page 22: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

Theoretische Ansprüche: „Tektonik “

1. Archivbildner hat die bestmögliche Informationsstruktur gefunden.

2. Provenienz bildet Entstehungsumstände ab.3. Einzelstücke sind ohne ihren Kontext nicht

verständlich.4. Hierarchie erleichtert die Suche.5. Hierarchische Ordnung erleichtert die

Erschließungsarbeit.

Page 23: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

Benutzerkultur undtechnische Möglichkeiten

• Digitale Aktenführung und Forscherdatenbanken bauen auf Verschlagwortung von Einzeldokumenten auf.

• Einschränkung von Suchergebnissen nach Kategorien („Facettierte Suche“) statt hierarchischer Zugang von oben nach unten.

• Graphendatenbanken als Abbildung von Assoziationen

Page 24: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

Benutzen wir die Archivtektonik für das, was sie wirklich kann!

1. Der Bestand ist eine (mögliche) Aggregation.=> Die Bestandsbeschreibung gilt für alle

Einzelstückez.B. zur• Suchexpansion • Gewichtung

Page 25: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

Benutzen wir die Archivtektonik für das, was sie wirklich kann

1. Der Bestand ist eine (mögliche) Aggregation.=> Die Bestandsbeschreibung gilt für alle Einzelstücke

2. Die Archivtektonik ist Kontext für ihre Bestandteile.=> Deklarieren wir ihre Beziehung klarer:z.B.• als Akteur• Kommunikationspartner• Aufgabenbereich

Page 26: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

RiC-CM

RiC-

CM, S

. 93

Page 27: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

Z.B. Provenienzforschung

• Wiedergutmachungsverfahren

GDA Bayern

Page 28: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

Behördenerschließung

GDA Bayern

Page 29: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

ArchiverschließungGD

A Ba

yern

Page 30: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

Z.B. Provenienzforschung

• Wiedergutmachungsverfahren: Strukturierte Daten erhalten

Page 31: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

Z.B. Provenienzforschung

• Wiedergutmachungsverfahren: Strukturierte Daten erhalten

• Enteignungen und Rückerstattung in Stichwörtern:– „Juden Enteignung“– „Enteignung jüdischer Besitz“– „Enteignung jüdisches Eigentum“

Page 32: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

„Enteignung Jüdischer Besitz“: DDB

Page 33: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

„Enteignung Jüdischer Besitz“: Archivportal-D

Page 34: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

Z.B. Provenienzforschung

• Wiedergutmachungsverfahren: Strukturierte Daten erhalten

• Enteignungen und Rückerstattung in Stichwörtern:Höhere Gewichtung von Aggregationen

Page 35: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

Z.B. Provenienzforschung

• Wiedergutmachungsverfahren: Strukturierte Daten erhalten

• Enteignungen und Rückerstattung in Stichwörtern:Höhere Gewichtung von Aggregationen

• Unterstützung der Exploration („erlernte Suche“):– Objekten, die keinen Rückerstattungsanspruch

geschaffen haben => Gestapo-Akten zur Auflösung jüdischer Gemeinden.

Page 36: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

Z.B. Provenienzforschung

• Wiedergutmachungsverfahren: Strukturierte Daten erhalten

• Enteignungen und Rückerstattung in Stichwörtern:Höhere Gewichtung von Aggregationen

• Unterstützung der Exploration („erlernte Suche“):– Erläuterungen– Vernetzungen

Page 37: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

NYPL: term explorer

http://archives.nypl.org/terms/ Suche nach „Shirley, William“

Page 38: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

http://bigdiva.org/

Page 39: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016
Page 40: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016
Page 41: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016
Page 42: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

Archivische Netze?

• Visuelle Notation für archivische Kontexte– Farben und Symbole für die Kontexte (Aktenbildner,

Zuständigkeiten, ...)?– Archivtektonik als Teilkreise oder Verknüpfung?– Größe der Kreise steht für Umfang der Bestände?

• Archiverschließung als Verknüpfung– Mehr Archiverschließung in knappen Aussagen, die sich leicht

auf „Subjekt Prädikat Objekt“-Strukturen abbilden lassen?• Experimente – mit Archivsoftwareherstellern?– mit Digitalen Geisteswissenschaftlern?

Page 43: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

Es dankt

für Ihre Aufmerksamkeit ...

Georg [email protected]

http://www.i-d-e.dehttp://informationsmodellierung.uni-graz.at

Julian Holzapfl, Joachim Wild, Walter Jaroschka, Michael Wischnath, Alfred Straub für Ihre archivische Expertise

... und ...

Page 44: VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016

Literatur

• Jefferson Bailey: Disrespect des fonds. Rethinking arrangement and description in born-digital archives, in: Archive Journal 3 , 2013 <http://www.archivejournal.net/issue/3/archives-remixed/disrespect-des-fonds-rethinking-arrangement-and-description-in-born-digital-archives>.

• Wendy M. Duff and Catherine A. Johnson: Accidentally Found on Purpose: Information-Seeking Behavior of Historians in Archives, in: The Library Quarterly: Information, Community, Policy, Vol. 72, No. 4 (Oct., 2002), pp. 472-496

• Peter Haber: digital.past. Geschichtswissenschaft im digitalen Zeitalter, München 2011.• ICA: Records in Contexts. A Conceptual Model for Archival Description, Consultation Draft v0.1, September 2016 <

http://www.ica.org/sites/default/files/RiC-CM-0.1.pdf>• Hea Lim Rhee: Modelling historians' information-seeking behaviour with an interdisciplinary and comparative approach, in:

Information Research 17,4 (2012), paper 544• Stan Ruecker / Milena Radzikowska / Stéfan Sinclair: Visual Interface Design for Digital Cultural Heritage. A Guide to Rich-

Prospect Browsing, Aldershot 2011.• Clay Shirky: Ontology is Overrated. Categories, Links, and Tags, in: O'Reilly ETech conference , 2005

<http://shirky.com/writings/ontology_overrated.html>.• Urban Stäheli: Archivnetzplan. Ein neues Findmittel für die Online-Suche in Archivbeständen, in: Informationswissenschaft:

Theorie, Methode und Praxis, [S.l.], v. 4, n. 1, may. 2016. <https://bop.unibe.ch/iw/article/view/2698/4019>• Athanasios Velios: Creative Archiving. A Case Study from the John Latham Archive, in: Journal of the Society of Archivists 32,2

(2011), S. 255-271.• Stefano Vitali: La ricerca archivistica sul web, in: Il web e gli studi storici, hg. v. Rolando Minui, Rom 2015 (Studi superiori), S.

61-106.• Mitchell Whitelaw: The Visible Archive: Mapping the National Archives of Australia Collection, 2009

http://infosthetics.com/archives/2009/09/the_visible_archive.html• Deborah A. Yakel u. Elizabeth Torres: AI: Archival Intelligence and User Expertise, in: American Archivist 44,1 (2003), S. 51-78.• Geoffrey Yeo: Contexts, Original Orders, and Item-Level Orientation. Responding Creatively to Users' Needs and

Technological Change, in: Journal of Archival Organization 12 (2014), S. 170-185.