VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter...

Post on 12-Jan-2017

29 views 1 download

Transcript of VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter...

VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter

Information Retrieval

Georg VogelerZentrum für Informationsmodellierung

Universität Graz@GVogeler

http://www.i-d-e.dehttp://informationsmodellierung.uni-graz.at

Was Sie erwartet

1. Wie sehen die Digitalen Geisteswissenschaften das Problem der Archiverschließung?

2. Überblick über Stand der Diskussion „Suche“ und Konsequenzen für die Erschließung

3. Konkretisierung

Digital Geisteswissenschaften

Digitales und digitalisiertes Kulturerbe in seiner• menschlichen Aneignung,• geisteswissenschaftlichen Reflexion,• hermeneutischen Kontextualisierung,• informatischen Formalisierung,• technischen Realisierung und• statistischen Berechnung.

Konsequenzen der IT

Archiv-erschlies-

sung

technische Möglichkeiten

theoretische

Ansprüche

Benutzerkultur

Z.B. Informationsvisualisierung

• Word Clouds• Statistiken• geographische Karte• hierarchische Bäume• Netzwerke

• Oder kreativere Zugänge:

• Moretti: „Distant reading“

• Stan Ruecker: „Rich-prospect browsing“

Creative Archive

• John Latham Archive (Velios 2011)– Brüder Karamazov (Mitya, Ivan and Alyosha) als

Einstiegspunkte

http://www.ligatus.org.uk/aae/

Creative Archive

• John Latham Archive (Velios 2011)– Brüder Karamazov (Mitya, Ivan and Alyosha) als

Einstiegspunkte• Bloodaxe (Schofield et al. 2015)– Erschließung als künstlerisch reflektiertes Ereignis:

Nachträge und Randbemerkungen werden von Automaten „nachgeschrieben“ (Ausstellung, Twitter)

http:

//bl

ooda

xe.n

cl.a

c.uk

/exp

lore

/#/s

hape

s

Benutzerkultur

• „Google-Suchschlitz“

Information Retrieval

• „Bag of Words“– incl. morphologische Normalisierung

• Gewichtung– von der Ähnlichkeit zwischen Such- und

Informationsraum bis zu externen Relevanzkriterien• „Semantische Suche“– Abbildung auf Konzepte

• „Topic Modeling“ (LDA) u.ä.– Statistische Muster

Benutzererwartungen

• „Google-Suchschlitz“:– Expansion der Suchbegriffe (Lemmatisierung,

semantische Expansion)– Gewichtung (Ranking)

IR und Geschichswissenschaft

• „Jede Suche wird geprägt vom Vorwissen, das der Suchende mitbringt, von der Kenntnis der entsprechenden Zusammenhänge und Fachbegriffe, von der Erfahrung und der Routine im Umgang mit den Hilfsmitteln.“ (Peter Haber 2011)

IR und Geschichswissenschaft

• „Jede Suche wird geprägt vom Vorwissen, das der Suchende mitbringt, von der Kenntnis der entsprechenden Zusammenhänge und Fachbegriffe, von der Erfahrung und der Routine im Umgang mit den Hilfsmitteln.“ (Peter Haber 2011)

• Aber: „Although the building of contextual knowledge is time-consuming, requiring broad searches through vast amounts of archival material, it appears to be an essential part of the historical method.” (Duff / Johnson 2002)

Benutzerkultur: HistorikerInnen

• Iterative (lernende) Suchen

• „Archival Intelligence“ (Yakel / Torres 2003)

=> Kontexte!

Rhee

201

2

Theoretische Ansprüche: „Tektonik “

1. Archivbildner hat die bestmögliche Informationsstruktur gefunden.

2. Provenienz bildet Entstehungsumstände ab.3. Einzelstücke sind ohne ihren Kontext nicht

verständlich.4. Hierarchie erleichtert die Suche.5. Hierarchische Ordnung erleichtert die

Erschließungsarbeit.

Theoretische Ansprüche: Klassifikation

(Shi

rky

2005

)

Benutzerkultur undtechnische Möglichkeiten

• Digitale Aktenführung und Forscherdatenbanken bauen auf Verschlagwortung von Einzeldokumenten auf.

Theoretische Ansprüche: „Tektonik “

1. Archivbildner hat die bestmögliche Informationsstruktur gefunden.

2. Provenienz bildet Entstehungsumstände ab.3. Einzelstücke sind ohne ihren Kontext nicht

verständlich.4. Hierarchie erleichtert die Suche.5. Hierarchische Ordnung erleichtert die

Erschließungsarbeit.

Benutzerkultur undtechnische Möglichkeiten

• Digitale Aktenführung und Forscherdatenbanken bauen auf Verschlagwortung von Einzeldokumenten auf.

• Einschränkung von Suchergebnissen über Kategorien („Facettierte Suche“) statt hierarchischer Zugang von oben nach unten.

Theoretische Ansprüche: „Tektonik “

1. Archivbildner hat die bestmögliche Informationsstruktur gefunden.

2. Provenienz bildet Entstehungsumstände ab.3. Einzelstücke sind ohne ihren Kontext nicht

verständlich.4. Hierarchie erleichtert die Suche.5. Hierarchische Ordnung erleichtert die

Erschließungsarbeit.

Benutzerkultur undtechnische Möglichkeiten

• Digitale Aktenführung und Forscherdatenbanken bauen auf Verschlagwortung von Einzeldokumenten auf.

• Einschränkung von Suchergebnissen nach Kategorien („Facettierte Suche“) statt hierarchischer Zugang von oben nach unten.

• Graphendatenbanken als Abbildung von Assoziationen

Benutzen wir die Archivtektonik für das, was sie wirklich kann!

1. Der Bestand ist eine (mögliche) Aggregation.=> Die Bestandsbeschreibung gilt für alle

Einzelstückez.B. zur• Suchexpansion • Gewichtung

Benutzen wir die Archivtektonik für das, was sie wirklich kann

1. Der Bestand ist eine (mögliche) Aggregation.=> Die Bestandsbeschreibung gilt für alle Einzelstücke

2. Die Archivtektonik ist Kontext für ihre Bestandteile.=> Deklarieren wir ihre Beziehung klarer:z.B.• als Akteur• Kommunikationspartner• Aufgabenbereich

RiC-CM

RiC-

CM, S

. 93

Z.B. Provenienzforschung

• Wiedergutmachungsverfahren

GDA Bayern

Behördenerschließung

GDA Bayern

ArchiverschließungGD

A Ba

yern

Z.B. Provenienzforschung

• Wiedergutmachungsverfahren: Strukturierte Daten erhalten

Z.B. Provenienzforschung

• Wiedergutmachungsverfahren: Strukturierte Daten erhalten

• Enteignungen und Rückerstattung in Stichwörtern:– „Juden Enteignung“– „Enteignung jüdischer Besitz“– „Enteignung jüdisches Eigentum“

„Enteignung Jüdischer Besitz“: DDB

„Enteignung Jüdischer Besitz“: Archivportal-D

Z.B. Provenienzforschung

• Wiedergutmachungsverfahren: Strukturierte Daten erhalten

• Enteignungen und Rückerstattung in Stichwörtern:Höhere Gewichtung von Aggregationen

Z.B. Provenienzforschung

• Wiedergutmachungsverfahren: Strukturierte Daten erhalten

• Enteignungen und Rückerstattung in Stichwörtern:Höhere Gewichtung von Aggregationen

• Unterstützung der Exploration („erlernte Suche“):– Objekten, die keinen Rückerstattungsanspruch

geschaffen haben => Gestapo-Akten zur Auflösung jüdischer Gemeinden.

Z.B. Provenienzforschung

• Wiedergutmachungsverfahren: Strukturierte Daten erhalten

• Enteignungen und Rückerstattung in Stichwörtern:Höhere Gewichtung von Aggregationen

• Unterstützung der Exploration („erlernte Suche“):– Erläuterungen– Vernetzungen

NYPL: term explorer

http://archives.nypl.org/terms/ Suche nach „Shirley, William“

http://bigdiva.org/

Archivische Netze?

• Visuelle Notation für archivische Kontexte– Farben und Symbole für die Kontexte (Aktenbildner,

Zuständigkeiten, ...)?– Archivtektonik als Teilkreise oder Verknüpfung?– Größe der Kreise steht für Umfang der Bestände?

• Archiverschließung als Verknüpfung– Mehr Archiverschließung in knappen Aussagen, die sich leicht

auf „Subjekt Prädikat Objekt“-Strukturen abbilden lassen?• Experimente – mit Archivsoftwareherstellern?– mit Digitalen Geisteswissenschaftlern?

Es dankt

für Ihre Aufmerksamkeit ...

Georg Vogelergeorg.vogeler@uni-graz.at

http://www.i-d-e.dehttp://informationsmodellierung.uni-graz.at

Julian Holzapfl, Joachim Wild, Walter Jaroschka, Michael Wischnath, Alfred Straub für Ihre archivische Expertise

... und ...

Literatur

• Jefferson Bailey: Disrespect des fonds. Rethinking arrangement and description in born-digital archives, in: Archive Journal 3 , 2013 <http://www.archivejournal.net/issue/3/archives-remixed/disrespect-des-fonds-rethinking-arrangement-and-description-in-born-digital-archives>.

• Wendy M. Duff and Catherine A. Johnson: Accidentally Found on Purpose: Information-Seeking Behavior of Historians in Archives, in: The Library Quarterly: Information, Community, Policy, Vol. 72, No. 4 (Oct., 2002), pp. 472-496

• Peter Haber: digital.past. Geschichtswissenschaft im digitalen Zeitalter, München 2011.• ICA: Records in Contexts. A Conceptual Model for Archival Description, Consultation Draft v0.1, September 2016 <

http://www.ica.org/sites/default/files/RiC-CM-0.1.pdf>• Hea Lim Rhee: Modelling historians' information-seeking behaviour with an interdisciplinary and comparative approach, in:

Information Research 17,4 (2012), paper 544• Stan Ruecker / Milena Radzikowska / Stéfan Sinclair: Visual Interface Design for Digital Cultural Heritage. A Guide to Rich-

Prospect Browsing, Aldershot 2011.• Clay Shirky: Ontology is Overrated. Categories, Links, and Tags, in: O'Reilly ETech conference , 2005

<http://shirky.com/writings/ontology_overrated.html>.• Urban Stäheli: Archivnetzplan. Ein neues Findmittel für die Online-Suche in Archivbeständen, in: Informationswissenschaft:

Theorie, Methode und Praxis, [S.l.], v. 4, n. 1, may. 2016. <https://bop.unibe.ch/iw/article/view/2698/4019>• Athanasios Velios: Creative Archiving. A Case Study from the John Latham Archive, in: Journal of the Society of Archivists 32,2

(2011), S. 255-271.• Stefano Vitali: La ricerca archivistica sul web, in: Il web e gli studi storici, hg. v. Rolando Minui, Rom 2015 (Studi superiori), S.

61-106.• Mitchell Whitelaw: The Visible Archive: Mapping the National Archives of Australia Collection, 2009

http://infosthetics.com/archives/2009/09/the_visible_archive.html• Deborah A. Yakel u. Elizabeth Torres: AI: Archival Intelligence and User Expertise, in: American Archivist 44,1 (2003), S. 51-78.• Geoffrey Yeo: Contexts, Original Orders, and Item-Level Orientation. Responding Creatively to Users' Needs and

Technological Change, in: Journal of Archival Organization 12 (2014), S. 170-185.