Digitalisierungspraxis - Müller - Zeitungsvolltexte

27
Historische Zeitungen Online – Schritt für Schritt Christa Müller Österreichische Nationalbibliothek

description

 

Transcript of Digitalisierungspraxis - Müller - Zeitungsvolltexte

Page 1: Digitalisierungspraxis - Müller - Zeitungsvolltexte

Historische Zeitungen Online – Schritt für Schritt

Christa Müller

Österreichische Nationalbibliothek

Page 2: Digitalisierungspraxis - Müller - Zeitungsvolltexte
Page 3: Digitalisierungspraxis - Müller - Zeitungsvolltexte

ANNO – AustriaNNewspapers Online• http://anno.onb.ac.at/

• historische österreichische Zeitungen und Zeitschriften

• seit Mai 2003

• 6,5 Mio gescannte Zeitungsseiten online

• ca. 190 Zeitungs- und Zeitschriftentiteln

• frei und kostenlos

• täglich > 1500 Leser

Page 4: Digitalisierungspraxis - Müller - Zeitungsvolltexte

Warum Zeitungen?

• internationale, regionale und lokale Geschichte, Politik, Kultur und Gesellschaftsfragen

• unmittelbarer Spiegel des Tagesgeschehens

• Verbesserung der Zugänglichkeit (Probleme für Leser)

• Integrierte Sammlungen

• Schonung der Originale

• Zusatznutzen

Page 5: Digitalisierungspraxis - Müller - Zeitungsvolltexte

Massendigitalisierung: ANNO

• Dienstleister scannt – EU-weite Ausschreibung

• nicht vom MF, immer vom Original

• Auflicht und Durchlauf

• pro Jahr ca. 1 Mio Seiten

Page 6: Digitalisierungspraxis - Müller - Zeitungsvolltexte

Besonderheiten der Zeitungen

• vertraute Textsorte

• nur sehr wenige Exemplare erhalten

• „Verbrauchsgut“

Page 7: Digitalisierungspraxis - Müller - Zeitungsvolltexte

Verbesserungen für die Leser: Schritt für Schritt

1. Imageversion:• Titelliste

• Jahreseinstieg

Page 8: Digitalisierungspraxis - Müller - Zeitungsvolltexte
Page 9: Digitalisierungspraxis - Müller - Zeitungsvolltexte
Page 10: Digitalisierungspraxis - Müller - Zeitungsvolltexte
Page 11: Digitalisierungspraxis - Müller - Zeitungsvolltexte
Page 12: Digitalisierungspraxis - Müller - Zeitungsvolltexte
Page 13: Digitalisierungspraxis - Müller - Zeitungsvolltexte

Verbesserte Nutzung von Zeitschriften

• Inhaltsverzeichnisse erschließen

Page 14: Digitalisierungspraxis - Müller - Zeitungsvolltexte
Page 15: Digitalisierungspraxis - Müller - Zeitungsvolltexte
Page 16: Digitalisierungspraxis - Müller - Zeitungsvolltexte
Page 17: Digitalisierungspraxis - Müller - Zeitungsvolltexte
Page 18: Digitalisierungspraxis - Müller - Zeitungsvolltexte
Page 19: Digitalisierungspraxis - Müller - Zeitungsvolltexte
Page 20: Digitalisierungspraxis - Müller - Zeitungsvolltexte

ANNO – OCR-Pilot

Page 21: Digitalisierungspraxis - Müller - Zeitungsvolltexte

ANNO in TelPlus

Page 22: Digitalisierungspraxis - Müller - Zeitungsvolltexte

Besondere Herausforderungen für OCR

• Zeitungen weniger sorgfältig gedruckt als Bücher: Druckerschwärze ungleichmäßig, dünnes Papier

• großes Format

• viele Eigennamen (Orte und Personen)

• mehrere Spalten

• kleine Schrift

Page 23: Digitalisierungspraxis - Müller - Zeitungsvolltexte

ABO – Austrian Books Online

• Public-Private-Partnership

• historischen Buchbestand vom 16. bis zum 19. Jahrhundert

• 600.000 urheberrechtsfreie Werke

• 180 Millionen Seiten

Page 24: Digitalisierungspraxis - Müller - Zeitungsvolltexte
Page 25: Digitalisierungspraxis - Müller - Zeitungsvolltexte

Texterkennung

• Volltextsuche in Zeitungen getrennt von Büchern

• Suchworte mit Tagesdatumsangaben kombinieren

• OCR von Zeitungen nicht so gut wie von Büchern

Page 26: Digitalisierungspraxis - Müller - Zeitungsvolltexte

Was nun?

• Leser findet immer etwas – was?

• Was findet er nicht?

• möglicher erster Lösungsansatz: Index offenlegen– positionierbar

– Filter

– Fuzzy Logik

– durchsuchbar

– …… ????

Page 27: Digitalisierungspraxis - Müller - Zeitungsvolltexte

Danke!

• anno.onb.ac.at