Lexikographie im digitalen Zeitalter: Das Goethe-Wörterbuch Robert Charlier Berlin-Brandenburgische...

Post on 05-Apr-2015

107 views 1 download

Transcript of Lexikographie im digitalen Zeitalter: Das Goethe-Wörterbuch Robert Charlier Berlin-Brandenburgische...

Lexikographie im digitalen Zeitalter: Das Goethe-Wörterbuch

Robert Charlier Robert Charlier Berlin-Brandenburgische Akademie der Berlin-Brandenburgische Akademie der

WissenschaftenWissenschaften

»Neue Wege zu alten Quellen« »Neue Wege zu alten Quellen« Historisch-kulturwissenschaftliche Informationsverarbeitung Historisch-kulturwissenschaftliche Informationsverarbeitung

Universität Köln, 4.-6. März 2004Universität Köln, 4.-6. März 2004

Klassikerlexikographie für das Internet

A. Projekt Goethe-Wörterbuch (GWb)A. Projekt Goethe-Wörterbuch (GWb)

B. Lexikographie als Meta-SystemB. Lexikographie als Meta-System

C. Digitale QuellenbearbeitungC. Digitale Quellenbearbeitung

A. Projektvorstellung

Akademienvorhaben Goethe-Wörterbuch (GWb)

Berlin-Brandenburgische Berlin-Brandenburgische Akademie der Akademie der WissenschaftenWissenschaften

Akademie der Wissenschaften Akademie der Wissenschaften in Göttingen in Göttingen (Hamburg)(Hamburg)

Heidelberger Akademie der Heidelberger Akademie der Wissenschaften Wissenschaften (Tübingen)(Tübingen)

Die deutschen Akademien

BIB

LIO

GR

AP

HIE

N

ED

ITIO

NE

N

RT

ER

CH

ER

GRUNDLAGENFORSCHUNG

AKADEMIEN

Historische Lexikographie

Formensprache des 19. Jhs. Formensprache des 19. Jhs. Morphologie des 21. Jhs.Morphologie des 21. Jhs. Internet =‘Weltwörterbuch’Internet =‘Weltwörterbuch’ Wörterbuch=‘Hypertext’Wörterbuch=‘Hypertext’

RT

ER

CH

ER

B. Lexikographie als Meta-System

Wortartikel:Wortartikel:

LemmaLemma VorbemerkungVorbemerkung LeitbemerkungLeitbemerkung Zitat, StellenangabeZitat, Stellenangabe SynonymeSynonyme LemmalisteLemmaliste

Google-Eintrag:Google-Eintrag:

Such-, Schlag, StichwortSuch-, Schlag, Stichwort Meta-InformationMeta-Information TrefferkommentarTrefferkommentar Dokument, Ort (URL)Dokument, Ort (URL) Angabe ähnlicher SeitenAngabe ähnlicher Seiten IndexIndex

Thesaurus vs. Index

Deutsches WbDeutsches Wb Adelung, Heyne, PaulAdelung, Heyne, Paul

19. Jh.19. Jh.

‘‘thesaurisch’thesaurisch’

DWDS des 20. Jhs.DWDS des 20. Jhs. Schiller-WörterbuchSchiller-Wörterbuch

21. Jh.21. Jh.

‘‘indexierend’indexierend’

Thesaurus | Index | Thesaurus

C. Digitale Quellenbearbeitung

Mit ‘GWb intern’...

GWb-Datentypologie:

Quellentextdaten (Ausgaben, Übersetzungsvorlagen)

Arbeitsdaten (Siglen-, Namenslisten)

Ergebnisdaten (Artikel, Projektbeschreibung)

Digitaler Quellenbegriff

Goethes Vorlagentexte...

...für ...für ÜbersetzungÜbersetzung u. u. Bearbeitung Bearbeitung als:als:

1. Bilddatei 1. Bilddatei (Drucke des 18. Jhds.)(Drucke des 18. Jhds.)

2. Textimage 2. Textimage (moderne Reprints)(moderne Reprints)

3. Volltext 3. Volltext (Frakturausgaben bis 1941)(Frakturausgaben bis 1941)

GWb intern: Quellen-Bibliothek

Sekundärliteratur (.pdf, OCR)Sekundärliteratur (.pdf, OCR)

Opern-Bearbeitungen (.tiff)Opern-Bearbeitungen (.tiff)

Reiseliteratur (.pdf)Reiseliteratur (.pdf)

lokale Suchmaschinen (Java)lokale Suchmaschinen (Java)

1. Opern-Bearbeitung: Text|Druck|Musik-Synopse

2. Reiseliteratur: R. P. Knight

3. Sekundärliteratur: E. Arnhold

Fraktur-Erkennung

Frakturdruck-OCR

Programmgruppe „Artex“Programmgruppe „Artex“ Basis: Kontur-TomographieBasis: Kontur-Tomographie 95 % reicht für Verschlagwortung95 % reicht für Verschlagwortung Grenze: Schriftsetzer-WechselGrenze: Schriftsetzer-Wechsel

Fazit

Auszeichnung der Quellen-Textdaten extensivAuszeichnung der Quellen-Textdaten extensiv intensives Markup durch Artikel-Tagging:intensives Markup durch Artikel-Tagging:

i.i. Tustep-Schnittstelle Tustep-Schnittstelle (‘Konvert’)(‘Konvert’)

ii.ii. prospektive Digitalisierungprospektive Digitalisierung