Download - Vom Archiv ins WWW – Digitale Korpora und (sprach-)historische Synergien 2.0 (Offene Archive 2.1)

Transcript
Page 1: Vom Archiv ins WWW – Digitale Korpora und (sprach-)historische Synergien 2.0 (Offene Archive 2.1)

Offene Archive 2.1 – Social media im deutschen Sprachraum

und im internationalen Kontext

Vom Archiv ins WWW – Digitale Korpora und

(sprach-)historische Synergien

Kathrin Pindl Christopher Kolbeck Susanne Haaf

Lehrstuhl für Wirtschafts- und Sozialgeschichte

Fakultät PKGG

Lehrstuhl für Deutsche Sprachwissenschaft

Fakultät SLK

BBAW

Deutsches Textarchiv

Page 2: Vom Archiv ins WWW – Digitale Korpora und (sprach-)historische Synergien 2.0 (Offene Archive 2.1)

Lehrstuhl für Deutsche Sprachwissenschaft

Christopher Kolbeck

BBAW/Deutsches Textarchiv

Susanne Haaf

Lehrstuhl für Wirtschafts- und Sozialgeschichte

Kathrin Pindl

Gliederung 1. Die Rechnungsbücher im Regensburger Spitalarchiv: Überblick über den

Bestand (Kathrin Pindl)

2. Die Textsorte Rechnungsbuch: Forschungsfragen und Erkenntnisinteresse

2.1 Wirtschafts- und sozialgeschichtliches Erkenntnisinteresse (Kathrin Pindl)

2.2 Sprachwissenschaftliches Erkenntnisinteresse (Christopher Kolbeck)

3. Aufbau und Erschließung des Korpus historischer Rechnungsbücher (Susanne

Haaf)

3.1 Deutsches Textarchiv: Referenzkorpus für die Entwicklung des

Neuhochdeutschen

3.2 Digitalisierung historischer Rechnungsbücher

3.3 Korpusrecherchen im DTA

4. Synergien zwischen den Disziplinien und Ausblick (Kathrin Pindl)

Page 3: Vom Archiv ins WWW – Digitale Korpora und (sprach-)historische Synergien 2.0 (Offene Archive 2.1)

Lehrstuhl für Deutsche Sprachwissenschaft

Christopher Kolbeck

BBAW/Deutsches Textarchiv

Susanne Haaf

Lehrstuhl für Wirtschafts- und Sozialgeschichte

Kathrin Pindl

Spitalarchiv

• Regensburger Bürgerspital St. Katharina: Gründung im 13. Jahrhundert als

Gemeinschaftsprojekt von Bischof, Domkapitel und Bürgern; heute öffentliche

Stiftung des bürgerlichen Rechts

• Aufgaben als Armenkrankenhaus und Herberge, wandelte sich im 15.

Jahrhundert zunehmend zu einer Pfründneranstalt, dazu Grundherrschaft und

Wirtschaftsbetrieb (u.a. Weinbau, Brauerei)

• Erste Ansätze zur Organisation des Schriftgutes reichen in das 14. Jahrhundert

zurück

• Archiv- und Registraturordnungen des Katharinenspitals datieren in die Jahre

1412, 1538, 1772, 1862 und 1898

Page 4: Vom Archiv ins WWW – Digitale Korpora und (sprach-)historische Synergien 2.0 (Offene Archive 2.1)

Lehrstuhl für Deutsche Sprachwissenschaft

Christopher Kolbeck

BBAW/Deutsches Textarchiv

Susanne Haaf

Lehrstuhl für Wirtschafts- und Sozialgeschichte

Kathrin Pindl

Bestände

• ca. 5.000 Urkunden, davon ca. 2.000 aus dem 12.-15. Jahrhundert

• Urbare und Salbücher, 27 Bände (1333–1781)

• Protokolle in verschiedenen Serien, 59 Bände (1577–1990)

• Rechnungsbücher und Bilanzen, ca. 4.500 Bände (1359–1990)

• Chroniken (ab 17. Jahrhundert)

• Pfarrei Niederwinzer (1803–1937)

• Pfarrei Höhenberg (18. Jahrhundert)

• Akten, ca. 100 lfm (1520–1990)

• Karten- und Plansammlung (ab ca. 1700)

• Fotos und Bilder (20. Jahrhundert)

• Altrepertorien, 10 Bände (1538–1898)

• Nachlässe:

– Johann Maria Warschütz (1510–1533; Diplomat)

– Franz Dietheuer († 1992; Architekturgeschichte, Kunstgeschichte)

• Archiv des Liedervereins Stadtamhof (1874–1961)

Page 5: Vom Archiv ins WWW – Digitale Korpora und (sprach-)historische Synergien 2.0 (Offene Archive 2.1)

Lehrstuhl für Deutsche Sprachwissenschaft

Christopher Kolbeck

BBAW/Deutsches Textarchiv

Susanne Haaf

Lehrstuhl für Wirtschafts- und Sozialgeschichte

Kathrin Pindl

Rechnungsbücher und Bilanzen ca. 4.500 Bände (1359–1990)

• Paritätische Organisationsstruktur erforderte ausführliche Rechnungslegung

• Neben den Rechnungsbüchern weitere Quellen wie Urbare, Briefbücher,

Manuale, grundherrschaftliche Mischhandschriften, Schuldbücher, Stift- und

Taidingsbücher sowie Ehaftbücher, Statutensammlungen und Protokolle bis zu

den Anfängen einer rudimentären Aktenführung vorhanden

• Enorme Überlieferungsdichte und -kontinuität

• Einzigartiger Erkenntniswert für Wirtschafts- und Sozialgeschichte und

Sprachwissenschaft

Page 6: Vom Archiv ins WWW – Digitale Korpora und (sprach-)historische Synergien 2.0 (Offene Archive 2.1)

Lehrstuhl für Deutsche Sprachwissenschaft

Christopher Kolbeck

BBAW/Deutsches Textarchiv

Susanne Haaf

Lehrstuhl für Wirtschafts- und Sozialgeschichte

Kathrin Pindl

Wirtschafts- und Sozialgeschichte – Warum diese RB?

• Informationen zu Löhnen, Preisen und Lohnnebenleistungen, die für

verschiedene Berufe und Gütergruppen nahezu lückenlos über 700 Jahre

detailliert nachverfolgt werden können

• Lange Reihen mit Preisen für wesentliche Produkte und Löhnen verschiedener

Berufsgruppen sowie – als Novum – die Berücksichtigung nicht-monetärer

Lohnnebenleistungen

• Erstellung repräsentativer Warenkörbe, die schicht- und regionalspezifische

Konsummuster widerspiegeln

• REALLOHNKONZEPT quantitative Rückschlüsse auf die Entwicklung des

Lebensstandards in historischer Perspektive

Page 7: Vom Archiv ins WWW – Digitale Korpora und (sprach-)historische Synergien 2.0 (Offene Archive 2.1)

Lehrstuhl für Deutsche Sprachwissenschaft

Christopher Kolbeck

BBAW/Deutsches Textarchiv

Susanne Haaf

Lehrstuhl für Wirtschafts- und Sozialgeschichte

Kathrin Pindl

Wirtschafts- und Sozialgeschichte – Untersuchungsinteressen

Entwicklung von Löhnen, Preisen

und Lebensstandard

Schichtspezifische Einkommens-

verteilung Marktintegration

Skill Premia Vernetzung mit

Stadt und Umland

Page 8: Vom Archiv ins WWW – Digitale Korpora und (sprach-)historische Synergien 2.0 (Offene Archive 2.1)

Lehrstuhl für Deutsche Sprachwissenschaft

Christopher Kolbeck

BBAW/Deutsches Textarchiv

Susanne Haaf

Lehrstuhl für Wirtschafts- und Sozialgeschichte

Kathrin Pindl

Wirtschafts- und Sozialgeschichte – Ziele

• Substantielle Ergänzung des bisher lückenhaften Bilds zur Preis- und

Lohnentwicklung in Süddeutschland: Überwindung des Nordwest-Südost-Gefälle

in der historischen Lebensstandardforschung und bei der Debatte zur „Great

Divergence“ in Europa

• Vergleichbarkeit mit Daten weiterer Orte in Süddeutschland, Österreich und der

Schweiz

• Zuverlässige, transparente und nachprüfbare Daten auf Grundlage der

Digitalisierung, Transkription und Annotation der Quellengrundlage in

interdisziplinärer Zusammenarbeit mit den SprachwissenschaftlerInnen

• Bereitstellung von Informationen für assoziierte Wissenschaftler und externen

Dritte, die ähnliche Projekte für den süddeutschen Raum planen

Page 9: Vom Archiv ins WWW – Digitale Korpora und (sprach-)historische Synergien 2.0 (Offene Archive 2.1)

Lehrstuhl für Deutsche Sprachwissenschaft

Christopher Kolbeck

BBAW/Deutsches Textarchiv

Susanne Haaf

Lehrstuhl für Wirtschafts- und Sozialgeschichte

Kathrin Pindl

Sprachwissenschaft: Warum diese RB?

• lückenlose Überlieferung der Rechnungsbücher von 1357 bis heute

ideale Basis für Textsortenforschung (Musterbildung)

lückenloser Nachweis der Entwicklung von Verschriftungsstrategien,

Phonem-Graphem-Korrespondenz, Interpunktion etc.

Lexik: Erstbelege

Onomastik: Geltungsareale

• Vorhandensein unterschiedlicher Ausfertigungsstufen

(Mitschriften, Manuale, Reinschriften)

Variationslinguistik: Rekonstruktion historischer Mündlichkeit

language attitudes: Rekonstruktion der Sprachvorstellungen der

Schreiber

Möglicher Einfluss der Konfession auf Verschriftungsstragtegien

(Bikonfessionalität)

Page 10: Vom Archiv ins WWW – Digitale Korpora und (sprach-)historische Synergien 2.0 (Offene Archive 2.1)

Lehrstuhl für Deutsche Sprachwissenschaft

Christopher Kolbeck

BBAW/Deutsches Textarchiv

Susanne Haaf

Lehrstuhl für Wirtschafts- und Sozialgeschichte

Kathrin Pindl

Page 11: Vom Archiv ins WWW – Digitale Korpora und (sprach-)historische Synergien 2.0 (Offene Archive 2.1)

Lehrstuhl für Deutsche Sprachwissenschaft

Christopher Kolbeck

BBAW/Deutsches Textarchiv

Susanne Haaf

Lehrstuhl für Wirtschafts- und Sozialgeschichte

Kathrin Pindl

Page 12: Vom Archiv ins WWW – Digitale Korpora und (sprach-)historische Synergien 2.0 (Offene Archive 2.1)

Lehrstuhl für Deutsche Sprachwissenschaft

Christopher Kolbeck

BBAW/Deutsches Textarchiv

Susanne Haaf

Lehrstuhl für Wirtschafts- und Sozialgeschichte

Kathrin Pindl

RB 1500 (Ausschnitt)

(Z. 6) It(em) dem sporer umb Arbeit zalt i. s. 5d

(Z. 7f) It(em) zur Rechnung viti umb wein vish krebs und Anders Ausgeb(en) ii. lb. vi. s. d

RB 1657 (Ausschnitt)

(Z. 3f) Den 19 Junӱ (1)657: In deß Geistlichen herrn spitalmeisters Zim(m)er,

ein eißernes offrschliesrl machen lassen darvor bezalt 5s. 18 d.

(Z. 10f) Den 24 Junӱ vor die 37. Pfrientner, und vor die .3. g(e)halten 20. köpf meth

erkhaufft, auffden st: Johannistag, 3f. 2s. 10 d.

Page 13: Vom Archiv ins WWW – Digitale Korpora und (sprach-)historische Synergien 2.0 (Offene Archive 2.1)

Lehrstuhl für Deutsche Sprachwissenschaft

Christopher Kolbeck

BBAW/Deutsches Textarchiv

Susanne Haaf

Lehrstuhl für Wirtschafts- und Sozialgeschichte

Kathrin Pindl

Page 14: Vom Archiv ins WWW – Digitale Korpora und (sprach-)historische Synergien 2.0 (Offene Archive 2.1)

Lehrstuhl für Deutsche Sprachwissenschaft

Christopher Kolbeck

BBAW/Deutsches Textarchiv

Susanne Haaf

Lehrstuhl für Wirtschafts- und Sozialgeschichte

Kathrin Pindl

Sprachwissenschaft: Subsyteme

Rechnungs-bücher als

sprachhistor. Quelle

Musterbildung:

Makrostrukturen

und Paratext

Sprachökonomie:

defektive Syntax vs.

optimierte Informationsstruktur

Entwicklung

der Textsorte

„Rechnungs-

bücher“

Sozialer Hintergrund der Schreiber

Verschriftungsstrategien auf

Phonem-Graphem-Ebene

Page 15: Vom Archiv ins WWW – Digitale Korpora und (sprach-)historische Synergien 2.0 (Offene Archive 2.1)

Lehrstuhl für Deutsche Sprachwissenschaft

Christopher Kolbeck

BBAW/Deutsches Textarchiv

Susanne Haaf

Lehrstuhl für Wirtschafts- und Sozialgeschichte

Kathrin Pindl

Das Deutsche Textarchiv

• DFG-Projekt am Zentrum Sprache der BBAW; Partner im CLARIN-D

Verbundprojekt

• Ziel: Bereitstellung der Grundlage für ein Referenzkorpus für die Entwicklung

des Neuhochdeutschen (ca. 1650–1900)

• DTA-Kernkorpus: 1.500 Texte unterschiedlicher Disziplinen und Textsorten

• DTA-Erweiterungen:

Integration historischer Textdaten aus anderen

Projektkontexten (z.B. Regensburger Rechnungsbücher);

Kuration und Zusammenführung verstreuter Textressourcen

Page 16: Vom Archiv ins WWW – Digitale Korpora und (sprach-)historische Synergien 2.0 (Offene Archive 2.1)

Lehrstuhl für Deutsche Sprachwissenschaft

Christopher Kolbeck

BBAW/Deutsches Textarchiv

Susanne Haaf

Lehrstuhl für Wirtschafts- und Sozialgeschichte

Kathrin Pindl

Die DTA-

Werkauswahl

• gedruckte Werke

des 17.–19. Jhs.

• Fachliteratur [von Alchemie bis

Zoologie]

• Gebrauchsliteratur [von Anstandsliteratur bis

Zeitung]

• Belletristik [von Autobiographie bis

Schäferdichtung]

Page 17: Vom Archiv ins WWW – Digitale Korpora und (sprach-)historische Synergien 2.0 (Offene Archive 2.1)

Lehrstuhl für Deutsche Sprachwissenschaft

Christopher Kolbeck

BBAW/Deutsches Textarchiv

Susanne Haaf

Lehrstuhl für Wirtschafts- und Sozialgeschichte

Kathrin Pindl

www.deutschestextarchiv.de

Page 18: Vom Archiv ins WWW – Digitale Korpora und (sprach-)historische Synergien 2.0 (Offene Archive 2.1)

Lehrstuhl für Deutsche Sprachwissenschaft

Christopher Kolbeck

BBAW/Deutsches Textarchiv

Susanne Haaf

Lehrstuhl für Wirtschafts- und Sozialgeschichte

Kathrin Pindl

• Textdigitalisierung im DTA:

– Quellennahe Transkription entsprechend festgelegter Richtlinien

– Strukturelle XML-Annotation nach TEI/P5: DTA-Basisformat

– Linguistische Annotation und orthographische Normierung

– Qualitätssicherung in einer kollaborativen Korrekturumgebung

– Bereitstellung unter freien Lizenzen (CC by-XXX)

• Text-Bild-Ansicht in DTAQ und (nach Qualitätssicherung) auf der DTA-Webseite

• Download in unterschiedlichen Formaten (TEI-XML, HTML, ePub, TCF, CMDI, …)

• OAI-PMH und Fedora Repository

Das Deutsche Textarchiv

Page 19: Vom Archiv ins WWW – Digitale Korpora und (sprach-)historische Synergien 2.0 (Offene Archive 2.1)

Lehrstuhl für Deutsche Sprachwissenschaft

Christopher Kolbeck

BBAW/Deutsches Textarchiv

Susanne Haaf

Lehrstuhl für Wirtschafts- und Sozialgeschichte

Kathrin Pindl

Strukturelle Aufbereitung Gedichte über den

Frühling

Page 20: Vom Archiv ins WWW – Digitale Korpora und (sprach-)historische Synergien 2.0 (Offene Archive 2.1)

Metadaten Das Erdbeben von Lissabon …

http://www.deutschestextarchiv.de/goethe_leben01_1811/66 … in der Wissenschaft

… in der Literatur

Page 21: Vom Archiv ins WWW – Digitale Korpora und (sprach-)historische Synergien 2.0 (Offene Archive 2.1)

Lehrstuhl für Deutsche Sprachwissenschaft

Christopher Kolbeck

BBAW/Deutsches Textarchiv

Susanne Haaf

Lehrstuhl für Wirtschafts- und Sozialgeschichte

Kathrin Pindl

• Textdigitalisierung im DTA:

– Quellennahe Transkription entsprechend festgelegter Richtlinien

– Strukturelle XML-Annotation nach TEI/P5: DTA-Basisformat

– Linguistische Annotation und orthographische Normierung

– Qualitätssicherung in einer kollaborativen Korrekturumgebung

– Bereitstellung unter freien Lizenzen (CC by-XXX)

• Text-Bild-Ansicht in DTAQ und (nach Qualitätssicherung) auf der DTA-Webseite

• Download in unterschiedlichen Formaten (TEI-XML, HTML, ePub, TCF, CMDI, …)

• OAI-PMH und Fedora Repository

Das Deutsche Textarchiv

Page 22: Vom Archiv ins WWW – Digitale Korpora und (sprach-)historische Synergien 2.0 (Offene Archive 2.1)

Lehrstuhl für Deutsche Sprachwissenschaft

Christopher Kolbeck

BBAW/Deutsches Textarchiv

Susanne Haaf

Lehrstuhl für Wirtschafts- und Sozialgeschichte

Kathrin Pindl

Was alles früher

teuer war …

Page 23: Vom Archiv ins WWW – Digitale Korpora und (sprach-)historische Synergien 2.0 (Offene Archive 2.1)

Lehrstuhl für Deutsche Sprachwissenschaft

Christopher Kolbeck

BBAW/Deutsches Textarchiv

Susanne Haaf

Lehrstuhl für Wirtschafts- und Sozialgeschichte

Kathrin Pindl

• Textdigitalisierung im DTA:

– Quellennahe Transkription entsprechend festgelegter Richtlinien

– Strukturelle XML-Annotation nach TEI/P5: DTA-Basisformat

– Linguistische Annotation und orthographische Normierung

– Qualitätssicherung in einer kollaborativen Korrekturumgebung

– Bereitstellung unter freien Lizenzen (CC by-XXX)

• Text-Bild-Ansicht in DTAQ und (nach Qualitätssicherung) auf der DTA-Webseite

• Download in unterschiedlichen Formaten (TEI-XML, HTML, ePub, TCF, CMDI, …)

• OAI-PMH und Fedora Repository

Das Deutsche Textarchiv

Page 24: Vom Archiv ins WWW – Digitale Korpora und (sprach-)historische Synergien 2.0 (Offene Archive 2.1)

Lehrstuhl für Deutsche Sprachwissenschaft

Christopher Kolbeck

BBAW/Deutsches Textarchiv

Susanne Haaf

Lehrstuhl für Wirtschafts- und Sozialgeschichte

Kathrin Pindl

www.deutschestextarchiv.de/dtaq

Page 25: Vom Archiv ins WWW – Digitale Korpora und (sprach-)historische Synergien 2.0 (Offene Archive 2.1)

Lehrstuhl für Deutsche Sprachwissenschaft

Christopher Kolbeck

BBAW/Deutsches Textarchiv

Susanne Haaf

Lehrstuhl für Wirtschafts- und Sozialgeschichte

Kathrin Pindl

www.deutschestextarchiv.de/dtaq

Page 26: Vom Archiv ins WWW – Digitale Korpora und (sprach-)historische Synergien 2.0 (Offene Archive 2.1)

Lehrstuhl für Deutsche Sprachwissenschaft

Christopher Kolbeck

BBAW/Deutsches Textarchiv

Susanne Haaf

Lehrstuhl für Wirtschafts- und Sozialgeschichte

Kathrin Pindl

• Textdigitalisierung im DTA:

– Quellennahe Transkription entsprechend

festgelegter Richtlinien

– Strukturelle XML-Annotation nach TEI/P5:

DTA-Basisformat

– Linguistische Annotation und orthographische

Normierung

– Qualitätssicherung in einer kollaborativen

Korrekturumgebung

– Bereitstellung unter freien Lizenzen (CC by-XXX)

• Text-Bild-Ansicht in DTAQ und (nach Qualitätssicherung)

auf der DTA-Webseite

• Download in unterschiedlichen Formaten (TEI-XML,

HTML, ePub, TCF, CMDI, …)

• OAI-PMH und Fedora Repository

Das Deutsche Textarchiv

Page 27: Vom Archiv ins WWW – Digitale Korpora und (sprach-)historische Synergien 2.0 (Offene Archive 2.1)

Lehrstuhl für Deutsche Sprachwissenschaft

Christopher Kolbeck

BBAW/Deutsches Textarchiv

Susanne Haaf

Lehrstuhl für Wirtschafts- und Sozialgeschichte

Kathrin Pindl

Synergien • Enorme Synergien bei Erschließung, Aufbereitung und Auswertung des

Quellenmaterials

• Erschließung und Aufbereitung: Proaktive Ergänzung der Kompetenzen beider Fachrichtungen bei Digitalisierung, Transkription und Annotation

• Inhaltliche Auswertung – Beispiele:

– Währungseinheiten

– Begriffsbedeutungen

– Wirtschaftliche Veränderungen, die sich sprachlich niederschlagen (z.B. Karre – Kutsche – Auto)

– Soziolinguistische Fragestellungen

– Schreiberbiographien

– etc. etc. etc.?