Multilinguale Verknüpfungen in der GND aus dem MACS Projekt … · • Anreicherung der...

50
| Helga Karg | MACS-Verknüpfungen in der GND | Wien 2015 1 Multilinguale Verknüpfungen in der GND aus dem MACS – Projekt

Transcript of Multilinguale Verknüpfungen in der GND aus dem MACS Projekt … · • Anreicherung der...

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015 1

Multilinguale Verknpfungen in der GND

aus dem MACS Projekt

1. MACS - Multilingual Access to Subjects

2. Historie

3. Methodik der Verknpfung

4. Integration in die GND

5. Ausblick

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

Gliederung

2

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

RAMEAU Rpertoire d'autorit-matire encyclopdique et alphabtique unifi

LCSH Library of Congress Subject Headings

SWD Schlagwortnormdatei

MACS - Multilingual ACces to Subjects -

>> GND Gemeinsame Normdatei

3

Schaffung einer Sprachgrenzen berschreitenden sachlichen

Suche in Bibliothekskatalogen im deutsch-, englisch- und

franzsischsprachigen Raum durch eine unmittelbare Verbindung

zwischen den Sachschlagwrtern der drei etablierten

umfassenden Indexierungsvokabulare

Projekttrger CENL

Conference of European National Librarians

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

Projektpartner

Bibliothque nationale de France

British Library

Schweizerische Nationalbibliothek

Deutsche Nationalbibliothek

4

Projektleitung Patrice Landry

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015 5

Ziele der Verknpfung auf Normdatenebene

Sprachunabhngige Suche ber mehrsprachiges Abfragevokabular (englisch, franzsisch, deutsch) im eigenen Katalog

Qualifizierte Suche, ohne die Regeln der fremden Erschlieungsinstrumente kennen zu mssen

Ausweitung der Recherche vom eigenen Portal aus auf andere Kataloge und umgekehrt (z.B.: The European Library)

Anreicherung der Erschlieung durch Fremddaten von LoC, BL oder BnF

Potential fr eine automatische Generierung von GND-Schlagwortfolgen aus Fremddaten (z.B.: Umsetzung des Crosswalks zum Standardthesaurus Wirtschaft STW )

Nutzung englischer und franzsischer quivalente als Wrterbuchfunktion zur automatischen Indexierung fremdsprachiger Dokumente

Titel in DNB - deutsch - fremdsprachig

Titel in BnF - franzsisch - fremdsprachig

Titel in BL Titel in LoC - englisch - fremdsprachig

....

MACS GND RAMEAU LCSH

Recherche

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

Suchterm

6

Su

ch

term

rztlicher Behandlungsfehler

GN

D

rztlicher Kunstfehler

BF: rztlicher Behandlungsfehler

LC

SH

Medical errors

RA

MEA

U

Erreurs mdicales

Dokumente in: DNB 144 BL 127 BnF 55

LoC 341 SNB usw. .......

Multilinguale Schlagwortsuche

1. MACS - Mulitlingual Access to Subjects

2. Historie

3. Methodik der Verknpfung

4. Integration in die GND

5. Ausblick

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

Gliederung

8

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

Projektentwicklung Historie

1997 - 1999 Projektkonzeption und Machbarkeitsstudie

2000 - 2001 Prototyp mit den Funktionen eines Link-Management-Systems sowie eines Retrievalsystems

2002 2004 Produktivnahme der Datenbasis mit einer Liste aus Sachschlagwortprchen zwischen Rameau und LCSH

Beginn mit Tests zur Verlinkung in den Bereichen Sport und Theater

2007 Beginn mit der Verlinkung ber alle Wissensgebiete (Schweizer NB / DNB) und Weiterentwicklung der Datenbank

Update-Routine fr LCSH und RAMEAU

2007 Beginn der Tests zur Integration in The European Library (TEL)

2009-2010 Linkerstellung in DNB im Rahmen des CrissCross-Projektes

2012-2013 Integration der 1:1 Verlinkungen in die GND

9

Link-Management-Interface - LMI

Anzahl der Links pro Sprache

Vorzugsbenennungen und Identifiers

Sachschlagwrter

GND-Systematiknummern zum GND-Schlagwort

Update-Routine

Manuelles Update der Schlagwrter

Links werden bearbeitet und neu erstellt

MACS-Identifier

MACS-Domains

Recherche der Schlagwrter in Listenfunktion

Historienverwaltung bei der Linkbearbeitung

Kommunikation der Bearbeiter ber ein Bemerkungsfeld Annotations

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015 10

LMI als Arbeitsdatenbank Suchfenster fr die Suche in der Schlagwortliste

11 | Helga Karg

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

Anzeige des Schlagworts mit der Anzahl der Links

Kurzanzeige des Links

12

Bearbeitungsmaske

13 | Helga Karg

14

LM

I -

Dom

ain

s

| Helga Karg

1. MACS - Mulitlingual Access to Subjects

2. Historie

3. Methodik der Verknpfung

4. Integration in die GND

5. Ausblick

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

Gliederung

15

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

Herausforderung der Verknpfung von Schlagwortsprachen

Divergierende methodische Grundlagen - Regelwerke der Schlagwortsprachen -

Linguistische Besonderheiten der jeweiligen Sprache und die daraus resultierende Ansetzungspraxis fr Schlagwrter

Tradierte Gepflogenheiten

Universalitt des Vokabulars (Schlagwrter aller Wissensgebiete - Disambiguierung)

Anlassbezogene Erstellung des Vokabulars

Unterschiedliche Ausbildung der semantischen Beziehungen

Technische Rahmenbedingungen

16

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

Suche nach dem quivalent

Ausschlaggebend ist der Begriffsumfang des Schlagworts, nicht die Bedeutung der Bezeichnung in der natrlichen Sprache

Verifizierung des Bedeutungsumfangs der Schlagwrter:

berprfung der Schlagwrter in der Originaldatenbank

Quellenangabe, Definition, Verwendungshinweise Hierarchische Einbettung Semantisches Umfeld Titelverknpfungen

17

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

Festlegungen fr die Vorgehensweise bei der Verlinkung

Verlinkung von Sachschlagwrtern Einbezug eines quivalenten Schlagworts einer anderen Kategorie aber mglich

Verknpfungsrichtung GND = Ausgangssprache LCSH / RAMEAU = Zielsprache

Gleichwertigkeit der beteiligten Schlagwortsprachen: Suche nach der grtmglichen semantischen Nhe ohne besondere Kennzeichnung des Grades der bereinstimmung

Mapping auch auf Schlagwortkombinationen

Methodische Grundlagen: - British Standard for Structured vocabularies for information retrieval BS 8723 Part 4 Interoperability between vocabularies - MACS-Handbuch

18

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

1. Verknpfung von Einzelschlagwrtern und prkoordinierten Schlagwrtern aus GND, RAMEAU und LCSH

GND RAMEAU LCSH

Kurzstreckenlauf

Adjektiv

Abenteuerreise

Course de vitesse

Adjectifs

Tourisme daventure

Sprinting

Grammar,

Comparative

and general

Adjective

Adventure travel

Typen von Verlinkungen

19

Typen von Verlinkungen

2. Verknpfung zwischen einem Einzelschlagwort und zwei oder

mehreren Schlagwrtern der anderen Sprache in einem Link,

sogenannte And-Verknpfung

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

GND RAMEAU LCSH

Leichtathletiktrainer Abstandsmessung

Athltisme AND Entaneurs Mesure AND Distances

Track and field coaches Distances Measurement

20

Typen von Verlinkungen

3. Verknpfung von einem Einzelschlagwort zu mehreren Schlagwrtern

der anderen Sprachen in mehreren Links,

sogenannte Oder-Verknpfung

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

GND RAMEAU LCSH

bersetzer

Dolmetscher

Traducteurs

Employ pour : Interprtes Traducteurs-interprtes

Translators

Used For: Interpreters

21

Typen von quivalenzen

Exakte quivalenz

zwischen Einzelschlagwrtern

zu prkoordinierten Schlagwrtern

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

GND RAMEAU LCSH

Spurenelementstoffwechsel

Fabeltier

Oligolments --

Mtabolisme

Animaux fabuleux

Trace elements --

Metabolism

Animals, Mythical

22

Typen von quivalenzen

Inexakte quivalenz

zwischen Schlagwrtern, deren Begriffsumfang nicht vollstndig deckungsgleich ist, aber so stark berlappt, dass ein gutes Retrievalergebnis erzielt wird.

Zum Bsp.: Bei bereinstimmung der Verweisungsform eines Schlagworts in RAMEAU und/oder LCSH

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

GND RAMEAU LCSH

Keller

Langstreckenlufer

Sous-sols Employ pour: Caves

Coureurs Employ pour: Coureurs de fond

Basements Used for: Cellars

Long-distance runners

23

Inexakte quivalenz

Verlinkungen von zwei oder mehr verwandten Schlagwrtern auf ein

Schlagwort, dass die Begriffe in einem Normdatensatz vereint

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

Typen von quivalenzen

24

GND RAMEAU LCSH

Imperialismus

Neokolonialismus

Expansionspolitik

Imprialisme

Employ pour:

Nocolonialisme

..

Expansionnisme

Politique expansionniste

Politique imprialiste

Imperialism

Used for:

Neocolonialism

Inexakte quivalenz

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

Typen von quivalenzen

GND RAMEAU LCSH

Heilung

BF Heilen

BF Krankenheilung

VB Genesung

Genesung

BF Rekonvaleszenz

BF Gesundung

BF Gesundungsprozess

BF Genesungsprozess

VB Heilung

Gurison

Employ pour :

Gurison des malades

Gurison des maladies

Malades -- Gurison

Maladies -- Gurison

Gurison

Healing

--

25

Typen von quivalenzen

Partielle quivalenz zu Schlagwrtern mit grsserem

Begriffsumfang

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

GND RAMEAU LCSH

Langstreckenlufer Coureurs

Employ pour:

Coureurs de fond

Long-distance runners

Dativ Cas (linguistique) Employ pour: Accusatif Datif

--

26

Link fr die exakte quivalenz

Kasus Cas (linguistique)

Grammar, Comparative and general -- Case

Partielle quivalenz zu Schlagwrtern mit engerem Begriffsumfang

Eine Verknpfung erfolgt nur, wenn keine exakte quivalenz hergestellt

werden kann

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

Typen von quivalenzen

GND RAMEAU LCSH

Mercedes

Mercedes

Analogie

Analogie

Analogie

Mercedes (automobiles) Mercedes-Benz (camions)

Analogie (philosophie)

Analogie (religion)

Analogie (linguistique)

Mercedes automobile Mercedes-Benz trucks

Analogy

Analogy (Religion)

Analogy (Linguistics)

27

Vorsicht bei partiellen quivalenzen!

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

Grundsatz: Keine Verknpfung zum engeren / weiteren RAMEAU oder LCSH, wenn die exakte quivalent weder Ansetzungsform ist noch als Synonymverweisung im Normdatensatz gefhrt wird. Also nicht:

GND: Saturationskernmagnetometer RAMEAU: Magntomtres

GND: Basilisk RAMEAU: Animaux fabuleux

Aber: Fabeltier -- Animaux fabuleux -- Animals, Mythical

Basilisk -- Basilisk (Mythical animals)

Ausnahme: Die Verlinkung ist zulssig, wenn sich erweist, dass es eine angemessene Anzahl Titel zum engeren Thema unter dem weiteren Begriff gibt. Byzantinische Liturgie -- Eglises orientales Liturgie -- Eastern churches - Liturgie

28

quivalenzen mit kombinierten GND-Schlagwrtern

Bei Vorhandensein von Hinweisdatenstzen in der GND

quivalenzen mit kombinierten RAMEAU-Schlagwrtern

Hauptschlagwort + Subdivision mit eigenem Datensatz

Hauptschlagwort + Subdivision ohne eigenem Datensatz hier erfolgt die

Verknpfung nur, wenn regelgerecht und Literatur in BnF vorhanden ist

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

Typen von quivalenzen

29

GND RAMEAU LCSH

Experiment AND Archologie

Hinweissatz:

Experimentelle Archologie

benutze Kombination: Experiment / Archologie.

Archologie experimentale

Experimental Archaeology

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

Achtung Problem nicht exakter Verlinkungen zwischen LCSH-Schlagwrtern und RAMEAU, die in der Datenbasis bereits vorhanden sind! Vorsicht bei inexakten quivalenzen:

GND RAMEAU LCSH

Langstreckenlufer Coureurs

Employ pour:

Coureurs de fond

Runners (Sports)

?

30

Long-distance runners

| Helga Karg

Mapping zwischen GND-Sachschlagwrtern und DDC-Notationen,

den beiden Erschlieungsinstrumenten der DNB

fr eine integrierte Recherche ber heterogen erschlossene Bestnde

Anreicherung des Suchvokabulars der DDC (Dewey Dezimal Klassifikation)

in WebDewey Deutsch durch GND-Sachschlagwrter-Mappings

Teilprojekt: MACS-Verlinkungen

Projektpartner: Fachhochschule Kln Deutsche Nationalbibliothek Projektfrderer: Deutsche Forschungsgemeinschaft

CrissCross

31

Weitere Projektentwicklung in DNB 2009 2010 MACS-Rapid Verlinkung der 40.000 most used GND-SachSWW im Rahmen des CrissCross-Projektes

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

CrissCross Verlinkungsgrundstze

Verknpfungsrichtung GND DDC

One-to-many Mapping

Deep-Level Mapping = Prinzip der engen DDC-Notation (analog enges SW)

Determiniertheiten in 4 Graden = Grad der bereinstimmung zwischen Schlagwort und DDC-Notation

Umsetzung - Verankerung am Datensatz in der GND

Aktualisierung durch DDC-Notationenhistorie am GND-Normdatensatz

32

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

Det 4 = Vollstndige thematische bereinstimmung Det 3 = Wesentliche bereinstimmung Det 2 = Teilweise bereinstimmung Det 1 = Geringe bereinstimmung

4 4

3 3

3 3

3 3 3 3

1 1

1 1

1 1 1 1

2 2

2 2

2 2 2 2

Determiniertheitsgrade

33

Mapping-Beispiel

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

GND

DDC-Notation - Notationsberschrift

Determiniertheit

Arbeitsbedingung

BF

Arbeitssituation

Arbeit$xBedingung

Arbeitsbedingung

LCSH:

Work environment

RAMEAU:

Conditions de travail

331.2 Arbeitsbedingungen Arbeitskonomie

344.01 Arbeitsbedingungen Recht

658.312 Arbeitsbedingungen Personalmanagement

http://d-nb.info/gnd/4002641-3

Det 4

Det 2

Det 3

34

http://d-nb.info/gnd/4002641-3http://d-nb.info/gnd/4002641-3http://d-nb.info/gnd/4002641-3http://d-nb.info/gnd/4002641-3http://d-nb.info/gnd/4002641-3http://d-nb.info/gnd/4002641-3

MACS-Rapid

Verlinkung der 40.000 most used GND-Sachschlagwrter

Linkerstellung durch Fachbersetzer

Vorgehensweise nach den MACS-Grundstzen

Arbeitsdatenbank: LMI

Informationsbasis:

Normdatenbanken GND, RAMEAU und LCSH

Bibliothekskataloge DNB, KVK, BnF und LoC

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015 35

1. MACS - Mulitlingual Access to Subjects

2. Historie

3. Methodik der Verknpfung

4. Integration in die GND

5. Ausblick

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

Gliederung

36

Integration in die GND

Integration im Normdatensatz versus eigener Normdaten

Eigene Crosskonkordanz-Datenstze [Tc-Stze]

Integration im Normdatensatz

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015 37

Vorteil: gesonderter Datenraum Gleichbehandlung mit den monolingualen Links zum Wirtschaftsthesaurus

Vorteil: internationales Datenfeld in MARC21 mit entsprechender Unterfeldstruktur direkte Verfgbarkeit fr die Recherche Sichtbarkeit fr alle GND-Nutzer

Nachteil: nur Tupel knnen dargestellt werden keine Mglichkeit, bei Mehrfach-Verlinkungen die Tripel zu identifizieren

Integration in die GND

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015 38

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

MARC21 Feld 750

750$a Ansetzungsform des Schlagworts

750$x Weiterer Term bei zusammengesetzten Begriffen

750$u URI des Schlagworts - Hyperlink

750$S Institutionen Code LoC / BnF

750$0 Identifikationsnummer des Thesaurus-Terms

750$2 Thesaurus Field Name LCSH / RAMEAU

750$v Bemerkungen MACS-Mapping Bitte keine nderungen vornehmen

39

Portalanzeige der DNB

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015 40

Normdatenstze in den Originaldatenbanken LCSH

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015 41

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

Normdatenstze in den Originaldatenbanken RAMEAU

42

Integration 1:1 Mappings in die GND

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015 43

41.442 GND-Datenstze wurden angereichert

95% haben die Schlagwortverknpfungen aus einem MACS-Link

5% haben zwischen 1-8 MACS-Links

Verteilung der Links ber die Wissensgebiete anhand der GND-Systematik

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

0

500

1000

1500

2000

2500

3000

3500

4000

4500

5000

Verteilung ber die Fachgebiete

1. MACS - Mulitlingual Access to Subjects

2. Historie

3. Methodik der Verknpfung

4. Integration in die GND

5. Ausblick

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

Gliederung

45

Weitere Arbeitsschritte

berprfung der in der GND vorhanden Links und Fortfhrung der Verlinkungsarbeit

Links als LoD

Integration der 1: n Mappings in die GND

Nutzung der Verlinkungen fr die maschinelle Erschlieung fremdsprachiger Publikationen

Nutzung von Fremddaten zur Generierung deutschsprachiger Sucheinstiege entsprechend dem Modell der Crosskonkordanz zum Standardthesaurus Wirtschaft

Redaktionsverfahren fr die Beteiligung der Verbundpartner an der MACS-Arbeit

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015 46

Crosskonkordanzdatensatz in der DNB

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

005 Tc 011 cs 065 10.11e 069 V.10.02 190 !042089409!Preisdifferenzierung 680 neu 750 Preisstreuung$SZBW$029841-2$2STW 981 vb

Relationen: bf, ob, ub, vb, 0

47

pica3://cbs.dnb.de:1035,1,66064/?/zoe+/12+042089409

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015

Fremddatennutzung

48 http://d-nb.info/973571691

Erschlieung englischsprachiger Publikationen

Einsatz fr die maschinelle Beschlagwortung englischsprachiger Publikationen

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015 49

Englisch-sprachige Publikation

Maschinelle Extraktion relevanter englischer Terme

Abgleich mit LCSH

GND-Schlagwrter durch MACS-Verlinkung

Vielen Dank fr Ihr Interesse

| Helga Karg | MACS-Verknpfungen in der GND | Wien 2015 50

[email protected]