BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Post on 12-Jan-2016

35 views 0 download

description

BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN. DAS PERSONENDATEN- REPOSITORIUM. ÜBERBLICK. IEINFÜHRUNG Ziele, Projektstruktur, Kooperationen, Arbeitsablauf IIDATENMODELL Personen, Aspekte, Quellen, Identifikatoren IIIANWENDUNG Quellenvergleich, Chronologien, - PowerPoint PPT Presentation

Transcript of BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

BERLIN-BRANDENBURGISCHEAKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

DAS PERSONENDATEN-REPOSITORIUM

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

I EINFÜHRUNGZiele, Projektstruktur,Kooperationen, Arbeitsablauf

II DATENMODELLPersonen, Aspekte,Quellen, Identifikatoren

III ANWENDUNGQuellenvergleich, Chronologien,Geographische Darstellung, Netzwerke

ÜBERBLICK

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

Aufbau einer Architektur zur Vereinigung heterogener Datenbestände

– Erstes Szenario: Repositorium zu Personen des 19. Jahrhunderts– Datenbestände: aus Forschungsvorhaben der Akademie

und von Kooperationspartnern

Freie Verfügbarmachung (Open Source / Open Access)

– Erfassungs-Werkzeug (Archiv-Editor)– Strukturierungs-Werkzeuge (Datumserkennung, Namenerkennung, PND-Abgleich)– Repositorien-Software (basierend auf Fedora Commons)– Daten

Integration in das Wissenschaftsnetzwerk

– Aufbau von Schwester-Repositorien (DHI in Rom, Universität Bamberg)– Vernetzung mit anderen Datenquellen

ZIELE

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

Berlin-Brandenburgische Akademie der Wissenschaften

TELOTA Initiative„The Electronic Life of the Academy“

Personendaten-RepositoriumDFG-Projekt

3 Mitarbeiter, 3 Hilfskräfte07/2009 – 06/2011

PROJEKTSTRUKTUR

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

Datenaustausch mit Forschungsvorhaben der Akademie– Marx-Engels-Gesamtausgabe– Alexander-von-Humboldt-Forschungsstelle– Archiv– Berliner Klassik– Acta Borussica– Wilhelm-von-Humboldt-Briefwechsel– Schleiermacher-Ausgabe– Magazin zur Erfahrungsseelenkunde

Datenaustausch mit anderen Institutionenin Vorbereitung(individuell zu verhandeln: Schnittstellen, Rechte)

Schwester-Repositorien– Deutsches Historisches Institut in Rom / École française de Rome– Universität Bamberg– weitere Kooperationen sind in Vorbereitung

KOOPERATIONEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

ARBEITSABLAUF

Repositorium

Strukturierung

Archiv-EditorRecherche

offeneSchnittstellen

Veröffentlichung(www)

unstrukturierteDaten

Schwester-Repositorien

Kooperations-Partner

strukturierte Daten(XML)

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

ARBEITSABLAUFArchiv-Editor

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

ARBEITSABLAUFIntegration in das Wissensnetzwerk

PDR 2Musici

PDR 1BBAW

PDR 3?

DB

DB

DB

DB

Forscher

Forscher

Forscher

Forscher

Forscher

Forscher

Forscher

Forscher Forscher

Forscher

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

Vorteile eines Repositoriums

– Publikationskontext– integriertes Produkt– Schnittstellen, Administration, Workflow, Oberflächen i.d.R. vorhanden– Grid-Fähigkeit durch SOAP- und REST-Schnittstellen

Evaluation mehrerer Systeme

– DSpace– EPrints– Fedora Commons– Greenstone

publiziert unter: http://edoc.bbaw.de/volltexte/2010/1506/

ARBEITSABLAUFRepositorien-System

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

Fedora-Schnittstellen

– Gfind– REST

Domainspezifische Exportformate

– PND-BEACON– …

nicht unterstützt

– OAI– /.39.50

ARBEITSABLAUFSchnittstellen

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

Das Datenmodell soll folgende Anforderungen erfüllen:

– Personen als Haupteinstiegspunkt– Erfassung unterschiedlicher Beschreibungssysteme– Koordination verschiedener Datenquellen

Das Datenmodell umschließt daher drei zentrale Elemente:

die zu beschreibenden Objekte → Personendie Beschreibungen selbst → Aspektedie Quellen der Beschreibungen → Referenzen

Zusätzlich:

zum Abgleich verschiedener Quellen → Identifikatoren

DATENMODELL

Personen

Aspekte

IDs

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

DATENMODELLPersonen

Personen werden anhand von Aussagen erfasst, die über sie getroffen werden.

Personen tragen ausschließlich die Eigenschaften,die ihr von außen zugeschrieben werden.

Diese Eigenschaften sind in Form von Aussagen zusammengefasst,die hier Aspekte genannt werden.

Person 1

Aspekt 1

Aspekt 2

Aspekt 3

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

DATENMODELLPersonen: Beispiel

Die Person 1 wird hier mit drei Aspekten beschrieben.

Die Aussagen betreffen alle dieselbe Person,jedoch erfassen sie sehr unterschiedliche Eigenschaften.

Ein Aspekte kann also eine fast beliebige Form annehmen.Sein Zweck ist die Beschreibung einer Person.

Person 1

Rudolf Virchow

wurde 1849Professor

in Würzburg

lebte von1821 bis 1902

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

DATENMODELLAspekte

Ein Aspekt ist eine einzelne Aussage zu einer Person.

Ein Aspekt kann verschiedenste Informationen beinhalten.

Die Einheit aus diesen Informationen ergibt zusammen einen Aspekt.

Ort

Zeit

Referenzen

Klassifikation

Beziehungen

QuelltextAspekt

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

DATENMODELLAspekte: Beispiel

Aspekt 1→ Beziehung = Person 1→ Quelltext = Virchow, Rudolf→ Klassifikation = Name, normiert

Aspekt 2→ Beziehung = Person 1→ Quelltext = 1849 Professor in Würzburg→ Klassifikation = Beruf→ Zeit = 1849→ Ort = Würzburg

Aspekt 3→ Beziehung = Person 1→ Quelltext = 1821–1902→ Klassifikation = Lebensdaten→ Zeit = von 1821 bis 1902

Person 1

Rudolf Virchow

wurde 1849Professor

in Würzburg

lebte von1821 bis 1902

Ort

Zeit

Referenzen

Klassifikation

Beziehungen

QuelltextAspekt

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

DATENMODELLAspekte: Beispiel

Beispiel: Aspekt in XML-Ansicht

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

DATENMODELLIdentifikatoren

Identifikatoren ...– geben jeder Person eine eindeutige Nummer– werden von Institutionen festgelegt (in der Regel von Nationalbibliotheken)– wurden zunächst nur im Zusammenhang mit Publikationen vergeben– werden zusammen mit Personeninformationen geführt (Namen, Lebensdaten, etcetera)

Verbreitete Identifikationssysteme– BNF (Bibliothèque nationale de France)– LCCN (Library of Congress Control Number)– ICCU (Istituto Centrale per il Catalogo Unico)– PeEnDe (Wikipedia)– PND (Personennormdatei)

Beispiele– http://errol.oclc.org/laf/n%20%2080158647.html– http://d-nb.info/gnd/11861116X– http://d-nb.info/gnd/140116176– http://catalogue.bnf.fr/ark:/12148/cb14564447j/PUBLIC

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

DATENMODELLIdentifikatoren

Wenn Informationen zu einer Person aus verschiedenen Quellen stammen,kann die Identität dieser Personenobjektemithilfe von Identifikatoren festgehalten werden.

In der Skizze sind drei Personenobjekte zu sehen.Zwei davon sind über die ID 1 als identisch erkennbar.

P1

P2

P3

ID 1ID 1

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

DATENMODELLIdentifikatoren

Durch die Integration verschiedener Systeme(z.B. PND, LCCN, VIAF) können Identitäten erschlossen werden.

In der Skizze wird durch einen Identifikator aus einem anderen Systemdie Identität der Personenobjekte P2 und P3 hergestellt– und dadurch auch die Identität von P1 und P3.

P1

P2

P3

ID 1 ID 1 ID 1ID 1

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

Quelle 1: Acta Borussica (AB), Band 8Virchow, Rudolf (1821–1902), Dr. med. Berlin, 1846 Priv.-Doz. Berlin, 1849 Prof. Würzburg, 1856 Berlin, Leiter Patholog. Institut der Charité, Begründer der path. Anatomie u. der Zellularpathologie, einflußreich in Hygiene- und Sozialpolitik, zeitw. Berliner Stadtverordneter, 1880–93 MdR (DFP, DFsP), 1862–1902 MdA (DFP, DFsP, FsVP), 1891 große Goldene Medaille für Wissenschaft u. Berliner Ehrenbürger, 1895 Kommandeurkreuz der franz. Ehrenlegion.

ANWENDUNGBeispiel

Quelle 2: Marx-Engels-Gesamtausgabe (MEGA), Band III/11Virchow, Rudolf (1821–1902) deutscher Pathologe und Anthropologe; 1861 ein Gründer und Führer der Deutschen Fortschrittspartei; Mitglied des preußischen Abgeordnetenhauses (1862–1902) und des Deutschen Reichstags (1880–1893).

Quelle 3: Altmitgliederverzeichnis der BBAW (Archiv der BBAW)Rudolf Virchow, *13.10.1821 Schievelbein/Pomm., +05.09.1902 Berlin. 1846 Prosektor an der Charité in Berlin. 1849 Professor an der Universität in Würzburg. 1856 Professor für Anatomie und Pathologie an der Universität in Berlin und Direktor des Pathologischen Instituts. 1892-1893 Rektor. 1898 Helmholtz-Medaille der Akademie. Geh. Medizinalrat.

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

Aspekt 1 Klassifikation = NameText = Rudolf VirchowQuelle= AB 8

Aspekt 2 Klassifikation = BerufText = Leiter Patholog. Institut d. CharitéQuelle = AB 8

ANWENDUNGBeispiel: Zerlegung in Aspekte

Aspekt 3 Klassifikation = NameText = Rudolf VirchowQuelle = MEGA III/11

Aspekt 4 Klassifikation = TätigkeitText = deutscher Pathologe und AnthropologeQuelle = MEGA III/11

Aspekt 5 ...

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

ANWENDUNGQuellenvergleich

Abfrage:

„Alle Berufe oder Tätigkeiten einer Person mit dem Namen Rudolf Virchow“

Ergebnis:

# TextQuelle

1. Begründer d. patholog. Anatomie u. d. Zellularpathologie AB 82. Begründer der Zellularpathologie MEGA III/113. deutscher Pathologe und Anthropologe MEGA III/114. Direktor des Pathologischen Instituts Archiv5. Leiter Patholog. Institut d. Charité AB 86. Prosektor an der Charité in Berlin Archiv...

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

ANWENDUNGChronologien

Abfrage:

„Alle Aspekte mit einer Zeitangabe zu einer Person mit dem Namen Rudolf Virchow“

Ergebnis (Seite 2):

AB 8 1856 Berlin, Leiter Patholog. Institut der CharitéBegründer der path. Anatomie u. der Zellularpathologieeinflußreich in Hygiene- und Sozialpolitikzeitw. Berliner Stadtverordneter

Archiv 1856 Professor für Anatomie und Pathologie an der Universität in Berlin

Direktor des Pathologischen InstitutsMEGA III/11 1861 ein Gründer und Führer der Deutschen FortschrittsparteiAB 8 1862–1902 MdA (DFP, DFsP, FsVP)MEGA III/11 1862–1902 Mitglied des preußischen Abgeordnetenhauses

[...]

Aufgrund von Divergenz und unterschiedlicher Schärfe eröffnen sich aber auch neue Fragen.

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

ANWENDUNGChronologien: Similie Timeline

Visualisierung mithilfe von Simile Timeline

– frei verfügbares Produkt des Massachusetts Institute of Technology – Abbildung von Zeitpunkten und Zeiträumen auf einer Zeitleiste – individuell konfigurierbar

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

ANWENDUNGGeographische Darstellung

Nutzung von interaktiven Karten

Verknüpfung mit historischen Karten

Abbildung der Niederlassungen bestimmter Berufszweige auf historischen Stadtplänen

Abbildung von Reisewegen und Migrationsströmenauf historischen Gebietskarten

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

ANWENDUNGGeographische Darstellung

Durch Kombination von Landkarte und Zeitleistekönnen Aspekte gleichzeitig in ihren zeitlichen und inihren räumlichen Dimensionen visualisiert werden.Auch die Kombination mit historischen Karten ist möglich.

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

ANWENDUNGGeographische Darstellung: Google timemap

Visualisierung mit Google timemap

Beispiel: Fallmerayer-Briefwechsel

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

ANWENDUNGNetzwerk-Visualisierung

Die Auswertung von Beziehungs-aspekten ermöglicht dieUntersuchung von Netzwerken.

Für die Erforschung von Wissenschafts-netzwerken sind z.B. Briefkontakteeine besonders ergiebige Quelle(wer schrieb wie häufig worüber an wen).

Aber auch die Auswertung von z.B.Kontenbüchern ist denkbar, umHandelsnetzwerke sichtbar zu machen.

Die Daten können sowohl qualitativals auch quantitativ ausgewertet werden.

Brief an P3

einseitiger KontaktBrief an P2

Brief an P3

Brief an P2

Brief an P3 Brief an

P1Brief an

P3 Brief an P1

intensiver Kontakt

sporadischer Kontakt

P1

P3

P2

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

ANWENDUNGNetzwerk-Visualisierung: Protovis

Visualisierung mit Protovis

Beispiel: Physiker-Netzwerk

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

ABSCHLIEßENDE HINWEISE

weitere Informationen

Projektwebsite http://pdr.bbaw.de

Nachrichtendienst Twitterhttp://twitter.com/persdatrep

Ansprechpartner Torsten Roederroeder@bbaw.de

Termine 2010

2.–6. NovemberJahrestagung der GfM 2010Deutsches Historisches Institut in RomÉcole française de Rome