BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

31
Oktober 2010 Personendaten-Repositorium DFG-Projekt BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

description

BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN. DAS PERSONENDATEN- REPOSITORIUM. ÜBERBLICK. IEINFÜHRUNG Ziele, Projektstruktur, Kooperationen, Arbeitsablauf IIDATENMODELL Personen, Aspekte, Quellen, Identifikatoren IIIANWENDUNG Quellenvergleich, Chronologien, - PowerPoint PPT Presentation

Transcript of BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Page 1: BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

BERLIN-BRANDENBURGISCHEAKADEMIE DER WISSENSCHAFTEN

Page 2: BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

DAS PERSONENDATEN-REPOSITORIUM

Page 3: BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

I EINFÜHRUNGZiele, Projektstruktur,Kooperationen, Arbeitsablauf

II DATENMODELLPersonen, Aspekte,Quellen, Identifikatoren

III ANWENDUNGQuellenvergleich, Chronologien,Geographische Darstellung, Netzwerke

ÜBERBLICK

Page 4: BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

Aufbau einer Architektur zur Vereinigung heterogener Datenbestände

– Erstes Szenario: Repositorium zu Personen des 19. Jahrhunderts– Datenbestände: aus Forschungsvorhaben der Akademie

und von Kooperationspartnern

Freie Verfügbarmachung (Open Source / Open Access)

– Erfassungs-Werkzeug (Archiv-Editor)– Strukturierungs-Werkzeuge (Datumserkennung, Namenerkennung, PND-Abgleich)– Repositorien-Software (basierend auf Fedora Commons)– Daten

Integration in das Wissenschaftsnetzwerk

– Aufbau von Schwester-Repositorien (DHI in Rom, Universität Bamberg)– Vernetzung mit anderen Datenquellen

ZIELE

Page 5: BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

Berlin-Brandenburgische Akademie der Wissenschaften

TELOTA Initiative„The Electronic Life of the Academy“

Personendaten-RepositoriumDFG-Projekt

3 Mitarbeiter, 3 Hilfskräfte07/2009 – 06/2011

PROJEKTSTRUKTUR

Page 6: BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

Datenaustausch mit Forschungsvorhaben der Akademie– Marx-Engels-Gesamtausgabe– Alexander-von-Humboldt-Forschungsstelle– Archiv– Berliner Klassik– Acta Borussica– Wilhelm-von-Humboldt-Briefwechsel– Schleiermacher-Ausgabe– Magazin zur Erfahrungsseelenkunde

Datenaustausch mit anderen Institutionenin Vorbereitung(individuell zu verhandeln: Schnittstellen, Rechte)

Schwester-Repositorien– Deutsches Historisches Institut in Rom / École française de Rome– Universität Bamberg– weitere Kooperationen sind in Vorbereitung

KOOPERATIONEN

Page 7: BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

ARBEITSABLAUF

Repositorium

Strukturierung

Archiv-EditorRecherche

offeneSchnittstellen

Veröffentlichung(www)

unstrukturierteDaten

Schwester-Repositorien

Kooperations-Partner

strukturierte Daten(XML)

Page 8: BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

ARBEITSABLAUFArchiv-Editor

Page 9: BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

ARBEITSABLAUFIntegration in das Wissensnetzwerk

PDR 2Musici

PDR 1BBAW

PDR 3?

DB

DB

DB

DB

Forscher

Forscher

Forscher

Forscher

Forscher

Forscher

Forscher

Forscher Forscher

Forscher

Page 10: BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

Vorteile eines Repositoriums

– Publikationskontext– integriertes Produkt– Schnittstellen, Administration, Workflow, Oberflächen i.d.R. vorhanden– Grid-Fähigkeit durch SOAP- und REST-Schnittstellen

Evaluation mehrerer Systeme

– DSpace– EPrints– Fedora Commons– Greenstone

publiziert unter: http://edoc.bbaw.de/volltexte/2010/1506/

ARBEITSABLAUFRepositorien-System

Page 11: BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

Fedora-Schnittstellen

– Gfind– REST

Domainspezifische Exportformate

– PND-BEACON– …

nicht unterstützt

– OAI– /.39.50

ARBEITSABLAUFSchnittstellen

Page 12: BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

Das Datenmodell soll folgende Anforderungen erfüllen:

– Personen als Haupteinstiegspunkt– Erfassung unterschiedlicher Beschreibungssysteme– Koordination verschiedener Datenquellen

Das Datenmodell umschließt daher drei zentrale Elemente:

die zu beschreibenden Objekte → Personendie Beschreibungen selbst → Aspektedie Quellen der Beschreibungen → Referenzen

Zusätzlich:

zum Abgleich verschiedener Quellen → Identifikatoren

DATENMODELL

Personen

Aspekte

IDs

Page 13: BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

DATENMODELLPersonen

Personen werden anhand von Aussagen erfasst, die über sie getroffen werden.

Personen tragen ausschließlich die Eigenschaften,die ihr von außen zugeschrieben werden.

Diese Eigenschaften sind in Form von Aussagen zusammengefasst,die hier Aspekte genannt werden.

Person 1

Aspekt 1

Aspekt 2

Aspekt 3

Page 14: BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

DATENMODELLPersonen: Beispiel

Die Person 1 wird hier mit drei Aspekten beschrieben.

Die Aussagen betreffen alle dieselbe Person,jedoch erfassen sie sehr unterschiedliche Eigenschaften.

Ein Aspekte kann also eine fast beliebige Form annehmen.Sein Zweck ist die Beschreibung einer Person.

Person 1

Rudolf Virchow

wurde 1849Professor

in Würzburg

lebte von1821 bis 1902

Page 15: BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

DATENMODELLAspekte

Ein Aspekt ist eine einzelne Aussage zu einer Person.

Ein Aspekt kann verschiedenste Informationen beinhalten.

Die Einheit aus diesen Informationen ergibt zusammen einen Aspekt.

Ort

Zeit

Referenzen

Klassifikation

Beziehungen

QuelltextAspekt

Page 16: BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

DATENMODELLAspekte: Beispiel

Aspekt 1→ Beziehung = Person 1→ Quelltext = Virchow, Rudolf→ Klassifikation = Name, normiert

Aspekt 2→ Beziehung = Person 1→ Quelltext = 1849 Professor in Würzburg→ Klassifikation = Beruf→ Zeit = 1849→ Ort = Würzburg

Aspekt 3→ Beziehung = Person 1→ Quelltext = 1821–1902→ Klassifikation = Lebensdaten→ Zeit = von 1821 bis 1902

Person 1

Rudolf Virchow

wurde 1849Professor

in Würzburg

lebte von1821 bis 1902

Ort

Zeit

Referenzen

Klassifikation

Beziehungen

QuelltextAspekt

Page 17: BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

DATENMODELLAspekte: Beispiel

Beispiel: Aspekt in XML-Ansicht

Page 18: BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

DATENMODELLIdentifikatoren

Identifikatoren ...– geben jeder Person eine eindeutige Nummer– werden von Institutionen festgelegt (in der Regel von Nationalbibliotheken)– wurden zunächst nur im Zusammenhang mit Publikationen vergeben– werden zusammen mit Personeninformationen geführt (Namen, Lebensdaten, etcetera)

Verbreitete Identifikationssysteme– BNF (Bibliothèque nationale de France)– LCCN (Library of Congress Control Number)– ICCU (Istituto Centrale per il Catalogo Unico)– PeEnDe (Wikipedia)– PND (Personennormdatei)

Beispiele– http://errol.oclc.org/laf/n%20%2080158647.html– http://d-nb.info/gnd/11861116X– http://d-nb.info/gnd/140116176– http://catalogue.bnf.fr/ark:/12148/cb14564447j/PUBLIC

Page 19: BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

DATENMODELLIdentifikatoren

Wenn Informationen zu einer Person aus verschiedenen Quellen stammen,kann die Identität dieser Personenobjektemithilfe von Identifikatoren festgehalten werden.

In der Skizze sind drei Personenobjekte zu sehen.Zwei davon sind über die ID 1 als identisch erkennbar.

P1

P2

P3

ID 1ID 1

Page 20: BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

DATENMODELLIdentifikatoren

Durch die Integration verschiedener Systeme(z.B. PND, LCCN, VIAF) können Identitäten erschlossen werden.

In der Skizze wird durch einen Identifikator aus einem anderen Systemdie Identität der Personenobjekte P2 und P3 hergestellt– und dadurch auch die Identität von P1 und P3.

P1

P2

P3

ID 1 ID 1 ID 1ID 1

Page 21: BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

Quelle 1: Acta Borussica (AB), Band 8Virchow, Rudolf (1821–1902), Dr. med. Berlin, 1846 Priv.-Doz. Berlin, 1849 Prof. Würzburg, 1856 Berlin, Leiter Patholog. Institut der Charité, Begründer der path. Anatomie u. der Zellularpathologie, einflußreich in Hygiene- und Sozialpolitik, zeitw. Berliner Stadtverordneter, 1880–93 MdR (DFP, DFsP), 1862–1902 MdA (DFP, DFsP, FsVP), 1891 große Goldene Medaille für Wissenschaft u. Berliner Ehrenbürger, 1895 Kommandeurkreuz der franz. Ehrenlegion.

ANWENDUNGBeispiel

Quelle 2: Marx-Engels-Gesamtausgabe (MEGA), Band III/11Virchow, Rudolf (1821–1902) deutscher Pathologe und Anthropologe; 1861 ein Gründer und Führer der Deutschen Fortschrittspartei; Mitglied des preußischen Abgeordnetenhauses (1862–1902) und des Deutschen Reichstags (1880–1893).

Quelle 3: Altmitgliederverzeichnis der BBAW (Archiv der BBAW)Rudolf Virchow, *13.10.1821 Schievelbein/Pomm., +05.09.1902 Berlin. 1846 Prosektor an der Charité in Berlin. 1849 Professor an der Universität in Würzburg. 1856 Professor für Anatomie und Pathologie an der Universität in Berlin und Direktor des Pathologischen Instituts. 1892-1893 Rektor. 1898 Helmholtz-Medaille der Akademie. Geh. Medizinalrat.

Page 22: BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

Aspekt 1 Klassifikation = NameText = Rudolf VirchowQuelle= AB 8

Aspekt 2 Klassifikation = BerufText = Leiter Patholog. Institut d. CharitéQuelle = AB 8

ANWENDUNGBeispiel: Zerlegung in Aspekte

Aspekt 3 Klassifikation = NameText = Rudolf VirchowQuelle = MEGA III/11

Aspekt 4 Klassifikation = TätigkeitText = deutscher Pathologe und AnthropologeQuelle = MEGA III/11

Aspekt 5 ...

Page 23: BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

ANWENDUNGQuellenvergleich

Abfrage:

„Alle Berufe oder Tätigkeiten einer Person mit dem Namen Rudolf Virchow“

Ergebnis:

# TextQuelle

1. Begründer d. patholog. Anatomie u. d. Zellularpathologie AB 82. Begründer der Zellularpathologie MEGA III/113. deutscher Pathologe und Anthropologe MEGA III/114. Direktor des Pathologischen Instituts Archiv5. Leiter Patholog. Institut d. Charité AB 86. Prosektor an der Charité in Berlin Archiv...

Page 24: BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

ANWENDUNGChronologien

Abfrage:

„Alle Aspekte mit einer Zeitangabe zu einer Person mit dem Namen Rudolf Virchow“

Ergebnis (Seite 2):

AB 8 1856 Berlin, Leiter Patholog. Institut der CharitéBegründer der path. Anatomie u. der Zellularpathologieeinflußreich in Hygiene- und Sozialpolitikzeitw. Berliner Stadtverordneter

Archiv 1856 Professor für Anatomie und Pathologie an der Universität in Berlin

Direktor des Pathologischen InstitutsMEGA III/11 1861 ein Gründer und Führer der Deutschen FortschrittsparteiAB 8 1862–1902 MdA (DFP, DFsP, FsVP)MEGA III/11 1862–1902 Mitglied des preußischen Abgeordnetenhauses

[...]

Aufgrund von Divergenz und unterschiedlicher Schärfe eröffnen sich aber auch neue Fragen.

Page 25: BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

ANWENDUNGChronologien: Similie Timeline

Visualisierung mithilfe von Simile Timeline

– frei verfügbares Produkt des Massachusetts Institute of Technology – Abbildung von Zeitpunkten und Zeiträumen auf einer Zeitleiste – individuell konfigurierbar

Page 26: BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

ANWENDUNGGeographische Darstellung

Nutzung von interaktiven Karten

Verknüpfung mit historischen Karten

Abbildung der Niederlassungen bestimmter Berufszweige auf historischen Stadtplänen

Abbildung von Reisewegen und Migrationsströmenauf historischen Gebietskarten

Page 27: BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

ANWENDUNGGeographische Darstellung

Durch Kombination von Landkarte und Zeitleistekönnen Aspekte gleichzeitig in ihren zeitlichen und inihren räumlichen Dimensionen visualisiert werden.Auch die Kombination mit historischen Karten ist möglich.

Page 28: BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

ANWENDUNGGeographische Darstellung: Google timemap

Visualisierung mit Google timemap

Beispiel: Fallmerayer-Briefwechsel

Page 29: BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

ANWENDUNGNetzwerk-Visualisierung

Die Auswertung von Beziehungs-aspekten ermöglicht dieUntersuchung von Netzwerken.

Für die Erforschung von Wissenschafts-netzwerken sind z.B. Briefkontakteeine besonders ergiebige Quelle(wer schrieb wie häufig worüber an wen).

Aber auch die Auswertung von z.B.Kontenbüchern ist denkbar, umHandelsnetzwerke sichtbar zu machen.

Die Daten können sowohl qualitativals auch quantitativ ausgewertet werden.

Brief an P3

einseitiger KontaktBrief an P2

Brief an P3

Brief an P2

Brief an P3 Brief an

P1Brief an

P3 Brief an P1

intensiver Kontakt

sporadischer Kontakt

P1

P3

P2

Page 30: BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

ANWENDUNGNetzwerk-Visualisierung: Protovis

Visualisierung mit Protovis

Beispiel: Physiker-Netzwerk

Page 31: BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN

Oktober 2010

Personendaten-RepositoriumDFG-Projekt

ABSCHLIEßENDE HINWEISE

weitere Informationen

Projektwebsite http://pdr.bbaw.de

Nachrichtendienst Twitterhttp://twitter.com/persdatrep

Ansprechpartner Torsten [email protected]

Termine 2010

2.–6. NovemberJahrestagung der GfM 2010Deutsches Historisches Institut in RomÉcole française de Rome