Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte...

36
Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Transcript of Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte...

Page 1: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

Offene Repositorien für wissenschaftliche Inhalte

Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Page 2: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

Viele neue Fragen …

Was machen Sie als Bibliothek oder Informationseinrichtung, wenn Sie um Hilfe gebeten werden …… bei einer Bibliographie für die Webseiten einer Fakultät

/ eines Institutes… bei einer elektronischen Fachzeitschrift für einen

Professor als Herausgeber… bei einem Primärdatendienst für eine Forschergruppe … bei der Verknüpfung des

Forschungsinformationssystems und dem Repositorium ???

Page 3: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

… viele neue Lösungen!

Digitale Dienste in Bibliotheken und Informationseinrichtungen werden spezifischer und komplexer und entsprechend auch die Lösungen>> „Informationsinfrastrukturen“

Digitale Dienste in Bibliotheken sind fast alle Daten-zentriert und heute Internet-basiert > keine reine IT

>> „Repositorien“ als Rückgrat

Page 4: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

Informationsinfrastrukturen: Sicht der EU

Linking at the speed of the lightLinking at the speed of the lightSharing computers, instruments and applicationsSharing computers, instruments and applications

Sharing and federating scientific dataSharing and federating scientific data

Astrophysics

community

WeatherForecast

community

Biomedics

community

Connecting the finest mindsSharing and federating the best scientific

resourcesBuilding global virtual communities

. . . . . .

. http://www.driver-repository.eu/Summit1/Campolargo%20MCAM%20Driver%20event.ppt

EU: e

-Infr

astr

uctu

res

Nets

Grids

Repos.

Page 5: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

Informationsinfrastrukturen: USA

http://www.dlib.org/dlib/july05/griffin/07griffin.html

USA

: cyb

erin

fras

truc

ture

Page 6: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

Eine (sehr) kurze Geschichte der Repositorien

Eigentlich bekannt aus der Software-Entwicklung

In deutschen Bibliotheken zunächst Dokumentenserver für Dissertationen

Dann en vogue durch „Open Access“

Heute weitere Trends erkennbar:Primär- und SekundärdatenForschungsinformationssystemeVirtuelle Forschungsumgebungen… (zurück zu Software-Repositories?)

Page 7: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

Repositorien sind ein Symbol geworden…

… für: Open Access – Inhalte im Fokus – Verteilte Systeme

Page 8: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

Repositorien: Situation OAI-PMH

~ 7,5 Mio records~ 550 repositories~ quality selection

Scholarly Texts

~ 10 Mio records~ 800 repositories~ loose selection

~ number unknown~ repositories indirectly~ mixed contents

~ 1000 Journals

~ 1000 Repositories

1300

4000

19 1200

20 1100

Page 9: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

Repositorien: Eine Erfolgsstory?

Publikationenserver im RegelbetriebNeue bibliothekarische AufgabeBeinhalten wichtige Daten der Institution Zuverlässiger, dauerhafter BetriebGuter Ausgangspunkt für neue Aufgaben

Aber: verteilte Infrastrukturwenig lokale und globale Einbettung ‚Nur‘ Suche dank Crawling und OAI-PMH Noch eine Silo-artige Struktur

Page 10: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

Fokus: lokale Einbettung

CRIS

z.B. z.B.

z.B.

z.B.

Page 11: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

Lokal / National / International

Nicht alles geht lokal

Nationale und internationale Projekte helfen, Anforderungen zu entsprechen

Weiterverarbeitung von lokalen DatenVerknüpfung von Mehrwertdiensten…

Page 12: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

Verteilte Systeme sind mächtig aber komplex

Humpty Dumpty sat on a wall,

Humpty Dumpty had a great fall.

All the king's horses,

And all the king's men,

Couldn't put Humpty together again.

Es fehlt Infrastruktur:Organisation – Dateninteroperabilität – Diensteinteroperabilität

Page 13: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

DRIVER-Infrastruktur: Ziele

1. Organisatorische Struktur für Repositorien„Confederation“

2. Verbesserung von Datenqualität und -standards„Guidelines“ und Validierung

3. Verteilte Laufzeitumgebung für Dienste z.B. gemeinsame Nutzung von Technik & Diensten

Zielgruppen1. Entscheider 2. Repositorienmanager3. Diensteanbieter

Page 14: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

Was meint DRIVER mit Infrastruktur?

Keine InfrastrukturEinzelnes Institutionelles RepositoriumEinzelne Anwendung (z.B. Suche; BASE) Lokale Operation Keine strukturelle Rückwirkung auf Repositorien

Vielleicht eine InfrastrukturVerteilte Repositorienlandschaft als Ganzes Hat das Potential „emergente“ Eigenschaften zu entwickeln Kann zu einer Entwicklung von Diensteanbietern führen

Sicher eine InfrastrukturMehrere Diensteanbieter in einer gemeinsamen organisatorischen und technischen UmgebungGeteilt geschulterter Betrieb und Datenaustausch

Page 15: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

Der DRIVER-Ansatz ist inkrementell

Publikationsmetadaten als StartpunktVerteiltes, lose gekoppeltes System existiert bereitsBeträchtliche Homogenität durch OAI-PMH

Ausbau nach LändernVon 5 Ländern über 10 und 27 nach ???

Ausbau zu anderen InhaltstypenVon Publikationsmetadaten zu „enhanced publications“, also Representationen von Text & Daten

Ausbau zu fachlichen DienstenDaten bedingen disziplinäre Sichtweise

Page 16: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-20091616

Der DRIVER-Fahrplan

DRIVER-I 6/2006 – 11/2007

Organisationelle Modelle and technisches “Test-Bed”

DRIVER-II 12/2007 – 11/2009

Laufende Organisation and Produktionssysteme

DRIVER-Confederation 2010ff

Geschäftsstelle und technischer Betrieb

NB: DRIVER ist kein “Ordnungsamt” – es ist eine liberale Versammlung von Interessenvertretern

Page 17: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

DRIVER-Partner and Netzwerke

Networking, Support, Policy, StudienGöttingen, Nottingham, SURF, Genth, Ljubiljana, Minho, Copenhagen

Technische Entwicklung und BetriebAthen, Bielefeld, Pisa, Warschau

Partner sind hochgradig vernetztOA-services: Sherpa-ROMEO, OpenDOAR, BASE…Projects: OA-Netzwerk, Europeana, PEER, DELOS, DL.org, D4Science, PARSE-Insight…Orgs: DINI, JISC, LIBER, SPARC, KE …Platforms: DSPACE/FEDORA/OPUS/ePrints

Page 18: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

Einige Ergebnisse: Studien

Page 19: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

Einige Ergebnisse: Ein Portal

Page 20: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

Einige Ergebnisse: Eine Suche

Page 21: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

Einige Ergebnisse: Repository Registration

Page 22: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

Einige Ergebnisse: GuidelinesBuild on knowledge from past & current IR projects (EU)26 actively involved contributors (experts and repository managers) from 8 countries.Practical answers on how to:

Improve full-text access Standardize metadata qualityCreate a reliable infrastructure for permanent identification, resolution, traceability and storageResolve semantic and classification issues

Page 23: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

Einige Ergebnisse: Support structures

Page 24: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

Einige Ergebnisse: Repositorien

200+ harvested repositories

21 countries

1.000.000+ documents

Page 25: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

Einige Ergebnisse: Verteilter Betrieb9 hosting nodes

25+ Functionality typologies(services)

36serviceInstances

3 applications: DRIVER Main, Belgium, Spain-Recolecta

Page 26: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-20092626

Einige Ergebnisse: Runtime-System

Enabling Layer

Data Layer

EU Open AccessRepositories

Functionality Layer

Adm

inis

trat

ors

End

user

s

Advanced User Interfaces National portals

Project Applications

Page 27: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

Einige Ergebnisse: Eine Software

NUr für große Service Provider!

Page 28: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-200928

Wo steht DRIVER-II?

Netzwerk“Confederation” mit “who-is-who” im BeiratNat: LIBER, SPARC, DINI, US, JAPAN etc…

Konsolidierungvon der Laufzeitumgebung in DRIVER-I Verteilte Dienste als Produktionssystem Nationale Knoten in Spanien, Portugal, China, Indien

ErweiterungDRIVER-I Services Verbesserte Indexierung und Aggregierung

DRIVER-II Services Management komplexer Objekte, z.B. “enhanced publications”

Page 29: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

Kritische Analyse

DRIVER-Infrastruktur behandelt Repositorien als verbindliche bibliothekarische Services

Aufgrund der hohen Standardisierung gerechtfertigtAber Repositorien werden zu offeneren Systemen Konvergenz mit Nachbarsystemen: CRIS, VREs, LTP,

Datendienste, Campus-Management, Web-CMS …

OAI-PMH hat seine GrenzenProtokoll für Austausch ist robust Aber keine interoperable semantische RepräsentationAber nicht integriert in Web-Architektur

Datenaustausch stark eingeschränkt DRIVER muss web-fähige semantische Beziehungen verarbeiten und herstellen können

Page 30: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

Problemstellung für DRIVER v2.0

Repositorien exponieren reiche Datenstrukturen„Pakete“: METS, MPEG21-DIDL, IMS-CP …„Umschläge“: OAI-ORE, Microformats …

Nachbarsysteme müssen verlinkt werdenGRID, CRIS, Long-Term-Preservation …

DRIVER muss vom Metadatenmanagement zum semantischen Datenmanagement kommen

Input/Ingest von diversen DatentypenTransformation zu neutralem ObjektmodellSpeicherung komplexer Datenstrukturen (Repositorium!)Zugriffssteuerung für Anreicherungsdienste Data Mining und Nutzer-generierte DatenExposition von diversen Datentypen

Page 31: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

D-NET v2.0 – Der Plan

„Enhanced Publications“ als ParadigmaStudien und DemonstratorEntwicklung eines generischen Datenmodells

Infrastrukturdienste werden komplett erneuertD-NET v2.0 als Test-Bed im Sommer `09Tests mit „enhanced publications“Fähigkeit zur Verarbeitung komplexer Daten Ende `09Sichtbarkeit erwartet für `10ff

Page 32: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

D-NET v2.0 – der Stand

StudienWas sind „Enhanced Publications“? >> PDFTechnologien für „Enhanced Publications“ >> PDFLangzeitarchivierung von „Enhanced Publications“„Technology Watch“: die Zukunft >> PDF

Demonstratoren „Enhanced Publications“ >> Live„Enhanced Publications“ Langzeitarchivierung >> Film

InfrastrukturSpezifikationen fertig, Entwicklung im Gange >> WIKI D-NET v1.1: Java-Portierung und Build-System D-NET v1.2: Neuer Aggregator, Installer D-NET v2.0: Compound Object Management

Page 33: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

DRIVER v2.0 – Perspektiven

Geograph. (oder fachliche) Knoten bilden ein verteiltes Hardware- & Softwarenetz

Load-balancing, Shared Costs, Redundanz …Andere Datentypen werden integriert und gebunden

Diensteanbieter bauen auf InfrastrukturVernetzung von Mehrwertdiensten z.B. Integration von BASE, RoMEO, OpenDOAR etc. Terminologiedienste (i.w.S.): Zeitschriftendatenbanken,

Ontologien, Autorenidentifikation, Objektidentifikation… Endnutzerdienste werden ausgebaut

Page 34: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

Die Zukunft von DRIVER

Mit DRIVER-II wird einen robuster und mächtiger Werkzeugkasten zur Vernetzung von Repositorien zur Verfügung gestellt

Verstetigung der Organisation >> ConfederationTechnischer Betrieb gewährleistetSchwerpunkt auf „Uptake“ Nationale Knoten und weitere Projekte

OpenAIRE als Support-Projekt für OA-Mandat zu europ. Förderprogrammen plant mit DRIVER

Infrastruktur für Nachweis der DokumenteDisziplinenspezifische Studien zu Informationsinfrastr.Weiterentwicklung der Nutzungsstatistiken u.v.m.

Page 35: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

„Offene Repositorien für wiss. Inhalte“

Lokale Repositorien als eingebettete SystemeLokale Wissensspeicher – eng mit CRIS, VREs, Campus-Management, LMS, LTP … verknüpft Workflows sind eine StandardanforderungWeg von Menschenlesbarkeit, hin zu Maschinenlesbarkeit/Schnittstellen

Lokale Repositorien als semantische InfrastrukturNahtlose Integration in Web-ArchitekturWeltweit verteiltes Netz in WWW-Manier

Repositorien entwickeln sich vom einzelnstehenden Publikationenserver zur Datenbasis der verteilten

wissenschaftlichen Informationsarchitektur

Page 36: Open Access Fortbildung WGL: Berlin 25-AUG-2009 Offene Repositorien für wissenschaftliche Inhalte Vernetzung im Europäischen Forschungsraum (Projekt DRIVER)

Open Access Fortbildung WGL: Berlin 25-AUG-2009

Vernetzung im europ. Forschungsraum

Zahlreiche Förderprogramme für RepositorienDRIVER ist ein (kleines) Projekt unter vielen DG-INFSO mit vielen ProgrammlinienESFRI-EntwicklungsaktivitätenStarker fachlicher SchwerpunktDFG mit Repositorienprogrammen (>> OA-Netzwerk)+ USA, Australien, Japan, China, Indien …

Fragmentierung durch lokale und disziplinäre Ausdifferenzierung muss umso mehr durch Vernetzung

begleitet werden >> „Interoperability rules“