Forschungsdatenmanagement und Förderauflagen zur ... › wp-content › ... · 1. Beschreibung der...

23
Forschungsdatenmanagement und Förderauflagen zur Archivierung von Forschungsdaten in den Sozialwissenschaften Sebastian Netscher CESSDA Training am Datenarchiv für Sozialwissenschaften, GESIS - Leibniz Institut für Sozialwissenschaften Servicezentrum eSciences, Universität Trier 11 Juli 2017

Transcript of Forschungsdatenmanagement und Förderauflagen zur ... › wp-content › ... · 1. Beschreibung der...

Page 1: Forschungsdatenmanagement und Förderauflagen zur ... › wp-content › ... · 1. Beschreibung der Forschungsdaten: ⇒Projektkontext, Art der Daten, Datengenerierung, Verfügbarkeit

Forschungsdatenmanagement und Förderauflagen

zur Archivierung von Forschungsdaten

in den Sozialwissenschaften

Sebastian Netscher

CESSDA Training am Datenarchiv für Sozialwissenschaften,

GESIS - Leibniz Institut für Sozialwissenschaften

Servicezentrum eSciences, Universität Trier

11 Juli 2017

Page 2: Forschungsdatenmanagement und Förderauflagen zur ... › wp-content › ... · 1. Beschreibung der Forschungsdaten: ⇒Projektkontext, Art der Daten, Datengenerierung, Verfügbarkeit

Forschungsdatenmanagement und Förderauflagen

• “Regarding the digital research data generated in the action (…),

the beneficiaries must (…) deposit in a research data repository

and take measures to make it possible for third parties to access,

mine, exploit, reproduce and disseminate (…) the data(…) laid

down in the ‘data management plan’” (EU-Horizon 2020, 2016)

• „Die Antragstellenden verpflichten sich, die im Rahmen des

Projekts gewonnenen Daten (…) zur Verfügung zu stellen (…). Um

die Weitergabefähigkeit (…) zu gewährleisten, (…) ein eigenes

Forschungsdatenmanagement betreiben.“ (BMBF, 2016)

Page 3: Forschungsdatenmanagement und Förderauflagen zur ... › wp-content › ... · 1. Beschreibung der Forschungsdaten: ⇒Projektkontext, Art der Daten, Datengenerierung, Verfügbarkeit

Die Bedeutung der Förderauflagen

Förderer

Forschungsprojekt

verfügbare Forschungsdaten

⇒ FAIR-Daten

Forschungsdatenmanagement

⇒ Datenmanagementplan

Ziel

Aktivität

GewährleistungDokumentation

Page 4: Forschungsdatenmanagement und Förderauflagen zur ... › wp-content › ... · 1. Beschreibung der Forschungsdaten: ⇒Projektkontext, Art der Daten, Datengenerierung, Verfügbarkeit

Accessible

Re-UseableInteroperable

Findable

Die FAIR-Prinzipien von Forschungsdaten

Wie erlangen Dritte Kenntnis

von den Daten?

Wie erhalten Dritte Zugang

zu den Daten?

Können die Daten technisch

nachgenutzt werden?

Können die Daten analytisch

nachgenutzt werden?

Page 5: Forschungsdatenmanagement und Förderauflagen zur ... › wp-content › ... · 1. Beschreibung der Forschungsdaten: ⇒Projektkontext, Art der Daten, Datengenerierung, Verfügbarkeit

Accessible

Re-UseableInteroperable

Findable

FAIR-Prinzipien: Auffindbarkeit

Auffindbarkeit

Wie erlangen Dritte

Kenntnis von den Daten?

• Zitation in Publikationen

• Persistente Identifikatoren,

z. B. DOIs

• Datennachweis in

Suchportalen

⇒ kontrolliertes Vokabular und

Metadaten(-standards)

Page 6: Forschungsdatenmanagement und Förderauflagen zur ... › wp-content › ... · 1. Beschreibung der Forschungsdaten: ⇒Projektkontext, Art der Daten, Datengenerierung, Verfügbarkeit

Accessible

Re-UseableInteroperable

Findable

FAIR-Prinzipien: Zugänglichkeit

Zugänglichkeit

Wie erhalten Dritte

Zugang zu den Daten?

• Zugangs- und

Nachnutzungsbedingungen

� projektinterne

Einschränkungen

� rechtliche

Einschränkungen

⇒ so offen wie möglich, so

geschlossen wie nötig

Page 7: Forschungsdatenmanagement und Förderauflagen zur ... › wp-content › ... · 1. Beschreibung der Forschungsdaten: ⇒Projektkontext, Art der Daten, Datengenerierung, Verfügbarkeit

Accessible

Re-UseableInteroperable

Findable

FAIR-Prinzipien: Interoperabilität

Interoperabilität

Können die Daten technisch

nachgenutzt werden?

• Aufbau und Struktur

des Datensatzes

• Dateiformate, Software

und Versionen

• Begleitmaterialien

(Dokumentation und

Software)

⇒ disziplinspezifische Standards

Page 8: Forschungsdatenmanagement und Förderauflagen zur ... › wp-content › ... · 1. Beschreibung der Forschungsdaten: ⇒Projektkontext, Art der Daten, Datengenerierung, Verfügbarkeit

Accessible

Re-UseableInteroperable

Findable

FAIR-Prinzipien: Nachnutzbarkeit

Nachnutzbarkeit

Können die Daten analytisch

nachgenutzt werden?

• Dokumentation der Daten

• Inhaltliche Verständlichkeit

der Daten

• Interpretierbarkeit

von Ergebnissen

⇒ kontrolliertes Vokabular und

Metadaten(-standards)

Page 9: Forschungsdatenmanagement und Förderauflagen zur ... › wp-content › ... · 1. Beschreibung der Forschungsdaten: ⇒Projektkontext, Art der Daten, Datengenerierung, Verfügbarkeit

Die Bedeutung der Förderauflagen

Förderer

Forschungsprojekt

verfügbare Forschungsdaten

⇒ FAIR-Daten

Forschungsdatenmanagement

⇒ Datenmanagementplan

Ziel

Aktivität

GewährleistungDokumentation

Page 10: Forschungsdatenmanagement und Förderauflagen zur ... › wp-content › ... · 1. Beschreibung der Forschungsdaten: ⇒Projektkontext, Art der Daten, Datengenerierung, Verfügbarkeit

Forschungsdatenmanagement (FDM)

• FDM umfasst alle Prozesse und Maßnahmen zum Erhalt

und zur (Nach-)Nutzbarkeit von Forschungsdaten

– Qualitätssicherung

im Forschungsprojekt

– Replizierbarkeit über das

Forschungsprojekt hinaus

– Nachnutzbarkeit der

Forschungsdaten durch Dritte

Bild: Hochstenbach, P. (2015): FOSTER Cartoon: Re-Use. FOSTER-Project (EU-Funding 612425).

Available at: https://www.fosteropenscience.eu/foster-taxonomy/research-data-management. (CC-by)

Page 11: Forschungsdatenmanagement und Förderauflagen zur ... › wp-content › ... · 1. Beschreibung der Forschungsdaten: ⇒Projektkontext, Art der Daten, Datengenerierung, Verfügbarkeit

Bereiche des FDM

1. Handhabung der Forschungsdaten

⇒ Organisation, Dateiaufbereitung

und -dokumentation

2. Forschungsethische und rechtliche Aspekte

⇒ Datenschutz (personenbezogene

Daten) und Urheberrechte (Dritter)

3. Längerfristige Sicherung

der Forschungsdaten

⇒ Replikation und Nachnutzung

Bild: Hochstenbach, P. (2015): FOSTER Cartoon: Data Management. FOSTER-Project (EU-Funding 612425).

Available at: https://www.fosteropenscience.eu/foster-taxonomy/research-data-management. (CC-by)

Page 12: Forschungsdatenmanagement und Förderauflagen zur ... › wp-content › ... · 1. Beschreibung der Forschungsdaten: ⇒Projektkontext, Art der Daten, Datengenerierung, Verfügbarkeit

1. Handhabung von Forschungsdaten

• Datenorganisation

– Ordnerstruktur, Benennung und Versionierung der Dat(ei)en

– Sicherung der Dat(ei)en (Backups)

• Datenaufbereitung

– Validierung der Daten

– Prüfung auf fehlende Antworten,

inkonsistentes Antwortverhalten etc.

– Anonymisierung

• Datendokumentation

– Studiendokumentation

– Dokumentation der Forschungsdaten

Bild: Herrema, A. (2014): FOSTER Cartoon: Loss of Data. FOSTER-Project (EU-Funding 612425).

Available at: https://www.fosteropenscience.eu/foster-taxonomy/research-data-management. (CC-by).

Page 13: Forschungsdatenmanagement und Förderauflagen zur ... › wp-content › ... · 1. Beschreibung der Forschungsdaten: ⇒Projektkontext, Art der Daten, Datengenerierung, Verfügbarkeit

2. Ethische und Rechtliche Aspekte

• Datenschutz (personenbezogene Informationen)

– informierte Einwilligung

– Anonymisierung

– Schutz vor unautorisiertem

Zugriff

• Urheberrecht

(Recht am geistigen Eigentum)

– an den Forschungsdaten

– Urheberechte Dritter

Bild: Hochstenbach, P. (2015): FOSTER Cartoon: Ethics. FOSTER-Project (EU-Funding 612425).

Available at: https://www.fosteropenscience.eu/foster-taxonomy/research-data-management. (CC-by)

Page 14: Forschungsdatenmanagement und Förderauflagen zur ... › wp-content › ... · 1. Beschreibung der Forschungsdaten: ⇒Projektkontext, Art der Daten, Datengenerierung, Verfügbarkeit

Der Datenmanagementplan (DMP)

• Zweckorientierte Dokumentation

des Forschungsdatenmanagements

– immer projekt-spezifisch

– lebendes Dokument

– zweckorientiertes Dokument

• projekt-internen Qualitätssicherung

• Replikation der Forschungsdaten

• Verfügbarmachung der

Forschungsdaten für Dritte

Bild: Herrema, A. (2014): FOSTER Cartoon: Data Sharing. FOSTER-Project (EU-Funding 612425).

Available at: https://www.fosteropenscience.eu/foster-taxonomy/research-data-management. (CC-by).

Page 15: Forschungsdatenmanagement und Förderauflagen zur ... › wp-content › ... · 1. Beschreibung der Forschungsdaten: ⇒Projektkontext, Art der Daten, Datengenerierung, Verfügbarkeit

Die Bedeutung der Förderauflagen

Förderer

Forschungsprojekt

verfügbare Forschungsdaten

⇒ FAIR-Daten

Forschungsdatenmanagement

⇒ Datenmanagementplan

Ziel

Aktivität

GewährleistungDokumentation

Page 16: Forschungsdatenmanagement und Förderauflagen zur ... › wp-content › ... · 1. Beschreibung der Forschungsdaten: ⇒Projektkontext, Art der Daten, Datengenerierung, Verfügbarkeit

Strategie zur Generierung verfügbarer Daten

1. Planung des FDM

– Forschungsdaten und Verfügbarkeit

– Einschränkungen der Verfügbarkeit

– Archivierung und Verfügbarkeit

2. Erstellung eines DMP

– vom erste Entwurf zum

Abschlussbericht

– Aufbau des DMP

Bild: Herrema, A. (2014): FOSTER Cartoon: Open Data. FOSTER-Project (EU-Funding 612425).

Available at: https://www.fosteropenscience.eu/foster-taxonomy/research-data-management. (CC-by)

Page 17: Forschungsdatenmanagement und Förderauflagen zur ... › wp-content › ... · 1. Beschreibung der Forschungsdaten: ⇒Projektkontext, Art der Daten, Datengenerierung, Verfügbarkeit

Werden im Forschungsprojekt Forschungsdaten generiert?

Welche Forschungsdaten mit welchem Nachnutzungspotential?

Ist die Verfügbarmachung der Forschungsdaten möglich?

Ist die interne Sicherung möglich? Ist ein freier Zugang für jeden möglich?

Welche

Restriktionen

bestehen warum?

keine Daten,

d. h. kein FDM & kein DMP

CC-0 oder

CC-by?

Wie werden die

Daten intern

gesichert?

nein

nein

nein ja

Replikation Verfügbarmachung

ja

„opt out“

„opt out“

Forschungsprojekt

ja

ja

nein

Page 18: Forschungsdatenmanagement und Förderauflagen zur ... › wp-content › ... · 1. Beschreibung der Forschungsdaten: ⇒Projektkontext, Art der Daten, Datengenerierung, Verfügbarkeit

Zugänglichkeit und Restriktionen

offene

Datengeschlossene

DatenZugänglichkeit

nationale Sicherheitamtliche Statistik Forschungsdaten

rechtlich

projekt-intern

⇒ so offen wie möglich, so geschlossen wie nötig

EU-EU-Horizon 2020: Grant Agreement, Art. 29.3

Page 19: Forschungsdatenmanagement und Förderauflagen zur ... › wp-content › ... · 1. Beschreibung der Forschungsdaten: ⇒Projektkontext, Art der Daten, Datengenerierung, Verfügbarkeit

Werden im Forschungsprojekt Forschungsdaten generiert?

Welche Forschungsdaten mit welchem Nachnutzungspotential?

Ist die Verfügbarmachung der Forschungsdaten möglich?

Ist die interne Sicherung möglich? Ist ein freier Zugang für jeden möglich?

Welche

Restriktionen

bestehen warum?

keine Daten,

d. h. kein FDM & kein DMP

CC-0 oder

CC-by?

Wie werden die

Daten intern

gesichert?

nein

nein

nein ja

Replikation Verfügbarmachung

ja

„opt out“

„opt out“

Forschungsprojekt

ja

ja

nein

Welche Daten sollen

wie bereitgestellt werden?

Auffindbarkeit und Zugänglichkeit

RepositoriumProjekt

Page 20: Forschungsdatenmanagement und Förderauflagen zur ... › wp-content › ... · 1. Beschreibung der Forschungsdaten: ⇒Projektkontext, Art der Daten, Datengenerierung, Verfügbarkeit

Forschungsdaten-Repositorien

• Machen Forschungsdaten

– auffindbar, z. B. über persistente Identifikatoren,

Publikation von Metadaten in Suchmaschinen etc.

– zugänglich, z. B. über Lizenzen (Definition von

Zugangs- und Nachnutzungsbedingungen)

• Unterstützen bei der Generierung interoperabler

und nachnutzbarer Forschungsdaten

• Ein geeignetes Repositorium finden

⇒ Disziplin, Region, Datentyp,

Dauer der Archivierung etc.

Page 21: Forschungsdatenmanagement und Förderauflagen zur ... › wp-content › ... · 1. Beschreibung der Forschungsdaten: ⇒Projektkontext, Art der Daten, Datengenerierung, Verfügbarkeit

Erstellen eines DMP

• Erster Entwurf: Strategie zur Generierung

verfügbarer Forschungsdaten

– EU: innerhalb der ersten 6 Monaten

– BMBF: Teil des Förderantrags

• Aktualisierter DMP in den

Zwischenberichten: Sicherstellung

der Umsetzung der Strategie

• Abschlussbericht: Erklärung,

wann die Daten archiviert werden

bzw. wurden

Bild: Herrema, A. (2014): FOSTER Cartoon: Data Handling. FOSTER-Project (EU-Funding 612425).

Available at: https://www.fosteropenscience.eu/foster-taxonomy/research-data-management. (CC-by).

Page 22: Forschungsdatenmanagement und Förderauflagen zur ... › wp-content › ... · 1. Beschreibung der Forschungsdaten: ⇒Projektkontext, Art der Daten, Datengenerierung, Verfügbarkeit

Aufbau des DMP

1. Beschreibung der Forschungsdaten:

⇒ Projektkontext, Art der Daten, Datengenerierung,

Verfügbarkeit der generierten Daten etc.

2. Einschränkungen in der Verfügbarkeit der Daten

⇒ projektinterner und/oder rechtlicher Aspekte

3. Verfügbarkeit und Gewährleistung des FAIR-Prinzips

⇒ (Dauer der) Auffindbarkeit und Zugänglichkeit,

Interoperabilität und Nachnutzbarkeit

4. Verantwortlichkeiten und Ressourcen für das FDM

Page 23: Forschungsdatenmanagement und Förderauflagen zur ... › wp-content › ... · 1. Beschreibung der Forschungsdaten: ⇒Projektkontext, Art der Daten, Datengenerierung, Verfügbarkeit

Literatur

• Büttner, S., H.C. Hobohm & L. Müller (2011): Handbuch Forschungsdatenmanagement.

Bad Honnef: Bock + Herchen.

• Bundesanzeiger (2016): Bekanntmachung des BMBF. 29.03.2016.

• CESSDA Training (2015): CESSDA User Guide on Data Management.

• Corti, L., V. van den Eynden, L. Bishop & M. Woollard (2014): Managing and Sharing Research Data.

A Guide to Good Practice. London: Sage Publication Ltd.

• Force 11 (2016): The FAIR Data Principles.

• Horizon 2020 Programme (2016): Annotated Model Grant Agreement. Version 2.1.1. 1. July 2016.

• Horizon 2020 Programme (2016): Guidelines on FAIR Data Management in Horizon 2020.

Version 3.0. 26 July 2016.

• Horizon 2020 Programme (2016): Guidelines on Open Access to Scientific Publications and Research

Data in Horizon 2020. Version 3.1. 25 August 2016.

• Humboldt Universität zu Berlin (2017): Muster Datenmanagementplan für Horizon 2020. Version 3.0.

• Jensen, U. (2012): Leitlinien zum Management von Forschungsdaten. Sozialwissenschaftliche

Umfragedaten. GESIS-Technical Reports 2012|07.