Forschungsdaten - Helmholtz · 2014. 5. 14. · Knowledge Exchange Internationale Kooperation mit...

Post on 06-Oct-2020

1 views 0 download

Transcript of Forschungsdaten - Helmholtz · 2014. 5. 14. · Knowledge Exchange Internationale Kooperation mit...

Forschungsdaten Auch eine Aufgabe der Forschungsförderung?

Offener Helmholtz Workshop - Umgang mit Forschungsdaten

Bremen, 18. September 2008

Manfred NießenDeutsche Forschungsgemeinschaft(DFG)

Wie kommt die DFG zum Thema?

HGF Open Data Workshop / Manfred NießenBremen, 18.09.2008

Mit der Förderung von Projekten fördert die DFG zugleich die Produktion von Daten: die Erhebung bzw. das Generieren von Daten ist integraler Teil vieler Projekte.

In der Regel sind diese Daten projektspezifisch bzw. fragestellungsabhängig.

Sharing Data

• „Sharing Data“ als Beitrag zur Effizienzsteigerung, zur Begrenzung von Aufwand und Kosten

HGF Open Data Workshop / Manfred NießenBremen, 18.09.2008

• „Sharing Data“ als Kontrollmechanismus gegen wissenschaftliches Fehlverhalten.

• Wiederholungsstudien mit zugänglichen Datensets können wichtiger Baustein für Ausbildung des wissenschaftlichen Nachwuchses sein.

Sharing Data: Effizienzsteigerung

HGF Open Data Workshop / Manfred NießenBremen, 18.09.2008

Fachspezifische Datenarchive sind entstanden und werden wichtiger.

Der Prozess verläuft unterschiedlich nach Disziplinen.

• In manchen Fächern: Verpflichtung zurBereitstellung der projektspezifischen Daten anArchive

• Pilotprojekt zur Förderung des Aufbaus eines fachbezogenen Datenarchivs: ZPID

Research Data Sets in the catalog of the National Library of Science, Hannover(DFG funded project)

http://tiborder.gbv.de/psi/DB=2.63/CLK?IKT=8578&TRM=primaerdaten

ESOF 2008 / Max VoeglerBarcelona, 18.-22.07.2008

http://psychdata.zpid.de/

Offene Fragen

• Wissenschaftliche Freiheit(GG § 5). Auch die Freiheit, Daten nicht freizugeben?

• Wem gehören die Daten? Förderorganisation, Institution/Einrichtung, (Haupt)-Antragsteller, Wissenschaftlicher Mitarbeiter, Verlag? Alles ist möglich.

• Wie werden Daten zur Verfügbar gestellt?Was für Rechte werden für die Nachnutzung gewährleistet? Welche Lizenzen verwendet? Die „Offenheit“ von Daten ist nicht nur eine technische Frage.

• QualitätssicherungAlle Daten? Ist das überhaupt möglich? Wünschenswert? Wer entscheidet, welche Daten wo und wie lange gespeichert werden?

HGF Open Data Workshop / Manfred NießenBremen, 18.09.2008

Sharing Data: Scientific Integrity

HGF Open Data Workshop / Manfred NießenBremen, 18.09.2008

Pilotworkshop der ESF im November 2006: „Scientific Integrity“ mit Vertretern einer Wissenschaft (Psychologie), der Förderorganisationen und der Verlage

Thema: Verbindung von wissenschaftlichen Publikationen in Zeitschriften mit gleichzeitiger Publikation der Daten und der Verarbeitungsalgorithmen

ESF, 25 Nov 2006

Procedure to ascertain reliability and robustness of data: Public Domain

• Raw data (at least a significant subset)— Algorithms of data reduction (e.g., binocular saccade detection)— Algorithms of data screening (e.g., extrapolating blink positions)

• Aggregated data— Eye-movement corpora in different languages (same protocol)

• Text/sentence/word information (e.g., frequency, predictability)

• Fixation duration sequence in screen coordinates

— R scripts for data visualization and statistical analyses— Sources for computational models, GUIs for general usage— Sources for experimental control and stimulus generation

• Packages (1 package per article)— Article (e.g., Sweave file) and data— Experimental program code (e.g., psychophysics toolbox)— R scripts generating tables, figures, inferential statistics

• SVN (control version system)— Ask for submission of user updates, improvements, corrections ...

HGF Open Data Workshop / Manfred NießenBremen, 18.09.2008

ESF, 25 Nov 2006

Recommendations for ESF• Contribute to “scientific integrity” by moving research results in the

Public Domain— Check suitability of various licenses (GPL, BSD, ...)— Respect right to first publication; specify embargos (time limits)— Require ...— Encourage ...— Suggest ...

• Support of R (or other GNU General Public License projects), ... — as institutional sponsor— with research projects

• Support prototype ESF project in implementation

• One size may not fit all— Small: R package repository — Medium: SVN— Large: VDC

Vorläufige Empfehlungen

Sharing Data

• „Sharing Data“ als Beitrag zur Effizienzsteigerung, zur Begrenzung von Aufwand und Kosten

• „Sharing Data“als Kontrollmechanismus gegen wissenschaftliches Fehlverhalten.

• Wiederholungsstudien mit zugänglichen Datensets können wichtiger Baustein für Ausbildung des wissenschaftlichen Nachwuchses sein.

HGF Open Data Workshop / Manfred NießenBremen, 18.09.2008

Providing Data

HGF Open Data Workshop / Manfred NießenBremen, 18.09.2008

Zunehmend wichtiger für die Wissenschaft werden eigenständige Großvorhaben nur zur Datenproduktion.

Ziel: Daten für die Forschung bereitzustellen

Diese Vorhaben haben „Allmende-Charakter“

Zwei Varianten:

• groß-skalierte Datensammlungen

• das gezielte und theoriegeleitete Generieren vonDaten für definierte Forschungsfelder: jedeseinzelne „Datum“ ist vorab theoretisch begründet

Providing Data

HGF Open Data Workshop / Manfred NießenBremen, 18.09.2008

Neuer Schwerpunkt: Vorhaben mit dem Ziel, Daten für die Wissenschaft zu generieren.

Beispiele:

Nationales Bildungspanel (NEPS)Koordiniertes Förderverfahren gemeinsam mit BMBFZentrales Infrastrukturprojekt zur DatenerhebungGezielte Forschungsförderung (z.B. durch SPP) zur Verwendung der Daten

European Social Survey (ESS)

Offene Fragen

• Prioritätensetzung

• Anerkennung (und first-use Rechte?)

• Nachhaltigkeit

HGF Open Data Workshop / Manfred NießenBremen, 18.09.2008

DFG: Ziele und Projekte

Policy Ebene:

Neugestaltung der Guten Wissenschaftlichen Praxis (GWP): GWP (1996) Empfehlung 7: “Primärdaten als Grundlagen für Veröffentlichungen sollen auf haltbaren und gesicherten Trägern in der Institution, wo sie entstanden sind, für zehn Jahre aufbewahrt werden.”GWP muss an neue technische Möglichkeiten angepasst und implementiert werden.

Daten-policies: Richtlinien und Empfehlungen müssen fachnahentwickelt und implementiert werden (DFG Fachkollegien).

HGF Open Data Workshop / Manfred NießenBremen, 18.09.2008

DFG: Ziele und Projekte

“Community Building”

Jede Disziplin hat eine eigene Wissenschaftskultur und eigene Herausforderungen im Umgang mit Forschungsdaten. Bei der Ausarbeitung eines Infrastrukturplans, Daten-Policy und dessen Implementierung müssen diese Kulturunterschiede verstanden und berücksichtigt werden.

WorkshopsSozialwissenschaften (Dez. 2007)Infrastruktur und Datenzentren (Jan. 2008)Archäologie (April 2008)Lebenswissenschaften I: „Scoping“ (Herbst 2008)... weitere werden folgen.

HGF Open Data Workshop / Manfred NießenBremen, 18.09.2008

DFG: Ziele und Projekte

Kooperation: Die DFG ist eine Selbstverwaltungseinrichtung der Wissenschaft zur Förderung der Forschung. Sie betreibt selber keine Forschung, keine Infrastruktur für die Forschung. Sie muss im Wissenschaftssystem kooperieren.

HGF Open Data Workshop / Manfred NießenBremen, 18.09.2008

DFG: Ziele und Projekte

BMBFBeispiel NEPS: gemeinsame Förderung. BMBF fördert die Infrastrukturprogramme, DFG die darauf aufbauende Grundlagenforschung

Allianz (DFG, MPG, HGF, FGH, WGL, HRK, WR) Gemeinsame Förderinitiative „Digitale Information“ hat Forschungsdaten als Schwerpunkt.

Fachcommunities und ihre InstitutionenBeispiel: RatSWD

National

HGF Open Data Workshop / Manfred NießenBremen, 18.09.2008

DFG: Ziele und Projekte

International

HGF Open Data Workshop / Manfred NießenBremen, 18.09.2008

Knowledge ExchangeInternationale Kooperation mit anderen Europäischen Organisationen im Bereich der Infrastrukturförderung (DEFF, DK; JISC, UK; und SURF, NL). Ab Herbst 2008 neuer Schwerpunkt „Research Data“

ESF Members Forum „Open Data“Zusammenarbeit mit anderen europäischen Forschungsförder-organisationenzum Thema.

European Strategy Forum on Research Infrastructure (ESFRI)

International Data Forum (IDF)

DFG: Ziele und Projekte

International Data Forum (IDF)

HGF Open Data Workshop / Manfred NießenBremen, 18.09.2008

The Aim of the International Data Forum

The International Data Forum aims to facilitate and coordinate international production and sharing of data for research in the social sciences.

The Mission of the International Data Forum

The International Data Forum will strive to establish alignment between its aimsand the strategic directions and priorities of prominent organisations representing producers, managers and research users of data relevant to the social sciences.

Die europäische Dimension der Datenfrage

Eine koordinierte Struktur zur Pflege und Archivierung von Daten wäre ein zentralerBeitrag zum Aufbau der European Research Area (ERA). Wie kommen wir dahin?ESFRI-ähnliches Verfahren? Europa will das “best possible home for globalresearch communities” (Motto von DG INFSO). Offene Daten, disziplinspezifischimplementiert.

HGF Open Data Workshop / Manfred NießenBremen, 18.09.2008

Manfred NießenGruppe Geistes- und Sozialwissenschaften

Deutsche Forschungsgemeinschaft (DFG)

Vielen Dank!