Einführung: Einführung in das Forschungsdatenmanagement
Mit dem Aufkommen der globalen Open-Science(OS)-BewegungDie Open-Science-Bewegung plädiert seit den frühen 2000er Jahren für eine offene und transparente Wissenschaft, in der alle Schritte des wissenschaftlichen Erkenntnisprozesses offen online zugänglich gemacht werden. So sollen nicht nur Endergebnisse von Forschungen wie Monographien oder Artikel öffentlich geteilt werden, sondern auch verwendete Materialien, die den Entstehungsprozess begleiteten wie: Labortagebücher, Forschungsdaten, verwendete Software, Forschungsberichte usw. Dadurch soll eine Partizipation an Wissenschaft und Erkenntnissen gefördert und interessierte Öffentlichkeiten angesprochen werden. Kreativität, Innovation und neue Kollaborationen sollen gefördert, Erkenntnisse auf ihre Qualität, Richtigkeit und Authentizität hin überprüft werden, was eine Demokratisierung von Forschung bezwecken soll. Zur Open Science zählen u. a. Open Access und Open Data, die Infrastrukturen des Teilens von Zwischenergebnissen von Forschungen bilden. Weiterlesen in den frühen 2000er Jahren hat sich der Anspruch an eine verantwortungsvolle Forschung und eine gute wissenschaftliche PraxisDie gute wissenschaftliche Praxis (GWP) bildet einen standardisierten Kodex, der als Regelwerk in den Leitlinien der Deutschen Forschungsgemeinschaft (DFG) verankert ist. Die Leitlinien verweisen auf die ethische Verpflichtung jedes/jeder Forschenden, verantwortungsvoll, ehrlich und respektvoll vorzugehen, auch um das allgemeine Vertrauen in Forschung und Wissenschaft zu stärken. Sie können als Orientierung im Rahmen wissenschaftlicher Arbeitsprozesse geltend gemacht werden. Weiterlesen (GWP) weiterentwickelt. GWP bildet einen standardisierten Kodex, der in den Leitlinien der Deutschen Forschungsgemeinschaft (DFG) verankert ist und zu einem ehrlichen und verantwortungsvollen, sowie ethisch und rechtlich einwandfreien wissenschaftlichen Arbeiten verpflichtet (DFG, 2022). Immer stärker rücken ebenso Forderungen nach Open AccessOpen Access bezeichnet den freien, kostenlosen, ungehinderten und barrierefreien Zugang zu wissenschaftlichen Erkenntnissen und Materialien. Für eine weitere rechtssichere Nachnutzung der Materialien durch Dritte müssen die Urhebenden mittels Lizenzvertrages die Nutzungsrechte an ihren Werken einräumen. Die freien CC-Lizenzen spezifizieren bspw. genau, wie Daten und Materialien weitergenutzt werden dürfen. Weiterlesen – einem offenen und kostenlosen Zugang zu Forschungsdaten – und damit nach Open DataOpen Data (offene Daten) sind Daten, die offen und frei online zugänglich sind sowie uneingeschränkt von Dritten weiterverwendet werden dürfen. Dies setzt voraus, dass sie mit einer offenen Lizenz versehen sind (Opendefinition, 2023). Weiterlesen – der Möglichkeit der Nachnutzung von Daten durch Dritte – in den Vordergrund. Die Forderungen nach Open Science sind in den Richtlinien und Empfehlungen der DFG verankert und haben zum Ziel, die akademische Forschung für unterschiedliche Öffentlichkeiten zugänglich zu gestalten. Damit soll das allgemeine Vertrauen in die Wissenschaft gestärkt und Kreativität, Innovationen und Kollaborationen gefördert werden.
Im Sinne der FAIR-PrinzipienDie FAIR-Prinzipien wurden 2016 erstmals von der FORCE 11-Community (The Future of Research Communication and e-Scholarship) entwickelt. FORCE11 ist eine Gemeinschaft von Wissenschaftlern, Bibliothekaren, Archivaren, Verlegern und Forschungsförderern, die durch den effektiven Einsatz von Informationstechnologie einen Wandel in der modernen wissenschaftlichen Kommunikation herbeiführen und so eine verbesserte Wissenserstellung und -weitergabe unterstützen will. Das primäre Ziel liegt in der transparenten und offenen Darlegung wissenschaftlicher Erkenntnisprozesse. Demnach sollten Daten online findable (auffindbar), accessible (zugänglich), interoperable (kompatibel) und reusable (wiederverwendbar) abgelegt und strukturiert sein. Ziel ist es, Daten langfristig aufzubewahren und im Sinne der Open Science und des Data Sharing für eine Nachnutzung durch Dritte bereitzustellen. Genaue Definitionen der FORCE11 selbst können auf der Website nachgelesen werden siehe: https://force11.org/info/the-fair-data-principles/. Die FAIR-Prinzipien berücksichtigen ethische Aspekte der Weitergabe von Daten in sozialwissenschaftlichen Kontexten nicht hinreichend, weshalb sie um die CARE-Prinzipien ergänzt wurden. Weiterlesen, die 2016 erstmals von der FORCE11-Community (The Future of Research Communication and e-Scholarship) veröffentlicht wurden, sollen wissenschaftliche Erkenntnisse auch in ihrem Entstehungsprozess transparent und offen zirkulieren (Force, 2021). Daten sollen auffindbar (findable), zugänglich (accessible), interoperabelUnter Interoperabilität bezeichnet man die Fähigkeit eines Systems mit anderen Systemen nahtlos zusammenzuarbeiten. Innerhalb interoperabler Systeme können Daten automatisiert mit anderen Datensätzen kombiniert und ausgetauscht werden. Somit werden Daten auf vereinfachte und beschleunigte Weise maschinell lesbar, interpretierbar und vergleichbar. Interoperabilität stellt eines der Hauptkriterien der FAIR-Prinzipien dar (Forschungsdaten.info, 2023). Weiterlesen bzw. kompatibel (interoperable) und wiederverwendbar (reusable) strukturiert, dokumentiert und abgelegt werden. Durch einen uneingeschränkten Zugang zu Wissen soll die Partizipation an akademischen Diskursen für breite Öffentlichkeiten ermöglicht und eine Demokratisierung von Forschung angestrebt werden.
Quelle: FAIR-Prinzipien (nach Paulina Halina Sieminska), Anne Voigt mit CoCoMaterial, 2023, lizenziert unter CC BY-SA 4.0
Dabei steht insbesondere das Forschungsdatenmanagement (FDM) im Fokus: FDM bildet das Schlüsselkonzept verantwortungsvoller, guter wissenschaftlicher Praxis und beinhaltet den Umgang mit Forschungsdaten in Bezug auf ihre Organisation, Pflege und Aufarbeitung anhand spezifischer Maßnahmen und Strategien. Ziel ist es, Daten im Sinne der FAIR-Prinzipien langfristig aufzubewahren und für Dritte zugänglich zu machen, sodass wissenschaftliche Aussagen überprüft, Nachweise gesichert und weitere Auswertungen oder Analysen vollzogen werden können. Hier greift der Imperativ des Data SharingData Sharing meint das Teilen bzw. Weitergeben von Daten. Dabei gilt es gemäß den entsprechenden Anforderungen der Forschung, die Daten so offen wie möglich und so geschlossen wie nötig (Europäische Kommission, 2021) darzulegen und zur Verfügung zu stellen. Insbesondere im Hinblick auf die Nachnutzung und den Umgang mit sensiblen, personenbezogenen Daten muss gründlich überprüft werden, ob und in welcher Form das Archivieren und Teilen von Daten mit anderen Wissenschaftler*innen und der Öffentlichkeit möglich und sinnvoll ist. Der Imperativ des Data Sharing bildet im Rahmen der Open-Science-Bewegung einen breiten Konsens in der Wissenschaft, ist aber aus sozial- und kulturanthropologischer Sichtweise kritisch zu betrachten und abzuwägen. Weiterlesen, also des Teilens bzw. der Weitergabe von Daten: Gemäß den Anforderungen von Open Science'Der Begriff Open Science bündelt … Strategien und Verfahren, die allesamt darauf abzielen, ... alle Bestandteile des wissenschaftlichen Prozesses über das Internet offen zugänglich und nachnutzbar zu machen. Damit sollen Wissenschaft, Gesellschaft und Wirtschaft neue Möglichkeiten im Umgang mit wissenschaftlichen Erkenntnissen eröffnet werden' (AG Open Science, 2014). Weiterlesen gilt es, erhobene Daten „as open as possible and as closed as necessary“ (Europäische Kommission, 2021) darzulegen und zur Verfügung zu stellen.
Aspekte des Forschungsdatenmanagements gewinnen in den letzten Jahren zunehmend an Bedeutung, sodass immer mehr Universitäten, Forschungs- und Förderinstitutionen eigene Forschungsdatenpolicies formulieren. Diese Richtlinien und Regelwerke bieten Unterstützung bei Fragen bezüglich des FDM und sollten in der Umsetzung beachtet werden. Es gibt in Deutschland zwar noch keine standardisierten Auflagen zum Umgang mit Forschungsdaten, dennoch können Förderprogramme der DFG oder der EU entsprechende Nachweise oder Pläne (wie z. B. einen DatenmanagementplanEin Datenmanagementplan (DMP) beschreibt und dokumentiert den Umgang mit den Forschungsdaten und Forschungsmaterialien einer Forschung während und nach der Projektlaufzeit. Im DMP wird festgehalten, wie die Daten und Materialien entstehen, aufbereitet, gespeichert, organisiert, veröffentlicht, archiviert und ggf. geteilt werden. Zudem werden im DMP Verantwortlichkeiten und Rechte geregelt. Als 'living document' (also ein dynamisches Dokument, das sich fortlaufend in Bearbeitung und Veränderung befindet) wird der DMP im Laufe des Projektes regelmäßig geprüft und bei Bedarf angepasst. Weiterlesen) verpflichtend einfordern.
Hinsichtlich eines empfohlenen, sorgfältigen Forschungsdatenmanagements kann ferner das Modell des ForschungsdatenlebenszyklusDas Modell des Forschungsdatenlebenszyklus stellt sämtliche Phasen dar, die Forschungsdaten vom Zeitpunkt der Erhebung bis zu ihrer Nachnutzung durchlaufen können. Die Phasen sind an bestimmte Aufgaben gekoppelt und können variieren (Forschungsdaten.info, 2023). Allgemein umfasst der Forschungsdatenlebenszyklus folgende Teilbereiche: Weiterlesen als unterstützendes Hilfsmittel herangezogen werden: Innerhalb dieses Konzeptes werden einzelne „Lebensstadien“ von Daten unterschieden und mit bestimmten Aufgaben verbunden, die vor, während und nach der Datenerhebung anfallen. Diese beinhalten die Planung des Forschungsvorhabens, die Datenerhebung als solche, die Aufarbeitung und Analyse von Daten, die Datenpublikation sowie die Archivierung und Nachnutzung. Mit der Metapher des Lebenszyklus werden Daten als „lebendige“ Entitäten betrachtet, die auch über das Forschungsprojekt hinaus (z. B. durch eine NachnutzungEine Nachnutzung, oftmals auch Sekundärnutzung genannt, befragt bereits erhobene und veröffentlichte Forschungsdatensätze erneut mit dem Ziel, andere Erkenntnisse, möglicherweise aus einer neuen oder unterschiedlichen Perspektive, zu erhalten. Die Aufbereitung von Forschungsdaten für eine Nachnutzung erfordert einen erheblich höheren Anonymisierungs-, Aufbereitungs- und Dokumentationsaufwand als die bloße Archivierung im Sinne von Datenspeicherung. Weiterlesen) ein „eigenes Leben“ führen.
Die oben beschriebenen FAIR-Prinzipien, die Richtlinien der Hochschulen und der Forschungsdatenlebenszyklus stellen Empfehlungen für ein erfolgreiches Forschungsdatenmanagement dar, berücksichtigen allerdings forschungsethische AspekteForschungsethik befasst sich mit dem Verhältnis zwischen Forschenden, Forschungsfeld und Beforschten. Dabei wird dieses Verhältnis vor dem Hintergrund der durch die Forschung hergestellten Vulnerabilitäten und Machtasymmetrien kritisch reflektiert (Unger, Narimani & M’Bayo, 2014, p.1-2). Gerade wegen der Prozesshaftigkeit und Offenheit einer ethnografischen Forschung treten forschungsethische Fragen im gesamten Forschungsprozess in verschiedener Weise auf. Sie variieren je nach Forschungskontext und Forschungsmethoden. Forschungsethik hört allerdings nicht mit dem Verlassen des Feldes auf, sondern umfasst ebenfalls Fragen der Datenarchivierung, des Datenschutzes sowie des Teilens der Forschungsdaten mit den Forschungsteilnehmenden (siehe z. B. Ethikpapiere der DGSKA oder das Positionspapier zur Archivierung, Bereitstellung und Nachnutzung von Forschungsdaten der dgv). Weiterlesen und Problematiken nur am Rande. Daher wurden 2019 von der Research Data Alliance, die einen technischen und sozialen infrastrukturellen Ausbau von Data Sharing anstrebt, die CARE-PrinzipienDie CARE-Prinzipien wurden 2019 von der Global Indigenous Data Alliance (GIDA) etabliert. Sie fungieren als Komplement zu den FAIR-Prinzipien und gelten als Hilfswerkzeug, um Forschungskontexte und ihre historische Einbettung sowie Machtasymmetrien im Feld stärker zu fokussieren. Das Akronym steht für Collective Benefit (Gemeinwohl), Authority to Control (Kontrolle der Forschungsteilnehmenden über die eigene Repräsentation), Responsibility (Verantwortung seitens Forschender) und Ethics (Berücksichtigung ethischer Aspekte). Durch die CARE-Prinzipien soll der gerechte, respektvolle und ethische Umgang mit Forschungsteilnehmenden und den aus der Forschung generierten Daten hinsichtlich des Data Sharing betont und berücksichtigt werden. Die CARE-Prinzipien sind somit in allen Phasen des Forschungsdatenlebenzyklus und des Forschungsdatenmanagements relevant. Weiterlesen formuliert. Sie sollen als Ergänzung der FAIR-Prinzipien fungieren und sind besonders für die sozial- und kulturanthropologische Datenerhebung bedeutend (vgl. Artikel zur Forschungsethik; Research Data Alliance, 2016).
Literatur
Deutsche Forschungsgemeinschaft. (DFG, 2022). Leitlinien zur Sicherung guter wissenschaftlicher Praxis. Kodex. https://doi.org/10.5281/zenodo.6472827
Europäische Kommission, Directorate-General for Research and Innovation. (2021). Horizon Europe, open science. Early knowledge and data sharing, and open collaboration. Publications Office of the European Union. https://data.europa.eu/doi/10.2777/18252
Force11. (2021). The FAIR Data Principles. Force11. The Future of Research Communications and e-scholarship. https://force11.org/info/the-fair-data-principles/
Research Data Alliance. (RDA, 2016). The Research Data Alliance (RDA) builds the social and technical bridges to enable the open sharing and re-use of data. Research Data Alliance. https://www.rd-alliance.org/about-rda
Sieminska, P. H. (2019). A FAIRy tale graphics (1.0.0). Zenodo. https://doi.org/10.5281/zenodo.3267168