Logo

Suche in DATA AFFAIRS

LerneinheitDatendokumentation und Metadaten

Einführung

Sollen Forschungsdaten für eine ArchivierungArchivierung meint das Aufbewahren und Zugänglichmachen von Forschungsdaten und -materialien. Das Ziel der Archivierung ist es, den Zugang zu Forschungsdaten über einen längeren Zeitraum hinweg zu ermöglichen. So können zum einen archivierte Forschungsdaten durch Dritte für eigene Forschungsfragen als Sekundärdaten nachgenutzt werden. Zum anderen bleiben Forschungsverläufe so nachprüfbar und nachvollziehbar. Daneben gibt es auch die Langzeitarchivierung (LZA), welche die langfristige Nutzbarkeit über einen nicht definierten Zeitraum hinweg sicherstellen soll. Die LZA zielt auf Erhalt der Authentizität, Integrität, Zugänglichkeit und Verständlichkeit von Daten ab. Weiterlesen und NachnutzungEine Nachnutzung, oftmals auch Sekundärnutzung genannt, befragt bereits erhobene und veröffentlichte Forschungsdatensätze erneut mit dem Ziel, andere Erkenntnisse, möglicherweise aus einer neuen oder unterschiedlichen Perspektive, zu erhalten. Die Aufbereitung von Forschungsdaten für eine Nachnutzung erfordert einen erheblich höheren Anonymisierungs-, Aufbereitungs- und Dokumentationsaufwand als die bloße Archivierung im Sinne von Datenspeicherung. Weiterlesen freigegeben werden, so ist eine sorgfältige und detaillierte Datendokumentation unverzichtbar. Dabei gilt es, den Kontext der Datenerhebung und -auswertung so zu erläutern und zu beschreiben, dass Nachnutzende z. B. die Entstehung von Forschungsmaterial nachvollziehen, es angemessen interpretieren und sinnvoll auswerten können. Die zentrale Frage lautet: Wie können Forschungsprozesse für Dritte verständlich und nachvollziehbar und die während eines Forschungsprozesses entstandenen Forschungsdaten für Dritte interpretierbar und nachnutzbar gemacht werden?

In der Sozial- und Kulturanthropologie gehört eine sorgfältige und transparente Dokumentation des Forschungskontextes und der genauen Umstände der Datenerhebung zur alltäglichen Forschungspraxis. Diese sogenannte Datentransparenz ist erforderlich, um Daten intersubjektiv überprüfbar zu machen, d. h. den Leser*innen einer Ethnografie oder den Nachnutzer*innen von Forschungsdaten zu ermöglichen, Erkenntniswege im Feld nachzuvollziehen.

Bei der Aufbereitung von Forschungsdaten für die Speicherung/Archivierung und Nachnutzung in Repositorien und Datenzentren kommt dieser Form der Datendokumentation, d. h. der systematischen Beschreibung des Forschungskontextes und der verwandten Methoden, eine besondere Bedeutung zu.

Wenn wir im Folgenden von Datendokumentation sprechen, beziehen wir uns also nicht auf die Sicherung und Niederschrift von Informationen (in Form von Notizen, Forschungsprotokollen, Tagebüchern, Fotografien, Tonaufnahmen etc.) im Feld (diese werden im Artikel Aufzeichnungsstrategien thematisiert), sondern auf eine standardisierte, digitale Form der Datenbeschreibung (sog. MetadatenMetadaten sind Beschreibungen von Forschungsdaten (Daten über Daten) und geben inhaltliche und strukturierte Informationen zum Forschungskontext, dem methodischen und analytischen Verfahren, sowie über das jeweilige Forschungsteam, das die Daten generiert. Sie lassen sich unterscheiden in bibliographische, administrative, prozessuale und deskriptive Metadaten und werden beispielsweise in Form von Templates, ReadMe-Dateien oder Data Curation Profiles verfasst. Metadaten werden begleitend zu den Forschungsdaten selbst publiziert und gelten insbesondere in Online-Repositorien und Forschungsdatenzentren als unverzichtbar für das Nachvollziehen und Verstehen von Datensätzen durch Dritte. Auch erleichtern Metadaten die Auffindbarkeit und Maschinenlesbarkeit von Daten und sind somit Teil der FAIR-Prinzipien und der guten wissenschaftlichen Praxis. Weiterlesen) und andere Arten der Datenkontextualisierung, die in Bezug zur Archivierung und Nachnutzung stehen.

Metadaten beschreiben in strukturierter Art und Weise die eigentlichen Forschungsdaten und können z. B. inhaltliche, fachspezifische sowie technisch-formale Angaben zur Datenerhebung beinhalten. Sie ermöglichen einen ersten groben Überblick über das archivierte Material. Meist sind es Archive, RepositorienEin Repositorium bildet einen Ort der Aufbewahrung wissenschaftlicher Dokumente. In Online-Repositorien werden Publikationen digital gespeichert, verwaltet und mit persistenten Identifikatoren versehen. Die Katalogisierung vereinfacht die Suche und Nutzung von Publikationen und Autor*innen. In den meisten Fällen sind Dokumente in Online-Repositorien uneingeschränkt und offen zugänglich (Open Access). Weiterlesen oder Forschungsdatenzentren, die allgemeine Vorgaben in Bezug auf Inhalt und Format der Metadaten festlegen, an denen man sich bei der Beschreibung orientieren kann. Diese inkludieren Schemata und Kernelemente zur Beschreibung der Daten und zielen insbesondere auf die Auffindbarkeit und Lesbarkeit der Metainformationen für Menschen und Maschinen ab.

Dabei wird empfohlen, ein kontrolliertesUnter einem kontrollierten Vokabular versteht man Vorgaben bzw. Definitionen von Begriffen und Regeln, die in Wortlisten oder strukturierten Thesauri zusammengefasst sind. Sie sind eine Art Lexikon oder Enzyklopädie für fachspezifische Begriffsdefinitionen, die dazu dienen, eine einheitliche wissenschaftliche Praxis zu fördern und Forschungen interoperabel und intersubjektiv nachvollziehbar zu machen. In den Sozialwissenschaften ist insbesondere der 'European Language Social Science Thesaurus' (ELSST) relevant siehe: https://elsst.cessda.eu. Weiterlesen und einheitliches Begriffsvokabular zu verwenden, zu dem die NormdatenNormdaten bilden Identifikationen und standardisierte normierte Datensätze in Form von eindeutigen Nummern, anhand derer Personen, Werke, Institutionen, Forschungsförderer, Körperschaften oder Schlagwörter eindeutig beschrieben und zuordenbar werden. Eine fälschliche oder doppelte Zuordnung entfällt durch diese normierten Daten. Insbesondere in Katalogen und Datenbanken können durch Normdaten Informationen zu bestimmten Entitäten vereinfacht herausgefunden werden, wodurch eine digitale Vernetzung und Auffindbarkeit zwischen Projekten stattfinden kann. Weiterlesen zählen, die bei der Katalogisierung und Verschlagwortung in Online-Archiven und Repositorien der eindeutigen Identifizierung von Personen, Orten, Werken u. ä. dienen1 Mehr zu Normdaten siehe Video: https://www.youtube.com/watch?v=VsP7b7B-W_Q.

Für eine ausführlichere Beschreibung und/oder zur besseren Nachvollziehbarkeit der Forschungsdaten können Kontextmaterialien bzw. -dokumente bereitgestellt werden, die Einblicke in den Forschungshintergrund gewähren. Aus diesen können zahlreiche Kontextinformationen gebündelt entnommen werden, was das Verständnis von Daten in ihrer Nachnutzung erhöht.