Methoden: Datendokumentation und Metadaten
Quelle: Arten der Datendokumentationen, Anne Voigt mit CoCoMaterial, 2023, lizenziert unter CC BY-SA 4.0
Metadaten und Metadatenstandards
Metadaten beschreiben (Forschungs-)Daten. Sie geben strukturierte Informationen zum Forschungskontext, den verwendeten Methoden- sowie Analyseverfahren, zum Forschungsteam, den bereit gestellten Datensätzen und vieles mehr. I. d. R. lassen sie sich unterscheiden in:
- Bibliographische Metadaten (wie Titel, Autor und thematische Eingrenzung des Themas)
- Administrative Metadaten (wie Dateiformat, Zugriffsrechte und Lizenzen)
- Prozessmetadaten (wie verwendete Methoden bei der Erhebung von Daten)
- Deskriptive Metadaten (wie zusätzliche Informationen zu Inhalt und Entstehung der Daten (Forschungsdaten.info, 2023d)
Die unterschiedlichen Metadaten können zum einen in vorstrukturierten Templates wie für ReadMe-DateienReadMe-Dateien im Kontext von Systemen oder Projektenenthalten Informationen zum jeweiligen System, Projekt o. ä., damit die Nutzenden sich zurechtfinden. Weiterlesen zusammengefasst und publiziert werden. Zum anderen geben Archive, Repositorien oder Forschungsdatenzentren meist bei Datenarchivierung bereits eine Struktur der Metadaten in auszufüllenden Formularen vor1 Siehe z. B. Qualiservice: https://www.qualiservice.org/en/the-helpdesk.html#downloads.
Für die Sozialwissenschaften haben sich die disziplinspezifischen Metadatenstandards 1) „Data Documentation Initiative“ (DDI)2 https://ddialliance.org/ und das 2) „dara Metadatenschema“3 https://www.da-ra.de/downloads#version-3-0 etabliert, die in digitale Datenbanken integriert und zum freien Download verfügbar sind. Diese Metadatenstandards sind bis dato insbesondere auf quantitative Forschungsdaten ausgerichtet und für qualitative Forschungsdaten, wie sie zum großen Teil in der sozial- und kulturanthropologischen Forschung (vgl. Artikel Daten in der ethnografischen Forschung) erzeugt werden, eher unpassend. Für die empirisch-ethnografische Forschung ist daher eine ergänzende Datendokumentation mittels Datenberichten/Studienreports und Kontextmaterialien unerlässlich.
ReadMe-Dateien
ReadMe-Dateien sind einfache Text- oder TEI-xml-Dateien, die in den Formaten .txt, .md oder .xml abgespeichert werden und zentrale Metadaten in kompakter und strukturierter Form umfassen. Hier können Informationen festgehalten werden wie: der Projektname, die beteiligten Personen, die Förderung, sowie Benennungen, Ordnerstrukturen oder Abkürzungen. Zum anderen können Änderungen und Versionierungen von Daten gekennzeichnet und aufgenommen werden. ReadMe-Dateien können eigenständig publiziert werden. Sie dienen der praktischen Übersicht, sind i. d. R. maschinenlesbar und können so aussehen:
Beispiele
Documentation of research project XYZ
Creator(s):
Research context and hypotheses (reason(s) for data analysis):
Creation date of file(s):
Data collection/creation method(s):
Used Software (incl. version and add-ons), tools or devices:
Data (file names (incl. version), content, methods for data cleansing, language of data):
Softwarecode (file names (incl. version), content, programming language):
Additional documentation files (e.g. codebook, lab notebook, questionnaire):
Information on access and terms of use (license)
Notes:
Datenberichte und Studienreports
Metadaten allein reichen für die Dokumentation von qualitativen Forschungsdaten meist nicht aus. Eine Methode der Datendokumentation bildet der Daten- oder Methodenbericht, bzw. Kontextbogen oder ein Studienreport, wie er von Qualiservice empfohlen wird. Hier kann der/die Verfasser*in in freier Textform oder stichpunktartig Kontexte, Verknüpfungen und Zusatzinformationen darstellen sowie Änderungen etc. vermerken. Der Bericht sollte dabei (ähnlich wie die Templates der Metadaten) die Institution und Personen, die Forschungsfrage, die Vorarbeiten und die Konzepte des Themas beinhalten. Ebenso sollten Methoden genannt und weitere Schritte der Datenaufarbeitung und -analyse (wie Transkription, Auswertungsverfahren, Interpretation und Perspektive des/der Forscher*in) dargelegt werden. Ferner können Bezüge zu weiteren Kontextinformationen und Nachnutzungspotentialen hergestellt werden. Es empfiehlt sich, den Bericht mit wesentlichen Informationen, Vermerken und Beschreibungen kurz und knapp zu halten, und ihn als praktische und detaillierte Zusammenfassung der Forschung zu handhaben. Als Übersicht und Resümee der Forschung ist der Bericht eine vorteilhafte Orientierungsstütze für sowohl Forschende selbst, als auch für das eventuelle Forschungsteam und kann als eigenständige Publikation verwendet werden (RatSWD, 2023, p. 27).
Kontextdokumente und -materialien
Für qualitative Forschungsdaten bzw. in ethnografischen Forschungen erhobene Daten und deren Archivierungs- und Nachnutzungsszenarien eignet sich die Bereitstellung von Kontextmaterialien zur Datendokumentation. Unter Materialien werden hier unterschiedliche Artefakte verstanden, wie schriftliche Dokumente, Bilder, Videos aber auch Gegenstände profaner alltäglicher, sakraler oder künstlerischer Herkunft, die von dem/der Ethnograf*in nicht generiert, sondern gesammelt wurden und die zur Kontextualisierung herangezogen und gemäß der Fragestellung analysiert werden können (vgl. Artikel Daten in der ethnografischen Forschung).
Für die Datendokumentation kann dieses Verständnis um Kontextdokumente, die bei der Forschung „anfallen“, erweitert werden: Fragebögen, Interview-Leitfäden, systematische Beobachtungsprotokolle sowie weitere verwandte Erhebungsinstrumente, Feld- und Methodenberichte, die jeweils benutzten Transkriptionsregeln, Anonymisierungsmaßnahmen und Auswertungsprogramme etc. Derartige Kontextdokumente fungieren als Datendokumentation und führen zu einem besseren Verständnis der Forschung und der Forschungsergebnisse.
Für die Archivierung gilt es im Vorfeld, die Dokumente und Materialien einer überlegten Kuration und Sortierung nach Arten (wie Interviewdaten, SurveysAls Survey (dt. Umfrage, Erhebung) werden in den Sozialwissenschaften standardisierte, quantitative Überblicksstudien bezeichnet, die Aufschluss über bestimmte Personengruppen oder Beobachtungseinheiten geben sollen wie z. B. Haushalte, Familienstrukturen, Altersgruppen (Jugend, Rentner, Erwerbstätige etc.), oder auch einzelne Unternehmen und Organisationen. Survey-Daten werden meist mittels Befragung (in Form von Fragebögen oder direkten strukturierten Befragungen) erhoben. Sie bilden statistische Mikrodaten, die es ermöglichen, Zusammenhänge und Merkmale bis auf die Ebene des Individuums zu untersuchen. Surveys gehören zu den Standardverfahren der quantitativen Sozialforschung, werden aber auch in der Sozial- und Kulturanthropologie eingesetzt, um Überblicksinformationen über bestimmte soziale Parameter zu erhalten wie z. B. Haushaltszusammensetzungen, ökonomische Verhältnisse oder Altersstrukturen einer BevölkerungEine Übersicht über bedeutende sozialwissenschaftliche Surveys in Bezug auf Deutschland und die entsprechenden Datenbanken bietet Gesis (Leibniz-Institut für Sozialwissenschaften): https://auffinden-zitieren-dokumentieren.de/auffinden/b-erhebungsdaten/.. Weiterlesen, Beobachtungsdaten oder mediale Daten usw.) zu unterwerfen, d. h. zu überlegen, welche der eigenen Forschungsdaten sich für eine Archivierung und Nachnutzung eignen und welche nicht. Diese Entscheidung ist eng an ethische und datenschutzrechtlicheDatenschutz beinhaltet Maßnahmen gegen ein unrechtmäßiges Erheben, Speichern, Teilen und Nachnutzen von personenbezogenen Daten. Der Datenschutz stützt sich auf das Recht der Selbstbestimmung von Individuen in Bezug auf den Umgang mit ihren Daten und ist in der Datenschutz-Grundverordnung (DSGVO), dem Bundesdatenschutzgesetz und in den entsprechenden Gesetzen der Bundesländer verankert. Ein Verstoß gegen datenschutzrechtliche Vorschriften kann strafrechtliche Konsequenzen nach sich ziehen. Weiterlesen Aspekte gekoppelt. Sind die Auswahlkriterien geklärt, kann eine genaue Herleitung und Aufzählung der verwendeten Materialien und Dokumente sowie verwendeter „Werkzeuge“ und „Instrumente“ der Forschung erfolgen. Dadurch wird der Forschungskontext, die Perspektive des/der Forscher*in sowie Methode, Thema, Fragestellung etc. nachvollzieh- und interpretierbar.
Literatur
Forschungsdaten.info. (2023a). Das Data-Curation-Profile. forschungsdaten.info. https://forschungsdaten.info/themen/organisieren-und-aufbereiten/data-curation-profile/
Forschungsdaten.info. (2023d). Metadaten und Metadatenstandards. forschungsdaten.info. https://forschungsdaten.info/themen/beschreiben-und-dokumentieren/metadaten-und-metadatenstandards/
Rat für Sozial- und Wirtschaftsdaten. (RatSWD, 2023). Forschungsdatenmanagement in kleinen Forschungsprojekten – Eine Handreichung für die Praxis. RatSWD Output Series, 7. Berufungsperiode Nr. 3. https://doi.org/10.17620/02671.72