Diskussion
Datenbegriff
Forschungsdaten, die während einer ethnografischen Feldforschung erhoben werden, sind immer gezielt generiert und existieren nicht jenseits der persönlichen Interaktion zwischen Forschenden und Forschungsteilnehmer*innen. Daher kann innerhalb der ethnografischen Feldforschung auch nicht von der Sammlung bereits existierender Roh- oder PrimärdatenPrimärdaten sind Daten, die im direkten Bezug auf einen Untersuchungsgegenstand selbst ‚im Feld‘ erhoben wurden. Dies können bei der Feldforschung zum einen Feldbeobachtungen und entsprechende Aufzeichnungen in Feldtagebüchern sowie Interviewtranskripte und Gesprächsprotokolle, aber auch quantitative Erhebungen in Form von Fragebögen als auch von und mit Forschungsteilnehmenden erzeugte Daten wie Fotografien, Filme u. dgl. sein. Weiterlesen gesprochen werden: Vielmehr werden Daten während der Forschung prozessual hergestellt und müssen somit als konstruiert aufgefasst werden: Sozial- und kulturanthropologische Forschung schließt also nicht „einer Datengewinnung deren Analyse an, sondern stellt in einer theorieorientierten Analyse den Wert bestimmter Informantenäußerungen als Datum erst her“ (Hirschauer, 2014, p. 303). In ihrer Filterung und Reflexion des Beobachteten und Erfragten produzieren Ethnograf*innen letztendlich subjektiv und affektiv beeinflusste Daten.
Daneben tragen sie aber stets auch noch weitere für ihr Thema relevante Materialien (z. B. Zeitungsartikel, Broschüren, Fotos, Filme, Social-Media-Inhalte etc.) zusammen, auch betreiben sie – je nach Fragestellung – Archivforschung, indem sie beispielsweise historische Quellen sichten. Uns erscheint es sinnvoll, zwischen Daten als Informationen, die durch Forscher*innen gezielt generiert werden, und Materialien als Informationen, die unabhängig von den Forschenden existieren, zu unterscheiden. Den Begriff der Quelle beziehen wir dagegen in erster Linie auf veröffentlichte Texte, die sich auf den jeweiligen Forschungsgegenstand beziehen und die sowohl wissenschaftlicher als auch nicht-wissenschaftlicher Natur sein können, wobei im letzteren Fall die Abgrenzung zum Materialienbegriff schwierig werden kann. Auch unterscheidet sich dieses Verständnis von dem in den historischen Wissenschaften üblichen Quellenbegriff (s. dazu Kirn, 1968, p. 29). Diese Differenzierung erscheint uns bedeutsam, da generierte Daten, gesammelte Materialien und konsultierte Quellen je andere Formen der Aufbereitung, Kontextualisierung, forschungsethischen Reflexion und rechtlichen Absicherung in Bezug auf Archivierung und eine eventuelle Nachnutzung erfordern (s. TP INF/SFB 1171, 2022).
Im Fokus dieses Portals stehen Daten als von den Forschenden mittels verschiedener Methoden evozierte Informationen.
In diesem Zusammenhang wird auch die Varianz von Datengenres relevant, denn in der ethnografischen Feldforschung werden sowohl qualitative, als auch quantitative Daten erhoben, deren Unterscheidung nicht immer trennscharf zu ziehen ist (Beer, 2003, p. 11). Quantitative Daten sind zum Beispiel HaushaltssurveysEin Haushaltssurvey ist eine Überblicksstudie mittels standardisierter Befragungen eines repräsentativen Samples oder einer Zufallsstichprobe zu den Zusammensetzungen der Haushalte in einer Untersuchungsregion (siehe: Survey/Survey-Daten). In der Sozial- und Kulturanthropologie werden die Begriffe Survey, Haushaltssurvey und Zensus oft auch synonym gebraucht. Weiterlesen, Vermessungen, standardisierte Fragebögen oder ZeitallokationsstudienHier handelt es sich um die systematische Erhebung der Zeit, die Personen für bestimmte Aufgaben und Tätigkeiten aufwenden. Mittels Zeitallokationsstudien wird untersucht, wie Menschen in verschiedenen sozialen und kulturellen Kontexten ihre Zeit budgetieren, z. B. wie die Arbeitsteilung im re-/produktiven Bereich zwischen den Geschlechtern und Generationen geregelt ist: Wieviel Zeit am Tag verbringen Mütter, Väter, ältere Geschwisterkinder, Großeltern u. a. täglich mit der Betreuung von Kleinkindern, wieviel Zeit bringt wer für welche ökonomischen Tätigkeiten sowie andere Fürsorgearbeit oder nachbarschaftliche Kontakte etc. auf. Es gibt verschiedene Methoden zur Erfassung der Zeitbudgetierung, die quantitative und replizierbare Datensets erbringen. Weiterlesen. Zu qualitativen Daten zählen: offene, narrative Interviews, nicht standardisierte Forschungsaufzeichnungen, wie Exzerpte, Protokolle, Notizen und Feldtagebücher sowie Fotografien, Bilder und im Feld gedrehte Filme. Während sich quantitative Daten einfacher depersonalisieren lassen, sind qualitative Daten durch ihre semantische Dichte und Mehrdeutigkeit geprägt und ohne präzise Kontextualisierung kaum zu verstehen (Hirschauer, 2014, p. 303; Kretzer, 2013, p. 153). Ein Teilen von quantitativen Daten, die im Rahmen teilnehmender Beobachtung auch erhoben werden, ist somit potentiell einfacher, während das Teilen von qualitativen Daten äußerst anforderungsreich ist. Hier zeichnet sich ab, dass eine offene und transparente Einsicht in qualitive ethnografische Daten im Sinne der Open Science'Der Begriff Open Science bündelt … Strategien und Verfahren, die allesamt darauf abzielen, ... alle Bestandteile des wissenschaftlichen Prozesses über das Internet offen zugänglich und nachnutzbar zu machen. Damit sollen Wissenschaft, Gesellschaft und Wirtschaft neue Möglichkeiten im Umgang mit wissenschaftlichen Erkenntnissen eröffnet werden' (AG Open Science, 2014). Weiterlesen und des Data SharingData Sharing meint das Teilen bzw. Weitergeben von Daten. Dabei gilt es gemäß den entsprechenden Anforderungen der Forschung, die Daten so offen wie möglich und so geschlossen wie nötig (Europäische Kommission, 2021) darzulegen und zur Verfügung zu stellen. Insbesondere im Hinblick auf die Nachnutzung und den Umgang mit sensiblen, personenbezogenen Daten muss gründlich überprüft werden, ob und in welcher Form das Archivieren und Teilen von Daten mit anderen Wissenschaftler*innen und der Öffentlichkeit möglich und sinnvoll ist. Der Imperativ des Data Sharing bildet im Rahmen der Open-Science-Bewegung einen breiten Konsens in der Wissenschaft, ist aber aus sozial- und kulturanthropologischer Sichtweise kritisch zu betrachten und abzuwägen. Weiterlesen, mit persönlichen, rechtlichen und ethischenForschungsethik befasst sich mit dem Verhältnis zwischen Forschenden, Forschungsfeld und Beforschten. Dabei wird dieses Verhältnis vor dem Hintergrund der durch die Forschung hergestellten Vulnerabilitäten und Machtasymmetrien kritisch reflektiert (Unger, Narimani & M’Bayo, 2014, p.1-2). Gerade wegen der Prozesshaftigkeit und Offenheit einer ethnografischen Forschung treten forschungsethische Fragen im gesamten Forschungsprozess in verschiedener Weise auf. Sie variieren je nach Forschungskontext und Forschungsmethoden. Forschungsethik hört allerdings nicht mit dem Verlassen des Feldes auf, sondern umfasst ebenfalls Fragen der Datenarchivierung, des Datenschutzes sowie des Teilens der Forschungsdaten mit den Forschungsteilnehmenden (siehe z. B. Ethikpapiere der DGSKA oder das Positionspapier zur Archivierung, Bereitstellung und Nachnutzung von Forschungsdaten der dgv). Weiterlesen Herausforderungen – sowohl für die Forschenden, als auch für die jeweiligen Forschungsteilnehmenden – einhergeht. Insofern ist eine sorgfältige (Vor-)Auswahl und Kuration der zu veröffentlichenden Daten erforderlich.
Kritische Perspektiven auf Open Science
Viele ethnografisch Forschende begegnen der Forderung nach Open Science und Data Sharing aus verschiedenen Gründen mit Skepsis: Sie sehen keine Notwendigkeit für das Teilen von Daten jenseits der Veröffentlichung mit dem Argument, dass Daten erst in der reflexiven und selektiven Auseinandersetzung der Forschenden mit ihren Aufzeichnungen, Quellen und Materialien entstehen und letztlich erst in der Niederschrift ihre endgültige Form annehmen (Behrends et al., 2022, p. 15) und die Grenze zwischen Daten und Publikation nicht eindeutig zu ziehen sei. Sie verweisen weiter darauf, dass es zur guten wissenschaftlichen PraxisDie gute wissenschaftliche Praxis (GWP) bildet einen standardisierten Kodex, der als Regelwerk in den Leitlinien der Deutschen Forschungsgemeinschaft (DFG) verankert ist. Die Leitlinien verweisen auf die ethische Verpflichtung jedes/jeder Forschenden, verantwortungsvoll, ehrlich und respektvoll vorzugehen, auch um das allgemeine Vertrauen in Forschung und Wissenschaft zu stärken. Sie können als Orientierung im Rahmen wissenschaftlicher Arbeitsprozesse geltend gemacht werden. Weiterlesen des Faches gehört, die Erhebungskontexte, verwandte Methodik und die daraus resultierenden Daten sowie die eigene Positionierung im Feld in den Veröffentlichungen transparent und damit den Forschungsprozess intersubjektiv nachvollziehbar zu machen. Die offene Darlegung des Forschungs- und Erkenntnisprozesses wurde bereits vom „Gründungsvater“ der teilnehmenden Beobachtung Bronislaw Malinowski (1922) betont:
„I consider that only such ethnographic sources are of unquestionable scientific value, in which we can clearly draw the line between, on the one hand, the results of direct observation and of native statements and interpretations, and on the other, the inferences of the author, based on his common sense and psychological insight”.
(Malinowski, 1922, p. 3)
Auch befürchten einige, dass mit der Forderung nach Data Sharing eine Preisgabe privater Feldtagebücher oder Notizhefte verbunden sein könnte, die nie für eine Veröffentlichung angefertigt wurden (Behrends et. al., 2022, p. 10). Ein zentraler Kritikpunkt betrifft den erheblichen Ressourcenaufwand, der mit Data Sharing einhergeht, und mit hohen Kosten für Nachbearbeitungen (Entschlüsselung, Umschreiben oder Übersetzung), Kuration, Pseudo-Die Pseudonymisierung ist 'die Verarbeitung personenbezogener Daten in einer Weise, in der die personenbezogenen Daten ohne Hinzuziehung zusätzlicher Informationen nicht mehr einer spezifischen betroffenen Person zugeordnet werden können, sofern diese zusätzlichen Informationen gesondert aufbewahrt werden und technischen und organisatorischen Maßnahmen unterliegen, die gewährleisten, dass die personenbezogenen Daten nicht einer identifizierten oder identifizierbaren natürlichen Person zugewiesen werden können' (BlnDSG §31, 2020; EU-DSGVO Artikel 4 Nr. 5, 2016). Weiterlesen oder AnonymisierungenLaut Bundesdatenschutzgesetz (BDSG § 3, Abs. 6 in der bis 24.05.2018 gültigen Fassung) versteht man unter Anonymisierung alle Maßnahmen der Veränderung personenbezogener Daten derart, 'dass die Einzelangaben über persönliche oder sachliche Verhältnisse nicht mehr oder nur mit einem unverhältnismäßig großen Aufwand an Zeit, Kosten und Arbeitskraft einer bestimmten oder bestimmbaren natürlichen Person zugeordnet werden können.' Anonymisierte Daten sind demnach Daten, die keinen Rückschluss (mehr) auf die betroffene Person geben. Sie unterliegen damit nicht dem Datenschutz bzw. der Datenschutz-Grundverordnung (DSGVO). Weiterlesen etc. verbunden ist, wodurch sich nochmals die „Sinnfrage“ des Data Sharing stellt:
„Ich glaube, dass der Mehrwert der Offenlegung der Daten unabhängig von allen ethischen Fragen, die damit verbunden sind, extrem begrenzt ist […] Deswegen sehe ich ehrlich gesagt nicht wirklich, was damit gewonnen werden kann – abgesehen von dem enormen finanziellen und zeitlichen Aufwand, der nötig wäre, um die Daten so zu anonymisieren“.
(Behrends et al., 2022, p. 8)
Auch Hirschauer (2014) schließt sich dieser Meinung an und geht dabei so weit, Data Sharing (in Form von Archivierung und Nachnutzung von Daten der ethnografischen Forschung) als „archivarischen Unsinn“ zu bezeichnen:
„Die bloße Anhäufung von Daten ist ebenso sinnlos wie eine bloße Ansammlung ethnologischer Artefakte in staubigen Regalen und dunklen Speicherkammern“.
(Hirschauer, 2014, p. 301)
Schließlich zeigen sich Sozial- und Kulturanthropolog*innen um den gesamten Forschungsprozess besorgt und sehen diesen durch die Forderung von OS bedroht:
„Was macht das eigentlich mit uns und unserer Forschung in dem Moment, in dem wir eine Verfügbarkeit oder eine Verfügbarmachung bereits mitdenken?“
(Behrends et al., 2022, p. 10)
So wird zum einen befürchtet, dass das Wissen um eine spätere Veröffentlichung von Daten bereits die Art der Aufzeichnungen im Feld beeinflussen kann, zum anderen eröffnen sich hier relevante Fragen und Lücken in Bezug auf die Forschungsethik: Wie geht man mit fehlenden Vorkehrungen zu Personen- und DatenschutzDatenschutz beinhaltet Maßnahmen gegen ein unrechtmäßiges Erheben, Speichern, Teilen und Nachnutzen von personenbezogenen Daten. Der Datenschutz stützt sich auf das Recht der Selbstbestimmung von Individuen in Bezug auf den Umgang mit ihren Daten und ist in der Datenschutz-Grundverordnung (DSGVO), dem Bundesdatenschutzgesetz und in den entsprechenden Gesetzen der Bundesländer verankert. Ein Verstoß gegen datenschutzrechtliche Vorschriften kann strafrechtliche Konsequenzen nach sich ziehen. Weiterlesen um? Inwiefern werden gewonnene Erkenntnisse durch mögliche Anonymisierungen verfremdet? Können veröffentlichte Daten zu missbräuchlichen NachnutzungenEine Nachnutzung, oftmals auch Sekundärnutzung genannt, befragt bereits erhobene und veröffentlichte Forschungsdatensätze erneut mit dem Ziel, andere Erkenntnisse, möglicherweise aus einer neuen oder unterschiedlichen Perspektive, zu erhalten. Die Aufbereitung von Forschungsdaten für eine Nachnutzung erfordert einen erheblich höheren Anonymisierungs-, Aufbereitungs- und Dokumentationsaufwand als die bloße Archivierung im Sinne von Datenspeicherung. Weiterlesen und damit zu nicht intendierten (politischen) Konsequenzen führen? Forschende gehen davon aus, dass genau diese Lücken das auf Loyalität und Verantwortung basierende Vertrauensverhältnis zwischen ihnen und ihren Informant*innen nachhaltig gefährden könnten. So konkludiert Hirschauer:
„Das zentrale Problem ist nicht, dass die Archivierung unseren Informanten schaden kann – und dies ist bereits ein beträchtliches Problem -, sondern dass sie deren Vertrauen so untergräbt, dass dies unserer Forschung schaden kann“.
(Hirschauer, 2014, p. 310)
So lässt sich festhalten, dass die Forderung nach Open Science (Data Sharing, ForschungsdatenmanagementBeim Forschungsdatenmanagement geht es um einen verantwortungsvollen und reflektierten Umgang mit Forschungsdaten. Anhand spezifischer Maßnahmen und Strategien sollen Forschungsdaten sorgfältig organisiert, gepflegt und aufgearbeitet werden. Ziel ist es, sie im Sinne einer guten wissenschaftlichen Praxis langfristig zu speichern und für Dritte zugänglich und nachnutzbar zu machen. Somit soll eine Überprüfung wissenschaftlicher Aussagen vereinfacht, Nachweise gesichert und weitere Auswertungen und Analysen an den Daten vollzogen werden können. Weiterlesen und die FAIR-PrinzipienDie FAIR-Prinzipien wurden 2016 erstmals von der FORCE 11-Community (The Future of Research Communication and e-Scholarship) entwickelt. FORCE11 ist eine Gemeinschaft von Wissenschaftlern, Bibliothekaren, Archivaren, Verlegern und Forschungsförderern, die durch den effektiven Einsatz von Informationstechnologie einen Wandel in der modernen wissenschaftlichen Kommunikation herbeiführen und so eine verbesserte Wissenserstellung und -weitergabe unterstützen will. Das primäre Ziel liegt in der transparenten und offenen Darlegung wissenschaftlicher Erkenntnisprozesse. Demnach sollten Daten online findable (auffindbar), accessible (zugänglich), interoperable (kompatibel) und reusable (wiederverwendbar) abgelegt und strukturiert sein. Ziel ist es, Daten langfristig aufzubewahren und im Sinne der Open Science und des Data Sharing für eine Nachnutzung durch Dritte bereitzustellen. Genaue Definitionen der FORCE11 selbst können auf der Website nachgelesen werden siehe: https://force11.org/info/the-fair-data-principles/. Die FAIR-Prinzipien berücksichtigen ethische Aspekte der Weitergabe von Daten in sozialwissenschaftlichen Kontexten nicht hinreichend, weshalb sie um die CARE-Prinzipien ergänzt wurden. Weiterlesen) nicht recht zu dem methodischen Vorgehen und Datenverständnis der Disziplin zu passen scheint. OS berücksichtigt die Sensibilität und Verantwortung, die Forschungen mit Menschen erfordern, nicht zufriedenstellend, sondern scheint primär einer neoliberalen Verwertungslogik unterworfen zu sein (Pels, 2018). Dies kritisierte 2019 auch die Global Indigenous Data Alliance (GIDA)Die Global Indigenous Data Allaince (GIDA) ist ein Netzwerk von Forschenden, Datenpraktiker*innen und politischen Aktivist*innen, die sich dafür einsetzen, dass indigene Gruppen Weiterlesen und entwickelte die CARE-PrinzipienDie CARE-Prinzipien wurden 2019 von der Global Indigenous Data Alliance (GIDA) etabliert. Sie fungieren als Komplement zu den FAIR-Prinzipien und gelten als Hilfswerkzeug, um Forschungskontexte und ihre historische Einbettung sowie Machtasymmetrien im Feld stärker zu fokussieren. Das Akronym steht für Collective Benefit (Gemeinwohl), Authority to Control (Kontrolle der Forschungsteilnehmenden über die eigene Repräsentation), Responsibility (Verantwortung seitens Forschender) und Ethics (Berücksichtigung ethischer Aspekte). Durch die CARE-Prinzipien soll der gerechte, respektvolle und ethische Umgang mit Forschungsteilnehmenden und den aus der Forschung generierten Daten hinsichtlich des Data Sharing betont und berücksichtigt werden. Die CARE-Prinzipien sind somit in allen Phasen des Forschungsdatenlebenzyklus und des Forschungsdatenmanagements relevant. Weiterlesen, die sich als Komplement der FAIR-Prinzipien etablierten und die ethische Lücke füllen sollen, die sich durch Forderung des Data Sharing in der ethnografischen Forschung ergibt (vgl. Artikel zur Forschungsethik und Datenethik; Imeri & Rizzolli, 2022, pp. 1).
Zusammenfassung
Die obigen Abschnitte zusammenfassend lässt sich folgendes festhalten:
- Open Science und die Forderung nach Data Sharing gestaltet sich in den ethnografisch arbeitenden Fächern aufgrund der unwiederholbaren Einzigartigkeit von Feldforschungen und der persönlichen Involvierung des Forschers oder der Forscherin als schwierig.
- Um den Forderungen der OS entgegenzukommen, können allerdings einzelne, losgelöste Datengenres (z. B. in Form quantitativer Daten, Materialien oder Quellen) offen zugänglich gemacht und geteilt werden. Auch qualitative Dokumente sind grundsätzlich teilbar, dies ist aber stets mit einem hohen Ressourcenaufwand verbunden.
- Um Data Sharing nicht nur FAIR, sondern auch ethisch vertretbar zu gestalten, sollten die CARE-Prinzipien mitbedacht und die eigene Positionalität, Macht- und Autoritätsstrukturen bereits in Mitschriften, Dokumentationen und vor allem in der Veröffentlichung reflektiert werden.
Ferner sollten beim Data Sharing folgende Fragen immer beachtet und mitgedacht werden:
- An wen richten sich die veröffentlichten Daten? Wer wird diese, aus welchem Grund lesen/nutzen? Welche Zusatzinformationen werden für das Verständnis benötigt und wie werden diese vermittelt? (vgl. Artikel Archivierung, Nachnutzung, Datendokumentation und Metadaten)
- Sind Teilnehmende der Forschung über die Veröffentlichung informiert und haben sie dieser zugestimmt? (vgl. Artikel Informierte Einwilligung und Rechte und Lizenzen)
- Sind personen- und datenschutzrechtliche Aspekte berücksichtigt? (vgl. Artikel Datenschutz und Rechte und Lizenzen)
- Wurden Teilnehmende hinreichend pseudonymisiert und ist eine Wiedererkennung auszuschließen? (vgl. Artikel Anonymisierung und Pseudonymisierung)
Auf diese Fragen soll das vorliegende Angebot zum Forschungsdatenmanagement in der Sozial- und Kulturanthropologie Antworten geben: Es werden die Maßnahmen und Methoden des FDM vorgestellt, zugleich aber ein Gefühl für die Problematiken und Grenzen von OS vermittelt. Zum einen wird der aktuelle Stand vorherrschender Fachdebatten der Themen des FDM aufgezeigt, wobei viele offene Fragen noch nicht zufriedenstellend beantwortet werden können, zum anderen werden interessierte Nachwuchswissenschaftler*innen, Studierende und Lehrende mit Informationen zum OS sowie praxisorientierten Hinweisen, Übungen und Hilfestellungen unterstützt. Eine sorgfältige Datenpflege, ‑aufarbeitung und ‑organisation ist für jede Forschung relevant. In welcher Form und in welchem Umfang Forscher*innen jedoch ihre Daten teilen und zur Nachnutzung zur Verfügung stellen, müssen sie – je nach Forschungskontext – selbst entscheiden. Je intensiver sich dabei Reflexion und kritischer Austausch über Forschungsdatenmanagement gestalten, desto erfolgreicher können sich zukünftige Forschungen und Datenerhebungen entwickeln.