ArtikelAnonymisierung und Pseudonymisierung

Anonymisierung und Pseudonymisierung

Zugehörige Inhalte

In diesem Artikel werden Möglichkeiten besprochen, sensible, personenbezogene Daten durch Maßnahmen der Anonymisierung bzw. Pseudonymisierung aus ethischen Gründen sowie gemäß der europäischen Datenschutzgrundverordnung zu schützen.

Definition

Anonymisierung und Pseudonymisierung werden häufig synonym verwendet, doch sollten beide Begriffe unterschieden werden:

1) Unter Anonymisierung, (die aus dem Griechischen als „Namenslosigkeit“ übersetzt werden kann), versteht man die Verfremdung von Daten mit PersonenbezugPersonenbezogene Daten sind: 'alle Informationen, die sich auf eine identifizierte oder identifizierbare natürliche Person (betroffene Person) beziehen; als identifizierbar wird eine natürliche Person angesehen, die direkt oder indirekt, insbesondere mittels Zuordnung zu einer Kennung wie einem Namen, zu einer Kennnummer, zu Standortdaten, zu einer Online-Kennung oder zu einem oder mehreren besonderen Merkmalen, die Ausdruck der physischen, physiologischen, genetischen, psychischen, wirtschaftlichen, kulturellen oder sozialen Identität dieser Person sind, identifiziert werden kann;...' (EU-DSGVO Artikel 4 Nr. 1, 2016; BDSG §46 Abs. 1, 2018; BlnDSG §31, 2020). Weiterlesen in so weitreichender Form, dass ein Rückschluss auf die Person gar nicht oder nur mit einem unverhältnismässig hohen Aufwand möglich ist. Zentral dabei ist das unwiderrufliche Löschen der Informationen über die betroffenen Personen – Forschungspartner*innen und etwaige Dritte – sodass eine Re-Identifikation und De-Anonymisierung verhindert oder zumindest erschwert wird. Sobald Daten anonymisiert wurden, gelten sie nicht mehr als personenbezogen und fallen – rechtlich gesehen – nicht mehr in den Anwendungsbereich der DSGVO.

2) Auch bei der Pseudonymisierung werden im Prozess der Datenaufbereitung die Personenbezüge ersetzt, umschrieben oder soweit verändert, dass die Betroffenen nicht ohne weiteres, d. h. nicht ohne Hinzuziehung zusätzlicher Informationen re-identifiziert werden können. Anders als bei der Anonymisierung werden die direkt identifizierenden Merkmale wie Namen und Adressen jedoch nicht vernichtet/gelöscht, sondern vom Material getrennt und besonders gesichert verwahrt. Somit bleiben die Personenbezüge rückführbar und die Betroffenen gelten bei pseudonymen Daten im Gegensatz zu anonymen Daten weiterhin als re-identifizierbar.

Datenschutzrechtlich liegt der Unterschied zwischen Pseudonymisierung und Anonymisierung also darin, dass im ersteren Fall Daten über z. B. eine gesonderte Schlüsseldatei Personen wieder zugeordnet werden können, während diese Möglichkeit bei der Anonymisierung ausgeschlossen wird (Imeri, Klausner & Rizolli, 2023, p. 244).

Wichtig ist, dass Verfahren der Anonymisierung bzw. Pseudonymisierung für jedes Forschungsvorhaben entwickelt bzw. an die jeweiligen Feldbedingungen und den Zweck der Anonymisierung/Pseudonymisierung angepasst werden müssen. Durch kreative, an die lokalen Verhältnisse adaptierte Pseudonymisierungen, ist Ethnograf*innen eine dichte Beschreibung der von ihnen untersuchten Lebensverhältnisse möglich.

Eine Sonderform der Pseudonymisierung bildet die Fiktionalisierung, in der personenbezogene Daten zum Schutz der Persönlichkeitsrechte durch fiktive Elemente ersetzt, ergänzt und narrativ umgestaltet werden.

Beispiel für Anonymisierung und Pseudonymisierung

Quelle: Original von Anne Voigt mit CoCoMaterial (nach Lauri, H. & Gush, K. (2019), 2023, lizenziert unter CC BY-SA 4.0
Quelle: Anonymisiertes Beispiel von Anne Voigt mit CoCoMaterial (nach Lauri, H. & Gush, K. (2019), 2023, lizenziert unter CC BY-SA 4.0
Quelle: Pseudonymisiertes Beispiel von Anne Voigt mit CoCoMaterial (nach Lauri, H. & Gush, K. (2019), 2023, lizenziert unter CC BY-SA 4.0

Alternativer Text	Original von Anne Voigt mit CoCoMaterial (nach Lauri, H. & Gush, K. (2019), 2023, lizenziert unter CC BY-SA 4.0
Titel	anonym_pseudonym1
Medienlizenz	CC NY-SA 4.0
Autor*innennachweis	Anne Voigt mit CoCoMaterial
Datum der Veröffentlichung	Dienstag, 28. November 2023
Bildunterschrift	Quelle: Original von Anne Voigt mit CoCoMaterial (nach Lauri, H. & Gush, K. (2019), 2023, lizenziert unter CC BY-SA 4.0

Alternativer Text	Anonymisiertes Beispiel von Anne Voigt mit CoCoMaterial (nach Lauri, H. & Gush, K. (2019), 2023, lizenziert unter CC BY-SA 4.0
Titel	anonym_pseudonym2
Medienlizenz	CC BY-SA 4.0
Autor*innennachweis	Anne Voigt mit CoCoMaterial
Datum der Veröffentlichung	Dienstag, 28. November 2023
Bildunterschrift	Quelle: Anonymisiertes Beispiel von Anne Voigt mit CoCoMaterial (nach Lauri, H. & Gush, K. (2019), 2023, lizenziert unter CC BY-SA 4.0

Alternativer Text	Pseudonymisiertes Beispiel von Anne Voigt mit CoCoMaterial (nach Lauri, H. & Gush, K. (2019), 2023, lizenziert unter CC BY-SA 4.0
Titel	anonym_pseudonym3
Medienlizenz	CC BY-SA 4.0
Autor*innennachweis	Anne Voigt mit CoCoMaterial
Datum der Veröffentlichung	Dienstag, 28. November 2023
Bildunterschrift	Quelle: Pseudonymisiertes Beispiel von Anne Voigt mit CoCoMaterial (nach Lauri, H. & Gush, K. (2019), 2023, lizenziert unter CC BY-SA 4.0

Einführung

In der Sozial- und Kulturanthropologie werden in der Regel personenbezogenePersonenbezogene Daten sind: 'alle Informationen, die sich auf eine identifizierte oder identifizierbare natürliche Person (betroffene Person) beziehen; als identifizierbar wird eine natürliche Person angesehen, die direkt oder indirekt, insbesondere mittels Zuordnung zu einer Kennung wie einem Namen, zu einer Kennnummer, zu Standortdaten, zu einer Online-Kennung oder zu einem oder mehreren besonderen Merkmalen, die Ausdruck der physischen, physiologischen, genetischen, psychischen, wirtschaftlichen, kulturellen oder sozialen Identität dieser Person sind, identifiziert werden kann;...' (EU-DSGVO Artikel 4 Nr. 1, 2016; BDSG §46 Abs. 1, 2018; BlnDSG §31, 2020). Weiterlesen und sensible DatenEinen eigenen Teilbereich innerhalb der personenbezogenen Daten bilden die sog. besonderen Kategorien personenbezogener Daten. Ihre Definition geht auf den EU-DSGVO Artikel 9 Abs. 1, 2016 zurück, der besagt, dass es sich hierbei um Angaben über Weiterlesen erhoben, die im Sinne der europäischen Datenschutzgrundverordnung (DSGVO) geschützt werden müssen. Durch Anonymisierung oder Pseudonymisierung werden Daten von Personenbezügen befreit, was ihre Weiterverarbeitung für eine Publikation sowie ArchivierungArchivierung meint das Aufbewahren und Zugänglichmachen von Forschungsdaten und -materialien. Das Ziel der Archivierung ist es, den Zugang zu Forschungsdaten über einen längeren Zeitraum hinweg zu ermöglichen. So können zum einen archivierte Forschungsdaten durch Dritte für eigene Forschungsfragen als Sekundärdaten nachgenutzt werden. Zum anderen bleiben Forschungsverläufe so nachprüfbar und nachvollziehbar. Daneben gibt es auch die Langzeitarchivierung (LZA), welche die langfristige Nutzbarkeit über einen nicht definierten Zeitraum hinweg sicherstellen soll. Die LZA zielt auf Erhalt der Authentizität, Integrität, Zugänglichkeit und Verständlichkeit von Daten ab. Weiterlesen und NachnutzungEine Nachnutzung, oftmals auch Sekundärnutzung genannt, befragt bereits erhobene und veröffentlichte Forschungsdatensätze erneut mit dem Ziel, andere Erkenntnisse, möglicherweise aus einer neuen oder unterschiedlichen Perspektive, zu erhalten. Die Aufbereitung von Forschungsdaten für eine Nachnutzung erfordert einen erheblich höheren Anonymisierungs-, Aufbereitungs- und Dokumentationsaufwand als die bloße Archivierung im Sinne von Datenspeicherung. Weiterlesen erst rechtmäßig macht, wenn die Einwilligung der betroffenen Personen eine nicht-anonymisierte Verarbeitung und Weitergabe personenbezogener Daten nicht ausdrücklich erlaubt.

Für Sozial- und Kulturanthropolog*innen führen die rechtlichen Erfordernisse der Datenschutzgrundverordnung (vgl. Artikel Datenschutz) einerseits sowie die Wahrung von Präzision, Authentizität und Forschungsfreiheit andererseits oft zu einem Dilemma, denn mit dem Verfremden von personenbezogenen Identifikatoren gehen unter Umständen auch bedeutende Informationen verloren, die für die Nutzbarkeit im Projekt und darüber hinaus wesentlich sind. So lassen sich z. B. je nach Forschungsfrage Faktoren wie Geschlecht, Lebensalter, soziale Position, Beruf, religiöse oder politische Zugehörigkeit etc. nicht ersetzen, ohne dass dies zu einer Verfremdung relevanter sozialer Zusammenhänge führt. Dieses Spannungsverhältnis zwischen einer dichten und transparenten Darlegung der Forschungsabläufe und -erkenntnisse sowie der sozialen und persönlichen Positioniertheit des/der jeweiligen Ethnograf*in im Feld bei dem gleichzeitig notwendigen Schutz der Teilnehmenden und ihrer Persönlichkeitsrechte erfordert forschungskontextuelle und situationsbezogene Lösungen.

Das Anonymisierungskonzept des Forschungsdatenzentrums QualiserviceDas Forschungsdatenzentrum Qualiservice stellt qualitative sozialwissenschaftliche Daten für die wissenschaftliche Nachnutzung zur Verfügung. Vom Rat für Sozial- und Wirtschaftswissenschaften (RatSWD) 2019 akkreditiert, basiert es auf dessen Qualitätssicherungskriterien. Neben der (Nach-)Nutzung von Daten gibt es für Forschende die Möglichkeit, ihre Forschungsdaten zu teilen und zu organisieren. Dabei steht das Team von Qualiservice beratend zur Seite. Qualiservice bekennt sich zu den DFG-Richtlinien zur Sicherung guter wissenschaftlicher Praxis und berücksichtigt darüber hinaus die FAIR Guiding Principles for Scientific Data Management and Stewardship sowie die OECD Principles and Guidelines for Access to Research Data from Public FundingMehr Informationen unter: https://www.qualiservice.org/de/. Weiterlesen ersetzt etwa sensible Informationen durch sozialwissenschaftlich relevante Informationen, um Betroffene zu schützen und gleichzeitig den wissenschaftlichen Analyse- und Nachnutzungswert möglichst hoch zu halten. So werden z. B. konkrete Ortsnamen nicht zu Stadt A oder B, sondern zu Wohnort A oder zu Großstadt in Süddeutschland. Entsprechende Strategien der Abstraktion sollten an die feld- und materialspezifischen Anforderungen und Bedingungen individuell angepasst werden.

Motivation

Die Notwendigkeit, personenbezogene Daten zu anonymisieren oder zu pseudonymisieren, resultiert aus ethischen und datenschutzrechtlichen Vorgaben (DSGVO). Verantwortung und Loyalität gegenüber den Forschungsteilnehmenden verpflichten Forschende ethisch und moralisch dazu, personenbezogene Daten in Absprache mit diesen verantwortungsvoll zu behandeln und zu schützen. Insbesondere sensible DatenEinen eigenen Teilbereich innerhalb der personenbezogenen Daten bilden die sog. besonderen Kategorien personenbezogener Daten. Ihre Definition geht auf den EU-DSGVO Artikel 9 Abs. 1, 2016 zurück, der besagt, dass es sich hierbei um Angaben über Weiterlesen zu Themen wie sexueller Orientierung, politischer Einstellung oder ethnischer Herkunft können je nach Forschungssituation und ‑kontext bei Veröffentlichung enorme (sicherheits-)politische Gefahren und Risiken für Teilnehmende darstellen und erfordern sorgfältige Anonymisierungs- und Pseudonymisierungsstrategien. Darüber hinaus ist es gesetzlich vorgeschrieben, den „Schutz natürlicher Personen bei der Verarbeitung ihrer personenbezogenen Daten“ Der Begriff der 'Verarbeitung' ist definiert als 'jeden mit oder ohne Hilfe automatisierter Verfahren ausgeführten Vorgang oder jede solche Vorgangsreihe im Zusammenhang mit personenbezogenen Daten wie das Erheben, das Erfassen, die Organisation, das Ordnen, die Speicherung, die Anpassung oder Veränderung, das Auslesen, das Abfragen, die Verwendung, die Offenlegung durch Übermittlung, Verbreitung oder eine andere Form der Bereitstellung, den Abgleich oder die Verknüpfung, die Einschränkung, das Löschen oder die Vernichtung;' (BlnDSG §31, 2020; EU-DSGVO Artikel 4 Nr. 2, 2016). Die Verarbeitung bezeichnet also jegliche Form der Arbeit mit personenbezogenen Daten, von der Erhebung bis zur Löschung. Weiterlesen(DSGVO, 2016, Artikel 1) zu gewährleisten und ihr Wohlergehen, ihre Sicherheit und Freiheit nicht zu gefährden. Ein Verstoß gegen diese Verordnung kann strafrechtliche Folgen haben (z. B. können Forschungsteilnehmende gegen ihren Willen veröffentlichte Daten zur Anzeige bringen).

Es sollte jedoch auch berücksichtigt werden, dass Forschungsteilnehmende unter Umständen explizit mit vollem Namen und Identitätsmerkmalen in Publikationen oder Vorträgen genannt werden wollen (vgl. Interview mit A. v. Poser). Dennoch erfordern auch solche Fälle eine sorgfältige Abwägung des Für und Widers.

Die Motivation, personenbezogene Daten zu pseudonymisieren oder bewusst kenntlich zu belassen, sollte in Absprache mit den Teilnehmenden ausgehandelt werden und idealerweise in einer schriftlichen oder mündlichen informierten EinwilligungInformierte Einwilligung (informed consent) meint die Zustimmung der Forschungsteilnehmenden zur Teilnahme an einem Forschungsvorhaben auf der Basis umfangreicher und verständlicher Informationen. Die Ausgestaltung einer informierten Einwilligung muss dabei sowohl ethische Grundsätze als auch datenschutzrechtliche Anforderungen adressieren. Weiterlesen (vgl. Artikel zur informierten Einwilligung) festgehalten werden.

Methoden

Forschende in den ethnografisch arbeitenden Fächern müssen sich grundsätzlich mit Fragen der Pseudonymisierung auseinandersetzen, da „qualitativ Forschende sich in ihrem Erkenntnisinteresse i. d. R. auf sensible Themenbereiche beziehen, die aus der subjektiven Sicht von Befragten rekonstruiert werden. Damit stehen genau die schützenswerten, d. h. zu anonymisierenden persönlichen Angaben zu der eigenen Person und die individuellen Bezüge, Institutionen, Organisationen und Dritten in aller Fülle im Mittelpunkt der Forschung“ (Kretzer, 2013, p. 2).

Eine in der Sozial- und Kulturanthropologie gängige Praxis besteht darin, bei der Niederschrift von Forschungsergebnissen die jeweiligen Eigennamen durch einen anderen Namen (ein Pseudonym) zu ersetzen (Imeri, Klausner & Rizzolli, 2023, p. 243), also aus Marta z. B. Barbara zu machen und soweit als nötig auch andere Identifikationsmerkmale zum Schutz der Forschungspartner*innen oder Dritter, die im Material erwähnt werden, zu verändern. Allerdings ist Letzteres nicht immer ohne weiteres möglich: So kann z. B. nicht immer die Bezeichnung eines bedeutenden Amtes ersetzt oder weggelassen werden, mit der Nennung des Amtes ist aber dann auch der/die jeweilige Amtsinhaber*in zum Forschungszeitpunkt rekonstruierbar.

Eine häufig verwendete Strategie innerhalb der Sozial- und Kulturanthropologie besteht deshalb in der zusätzlichen Verschleierung der konkreten Forschungsorte durch die Nennung fiktiver Ortsnamen, wobei oft auch die Forschungsregionen nicht genauer expliziert werden. Weiter finden im Fach etwa auch Formen und Strategien der Fiktionalisierung Anwendung, wonach personenbezogene Informationen zum Schutz der Forschungspartner*innen durch fiktive Elemente ersetzt, ergänzt und narrativ umgestaltet werden. Durch kreative, an die lokalen Verhältnisse adaptierte Pseudonymisierungen ist Ethnograf*innen eine dichte Beschreibung der von ihnen untersuchten Lebensverhältnisse möglich.

Kaum thematisiert wird aber, dass diese Strategien zwar die Identifikation der Personen durch Dritte – wie die Leser*innen einer Publikation oder die Nachnutzer*innen eines archivierten Datensatzes – erschweren, jedoch innerhalb der untersuchten Gemeinschaften i. d. R. schnell aufgedeckt werden kann, wer sich hinter welchem Pseudonym verbirgt. Dies gilt insbesondere in Bezug auf die oft verwandten Fallstudien (extended case studies)Die Extended-Case Methode (ECM) wurde während der fünfziger und sechziger Jahre des letzten Jahrhunderts in der britischen Sozialanthropologie entwickelt und gehört zu einem der qualitativen Standardverfahren des Faches. Sie lässt sich definieren als die detaillierte Dokumentation und Analyse spezifischer im Feld beobachteter Ereignisse oder Ereignisketten, aus denen sich allgemeine theoretische Prinzipien ableiten lassen. Im Gegensatz zur singulären, zeitlich begrenzten Fallstudie wird mittels der ECM die Verbundenheit mehrerer sozialer Ereignisse über längere Zeiträume hinweg untersucht, in denen dieselben Akteure eine Rolle spielen. Sie bildet damit eine Methode, die es ermöglicht, soziale Aushandlungsprozesse zu erfassen. ECM-Daten bilden in Regel 'dichte Beschreibungen', die zahlreiche sensible Personenbezüge enthalten, weswegen sie besonders sorgfältig geschützt und anonymisiert werden müssen. Weiterlesen, in denen komplexe Ereignisketten rekonstruiert werden. Hier wissen Beteiligte stets, auch wenn Eigen- und Ortsnamen pseudonymisiert wurden, wer die jeweiligen Akteur*innen waren. Ethnograf*innen müssen also gerade bei der Aufbereitung und Repräsentation von Fallstudien äußerst sensibel agieren. Häufig bilden sorgfältige Fiktionalisierungen hier das einzige Mittel, um Datenschutz zu gewährleisten. Pseudonymisierung und Anonymiserung sind folglich keine mechanischen Vorgänge, sondern komplexe und kreative Prozesse. Auch lassen sich Pseudonymisierungen nur schwer innerhalb des ethnografischen Dokumentationsprozesses – also quasi „on the run“ – durchführen, da Ethnograf*innen gerade in Beobachtungsprotokollen (auf deren Basis später in der Analyse z. B. komplexe Fallgeschichten rekonstruiert werden) meist mit den Klarnamen ihrer Forschungsteilnehmenden arbeiten. Diese Praxis hängt damit zusammen, dass Eigennamen starke Identifikatoren sind und Ethnograf*innen die Orientierung in ihrem Material enorm erleichtern, wogegen die Verwendung von Pseudonymen während des Dokumentationsprozesses einen extrem distanzierenden Effekt hat. Die meisten Sozial- und Kulturanthropolog*innen pseudonymisieren ihr Datenmaterial deshalb erst vor der Publikation oder für die Bereitstellung für Archive. Das bedeutet allerdings, dass sie ihr primäres Material besonders gesichert aufbewahren müssen (vgl. Artikel Datenschutz).

Eine besondere Herausforderung bildet der Umgang mit Multimediadaten (Bild, Audio, Video), die sich kaum pseudonymisieren oder anonymisieren lassen, weshalb hier ebenfalls äußerst sorgfältig auf den Datenschutz geachtet werden muss (vgl. Interview mit M. Kramer). Das Forschungsdatenzentrum Qualiservice begegnet diesem Problem, in dem es den Zugang zu Multimediadaten mit Personenbezug stark einschränkt und nur vor Ort in Bremen ermöglicht. Bei Fotos ist das Verpixeln oder Verwischen von Gesichtern in Publikationen zu einer gängigen Praxis geworden, bei Audiodaten lassen sich Stimmen verzerren, was ihnen aber meist einen unschönen Klang gibt. Insgesamt wird die Aussagekraft von Bild- und Tondokumenten durch solche Verfremdungstechniken stark beeinträchtigt, dennoch sind sie in manchen Kontexten unverzichtbar.

Gerade mit Blick auf die in ethnografischen Forschungen immer bedeutsamer werdenden Inhalte von Social-Media-Daten gilt es Fragen der Anonymisierung und Pseudonymisierung besondere Aufmerksamkeit zu schenken.

Hinweise und Tools:

Es gibt verschiedene Softwaretools zur Anonymisierung sowie Pseudonymisierung (z. B. IQDA Qualitative Data Anonymizer oder eAnonymizer), die Daten wie transkribierte Interviews bereits in ihrer Entstehung maschinell pseudonymisieren. Dabei wird betont, dass lediglich Ausschnitte von Interviews in pseudonymisierter Form veröffentlicht werden sollten, damit komplette Gesamtzusammenhänge von Dritten nicht nachvollzogen werden können.

Besonders empfehlenswert ist das vom Forschungsdatenzentrum Qualiservice in Bremen als Open Source Software entwickelte Anonymisierungstool QualiAnon (Nicolai et al., 2021), das bei der Anonymisierung/Pseudonymisierung von Textdaten unterstützt. QualiAnon wurde als Open Source Software entwickelt und kann kostenfrei von Forschenden genutzt werden¹ Weiterführende Informationen finden sich im QualiAnon User Manual (Nicolai & Mozygemba, 2023)..

Hilfreiche Hinweise und Beispiele für Verfremdungsstrategien bietet auch der Verbund Forschungsdaten Bildung (Meyermann & Porzelt, 2014).

Anwendungsbeispiele

Folgende Beispiele aus der ethnografischen Praxis sollen die Schwierigkeiten und Grenzen der Pseudonymisierung im Feld und bei der Publikation untermauern und zeigen, wie Wissenschaftler*innen mit diesen umgehen.

Beispiel 1: Pseudonymisierung, Bodner (2018)

In der Monografie „Berg/Leute. Ethnografie eines ausgebliebenen Bergsturzes am Eiblschrofen bei Schwaz in Tirol 1999“ (Bodner, 2018) behandelt der europäische Ethnologe Reinhard Bodner den Umgang mit Felsstürzen seitens lokaler Anwohner*innen. Die Monographie bietet ausführliche Einblicke in das methodische Vorgehen des Autors im Feld, insbesondere auch in Bezug auf Anonymisierungs- und Pseudonymisierungsstrategien. Bei einem Großteil seiner Interviewpartner*innen verzichtet der Autor auf die Nennung ihres realen Namens, um ihre Persönlichkeitsrechte zu schützen und verwendet stattdessen Pseudonyme bzw. Alias-Namen. Das Vorgehen begründet der Autor wie folgt:

„Lautliche Anklänge an die realen Vor- und Familiennamen wurden vermieden, durch die Verwendung von in Schwaz relativ gängigen Familiennamen versuchte ich aber eine lokale Klangfarbe zu erhalten (bzw. neu herzustellen)" (Bodner, 2018, p.62).

So wurde Franz Müller beispielsweise nicht in Max Müller, Herr X oder die Initialen FM überführt. Vielmehr galt es, das Verfahren der Pseudonymisierung als kreativen Prozess zu verstehen und eine angemessene Balance zwischen dem Schutz der Persönlichkeitsrechte einerseits und dem Informationsgehalt des Datenmaterials andererseits zu finden. So heißen die Gesprächspartner*innen in der Publikation beispielsweise Richard Fuhrmann oder Ingrid Zoller. Namen von öffentlichen Personen wie dem Bürgermeister hingegen werden in der Monographie beibehalten, also nicht pseudonymisiert. Bei medial besonders präsenten Akteur*innen wie einem Sprecher der Bürgerinitiative, der besonders häufig in den Medien vorkommt, lässt der Autor den Vor- und Nachnamen weg, nennt aber seine soziale Funktion.

Das Beispiel zeigt, dass die Pseudonymisierung in Publikationen sehr bedeutsam für die Art der ethnografischen Repräsentation sein kann: Ethnograf*innen nehmen im Zuge der Pseudonymisierung Einfluss auf die Darstellung und damit auch auf die Wahrnehmung der Akteur*innen im Feld durch die Leser*innen. Indem durch den/die Ethnograf*in bestimmte Merkmale von Forschungsteilnehmenden aufgegriffen und betont werden, andere wiederum nicht, werden „Figuren eigenständiger Realität“ (Bodner, 2018, p. 62) geschaffen, was der/dem Forschenden bewusst sein sollte.

Beispiel 2: Fiktionalisierung, Rottenburg (2002)

Ein Beispiel für eine sehr weitreichende Fiktionalisierung bildet das Buch „Weit hergeholte Fakten. Eine Parabel der Entwicklungshilfe“ (2002) des Sozialanthropologen Richard Rottenburg. In diesem Text beschreibt er vermittels literarischer Verfremdung die Ergebnisse seiner Untersuchungen im Bereich der Entwicklungszusammenarbeit im afrikanischen Kontext. Rottenburg arbeitet mit vier erzählerischen Instanzen: Er selbst wird als empirischer Autor lediglich in der Einleitung und im Schlusskapitel sichtbar. Die zweite Instanz bildet die Figur des Ethnografen Eduard B. Drotleff, der als Autor der ersten drei Teile des Buches auftritt und seine Forschungen schildert. Als dritte und vierte erzählerische Instanz kommen noch ein Organisationsethnologe sowie ein lokaler Unternehmer zu Wort. Alle vier Figuren verkörpern andere Rollen und Perspektiven. Durch diese literarische Technik gelingt es Rottenburg den Konstruktionscharakter des Textes zu verdeutlichen. Er begründet seine Entscheidung für diese Fiktionalisierung damit, dass die Benennung realer Akteure den Leser*innen nahelegen würde, „sich an der Frage festzubeißen: ‚Wer ist für die geschilderten Umstände eigentlich verantwortlich?‘ Die Fiktionalisierung soll dem entgegenwirken und die Aufmerksamkeit von Stärken und Schwächen existierender Akteure auf die Bedeutung allgemeiner Strukturprinzipien lenken“ (Rottenburg, 2002, p. 4).

Beispiel 3: Anonymisierung mittels Animation, Gregory Gan (2023)

"Empathy for Concrete Things" ist ein animierter Dokumentarfilm, der 2023 von Gregory Gan veröffentlicht wurde. Der Film beschreibt die Geschichte der Plattenbauarchitektur anhand von Fallstudien der wichtigsten Kunstbewegungen des 20. Jahrhunderts und im Dialog mit fünf bildenden Künstler*innen, die ihre Erfahrungen mit dem Leben und Arbeiten in Plattenbauwohnungen aus der Sowjetära beschreiben. Durch die Verflechtung persönlicher und globaler Geschichten hinterfragt der Film die utopischen Fantasien der Moderne und die Bilder des Kalten Krieges vor dem Hintergrund der aktuellen humanitären und politischen Krisen.
Der Film wurde mit Originalaquarellen visualisiert, um die Erzählungen der Forschungsteilnehmenden mit künstlerischen Mitteln zu interpretieren und gleichzeitig ihre Anonymität zu gewährleisten. Darüber hinaus wurden die Interviews so bearbeitet, dass alle identifizierenden Informationen weggelassen und mit Synchronsprecher*innen neu eingesprochen wurden² Diese Maßnahmen sind für visuelle Anthropologieprojekte eher untypisch, da durch Videos die Forschungsteilnehmenden normalerweise sichtbar werden. Sie waren hier jedoch aus ethischen und datenschutzrechtlichen Gründen notwendig, weil die Äußerungen z. T. politisch sensibel waren..

Beispiel 4: Anonymisierung mittels Aggregation, Asher & Jahnke (2013)

In dem Artikel „Curating the Ethnographic Moment” (Asher & Jahnke, 2013) geht es um Herausforderungen und Praktiken des Forschungsdatenmanagements in Bezug auf Ethik, das Einholen informierter Einwilligungen und Anonymisierungs- sowie Pseudonymisierungsstrategien. Es wurden Forschende zu ihren Erfahrungen befragt. Ein Soziologe beschreibt folgendes Dilemma:

“I wanted to do life histories with priests [in central Pennsylvania], and part of the problem was . . . we got into a situation where people might tell me things about their personal lives that are sort of not confidential in the IRB sense but that might be upsetting to their congregations—like I talked to one priest who had been married three times, where if the congregation had known about that they would have been very upset. There’s nothing illegal about it; this person’s not shy about telling that, but it could have been damaging.” (2-13-111411).

Dieser Auszug enthält einen Hinweis zum Forschungsort Zentral-Pennsylvania. Eine Leserin des Artikels hinterlässt diesbezüglich folgenden Kommentar auf der Webseite:

„I am finding this article to be extremely useful and interesting. However, I noticed this “I wanted to do life histories with priests [in central Pennsylvania]” and I think you should remove the geographic reference. There can’t be that many priests in central Penn. and marriage certificates are public records. By including this geography in your article, you may yourself be compromising the privacy of the potential respondents”.

Die Autor*innen rechtfertigen sich wie folgt: „Your point is well taken. We chose to replace a specific geographic reference (in this case a town) with the more general and nonspecific “central Pennsylvania” in order to retain contextual information while expanding the population of potential people to a large enough degree to make identification difficult. Since “central Pennsylvania” can be used to refer to almost anywhere between Philadelphia and Pittsburgh, it would take a very committed person to compile a list of priests and cross reference it with marriage records–both very difficult tasks, especially since the person in question could have been married anywhere. However, as an added precaution, we have also omitted information about when the researcher was conducting this work and denomination of the priest the researcher was discussing, which further expands the population that would have to be investigated. We therefore believe the risk of identification is very low, but you are correct in noting that researchers and archivists need to be aware that seemingly innocuous details can result in breeches of confidentiality.“

Diskussion

Offene Fragen:

Wie viele sozialwissenschaftlich bedeutsame Informationen gehen durch Verfremdungsstrategien verloren und inwiefern können fiktionalisierte und verfremdete Daten noch sinnvoll nachgenutzt werden?
Lässt sich immer schon vorausschauend entscheiden, welche Informationen sich in Zukunft als risikobehaftet für Forschungsteilnehmende erweisen? „Wir wissen nicht, ob man in zwanzig Jahren die Anonymisierungsstrategien jetzt zurückrechnen kann und […] was für Informationen aus meinem Feld möglicherweise später politisch nutzbar gemacht werden können“ (Behrends et al., 2022, p. 8).
Anonymität kann in vielen Fällen nicht gewährleistet werden, denn oft kann „die Gesamtstruktur persönlicher Angaben selbst, d. h. ihr individuell spezifischer Zusammenhang z. B. im Rahmen der Rekonstruktion einer individuellen Biografie trotz Anonymisierung der Detailinformationen zumindest theoretisch eine Re-Identifikation ermöglichen“ (Kretzer, 2013, p. 3). Wie kann damit umgegangen werden?
Auch muss bedacht werden, dass durch behördlich erteilte und archivierte Forschungsgenehmigungen die Identität sowie die Forschungsorte von Ethnograf*innen rekonstruiert werden können. Wie sicher sind dann Pseudonymisierungsstrategien?
Die fortschreitende Digitalisierung macht es zusehends schwieriger, Anonymität herzustellen und erfordert ein sorgfältiges Abwägen der verwendeten Aufzeichnungsstrategien im Feld (vgl. Interview mit M. Kramer; Shklovski & Vertesi, 2013; Bachmann et al., 2017). Sind sichere Formen der Anonymisierung und Pseudonymisierung in digital vernetzten Welten noch erreichbar?

Tools

Praktische Hilfestellung zur Anonymisierung und Pseudonymisierung qualitativer Forschungsdaten bieten:

Anonymisierungstool QualiAnon zur teilautomatisierten Anonymisierung von textbasierten Daten:
https://www.qualiservice.org/de/helpdesk/webinar/tools.html
und die zugehörige Handreichung von Mozygemba und Hollstein (2023):
User Manual: QualiAnon – Tool for the anonymization of text data (v1.3)

Endnoten

1
Weiterführende Informationen finden sich im QualiAnon User Manual (Nicolai & Mozygemba, 2023).
2
Diese Maßnahmen sind für visuelle Anthropologieprojekte eher untypisch, da durch Videos die Forschungsteilnehmenden normalerweise sichtbar werden. Sie waren hier jedoch aus ethischen und datenschutzrechtlichen Gründen notwendig, weil die Äußerungen z. T. politisch sensibel waren.

Literatur und Quellenangaben

American Anthropological Association. (AAA, 2004). Statement on Ethnography and Institutional Review Boards. Adopted by AAA Executive Board. American Anthropological Association. Advancing Knowledge, Solving Human Problems. https://www.americananthro.org/ParticipateAndAdvocate/Content.aspx?ItemNumber=1652
Asher, A. & Jahnke, L. M. (2013). Curating the Ethnographic Moment. Archive Journal. http://www.archivejournal.net/essays/curating-the-ethnographic-moment/
Bachmann, G., Knecht, M. & Wittel, A. (2017): The Social Productivity of Anonymity. Introduction. In: Ephemera: Theory & Politics in Organization 17/2, 241–258. https://irep.ntu.ac.uk/id/eprint/31952/1/PubSub9418_Wittel.pdf
Behrends, A.; Knecht, M.; Liebelt, C.; Pauli, J.; Rao, U.; Rizzolli, M.; Röttger-Rössler, B.; Stodulka, T. and Zenker, O. (eds.) (2022). Zur Teilbarkeit ethnographischer Forschungsdaten. Oder: Wie viel Privatheit braucht ethnographische Forschung? Ein Gedankenaustausch. SFB 1171 ‚Affective Societies‘ Working Paper Nr. 01/22. http://dx.doi.org/10.17169/refubium-35157.2
Bodner, R. (2018): Berg/Leute. Ethnografie eines ausgebliebenen Bergsturzes am Eiblschrofen bei Schwaz in Tirol (1999). Dissertation.
Europäische Datenschutz-Grundverordnung. (EU-DSGVO, 2016). Verordnung (EU) 2016/679 des Europäischen Parlaments und des Rates vom 27. April 2016. intersoft consulting. https://dsgvo-gesetz.de
Imeri, S., Klausner, M. & Rizzolli, M. (2023). Forschungsdatenmanagement in der ethnografischen Forschung. Eine praktische Einführung. In Kulturanthropologie Notizen 85, S. 223–254. https://doi.org/10.21248/ka-notizen.85.22
Kretzer, S. (2013): Arbeitspapier zur Konzeptentwicklung der Anonymisierungs-/Pseudonymisierung in Qualiservice. Open Access Repository. https://www.ssoar.info/ssoar/handle/document/47605
Laurie, H. & Gush, K. (2019). Understanding Couples‘ Experiences of Job Loss in Recessionary Britain: a Linked Qualitative Study, 2008-2013: Special Licence Access. [data collection]. UK Data Service. SN: 7657. http://doi.org/10.5255/UKDA-SN-7657-1
Meyermann, A. & Porzelt, M. (2014). Hinweise zur Anonymisierung qualitativer Daten. Frankfurt am Main : DIPF | Leibniz-Institut für Bildungsforschung und Bildungsinformation. (forschungsdaten bildung informiert; 1). https://doi.org/10.25656/01:21968
Mozygemba, K. & Hollstein, B. (2023). Anonymisierung und Pseudonymisierung qualitativer textbasierter Forschungsdaten – eine Handreichung. Qualiservice Working Papers, 5. Bremen. Forschungsdatenzentrum Qualiservice. https://doi.org/10.26092/elib/2525
Nicolai, T. & Mozygemba, K. (2023). QualiAnon User Manual, v1.3. Qualiservice Technical Report 2-2023. Bremen. https://doi.org/10.26092/elib/2576
Nicolai, T. , Mozygemba, K., Kretzer, S. & Hollstein, B. (2021). QualiAnon – Qualiservice Tool for Anonymizing Text Data (version 1.0.1). Qualiservice. University of Bremen. https://github.com/pangaea-data-publisher/qualianon
Rottenburg, R. (2002). Weit hergeholte Fakten: Eine Parabel der Entwicklungshilfe. Berlin, Boston: De Gruyter Oldenbourg. https://doi.org/10.1515/9783110508505
Shklovski, I. & Vertesi, J. (2013). Un-Googling Publications. The Ethics and Problems of Anonymization. In CHI’13 Extended Abstracts on Human Factors in Computing Systems 2169–2178. ACM Digital Library. https://doi.org/10.1145/2468356.2468737

Weitere Literatur

Antes, A. L., Walsh, H. A., Strait, M., Hudson-Vitale, C. R. & DuBois, J. M. (2018). Examining Data Repository Guidelines for Qualitative Data Sharing. Journal of empirical re-search on human research ethics : JERHRE, 13(1), 61–73. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5953419/
Lenk, C., Duttge, G., Fangerau, H. (Hrgs.) (2014): Handbuch Ethik und Recht der Forschung am Menschen. Springer Berlin Heidelberg.
Marnau, N. (2016). Anonymisierung, Pseudonymisierung und Transparenz für Big Data. Datenschutz Datensicherheit – DuD, 40, 428–433. https://doi.org/10.1007/s11623-016-0631-9
Schaar, P. (2014). Anonymisieren und Pseudonymisieren als Möglichkeit der Forschung mit sensiblen, personenbezogenen Forschungsdaten. In: Lenk, Christian; Duttge, Gunnar; Fangerau, Heiner (Eds.) Handbuch Ethik und Recht der Forschung am Menschen (95-100). Springer Berlin Heidelberg.

Zitierweise

Heldt, C. & Röttger-Rössler, B. (2023). Anonymisierung und Pseudonymisierung. In Data Affairs. Datenmanagement in der ethnografischen Forschung. SFB 1171 & Center für Digitale Systeme, Freie Universität Berlin. https://data-affairs.affective-societies.de/artikel/anonymisierung-und-pseudonymisierung/

Metadaten

Creative Commons Lizenztyp	Attribution ShareAlike CC BY-SA (4.0)
Version	1.0
Autor*innen	Heldt, C. Röttger-Rössler, B.
Schlagworte	Anonymisierung Datenschutz Datenschutzgrundverordnung Ethik Pseudonymisierung
Glossareinträge	Archivierung Besondere Kategorien personenbezogener Daten Data Sharing Extended Case Studies/Fallstudien Forschungsdatenzentrum Qualiservice Informierte Einwilligung Nachnutzung Personenbezogene Daten Sensible Daten Verarbeitung personenbezogener Daten
Verwandte Artikel	Datenschutz Informierte Einwilligung
Zugehörige Inhalte	Lerneinheit

Suche in DATA AFFAIRS