Logo

Suche in DATA AFFAIRS

AbschnittMethoden: Anonymisierung und Pseudonymisierung

Methoden: Anonymisierung und Pseudonymisierung

Forschende in den ethnografisch arbeitenden Fächern müssen sich grundsätzlich mit Fragen der Pseudonymisierung auseinandersetzen, da „qualitativ Forschende sich in ihrem Erkenntnisinteresse i. d. R. auf sensible Themenbereiche beziehen, die aus der subjektiven Sicht von Befragten rekonstruiert werden. Damit stehen genau die schützenswerten, d. h. zu anonymisierenden persönlichen Angaben zu der eigenen Person und die individuellen Bezüge, Institutionen, Organisationen und Dritten in aller Fülle im Mittelpunkt der Forschung“ (Kretzer, 2013, p. 2).

Eine in der Sozial- und Kulturanthropologie gängige Praxis besteht darin, bei der Niederschrift von Forschungsergebnissen die jeweiligen Eigennamen durch einen anderen Namen (ein Pseudonym) zu ersetzen (Imeri, Klausner & Rizzolli, 2023, p. 243), also aus Marta z. B. Barbara zu machen und soweit als nötig auch andere Identifikationsmerkmale zum Schutz der Forschungspartner*innen oder Dritter, die im Material erwähnt werden, zu verändern. Allerdings ist Letzteres nicht immer ohne weiteres möglich: So kann z. B. nicht immer die Bezeichnung eines bedeutenden Amtes ersetzt oder weggelassen werden, mit der Nennung des Amtes ist aber dann auch der/die jeweilige Amtsinhaber*in zum Forschungszeitpunkt rekonstruierbar.

Eine häufig verwendete Strategie innerhalb der Sozial- und Kulturanthropologie besteht deshalb in der zusätzlichen Verschleierung der konkreten Forschungsorte durch die Nennung fiktiver Ortsnamen, wobei oft auch die Forschungsregionen nicht genauer expliziert werden. Weiter finden im Fach etwa auch Formen und Strategien der Fiktionalisierung Anwendung, wonach personenbezogene Informationen zum Schutz der Forschungspartner*innen durch fiktive Elemente ersetzt, ergänzt und narrativ umgestaltet werden. Durch kreative, an die lokalen Verhältnisse adaptierte Pseudonymisierungen ist Ethnograf*innen eine dichte Beschreibung der von ihnen untersuchten Lebensverhältnisse möglich.

Kaum thematisiert wird aber, dass diese Strategien zwar die Identifikation der Personen durch Dritte – wie die Leser*innen einer Publikation oder die Nachnutzer*innen eines archivierten Datensatzes – erschweren, jedoch innerhalb der untersuchten Gemeinschaften i. d. R. schnell aufgedeckt werden kann, wer sich hinter welchem Pseudonym verbirgt. Dies gilt insbesondere in Bezug auf die oft verwandten Fallstudien (extended case studies)Die Extended-Case Methode (ECM) wurde während der fünfziger und sechziger Jahre des letzten Jahrhunderts in der britischen Sozialanthropologie entwickelt und gehört zu einem der qualitativen Standardverfahren des Faches. Sie lässt sich definieren als die detaillierte Dokumentation und Analyse spezifischer im Feld beobachteter Ereignisse oder Ereignisketten, aus denen sich allgemeine theoretische Prinzipien ableiten lassen. Im Gegensatz zur singulären, zeitlich begrenzten Fallstudie wird mittels der ECM die Verbundenheit mehrerer sozialer Ereignisse über längere Zeiträume hinweg untersucht, in denen dieselben Akteure eine Rolle spielen. Sie bildet damit eine Methode, die es ermöglicht, soziale Aushandlungsprozesse zu erfassen. ECM-Daten bilden in Regel 'dichte Beschreibungen', die zahlreiche sensible Personenbezüge enthalten, weswegen sie besonders sorgfältig geschützt und anonymisiert werden müssen. Weiterlesen, in denen komplexe Ereignisketten rekonstruiert werden. Hier wissen Beteiligte stets, auch wenn Eigen- und Ortsnamen pseudonymisiert wurden, wer die jeweiligen Akteur*innen waren. Ethnograf*innen müssen also gerade bei der Aufbereitung und Repräsentation von Fallstudien äußerst sensibel agieren. Häufig bilden sorgfältige Fiktionalisierungen hier das einzige Mittel, um Datenschutz zu gewährleisten. Pseudonymisierung und Anonymiserung sind folglich keine mechanischen Vorgänge, sondern komplexe und kreative Prozesse. Auch lassen sich Pseudonymisierungen nur schwer innerhalb des ethnografischen Dokumentationsprozesses – also quasi „on the run“ – durchführen, da Ethnograf*innen gerade in Beobachtungsprotokollen (auf deren Basis später in der Analyse z. B. komplexe Fallgeschichten rekonstruiert werden) meist mit den Klarnamen ihrer Forschungsteilnehmenden arbeiten. Diese Praxis hängt damit zusammen, dass Eigennamen starke Identifikatoren sind und Ethnograf*innen die Orientierung in ihrem Material enorm erleichtern, wogegen die Verwendung von Pseudonymen während des Dokumentationsprozesses einen extrem distanzierenden Effekt hat. Die meisten Sozial- und Kulturanthropolog*innen pseudonymisieren ihr Datenmaterial deshalb erst vor der Publikation oder für die Bereitstellung für Archive. Das bedeutet allerdings, dass sie ihr primäres Material besonders gesichert aufbewahren müssen (vgl. Artikel Datenschutz).

Eine besondere Herausforderung bildet der Umgang mit Multimediadaten (Bild, Audio, Video), die sich kaum pseudonymisieren oder anonymisieren lassen, weshalb hier ebenfalls äußerst sorgfältig auf den Datenschutz geachtet werden muss (vgl. Interview mit M. Kramer). Das Forschungsdatenzentrum Qualiservice begegnet diesem Problem, in dem es den Zugang zu Multimediadaten mit Personenbezug stark einschränkt und nur vor Ort in Bremen ermöglicht. Bei Fotos ist das Verpixeln oder Verwischen von Gesichtern in Publikationen zu einer gängigen Praxis geworden, bei Audiodaten lassen sich Stimmen verzerren, was ihnen aber meist einen unschönen Klang gibt. Insgesamt wird die Aussagekraft von Bild- und Tondokumenten durch solche Verfremdungstechniken stark beeinträchtigt, dennoch sind sie in manchen Kontexten unverzichtbar.

Gerade mit Blick auf die in ethnografischen Forschungen immer bedeutsamer werdenden Inhalte von Social-Media-Daten gilt es Fragen der Anonymisierung und Pseudonymisierung besondere Aufmerksamkeit zu schenken.

Hinweise und Tools:

Es gibt verschiedene Softwaretools zur Anonymisierung sowie Pseudonymisierung (z. B. IQDA Qualitative Data Anonymizer oder eAnonymizer), die Daten wie transkribierte Interviews bereits in ihrer Entstehung maschinell pseudonymisieren. Dabei wird betont, dass lediglich Ausschnitte von Interviews in pseudonymisierter Form veröffentlicht werden sollten, damit komplette Gesamtzusammenhänge von Dritten nicht nachvollzogen werden können.

Besonders empfehlenswert ist das vom Forschungsdatenzentrum Qualiservice in Bremen als Open Source Software entwickelte Anonymisierungstool QualiAnon (Nicolai et al., 2021), das bei der Anonymisierung/Pseudonymisierung von Textdaten unterstützt. QualiAnon wurde als Open Source Software entwickelt und kann kostenfrei von Forschenden genutzt werden1 Weiterführende Informationen finden sich im QualiAnon User Manual (Nicolai & Mozygemba, 2023)..

Hilfreiche Hinweise und Beispiele für Verfremdungsstrategien bietet auch der Verbund Forschungsdaten Bildung (Meyermann & Porzelt, 2014).

Literatur

  • Imeri, S., Klausner, M. & Rizzolli, M. (2023). Forschungsdatenmanagement in der ethnografischen Forschung. Eine praktische Einführung. In Kulturanthropologie Notizen 85, S. 223–254. https://doi.org/10.21248/ka-notizen.85.22

  • Kretzer, S. (2013): Arbeitspapier zur Konzeptentwicklung der Anonymisierungs-/Pseudonymisierung in Qualiservice. Open Access Repository. https://www.ssoar.info/ssoar/handle/document/47605

  • Meyermann, A. & Porzelt, M. (2014). Hinweise zur Anonymisierung qualitativer Daten. Frankfurt am Main : DIPF | Leibniz-Institut für Bildungsforschung und Bildungsinformation. (forschungsdaten bildung informiert; 1). doi:10.25656/01:21968

  • Nicolai, T. & Mozygemba, K. (2023). QualiAnon User Manual, v1.3. Qualiservice Technical Report 2-2023. Bremen. https://doi.org/10.26092/elib/2576

  • Nicolai, T. , Mozygemba, K., Kretzer, S. & Hollstein, B. (2021). QualiAnon – Qualiservice Tool for Anonymizing Text Data (version 1.0.1). Qualiservice. University of Bremen. https://github.com/pangaea-data-publisher/qualianon

Nachweise in Data Affairs

Anonymisierung und Pseudonymisierung

Artikel, Lerneinheit