Glossar

77 Einträge

No entries found for this filter combination.

Bei analogen Forschungsmaterialien handelt es sich um Artefakte oder Gegenstände des rituellen oder alltäglichen Gebrauchs. Sie werden während ethnografischen Feldforschungen angefertigt oder gesammelt und können außerdem als Fotos, Notizen, Bücher, Tonbänder, Zeichnungen oder Plastiken vorliegen. Um sie online nachnutzbar zu machen, müssen die Materialien zunächst digitalisiert und mit entsprechenden Metadaten versehen werden, damit sie z. B. in einem Repositorium zur Verfügung gestellt werden können (Forschungsdaten.info, 2023). Die Organisation OpenAIRE liefert zum sicheren Umgang mit analogen, nicht-digitalen Forschungsdaten eine Handreichung¹siehe: https://www.openaire.eu/non-digital-data-guide.
Verwandte Glossareinträge	Digitale Daten/Digitalisierung

Bei analogen Forschungsmaterialien handelt es sich um Artefakte oder Gegenstände des rituellen oder alltäglichen Gebrauchs. Sie werden während ethnografischen Feldforschungen angefertigt oder gesammelt und können außerdem als Fotos, Notizen, Bücher, Tonbänder, Zeichnungen oder Plastiken vorliegen. Um sie online nachnutzbar zu machen, müssen die Materialien zunächst digitalisiert und mit entsprechenden Metadaten versehen werden, damit sie z. B. in einem Repositorium zur Verfügung gestellt werden können (Forschungsdaten.info, 2023). Die Organisation OpenAIRE liefert zum sicheren Umgang mit analogen, nicht-digitalen Forschungsdaten eine Handreichung¹siehe: https://www.openaire.eu/non-digital-data-guide.

Verwandte Glossareinträge

Digitale Daten/Digitalisierung

Anonymisierung

Laut Bundesdatenschutzgesetz (BDSG § 3, Abs. 6 in der bis 24.05.2018 gültigen Fassung) versteht man unter Anonymisierung alle Maßnahmen der Veränderung personenbezogener Daten derart, „dass die Einzelangaben über persönliche oder sachliche Verhältnisse nicht mehr oder nur mit einem unverhältnismäßig großen Aufwand an Zeit, Kosten und Arbeitskraft einer bestimmten oder bestimmbaren natürlichen Person zugeordnet werden können.“ Anonymisierte Daten sind demnach Daten, die keinen Rückschluss (mehr) auf die betroffene Person geben. Sie unterliegen damit nicht dem Datenschutz bzw. der Datenschutz-Grundverordnung (DSGVO).
Verwandte Glossareinträge	Datenschutz Personenbezogene Daten Pseudonymisierung Verarbeitung personenbezogener Daten

Laut Bundesdatenschutzgesetz (BDSG § 3, Abs. 6 in der bis 24.05.2018 gültigen Fassung) versteht man unter Anonymisierung alle Maßnahmen der Veränderung personenbezogener Daten derart, „dass die Einzelangaben über persönliche oder sachliche Verhältnisse nicht mehr oder nur mit einem unverhältnismäßig großen Aufwand an Zeit, Kosten und Arbeitskraft einer bestimmten oder bestimmbaren natürlichen Person zugeordnet werden können.“ Anonymisierte Daten sind demnach Daten, die keinen Rückschluss (mehr) auf die betroffene Person geben. Sie unterliegen damit nicht dem Datenschutz bzw. der Datenschutz-Grundverordnung (DSGVO).

Verwandte Glossareinträge

Archivierung

Archivierung meint das Aufbewahren und Zugänglichmachen von Forschungsdaten und -materialien. Das Ziel der Archivierung ist es, den Zugang zu Forschungsdaten über einen längeren Zeitraum hinweg zu ermöglichen. So können zum einen archivierte Forschungsdaten durch Dritte für eigene Forschungsfragen als Sekundärdaten nachgenutzt werden. Zum anderen bleiben Forschungsverläufe so nachprüfbar und nachvollziehbar. Daneben gibt es auch die Langzeitarchivierung (LZA), welche die langfristige Nutzbarkeit über einen nicht definierten Zeitraum hinweg sicherstellen soll. Die LZA zielt auf Erhalt der Authentizität, Integrität, Zugänglichkeit und Verständlichkeit von Daten ab. In vielen Fachdisziplinen hat sich eine mindestens zehnjährige Aufbewahrungsfrist von Forschungsdaten als Standard etabliert. Weil dieser Zeitraum von technischen Veränderungen betroffen sein kann, bedarf es einer regelmäßigen Überprüfung der Daten im Hinblick auf ihre Erhaltung und Nutzbarkeit.
Verwandte Glossareinträge	Nachnutzung

Archivierung meint das Aufbewahren und Zugänglichmachen von Forschungsdaten und -materialien. Das Ziel der Archivierung ist es, den Zugang zu Forschungsdaten über einen längeren Zeitraum hinweg zu ermöglichen. So können zum einen archivierte Forschungsdaten durch Dritte für eigene Forschungsfragen als Sekundärdaten nachgenutzt werden. Zum anderen bleiben Forschungsverläufe so nachprüfbar und nachvollziehbar. Daneben gibt es auch die Langzeitarchivierung (LZA), welche die langfristige Nutzbarkeit über einen nicht definierten Zeitraum hinweg sicherstellen soll. Die LZA zielt auf Erhalt der Authentizität, Integrität, Zugänglichkeit und Verständlichkeit von Daten ab.

In vielen Fachdisziplinen hat sich eine mindestens zehnjährige Aufbewahrungsfrist von Forschungsdaten als Standard etabliert. Weil dieser Zeitraum von technischen Veränderungen betroffen sein kann, bedarf es einer regelmäßigen Überprüfung der Daten im Hinblick auf ihre Erhaltung und Nutzbarkeit.

Verwandte Glossareinträge

Nachnutzung

Backup

Der Begriff Backup bedeutet Datensicherung beziehungsweise Datenrettung und bezeichnet das Kopieren von Daten als Vorsorge für den Fall, dass es durch einen Schaden z. B. an der Festplatte oder durch versehentliches Löschen zu Datenverlusten kommt. Mit einem Backup können die Daten wiederhergestellt werden. Dafür wird der Datensatz auf einem anderen Datenträger zusätzlich gesichert (Sicherungskopie) und offline oder online abgelegt.
Verwandte Glossareinträge	Datenspeicherung

Der Begriff Backup bedeutet Datensicherung beziehungsweise Datenrettung und bezeichnet das Kopieren von Daten als Vorsorge für den Fall, dass es durch einen Schaden z. B. an der Festplatte oder durch versehentliches Löschen zu Datenverlusten kommt. Mit einem Backup können die Daten wiederhergestellt werden. Dafür wird der Datensatz auf einem anderen Datenträger zusätzlich gesichert (Sicherungskopie) und offline oder online abgelegt.

Verwandte Glossareinträge

Datenspeicherung

Besondere Kategorien personenbezogener Daten

Einen eigenen Teilbereich innerhalb der personenbezogenen Daten bilden die sog. besonderen Kategorien personenbezogener Daten. Ihre Definition geht auf den EU-DSGVO Artikel 9 Abs. 1, 2016 zurück, der besagt, dass es sich hierbei um Angaben über ethnische Herkunft (z. B. Hautfarbe) politische Meinungen (z. B. Mitgliedschaft in einer politischen Partei) religiöse oder weltanschauliche Überzeugungen (z. B. Zugehörigkeit zu einer Religionsgemeinschaft) Gewerkschaftszugehörigkeit Gesundheit (z. B. Krankheit) Sexualleben und sexueller Orientierung (z. B. Besuch entsprechender Lokale) der Betroffenen handelt. Hierunter fallen auch genetische und biometrische Daten (z. B. Fingerabdruck) zur Identifizierung einer natürlichen Person. Laut Datenschutz-Grundverordnung gelten diese Angaben als „sensibel“, weil ihre Erhebung, Verarbeitung oder Nutzung erhebliche Risiken für die Betroffenen mit sich bringen kann. Sie unterliegen daher besonderen Pflichten und Verarbeitungsbedingungen. Grundsätzlich gilt, dass zur Verarbeitung personenbezogener Daten das Einverständnis der betroffenen Personen einzuholen ist. Ausnahmen gelten, wenn die Daten von der betroffenen Person selbst öffentlich gemacht wurden oder ein erhebliches öffentliches Interesse besteht (EU-DSGVO Artikel 9 Abs. 2, 2016). Gerade in ethnografischen Forschungsvorhaben entstehen regelmäßig personenbezogene Daten, die laut Datenschutz-Grundverordnung in hohem Maße als sensibel gelten.
Synonyme Glossareinträge	Sensible Daten
Verwandte Glossareinträge	Datenschutz Personenbezogene Daten Verarbeitung personenbezogener Daten

Einen eigenen Teilbereich innerhalb der personenbezogenen Daten bilden die sog. besonderen Kategorien personenbezogener Daten. Ihre Definition geht auf den EU-DSGVO Artikel 9 Abs. 1, 2016 zurück, der besagt, dass es sich hierbei um Angaben über

ethnische Herkunft (z. B. Hautfarbe)
politische Meinungen (z. B. Mitgliedschaft in einer politischen Partei)
religiöse oder weltanschauliche Überzeugungen (z. B. Zugehörigkeit zu einer Religionsgemeinschaft)
Gewerkschaftszugehörigkeit
Gesundheit (z. B. Krankheit)
Sexualleben und sexueller Orientierung (z. B. Besuch entsprechender Lokale)

der Betroffenen handelt. Hierunter fallen auch genetische und biometrische Daten (z. B. Fingerabdruck) zur Identifizierung einer natürlichen Person. Laut Datenschutz-Grundverordnung gelten diese Angaben als „sensibel“, weil ihre Erhebung, Verarbeitung oder Nutzung erhebliche Risiken für die Betroffenen mit sich bringen kann. Sie unterliegen daher besonderen Pflichten und Verarbeitungsbedingungen. Grundsätzlich gilt, dass zur Verarbeitung personenbezogener Daten das Einverständnis der betroffenen Personen einzuholen ist. Ausnahmen gelten, wenn die Daten von der betroffenen Person selbst öffentlich gemacht wurden oder ein erhebliches öffentliches Interesse besteht (EU-DSGVO Artikel 9 Abs. 2, 2016).

Gerade in ethnografischen Forschungsvorhaben entstehen regelmäßig personenbezogene Daten, die laut Datenschutz-Grundverordnung in hohem Maße als sensibel gelten.

Synonyme Glossareinträge

Sensible Daten

Verwandte Glossareinträge

CARE-Prinzipien

Die CARE-Prinzipien wurden 2019 von der Global Indigenous Data Alliance (GIDA) etabliert. Sie fungieren als Komplement zu den FAIR-Prinzipien und gelten als Hilfswerkzeug, um Forschungskontexte und ihre historische Einbettung sowie Machtasymmetrien im Feld stärker zu fokussieren. Das Akronym steht für Collective Benefit (Gemeinwohl), Authority to Control (Kontrolle der Forschungsteilnehmenden über die eigene Repräsentation), Responsibility (Verantwortung seitens Forschender) und Ethics (Berücksichtigung ethischer Aspekte). Durch die CARE-Prinzipien soll der gerechte, respektvolle und ethische Umgang mit Forschungsteilnehmenden und den aus der Forschung generierten Daten hinsichtlich des Data Sharing betont und berücksichtigt werden. Die CARE-Prinzipien sind somit in allen Phasen des Forschungsdatenlebenzyklus und des Forschungsdatenmanagements relevant.
Verwandte Glossareinträge	FAIR-Prinzipien Global Indigenous Data Alliance (GIDA)

Die CARE-Prinzipien wurden 2019 von der Global Indigenous Data Alliance (GIDA) etabliert. Sie fungieren als Komplement zu den FAIR-Prinzipien und gelten als Hilfswerkzeug, um Forschungskontexte und ihre historische Einbettung sowie Machtasymmetrien im Feld stärker zu fokussieren. Das Akronym steht für Collective Benefit (Gemeinwohl), Authority to Control (Kontrolle der Forschungsteilnehmenden über die eigene Repräsentation), Responsibility (Verantwortung seitens Forschender) und Ethics (Berücksichtigung ethischer Aspekte). Durch die CARE-Prinzipien soll der gerechte, respektvolle und ethische Umgang mit Forschungsteilnehmenden und den aus der Forschung generierten Daten hinsichtlich des Data Sharing betont und berücksichtigt werden. Die CARE-Prinzipien sind somit in allen Phasen des Forschungsdatenlebenzyklus und des Forschungsdatenmanagements relevant.

Verwandte Glossareinträge

Creative-Commons-Lizenzen (CC-Lizenzen)

Creative-Commons-Lizenzen sind von der Non-Profit-Organisation Creative Commons vorgefertigte Lizenzverträge, mit denen die Urheberrechtsinhabenden der Öffentlichkeit die Nutzungsrechte am eigenen kreativen Werk einräumen können. Sobald ein unter CC-Lizenz stehendes Werk im Sinne des Lizenzvertrages von Dritten genutzt wird, kommt der Vertrag zustande (TUM, 2023, p. 5). Die bestehenden Lizenzen sind aufgrund des standardisierten Baukastenprinzips auch ohne juristisches Wissen leicht nachvollziehbar, mit über 2 Milliarden CC-lizenzierten Werken weit verbreitet und unterstützen die Kultur des Teilens und Wiederverwendens. Sie sind sowohl menschen- als auch maschinenlesbar (Creative Commons, 2023a; 2023b). Die einzelnen Bausteine legen jeweils eine Bedingung für die Wiederverwendung fest, werden mit Symbolen visualisiert und haben einen hohen Wiedererkennungswert, sodass Nachnutzende schnell verstehen, was sie bei einer Wiederverwendung beachten müssen. Aus den Bausteinen setzen sich dann die weltweit rechtsgültigen Lizenzverträge zusammen. BAUSTEINE BY Attribution – Der Name desder Urheberin muss genannt werden. NC Non-Commercial – Das Werk darf nicht kommerziell verwertet werden. ND No Derivates – Das Werk darf nicht verändert werden. SA Share Alike – Weitergabe des Werkes muss unter gleichen Bedingungen (Lizenz) erfolgen. Aus diesen setzen sich die sechs Lizenzen zusammen (Creative Commons, 2023b).
Verwandte Glossareinträge	Lizenzvertrag/Lizenzierung Open Data

Creative-Commons-Lizenzen sind von der Non-Profit-Organisation Creative Commons vorgefertigte Lizenzverträge, mit denen die Urheberrechtsinhabenden der Öffentlichkeit die Nutzungsrechte am eigenen kreativen Werk einräumen können. Sobald ein unter CC-Lizenz stehendes Werk im Sinne des Lizenzvertrages von Dritten genutzt wird, kommt der Vertrag zustande (TUM, 2023, p. 5).

Die bestehenden Lizenzen sind aufgrund des standardisierten Baukastenprinzips auch ohne juristisches Wissen leicht nachvollziehbar, mit über 2 Milliarden CC-lizenzierten Werken weit verbreitet und unterstützen die Kultur des Teilens und Wiederverwendens. Sie sind sowohl menschen- als auch maschinenlesbar (Creative Commons, 2023a; 2023b).

Die einzelnen Bausteine legen jeweils eine Bedingung für die Wiederverwendung fest, werden mit Symbolen visualisiert und haben einen hohen Wiedererkennungswert, sodass Nachnutzende schnell verstehen, was sie bei einer Wiederverwendung beachten müssen. Aus den Bausteinen setzen sich dann die weltweit rechtsgültigen Lizenzverträge zusammen.

BAUSTEINE

BY Attribution – Der Name des*der Urheber*in muss genannt werden.

NC Non-Commercial – Das Werk darf nicht kommerziell verwertet werden.

ND No Derivates – Das Werk darf nicht verändert werden.

SA Share Alike – Weitergabe des Werkes muss unter gleichen Bedingungen (Lizenz) erfolgen.

Aus diesen setzen sich die sechs Lizenzen zusammen (Creative Commons, 2023b).

Verwandte Glossareinträge

Data Journal

Data Journals bieten analog zu klassischen wissenschaftlichen Zeitschriften die Möglichkeit, Forschungsdaten mit Peer-Review-Prozess zu publizieren. Data Journals werden von Verlagen herausgebracht und sind in der Regel mit Kosten für die Lesenden oder Autor*innen verbunden.

Data Sharing

Data Sharing meint das Teilen bzw. Weitergeben von Daten. Dabei gilt es gemäß den entsprechenden Anforderungen der Forschung, die Daten so offen wie möglich und so geschlossen wie nötig (Europäische Kommission, 2021) darzulegen und zur Verfügung zu stellen. Insbesondere im Hinblick auf die Nachnutzung und den Umgang mit sensiblen, personenbezogenen Daten muss gründlich überprüft werden, ob und in welcher Form das Archivieren und Teilen von Daten mit anderen Wissenschaftler*innen und der Öffentlichkeit möglich und sinnvoll ist. Der Imperativ des Data Sharing bildet im Rahmen der Open-Science-Bewegung einen breiten Konsens in der Wissenschaft, ist aber aus sozial- und kulturanthropologischer Sichtweise kritisch zu betrachten und abzuwägen.
Verwandte Glossareinträge	Open Science Open-Science-Bewegung

Data Sharing meint das Teilen bzw. Weitergeben von Daten. Dabei gilt es gemäß den entsprechenden Anforderungen der Forschung, die Daten so offen wie möglich und so geschlossen wie nötig (Europäische Kommission, 2021) darzulegen und zur Verfügung zu stellen. Insbesondere im Hinblick auf die Nachnutzung und den Umgang mit sensiblen, personenbezogenen Daten muss gründlich überprüft werden, ob und in welcher Form das Archivieren und Teilen von Daten mit anderen Wissenschaftler*innen und der Öffentlichkeit möglich und sinnvoll ist. Der Imperativ des Data Sharing bildet im Rahmen der Open-Science-Bewegung einen breiten Konsens in der Wissenschaft, ist aber aus sozial- und kulturanthropologischer Sichtweise kritisch zu betrachten und abzuwägen.

Verwandte Glossareinträge

Dateibenennung

Der Dateiname identifiziert in Verbindung mit dem zur Datei führenden Verzeichnispfad eine Datei eindeutig. Er besteht aus der eigentlichen Benennung und der Erweiterung oder Endung. Die Erweiterung gibt Hinweise auf die Dateiart (Text, Bild, Video) und den Typ (.docx für Textdatei, .mp4 für Videodateien oder .png für Bilddateien) und bestimmt auch, in welchem Programm die Datei standardmäßig geöffnet wird.
Synonyme Glossareinträge	Dateiname
Verwandte Glossareinträge	Dateiformat Dateityp

Der Dateiname identifiziert in Verbindung mit dem zur Datei führenden Verzeichnispfad eine Datei eindeutig. Er besteht aus der eigentlichen Benennung und der Erweiterung oder Endung. Die Erweiterung gibt Hinweise auf die Dateiart (Text, Bild, Video) und den Typ (.docx für Textdatei, .mp4 für Videodateien oder .png für Bilddateien) und bestimmt auch, in welchem Programm die Datei standardmäßig geöffnet wird.

Synonyme Glossareinträge

Dateiname

Verwandte Glossareinträge

Dateiendung

Die Dateiendung gibt an, um welche Art von Datei es sich handelt (Dokument, Bild, Video, etc.) und in welchem Format sie gespeichert ist. Die Dateiendung bestimmt auch, mit welchem Programm die Datei standardmäßig geöffnet wird. Sie sollte unbedingt dem tatsächlichen Dateityp entsprechen und nicht geändert werden.

Typ	Endung
Textdokument	.doc, .docx, .odt, .ott, …
Tabelle	.xls, .xlsx, .ods, .ots, …
Präsentation	.ppt, .pptx, .odp, .otp, …
PDF-Dokument	.pdf
Reine Textdatei	.txt
Bild	.jpg, .jpeg, .png, .gif, .bmp, …
Video	.mp4, .mkv, .webm, .avi, .wmv, .3gp, …
Audio	.mp3, .wma, .aac, .flac, …
Webseite	.htm, .html, .xhtml, …
E-Mail	.eml

Synonyme Glossareinträge

Dateierweiterung

Verwandte Glossareinträge

Dateierweiterung

Typ	Endung
Textdokument	.doc, .docx, .odt, .ott, …
Tabelle	.xls, .xlsx, .ods, .ots, …
Präsentation	.ppt, .pptx, .odp, .otp, …
PDF-Dokument	.pdf
Reine Textdatei	.txt
Bild	.jpg, .jpeg, .png, .gif, .bmp, …
Video	.mp4, .mkv, .webm, .avi, .wmv, .3gp, …
Audio	.mp3, .wma, .aac, .flac, …
Webseite	.htm, .html, .xhtml, …
E-Mail	.eml

Synonyme Glossareinträge

Dateiendung

Verwandte Glossareinträge

Dateiformat

Die Begriffe Dateitypen und Dateiformate werden meist synonym verwendet. Es wird zwischen proprietären und offenen Dateiformaten unterschieden. Für proprietäre Formate braucht man meist eine kostenpflichtige Software, da diese von anderen Programmen nicht zu öffnen oder zu lesen sind, wie etwa Powerpoint für .ppt- oder Photoshop für .psd-Dateien. Offene Formate wie .rft oder .png dagegen basieren auf Standards und können von vielen Programmen geöffnet werden.

Zu archivierende Forschungsdaten sollten in folgenden Formaten bereitgestellt werden (Biernacka et al., 2021):

Dateiformate für	Empfehlung	Vermeiden
Bilddateien	TIFF, JPEG2000, PNG	GIF, JPG
Text	TXT, HTML, RTF, PDF/A, DOCX	DOC, PDF
Tabellen	CSV, TSV, SPSS portable, XLSX	XLS, SPSS
Multimedia	Container: MPEG4, MKV Codec: Theora, Dirac, FLAC	QuickTime, Flash

Eine ausführliche Übersicht aller geeigneten Datenformate und ihrer Tauglichkeit sowie Konvertierungsempfehlungen ist aufgelistet unter: https://forschungsdaten.info/themen/veroeffentlichen-und-archivieren/formate-erhalten/.

Synonyme Glossareinträge

Dateityp

Verwandte Glossareinträge

Dateiname

Der Dateiname identifiziert in Verbindung mit dem zur Datei führenden Verzeichnispfad eine Datei eindeutig. Er besteht aus der eigentlichen Benennung und der Erweiterung oder Endung. Die Erweiterung gibt Hinweise auf die Dateiart (Text, Bild, Video) und den Typ (.docx für Worddatei, .mp4 für Videodateien oder .png für Bilddateien) und bestimmt auch, in welchem Programm die Datei standardmäßig geöffnet wird.
Synonyme Glossareinträge	Dateibenennung
Verwandte Glossareinträge	Dateiendung Dateierweiterung Dateiformat Dateityp

Der Dateiname identifiziert in Verbindung mit dem zur Datei führenden Verzeichnispfad eine Datei eindeutig. Er besteht aus der eigentlichen Benennung und der Erweiterung oder Endung. Die Erweiterung gibt Hinweise auf die Dateiart (Text, Bild, Video) und den Typ (.docx für Worddatei, .mp4 für Videodateien oder .png für Bilddateien) und bestimmt auch, in welchem Programm die Datei standardmäßig geöffnet wird.

Synonyme Glossareinträge

Dateibenennung

Verwandte Glossareinträge

Dateityp

Zu archivierende Forschungsdaten sollten in folgenden Formaten bereitgestellt werden (Biernacka et. al., 2021):

Dateiformate für	Empfehlung	Vermeiden
Bilddateien	TIFF, JPEG2000, PNG	GIF, JPG
Text	TXT, HTML, RTF, PDF/A, DOCX	DOC, PDF
Tabellen	CSV, TSV, SPSS portable, XLSX	XLS, SPSS
Multimedia	Container: MPEG4, MKV Codec: Theora, Dirac, FLAC	QuickTime, Flash

Synonyme Glossareinträge

Dateiformat

Verwandte Glossareinträge

Daten (in der ethnografischen Forschung)

Als Forschungsdaten werden sämtliche in wissenschaftlichen Forschungsprozessen analog sowie digital erhobenen Informationen bezeichnet. Diese werden in der Sozial- und Kulturanthropologie größtenteils, aber nicht ausschließlich, im Rahmen stationärer Feldforschungen gewonnen und sind methodologisch durch die teilnehmende Beobachtung geprägt. Das heißt, sie werden in sozialen Interaktionen durch Beobachtung und Befragung gezielt generiert und existieren nicht jenseits der persönlichen und affektiven Interaktion zwischen Forschenden und Forschungsteilnehmerinnen. Daher kann innerhalb der ethnografischen Feldforschung auch nicht von der Sammlung bereits existierender Rohdaten gesprochen werden: Vielmehr werden Daten während der Forschung prozessual hergestellt und müssen somit als konstruiert aufgefasst werden. Sie stehen damit in Abgrenzung zu anderen Quellen und Materialien wie etwa Zeitungsberichten, Statistiken oder historischen Dokumenten, die ohne die Intervention der jeweiligen Ethnografinnen existieren und von diesen zu Informationszwecken konsultiert und zusammengetragen werden können.
Verwandte Glossareinträge	Ethnografische Forschungsdaten

Als Forschungsdaten werden sämtliche in wissenschaftlichen Forschungsprozessen analog sowie digital erhobenen Informationen bezeichnet. Diese werden in der Sozial- und Kulturanthropologie größtenteils, aber nicht ausschließlich, im Rahmen stationärer Feldforschungen gewonnen und sind methodologisch durch die teilnehmende Beobachtung geprägt. Das heißt, sie werden in sozialen Interaktionen durch Beobachtung und Befragung gezielt generiert und existieren nicht jenseits der persönlichen und affektiven Interaktion zwischen Forschenden und Forschungsteilnehmer*innen. Daher kann innerhalb der ethnografischen Feldforschung auch nicht von der Sammlung bereits existierender Rohdaten gesprochen werden: Vielmehr werden Daten während der Forschung prozessual hergestellt und müssen somit als konstruiert aufgefasst werden. Sie stehen damit in Abgrenzung zu anderen Quellen und Materialien wie etwa Zeitungsberichten, Statistiken oder historischen Dokumenten, die ohne die Intervention der jeweiligen Ethnograf*innen existieren und von diesen zu Informationszwecken konsultiert und zusammengetragen werden können.

Verwandte Glossareinträge

Ethnografische Forschungsdaten

Datendokumentation

Forschungsdaten bilden nicht nur die Basis wissenschaftlicher Veröffentlichungen der jeweiligen Forscher*innen, sondern werden in vielen Fällen anderen zugänglich gemacht. Dies setzt voraus, dass Forschungsdaten verständlich dokumentiert sind. Unverzichtbar wird dies, wenn eine Datenpublikation beabsichtigt ist. Eine zentrale Rolle für das Finden, Durchsuchen und Nutzen von Forschungsdaten spielen Metadaten, also Daten, die strukturierte Informationen über andere Daten enthalten. In verschiedenen Wissenschaftskreisen haben sich für die Dokumentation in Form von Metadaten sogenannte Metadatenstandards etabliert, die Konventionen für die Beschreibung und Dokumentation von Forschungsdaten über Metadaten festlegen. Eine angemessene Dokumentation gehört zu jeder guten wissenschaftlichen Praxis.
Verwandte Glossareinträge	Nachnutzung ReadMe-Datei

Forschungsdaten bilden nicht nur die Basis wissenschaftlicher Veröffentlichungen der jeweiligen Forscher*innen, sondern werden in vielen Fällen anderen zugänglich gemacht. Dies setzt voraus, dass Forschungsdaten verständlich dokumentiert sind. Unverzichtbar wird dies, wenn eine Datenpublikation beabsichtigt ist. Eine zentrale Rolle für das Finden, Durchsuchen und Nutzen von Forschungsdaten spielen Metadaten, also Daten, die strukturierte Informationen über andere Daten enthalten. In verschiedenen Wissenschaftskreisen haben sich für die Dokumentation in Form von Metadaten sogenannte Metadatenstandards etabliert, die Konventionen für die Beschreibung und Dokumentation von Forschungsdaten über Metadaten festlegen.

Eine angemessene Dokumentation gehört zu jeder guten wissenschaftlichen Praxis.

Verwandte Glossareinträge

Datenmanagementplan (DMP)

Ein Datenmanagementplan (DMP) beschreibt und dokumentiert den Umgang mit den Forschungsdaten und Forschungsmaterialien einer Forschung während und nach der Projektlaufzeit. Im DMP wird festgehalten, wie die Daten und Materialien entstehen, aufbereitet, gespeichert, organisiert, veröffentlicht, archiviert und ggf. geteilt werden. Zudem werden im DMP Verantwortlichkeiten und Rechte geregelt. Als „living document“ (also ein dynamisches Dokument, das sich fortlaufend in Bearbeitung und Veränderung befindet) wird der DMP im Laufe des Projektes regelmäßig geprüft und bei Bedarf angepasst.

Datenqualität

Im Zuge des digitalen Wandels wächst die Vielfalt an Methoden und Verfahren zur Erzeugung, Verarbeitung und Verbreitung von Daten rasant. Je mehr Entscheidungen auf Grundlage von digitalen Daten getroffen werden, desto wichtiger werden Fragen nach deren Herkunft und Qualität. Die Qualitätssicherung von Forschungen gehört zu jeder guten wissenschaftlichen Praxis und sichert wiederum die Wissenschaftlichkeit.

Der Rat für Informationsinfrastrukturen (RfII) empfiehlt dabei in einem im Jahr 2019 veröffentlichten Positionspapier, die Dokumentation von Forschungsdaten als methodische Kernaufgabe in der Forschungspraxis zu verankern. Hochschulen und Wissenschaftsorganisationen fordert der RfII auf, die Sicherung und Steigerung der Datenqualität in ihre jeweiligen Forschungsstrategien zu integrieren. Auch die Forschungsförderung kann hier Anreize setzen und zeitliche Freiräume gewähren (RfII, 2919, p. 172).

Datenschutz

Datenschutz beinhaltet Maßnahmen gegen ein unrechtmäßiges Erheben, Speichern, Teilen und Nachnutzen von personenbezogenen Daten. Der Datenschutz stützt sich auf das Recht der Selbstbestimmung von Individuen in Bezug auf den Umgang mit ihren Daten und ist in der Datenschutz-Grundverordnung (DSGVO), dem Bundesdatenschutzgesetz und in den entsprechenden Gesetzen der Bundesländer verankert. Ein Verstoß gegen datenschutzrechtliche Vorschriften kann strafrechtliche Konsequenzen nach sich ziehen.
Verwandte Glossareinträge	Anonymisierung Besondere Kategorien personenbezogener Daten Personenbezogene Daten Pseudonymisierung Sensible Daten

Datenschutz beinhaltet Maßnahmen gegen ein unrechtmäßiges Erheben, Speichern, Teilen und Nachnutzen von personenbezogenen Daten. Der Datenschutz stützt sich auf das Recht der Selbstbestimmung von Individuen in Bezug auf den Umgang mit ihren Daten und ist in der Datenschutz-Grundverordnung (DSGVO), dem Bundesdatenschutzgesetz und in den entsprechenden Gesetzen der Bundesländer verankert. Ein Verstoß gegen datenschutzrechtliche Vorschriften kann strafrechtliche Konsequenzen nach sich ziehen.

Verwandte Glossareinträge

Datensicherheit

Unter Datensicherheit werden alle präventiven Maßnahmen physischer und technischer Art verstanden, die dem Schutz digitaler und auch analoger Daten dienen. Datensicherheit soll für deren Verfügbarkeit bürgen, sowie die Vertraulichkeit und Integrität der Daten gewährleisten. Beispiele für Maßnahmen sind: Passwortschutz für Geräte und Online-Plattformen, Verschlüsselungen für Software z. B. E-Mails und auch Hardware, Firewalls, regelmäßige Softwareupdates sowie sicheres Löschen von Dateien.
Verwandte Glossareinträge	Sichere Passwörter Sicheres Löschen Zwei-Faktor-Authentifizierung

Unter Datensicherheit werden alle präventiven Maßnahmen physischer und technischer Art verstanden, die dem Schutz digitaler und auch analoger Daten dienen. Datensicherheit soll für deren Verfügbarkeit bürgen, sowie die Vertraulichkeit und Integrität der Daten gewährleisten. Beispiele für Maßnahmen sind: Passwortschutz für Geräte und Online-Plattformen, Verschlüsselungen für Software z. B. E-Mails und auch Hardware, Firewalls, regelmäßige Softwareupdates sowie sicheres Löschen von Dateien.

Verwandte Glossareinträge

Datenspeicherung

Datenspeicherung bezeichnet allgemein den Vorgang des Speicherns von Daten auf einem Trägermaterial oder Datenträger (digitalisierte Daten). Forschungsdaten sind einzigartige, wertvolle Daten, die sicher aufbewahrt werden sollten, um sie vor Verlust und fremden Zugriff zu schützen. Mit verschiedenen Maßnahmen wie z. B. regelmäßigen Backup-Routinen (Sicherheitskopien) kann ein möglicher Datenverlust minimiert werden.
Verwandte Glossareinträge	Backup Versionierung

Datenspeicherung bezeichnet allgemein den Vorgang des Speicherns von Daten auf einem Trägermaterial oder Datenträger (digitalisierte Daten).

Forschungsdaten sind einzigartige, wertvolle Daten, die sicher aufbewahrt werden sollten, um sie vor Verlust und fremden Zugriff zu schützen. Mit verschiedenen Maßnahmen wie z. B. regelmäßigen Backup-Routinen (Sicherheitskopien) kann ein möglicher Datenverlust minimiert werden.

Verwandte Glossareinträge

Digitale Daten/Digitalisierung

Digitale Daten werden durch Digitalisierung hergestellt, indem analoge Materialien in Formate überführt werden, die sich für eine elektronische Speicherung auf digitalen Datenträgern eignen. Digitale Daten haben den Vorteil, dass sie effizient und fehlerfrei vervielfacht, geteilt und maschinell verarbeitet werden können.
Verwandte Glossareinträge	Analoge Materialien

Digitale Methoden

Digitale Methoden nutzen computationelle Verfahren zur Gewinnung und Aufbereitung von Daten sowie zur Analyse dieser Daten. Digitale Methoden bilden einen neuen, interdisziplinären Forschungsbereich, bei dem es im Kern darum geht, computerbasierte Verfahren zu entwickeln und zu verwenden, die es ermöglichen gesellschaftliche, soziale und kulturelle Phänomene zu analysieren. Die wichtigsten beiden Richtungen sind die Digital Humanities (DH) und die Computational Social Sciences (CSS). Eine gute Einführung in die digitalen Methoden in der qualitativen Forschung bietet Franken (2023).

DOI (Digital Object Identifier)

Die Abkürzung DOI steht für Digital Object Identifier und ist ein eindeutiger und dauerhafter (persistenter) Identifikator für digitale Objekte, z. B. für Artikel und Beiträge in wissenschaftlichen Veröffentlichungen aber auch Veröffentlichungen von Vorträgen und Lehrmaterialien. Ein DOI muss initial in der zentralen Datenbank, der International DOI Foundation, registriert werden² siehe: https://www.doi.org/. Ein Persistent Identifier verweist auf das Objekt selbst und nicht auf seinen Standort im Internet (wie die URL-Adressen). Ändert sich der Standort eines mit einem Persistent Identifier assoziierten digitalen Objekts, so bleibt der Identifikator derselbe. Es muss lediglich in der Identifikator-Datenbank der URL-Standort geändert oder ergänzt werden. So wird sichergestellt, dass ein Datensatz dauerhaft auffindbar, abrufbar und zitierbar bleibt (Forschungdaten.info, 2023). Ein DOI besteht immer aus einem Präfix und einem Suffix, die durch einen Schrägstrich getrennt sind, z. B. doi: 10.17169/refubium-35157.2. Dabei referenziert das Suffix refubium-35157.2 die Veröffentlichung „Zur Teilbarkeit ethnografischer Forschungsdaten. Oder: Wie viel Privatheit braucht ethnografische Forschung?“, die im Refubium der Freien Universität Berlin 17169 archiviert ist (siehe: https://refubium.fu-berlin.de/handle/fub188/35442.2). DOIs können in verschiedenen Formaten – je nach Zitierstil – dargestellt werden. doi: 10.17169/refubium-35157.2 (Harvard-Zitierstil) DOI: 10.17169/refubium-35157.2 https://doi.org/10.17169/refubium-35157.2 (APA-Zitierstil) https://dx.doi.org/10.17169/refubium-35157.2
Verwandte Glossareinträge	ORCID (Open Research and Contributor-ID) PID (Persistent Identifier)

Die Abkürzung DOI steht für Digital Object Identifier und ist ein eindeutiger und dauerhafter (persistenter) Identifikator für digitale Objekte, z. B. für Artikel und Beiträge in wissenschaftlichen Veröffentlichungen aber auch Veröffentlichungen von Vorträgen und Lehrmaterialien. Ein DOI muss initial in der zentralen Datenbank, der International DOI Foundation, registriert werden² siehe: https://www.doi.org/.

Ein Persistent Identifier verweist auf das Objekt selbst und nicht auf seinen Standort im Internet (wie die URL-Adressen). Ändert sich der Standort eines mit einem Persistent Identifier assoziierten digitalen Objekts, so bleibt der Identifikator derselbe. Es muss lediglich in der Identifikator-Datenbank der URL-Standort geändert oder ergänzt werden. So wird sichergestellt, dass ein Datensatz dauerhaft auffindbar, abrufbar und zitierbar bleibt (Forschungdaten.info, 2023).

Ein DOI besteht immer aus einem Präfix und einem Suffix, die durch einen Schrägstrich getrennt sind, z. B. doi: 10.17169/refubium-35157.2. Dabei referenziert das Suffix refubium-35157.2 die Veröffentlichung „Zur Teilbarkeit ethnografischer Forschungsdaten. Oder: Wie viel Privatheit braucht ethnografische Forschung?“, die im Refubium der Freien Universität Berlin 17169 archiviert ist (siehe: https://refubium.fu-berlin.de/handle/fub188/35442.2).

DOIs können in verschiedenen Formaten – je nach Zitierstil – dargestellt werden.

doi: 10.17169/refubium-35157.2 (Harvard-Zitierstil)
DOI: 10.17169/refubium-35157.2
https://doi.org/10.17169/refubium-35157.2 (APA-Zitierstil)
https://dx.doi.org/10.17169/refubium-35157.2

Verwandte Glossareinträge

Ethnografische Feldforschung

Ethnografische Feldforschung bezeichnet die Erhebung empirischer Daten vor Ort, d. h. in konkreten sozialen Lebenswelten, im Gegensatz zu Labor- oder Archivforschung oder standardisierten Fragebogenstudien. Die in der Regel langfristige Teilnahme der Ethnograf*innen am Alltag der untersuchten Gruppe ermöglicht die direkte Beobachtung sozialer Praktiken und Prozesse und damit Aussagen über tatsächliches Verhalten. Bedeutsam ist, dass die Forschenden immer Teil der Situationen im Feld sind und die ihnen zugeschriebene sowie von ihnen eingenommene soziale Position wesentlich Einfluss auf ihre Daten hat, d. h. auf das, was sie erfassen und erkennen können.

Ethnografische Forschungsdaten

Daten, die im Rahmen ethnografischer Forschungen mittels unterschiedlicher Methoden in situ erhoben werden, sind stets in soziale Interaktionen eingebettet, d. h. sie entstehen im direkten und nicht anonymisierten Austausch zwischen Forschenden und den Akteur*innen im gewählten Forschungsfeld. Entsprechend sind sie stark geprägt von dem subjektiven Charakter dieser Beziehungen und stellen größtenteils personenbezogene Daten dar, die besonderem Schutz unterliegen.
Verwandte Glossareinträge	Daten (in der ethnografischen Forschung)

Daten, die im Rahmen ethnografischer Forschungen mittels unterschiedlicher Methoden in situ erhoben werden, sind stets in soziale Interaktionen eingebettet, d. h. sie entstehen im direkten und nicht anonymisierten Austausch zwischen Forschenden und den Akteur*innen im gewählten Forschungsfeld. Entsprechend sind sie stark geprägt von dem subjektiven Charakter dieser Beziehungen und stellen größtenteils personenbezogene Daten dar, die besonderem Schutz unterliegen.

Verwandte Glossareinträge

Daten (in der ethnografischen Forschung)

Extended Case Studies/Fallstudien

Die Extended-Case Methode (ECM) wurde während der fünfziger und sechziger Jahre des letzten Jahrhunderts in der britischen Sozialanthropologie entwickelt und gehört zu einem der qualitativen Standardverfahren des Faches. Sie lässt sich definieren als die detaillierte Dokumentation und Analyse spezifischer im Feld beobachteter Ereignisse oder Ereignisketten, aus denen sich allgemeine theoretische Prinzipien ableiten lassen. Im Gegensatz zur singulären, zeitlich begrenzten Fallstudie wird mittels der ECM die Verbundenheit mehrerer sozialer Ereignisse über längere Zeiträume hinweg untersucht, in denen dieselben Akteure eine Rolle spielen. Sie bildet damit eine Methode, die es ermöglicht, soziale Aushandlungsprozesse zu erfassen. ECM-Daten bilden in Regel „dichte Beschreibungen“, die zahlreiche sensible Personenbezüge enthalten, weswegen sie besonders sorgfältig geschützt und anonymisiert werden müssen.

Fachinformationsdienst Sozial- und Kulturanthropologie (FID-SKA)

Der Fachinformationsdienst Sozial- und Kulturanthropologie (FID-SKA) stellt den Mitgliedern der Deutschen Gesellschaft für Empirische Kulturwissenschaft und der Deutschen Gesellschaft für Sozial- und Kulturanthropologie sowie – in begrenztem Maße – anderen interessierten Forschenden ausgewählte Ressourcen für die Forschung im Online-Zugriff zur Verfügung.

FAIR-Prinzipien

Die FAIR-Prinzipien wurden 2016 erstmals von der FORCE 11-Community (The Future of Research Communication and e-Scholarship) entwickelt. FORCE11 ist eine Gemeinschaft von Wissenschaftlern, Bibliothekaren, Archivaren, Verlegern und Forschungsförderern, die durch den effektiven Einsatz von Informationstechnologie einen Wandel in der modernen wissenschaftlichen Kommunikation herbeiführen und so eine verbesserte Wissenserstellung und -weitergabe unterstützen will. Das primäre Ziel liegt in der transparenten und offenen Darlegung wissenschaftlicher Erkenntnisprozesse. Demnach sollten Daten online findable (auffindbar), accessible (zugänglich), interoperable (kompatibel) und reusable (wiederverwendbar) abgelegt und strukturiert sein. Ziel ist es, Daten langfristig aufzubewahren und im Sinne der Open Science und des Data Sharing für eine Nachnutzung durch Dritte bereitzustellen. Genaue Definitionen der FORCE11 selbst können auf der Website nachgelesen werden³ siehe: https://force11.org/info/the-fair-data-principles/. Die FAIR-Prinzipien berücksichtigen ethische Aspekte der Weitergabe von Daten in sozialwissenschaftlichen Kontexten nicht hinreichend, weshalb sie um die CARE-Prinzipien ergänzt wurden.
Verwandte Glossareinträge	CARE-Prinzipien Interoperabilität

Die FAIR-Prinzipien wurden 2016 erstmals von der FORCE 11-Community (The Future of Research Communication and e-Scholarship) entwickelt. FORCE11 ist eine Gemeinschaft von Wissenschaftlern, Bibliothekaren, Archivaren, Verlegern und Forschungsförderern, die durch den effektiven Einsatz von Informationstechnologie einen Wandel in der modernen wissenschaftlichen Kommunikation herbeiführen und so eine verbesserte Wissenserstellung und -weitergabe unterstützen will. Das primäre Ziel liegt in der transparenten und offenen Darlegung wissenschaftlicher Erkenntnisprozesse. Demnach sollten Daten online findable (auffindbar), accessible (zugänglich), interoperable (kompatibel) und reusable (wiederverwendbar) abgelegt und strukturiert sein. Ziel ist es, Daten langfristig aufzubewahren und im Sinne der Open Science und des Data Sharing für eine Nachnutzung durch Dritte bereitzustellen. Genaue Definitionen der FORCE11 selbst können auf der Website nachgelesen werden³ siehe: https://force11.org/info/the-fair-data-principles/. Die FAIR-Prinzipien berücksichtigen ethische Aspekte der Weitergabe von Daten in sozialwissenschaftlichen Kontexten nicht hinreichend, weshalb sie um die CARE-Prinzipien ergänzt wurden.

Verwandte Glossareinträge

Forschungsdaten

„Forschungsdaten sind (digitale) Daten, die während wissenschaftlicher Tätigkeit (z. B. durch Messungen, Befragungen, Beobachtungen, Experimente, Quellenarbeit) entstehen. Sie bilden eine Grundlage wissenschaftlicher Arbeit und dokumentieren deren Ergebnisse. Daraus ergibt sich ein disziplin- und projektspezifisches Verständnis von Forschungsdaten (siehe ethnografische Forschungsdaten) mit unterschiedlichen Anforderungen an die Aufbereitung, Verarbeitung und Verwaltung der Daten: dem sogenannten Forschungsdatenmanagement (FDM)“ (Forschungsdaten.info, 2023).

Forschungsdatenlebenszyklus

Das Modell des Forschungsdatenlebenszyklus stellt sämtliche Phasen dar, die Forschungsdaten vom Zeitpunkt der Erhebung bis zu ihrer Nachnutzung durchlaufen können. Die Phasen sind an bestimmte Aufgaben gekoppelt und können variieren (Forschungsdaten.info, 2023). Allgemein umfasst der Forschungsdatenlebenszyklus folgende Teilbereiche:

Planung des Forschungsvorhabens
Erhebung der Daten und Dokumentation/Aufzeichnung
Aufbereitung und Analyse
Teilen und Publizieren
Archivierung
Nachnutzung.

Forschungsdatenmanagement

Beim Forschungsdatenmanagement geht es um einen verantwortungsvollen und reflektierten Umgang mit Forschungsdaten. Anhand spezifischer Maßnahmen und Strategien sollen Forschungsdaten sorgfältig organisiert, gepflegt und aufgearbeitet werden. Ziel ist es, sie im Sinne einer guten wissenschaftlichen Praxis langfristig zu speichern und für Dritte zugänglich und nachnutzbar zu machen. Somit soll eine Überprüfung wissenschaftlicher Aussagen vereinfacht, Nachweise gesichert und weitere Auswertungen und Analysen an den Daten vollzogen werden können.

Forschungsdatenzentrum Qualiservice

Das Forschungsdatenzentrum Qualiservice stellt qualitative sozialwissenschaftliche Daten für die wissenschaftliche Nachnutzung zur Verfügung. Vom Rat für Sozial- und Wirtschaftswissenschaften (RatSWD) 2019 akkreditiert, basiert es auf dessen Qualitätssicherungskriterien. Neben der (Nach-)Nutzung von Daten gibt es für Forschende die Möglichkeit, ihre Forschungsdaten zu teilen und zu organisieren. Dabei steht das Team von Qualiservice beratend zur Seite. Qualiservice bekennt sich zu den DFG-Richtlinien zur Sicherung guter wissenschaftlicher Praxis und berücksichtigt darüber hinaus die FAIR Guiding Principles for Scientific Data Management and Stewardship sowie die OECD Principles and Guidelines for Access to Research Data from Public Funding⁴Mehr Informationen unter: https://www.qualiservice.org/de/.

Forschungsethik in der ethnologischen Forschung

Forschungsethik befasst sich mit dem Verhältnis zwischen Forschenden, Forschungsfeld und Beforschten. Dabei wird dieses Verhältnis vor dem Hintergrund der durch die Forschung hergestellten Vulnerabilitäten und Machtasymmetrien kritisch reflektiert (Unger, Narimani & M’Bayo, 2014, p.1-2). Gerade wegen der Prozesshaftigkeit und Offenheit einer ethnografischen Forschung treten forschungsethische Fragen im gesamten Forschungsprozess in verschiedener Weise auf. Sie variieren je nach Forschungskontext und Forschungsmethoden. Forschungsethik hört allerdings nicht mit dem Verlassen des Feldes auf, sondern umfasst ebenfalls Fragen der Datenarchivierung, des Datenschutzes sowie des Teilens der Forschungsdaten mit den Forschungsteilnehmenden (siehe z. B. Ethikpapiere der DGSKA oder das Positionspapier zur Archivierung, Bereitstellung und Nachnutzung von Forschungsdaten der dgv).

Zentrale Stichworte im Zusammenhang mit Forschungsethik sind: informierte Einwilligung, Freiwilligkeit der Teilnahme, Abschätzung und Vermeidung von Gefahren und Risiken für Betroffene.

Förderinstitution

Förderinstitutionen sind all jene Einrichtungen, die wissenschaftliche Forschung finanziell fördern, also Stiftungen, Vereine oder andere Organisationen. Die meisten dieser Einrichtungen im internationalen Raum haben dabei Richtlinien für das Forschungsdatenmanagement (FDM) von Forschungsprojekten eingeführt, d. h. eine mögliche finanzielle Förderung ist an Bedingungen und Forderungen zum Umgang mit Forschungsdaten geknüpft. Zu den bekanntesten Förderinstitutionen im deutschsprachigen Raum gehören das Bundesministerium für Bildung und Forschung (BMBF) selbst, die Bildungs- und Wissenschaftsministerien der Bundesländer, die Deutsche Forschungsgemeinschaft (DFG), die Volkswagenstiftung oder der Österreichische Wissenschaftsfonds (FWF) sowie der Schweizer Nationalfonds (SNF).

Global Indigenous Data Alliance (GIDA)

Die Global Indigenous Data Allaince (GIDA) ist ein Netzwerk von Forschenden, Datenpraktikerinnen und politischen Aktivistinnen, die sich dafür einsetzen, dass indigene Gruppen die Souveränität über ihre Daten in Forschungskontexten erlangen und behalten, ihre Rechte und Interessen an Daten durchsetzen und diese Daten für das Wohlergehen der Gruppen eingesetzt werden (vgl. https://www.gida-global.org).
Verwandte Glossareinträge	CARE-Prinzipien

Die Global Indigenous Data Allaince (GIDA) ist ein Netzwerk von Forschenden, Datenpraktiker*innen und politischen Aktivist*innen, die sich dafür einsetzen, dass indigene Gruppen

die Souveränität über ihre Daten in Forschungskontexten erlangen und behalten,
ihre Rechte und Interessen an Daten durchsetzen und
diese Daten für das Wohlergehen der Gruppen eingesetzt werden (vgl. https://www.gida-global.org).

Verwandte Glossareinträge

CARE-Prinzipien

Gute wissenschaftliche Praxis

Die gute wissenschaftliche Praxis (GWP) bildet einen standardisierten Kodex, der als Regelwerk in den Leitlinien der Deutschen Forschungsgemeinschaft (DFG) verankert ist. Die Leitlinien verweisen auf die ethische Verpflichtung jedes/jeder Forschenden, verantwortungsvoll, ehrlich und respektvoll vorzugehen, auch um das allgemeine Vertrauen in Forschung und Wissenschaft zu stärken. Sie können als Orientierung im Rahmen wissenschaftlicher Arbeitsprozesse geltend gemacht werden.

Haushaltssurvey

Ein Haushaltssurvey ist eine Überblicksstudie mittels standardisierter Befragungen eines repräsentativen Samples oder einer Zufallsstichprobe zu den Zusammensetzungen der Haushalte in einer Untersuchungsregion (siehe: Survey/Survey-Daten). In der Sozial- und Kulturanthropologie werden die Begriffe Survey, Haushaltssurvey und Zensus oft auch synonym gebraucht.
Verwandte Glossareinträge	Survey/Survey-Daten Zensuserhebung

Informierte Einwilligung

Informierte Einwilligung (informed consent) meint die Zustimmung der Forschungsteilnehmenden zur Teilnahme an einem Forschungsvorhaben auf der Basis umfangreicher und verständlicher Informationen. Die Ausgestaltung einer informierten Einwilligung muss dabei sowohl ethische Grundsätze als auch datenschutzrechtliche Anforderungen adressieren.
Verwandte Glossareinträge	Personenbezogene Daten Pseudonymisierung Verarbeitung personenbezogener Daten

Interoperabilität

Unter Interoperabilität bezeichnet man die Fähigkeit eines Systems mit anderen Systemen nahtlos zusammenzuarbeiten. Innerhalb interoperabler Systeme können Daten automatisiert mit anderen Datensätzen kombiniert und ausgetauscht werden. Somit werden Daten auf vereinfachte und beschleunigte Weise maschinell lesbar, interpretierbar und vergleichbar. Interoperabilität stellt eines der Hauptkriterien der FAIR-Prinzipien dar (Forschungsdaten.info, 2023).
Verwandte Glossareinträge	FAIR-Prinzipien

Unter Interoperabilität bezeichnet man die Fähigkeit eines Systems mit anderen Systemen nahtlos zusammenzuarbeiten. Innerhalb interoperabler Systeme können Daten automatisiert mit anderen Datensätzen kombiniert und ausgetauscht werden. Somit werden Daten auf vereinfachte und beschleunigte Weise maschinell lesbar, interpretierbar und vergleichbar. Interoperabilität stellt eines der Hauptkriterien der FAIR-Prinzipien dar (Forschungsdaten.info, 2023).

Verwandte Glossareinträge

FAIR-Prinzipien

Kontrolliertes Vokabular

Unter einem kontrollierten Vokabular versteht man Vorgaben bzw. Definitionen von Begriffen und Regeln, die in Wortlisten oder strukturierten Thesauri zusammengefasst sind. Sie sind eine Art Lexikon oder Enzyklopädie für fachspezifische Begriffsdefinitionen, die dazu dienen, eine einheitliche wissenschaftliche Praxis zu fördern und Forschungen interoperabel und intersubjektiv nachvollziehbar zu machen. In den Sozialwissenschaften ist insbesondere der „European Language Social Science Thesaurus“ (ELSST) relevant⁵ siehe: https://elsst.cessda.eu.

Leistungsschutzrecht

Leistungsschutzrechte sind verwandte Schutzrechte im Urheberrecht. Sie schützen nicht das Werk an sich, sondern die künstlerische, wissenschaftliche Leistung von Personen oder eine getätigte Investition. Letzteres gilt vor allem für die Erstellung von Datenbanken oder die Produktion von Filmen. Eine künstlerische oder wissenschaftliche Leistung kann die Aufführung eines Theaterstücks sein, die Übersetzung eines Werkes oder die Erstellung eines Lichtbildes, z. B. eines Fotos oder einer Röntgenaufnahme. Das Urheberrecht (UrhG) sieht folgende verwandte Schutzrechte vor (§§ 70-94) (UrhG, 2021): Schutz wissenschaftlicher Ausgaben Schutz von Lichtbildern Schutz der ausübenden Kunstschaffenden Schutz der Herstellenden von Tonträgern Schutz von Sendeunternehmen Schutz der Datenbankerstellenden sowie der Pressenverlegenden und besondere Schutzbestimmungen für Filme.
Verwandte Glossareinträge	Lizenzvertrag/Lizenzierung Urheberrecht

Leistungsschutzrechte sind verwandte Schutzrechte im Urheberrecht. Sie schützen nicht das Werk an sich, sondern die künstlerische, wissenschaftliche Leistung von Personen oder eine getätigte Investition. Letzteres gilt vor allem für die Erstellung von Datenbanken oder die Produktion von Filmen. Eine künstlerische oder wissenschaftliche Leistung kann die Aufführung eines Theaterstücks sein, die Übersetzung eines Werkes oder die Erstellung eines Lichtbildes, z. B. eines Fotos oder einer Röntgenaufnahme.

Das Urheberrecht (UrhG) sieht folgende verwandte Schutzrechte vor (§§ 70-94) (UrhG, 2021):

Schutz wissenschaftlicher Ausgaben
Schutz von Lichtbildern
Schutz der ausübenden Kunstschaffenden
Schutz der Herstellenden von Tonträgern
Schutz von Sendeunternehmen
Schutz der Datenbankerstellenden sowie
der Pressenverlegenden und
besondere Schutzbestimmungen für Filme.

Verwandte Glossareinträge

Lizenzvertrag/Lizenzierung

In einem Lizenzvertrag oder über eine offene Lizenz legen die Rechteinhabenden fest, wie und unter welchen Bedingungen das eigene urheberrechtlich geschützte Werk durch Dritte verwendet und oder verwertet werden darf. Kommerzielle Einrichtungen wie etwa Verlage schließen i. d. R. Lizenzverträge mit den Urheberrechtsinhabenden ab. Werden diese Werke dann von Dritten weitergenutzt, müssen sie eine Erlaubnis zur Nutzung beim Nutzungsrechtsinhabenden (in diesem Fall dem Verlag) einholen und ggf. eine Lizenzgebühr bezahlen. Offene Lizenzen, wie die Creative-Commons-Lizenzen, gestatten hingegen eine kostenlose Nutzung. Werden offen lizenzierte Forschungsdaten von Dritten genutzt „kommt automatisch ein Vertrag zwischen dem Lizenzgeber und dem Lizenznehmer zustande, ohne, dass es dafür eines Kontakts zwischen ihnen bedarf“ (TUM, 2023, p. 5).
Verwandte Glossareinträge	Creative-Commons-Lizenzen (CC-Lizenzen) Leistungsschutzrecht

In einem Lizenzvertrag oder über eine offene Lizenz legen die Rechteinhabenden fest, wie und unter welchen Bedingungen das eigene urheberrechtlich geschützte Werk durch Dritte verwendet und oder verwertet werden darf.

Kommerzielle Einrichtungen wie etwa Verlage schließen i. d. R. Lizenzverträge mit den Urheberrechtsinhabenden ab. Werden diese Werke dann von Dritten weitergenutzt, müssen sie eine Erlaubnis zur Nutzung beim Nutzungsrechtsinhabenden (in diesem Fall dem Verlag) einholen und ggf. eine Lizenzgebühr bezahlen.

Offene Lizenzen, wie die Creative-Commons-Lizenzen, gestatten hingegen eine kostenlose Nutzung. Werden offen lizenzierte Forschungsdaten von Dritten genutzt „kommt automatisch ein Vertrag zwischen dem Lizenzgeber und dem Lizenznehmer zustande, ohne, dass es dafür eines Kontakts zwischen ihnen bedarf“ (TUM, 2023, p. 5).

Verwandte Glossareinträge

Metadaten

Metadaten sind Beschreibungen von Forschungsdaten (Daten über Daten) und geben inhaltliche und strukturierte Informationen zum Forschungskontext, dem methodischen und analytischen Verfahren, sowie über das jeweilige Forschungsteam, das die Daten generiert. Sie lassen sich unterscheiden in bibliographische, administrative, prozessuale und deskriptive Metadaten und werden beispielsweise in Form von Templates, ReadMe-Dateien oder Data Curation Profiles verfasst. Metadaten werden begleitend zu den Forschungsdaten selbst publiziert und gelten insbesondere in Online-Repositorien und Forschungsdatenzentren als unverzichtbar für das Nachvollziehen und Verstehen von Datensätzen durch Dritte. Auch erleichtern Metadaten die Auffindbarkeit und Maschinenlesbarkeit von Daten und sind somit Teil der FAIR-Prinzipien und der guten wissenschaftlichen Praxis.
Verwandte Glossareinträge	Metadatenschema Metadatenstandards

Metadaten sind Beschreibungen von Forschungsdaten (Daten über Daten) und geben inhaltliche und strukturierte Informationen zum Forschungskontext, dem methodischen und analytischen Verfahren, sowie über das jeweilige Forschungsteam, das die Daten generiert. Sie lassen sich unterscheiden in bibliographische, administrative, prozessuale und deskriptive Metadaten und werden beispielsweise in Form von Templates, ReadMe-Dateien oder Data Curation Profiles verfasst. Metadaten werden begleitend zu den Forschungsdaten selbst publiziert und gelten insbesondere in Online-Repositorien und Forschungsdatenzentren als unverzichtbar für das Nachvollziehen und Verstehen von Datensätzen durch Dritte. Auch erleichtern Metadaten die Auffindbarkeit und Maschinenlesbarkeit von Daten und sind somit Teil der FAIR-Prinzipien und der guten wissenschaftlichen Praxis.

Verwandte Glossareinträge

Metadatenschema

Ein Metadatenschema gibt verpflichtende Vorgaben, wie Metadaten strukturiert sein sollen. Festgelegt werden Elemente der Beschreibung von Forschungsdaten und in welchem Format diese vorliegen sollen. Auf diese Weise werden Metadaten standardisiert und reguliert, was zu einer erhöhten Maschinenlesbarkeit, Vergleichbarkeit und einer automatisierten Datenverwendung und -erfassung beiträgt.
Verwandte Glossareinträge	Metadaten Metadatenstandards

Metadatenstandards

Metadatenstandards dienen der einheitlichen Beschreibung von ähnlichen Daten durch Metadaten. Sie legen die Begriffe und Bedeutungen, sowie Struktur und Aufbau als Standard für z. B. eine bestimmte Fachdisziplin fest. Metadatenstandards fördern so die Auffindbarkeit von Daten und unterstützen die Interoperabilität zwischen Anwendungen, also den Austausch, den Vergleich und die Verknüpfung von Datensätzen⁶ Ein verbreiteter Metadatenstandard ist der Dublin Core (siehe folgendes Beispiel: https://www.dublincore.org/specifications/dublin-core/dcmi-terms/)..

Verwandte Glossareinträge

Nachnutzung

Eine Nachnutzung, oftmals auch Sekundärnutzung genannt, befragt bereits erhobene und veröffentlichte Forschungsdatensätze erneut mit dem Ziel, andere Erkenntnisse, möglicherweise aus einer neuen oder unterschiedlichen Perspektive, zu erhalten. Die Aufbereitung von Forschungsdaten für eine Nachnutzung erfordert einen erheblich höheren Anonymisierungs-, Aufbereitungs- und Dokumentationsaufwand als die bloße Archivierung im Sinne von Datenspeicherung.

Verwandte Glossareinträge

Normdaten

Normdaten bilden Identifikationen und standardisierte normierte Datensätze in Form von eindeutigen Nummern, anhand derer Personen, Werke, Institutionen, Forschungsförderer, Körperschaften oder Schlagwörter eindeutig beschrieben und zuordenbar werden. Eine fälschliche oder doppelte Zuordnung entfällt durch diese normierten Daten. Insbesondere in Katalogen und Datenbanken können durch Normdaten Informationen zu bestimmten Entitäten vereinfacht herausgefunden werden, wodurch eine digitale Vernetzung und Auffindbarkeit zwischen Projekten stattfinden kann.

Die „Gemeinsame Normdatei“ (GND) der Deutschen Nationalbibliothek ist in Deutschland die zentrale Normdatei⁷ siehe: https://www.dnb.de/DE/Professionell/Standardisierung/GND/gnd_node.html.

Verwandte Glossareinträge

ORCID (Open Research and Contributor-ID)

Offenheit im Kontext ethnografischer Forschung

Eine Haltung methodologischer Offenheit ist in der ethnografischen Forschung erforderlich, um sich der Dynamik sozialer Prozesse anpassen und auf nicht vorhersehbare Ereignisse im Feld reagieren zu können. Ein festgelegtes, unveränderliches Bündel an Forschungsmethoden wird diesen Anforderungen nicht gerecht. Darüber hinaus zeichnet sich ethnografische Forschung auch durch die Offenheit gegenüber dem Forschungsmaterial nach der Datenerhebung aus: So sollen immer wieder neue theoretische Zugänge zum Material hergestellt werden, um dieses konstruktiv und vielschichtig interpretieren zu können.

Open Access

Open Access bezeichnet den freien, kostenlosen, ungehinderten und barrierefreien Zugang zu wissenschaftlichen Erkenntnissen und Materialien. Für eine weitere rechtssichere Nachnutzung der Materialien durch Dritte müssen die Urhebenden mittels Lizenzvertrages die Nutzungsrechte an ihren Werken einräumen. Die freien CC-Lizenzen spezifizieren bspw. genau, wie Daten und Materialien weitergenutzt werden dürfen.

Bei der Veröffentlichung von wissenschaftlichen Inhalten gibt es zwei Wege: Der goldene Weg bezeichnet die Open-Access-Erstveröffentlichung von wissenschaftlichen Texten meist in Monografien o. Ä., der grüne Weg die Zweitveröffentlichung auf institutionellen Repositorien oder Webseiten der Autor*innen (Open-Access Network, 2023).

Verwandte Glossareinträge

Open Data

Open Data (offene Daten) sind Daten, die offen und frei online zugänglich sind sowie uneingeschränkt von Dritten weiterverwendet werden dürfen. Dies setzt voraus, dass sie mit einer offenen Lizenz versehen sind (Opendefinition, 2023).
Verwandte Glossareinträge	Creative-Commons-Lizenzen (CC-Lizenzen) Open Access Open Science Open-Science-Bewegung

Open Science

„Der Begriff Open Science bündelt … Strategien und Verfahren, die allesamt darauf abzielen, … alle Bestandteile des wissenschaftlichen Prozesses über das Internet offen zugänglich und nachnutzbar zu machen. Damit sollen Wissenschaft, Gesellschaft und Wirtschaft neue Möglichkeiten im Umgang mit wissenschaftlichen Erkenntnissen eröffnet werden“ (AG Open Science, 2014).

Publikationen, Forschungsdaten oder Codes werden zunehmend von Wissenschaftler*innen unter den Begriffen Open Access, Open Data, Open Source u. a., die alle unter dem Sammelbegriff Open Science subsumiert werden, frei im Web zugänglich gemacht.

Verwandte Glossareinträge

Open-Science-Bewegung

Die Open-Science-Bewegung plädiert seit den frühen 2000er Jahren für eine offene und transparente Wissenschaft, in der alle Schritte des wissenschaftlichen Erkenntnisprozesses offen online zugänglich gemacht werden. So sollen nicht nur Endergebnisse von Forschungen wie Monographien oder Artikel öffentlich geteilt werden, sondern auch verwendete Materialien, die den Entstehungsprozess begleiteten wie: Labortagebücher, Forschungsdaten, verwendete Software, Forschungsberichte usw. Dadurch soll eine Partizipation an Wissenschaft und Erkenntnissen gefördert und interessierte Öffentlichkeiten angesprochen werden. Kreativität, Innovation und neue Kollaborationen sollen gefördert, Erkenntnisse auf ihre Qualität, Richtigkeit und Authentizität hin überprüft werden, was eine Demokratisierung von Forschung bezwecken soll. Zur Open Science zählen u. a. Open Access und Open Data, die Infrastrukturen des Teilens von Zwischenergebnissen von Forschungen bilden.

Verwandte Glossareinträge

ORCID (Open Research and Contributor-ID)

Als Beispiel für eine Normdatei zur eindeutigen Identifizierung von Personen gilt die sogenannte ORCID. Die Open Research and Contributor-ID (ORCID) ist ein international anerkannter persistenter Identifikator, mit dessen Hilfe Forschende eindeutig identifiziert werden können. Die ID kann dauerhaft sowie institutionsunabhängig von Forschenden für ihre wissenschaftlichen Veröffentlichungen verwendet werden. Sie besteht aus 16 Ziffern, die in vier Viererblöcken dargestellt sind (z.B. 0000-0002-2792-2625). Die ORCID-ID ist als Identifizierungsnummer bei zahlreichen Verlagen, Universitäten und wissenschaftsnahen Einrichtungen etabliert und wird in den Workflow z. B. bei der Begutachtung von Zeitschriftenartikeln integriert⁸ Eine ORCID kann unter https://orcid.org/ kostenfrei erstellt werden..

Verwandte Glossareinträge

Personenbezogene Daten

Personenbezogene Daten sind: „alle Informationen, die sich auf eine identifizierte oder identifizierbare natürliche Person (betroffene Person) beziehen; als identifizierbar wird eine natürliche Person angesehen, die direkt oder indirekt, insbesondere mittels Zuordnung zu einer Kennung wie einem Namen, zu einer Kennnummer, zu Standortdaten, zu einer Online-Kennung oder zu einem oder mehreren besonderen Merkmalen, die Ausdruck der physischen, physiologischen, genetischen, psychischen, wirtschaftlichen, kulturellen oder sozialen Identität dieser Person sind, identifiziert werden kann;…“ (EU-DSGVO Artikel 4 Nr. 1, 2016; BDSG §46 Abs. 1, 2018; BlnDSG §31, 2020).

Verwandte Glossareinträge

PID (Persistent Identifier)

Ein Persistent Identifier (PID) (auf Deutsch: dauerhafter Identifikator) ist ein dauerhafter, digitaler Code, der einer digitalen Ressource wie z. B. einem Datensatz, einem wissenschaftlichen Artikel oder einer anderen Veröffentlichung direkt zugeordnet ist und diese damit permanent identifizier- und auffindbar macht. Im Gegensatz zu anderen seriellen Identifikatoren (bspw. URL-Adressen) verweist ein Persistent Identifier auf das Objekt selbst und nicht auf seinen Standort im Internet. Ändert sich der Standort eines mit einem Persistent Identifier assoziierten digitalen Objekts, so bleibt der Identifikator derselbe. Es muss lediglich in der Identifikator-Datenbank der URL-Standort geändert oder ergänzt werden. So wird sichergestellt, dass ein Datensatz dauerhaft auffindbar, abrufbar und zitierbar bleibt (Forschungdaten.info, 2023).

PIDs spielen eine zentrale Rolle bei der FAIRen (Wieder)Verwendung von Forschungsdaten und werden nicht ohne Grund explizit in den FAIR-Prinzipien erwähnt. Forschungsdaten sollten zugänglich, interoperabel und wiederverwendbar sein, aber dazu müssen sie zuerst auch gefunden werden. Global eindeutige und persistente Identifier sind unerlässlich, um die Identifikation veröffentlichter Ressourcen zu ermöglichen und maschinenlesbare Metadaten bereitzustellen. PIDs werden jedoch nicht nur Datensätzen und Publikationen zugeordnet, sondern sind für alle Aspekte des Forschungsdatenlebenszyklus relevant, für die Forschenden selbst, sowie Organisationen und Förderinstitutionen.

Beispiele für persistente Identifikatoren sind z. B. der DOI oder die ORCID.

Verwandte Glossareinträge

Primärdaten

Primärdaten sind Daten, die im direkten Bezug auf einen Untersuchungsgegenstand selbst ‚im Feld‘ erhoben wurden. Dies können bei der Feldforschung zum einen Feldbeobachtungen und entsprechende Aufzeichnungen in Feldtagebüchern sowie Interviewtranskripte und Gesprächsprotokolle, aber auch quantitative Erhebungen in Form von Fragebögen als auch von und mit Forschungsteilnehmenden erzeugte Daten wie Fotografien, Filme u. dgl. sein.

Im Vergleich entstehen Sekundärdaten durch die Nachnutzung, d. h. einen weiteren Verarbeitungsschritt (z. B. durch statistische Verfahren) der primären Daten. Diese können aus den Sekundärdaten nicht mehr in ihrer ursprünglichen Form abgelesen werden.

Verwandte Glossareinträge

Sekundärdaten

proprietär

Proprietäre Dateiformate sind Dateiformate, die sich nicht oder nur mit Schwierigkeiten von Dritten öffnen bzw. lesen lassen, da sie z. B. lizenzrechtlich oder durch Patente geschützt sind. Meist wird dafür spezielle (kostenpflichtige) Software benötigt (Wikipedia, 2023). Beispiele hierfür sind z. B. das Wordformat .docx oder das Adobe Photoshop-Format .psd.

Pseudonymisierung

Die Pseudonymisierung ist „die Verarbeitung personenbezogener Daten in einer Weise, in der die personenbezogenen Daten ohne Hinzuziehung zusätzlicher Informationen nicht mehr einer spezifischen betroffenen Person zugeordnet werden können, sofern diese zusätzlichen Informationen gesondert aufbewahrt werden und technischen und organisatorischen Maßnahmen unterliegen, die gewährleisten, dass die personenbezogenen Daten nicht einer identifizierten oder identifizierbaren natürlichen Person zugewiesen werden können“ (BlnDSG §31, 2020; EU-DSGVO Artikel 4 Nr. 5, 2016).

Übliche Strategien sind der Ersatz des Eigennamens (durch einen Buchstaben oder einen anderen Namen) oder die Verschleierung der Forschungsorte durch die Nennung fiktiver Ortsnamen. Oft werden auch die Forschungsregionen nicht expliziert.

Verwandte Glossareinträge

ReadMe-Datei

ReadMe-Dateien im Kontext von Systemen oder Projekten
enthalten Informationen zum jeweiligen System, Projekt o. ä., damit die Nutzenden sich zurechtfinden.

ReadMe-Dateien im Kontext von Forschungsdaten
enthalten Informationen über Forschungsdaten, Forschungsdatensätze oder Forschungsdatensammlungen in kompakter und strukturierter Form und sind oft als einfache Textdateien oder in TEI-xml (.txt, .md, .xml) verfügbar. ReadMe-Dateien können als Begleitdokumente zu Forschungsdaten veröffentlicht oder zur strukturierten Speicherung von Forschungsdaten am Ende eines Projekts verwendet werden (z. B. auf einem Institutsserver oder Repositorium zur Archivierung). ReadMe-Dateien sammeln zentrale Metadaten über das Projekt, in dem die Daten entstanden sind (wie Projektname, beteiligte Personen, Finanzierung), geben Auskunft über Ordnerstrukturen, Abkürzungen und Normdaten und halten Änderungen und Versionierungen von Forschungsdaten fest (Forschungsdaten.info, 2023).

Verwandte Glossareinträge

Datendokumentation

Recht am eigenen Bild

Das Recht am eigenen Bild besagt, dass jede Person selbst entscheiden kann, ob und wo sein Bild veröffentlicht wird. Für eine Verbreitung und Veröffentlichung eines Fotos mit hierauf erkennbaren Personen bedarf es sowohl in Printmedien als auch im Internet nach §22 des Kunsturhebergesetzes der Zustimmung der abgebildeten Person⁹ Zum genauen Gesetztext siehe Kunsturhebergesetzes (KUG) unter: https://www.gesetze-im-internet.de/kunsturhg/__22.html.

Repositorium

Ein Repositorium bildet einen Ort der Aufbewahrung wissenschaftlicher Dokumente. In Online-Repositorien werden Publikationen digital gespeichert, verwaltet und mit persistenten Identifikatoren versehen. Die Katalogisierung vereinfacht die Suche und Nutzung von Publikationen und Autor*innen. In den meisten Fällen sind Dokumente in Online-Repositorien uneingeschränkt und offen zugänglich (Open Access).

Sekundärdaten

Hierbei handelt es sich um Daten, die durch weitere Verarbeitungsschritte (z. B. statistische Analysen) aus den Primärdaten gewonnen wurden und dann als Grundlage für weitere Auswertungen dienen. Sekundärdaten sind von den Primärdaten abgeleitet, lassen diese aber nicht mehr in ihrer ursprünglichen Form erkennen. In der Sozial- und Kulturanthropologie ist diese in der Statistik wichtige Unterscheidung zwischen Primär- und Sekundärdaten von geringer Relevanz.

Verwandte Glossareinträge

Primärdaten

Sensible Daten

ethische Herkunft (z. B. Hautfarbe)
politische Meinungen (z. B. Mitgliedschaft in einer politischen Partei)
religiöse oder weltanschauliche Überzeugungen (z. B. Zugehörigkeit zu einer Religionsgemeinschaft)
Gewerkschaftszugehörigkeit
Gesundheit (z. B. Krankheit)
Sexualleben und sexueller Orientierung (z. B. Besuch entsprechender Lokale)

Gerade in ethnografischen Forschungsvorhaben entstehen regelmäßig personenbezogene Daten, die laut Datenschutz-Grundverordnung in hohem Maße als sensibel gelten.

Synonyme Glossareinträge

Besondere Kategorien personenbezogener Daten

Verwandte Glossareinträge

Sichere Passwörter

Forschungsdaten und besonders sensible Daten sollten vor fremden Zugriff geschützt werden. Sichere, also starke und individuelle Passwörter, deren Entschlüsselung viel Zeit und Rechenleistung erfordern, sind hierfür ein wichtiger Baustein. Generell kann gesagt werden, je höher die Komplexität des Passworts, desto sicherer ist es.

Tipps zur Passwortgenerierung:

Lange Passwörter (mindestes 8 Zeichen)
Groß-, Kleinbuchstaben, Zahlen und Sonderzeichen verwenden
Keine Wörter aus dem Wörterbuch
Keine Wiederverwendung von gleichen oder ähnlichen Passwörtern
Wortschreibung ändern durch Ersetzen von Zeichen durch optisch ähnliche: BESEN wird so z. B. zu I3€5EN
Verwendung von Passphrasen auch gekürzt und verändert: IchHabeEinNeuesPasswort. IchHabe1nPa$$Wort.
Passwörter sicher und verschlossen aufbewahren
Verwendung von Passwortmanagement-Software wie Keepass
Wenn möglich Zwei-Faktor-Authentisierung verwenden

Verwandte Glossareinträge

Sicheres Löschen

Das sichere Löschen von digitalen Forschungsdaten geht über ein Verschieben in den digitalen Papierkorb hinaus, denn mit diesem Vorgang werden nur die Verweise auf die Daten gelöscht, nicht die Daten selbst. Um Daten ganz sicher zu löschen, sollten spezielle Programme zum Schreddern von Daten verwendet werden, Daten mit sinnlosen Daten überschrieben werden bzw. der Datenträger selbst zerstört werden (BSI, 2023b).

Verwandte Glossareinträge

Datensicherheit

Supplement (zu wissenschaftlichen Veröffentlichungen)

Supplemente (zu wissenschaftlichen Veröffentlichungen) sind Materialien und Forschungsdaten, die ergänzend zu einer wissenschaftlichen Veröffentlichung publiziert werden, da in den Journal-Artikeln die Auswertung der Datenerhebung und Forschungsergebnisse meist nur in zusammengefasster Form erfolgen kann. Die Supplemente können detaillierte Erläuterungen enthalten, die Datensätze selbst, oder weiterführenden Informationen, die den Kontext der erhobenen Daten näher erläutern und fördern somit die Transparenz und Reproduzierbarkeit von Materialien und Forschungsdaten.

Survey/Survey-Daten

Als Survey (dt. Umfrage, Erhebung) werden in den Sozialwissenschaften standardisierte, quantitative Überblicksstudien bezeichnet, die Aufschluss über bestimmte Personengruppen oder Beobachtungseinheiten geben sollen wie z. B. Haushalte, Familienstrukturen, Altersgruppen (Jugend, Rentner, Erwerbstätige etc.), oder auch einzelne Unternehmen und Organisationen. Survey-Daten werden meist mittels Befragung (in Form von Fragebögen oder direkten strukturierten Befragungen) erhoben. Sie bilden statistische Mikrodaten, die es ermöglichen, Zusammenhänge und Merkmale bis auf die Ebene des Individuums zu untersuchen. Surveys gehören zu den Standardverfahren der quantitativen Sozialforschung, werden aber auch in der Sozial- und Kulturanthropologie eingesetzt, um Überblicksinformationen über bestimmte soziale Parameter zu erhalten wie z. B. Haushaltszusammensetzungen, ökonomische Verhältnisse oder Altersstrukturen einer Bevölkerung¹⁰Eine Übersicht über bedeutende sozialwissenschaftliche Surveys in Bezug auf Deutschland und die entsprechenden Datenbanken bietet Gesis (Leibniz-Institut für Sozialwissenschaften): https://auffinden-zitieren-dokumentieren.de/auffinden/b-erhebungsdaten/..

Verwandte Glossareinträge

Haushaltssurvey

Urheberrecht

Das Urheberrecht (UrhG) schützt bestimmte geistige Schöpfungen (Werke) und Leistungen. Unter Werke fallen Sprachwerke, Lichtbild-, Film- und Musikwerke sowie Darstellungen wissenschaftlicher oder technischer Art, wie Zeichnungen, Pläne, Karten, Skizzen, Tabellen und plastische Darstellungen (§2 UrhG). Die künstlerischen, wissenschaftlichen Leistungen von Personen oder die getätigte Investition gelten dagegen als schützenswerte Leistungen (Leistungsschutzrecht).
Der*die Urheber*in ist berechtigt, das Werk zu veröffentlichen und zu verwerten.

Verwandte Glossareinträge

Leistungsschutzrecht

Verarbeitung personenbezogener Daten

Der Begriff der „Verarbeitung“ ist definiert als „jeden mit oder ohne Hilfe automatisierter Verfahren ausgeführten Vorgang oder jede solche Vorgangsreihe im Zusammenhang mit personenbezogenen Daten wie das Erheben, das Erfassen, die Organisation, das Ordnen, die Speicherung, die Anpassung oder Veränderung, das Auslesen, das Abfragen, die Verwendung, die Offenlegung durch Übermittlung, Verbreitung oder eine andere Form der Bereitstellung, den Abgleich oder die Verknüpfung, die Einschränkung, das Löschen oder die Vernichtung;“ (BlnDSG §31, 2020; EU-DSGVO Artikel 4 Nr. 2, 2016). Die Verarbeitung bezeichnet also jegliche Form der Arbeit mit personenbezogenen Daten, von der Erhebung bis zur Löschung.

Verwandte Glossareinträge

Versionierung

Versionierung bedeutet die Erfassung aller Veränderungen von Forschungsdaten während des Arbeitsprozesses. Es empfiehlt sich bei jeder Datenanpassung eine neue Version dieser zu speichern, um die Veränderung nachvollziehbar kenntlich zu machen. Dafür können manuelle Maßnahmen wie Versionierungsschemata (z. B. durch Nummerierung: Version 1.3.2.) ergriffen, oder Versionierungssoftware wie Git verwendet werden. Versioniert wird während des Forschungsprozesses selbst, aber auch bei bereits veröffentlichten Forschungsdaten ist eine Versionierung im Nachhinein möglich, um nachnutzenden Dritten die korrekte Version der Forschungsdaten zur Verfügung zu stellen.

Verwandte Glossareinträge

Datenspeicherung

Zeitallokationsstudie

Hier handelt es sich um die systematische Erhebung der Zeit, die Personen für bestimmte Aufgaben und Tätigkeiten aufwenden. Mittels Zeitallokationsstudien wird untersucht, wie Menschen in verschiedenen sozialen und kulturellen Kontexten ihre Zeit budgetieren, z. B. wie die Arbeitsteilung im re-/produktiven Bereich zwischen den Geschlechtern und Generationen geregelt ist: Wieviel Zeit am Tag verbringen Mütter, Väter, ältere Geschwisterkinder, Großeltern u. a. täglich mit der Betreuung von Kleinkindern, wieviel Zeit bringt wer für welche ökonomischen Tätigkeiten sowie andere Fürsorgearbeit oder nachbarschaftliche Kontakte etc. auf. Es gibt verschiedene Methoden zur Erfassung der Zeitbudgetierung, die quantitative und replizierbare Datensets erbringen.

Zensuserhebung

Der Begriff Zensus (lat. census) bezeichnet Volkszählungen, d. h. Totalerfassungen der Bevölkerung eines Staates. Schon vor 2000 Jahren wurden im römischen Reich alle fünf Jahre derartige Zählungen durchgeführt, mit dem Ziel, Aufschluss über die Bevölkerungsstruktur und Vermögensverhältnisse zu bekommen. Im Jahr 2022 hat die Bundesrepublik einen registergestützten (d. h. auf Meldedaten basierenden) Zensus durchgeführt, der mit einer Stichprobenbefragung sowie einer Gebäude- und Wohnungszählung kombiniert wurde.

In der Sozial- und Kulturanthropologie bildet der sogenannte Ethnografische Zensus (EZ) eine Standardmethode, mittels derer Ethnograf*innen systematisch Grundinformationen zu einer bestimmten Bevölkerungsgruppe erheben. Ein EZ zielt niemals auf eine Totalerhebung ab, sondern konzentriert sich in Relation zur Fragestellung auf kleinere Einheiten (z. B. die Bevölkerung eines Dorfes, Stadtteils, einer Region o. ä.). Bei den erhobenen Informationen handelt es sich einerseits um demografische Daten (Fertilität, Mortalität und Migration) und andererseits um soziale und wirtschaftliche Basisinformationen (z. B. zu ökonomischen Tätigkeiten, Besitzverhältnissen, religiöser Zugehörigkeit etc.). Basis des EZ sind standardisierte Erhebungsbögen, die entweder verteilt oder im unmittelbaren Kontakt durch den/die Ethnograf*in ausgefüllt werden, wobei die Befragten stets anonymisiert werden.

Verwandte Glossareinträge

Haushaltssurvey

Zugriffsrecht

In Archiven oder Repositorien regeln Zugriffsrechte, welche Personen in welchem Umfang Zugang und Einsicht in Datenmaterial zur Nachnutzung bekommen. I. d. R. wird unterschieden zwischen einem

freien Zugang (Zugriff auf Daten direkt oder nach Zustimmung zu Nutzungsbestimmungen und kostenfrei),
Zugang mit Antrag (Zugriff nur per Datennutzungsvertrag und meist nur für wissenschaftliche Forschungszwecke) und einem
gesicherten Zugang (z. B. durch eine On-Site-Nutzung in digitalen Saferooms ohne Möglichkeit einer Datenkopie auf einem lokalen Computer).

Zweckbindung

Die Verarbeitung personenbezogener Daten darf nur zu festgelegten und eindeutigen Zwecken erfolgen. Diese sollten möglichst schon vor der Erhebung so präzise wie möglich bestimmt werden und im Forschungsvorhaben – wenn möglich – in einer Einwilligungserklärung hinterlegt werden. Weitere Verarbeitungsschritte sind an diesen Zweck gebunden. Ändern oder erweitern sich Zwecke während des Forschungsvorhabens, wenn sich z. B. bei der Analyse der Forschungsdaten neue Fragestellungen ergeben, muss ggf. erneut eine Einwilligung der betroffenen Personen eingeholt werden. Die Daten sind zu löschen, sobald der Zweck erreicht ist.

Personenbezogene Daten dürfen nicht länger als es für die Zwecke erforderlich ist, in einer Form gespeichert werden, die die Identifizierung der betroffenen Personen ermöglicht.

Der Umfang der Verarbeitung personenbezogener Daten muss dem Zweck angemessen sein, das bedeutet, so wenig personenbezogene Daten wie nötig und möglich zu erheben und zu verarbeiten (BlnDSG §32, 2018).

Zwei-Faktor-Authentifizierung

Bei einer Zwei-Faktor-Authentifizierung (2FA) wird ergänzend zu dem Passwort ein Einmalcode erfragt, der entweder per SMS, Smartphone-App oder Hardware-Dongle mitgeteilt wird. Die Anwendung dieses Verfahrens potenziert die Sicherheit, denn es ist zusätzlich ein Zugang zum Smartphone o. ä. notwendig, um sich Zugang zu den geschützten Daten zu beschaffen.
Verwandte Glossareinträge	Datensicherheit Sichere Passwörter

Suche in DATA AFFAIRS