Datenspeicherung
Definition
Datenspeicherung bezeichnet allgemein den Vorgang des Speicherns von Daten auf einem Trägermaterial oder Datenträger (digitalisierte Daten).
Einführung
Forschungsdaten sind wertvolle Daten, die so aufbewahrt werden sollten, dass sie vor Verlust und fremdem Zugriff geschützt sind. Die sichere Speicherung von Forschungsdaten ist ein wichtiger Baustein des ForschungsdatenmanagementsBeim Forschungsdatenmanagement geht es um einen verantwortungsvollen und reflektierten Umgang mit Forschungsdaten. Anhand spezifischer Maßnahmen und Strategien sollen Forschungsdaten sorgfältig organisiert, gepflegt und aufgearbeitet werden. Ziel ist es, sie im Sinne einer guten wissenschaftlichen Praxis langfristig zu speichern und für Dritte zugänglich und nachnutzbar zu machen. Somit soll eine Überprüfung wissenschaftlicher Aussagen vereinfacht, Nachweise gesichert und weitere Auswertungen und Analysen an den Daten vollzogen werden können. Weiterlesen und eine Voraussetzung für gutes wissenschaftliches ArbeitenDie gute wissenschaftliche Praxis (GWP) bildet einen standardisierten Kodex, der als Regelwerk in den Leitlinien der Deutschen Forschungsgemeinschaft (DFG) verankert ist. Die Leitlinien verweisen auf die ethische Verpflichtung jedes/jeder Forschenden, verantwortungsvoll, ehrlich und respektvoll vorzugehen, auch um das allgemeine Vertrauen in Forschung und Wissenschaft zu stärken. Sie können als Orientierung im Rahmen wissenschaftlicher Arbeitsprozesse geltend gemacht werden. Weiterlesen.
Gerade bei der Arbeit in Forschungsteams, wenn also mehrere Personen an einem Datenpool arbeiten, sollte frühzeitig eine Strategie zur Datenaufbewahrung und ‑sicherung entwickelt und etabliert werden, in der Fragen zur Speicherkapazität, zu Speicherorten, ‑medien sowie Zugriffsmöglichkeiten (datenschutzrechtlicheDatenschutz beinhaltet Maßnahmen gegen ein unrechtmäßiges Erheben, Speichern, Teilen und Nachnutzen von personenbezogenen Daten. Der Datenschutz stützt sich auf das Recht der Selbstbestimmung von Individuen in Bezug auf den Umgang mit ihren Daten und ist in der Datenschutz-Grundverordnung (DSGVO), dem Bundesdatenschutzgesetz und in den entsprechenden Gesetzen der Bundesländer verankert. Ein Verstoß gegen datenschutzrechtliche Vorschriften kann strafrechtliche Konsequenzen nach sich ziehen. Weiterlesen Bedingungen) und Sicherheit vor Datenverlust berücksichtigt werden. Mit verschiedenen Maßnahmen und BackupDer Begriff Backup bedeutet Datensicherung beziehungsweise Datenrettung und bezeichnet das Kopieren von Daten als Vorsorge für den Fall, dass es durch einen Schaden z. B. an der Festplatte oder durch versehentliches Löschen zu Datenverlusten kommt. Mit einem Backup können die Daten wiederhergestellt werden. Dafür wird der Datensatz auf einem anderen Datenträger zusätzlich gesichert (Sicherungskopie) und offline oder online abgelegt. Weiterlesen-Routinen (Sicherheitskopien) kann so ein möglicher Datenverlust minimiert werden.
Die verschiedenen Speicherorte und -medien haben bezüglich Kompatibilität, Mobilität, Zugriff, Sicherheit und Haltbarkeit sowie Backup-Möglichkeiten und des Anwendens von Verschlüsselungstechniken jeweils Vor- und Nachteile, die im Folgenden aufgezeigt werden (Baur, 2021; Forschungsdaten.info, 2023g).
Quelle: Übersicht verschiedener Speicherorte und -medien, Anne Voigt, 2023, lizenziert unter CC BY-SA 4.0
Motivation
Forschungsdaten sind einzigartige und wertvolle Daten, die sicher und geschützt aufbewahrt werden sollten, um die eigene Forschungsarbeit nicht zu verlieren. Mögliche Datenverluste können dabei ganz verschiedene Ursachen menschlichen oder technischen Ursprungs haben, wie das versehentliche Überschreiben oder Löschen, Hacker- und Trojanerangriffe oder der Verlust der Zugangsdaten zu einem Speicherort. Speichermedien sind auch nicht immer zuverlässig und können kaputt oder verloren gehen sowie gestohlen werden. Auch können Soft- und Hardware aufgrund technischer Neuentwicklungen nach einiger Zeit nicht mehr kompatibel sein.
Mobiles und flexibles Arbeiten ist aus der Forschungs- und Arbeitswelt nicht mehr wegzudenken. Hierfür ist ein zeit- und ortsunabhängiger Zugriff auf Daten Voraussetzung. Je nach Situation, z. B. im Feld ohne Internetzugang vs. im Büro bei der Auswertung, gibt es unterschiedliche Anforderungen an Speicherorte und ‑medien. Daher ist es wichtig, sich frühzeitig darüber Gedanken zu machen, welche Maßnahmen und regelmäßige Routinen etabliert werden, um die Forschungsdaten vor Verlust zu schützen.
Methoden
Neben der Auswahl des geeigneten Speicherortes für die Forschungsdaten spielt das regelmäßige Anfertigen von Sicherungskopien der Originaldateien und deren Archivierung (sogenannte BackupDer Begriff Backup bedeutet Datensicherung beziehungsweise Datenrettung und bezeichnet das Kopieren von Daten als Vorsorge für den Fall, dass es durch einen Schaden z. B. an der Festplatte oder durch versehentliches Löschen zu Datenverlusten kommt. Mit einem Backup können die Daten wiederhergestellt werden. Dafür wird der Datensatz auf einem anderen Datenträger zusätzlich gesichert (Sicherungskopie) und offline oder online abgelegt. Weiterlesen-Routinen) eine wichtige Rolle. Dabei sollten Backup-Dateien generell auf einem anderen Medium und getrennt von den Originaldaten aufbewahrt werden. Nach erfolgtem Backup ist es ratsam, die Daten auf Richtigkeit und Vollständigkeit zu kontrollieren.
Als eine optimale Backup-Strategie hat sich die 3-2-1-Regel bewährt:
- 3: Anfertigung von Datenkopien (neben dem Original noch zwei Kopien)
- 2: Speicherung auf zwei verschiedenen Speichertechnologien (z. B. interne Festplatte und Netzlaufwerk)
- 1: davon befindet sich extern (d. h. an einem anderen physischen Ort als die beiden anderen Kopien z. B. in der Cloud)
An vielen Hochschulen bieten Serviceeinrichtungen Backup-Möglichkeiten und ‑routinen an, die zum Großteil automatisiert ablaufen. Allerdings verliert man i. d. R. den Zugang zu diesen Serviceleistungen mit dem Weggang von einer Institution.
Daneben sollten die Forschenden stets eigene gut geplante Backup-Strategien entwickeln, um ihre Daten zu sichern. Folgende Fragen können hier hilfreich sein:
- Was genau soll wie oft gesichert werden?
- Wovon sollte eine Sicherheitskopie angefertigt werden (alle Daten, von einem Teil ...)?
- Auf welchen Systemen soll gesichert werden?
- Was ist das Primärsystem für die Originaldateien und welche Systeme werden für Backups genutzt?
- Ist ein schneller Zugriff auf die Daten wichtig?
- Wie häufig sollen Backups gemacht werden?
Anwendungsbeispiele
Quelle: Beispiel für 3-2-1-Regel, Anne Voigt, 2023, lizenziert unter CC BY-SA 4.0
Literatur und Quellenangaben
Baur, J. (2021). FDM erklärt – Forschungsdatenspeicherung. Forschungsdaten – Aktuelles & Wissenswertes. Blog der RWTH AAchen University. https://blog.rwth-aachen.de/forschungsdaten/2021/08/20/fdm-erklaert-forschungsdatenspeicherung/
Forschungsdaten.info. (2023g). Datenspeicherung und die Lebensdauer von Datenträgern. forschungsdaten.info. https://forschungsdaten.info/themen/speichern-und-rechnen/datenspeicherung-und-die-lebensdauer-von-datentraegern/
Zitierweise
Voigt, A. & Dührsen, J. L. (2023). Datenspeicherung. In Data Affairs. Datenmanagement in der ethnografischen Forschung. SFB 1171 & Center für Digitale Systeme, Freie Universität Berlin. https://data-affairs.affective-societies.de/artikel/dateispeicherung/