Logo

Suche in DATA AFFAIRS

ArtikelDateibenennung

Dateibenennung

Übersicht

In diesem Artikel geht es um Benennungen von (Forschungs)-Daten. Eine klare Dateibenennung, z. B. mithilfe einer Benennungskonvention, ist neben einer systematischen Ordnerstruktur (vgl. Artikel Ordnerstruktur) ein wichtiger Baustein der Dateiaufbewahrung und -sicherung.

Definition

Der Dateiname identifiziert in Verbindung mit dem zur Datei führenden Verzeichnispfad eine Datei eindeutig. Er besteht aus der eigentlichen Benennung und der ErweiterungDie Dateiendung gibt an, um welche Art von Datei es sich handelt (Dokument, Bild, Video, etc.) und in welchem Format sie gespeichert ist. Die Dateiendung bestimmt auch, mit welchem Programm die Datei standardmäßig geöffnet wird. Sie sollte unbedingt dem tatsächlichen Dateityp entsprechen und nicht geändert werden. Weiterlesen oder EndungDie Dateiendung gibt an, um welche Art von Datei es sich handelt (Dokument, Bild, Video, etc.) und in welchem Format sie gespeichert ist. Die Dateiendung bestimmt auch, mit welchem Programm die Datei standardmäßig geöffnet wird. Sie sollte unbedingt dem tatsächlichen Dateityp entsprechen und nicht geändert werden. Weiterlesen. Die Erweiterungen (z. B. .gif, .pdf, .docx, .mp3...) geben Hinweise auf die Art der DateitypenDie Begriffe Dateitypen und Dateiformate werden meist synonym verwendet. Es wird zwischen proprietären und offenen Dateiformaten unterschieden. Für proprietäre Formate braucht man meist eine kostenpflichtige Software, da diese von anderen Programmen nicht zu öffnen oder zu lesen sind, wie etwa Powerpoint für .ppt- oder Photoshop für .psd-Dateien. Offene Formate wie .rft oder .png dagegen basieren auf Standards und können von vielen Programmen geöffnet werden. Weiterlesen (Bild-, Text-, Audiodateien) und bestimmen auch, mit welchem Programm die Datei standardmäßig geöffnet werden kann (z. B. .docx mit Microsoft Word).

Quelle: Beispiel eines Dateipfades, Anne Voigt, 2023, lizenziert unter CC BY-SA 4.0

Motivation

Die Art und Weise der Benennung von Dateien ist ein wichtiger Baustein der Dateiaufbewahrung und -sicherung. Eine klare Dateibenennung

  • dient dazu, Dateien innerhalb eines Ordners eindeutig unterscheiden zu können,
  • hilft dabei, bei verschiedenen Versionen einer Datei die aktuellste eindeutig ermitteln zu können,
  • verhindert/verkürzt das aufwändige Suchen nach Dateien,
  • erleichtert die Zuordenbarkeit und Auffindbarkeit, insbesondere wenn Dateien (versehentlich) verschoben wurden und
  • dient der Übersichtlichkeit, da Dateien logisch sortiert angezeigt werden.

Durch ein systematisches Vorgehen bei der Dateiorganisation kann sichergestellt werden, dass Informationen nicht irrtümlich gelöscht oder überschrieben werden, aus Backup-RoutinenDer Begriff Backup bedeutet Datensicherung beziehungsweise Datenrettung und bezeichnet das Kopieren von Daten als Vorsorge für den Fall, dass es durch einen Schaden z. B. an der Festplatte oder durch versehentliches Löschen zu Datenverlusten kommt. Mit einem Backup können die Daten wiederhergestellt werden. Dafür wird der Datensatz auf einem anderen Datenträger zusätzlich gesichert (Sicherungskopie) und offline oder online abgelegt. Weiterlesen herausfallen oder verloren gehen. Systematische Dateibenennungen sind besonders wichtig, wenn mehrere Personen eines Teams Dateien gemeinsam bearbeiten bzw. darauf zugreifen.

Methoden

Allgemeine Empfehlungen

Die folgenden Elemente sind für eine klare Dateibenennung meist ausreichend. Je nach Kontext, Projekt und Arbeitsumfeld können jedoch einige entfallen oder weitere hinzugenommen werden ( VerbundFDB, 2018).

  1. Datum
  2. ggf. Organisation/Zugehörigkeit zu einem Projekt, Abteilung o. ä.
  3. Kurztitel
  4. Version
  5. bei Teamarbeit: der/die jeweilige Autor*in oder Bearbeiter*in

Die angegebene Reihenfolge ist nicht bindend. In der Regel wird jedoch empfohlen, das Datum voranzustellen, da die Dateien so in chronologischer Reihenfolge sortiert werden. Wichtig ist in jedem Fall, dass die Dateibenennung konsistent erfolgt, d. h. unter Verwendung der festgelegten Bestandteile in immer der gleichen Reihenfolge.

Auf Leerzeichen, Schrägstriche, Umlaute und diakritische Zeichen sollte verzichtet werden, damit die Dateinamen maschinenlesbar sind. Denn diese Sonderzeichen erschweren die Kompatibilität zwischen verschiedenen Systemen, weil sie je nach Betriebssystem unerwünschte Effekte erzeugen können wie z. B. eine Änderung des Dateinamens.

Zeichen in Dateinamen, Anne Voigt, 2023, lizenziert unter CC BY-SA 4.0

Quelle: Zeichen in Dateinamen, Anne Voigt, 2023, lizenziert unter CC BY-SA 4.0

Für die Trennung der Bestandteile im Dateinamen haben sich aus den Programmiersprachen kommend folgende mögliche Schreibweisen etabliert:

Trennungsmöglichkeiten der Bestandteile von Dateinamen, Anne Voigt, 2023, lizenziert unter CC BY-SA 4.0

Quelle: Trennungsmöglichkeiten der Bestandteile von Dateinamen, Anne Voigt, 2023, lizenziert unter CC BY-SA 4.0

Bestandteile des Dateinamens

Datum

Grundsätzlich wird in jedem Dateisystem das Datum der letzten Änderung einer Datei gespeichert. Diese Informationen sind aber nicht immer betriebssystemübergreifend verfügbar und gehen evtl. beim Kopieren/Verschieben/Versenden/… verloren. Spielt das Datum eine wichtige Rolle, sollte es mit in den Dateinamen geschrieben werden.

  • Steht das Datum am Anfang des Dateinamens, werden die Dateien chronologisch sortiert angezeigt.
  • ISO 8601-Format: JJJJ-MM-TT (gekürzt: JJ-MM-TT oder JJMMTT)
    Dieses Format ist ein international anerkannter und eindeutiger Standard und lässt sich von anderen Programmen auslesen, dies ist z. B. relevant für Archivierungszwecke (Wikipedia, 2023).

Beispiele

2021-02-10_
2021-02-21_
2021-03-05_

Organisation/Zugehörigkeit

Damit auch nach längerer Zeit oder für Dritte erkennbar ist, aus welchem Kontext eine Datei stammt, ist es hilfreich, ein Kürzel für die Organisation/das Projekt/ … im Dateinamen festzuhalten.

Beispiele

Teilprojekt: 2021-02-10_A01 
Studie: 2021-02-10_SOEP
Hausarbeit: 2021-02-10_HA

Kurztitel der Datei

Der Kurztitel sollte den Inhalt der Datei deutlich widerspiegeln, aber trotzdem sehr knapp formuliert werden. Es sollten so viele Informationen in die Namensgebung einfließen, dass Dateien und Dokumente auch ohne den Ablagekontext z. B. beim Versenden identifiziert werden können.

Beispiele

Protokoll: 2021-02-10_A01_Protokoll-jf
Transkript zu Interview 1: 2021-02-10_SOEP_Int01-Transkript
Hausarbeit zur Methode Interview: 2021-02-10_HA_Methode-Int

Versionierung

VersionierungenVersionierung bedeutet die Erfassung aller Veränderungen von Forschungsdaten während des Arbeitsprozesses. Es empfiehlt sich bei jeder Datenanpassung eine neue Version dieser zu speichern, um die Veränderung nachvollziehbar kenntlich zu machen. Dafür können manuelle Maßnahmen wie Versionierungsschemata (z. B. durch Nummerierung: Version 1.3.2.) ergriffen, oder Versionierungssoftware wie Git verwendet werden. Versioniert wird während des Forschungsprozesses selbst, aber auch bei bereits veröffentlichten Forschungsdaten ist eine Versionierung im Nachhinein möglich, um nachnutzenden Dritten die korrekte Version der Forschungsdaten zur Verfügung zu stellen. Weiterlesen sind wichtig, um vor allem auch in Projektteams Änderungen sowie Arbeits- und Denkprozesse nachvollziehen zu können. Benennungen mit „final2″, „finalfinal”, „FINAL!!!”, „bearbeitet” etc. sind nicht eindeutig. Es empfiehlt sich daher, eine Versionierung mit „v+Nummerierung” in den Dateinamen einzufügen. Verwenden Sie jeweils eine vorangestellte Null bei der Hauptversion (01, 02 usw.), bleibt die Sortierung der Dateien auch dann noch korrekt, wenn mehr als neun Versionen existieren.

Bei der Versionierung kann zwischen größeren und kleineren Änderungen an einer Datei unterschieden werden. Die allererste Version wird dann mit v01-0 markiert, die nächste kleine Änderung (Rechtschreib- und Grammatikfehler verbessern, Formatierung, etc.) erhält ein v01-1 und die nächste große Änderung (neues Kapitel hinzugefügt, umstrukturiert, usw.) ein v02-0 als Versionsnummer.

Beispiele

Erste Version: 2021-02-10_SOEP_Int01-Transkript-v01-0
Erste Version mit kleineren Änderungen: 2021-02-10_SOEP_Int01-Transkript-v01-1
Erste größere Revision: 2021-02-10_SOEP_Int01-Transkript-v02-0

Autor*in/Bearbeiter*in

Die Nennung der zuletzt bearbeitenden Person im Dateinamen ist hilfreich, wenn verschiedene Personen am gleichen Dokument arbeiten. So ist transparent, wer welche Änderungen vorgenommen hat, oder von wem ein Dokument stammt. Die Initialen sind meist ausreichend.

Beispiele

Erste Version durch eine Person: 2021-02-10_SOEP_Int01-Transkript-v01-0_XY
Erste Version mit kleineren Änderungen durch andere Person: 2021-02-10_SOEP_Int01-Transkript-v01-1_YZ

Anwendungsbeispiele

Quelle: Abbildung 1 bis 6, Anne Voigt, lizenziert unter CC BY-SA 4.0

Diskussion

Betriebssysteme und Speicherung des Datums einer Dateiänderung
„Es werden doch die Daten der Erstellung und der letzten Bearbeitung gespeichert, warum soll das auch noch in den Dateinamen?”
Es ist trotzdem sinnvoll, das Datum mit in den Dateinamen zu schreiben, obwohl in jedem Dateisystem das Datum der letzten Änderung einer Datei gespeichert wird. Denn diese Informationen sind nicht immer betriebssystemübergreifend verfügbar und können beim Kopieren/Verschieben/Versenden/… verloren gehen.

Versionierung vs. Änderungsverfolgung (bei Word)
„Viele Programme bieten mittlerweile Funktionen, um Änderungen nachvollziehen zu können (u.a. Word). Sollte ich trotzdem für jede Version eine eigene Datei erstellen?”
Ja, weil so direkt aus dem Dateinamen ersichtlich wird, dass eine Änderung stattgefunden hat und nie zwei (oder mehr) Dateien mit dem gleichen Namen aber unterschiedlichen Inhalten existieren. Außerdem kann das Nachverfolgen von Änderungen z. B. in Word abgeschaltet werden, oder die verschiedenen Autor*innen unterschiedliche Software benutzen, die Versionierung nicht (vollständig) unterstützen.

Versionierungen und höherer Speicherverbrauch
„Wenn jede auch noch so kleinste Änderung als neue Version abspeichert wird, verbraucht das nicht unnötig viel Speicherplatz?”
Das gilt vor allem für Video-, Audio- und Bilddateien. Hier empfiehlt es sich, die Rohdaten im Original zu behalten und eine “Arbeitsdatei” zu erstellen, aus der dann ggf. verschiedene Versionen bzw. die finale Datei generiert werden.
Textdateien verbrauchen i. d. R. nicht so viel Speicherplatz. Arbeiten Sie in einem Team gemeinsam an Dateien, ist es ratsam, jede Veränderung zu versionieren, damit den Teammitgliedern zur weiteren Bearbeitung immer die aktuellste Datei vorliegt. Arbeiten Sie allein an den Dateien, können Sie selbst entscheiden, ob Sie auch für kleinste Rechtschreib- und Grammatikkorrektur eine Version anlegen, oder nur bei inhaltlichen (größeren) Bearbeitungen.

Versionierungen und Übersichtlichkeit
„Verliert man nicht die Übersicht bei zu vielen Versionierungen von Dateien? Wohin mit den vielen alten Versionen?”
Es bietet sich an, die vorherigen Versionierungen in einem Archiv-Ordner abzulegen, und alle Versionen bis auf die aktuellste dorthin zu verschieben. So liegen im Hauptordner nur die aktuellen Versionen, die dann direkt gefunden werden. Es ist ratsam, Ordner regelmäßig aufzuräumen und nicht gebrauchte Dateien (inkl. Versionen) zu löschen, da dies Energie spart und so die Umwelt schont.

Literatur und Quellenangaben

Zitierweise

Voigt, A. & Röttger-Rössler, B. (2023). Dateibenennung. In Data Affairs. Datenmanagement in der ethnografischen Forschung. SFB 1171 & Center für Digitale Systeme, Freie Universität Berlin. https://data-affairs.affective-societies.de/artikel/dateibenennung/