Einführung: Archivierung
Mit dem Begriff Archiv (lat. archivum „Aktenschrank“) verbinden viele vermutlich das Bild staubiger Kellerräume, in denen sich endlose Reihen mit Regalen voller Akten aneinanderreihen. Denkt man an die vielen Behörden, deren Amtsgeschäfte das Dokumentieren und Aufbewahren von administrativen Vorgängen erfordern (Versicherungen, Kranken- und Rentenkassen, Meldeämter etc.), so ist dieses Bild sicherlich zutreffend, auch wenn hier zunehmend auf DigitalisierungDigitale Daten werden durch Digitalisierung hergestellt, indem analoge Materialien in Formate überführt werden, die sich für eine elektronische Speicherung auf digitalen Datenträgern eignen. Digitale Daten haben den Vorteil, dass sie effizient und fehlerfrei vervielfacht, geteilt und maschinell verarbeitet werden können. Weiterlesen umgestellt wird. Doch neben Amtsarchiven gibt es eine unüberschaubare Vielzahl weiterer Archive, die sich sowohl in staatlicher als auch in privater Trägerschaft befinden können. Als Gedächtnisinstitutionen kommt ihnen – ebenso wie Museen, Bibliotheken und Dokumentationszentren – zum Teil eine große gesellschaftliche Bedeutung zu. Eine Sonderform bilden wissenschaftliche Sammlungen verschiedener Disziplinen, die primär zu Forschungszwecken unterhalten werden. Einen Einblick in die Vielgestaltigkeit dieser Sammlungen vermittelt das Portal Wissenschaftliche Sammlungen. Von besonderem Interesse sind hier die diversen ethnologischen Sammlungen, die sich zum Beispiel an den Universitäten in Göttingen, Frankfurt, Mainz, Tübingen, Marburg, Hannover u. a. befinden und sowohl Artefakte als auch Ton-, Bild-, Film- und Schriftdokumente umfassen1 siehe: https://portal.wissenschaftliche-sammlungen.de.
Die Forderung der Open-Science-BewegungDie Open-Science-Bewegung plädiert seit den frühen 2000er Jahren für eine offene und transparente Wissenschaft, in der alle Schritte des wissenschaftlichen Erkenntnisprozesses offen online zugänglich gemacht werden. So sollen nicht nur Endergebnisse von Forschungen wie Monographien oder Artikel öffentlich geteilt werden, sondern auch verwendete Materialien, die den Entstehungsprozess begleiteten wie: Labortagebücher, Forschungsdaten, verwendete Software, Forschungsberichte usw. Dadurch soll eine Partizipation an Wissenschaft und Erkenntnissen gefördert und interessierte Öffentlichkeiten angesprochen werden. Kreativität, Innovation und neue Kollaborationen sollen gefördert, Erkenntnisse auf ihre Qualität, Richtigkeit und Authentizität hin überprüft werden, was eine Demokratisierung von Forschung bezwecken soll. Zur Open Science zählen u. a. Open Access und Open Data, die Infrastrukturen des Teilens von Zwischenergebnissen von Forschungen bilden. Weiterlesen, Forschungsdaten soweit wie möglich für wissenschaftliche NachnutzungenEine Nachnutzung, oftmals auch Sekundärnutzung genannt, befragt bereits erhobene und veröffentlichte Forschungsdatensätze erneut mit dem Ziel, andere Erkenntnisse, möglicherweise aus einer neuen oder unterschiedlichen Perspektive, zu erhalten. Die Aufbereitung von Forschungsdaten für eine Nachnutzung erfordert einen erheblich höheren Anonymisierungs-, Aufbereitungs- und Dokumentationsaufwand als die bloße Archivierung im Sinne von Datenspeicherung. Weiterlesen als auch für interessierte Öffentlichkeiten zur Verfügung zu stellen, knüpft also an eine lange Tradition des Aufbereitens und Speicherns von Dokumenten und Objekten für Forschungs- aber auch für öffentliche Informationszwecke an. So ermöglichen die meisten wissenschaftlichen Sammlungen interessierten Personen Zugang zu ihren Archiven oder stellen auch Teile ihrer Sammlungen öffentlich aus.
In diesem Artikel geht es ausschließlich um die Zugänglichmachung von digitalen und digitalisierten Daten in institutionalisierten Archiven oder RepositorienEin Repositorium bildet einen Ort der Aufbewahrung wissenschaftlicher Dokumente. In Online-Repositorien werden Publikationen digital gespeichert, verwaltet und mit persistenten Identifikatoren versehen. Die Katalogisierung vereinfacht die Suche und Nutzung von Publikationen und Autor*innen. In den meisten Fällen sind Dokumente in Online-Repositorien uneingeschränkt und offen zugänglich (Open Access). Weiterlesen2Das bedeutet nicht zwangsläufig, dass das Material frei ins Internet gestellt wird, sondern dass der Zugang kontrolliert bzw. beschränkt werden kann oder auch muss., und nicht um die individuelle Archivierung und Aufbewahrung von Daten und Materialien der Forschenden in digitalen Ordnern oder analogen Kisten und Kästen. Das eigentliche Ziel der Archivierung von Forschungsdaten ist i. d. R., deren Nachnutzung (vgl. Artikel Nachnutzung) zu ermöglichen. Eine wichtige Rolle hierbei spielt die DatendokumentationForschungsdaten bilden nicht nur die Basis wissenschaftlicher Veröffentlichungen der jeweiligen Forscher*innen, sondern werden in vielen Fällen anderen zugänglich gemacht. Dies setzt voraus, dass Forschungsdaten verständlich dokumentiert sind. Unverzichtbar wird dies, wenn eine Datenpublikation beabsichtigt ist. Eine zentrale Rolle für das Finden, Durchsuchen und Nutzen von Forschungsdaten spielen Metadaten, also Daten, die strukturierte Informationen über andere Daten enthalten. In verschiedenen Wissenschaftskreisen haben sich für die Dokumentation in Form von Metadaten sogenannte Metadatenstandards etabliert, die Konventionen für die Beschreibung und Dokumentation von Forschungsdaten über Metadaten festlegen. Weiterlesen in Form von MetadatenMetadaten sind Beschreibungen von Forschungsdaten (Daten über Daten) und geben inhaltliche und strukturierte Informationen zum Forschungskontext, dem methodischen und analytischen Verfahren, sowie über das jeweilige Forschungsteam, das die Daten generiert. Sie lassen sich unterscheiden in bibliographische, administrative, prozessuale und deskriptive Metadaten und werden beispielsweise in Form von Templates, ReadMe-Dateien oder Data Curation Profiles verfasst. Metadaten werden begleitend zu den Forschungsdaten selbst publiziert und gelten insbesondere in Online-Repositorien und Forschungsdatenzentren als unverzichtbar für das Nachvollziehen und Verstehen von Datensätzen durch Dritte. Auch erleichtern Metadaten die Auffindbarkeit und Maschinenlesbarkeit von Daten und sind somit Teil der FAIR-Prinzipien und der guten wissenschaftlichen Praxis. Weiterlesen, mithilfe derer die Daten von Dritten gefunden werden können und nachvollziehbar und verständlich werden (vgl. Artikel Datendokumentation und Metadaten).