Logo

Suche in DATA AFFAIRS

GlossareintragPID (Persistent Identifier)

PID (Persistent Identifier)

Ein Persistent Identifier (PID) (auf Deutsch: dauerhafter Identifikator) ist ein dauerhafter, digitaler Code, der einer digitalen Ressource wie z. B. einem Datensatz, einem wissenschaftlichen Artikel oder einer anderen Veröffentlichung direkt zugeordnet ist und diese damit permanent identifizier- und auffindbar macht. Im Gegensatz zu anderen seriellen Identifikatoren (bspw. URL-Adressen) verweist ein Persistent Identifier auf das Objekt selbst und nicht auf seinen Standort im Internet. Ändert sich der Standort eines mit einem Persistent Identifier assoziierten digitalen Objekts, so bleibt der Identifikator derselbe. Es muss lediglich in der Identifikator-Datenbank der URL-Standort geändert oder ergänzt werden. So wird sichergestellt, dass ein Datensatz dauerhaft auffindbar, abrufbar und zitierbar bleibt (Forschungdaten.info, 2023).

PIDs spielen eine zentrale Rolle bei der FAIRen (Wieder)Verwendung von Forschungsdaten'Forschungsdaten sind (digitale) Daten, die während wissenschaftlicher Tätigkeit (z. B. durch Messungen, Befragungen, Beobachtungen, Experimente, Quellenarbeit) entstehen. Sie bilden eine Grundlage wissenschaftlicher Arbeit und dokumentieren deren Ergebnisse. Daraus ergibt sich ein disziplin- und projektspezifisches Verständnis von Forschungsdaten (siehe ethnografische Forschungsdaten) mit unterschiedlichen Anforderungen an die Aufbereitung, Verarbeitung und Verwaltung der Daten: dem sogenannten Forschungsdatenmanagement (FDM)' (Forschungsdaten.info, 2023). Weiterlesen und werden nicht ohne Grund explizit in den FAIR-PrinzipienDie FAIR-Prinzipien wurden 2016 erstmals von der FORCE 11-Community (The Future of Research Communication and e-Scholarship) entwickelt. FORCE11 ist eine Gemeinschaft von Wissenschaftlern, Bibliothekaren, Archivaren, Verlegern und Forschungsförderern, die durch den effektiven Einsatz von Informationstechnologie einen Wandel in der modernen wissenschaftlichen Kommunikation herbeiführen und so eine verbesserte Wissenserstellung und -weitergabe unterstützen will. Das primäre Ziel liegt in der transparenten und offenen Darlegung wissenschaftlicher Erkenntnisprozesse. Demnach sollten Daten online findable (auffindbar), accessible (zugänglich), interoperable (kompatibel) und reusable (wiederverwendbar) abgelegt und strukturiert sein. Ziel ist es, Daten langfristig aufzubewahren und im Sinne der Open Science und des Data Sharing für eine Nachnutzung durch Dritte bereitzustellen. Genaue Definitionen der FORCE11 selbst können auf der Website nachgelesen werden siehe: https://force11.org/info/the-fair-data-principles/. Die FAIR-Prinzipien berücksichtigen ethische Aspekte der Weitergabe von Daten in sozialwissenschaftlichen Kontexten nicht hinreichend, weshalb sie um die CARE-Prinzipien ergänzt wurden. Weiterlesen erwähnt. Forschungsdaten sollten zugänglich, interoperabel und wiederverwendbar sein, aber dazu müssen sie zuerst auch gefunden werden. Global eindeutige und persistente Identifier sind unerlässlich, um die Identifikation veröffentlichter Ressourcen zu ermöglichen und maschinenlesbare MetadatenMetadaten sind Beschreibungen von Forschungsdaten (Daten über Daten) und geben inhaltliche und strukturierte Informationen zum Forschungskontext, dem methodischen und analytischen Verfahren, sowie über das jeweilige Forschungsteam, das die Daten generiert. Sie lassen sich unterscheiden in bibliographische, administrative, prozessuale und deskriptive Metadaten und werden beispielsweise in Form von Templates, ReadMe-Dateien oder Data Curation Profiles verfasst. Metadaten werden begleitend zu den Forschungsdaten selbst publiziert und gelten insbesondere in Online-Repositorien und Forschungsdatenzentren als unverzichtbar für das Nachvollziehen und Verstehen von Datensätzen durch Dritte. Auch erleichtern Metadaten die Auffindbarkeit und Maschinenlesbarkeit von Daten und sind somit Teil der FAIR-Prinzipien und der guten wissenschaftlichen Praxis. Weiterlesen bereitzustellen. PIDs werden jedoch nicht nur Datensätzen und Publikationen zugeordnet, sondern sind für alle Aspekte des ForschungsdatenlebenszyklusDas Modell des Forschungsdatenlebenszyklus stellt sämtliche Phasen dar, die Forschungsdaten vom Zeitpunkt der Erhebung bis zu ihrer Nachnutzung durchlaufen können. Die Phasen sind an bestimmte Aufgaben gekoppelt und können variieren (Forschungsdaten.info, 2023). Allgemein umfasst der Forschungsdatenlebenszyklus folgende Teilbereiche:  Weiterlesen relevant, für die Forschenden selbst, sowie Organisationen und Förderinstitutionen.

Beispiele für persistente Identifikatoren sind z. B. der DOIDie Abkürzung DOI steht für Digital Object Identifier und ist ein eindeutiger und dauerhafter (persistenter) Identifikator für digitale Objekte, z. B. für Artikel und Beiträge in wissenschaftlichen Veröffentlichungen aber auch Veröffentlichungen von Vorträgen und Lehrmaterialien. Ein DOI muss initial in der zentralen Datenbank, der International DOI Foundation, registriert werden siehe: https://www.doi.org/. Weiterlesen oder die ORCIDAls Beispiel für eine Normdatei zur eindeutigen Identifizierung von Personen gilt die sogenannte ORCID. Die Open Research and Contributor-ID (ORCID) ist ein international anerkannter persistenter Identifikator, mit dessen Hilfe Forschende eindeutig identifiziert werden können. Die ID kann dauerhaft sowie institutionsunabhängig von Forschenden für ihre wissenschaftlichen Veröffentlichungen verwendet werden. Sie besteht aus 16 Ziffern, die in vier Viererblöcken dargestellt sind (z.B. 0000-0002-2792-2625). Die ORCID-ID ist als Identifizierungsnummer bei zahlreichen Verlagen, Universitäten und wissenschaftsnahen Einrichtungen etabliert und wird in den Workflow z. B. bei der Begutachtung von Zeitschriftenartikeln integriert Eine ORCID kann unter https://orcid.org/ kostenfrei erstellt werden.. Weiterlesen.

Literatur und Quellenangaben