Skip to main content

Glossar

Administrator

Administratoren sind vom Kunden benannte Personen, die in RADAR Arbeitsbereiche einrichten und verwalten, an Benutzer die Rollen Kurator oder Subkurator für einen Arbeitsbereich vergeben, Quota definieren und Statistiken einsehen. Pro Vertrag können ein oder mehrere Administratoren bestimmt werden. RADAR kommuniziert wichtige Informationen (Releases, Wartungs-Downtimes oder ungeplanten Systemausfällen etc.) per E-Mail an Administratoren.

Angemeldete Nutzer

In RADAR werden verschiedenen Nutzergruppen unterschiedliche Zugriffsrechte eingeräumt. Administratoren, Kuratoren und Subkuratoren müssen bei RADAR angemeldet sein, um ihre Rolle wahrnehmen zu können. Auch für den Zugang zu archivierten Forschungsdaten ist eine Anmeldung am System und die Freigabe durch den zuständigen Administrator bzw. Kurator erforderlich. Der Zugang zur Suchfunktion und zu publizierten Datenpaketen ist für jeden Nutzer (auch unangemeldete Nutzer) frei.

API

RADAR stellt eine API (Application Programming Interface), also eine Programmierschnittstelle, zur Verfügung. Über die API können RADAR-Dienste in eigene Applikationen integriert und beispielsweise über eine eigene Benutzungsoberfläche angeboten werden. Die RADAR API ist REST-basiert. Die Dokumentation der API ist hier verfügbar. Das System kann parallel über die API und die reguläre RADAR-Benutzungsoberfläche angeboten werden.

Arbeitsbereich

Der Arbeitsbereich ist der zentrale Einstiegspunkt für Forschende in RADAR, die Daten archivieren oder publizieren wollen. Er wird typischerweise für eine Arbeitsgruppe, eine Organisationseinheit oder ein Projekt eingerichtet. Er bietet eine Übersicht über die bereits vorhandenen Datenpakete, erlaubt das Hochladen von Forschungsdaten und deren Beschreibung mit Metadaten. Jedem Arbeitsbereich wird vom Administrator mindestens ein Kurator zugeordnet, der diesen verwaltet. Der Kurator entscheidet über die Publikation oder Archivierung von Datenpaketen, kann Vorgaben zu den Metadaten machen und die Zugriffsrechte für den Arbeitsbereich und für archivierte Datenpakete festlegen. Für jeden RADAR-Vertrag können mehrere Arbeitsbereiche eingerichtet werden.

Auffindbarkeit

Kuratoren beschreiben die Datenpakete vor dem Publizieren mit Metadaten. Damit wird die Sichtbarkeit und die Auffindbarkeit der über RADAR publizierten Forschungsdaten erhöht. Hierfür werden die Metadaten standardisiert mit anderen Diensten geteilt (z.B. DataCite, OAI Provider).

Begutachtung von Forschungsdaten

RADAR unterstützt einen Review-Prozess vor einer Datenpublikation. Dazu kann ein Datenpaket vom Status „in Bearbeitung“ in den Status „in Begutachtung“ versetzt werden. Damit kann das Datenpaket nicht mehr bearbeitet werden und RADAR erzeugt einen eindeutigen Link, den der Datengeber an den zuständigen Verlag bzw. die Gutachter weitergeben kann und über diese auch ohne vorherige Authentifizierung auf die noch unveröffentlichten Daten zugreifen können. Datenpakete mit dem Status „in Begutachtung“ befinden sich stets im temporären Speicher. Nach Abschluss der Begutachtung kann der Datengeber den Status für das Datenpaket entweder wieder in den Bearbeitungsstatus überführen oder aber das Datenpaket publizieren. In beiden Fällen wird der vorher erzeugte eindeutige Link ungültig. Der Datengeber kann ein Datenpaket mehrfach hintereinander in den Status „in Begutachtung“ versetzen.

Bitstream Preservation

Digitale Daten bestehen aus einer festgelegten Abfolge von Bits, die auf Datenträgern gespeichert werden. Diese Abfolge wird Bitstream genannt. Die Lebensdauer und Zuverlässigkeit von Datenträgern ist jedoch begrenzt. Einzelne Bits können dadurch im Laufe der Zeit nicht mehr oder verfälscht gelesen werden. Dies führt zu Informationsverlust. Die Bitstream Preservation stellt durch technische Maßnahmen wie Prüfsummen und Redundanz sicher, dass der Bitstream über längere Zeiträume, auch nach Technologiewechseln, unverändert erhalten bleibt. Sie bildet eine Grundvoraussetzung für die digitale Langzeitarchivierung.

Bitstream Preservation

Digital data consists of a fixed sequence of bits that are stored on data carriers. This sequence is called a bitstream. Since the lifetime and reliability of storage media is limited, individual bits may no longer be read correctly after longer time periods. This leads to loss of information. Bitstream preservation uses technical measures such as checksums and redundancy to ensure that the Bitstream remains unchanged over time and after changes in technology. It is a basic prerequisite for digital long-term preservation.

Creative Commons Lizenzen

Um Nutzungsrechte für Forschungsdaten festzulegen, bietet RADAR Datengebern verschiedene Lizenzmodelle an. Lizenzen sind Standardverträge, die für ein entsprechend lizenziertes Objekt bestimmte Handlungen (z.B. lesen, kopieren, weiterverbreiten, verändern, mit anderen Daten kombinieren) erlauben. RADAR empfiehlt die Verwendung liberaler und weit verbreiteter Lizenzen, die eine sinnvolle Nachnutzung für die Forschung rechtlich ermöglichen. Insbesondere die weltweit anerkannten Creative Commons Lizenzen sind aufgrund ihrer weiten Verbreitung zu empfehlen. Sie eignen sich auch für Forschungsdaten. Eine Übersicht zu Creative Commons Lizenzen finden Sie hier.

Data Archiving

RADAR offers data archiving for retention periods between 5 and 15 years. This fulfills the requirements of good scientific practice and many funding agencies to retain data for a longer period after a project is completed. Each archived dataset is assigned an identifier in the form of a RADAR-ID. RADAR uses bitstream preservation to ensure that the data remains unchanged for the retention period. In contrast to data publication, archived data sets and respective metadata can only be viewed and accessed by administrators and curators or subcurators of the workspace. Optionally, access can also be granted to selected registered users or to all RADAR users.

Dateiformate

Nicht alle Dateiformate eignen sich für die Langzeitarchivierung von Forschungsdaten. Formate sollten den Standards der jeweiligen Fachdisziplin entsprechen und nach Möglichkeit vollständig offen und dokumentiert sein. Einige Formate, die die Nachnutzbarkeit von Daten erleichtern, haben sich bewährt. RADAR hat hier eine Übersicht empfohlener Dateiformate für unterschiedliche Objekttypen zusammengestellt, die jedoch nicht abschließend ist.

Datenarchivierung

RADAR bietet die Datenarchivierung über eine Haltefrist zwischen 5 und 15 Jahren. Damit wird den Anforderungen guter wissenschaftlicher Praxis und vieler Drittmittelgeber entsprochen, Daten auch nach Abschluss eines Vorhabens für einen längeren Zeitraum vorzuhalten. RADAR vergibt an jedes archivierte Datenpaket einen Identifier in Form einer RADAR-ID und stellt mittels der Bitstream Preservation sicher, dass diese auch nach vielen Jahren unverändert vorliegen. Archivierte Daten und ihre Metadaten sind, anders als bei der Datenpublikation, standardmäßig nur für Administratoren und Kuratoren bzw. Subkuratoren des Arbeitsbereichs einsehbar und zugänglich. Optional kann der Zugriff aber auch für ausgewählte registrierte Nutzer oder für alle RADAR-Nutzer freigegeben werden.

Datengeber

Datengeber sind vom RADAR-Vertragspartner autorisierte Dritte (üblicherweise Mitarbeitende der Einrichtung), die Forschungsdaten mit RADAR archivieren oder publizieren und zu diesem Zweck Daten an RADAR übertragen. RADAR unterscheidet zwischen Datengebern mit vollen Rechten (Kuratoren) und Datengebern mit eingeschränkten Rechten (Subkuratoren).

Datenmanagementplan

Mit einem Datenmanagementplan (DMP) werden alle Entscheidungen und Prozesse zum Umgang mit den Forschungsdaten eines Projekts dokumentiert. Idealerweise wird ein DMP bereits vor Beginn eines Forschungsprojekts bei der Beantragung von Forschungsmitteln erstellt. Er sollte während des laufenden Projekts immer wieder überprüft und angepasst werden, d.h. er ist ein lebendes Dokument. Mit einem DMP können auch Mittel für die adäquate Datenpublikation oder -archivierung beantragt werden. Die Preise für RADAR-Dienste finden Sie hier. Bitte kontaktieren Sie uns bei Rückfragen unter info@radar-serivce.eu.

Datenpaket

Ein Datenpaket besteht aus einer oder mehreren Dateien, die in Verzeichnissen organisiert sein können. Hinzu kommen die dazugehörigen Beschreibungen in Form von Metadaten. Datenpakete werden von Kuratoren und Subkuratoren im Arbeitsbereich angelegt und bearbeitet. Mit RADAR können Datenpakete entweder archiviert oder publiziert werden. Jedes Datenpaket wird in RADAR mit einem Identifier (DOI oder RADAR-ID) versehen. Um ein neues Datenpaket anzulegen, können einzelne Dateien wie auch Zusammenstellungen in Form von ZIP-, TAR-, GZIP, oder anderen komprimierten Dateien hochgeladen werden. Eventuell in den Zusammenstellungen enthaltene Verzeichnisse werden automatisch für das Datenpaket übernommen. RADAR empfiehlt die Verwendung von Dateiformaten, die sich für die Langzeitarchivierung eignen.

Datenpublikation

Bei der Datenpublikation werden, anders als bei der Datenarchivierung, die Forschungsdaten und ihre Metadaten von RADAR öffentlich zugänglich gemacht. Jeder Datensatz erhält einen eindeutigen und persistenten Identifier in Form einer DOI. Optional kann der Kurator auch ein zeitliches Embargo festlegen. Publizierte Daten können zitiert und von Dritten entsprechend der Lizenzbedingungen nachgenutzt werden. RADAR garantiert für publizierte Daten eine Verfügbarkeit von mindestens 25 Jahren.

Digital Long-Term Preservation

Digital long-term preservation aims at ensuring the long-term availability of digital documents, e.g. research data. It involves two levels. On the one hand, bitstream preservation ensures that the data remains unchanged over time. Functional long-term preservation aims at maintaining the interpretability of the data and can include measures such as migration or emulation. RADAR guarantees the readability of the datasets within the retention period specified by the customer (5-15 years) for archived datasets or for at least 25 years for published datasets. To ensure that the data can be interpreted and used, RADAR recommends the use of suitable file formats. For further information on suitable file formats, please refer to this overview.

Digitale Langzeitarchivierung

Unter digitaler Langzeitarchivierung wird die Sicherung der langfristigen Verfügbarkeit von digitalen Dokumenten, zum Beispiel Forschungsdaten, verstanden. Sie erfolgt auf zwei Ebenen. Einerseits stellt die Bitstream Preservation sicher, dass die Daten über die Zeit unverändert erhalten bleiben. Die funktionale Langzeitarchivierung ermöglicht die Interpretierbarkeit der Daten, gegebenenfalls durch Maßnahmen wie Migration oder Emulation. RADAR garantiert die Lesbarkeit der Datenpakete im Rahmen der vom Kunden festgelegten Haltefrist bei der Datenarchivierung (5-15 Jahre) bzw. für mindestens 25 Jahre Bei der Datenpublikation. Damit die Daten über diesen Zeitraum hinweg auch interpretiert und genutzt werden können, empfiehlt RADAR die Verwendung von geeigneten Dateiformaten. Weitere Informationen zu geeigneten Dateiformaten finden Sie in unserer Übersicht.

Digitales Repositorium

Ein digitales Repositorium ist eine online verfügbare Informationsinfrastruktur, die digitale Objekte sicher speichert und, wenn gewünscht, zugänglich macht. Die Objekte – zum Beispiel Forschungsdaten – werden mit Metadaten beschrieben und mit Identifiern versehen. Dadurch können Forschungsdaten aufgefunden, zitiert und (entsprechend der Lizenzbedingungen) nachgenutzt werden. RADAR entstand als digitales Repositorium für Forschungsdaten der sogenannten „Long Tail“-Disziplinen.

DOI - Digital Object Identifier

Ein Digital Object Identifier (DOI) ist eine Zeichenkette, bestehend aus einem Präfix und einem Suffix (z.B. DOI: 10.1000/123456), die ein digitales Objekt – zum Beispiel Zeitschriftenartikel oder Forschungsdaten - eindeutig identifiziert. Der Identifier verweist permanent auf das zugeordnete Objekt. Durch DOIs können Forschungsdaten leichter gefunden, zitiert und mit anderen wissenschaftlichen Publikationen verknüpft werden. In RADAR erhält jedes publizierte Datenpaket automatisch eine DOI, die bei der globalen Organisation DataCite registriert wird.

Embargo

Ein Embargo definiert einen Zeitraum, in dem publizierte Datenpakete nicht zugänglich, deren Metadaten jedoch bereits öffentlich sichtbar sind. Erst mit Ablauf der Embargofrist wird das Datenpaket zugänglich gemacht. Ein Embargo kann verwendet werden, wenn Forschungsdaten zeitverzögert publiziert werden sollen (z.B. zur Erfüllung von Verlagsvorgaben oder bei noch unvollständig ausgewerteten Daten). Der Embargo-Zeitraum kann in RADAR durch den Kurator definiert und auch verlängert werden.

Forschungsdaten

Forschungsdaten sind digitale Daten, die je nach Fachkontext Gegenstand eines Forschungsprozesses sind, im Laufe eines solchen Prozesses entstehen oder sein Ergebnis sind.
vgl. Kindling, M.; Schirmbacher, P. (2013): „Die digitale Forschungswelt“ als Gegenstand der Forschung. In: Information: Wissenschaft und Praxis 64 (2/3), S. 127–136. 10.1515/iwp-2013-0017

Gute wissenschaftliche Praxis

Die Regeln der guten wissenschaftlichen Praxis (GWP) dienen als Orientierung im Rahmen wissenschaftlicher Arbeitsprozesse. In Deutschland spiegeln sich diese Regeln z.B. in den Empfehlungen der Deutschen Forschungsgemeinschaft (DFG) zur Sicherung guter wissenschaftlicher Praxis wider. In Bezug auf den Umgang mit Forschungsdaten wird empfohlen, dass "Primärdaten als Grundlagen für Veröffentlichungen auf haltbaren und gesicherten Trägern in der Institution, wo sie entstanden sind, zehn Jahre lang aufbewahrt werden" sollen. Dieser Empfehlung kann durch eine Datenpublikation oder -archivierung in RADAR entsprochen werden.

Harvesting

Der Begriff "Harvesting" bezeichnet das systematische Sammeln und Aufbereiten von Metadaten aus Datenbanken, Repositorien und weiteren digitalen Quellen. RADAR unterstützt diesen Prozess über eine OAI-PMH–Schnittstelle, die ein Harvesting der in RADAR veröffentlichten Metadaten erlaubt. Dadurch wird die Sichtbarkeit, Auffindbarkeit und Nachnutzbarkeit der publizierten Forschungsdaten erhöht.

Identifier

Ein Identifier zählt zu den Metadaten und ist eine Zeichenkette, die ein (digitales) Objekt eindeutig identifiziert. Objekte können z.B. Datenpakete (DOI oder RADAR-ID), Personen (ORCID) oder Begriffe eines kontrollierten Vokabulars (Funder-ID) sein. Einige Identifier (sogenannte persistente Identifier) verweisen permanent auf das zugeordnete Objekt und bleiben über die Zeit hinweg stabil. Identifier ermöglichen die verlässliche und dauerhafte Adressierung eines Objekts, erlauben Disambiguierung gleicher oder ähnlicher Objekte, unterstützen Interoperabilität und erleichtern so deren Auffindbarkeit und Zitierbarkeit.

Kontrolliertes Vokabular

Ein kontrolliertes Vokabular ist eine abgeschlossene Sammlung von Begriffen zur einheitlichen Beschreibung von Objekten. Sie ermöglichen Interoperabilität von Metadaten und vereinfachen so eine übergreifende Suche und das Auffinden relevanter Objekte. Das RADAR Metadatenschema verwendet kontrollierte Vokabulare beispielsweise, um Forschungsdaten einem oder mehreren Fachgebiet(en) zuzuordnen oder um die Sprache zu definieren. Bei der Auswahl der kontrollierten Vokabulare wurde auf anerkannte Standards zurückgegriffen, z.B. ISO-Normen für die Sprache und das Entstehungsland der Forschungsdaten.

Long Tail

RADAR entstand als Repositorium für Forschungsdaten der sogenannten „Long Tail“-Disziplinen. In diesen Disziplinen entstehen in der Regel viele Datensätze von jeweils geringem Speichervolumen. Diese Datensätze unterscheiden sich meist in ihren Erhebungsmethoden und lassen sich darum schwer standardisieren. RADAR eignet sich für die Archivierung und Publikation von Datenpaketen aus allen wissenschaftlichen Disziplinen.

Metadaten

Metadaten („Daten über Daten“) beschreiben Eigenschaften und Inhalt von Objekten, zum Beispiel Forschungsdaten. Metadaten eines Datenpakets in RADAR umfassen zum einen deskriptive Metadaten, welche die Auffindbarkeit, Referenzierung und Nachnutzbarkeit ermöglichen (z.B. Titel, Ersteller, Thema oder Identifier eines Datensatzes). Sie werden durch Kuratoren und Subkuratoren erstellt. Zum anderen generiert RADAR technische Metadaten (z.B. Angaben zu Datenvolumen, Datenformat und Prüfsummen), welche für die langfristige Datenspeicherung von Bedeutung sind. Darüber hinaus erstellt das System noch automatisch Metadaten für die Langzeitarchivierung gemäß dem PREMIS-Standard, in den alle Ereignisse vom ersten Hochladen bis zur Erstellung von Kopien bei der Migration auf neuere Speichermedien festgehalten und dokumentiert werden. Die Metadaten der über RADAR publizierten Datenpakete sind stets öffentlich einsehbar. Sie werden im Rahmen der DOI-Vergabe und Registrierung bei DataCite durch RADAR automatisch ins DataCite-Format umgewandelt. Gleichzeitig erfolgt auch die Umwandlung ins DublinCore-Format, um die Metadaten standardkonform über einen OAI-Provider öffentlich zum Harvesting anbieten zu können. Die Dokumentation des RADAR Metadatenschemas ist hier verfügbar.

ORCID

Eine ORCID (Open Researcher and Contributor ID) ist eine Zeichenkette, die einen wissenschaftlichen Autor eindeutig identifiziert. Dieser Identifier verweist permanent auf dieselbe Person. Dadurch wird die Zuordnung von Publikationen zu ihren Autoren erleichtert - selbst bei Namensgleichheit mit anderen Autoren oder dem Wechsel an eine andere Einrichtung. Mehr zu ORCID erfahren Sie hier. Der Datengeber kann in den Metadaten des Datenpakets die ORCID der an der Entstehung des Datenpakets beteiligten Personen angeben.

Pending-Status ("in Bearbeitung")

Nach dem Upload in einen Arbeitsbereich befindet sich ein Datenpaket zunächst im Pending-Status im temporären Speicher und ist mit „In Bearbeitung“ gekennzeichnet. In dieser Phase können Kurator bzw. Subkurator das Datenpaket selbst durch Hinzufügen oder Löschen von Dateien und Verzeichnissen sowie dessen Metadaten bearbeiten. Datenpakete können maximal 6 Monate im Pending-Status im temporären Speicher belassen werden. Mit der Archivierung bzw. Publikation wandert das Datenpaket aus dem temporären in den permanenten Speicher.

Quota

Quota bezeichnen eine konfigurierbare Maximalgröße des Speicherplatzes. RADAR unterscheidet drei unterschiedliche Quota: eine für den temporären Speicher, eine weitere für archivierte und eine dritte für publizierte Datenpakete. Sie dienen vor allem zur Kontrolle der entstehenden Kosten für die Institution, die den Vertrag mit RADAR abgeschlossen hat. Quota werden vom Administrator pro Vertrag und pro Arbeitsbereich festgelegt und eingetragen. Datengeber können Daten nur so lange auf die RADAR-Plattform hochladen bzw. archivieren oder publizieren, bis die jeweilige Quote überschritten ist. Der Administrator kann jederzeit die festgelegten Quota erhöhen, was zu Mehrkosten führen kann.

RADAR-ID

Eine RADAR-ID ist eine Zeichenkette, die ein Datenpaket eindeutig innerhalb des RADAR-Systems identifiziert. Dieser Identifier verweist permanent auf den zugeordneten Forschungsdatensatz. In RADAR erhält jedes archivierte Datenpaket eine RADAR-ID.

Subkurator

Der Subkurator ist ein Datengeber mit eingeschränkten Rechten, der nur Daten nach RADAR übertragen und mit Metadaten anreichern kann. Er hat Leserechte auf die in seinem Arbeitsbereich archivierten Datenpakete. Im Gegensatz zu Kuratoren kann er Datenpakete weder archivieren noch publizieren. Subkuratoren werden vom Administrator oder Kurator einem bestimmten Arbeitsbereich zugewiesen. Einem Arbeitsbereich können ein oder mehrere Subkuratoren zugeordnet sein.

Temporärer Speicher

Der temporäre Speicher in RADAR dient Bearbeitungs- und Begutachtungszwecken im Arbeitsbereich. Nach dem Upload in einen Arbeitsbereich befindet sich ein Datenpaket zunächst im temporären Speicher, was mit „In Bearbeitung“ gekennzeichnet ist. In dieser Phase können Kurator bzw. Subkurator das Datenpaket selbst durch Hinzufügen oder Löschen von Dateien und Verzeichnissen bearbeiten sowie Metadaten hinzufügen. Datenpakete können maximal 6 Monate im temporären Speicher belassen werden. Werden Datenpakete archiviert oder publiziert, belegen sie keinen temporären Speicherplatz mehr. Auch Datenpakete im Status „In Begutachtung“ (Review) liegen im temporären Speicher. In der jährlichen Grundgebühr ist ein für die meisten Zwecke ausreichendes temporäres Speichervolumen enthalten. Bei Bedarf kann der temporäre Speicherplatz kostenpflichtig erweitert werden.

Unregistrierte Nutzer

In RADAR werden verschiedenen Nutzergruppen verschiedene Zugriffsrechte eingeräumt. Der Zugang zur Suchfunktion und zu publizierten Datenpaketen ist auch für unangemeldeten Nutzer („anonyme Nutzer“) frei. Administratoren, Kuratoren und Subkuratoren müssen bei RADAR angemeldet sein, um ihre Rolle wahrnehmen zu können. Für den Zugang zu den bei RADAR archivierten Forschungsdaten ist eine Anmeldung im System und die Freigabe durch den zuständigen Kurator erforderlich.

Verantwortlicher für Datenpakete

Beim Anlegen eines Arbeitsbereichs muss die E-Mailadresse eines Verantwortlichen angegeben werden. Der Verantwortliche wird bei Ablauf der Haltefrist kontaktiert, um zu klären wie mit den archivierten Forschungsdaten verfahren werden soll. Da die Haltefrist bis zu 15 Jahre betragen kann, sollte der Verantwortliche bzw. die E-Mailadresse sorgfältig gewählt werden. RADAR empfiehlt die Verwendung von Funktionsadressen (z.B. bibliothek@meine-institution.de) statt persönlicher Mailadressen.