Direkt zum Inhalt
Frequently Asked Questions


5.3 Daten speichern, archivieren und publizieren

Wie lange werden Datenpakete in RADAR gespeichert?

Die Speicherdauer für archivierte Datenpakete wird vom Datengeber gewählt und kann 5, 10 oder 15 Jahre betragen. Bei Bedarf kann die Speicherdauer angepasst werden, bitte nehmen Sie hierzu Kontakt mit RADAR auf.
Bei publizierten Datenpaketen ist eine dauerhafte Speicherung vorgesehen. RADAR garantiert die Verfügbarkeit der Datenpakete für mindestens 25 Jahre.

Kann die Speicherdauer bei Bedarf verlängert werden?

Ja, durch eine Verlängerung des Vertrags kann die Speicherdauer archivierter Datenpakete ausgedehnt werden. Für publizierte Datenpakete ist eine dauerhafte Speicherung vorgesehen. RADAR garantiert die Verfügbarkeit der Datenpakete für mindestens 25 Jahre.

Werden Datenpakete nach Ablauf der Haltefrist gelöscht?

Publizierte Datenpakete sind dauerhaft (d.h. mindestens 25 Jahre) verfügbar. Bei archivierten Datenpaketen wird der angegebene Ansprechpartner ein halbes Jahr vor Ablauf der Archivierungsfrist informiert. Kurz vor Ablauf der Frist wird der Administrator erneut informiert. Handelt der Kunde bis zum Ende der Archivierungsfrist nicht, werden die Daten gelöscht.

Können Daten auch nach Ablauf einer festgelegten Embargofrist publiziert werden?

Ja, der Datengeber kann in RADAR eine Embargofrist für Datenpakete festlegen. Die beschreibenden Metadaten, werden sofort nach der Publikation veröffentlicht und das Datenpaket erhält eine DOI. Die Forschungsdaten können erst öffentlich eingesehen werden, nachdem die Embargofrist abgelaufen ist.

Vergibt RADAR persistente Identifikatoren für Datenpakete?

Publizierte Datenpakete erhalten in RADAR einen Digital Object Identifier (DOI). Damit können Datenpakete eindeutig referenziert und verlässlich zitiert werden.
Archivierte Datenpakete erhalten einen RADAR-Identifier.

Wie schnell erhält ein publiziertes Datenpaket eine DOI?

RADAR vergibt für publizierte Datenpakete eine vorläufige DOI. Diese vorläufige DOI kann der Datengeber bereits an Dritte weitergeben. Die Weiterleitung über eine DOI zum Speicherort funktioniert erst, wenn die Pflichtfelder im Metadatenformular ausgefüllt sind und das Datenpaket veröffentlicht wurde.

Worauf bezieht sich eine DOI?

RADAR vergibt eine DOI für jedes publizierte Datenpaket. Der Datengeber entscheidet über den Umfang eines Datenpakets. Je nach Sachlage kann es sinnvoll sein, nur eine oder mehrere Dateien in einer .ZIP-Datei zusammenzufassen und in einem Datenpaket abzulegen.

Können publizierte Datenpakete gelöscht werden?

Prinzipiell können publizierte Datenpakete gelöscht werden. In diesem Fall bleibt die Landingpage mit Informationen über das Datenpaket und einem Hinweis auf die Löschung erhalten.

1 About RADAR

What is RADAR?

RADAR is a multidisciplinary repository for archiving and publishing research data. The focus of RADAR is on research data of the so-called "long tail" disciplines, i.e. from disciplines that deal with smaller amounts of data and usually do not yet have their own infrastructure for research data management. The service is currently only aimed at publicly funded research institutions in Germany. An offer to other institutions, also abroad, is in preparation.

Who operates RADAR?

RADAR is a service for academic research and is supported by renowned German scientific institutions. RADAR is offered and operated by FIZ Karlsruhe - Leibniz Institute for Information Infrastructure. The technical infrastructure is provided by the Karlsruhe Institute of Technology (KIT) via its Steinbuch Centre for Computing (SCC) and the TU Dresden with its Centre for Information Services and High Performance Computing (ZIH). The Leibniz Information Cenre for Science and Technology (TIB) supports FIZ Karlsruhe in consulting, training and marketing. In addition, RADAR obtains the Digital Object Identifiers (DOI) required for data publication from TIB (DataCite).

How is RADAR funded?

RADAR was funded by the German Research Foundation (DFG) from September 2013 to August 2016. During this period, a sustainable, transparent business model was developed to ensure the long-term operation of RADAR. It is based on usage-based fees, contract fees and institutional funding. RADAR has been in regular operation since March 2017 and does not require project-related funding.

What is the RADAR software based on? How is the software licensed?

RADAR is a hosted service. The software used consists of the archive solutions at the Steinbuch Centre of Computing (SCC) and the Centre for Information Services and High Performance Computing (ZIH), the repository management middleware and the frontend (user interface). Middleware and frontend are completely based on open source software (including Cassandra and ElasticSearch). The archive solutions at SCC (HPSS) and ZIH (SpectrumProtect) are partly commercial and not part of the RADAR software. The RADAR software is available under Apache License 2.0 as Open Source.

Is RADAR certified?

The RADAR team is currently working on certification as a "Trustworthy Data Repository" according to the guidelines of the new Core Trust Seal, a joint initiative of DANS and the World Data System (WDS) under the umbrella of the Research Data Alliance (RDA).

2 Requirements for the Use of RADAR

Who is RADAR aimed at?

RADAR is currently only aimed at publicly funded research institutions in Germany that want to offer researchers an infrastructure for research data management. RADAR focuses in particular on research data from the so-called "long tail" disciplines, i.e. from disciplines that deal with smaller amounts of data and usually do not yet have their own infrastructures.
Services for institutions that are not publicly funded or are not located in Germany are in preparation.

What requirements must be met in order to use RADAR?

The use of RADAR as an infrastructure for the management of research data at an institution requires the conclusion of a service contract between the institution and FIZ Karlsruhe. More information about the contract, the RADAR service description and the terms of use can be found here.

Why does RADAR cost something and how much?

RADAR's business model is based on sustainability and transparency. It is based on usage-dependent fees, contract fees and institutional support. The prices depend on the data volume and the service used. For more information, please refer to the RADAR price list.

Is it necessary to conclude a contract before using RADAR?

In order to publish or archive research data with RADAR, research institutions must first sign a contract with FIZ Karlsruhe. RADAR offers interested institutions the opportunity to test the service in advance without obligation via the test system. In order to view and download published dataset, neither a contract nor a registration is necessary. However, data users must adhere to the terms of use.

Can contracts be viewed in advance?

The RADAR customer contract is available here.

Is there a way to test RADAR without obligation?

RADAR can be tested without obligation via the test system. For more information on the test system, please refer to this page.

3 RADAR for Institutions

What services does RADAR offer?

With RADAR, research data can be archived or published. Archived datasets are stored securely for user-defined periods. For example, the German Research Foundation (DFG) recommends keeping research data for a period of 10 years. In RADAR, data providers can choose retention periods between 5 and 15 years. By default, archived datasets and the descriptions (metadata) are not publicly accessible unless the data provider specifies otherwise. Published datasets are made publicly accessible. Optionally, data providers can define an embargo period. The data can then only be accessed publicly after this period has expired. RADAR assigns a Digital Object Identifier (DOI) to each published dataset. This makes it possible to uniquely identify a dataset, connect it to publications and reliably cite it. RADAR guarantees secure storage of at least 25 years for published datasets. In order to improve the findability  and interpretation of the data, datasets can be described with discipline-specific metadata. With RADAR, data can be reviewed before publication, for example as part of a peer review process. For this purpose, data providers in RADAR can create non-public links and pass them on to reviewers. In addition, RADAR provides an API that allows RADAR customers to offer the service via their own user interface.

How much does the service cost?

In addition to an annual contract fee, costs comprise usage-based fees, which depend on data volumes and the service used. The costs for data archiving depend on the amount of data stored and the retention period. For the publication of datasets, RADAR offers a one-off payment based on the data volume. The current price list can be found here. These prices apply exclusively to universities and research institutions. When applying for funding, applicants can add the costs for the publication or archiving of research data with RADAR to the application and thus procure funding for making use of RADAR services.

How can others access the datasets?

Published datasets can be viewed publicly and access is free of charge. The license terms specified by the data provider apply to the reuse of the dataset.
Archived datasets are generally not publicly accessible (dark archive). However, the data provider can grant individual registered users access to a dataset.

How long are published and archived data stored in RADAR?

For archived datasets, the data provider determines the retention period (5, 10, or 15 years). The dataset is then securely archived by RADAR for this period (dark archive). The data provider can access the dataset at any time.
For published datasets, RADAR guarantees the availability of the data for a period of at least 25 years. If necessary, the data provider can define an embargo period. In that case, the dataset will only be published after this period has expired.

What measures for the long-term preservation of datasets does RADAR take?

The data transfer to the storage layer is carried out via standardized protocols (SFTP, GridFTP). Data is stored using modern disk and tape systems. These offer several petabytes of storage space. A storage management system (high-performance storage system - HPSS) ensures efficient data access and allows cost-effective long-term storage. System reliability is ensured by multiple copies stored at different locations using different technologies. The use of Redundant Array of Independent Disks (RAID) and the system monitoring itself ensure the data security of the administrative components, such as databases, in the system. The data itself is available as BagIt structures in ZIP containers, i.e. the data is stored in well-documented containers. Each archived dataset consists of a file that is self-descriptive in itself (containing the data itself and the descriptive metadata record). For the interpretation of the BagIt structures no special software is necessary.
RADAR currently only ensures the physical preservation of datasets (Bitstream Preservation), a functional long-term preservation with format migration is currently not planned.
RADAR does not guarantee the permanent usability or interpretability of the data contained in a dataset, as these depend on the data formats selected by the data provider. RADAR therefore recommends the use of file formats that are suitable for long-term preservation.

Is the data stored redundantly?

Yes, three copies are stored at three locations (2 x Karlsruhe, 1 x Dresden). Different software and hardware systems are in use. The systems in Karlsruhe and Dresden are organizationally and administratively completely separated from each other.

Is the integrity of the data checked during the retention period?

Before being transferred to permanent storage, datasets are provided with a checksum, which is checked after each duplication. By comparing checksums, errors can be detected and eliminated during data transmission. When accessing a dataset, the checksum is calculated again and compared with the stored value in order to identify possible data consistency errors. If an error should be detected, RADAR accesses the second copy at the other location. The storage media used are replaced at the latest when the manufacturer's warranty expires. The affected datasets are migrated to new storage media and checked to avoid bit errors ("fixity checks").

4 RADAR for Researchers

What are the advantages of archiving or publishing research data with RADAR?

As more and more data is generated during research processes, the appropriate management of this data is becoming more important. This view is increasingly shared by research funding agencies, which increasingly tie the allocation of funding to requirements concerning data.
The storage of research data in RADAR ensures that these requirements are met and research adheres to the rules for good scientific practice.
In addition, the publication of scientific data increases the visibility and traceability of research. Third parties can find and cite datasets, leading to the reuse of research results.

How does RADAR support researchers in publishing research results?

RADAR services can be integrated into the process of publishing journal articles. If a journal requires the publication of the underlying research data, researchers can publish their data on RADAR and connect the unique DOI of the dataset to the journal article. The data can also be reviewed prior to publication, for example as part of a peer review process. For this purpose, data providers can generate a non-public link to the dataset that can then be passed on to the reviewers.

How does RADAR support researchers in creating a Data Management Plan (DMP)?

Researchers can refer to RADAR services when describing the storage or archiving strategy in data management plans. Archived and published datasets receive a unique and persistent identifier that can serve as proof of sustainable data storage for funding institutions. When applying for funding, applicants can add the costs of publishing or archiving research data with RADAR into the application and thus procure the necessary means to make use of RADAR services. The current price list can be found here.

Is there a recommended storage period for research data?

In its recommendations for "Safeguarding Good Scientific Practice", the German Research Foundation (DFG) suggests the storage of data on which publications are based for a period of 10 years. This period is often mentioned in the context of research data management. Nevertheless, there is no general recommendation for data retention periods across all disciplines. Depending on the field of research, service providers or institutions, different requirements can come into effect.
When archiving data with RADAR, data providers can select the retention period for datasets (5, 10 or 15 years). If necessary, the retention period can be extended. For published datasets, RADAR guarantees the availability of the data for at least 25 years.

5.2 Describing data

How are research data described in RADAR?

The description of datasets is one of the tasks of the (sub)curators. RADAR has developed a metadata schema for the description of research data that specifies 10 mandatory fields. The mandatory fields meet the requirements for the assignment of a DOI (Digital Object Identifier) for the dataset. The fields can be used across different scientific disciplines. In addition to the mandatory fields, 13 optional fields can be filled in. Thorough descriptions increase the visibility, findability and reusability of the dataset. The documentation of the RADAR metadata schema is available here

Are the dataset and metadata record checked for quality by RADAR?

The technical integrity of the dataset is checked by RADAR at regular intervals in the process of bitstream preservation. Checking the content of dataset is the responsibility of the data providers.
The metadata is automatically checked for completeness and validated before publication or archiving in RADAR.

Which databases and search engines can be used to find datasets published with RADAR?

RADAR uses the protocol OAI-PMH to offer metadata for automatic harvesting by search engines. The metadata is licensed under a CC0 license and can also be accessed through the DataCite metadata store. These measures ensure that the published datasets can be found through a variety of search engines and databases.

Can metadata be added automatically?

Yes, administrators and curators can compile XML-files containing metadata offline and upload them to RADAR. In this way, datasets can either be described individually or by adding default values that were predefined for an entire workspace. A template for XML-files is available online in RADAR. Metadata can also be uploaded automatically using the RADAR API. First steps for using the API can be found here.

How is the interoperability of metadata ensured?

The RADAR metadata schema is compatible with the widely used DataCite and Dublin Core metadata schemas. In addition, the RADAR metadata can be found and reused via the DataCite metadata store. A connection to ORCID is implemented.

In which languages can metadata records be entered?

The language for the metadata is chosen by the data provider. Optionally, a language for the dataset can be specified. A translation of the metadata into several languages is not yet planned.

Do licenses refer to the entire dataset or to individual files?

The license specified by the data provider refers to the entire dataset. If data providers want to specify different license terms for individual files, the data must be split into several dataset. RADAR recommends the use of Creative Commons licenses.

5.4 Searching and citing Data

How can third parties search for published datasets?

All users can search for published datasets in the RADAR database; prior registration is not required. RADAR offers users a free text search as well as a facet search. The easiest way to search for a specific dataset is via the unique DOI (Digital Object Identifier).
The RADAR search can also be used to find dataset that are made available for download after the end of an embargo period. Users can then view the descriptive metadata and quote the dataset.
Generally, archived datasets are not publicly available and cannot be found via the search.

Can RADAR also be used to search the contents of datasets?

No, the RADAR search function is based solely on the descriptive metadata records supplied by data providers.

Can I use RADAR to search for specific file formats?

Yes, RADAR provides a facet to search for specific file formats. For this purpose, please use the facet search option "Resource".

How are research data cited?

Generally, there are no binding rules for a specific format when citing research data. In accordance with international recommendations, RADAR proposes the following citation format:

Author(s) (year of publication): Title of the dataset. Publisher. Type of research data/resource type. Identifier (DOI)

On the landing page of each dataset, RADAR displays a citation suggestion.

5.5 Roles and Access Rights

Who can use RADAR?

Generally, anyone can use the storage service. However, the service is aimed at the needs of institutions and researchers who want to archive or publish research data.

What user roles are there in RADAR and what rights do they have?

RADAR is based on a clear distribution of roles and tasks.

Administrator: (Contract) administrators are people designated by the customer to set up and manage new workspaces in RADAR, assign the roles of curator or subcurator to users, define the maximum available storage volume and view statistics. Administrators also decide which RADAR services (data publication or archiving) to use. A contract can have one or more administrators.

Curator: A curator is responsible for the research data of a workspace and is appointed by the administrator. A workspace may have one or more curators. The curator is a data provider with full rights who can transfer research data to RADAR, describe it with metadata and archive or publish it. Curators can designate additional persons as subcurators and grant individual registered users access to archived datasets.

Sub-curator: Subcurators are assigned to a specific workspace by the administrator or curator. A workspace can have one or more sub-curators. The subcurator is a data provider with restricted rights that can only transfer data to RADAR and describe it with metadata. Subcurators have read access to the datasets archived in their workspace.

Can third parties access the data and descriptive metadata?

There are different modes of access depending on the selected RADAR service.
Archived datasets are generally not visible to third parties. However, curators can grant individual registered users access to archived datasets. The data provider decides whether third parties can access the metadata records. There are three options: publicly visible; visible to shared users; not visible.
Published datasets and their metadata records are publicly visible and can be downloaded by third parties. If necessary, the data provider can define an embargo period for a dataset. The dataset will then only be made accessible to third parties after this period has expired.

Can user rights be transferred?

User rights can be transferred in accordance with the RADAR terms and conditions. This may be necessary, for example, if responsibilities within an institution change.

In addition to registration with RADAR, are there other options for user authentification?

If your institution is participating in the DFN-AAI, you can log in using you Shibboleth credentials.

5.1 Upload Data

How do I upload data to RADAR?

To upload data to RADAR, you must be a registered user and have curator or subcurator rights.

Which data types and formats can be archived and published with RADAR?

RADAR does not impose any restrictions on the type or format of data.
For example, datasets in RADAR can contain raw data or data in different processing stages. RADAR recommends formats that are suitable for long-term preservation. For more information, please refer to the Glossary entry for file formats.
No data subject to data protection laws may be stored with RADAR.

Can datasets still be processed after being uploaded to RADAR?

As long as a dataset is in the pending status, changes can still be made to its content and description.
Once the dataset has been archived or published by the curator, no further changes can be made. This ensures that the dataset can be cited. If changes or corrections are necessary after archiving or publication, a new version of the dataset can be created with a reference to the original version in the description (using the fields "Related Identifier" and "Relation Type").
If it should be necessary to delete a published dataset, RADAR will keep the landing page of the dataset to ensure referencing.

Can datasets be uploaded automatically?

Yes, automatic data transfer is possible via the RADAR API. More information about using the API can be found here.

What is the maximum file size that can be uploaded?

Depending on the browser used, uploads of at least 10 GB are possible via the RADAR user interface. Internet Explorer is only supported from version 11 onwards, since Microsoft has stopped maintaining older versions in 2016. The use of older versions therefore poses a potential security risk.

Larger files can only be transferred via HTTP clients such as Curl. The uploadURL / ingestURL can be requested via the API. More information about the RADAR API can be found here.

The limit set by the RADAR archive system is 600 GB. However, uploading or downloading files of this size is time-consuming.

Can personal data be stored in RADAR?

No personal data may be stored in RADAR. This restriction is stated in the RADAR Licence, Terms and Conditions  for Data Providers (Curators). Data Providers agree to these terms when a user contract is concluded.

5.5 Rollen und Zugriffsrechte

Wer kann RADAR nutzen?

Generell kann jeder den Speicherdienst in Anspruch nehmen. Zielgruppe sind jedoch Institutionen und Forschende, die Forschungsdaten archivieren oder veröffentlichen wollen.

Welche Rollen gibt es in RADAR, und welche Rechte haben sie?

RADAR basiert auf einer klaren Rollen- und Aufgabenverteilung.

  • Administrator: (Vertrags-)Administratoren sind vom Kunden benannte Personen, die in RADAR neue Arbeitsbereiche einrichten und verwalten, an Benutzer die Rollen Kurator oder Subkurator für einen Arbeitsbereich vergeben, das maximal zur Verfügung stehende Speichervolumen definieren und Statistiken einsehen. Administratoren entscheiden auch darüber, welche RADAR-Dienstleistungen (Datenpublikation oder -archivierung) in Anspruch genommen werden. Ein Vertrag kann pro Arbeitsbereich ein oder mehrere Administratoren besitzen.
  • Kurator: Ein Kurator ist verantwortlich für Forschungsdaten eines Arbeitsbereichs und wird vom Administrator bestimmt. Ein Arbeitsbereich kann ein oder mehrere Kuratoren besitzen. Der Kurator ist ein Datengeber mit vollen Rechten, der Forschungsdaten nach RADAR übertragen, mit Metadaten anreichern sowie diese archivieren bzw. publizieren kann. Kuratoren können weitere Personen als Subkuratoren bestimmen und ausgewählten registrierten Nutzern Zugriff auf archivierte Daten gewähren.
  • Subkurator: Sub-Kuratoren werden vom Administrator oder Kurator einem bestimmten Arbeitsbereich zugewiesen. Ein Arbeitsbereich kann ein oder mehrere Subkuratoren besitzen. Der Subkurator ist ein Datengeber mit eingeschränkten Rechten, der nur Daten nach RADAR übertragen und mit Metadaten anreichern kann. Subkuratoren haben Leserechte auf die in ihrem Arbeitsbereich archivierten Datenpakete.

Weitere Informationen finden Sie im Videotutorial "Rollen und Benutzerverwaltung".

Können Dritte auf die Daten und beschreibenden Metadaten zugreifen?

Abhängig vom gewählten Angebot gibt es verschiedene Zugriffsrechte.
Archivierte Datenpakete sind per se nicht für Dritte sichtbar. Kuratoren können allerdings einzelnen registrierten Nutzern Zugriff auf die Daten gewähren. Der Datengeber entscheidet, ob Dritte auf die Metadaten zugreifen können. Es gibt drei Optionen: öffentlich sichtbar; für freigegebene Nutzer sichtbar; nicht sichtbar.
Publizierte Datenpakete und ihre Metadaten sind öffentlich einsehbar und können von Dritten heruntergeladen werden. Gegebenenfalls kann der Datengeber ein zeitliches Embargo für ein Datenpaket festlegen. Die Datenpakete werden dann erst nach Ablauf dieser Frist für Dritte zugänglich gemacht.

Können Nutzerrechte übertragen werden?

Nutzerrechte können entsprechend der RADAR AGB übertragen werden. Dies kann beispielsweise notwendig sein, wenn sich Zuständigkeiten innerhalb einer Institution ändern.

Gibt es neben der Registrierung bei RADAR weitere Möglichkeiten der Authentifikation?

Nutzer, deren Einrichtung am DFN-AAI teilnimmt, müssen sich nicht explizit bei RADAR registrieren, sondern können sich mit ihrer Shibboleth-Benutzerkennung anmelden.

5.4 Daten suchen und zitieren

Wie können Dritte nach publizierten Datenpaketen suchen?

Die Suche nach publizierten Datenpaketen in der RADAR-Datenbank steht allen Nutzern frei, eine Registrierung ist nicht erforderlich. RADAR bietet Nutzern eine Freitextsuche sowie eine Facettensuche in den Metadaten an. Die Suche nach einem speziellen Datenpaket ist am einfachsten über die eindeutige DOI (Digital Object Identifier).
Über die Suche können auch Datenpakete gefunden werden, die erst nach dem Ende einer Embargofrist zum Download verfügbar sind. Nutzer können dann die beschreibenden Metadaten einsehen und das Datenpaket zitieren.
Archivierte Datenpakete sind prinzipiell nicht öffentlich einsehbar und können nicht gesucht werden.

Kann mit RADAR auch der Inhalt von Datenpaketen durchsucht werden?

Nein, die RADAR-Suchfunktion basiert ausschließlich auf den vom Datengeber festgelegten beschreibenden Metadaten Eine Suche im Inhalt von Datenpaketen ist nicht möglich.

Kann man mit RADAR gezielt nach Dateiformaten suchen?

Ja, RADAR erlaubt die Suche nach Dateiformaten. Hierfür steht die Facettensuch-Option “Ressource” zur Verfügung.

Wie werden Forschungsdaten zitiert?

Grundsätzlich gibt es keine verbindlichen Vorgaben für das Zitationsformat. In Anlehnung an internationale Richtlinien empfiehlt RADAR das folgende Zitationsformat:

Ersteller/Autor(en) (Jahr der Veröffentlichung): Titel des Datenpaketes. Herausgeber. Art der Forschungsdaten/Resource Type. Identifier (DOI)

Auf der Landing Page eines Datenpakets wird jeweils ein entsprechender Zitationsvorschlag angezeigt.

5.3 Storing, Archiving and Publishing Data

How long are datasets stored in RADAR?

The retention period for archived datasets is selected by the data provider and can range from 5 to 15 years. If necessary, the retention period can be adjusted, please contact RADAR for this purpose.
Published datasets are stored permanently. RADAR guarantees the availability of published datasets for at least 25 years.

Can the retention period be extended if necessary?

The retention period of archived datasets can be extended by renewing the contract. Permanent storage is provided for published datasets. RADAR guarantees the availability of published datasets for at least 25 years.

Are datasets deleted after the retention period?

Published datasets are available permanently (at least 25 years). For archived datasets, the specified contact person is informed half a year before the retention period ends. The administrator is informed again shortly before the deadline expires. If the customer does not act by the end of the retention period, the dataset will be deleted.

Can a dataset be published after a specified embargo period has expired?

The data provider can define an embargo period for datasets in RADAR. The descriptive metadata is published immediately after publication and the dataset is assigned a DOI. The research data can only be viewed publicly after the specified embargo period has expired.

Does RADAR provide persistent identifiers for datasets?

Published datasets are assigned a Digital Object Identifier (DOI) in RADAR. This makes unique and persistent identification as well as reliable citation of datasets possible.
Archived datasets receive a RADAR identifier.

How long does it take for a published dataset to receive a DOI?

RADAR assigns temporary DOIs for published datasets. This preliminary DOI can be passed on to third parties by the data provider. DOI resolving and forwarding to the storage location only works if the mandatory fields in the metadata form have been filled in and the dataset has been published.

What does a DOI refer to?

RADAR assigns a DOI to each published dataset. The data provider decides on the scope and granularity of a dataset. Depending on the context, it may be useful to combine one or more files in a .ZIP file and store them in a dataset.

Can published datasets be deleted?

Generally, published datasets can be deleted. In this case, the landing page with information about the dataset and a reference to the deletion is retained.

5.2 Daten beschreiben

Wie werden Forschungsdaten in RADAR beschrieben?

Die Beschreibung von Datenpaketen zählt zu den Aufgaben der (Sub-)Kuratoren. RADAR hat ein Metadatenprofil für die Beschreibung von Forschungsdaten entwickelt, das 10 Pflichtfelder vorgibt. Die Pflichtfelder erfüllen die Voraussetzungen für die Vergabe eines DOI (Digital Object Identifier) für das Datenpaket. Die Felder sind außerdem auf verschiedene Wissenschaftsdisziplinen übertragbar. Neben den Pflichtfeldern können 13 optionale Felder ausgefüllt werden. Sorgfältig beschriebene Datenpakete erhöhen die Sichtbarkeit, Auffindbarkeit und Nachnutzbarkeit der Forschungsdaten. Die Dokumentation des RADAR Metadatenschemas ist hier verfügbar. Weitere Informationen zur Beschreibung von Datenpaketen finden Sie im Videotutorial "Metadaten für Datenpakete".

Werden das Datenpaket und die beschreibenden Metadaten von RADAR auf Qualität geprüft?

Die technische Integrität des Datenpakets wird beim Upload und im Rahmen der Bitstream Preservation in regelmäßigen Abständen von RADAR überprüft. Eine inhaltliche Prüfung der Datenpakete liegt in der Verantwortung der Datengeber.
Die Metadaten werden vor dem Publizieren oder Archivieren automatisch auf Vollständigkeit geprüft und validiert.

Über welche Datenbanken und Suchmaschinen können Daten gefunden werden, die mit RADAR publiziert sind?

RADAR verwendet das Protokoll OAI-PMH, um die Metadaten zum automatischen Einsammeln (Harvesting) durch Suchmaschinen zur Verfügung zu stellen. Die Metadaten stehen unter einer CC0-Lizenz und sind auch über den DataCite Metadatenstore abrufbar. Diese Maßnahmen stellen sicher, dass die publizierten Datenpakete über eine Vielzahl von Suchmaschinen und Datenbanken gefunden werden können.

Können Metadaten automatisiert eingepflegt werden?

Ja, Administratoren und Kuratoren können Metadaten offline als XML-Datei erstellen und per Upload in RADAR hinterlegen. Auf diese Weise können einzelne Datenpakete beschrieben werden als auch ein (überschreibbarer) Standardwert für den gesamten Arbeitsbereich definiert werden. Eine Vorlage für die entsprechende XML-Datei steht in RADAR online zur Verfügung. Weiterhin können Metadaten automatisch über die RADAR API hochgeladen werden. Erste Schritte zur Nutzung der API finden Sie hier.

Wie wird die Interoperabilität der Metadaten gewährleistet?

Das RADAR-Metadatenschema ist kompatibel mit den weit verbreiteten Metadatenschemata DataCite und Dublin Core. Darüber hinaus können die RADAR-Metadaten über den DataCite Metadatenstore aufgefunden und nachgenutzt werden. Eine Anbindung an ORCID ist implementiert.

In welchen Sprachen können die Metadaten erfasst werden?

Die Sprache für die Metadaten ist frei wählbar. Optional kann eine Sprache für das Datenpaket angegeben werden. Eine Übersetzung der Metadaten in mehrere Sprachen ist bisher nicht vorgesehen.

Gilt eine Lizenz für das gesamte Datenpaket oder für einzelne Dateien?

Die Lizenz gilt für das gesamte Datenpaket. Sollen unterschiedliche Lizenzen vergeben werden, müssen die Daten in mehrere Datenpakete aufgeteilt werden. RADAR empfiehlt die Verwendung von Creative Commons Lizenzen.

5.1 Daten hochladen

Wie werden Daten in RADAR hochgeladen?

Um Daten in RADAR hochzuladen, müssen Sie als Nutzer registriert sein und über Kuratoren- bzw. Subkuratoren-Rechte verfügen. Weitere Informationen hierzu finden Sie im Videotutorial Rollen und Benutzerverwaltung.

Welche Datentypen und -formate können mit RADAR archiviert und publiziert werden?

RADAR gibt keinerlei Beschränkungen hinsichtlich des Datentyps oder -formats vor.
Datenpakete in RADAR können zum Beispiel Rohdaten oder Daten in verschiedenen Bearbeitungsstufen enthalten. RADAR empfiehlt Formate, die besonders gut für die Langzeitarchivierung geeignet sind. Weitere Informationen finden Sie im Glossar unter Formatempfehlungen.
Es dürfen keine Daten, die dem Datenschutzrecht unterliegen, bei RADAR abgelegt werden.

Können Datenpakete in RADAR nach dem Hochladen noch bearbeitet werden?

Solange ein Datenpaket im Pending-Status ist, können noch Änderungen am Inhalt und an der Beschreibung vorgenommen werden.
Nach der Freigabe zur Archivierung oder Publikation durch den Kurator sind keine Änderungen mehr möglich. Dies dient der Sicherstellung der Zitierbarkeit des Datenpakets. Falls nachträglich Änderungen oder Korrekturen vorgenommen werden sollen, kann ein neues Datenpaket angelegt und über die Beschreibung ein Verweis auf die ursprüngliche Version hinzugefügt werden (über die Felder "Related Identifier" und "Relation Type").
Sollte die Löschung bereits publizierter Daten notwendig sein, stellt RADAR weiterhin die Referenzierbarkeit über eine Landing Page sicher.

Können Daten neben dem manuellen Upload auch automatisch hochgeladen werden?

Ja, die automatische Datenübernahme wird über die RADAR API ermöglicht. Mehr Informationen zur Nutzung der API finden Sie hier.

Was ist die maximale Dateigröße, die hochgeladen werden kann?

Abhängig vom verwendeten Browser sind über die RADAR-Benutzeroberfläche Uploads von mindestens 10 GB möglich. Der Internet Explorer wird nur noch ab Version 11 unterstützt, da Microsoft ältere Versionen seit 2016 nicht mehr pflegt und damit deren Verwendung ein potentielles Sicherheitsrisiko darstellen kann.

Größere Dateien können ausschließlich über HTTP Clients wie Curl übertragen werden. Die uploadURL / ingestURL kann über den Dataset-Endpoint der API https://www.radar-service.eu/radar/api erfragt werden. Mehr Informationen zur RADAR API finden Sie hier.

Die vom RADAR-Archivsystem gesetzte Grenze liegt bei 600 GB. Der Upload bzw. Download von Dateien dieser Größenordnung ist jedoch zeitintensiv.

Können personenbezogene Daten in RADAR gespeichert werden?

Es dürfen in RADAR keine Daten mit Personenbezug gespeichert werden. Auf diese Einschränkung wird bei Abschluss eines Nutzungsvertrags in den Allgemeinen Geschäftsbedingungen (AGB) hingewiesen.

4 RADAR für Forschende

Welche Vorteile bietet die Archivierung oder Publikation von Forschungsdaten bei RADAR?

Da in der Forschung immer mehr Daten anfallen, wird ein passendes Management wissenschaftlicher Daten demnach wichtiger. Diese Ansicht vertreten zunehmend auch Forschungsförderer, die entsprechende Auflagen an die Vergabe von Drittmitteln knüpfen.
Mit dem Ablegen von Forschungsdaten in RADAR wird sichergestellt, dass die Anforderungen von Leistungsträgern und der „guten wissenschaftlichen Praxis“, also die sichere Aufbewahrung und Verfügbarkeit der für Publikationen zugrunde liegenden Daten, erfüllt werden.
Darüber hinaus erhöht die Publikation wissenschaftlicher Daten die Sichtbarkeit und Nachvollziehbarkeit von Forschung. Dritte können Daten finden und zitieren. Damit können die Ergebnisse wissenschaftlicher Arbeit nachgenutzt werden.

Wie unterstützt RADAR Forschende beim Publizieren von Forschungsergebnissen?

RADAR-Dienste können in den Publikationsprozess von Zeitschriftenaufsätzen integriert werden. Verlangt eine Zeitschrift die Veröffentlichung der zugrundeliegenden Forschungsdaten, können Forschende ihre Daten bei RADAR publizieren und die DOI des Datenpakets mit dem Zeitschriftenaufsatz verbinden. Die Daten können vor der Publikation außerdem begutachtet werden, beispielsweise im Rahmen eines Peer-Review-Prozesses. Dafür bietet RADAR Datengebern die Möglichkeit, einen nicht öffentlichen Link zu erzeugen, der an die Gutachter weitergegeben werden kann.

Wie unterstützt RADAR Forschende bei der Erstellung eines Datenmanagementplans (DMP)?

Forschende können in Datenmanagementplänen RADAR-Dienste angeben, um die Speicher- beziehungsweise Archivierungsstrategie zu beschreiben. Archivierte und publizierte Forschungsdaten erhalten einen eindeutigen persistenten Identifikator, der gegenüber Förder- und Drittmittelgebern als Nachweis einer nachhaltigen Datenspeicherung dienen kann. Beim Beantragen von Förder- und Drittmitteln können Antragsteller die Kosten für die Publikation oder Archivierung von Forschungsdaten mit RADAR in den Antrag integrieren und so die Finanzierung für RADAR-Dienste mit einwerben. Die aktuelle Preisliste finden Sie hier. Auf Anfrage erstellen wir gerne einen Kostenvoranschlag für Forschungsvorhaben.

Gibt es einen empfohlenen Zeitraum, über den wissenschaftliche Daten gespeichert werden sollten?

In den Empfehlungen zur "Sicherung der guten wissenschaftlichen Praxis" fordert die Deutsche Forschungsgesellschaft (DFG), dass Primärdaten, die einer Veröffentlichung zu Grunde liegen, für einen Zeitraum von 10 Jahren gespeichert werden sollen. Dieser Zeitraum wird häufig im Datenmanagement-Kontext erwähnt. Trotzdem gibt es keine allgemein und für alle Fachdisziplinen empfohlene Speicherdauer. Abhängig von Forschungsgebiet, Leistungsträgern oder Institutionen können verschiedene Anforderungen in Kraft treten.
Bei der Archivierung von Daten mit RADAR können Datengeber den Zeitraum auswählen, über den die Daten gespeichert werden sollen (5, 10 oder 15 Jahre). Bei Bedarf kann der Zeitraum erweitert werden. Für publizierte Daten garantiert RADAR die Verfügbarkeit der Daten über mindestens 25 Jahre.

3 RADAR für Institutionen

Welchen Service bietet RADAR an?

Mit RADAR können wissenschaftliche Forschungsdaten archiviert oder publiziert werden. Bei der Archivierung werden Daten über längere Zeiträume sicher gespeichert. Die Deutsche Forschungsgemeinschaft (DFG) empfiehlt beispielsweise, Forschungsdaten für eine Periode von 10 Jahren aufzubewahren. In RADAR kann zwischen Haltefristen von 5,10 oder 15 Jahren gewählt werden. Standardmäßig sind archivierte Daten und ihre Beschreibung (Metadaten) nicht öffentlich einsehbar, es sei denn, der Datengeber legt etwas anderes fest. Weitere Informationen finden Sie im Glossar unter dem Begriff Datenarchivierung. Bei der Datenpublikation werden die Forschungsdaten für Dritte öffentlich zugänglich gemacht. Optional können Datengeber eine Sperrfrist definieren. Die Daten können dann erst nach Ablauf dieser Embargofrist öffentlich eingesehen werden. RADAR vergibt einen Digital Object Identifier (DOI) für jedes publizierte Datenpaket. Damit können die Daten eindeutig identifiziert, mit Publikationen verknüpft und verlässlich zitiert werden. RADAR garantiert eine Speicherdauer publizierter Daten von mindestens 25 Jahren. Um die Auffindbarkeit und Verständlichkeit der Daten zu verbessern, können Datenpakete mit disziplinspezifischen Metadaten beschrieben werden. Weitere Informationen finden Sie im Glossar unter dem Begriff Datenpublikation. Mit RADAR können Daten vor der Veröffentlichung begutachtet werden, zum Beispiel im Rahmen eines Peer-Review-Prozesses. Zu diesem Zweck können Datengeber in RADAR nicht öffentliche Links erzeugen und an die Reviewer weitergeben. Darüber hinaus stellt RADAR eine API zur Verfügung, die es erlaubt, RADAR-Dienste über eine eigene Benutzungsoberfläche anzuprogrammieren und anzubieten.

Was kostet der Service?

Mit Vertragsabschluss fällt eine jährliche Vertragsgrundgebühr an. Hinzu kommen nutzungsabhängige Entgelte, die sich nach der Datenmenge und der in Anspruch genommenen Dienstleistung richten. Die Kosten für die Datenarchivierung hängen von der gespeicherten Datenmenge ab und sind während der Haltefrist jährlich zu zahlen. Für die Publikation von Datenpaketen inkl. garantierter Haltefrist von 25 Jahren bietet RADAR eine Einmalzahlung an, die sich an der Datenmenge orientiert. Die aktuelle Preisliste finden Sie hier. Diese Preise gelten ausschließlich für Hochschulen und Forschungseinrichtungen als institutionelle Kunden. Beim Beantragen von Förder- und Drittmitteln können Antragsteller die Kosten für die Publikation oder Archivierung von Forschungsdaten mit RADAR in den Antrag integrieren und so die Finanzierung für RADAR-Dienste mit einwerben.

Wie können Dritte auf die Datensätze zugreifen?

Publizierte Datenpakete sind öffentlich einsehbar und der Zugriff ist kostenfrei. Bei der Nachnutzung der Daten gelten die vom Datengeber vorgegebenen Lizenzbestimmungen.
Archivierte Datenpakete sind nicht öffentlich einsehbar (dark archive). Der Datengeber kann allerdings einzelnen registrierten Nutzern den Zugang zu diesen Datenpaketen gewähren. Weitere Informationen finden Sie im Videotutorial Rollen und Benutzerverwaltung.

Wie lange werden publizierte und archivierte Daten in RADAR vorgehalten?

Bei der Archivierung bestimmt der Administrator die Haltefrist (5,10 oder 15 Jahre). Die Daten werden dann von RADAR für diesen Zeitraum sicher archiviert (dark archive). Der Datengeber kann jederzeit auf die Daten zugreifen.
Bei publizierten Daten garantiert RADAR die öffentliche Verfügbarkeit der Daten über einen Zeitraum von mindestens 25 Jahren. Der Datengeber kann gegebenenfalls eine Embargofrist festlegen, das Datenpaket wird dann erst nach Ablauf dieser Frist veröffentlicht.

Welche Maßnahmen zur Langzeitarchivierung (LZA) trifft RADAR?

Die Datenübertragung zur Speicherschicht erfolgt über standardisierte Protokolle (SFTP, GridFTP). Die Datenhaltung erfolgt über moderne Platten- und Tape-Systeme. Diese bieten mehrere Petabyte an Speicherplatz. Ein Storage Management System (High-Performance Storage System - HPSS) sorgt für einen effizienten Datenzugriff und erlaubt eine kostengünstige Langzeitspeicherung. Die System-Zuverlässigkeit wird durch Mehrfachkopien gesichert, die an unterschiedlichen Standorten mit verschiedenen Technologien abgelegt werden. Der Einsatz von Redundant Array of Independent Disks (RAID) und die Systemüberwachung selbst sorgen für die Datensicherheit der administrativen Komponenten, wie zum Beispiel Datenbanken, im System. Die Daten selbst liegen als BagIt-Strukturen in ZIP-Containern vor, d.h. die Daten werden in wohl-dokumentierten Containern vorgehalten. Jedes archivierte Datenpaket besteht aus einer Datei, die in sich selbstbeschreibend ist (also Daten und beschreibende Metadaten enthält). Für die Interpretation der BagIt-Strukturen ist keine spezielle Software notwendig.
RADAR sichert derzeit ausschließlich den physischen Erhalt von Datenpaketen, eine funktionale Langzeitarchivierung mit Formatmigration ist derzeit nicht vorgesehen.
RADAR garantiert weder die dauerhafte Nutzbarkeit noch die Interpretierbarkeit der in einem Datenpaket enthaltenen Daten, da diese abhängig von den gewählten Datenformaten sind. RADAR empfiehlt daher die Verwendung von Dateiformaten, die für die Langzeitarchivierung geeignet sind.

Werden die Daten redundant gespeichert?

Ja, es werden drei Kopien an drei Standorten (2 x Karlsruhe, 1 x Dresden) gespeichert. Dabei kommen unterschiedliche Soft- und Hardware-Systeme zum Einsatz. Die Systeme in Karlsruhe und Dresden sind organisatorisch und administrativ vollständig voneinander getrennt und unabhängig.

Wird die Integrität der Daten während der Speicherdauer geprüft?

Datenpakete werden vor ihrer Überführung in einen dauerhaften Speicher mit einer Prüfsumme (“checksum”) versehen, die nach jedem Kopiervorgang kontrolliert wird. Damit können Fehler während der Datenübertragung entdeckt und beseitigt werden. Beim Zugriff auf ein Datenpaket wird erneut die Prüfsumme berechnet und mit dem gespeicherten Wert verglichen, um eventuelle Datenkonsistenzfehler zu identifizieren. Sollte hierbei ausnahmsweise ein Fehler erkannt werden, greift RADAR auf die zweite Kopie am anderen Standort zu. Die verwendeten Speichermedien werden spätestens bei Ablauf der Herstellergarantie ausgetauscht. Dabei erfolgt eine Migration der betroffenen Datenpakete auf neue Speichermedien, verbunden mit einer Überprüfung auf eventuelle Bitfehler (“Fixity Checks”).

2 Voraussetzungen für die Nutzung von RADAR

An wen richtet sich RADAR?

RADAR richtet sich in seiner Startphase an öffentlich geförderte Forschungseinrichtungen in Deutschland, die Forschenden eine Infrastruktur für das Forschungsdatenmanagement anbieten möchten. Der Fokus von RADAR liegt insbesondere auf Forschungsdaten des sogenannten „Long Tails”, also aus den Fachrichtungen, die mit kleineren Datenmengen umgehen und meist noch keine eigenen Infrastrukturen vorhalten. Ein Angebot an Einrichtungen, die nicht öffentlich gefördert werden oder nicht in Deutschland angesiedelt sind, ist in Vorbereitung.

Welche Voraussetzungen müssen erfüllt sein, um RADAR nutzen zu können?

Die Nutzung von RADAR als Infrastruktur für das Forschungsdatenmanagement einer Institution setzt den Abschluss eines Dienstleistungsvertrags zwischen der Einrichtung und FIZ Karlsruhe voraus. Mehr Informationen zum Vertragstext, der RADAR-Dienstbeschreibung sowie zu den Nutzungsbedingungen finden Sie hier.

Wieso kostet RADAR etwas und wieviel?

Das Geschäftsmodell von RADAR ist auf Nachhaltigkeit und Transparenz ausgelegt. Es basiert auf nutzungsabhängigen Entgelten, Vertragsgebühren und institutioneller Förderung. Die Preise richten sich nach dem Datenvolumen und der Dienstleistung, die in Anspruch genommen wird. Mehr Informationen entnehmen Sie bitte der RADAR Preisliste.

Muss vor der Nutzung immer einen Vertrag abgeschlossen werden?

Ja, um Forschungsdaten mit RADAR zu publizieren oder archivieren zu können, müssen Forschungseinrichtungen zunächst einen Vertrag mit FIZ Karlsruhe abschließen. RADAR bietet interessierten Institutionen die Möglichkeit, den Dienst vorab unverbindlich über einen Testzugang zu testen. Um publizierte Forschungsdaten einzusehen und herunterzuladen ist weder ein Vertrag noch eine Registrierung notwendig, die Nutzungsbedingungen für Datennehmer von RADAR sind jedoch zu beachten und zu akzeptieren.

Können Verträge vorab eingesehen werden?

Ja, der Dienstleistungsvertrag über die Nutzung des Datenzentrums RADAR kann hier eingesehen werden.

Gibt es eine Möglichkeit, RADAR unverbindlich zu testen?

Ja, RADAR kann über einen Testzugang unverbindlich getestet werden. Weitere Informationen finden Sie im Glossar sowie im Videotutorial "Testoption".

1 Über RADAR

Was ist RADAR?

RADAR ist ein disziplinübergreifendes Repositorium, das die Archivierung sowie die Publikation von Forschungsdaten ermöglicht. Der Fokus von RADAR liegt auf Forschungsdaten des sogenannten „Long Tails”, also aus den Fachrichtungen, die mit kleineren Datenmengen umgehen und meist noch keine eigene Infrastruktur für das Forschungsdatenmanagement vorhalten. Der Dienst richtet sich in seiner Startphase an öffentlich geförderte Forschungseinrichtungen in Deutschland. Ein Angebot an andere Einrichtungen, auch im Ausland, ist in Vorbereitung.

Wer betreibt RADAR?

RADAR ist ein Service für die akademische Forschung und wird von namhaften deutschen wissenschaftlichen Einrichtungen getragen. Angeboten und betrieben wird RADAR durch FIZ Karlsruhe – Leibniz-Institut für Informationsinfrastruktur. Die technische Infrastruktur stellen das Karlsruher Institut für Technologie (KIT) über sein Steinbuch Centre for Computing (SCC) und die TU Dresden mit ihrem Zentrum für Informationsdienste und Hochleistungsrechnen (ZIH) bereit. Die Technische Informationsbibliothek (TIB) unterstützt FIZ Karlsruhe bei Beratung, Training und Marketing. Außerdem bezieht RADAR über sie (DataCite) die für die Datenpublikation benötigten Digital Object Identifier (DOI).

Wie wird RADAR finanziert?

Das RADAR-Projekt wurde von September 2013 bis August 2016 durch die Deutsche Forschungsgemeinschaft (DFG) gefördert. Während der Förderung wurde ein nachhaltiges, transparentes Geschäftsmodell entwickelt, das den langfristigen Betrieb RADARs sicherstellt. Es basiert auf nutzungsabhängigen Entgelten, Vertragsgebühren und institutioneller Förderung. Seit März 2017 läuft RADAR im Regelbetrieb und kommt ohne projektbezogene Förderung aus.

Worauf basiert die RADAR Software? Wie ist die Software lizenziert?

RADAR ist ein gehosteter Dienst. Die eingesetzte Software setzt sich aus den Archivlösungen beim Steinbuch Centre of Computing (SCC) und dem Zentrum für Informationsdienste und Hochleistungsrechnen (ZIH), der Repository-Management-Middleware und dem Frontend (Benutzungsoberfläche) zusammen. Middleware und Frontend basieren vollständig auf Open-Source-Software (u.a. Cassandra und ElasticSearch). Die Archivlösungen bei SCC (HPSS) und ZIH (SpectrumProtect) sind teilweise kommerziell und nicht Teil der RADAR-Software. Die RADAR-Software steht unter Apache License 2.0 als Open Source zur Verfügung.

Ist RADAR zertifiziert?

Das RADAR-Team arbeitet aktuell an einer Zertifizierung als “Trustworthy Data Repository” nach den Richtlinien des neuen Core Trust Seals, einer gemeinsamen Initiative von DANS und dem World Data System (WDS) unter dem Schirm der Research Data Alliance (RDA).