Editorial

Wie von Zauberhand
erstellt

(26.07.2023) Ein Datenmanagement-Plan führt penibel auf, was während eines Projekts mit den Daten passiert. Mit dem Data­PLAN-Tool schreibt er sich wie von selbst.
editorial_bild

Wer eifrig forscht, produziert jede Menge Daten. Haufenweise Genom­sequenzen hier, hunderte Phäno­typisie­rungen dort, zig Metabolom-Profile beim Kollegen und dazu noch die hinterlassenen Mikroskopie-Aufnahmen einer einstigen Doktorandin. Schnell wird der Datenberg unüberschaubar und ohne einen Daten­management-Plan (DMP) ist es fast unmöglich, den Überblick zu behalten.

Der DMP hilft dabei nicht nur im Laboralltag, effizienter durch den Datenwust zu navigieren – mittlerweile sind Datenmanagement-Pläne für Forschungs­anträge ein Muss. Antragsteller und Antrag­stellerinnen erhalten nur dann Geld, wenn sie überzeugend darlegen können, dass sie weder Daten-Messies sind, noch rechtliche Aspekte ignorieren, etwa die General Data Protection Regulation (GDPR). Für Anträge bei der Deutschen Forschungs­gemeinschaft (DFG) müssen Forscher und Forscherinnen 19 Fragen zum Daten­management beantworten, bei Horizon2020-Anträgen auf EU-Ebene sogar 45.

Editorial

Für DFG- und EU-Anträge

So einzigartig jedes Forschungsprojekt und jeder Antrag auch ist, effiziente DMPs sollten ähnlich strukturiert sein, um sie einfacher standardisieren zu können. Sie müssen dennoch zum Forschungsgebiet passen – für ein Astrophysik-Projekt ist etwa der geregelte Umgang mit genetischen Ressourcen ziemlich irrelevant. Ein Team um Angela Kranz vom Forschungs­zentrum Jülich, dem Bioinformatiker und Bioinfor­matikerinnen von fünf deutschen Universitäten sowie der britischen Projekt- und Daten­management-Firma Twyman Research Management angehörten, hat sich vorgenommen, die Standardisierung von DMPs zu vereinfachen. Speziell für die Pflanzen­wissenschaft entwickelte die Gruppe das Daten­management-Werkzeug DataPLAN.

Das an den sogenannten FAIR-Prinzipien (Findable, Accessible, Interoperable, Reuseable) orientierte Web-basierte Tool generiert standardisierte Templates, die speziell für DFG-, Horizon2020- oder Horizon-Europe-Anträge ausgelegt sind. Folgt man dem Link plan.nfdi4plants.org, findet man auf der Website von DataPLAN eine zweigeteilte Vorlage. Auf der rechten Seite des Bildschirms sind stichpunktartig abgefragte Eckdaten zum Projekt aufgeführt: etwa Name, Projektziel, wer von den Projekt­ergebnissen profitieren wird und wo Daten für die Community bereitgestellt werden. Die hier eingegebenen Daten erscheinen in der linken Bildschirmhälfte als fertig ausformulierter Text – die selbst eingetragenen Begriffe sowie angeklickte Auswahl­begriffe, etwa auf die Frage „What kind of data will you handle?“, sind farbig hervorgehoben.

Link zu Gesetzestexten

Die eingetragenen, stichwortartigen Antworten lassen sich speichern (im json-Format), exportieren und in ein neues DMP-Formular importieren. Das erspart wiederholtes Eintragen und mühsames Recherchieren in alten Anträgen. Außerdem können Einträge aus dem DFG-Template in ein Horizon2020-Template übertragen werden und vice versa. Der ausformulierte Text fällt jeweils anders aus, basiert aber auf denselben Einträgen.

DataPLAN zeigt die Einträge von zwei DMPs tabellarisch nebeneinander an, damit der User auf Anhieb Unterschiede erkennen kann. Die automatisch ausformulierten Texte erscheinen im spezifischen Design des jeweiligen Förderprogramms, etwa der DFG, und sind copy/paste-kompatibel. Das Programm erkennt auch rechtliche Tücken, die ein erfolgreicher Antrag adressieren muss. Gerade bei internationalen Kooperationen können hier Probleme auftauchen, etwa beim Austausch genetischen Materials oder anderer Proben. DataPLAN markiert die entsprechende Textpassage automatisch, nennt den Grund der Warnung und leitet den Nutzer mit einem Link zum jeweils gültigen Gesetzestext.

Zeit und Nerven sparen

Obwohl die einzelnen Förderprogramme und ihre DMP-Abfragen unterschiedlich sind, haben sie dennoch vieles gemeinsam. Eine semantische Analyse der Gruppe ergab, dass einzelne Fragen bis zu 75 Prozent auf dieselben Inhalte abzielen. Der Beginn eines ausformulierten DFG-spezifischen DMPs liest sich beispielsweise wie folgt (unterstrichen angezeigte Begriffe stammen von individuellen Einträgen):

Data acquisition:

a. Data generation
Data should be generated by devices that are compatible with the open-source format. The drought resistant superplant should be compliant to biodiversity protocols. The protocols used to collect phenotypes, genotypes, data about the drought resistant superplant will be stored in a FAIR data storage.
b. Data collection
The data collection process is conducted by experimental scientists and stewarded by Datenhäuptling.
c. Data organization
The data organization process is conducted by Datenhäuptling. The detailed organization method and procedure are reported to the PIs.

Mit DataPLAN können Pflanzenforscher und -forscherinnen Zeit und Nerven sparen, denn DMPs zu formulieren, gehört sicher nicht zu ihren Lieblingsaufgaben. Einfach mal ausprobieren. Der Name DataPLAN ist aber eher suboptimal – wer ihn googelt, stößt zuallererst auf eine IT-Firma.

Andrea Pitzschke

Zhou X. et al. (2023): DataPLAN: a web-based data management plan generator for the plant sciences. BioRxiv, DOI: 10.1101/2023.07.07.548147

Bild: DataPLAN & Pixabay/rapplw (Zauberer)




Letzte Änderungen: 26.07.2023