FAIR Datenmanagement für bessere Forschungsgrundlagen

Gesicherte Erkenntnisse kann eine datenbasierte Wissenschaft nur dann liefern, wenn Qualität und Verfügbarkeit der Rohdaten verlässlich stimmen. Mit dem Projekt „FAIR DATA Austria“ bekommt Forschungsdatenmanagement (FDM) jene Priorität, die es verdient. Ziel ist eine effiziente und kollaborative Basis für die Zukunft zu schaffen, ausgerichtet an den Bedürfnissen der Forschenden in den jeweiligen Disziplinen.

Der Legende nach führte ein einzelner Datensatz in Form von Kernobst zur Benennung eines der fundamentalen Prinzipien unseres Lebens. Ob Newton die Erkenntnis in Form eines Apfels überhaupt traf ist hochumstritten und für die Sache selbst unbedeutend. Durch eine ausreichende Menge weiterer, nachvollziehbarer und leicht beobachtbarer Belege wurde in den letzten 400 Jahren die Schwerkraft allgemein akzeptiert. Heute ist Wissenschaft in dieser Form nicht mehr möglich. Derart gravierender Erkenntnisgewinns ist ebenso wenig möglich, wie die Arbeit mit ungesicherten Daten oder Anekdoten.

In den kommenden Jahren ist ein deutlicher Kulturwandel beim Forschungsdatenmanagement nicht aufzuhalten. Die öffentliche Hand und die Hochschulen arbeiten gemeinsam daran, dass sämtliche Ergebnisse öffentlich finanzierter Forschung allgemein und jederzeit zugänglich sind. Die Forschenden realisieren, welches Potenzial in der Nutzung neuer FDM-Technologien schlummert. Unter der Leitung der TU Graz entwickelt das Projektteam rund um Ilire Hasani-Mavriqi eine nutzenorientierte Herangehensweise, die alle Anforderungen der unterschiedlichen Disziplinen berücksichtigt.

Größte Herausforderungen meistern

Mangelhaftes Forschungsdatenmanagement ist in vielen Fällen ein beträchtliches Hindernis in der wissenschaftlichen Arbeit. Ist ein Datensatz, der in einer Arbeitsgruppe via USB-Stick weitergegeben wird, überhaupt noch vollständig und aktuell? Wo können wir große Datenmengen ablegen ohne Hardwareprobleme zu verursachen? Wie finden wir ähnliche Forschungsdaten für einen qualifizierten Vergleich? Für Forschende bedeutet adäquates Datenmanagement aktuell viel Aufwand. Kein Wunder, dass bis zu 85 % aller Forschungsdaten nur ein einziges Mal verwendet werden, bevor sie im digitalen Nirwana verschwinden.

Der Wunsch nach einer Verbesserung ist allgegenwärtig, die Priorität des Projekts entsprechend hoch. FAIR DATA Austria setzt hier gleichzeitig auf zwei wichtige Hebel. Auf der einen Seite müssen funktionierende Tools für einen effizienten und sicheren Umgang mit den Forschungsdaten geschaffen werden. Auf der anderen Seite müssen die Forschenden bei diesem Transformationsprozess ausreichend unterstützt werden. Ein hohes Bewusstsein für Datenmanagement, eine durchdringende Akzeptanz für die Nutzung der Tools und ein offener Feedbackkanal für gewünschte Verbesserungen versprechen hier den größten Erfolg.

 

“A trusted space for researchers to store their data
and to access data from researchers from all other disciplines."

EC President Ursula von der Leyen über EOSC

Mit dieser Strategie ist Österreich auch im internationalen Vergleich gut aufgestellt. Dank der Vienna Scientific Cluster und den ersten Repositorien für Langzeitarchivierung sind die Grundlagen im Bereich der Infrastruktur geschaffen. Durch den Austausch über die Landesgrenzen hinaus sollen bewährte Erfolgsmodelle (beispielsweise aus den Niederlanden) auf Österreichs Hochschulen Einzug halten. Die European Open Science Cloud fördert diesen Austausch und startet gerade mit der Phase 2, die es sich zum Langzeitziel gesetzt hat, dass mindestens 50% der Forschungsdaten1 dauerhaft verwertbar zur Verfügung stehen. Die EOSC Full Members TU Graz, TU Wien und Uni Wien leisten hier einen entscheidenden Beitrag. Sie sorgen dafür, dass die gewonnenen Erkenntnisse in der österreichischen Hochschullandschaft implementiert werden und diese europaweit eine Führungsrolle einnehmen.

 

"A web of scientific insight."

Karel Luyben, President of the EOSC Association

FAIR als Grundlage für langfristige Änderungen

Bei der Entwicklung eines adäquaten FDMs steht die Implementierung der FAIR Prinzipien („findable“, „accessible“, „interoperable“ und „re-usable“) im Mittelpunkt. Die Daten sollen zukünftig für Mensch und Maschinen auffindbar und zugänglich sein. Sie stehen in einem disziplinübergreifenden Open Source Format zur Verfügung und können damit kollaborativ genutzt werden. Um sie für weitere Forschungsfragen wiederverwerten zu können, bleiben sie langfristig verfügbar. Keine einfache Aufgabe, wie ein Blick in die Praxis zeigt.

In jeder Wissenschaft werden Daten anders behandelt. Teilweise sind die entwickelten Modelle wichtiger als die Daten auf denen sie beruhen. Oder der Umfang der gesammelten Rohdaten bringt die Hardware an ihre Grenzen. Experimentelle Daten, Patient*innendaten oder Simulationsdaten brauchen hier den jeweils richtigen Zugang im Einklang mit den Anforderungen. Für den Anfang taucht das Projektteam daher tief in die Wünsche und Bedürfnisse der einzelnen Disziplinen ein. „Die Forschung der Zukunft lässt sich nicht isoliert aufstellen“, formuliert Ilire Hasani-Mavriqi den Grundsatz. Analyse erfolgreicher Vorreiterdisziplinien, eine schrittweise Implementierung für weitere Einsatzzwecke und ständige Verbesserung durch das Feedback der Anwender*innen schafft ein erfolgreiches System für Datenmanagement.

Derzeit müssen sich Forschende meist nach Abschluss der wissenschaftlichen Arbeit um das Datenmanagement selbst kümmern. FAIR DATA Austria setzt hier einen umfassenden Kulturwandel in Gang. Ziel ist es aus technischer Sicht eine intuitive Infrastruktur zu schaffen, die Forschende früher motiviert ihre Forschungsdaten für die langfristige Nutzung aufzubereiten. Via Drag and Drop und der Befüllung der entsprechenden Metadatenfelder werden Datensätze mit einem DOI (Digital Object Identifier) publiziert und die einzigartige URL bleibt nach den FAIR-Prinzipien erhalten. Die Dokumentation der Daten (Metadaten) ist dabei mindestens so wichtig wie die Daten selbst. Ohne zu wissen was drinsteckt, kann man nichts damit anfangen. Ein Datenset sichtbar machen und für eine Analyse mit qualitativ hochwertigen Metadaten zu verfeinern wird künftig für Forschende mit deutlich weniger Aufwand verbunden sein.

Gelungene Transformation

Durch die unzähligen Anforderungen setzt das Projektteam auf eine beständige Politik der kleinen Schritte, ohne dabei die große Vision aus den Augen zu verlieren. Die Forschenden bekommen jede Unterstützung, damit die neuen Tools angenommen und getestet werden können. Die Beobachtungen und kritische Fragen fließen im Gegenzug zurück in die Entwicklung. Facts and Checks anhand konkreter Beispiele aus der Praxis helfen bei Überzeugungsarbeit auf jeder Ebene. Damit Aufbau und Entwicklung von Next-Generation Repositorien für Forschungsdaten überhaupt umfassend, disziplinspezifisch und auf die generischen Bedürfnisse abstimmt werden können, braucht es die gerade jetzt die konzentrierte Mitarbeit der Forschenden. Zentrale Frage dabei: Wie könnte es für noch besser funktionieren?

“As a [role] I want to [goal] so that [benefit]”

Mit einer weiterentwickelten Technologiebasis wird der gewünschte Kulturwandel leichter möglich. Der intensive Austausch zwischen Forschenden, Projektteam und EntwicklerInnen in dieser frühen Phase garantiert, dass alle Anforderungen für die Zukunft implementiert werden können. Damit der kommende Nutzen sichtbar wird, ist gezieltes Transformationsmanagement eine der Säulen des Projekts. „In Workshops schaffen wir Awareness für Datenmanagement, Akzeptanz für neue Tools und holen uns gleichzeitig wertvolles Feedback für die Weiterentwicklung“, fasst Sabrina Knopper den Zugang zusammen.

Example: “As a researcher, I want to find datasets that
are similar to those that I used before, so that I can
expand and compare my studies”2

Mit den ersten drei disziplinspezifischen Data Stewards an der TU Graz ist ein Grundstein für die Einführung an der Hochschule gelegt. Das Team der Data Stewards fungiert als Bindeglied zwischen Mensch und Technik bzw. zwischen Forschung, Infrastruktur und Policy. Für effizientes, den FAIR-Prinzipien entsprechendes FDM ist es essenziell, dass der gesamte Lebenszyklus der Forschungsdaten (von der Generierung bis zur Archivierung) durch Prozesse strukturiert und gut organisiert ist. Im regelmäßigen Austausch werden technisches Know-how und soziale Fähigkeiten beständig gesteigert und die Erfahrungswerte an andere Hochschulen weitergegeben. Steigende Akzeptanz ist für den gelungenen Umstieg essentiell, alle Organisationseinheiten müssen in den Prozess miteingebunden werden.

Eine erfolgreiche Initiative zur niederschwelligen Dissemination guter Forschungsdatenmanagementpraxis an der TU Graz stellt die Data Champions Community dar. Diese Gruppe von engagierten Forschenden interessiert sich für FDM sowie die dazugehörigen FDM-Tools und tauscht sich in regelmäßigen Treffen untereinander aus. Betreut werden die Data Champions von den Data Stewards mittels Info-Events und Workshops, die sich unterschiedlichen Aspekten des Forschungsdatenmanagements widmen und auf die Bedürfnisse der Community abgestimmt sind. Die Data Champions werden stets in die Planung der Treffen und die inhaltliche Schwerpunktsetzung eingebunden und präsentieren auch Themenstellungen aus ihrer eigenen Forschungsdisziplin. Als nächsten Schritt tragen sie das erworbene FDM-Wissen aus den Data Champions Treffen in ihre Forschungsgruppen weiter und fördern dadurch die Bewusstseinsbildung für die Wichtigkeit der FAIR-Prinzipien. Die Data Champions Community lebt vom Erfahrungsaustausch unter den Mitgliedern sowie der hohen Praxisorientierung und beweist, dass sich durch konsequente Partizipation und Bedürfnisorientierung ein Netzwerk an Change MultiplikatorInnen etablieren lässt, um gute FDM-Praxis für Forschende zugänglicher zu gestalten.

Für die Zukunft entscheidend

Bereits heute zeichnet sich ab, dass weitreichende Veränderungen auf die Hochschulen zukommen. Bibliotheken werden als HüterInnen des Wissens weniger Bücher und mehr Server beherbergen.  FDM wird als wesentlicher Grundpfeiler guter wissenschaftlicher Arbeit, früh in den ersten Semestern des Studiums implementiert sein. Im Fokus steht der Aufbau einer nachhaltigen und föderierten Infrastruktur, die den offenen Austausch wissenschaftlicher Ergebnisse ermöglicht. Im Idealfall ist damit der Grundstein für bisher unerreichte Erkenntnisse durch eine datenfundierte Wissenschaft gelegt.

Wie wichtig das Thema ist, lässt sich schon heute an der Liste der Kooperationspartner ablesen. Neben den Projektpartner*innen TU Graz, Institute of Interactive Systems and Data Science (ISDS) und Handlungsfeld Forschung der Digitalen TU Graz, TU Wien, Zentrum für Forschungsdatenmanagement und Universität Wien, Bibliotheks- und Archivwesen, Abteilung Repositorienmanagement Phaidra-Services profitieren die Kooperationspartner*nnen Akademie der bildenden Künste Wien, Medizinische Universität Graz, Universität Innsbruck sowie 23 weitere assoziierte Partner*innen (Universitäten und internationale Initiativen) von den Ergebnissen.

FAIR Data Austria ist Teil des Digitalisierungs-Clusters „Forschungsdaten“, der drei geförderte Projekte des Bundesministeriums für Bildung, Wissenschaft und Forschung vereint: FAIR Data Austria, RIS Synergy und Austrian DataLAB and Services.

Sie alle teilen die Überzeugung, dass Datenmanagement für erfolgreiche Forschung und höhere Qualität der Publikationen in jeder Disziplin entscheidend sein wird. Und dass die Stärkung des Wissenstransfers zwischen Universitäten, Wirtschaft und Gesellschaft von entscheidender Bedeutung für Lösungen von Morgen sein wird.

 

1https://www.eosc-pillar.eu/news/eosc-association-regional-national-communities-interviews-board
2https://phaidra.univie.ac.at/open/o:1201054