IDE@S - Innovative Data Environment at Styria

Wie alles begann...

Vor einigen Jahren standen einige Forschende an der Medizinischen Universität Graz (MUG) vor dem Problem, ihre Forschungsdaten aufgrund der beträchtlichen Quantität nur noch per Post auf Speichermedien an ihre Kollaborationspartner*innen versenden zu können und auf eine Rücksendung warten zu müssen, um die Analysen weiterführen zu können.

Dieser Moment war auch einer der Wegbereiter für die Konzeptionierung einer kollaborativen Dateninfrastruktur. Natürlich stellt sich im Zuge von Forschungsthematiken generell immer mehr die Frage nach weiteren Daten, die einerseits Modelle verbessern sollen und andererseits auch neue Einblicke generieren können. Dies schließt gerade interdisziplinäre Vorhaben mit ein.

Infolgedessen ergab sich in Zusammenarbeit mit Forschungsgruppen anderer Grazer Hochschulen die Idee, eine Dateninfrastruktur erstmals im regionalen Raum zu erarbeiten. Steiermark als Startpunkt zu wählen hatte den Vorteil, das Vorhaben in kleinerem Maßstab zu testen, bevor man überregionale Lösungen betrachtet und  Landesförderungen zu beantragen. Um im späteren Verlauf die Einwerbung von EU-Förderungen beispielsweise im Rahmen der europäischen Open Science Cloud Initiative (EOSC) zu ermöglichen, würde eine finanzielle Unterstützung des Landes Steiermark für eine professionelle Planung und Einreichungsvorbereitung eines Dateninfrastrukturprojektes erforderlich sein.

Als Prämisse galt es nicht nur öffentliche sondern auch private Organisation miteinzubinden, da viele Forschungsprojekte entsprechende Kollaborationen beinhalten. Darauf aufbauend ergab sich die Vision, die Effizienz und Wettbewerbsfähigkeit von öffentlichen Institutionen wie Universitäten und Verwaltung als auch der privaten Unternehmen auf Basis einer erweiterten Infrastruktur, die eine effiziente, sichere und nachhaltige Nutzung von Daten ermöglicht, zu steigern.

Ein Konzept für kollaborative Datennutzung ist geboren

Aus diesen Überlegungen wurde die Hauptidee des Projekts IDE@S entwickelt: Als übergeordnetes Ziel vom Projekt sollte das Konzept für ein steirisches Referenzmodell für die kollaborative Nutzung großer Datenmengen erstellt und darauf aufbauend die Sichtbarkeit der Steiermark in der europäischen Landschaft um Datenwissenschaften erhöht werden.

Eine Grafik einer Datenbank und ihrer netzwerkartigen Umgebung

Als Kernpunkte wurden folgende bearbeitet: eine Abbildung existierender Infrastrukturen und Dienstleistungen für Forschungsdaten aus Wissenschaft, Öffentlichkeit und Wirtschaft, um daraus Lücken für eine Weiterentwicklung aufzuzeichnen; Wege zur Ausbildung von Arbeitskräften aufzeigen und Richtlinien für den sicheren Umgang mit Daten vorschlagen; Entwurf und Aufbau einer Organisations- und Führungsstruktur rund um die technische Infrastruktur sowie Dienstleistungen und erste Planungen für den Aufbau und die Installation eines Demonstrators auf Basis lokal existierender und in Zukunft notwendiger Infrastruktur für die Anbindung an europäische Initiativen. Teil des Vorhabens umfasste die Identifikation und Involvierung von Partner*innen aus den öffentlichen und privaten Sektoren.

Aufbauend auf einer Bedarfserhebung sollte ein Grobkonzept für die Infrastruktur in Bezug auf Datenmanagement, Rechenleistung, Datensicherheit, Datenanalytik, zentraler und dezentraler Organisationsstrukturen erstellt werden. Zugehörig ist auch ein Konzept für die soziale Infrastruktur wie Richtlinien, Ausbildung, Schulungen, Dienstleistungen oder Wissensdiffusion, genauso wie ein grober Finanz- sowie Unternehmensplan. Das Projektteam wird hierfür von Grazer Universitäten und Fachhochschulen gestellt und soll die steirische Industrie, Kompetenzzentren, Joanneum Research und Technologie-Cluster sowie den öffentlichen Sektor aktiv involvieren.

Im Zuge des Projektes wurden Studien zum Thema vorhandener Dateninfrastrukturen, Personal und Ausbildungsprogramme, eine Wirtschaftsanalyse, eine Untersuchung zu Interessensgruppen durchgeführt, als auch ein datenschutzrechtlicher Leitfaden sowie Organisationsaspekte erarbeitet. Unter anderem ließen sich einige Erkenntnisse ableiten: Um Datensilos aufzubrechen, benötigt es gemeinsame Entwicklungen zwischen privaten und öffentlichen Organisationen für eine kollaborative Datennutzung zwischen Produzierenden und Nutzenden. Die Basis hierzu bilden Dateninfrastrukturen genauso wie modellhafte Vorgehensweisen und die nötige Expertise. Laut Hochrechnung der FH Joanneum wird sich der Personalbedarf im Bereich Datenwissenschaften bzw. Cloud Computing in steirischen Unternehmen in den nächsten sieben Jahren ungefähr verdoppeln. Etwas mehr als die Hälfte des zukünftigen Personals soll laut der Befragung mit nicht-akademisch ausgebildetem Personal gedeckt werden. Steirische Unternehmen erachten Weiterbildung in diesen Bereichen als relevant, woraus man ableiten könnte, dass die Unternehmen den Personalbedarf auch decken werden, indem sie vorhandenes Personal weiterbilden.

Drehscheibe für Informationen und Lösungen 

In der Ausgestaltung der einzelnen Arbeitspakete rund um technische Infrastruktur, Dienstleistungen, humane Ressourcen, Datenmodelle und Geschäftsstrukturen wurde der Bedarf an spezifischen Lösungen festgestellt, die einzelne Kollaborationspartner*innen unterstützen müssen, bevor eine generelle Lösung geschaffen werden kann.

Beispiele hierfür sind personalisierbare - einfach zu konfigurierende und anzuwendende - Sicherheitssysteme, eine Anonymisierungssoftware, die die Bereitschaft zum Datenaustausch und zugehöriger Offenlegung erleichtert, ein Kollaborationsinformationssystem zum thematischen Austausch und Marktplatz von Dienstleistungen bzw. Gerätschaften sowie Expertisenvermittlung rund und Personalbedarf als auch Datenlabore. Gemäß erhobenem Bedarf und eingegangener Rückmeldungen würde eine „simple“ Datenaustauschumgebung ohne weitere Spezifikationen nur begrenzt einen gesteigerten Datenaustausch bewirken oder genutzt werden, da diese beispielsweise für sensitive Daten oder gegen das mangelnde Wissen um vorhandene Daten keine Unterstützung bietet.

Tortendiagramm von Ideas

Auch nach Projektende wird IDE@S nun als Verein weiterexistieren, um als Informations- und Lösungsdrehscheibe zum Thema kollaborativer Datennutzung zu dienen. IDE@S bringt Mehrwert durch Kooperation und macht konkrete Lösungen zugänglich, um regionale, datengetriebene Ökosysteme zu fördern und weiterzuentwickeln!

Mehr Informationen zum Projekt finden sich auf ideas.tugraz.at.