Data Science & Machine Learning Hub (DSML-Hub)

Praxisbeispiel und aktuelle Herausforderungen

  • Derzeit kommen für die Entwicklung von Lösungen für Data Science oder Machine Learning Use Cases und der damit verbundenen Datenhaltung vor allem die Angebote der Hyperscaler in Frage. Digitale Souveränität ist somit nur bedingt möglich. Daten der öffentlichen Verwaltung liegen nicht für alle Bereiche oder nicht in geeigneter Qualität vor, oder sie sind besonders geschützt und können nicht als Rohdaten zur Verfügung gestellt werden. Sie müssen vielmehr aufbereitet oder aggregiert werden, damit Start-ups oder Unternehmen sie nutzen können.
  • Der Data Science & Machine Learning (DSML)-Hub steht für die Öffnung und Nutzung von Daten der öffentlichen Verwaltung (unter Berücksichtigung des Datenschutzes), um diese für die Entwicklung von Data Science und KI-Anwendungen zur Verfügung zu stellen. Ziel ist die Schaffung eines nachhaltigen Lösungsansatzes für die Herausforderungen des Einsatzes von Data Science und KI im öffentlichen Sektor. Zusätzlich sollen Unternehmen, Start-ups sowie Wissenschafts- und Forschungseinrichtungen mit dem Hub bei Innovation und Wertschöpfung durch Data Science und KI unterstützt werden.
  • Der DSML-Hub besteht aus fünf Bausteinen:
  1. Öffnung der Datensilos der Verwaltung und Zugang zu Datenräumen für Dritte
  2. Aufbau einer Infrastruktur für Data Science und KI mit modernster Hardware und gängiger Software (u.a. einer DSML-Plattform)
  3. Ausweitung des im Aufbau befindlichen Ökosystems bestehend aus Start-ups, öffentlichen IT-Dienstleistern, (regionalen kleinen und mittleren) Unternehmen, Verwaltung, Politik sowie Wissenschafts- und Forschungseinrichtungen
  4. Synchronisation mit GAIA-X
  5. Umsetzung von zehn ausgewählten innovativen Projekten in Verwaltung und Unternehmen
  • Die DSML-Plattform mit entsprechender Infrastruktur ermöglicht den Zugang zu Daten und damit die Bearbeitung jeglicher Use Cases. Es können Lösungen für den eigenen Bedarf oder für Dritte entwickelt und in den Betrieb übergeben werden. Das Angebot richtet sich vor allem an regionale Unternehmen, die öffentliche Verwaltung und an Wissenschafts- und Forschungseinrichtungen.
  • Mit dem DSML-Hub wird der Wirtschafts- und Wissenschaftsstandort Deutschland gestärkt und Datenräume geschaffen, die es in Verbindung mit der technischen Infrastruktur ermöglichen, Data Science und KI-Lösungen aus der Forschung bzw. von Start-ups in regionale Unternehmen zu übertragen.
Infografik: Data Science & Machine Learning Hub (DSML-Hub)

Welchen Mehrwert bietet das „Projekt GAIA-X“?

  • GAIA-X setzt die Voraussetzungen für das Vertrauen in Datensicherheit und die digitale Souveränität.
  • Der Data Science & Machine Learning Hub stellt zum einen das Leistungsangebot zur Verfügung, welches für Entwicklungsprojekte notwendig ist: konfigurierbare Hardware (z.B. GPU, CPU, RAM) sowie einen Software-Stack (z.B. KI-Frameworks wie TensorFlow, Jupyter Notebook oder Tools für den Data Lifecycle). Zudem sollen im Rahmen eines Marketplace auch vorkonfigurierte Lösungen angeboten werden können. Dadurch besteht die Möglichkeit ein Entwicklungsprojekt bis zum Betrieb auf dem Hub durchzuführen.
  • GAIA-X ermöglicht die nationale und internationale Zusammenarbeit und vergrößert die Reichweite des DSML-Hubs.

Patin und Pate

  • Tina Siegfried – Dataport
  • Nikolai Wilckens – Dataport