DANTE

FFG COMET, 2023 – 2026

Data Centric AI Engineering

Kontext und Motivation

Im Forschungsprojekt DANTE werden Methoden und Werkzeuge zur Messung und Verbesserung der Qualität von Daten entwickelt, wie sie für KI-Anwendungen verwendet werden. Trotz des wachsenden Bewusstseins für die Wichtigkeit dieses Themas, gibt es noch viele offene Fragen. Typische Probleme wie fehlende Daten, Ausreißer, Duplikate oder Konzeptdrift treten in vielen praktischen Anwendungen auf.

Während hohe Datenqualität eine entscheidende Voraussetzung für erfolgreiche KI-Projekte ist, ist die Qualität der eingesetzten Machine Learning (ML) Modelle ihr Gegenstück. Die Entwicklung, Überwachung und Wartung dieser Modelle erfordert eine kontrollierte und nachvollziehbare Verwaltung, welche durch eine Plattform unterstützt werden muss. Während Entwicklungsprinzipien wie DataOps und MLOps einen hohen Automatisierungs- und Flexibilisierungsgrad ermöglichen, liegt hier ein Fokus auf die Nutzer einer solchen Platform und wie deren Rolle in eine gesamtheitliche Data Governance Strategie integriert werden kann.

Durch die Anwendung hoher Qualitätsstandards auf Daten und ML-Modellen will das Forschungsprojekt DANTE die Entwicklung und Wartung von erklärbaren, vertrauenswürdigen und begründbaren KI-Modellen ermöglichen und unterstützen.

Erwartete Ergebnisse

  • Erforschung und Entwicklung neuer Ansätze für die automatisierte Erstellung von Datenkatalogen mit besonderem Augenmerk auf die semantische Beschreibung heterogener Datenquellen und von Konzeptdrifts.
  • Entwicklung und Anwendung von Werkzeugen zur kontinuierlichen Messung und Verbesserung der Datenqualität für eine schnelle, flexible und transparente Datenkuratierung mit dem Ziel qualitativ hochwertige human-in-the-loop KI-Anwendungen zu ermöglichen.

  • Entwicklung neuer Methoden zur semantischen Beschreibung von KI-Modellen und der Verwaltung von Modellvarianten mit den zugehörigen Metadaten.

  • KI-Engineering: Erforschung, wie die datenzentrierte und die modellzentrierte Sicht auf ML in eine ganzheitliche Plattform für qualitativ hochwertige KI-Anwendungen integriert werden kann. Die Plattform zielt auf Automatisierung und Benutzerintegration durch definierte Verantwortungsrollen ab.

Fördergeber

Das Projekt wird im Rahmen von COMET – Competence Centers for Excellent Technologies durch BMK, BMAW, Land Oberösterreich und den wissenschaftlichen Partnern des SCCH gefördert. Das Programm COMET wird durch die FFG abgewickelt.

Lettner Christian

Senior Research Project Manager Data Science
Research Team Lead Data Centric AI Engineering