daSEM

FFG COMET, 2015-2018

Automatisiertes (Big) Data Engineering, Datenverarbeitung und semantische Modelle

Automatisiertes (Big) Data Engineering, Datenverarbeitung und semantische Modelle

Ziele / Forschungsthemen

Das Projekt daSEM fokussiert sich auf den Entwurf und die Entwicklung von computergestützten Techniken und Werkzeugen zur Gewinnung von implizitem Wissen aus Informationen durch automatisiertes (Big) Data Engineering, (halb)automatisierte Datenintegration, Anwendung von Big Data Technologien und semantische Wissensmodellierung. Im Hinblick auf die Projektziele werden modernste Ansätze und Konzepte für das Management und die Verarbeitung von großen Datenmengen (Big Data) evaluiert, einschließlich prototypischer Implementierungen für automatisierte Daten- und Wissensverarbeitungs-Workflows im Kontext von Data Warehousing und Business Intelligence. Zusätzlich werden Muster über fehlende Daten untersucht, wobei mit Hilfe von maschinellen Lernmodellen und Methoden des Datenqualitätsmanagements z.B. fehlende Werte basierend auf den Merkmalen nachgelagerter Datenanalyseverfahren abgeleitet werden.

Methoden / Software / Proof of concepts

  • Evaluierung von state-of-the-art Ansätzen für Big Data Management und -Verarbeitung: Hadoop-Ökosystem, Apache Spark, NoSQL-Datenbanken
  • Identifikation von automatisierbaren Daten- und Wissensverarbeitungsaufgaben auf Basis verfügbarer Produktionsdaten der Unternehmenspartner
  • Untersuchung von Data Mining Workflow und Toolstack(s), prototypische Testimplementierungen für Unternehmenspartner
  • Evaluierung von Mustern und Relationen fehlender Daten

Ausgewählte Publikationen

  • Automated Data Quality Monitoring as the basis for meaningful data integration [EW17a, EW17b]

Fördergeber

Das Projekt wird im Rahmen von COMET – Competence Centers for Excellent Technologies durch BMK, BMDW, Land Oberösterreich und den wissenschaftlichen Partnern des SCCH gefördert. Das Programm COMET wird durch die FFG abgewickelt.