PRIMAL

Privacy Preserving Machine Learning for Industrial Applications

Ausgangssituation

Google und Facebook haben bewiesen, dass die Erfassung großer Datenmengen und die Anwendung von Deep Learning prädiktive Dienste mit erstaunlicher Genauigkeit ermöglichen. Ähnliche Chancen bestehen in vielen anderen Branchen.

Problem Motivation für das F & E Projekt

Für industrielle Anwendungen sind jedoch große homogene Datensätze, wie sie für Deep Learning benötigt werden, oft nicht vorhanden. Transfer Learning lindert dieses Problem, da es erlaubt, Modelle auf verschiedenen (aber verwandten) Datensätzen aufzubauen. Ein weiterer vielversprechender Ansatz ist die gemeinsame Nutzung von verteilten Daten (z.B. verschiedener Abteilungen und Unternehmen), um Modelle gemeinsam zu erstellen, was allerdings datenschutzrechtliche Bedenken aufwirft. Zwei indikative Anwendungen sind:

  • Maschinenhersteller könnten die Daten ihrer Kunden nutzen, um maschinenbezogene Prognosemodelle zu erstellen; Kunden befürchten jedoch, dass sensible Informationen preisgegeben werden.
  • Materialhersteller wollen gemeinsam ein Modell zur Repräsentation von Molekülstrukturen erarbeiten, das eine effizientere Erstellung von individuellen Modellen für funktionelle Eigenschaften ermöglicht. Sie sind jedoch nicht gewillt, detaillierte experimentelle Daten zu teilen.

Ziele und Innovationsgrad

PRIMAL adressiert diese Probleme, indem privatsphären-erhaltende Verfahren für Deep Learning entwickelt werden, um gemeinsame globale Modelle unter Verwendung verteilter Datensätze so aufzubauen, dass jeder Datensatz im Privatbesitz jedes Einzelnen bleibt. Ziel ist es, private Daten jedes Einzelnen zu schützen und gleichzeitig eine maschinelle, lernbasierte Analyse der Gesamtdaten aller Beteiligten als Ganzes zu ermöglichen. Über den Stand der Technik hinaus gibt es viele offene Fragen zu klären: Schutz vor neu entwickelten Angriffen auf die Privatsphäre; Evaluierung von Methoden jenseits einfacher Bildklassifikationsaufgaben, d.h. Eignung von Ansätzen für industrielle Anwendungen; Unterstützung von Transfer-und Multitasking-Learning sowie rekurrenten Netzwerken; Schnittstellen zur Integration in Datenanalyse-Infrastrukturen einschließlich Authentifizierungskonzepten.

Erwartete Ergebnisse

Das Hauptergebnis des Projekts wird ein Software-Framework sein, das Algorithmen und Schnittstellen für die Erstellung von privatsphärenerhaltende Predictive Analytics Anwendungen für eine Vielzahl von (industriellen)Anwendungen bereitstellt. Es wird Mechanismen bereitstellen, um (zumindest) Anwendungen zu unterstützen, die homomorph zu A1 und A2 sind. Darüber hinaus werden Transfer Learning und Multi-Task-Lernmethodeneingesetzt, um die Integration inhomogener Datenquellen in den Modellierungsprozess zu unterstützen. Um die Allgemeingültigkeit des Ansatzes zu gewährleisten, wird das Framework unter Verwendung von Daten mit unterschiedlichen Modalitätenaus verschiedenen Anwendungsbereichen entwickelt: Intralogistik, Schweißtechnologie und Bioinformatik.

Wissenschaftliche Kooperationen

PRIMAL bündelt alle erforderlichen wissenschaftlichen & technologischen Kompetenzen durch die Partner

  • SCCH (privatsphärenerhaltendes maschinelles Lernen, Software-Architektur, Big Data Technologien, Deep-&Transfer Learning)
  • Institut für Machine Learningder JKU Linz (Deep Learning, Bioinformatik)
  • SBA Research (Security,Privacy)
  • TGW Logistics (Intralogistik, Connected Warehouse Infrastructure) und
  • Fronius International (Schweißtechnik, Datenanalyse-Infrastruktur).

Fördergeber

Das Projekt wird im Rahmen von IKT der Zukunft gefördert.

Kontakt

Bernhard Freudenthaler

Freudenthaler Bernhard

Area Manager Data Science
Telefon: +43 50 343 850

zurück