SUSTAIN
FFG COMET, 2023 – 2026
Scalable situation & sustainability aware optimization & control
Kontext und Motivation
Maschinelles Lernen und Datenanalytik spielen eine entscheidende Rolle bei der Verwirklichung langfristiger Nachhaltigkeitsziele. In den Vorgaben der Europäischen Union bis 2030 finden sich ehrgeizige Kernziele, wie zum Beispiel eine Verringerung der Treibhausgasemissionen um 40 %, ein Anteil von 32 % erneuerbarer Energien und eine Verbesserung der Energieeffizienz um 32,5 %. Angesichts der Komplexität der zu steuernden physikalischen Prozesse und der notwendigen Integration von Menschen in diese Abläufe, ist die Überwachung, Modellierung, Vorhersage und Steuerung nicht trivial.
Darüber hinaus wirft das Training universeller Vorhersagemodelle für die Entscheidungsfindung in verteilten Systemen, die auch in unterschiedlichen Szenarien und mit begrenztem Zugang zu großen historischen Datensätzen gleich gut funktionieren, mehrere Probleme auf. Darunter insbesondere das Spannungsfeld von Trainingseffizienz im Vergleich zur Modellperformanz bei Online-Transfer und verteiltem/föderiertem Lernen, wie es unter anderem in vielen Anwendungsfällen der industriellen Fertigung zu finden ist.
Sind in solchen verteilten Systemen kooperative Reaktionen und Kontrollstrategien erforderlich, können sich aufgrund der fehlenden analytischen Darstellung der gesamten (globalen) Systemdynamik zusätzliche algorithmische Herausforderungen ergeben. Beispiele dazu sind eine koordinierte Reaktion auf die Nachfrage in großen Stromnetzen, kooperative Multi-Thread-Planungsprobleme bei der Ressourcenzuteilung oder die reaktive Planung von industriellen Abläufen.
Erwartete Ergebnisse
- Framework für föderiertes Lernen in der industriellen Prozessoptimierung: Prototypisches Framework für datenschutzgerechtes föderiertes Lernen im Kontext der industriellen Prozessoptimierung. Evaluierung auf industriellen Datensätzen mit spezifischen Einschränkungen bezüglich zensierter Online-Daten.
- Neue Methoden für hierarchisches und verteiltes (Multi-Agenten) Reinforcement Learning: Methodik für hierarchisches und verteiltes Reinforcement Learning für die industrielle Prozessoptimierung, bei der übergeordnete (globale) Ziele hierarchisch in untergeordnete (lokale) Ziele zerlegt werden, sowie die Ableitung von globalen Zusicherungen hinsichtlich Performanz.
- Neue Methoden für interaktive Erklärbarkeit und die Zusammenarbeit von Menschen und Agent bei der Entscheidungsfindung: Methodik zur Verstärkung des Trainings von Deep-Learning-Netzen durch menschliches Feedback bei begrenzter Verfügbarkeit von Daten (few-shot learning) und eine Methodik zur interaktiven Erklärbarkeit durch Mensch-Agent-Interaktionen in komplexen Entscheidungsprozessen.
Fördergeber
Das Projekt wird im Rahmen von COMET – Competence Centers for Excellent Technologies durch BMK, BMAW, Land Oberösterreich und den wissenschaftlichen Partnern des SCCH gefördert. Das Programm COMET wird durch die FFG abgewickelt.
Zwick Michael
Research Team Lead Scalable Optimization and Control