Detailseite
Operator Learning für Optimalsteuerung: Approximation und Statistische Theorie
Antragstellerinnen / Antragsteller
Dr. Evelyn Herberg; Professor Dr. Sven Wang; Professor Dr. Jakob Zech
Fachliche Zuordnung
Mathematik
Förderung
Förderung seit 2024
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 543965776
Dieser Antrag konzentriert sich auf die Entwicklung einer umfassenden Konvergenzanalyse für 'Operator-Learning', eine aufkommende Methode, die für die effiziente Annäherung von Daten-zu-Lösungs-Abbildungen bei parameterabhängigen partiellen Differentialgleichungen (PDEs) eingesetzt wird. Als Anwendung betrachten wir die Lösung von Optimalsteuerungsproblemen, die typischerweise auf sequentielle, kostspielige numerische PDE-Lösungen angewiesen sind. Zu diesem Zweck führen wir eine vollständige Fehleranalyse durch, die darauf abzielt, den 'Bias-Variance-Tradeoff' zu analysieren und den sogenannten 'Fluch der Dimensionalität' durch die Auswahl geeigneter Netzwerkarchitekturen zu vermeiden. Darüber hinaus werden die gewonnenen Erkenntnisse auch für Problemstellungen im Bereich der Unsicherheitsquantifizierung und der Parameterschätzung Anwendung finden. Das Projekt wird sich mit der Entwicklung geeigneter Netzwerkarchitekturen befassen, wobei der Schwerpunkt auf deren Expressivität und Fehleranalyse liegt. Aufbauend auf diesen Ergebnissen werden wir zudem eine statistische Analyse für den empirischen Risikominimierer durchführen. Dieses Projekt wird somit klassische Resultate aus der Regressionsanalyse auf nichtlineare Abbildungen zwischen unendlich dimensionalen Räumen erweitern. Wichtige Hilfsmittel zur Erreichung dieser Ziele sind die Nutzung niedrigdimensionaler Strukturen, die sich aus der bekannten hohen Regularität von Parameter-zu-Lösungs-Abbildungen ergeben, sowie die Auftrennung der In- und Outputs des Operators in wichtige niederfrequente und weniger wichtige hochfrequente Teile. Dies wird durch eine so genannte Encoder/Decoder-Architektur erreicht, die es ermöglicht, In- und Outputs in stabilen Darstellungssystemen wie Wavelets darzustellen. Der praktische Aspekt des Projekts besteht in der Integration von Operator Learning Modellen in Optimierungsalgorithmen, um den Rechenaufwand für die Lösung von PDE-beschränkten Optimalsteuerungsproblemen erheblich zu verringern.
DFG-Verfahren
Schwerpunktprogramme
Teilprojekt zu
SPP 2298:
Theoretische Grundlagen von Deep Learning