Detailseite
Projekt Druckansicht

Aktives Lernen im Rahmen der Koopman Theorie

Fachliche Zuordnung Automatisierungstechnik, Mechatronik, Regelungssysteme, Intelligente Technische Systeme, Robotik
Förderung Förderung seit 2025
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 535860958
 
Dieses Projekt ist Teil der Forschungsgruppe "Aktives Lernen für dynamische Systeme und Regelung (ALeSCo) - Dateninformativität, Unsicherheiten und Garantien". Wir nutzen die "extended dynamic mode decomposition" (EDMD) im Rahmen der Koopman-Theorie, um datengetriebene Ersatzmodelle dynamischer Systeme mit Eingang zu generieren. Anschließend setzen wir die Vorhersagefähigkeit des Surrogatmodells ein, um aktives Lernen gemäß neuster Konzepte der Dateninformativität mit der modellprädiktiven Regelung (MPC) zu verzahnen. Dazu wird die Bewertung der Daten auf das Regelziel bedingt, um Exploration und Verwertung erfolgreich auszubalanzieren. Die Grundidee der Koopman-Theorie ist es, das komplexe, stark nichtlineare System zu "liften", um dessen Dynamik linear darzustellen. Da dieser Ansatz i.A. auf unendliche Dimension führt, bedarf es Techniken wie EDMD, um eine endlich dimensionale Approximation zu erhalten: Zuerst wird die Dynamik auf einen von endlich vielen Funktionen aufgespannten Teilraum eingeschränkt (Projektion), bevor ein Regressionsproblem datenbasiert gelöst wird (Schätzung). Während EDMD in der Praxis vielfach eingesetzt wird (sogar für sehr herausfordernde Anwendungen wie Molekular- und Strömungsdynamik), sind kaum Fehlerschranken in Abhängigkeit der Datenmenge vorhanden. Diese Aussage gilt insbesondere für punktweise Metriken. Genau diese Lücke konnten wir kürzlich für kernbasiertes EDMD erfolgreich schließen. Dazu war einerseits die Koopman-Invarianz des reproduzierenden Kern-Hilbertraums zu zeigen und, andererseits, der Kern geeignet zu wählen (radiale Basisfunktionen mit kompaktem Träger und frei wählbarer Glattheit). Basierend auf kürzlich erschienenen Ergebnissen bzgl. "control-Koopman operator regression" und unseren Vorarbeiten beabsichtigen wir diese gleichmäßigen Fehlerschranken auf Systeme mit Eingang zu erweitern und aufgabenspezifische Abschätzungen herzuleiten - bspw. Für die Arbeitspunktstabilisierung. Zudem gilt es Vorwissen sowie aktives Lernen in unsere prädiktiven Regelungsalgorithmen einzubauen. Dazu nutzen wir informationstheoretische Konzepte wie Dateninformativität und entwickeln maßgeschneiderte "persistency of excitation"-Ansätze. Zudem setzen wir bikriterielle Optimalsteuerungsprobleme auf, um den Tradeoff zwischen Exploration und Verwertung geeignet aufzulösen. Wir setzen dazu aufgabenspezifische adaptive Verfeinerungen, konsistente Projektoren und diffusionsbasierte Exploration ein, um aktives Lernen effizient zu gestalten und die Geometrie der Messdaten adäquat zu berücksichtigen. Im Projektverlauf wenden wir die entwickelten Algorithmen auf zwei exemplarisch ausgewählte Anwendungen an (Robotik und Energiesysteme), um die informationstheoretischen Gütemaße wie Dateninformativität sowie die daraus abgeleiteten Ansätze für aktives Lernen zu validieren. Schlussendlich entwickeln wir ein innovatives, aktiv lernendes MPC Schema im Rahmen der Koopman-Theorie.
DFG-Verfahren Forschungsgruppen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung