Aktives Lernen im Rahmen der Koopman Theorie

Antragsteller Professor Dr. Karl Worthmann

Fachliche Zuordnung Automatisierungstechnik, Mechatronik, Regelungssysteme, Intelligente Technische Systeme, Robotik

Förderung Förderung seit 2025

Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 535860958

Projektbeschreibung

Dieses Projekt ist Teil der Forschungsgruppe "Aktives Lernen für dynamische Systeme und Regelung (ALeSCo) - Dateninformativität, Unsicherheiten und Garantien". Wir nutzen die "extended dynamic mode decomposition" (EDMD) im Rahmen der Koopman-Theorie, um datengetriebene Ersatzmodelle dynamischer Systeme mit Eingang zu generieren. Anschließend setzen wir die Vorhersagefähigkeit des Surrogatmodells ein, um aktives Lernen gemäß neuster Konzepte der Dateninformativität mit der modellprädiktiven Regelung (MPC) zu verzahnen. Dazu wird die Bewertung der Daten auf das Regelziel bedingt, um Exploration und Verwertung erfolgreich auszubalanzieren. Die Grundidee der Koopman-Theorie ist es, das komplexe, stark nichtlineare System zu "liften", um dessen Dynamik linear darzustellen. Da dieser Ansatz i.A. auf unendliche Dimension führt, bedarf es Techniken wie EDMD, um eine endlich dimensionale Approximation zu erhalten: Zuerst wird die Dynamik auf einen von endlich vielen Funktionen aufgespannten Teilraum eingeschränkt (Projektion), bevor ein Regressionsproblem datenbasiert gelöst wird (Schätzung). Während EDMD in der Praxis vielfach eingesetzt wird (sogar für sehr herausfordernde Anwendungen wie Molekular- und Strömungsdynamik), sind kaum Fehlerschranken in Abhängigkeit der Datenmenge vorhanden. Diese Aussage gilt insbesondere für punktweise Metriken. Genau diese Lücke konnten wir kürzlich für kernbasiertes EDMD erfolgreich schließen. Dazu war einerseits die Koopman-Invarianz des reproduzierenden Kern-Hilbertraums zu zeigen und, andererseits, der Kern geeignet zu wählen (radiale Basisfunktionen mit kompaktem Träger und frei wählbarer Glattheit). Basierend auf kürzlich erschienenen Ergebnissen bzgl. "control-Koopman operator regression" und unseren Vorarbeiten beabsichtigen wir diese gleichmäßigen Fehlerschranken auf Systeme mit Eingang zu erweitern und aufgabenspezifische Abschätzungen herzuleiten - bspw. Für die Arbeitspunktstabilisierung. Zudem gilt es Vorwissen sowie aktives Lernen in unsere prädiktiven Regelungsalgorithmen einzubauen. Dazu nutzen wir informationstheoretische Konzepte wie Dateninformativität und entwickeln maßgeschneiderte "persistency of excitation"-Ansätze. Zudem setzen wir bikriterielle Optimalsteuerungsprobleme auf, um den Tradeoff zwischen Exploration und Verwertung geeignet aufzulösen. Wir setzen dazu aufgabenspezifische adaptive Verfeinerungen, konsistente Projektoren und diffusionsbasierte Exploration ein, um aktives Lernen effizient zu gestalten und die Geometrie der Messdaten adäquat zu berücksichtigen. Im Projektverlauf wenden wir die entwickelten Algorithmen auf zwei exemplarisch ausgewählte Anwendungen an (Robotik und Energiesysteme), um die informationstheoretischen Gütemaße wie Dateninformativität sowie die daraus abgeleiteten Ansätze für aktives Lernen zu validieren. Schlussendlich entwickeln wir ein innovatives, aktiv lernendes MPC Schema im Rahmen der Koopman-Theorie.

DFG-Verfahren Forschungsgruppen

Teilprojekt zu FOR 5785: Aktives Lernen für dynamische Systeme und Regelung - Dateninformativität, Unsicherheiten und Garantien

Servicenavigation

Hauptnavigation

Aktives Lernen im Rahmen der Koopman Theorie

Zusatzinformationen

Servicenavigation

Hauptnavigation

Aktives Lernen im Rahmen der Koopman Theorie

Zusatzinformationen

Textvergrößerung und Kontrastanpassung