Inverse Dynamische Spiele in der Regelungstechnik
Zusammenfassung der Projektergebnisse
Schon heute interagieren hochautomatisierte Systeme zunehmend miteinander und mit dem Menschen. So transportieren beispielsweise autonome Roboterplattformen Waren in Lagerhallen, in denen Menschen und andere von Menschen gesteuerte Fahrzeuge anwesend sind. Weitere Beispiele sind gemischte Verkehrsszenarien mit autonomen Fahrzeugen und Fahrzeugen mit menschlichen Fahrern oder physisch gekoppelte Shared-Control-Systeme für die Teleoperation. In derartigen Szenarien treten naturgemäß Konflikte zwischen den Partnern auf und die Theorie der dynamischen Spiele (DG) (gekoppelte dynamische Optimierungsprobleme) ist vielversprechend, um diese zu lösen und Gleichgewichtslösungen zwischen den Partnern zu realisieren. Dafür müssen jedoch die Kostenfunktionen, d.h. die Optimierungskriterien, aller Partner/Spieler bekannt sein. Da dies typischerweise nicht der Fall ist, z.B. ist die menschliche Kostenfunktion immer unbekannt, werden sogenannte Inverse-Dynamic-Game-(IDG)-Methoden benötigt, die die Kostenfunktionen aus Messdaten ableiten. Dieses inverse Problem dynamischer Spiele war vor diesem Projekt nur unzureichend erforscht und die einzigen existierenden Methoden wiesen hohe Rechenzeiten auf. Während des Projekts wurde zunächst eine formale Problemdefinition aufgestellt und mehrere recheneffiziente Methoden zur Lösung entwickelt, die sogar die Identifikation der Kostenfunktionen in Echtzeit ermöglichen. Darüber hinaus erfolgte eine theoretische Analyse aller entwickelten Methoden, die u.a. die Mehrdeutigkeit des IDG-Problems behandelt, indem eine Menge aller möglichen Kostenfunktionskombinationen formuliert wird, die in der Lage sind, die Messdaten zu erklären und somit das Verhalten der Spieler widerzuspiegeln. Schließlich wurde die Anwendung der neu entwickelten Methoden auf reale Daten untersucht. Hier wurden Bedingungen aufgestellt, wann die neu entwickelten Methoden angewandt werden können. Als Anwendungsbeispiel wurde untersucht, ob ein DG ein allgemeingültiges Modell für Multi-Agent-Collision-Avoidance-Szenarien mehrerer Roboterplattformen darstellt, die von Menschen oder autonom gesteuert werden. Das Praxisbeispiel verdeutlichte zum einen die Notwendigkeit, die zuvor beschriebenen Bedingungen für die Anwendbarkeit der neu entwickelten Methoden zu berücksichtigen. Andererseits zeigte sich, dass ein DG-Modell zwar vielversprechend ist, um in Zukunft das Kollisionsvermeidungsverhalten zwischen Menschen zu beschreiben, es jedoch nicht allgemeingültig ist. Szenarien, in denen die Roboter durch beliebige Automatisierungsalgorithmen gesteuert werden, konnten nicht durch ein DG beschrieben werden und somit auch nicht identifiziert werden.
Projektbezogene Publikationen (Auswahl)
-
Solution Sets for Inverse Non-Cooperative Linear-Quadratic Differential Games. IEEE Control Systems Letters, 3(4), 871-876.
Inga, Jairo; Bischoff, Esther; Molloy, Timothy L.; Flad, Michael & Hohmann, Soren
-
Validation of a Human Cooperative Steering Behavior Model Based on Differential Games. 2019 IEEE International Conference on Systems, Man and Cybernetics (SMC), 3124-3129. IEEE.
Inga, Jairo; Flad, Michael & Hohmann, Soren
-
Inverse Open-Loop Noncooperative Differential Games and Inverse Optimal Control. IEEE Transactions on Automatic Control, 65(2), 897-904.
Molloy, Timothy L.; Inga, Jairo; Flad, Michael; Ford, Jason J.; Perez, Tristan & Hohmann, Soren
-
“Inverse Dynamic Games Based on Maximum Entropy Inverse Reinforcement Learning”
J. Inga, E. Bischoff, F. Köpf & S. Hohmann
-
“Online Inverse Linear-Quadratic Differential Games Applied to Human Behavior Identification in Shared Control”, Proceedings of the European Control Conference, 2021.
J. Inga, A. Creutz & S. Hohmann
-
Inverse Noncooperative Dynamic Games. Communications and Control Engineering, 143-187. Springer International Publishing.
Molloy, Timothy L.; Inga, Charaja Jairo; Hohmann, Sören & Perez, Tristan
-
Inverse Stochastic Optimal Control for Linear-Quadratic Gaussian and Linear-Quadratic Sensorimotor Control Models. 2022 IEEE 61st Conference on Decision and Control (CDC), 2801-2808. IEEE.
Karg, Philipp; Stoll, Simon; Rothfus, Simon & Hohmann, Soren
-
Excitation for Adaptive Optimal Control of Nonlinear Systems in Differential Games. IEEE Transactions on Automatic Control, 68(1), 596-603.
Karg, Philipp; Kopf, Florian; Braun, Christian A. & Hohmann, Soren
-
“Inverse Dynamic Optimization and its Application to Human-Machine Systems”, Workshop of the VDI/VDE-GMA FA 2.15, 2023.
P. Karg & S. Hohmann
-
Trustworthiness of Optimality Condition Violation in Inverse Dynamic Game Methods Based on the Minimum Principle. 2024 IEEE Conference on Control Technology and Applications (CCTA), 824-831. IEEE.
Karg, Philipp; Kienzle, Adrian; Kaub, Jonas; Varga, Balint & Hohmann, Sören
