Detailseite
Analyse und Verbesserung der Generalisierung von Vision-Language-Action-Modellen
Antragsteller
Dr.-Ing. Max Argus
Fachliche Zuordnung
Künstliche Intelligenz und Maschinelle Lernverfahren
Automatisierungstechnik, Mechatronik, Regelungssysteme, Intelligente Technische Systeme, Robotik
Automatisierungstechnik, Mechatronik, Regelungssysteme, Intelligente Technische Systeme, Robotik
Förderung
Förderung seit 2025
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 559307072
Große Sprachmodelle sind äußerst beliebt, da sie in der Lage sind, eine Vielzahl von Aufgaben direkt auszuführen oder, für ungewöhnlichere Aufgaben, mit nur wenigen Beispielen im Kontext zu arbeiten. In Zukunft möchten wir, dass robotische Modelle ähnlich intuitiv und einfach zu verwenden sind. Vision-Action-Language-Modelle (VLA) sind ein aktuelles Forschungsgebiet in der Robotik, um dies zu erreichen. Unser übergeordnetes Ziel in diesem Projekt ist es, diese Modelle zu verbessern. Es gibt drei Ziele, die wir verfolgen möchten, um dieses Ziel zu erreichen: die Verbesserung der Generalisierungsfähigkeit auf neue Roboter, die Verbesserung der Interpretation von Vision-Action-Language-Modellen und das Training von VLA-Modellen für die Nachahmung anhand von Demonstrationsvideos.
DFG-Verfahren
WBP Stipendium
Internationaler Bezug
USA
Gastgeberin
Professorin Jeannette Bohg, Ph.D.
