Detailseite
Projekt Druckansicht

Analyse und Verbesserung der Generalisierung von Vision-Language-Action-Modellen

Antragsteller Dr.-Ing. Max Argus
Fachliche Zuordnung Künstliche Intelligenz und Maschinelle Lernverfahren
Automatisierungstechnik, Mechatronik, Regelungssysteme, Intelligente Technische Systeme, Robotik
Förderung Förderung seit 2025
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 559307072
 
Große Sprachmodelle sind äußerst beliebt, da sie in der Lage sind, eine Vielzahl von Aufgaben direkt auszuführen oder, für ungewöhnlichere Aufgaben, mit nur wenigen Beispielen im Kontext zu arbeiten. In Zukunft möchten wir, dass robotische Modelle ähnlich intuitiv und einfach zu verwenden sind. Vision-Action-Language-Modelle (VLA) sind ein aktuelles Forschungsgebiet in der Robotik, um dies zu erreichen. Unser übergeordnetes Ziel in diesem Projekt ist es, diese Modelle zu verbessern. Es gibt drei Ziele, die wir verfolgen möchten, um dieses Ziel zu erreichen: die Verbesserung der Generalisierungsfähigkeit auf neue Roboter, die Verbesserung der Interpretation von Vision-Action-Language-Modellen und das Training von VLA-Modellen für die Nachahmung anhand von Demonstrationsvideos.
DFG-Verfahren WBP Stipendium
Internationaler Bezug USA
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung