Analyse und Verbesserung der Generalisierung von Vision-Language-Action-Modellen

Antragsteller Dr.-Ing. Max Argus

Fachliche Zuordnung Künstliche Intelligenz und Maschinelle Lernverfahren
Automatisierungstechnik, Mechatronik, Regelungssysteme, Intelligente Technische Systeme, Robotik

Förderung Förderung seit 2025

Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 559307072

Projektbeschreibung

Große Sprachmodelle sind äußerst beliebt, da sie in der Lage sind, eine Vielzahl von Aufgaben direkt auszuführen oder, für ungewöhnlichere Aufgaben, mit nur wenigen Beispielen im Kontext zu arbeiten. In Zukunft möchten wir, dass robotische Modelle ähnlich intuitiv und einfach zu verwenden sind. Vision-Action-Language-Modelle (VLA) sind ein aktuelles Forschungsgebiet in der Robotik, um dies zu erreichen. Unser übergeordnetes Ziel in diesem Projekt ist es, diese Modelle zu verbessern. Es gibt drei Ziele, die wir verfolgen möchten, um dieses Ziel zu erreichen: die Verbesserung der Generalisierungsfähigkeit auf neue Roboter, die Verbesserung der Interpretation von Vision-Action-Language-Modellen und das Training von VLA-Modellen für die Nachahmung anhand von Demonstrationsvideos.

DFG-Verfahren Stipendium

Internationaler Bezug USA

Gastgeberin Professorin Jeannette Bohg, Ph.D.

Servicenavigation

Hauptnavigation

Analyse und Verbesserung der Generalisierung von Vision-Language-Action-Modellen

Zusatzinformationen

Servicenavigation

Hauptnavigation

Analyse und Verbesserung der Generalisierung von Vision-Language-Action-Modellen

Zusatzinformationen

Textvergrößerung und Kontrastanpassung