Detailseite
Projekt Druckansicht

Maschinelles Lernen für Probleme in der Robotik

Fachliche Zuordnung Automatisierungstechnik, Mechatronik, Regelungssysteme, Intelligente Technische Systeme, Robotik
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung Förderung von 2017 bis 2024
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 329426068
 
Dieses Projekt wird Robotik-spezifische Methoden des Maschinellen Lernens entwickeln, die Robotern ermöglichen komplexes Verhalten effizient zu lernen. Die Notwendigkeit solcher Methoden ergibt sich direkt aus den No-Free-Lunch-Theoremen (Wolpert, 1996), die beweisen, dass keine Machinelle-Lern-Methode besser als bloßes Raten funktioniert, wenn man über alle möglichen Probleme mittelt. Die einzige Möglichkeit besser als Raten zu sein, ist es den Raum der betrachteten Probleme einzuschränken und Vorwissen über diesen Raum beim Lernen zu nutzen.Natürlich gibt es Methoden des Maschinellen Lernens die auf eine große Menge von Echtwelt-Problemen anwendbar sind und nur recht generelle Vorannahmen haben. Jedoch benötigen diese Methoden großen Datenmengen, selbst zum Lösen relativ einfacher Probleme. Das Gesamtproblem der Robotik -- das Lernen von Verhalten, d.h. einer Abbildung von einer Sequenz von Sensorsignalen zu einer Sequenz von Motorsignalen, auf Basis von nur lückenhaften Rückmeldungen -- ist zu komplex um mit generischen Machinellen-Lern-Methoden und realistischen Datenmengen gelöst werden zu können. Andere Ansätze vermeiden dieses Problem, indem sie problemspezifische Vorannahmen nutzen, z.B. durch Verwendung bestimmter Features und Repräsentationen die auf das aktuelle Problem zugeschnitten sind. Diese Ansätze generalisieren jedoch nicht.Dieses Projekt schlägt einen Kompromiss zwischen generischen und problemspezifischen Ansätzen zum Lernen von Roboter-Verhalten vor. Die Idee ist es, Robotik-spezifische Vorannahmen in das Lernen zu integrieren. Das Umsetzen dieser Idee erfordert zwei Schritte: a) das Entdecken Robotik-spezifischer Vorannahmen und b) das Integrieren dieser Vorannahmen in Methoden des Maschinellen Lernens. Wir können entsprechende Vorannahmen entdecken, wenn wir die inhärente Struktur der Roboter-Echtwelt-Interaktion betrachten (z.B. Physik, Embodiment, Objekte). Um solche Vorannahmen zu nutzen, werden wir diese zu internen Zustandsrepräsentationen, das sind Zwischenergebnisse der Abbildung von Sensorsignal zu Motorsignal, in Bezug setzen. Genau genommen fließen diese Vorannahmen ein, indem wir i) das Lernziel definieren und ii) den Hypothesenraum einschränken. Unsere Arbeit wird den Bedarf von händischem "Feature-Engineering" eliminieren und gleichzeitig die Menge der benötigten Daten reduzieren. Als Konsequenz wird das Projekt Robotern ermöglichen autonom komplexe Verhalten direkt von Sensorsignalen zu lernen.Wir haben bereits weitreichende Vorarbeiten durchgeführt, die sowohl die Umsetzbarkeit dieses Ansatzes, als auch sein Potential gezeigt haben. Dieses Projekt wird die Idee weiter ausbauen durch:1) "online" Lernen während der Interaktion2) Lösen von partiell beobachtbaren Problemen (POMDPs) durch das Lernen rekursiver Zustandsschätzer3) Lernen von strukturierten Zustandsrepräsentationen um bestärkendes Lernen effektiver zu machen4) inkrementelles Lernen von Zustandsrepräsentationen für mehrerer Probleme
DFG-Verfahren Sachbeihilfen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung