Detailseite
Projekt Druckansicht

Inkrementelles Lernen von Objektkategorien

Fachliche Zuordnung Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung Förderung von 2014 bis 2018
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 245070555
 
Die automatische Erkennung von Objekten in komplexen visuellen Szenen ist international immer noch eines der aktivsten Forschungsgebiete im Bereich der Bildverarbeitung. Die meisten der heutigen Arbeiten liefern jedoch nur Lösungen für ein klar definiertes Anwendungsszenario mit einer festen Anzahl an Objektklassen (derzeit zwischen 100 und 1000). Das beantrage Forschungsprojekt geht über diese Grenzen von statischen Systemen hinaus, indem Methoden entwickelt werden sollen, welche ausgehend von einer initialen Stichprobe mit bekannten Objekten inkrementell ihr Wissen erweitern. Anfänglich unbekannte Objektkategorien werden erst dadurch über die Zeit hinweg adäquat repräsentiert und erkannt. Dies ist insbesondere in Zeiten von frei verfügbaren Internetdatenbanken wie Flickr mit einer täglich zunehmenden Anzahl von Bildern von enormer Bedeutung. Langfristig soll mit dem beantragten Projekt die Lücke zwischen menschlichem und maschinellem Sehen verringert werden, sodass Systeme in der Lage sind, auch neue, unbekannte Objekte zu erkennen und diese der aktuellen Datenbasis (halb-)überwacht hinzuzufügen. Dabei wird es erforderlich sein, die interne Repräsentation von Objekten dynamisch anzupassen, um eine hohe Trennbarkeit selbst im Fall von Tausenden zu unterscheidender Objektkategorien sicherzustellen. Thematische Schwerpunkte in der ersten Projektphase sind daher die Detektion von unbekannten Objekten (bekannt als out-of-vocabulary-Detektion in der Spracherkennung) sowie das Lernen aus wenigen Beispielen (notwendig für die robuste Beschreibung einer neu detektierten Kategorie). Zusätzlich gilt es inbesondere Techniken zur dynamischen Aktualisierung der Repräsentation - sowohl auf Modellebene als auch auf Merkmalsebene - zu untersuchen, um eine große Anzahl von Kategorien und Trainingsbilder handhaben zu können und gleichzeitig ein Von-Grund-auf-Lernen bei Hinzunahme einer neuen Kategorie zu vermeiden. Darüber hinaus sollen Verfahren aus dem Bereich des Aktiven Lernens betrachtet werden, um die Relevanz von neuen Beispielen sicherzustellen. Als zusätzlichen, aber nicht weniger wichtigen Beitrag schlagen wir die Erstellung standardisierter Datensätze und Verfahren zur Evaluierung von inkrementell lernenden Verfahren vor und stellen die Ergebnisse am Ende der Gemeinschaft zur Verfügung. Als finales Anwendungsszenario der entwickelten Methoden greifen wir auf ein autonomes, mobiles System zurück, welches seine Umgebung erkundet und dabei schrittweise den Aufbau einer Wissensbasis durch Exploration seiner Umgebung vornimmt. Langfristig soll das beantragte Projekt Methoden hervorbringen, mit denen sich Systeme an die täglich ändernde Umwelt anpassen können und über die Zeit hinweg ihr verfügbares Wissen erweitern und aktualisieren.
DFG-Verfahren Sachbeihilfen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung