Detailseite
Visuelle fein-granulare Erkennung von Objekten
Antragsteller
Professor Dr.-Ing. Joachim Denzler, seit 1/2017
Fachliche Zuordnung
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung
Förderung von 2015 bis 2020
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 275610656
Wie lassen sich automatisch mit Methoden der Bildverarbeitung und des maschinellen Lernens die visuellen Unterschiede zwischen verschiedenen Vogelarten erlernen?Aus welchen Objektteilen besteht ein Objekt und wie lassen sich diese aus einer Menge von unbeschrifteten Bildern ermitteln?Wie kann ich diese Objektteile bei gegebenen Beschriftungen oder komplett neuen Lerndaten automatisch adaptieren und bezüglich eines Lernzieles optimieren?Ziel des Projektes ist die Beantwortung dieser Fragen durch die Entwicklung von neuen Lern- und Erkennungsalgorithmen.Die Forschung im Bereich der visuellen Erkennung hat sich in den letzten 10 Jahren hauptsächlich auf zwei Bereiche konzentriert: (a) Erkennung von Basis-Objektkategorien, charakterisiert durch eine hohe Variation innerhalb der Klasse aber auch durch große Unterschiede zwischen den Klassen, und (b) Erkennung von einzelnen Objektinstanzen, wobei eine Klasse unterschiedliche Aufnahmen des gleichen 3D-Objektes repräsentiert. Im Gegensatz dazu beschäftigt sich das beantragte Projekt mit der visuellen Erkennung von Objekten mit sehr feingranularen Unterschieden, eine Aufgabenstellung welche sich zwischen den obigen beiden Extremen bewegt. Obwohl die Verfahren in allen drei Gebieten oft sehr unterschiedlich ausfallen und motiviert sind, nutzen alle direkt oder indirekt eine Repräsentation von Objekten als Konstellation von Objektteilen und lokalen Merkmalen. Die Unterschiede der drei Aufgabenstellungen liegen hauptsächlich in der unterschiedlichen Variabilität in den Lerndaten begründet, sowohl bei der Variabilität der Erscheinung von Objektteilen sowie bei der Variabilität in der geometrischen Anordnung.Im Projekt werden wir daher sehr allgemeine Modelle sowie Lernverfahren entwickeln, welche es ermöglichen Objekte als Konstellationen von Objektteilen zu repräsentieren. Dabei soll ein großer Teil der notwendigen Flexibilität der Modelle aus den Lerndaten zu gewonnen. Die neuen Verfahren sollen damit die Brücke zwischen der Kategorieerkennung, feingranularen Erkennung und der Instanzerkennung schlagen. Die konkreten Ziele des Projektes sind: 1. Unüberwachtes Lernen von Objektteilen und deren Konstellationen,2. Bestimmung von "lokalen" Modellen spezifisch für jedes Testbeispiel,3. Adaption von Objektteil- und Klassifikationsmodellen bei gegebenen neuen Lerndaten und Aufgabenstellungen.Die im Projekt entwickelten Algorithmen werden für zahlreiche Anwendungen und andere Forschungsgebiete wichtig sein. Dazu zählen zum Beispiel Klassifikationsaufgaben in der medizinischen Bildverarbeitung (z.B. Erkennung von unterschiedlichen Gewebetypen), in der Robotik (z.B. Erkennung von Objekten in unterschiedlichen Szenen) oder bei biologischen Daten (z.B. automatische Unterscheidung und Analyse von unterschiedlichen Spezies).
DFG-Verfahren
Sachbeihilfen
Ehemaliger Antragsteller
Professor Dr. Erik Rodner, bis 12/2016