Detailseite
Efficiently adaptable and efficiently indexable visual bundle features for image region search and mining in image databases
Antragsteller
Professor Dr. Rainer Lienhart
Fachliche Zuordnung
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Theoretische Informatik
Theoretische Informatik
Förderung
Förderung von 2012 bis 2015
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 218154315
Vergangene und aktuelle inhaltsbasierte Bildsuchsysteme nutzen meist fest voreingestellte Merkmale, Parameter und Distanzmaße. Sie legen damit ein starres Kriterium für die Ähnlichkeit fest. Die Erfahrung zeigt jedoch, dass die erwartete Ähnlichkeit eines normalen, durchschnittlichen Nutzers bei einer Suche mittels Beispielbild oder Beispielbildregion vom Bildinhalt der Anfrage selbst abhängt. Es ist daher wichtig, die Suche an den allgemeinen Kontext der Anfrage (Suche nach „Szenen“, „Wahrzeichen“, „Menschen“, „starre Objekte", etc.) anzupassen, ohne gleichzeitig eine Vielzahl unterschiedlicher Merkmale in zahlreichen separaten Indizes zu benötigen. Dieses Projekt entwickelt eine neue Art von Regionenmerkmalen für die inhaltsbasierte Bildsuche. Dabei werden mehrere lokale Merkmale in einer Regionenrepräsentation gebündelt. Im Gegensatz zu existierenden Ansätzen untersucht dieses Projekt Repräsentationen, die auf zwei verschiedene Arten angepasst werden können. Sowohl die visuelle Beschreibung einzelner Merkmale als auch die Codierung der räumlichen Lage untereinander kann von einer strikten bis hin zu einer groben Beschreibung variiert werden. Hierbei sollen die Merkmale mit unterschiedlicher Striktheit ohne Neuberechnung aus dem Bild aus einer einzigen Quellrepräsentation abgeleitet werden können. Analog soll auch die Indexstruktur eine Ähnlichkeitssuche mit variierbarer Striktheit unterstützen, ohne Daten mehrfach zu speichern. Schlussendlich soll dieses Projekt zeigen, dass eine an den Bildinhalt anpassbare visuelle Beschreibung die allgemeine Bildsuche verbessert und die optimale Konfiguration der Beschreibung anhand einer kleinen Menge an Trainingsdaten pro allgemeinem Kontext vorab gelernt werden kann.
DFG-Verfahren
Sachbeihilfen