Detailseite
Inhaltsbasierte Bildsuche in sehr großen, realen Bilddatenbanken mittels stochastischer Lernalgorithmen
Antragsteller
Professor Dr. Rainer Lienhart
Fachliche Zuordnung
Sicherheit und Verlässlichkeit, Betriebs-, Kommunikations- und verteilte Systeme
Förderung
Förderung von 2008 bis 2013
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 77698382
Ziel des beantragten Projektes ist es, die inhaltsbasierte Bildsuche auf und insbesondere durch die Ausnutzung riesiger öffentlicher Bilddatenbanken wie Flickr™ mit über drei Milliarden Bildern (Stand Juli 2009) wesentlich weiterzuentwickeln. Derartig große und von Benutzern teilweise annotierte Bilddatenbanken des Webs 2.0 ermöglichen neue Verfahren zum Erlernen von statistischen Modellen des Bildinhaltes. In Verbindung mit vollautomatischen Lernalgorithmen können diese Modelle erstmals eine funktionierende allgemeine Bildsuche ermöglichen. Die erlernten Modelle lassen sich dann auch erfolgreich auf kleinere Bilddatenbanken anwenden. Ein besonderer Schwerpunkt des Projektes liegt auf der Modellierung der Bilddaten durch syntaktisch wie inhaltlich sehr verschiedene Merkmale. Ziel der Modellierung ist es, eine geeignete (hierarchische) Repräsentation der Bilder für die effiziente Suche zu finden. Eine adäquate Modellierung soll mittels wahrscheinlichkeitstheoretischer Lernalgorithmen unter Ausnutzung aller in der Bilddatenbank vorhandenen Informationen erfolgen. Neben den reinen Bilddaten sind dies von Nutzern eingegebene Metadaten wie Titel, Stichworte oder der Ort der Aufnahme. Sie stehen für eine große Untermenge der Bilder zur Verfügung und sollen auf nicht annotierte Bilder automatisch mittels geeigneter Algorithmen übertragen werden. Wegen der schieren Größe der geplanten „echten“ Bilddatenbank (zwischen 10-100 Millionen Bildern), bildet die Erforschung und algorithmische Untersuchung der Skalierbarkeit dieser Verfahren einen zweiten Schwerpunkt.
DFG-Verfahren
Sachbeihilfen