Detailseite
Exakte Szenenrekonstruktion aus extrem großen Bildmengen
Antragsteller
Professor Dr.-Ing. Michael Goesele
Fachliche Zuordnung
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung
Förderung von 2009 bis 2016
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 110161085
Im Internet finden sich Tausende oder gar Millionen von Bildern von fast allen wichtigen und interessanten Orten der Welt. Allein das Photosharing-Portal Flickr verfügt über mehr als 2 Milliarden Bilder. Diese Bilder in sogenannten Community Photo Collections [GSC+07] sind von einer Vielzahl an Fotografen mit den unterschiedlichsten, unkalibrierten Kameras aufgenommen worden, wodurch sie sich sehr in Auflösung, Beleuchtung, Wetter, Aufnahmezeitpunkt und anderen Aspekten unterscheiden. Weiterhin sind Teile der Szene in diesen Bildern oft durch Touristen, Autos oder andere Gegenstände verdeckt. Dieser riesige Schatz an Bildern wird bisher kaum zur Rekonstruktion von Szenen mittels Techniken aus der Computergrafik und Computer Vision verwendet. Der Hauptgrund dafür ist, dass die meisten aktuellen Verfahren nicht mit diesen realen, nicht unter Laborbedingungen aufgenommenen Bilder umgehen können. Der Antragsteller hat in einer ersten Arbeit [GSC+07] jedoch gezeigt, dass aktuelle Registrierungs- und Multi-View Stereo-Rekonstruktionsverfahren robust und mächtig genug sind, um gute Geometriemodelle aus Community Photo Collections zu rekonstruieren. Darauf aufbauend verfolgt dieser Antrag mehrere Ziele: Zum einen sollen umfassende Modelle (einschließlich Geometrie und Reflexionseigenschaften) aus Tausenden und Millionen von Bildern rekonstruiert werden. Zum anderen sollen fundamental neue Fragenstellungen, die sich durch die Natur der Eingabedaten ergeben, untersucht und gelöst werden. Dazu gehören zum Beispiel die Geometrierekonstruktion aus Bildern auf verschiedenen Größenskalen oder die inkrementelle Rekonstruktion einer Szene aus Millionen von Eingabebildern. Es ist zu erwarten, dass die theoretischen und praktischen Ergebnisse dieses Forschungsprojekts nicht nur für Community Photo Collections von Bedeutung sind, sondern auch einen signifikanten Einfluss auf traditionelle, auf Standardeingabedaten beruhende Verfahren haben werden. Die Vision hinter diesem Projekt ist letztlich, realistische Modelle einer Szene aus beliebigen Eingabedaten erzeugen zu können.
DFG-Verfahren
Emmy Noether-Nachwuchsgruppen