Detailseite
Projekt Druckansicht

Automatische 3D Rekonstruktion komplexer Straßenkreuzungen aus Luftbildsequenzen durch semantische Modellierung von statischen und bewegten Kontextobjekten

Fachliche Zuordnung Geodäsie, Photogrammetrie, Fernerkundung, Geoinformatik, Kartographie
Förderung Förderung von 2010 bis 2015
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 186143973
 
Erstellungsjahr 2016

Zusammenfassung der Projektergebnisse

Das Ziel dieses Projekts bestand in der Entwicklung von Methoden zur automatischen Klassifizierung von Luftbildern von Kreuzungen, um die darin abgebildeten Objekte erkennen und auch Rückschlüsse auf die möglicherweise verdeckten Straßenoberflächen ziehen zu können. Letzteres sollte vor allem dazu dienen, bessere Voraussetzungen zur automatischen Erkennung von Straßen zu liefern, weil existierende Verfahren zur Straßendetektion mit Verdeckungen bzw. generell im Kreuzungsbereich mit Problemen konfrontiert sind. Solche Straßenextraktionsalgorithmen sind z.B. für die Neuerfassung oder Aktualisierung von Straßendatenbanken für Navigationssysteme von Interesse. Unter den extrahierten Objekten sind vor allem Fahrzeuge für Anwendungen wie z.B. die Verkehrsüberwachung interessant. Da sich die Erkennung von Straßenoberflächen bzw. von Fahrzeugen gegenseitig bedingen, wurde eine gemeinsame Behandlung dieser beiden Probleme angestrebt. In Hinblick auf die Klassifizierung standen dabei die Berücksichtigung von Kontext und die explizite Modellierung von Verdeckungen in einem einheitlichen Ansatz im Vordergrund. Es konnte ein statistischer Ansatz entwickelt werden, bei dem die vertikale Struktur einer Szene modelliert wurde. Von einer „Basis-Ebene“, welche den potentiell durch andere Objekte verdeckten Objektarten wie z.B. Gebäude und (vor alle) Straßenoberflächen entspricht, wird eine „Verdeckungs-Ebene“ unterschieden, welche die Objektarten der Basis-Ebene potentiell verdeckende Objekte wie z.B. Bäume oder Fahrzeuge enthält. Dabei wird auch berücksichtigt, dass in vielen Fällen keine Verdeckung vorliegt, die Verdeckungs-Ebene also „leer“ ist. Anhand von aus Bilddaten abgeleiteten Merkmalen wird für jedes Pixel eine Objektzugehörigkeit für beide Ebenen simultan bestimmt, wobei einerseits die beiden Ebenen mit einander verknüpft werden, indem z.B. mit Hilfe von Klassifikationsverfahren Wahrscheinlichkeiten dafür, dass an einem Pixel eine Straßenoberfläche, die von einem Fahrzeug verdeckt wird, abgeleitet wird. Gelichzeitig wird bei der Klassifikation Kontext berücksichtigt, indem davon ausgegangen wird, dass Objekte üblicherweise eine im Vergleich zur Bildauflösung große Ausdehnung haben, sodass benachbarte Pixel wahrscheinlich nur dann zu unterschiedlichen Objektarten gehören, wenn die dort beobachtbaren Daten unterschiedlich sind. Alle diese Modelle werden in einem neuartigen statistischen Ansatz vereinigt und zur simultanen Bestimmung der Objektarten der beiden Ebenen verwendet, wobei das aus dem computergestützten Sehen bekannte Verfahren der „Conditional Random Fields“ den mathematischen Rahmen bilden. Experimente haben gezeigt, dass durch diese explizite Behandlung von Verdeckungen sowie die Berücksichtigung von Verdeckungen tatsächlich die Klassifikationsergebnisse für Straßenoberflächen und verdeckende Objekte zum Teil verbessert werden konnte, wobei aber die Genauigkeit der Fahrzeugdetektion noch nicht zufriedenstellend ist. Parallel zu diesen Arbeiten wurden auch neuartige Methoden zur Detektion und Verfolgung von Fahrzeugen aus Luftbildern entwickelt. Bei der Detektion wurden verschiedenen Verfahren und zuletzt mit großem Erfolg die so genannten „Convolutional Neural Networks“ angewandt, welche aus den Daten sogar die Definition der Merkmale automatisch lernen und aktuell zu den erfolgreichsten Klassifikatoren zählen. Für das Tracking, d.h. die Verfolgung von Objekten über mehrere Bilder einer (zeitlich hoch aufgelösten) Sequenz wurde ein Ansatz gewählt, bei dem gleichzeitig mehrere Hypothesen für die Zuordnung von detektierten Fahrzeugen aus unterschiedlichen Bildern betrachtet werden, um Probleme wie z.B. „Identity Switches“ (d.h. das Verwechseln von nahe beieinanderliegenden Objekten bei der Verfolgung) zu verhindern. Dieser Ansatz zeigt ein hohes Potential auch für andere Anwendungen wie z.B. die echtzeitfähige Verfolgung von Personen in Überwachungsvideos. Schließlich wurden die Ergebnisse der oben skizzierten Teilprojekte auch zusammengeführt, indem die Ergebnisse der Fahrzeugdetektion in die Gesamtklassifikation mit eingeführt wurden, um die Ergebnisse weiter zu verbessern. Eine solche Verbesserung konnte in den Experimenten auch beobachtet werden, sie fiel aber geringer als erwartet aus. In diesen Experimenten waren die Ergebnisse der Fahrzeugverfolgung noch nicht verfügbar. In weiterführenden Untersuchungen soll die Integration von Fahrzeugtrajektorien in die Gesamtklassifikation erfolgen, was eine weitere Verbesserung der Ergebnisse erwarten lässt.

Projektbezogene Publikationen (Auswahl)

 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung