Project Details
Projekt Print View

Holistic Scene Understanding

Applicant Professor Dr.-Ing. Bodo Rosenhahn, since 6/2016
Subject Area Geodesy, Photogrammetry, Remote Sensing, Geoinformatics, Cartography
Image and Language Processing, Computer Graphics and Visualisation, Human Computer Interaction, Ubiquitous and Wearable Computing
Term from 2014 to 2021
Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 249306183
 
Final Report Year 2021

Final Report Abstract

Als wesentliche wissenschaftliche Fortschritte möchte die methodischen Entwicklungen im Bereich deep learning hervorheben. Insbesondere die Entwicklungen im Bereich der Szenengraphengenerierung und die Kombination von semantischen Labels (aus Text oder Sprachkorpora) für die Extraktion von Relationen zwischen Bilddetektionen ist für mich ein neues Feld, was wir in Zukunft verstärkt bearbeiten werden. Eine Hauptmotivation dabei ist der sogenannte visual Turing test, wo graphbasierte Bildrepräsentationen helfen können um relationale Fragen an ein Bild resp. Computer semantisch angemessen beantworten zu können. Während in früheren Arbeiten Relationen u.a. über gemischt-ganzzahlige lineare Programme gelöst wurden, haben wir in dieser Arbeit eine Formulierung als gewöhnliche Differentialgleichung (ODE) vorgeschlagen. Die von uns aufgebaute Architektur führt eine Szenengraphen-Inferenz durch, indem sie eine neuronale Variante einer gewöhnlichen Differentialgleichung durch eine End-to-End-Framework löst. Wir erreichen damit State-of-the-Art-Ergebnisse bei den typischem Szenen-Graphen Benchmark-Aufgaben, der Generierung von Szenengraphen (SGGen), der Klassifizierung (SGCls) und Erkennung von visuellen Beziehungen (PredCls), u.a. beim Visual Genome-Benchmark.

Publications

 
 

Additional Information

Textvergrößerung und Kontrastanpassung