Project Details
Projekt Print View

The integration of early vision, saliency models, and eye-movement control: Experiments, modeling, and spatial statistics

Subject Area General, Cognitive and Mathematical Psychology
Term from 2014 to 2021
Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 247862554
 
Final Report Year 2021

Final Report Abstract

Das übergeordnete Thema dieses Projektes war die Zusammenführung zweier bisher weitgehend getrennter Forschungsgebiete, der frühen visuellen Verarbeitung von Mustern und Strukturen (early spatial vision) und der dynamischen Blicksteuerung – mit dem Ziel der Entwicklung eines integrierten mathematischen (computer-implementierten) Modells. Als Ausgangspunkt für die Verarbeitung von Mustern und Strukturen wurde ein Populationsmodell der frühen visuellen Verarbeitung der AG Wichmann in Tübingen verwendet. Für die Blicksteuerung diente ein dynamischer Modellierungsansatz für die Blick- und Aufmerksamkeitssteuerung der AG Engbert in Potsdam als Ausgangspunkt. Die Zusammenführung der beiden Modellierungsansätze war erfolgreich: Das aus unserer Forschung resultierende Bottom-up Modell kann Fixationen beim Betrachten von natürlichen Bildern besser voraussagen als state-of-the-art Bottom-up Low-Level Salienz-Modelle der Literatur. Auch wenn wir, wie oben besprochen, zeigen konnten, dass Modelle, die (auch) über High-Level Information verfügen, Fixationen nochmals besser voraussagen können – diese auf tiefen neuronalen Netzwerken basierenden Modelle sind aber auch deutlich komplexer und haben eine mehrere tausendmal (!) größere Anzahl freier Parameter und sind auf mindestens einer Million Bilder trainiert – im Vergleich dazu ist unser dynamisches Modell sehr überschau- und verstehbar, und alle Komponenten sind psychologisch oder neurophysiologisch motiviert und nachvollziehbar. In den beiden Förderungsphasen des Projektes wurden 1. umfangreiche Experimente zur Blick- und Aufmerksamkeitssteuerung beim Betrachen von Szenen umgesetzt, 2. für das Gebiet neuartige Analysen zu räumlichen Korrelationsfunktionen erarbeitet, 3. ein dynamisches Modell der Generierung von Blickpfaden bei der Szenenbetrachtung vorgeschlagen und über mehrere Versionen weiterentwickelt, 4. die Maximum Likelihood Schätzung für dynamische kognitive Modelle der Blicksteuerung umgesetzt, was nun die Schätzung interindividueller Unterschiede ermöglicht, 5. ein Salienzmodell auf der Basis des Populationsmodells der frühen visuellen Verarbeitung erarbeitet und 6. die Grundlagen eines kombinierten Modells der frühen visuellen Verarbeitung und Blicksteuerung implementiert. Insbesondere das Thema der Bayesschen Inferenz für dynamische kognitiven Modelle wird nun im breiteren Kontext im DFG-Sonderforschungsbereich 1294 “Datenassimilation: Die nahtlose Verschmelzung von Daten und Modellen” in Potsdam erforscht. Diese Projekt hat dazu wichtige Grundlagen gelegt. Inspiriert durch den Erfolg des Populationsmodells der frühen visuellen Verarbeitung als erste Verarbeitungsstufen (front-end) unseres kombinierten Modells für die Blicksteuerung arbeiten wir in Tübingen daran, dass Modell ähnlich auch als front-end für tiefe neuronale Netzwerke zu verwenden, um deren Verhalten dem des Menschen anzunähern. Auch hierzu hat das Projekt wichtige Grundlagen gelegt.

Publications

 
 

Additional Information

Textvergrößerung und Kontrastanpassung