Detailseite
Nicht-lineare probabilistische Modelle für repräsentations-basiertes Erkennen und unüberwachtes Lernen auf visuellen Daten
Antragsteller
Professor Dr. Jörg Lücke
Fachliche Zuordnung
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung
Förderung von 2010 bis 2015
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 170992112
Ein seit langem verfolgtes Ziel im Bereich des Computer Sehens ist das unüberwachten Lernen von elementaren Komponenten aus Bildern. Für viele Arten von Daten, haben state-of-the-art Ansätze in den letzten Jahren große Fortschritte damit erzielt, dass Bayes’sche Methodiken ihre Anwendung fanden, die es erlaubten die Regelmäßigkeiten in der Daten Statistik zu modellieren. Für visuelle Daten beruhen heutige Ansätze jedoch immer noch auf einer sehr ungenauen Modellierung charakteristischer Daten-Eigenschaften. So beruhen Modelle wie “Sparse Coding”, “Independent Component Analysis”, oder “Non-negative Matrix Factorization” auf den Annahmen, dass 1. elementare Komponenten sich linear super-positionieren; dass 2. versteckte Modellvariablen unabhängig sind; und dass 3. eine feste Komponenten-Position angenommen wird. In diesem Projekt werden Modelle untersucht werden, die sich in all diesen entscheidenden Punkten von herkömmlichen Modellen unterscheiden. Basierend auf den modernen Ansätzen der generativen Modelle werden wir 1. nicht-lineare Komponenten Kombinationen betrachten, 2. lernbare Strukturen für abhängige a priori Wahrscheinlichkeiten einführen, und 3. aktiv Muster-Transformationen für invariantes Erkennen modellieren. Während die Behandlung eines jeden einzelnen dieser Punkte einen wichtigen Fortschritt bedeutet, kann durch eine Kombination dieser Ansätze eine gänzlich neue Klasse von Komponenten Extraktions Modellen geschaffen werden. Die neu entwickelten Lern-Algorithmen werden auf schwierige Formen visueller Daten angewandt werden können und ermöglichen praktische Anwendungen die weit über die Möglichkeiten bisheriger Algorithmen hinausgehen. Wir werden eine neu Technologie für die visuelle Datenverarbeitung entwickeln, die genau dort ansetzt, wo heutige Methodiken ihre größten Schwierigkeiten haben.
DFG-Verfahren
Sachbeihilfen