Detailseite
Lernen von Analyse Operatoren mit Anwendungen in der Bildverarbeitung
Antragsteller
Professor Dr.-Ing. Klaus Diepold, seit 8/2016
Fachliche Zuordnung
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung
Förderung von 2013 bis 2018
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 246651110
Der Erfolg von vielen Verfahren im Bereich des Maschinellen Lernens und der Bildverarbeitung beruht auf dem Ausnutzen bestimmter Datenstrukturen, und das Sparsity-Datenmodell (dünnbesetzte Datenstrukturen) spielt hierbei eine bedeutende Rolle. Daher hat sich Sparsity zu einem bedeutenden Forschungsgebiet in den Bereichen des Maschinellen Lernens und der Signalverarbeitung entwickelt, welches in den letzten Jahren zahlreiche Algorithmen hervorgebracht hat. Diese befassen sich entweder mit der Entwicklung von dünnbesetzten Darstellungen oder mit Wegen, diese Eigenschaft in den Modellen geschickt zu nutzen.Im Gegensatz zum bereits etablierten Synthese-Modell - auch als Sparse Coding bekannt - genießt eine interessante Alternative, das Co-Sparse-Analysemodell, bisher deutlich weniger Aufmerksamkeit. Hierbei bildet ein Analyse-Operator Daten linear so auf einen höherdimensionalen Raum ab, dass das Bild der Abbildung dünn besetzt ist. Wie aktuelle Veröffentlichungen belegen, übertrifft der Analyse-Ansatz den Synthese-Ansatz bei der Regularisierung von inversen Problemen und zeichnet sich besonders bei Bildverarbeitungsanwendungen aus.Die Entwicklung von effektiven Lernalgorithmen erfordert die Erarbeitung einer soliden Theorie, und alle entwickelten Methoden müssen sorgsam evaluiert werden. Während für die Struktur von optimalen Synthese-Dictionaries bereits theoretische Ergebnisse vorliegen, sind viele Fragen rund um das Analyse-Modell bisher offen und für viele Anwendungen fehlen vergleichbare Resultate. In der Bildverarbeitung beispielsweise existiert noch keine theoretische Analyse über Bedingungen für eine garantiert erfolgreiche Signalrekonstruktion. In anderen Bereichen, wie etwa bei der Merkmalsextraktion oder der multidimensionalen Bildanalyse wurde das Analyse Modell noch gar nicht eingesetzt.Das Ziel dieses Antrags ist die Beantwortung einiger entscheidenden theoretischen Fragen und die weitere Erkundung dieses vielversprechenden Forschungszweiges, um die bestehenden Lücken in der Theorie zu füllen und die Entwicklung des Co-Sparse-Analysemodells als Standardwerkzeug in der Bildverarbeitung voranzutreiben.Untersucht werden soll die Stichprobeneffizienz beim Lernen eines Analyseoperators, zusammen mit einer lokalen Stabilitätsanalyse von unüberwachten Lernverfahren. Diese werden derart erweitert werden, dass sie für die Verarbeitung von multidimensionalen Bilddaten, z.B. Farbbildern oder 3D-Bildern, geeignet sind. Eine derartige Erweiterung kann den Rechenaufwand verringern und die Verarbeitung von hochdimensionalen Daten ermöglichen. Überdies wird im Projekt der Zusammenhang des Co-Sparse-Analysemodells mit Sparse-Autoencodern untersucht, welche sich als sehr geeignet für tiefe neuronale Netzwerk-Architekturen herausgestellt haben. Abschließend werden wir Algorithmen untersuchen, die das Problem der Bildrekonstruktion lösen und dabei blind ein Co-Sparse-Analysemodell lernen.
DFG-Verfahren
Sachbeihilfen
Ehemaliger Antragsteller
Professor Dr. Martin Kleinsteuber, bis 8/2016