Detailseite
Restringierte Matrix- und Tensorfaktorisierungen und ihre Anwendung in der Datenfusion
Antragsteller
Professor Dr. Max Pfeffer
Fachliche Zuordnung
Mathematik
Förderung
Förderung seit 2020
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 448293816
Das vorliegende Forschungsprojekt beschäftigt sich mit restringierten Matrix- und Tensorfaktorisierungen im Kontext der Datenfusion. Die zentrale Anwendung ist die Klassifikation von Krebsproben. Die Datenfusion besteht aus der gleichzeitigen Faktorisierung mehrerer Matrizen (oder Tensoren), welche unterschiedliche Messungen für jede Probe beinhalten. Dies führt zu einer Reduzierung der Dimension, es erzeugt relevante Komponenten- oder Featurevektoren und es ermöglicht eine Klassifizierung der Datenpunkte. Die Faktormatrizen können auf verschiedene Weise restringiert werden, wodurch die Klassifizierung verbessert und die Extraktion von interpretierbaren Features vereinfacht wird.Unser Ziel ist es, aufbauend auf einer vorbereitenden Arbeit die Methoden der Datenfusion auf weniger verstandene Krebstypen anzuwenden. Wir werden die resultierenden Klassifikationen mit Hilfe einer Kollaboration mit Biologen validieren und den Einfluss der gleichzeitigen und restringierten Faktorisierung auf die Klassifikation untersuchen. In diesem Kontext werden wir auch restringierte Tensorfaktorisierungen anwenden und untersuchen.Außerdem werden wir weniger konventionelle Restriktionen in die Datenfusion einführen, zum Beispiel dünn besetzte oder sogar boolesche oder subtropische Faktorisierungen. Das ermöglicht die Betrachtung einer größeren Menge von Datentypen und es verbessert die Klassifizierung und den anschließenden Prozess der Feature Selection. Es werden Methoden entwickelt, die die Auswahl der relevanten Features zum Ziel haben, insbesondere in Hinblick auf die Auswahl der Restriktionen.Um die oben genannten Berechnungen zu ermöglichen, werden wir die nötigen Algorithmen herleiten und implementieren. Dafür verbinden wir die Stärke der Riemannschen Optimierung, welche mittlerweile eine Standardmethode für die Berechnung von Niedrigrangzerlegungen darstellt, mit der von proximalen Algorithmen, welche zur Lösung von nichtglatten (aber konvexen) Problem verwendet werden. Dies hat auch weitreichende Anwendungen außerhalb der Datenfusion.
DFG-Verfahren
Sachbeihilfen