Detailseite
Statistisches Lernen mit Vine Kopulas
Antragstellerin
Professorin Dr. Claudia Czado
Fachliche Zuordnung
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Mathematik
Mathematik
Förderung
Förderung von 2019 bis 2024
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 414226540
Statistische Lernverfahren für Daten mit vielen Variablen müssen nicht nur das individuelle Verhalten der einzelnen Variablen modellieren, sondern auch Abhängigkeiten zwischen den Variablen erlauben. Der Kopula Ansatz ist dafür sehr geeignet, da diese Modelle die einzelnen Randverteilungen mit einer Kopula, die die Abhängigkeit vollständig beschreibt, zusammenführen und so die gemeinsame Verteilung abbilden. Ein Stolperstein für die Anwendbarkeit von Kopula basierten Modellen war das Fehlen von flexiblen Kopula Klassen für hohe Dimensionen. Vor Kurzem haben sich jedoch Vine Kopulas für die Modellierung in hohen Dimensionen etabliert, da sie mit Hilfe von unabhängigen bivariaten Kopulas konstruiert werden und damit hohe Flexibilität erlauben. So können Vine Kopulas asymmetrische Abhängigkeiten an den Rändern modellieren. Diese treten beim Risikomanagement im Finanz-, Versicherungs- und Ingenieursbereich auf. Standard Abhängigkeitsmodelle wie die multivariate Gauss oder Student t Verteilung können keine asymmetrischen Abhängigkeiten abbilden. Dieses Projekt möchte diese Vorteile nutzen, um ein Vine Kopula basiertes statistisches Methodenrepertoire für Lernverfahren aufzubauen und um anspruchsvolle Anwendungen in hohen Dimensionen zu implementieren. Insbesondere soll die Schätzung und Selektion von Vine Kopula basierten Quantils Regressionen untersucht werden. Daneben werden Clustering- und Klassifikationsprobleme durch die Entwicklung von neuen Mischmodellen mit Vine Komponenten gelöst. Statistische Theorie sowohl für die Quantifizierung von Modellunsicherheiten für die Vorhersage von bedingten Quantilen als auch für die Zuordnung von neuen Datenpunkten zu Clustern wird entwickelt werden. Durch Vergleichsstudien sollen die Vorteile dieser realistischeren und interpretierbareren Modellierung aufgezeigt werden.
DFG-Verfahren
Sachbeihilfen