Statistisches Lernen mit Vine Kopulas
Mathematik
Zusammenfassung der Projektergebnisse
Statistische Lernmethoden für hochdimensionale Daten erfordern nicht nur eine adäquate Modellierung des Verhaltens jeder einzelnen Variablen, sondern auch eine Berücksichtigung der Abhängigkeiten zwischen ihnen. Der Copula-Ansatz bietet sich hierfür besonders an, da er separate Randverteilungen mit einer Copula, die die Abhängigkeit beschreibt, verbindet. Ein wesentlicher Hemmschuh für die Anwendung von Copula-basierten Modellen in statistischen Lernproblemen war bislang das Fehlen flexibler Copula-Modelle in hohen Dimensionen. Vine-Copulas haben sich jedoch kürzlich als geeignet erwiesen, asymmetrische Tail-Abhängigkeiten abzubilden, wie sie in Bereichen wie Risikomanagement im Finanz- und Versicherungswesen, Ingenieurwesen sowie in den Umweltwissenschaften beobachtet werden. Standardabhängigkeitsmodelle, wie die multivariate Normal- oder Student-t-Verteilung, können asymmetrische Tails nicht adäquat berücksichtigen. Vine-Copula-Modelle sind in hohen Dimensionen anwendbar, da sie aus unabhängigen bivariaten Copula-Blöcken aufgebaut werden. Dieses Projekt nutzt diese Vorteile, um eine Copula-basierte Toolbox für statistisches Lernen in herausfordernden hochdimensionalen Anwendungen zu entwickeln und zu implementieren. Im Speziellen wurden neue Methoden der Quantilregression auf Basis von Vine-Copulas untersucht, insbesondere deren Schätzung und Modellselektion. Darüber hinaus wurden Clustering- und Klassifikationsaufgaben durch die Entwicklung neuartiger Mischmodelle mit Vine-Komponenten adressiert. Statistische Theorien wurden entwickelt, um Unsicherheitsbewertungen sowohl für die Vorhersage bedingter Quantile als auch für die Cluster- und Klassifikationszuordnung neuer Daten zu ermöglichen. Vergleichsstudien haben die Vorteile dieser realistischeren und flexibleren Modellierungsansätze deutlich gemacht.
Projektbezogene Publikationen (Auswahl)
-
Bivariate vine copula based regression, bivariate level and quantile curves
Tepegjozova, M. & Czado, C.
-
Nonparametric C- and D-vine-based quantile regression. Dependence Modeling, 10(1), 1-21.
Tepegjozova, Marija; Zhou, Jing; Claeskens, Gerda & Czado, Claudia
-
Predicting times to event based on vine copula models. Computational Statistics & Data Analysis, 175, 107546.
Pan, Shenyi & Joe, Harry
-
Vine copula mixture models and clustering for non-Gaussian data. Econometrics and Statistics, 22, 136-158.
Sahin, Özge & Czado, Claudia
-
Assessing univariate and bivariate risks of late-frost and drought using vine copulas: A historical study for Bavaria
Tepegjozova, M., Meyer, B. F., Rammig, A., Zang, C. S. & Czado, C.
-
Conditional inferences and predictions based on copula models. (Ph.D. thesis). University of British Columbia
Pan, S.
-
Statistical learning based on vine copulas with societal applications (Ph.D. thesis). Technische Universität München
Sahin, Ö.
-
Statistical learning with vine copulas in regression settings (Ph.D. thesis). Technische Universität München
Tepegjozova, M.
-
Assessing copula models for mixed continuous-ordinal variables. Dependence Modeling, 12(1).
Pan, Shenyi & Joe, Harry
-
High-dimensional sparse vine copula regression with application to genomic prediction. Biometrics, 80(1).
Sahin, Özge & Czado, Claudia
-
Vine Copula-Based Classifiers with Applications. Journal of Classification, 42(2), 335-363.
Şahin, Özge & Joe, Harry
