Hochdimensionale Statistik für Punkt- und Sprungprozesse
Zusammenfassung der Projektergebnisse
Wann immer die Entwicklung eines zeitabhängigen Systems durch Zufallsphänomene beeinflusst wird, werden stochastische Prozesse für die mathematische Modellierung verwendet. Da ein wichtiges Merkmal von Datensätzen in modernen Anwendungen eine hohe Dimensionalität ist, werden statistische Methoden für stochastische Prozesse benötigt, die auf hochdimensionale Daten anwendbar sind. Darüber hinaus ist es von größter Bedeutung, die zugrundeliegenden Unsicherheiten abschätzen zu können, insbesondere bei Anwendungen aus den Naturwissenschaften. Im ersten Teil dieses Projekts wurden neuartige Regressionsansätze entwickelt, die es erlauben, den Fluch der Dimension durch Dimensionsreduktionstechniken im Allgemeinen und durch tiefe neuronale Netze im Besonderen zu umgehen. Ein Schwerpunkt lag dabei auf Bayes'schen Methoden, die unter anderem eine Quantifizierung von Unsicherheiten ermöglichen. Um eine skalierbare, auf Markov-Ketten-Monte-Carlo basierende Methode zu erreichen, wurde ein korrigierter stochastischer Metropolis-Hastings-Algorithmus vorgeschlagen. Diese Methode ist für große Stichproben effizient berechenbar, besitzt ein optimales Vorhersagerisiko und erlaubt Unsicherheitsgarantien. In einer laufenden interdisziplinären Zusammenarbeit wird diese Methode zur Quantifizierung von Unsicherheiten in der Teilchenphysik eingesetzt. In einem zweiten Projektteil wurde die Schätzung der Sprungverteilung eines mehrdimensionalen Levy-Prozesses untersucht. Auf der Grundlage diskreter Beobachtungen wurde die multivariate Levy-Dichte mittels eines spektralen Ansatzes geschätzt. Unter Berücksichtigung von niedrig- und hochfrequenten Beobachtungen wurden Konvergenzraten nachgewiesen. Numerische Experimente bestätigen die theoretischen Ergebnisse. Die vorgeschlagene Methode ist robust gegenüber verschiedenen Abhängigkeitsstrukturen, die zu singulären Sprungverteilungen führen können. Die Kombination beider Teile mit dem Ziel numerisch effiziente Schätzverfahren für hochdimensionale Levy-Prozesse zu erhalten, ist Gegenstand noch laufender Forschung, die in hohem Maße auf den Ergebnissen dieses Projekts aufbaut.
Projektbezogene Publikationen (Auswahl)
-
A PAC-Bayes oracle inequality for sparse neural networks
M. F. Steffen & M. Trabs
-
Dimensionality Reduction and Wasserstein stability for kernel regression
S. Eckstein; A. Iske & M. Trabs
-
Estimating a multivariate Lévy density based on discrete observations
M. F. Steffen
-
PAC-Bayes bounds for high-dimensional multi-index models with unknown active dimensio
M. F. Steffen
-
Statistical guarantees for stochastic Metropolis-Hastings
S. Bieringer; G. Kasieczka; M.F. Steffen & M. Trabs
