Fortschritte in der Topologischen Datenanalyse
Statistik und Ökonometrie
Zusammenfassung der Projektergebnisse
Das Projekt betrachtet fortgeschrittene Fragestellungen in der statistischen topologischen Datenanalyse (TDA). Das übergeordnete Ziel ist, die Stärken der TDA besser zu verstehen und zu erkennen, ob mit ihrer Hilfe bessere Entscheidungsgrundlagen für Datenwissenschaftler geschaffen werden können. Das Projekt gliedert sich in vier Teilprojekte. Die ersten beiden betrachten theoretische Fragestellungen in der TDA bzw. etwas allgemeiner in der stochastischen Geometrie. Die Teilprojekte drei und vier betrachten praktische Fragestellungen in der Analyse von Datenobjekten. Im ersten Teilprojekt stehen funktionale zentrale Grenzwertsätze für gewisse Statistiken in der topologischen Datenanalyse im Vordergrund. Das Teilprojekt betrachtet die (funktionale) asymptotische Normalität und zugehörige Konvergenzraten der Eulercharakteristik für die Čech und Vietoris-Rips Filterung im thermodynamischen Regime. Ferner leitet es die asymptotische Verteilung für eine Vielzahl an Teststatistiken her, die von Persistenzdiagrammen zufälliger Mosaike abgeleitet werden. Die Hauptresultate werden für Voronoi- und Laguerre-Mosaike, welchen ein Gibbs-Punktprozess zugrunde liegt, entwickelt. Im zweiten Teilprojekt wird die Bahadur Darstellung von empirischen Quantilen von Score-Funktionalen in der stochastischen Geometrie hergeleitet und das asymptotische Verhalten der zugehörigen Verteilungsfunktion untersucht. Den Score-Funktionalen liegt ein stationärer Poisson-Prozess zugrunde, der auf wachsenden Fenstern im Euklidischen-Raum beobachtet wird. Wir verwenden die Ergebnisse, um getrimmte und winsorisierte Mittelwerte von Score-Funktionalen zu untersuchen und das Gesetz des iterierten Logarithmus für Quantile von Score-Funktionalen herzuleiten Das dritte Teilprojekt untersucht multivariate Bootstrap- Verfahren für stabilisierende Funktionale mit Fokus auf Anwendungen in der topologischen Datenanalyse. Motiviert ist diese Arbeit durch die Tatsache, dass bestehende Grenzwersätze zur asymptotischen Verteilung in der Praxis schwer anwendbar sind, um Konfidenzbereiche zu konstruieren. Gleichzeitig ist der Standard-Bootstrap nicht direkt anwendbar. Aus diesem Grund entwickeln wir ein geglättetes Bootstrap-Verfahren in dieser Arbeit. Das vierte Teilprojekt untersucht statistische Tests in der topologischen Datenanalyse. Es betrachtet die Erkennung von Strukturbrüchen in einer schwach abhängigen Zeitreihe von Persistenzdiagrammen. Die Tests basieren auf Stabilitätsresultaten gängiger Filterungen, wenn die zugrunde liegenden Punktwolken kleinen Störungen ausgesetzt sind. Ferner werden Zweistichproben-Tests für relevante Unterschiede in den (Fréchet-) Varianzen von Persistenzdiagrammen entwickelt. Inhaltlich beruhen diese Tests auf selbstnormalisierenden Teststatistiken sowie einem funktionalen zentralen Grenzwertsatz für U-Statistiken für schwach abhängige Daten. Neben diesen vier Teilprojekten wurde im Förderzeitraum noch ein weiteres Projekt erarbeitet. Es behandelt die statistische Inferenz von sogenannten intrinsischen Waveletschätzern von Kurven positiv-definiter Matrizen in der log-Euklidischen Metrik.
Projektbezogene Publikationen (Auswahl)
-
On approximation theorems for the Euler characteristic with applications to the bootstrap. Electronic Journal of Statistics, 15(2).
Krebs, Johannes; Roycraft, Benjamin & Polonik, Wolfgang
-
Bootstrapping persistent Betti numbers and other stabilizing statistics. The Annals of Statistics, 51(4).
Roycraft, Benjamin; Krebs, Johannes & Polonik, Wolfgang
-
On the stability of the filtration functions for weakly dependent data with applications to structural break detection
Krebs, J. & Rademacher, D.
-
Persistent homology based goodness-of-fit tests for spatial tessellations. Journal of Nonparametric Statistics, 36(1), 39-59.
Hirsch, Christian; Krebs, Johannes & Redenbach, Claudia
-
On the Bahadur representation of sample quantiles for score functionals. Bernoulli, 30(4).
Krebs, Johannes
-
Statistical inference for wavelet curve estimators of symmetric positive definite matrices. Journal of Statistical Planning and Inference, 231, 106140.
Rademacher, Daniel; Krebs, Johannes & von, Sachs Rainer
-
Two-sample tests for relevant differences in persistence diagrams
Krebs, J. & Rademacher, D.
