Detailseite
Projekt Druckansicht

Von dicht zu spärlich besetzten funktionalen Daten: Optimale Konvergenzraten, asymptotische Inferenz und funktionale Zeitreihen

Fachliche Zuordnung Mathematik
Förderung Förderung seit 2025
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 557935639
 
Die funktionale Datenanalyse (FDA) bezieht sich auf Situationen, in denen die Daten wiederholte Beobachtungen von Funktionen oder Bildern beinhalten. Zwei zentrale Begriffe in der FDA sind Replikation und Regularisierung. Replikation verwendet Informationen über die n wiederholten Beobachtungen der Funktionen, wohin gegen Regularisierung die Informationen innerhalb der Funktionen nutzt, die in der Praxis nur zu diskreten Punkten in Zeit oder Raum beobachtet werden. In einem synchronen Design befinden sich die diskreten Beobachtungspunkte bei jeder Replikation an gleichen, deterministischen Stellen, was das typische Szenario für maschinell aufgezeichnete funktionale Daten ist und die in Anwendungen am häufigsten auftreten. Abhängig von der Anzahl der Beobachtungen innerhalb der Funktionen unterscheidet man zwischen dicht und spärlich beobachteten funktionalen Daten. Für das synchrone Design zeigen unsere bisherigen Ergebnisse für die Erwartungswertfunktion und den Kovarianzkern, dass im dicht besetzen Fall die Inferenz mit der parametrischen Wurzel - n - Rate durchgeführt werden kann, ebenso als wenn die Prozesse kontinuierlich und ohne Fehler beobachtet würden. Der spärlich besetzte Fall wird von Diskretisierungsfehlern dominiert, während dazwischen ein Phasenübergang stattfindet, der durch zusätzliches Beobachtungsrauschen verursacht wird. Dieser Phasenübergang kommt nur dann vollständig zum Vorschein, wenn die Supremumsnorm als Fehlermaß verwendet wird. Die Supremumsnorm ist auch von großem praktischen Interesse, da sie der Visualisierung des Schätzfehlers entspricht und die Grundlage für die Konstruktion uniformer Konfidenzbereiche bildet. In diesem Projekt besteht unser erstes Ziel darin, die oben beschriebenen Ergebnisse mit optimalen Raten in der Supremumsnorm und zentrale Grenzwertsätzen (CLTs) im Raum der stetigen Funktionen unter synchronem Design für die Schätzung von Ableitungen der Mittelwertfunktion und des Kovarianzkerns sowie für die Hauptkomponenten Funktionen zu vervollständigen. Unser zweites übergeordnetes Ziel ist es, die Erkenntnisse für Inferenzmethoden zu nutzen. Dazu gehören die Konstruktion von Konfidenzbändern, Inferenz bzgl. der Anzahl der erforderlichen Designpunkte und Inferenz auf Glattheit der Pfade sowie CLTs und Inferenz für Transferlernen bei funktionalen Schätzproblemen. Während Schätz- und Testprobleme mit funktionalen Zeitreihen in Anwendungen häufig auftreten und intensiv untersucht wurden, gehen die meisten Studien von der idealisierten Annahme aus, dass Prozesse vollständig und ohne Fehler beobachtet werden. Daher besteht das dritte übergeordnete Ziel darin, unsere Ergebnisse auf diskret und synchron beobachtete funktionale Zeitreihen zu erweitern.
DFG-Verfahren Sachbeihilfen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung