Detailseite
Vorverarbeitete und hochdimensionale Datensätze in Diskriminanzanalyse und Klassifikation
Antragstellerinnen
Professorin Dr. Sophie Langer; Professorin Dr. Angelika Rohde
Fachliche Zuordnung
Mathematik
Förderung
Förderung seit 2021
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 460867398
Dieses Projekt untersucht, wie sich Datenvorverarbeitung und hochdimensionale Merkmalsvektoren auf Klassifikation, Regression und lineare Diskriminanzanalyse auswirken. Beide Aspekte stellen zentrale Herausforderungen der modernen Datenwissenschaft dar. Datenschutzbewahrende Vorverarbeitung kann den Einfluss einzelner Merkmale auf das Analyseergebnis verringern, während hochdimensionale Daten häufig eine große Zahl schwacher Prädiktoren enthalten. Wir entwickeln statistische Methoden, die speziell für solche Szenarien geeignet sind, mit einem Schwerpunkt auf recheneffizienten Lernalgorithmen mit nachweisbaren Konvergenzraten. Im Fokus stehen dabei semiparametrische binäre Regressionsmodelle sowie die Analyse des (stochastischen) Gradientenabstiegs für (penalisierte) empirische Risikominimierung. Unsere Untersuchungen reichen von grundlegenden hochdimensionalen linearen und additiven Modellen bis hin zu komplexeren Architekturen neuronaler Netzwerke.
DFG-Verfahren
Forschungsgruppen
Teilprojekt zu
FOR 5381:
Mathematische Statistik im Informationszeitalter - Statistische Effizienz und rechentechnische Durchführbarkeit
Internationaler Bezug
Österreich
Partnerorganisation
Fonds zur Förderung der wissenschaftlichen Forschung (FWF)
Kooperationspartner
Professor Dr. Lukas Steinberger
