Vorverarbeitete und hochdimensionale Datensätze in Diskriminanzanalyse und Klassifikation

Antragstellerinnen Professorin Dr. Sophie Langer; Professorin Dr. Angelika Rohde

Fachliche Zuordnung Mathematik

Förderung Förderung seit 2021

Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 460867398

Projektbeschreibung

Dieses Projekt untersucht, wie sich Datenvorverarbeitung und hochdimensionale Merkmalsvektoren auf Klassifikation, Regression und lineare Diskriminanzanalyse auswirken. Beide Aspekte stellen zentrale Herausforderungen der modernen Datenwissenschaft dar. Datenschutzbewahrende Vorverarbeitung kann den Einfluss einzelner Merkmale auf das Analyseergebnis verringern, während hochdimensionale Daten häufig eine große Zahl schwacher Prädiktoren enthalten. Wir entwickeln statistische Methoden, die speziell für solche Szenarien geeignet sind, mit einem Schwerpunkt auf recheneffizienten Lernalgorithmen mit nachweisbaren Konvergenzraten. Im Fokus stehen dabei semiparametrische binäre Regressionsmodelle sowie die Analyse des (stochastischen) Gradientenabstiegs für (penalisierte) empirische Risikominimierung. Unsere Untersuchungen reichen von grundlegenden hochdimensionalen linearen und additiven Modellen bis hin zu komplexeren Architekturen neuronaler Netzwerke.

DFG-Verfahren Forschungsgruppen

Teilprojekt zu FOR 5381: Mathematische Statistik im Informationszeitalter - Statistische Effizienz und rechentechnische Durchführbarkeit

Internationaler Bezug Österreich

Partnerorganisation Fonds zur Förderung der wissenschaftlichen Forschung (FWF)

Kooperationspartner Professor Dr. Lukas Steinberger

Servicenavigation

Hauptnavigation

Vorverarbeitete und hochdimensionale Datensätze in Diskriminanzanalyse und Klassifikation

Zusatzinformationen

Servicenavigation

Hauptnavigation

Vorverarbeitete und hochdimensionale Datensätze in Diskriminanzanalyse und Klassifikation

Zusatzinformationen

Textvergrößerung und Kontrastanpassung