Detailseite
Projekt Druckansicht

Statistische Methoden und Modelle für Abhängige Kategoriale, insbesondere Ordinale Daten

Fachliche Zuordnung Statistik und Ökonometrie
Förderung Förderung von 2018 bis 2022
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 404505486
 
Erstellungsjahr 2023

Zusammenfassung der Projektergebnisse

Für die Analyse hochdimensionaler voneinander abhängiger Variablen existieren unterschiedlichste statistische Methoden, wie etwa die Hauptkomponentenanalyse (Principal Component Analysis, PCA). Diese erfordern in ihrer Grundform jedoch oft stetige bzw. metrisch-skalierte Daten. Entsprechende Methoden für hochdimensionale kategoriale, insbesondere ordinale Daten stehen dagegen weit weniger zur Verfügung, obwohl man diese Art von Daten häufig und in verschiedensten Anwendungen findet. Das Ziel des Projektes war es daher, diese Lücke in der statistischen Methodik zu schließen, indem geeignete Verfahren zu entwickeln waren, insbesondere regularisierte Regressionsmodelle mit ordinal-skalierten Daten sowohl auf Seiten des Response wie auch der Prädiktoren, sowie eine penalisierte Form der Hauptkomponentenanalyse für ordinale Variablen. Letztere wurde durch sog. Optimal Scaling mit diskreter Glättungspenalty realisiert, welches als adaptiver und datengesteuerter Kompromiss zwischen gewöhnlicher (linearer) PCA unter Verwendung der durchnummerierten Levels einerseits und naivem Optimal Scaling mit der Gefahr des Overfittings andererseits verstanden werden kann. Für Regressionsmodelle mit ordinalem Response sowie ordinalen Prädiktoren wurde eine geeignete Group wie auch Fused Lasso Bestrafung implementiert und erfolgreich bei der Item-on-Item(s) Regression eingesetzt. Durch besagte Penalties können die ordinalen Prädiktoren datengesteuert/automatisiert über die Levels hinweg geglättet bzw. fusioniert sowie selektiert werden. Darüber hinaus wurde im Rahmen des Projekts eine spezielle Glättungspenalty für kumulative Logit-Modelle ohne Annahme proportionaler Odds vorgeschlagen und evaluiert, sowie einige Ergebnisse bzgl. weitergehender Inferenz (statistische Tests, Konfidenzintervalle) bei Vorliegen ordinaler Prädiktoren erzielt.

Projektbezogene Publikationen (Auswahl)

 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung