Detailseite
Projekt Druckansicht

Flexible Dichteregressionsmethoden

Fachliche Zuordnung Statistik und Ökonometrie
Förderung Förderung seit 2023
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 513634041
 
Ziel dieses Projekts ist die Entwicklung eines einheitlichen Ansatzes zur flexiblen semiparametrischen Dichteregression. Während die Beschränkungen der traditionellen mittelwertorientierten parametrischen Modellierung von (skalaren) Daten eine Vielzahl von Erweiterungen auf andere Verteilungsmerkmale (Quantile) oder mehrere Verteilungsparameter (Verteilungsregression) motiviert haben, wurden zuletzt erste Methoden in der funktionalen und Kompositions-Datenanalyse für Wahrscheinlichkeitsdichten als Objekte der statistischen Analyse entwickelt. Allerdings sind diese Gebiete der Regression mit flexiblen Verteilungen (Ansätze auf Individualebene) und der statistischen Analyse von Verteilungen (Ansätze auf Dichteebene) bisher unabhängig voneinander. Unser Ziel ist es, durch ihre Verbindung die methodischen Entwicklungen gegenseitig zu befruchten und voranzutreiben. Der Bedarf an flexiblen Dichteregressionsmethoden lässt sich anhand eines Beispiels aus der Geschlechterökonomie illustrieren: Die Verteilung des Anteils der Frau am Arbeitseinkommen eines Paares ist eine gemischte Verteilung auf [0,1] mit positiver Wahrscheinlichkeitsmasse bei 0 und 1 (für Paare mit einem Einkommen) und einer stetigen - oft bimodalen - Dichte dazwischen (für Paare mit zwei Einkommen). Es ist von Interesse, Variablen zu untersuchen, die die Verteilung beeinflussen können, wie (Alter der) Kinder im Haushalt, Jahr oder Wohnregion. Deutliche Unterschiede gibt es beispielsweise zwischen Ost- und Westdeutschland. Die Dichte ist von besonderem Interesse, da sie Verschiebungen in der Wahrscheinlichkeitsmasse oder Bimodalitäten aufgrund von Untergruppen leicht sichtbar macht und sich gut auf diskrete, stetige, gemischte oder bivariate Verteilungen übertragen lässt. Solche Analysen erfordern Methoden, die die gesamte Verteilung in Abhängigkeit von Kovariablen flexibel mit linearen, nichtlinearen und zufälligen Effekten modellieren können, ohne parametrische Annahmen wie Normalität zu treffen. Wir werden daher geeignete Methoden zur Dichteregression entwickeln. Je nach Datensituation werden Dichteregressionsmethoden sowohl für dichtewertige Daten benötigt und entwickelt - z. B. wenn ein Histogramm zu Verwaltungsdaten bereitgestellt oder zur Zusammenfassung von sehr großen Daten verwendet wird - als auch für einzelne skalare Daten, wenn die Modellierung der bedingten Dichte in Abhängigkeit von Kovariablen von Interesse ist. In unserem vereinheitlichten Ansatz stellen diese beiden Szenarien zwei Seiten derselben Medaille dar, statt zweier verschiedener Zweige der Statistik. Wir werden Methoden für stetige Dichten (z. B. Einkommen), diskrete Dichten, d.h. Kompositionsdaten (z. B. Zeitverwendung in diskreten Kategorien), sowie gemischte Dichten (z. B. Anteil der Frau am Haushaltseinkommen) entwickeln und diese auf bivariate Dichten erweitern, z. B. bei der gemeinsamen Betrachtung eines Paares innerhalb eines Haushalts.
DFG-Verfahren Sachbeihilfen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung