Zeitstabile Schätzverfahren für die Household Finance and Consumption Survey - Small Area Verfahren im Kontext von Paneldaten (TESAP)
Zusammenfassung der Projektergebnisse
Um Maßnahmen gezielt dort einzusetzen, wo sie am dringendsten sind, benötigen politische Entscheidungsträger zuverlässige Indikatoren für regionale oder demografische Untergruppen. Da der Stichprobenumfang auf disaggregierter Ebene sehr klein werden kann, sind Schätzungen, die ausschließlich auf Umfragedaten beruhen, oft nicht mehr zuverlässig. Methoden der Small Area Estimation (SAE) zielen darauf ab, dieses Problem zu überwinden und eine höhere Genauigkeit zu erreichen. SAE-Methoden reichern Informationen aus Erhebungsdaten mit Daten aus zusätzlichen Quellen wie Verwaltungs- oder Volkszählungsdaten an. Neben dem Problem kleiner Stichprobenumfänge auf disaggregierter Ebene leiden Erhebungen häufig unter einem hohen Antwortausfall. Eine mögliche Lösung für Item-Non-Response ist multiple Imputation, bei der fehlende Werte durch mehrere plausible Werte ersetzt werden. Die fehlenden Werte und ihre Ersetzungen führen zu Unsicherheiten in der Schätzung. Das Hauptziel dieses Projektes bestand darin, die Ergebnisse des Projekts QUESSAMI (2016-2018) zu erweitern, das multiple Imputation und SAE kombinierte. Das Projekt QUESSAMI lieferte eine Lösung für die Schätzung von Mittelwerten. Im Projekt TESAP liefern wir eine angepasste und erweiterte Lösung für die Schätzung von Mittelwerten und zusätzlich für die Schätzung von Anteilswerten, die die Unsicherheit aufgrund fehlender Werte im SAE-Schätzer berücksichtigen. Da Finanzvermögen und Wohlstand sensible Themen sind, leiden Erhebungen dieser Art besonders unter Item-Non-Response. Der Schwerpunkt lag auf der Schätzung des privaten Vermögens auf regionaler Ebene für Deutschland und Finanzanlagen auf nationaler Ebene für die EU-Länder. Die Anwendungen verwenden Daten aus dem Household Finance and Consumption Survey (HFCS) 2010 und 2017 für die Länder der Europäischen Union. Der Ansatz ist generisch und kann auf andere Indikatoren wie den Gini-Koeffizienten erweitert oder auf andere Erhebungen wie das Sozio-oekonomische Panel (SOEP) angewendet werden. Um den bestmöglichen SAE-Schätzer in Bezug auf Genauigkeit und Präzision zu erhalten, ist es außerdem wichtig, das optimale Modell für die Beziehung zwischen der Zielvariablen und den Hilfsdaten zu finden. Eine Möglichkeit besteht darin, die beste Transformation der Zielvariablen zu finden, um die Modellannahmen vollständig zu erfüllen oder um Nichtlinearitäten zu berücksichtigen. Ein Schwerpunkt dieses Projekts war die Schätzung von Gini-Koeffizienten für regional disaggregierte Daten für Deutschland unter Verwendung einer Logit-Transformation im zeitlichen Verlauf. Ein weiterer Schwerpunkt war die Identifizierung der wichtigsten Kovariaten und ihrer Beziehungen untereinander und zur Zielvariablen. Kovariaten sind zusätzliche Datenquellen oder zeitabhängige Variablen aus früheren Panelwellen. Es werden Ansätze zur Modellauswahl und optimalen Transformation vorgestellt, um Normalitätsannahmen zu erfüllen und Wechselwirkungen und nichtlineare Beziehungen zu berücksichtigen.
Projektbezogene Publikationen (Auswahl)
-
Area-level small area estimation with random forests. Working Paper.
Harmening, S., Runge, M. & Schmid, T.
-
The Fay–Herriot model for multiply imputed data with an application to regional wealth estimation in Germany. Journal of Applied Statistics, 49(13), 3278-3299.
Kreutzmann, Ann-Kristin; Marek, Philipp; Runge, Marina; Salvati, Nicola & Schmid, Timo
-
Variable selection using conditional AIC for linear mixed models with data-driven transformations. Statistics and Computing, 33(1).
Lee, Yeonjoo; Rojas-Perilla, Natalia; Runge, Marina & Schmid, Timo
-
Estimating Intra-Regional Inequality with an Application to German Spatial Planning Regions. Journal of Official Statistics, 39(2), 203-228.
Runge, Marina
-
Small Area with Multiply Imputed Survey Data. Journal of Official Statistics, 39(4), 507-533.
Runge, Marina & Schmid, Timo
