Detailseite
Modulare Fragenbogendesigns für sozialwissenschaftliche Umfragen: Der Beitrag statistischer Modellierung mittels Imputationsverfahren für Daten der Erhebungspraxis
Antragsteller
Dr. Christian Bruch; Professor Dr. Christof Wolf
Fachliche Zuordnung
Empirische Sozialforschung
Förderung
Förderung seit 2018
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 407454818
Dieses Projekt dient der Untersuchung der Anwendung von Imputationsverfahren in großangelegten sozialwissenschaftlichen Befragungen, die durch ein sogenanntes Modulares Fragebogendesign erhoben wurden. Modulare Fragebogendesigns verkürzen die Länge von Fragebögen, indem Befragten jeweils verschiedene Teile des Gesamtfragebogens (Module) zugewiesen werden. Dies hilft dabei, Kosten zu senken und akzeptable Response Rates und Antwortqualität sicherzustellen. Gleichzeitig entsteht durch das Modulare Fragebogendesign eine Vielzahl geplant fehlender Werte. Eine Möglichkeit zum Umgang mit diesen fehlenden Werten ist deren Imputation. In Anbetracht der typischen Eigenschaften sozialwissenschaftlicher Umfragedaten (wie etwa überwiegend geringe Korrelationen zwischen Variablen, einer Vielzahl an Variablen, denen eine relativ kleine Stichprobe gegenübersteht, und oft vielen Variablen, die ein kategoriales Skalenniveau aufweisen) ist die Imputation solcher Daten aber besonders anspruchsvoll. In der ersten Projektphase haben wir vielversprechende Strategien identifiziert, um einer solchen Situation zu begegnen. Um jedoch den Anforderungen sozialwissenschaftlicher Befragungen bei Anwendung Modularer Fragebogendesigns gerecht zu werden, müssen die Imputationsverfahren weiter evaluiert und weiterentwickelt werden. Zum einen müssen die Verfahren mit multinomialen Variablen umgehen können, die in sozialwissenschaftlichen Befragungen weit verbreitet sind. Zweitens müssen die Verfahren in Situationen mit mehreren hundert Variablen noch besser erprobt und gegebenenfalls angepasst werden, insbesondere im Hinblick auf einen angemessenen Umgang mit potenziellem Overfitting. Um die Praxistauglichkeit der Imputationsverfahren in Szenarien mit Daten aus Modularen Fragebogendesigns zu evaluieren, muss sich die Forschung auch mit der Perspektive der Forschenden befassen, die ihre Analysen auf Basis der imputierten Daten durchführen müssen. Dies betrifft insbesondere komplexe multivariate Modelle (wie multiple Regressionen), die im sozialwissenschaftlichen Bereich häufig angewandt werden. Eine zuverlässige Schätzung solcher Modelle mit den (imputierten) Daten aus modularen Fragebogendesigns muss sichergestellt sein. Besonderes Augenmerk wird auch auf Subgruppenanalysen gelegt. Unsere Forschung berücksichtigt hierbei Strategien sowohl für eine Imputation der gesamten Daten für allgemeine Forschungszwecke als auch für einen Ansatz, bei dem sich die Imputation sehr stark an den Analysevariablen orientiert. Letzteres macht es notwendig, dass die Forschenden die fehlenden Werte selbst imputieren. Daher schlagen wir vor, unsere Forschung in einer zweiten Phase fortzusetzen, um die Kluft zwischen der bisherigen Grundlagenforschung und zukünftigen praktischen Anwendungen der Imputation in solchen Umfragen zu schließen.
DFG-Verfahren
Sachbeihilfen