Detailseite
Robust and efficient multiple imputation of complex data sets
Antragsteller
Professor Dr. Jost Reinecke; Professor Dr. Martin Spieß
Fachliche Zuordnung
Empirische Sozialforschung
Förderung
Förderung von 2012 bis 2017
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 220421560
Selbst in sorgfältig durchgeführten wissenschaftlichen Umfragen treten fehlende Werte auf. Valide Inferenzen basierend auf unvollständig beobachteten Datensätzen sind aber nur möglich, wenn das Problem fehlender Werte angemessen behandelt wird. Eine zunehmend auch von Bereitstellern öffentlich nutzbarer Datensätze akzeptierte Methode zur Kompensation fehlender Werte ist die Methode der multiplen Imputation. Verfügbare modell-basierte Techniken zur Erzeugung multipler Imputationen sind beschränkt auf parametrische Modelle, die wenn fehlspezifiziert, zu unnötig ungenauen oder sogar verzerrten Inferenzen führen können. Darüber hinaus sind die verfügbaren Programme nicht zur Imputation großer, komplexer Datensätze mit Clusterstrukturen oder Paneldatensätze vorgesehen. Im beantragten Projekt werden Prozeduren zur Erzeugung multipler Imputationen enweitert, um, basierend auf einem approximativen Bayes-Ansatz, eine effiziente und robuste multiple Imputation komplexer Datensätze und damit valide und genauere Inferenzen zu ermöglichen. Weiterhin sollen, auf der Basis existierender und im Projekt zu entwickelnder Programme (aufrufbar in R), Richtlinien zum Umgang mit der Methode der multiplen Imputation, insbesondere im Hinblick auf mögliche, in der Literatur diskutierte Grenzen, erabeitet und veröffentlicht werden. Die Notwendigkeit der zu entwickelnden Erweiterungen wird anhand inhaltlicher Anwendungen und mit Hilfe realer Datensätze illustriert werden. Die Imputations-Programme werden der wissenschaftliche Öffentlichkeit zur Verfügung gestellt.
DFG-Verfahren
Sachbeihilfen