Survey Nonresponse Analysis based on Social Security Administration Records
Final Report Abstract
Alle Befragungen leiden zunehmend unter Nonresponse, d.h. immer mehr zur Teilnahme an einer Befragung ausgewählte Personen können aus verschiedenen Gründen nicht befragt werden. Unterscheiden sich Nichtteilnehmer von Teilnehmern, dann sind verzerrte Schätzungen auf der Basis der erhobenen Daten möglich. In diesem Projekt konnten für eine bundesweite große Panelstudie der Bundesagentur für Arbeit umfangreiche administrative Daten für Teilnehmer und Nichtteilnehmer der Studie für detaillierte Analysen genutzt werden. Hierzu wurden erstmals die datenschutzrechfiichen und konzeptuellen Probleme einer solchen Datenzusammenführung gelöst. Dabei konnte in Zusammenarbeit mit dem Forschungsdatenzentrum der Bundesagentur für Arbeit ein entsprechender Datensatz fertiggestellt werden, der auch anderen Wissenschaftlern Zugang zu diesen Daten erlaubt. Der Datensatz ermöglicht die Berechnung des Effekts verschiedener Kategorien von Nonrespondenten auf resultierende Schätzungen. In der gesamten Nonresponseliteratur finden sich nur wenige Beispiele für die Berechnung des tatsächlichen Effekts der Ausfälle auf resultierende Schätzungen anhand bekannter Daten. Explizite Berechnungen von Effektstärkemaßen finden sich bislang nicht in der Literatur. Die hier vorgenommenen Schätzungen der Effektstärken für einzelne Nonresponse-Kategorien ist ein Alleinstellungsmerkmal dieses Projekts. Die Ergebnisse zeigen, dass es bei einigen speziellen Kategorien von Nonrespondenten bedeutende Unterschiede zwischen Teilnehmern und Nichtteilnehmern gibt. Allerdings sind die Schätzungen insgesamt kaum verzerrt. Dies liegt vor allem daran, dass sich die große Gruppe der Teilnahmeverweigerer nicht von Teilnehmern unterscheidet. Dieses Ergebnis ist sowohl für die Planung und Durchführung eines Surveys als auch für die Korrektur möglicher Verzerrungen von Bedeutung. Vorläufige Ergebnisse belegen zudem die Vermutung, dass die routinemäßige Anwendung elaborierter Korrekturverfahren nicht zwangsläufig zu besseren Schätzung führen muss als die Anwendung einfacher Korrekturverfahren. Das Projekt konnte trotz der erheblichen datenschutzrechtlichen und konzeptuellen Probleme erfolgreich abgeschlossen werden. Trotz der Beschränkung auf nur zwei Projektjahre hat die Verwendung detaillierter administrativer Daten in diesem Projekt zu einer deutlichen Verbesserung des empirischen Kenntnisstandes zu Nonresponse geführt: Die Ergebnisse des Projekts sind zum Teil überraschend, wie auch die Diskussionen im Anschluss an die Projektvorträge im Rahmen mehrerer internationaler Konferenzen zeigten.
Publications
-
(2009): Nonresponse Analysis in the German Labor Force using Individual Social Security Administration Data. Proceedings of the 20th Nonresponse Workshop, Lausanne, 2. September 2009
Gramlich, T./Schnell, R./Mosthaf, A./Bender, S.
-
(2011): Using complete administration data for nonresponse analysis: The PASS survey of low-income households in Germany. Proceedings of Statistics Canada Symposium 2010. Social Statistics: The Interplay among Censuses, Surveys and Administrative Data
Schnell, R./Gramlich, T./Mosthaf, A./Bender, S.