Detailseite
Integration weiterer Mikrodatenbestände in den Basisdatensatz
Antragsteller
Professor Dr. Ralf Münnich; Professor Dr. Rainer Schnell
Fachliche Zuordnung
Empirische Sozialforschung
Förderung
Förderung von 2018 bis 2024
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 316511172
Grundlage für die Durchführung kleinräumig gegliederter Mikrosimulationen ist eine geeignete Basispopulation. Diese muss individuelle und geographische Strukturen realitätsnah abbilden.Teilprojekt 1 (TP 1) konzentriert sich auf die Erstellung eines Grunddatenbestandes, der auf Register- und Zensusdaten basiert. Hierbei werden zusätzlich Variablen zur Grundschulsimulation unter Verwendung weiterer Datenquellen implementiert. TP 2 befasst sich mit einer umfassenden Erweiterung des Datenbestandes, um Simulationen in den Themenbereichen Pflege und Migration, welche in den Teilprojekten 4 und 5 erforscht werden, durchzuführen zu können.Für diese Datensatzerweiterung wird ein Methodenbaukasten aufgebaut und erweitert, der es über die beiden Themenbereiche hinaus erlaubt, weitere themenbezogene Variablenkomplexe in die Simulationsinfrastruktur zu integrieren. Dabei sollen die Mikrostrukturen in Form individueller Merkmalskombinationen und Haushaltszusammenhänge bestmöglich berücksichtigt werden. Hierbei werden insbesondere Methoden der synthetischen Datenerzeugung angewendet.Insgesamt muss im Datengenerierungsprozess zwischen Mikro- und Makrostrukturen unterschieden werden. Dabei ist auf eine Harmonisierung beider Ebenen in der Datengenerierung zu achten. Für die Erfassung solcher Strukturen werden sowohl sozialwissenschaftliche Erhebungen wie der Mikrozensus oder das SOEP, als wie auch weitere themenspezifisch benötigte Datensätze verwendet. Zusätzlich soll der Datenbestand regionale Unterschiede abbilden, welche grundlegend für die Durchführung geographisch differenzierter Mikrosimulationen sind. Da in vielen Erhebungen regional differenzierte Größen aufgrund geringer Teilstichprobenumfänge nur in unzureichender Qualität verfügbar sind, werden spezielle statistische Verfahren der Small Area Methoden herangezogen.Die gesamte Erweiterung wird über drei grundlegende Prozesse durchgeführt. Im Modellierungsprozess werden die Variablenstrukturen bestmöglich erfasst und anschließend im Prädiktionsprozess dem bestehenden Datenbestand beigefügt. Im Validierungsprozess werden sowohl die geschätzten Modelle wie auch die erzeugten Verteilungen überprüft. Dies wird sowohl individuell für die ergänzten Variablen wie auch multivariat für die gesamte Basispopulation durchgeführt.Zur Gewährleistung der Plausibilität des gesamten Datenbestandes finden verschiedene Methoden des statistischen und logischen Editings Verwendung. Das gesamte Methodenprogramm soll im Sinne von Open and Reproducible Research der Forschungsöffentlichkeit zugänglich gemacht werden.
DFG-Verfahren
Forschungsgruppen