Ökonometrische Modelle für faktisch anonymisierte Individualdaten
Final Report Abstract
In den Wirtschafts- und Sozialwissenschaften gehört die Verwendung von Mikrodaten zum festen Bestandteil der empirischen Forschung. Oftmals können aus datenschutzrechtlichen Gründen für die Forschung interessante Originaldatensätze als scientific-use files nicht zur Verfügung gestellt werden. Einen Ausweg bieten faktisch anonymisierte Datensätze, die sich dadurch auszeichnen, dass die Wahrscheinlichkeit, eine Beobachtungseinheit zu reidentifizieren, sehr klein ist bzw. die Kosten einer Reidentifikation prohibitiv hoch sind. Die Anwendung von Anonymisierungstechniken führt jedoch in aller Regel zu einer Kontaminierung der Datenstruktur, so dass sich der wahre datengenerierende Prozess nicht mehr konsistent schätzen lässt. Damit ist die Verwendung dieser Datensätze in der empirischen Wirtschafts- und Sozialforschung äußerst problematisch. Das geförderte Forschungsvorhaben verfolgte das Ziel, die Auswirkungen gängiger Anonymisierungsmethoden auf die Eigenschaften nichtlinearer Schätzmethoden zu analysieren. Es sollten Verfahren entwickelt werden, die der Kontaminierung der Originaldaten aufgrund einer Anonymisierung durch stochastische Überlagerung und/oder Data Blanking Rechnung tragen und in der Lage sind, die Parameter des wahren datengenerierenden Prozesses konsistent zu schätzen. Insbesondere wurden die Anonymisierungsverfahren dahingehend weiterentwickelt werden, dass sowohl das Ziel der faktischen Anonymisierung als auch das Ziel der Minimierung der durch Anonymisierung erzeugten Informationsreduktion für die empirische Forschung erfüllt werden kann. Dabei galt es zu berücksichtigen, dass die Kombination von Anonymisierungsverfahren und ökonometrischem Schätzverfahren ein breites Anwendungsspektrum hinsichtlich des Variablentypus abdeckt. Das Forschungsvorhaben war eng verknüpft mit den Aktivitäten des wissenschaftlichen Begleitkreises „Faktische Anonymisierung wirtschaftsstatistischer Daten“ des statistischen Bundesamtes. Dier Ergebnisse des Projekts sind neben den wissenschaftlichen Veröffentlichungen somit auch in die wissenschaftliche Beratung eingeflossen.
Publications
- (2005): “Econometrics of Anonymized Micro Data”. Jahrbücher für Nationalökonomie und Statistik (Journal of Economics and Statistics), 225, special issue
Pohlmeier, W., G. Ronning and J. Wagner
- (2006): “Combining Blanking and Noise Addition as a Data Disclosure Limitation Method”. In: Domingo-Ferrer, J. and Franconi, L: Privacy in Statistical Databases, 152-163, Springer Verlag Lecture Notes in Computer Science, LNCS 4302
Flossmann, A, und S. Lechner
- (2007): “Bicameral Conflict Resolution in the European Union: An Empirical Analysis of Conciliation Committee Bargains”. British Journal of Political Science, 37, 281-312
Koenig, T, B. Lindberg, S. Lechner und W. Pohlmeier
- (2007): “The multiplicative Simulation Extrapolation Approach”. Working Paper, University of Konstanz
Nolte, S
- (2007): “Ökonometrische Analyse mit anonymisierten Mikrodaten”. In: Zwick, M. und J. Merz: MITAX -Mikroanalysen und Steuerpolitik, 183-193, Statistisches Bundesamt, Band 7, Wiesbaden
Lechner, S, und W. Pohlmeier
- (2008): “Make Assurance Double Sure: Combination of Two Disclosure Limitation Methods and estimation of General Regression Models”. ASTA Advances in Statistical Analysis, 92(4), 405-422
Flossmann, A, und S. Nolte
- (2008): “Measurement Error in Nonlinear Regression Models: An Application to Disclosure Limitation Techniques”. Dissertation, University of Konstanz
Nolte, S
- (2008): “Microeconometrics and Disclosure Control”. Advances in Statistical Analysis, 92 (4), special issue
Pohlmeier, W., and G. Ronning
- (2008): “Multiplicative Measurement Error and the Simulation Extrapolation Method”. IAW-Diskussionspapier, N° 39
Biewen, E, S. Nolte und R. Rosemann
- (2008): “Perturbation by Multiplicative Noise and the Simulation Extrapolation Method”. ASTA Advances in Statistical Analysis, 92(4), 375- 389
Biewen, E, S. Nolte und R. Rosemann