Project Details
Ökonometrische Modelle für faktisch anonymisierte Individualdaten
Subject Area
Statistics and Econometrics
Term
from 2006 to 2011
Project identifier
Deutsche Forschungsgemeinschaft (DFG) - Project number 22074745
In den Wirtschafts- und Sozialwissenschaften gehört die Verwendung von Mikrodaten zum festen Bestandteil der empirischen Forschung. Oftmals können aus datenschutzrechtlichen Gründen für die Forschung interessante Originaldatensätze als scientific-use files nicht zur Verfügung gestellt werden. Einen Ausweg bieten faktisch anonymisierte Datensätze, die sich dadurch auszeichnen, dass die Wahrscheinlichkeit, eine Beobachtungseinheit zu reidentifizieren, sehr klein ist bzw. die Kosten einer Reidentifikation prohibitiv hoch sind. Die Anwendung von Anonymisierungstechniken fuhrt jedoch in aller Regel zu einer Kontaminierung der Datenstruktur, so dass sich der wahre datengenerierende Prozess nicht mehr konsistent schätzen lässt. Damit ist die Verwendung dieser Datensätze in der empirischen Wirtschafts- und Sozialforschung äußerst problematisch. Das beantragte Forschungsvorhaben verfolgt das Ziel, die Auswirkungen gängiger Anonymisierungsmethoden auf die Eigenschaften nichtlinearer Schätzmethoden zu analysieren. Es sollen Verfahren entwickelt werden, die der Kontaminierung der Originaldaten aufgrund einer Anonymisierung durch stochastische Überlagerung und/oder Data Blanking Rechnung tragen und in der Lage sind, die Parameter des wahren datengenerierenden Prozesses konsistent zu schätzen. Insbesondere sollen die Anonymisierungsverfahren dahingehend weiterentwickelt werden, dass sowohl das Ziel der faktischen Anonymisierung als auch das Ziel der Minimierung anonymisierungsbedingter Informationsreduktion erfüllt werden kann. Dabei gilt es zu berücksichtigen, dass die Kombination von Anonymisierungsverfahren und ökonometrischem Schätzverfahren ein breites Anwendungsspektrum hinsichtlich des Variablentypus abdeckt.
DFG Programme
Research Grants