Project Details
Filemerge using error prone strings
Applicant
Professor Dr. Rainer Schnell
Subject Area
Empirical Social Research
Term
from 2001 to 2005
Project identifier
Deutsche Forschungsgemeinschaft (DFG) - Project number 5369360
Sowohl in der Sozial-Epidemiologie als auch in den Sozialwissenschaften allgemein werden die meisten Daten im Rahmen empirischer Datenerhebungen durch standardisierte Interviews gewonnen. Durch die zunehmende Nutzung von Informationstechnologien hat in den letzten Jahren allerdings der Austausch von Informationen zwischen verschiedenen Datenbanken ("record match") an Bedeutung für die Entstehung von Datensätzen gewonnen. Dabei werden Daten aus verschiedenen Datenbanken über einen gemeinsamen Schlüssel (z.B. die Sozialversicherungsnummer) zusammengeführt. Solange die verwendeten Schlüssel fehlerfrei sind, ist die Zusammenführung der Daten technisch unproblematisch. Probleme entstehen, wenn die Schlüssel Fehler aufweisen, z.B. Namen falsch geschrieben werden. Das Ziel des Projekts ist die Entwicklung und Evaluierung eines Computerprogramms, das die Zusammenführung von Personendaten aus verschiedenen Datenbanken auch bei fehlerhaften Schlüsseln ermöglicht. Bestehende Programme sind ungeeignet, da sie nicht auf die deutsche Phonetik adapiert sind. Langfristig soll das zu entwickelnde Programm die Durchführung empirischer Forschungsprojekte auf der Basis dieser für die Sozialwissenschaft bislang unüblichen Datengewinnungsmethode erleichtern.
DFG Programme
Research Grants