Detailseite
Kausale Modellselektion für Kohortendaten
Antragstellerin
Professorin Dr. Vanessa Didelez
Fachliche Zuordnung
Epidemiologie und Medizinische Biometrie/Statistik
Mathematik
Mathematik
Förderung
Förderung von 2017 bis 2021
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 389238860
Das Vorhaben beabsichtigt Methoden der kausalen Modellselektion (Causal Discovery) für die Analyse von Kohortendaten zu entwickeln, damit der Informationsgehalt von Kohortendaten besser ausgeschöpft werden kann als mit üblichen statistischen Verfahren. Kohortenstudien sind in der epidemiologischen oder soziologischen Erforschung von Lebensabläufen eine wichtige Informationsquelle, u.a. um späte Folgen einer Exposition in jungen Jahren abzuschätzen. Causal Discovery Methoden befinden sich an der Schnittstelle zwischen Informatik und Statistik. Dabei wird der Datensatz unter Ausnutzung spezieller Annahmen statistisch dahin gehend ausgewertet, dass idealerweise alle kausalen Zusammenhänge zwischen den Variablen einem Graph zu entnehmen sind. Obwohl Causal Discovery Methoden momentan vor allem im Big Data Kontext vermehrt eingesetzt werden, gibt es bisher keine entsprechenden Verfahren, die speziell auf Kohortendaten ausgerichtet oder direkt dafür geeignet sind. Das hier vorgeschlagene Vorhaben möchte diese Lücke durch die Bearbeitung der folgenden Arbeitspakete schließen:(1) Die Formulierung und Untersuchung einer neue Modellklasse der kausalen Kohortengraphen (CCGs), sowie die Entwicklung dafür geeigneter und effizienter Modellselektionsverfahren.(2) Die Entwicklung neuer statistischer Ansätze zur kausalen Modellselektion, welche die speziellen Probleme mit Kohortendaten lösen, vor allem Methoden für fehlende Werte.(3) Das Erstellen eines Leitfadens zur praktischen Anwendung (inkl. Empfehlungen und Warnungen) sowie die Programmierung einer bedienungsfreundlichen Software, damit die neuen Methoden eine weit verbreitete Anwendung finden können. Da Causal Discovery für Kohortendaten einen fundamental anderen Ansatz verfolgt als die üblichen statistischen Verfahren, eröffnet sich die Möglichkeit, gänzlich neue Grundlagenerkenntnisse zu gewinnen, die z.B. für neue Ansätze in zukünftigen Interventionsstudien genutzt werden können. Letztlich kann unser Verfahren dadurch einen vielversprechenden Beitrag zur öffentlichen Gesundheitsversorgung und zur medizinischen Entscheidungsfindung leisten.
DFG-Verfahren
Sachbeihilfen