Detailseite
Räumlich-zeitliche endemisch-epidemische Modellierung in R
Antragsteller
Dr. Sebastian Meyer
Fachliche Zuordnung
Epidemiologie und Medizinische Biometrie/Statistik
Förderung
Förderung seit 2023
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 528691398
Infektionskrankheiten stellen eine Herausforderung für die öffentliche Gesundheit dar; die COVID-19-Pandemie ist nur ein aktuelles Beispiel. Gesundheitsbehörden und Epidemiologen sehen sich mit Fragen zur Wirksamkeit von Impfstoffen konfrontiert, ob es besonders anfällige Untergruppen in der Bevölkerung gibt, ob einige Serotypen infektiöser sind als andere und wie schnell und weit sich die Krankheit ausbreitet. Die Modellierung von Epidemien ist von zentraler Bedeutung für unser Verständnis der Ausbreitung von Infektionskrankheiten, z.B. in Bezug auf Umwelt- oder saisonale Effekte und Reproduktionszahlen. Statistische Ansätze befassen sich mit der Unsicherheit sowohl der interessierenden Parameter als auch von Vorhersagen der Inzidenz. Mit dem Ziel eines regressionsähnlichen Analysewerkzeugs wurden sogenannte endemisch-epidemische Modelle entwickelt und in den Jahren 2011-2017 im R-Paket "surveillance" implementiert: ein multivariates Zeitreihenmodell für Zähldaten ("HHH") und ein räumlich-zeitliches Punktprozessmodell für Daten auf Individualebene ("twinstim"). Beide Implementierungen erwiesen sich in ihren ursprünglichen Anwendungen als nützlich und ebenso für viele epidemiologische Studien, die von anderen Forschergruppen durchgeführt wurden, inklusive zu COVID-19, und sogar für kriminologische Modelle. Mehrere Weiterentwicklungen dieser Implementierungen sind jedoch noch nicht für eine Wiederverwendung durch Dritte integriert. So unterstützt HHH beispielsweise weder eine Verteilungsfunktion für das serielle Intervall noch kann es mit übermäßigen Nullern umgehen; beides ist nur in Teil-Abspaltungen von "surveillance" implementiert, die für Nicht-Entwickler undurchsichtig und nicht über CRAN verfügbar sind. Bei "twinstim" fehlen der Rayleigh-Kernel für das serielle Intervall und die Möglichkeit für vordefinierte Hintergrundraten. Beide Modelle unterstützen noch nicht die neuen räumlichen Datenklassen aus dem "sf"-Paket. In Anerkennung von Software als wichtiger Bestandteil von Forschung zielt dieses Projekt darauf ab, die bestehenden Implementierungen zu überarbeiten und in zwei gut dokumentierte, umfassend getestete, quelloffene R-Pakete aufzuteilen. Diese sind vollständig auf die beiden statistischen Modellierungsansätze für die Ausbreitung von Infektionskrankheiten und andere epidemische Phänomene ausgerichtet.
DFG-Verfahren
Sachbeihilfen