Detailseite
Identifikation von Kohorten-übergreifenden und Variablen-stabilen prognostischen Modellen in der Überlebenszeitanalyse mit Methoden der modellbasierten Optimierung
Antragsteller
Professor Dr. Bernd Bischl; Professor Dr. Jörg Rahnenführer
Fachliche Zuordnung
Epidemiologie und Medizinische Biometrie/Statistik
Förderung
Förderung von 2016 bis 2020
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 289820878
Ziel ist die Entwicklung von neuen statistischen Methoden zur Kohorten-übergreifenden und Selektions-stabilen Modellselektion in der Überlebenszeitanalyse. Die Anzahl an Vorhersagemethoden für Überlebenszeitdaten basierend auf klinischen und auf hochdimensionalen genetischen Daten ist enorm groß, und das beste Modell hängt oft von der verwendeten Patientenkohorte ab. Mit modernen Methoden der modellbasierten Optimierung können effizient mit deutlich reduzierten Laufzeiten für einzelne Kohorten jeweils spezifisch die besten Modelle bestimmt werden. Diese Modelle haben zwei Nachteile. Erstens sind sie überspezialisiert für die Lernkohorte und haben daher oft keine gute Prognosequalität auf unabhängigen Kohorten. Zweitens werden auf verschiedenen Kohorten mit gleicher biomedizinischer Fragestellung in der Regel aufgrund der inhärenten Redundanz in den genetischen Messungen unterschiedliche Variablen selektiert. Für eine höhere Generalisierbarkeit sollen in diesem Projekt Methoden entwickelt werden, um Modelle zu identifizieren, welche gleichzeitig Kohorten-übergreifend und Selektions-stabil Vorhersagen mit guter Prognosequalität liefern. Ein durch eine solche multikriterielle Betrachtung gefundenes Modell muss dann noch mit den spezialisierten Modellen verglichen werden, um den Güteverlust durch die zusätzlichen Stabilitätskriterien zu bewerten. Die Reproduzierbarkeit kann durch die Einbindung von öffentlich frei zugänglichen Experiment-Datenbanken deutlich verbessert werden, da Vergleichsstudien von Vorhersagemethoden damit nachvollziehbar und transparent kollaborativ erweitert werden können. Ergebnis der Arbeiten werden Modelle sein, die prognostisch relevant sind und durch die stabile Variablenauswahl eine biologische Interpretation der genetischen Merkmale erlauben.
DFG-Verfahren
Sachbeihilfen