Detailseite
Projekt Druckansicht

Baum-basierte, hybride Regression zur Modellierung von biomedizinischen Daten

Antragsteller Dr. Moritz Berger
Fachliche Zuordnung Epidemiologie und Medizinische Biometrie/Statistik
Förderung Förderung seit 2020
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 456235587
 
Statistische Lernverfahren bilden eine wichtige Grundlage für die Auswertung klinischer und epidemiologischer Daten. Eine zentrale Fragestellung ist oftmals die Modellierung des Zusammenhangs zwischen einer Vielzahl an erklärenden Variablen und einer interessierenden, abhängigen Variablen (Zielvariable). Dies kann durch sogenannte überwachte Lernverfahren untersucht werden. Klassische überwachte Lernverfahren stellen generalisierte, lineare Regressionsmodelle (GLMs) und Baum-basierte Methoden (Bäume) dar. Die große Bedeutung dieser Methoden spiegelt sich z.B. in zahlreichen Studien des Universitätsklinikums Bonn wider. Gegenstand des geplanten Projekts sind hybride Regressionsmodelle, die klassische GLMs und Bäume kombinieren. Diese Vorgehensweise ist besonders vielversprechend, da sie zu sparsamen und flexiblen Modellen führt, die (i) mit hochdimensionalen Variablenräumen umgehen können, (ii) mögliche nicht-lineare Effekte der erklärenden Variablen auf die Zielvariable erfassen können, und (iii) relevante Interaktionen zwischen den erklärenden Variablen extrahieren können. Ziel des beantragten Forschungsprojekts ist die Weiterentwicklung der bereits in verschiedenen Vorarbeiten vorgeschlagenen Klasse hybrider, Baum-basierter Regressionsmodelle. Dies beinhaltet einerseits die Erweiterung der Modellklasse auf neue Fragestellungen bzw. Anwendungsbereiche, die mit anders gelagerten Datensituationen einhergehen, und andererseits die Entwicklung neuer Strategien zur Stabilisierung der Modellanpassung und zur Berechnung von Vertrauensbereichen.Im Zuge der statistisch-methodischen Entwicklungen ist geplant, die Implementierungen mittels geeigneter Software (durch Ergänzung der existierenden Programmpakete) kostenfrei zur Verfügung zu stellen. Des Weiteren soll der Mehrwert der entwickelten Modelle mit Hilfe von umfangreichen Simulationen und auf Basis ausgewählter, klinischer und epidemiologischer Studiendaten (u.a. des Universitätsklinikums Bonn) untersucht werden.
DFG-Verfahren Sachbeihilfen
Mitverantwortlich Professor Dr. Matthias Schmid
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung