Detailseite
Weiterentwicklungen der GAMLSS-Methodik für die Modellierung von biomedizinischen Daten
Antragsteller
Professor Dr. Matthias Schmid
Fachliche Zuordnung
Epidemiologie und Medizinische Biometrie/Statistik
Förderung
Förderung von 2012 bis 2020
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 217090301
Vor dem Hintergrund der Entwicklung individualisierter Therapieformen und Diagnoseverfahren hat die Analyse von hochdimensionalen Daten in der biomedizinischen Forschung zunehmend an Bedeutung gewonnen. Eine wichtige Aufgabe der statistischen Methodenforschung ist es daher, aus verschiedenen Datenquellen und hochdimensionalen Datenstrukturen relevante Informationen zu extrahieren und sie mit Hilfe von Lern- und Modellierungsverfahren in akkurate Vorhersagemodelle zu integrieren. Zu diesem Zweck wurden im Vorgänger Projekt Verfahren zur Erstellung von AUC-optimierten Prognoseformeln für binäre und zensierte klinische Zielgrößen entwickelt.Mit der wachsenden Genauigkeit der Erfassung von klinisch-anamnestischen Merkmalen in biomedizinischen Studien sowie der Weiterentwicklung von Technologien zur Generierung molekularer Daten werden BiometrikerInnen zunehmend mit der Herausforderung konfrontiert, über rein datengesteuerte statistische Methoden hinaus Verfahren zu entwickeln, die bereits erworbenes Vorwissen in die Entwicklung von Prognoseformeln integrieren. Somit besteht die Aufgabe, die in der ersten Förderphase entwickelten datengesteuerten Methoden zur Prognoseoptimierung mit der Optimierung von Regressionsmodellen zu verbinden, die entsprechend des bestehenden Vorwissens angepasst werden können.Ein vielversprechendes Verfahren zur Erreichung dieses Ziels stellt die GAMLSS-Methodik dar, die die flexible Modellierung einer Vielzahl von stetigen und kategoriellen Zielgrößen erlaubt und daher die zentrale Grundlage des nun beantragten Folgeprojekts ist. Beispielsweise lassen sich mit Hilfe von GAMLSS Mittelwert- und Varianzstrukturen fast beliebig flexibel gemäß vorhandenem Vorwissen spezifizieren, während gleichzeitig bereits in der ersten Projektphase entwickelte statistische Verfahren zur Merkmalsselektion in GAMLSS verfügbar sind.Allerdings weist die GAMLSS-Methodik nach wie vor eine Reihe von Limitationen auf, die ihren breiten Einsatz in der klinisch-epidemiologischen Forschung bislang verhindern. Diese betreffen vor allem die Konstruktion von validen Hypothesentests sowie die Nicht-Berücksichtigung der Schätzunsicherheit bei der Erstellung von Prognoseintervallen mittels GAMLSS. Zudem fehlen Erweiterungen der GAMLSS-Methodik auf Modelle mit mehrdimensionalen Zielgrößen. Ziel des beantragten Projekts ist daher, die vorgenannten Limitationen der GAMLSS-Methodik systematisch zu analysieren sowie Lösungs- und Korrekturansätze zu entwickeln.Die Evaluation der zu entwickelnden methodischen Ansätze soll auch die Beurteilung der Praxistauglichkeit der Verfahren im klinisch-epidemiologischen Kontext umfassen. Letztere soll auf der Basis von Datensätzen aus laufenden Studienprojekten der Antragsteller erfolgen. Die neu entwickelten Methoden sollen ¿ wie bereits in der ersten Projektphase ¿ zudem mit Hilfe geeigneter Software implementiert und einem breiten Kreis von Anwendern zugänglich gemacht werden.
DFG-Verfahren
Sachbeihilfen
Mitverantwortlich
Professor Dr. Olaf Gefeller