GAMLSS for biostatistical regression modeling. Refinements and Further Developments
Final Report Abstract
Die Projektarbeiten sind in ihrer Mehrzahl dem Themenbereich der Modellbildung, Inferenz und Prognose in komplexen biostatistischen Regressionsmodellen zuzuordnen. So befassten sich mehrere im Projekt entstandene Arbeiten mit der inferenzstatistischen Weiterentwicklung von GAMLSS (insbesondere mit der Entwicklung von Hypothesentests im Kontext der Modellanpassung mittels Gradienten-Boosting) sowie mit der Entwicklung und Implementierung von GAMLSS für beschränkte stetige Zielgrößen. Ebenso befassten sich mehrere Arbeiten, anknüpfend an die Forschungsergebnisse der Vorgängerprojekts, mit der Integration und Weiterentwicklung von AUC-Methoden in Modellwahlverfahren für Überlebenszeitzielgrößen (z.B. durch Verbesserung der Prognose-Eigenschaften und -Messung von Gradienten-Boosting-Methoden und Random Survival Forests sowie zeitdiskreten Überlebenszeitmodellen). Im GAMLSS- Kontext entstand weiterhin eine Arbeit zur datengesteuerten Modellwahl für „Joint models for longitudinal and time-to-event data“ mittels Gradienten-Boosting. Sämtliche Verfahren wurden von den ProjektmitarbeiterInnen und ihren KooperationspartnerInnen in der Open-Source-Software R implementiert und frei verfügbar gemacht. Darüber hinaus haben die im Projekt entwickelten statistischen Methoden Eingang in eine Reihe von klinisch-epidemiologischen Fragestellungen gefunden, beispielsweise in Regressionsanalysen zur Erforschung von DNA-Methylierungsmustern in epigenomweiten Studien, zur Erforschung des longitudinalen Verhaltens der Lungenfunktion von Mukoviszidose-PatientInnen und zur Erforschung der Determinanten von Lebensqualität in PatientInnen mit initial mittelgradiger Nierenerkrankung. Somit repräsentieren die Projektergebnisse sowohl eine Erweiterung des biostatistischen Methodenspektrums im Kontext von GAMLSS als auch die unmittelbare Anwendbarkeit der neu entwickelten und implementierten Regressionsverfahren auf klinisch-epidemiologische Fragestellungen.
Publications
-
(2016): A statistical model for the analysis of beta values in DNA methylation studies. BMC Bioinformatics 17:480
Weinhold, L., S. Wahl, S. Pechlivanis, P. Hoffmann and M. Schmid
-
(2016): Approaches to regularized regression – a comparison between gradient boosting and the lasso. Methods of Information in Medicine 55 (5), 422-430
Hepp, T., M. Schmid, O. Gefeller, E. Waldmann and A. Mayr
-
(2016): Boosting the discriminatory power of sparse survival models via optimization of the concordance index and stability selection. BMC Bioinformatics 17:288
Mayr, A., B. Hofner and M. Schmid
-
(2016): On the use of Harrell’s C for clinical risk prediction via random survival forests. Expert Systems with Applications 63, 450-459
Schmid, M., M. N. Wright and A. Ziegler
-
(2016): The residual-based predictiveness curve: A visual tool to assess the performance of prediction models. Biometrics 72 (2), 392-401
Casalicchio, G., B. Bischl, A.-L. Boulesteix and M. Schmid
-
(2017): An update on statistical boosting in biomedicine. Computational and Mathematical Methods in Medicine 2017, Article ID 6083072
Mayr, A., B. Hofner, E. Waldmann, T. Hepp, S. Meyer and O. Gefeller
-
(2017): Boosting joint models for longitudinal and time-to-event data. Biometrical Journal 59 (6), 1104-1121
Waldmann, E., D. Taylor-Robinson, N. Klein, T. Kneib, T. Pressler, M. Schmid and A. Mayr
-
(2018): Discrimination measures for discrete time-to-event predictions. Econometrics and Statistics 7, 153-164
Schmid, M., G. Tutz and T. Welchowski
-
(2018): The betaboost package – a software tool for modelling bounded outcome variables in potentially high-dimensional epidemiological data. International Journal of Epidemiology 47 (5), 1383-1388
Mayr, A., L. Weinhold, B. Hofner, S. Titze, O. Gefeller and M. Schmid
-
(2019): Correlation-adjusted regression survival scores for high-dimensional variable selection. Statistics in Medicine 38 (13), 2413-2427
Welchowski, T., V. Zuber and M. Schmid
-
(2019): Significance tests for boosted location and scale models with linear base-learners. The International Journal of Biostatistics 15 (1), 20180110
Hepp, T., M. Schmid and A. Mayr