Project Details
Projekt Print View

GAMLSS for biostatistical regression modeling. Refinements and Further Developments

Subject Area Epidemiology and Medical Biometry/Statistics
Term from 2012 to 2020
Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 217090301
 
Final Report Year 2020

Final Report Abstract

Die Projektarbeiten sind in ihrer Mehrzahl dem Themenbereich der Modellbildung, Inferenz und Prognose in komplexen biostatistischen Regressionsmodellen zuzuordnen. So befassten sich mehrere im Projekt entstandene Arbeiten mit der inferenzstatistischen Weiterentwicklung von GAMLSS (insbesondere mit der Entwicklung von Hypothesentests im Kontext der Modellanpassung mittels Gradienten-Boosting) sowie mit der Entwicklung und Implementierung von GAMLSS für beschränkte stetige Zielgrößen. Ebenso befassten sich mehrere Arbeiten, anknüpfend an die Forschungsergebnisse der Vorgängerprojekts, mit der Integration und Weiterentwicklung von AUC-Methoden in Modellwahlverfahren für Überlebenszeitzielgrößen (z.B. durch Verbesserung der Prognose-Eigenschaften und -Messung von Gradienten-Boosting-Methoden und Random Survival Forests sowie zeitdiskreten Überlebenszeitmodellen). Im GAMLSS- Kontext entstand weiterhin eine Arbeit zur datengesteuerten Modellwahl für „Joint models for longitudinal and time-to-event data“ mittels Gradienten-Boosting. Sämtliche Verfahren wurden von den ProjektmitarbeiterInnen und ihren KooperationspartnerInnen in der Open-Source-Software R implementiert und frei verfügbar gemacht. Darüber hinaus haben die im Projekt entwickelten statistischen Methoden Eingang in eine Reihe von klinisch-epidemiologischen Fragestellungen gefunden, beispielsweise in Regressionsanalysen zur Erforschung von DNA-Methylierungsmustern in epigenomweiten Studien, zur Erforschung des longitudinalen Verhaltens der Lungenfunktion von Mukoviszidose-PatientInnen und zur Erforschung der Determinanten von Lebensqualität in PatientInnen mit initial mittelgradiger Nierenerkrankung. Somit repräsentieren die Projektergebnisse sowohl eine Erweiterung des biostatistischen Methodenspektrums im Kontext von GAMLSS als auch die unmittelbare Anwendbarkeit der neu entwickelten und implementierten Regressionsverfahren auf klinisch-epidemiologische Fragestellungen.

Publications

  • (2016): A statistical model for the analysis of beta values in DNA methylation studies. BMC Bioinformatics 17:480
    Weinhold, L., S. Wahl, S. Pechlivanis, P. Hoffmann and M. Schmid
    (See online at https://doi.org/10.1186/s12859-016-1347-4)
  • (2016): Approaches to regularized regression – a comparison between gradient boosting and the lasso. Methods of Information in Medicine 55 (5), 422-430
    Hepp, T., M. Schmid, O. Gefeller, E. Waldmann and A. Mayr
    (See online at https://doi.org/10.3414/ME16-01-0033)
  • (2016): Boosting the discriminatory power of sparse survival models via optimization of the concordance index and stability selection. BMC Bioinformatics 17:288
    Mayr, A., B. Hofner and M. Schmid
    (See online at https://doi.org/10.1186/s12859-016-1149-8)
  • (2016): On the use of Harrell’s C for clinical risk prediction via random survival forests. Expert Systems with Applications 63, 450-459
    Schmid, M., M. N. Wright and A. Ziegler
    (See online at https://doi.org/10.1016/j.eswa.2016.07.018)
  • (2016): The residual-based predictiveness curve: A visual tool to assess the performance of prediction models. Biometrics 72 (2), 392-401
    Casalicchio, G., B. Bischl, A.-L. Boulesteix and M. Schmid
    (See online at https://doi.org/10.1111/biom.12455)
  • (2017): An update on statistical boosting in biomedicine. Computational and Mathematical Methods in Medicine 2017, Article ID 6083072
    Mayr, A., B. Hofner, E. Waldmann, T. Hepp, S. Meyer and O. Gefeller
    (See online at https://doi.org/10.1155/2017/6083072)
  • (2017): Boosting joint models for longitudinal and time-to-event data. Biometrical Journal 59 (6), 1104-1121
    Waldmann, E., D. Taylor-Robinson, N. Klein, T. Kneib, T. Pressler, M. Schmid and A. Mayr
    (See online at https://doi.org/10.1002/bimj.201600158)
  • (2018): Discrimination measures for discrete time-to-event predictions. Econometrics and Statistics 7, 153-164
    Schmid, M., G. Tutz and T. Welchowski
    (See online at https://doi.org/10.1016/j.ecosta.2017.03.008)
  • (2018): The betaboost package – a software tool for modelling bounded outcome variables in potentially high-dimensional epidemiological data. International Journal of Epidemiology 47 (5), 1383-1388
    Mayr, A., L. Weinhold, B. Hofner, S. Titze, O. Gefeller and M. Schmid
    (See online at https://doi.org/10.1093/ije/dyy093)
  • (2019): Correlation-adjusted regression survival scores for high-dimensional variable selection. Statistics in Medicine 38 (13), 2413-2427
    Welchowski, T., V. Zuber and M. Schmid
    (See online at https://doi.org/10.1002/sim.8116)
  • (2019): Significance tests for boosted location and scale models with linear base-learners. The International Journal of Biostatistics 15 (1), 20180110
    Hepp, T., M. Schmid and A. Mayr
    (See online at https://doi.org/10.1515/ijb-2018-0110)
 
 

Additional Information

Textvergrößerung und Kontrastanpassung