In silico prediction of the disease-causing potential of extragenic DNA variants
Final Report Abstract
Ziel des Projekts war die Entwicklung einer Software zur verläßlichen Vorhersage des Krankheitspotentials von DNA-Varianten außerhalb proteinkodierender Gene. Leider sind – entgegen unserer Erwartungen vor Projektbeginn – nach wie vor nur wenige derartige Krankheitsmutationen bekannt. Eine automatische Klassifizierung dieser 'extratranskriptischen' Varianten wäre deshalb durch ein 'Overfitting' an die wenigen bekannten Krankheitsmutationen, die zum großen Teil phylogenetisch hoch konserviert sind und genau deshalb experimentell validiert wurden, problematisch gewesen. Wir konnten jedoch trotzdem drei Computerprogramme erstellen, die Teilaufgaben in der Bewertung des Krankheitspotentials von DNA-Varianten abbilden. 1) ePOSSUM (https://www.mutationdistiller.org/ePOSSUM2/). Diese Software dient der Bestimmung des Effekts von DNA-Varianten im Promotorbereich von Genen auf die Bindung von Transkriptionsfaktoren und somit auf die Genexpression. 2) MutationDistiller (https://www.mutationdistiller.org/). MutationDistiller verbindet die Beurteilung des Effekts von DNA-Varianten in proteinkodierenden Genen durch MutationTaster mit der möglichen Rolle der betroffenen Gene in der Pathogenese einer spezifischen Krankheit. Die Software erlaubt es prinzipiell, WGS Daten zu analysieren, Vorhersagen können aber aus den o.g. Gründen derzeit nur für Varianten innerhalb proteinkodierender Gene getroffen werden. Die Software richtet sich explizit in erster Linie an Ärztinnen und Ärzte, die so in die Lage versetzt werden, ihre NGS-Daten ohne die Hilfe von Bioinformatiker(inne)n selber auszuwerten. Mit Hilfe dieser Software wurden bis zum September 2019 schon mehr als 15.000 Projekte analysiert. Dabei handelt es sich meist nicht um Whole Genome sondern um kostengünstigere Whole Exome Sequenzierungen. 3) RegulationSpotter (https://www.regulationspotter.org/). Aufgrund der oben beschriebenen Umzulänglichkeit einer automatischen Klassifizierung haben wir uns entschlossen, eine Software zu konstruieren, die den Benutzer(inne)n auf komfortable Weise anzeigt, welche regulatorischen genomischen Elemente durch eine DNA- Variante in ihrer Funktion beeinträchtigt werden könnten. Dieses Computerprogramm ist schon explizit für WGS ausgelegt. Alle hier genannten Computerprogramme sind web-basiert und kostenlos nutzbar. Sie wurden von mehreren Mitarbeiter(inne)n meiner Arbeitsgruppe auf zahlreichen Konferenzen präsentiert und werden weltweit genutzt.
Publications
-
A systematic, large-scale comparison of transcription factor binding site models. BMC Genomics. 2016 May 21;17:388
Hombach D, Schwarz JM, Robinson PN, Schuelke M, Seelow D
-
Variant Pathogenicity. In: Peter N. Robinson, Rosario Michael Piro, Marten Jäger, (Hrsg.) Computational Exome and Genome Analysis. Chapman and Hall/CRC in Taylor & Francis Group of Informa; 2017; S.329-45
Seelow,D; Robinson PN
-
MutationDistiller: user-driven identification of pathogenic DNA variants. Nucleic Acids Res. 2019 Jul 2;47(W1):W114-W120
Hombach D, Schuelke M, Knierim E, Ehmke N, Schwarz JM, Fischer-Zirnsak B, Seelow D
-
RegulationSpotter: annotation and interpretation of extratranscriptic DNA variants. Nucleic Acids Res. 2019 Jul 2;47(W1):W106-W113
Schwarz JM, Hombach D, Köhler S, Cooper DN, Schuelke M, Seelow D