Detailseite
Projekt Druckansicht

Community-zentriertes open-source Framework für die Analyse von großen Tandem-Massenspektrometriedaten

Fachliche Zuordnung Bioinformatik und Theoretische Biologie
Medizininformatik und medizinische Bioinformatik
Förderung Förderung seit 2023
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 528775510
 
Tandem-Massenspektrometrie (MS/MS) ist ein zentrales Werkzeug in der modernen Molekularbiologie und ermöglicht die Detektion und strukturelle Identifikation und Quantifizierung von Biomolekülen mit hoher Genauigkeit und Spezifität. In den letzten beiden Jahrzehnten kam es zu umfangreichen Weiterentwicklungen hin zu Hochauflösung-Tandem-Massenspektrometrie (HRMS/MS) sowie erhöhten Durchsatzraten. Das daraus resultierende schnelle Wachstum von Größe und Anzahl der Datensätze schafft völlig neue Möglichkeiten für die Wissensgewinnung, erfordert jedoch neue computergestützte Tools und Methoden. Derzeit sehen wir jedoch eine fragmentierte Landschaft von HRMS/MS-Datenanalysemethoden, so dass viele Forscher eigene Ad-hoc-Lösungen entwickeln, anstatt auf robuste, zuverlässige, zugängliche Tools zu setzen. Wir glauben, dass matchms, eine von uns im Mai 2020 erstmals veröffentlichte Open-Source-Python-Bibliothek, solch ein zentralen Framework im Bereich der HRMS/MS-Datenanalyse werden kann. Matchms sowie mehrere ergänzende Bibliotheken für hochmoderne HRMS/MS-Datenanalyse (z.B. Spec2Vec, MS2DeepScore) wurden gemäß hoher Code-Standards und bewährten Best Practices für Softwareentwicklung entwickelt. Dies manifestiert sich zum Beispiel in einer sehr hohen Testabdeckung, einem sauberen Code-Design und umfangreicher Dokumentation. Gleichzeitig wurde die Entwicklung von tatsächlichen wissenschaftlichen Forschungsfragen geleitet, was bereits zu einer breiten Bekanntheit unter Entwickler*innen im Bereich Computational Metabolomics und Cheminformatics geführt hat. Matchms ist ein leistungsstarkes Tool für die HRMS/MS-Analyse, hat jedoch zwei wesentliche Einschränkungen, die wir mit dem vorgeschlagenen Projekt angehen möchten. Die erste Einschränkung sind notwendige Python Kenntnissen für den effektiven Einsatz unserer Software. Dies macht es schwierig, eine breitere Forschungsgemeinschaft zu erreichen. Wir werden diese Lücke durch die Entwicklung von zugänglicheren grafischen Benutzeroberflächen für die Ausführung zentraler Analyseworkflows schließen. Das zweite zentrale Hindernis ist eine zukunftsfähige Skalierbarkeit. Matchms wurde bereits umfangreich optimiert und kann relativ große Datensätze verarbeiten. Dennoch erwarten wir ein weiteres drastisches Wachstum in der Anzahl und Größe von HRMS/MS-Datensätzen. Für völlig neuartige HRMS/MS-Datenanalyse-Workflows, werden wir uns daher auf maximale Skalierbarkeit konzentrieren, indem wir Parallelisierung und eine weitere Optimierung zentraler Algorithmen implementieren. Zudem zielt dieses Projekt stark darauf ab, sowohl die Nutzer*innen- als auch die Entwickler*innen-Community von Matchms zu erweitern. Dazu setzen wir auf internationale Kooperationen mit Open Science Ansätzen, sowie jährliche Workshops und Einführungskurse. Dies wird nicht nur zu einer viel größeren Wirkung unserer Forschungssoftware führen, sondern auch mit unserem Ziel einhergehen, langfristige Zuverlässigkeit und Unterstützung sicherzustellen.
DFG-Verfahren Sachbeihilfen
Internationaler Bezug Belgien, Dänemark, Niederlande, Schweiz, Tschechische Republik
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung