Detailseite
MetaRbolomics4Galaxy: Infrastruktur für Metabolomics Datenanalyse
Antragsteller
Privatdozent Dr. Steffen Neumann
Fachliche Zuordnung
Bioinformatik und Theoretische Biologie
Medizininformatik und medizinische Bioinformatik
Medizininformatik und medizinische Bioinformatik
Förderung
Förderung seit 2025
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 564004112
Die Quantifizierung kleiner Moleküle mit Massenspektrometrie (MS) ist ein zentraler Ansatz in verschiedenen Disziplinen, z. B. in der Metabolomik (Biochemie), der biologischen und chemischen Diversität (Biodiversität, Ökologie), der Analyse von Zusammensetzung oder Kontamination von Lebensmitteln, oder der Abwasseranalyse und Trinkwasserüberwachung (Umweltforschung). In einem weiteren Schritt werden auf der Grundlage von MS/MS-Daten die relevanten Metaboliten identifiziert oder mit Informationen über die Metabolitenklassen annotiert, die für die (bio-)chemische Interpretation im experimentellen Kontext benötigt werden. Unter dem Begriff Computational Mass Spectrometry werden Software und Algorithmen zur Quantifizierung, statistischen Analyse und Annotation kleiner Moleküle entwickelt. Die globale Bioconductor-Community entwickelt und pflegt eine Reihe von R-Paketen für die reproduzierbare Analyse biologischer Daten aus verschiedenen Bereichen der Biowissenschaften. Die globale Galaxy-Community entwickelt das webbasierte Galaxy Workflow e-Research Ökosystem, das die Ausführung von Tools aus dem Galaxy Toolsched auf öffentlichen oder privaten Installationen ermöglicht. Solche Instanzen werden z.B. von institutionellen (z.B. dem Eurac Research HPC Cluster), regionalen (z.B. in Südtirol) oder nationalen (z.B. der de.NBI Cloud oder ELIXIR-DE usegalaxy.eu an der Universität Freiburg) HPC-Infrastrukturen betrieben. Die lokale Durchführung von Analysen ist besonders wichtig, um Analysen von gesundheitsbezogenen Humandaten auf individueller Ebene im Rahmen der DSGVO zu ermöglichen. Im Rahmen des MetaRbolomics4Galaxy-Projekts entwickeln und pflegen wir modulare R-Pakete für high-throughput, Cloud-fähige und reproduzierbare Metabolomics-Datenanalyse und die Integration der Funktionalität in das Galaxy Workflow e-Research-Ökosystem. Darauf aufbauende benutzerfreundliche Anwendungen ermöglichen eine detaillierte und interaktive Visualisierung und Analyse werden ebenfalls angepasst und in das Galaxy-Ökosystem integriert. Eine Beispielanwendung ist MetFamily, das am IPB Halle entwickelt wurde. Es ist eines der ersten Werkzeuge für die integrierte Analyse von MS/MS-Daten zur Quantifizierung und chemischen Charakterisierung. Wir werden bewährte Software-Engineering-Praktiken anwenden, beginnend mit einem offenen Upstream-First-Ansatz, kontinuierlicher Integration für Code, Testabdeckung und Dokumentation; Software-Containern für die Paketierung, einschließlich Software-Stücklisten und Ermöglichung der Nutzung von Hochleistungsrechnern, um die Analyse großer Datensätze zu erleichtern. Im Rahmen der Vernetzungsaktivitäten werden diese bewährten Verfahren mit Entwicklern von Forschungssoftware in der R, Galaxy und Metabolomics-Gemeinschaft ausgetauscht.
DFG-Verfahren
Forschungsdaten und Software (Wiss. Literaturversorgung und Informationssysteme)
Internationaler Bezug
Italien
Partnerorganisation
Autonome Provinz Bozen - Südtirol
Mitverantwortlich(e)
Dr. Henriette Uthe
Kooperationspartner
Dr. Johannes Rainer
