Leistungsstarke Algorithmen zur Durchführung aktualisierbarer und skalierbarer Metagenomanalysen
Biologische und Biomimetische Chemie
Medizininformatik und medizinische Bioinformatik
Zusammenfassung der Projektergebnisse
Die Untersuchung des gesamten genomischen Inhalts von Organismen einer bestimmten Umgebung unter Umgehung der Kultivierung klonaler Kulturen wird als Metagenomik bezeichnet. Die Analyse von Lebensgemeinschaften in ihrer Gesamtheit ist aufgrund ihrer Komplexität, ihrer großen Vielfalt und der Grenzen der verfügbaren Technologien zur Umwandlung genomischer Inhalte in verständliche Daten nicht trivial. Einer der kritischsten Aspekte ist die Komplexität und Größe der Daten. Das schnelle und stetige Wachstum der öffentlichen Sequenzensammlungen trägt wesentlich zum Erfolg der Metagenomik-Anwendungen bei. Sie wachsen jedoch viel schneller als die Ressourcen, um sie richtig zu nutzen. Dies stellt eine Herausforderung für Berechnungsmethoden dar, die nur schwer die Vorteile der massiven und schnellen Datenerzeugung nutzen können. In diesem Projekt habe ich Hochleistungsalgorithmen, -bibliotheken und -pipelines implementiert, um die ständig wachsenden Daten für Metagenomikanwendungen zu erleichtern und besser zu nutzen. Der Hauptbeitrag ist die Software ganon2, ein Alignment-freier genomischer Sequenzklassifikator, der einen Generationssprung in Leistung und Benutzerfreundlichkeit gegenüber seiner ersten Version und den modernsten Konkurrenten darstellt. ganon2 erreicht eine sehr gute Leistung bei der Indizierung und Abfrage großer Mengen genomischer Daten, wodurch die Verwendung vielfältigerer und umfassenderer Referenzen für Mikrobiomstudien ermöglicht und die Auflösung der Ergebnisse verbessert wird. Nicht nur die Leistung, sondern vor allem die Ergebnisse in Bezug auf Sensitivität und Präzision sind stark verbessert, nicht nur durch die Verwendung aktueller Referenzen, sondern auch durch neue Softwarefunktionen und Optimierungen. Darüber hinaus wurde eine Reihe von Tools und Pipelines verbessert und neu entwickelt, um die Ziele dieses Projekts zu unterstützen. Sie sind in ganon2 integriert, aber auch als eigenständige Open-Source-Beiträge verfügbar: genome_updater, ein Skript zum Herunterladen und Aktualisieren beliebiger Sequenzen aus dem NCBI. MultiTax, ein Python-Paket, um verschiedene biologische Taxonomien zu erhalten, zu analysieren und zu untersuchen. GRIMER: visuelle Analyse von Mikrobiomstudien mit einem portablen und interaktiven Dashboard. MetaBench: eine komplette Pipeline zur Ausführung und zum Benchmarking von Tools, die ihre Leistung mit einer interaktiven Visualisierung von Metriken bewerten. Diese Tools sind miteinander verbunden und bilden einen verbesserten Metagenomik-Analyse-Workflow.
Projektbezogene Publikationen (Auswahl)
-
Contamination detection and microbiome exploration with GRIMER. GigaScience, 12.
Piro, Vitor C. & Renard, Bernhard Y.
-
ganon2: up-to-date and scalable metagenomics analysis. Cold Spring Harbor Laboratory.
Piro, Vitor C. & Reinert, Knut
