Detailseite
Projekt Druckansicht

Leistungsstarke Algorithmen zur Durchführung aktualisierbarer und skalierbarer Metagenomanalysen

Antragsteller Vitor Cedran Piro, Ph.D.
Fachliche Zuordnung Bioinformatik und Theoretische Biologie
Biologische und Biomimetische Chemie
Medizininformatik und medizinische Bioinformatik
Förderung Förderung von 2021 bis 2024
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 458163427
 
Die Metagenomik ermöglicht die Entdeckung und Untersuchung des kollektiven genomischen Inhalts aus verschiedenen Umgebungen mit Hilfe von Rechenmethoden und Datenanalysen. Das schnelle Wachstum öffentlicher Sequenzsammlungen trägt wesentlich zum Erfolg der Metagenomikanwendungen bei. Diese Repositorien wachsen jedoch in einem viel schnelleren Tempo als die Ressourcen zu ihrer Nutzung. Dies stellt eine Herausforderung für die derzeitigen Methoden dar, die Mühe haben, die Vorteile der massiven und schnellen Datengenerierung voll auszuschöpfen. Darüber hinaus stellen die Auswahl und Erfassung von Referenzen, die Definition der Taxonomie, die statistische Analyse und die Visualisierung weitere Herausforderungen dar, um Umweltdaten vollständig und korrekt zu untersuchen. Dieses Projekt wird eine Sammlung von miteinander verknüpften Methoden zur Milderung dieser Probleme bereitstellen, wobei der Schwerpunkt auf der Entwicklung von Hochleistungsalgorithmen und deren Implementierung in Metagenomik-Werkzeuge liegt. Zentrales Ziel des Projekts ist es, eine vergleichende Metagenomanalyse in kurzer Zeit zu ermöglichen, indem die Gesamtheit der schnell wachsenden Zahl von zusammengesetzten Sequenzen offen zugänglich gemacht wird. Gleichzeitig wird es eine ständige Aktualisierung mit dem Zustrom neuer Sequenzen ermöglichen. Dies wird durch die Implementierung von Hochleistungsalgorithmen in Verbindung mit effizienten Datenstrukturen zur Verbesserung der Sequenzindizierung und -klassifizierung erreicht. Sie werden auf der Grundlage hochmoderner Methoden entwickelt, die ihre Kapazitäten zur Indizierung und Analyse sehr großer Datensätze erweitern und die Präzision und Sensitivität ihrer Endergebnisse beibehalten oder erhöhen. Dieser Algorithmus ist das Kernstück eines vorgeschlagenen Arbeitsablaufs für die Hochleistungs-Metagenomanalyse. Darüber hinaus wird der Arbeitsablauf die Auswahl, Erfassung und Filtration von Referenzsequenzen ermöglichen. Dies ist von entscheidender Bedeutung, um die derzeit wenig erforschten Datenrepositorien aufgrund fehlender Metadaten, Kontamination und Überrepräsentierung der Arten voll auszunutzen. Zusätzlich wird der Workflow eine molekular-basierte Taxonomie integrieren. Dies zielt darauf ab, Anomalien der derzeitigen taxonomischen Definitionen aufzulösen und die Sensitivität der Ergebnisse zu verbessern. Schließlich werden Berichte, Visualisierungen und erweiterte statistische Analysen entwickelt, um die Rohergebnisse in eine verständliche Ausgabe für Metagenomstudien mit Einzel- und Mehrfachstichproben zu übersetzen. Zusammenfassend lässt sich sagen, dass der hier vorgeschlagene Arbeitsablauf darauf abzielt, den Stand der Technik bei der Hochleistungs-Metagenomik-Sequenzklassifikation und -analyse zu verbessern, einschließlich der Datenerfassung, der erweiterten Berichterstattung und einer sequenzbasierten Taxonomieintegration.
DFG-Verfahren WBP Stelle
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung