Detailseite
Projekt Druckansicht

Computational models for metatranscriptome analysis

Antragsteller Dr. Peter Meinicke
Fachliche Zuordnung Bioinformatik und Theoretische Biologie
Förderung Förderung von 2012 bis 2016
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 215674903
 
Erstellungsjahr 2017

Zusammenfassung der Projektergebnisse

Im Rahmen des Projektes wurden neue bioinformatische Ansätze für die Metatranskriptomik entwickelt, um effiziente Lösungen für bestehende Probleme bei der statistischen Analyse der Genexpression in diversen Organismusgemeinschaften zu realisieren. Dabei war es insbesondere wichtig, Werkzeuge zu schaffen, die auch auf große RNA-Seq Datensätze mit einer Vielzahl von unbekannten Organismen ohne verfügbares Referenzgenom anwendbar sind. Hier konnten erfolgreich Methoden des maschinellen Lernens für die schnelle Erkennung von ribosomalen RNA-Genen und für die kombinierte Klassifikation von Proteinkodierenden Sequenzen implementiert werden. Insbesondere die taxonomisch funktionelle Klassifikation mit UProC-TX ermöglicht aufgrund der hohen Geschwindigkeit eine Analyse der rohen Sequenzdaten ohne die Probleme einer vorherigen Assemblierung in Kauf nehmen zu müssen. In Bezug auf die differentielle Expressionsanalyse von metatranskriptomischen Daten wurde ein wesentliches Problem identifiziert, das bisher in seiner Tragweite noch nicht bekannt war. Es konnte gezeigt werden, dass für eine korrekte Analyse die Sequenzdaten nach Spezies zu trennen sind, um vorab eine Organismus-spezifische Normalisierung der Transkripthäufigkeiten vorzunehmen. Obwohl dieser Schritt in den meisten Fällen praktisch nur für einen Teil der Daten durchführbar ist, gibt es keine direkte Alternative, um systematische Fehler zu vermeiden. Diese Erkenntnis ist für alle zukünftigen Studien von großer Bedeutung und legt als aufwendige aber wirkungsvolle Maßnahme die parallele Sequenzierung des Metagenoms nahe. Damit ließen sich dann Draft-Genome als valide Referenz für die differentielle Expressionsanalyse rekonstruieren.

Projektbezogene Publikationen (Auswahl)

 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung