Detailseite
Projekt Druckansicht

Transferierbare Retentionszeitvorhersage für auf Flüssigkeitschromatographie-Massenspektrometrie basierende Metabolomik

Fachliche Zuordnung Bioinformatik und Theoretische Biologie
Förderung Förderung von 2019 bis 2023
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 425789784
 
Die Identifizierung von Metaboliten stell einen zentralen Engpass in der Metabolomik dar. Flüssigkeitschromatographie, gekoppelt mit der Massenspektrometrie (LC-MS), ist die momentan am meisten eingesetzte Analysentechnik in der nicht zielgerichteten Metabolomik. Aktuell können weniger als 10% eines typischen, nicht zielgerichteten Experiments annotiert werden. Daher besteht eine starke Nachfrage nach verbesserten Methoden zur Metabolitidentifizierung. Fragmentierungsmuster in der Tandem-Massenspektrometrie (Tandem-MS) können zur Strukturaufklärung genutzt werden. In letzter Zeit wurden in silico Methoden zur Suche von Kandidaten in Strukturdatenbanken wie PubChem oder Chemspider entwickelt, welche vermehrt in der Metabolomik Anwendung finden. Bei der Identifizierung mittels Tandem-MS treten jedoch falsche Ergebnisse auf, weshalb mindestens zwei voneinander unabhängige Parameter, wie Masse und Retentionszeit eines Referenzstandards, für eine korrekte Identifizierung berichtet werden müssen. Retentionszeiten werden aktuell nur zu einem sehr späten Zeitpunkt, meist beim Abgleich mit einem chemischen Referenzstandard, herangezogen. Jedoch wäre es von Vorteil, besonders für in silico Methoden, Retentionszeiten zu einem früheren Zeitpunkt mit einzubeziehen, um potentielle Kandidaten zu filtern bzw. das Ergebnis, welches ein Kandidat erzielt, anhand des Vergleichs von vorhergesagter und gemessener Retentionszeit zu modifizieren.Dieses Projekt hat zum Ziel, die Vorhersage von Retentionszeiten für die verbesserte Identifizierung von Metaboliten in der LC-MS basierten, nicht zielgerichteten Metabolomik zu nutzen. Diese Vorhersagen basieren auf einem zweistufigen Verfahren. Im ersten Schritt wird maschinelles Lernen benutzt, um die Elutionsreihenfolge anhand von gegeben Strukturformeln vorherzusagen. Für diesen Lernschritt wird eine extensive Sammlung von Retentionszeitendaten kuratiert und durch eigene systematische Messungen vervollständigt. Im Gegensatz zur Masse stellt die Retentionszeit nicht eine Eigenschaft des Moleküls, sonders des gesamten chromatographischen Systems dar. Daher werden sowohl Eigenschaften des Moleküls, als auch des eingesetzten Trennsystems für das maschinelle Lernen genutzt. In einem zweiten Schritt wird dann die Elutionsreihenfolge mittels bekannter Substanzen auf Retentionszeiten übertragen. Sowohl die Elutionsreihenfolgen, als auch die Retentionszeitenvorhersage, werden dann genutzt, um falsch-positive Substrat-Produkt-Paare zu filtern und anhand eines unabhängigen Sekundärmetabolismusdatensatzes aus C. elegans validiert.Alle kuratierten und generierten Daten, die Open-Source Software für die Vorhersage von Elutionsreihenfolgen und Retentionszeiten werden frei zugänglich gemacht. Abschließend wird die Retentionszeitvorhersage in die Software CSI:FingerID integriert, um die Identifizierungsraten zu erhöhen.
DFG-Verfahren Sachbeihilfen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung