Detailseite
Projekt Druckansicht

Verbesserte Proteinquantifizierung mithilfe von mathematischen Optimierungsmethoden unter Nutzung der Struktur der bipartiten Peptid-Protein-Graphen

Fachliche Zuordnung Bioinformatik und Theoretische Biologie
Förderung Förderung seit 2023
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 532401634
 
In der Bottom-up-Proteomik werden die Proteine zu Peptiden verdaut und diese Peptide dann mithilfe von Massenspektrometrie gemessen. Daher müssen die erhaltenen Peptid-Quantitäten zu Protein-Quantitäten zusammengefasst werden, um daraus biologische Erkenntnisse zu gewinnen (Proteinquantifizierung). Dies wird dadurch erschwert, dass es nicht nur einzigartige Peptide gibt, sondern auch Peptide, die in mehreren Proteinsequenzen vorkommen. Die Beziehung zwischen Peptiden und den entsprechenden Proteinen kann in Form von bipartiten Graphen dargestellt werden. In diesem Projekt wollen wir die Strukturen dieser bipartiten Peptid-Protein-Graphen nutzen, um den Schritt der Proteinquantifizierung zu verbessern. Die vorgeschlagene Methode stellt für jedes gemessene Peptid eine Gleichung auf und minimiert die Fehlerterme durch mathematische Optimierungstechniken. Wir planen, die relative Quantifizierung, d. h. die berechneten Verhältnisse der einzelnen Peptide zwischen zwei Proben, zu verwenden und als Ergebnis Schätzungen der entsprechenden Proteinverhältnisse zu erhalten. Der Schwerpunkt liegt vor allem auf der Verbesserung der Quantifizierung von Proteinen ohne eindeutige Peptide, die bei vielen derzeitig verwendeten Methoden zur Proteinquantifizierung vernachlässigt werden. Ein weiterer Schwerpunkt liegt auf dem angemessenen Umgang mit fehlenden Werten, die in der Bottom-up-Proteomik häufig auftreten und einen großen Einfluss auf die berechneten Protein-Quantitäten haben können. Dies ist besonders wichtig für die Erkennung von On/Off-Proteinen, die in einer Versuchsgruppe vorhanden sind und in einer anderen fehlen. Um statistische Tests auf den erhaltenen Proteinverhältnisse berechnen zu können, werden wir eine Methode zur Schätzung der Unsicherheit und Varianz der erhaltenen Proteinverhältnisse entwickeln. Der vorgeschlagene Algorithmus soll an verschiedenen Goldstandard-Datensätzen mit bekannten Proteinverhältnissen validiert werden. Da diese Datensätze nicht alle möglichen Szenarien abdecken, die in realen Daten auftreten können, ist zusätzlich geplant, eine Methode zur Simulation dieser Art von Daten zu entwickeln. Ein Vergleich mit anderen State-of-the-Art-Methoden zur Proteinquantifizierung wird ebenfalls durchgeführt. Die vorgeschlagene Methode wird in einem benutzerfreundlichen Software-Tool mithilfe von R und RShiny implementiert, sodass diese von Forschern mit und ohne Programmiererfahrung verwendet werden kann. Alles in allem sehen wir ein großes Potenzial in der Entwicklung des vorgeschlagenen Quantifizierungsalgorithmus, um z.B. in der Anwendung die Entdeckung von Biomarkern in Proteomik-Studien zu unterstützen.
DFG-Verfahren Sachbeihilfen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung