Entwicklung von Methoden des Maschinellen Lernens zur funktionellen Charakterisierung von Peroxisomen
Zusammenfassung der Projektergebnisse
Peroxisomen sind kleine Zellorganellen, welche in fast allen eukaryotischen Organismen vorkommen und dort u.a. für den Fettstoffwechsel und Detoxifikationsprozesse verantwortlich sind. Die Zusammensetzung und Funktion der peroxisomalen Enzyme unterscheidet sich erheblich in verschiedenen Organismen und ist teilweise noch wenig aufgeklärt. Ziel des Projektes war es, für verschiedene Kategorien von Organismen (Pflanzen, Pilze, Metazoen) die Gesamtheit der peroxisomalen Proteine zuverlässig zu bestimmen, deren Funktion vorherzusagen und gemeinsame und unterschiedliche Eigenschaften im Vergleich mit anderen Organismen zu ermitteln. Im Rahmen des Projektes wurden verschiedene Algorithmen zur Vorhersage von peroxisomalen Proteinen anhand der peroxisomalen Zielsteuerungssignale PTS1 und PTS2 entwickelt. Die Vorhersagen wurden teilweise in Laborexperimenten bestätigt und deuten auf eine zuverlässige Vorhersagbarkeit von PTS1-Proteinen in Pflanzen und Pilzen hin. PTS1-Proteine von Metazoen (also auch menschliche) sowie PTS2-Proteine sind dagegen derzeit nicht zuverlässig vorhersagbar, was zum einen an der Menge der verfügbaren Beispiele und zum anderen an der Variabilität der Muster liegt. Hier sind weitere Untersuchungen zur Charakterisierung der PTS2-Domäne erforderlich. Weiterhin wurden Methoden zur funktionalen und metabolischen Annotation der Proteine entwickelt und verwendet um die Gesamtheit der peroxisomalen Proteine eines Organismus mit der anderer Organismen als auch mit der Menge aller Proteine des Organismus zu vergleichen. Hierbei konnten am Beispiel von Pflanzen zahlreiche neue peroxisomenrelevante bzw. -spezifische Funktionen identifiziert werden, welche nun gezielt auf ihre Rolle untersucht werden können. Eine erste Untersuchung von Metagenomdaten von Pilzgemeinschaften deutete hingegen darauf hin, dass organismenunspezifische Daten mit sehr kurzen Sequenzen keine geeignete Quelle zur Identifikation neuer peroxisomaler Proteine sind. Schließlich wurde ein Algorithmus entwickelt um die Überlesewahrscheinlichkeit eines Stop- Codons anhand seines Sequenzkontextes zu bestimmen. Mithilfe der genomweiten Vorhersage besonders extensionsfreundlicher Proteine und der Kombination mit der Vorhersage peroxisomaler Zielsteuerungssignale in den Extensionen konnte ein neues peroxisomales Protein (LDHB) identifiziert werden. Aufgrund der biologischen Relevanz dieser Entdeckung ist davon auszugehen, dass dieses Ergebnis Einzug in die Grundlagenliteratur und Fachbücher finden wird.
Projektbezogene Publikationen (Auswahl)
- CoMet – a web server for comparative functional profiling of metagenomes. Nucleic Acids Research, 39(Suppl. 2):W518, 2011
T. Lingner, K.P. Aßhauer, F. Schreiber, P. Meinicke
- Identification of novel plant peroxisomal targeting signals by a combination of machine learning methods and in vivo subcellular targeting analyses. Plant Cell 23(4):1556-72, 2011
T. Lingner, A.R.A. Kataya, G.E. Antonicelli, A. Benichou, K. Nilssen, X.Y. Chen, T. Siemsen, B. Morgenstern, P. Meinicke, S. Reumann
- Experimental and statistical post-validation of positive example EST sequences carrying peroxisome targeting signals type 1 (PTS1). Plant Signaling and Behaviour 7(2):263-268, 2012
T. Lingner, A.R.A. Kataya, S. Reumann
- PredPlantPTS1: A Web Server for the Prediction of Plant Peroxisomal Proteins. Frontiers in Plant Science 3:194, 2012
S. Reumann, D. Buchwald, T. Lingner
(Siehe online unter https://doi.org/10.3389/fpls.2012.00194) - Protein signature-based estimation of metagenomic abundances including all domains of life and viruses. Bioinformatics, 29(8):973-980, 2013
H. Klingenberg, K.P. Aßhauer, T. Lingner, P. Meinicke
(Siehe online unter https://doi.org/10.1093/bioinformatics/btt077) - Peroxisomal lactate dehydrogenase is generated by translational readthrough in mammals. eLife, 3:e03640, 2014
F. Schueren, T. Lingner, R. George, J. Hofhuis, C. Dickel, J. Gärtner, S. Thoms
(Siehe online unter https://doi.org/10.7554/eLife.03640.001)