Detailseite
Projekt Druckansicht

Repräsentation von Proteinstrukturen und Proteinsequenz/-struktur-Zuordnung

Fachliche Zuordnung Bioinformatik und Theoretische Biologie
Förderung Förderung von 2005 bis 2009
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 13676190
 
Erstellungsjahr 2009

Zusammenfassung der Projektergebnisse

Proteine sind die zentralen Akteure fast aller in einer Zelle ablaufenden biochemischen Prozesse, einschließlich der Kontrolle der Genexpression, des Metabolismus, des Transports und der enzymatischen Katalyse. Proteine sind aus Aminosäuren bestehende Heteropolymere, deren spezifische Sequenz in der Erbinformation gespeichert ist und damit, bedingt durch mögliche Kopierfehler bei der Zellteilung, dem Einfluß der biologischen Evolution unterliegt. Proteine erreichen ihre spezifische biologische Funktion in der Regel in einem gefalteten Zustand, wobei letzterer durch die Sequenz der Aminosäuren und deren Wechselwirkung untereinander und mit dem umgebenden Medium eindeutig festgelegt ist. Zwei der zentralen Probleme in der Bioinformatik sind das sogenannte Alignment von Proteinsequenzen und Proteinstrukturen, um durch diesem Vergleich Ähnlichkeiten wie auch Unterschiede abzuleiten. Die Grundidee dieses Projekts war es, eine von mir etablierte vektorielle Darstellung von Proteinstrukturen zu untersuchen, bzgl. ihres Informationsgehaltes genauer zu verstehen und das Anwendungspotential für die Bioinformatik im Allgemeinen und das Problem des Sequenz- und Strukturalignments im Besonderen auszuloten. Diese Repräsentation erlaubt die kompakte äquivalente Darstellung von globularen Proteinstrukturen als reellwertigen Vektor, in starker Vereinfachung zur Repräsentation in Form von dreidimensionalen Koordinaten oder Kontaktmatrizen. Die vektorielle Natur dieser kompakten Darstellung bot einen neuen Zugang zu den beiden oben genannten Problemen. Das Forschungsvorhaben gliederte sich dazu in zwei ineinandergreifende Teile. Das Ziel des ersten Teils war die Entwicklung und Implementiemng eines Verfahrens, welches das Alignment von Proteinstrukturen unter Benutzung der vektoriellen Strukturrepräsentation erlaubt. Hierzu wurden die Eigenschaften dieser vektoriellen Darstellung genauer untersucht, geeignete Maße für Ähnlichkeit zweier vektorieller Darstellungen definiert (insbesondere unter geeigneter Berücksichtigung von Einfügungen und Löschungen) und ein entsprechendes Verfahren entwickelt, implementiert und mit Standard verfahren verglichen. Das Ziel des zweiten Teils war die Entwicklung und Implementierung eines Verfahrens, welches die approximative Vorhersage der vektoriellen Repräsentation einer Proteinstruktur ausgehend von der Proteinsequenz ermöglicht. Hierzu war die Beziehung zwischen einer gegebenen Proteinsequenz und der vektoriellen Repräsentation der resultierenden Proteinstruktur zu untersuchen, insbesondere unter dem Aspekt der Evolution von Proteinsequenzen, und Methoden für eine approximative Vorhersage zu entwickeln und zu implementieren. Die Entwicklung einer solchen Vorhersage erfolgte mit dem Ziel, beide Teilprojekte miteinander zu kombinieren: Die approximative Vorhersage der vektoriellen Strukturrepräsentation aus einer Proteinsequenz und das nachfolgende Alignment solcher vorhergesagten vektoriellen Strukturrepräsentationen erlaubt ein signifikant verbessertes Alignment von Proteinsequenzen als dies bisher mit Standardverfahren möglich war.

Projektbezogene Publikationen (Auswahl)

  • Vectorial representation of single- and multi-domain protein folds. Eur. Phys. J. B 54, 131-136 (2006)
    F. Teichert und M. Porto
  • SABERTOOTH: Protein structure comparison based on a vectorial structure representation. BMC Bioinformatics 8, 425 (2007) (17 Seiten)
    F. Teichert, U. Bastolla und M. Porto
  • Effective Connectivity profile: A structural representation that evidences the relationship between protein structures and sequences. Proteins 73, 872-888 (2008)
    U. Bastolla, A.R. Ortiz, M. Porto und F. Teichert
  • Local interactions in protein folding determined through an inverse folding model. Proteins 71, 278-299 (2008)
    U. Bastolla, M. Porto und A.R. Ortiz
  • Protein Structure Alignment through a Contact Topology Profile using SABERTOOTH. In German Conference on Bioinformatics - GCB 2008, hrsg. von A. Beyer und M. Schroeder, Lecture Notes in Informatics No. P-136, Gesellschaft für Informatik e.V., Bonn, 2008, Seite 75-84
    F. Teichert, U. Bastolla und M. Porto
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung