Ab-initio-Vorhersage der Sekundär- und Tertiärstruktur von Polypeptiden aus der Primärstruktur, durch Anwendung hierarchischer evolutionärer Algorithmen im Raum optimierter Sekundärstrukturen, ohne Verwendung von Datenbankinformationen
Final Report Abstract
Ursprüngliches Ziel dieses Projekts war eine Untersuchung darüber, ob und inwieweit stochastisch-heuristische globale Strukturoptimierungsverfahren (insbesondere sog. Evolutionäre Algorithmen, EAs) eingesetzt werden können, um die dreidimensionale Faltung von Proteinen in ihre für die Enzymfunktionen nötige natürliche Form allein aus der Abfolge der Aminosäurebausteine im Protein vorherzusagen. Obwohl wir in vorherigen Projekten gute Erfahrungen mit EAs zur globalen Strukturvorhersagen atomarer und molekularer Cluster sammeln konnten, war der Erfolg bei einer Übertragung auf Proteinstrukturen nicht gesichert, da sich diese beiden Systeme in einigen Aspekten grundlegend unterscheiden. Zum Beispiel bestehen Cluster aus nicht fest aneinander gebundenen Einzelteilchen, die prinzipiell unabhängig voneinander an neue Positionen gebracht werden können. Demgegenüber weist ein Protein ein unter den hier vorausgesetzten Bedingungen nicht zerschneidbares Rückgrat auf, das alle Aminosäuren in einer fest vorgegebenen Abfolge zusammenhält und lediglich in sich verdrillt werden kann. In beiden Fällen gehört das Auffinden der günstigsten Anordnung aller Bausteine im dreidimensionalen Raum zu den derzeit schwierigsten Optimierungsaufgaben. In der ersten Phase des Proj ekt Verlaufs konnten wir eine bereits vor Projektanfang begonnene Implementierung eines EA-Proteinfaltungsprogramms erfolgreich abschließen. Tests sowohl an artifiziellen Aminosäuresequenzen als auch an realen Proteinen bis zu einer Größe von 60 Aminosäuren lieferten zwei zumindest in dieser starken Ausprägung unerwartete Resultate: (1) Die Faltung an sich, also die Suche nach der bestmöglichen 3D-Anordnung von Proteinrückgrat und Seitenketten, erwies sich als deutlich leichter als befürchtet. Gegenüber schwierigeren Fällen molekularer Cluster kann die Faltung von Proteinen dieser Größe also als vergleichsweise unproblematisch gelten. (2) Die dabei tatsächlich erreichten optimalen Proteinstrukturen hängen jedoch sehr stark davon ab, wie die Wechselwirkungskräfte zwischen den einzelnen Aminosäuren im Detail beschrieben werden. Unterschiedliche, speziell für Proteine entwickelte und gut etablierte Kraftfelder lieferten in vielen Fällen qualitativ unterschiedliche Faltungsresultate für ein und dasselbe Protein. Daher entschlossen wir uns in der zweiten Projektphase dazu, ein neues Proteinkraftfeld zu entwickeln, basierend auf Vorschlägen unseres Kooperationspartners Prof A. Neumaier (Mathematik, Universität Wien). In diesem Kraftfeld wird nicht versucht, die Teilchenwechselwirkungen auf physikalischer Basis zu approximieren, was zu für die nachfolgenden Parameter- und Strukturoptimierungen sehr schwierigen, nichtlinearen Funktionen führt. Stattdessen werden lokale Nahordnungen in realen Proteinen statistisch analysiert und die gefundenen Strukturpräferenzen direkt in möglichst einfache Funktionen einfacher Strukturkenngrößen übersetzt. Der Weg von diesen Grundideen zu einem in robuster Weise für eine Vielzahl von Proteinen funktionierenden Kraftfeld erwies sich jedoch als lang und steinig. Für die Optimierung der Kraftfeldparameter mußten zunächst neue Datenbanken mit etwa 700000 geeigneten Proteinstrukturen aufgestellt werden. Die ersten Ansätze für unser neues Kraftfeld erwiesen sich als zu einfach und mußten in mehreren Stufen ausgebaut und erweitert werden. Unter anderem stellten sich eine explizite, neuartige Darstellung der Seitenketten und der lösungsmittelzugänglichen Proteinoberfläche als unverzichtbar heraus. Derzeit ist diese Entwicklung soweit gediehen, daß das neue Kraftfeld gut in der Lage ist, aus großen Sätzen mehr oder weniger falsch gefalteter Strukturen die eine, richtige, natürliche Faltung eines bestimmten Proteins herauszufiltem. Beim Einsatz dieses Kraftfelds zur a-priori-Faltung mit unseren EA-Programm rächt sich jedoch dessen ansonsten begrüßenswerte Fähigkeit, exotische Faltungsstrukturen zu finden: Die EA-Methode findet ganz neue Faltungen, die in der bisherigen Kraftfeldanpassung noch nicht berücksichtigt wurden und die dann z.T. besser sind als die natürlichen Strukturen. Wir hoffen, durch Übernahme dieser neuen Strukturen in eine erneute Reparametrisierung des Kraftfelds diese letzten Defekte auch noch beseitigen zu können.
Publications
- „Towards protein folding with evolutionary techniques", J. Comput. Chem. 26 (2005) 1169
F. Koskowski und B. Hartke
- „Entwicklung eines neuartigen Proteinkraftfelds und dessen Einsatz in der ab-initio-Proteinfaltung", Dissertation, Universität Kiel, Mai 2009
F. Koskowski