Detailseite
Transferierbare Adaptive Konformationsdynamik
Antragsteller
Professor Dr. Frank Noé
Fachliche Zuordnung
Biophysik
Förderung
Förderung von 2011 bis 2024
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 200023966
Lebensprozesse, wie z.B. Wachstum oder Verdauung, entstehen aus der Interaktion von Proteinen und anderer Biomoleküle. Proteine können Informationen speichern und verarbeiten, indem sie zwischen Konformationen, d.h. langlebigen 3D-Strukturen, umschalten. Sie können mit anderen Biomolekülen assoziieren oder dissoziieren, um biologische Strukturen aufzubauen oder Zellsignale zu verarbeiten. Biologie ist inhärent mehrskalig: atomare Details an den Interaktionsflächen zwischen Biomolekülen sind oft entscheidend für deren Verhaltensweise. Um auf biologische Prozesse Einfluss nehmen zu können, z.B. beim Design von Wirkstoffen, biologischen Materialien oder biotechnologischen Prozessen, ist Wissen über atomistische Strukturen, deren Wahrscheinlichkeiten und Übergangsraten, von großem Vorteil.Molekulardynamik (MD) Simulationen können die atomistische Struktur und Dynamik gleichzeitig erfassen. State-of-the-art Simulationen können qualitativ und quantitativ korrekte Vorhersagen machen, und sind damit ein wichtiges Komplement zu experimentellen Studien. Dennoch hat MD eine wesentliche Beschränkung, das sogenannte Sampling Problem: Übergänge zwischen funktionell relevanten Konformationen, wie z.B. Proteinfaltung oder der Bindung eines Wirkstoffmoleküls an ein Protein, sind seltene Ereignisse. Mit direkter MD Simulation können solche Prozesse selbst auf einem Supercomputer mehrere Jahre Rechenzeit erfordern. In den letzten Jahren wurden signifikante Fortschritte bei der Lösung des Samplingproblems gemacht. Zum Beispiel gelang des dem Antragsteller und seinen Kooperationspartnern zum ersten Mal, die vollständige Assoziation und Dissoziation zweier Proteine in atomarer Auflösung zu simulieren. Leider benötigt selbst dieser Ansatz 20,000 Tage Rechenzeit auf high-end Grafikprozessoren, und ist damit immer noch ausgesprochen teuer.In der zweiten Förderperiode schlagen wir die Entwicklung einer grundlegend neuen adaptiven Simulationsmethode für MD vor. Statt die Simulation eines einzelnen Proteins zu beschleunigen, schlagen wir vor, mittels maschinellem Lernen (ML), aus bestehenden Simulationen vieler Proteinsequenzen ein Modell zu lernen. Dieses Modell soll Vorhersagen über die langlebigen Zustände, deren Wahrscheinlichkeiten und Übergangsraten für andere, bisher nicht simulierte Proteinsequenzen machen. Die vorgeschlagene Methode verbinden Fortschritte in ML für Quantenchemie mit unseren eigenen Vorarbeiten zu ML für die Bestimmung des Langzeitverhaltens von Proteinen. Im Erfolgsfall wäre eine solche Methode äußerst nützlich für das Proteindesign, also z.B. die Optimierung von Enzymen oder von Antikörpern.
DFG-Verfahren
Sachbeihilfen