Detailseite
Projekt Druckansicht

Maschinelles Lernen zur schnelleren Entwicklung und Adaptation von Enzymen für schwierige chemische Reaktionen (MacBioSyn). Teil I: Lösungen für regioselektive Oxidationsreaktionen mit 2OGD-Oxidasen

Fachliche Zuordnung Biologische und Biomimetische Chemie
Organische Molekülchemie - Synthese, Charakterisierung
Förderung Förderung seit 2022
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 497207454
 
Biokatalytische Synthesestrategien werden von der Europäischen Kommission als eine der Hauptkomponenten einer zukünftigen biobasierten nachhaltigen Wirtschaft (Green Deal) angesehen. Das volle Potenzial dieser Technologie kann jedoch derzeit aufgrund des limitierten Zugangs zu passenden Enzymen nicht ausgeschöpft werden. 2-Oxoglutarat-abhängige (2OGD) Proteine stellen eine bisher wenig bearbeitete Superfamilie von Enzymen dar, die viele „schwierige“ oxidative Reaktionen (u.a. Oxidation nichtaktivierter Kohlenstoffatome) katalysieren. Da solche Reaktionen oft nur schwer chemosynthetisch durchführbar sind, stellt die Nutzung von 2OGD-Enzyme eine lohnende regio- und produktspezifische Alternative zu derartigen traditionellen Verfahren dar. Somit eröffnet die Identifizierung neuartiger Enzyme mit verbessertem Substratspektrum neue Möglichkeiten z.B. in der Naturstoffchemie.Ein häufiges Problem in der Entwicklung neuer Enzyme (z.B. beim Genom-Mining) stellt die Vorhersage von Aktivitäten dar. Solche datenintensiven Methoden können aber durch maschinelles Lernen (ML) effizienter gestaltet werden, welches so über passende Vorhersagen zur Entwicklung optimaler Biokatalysatoren beitragen kann. Hier können verschiedene Parameter (Aktivität, Spezifität etc.) vorteilhafterweise simultan berechnet werden. Im hier vorgestellten Projekt MacBioSyn soll eine universell nutzbare Plattformtechnologie erstellt werden, die über ML (d.h. mehrschichtiges, aktives und bestärkendes Lernen) eine Vorhersage der Aktivität und der Substrat- und Reaktionsspezifität von Enzymen ermöglicht. Dazu wird eine in silico-Methode zur ML-basierten Analyse von Sequenz-Substratpaaren erzeugt werden, die mit experimentellen Daten trainiert werden wird. Das Projekt basiert auf einem synergistischen Ansatz und vereint Experten für computergestütztes Design/Modelling (Davari) und Hochdurchsatz(HD)-Screening von Enzymen (Dippe, Wessjohann). Zur Etablierung des Verfahrens wird MacBioSyn an 2OGD-Enzymen arbeiten. Dem Hauptproblem von ML-basierten Studien – der Verfügbarkeit großer Datenmengen zum Erstellen statistisch abgesicherter Trainingsdatensätze – wird hier durch ein Screening einer Vielzahl (> 1500) von rekombinant erzeugten 2OGD-Enzymen begegnet werden. Diese werden in einem HD-Verfahren auf Aktivität gegenüber 30 strukturell diversen Substraten untersucht werden, um in einem iterativen Prozess unsere Software zu verbessern. Zusammenfassend soll die hier entwickelte Technologie eine beschleunigte und verbesserte Entwicklung von Biokatalysatoren ermöglichen, die zudem Zugang zu neuen biokatalytischen Werkzeugen für die industriell wichtigen Oxofunktionalisierungsreaktionen an Naturstoffen und Basischemikalien gewährleistet.
DFG-Verfahren Schwerpunktprogramme
Internationaler Bezug Frankreich
Kooperationspartner Professor Dr. Jean Loup Faulon
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung