Detailseite
Maschinelles Lernen zur schnelleren Entwicklung und Adaptation von Enzymen für schwierige chemische Reaktionen (MacBioSyn). Teil I: Lösungen für regioselektive Oxidationsreaktionen mit 2OGD-Oxidasen
Antragsteller
Dr. Mehdi Davari Dolatabadi, Ph.D.
Fachliche Zuordnung
Biologische und Biomimetische Chemie
Organische Molekülchemie - Synthese, Charakterisierung
Organische Molekülchemie - Synthese, Charakterisierung
Förderung
Förderung seit 2022
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 497207454
Biokatalytische Synthesestrategien werden von der Europäischen Kommission als eine der Hauptkomponenten einer zukünftigen biobasierten nachhaltigen Wirtschaft (Green Deal) angesehen. Das volle Potenzial dieser Technologie kann jedoch derzeit aufgrund des limitierten Zugangs zu passenden Enzymen nicht ausgeschöpft werden. 2-Oxoglutarat-abhängige (2OGD) Proteine stellen eine bisher wenig bearbeitete Superfamilie von Enzymen dar, die viele „schwierige“ oxidative Reaktionen (u.a. Oxidation nichtaktivierter Kohlenstoffatome) katalysieren. Da solche Reaktionen oft nur schwer chemosynthetisch durchführbar sind, stellt die Nutzung von 2OGD-Enzyme eine lohnende regio- und produktspezifische Alternative zu derartigen traditionellen Verfahren dar. Somit eröffnet die Identifizierung neuartiger Enzyme mit verbessertem Substratspektrum neue Möglichkeiten z.B. in der Naturstoffchemie.Ein häufiges Problem in der Entwicklung neuer Enzyme (z.B. beim Genom-Mining) stellt die Vorhersage von Aktivitäten dar. Solche datenintensiven Methoden können aber durch maschinelles Lernen (ML) effizienter gestaltet werden, welches so über passende Vorhersagen zur Entwicklung optimaler Biokatalysatoren beitragen kann. Hier können verschiedene Parameter (Aktivität, Spezifität etc.) vorteilhafterweise simultan berechnet werden. Im hier vorgestellten Projekt MacBioSyn soll eine universell nutzbare Plattformtechnologie erstellt werden, die über ML (d.h. mehrschichtiges, aktives und bestärkendes Lernen) eine Vorhersage der Aktivität und der Substrat- und Reaktionsspezifität von Enzymen ermöglicht. Dazu wird eine in silico-Methode zur ML-basierten Analyse von Sequenz-Substratpaaren erzeugt werden, die mit experimentellen Daten trainiert werden wird. Das Projekt basiert auf einem synergistischen Ansatz und vereint Experten für computergestütztes Design/Modelling (Davari) und Hochdurchsatz(HD)-Screening von Enzymen (Dippe, Wessjohann). Zur Etablierung des Verfahrens wird MacBioSyn an 2OGD-Enzymen arbeiten. Dem Hauptproblem von ML-basierten Studien – der Verfügbarkeit großer Datenmengen zum Erstellen statistisch abgesicherter Trainingsdatensätze – wird hier durch ein Screening einer Vielzahl (> 1500) von rekombinant erzeugten 2OGD-Enzymen begegnet werden. Diese werden in einem HD-Verfahren auf Aktivität gegenüber 30 strukturell diversen Substraten untersucht werden, um in einem iterativen Prozess unsere Software zu verbessern. Zusammenfassend soll die hier entwickelte Technologie eine beschleunigte und verbesserte Entwicklung von Biokatalysatoren ermöglichen, die zudem Zugang zu neuen biokatalytischen Werkzeugen für die industriell wichtigen Oxofunktionalisierungsreaktionen an Naturstoffen und Basischemikalien gewährleistet.
DFG-Verfahren
Schwerpunktprogramme
Teilprojekt zu
SPP 2363:
Nutzung und Entwicklung des maschinellen Lernens für molekulare Anwendungen - Molekulares maschinelles Lernen
Internationaler Bezug
Frankreich
Mitverantwortliche
Martin Dippe, Ph.D.; Professor Dr. Ludger A. Wessjohann
Kooperationspartner
Professor Dr. Jean Loup Faulon