Detailseite
Exploration des Raumes Chemischer Verbindungen mit Methoden des maschinellen Lernens
Fachliche Zuordnung
Theoretische Informatik
Theoretische Chemie: Elektronenstruktur, Dynamik, Simulation
Theoretische Chemie: Elektronenstruktur, Dynamik, Simulation
Förderung
Förderung von 2014 bis 2017
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 253375148
Die akkurate Vorhersage molekularer Eigenschaften im Raum der chemischen Verbindungen (chemical compound space (CCS)) ist ein entscheidender Schritt für das Design neuer Verbindungen in der chemischen und pharmazeutischen Industrie. Daher ist es eine der großen Herausforderungen, quantitative Berechnungen molekularer Eigenschaften in vergleichsweise geringer Rechenzeit (Millisekunden pro Molekül oder schneller) durchführen zu können. Allerdings sind bis heute nur hoch-präzise quanten-chemische Rechnungen, die bis zu mehrere Tage Rechenzeit pro Molekül benötigen, in der Lage, die gewünschte 'chemische Genauigkeit'' (1~kcal/mol) zu erzielen, die für ein prädiktives \textit{in silico} Design molekularer Verbindungen notwendig ist.In der Vergangenheit konnten Methoden des maschinellen Lernens (ML) bereits erfolgreich eingesetzt werden, um das Problem der Lösung komplexer Differentialgleichungen auf statistische Modellierung abzubilden. In diesem Projekt soll daher die Leistungsfähigkeit von ML Methoden untersucht werden, um verschiedene molekulare Eigenschaften vorherzusagen, die aus quantenchemischen Berechnungen gewonnen wurden. Unser Hauptfokus liegt auf der Vorhersage molekularer Energien, jedoch sollen dieselben Ideen in einem weiteren Schritt zur Prädiktion von Eigenschaften angeregter Zustände, wie Polarisierbarkeit, Ionisationspotential und Elektronenaffinität eingesetzt werden.Es ist unsere Absicht durch ML Methoden Vorhersagen molekularer Eigenschaften mit annähernd 'chemische Genauigkeit' bei einem verschwindenden Bruchteil der Rechenkosten klassischer Elektronenstrukturberechnungen zu ermöglichen. Mit Erreichen dieses Zieles wären wir in die Lage versetzt, den Raum der chemischen Verbindungen systematisch zu erforschen und zu analysieren.Die erwarteten Resultate des Projektes sind: (a) eine physikalische Analyse (Exploration) des CCS mittels optimaler ML Modelle, mit dem Potenzial, wichtige Molekülklassen zu identifizieren und die Dimensionalität des CCS zu verstehen, (b) eine rigorose Bewertung der Möglichkeiten und Grenzen von ML Techniken für die Vorhersage molekularer Eigenschaften, und (c) ein Datensatz genauer molekularer Eigenschaften für eine Vielfalt von Molekülen, berechnet mit unterschiedlichen Genauigkeitsniveaus verschiedener quantenchemischer Theorien.
DFG-Verfahren
Sachbeihilfen