Detailseite
Projekt Druckansicht

Fingerprints entschlüsseln - Auf dem Weg zu einem ganzheitlichen Erklärungsinstrumentarium für molekulares maschinelles Lernen

Fachliche Zuordnung Organische Molekülchemie - Synthese, Charakterisierung
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung Förderung seit 2022
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 497089464
 
Unser zentrales Anliegen mit diesem Antrag ist die Entwicklung von allgemein nutzbaren Algorithmen für interpretierbares und erklärbares Molekulares Maschinelles Lernen auf einer strukturellen Ebene. Im Rahmen dieses Projekts werden weit verbreitete molekulare Repräsentationen entwickelt, angepasst und verwendet, um robuste und präzise Modelle zu trainieren (z.B. Gradient Boost Algorithmen). Ausgehend von diesen Modellen wird eine Open-Source Softwarepipeline konstruiert, um die Wichtigkeit, den Einfluss und die Abhängigkeiten von Features sowie die Konfidenz von Modellen auf die Molekülstruktur abzubilden und somit ausgebildeten Chemikern eine einfache Möglichkeit zum Molekül- und Reaktionsdesign zu eröffnen. Ein wichtiger Teil dieser Arbeit wird die Entwicklung von Visualisierungen sein, die einerseits ein hohes Maß an Genauigkeit bieten und andererseits für Wissenschaftler, die im Bereich der Molekularwissenschaften arbeiten, leicht zu verstehen sind. Diese Werkzeuge sollen sowohl für die Untersuchung und Verbesserung der zugrundeliegenden Datensätze als auch für das molekulare Design verwendet werden können. Neben der Colorierung und Visualisierung einzelner Moleküle sollen Methoden zur statistischen Auswertung hinsichtlich des generellen Einflusses funktioneller Gruppen entwickelt werden, um daraus Regeln für das weitere Reaktionsdesign abzuleiten. Schließlich sollen diese Regeln im Labor angewendet werden, um die im Rahmen dieses Antrags entwickelten Erklärungsmethoden zu validieren. Mit diesen Zielen zielt der Vorschlag darauf ab, die folgenden allgemeinen Ziele des SPPs zu erfüllen: "Anwendung moderner ML-Algorithmen - Erklärbare KI", "Entwicklung von (domänenspezifischen) molekularen Repräsentationen - Allgemein verbesserte molekulare Repräsentationen" und "Vorhersage, Verständnis und Interpretation molekularer Eigenschaften - Verbesserung der derzeitigen Anwendungen". In diesem Kontext liegt ein besonderer Schwerpunkt auf Interpretations- und Erklärungsmodellen für die quantitative Ausbeutevorhersage. Dadurch sollen Ansatzpunkte für eine systematische Verbesserung in diesem unterentwickelten Bereich der MML geschaffen werden. Dieser wurde als ein Hauptthema des SPP definiert.
DFG-Verfahren Schwerpunktprogramme
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung