Detailseite
Generativer Algorithmus auf Basis künstlicher Intelligenz zur Erhöhung der Prädiktivität präklinischer Studien bei gleichzeitig kleinem Stichprobenumfang
Antragsteller
Professor Dr. Jörn Lötsch
Fachliche Zuordnung
Epidemiologie und Medizinische Biometrie/Statistik
Pharmakologie
Pharmakologie
Förderung
Förderung seit 2021
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 464505234
Die Umsetzung der Ergebnisse pharmakologischer Grundlagenforschung in neue klinisch wirksame Substanzen erscheint oft unbefriedigend. Dies wurde auf unzureichende Datenqualitätsstandards und kleine Stichprobengrößen in präklinischen Studien zurückgeführt. Im beantragten Projekt wird die Entwicklung einer auf künstlicher Intelligenz (KI) basierenden Methode, um künstlich valide zusätzliche Daten zu generieren, ohne die Stichprobengröße in präklinischen Experimenten zu erhöhen. Die Generierung valider neuer Daten erfordert daher einen Algorithmus, der hochdimensionale Strukturen in den Daten erkennen und diese Struktur dann zur Generierung neuer Daten nutzen kann, die mit den verfügbaren Daten konsistent sind. In diesem Projekt sollen die vielversprechendsten Ansätze der dichtebasierten Clusterbildung und Datengenerierung hinsichtlich ihrer Eignung verglichen werden, aus zu wenigen Daten mehr, aber geeignete Daten zu erzeugen. Auf der Grundlage umfangreicher Vorerfahrungen und vorläufiger experimenteller Ergebnisse wird eine auf emergenten selbstorganisierenden Karten (ESOM) basierende Methode als strukturerkennender Algorithmus auf der Grundlage künstlicher neuronaler Netze entwickelt. Sie wird mit alternativen Methoden der künstlichen Datengenerierung und dis-tanzbasiertem Clustering verglichen, einschließlich, aber nicht ausschließlich, Generative Adversarial Networks (GAN), Gaussian-Mix-Modelle (GMM), Hidden-Markov-Modelle (HMM), naive Bayes'sche Modelle, latente Dirichlet-Allokation und (eingeschränkte) Boltzman-Maschinen und DataBoost-IM sowie hierarchisches DBSCAN, adaptive Dichte-Peak-Clustering und adaptive Affinitätsausbreitungs-Clustering. Der am besten geeignete Ansatz sollte zu einer praktikablen Methode für präklinische Studien entwickelt werden.Das Arbeitsprogramm umfasst (i) Grundlagenforschung zur Weiterentwicklung und Verfeinerung der generativen ESOM-Methode einschließlich der vergleichenden Bewertung von möglichen Alternativmethoden, (ii) ihren Vergleich mit alternativen zeitgenössischen Methoden des generativen maschinellen Lernens für die Datengenerierung und dichtebasiertes Clustering, (iii) die Anwendung der geeignetsten Methode auf verschiedene biomedizinische Datensätze einschließlich der Entwicklung einer Arbeitslösung für die Generierung valider neuer Fälle in Daten aus der präklinischen Forschung, begleitet und gefolgt von (iv) der Implementierung der ESOM-basierten generativen Methode der Datenvervollständigung als frei verfügbare Softwarelösung.Das primäre Ziel des geplanten Projekts ist die Entwicklung einer Methode zur validen und probabilistischen Generierung von experimentellen Daten, die zusammen mit den Originaldaten die hohe Datendichte liefert, die notwendig ist, um aus vorklinischen Experimenten valide Schlussfolgerungen zu ziehen.
DFG-Verfahren
Sachbeihilfen