Generativer Algorithmus auf Basis künstlicher Intelligenz zur Erhöhung der Prädiktivität präklinischer Studien bei gleichzeitig kleinem Stichprobenumfang

Antragsteller Professor Dr. Jörn Lötsch

Fachliche Zuordnung Epidemiologie und Medizinische Biometrie/Statistik
Pharmakologie

Förderung Förderung von 2021 bis 2025

Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 464505234

Projektbeschreibung

Die Umsetzung der Ergebnisse pharmakologischer Grundlagenforschung in neue klinisch wirksame Substanzen erscheint oft unbefriedigend. Dies wurde auf unzureichende Datenqualitätsstandards und kleine Stichprobengrößen in präklinischen Studien zurückgeführt. Im beantragten Projekt wird die Entwicklung einer auf künstlicher Intelligenz (KI) basierenden Methode, um künstlich valide zusätzliche Daten zu generieren, ohne die Stichprobengröße in präklinischen Experimenten zu erhöhen. Die Generierung valider neuer Daten erfordert daher einen Algorithmus, der hochdimensionale Strukturen in den Daten erkennen und diese Struktur dann zur Generierung neuer Daten nutzen kann, die mit den verfügbaren Daten konsistent sind. In diesem Projekt sollen die vielversprechendsten Ansätze der dichtebasierten Clusterbildung und Datengenerierung hinsichtlich ihrer Eignung verglichen werden, aus zu wenigen Daten mehr, aber geeignete Daten zu erzeugen. Auf der Grundlage umfangreicher Vorerfahrungen und vorläufiger experimenteller Ergebnisse wird eine auf emergenten selbstorganisierenden Karten (ESOM) basierende Methode als strukturerkennender Algorithmus auf der Grundlage künstlicher neuronaler Netze entwickelt. Sie wird mit alternativen Methoden der künstlichen Datengenerierung und dis-tanzbasiertem Clustering verglichen, einschließlich, aber nicht ausschließlich, Generative Adversarial Networks (GAN), Gaussian-Mix-Modelle (GMM), Hidden-Markov-Modelle (HMM), naive Bayes'sche Modelle, latente Dirichlet-Allokation und (eingeschränkte) Boltzman-Maschinen und DataBoost-IM sowie hierarchisches DBSCAN, adaptive Dichte-Peak-Clustering und adaptive Affinitätsausbreitungs-Clustering. Der am besten geeignete Ansatz sollte zu einer praktikablen Methode für präklinische Studien entwickelt werden.Das Arbeitsprogramm umfasst (i) Grundlagenforschung zur Weiterentwicklung und Verfeinerung der generativen ESOM-Methode einschließlich der vergleichenden Bewertung von möglichen Alternativmethoden, (ii) ihren Vergleich mit alternativen zeitgenössischen Methoden des generativen maschinellen Lernens für die Datengenerierung und dichtebasiertes Clustering, (iii) die Anwendung der geeignetsten Methode auf verschiedene biomedizinische Datensätze einschließlich der Entwicklung einer Arbeitslösung für die Generierung valider neuer Fälle in Daten aus der präklinischen Forschung, begleitet und gefolgt von (iv) der Implementierung der ESOM-basierten generativen Methode der Datenvervollständigung als frei verfügbare Softwarelösung.Das primäre Ziel des geplanten Projekts ist die Entwicklung einer Methode zur validen und probabilistischen Generierung von experimentellen Daten, die zusammen mit den Originaldaten die hohe Datendichte liefert, die notwendig ist, um aus vorklinischen Experimenten valide Schlussfolgerungen zu ziehen.

DFG-Verfahren Sachbeihilfen

Servicenavigation

Hauptnavigation

Generativer Algorithmus auf Basis künstlicher Intelligenz zur Erhöhung der Prädiktivität präklinischer Studien bei gleichzeitig kleinem Stichprobenumfang

Zusatzinformationen

Servicenavigation

Hauptnavigation

Generativer Algorithmus auf Basis künstlicher Intelligenz zur Erhöhung der Prädiktivität präklinischer Studien bei gleichzeitig kleinem Stichprobenumfang

Zusatzinformationen

Textvergrößerung und Kontrastanpassung