Detailseite
Projekt Druckansicht

FOR 5363:  KI-FOR Integration von Deep Learning und Statistik zum Verständnis strukturierter biomedizinischer Daten

Fachliche Zuordnung Informatik, System- und Elektrotechnik
Medizin
Sozial- und Verhaltenswissenschaften
Förderung Förderung seit 2022
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 459422098
 
Hochdurchsatzmessungen in den biomedizinischen Wissenschaften wie z.B. Bilder, Genomsequenzen oder Zeitreihen stellen strukturierte Daten dar, die durch inhärente Abhängigkeiten zwischen den Messungen, oft nicht-vektorielle Struktur und das Vorhandensein von Störgrößen und Stichprobenverzerrung gekennzeichnet sind. So können z.B. die Populationsstruktur, systematische Messartefakte, nicht unabhängige Stichproben oder unterschiedliche Altersverteilungen in den Gruppen zu falschen Ergebnissen führen, wenn sie nicht berücksichtigt werden. Deep Learning (DL) zeichnet sich in vielen Anwendungen auf strukturierten Daten durch die Fähigkeit aus, komplexe Abhängigkeiten innerhalb und zwischen Eingaben und Ausgaben zu erfassen, was eine genaue Prädiktion ermöglicht. Trotz der jüngsten Fortschritte bei erklärbarer künstlicher Intelligenz und Bayesschen neuronalen Netzen gibt es beim DL immer noch Einschränkungen hinsichtlich der Unsicherheitsquantifizierung, Interpretierbarkeit und Validierung. Dies sind jedoch wichtige Komponenten, um über die Prädiktion hinaus Verständnis der zugrunde liegenden Biologie zu erlangen. Zu diesem Zweck wurde in den biomedizinischen Wissenschaften traditionell die Statistik verwendet, aufgrund der interpretierbaren Modellergebnisse und der statistischen Inferenz, die u.a. eine Quantifizierung der Unsicherheit, Adjustierung für Störgrößen und Testen von Hypothesen mit statistischer Fehlerkontrolle ermöglicht. Methoden der klassischen Statistik sind jedoch begrenzt in ihrer Modellierungsflexibilität für strukturierte Daten und ihrer Fähigkeit, komplexe Nichtlinearitäten datengesteuert zu erfassen.In dieser Forschungsgruppe bringen wir Experten aus dem Bereich des maschinellen Lernens und der Statistik mit Erfahrung in biomedizinischen Anwendungen zusammen, um die folgenden übergreifenden Ziele zu erreichen:(O1) Integration von DL und Statistik zur Verbesserung der Interpretierbarkeit, Unsicherheitsquantifizierung und statistischen Inferenz für DL und zur Verbesserung der Modellierungsflexibilität statistischer Methoden für strukturierte Daten. Insbesondere werden wir Methoden entwickeln, die statistische Inferenz für strukturierte Daten durch Unsicherheitsquantifizierung, Testen von Hypothesen und Adjustierung für Störgrößen ermöglichen, und die Erklärungen strukturierter Daten durch hybride statistische und Deep-Learning-Modelle, Erklärungen auf Populations- und Verteilungsebene und robuste dünnbesetzte Erklärungen verbessern. (O2) Schaffung einer Rückkopplungsschleife zwischen dieser Methodenentwicklung und biomedizinischen Anwendungen, wobei wir bei der Entwicklung neuer Methoden die Bedürfnisse bei der Analyse der Daten berücksichtigen und biomedizinische Erkenntnisse aus den Anwendungen der entwickelten Methoden auf die Daten gewinnen wollen. Zu den Anwendungen gehören die Analyse von MRT-, fMRT- und Mikroskopie-Bildern, Krankheitsverlaufsmodellierung, DNA-Sequenzanalysen und genetische Assoziationsstudien.
DFG-Verfahren Forschungsgruppen

Projekte

 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung