Detailseite
Projekt Druckansicht

Robuste Identifizierung abhängiger Komponenten in mehreren hochdimensionalen Datensätzen basierend auf wenigen Beobachtungen

Fachliche Zuordnung Elektronische Halbleiter, Bauelemente und Schaltungen, Integrierte Systeme, Sensorik, Theoretische Elektrotechnik
Förderung Förderung von 2014 bis 2022
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 262301625
 
Ziel dieses Antrags ist die Entwicklung von Methoden zur robusten Identifizierung von abhängigen Komponenten in mehreren hochdimensionalen Datenstrukturen, wo die Anzahl der Stichproben relativ klein ist. Viele Algorithmen benötigen diese Information als Eingabeparameter. In der Biomedizin beispielsweise gibt es etablierte Prozeduren, Daten von verschiedenen bildgebenden Modalitäten zu fusionieren, aber um diese einzusetzen, muss man die abhängigen Komponenten in den verschiedenen Datensätzen kennen. Ein weiteres Beispiel ist die Schätzung des Ankunftswinkels bei einem Sensor Array, wo viele Algorithmen Kenntnis der Anzahl der bei diesem Array eintreffenden Quellen voraussetzen.Dieses Problem wird oft ad hoc gelöst, mit stark schwankenden Ergebnissen. Die Entwicklung systematischer Ansätze ist deswegen von großem Interesse für eine Vielzahl von Problemen in den Natur- und Ingenieurwissenschaften. Der Fokus unseres Antrags liegt auf der Theorie, aber wir werden einige ausgewählte Anwendungen in der Biomedizin betrachten, um die Leistungsfähigkeit unserer Methoden aufzuzeigen.Unsere Ziele in diesem Antrag sind also:- Regeln zur Wahl des geeigneten Modells bei mehreren Datensätzen mit relativ kleinem Stichprobenumfang zu entwickeln. Die Behandlung mehrerer Datensätze ist viel schwieriger als die Abhängigkeiten zwischen zwei Datensätzen zu finden, weil es so viele mögliche Abhängigkeitsstrukturen gibt. Die wenigen existierenden Ansätze funktionieren nur für großen Stichprobenumfang und machen sehr restriktive Annahmen über die zugrundeliegende Korrelationsstruktur.- Unsere Techniken zweiter Ordnung robust gegen Abweichungen von der Gaußverteilung zu machen. Das ist wichtig, um mit heavy-tailed Rauschen und Ausreißern, die in der Praxis oft vorkommen, umgehen zu können.- Zuerst eine Theorie basierend auf Korrelationen zweiter Ordnung, die nur lineare Abhängigkeiten betrachtet, zu entwickeln, und dann unsere Ansätze zu erweitern, um auch nichtlineare Abhängigkeiten zu berücksichtigen.- Die Beschränkungen zu untersuchen, die ein kleiner Stichprobenumfang bei der Identifizierbarkeit nichtlinearer Abhängigkeiten bedingt. Wir erwarten natürlich, dass die Anzahl der Stichproben die Menge an Information bestimmt, die man aus den Datensätzen extrahieren kann.- Unsere Techniken auf einige ausgewählte Probleme in der Biomedizin anzuwenden. Es ist zu erwarten, dass diese Anwendungen stark von unserem Projekt profitieren werden. Es ist immer noch gängige Praxis in der biomedizinischen Community, Probleme der Modellwahl ad hoc mit Faustegeln zu lösen. Ein systematischer Ansatz wird helfen, überzeugendere Lösungen zu finden.
DFG-Verfahren Sachbeihilfen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung