Detailseite
Projekt Druckansicht

Robuste Identifizierung abhängiger Komponenten in mehreren hochdimensionalen Datensätzen basierend auf wenigen Beobachtungen

Fachliche Zuordnung Elektronische Halbleiter, Bauelemente und Schaltungen, Integrierte Systeme, Sensorik, Theoretische Elektrotechnik
Förderung Förderung von 2014 bis 2025
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 262301625
 
Erstellungsjahr 2023

Zusammenfassung der Projektergebnisse

In diesem Projekt haben wir systematische und theoriegestützte Verfahren zur robusten Identifizierung abhängiger und korrelierter Komponenten in mehreren hochdimensionalen Datensätzen entwickelt. Die Identifizierung abhängiger Komponenten in mehreren Datensätzen ist ein grundlegendes Problem in vielen praktischen Anwendungen, die von der Nachrichtentechnik (z. B. Schätzung der Anzahl der Quellen, die auf eine Gruppe von Sensoranordnungen einwirken) über die Klimawissenschaft (z. B. Identifizierung gekoppelter Klimamuster) bis hin zur Biomedizin (z. B. Suche nach korrelierten Merkmalen für die Fusion von Hirnbilddaten aus verschiedenen Modalitäten) reichen. Die Herausforderung bei diesen Anwendungen besteht darin, dass die Datensätze oft hochdimensional sind, nur wenige Beobachtungen oder Stichproben zur Verfügung stehen und latente Komponenten mit unbekannten Wahrscheinlichkeitsverteilungen enthalten. Wir haben gezeigt, dass die Bestimmung der vollständigen Korrelationsstruktur, d. h. welche Komponenten über welche Datensätze hinweg korreliert sind, die Abhängigkeit zweiter Ordnung zwischen den Datensätzen vollständig charakterisiert. Das Projekt war in zwei Teile gegliedert. Im Rahmen des ersten Teils wurden Algorithmen zur Ermittlung der Korrelationen zwischen Komponenten in zwei hochdimensionalen Datensätzen entwickelt. Die Komponenten können entweder unkorreliert oder zwischen beiden Datensätzen korreliert sein. Im darauf aufbauenden gemeinsamen DFG-Projekt wurde die Identifizierung von Korrelationsstrukturen zwischen mehr als zwei Datensätzen untersucht. Dieses allgemeinere Problem ist komplexer, da einige Komponenten völlig unkorreliert sein können, einige zwischen einigen Datensätzen und einige zwischen allen Datensätzen korreliert sein können. Im Vergleich zu den in der Literatur vorhandenen Verfahren setzen die entwickelten Verfahren keine bestimmte Korrelationsstruktur aus und funktionieren gut bei einer großen Anzahl von Datensätzen, bei Unsicherheiten bezüglich der Wahrscheinlichkeitsmodelle, Rauschverteilungen mit schweren Rändern und Ausreißern. Aufgrund ihrer statistischen Garantien können die Methoden ohne weiteres auf eine Vielzahl praktischer Probleme angewandt werden. Zu den Anwendungen im Rahmen dieses Projekts gehörten drahtlose akustische Netzwerke, Array-Signalverarbeitung, Neurowissenschaften und Epilepsie, wo die Identifizierung der vollständigen Korrelationsstruktur und die Quantifizierung der Stärke des Zusammenhangs zwischen mehreren Datensätzen die Stärke der Assoziation zwischen mehreren Datensätzen zu erheblichen Leistungssteigerungen und zur Identifizierung potenzieller Biomarker führen. Die von uns entwickelten Techniken sind öffentlich zugänglich, damit andere Forscher sie für die Entwicklung verbesserter Algorithmen nutzen und abändern können.

Projektbezogene Publikationen (Auswahl)

 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung