Detailseite
Projekt Druckansicht

Modellbildung aus Experimentaldaten: Maschinelles Lernen und Modellevaluierung unter Abhängigkeiten und Verteilungsverschiebungen

Fachliche Zuordnung Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung Förderung von 2012 bis 2023
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 225197905
 
Erstellungsjahr 2023

Zusammenfassung der Projektergebnisse

Das Projekt untersucht und entwickelt Methoden des maschinellen Lernens für Daten, die durch besondere Verteilungseigenschaften geprägt sind. Traditionell wird in den meisten methodischen Ansätzen des maschinellen Lernens unterstellt, dass Datenpunkte unabhängige Stichproben aus einer einheitlichen Verteilung darstellen (englisch i.i.d., für independently drawn from identical distributions). Aufgrund spezifischer experimenteller Beobachtungsprozesse können Daten diese Annahme aber in verschiedener Weise verletzen. Im Projekt fokussieren wir uns auf zwei spezifische Verteilungseigenschaften: (1) Abhängigkeiten zwischen Datenpunkten, die durch individuelle Effekte von z.B. Versuchspersonen entstehen; (2) Verteilungsverschiebungen innerhalb der Daten, die z.B. durch an unterschiedlichen Orten durchgeführte Messungen entstehen. Zur Untersuchung dieser Phänomene fokussiert das Projekt auf zwei Anwendungsdomänen, in denen die entsprechenden Verteilungseigenschaften in charakteristischer Weise auftreten: (1) Blickbewegungsdaten in der Psychologie, welche stark durch individuelle Effekte geprägt sind sowie (2) Bodenbewegungsdaten in der seismischen Risikoanalyse, in denen räumliche Verteilungsverschiebungen durch unterschiedlicher Messstandorte eine große Rolle spielen. Zentrale Ergebnisse des Projekts im Bereich individueller Effekte sind Modelle zur Charakterisierung individueller Verteilungen in Sequenzdaten, von vollständig probabilistischen Modellen über Kombinationen von probabilistischen Modellen mit neuronalen Netzen bis zu Modellen, die auf Ansätzen des Metriklernens basieren. Auf der Anwendungsseite konnten wir zeigen, dass Blickbewegungsmuster hochgradig individuell sind, und daher auch zur biometrischen Identifikation von Personen dienen können. Dabei konnten wir die Erkennungsgenauigkeit im Vergleich zu existierenden Ansätzen aus der Literatur erheblich steigern. Zentrale Ergebnisse des Projekts im Bereich Verteilungsverschiebungen sind Modelle, die kontinuierliche räumliche Verteilungsverschiebungen in Daten abbilden. Dabei beschreibt ein Gauß’scher Prozess die räumliche Veränderung von Modellparametern, die ihrerseits den Zusammenhang zwischen Eingaben (z.B. Erdbebenattribute) und Ausgaben (z.B. Bodenbewegung) beschreiben. Auf der Anwendungsseite konnten wir zeigen, dass solche Modelle deutlich präzise Vorhersagen der Bodenbewegung liefern als i.i.d.-Modelle.

Projektbezogene Publikationen (Auswahl)

 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung