Detailseite
Projekt Druckansicht

Hyperbolische Stochastische Nachbarschafts-Einbettungen

Antragsteller Dr. Martin Skrodzki
Fachliche Zuordnung Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Mathematik
Förderung Förderung von 2021 bis 2023
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 455095046
 
Erstellungsjahr 2023

Zusammenfassung der Projektergebnisse

Die Analyse von Daten ist für eine Vielzahl von Branchen und für die Forschung nahezu allen Bereichen von großer Bedeutung. Eine besonders anspruchsvolle Art von Daten sind hochdimensionale Datensätze. Mit zunehmender Rechenleistung und fortschreitender Messtechnik treten hochdimensionale Daten immer häufiger auf. Eine weit verbreitete Praxis, um die hochdimensionalen Datenpunkte für die visuelle Analyse durch den Menschen zugänglich zu machen, besteht darin, sie in einen niedrigdimensionalen Raum einzubetten. Unser Fokus lag auf dem populären Stochastic Neighbor Embedding (SNE) Algorithmus, der diese Einbettungen berechnet, sowie auf seiner Variante t-Distributed Stochastic Neighbor Embedding (t-SNE). Unser Forschungsprojekt zielte darauf ab, den t-SNE-Ansatz in zwei Schlüsselaspekten weiterzuentwickeln: Skalierbarkeit und Verallgemeinerung auf hyperbolische Räume. Das Ziel unseres ersten Arbeitspakets war die Entwicklung eines hierarchischen Lösers für die Berechnung von t-SNE-Einbettungen auf mehreren Ebenen. Ein ähnlicher Ansatz wurde kürzlich als zweistufige Sampling-Technik beschrieben. Unsere Experimente zeigten keine zusätzlichen Vorteile in Bezug auf die Berechnungszeit oder die Einbettungsqualität, wenn das Sampling iteriert wird, d. h. wenn zu einem Ansatz mit drei oder mehr Skalen übergegangen wird. Unsere Experimente zeigten jedoch einen Zusammenhang zwischen einem der wichtigsten Hyperparameter von t-SNE, der Perplexität, und der Anzahl der einzubettenden Datenpunkte. Auf dieser Grundlage konnten wir das einfache Schema zu einem Beschleunigungsschema mit zusätzlichen Vorteilen in Bezug auf die Rechenzeit und die Einbettungsqualität erweitern. Zum zweiten Aspekt ist anzumerken, dass t-SNE-Methoden meist euklidische Räume für Einbettungen verwenden. Im zweiten und dritten Arbeitspaket zielten wir auf die Einbettung von Datenpunkten in hyperbolische Räume ab, die aufgrund ihrer unterschiedlichen Metriken eine vielversprechende Alternative darstellen. Mehrere Arbeiten haben sich mit diesem hyperbolischen Einbettungsproblem befasst. Alle diese Arbeiten folgen jedoch der ursprünglichen t-SNE-Methode, ohne Beschleunigungsstrukturen, wie z. B. eine Baumapproximation, zu verwenden. In diesem Projekt haben wir eine solche Beschleunigungsstruktur für die Einbettung von Berechnungen in den hyperbolischen Raum entwickelt. Im dritten Arbeitspaket wollten wir die Interaktionsmöglichkeiten untersuchen, die hyperbolische t-SNE bietet, wie z.B. die Veränderung der Krümmung des Einbettungsraums und die Verwendung hyperbolischer Focus+Context-Techniken zur Untersuchung der Daten. Aus Zeitgründen wurden die Elemente dieses Arbeitspakets im Rahmen des Projekts nicht in Angriff genommen und werden als künftige Arbeiten verbleiben.

Projektbezogene Publikationen (Auswahl)

 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung