Weiterentwickelte Qualitätsmaße für die Informationsvisualisierung und die wissenschaftliche Visualisierung
Zusammenfassung der Projektergebnisse
Die visuelle Datenanalyse hat sich als ein Analysewerkzeug innerhalb der Visual Analytics im Speziellen und der Datenanalyse ganz allgemein in unterschiedlichen Domänen etabliert, da sie eine Nutzer-zentrierte qualitative und phänomenologische Analyse von Multiparamter-Daten erlaubt. Der Raum der im Einzelanwendungsfall betrachtbaren Datenvisualisierungen ist zumeist sehr mächtig und kann z. T. aus Millionen von Visualisierungen bestehen. Für die Analyse selbst ist oftmals nur eine kleine Untermenge dieser Visualisierungen für den Nutzer relevant. Da eine Sichtprüfung aller Visualisierungsinstanzen dem Nutzer nicht zuzumuten ist und praktisch kaum möglich wäre, stellt sich die Frage wie relevante Visualisierungen algorithmisch erkannt/selektiert werden können? Ein etablierter Ansatz ist die Verwendung von Qualitätsmetriken. Qualitätsmetriken bewerten die Relevanz von Datenvisualisierungen. Sie tun dies traditionell durch ihre Anwendung im Raum der Visualisierungen, neuerdings aber auch zunehmend durch Anwendung im Raum der Skalen, Visualisierungsparametern, oder im Datenraum selbst. Dieses Forschungsprojekt untersuchte in den Jahren den Einsatz von Qualitätsmetriken in bisher nicht genutzten – z. T. hybriden – Arten von Daten bzw. neuen Anwendungsfeldern und intensivierte die diesbezügliche Betrachtung von Skalen- und Parameterräumen, immer mit dem Ziel die Selektionsmechanismen relevanter Visualisierungen für den Nutzer zu optimieren. Konkret untersuchte das Projekte (i) die Optimierung der Selektion von geeigneten Visualisierungen; (ii) die Erweiterung der Nutzung auf Skalenraum, Parameterraum und dem Datenraum selbst, (iii) die Erweiterung auf weitere Visualisierungsansätze, und (iv) die Erweiterung auf weitere Datenarten. Einschlägige theoretische Beiträge aus diesem Projekt sind: a) der LloydRelaxer, welcher das Problem diskutiert, das unterschiedliche Skalen der Daten die Strukturbildung in diesen beeinflusst. Die Arbeit schlägt einen Ansatz vor den Einfluss von Skaleneffekten im Visualisierungsraum zu minimieren. b) Die General Projective Maps zeigen einen Ansatz, wie unterschiedliche Klassen von Visualisierungstechniken als Gesamtkonzept einer einheitlichen mathematischen Beschreibung zu verstehen sind, wodurch sich Metriken transferieren lassen und sich zudem weitere Wege aufzeigen solche Visualisierungen geeignet zu bewerten. Einschlägige praktische Beiträge aus diesem Projekt sind: c) das Optimal Set of Projections das einen Algorithmus einführt, welcher aus dem Parameterraum eine kleine Menge an relevanten Visualisierungen eines nD Datensatzes erzeugt, durch Berücksichtigung der Ähnlichkeiten bzgl. affiner Transformationen untereinander. d) die Regression Lens, die Discriminative Star Coordinates und die Visual Exploration of Local Patterns adressieren wichtige statistische Teilaspekte bei der visuellen Datenanalyse. Einschlägige anwenderspezifische Ansätze aus diesem Projekt sind: e) die Weighted Hierarchical Edge Bundles, welche eine interaktive Analyse der Comtrade-Data der United Nations Statistics Division (UNSD) erlauben und f) die Visual Explorarion of Categorical States in Lake Sediment Cores, welche eine Analyse von Sedimentdaten der Geowissenschaften unterstützen. Das Projekt wurde an der Otto-von-Guericke Universität in Magdeburg durchgeführt, unter einer Vielzahl nationaler und internationaler Kooperationen. Beispielhaft zu nennen sind die TU Graz in Österreich, die URJC Madrid in Spanien oder die Shandong Universität in China u.v.m. Der Themenkomplex bietet zukünftig weitere Anknüpfungspunkte für Folgeuntersuchungen, was sowohl die Analyse von zeitbehafteten Daten betrifft, als auch Fragestellungen bezüglich der Analyse von kategorialen Daten. Ein zunehmend zu adressierendes Problem ist die Frage wie der darstellerische Einfluss des Visualisierungsprozesses selbst durch Qualitätsmetriken noch besser bewertet werden kann.
Projektbezogene Publikationen (Auswahl)
-
Optimal Sets of Projections of High-Dimensional Data, IEEE Transactions on Visualization and Computer Graphics (IEEE Information Visualization), 2015
Dirk J. Lehmann and Holger Theisel
-
General Projective Maps for Multidimensional Data Projection, Computer Graphics Forum (Proc. Eurographics), 2016
Dirk J. Lehmann and Holger Theisel
-
Adaptable Radial Axes Plots for Improved Multivariate Data Visualization, Computer Graphics Forum (EuroVis), 2017
Manuel Rubio-Sanchez, Alberto Sanchez and Dirk J. Lehmann
-
Interactive Regression Lens for Exploring Scatter Plots, Computer Graphics Forum (EuroVis), 2017
Lin Shao, Aishwarya Mahajan, Tobias Schreck and Dirk J. Lehmann
-
The LloydRelaxer: An Approach to Minimize Scaling Effects for Multivariate Projections, IEEE Transactions on Visualization and Computer Graphics, 2017
Dirk J. Lehmann and Holger Theisel
-
Understanding a Sequence of Sequences: Visual exploration of categorical states in lake sediment cores, IEEE Transactions on Visualization and Computer Graphics (Proc. IEEE VAST), 2017
Andrea Unger, Nadine Dräger, Mike Sips and Dirk J. Lehmann
-
Visual Exploration of Global Trade Networks with Time-Dependent and Weighted Hierarchical Edge Bundles on GPU, Computer Graphics Forum (EuroVis), 2017
Johannes Hofmann, Michael Groessler, Peter-Paul Pichler and Dirk J. Lehmann
-
Interactive Visual Exploration of Local Patterns in Large Scatterplot Spaces, Computer Graphics Forum (EuroVis), 2018
M. Chegini, L. Shao, R. Gregor, D. J. Lehmann, K. Andrews and T. Schreck
-
Scaled Radial Axes for Interactive Visual Feature Selection: A Case Study for Analyzing Chronic, Conditions Expert Systems With Applications, 2018
A. Sanchez, C. Soguero-Ruiz, I. Mora-Jiménez, F. J. Rivas-Flores, D. J. Lehmann and M. Rubio-Sánchez
-
Insight Beyond Numbers: The Impact of Qualitative Factors on Visual Data Analysis, IEEE Transactions on Visualization and Computer Graphics (Proc. IEEE VAST), 2020
Benjamin Karer, Hans Hagen, and D. J. Lehmann