Detailseite
Visuelle Analyse von Textdatenströmen
Antragsteller
Professor Dr. Thomas Ertl
Fachliche Zuordnung
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung
Förderung von 2018 bis 2023
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 392087235
Unsere globalen Kommunikationswege basieren zunehmend auf dem Austausch von unstrukturierten Textinformationen. Mit der Popularität von Kurznachrichten, sozialen Netzwerken und Online-Medien ist der häufige Konsum und die Verbreitung solcher Daten zu einem bestimmenden Element unseres Alltags geworden. Es gibt heute eine breite Palette von Anwendungsbereichen, die von der Fähigkeit profitieren können, kookkurrente Themen zu entdecken, korreliertes Verhalten zu analysieren und anomale Inhalte zu erkennen. Gleichzeitig stehen wir vor beispiellosen Bedrohungen, die durch die schnelle und unkontrollierte globale Verbreitung von Fehlinformationen und Gerüchten zustande kommen. Bedrohliche Aktivitäten wie der Einsatz von Social Bots zur Verbreitung falscher Behauptungen oder zur Sabotage des öffentlichen Diskurses konnten beobachtet werden. Während solche Verfahren bisher in ihren Fähigkeiten begrenzt waren, können wir nun oft fortschrittliche Verhaltenskomplexität, glaubwürdige Reaktionen und ausgeklügelte, orchestrierte Kampagnen sehen.Um die Entwicklung von Inhaltsmustern zu verstehen, anomale Informationen zu erkennen und koordinierte Aktivitäten zu entdecken, müssen wir uns mit den Herausforderungen von Echtzeit-Textdaten befassen. Wo bisherige Forschungen vor allem auf die Batch-Verarbeitung von Korpora gerichtet waren, wurde dieses Feld nur in geringem Maße berücksichtigt. Mit diesem Projekt soll diese Lücke durch eine neuartige Visual Analytics Methode geschlossen werden, welche Sprachverarbeitung, maschinelles Lernen und visuelle Schnittstellen anpasst und in einer interaktiven, analytischen Pipeline integriert. Zu diesem Zweck werden wir ein geeignetes Benchmark-Repository zusammenstellen und ein System entwickeln, das eine simulierte Wiedergabe dieser Daten ermöglicht. Mit diesem System werden wir die Echtzeit-Anwendbarkeit und -Anpassungsfähigkeit interaktiver Datenvisualisierungen untersuchen.Um den Schritt von der Stichprobenanalyse zu umfassendem Verständnis von sich entwickelnden Themen, korrelierten Verhaltensweisen und Unsicherheiten zu ermöglichen, werden wir unsere Visualisierungs- und Interaktionsmethoden mit speziell angepassten Mining-Tools verbinden. Wir werden insbesondere die Erweiterbarkeit von generativen Content-Modellen sowie evolutionärem Topic-Clustering untersuchen. Durch die Integration der vorhandenen Werkzeuge als Teil der visuellen Interaktionspipeline können wir eine gerichtete Voraggregation und Filterung ermöglichen, um so die kognitive Belastung zu reduzieren. Darüber hinaus kann durch die Öffnung der Black Box etablierter Mining-Tools eine interaktive Konfiguration und Kontrolle ermöglicht werden. Basierend auf Kontextwissen, Expertise und Intuition werden Analysten so in die Lage versetzt, die Kontrolle über das statistische Verfahren zu erlangen, das System mit der Interpretation von Zwischenergebnissen zu unterstützen und einen kontinuierlichen Abgleich mit ihrem Folgerungsprozess zu erreichen.
DFG-Verfahren
Sachbeihilfen
Internationaler Bezug
China
Partnerorganisation
National Natural Science Foundation of China
Kooperationspartner
Yingcai Wu, Ph.D.