Detailseite
Projekt Druckansicht

Lokale Abhängigkeiten im Kontext großer Eventdaten

Antragsteller Dr. Cornelius Fritz
Fachliche Zuordnung Statistik und Ökonometrie
Förderung Förderung von 2023 bis 2024
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 520770522
 
Erstellungsjahr 2025

Zusammenfassung der Projektergebnisse

Digitale Plattformen generieren heutzutage eine Vielzahl an Netzwerkdaten, zum Beispiel soziale Interaktionen wie Nachrichten und E-Mails. Diese Interaktionen bilden Netzwerke, die sich im Laufe der Zeit entwickeln und wertvolle Einblicke in Kommunikationspattern, Verhalten und strukturelle Abhängigkeiten erlauben. Traditionelle statistische Modelle stoßen jedoch bei der Analyse von großen Netzwerkdaten an ihre Grenzen, da sie von globalen Abhängigkeitsannahmen und schlechter computationalen Skalierung restringiert sind. Dieses Projekt nimmt sich dieser Herausforderungen an, indem es skalierbare statistische Modelle für große Netzwerkdaten entwickelt. Im Laufe des Projekts verlagerte sich der Fokus von reinen Ereignisdaten hin zu allgemeinen Netzwerkdaten ohne zeitliche Information, da es an geeigneten Modellen für große statische Netzwerke bereits mangelte. Diese Arbeit dient als Grundlage für zukünftige Erweiterungen um die temporale Information zu nutzen. Die Forschung entwickelt innovative Methoden, die auf lokaler Abhängigkeit basieren. Dieser Ansatz basiert darauf, dass Einheiten in einem Netzwerk vor allem ihre lokalen Nachbarschaften, nicht das gesamte Netzwerk wahrnehmen. Drei Ansätze sollten in dem Projekt ursprünglich verfolgt werden: 1. Non-Overlapping Neighborhoods: Die Ereignisse werden innerhalb bestimmter, isolierter Gruppen von Akteuren analysiert. 2. Domain-Driven Overlapping Neighborhoods: Die Interaktionen der Akteure werden durch sich überschneidende soziale Kontexte, wie gemeinsame Zugehörigkeiten oder gemeinsame Partner, bestimmt. 3. Latent Social Spaces: Akteursbeziehungen werden in einem latenten Raum dargestellt, in dem die Nähe die Wahrscheinlichkeit einer Interaktion widerspiegelt. Der dritte Ansatz konnte bisher nicht umgesetzt werden. Diese Modelle sind sowohl theoretisch fundiert als auch computational skalierbar und ermöglichen die effiziente Analyse großer Netzwerke mit bis zu 50.000 Akteuren. Anwendungen der Modelle reichen von der Untersuchung der Informationsverbreitung in sozialen Medien bis hin zur Modellierung von Abhängigkeitsnetzwerken zwischen Open-Source-Softwarepaketen. Gleichzeitig legt das Projekt großen Wert auf Reproduzierbarkeit und Zugänglichkeit der erarbeiteten Methoden. Dies führte zur Veröffentlichung des Softwarepakets bigergm, das speziell für die Analyse großer Netzwerke entwickelt wurde. Dadurch wird sichergestellt, dass Substanz-Forscher aus den Sozialwissenschaften diese Werkzeuge zur Lösung realer Probleme einsetzen können. Dieses Projekt schließt die Lücke zwischen theoretischer statistischer Modellierung und praktischer Analyse großer Netzwerkdaten und bietet Werkzeuge, um komplexe, dynamische Netzwerke in der heutigen datengetriebenen Welt besser verstehen zu können.

Projektbezogene Publikationen (Auswahl)

 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung