Lokale Abhängigkeiten im Kontext großer Eventdaten
Zusammenfassung der Projektergebnisse
Digitale Plattformen generieren heutzutage eine Vielzahl an Netzwerkdaten, zum Beispiel soziale Interaktionen wie Nachrichten und E-Mails. Diese Interaktionen bilden Netzwerke, die sich im Laufe der Zeit entwickeln und wertvolle Einblicke in Kommunikationspattern, Verhalten und strukturelle Abhängigkeiten erlauben. Traditionelle statistische Modelle stoßen jedoch bei der Analyse von großen Netzwerkdaten an ihre Grenzen, da sie von globalen Abhängigkeitsannahmen und schlechter computationalen Skalierung restringiert sind. Dieses Projekt nimmt sich dieser Herausforderungen an, indem es skalierbare statistische Modelle für große Netzwerkdaten entwickelt. Im Laufe des Projekts verlagerte sich der Fokus von reinen Ereignisdaten hin zu allgemeinen Netzwerkdaten ohne zeitliche Information, da es an geeigneten Modellen für große statische Netzwerke bereits mangelte. Diese Arbeit dient als Grundlage für zukünftige Erweiterungen um die temporale Information zu nutzen. Die Forschung entwickelt innovative Methoden, die auf lokaler Abhängigkeit basieren. Dieser Ansatz basiert darauf, dass Einheiten in einem Netzwerk vor allem ihre lokalen Nachbarschaften, nicht das gesamte Netzwerk wahrnehmen. Drei Ansätze sollten in dem Projekt ursprünglich verfolgt werden: 1. Non-Overlapping Neighborhoods: Die Ereignisse werden innerhalb bestimmter, isolierter Gruppen von Akteuren analysiert. 2. Domain-Driven Overlapping Neighborhoods: Die Interaktionen der Akteure werden durch sich überschneidende soziale Kontexte, wie gemeinsame Zugehörigkeiten oder gemeinsame Partner, bestimmt. 3. Latent Social Spaces: Akteursbeziehungen werden in einem latenten Raum dargestellt, in dem die Nähe die Wahrscheinlichkeit einer Interaktion widerspiegelt. Der dritte Ansatz konnte bisher nicht umgesetzt werden. Diese Modelle sind sowohl theoretisch fundiert als auch computational skalierbar und ermöglichen die effiziente Analyse großer Netzwerke mit bis zu 50.000 Akteuren. Anwendungen der Modelle reichen von der Untersuchung der Informationsverbreitung in sozialen Medien bis hin zur Modellierung von Abhängigkeitsnetzwerken zwischen Open-Source-Softwarepaketen. Gleichzeitig legt das Projekt großen Wert auf Reproduzierbarkeit und Zugänglichkeit der erarbeiteten Methoden. Dies führte zur Veröffentlichung des Softwarepakets bigergm, das speziell für die Analyse großer Netzwerke entwickelt wurde. Dadurch wird sichergestellt, dass Substanz-Forscher aus den Sozialwissenschaften diese Werkzeuge zur Lösung realer Probleme einsetzen können. Dieses Projekt schließt die Lücke zwischen theoretischer statistischer Modellierung und praktischer Analyse großer Netzwerkdaten und bietet Werkzeuge, um komplexe, dynamische Netzwerke in der heutigen datengetriebenen Welt besser verstehen zu können.
Projektbezogene Publikationen (Auswahl)
-
bigergm: Fit, Simulate, and Diagnose Hierarchical Exponential-Family Models for Big Networks. CRAN: Contributed Packages. The R Foundation.
Fritz, Cornelius; Schweinberger, Michael; Komatsu, Shota; Martínez Dahbura, Juan Nelson; Nishida, Takanori & Mele, Angelo
-
Vulnerability Webs: Systemic Risk in Software Networks. Elsevier BV.
Fritz, Cornelius; Georg, Co-Pierre; Mele, Angelo & Schweinberger, Michael
-
A Regression Framework for Studying Relationships among Attributes under Network Interference. Journal of the American Statistical Association, 1-22.
Fritz, Cornelius; Schweinberger, Michael; Bhadra, Subhankar & Hunter, David R.
-
Socio-cognitive networks between researchers: Investigating scientific dualities with the group-oriented relational hyperevent model. Social Networks, 83, 1-13.
Espinosa-Rada, Alejandro; Lerner, Jürgen & Fritz, Cornelius
