"Überseeischer Austausch": Die Nachverfolgung globaler Informationsnetzwerke in historischen Zeitungsarchiven 1840-1918
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Europäische und Amerikanische Literatur- und Kulturwissenschaften
Zusammenfassung der Projektergebnisse
Im 19. Jahrhundert entstand die Massenpresse im modernen Sinne: Durch die Einführung von Telegraphen und weite Verbreitung von Druckerpressen entwickelte sich ein weltumspannendes und im Vergleich zu früheren Jahrhunderten extrem schnell kommunizierendes Netzwerk an Zeitungen, das sowohl regionale als auch weltweite Nachrichten an seine Leser weitergab. Diese Periode ist in vielerlei Hinsicht mit der heutigen Globalisierung vergleichbar und wirft gleichzeitig eine Vielzahl von Forschungsfragen auf: wie wurden Nachrichten übermittelt - gab es "Standardpfade"? Wurden Nachrichten einfach übernommen oder an das Publikum angepasst? Wie wurden Nachrichten aufgenommen und verhielten sich zu Fragen politischer oder ethnischer Identität? Erlauben Zeitungstexte auch den Vergleich von Konzepten über Zeitläufe oder Sprachgrenzen hinweg? Diese Forschungsfragen legen einen Ansatz im Sinne der digitalen Geisteswissenschaften nahe, bei dem große Mengen digitalisierter Zeitungstexte aus verschiedenen Ländern aufbereitet und im Hinblick auf Forschungsfragen verschiedener Disziplinen nutzbar gemacht werden. Das Projekt "Oceanic Exchanges: Tracing Global Information Networks In Historical Newspaper Repositories, 1840-1914" brachte ein internationales Konsortium zusammen, das aus Forscher*innen aus den USA, Mexiko, den Niederlanden, dem Vereinigten Königreich, Finnland und Deutschland bestand. Die beteiligten Disziplinen waren Literaturwissenschaft, (Kultur-)Geschichte, Bibliothekswissenschaft, Computerlinguistik und Visualisierung. Das deutsche Team an der Universität Stuttgart brachte Amerikanistik, Computerlinguistik und Visualisierung zusammen und widmete sich zwei Forschungskomplexen: erstens der Entwicklung von spezifischen Verarbeitungsverfahren und Werkzeugen zur praktischen Umsetzung dieser Forschungsvision, und zweitens der Demonstration der Nützlichkeit dieser Methoden für die digitalen Geisteswissenschaften. Dabei sind zusammenfassend folgende Punkte festzuhalten: ● Die Entwicklung von spezifischen Verarbeitungsverfahren musste vor allem ausgleichen, dass Zeitungsarchive bisher per Publikationsorgan oder bestenfalls auf nationaler Ebene digitalisiert wurden und daher wenig standardisiert wurden. Dazu kommen Fehler durch vollautomatische Texterkennung (z.B. "langes s" in Fraktur: Kossuth → Koffuth). Entsprechend entwickelten wir informatische Verfahren, um verschiedene Schritte in der Verarbeitung historischer Daten zu verbessern. Dazu zählen die robuste Erkennung von Eigennamen, die Segmentierung von Zeitungsseiten in Artikel, die Darstellung und Vervollständigung von Artikel-Metadaten, die Modellierung und Darstellung von Wortbedeutung für bestimmte Zeitscheiben, sowie Unterstützung bei der manuellen Suche nach relevanten Artikel in großen Archiven. ● Die Nützlichkeit der entwickelten Verfahren für digitale Geisteswissenschaften wurde anhand einer Reihe von Fallstudien gezeigt. Eine Forschungsrichtung wurde von Studien zur zeitlichen und räumlichen Verbreitung von Nachrichten über prägende Ereignisse des 19. Jahrhunderts gebildet, wie der Erschießung des russischen Gouverneurs von Finnland, Nikolay Bobrikov, oder des Ausbruchs des Vulkans Krakatoa. Eine zweite Richtung betrachtete die Entwicklung von Konzepten über Zeiträume von Jahren bis Jahrzehnten, am Beispiel der Konzeptfamilien "Krankheit" und "Nation". Die Ergebnisse des Projektes stellen einen Schritt auf dem Weg da, digitale Zeitungsarchive für Forschungen insbesondere aus den Geisteswissenschaften nutzbar zu machen.
Projektbezogene Publikationen (Auswahl)
-
(2018): A Named Entity Recognition Shootout for German, In Proceedings of the Annual Meeting of the Association for Computational Linguistics (ACL), Melbourne, Australia
Martin Riedl, Sebastian Padó
-
(2019): Clustering-Based Article Identification in Historical Newspapers, In: Proceedings of the 3rd Joint SIGHUM Workshop on Computational Linguistics for Cultural Heritage, Social Sciences, Humanities and Literature at NAACL 2019, Minneapolis, USA
Martin Riedl, Daniela Betz, Sebastian Padó
-
“Confidence as First-class Attribute in Digital Humanities Data” In: Proceedings of the 4th VIS4DH Workshop. Vancouver, Canada, 2019
Max Franke, Ralph Barczok, Steffen Koch and Dorothea Weltecke
-
”Spreading News in 1904. The Media Coverage of Nikolay Bobrikov’s Shooting”, Media History Vol 25 No 3, 2019
Mila Oiva, Asko Nivala, Hannu Salmi, Otto Latva, Marja Jalava, Jana Keck, Laura Martínez Domínguez, James Parker
-
“LilyPads: Exploring the Spatiotemporal Dissemination of Historical Newspaper Articles” In: Proceedings of the 11th International Conference on Information Visualization Theory and Applications. Valletta, Malta, 2020
Max Franke, Markus John, Moritz Knabben, Jana Keck, Tanja Blascheck and Steffen Koch