Detailseite
Projekt Druckansicht

Methodologie und Reflexion: Linguistische Diskursgeschichtsschreibung als digital gestützte Gruppenforschung (TP 5: Methodologisches Querschnittsprojekt, Phase 2)

Fachliche Zuordnung Einzelsprachwissenschaften, Historische Linguistik
Förderung Förderung seit 2022
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 441142207
 
Teilprojekt 5 ist das methodologische Querschnittsprojekt der Forschungsgruppe. In der ersten Förderphase hat es sich theoretisch und in praktischen Experimenten mit der Automatisierung diskurspragmatischer Annotationen auseinandergesetzt. In Förderphase 2 wird es den Einsatz von Large Language Models (LLMs) für die diachrone digitale Korpusanalyse weiterentwickeln und dabei einen Fokus auf die dazu geeignete Infrastruktur legen. Aus diesem Grund ist das Teilprojekt 5 auch für die digitale Infrastruktur der Forschungsgruppe verantwortlich. Während in der ersten Förderphase die Grundlagen für kollaborative Annotation, automatische Textklassifikation und den Aufbau einer digitalen Forschungsumgebung gelegt wurden, zielt die zweite Phase auf eine systematische Fortentwicklung dieser Ansätze angesichts der jüngsten Fortschritte durch LLMs ab. Der Use Case für die linguistische Operationalisierung waren in der ersten Förderphase Topoi. Es wurden auch Tagger zur automatischen Identifikation des Nützlichkeits- und des Autoritätstopos entwickelt. In der zweiten Phase wird der Use Case die Identifikation von Frames und konzeptuellen Relationen sein. Durch den Einsatz von Retrieval-Augmented Generation (RAG) sollen diachrone Bedeutungsverschiebungen präziser erfasst und nachvollziehbar gemacht werden. In Kooperation mit den anderen Teilprojekten werden mittels manueller Annotation Gold-Standard-Datensets erstellt. Auf dieser Grundlage werden LLMs trainiert, getestet und durch RAG-Workflows erweitert. Dazu wird unsere digitale Forschungsumgebung „Discourse Lab“ um ein Repositorium für Volltextmanagement (Solr/Lucene ) und eine Serverumgebung für geschützte LLM-Nutzung (Ollama) erweitert und es werden Schnittstellen für den Export in etablierte Tools zur Annotation und Korpusanalyse geschaffen. Das ermöglicht es den Mitgliedern der FOR, thematisch passende Volltexte zu erschließen, manuell und automatisiert zu annotieren, eigene Klassifikationsmodelle zu trainieren und Ergebnisse der projektspezifischen Klassifizierung quantitativ auszuwerten. Teilprojekt 5 kombiniert auf diese Weise die gezielte Weiterentwicklung von Infrastruktur und Methodologie und leistet auf diese Weise nicht nur einen Beitrag zu den Zielen der Forschungsgruppe, sondern auch zur digitalen Diskursanalyse als Forschungsfeld. Die Ergebnisse werden in internationalen Zeitschriften und auf internationalen Konferenzen vorgestellt. Außerdem beteiligt sich Teilprojekt 5 an gemeinsamen Publikationen und Aktivitäten der Forschungsgruppe.
DFG-Verfahren Forschungsgruppen
Internationaler Bezug Schweiz
Kooperationspartnerinnen / Kooperationspartner Professor Dr. Noah Bubenhofer; Professorin Dr. Juliane Schröter
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung