Detailseite
Projekt Druckansicht

Aufmerksamkeit in großen Sprachmodellen: Linguistische Fundierung, kognitive Modellierung und Soziale Anwendung

Fachliche Zuordnung Angewandte Sprachwissenschaften, Computerlinguistik
Förderung Förderung seit 2026
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 579383584
 
Große Sprachmodelle (LLMs) haben die Verarbeitung natürlicher Sprache grundlegend verändert, doch die Mechanismen ihres Erfolgs sind nur teilweise verstanden. Ein zentrales Element ist der Aufmerksamkeitsmechanismus, der kontextuelle Abhängigkeiten zwischen Wörtern kodiert und linguistisch bedeutsame Muster offenlegt. Sein Wert als erklärendes Instrument für die Modellierung menschlichen Verhaltens ist jedoch umstritten. Es fehlen methodische Standards, die definieren, wann Aufmerksamkeit sich in linguistisch und kognitiv fundierte Konzepte überführen lässt und wie daraus Metriken für transparente und sichere Anwendungen entstehen – etwa zur Verbesserung wissenschaftlicher und medizinischer Kommunikation. In diesem Projekt prüfen wir die Hypothese, dass der Aufmerksamkeitsmechanismus in LLMs als computationales Analogon menschlichen Textverständnisses verstanden werden kann. Wir verfolgen drei Ziele: (O1) Verankerung des Mechanismus in linguistischer, kognitiver und psycholinguistischer Theorie des Textverständnisses (grundlegendes Verständnis), (O2) datengetriebene Entdeckung aufmerksamkeitsbasierter Metriken und Validierung anhand von Verhaltens- und neuronalen Korrelaten (robuste Bewertung) sowie (O3) Anwendung entdeckter Metriken zur Beurteilung und Personalisierung der Verständlichkeit wissenschaftlicher und medizinischer Texte (sichere Anwendbarkeit). Zusammen tragen diese Ziele zu den Säulen des LaSTing-Schwerpunktprogramms bei. Zur Umsetzung entwickelt Teilprojekt 1 eine theoriebasierte Wort-Fazilitationsmetrik aus Aufmerksamkeitsverteilungen in Transformermodellen und prüft deren Vorhersagekraft über traditionelle linguistische Metriken hinaus. Teilprojekt 2 nutzt datengetriebene Gleichungsentdeckung, um den Hypothesenraum potenzieller aufmerksamkeitsbasierter Metriken zu erschließen und neue Prädiktoren für Verhaltens- und neuronale Korrelate des Textverständnisses zu identifizieren. Teilprojekt 3 erweitert diese Metriken zu personalisierten Verständlichkeitsprofilen, um das individuelle Verständnis wissenschaftlicher und medizinischer Texte zu verbessern. Vorläufige Ergebnisse zeigen, dass die aufmerksamkeitsbasierte Wort-Fazilitation einzigartige Varianz im Textverständnis erklärt, insbesondere bei langen und seltenen Wörtern, die traditionelle Metriken fälschlich als schwierig einstufen. Aufbauend darauf wird das Projekt reproduzierbare Pipelines entwickeln, um neuartige psycholinguistische Metriken in LLM-Architekturen zu entdecken und zu validieren, sowie Werkzeuge zur modellgestützten Personalisierung wissenschaftlicher und medizinischer Texte bereitstellen. Über diese Ergebnisse hinaus trägt das Projekt zur Vision bei, LLMs als wissenschaftliche Instrumente zur Erklärung und Verbesserung menschlichen Textverständnisses einzusetzen – und damit sowohl das methodische Instrumentarium der kognitiven Sprachwissenschaften als auch die gesellschaftliche Wirkung empirisch fundierter LLM-Metriken voranzubringen.
DFG-Verfahren Schwerpunktprogramme
Internationaler Bezug USA
Kooperationspartner Professor Lawrence David, Ph.D.
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung