Detailseite
Projekt Druckansicht

Vom Wort zum Text: Nutzung von distributionalen semantischen Modellen zur Untersuchung von Schrift-Bedeutungs-Beziehungen auf verschiedenen Ebenen und ihren Einfluss auf den Leseprozess in verschiedenen Sprache

Fachliche Zuordnung Allgemeine, Kognitive und Mathematische Psychologie
Förderung Förderung seit 2025
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 561219433
 
Um effizient zu lesen, muss man schnell und sicher auf die Bedeutung schriftlicher Texte zugreifen können. Dabei müssen orthographische Einheiten auf verschiedenen linguistischen Strukturebenen (Wort, Satz, Text) mit korrespondierenden semantischen Repräsentationen in Beziehung gesetzt werden. Solche Schrift-Bedeutungsrelationen zu untersuchen ist schwierig, weil sprachliche Bedeutung lange Zeit lange Zeit nicht exakt quantifiziert werden konnte. In den letzten Jahren haben jedoch sog. Distributionale Semantische Modelle (DSM) erhebliche Fortschritte gemacht und Large-Language Models (LMMs) erlauben, die Bedeutung von Wörtern, Sätzen und Texten numerisch zu repräsentieren. Erste Studien haben solche DSM-basierten Repräsentation genutzt, um die Relation von orthographischen und semantischen Einheiten zu beschreiben und zu untersuchen, wie sie sich auf das menschliche Leseverhalten auswirken. Unser Projekt baut auf diesen Studien auf, wird aber in dreifacher Hinsicht über den bisherigen Forschungsstand hinausgehen: Erstens wollen wir moderne DSM-basierte Metriken auf der Wort-, Satz- und Text-Ebene gleichzeitig definieren und ihre Effekte auf das Lesen von Wörtern, Sätzen und Texte experimentell untersuchen. Zweitens wollen wir die Indikatoren auf den drei Strukturebenen gleichzeitig betrachten, um ihren relativen Einfluss, aber auch Interaktionen und Kompensationsmöglichkeiten zu modellieren. Drittens wollen wir sprach-vergleichend untersuchen, wie gut sich DSM-basierte Metriken auf andere Sprachen außer dem Englischen übertragen lassen und wie sprach-abhängig evtl. Effekte sind. Wir werden hierfür das Deutsche und das Hebräische vergleichen, die sich strukturell und orthographisch stark voneinander unterscheiden. In dem Projekt werden eine Reihe von sich ergänzenden Studienreihen in vier Arbeitspaketen durchgeführt, die das Leseverhalten im Deutschen und Hebräischen mittels Worterkennungs- und Blickbewegungsverfahren untersuchen. Arbeitspakete 1-3 fokussieren jeweils die Wort-, Satz- und Textebene und untersuchen experimentell die Effekte der verschiedenen Indikatoren in den beiden Sprachen. In Arbeitspaket 4 werden die drei Strukturebenen gemeinsam betrachtet und das Zusammenwirken der verschiedenen Maße in einem neuen, deutsch-hebräischen Blickbewegungskorpus modelliert. In einem eigenen Mercator-Projekt wird zusätzlich die Beziehung zwischen den DSM-basierten Maßen und etablierten Modellen der Textverarbeitung untersucht. Auf methodischer Ebene wird das Projekt neue Verfahren zur Quantifizierung der Beziehung von Orthographie und Bedeutung auf verschiedenen Strukturebenen entwickeln. Auf theoretischer Ebene wird der Einsatz dieser DSM-basierten Metriken zu neuen Erkenntnissen zum Einfluss von Semantik auf den Leseprozess in verschiedenen Sprachen führen. Die Ergebnisse tragen dazu bei, besser beschreiben zu können, wie und in welcher Form beim Lesen auf Bedeutung zurückgegriffen wird und wann es bei ihrer Verarbeitung Probleme geben kann.
DFG-Verfahren Sachbeihilfen
Internationaler Bezug Israel
Partnerorganisation The Israel Science Foundation
Kooperationspartner Dr. Noam Siegelman
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung