Detailseite
Projekt Druckansicht

Hierarchische Organisation semantischen Wissens in neuronalen Sprachsysteme

Fachliche Zuordnung Biologische Psychologie und Kognitive Neurowissenschaften
Förderung Förderung seit 2022
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 459426179
 
Die Repräsentation von Wörtern und semantischen Konzepten im menschlichen Sprachsystem umfasst unterscheidbare Abstraktionsebenen. Diese reichen von modalitätsspezifischen Repräsentationen geschriebener und gesprochener Wörter bis hin zu abstrakten konzeptuell-semantischen Repräsentationen im vorderen Temporallappen, auf die nicht nur während der Sprachverarbeitung sondern auch aus anderen perzeptuellen Domänen heraus zugegriffen wird – etwa während der visuellen Objekterkennung. Trotz weitreichender Erkenntnisse über die Lokalisation solcher Repräsentationen (z. B. aus Studien zur semantischen Demenz) und trotz umfassender experimenteller Forschung zur Worterkennung, ist bisher wenig über die neuronalen Codierungen, die lexikalischen und konzeptuell-semantischen Repräsentationen zu Grunde liegen, bekannt. Unterscheiden sich lexikalisch-semantische Repräsentationen, die während des Lesens und des Verarbeitens gesprochener Sprache aktiviert werden – oder sind diese durchgehend modalitäts-unabhängig repräsentiert? Wie ist ‚höheres‘ konzeptuell-semantisches Wissen im Gehirn organisiert? Word Embedding-Modelle sind Repräsentationen von Wörtern als Vektoren in hochdimensionalen Räumen, die Ähnlichkeitszusammenhänge zwischen Wörtern abbilden, die wiederum statistisch aus sehr großen Textkorpora auf Basis von gemeinsamen Vorkommenshäufigkeiten (Kookkurrenz) extrahiert werden. Es konnte gezeigt werden, dass Word Embeddings Informationen über Wortbedeutungen enthalten und überraschend gute Modelle für Hirnaktivierungsdaten aus Sprachstudien darstellen. Doch wie sind semantische Informationen jenseits von Kookkurrenz-Statistiken – etwa hierarchische Beziehungen zwischen semantischen Kategorien und ihren Mitgliedern oder unterschiedliche semantische Abstraktionen – in Embedding-Modellen und im Gehirn repräsentiert? Moderne künstliche Intelligenzen (KI) sind erstaunlich gut in Anwendungsbereichen wie der Verarbeitung natürlicher Sprache oder der Bilderkennung. Sie erreichen dies jedoch anders als das menschliche Gehirn, und einer der offensichtlichsten Unterschiede ist die Art und Weise, wie sie Informationen repräsentieren. Dieses Projekt kombiniert neurokognitive Sprachexperimente und KI-Modellierungen von Wort-, Satz- und Objektbedeutungen, um zu untersuchen, wie hierarchisch unterscheidbare Bedeutungsebenen im Gehirn und in KI-Modellen repräsentiert sind. Zusammen mit anderen Projekten der ARENA-Forschungsgruppe wird untersucht, ob bessere KI-Modelle entwickelt werden können, wenn beim Training der Embedding-Modelle Abstraktionen - über Stimulusmodalitäten (geschrieben vs. gesprochen) oder über Wahrnehmungsdomänen (Sprache vs. visuelle Objekterkennung) berücksichtigt werden. Darüber hinaus wird untersucht, ob semantische Bedeutungsrepräsentationen im menschlichen Gehirn flexibel an unterschiedliche Aufgabenkontexte angepasst werden können.
DFG-Verfahren Forschungsgruppen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung