Detailseite
Projekt Druckansicht

Grenzen und Tendenzen in maschineller und menschlicher Sprache und ihrem Erwerb

Fachliche Zuordnung Allgemeine und Vergleichende Sprachwissenschaft, Experimentelle Linguistik, Typologie, Außereuropäische Sprachen
Förderung Förderung seit 2026
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 579375133
 
Trotz der menschenähnlichen Ausgaben bei einigen Aufgaben unterscheiden sich Sprachmodelle (LMs) in ihrer Struktur und der Struktur ihres Trainings erheblich von Menschen. Das LIBILLE-Projekt zielt darauf ab, unser Verständnis dieser strukturellen Unterschiede und ihrer Auswirkungen zu verbessern. Zu diesem Zweck formuliert es Vorhersagen und versucht dann, Vorhersagen über Unterschiede und Gemeinsamkeiten im Verhalten von Menschen und LMs zu validieren, wobei der Schwerpunkt auf dem morphosyntaktischen Bereich liegt. Das Projekt untersucht sowohl den reifen Zustand, d. h. erwachsene Menschen im Vergleich zu trainierten LLMs, als auch die Lern-/Trainingsphasen von Menschen und LLMs. Darüber hinaus wendet es strukturelle Untersuchungen an, um sicherzustellen, dass die Erklärungen für das Verhalten von LMs den Vorhersagen entsprechen. Zentrale Merkmale des LM-Designs sind der Tokenizer, Embeddings, die Transformer-Architektur und das Gradientenabstiegslernen. Ausgehend von dieser Architektur argumentieren wir, dass eine Reihe unterschiedlicher Verhaltensweisen in der Morphosyntax im reifen Zustand vorhergesagt werden können. Wir konzentrieren uns auf drei davon, die sich auf morphologische Paradigmenlücken, morphologische Verallgemeinerungen auf erfundene („Nonce-“) Wörter und die Sensibilität für orthographische Konventionen, beispielsweise zur Zusammen-/Getrenntshcreibung von definiten Artikeln und klitischen Pronomen, beziehen. Im Rahmen des Projekts werden neuartige Experimente entwickelt, um LMs und Menschen auf solche vorhergesagten Unterschiede zu testen. Aus der LM-Architektur wird heraus wird auch vorausgesagt, dass LMs während des Trainings andere Eigenschaften aufweisen sollten als menschliche Kinder, die Sprache erwerben. Wir entwickeln verschiedene Paradigmen, um die vorhergesagten Lernunterschiede mithilfe von kontextbezogenem Lernen, künstlichem Grammatiklernen und anderen Techniken zu testen. Die drei Vorhersagen, auf die wir uns konzentrieren, sind das Fehlen der typischen Phasen des menschlichen Spracherwerbs in LMs, die Fähigkeit von LMs, Verallgemeinerungen zu lernen, die in menschlichen Sprachen unmöglich sind, und dass das Training zur Induzierung menschenähnlicher Biases das Lernen von LMs verbessern sollte. Das umfassende Verständnis der Unterschiede zwischen Mensch und Maschine in Bezug auf sprachliche Fähigkeiten, das das LIBILLE-Projekt entwickelt, wird entscheidende Erkenntnisse für unser Verständnis sowohl der menschlichen Sprachfähigkeit als auch der Fähigkeiten aktueller LMs liefern.
DFG-Verfahren Schwerpunktprogramme
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung