Detailseite
Superframes: Ein Schema und Daten für universelle semantische Rollenannotation
Antragsteller
Dr. Kilian Evang
Fachliche Zuordnung
Angewandte Sprachwissenschaften, Computerlinguistik
Förderung
Förderung seit 2025
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 560341082
Bestehende Schemata für Semantic Role Labeling (SRL) stützen sich auf große Lexika. Das führt zu langsamer Annotation und verhindert bisher, dass SRL, ähnlich wie bereits syntaktisches Parsing, zu einem alltäglichen Werkzeug für Korpuslinguist*innen und NLP-Fachleute wird. Eine mögliche Lösung für dieses Problem bieten linguistische Theorien, die die Bedeutung von Prädikaten dekompositionell repräsentieren und so die Annotation und Vorhersage semantischer Rollen für alle Sprachen ohne große sprachspezifische Lexika ermöglichen. Solche Repräsentationen müssen jedoch zunächst auf eine Weise formalisiert werden, die für schnelle Annotation und die Verwendung in NLP-Tools geeignet ist. Insbesondere müssen die Zahl der primitiven Relationen und die strukturelle Komplexität der Repräsentationen beschränkt werden. In dem hier vorgestellten Projekt wird ein solches Schema als Erweiterung von Dependenzsyntax definiert und in der Annotation bestehender Lexika und größerer Textmengen erprobt. Basierend auf den entstehenden Daten werden Machine-Learning-Modelle sowohl für SRL als auch für Downstream-Tasks entwickelt. So soll gezeigt werden, dass das Schema gegenüber herkömmlichem SRL sowohl bezüglich der Interrater-Reliabilität als auch bezüglich der Genauigkeit von Machine-Learning-Modellen eine Verbesserung darstellt.
DFG-Verfahren
Sachbeihilfen
