Detailseite
MUDCAT - MUltimodale Dimensionen und Computationelle Anwendungen von AbstrakTheit
Antragstellerin
Professorin Dr. Sabine Schulte im Walde
Fachliche Zuordnung
Angewandte Sprachwissenschaften, Computerlinguistik
Förderung
Förderung seit 2021
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 455856690
Die Unterscheidung zwischen abstrakten und konkreten Wörtern (z.B. "Traum" und "Banane") stellt eine semantische Kategorisierung dar, die für die Verarbeitung natürlicher Sprache von höchster Relevanz ist. In diesem Sinne rekonditioniert unser Projekt MUDCAT den Begriff der Abstraktheit aus einer datengetriebenen und anwendungsorientierten Perspektive. MUDCAT nimmt dabei als Ausgangspunkt die langjährigen tiefgehenden Diskussionen und Studien zu Abstraktheit, die vor allem im Bereich der kognitiven Forschung stattgefunden haben, um kritische Punkte in den existierenden Definitionen, Datensammlungen und Charakterisierungen von Abstraktheit anzusteuern, zu verbessern und dadurch eine Erweiterung und Optimierung der Perspektiven für eine effektive Anwendung in der natürlichen Sprachverarbeitung zu erzielen.Bis heute haben Definitionen, Sammlungen und Anwendungen von Abstraktheit auf der Basis von Wort-Typen und weitgehend ohne Kontextualisierungen stattgefunden. MUDCAT wird im Gegensatz zu dieser Tradition empirische Dimensionen von Abstraktheit spezifizieren, akquirieren und anwenden, die Bezug haben auf bedeutungsunterscheidende Kontexte, Wortklassen (Nomen, Verben, Adjektiven) und Modalitäten (Text, Assoziationen, Merkmale, Bilder) in drei Sprachen (Deutsch, Englisch, Italienisch). In diesem Sinne werden wir neue Daten mit Bewertungen von Abstraktheit sammeln sowie cross-lingualen Transfer ausnutzen, um semi-automatische Algorithmen zur Norm-Generierung zu verbessern. Auf der empirischen Ebene werden wir Wortklassen-abhängige saliente Dimensionen von Abstraktheit herausarbeiten und aus Web-Korpora akquirieren, unter Einbezug von kontextuellen Konditionen in der Form von syntaktischen Konstellationen (Subkategorisierung; Modifikation). Da die Unterscheidung zwischen Abstraktheit und Konkretheit auf multimodalen Facetten beruht, wird MUDCAT über die Text-Ebene hinausgehen und multimodale Datensammlungen schaffen und erforschen: freie Assoziationen, Merkmalsnormen und Bilder. Die Gesamtheit unseres multimodalen, cross-lingualen Wissens zu Abstraktheit wird schließlich bei Aufgaben der natürlichen Sprachverarbeitung angewandt, bei denen ein direkter Nutzen bekannt ist oder vermutet werden kann. Entsprechend werden wir generische computerlinguistische Techniken entwickeln und unsere facettenreiche Information für die Erkennung und Charakterisierung von figurativer Sprache (als Mapping von Konkretheit auf Abstraktheit im Sinne der konzeptuellen Metapherntheorie) und für die Vorhersage von Hyperonymie (als eine Instanz von semantischer Generalisierung) einsetzen. Über Projektbereiche hinweg wird MUDCAT einen cross-lingualen Strang betreiben, um den Transfer von Abstraktheits-Information bei Definitionen, empirischen Merkmalen und Anwendungen im Deutschen, Englischen und Italienischen zu untersuchen, unter Einbezug von Ambiguitäten und Kontexten.
DFG-Verfahren
Sachbeihilfen
Internationaler Bezug
Großbritannien, Italien
Kooperationspartnerinnen / Kooperationspartner
Professor Alessandro Lenci, Ph.D.; Professorin Gabriella Vigliocco, Ph.D.
Mitverantwortlich
Professor Diego Frassinelli, Ph.D.