Detailseite
Grammatikformalismen jenseits von kontextfreien Grammatiken und ihre Verwendung im statistischen maschinellen Lernen
Antragstellerin
Professorin Dr. Laura Kallmeyer
Fachliche Zuordnung
Allgemeine und Vergleichende Sprachwissenschaft, Experimentelle Linguistik, Typologie, Außereuropäische Sprachen
Förderung
Förderung von 2010 bis 2021
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 183821958
Das Ziel dieses Projekts ist es, neue Modelle und Algorithmen zumstatistischen Parsing und in der statistischen maschinellenÜbersetzung zu entwickeln, die Formalismen im schwachkontext-sensitiven Bereich verwenden, wie z.B. linear kontextfreieErsetzungssysteme (LCFRS), die die Fähigkeit haben, nichtlokaleZusammenhänge zu beschreiben. In beiden Bereichen, Parsing undmaschinelle Übersetzung, ist man mit der Herausforderung konfrontiert,mit Sätzen umgehen zu müssen, die nichtlokale Zusammenhänge aufweisen,also diskontinuierliche Einheiten, die zusammengehören. Eine Lösungist die Verwendung von nicht kontextfreien Formalismen. Im ersten Teildes Projekts wurden schon erfolgreich LCFRS für das statistischeParsing eingesetzt. Diese Arbeiten sollen im zweiten Teil fortgesetztwerden. Was die syntaxgetriebene statistische maschinelle Übersetzungangeht, wurde im ersten Teil des Projekts gezeigt, dass synchroneLCFRS ausdrucksstark genug sind, um die teilweise komplexenAlignierungsstrukturen zu beschreiben, die man in parallelen Korporafindet. Im zweiten Teil des Projekts planen wir, die bereits begonneneImplementierung eines Übersetzungssystems basierend auf synchronenLCFRS abzuschließen.
DFG-Verfahren
Sachbeihilfen