Detailseite
Entwicklung strukturierter semantischer Modelle zur Verbesserung der Qualität von statistischen maschinellen Übersetzungssystemen
Antragsteller
Dr. Hagen Fürstenau
Fachliche Zuordnung
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung
Förderung in 2012
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 200135679
Moderne maschinelle Übersetzungssysteme basieren auf statistischen Verfahren, die zu einem Eingabesatz die wahrscheinlichste Übersetzung suchen. Typischerweise werden dabei Wörter und Wortgruppen übersetzt, ohne dass ihre Bedeutung auf einer abstrakteren Ebene repräsentiert würde. Dies kann dazu führen, dass Ausgabesätze zwar flüssig klingen, die Bedeutung des Eingabesatzes jedoch nicht adäquat wiederspiegeln. Das beantragte Projekt soll sich mit der Entwicklung von Modellen beschäftigen, die mögliche Übersetzungen anhand ihrer semantischen Kompatibilität mit dem Ursprungssatz bewerten und so bessere Übersetzungen finden können. Die Bedeutung von Ein- und Ausgabesatz wird mit Hilfe von Wahrscheinlichkeitsmodellen beschrieben, die Situationen, semantische Rollen und Konzepte repräsentieren und vergleichen können. Im Gegensatz zu bestehenden Ansätzen der Rollensemantik sollen jedoch keine allgemeinen Konzepte vorgegeben, sondern geeignete Klassifikationen automatisch aus verfügbaren Textkorpora gelernt werden. Damit würden erstmalig strukturierte semantische Informationen direkt in statistische maschinelle Übersetzungssysteme einfließen. Neben dem Hauptziel, die Qualität maschineller Übersetzung zu verbessern, ergibt sich ferner die Möglichkeit, anwendungsorientierte semantische Kategorien und ihre Generalisierbarkeit über Sprachengrenzen hinweg zu untersuchen, was auch für andere Bereiche der Computerlinguistik von Nutzen sein kann.
DFG-Verfahren
Forschungsstipendien
Internationaler Bezug
USA
Gastgeber
Professor Dr. Eduard Hovy