Detailseite
Projekt Druckansicht

Semantische Methoden für computergestützte Schreibhilfen (SeMSch)

Fachliche Zuordnung Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung Förderung von 2014 bis 2017
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 249088706
 
Dieses Vorhaben aus der Sprachtechnologie beschäftigt sich mit der Frage, ob es möglich ist, eine semantische Schreibhilfe zur Paraphrasierung von Texten zu entwickeln, welche Hilfe beim (Um-)Formulieren von Texten bietet. Diese funktioniert ähnlich wie eine Rechtschreib- oder Grammatikprüfung und bietet innerhalb einer Textverarbeitungssituation geeignete Paraphrasen an, wodurch ein schnelleres Formulieren von Texten mit abwechselungsreicher Wortwahl ermöglicht wird. Ein besonderes Merkmal stellt ein zu erforschender Mechanismus dar, der die Qualität der Paraphrasierungen und somit der Schreibhilfe durch Benutzungsdaten verbessert. Der Kern dieses Forschungsvorhaben liegt in der Überprüfung der Hypothese, dass unüberwachte und vorwissensfreie Methoden geeignete Datenquellen für Paraphrasierungen innerhalb des Anwendungskontextes darstellen. Eine Paraphrasierungskomponente stellt das Herzstück einer prototypischen Implementierung dieser Schreibhilfe dar. Neben Fragen der Kombination verschiedener Paraphrasenquellen und dem Erforschen einer geeigneten Benutzerinteraktion beschäftigen wir uns mit der Übertragung der Methodologie mit Hilfe von datengetriebenen Verfahren auf andere Sprachen. Ferner untersuchen wir die Möglichkeit, die Qualität der Schreibhilfe mit Hilfe von implizitem Feedback zu verbessern. Bei der Entwicklung der Einzelkomponenten und bei der Simulation von Benutzung greifen wir massiv auf Crowdsourcing als Mittel zur Datenerhebung und zur entwicklungsbegleitenden Evaluierung zurück.Zunächst untersuchen wir, welche Quellen von Paraphrasen welche Arten von Paraphrasen liefern und kombinieren diese heterogenen Quellen innerhalb einer Paraphrasierungskomponente. Wir kontextualisieren Methoden der distributionalen Semantik, um in Abhängigkeit des Kontexts mögliche Paraphrasen auf unüberwachte, vorwissensfreie Weise zu produzieren. Hier wird besonderes Augenmerk auf die Rohdatengetriebenheit des Ansatzes gelegt, welcher weitgehend ohne lexikalische Ressourcen auskommen soll. Dies wird durch Sprach- und Sachgebietsunabhängigkeit motiviert und bei der Übertragung der Methodologie vom Englischen auf das Deutsche mit Hilfe unüberwachter und vorwissensfreier Methoden demonstriert. Mit Hilfe von Nutzerstudien erstellen wir eine prototypische Implementierung der Schreibhilfe und optimieren unsere Lösung bezüglich Nutzerinteraktion, Präsentation und Proaktivität. Diesen Prototyp setzen wir ein um zu untersuchen, inwieweit sogenannte schwache Signale, also rein durch Benutzung des Prototyps entstehende Interaktionsdaten, für die Verbesserung der Paraphrasierungskomponente einsetzbar sind. Dieser in sprachtechnologischen Anwendungen noch nicht betrachtete Einsatz von implizitem Benutzerfeedback ermöglicht die iterative Verbesserung von sprachtechnologischen Komponenten und bietet die Möglichkeit, bisher unzulänglich funktionierende Verarbeitungsschritte auf einsatzfähiges Niveau zu heben.
DFG-Verfahren Sachbeihilfen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung