Detailseite
Analyse, Modellierung und Synthese sichtbarer Sprechbewegungen bei unterschiedlichen Sprechgeschwindigkeiten
Antragsteller
Dr. Sascha Fagel
Fachliche Zuordnung
Allgemeine und Vergleichende Sprachwissenschaft, Experimentelle Linguistik, Typologie, Außereuropäische Sprachen
Förderung
Förderung von 2007 bis 2010
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 40177908
Trotz intensiver Forschungs- und Entwicklungsarbeit im Bereich Mensch-Maschine- Interaktion bieten aktuelle Sprachvisualisierungssysteme nicht die Möglichkeit, unterschiedliche Sprechgeschwindigkeiten adäquat darzustellen. Da solche Systeme jedoch eingesetzt werden um sprech- und hörgestörten Menschen barrierefreien Zugang zu Informationssystemen zu ermöglichen, ist diese Funktionalität von großer Bedeutung. Auch in weiteren Anwendungen wie z.B. Animationsfilmen und Computerspielen werden immer realistischere Sprechbewegungen benötigt. Durch die exakte Modellierung der sichtbaren Sprechbewegungen leistet das Projekt hierzu einen wichtigen Beitrag. Im Rahmen des Vorhabens werden unterschiedlich schnell gesprochene Äußerungen optisch aufgezeichnet und mithilfe eines aktuellen gestischen Modellansatzes für gesprochene Sprache analysiert. So werden die sichtbaren Bewegungen hinsichtlich des Sprechtempos allgemein beschreibbar und es lassen sich neue Erkenntnisse über den Vorgang der Sprachproduktion ableiten. Anschließend wird das entwickelte Modell in aktuelle Systeme zur Sprachvisualisierung (zur Reproduktion aufgenommener Daten) und visuellen Sprachsynthese (zur Erzeugung beliebiger Sprachäußerungen) implementiert. Die Qualität der resultierenden synthetischen visuellen Sprache bezüglich der Sprechgeschwindigkeit wird mittels Wahrnehmungsexperimenten evaluiert. Die Ergebnisse können anschließend in kommerziellen Systemen zur Computeranimation eingesetzt werden. Eine Übertragung der entwickelten Modelle auf nonverbale Mimik ist ebenfalls möglich.
DFG-Verfahren
Sachbeihilfen