Project Details
Projekt Print View

Entwicklung eines Steuerungskonzeptes für hochqualitative artikulatorische Sprachsynthese von Einzelwörtern

Subject Area General and Comparative Linguistics, Experimental Linguistics, Typology, Non-European Languages
Term from 2008 to 2013
Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 77780083
 
Final Report Year 2013

Final Report Abstract

Die einzellautliche Qualität artikulatorischer Sprachsynthese, d.h. die Qualität der Realisierung von Einzellauten mit statischer Artikulation (gehaltene Vokale, Frikative, Nasale und Laterale) ist bereits sehr gut. Um diese hohe Qualität nun auch auf die Synthese ganzer Silben und Wörter ausdehnen zu können, müssen aber Artikulationsbewegungen hoher Natürlichkeit generiert werden. Da dies bislang noch nicht gelungen ist, wurden in diesem Projekt die im Standarddeutschen häufig auftretende Wörter von einem Sprecher produziert und anschließend resynthetisiert. In Anlehnung an das Konzept des mentalen Silbenspeichers wurden die aus der Resynthese gewonnenen natürlichen Artikulationsmuster auf Silbenebene als Ganzes gespeichert und zur Synthese beliebiger Wörter genutzt. Darüber hinaus konnten aus dem resynthetisierten Wortkorpus erste artikulatorische Systematiken für die Synthese häufiger Silben abgeleitet werden.

Publications

  • (2011) Model-based reproduction of articulatory trajectories for consonant-vowel sequences. IEEE Transactions on Audio, Speech, and Language Processing 19: 1422-1433
    Birkholz P, Kröger BJ, Neuschaefer-Rube C
  • (2011) Towards an articulation-based developmental robotics approach for word processing in face-to-face communication. PALADYN Journal of Behavioral Robotics 2: 82-93
    Kröger BJ, Birkholz P, Neuschaefer-Rube C
  • (2011) Towards the acquisition of a sensorimotor vocal tract action repository within a neural model of speech processing. In: Esposito A, Vinciarelli A, Vicsi K, Pelachaud C, Nijholt A (eds.) Analysis of Verbal and Nonverbal Communication and Enactment: The Processing Issues. LNCS 6800 (Springer, Berlin), pp. 287-293
    Kröger BJ, Birkholz P, Kannampuzha J, Kaufmann E, Neuschaefer-Rube C
  • (2012) The neurophonetic model of speech processing ACT: structure, knowledge acquisition, and function modes. In: Esposito A, Esposito AM. Vinciarelli A, Hoffmann R, Müller VC (eds.) Cognitive Behavioural Systems, LNCS 7403 (Springer, Heidelberg, Berlin), pp. 398-404
    Kröger BJ, Kannampuzha J, Eckers C, Helm S, Kaufmann E, Neuschaefer-Rube C
 
 

Additional Information

Textvergrößerung und Kontrastanpassung