Detailseite
Projekt Druckansicht

Entwicklung eines Steuerungskonzeptes für hochqualitative artikulatorische Sprachsynthese von Einzelwörtern

Fachliche Zuordnung Allgemeine und Vergleichende Sprachwissenschaft, Experimentelle Linguistik, Typologie, Außereuropäische Sprachen
Förderung Förderung von 2008 bis 2013
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 77780083
 
Erstellungsjahr 2013

Zusammenfassung der Projektergebnisse

Die einzellautliche Qualität artikulatorischer Sprachsynthese, d.h. die Qualität der Realisierung von Einzellauten mit statischer Artikulation (gehaltene Vokale, Frikative, Nasale und Laterale) ist bereits sehr gut. Um diese hohe Qualität nun auch auf die Synthese ganzer Silben und Wörter ausdehnen zu können, müssen aber Artikulationsbewegungen hoher Natürlichkeit generiert werden. Da dies bislang noch nicht gelungen ist, wurden in diesem Projekt die im Standarddeutschen häufig auftretende Wörter von einem Sprecher produziert und anschließend resynthetisiert. In Anlehnung an das Konzept des mentalen Silbenspeichers wurden die aus der Resynthese gewonnenen natürlichen Artikulationsmuster auf Silbenebene als Ganzes gespeichert und zur Synthese beliebiger Wörter genutzt. Darüber hinaus konnten aus dem resynthetisierten Wortkorpus erste artikulatorische Systematiken für die Synthese häufiger Silben abgeleitet werden.

Projektbezogene Publikationen (Auswahl)

  • (2011) Model-based reproduction of articulatory trajectories for consonant-vowel sequences. IEEE Transactions on Audio, Speech, and Language Processing 19: 1422-1433
    Birkholz P, Kröger BJ, Neuschaefer-Rube C
  • (2011) Towards an articulation-based developmental robotics approach for word processing in face-to-face communication. PALADYN Journal of Behavioral Robotics 2: 82-93
    Kröger BJ, Birkholz P, Neuschaefer-Rube C
  • (2011) Towards the acquisition of a sensorimotor vocal tract action repository within a neural model of speech processing. In: Esposito A, Vinciarelli A, Vicsi K, Pelachaud C, Nijholt A (eds.) Analysis of Verbal and Nonverbal Communication and Enactment: The Processing Issues. LNCS 6800 (Springer, Berlin), pp. 287-293
    Kröger BJ, Birkholz P, Kannampuzha J, Kaufmann E, Neuschaefer-Rube C
  • (2012) The neurophonetic model of speech processing ACT: structure, knowledge acquisition, and function modes. In: Esposito A, Esposito AM. Vinciarelli A, Hoffmann R, Müller VC (eds.) Cognitive Behavioural Systems, LNCS 7403 (Springer, Heidelberg, Berlin), pp. 398-404
    Kröger BJ, Kannampuzha J, Eckers C, Helm S, Kaufmann E, Neuschaefer-Rube C
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung