Detailseite
Projekt Druckansicht

Künstliche Erweiterung der Bandbreite von Sprachsignalen mittels phonetischer Transkription

Fachliche Zuordnung Elektronische Halbleiter, Bauelemente und Schaltungen, Integrierte Systeme, Sensorik, Theoretische Elektrotechnik
Förderung Förderung von 2008 bis 2010
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 72435333
 
Geplant ist die Entwicklung von Algorithmen zur Verbesserung von Sprachsignalen, die außer dem eigentlichen Sprachsignal synchron vorliegende phonetische Transkriptionen (Symbole zur Aussprache) nutzen. Auf dieser Grundlage sind neuartige Ansätze zur künstlichen Erweiterung der Sprachbandbreite von Schmalbandsprache (Bandbreite 300 ... 3400 Hz) auf Breitbandsprache (50 Hz ... 7000 Hz) mit hoher Qualität denkbar.Sprachtelefonie mit Breitbandsprache wird in naher Zukunft eine deutlich verbesserte Sprachqualität und Verständlichkeit bieten - vorausgesetzt, beide Kommunikationspartner verfügen über ein breitbandfähiges Endgerät. Telefonbasierte Sprachdialogsysteme könnten dann ebenfalls Breitbandsprache verarbeiten und eine höhere Worterkennungsrate verzeichnen - vorausgesetzt, aufwendige breitbandige Telefon-Sprachdatensammlungen zum Training der Spracherkenner werden durchgeführt.Ziel des Vorhabens ist es daher,• dass auch Anrufe von einem Schmalband-Telefon bei einem breitband-fähigen Empfänger mit verbesserter Qualität/Verständlichkeit dargeboten werden (Mensch zu Mensch),• dass Sprachdialogsysteme auf Basis bereits vorhandener Schmalband-Telefonsprachdaten für die neue Breitband-Sprachtelefonie mit verbesserter Worterkennungsrate trainiert werden können (Mensch zu Computer).Für die erste Anwendung (Sprachtelefonie) müssen geeignete Phonemklassen in Echtzeit geschätzt werden, während die phonetischen Transkriptionen bei der zweiten Anwendung in den schmalbandigen Telefon-Sprachdatenbasen bereits vollständig vorhanden sind.
DFG-Verfahren Sachbeihilfen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung