Nachhallmodellierung für die robuste Spracherkennung in halligen Umgebungen

Antragsteller Professor Dr.-Ing. Walter Kellermann

Fachliche Zuordnung Elektronische Halbleiter, Bauelemente und Schaltungen, Integrierte Systeme, Sensorik, Theoretische Elektrotechnik
Akustik

Förderung Förderung von 2008 bis 2016

Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 76981564

Heutige Spracherkennungssysteme erzielen bemerkenswerte Erkennungsraten, wenn Nahbesprechungsmikrofone für die Aufnahme der Sprache verwendet werden. Aufgrund des größeren Abstandes zwischen Sprecher und Mikrofon erschweren im Freisprechbetrieb additive Störungen und der Nachhall des Nutzsignals die Erkennung erheblich. Während in den letzten Jahrzehnten beachtliche Fortschritte hinsichtlich der Robustheit der Erkenner bezüglich additiven Störungen erzielt wurden, bereitet der Nachhall nach wie vor Probleme bei der Erkennung. In diesem Forschungsvorhaben soll ein neuer Ansatz zur robusten Spracherkennung basierend auf der expliziten Modellierung des Nachhalls im Merkmalbereich weiterentwickelt werden. Insbesondere soll der Ansatz für leistungsfähige Sprachmerkmale und leistungsfähige akustische Modelle erweitert und mit in halligen Umgebungen aufgenommenen Sprachdaten anhand komplexer Aufgabenstellungen evaluiert werden.

DFG-Verfahren Sachbeihilfen

Servicenavigation

Hauptnavigation

Nachhallmodellierung für die robuste Spracherkennung in halligen Umgebungen

Zusatzinformationen

Servicenavigation

Hauptnavigation

Nachhallmodellierung für die robuste Spracherkennung in halligen Umgebungen

Zusatzinformationen

Textvergrößerung und Kontrastanpassung