Detailseite
Projekt Druckansicht

Robuste Spracherkennung in realistischer Umgebung durch Störgeräuschreduktion und gehörgerechte Vorverarbeitung

Fachliche Zuordnung Elektronische Halbleiter, Bauelemente und Schaltungen, Integrierte Systeme, Sensorik, Theoretische Elektrotechnik
Förderung Förderung von 2001 bis 2006
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 5296952
 
Die Verwendbarkeit von automatischen Systemen zur verbalen Mensch-Maschine-Kommunikation ist unter realistischen Bedingungen (z.B. Störgeräusche, Nachhall) stark eingeschränkt. Ziel dieses Vorhabens ist es daher, eine deutliche Verbesserung der Robustheit von automatischen Spracherkennungssystemen in schwierigen akustischen Situationen zu erreichen. Dazu sollen Algorithmen zur Störgeräuschbefreiung und Enthallung des akustischen Signals mit robusten Merkmalen auf Basis eines Modells der Sprachperzeption des Menschen kombiniert werden. Als Demonstrator soll während des beantragten Vorhabens ein robustes System zur automatischne Spracherkennung für den Einsatz in realistischen Umgebungen erstellt werden. In diesem sollen verschiedene Algorithmen zur Störunterdrückung mittels einer intelligenten Entscheidungseinheit optimal für die darauf aufsetzende Extraktion perzeptiver Merkmale kombiniert werden. In einer weiteren Stufe sollen dabei sekundäre Merkmale extrahiert werden, die der Verarbeitung auditiver Signale auf zentralen Stufen der Hörbahn entsprechen. Audiologische Messungen zur Sprachverständlichkeitsschwelle bei normalhörenden Menschen liefern als Referenzwert das (praktische) Optimum erreichbarer Erkennungsleistung.
DFG-Verfahren Sachbeihilfen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung