Detailseite
Robuste Spracherkennung in realistischer Umgebung durch Störgeräuschreduktion und gehörgerechte Vorverarbeitung
Antragsteller
Professor Dr. Birger Kollmeier
Fachliche Zuordnung
Elektronische Halbleiter, Bauelemente und Schaltungen, Integrierte Systeme, Sensorik, Theoretische Elektrotechnik
Förderung
Förderung von 2001 bis 2006
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 5296952
Die Verwendbarkeit von automatischen Systemen zur verbalen Mensch-Maschine-Kommunikation ist unter realistischen Bedingungen (z.B. Störgeräusche, Nachhall) stark eingeschränkt. Ziel dieses Vorhabens ist es daher, eine deutliche Verbesserung der Robustheit von automatischen Spracherkennungssystemen in schwierigen akustischen Situationen zu erreichen. Dazu sollen Algorithmen zur Störgeräuschbefreiung und Enthallung des akustischen Signals mit robusten Merkmalen auf Basis eines Modells der Sprachperzeption des Menschen kombiniert werden. Als Demonstrator soll während des beantragten Vorhabens ein robustes System zur automatischne Spracherkennung für den Einsatz in realistischen Umgebungen erstellt werden. In diesem sollen verschiedene Algorithmen zur Störunterdrückung mittels einer intelligenten Entscheidungseinheit optimal für die darauf aufsetzende Extraktion perzeptiver Merkmale kombiniert werden. In einer weiteren Stufe sollen dabei sekundäre Merkmale extrahiert werden, die der Verarbeitung auditiver Signale auf zentralen Stufen der Hörbahn entsprechen. Audiologische Messungen zur Sprachverständlichkeitsschwelle bei normalhörenden Menschen liefern als Referenzwert das (praktische) Optimum erreichbarer Erkennungsleistung.
DFG-Verfahren
Sachbeihilfen