Invariante Merkmale für die automatische Spracherkennung

Applicant Professor Dr.-Ing. Alfred Mertins

Subject Area Electronic Semiconductors, Components and Circuits, Integrated Systems, Sensor Technology, Theoretical Electrical Engineering

Term from 2007 to 2011

Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 36043764

Die Leistungsfähigkeit heutiger Spracherkennungssysteme liegt trotz großer Anstrengungen noch weit hinter der des Menschen. Dies gilt insbesondere dann, wenn ungünstige akustische Bedingungen herrschen oder wenn große Variationen innerhalb der Gruppe der betrachteten Sprecher vorliegen. Als Gründe sind hierbei die noch unzureichenden Methoden der robusten Merkmalsextraktion, der Adaptation, der Modellierung von Spracheinheiten und der Modellierung von Dialekten und Aussprachevariationen zu nennen. Die Schwächen liegen sowohl in der Behandlung extrinsischer Variabilitäten (Nachhall, Störungen, Mikrofon) als auch im Umgang mit intrinsischen Sprach-Variabilitäten wie Sprecher, Alter, Geschlecht, Vokaltraktdimension, Akzent/Dialekt, Sprechgeschwindigkeit und emotionaler Zustand. Das vorliegende Forschungsvorhaben soll sich insbesondere mit denjenigen Variabilitäten in Sprachsignalen befassen, die auf unterschiedliche Vokaltraktlängen der Sprecher zurückzuführen sind. Ziel ist es dabei, die Erkennungsleistung und Robustheit der automatischen Spracherkennung in sprecherunabhängigen Erkennungsaufgaben deutlich zu erhöhen und dabei ebenfalls eine Robustheit gegenüber extrinsischen Einflüssen zu erzielen. Erreicht werden soll das Ziel durch die Entwicklung und Optimierung spezieller Methoden zur Invariantengewinnung.

DFG Programme Research Grants

Servicenavigation

Hauptnavigation

Invariante Merkmale für die automatische Spracherkennung

Additional Information

Servicenavigation

Hauptnavigation

Invariante Merkmale für die automatische Spracherkennung

Additional Information

Textvergrößerung und Kontrastanpassung