Detailseite
Invariante Merkmale für die automatische Spracherkennung
Antragsteller
Professor Dr.-Ing. Alfred Mertins
Fachliche Zuordnung
Elektronische Halbleiter, Bauelemente und Schaltungen, Integrierte Systeme, Sensorik, Theoretische Elektrotechnik
Förderung
Förderung von 2007 bis 2011
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 36043764
Die Leistungsfähigkeit heutiger Spracherkennungssysteme liegt trotz großer Anstrengungen noch weit hinter der des Menschen. Dies gilt insbesondere dann, wenn ungünstige akustische Bedingungen herrschen oder wenn große Variationen innerhalb der Gruppe der betrachteten Sprecher vorliegen. Als Gründe sind hierbei die noch unzureichenden Methoden der robusten Merkmalsextraktion, der Adaptation, der Modellierung von Spracheinheiten und der Modellierung von Dialekten und Aussprachevariationen zu nennen. Die Schwächen liegen sowohl in der Behandlung extrinsischer Variabilitäten (Nachhall, Störungen, Mikrofon) als auch im Umgang mit intrinsischen Sprach-Variabilitäten wie Sprecher, Alter, Geschlecht, Vokaltraktdimension, Akzent/Dialekt, Sprechgeschwindigkeit und emotionaler Zustand. Das vorliegende Forschungsvorhaben soll sich insbesondere mit denjenigen Variabilitäten in Sprachsignalen befassen, die auf unterschiedliche Vokaltraktlängen der Sprecher zurückzuführen sind. Ziel ist es dabei, die Erkennungsleistung und Robustheit der automatischen Spracherkennung in sprecherunabhängigen Erkennungsaufgaben deutlich zu erhöhen und dabei ebenfalls eine Robustheit gegenüber extrinsischen Einflüssen zu erzielen. Erreicht werden soll das Ziel durch die Entwicklung und Optimierung spezieller Methoden zur Invariantengewinnung.
DFG-Verfahren
Sachbeihilfen