Detailseite
Untersuchungen zur automatischen Erkennung gestörter Sprachsignale unter Verwendung von modifizierten Referenzmodellen und einer Bestimmung stimmhafter Abschnitte
Antragsteller
Professor Dr.-Ing. Hans-Günter Hirsch
Fachliche Zuordnung
Akustik
Förderung
Förderung von 2012 bis 2016
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 217450045
Ausgehend von der Bestimmung stimmhafter Sprachsegmente mit hoher Energie, besteht die Zielsetzung dieses Forschungsvorhabens in der Untersuchung einer Modellierung sprachlicher Abschnitte mit Referenzmodellen, mit denen die vor dem stimmhaften Abschnitt aufgetretenen akustischen Merkmale und die danach auftretenden akustischen Merkmale beschrieben werden. Zudem sollen die sprachlichen Abschnitte mit geringer Energie, in denen die Störung die sprachlichen Merkmale weitgehend verdeckt, nicht oder mit einer geringeren Gewichtung zur Spracherkennung verwendet werden. Den Ausgangspunkt dieser alternativen Modellierung stellt eine Erkenntnis aus der Beobachtung der menschlichen Kommunikation in einer gestörten Umgebung dar. Das Sprachverstehen des Menschen basiert in solchen Situationen häufig nur noch auf der Wahrnehmung der energiereichen Laute. In einem weiteren Abschnitt des Vorhabens soll untersucht werden, wie weit dieser Ansatz einer modifizierten Modellierung mit den bestehenden Ansätzen zur robusten Erkennung gestörter Sprachsignale kombiniert werden kann, um die Leistungsfähigkeit eines Spracherkennungssystems zu verbessern. Die Untersuchungen zur Bestimmung der Leistungsfähigkeit einer auf diesem Ansatz beruhenden Spracherkennung sollen mit Hilfe von Simulationsexperimenten unter Verwendung vorhandener Sprachdatensammlungen durchgeführt werden.
DFG-Verfahren
Sachbeihilfen