Untersuchungen zur automatischen Erkennung gestörter Sprachsignale unter Verwendung von modifizierten Referenzmodellen und einer Bestimmung stimmhafter Abschnitte

Antragsteller Professor Dr.-Ing. Hans-Günter Hirsch

Fachliche Zuordnung Akustik

Förderung Förderung von 2012 bis 2016

Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 217450045

Ausgehend von der Bestimmung stimmhafter Sprachsegmente mit hoher Energie, besteht die Zielsetzung dieses Forschungsvorhabens in der Untersuchung einer Modellierung sprachlicher Abschnitte mit Referenzmodellen, mit denen die vor dem stimmhaften Abschnitt aufgetretenen akustischen Merkmale und die danach auftretenden akustischen Merkmale beschrieben werden. Zudem sollen die sprachlichen Abschnitte mit geringer Energie, in denen die Störung die sprachlichen Merkmale weitgehend verdeckt, nicht oder mit einer geringeren Gewichtung zur Spracherkennung verwendet werden. Den Ausgangspunkt dieser alternativen Modellierung stellt eine Erkenntnis aus der Beobachtung der menschlichen Kommunikation in einer gestörten Umgebung dar. Das Sprachverstehen des Menschen basiert in solchen Situationen häufig nur noch auf der Wahrnehmung der energiereichen Laute. In einem weiteren Abschnitt des Vorhabens soll untersucht werden, wie weit dieser Ansatz einer modifizierten Modellierung mit den bestehenden Ansätzen zur robusten Erkennung gestörter Sprachsignale kombiniert werden kann, um die Leistungsfähigkeit eines Spracherkennungssystems zu verbessern. Die Untersuchungen zur Bestimmung der Leistungsfähigkeit einer auf diesem Ansatz beruhenden Spracherkennung sollen mit Hilfe von Simulationsexperimenten unter Verwendung vorhandener Sprachdatensammlungen durchgeführt werden.

DFG-Verfahren Sachbeihilfen

Servicenavigation

Hauptnavigation

Untersuchungen zur automatischen Erkennung gestörter Sprachsignale unter Verwendung von modifizierten Referenzmodellen und einer Bestimmung stimmhafter Abschnitte

Zusatzinformationen

Servicenavigation

Hauptnavigation

Untersuchungen zur automatischen Erkennung gestörter Sprachsignale unter Verwendung von modifizierten Referenzmodellen und einer Bestimmung stimmhafter Abschnitte

Zusatzinformationen

Textvergrößerung und Kontrastanpassung