Automatische Analyse von Lautbildungsstörungen bei Kindern und Jugendlichen mit Lippen-Kiefer-Gaumenspalten (LKG)
Final Report Abstract
Im klinischen Alltag werden spalttypische Artikulations- und Nasalitätsstörungen perzeptiv von Logopädinnen analysiert. Dies ist sehr zeitaufwendig und untersucherabhängig, weshalb der Wunsch nach automatischen Systemen zur Artikulationsanalyse existiert. Zur Nasalitätsbewertung existieren bereits Apparaturen die durch ein spezielles Doppelmikrofon zwischen Mund und Nase das Verhältnis zwischen oralem und nasalem Luftstrom messen und daraus den sogenannten Nasalitätskoeffizienten bestimmen. Diese Apparaturen werden aber durch ihre hohen Kosten und den Aufwand, der durch das Anlegen und Justieren der Apparaturen entsteht, nicht bzw. sehr selten im klinischen Alltag eingesetzt. Fernziel des Projekts ist die automatische Analyse spalttypischer Artikulationsund Nasalitätsstörungen basierend auf Sprachaufzeichnungen eines herkömmlichen Nahbesprechungsmikrofons. Es wurden Sprachdaten von Kindern mit Lippen-Kiefer-Gaumenspalte und Kontrollaufnahmen erhoben und von klinisch tätigen Logopädinnen bzgl. verschiedenster spalttypische Artikulations- und Nasalitätsstörungen annotiert. Weiterhin wurde für einen Teil der Kinder die Nasalanz mit einem Nasometersystem bestimmt. Es wurden automatische Verfahren basierend auf Methoden der automatischen Sprachverarbeitung entwickelt, die eine automatische Analyse basierend auf Sprachaufnahmen gewöhnlicher Nahbesprechungsmikrofone erlauben. Die Verlässlichkeit der Systeme wurde mit der Übereinstimmung zu menschlichen Bewertern belegt. Zur Messung der Nasalanz wurde zusätzlich die Übereinstimmung mit einem Nasometer ermittelt. Es wurde gezeigt, dass verlässlich erkannt werden kann, welche bzw. wie viele Wörter eines Standardtextes falsch gebildet wurden. Besonders für die Kriterien Hypernasalität, Rückverlagerung, Veränderung der Artikulationsspannung, sowie Inter- und Lateralität wurde gezeigt, dass diese durch automatische Verfahren erkannt werden können. Eine detaillierte Analyse der Nasalanz zeigte eine hohe Übereinstimmung zwischen Nasometeranalysen und Methoden der Spracherkennung. Die Methoden der Spracherkennung kommen dabei mit einem einfachen Nahbesprechungsmikrofon aus, was die Durchführbarkeit und Akzeptanz im klinischen Alltag stark erhöhen dürfte.
Publications
- Improvement of a Speech Recognizer for Standardized Medical Assessment of Children's Speech by Integration of Prior Knowledge. Proc. 2nd IEEE Spoken Language Technologies (SLT 2010), pp. 247-252, 2010
Bocklet, T.; Maier, A.; Eysholdt, U.; Nöth, E.
- Combining phonological and acoustic ASR-free features for pathological speech intelligibility assessment. Proceedings of the 12th Annual Conference of the International Speech Communication Association, pp. 3005-3008, 2011
Middag, C.; Bocklet, T.; Martens, J.P.; Nöth, E.
- Detection of Persons with Parkinson’s Disease by Acoustic, Vocal, and Prosodic Analysis. Proc. of IEEE Automatic Speech Recognition and Understanding 2011 (ASRU), pp. 478-483, 2011
Bocklet, T.; Nöth, E.; Stemmer, G.; Ruzickova, H.; Rusz, J.
- Vergleich unterschiedlicher auditiven Analysen bei Kindern mit orofazialen Spaltfehlbildungen auf Lautebene. Aktuelle phoniatrisch-pädaudiologische Aspekte, vol. 19, pp. 79-81, 2011
Hagen, M.; Bocklet, T.; Eysholdt, U.
- Automatic Detection of Sigmatism in Children. Workshop on Child, Computer and Interaction, pp. 1-4, 2012
Valentini-Botinhao, C.; Degenkolb-Weyers, S.; Maier, A.; Nöth, E.; Eysholdt, U.; Bocklet, T.
- Automatic intelligibility assessment of speakers after laryngeal cancer by means of acoustic modeling. Journal of Voice, vol. 26, no. 3, pp. 390-397, 2012
Bocklet, T.; Riedhammer, K.; Nöth, E.; Eysholdt, U.; Haderlein, T.
(See online at https://doi.org/10.1016/j.jvoice.2011.04.010) - Automatische Bewertungen von Lautfehlbildungen bei Kindern mit orofazialen Spaltfehlbildungen mittels Gaußscher Sprechermodelle. Aktuelle phoniatrischpädaudiologische Aspekte, vol. 20, pp. 69-71, 2012
Bocklet T., Hagen, M., Ziethe A., Nöth, E. Eysholdt, U.
- The Automatic Assessment of Non-native Prosody: Combining Classical Prosodic Analysis with Acoustic Modelling. Proceedings of the 13th Annual Conference of the International Speech Communication Association, pp. 823-826, 2012
Hönig, F.; Bocklet, T.; Riedhammer, K.; Batliner, A.; Nöth, E.