Detailseite
Projekt Druckansicht

BIG VOICE DATA - Eine umfassende Dokumentation und Analyse der menschlichen Stimmproduktion mittels laryngealer Stimmfelder und Deep Learning

Fachliche Zuordnung Medizininformatik und medizinische Bioinformatik
Förderung Förderung seit 2025
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 544877652
 
Die zugrundeliegenden physikalischen und physiologischen Prinzipien der Stimmproduktion bei menschlicher Sprache und Gesang sind seit Jahrzehnten Gegenstand der Forschung. Trotz einiger hervorragender Untersuchungen in jüngster Zeit ist unser derzeitiges Verständnis der kausalen Beziehung zwischen der Schwingungsdynamik der Stimmlippen und der Qualität des abgestrahlten Klangs jedoch in bemerkenswerter Weise auf selektive Vokalisationsstereotypen beschränkt, die hauptsächlich die Sprache betreffen. Dies ist zum Teil auf methodische Einschränkungen bei der Datenerfassung sowie auf Herausforderungen bei der Analyse und Aggregation großer Datenmengen zurückzuführen, die durch die Hochgeschwindigkeits-Videoendoskopie (HSV) des Kehlkopfes erzeugt werden. Folglich und überraschenderweise gibt es bis heute keine umfassende Dokumentation über den ursächlichen Zusammenhang zwischen der laryngealen Stimmproduktion im Kehlkopf und dem daraus resultierenden akustischen Stimmsignal, die den gesamten menschlichen Stimmbereich abdeckt. Ziel dieser Studie ist es, die kausale Beziehung zwischen der Schwingungsdynamik der Stimmlippen und dem daraus resultierenden akustischen Stimmsignal über den gesamten, physiologisch möglichen Stimmbereich des erwachsenen Menschen erstmals umfassend und quantitativ zu untersuchen, um diesen Mangel an Daten zu beheben. Um dieses Ziel zu erreichen, werden wir die umfassendste quantitative in vivo Hochgeschwindigkeits-Videodatenerfassung und Deep-Learning-Datenanalyse durchführen, die bisher versucht wurde. Innovative laryngeale Stimmprofile (L-VRP) - die den gesamten erreichbaren Stimmumfang abdecken - werden für eine Kohorte von 40 Teilnehmern (20 weiblich, 20 männlich) erstellt, wobei gleichzeitig akustische, Beschleunigungsmesser-, elektroglottographische (EGG) und endoskopische HSV-Daten gesammelt werden. Die HSV-Datenerfassung basiert auf einem beispiellosen Datenerfassungsparadigma, das es ermöglicht, den gesamten Stimmumfang an einem Arbeitstag zu dokumentieren. Die erfassten L-VRP-Datensätze werden mit Hilfe von künstlicher Intelligenz (KI), einschließlich Deep Learning, segmentiert und analysiert, um laryngeale Faktoren zu identifizieren, die mit akustischen Stimmmessungen in Beziehung stehen. Das erweiterte Wissen über die kausale Beziehung zwischen der Dynamik der Stimmproduktion und dem akustischen Stimmsignal, das mit diesem innovativen Ansatz erzeugt wird, wird ein tieferes Verständnis der Entwicklung und Behandlung von Stimmstörungen sowie die Weiterentwicklung pädagogischer Ansätze auch für Sprache und Gesang fördern. Dieses Projekt wird als internationale Zusammenarbeit zwischen Christian T. Herbst, Universität Mozarteum Salzburg, Österreich, und Jörg Lohscheller, Fachhochschule Trier, Deutschland, durchgeführt.
DFG-Verfahren Sachbeihilfen
Internationaler Bezug Österreich
Kooperationspartner Christian Herbst, Ph.D.
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung