Project Details
Projekt Print View

Statistische Analyse phonetischer, linguistischer und rhythmischer Merkmale des Sprachsignals von normaler und alkoholisierter Sprache

Subject Area General and Comparative Linguistics, Experimental Linguistics, Typology, Non-European Languages
Term from 2009 to 2018
Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 156714053
 
Final Report Year 2015

Final Report Abstract

In diesem Projekt wurden phonetische, linguistische und rhythmische Merkmale von Sprache unter Alkoholeinfluss im Vergleich zu Sprache nüchterner Sprecher untersucht. Datenbasis ist das bislang größte veröffentlichte Korpus mit alkoholisierter Sprache 'Alcohol Language Corpus' (ALC) mit 162 Sprechern; dieses Korpus wurde auch als Testmaterial für die 'Interspeech 2011 Speaker State Challenge' eingesetzt. Die Ergebnisse dieses Projektes sind relevant für forensische Untersuchungen (z.B. zur Beurteilung der Nüchternheit von Verdächtigen zur Tatzeit) sowie auch für die Entwicklung von automatischen Monitoring-Programmen für Fahrzeugführer. Neu an der vorliegenden Studie ist die große Anzahl von Sprechern (auch weiblichen) in der Datenbasis (welche erstmals gesicherte statistische Aussagen zulassen), die Belegung der Alkoholisierung der Versuchspersonen durch die Untersuchung der Blutalkoholkonzentration (bisher meistens nur Atemalkohol), die Untersuchung von verschiedenen Sprachstilen (bisher nur gelesene Sprache), die Untersuchung von Rhythmus-Parametern einschließlich der Energie- und Grundfrequenz-Konturen, die Durchführung von Perzeptionsexperimenten zur Diskriminationsfähigkeit von alkoholisierter und nüchterner Sprache, sowie von Perzeptionsexperimenten mit manipulierten Sprachstimuli, um Alkoholisierung zu kompensieren/simulieren. Die wichtigsten Ergebnisse der vorliegenden Studie sind: 1) Die Mehrzahl von phonetischen und linguistischen Langzeit-Merkmalen unterscheiden sich im Mittel in alkoholisierter und nüchterner Sprache, darunter die Tonlage, die Geschwindigkeit, die Artikulationsgenauigkeit, der Rhythmus, die Anzahl der Versprecher und Korrekturen; 2) Energie- und Grundfrequenzkonturen unterscheiden sich ebenfalls signifikant (traditionelle Abstandsmaße, Parameterisierung von Konturen), jedoch bringt eine Funktionale Datenanalyse (FDA) keinen Vorteil gegenüber traditionellen Methoden; 3) Sibilanten ('s' und 'sch') werden nicht zentralisierter artikuliert, sondern im Gegenteil prägnanter; dies ist vermutlich ein kompensatorischer Effekt, der seine Ursache darin hat, dass sich die Versuchspersonen beobachtet fühlten; das gleiche wird für die Vokalartikulation beobachtet, bei der Vokale nicht zentralisierter artikuliert werden, sondern distinktiver; 4) Sprechgeschwindigkeit nimmt generell ab bei Alkoholisierung, desgleichen nimmt die Anzahl der Pausen zu, aber nicht deren Länge; 5) Alle gefundenen Merkmals-Unterschiede sind stark ideosynkratisch: Sprecher variieren in ihrem Verhalten sehr weit, sind aber in sich relativ konsistent; ein Zusammenhang mit dem Geschlecht besteht in der Regel nicht (Ausnahme: Artikulation von Vokalen: weibliche Sprecher kompensieren mehr als männliche); 6) Modernste Verfahren der Mustererkennung erreichen ca. 78% Diskriminationsgenauigkeit nur anhand von Sprache; menschliche Hörer erreichen dagegen nur ca. 63%. 7) Obwohl die (messbare) Tonlage ein sehr robustes Merkmal für Alkoholisierung darstellt, verwenden menschliche Hörer dieses Merkmal nicht oder nur, wenn andere Merkmale nicht zur Verfügung stehen (z.B. Versprecher); ein Grund hierfür ist vermutlich, dass die Tonlage von sehr vielen anderen Sprecherzuständen (z.B. Müdigkeit, emotionale Stimmung) abhängt, und daher von Hörern als nicht sehr zuverlässig eingeschätzt wird.

Publications

 
 

Additional Information

Textvergrößerung und Kontrastanpassung