Detailseite
Projekt Druckansicht

Menschliche Wahrnehmung und automatische Erkennung von Persönlichkeit und Sympathie von Sprechern - Einfluss moderner Telekommunikationskanäle

Fachliche Zuordnung Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Akustik
Förderung Förderung von 2015 bis 2018
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 284757262
 
Beim Hören von unbekannten Stimmen neigen Menschen spontan dazu, Rückschlüsse auf die wahrgenommene Persönlichkeit und Sympathie der Stimme ihrer Gesprächspartner zu ziehen. Die gehörten Stimmen sind in der Regel durch Kommunikationskanäle übertragen, z.B. in telefonbasierten Sprachanwendungen. Allerdings wurden bislang die Effekte von Übertragungskanälen in früheren Untersuchungen der menschlichen und automatischen Erkennung von Persönlichkeitsmerkmalen und Sympathie noch nicht berücksichtigt. In Bezug auf die automatische Vorhersage dieser Sprechereigenschaften wurde außerdem bisher - trotz des kontinuierlichen Charakters der Bewertung von Wahrnehmungen - die binäre Klassifikation betrachtet. Das geplante Projekt wird den Einfluss von Übertragungskanälen auf die Erkennung der Sprecherpersönlichkeit und Sympathie von Mensch und Maschine mit verschiedenen Einstellungen - wie beispielsweise Bandbreite, Kodierung und Endgeräte - näher untersuchen. Die für die Analysen benötigten Daten sollen im Laufe des Projektes aufgenommen werden. Auf der menschlichen Seite wird hier Crowdsourcing eingesetzt, um Einschätzungen von Zuhörern bezüglich größeren übertragenen Sprachmaterials schnell und zuverlässig erfassen zu können. Auf der maschinellen Seite werden Regressionsmodelle für die Vorhersage der Persönlichkeit und Sympathie berücksichtigt und State-of-the-Art Techniken wie Deep Neural Networks eingesetzt. Die Gültigkeit der Messung der Sprachqualität als Prädiktor für die Sprechereigenschaften wird ebenfalls untersucht. Die Ergebnisse werden aufklären, welche Übertragungskanäle jene Spracheigenschaften bewahren, die die wahrgenommene Persönlichkeit und Sympathie bestimmen, und wie diese sich automatisch vorhersagen lassen. Dies kann in telefonbasierten Sprachanwendungen, die auf die Abschätzung wahrgenommener Sprechereigenschaften und die Vorhersage des nachfolgenden Benutzerverhaltens abzielen, verwendet werden.
DFG-Verfahren Sachbeihilfen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung