Detailseite
Projekt Druckansicht

Mehrsprachiger und kontrollierbarer Schutz personenbezogener Daten in der Stimme (VoiPy)

Fachliche Zuordnung Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung Förderung seit 2024
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 533241795
 
Die automatische Sprachverarbeitung ermöglicht nützliche Anwendungen wie Sprachassistenten oder automatische Transkriptionsdienste. Ein Sprachsignal enthält jedoch mehr Daten, als normalerweise für die Aufgabe benötigt werden, beispielsweise paralinguistische Informationen über den Sprecher. Während Klassifizierungsmodelle wie zur Sprecheridentifizierung oder Emotionserkennung in der Stimme immer fortschrittlicher werden, stellen diese Informationen eine ernsthafte Bedrohung für den Datenschutz dar, oft ohne dass dem Sprecher dies bewusst ist. Dienstleister könnten die Daten zur Erstellung von Sprecherprofilen missbrauchen, oder die Daten könnten bei der Übertragung oder Speicherung in die Hände von Unbefugten fallen. Daher hat die Anonymisierung der Audiodaten unmittelbar nach der Aufnahme und vor der weiteren Verarbeitung an Bedeutung gewonnen, insbesondere nach der Einführung der Datenschutz-Grundverordnung (DSGVO) der Europäischen Union. Die Idee besteht darin, Sprachaufnahmen so zu verändern, dass die Verbindung zwischen dem ursprünglichen Sprecher und dem Audio zerstört wird, zum Beispiel indem man die Stimme eines anderen Sprechers verwendet. Ist die Anonymisierung erfolgreich, müssen theoretisch keine weiteren Maßnahmen ergriffen werden, um andere personenbezogene Informationen in den Daten zu schützen, wie z. B. Eigenschaften oder Zustände des Sprechers. In diesem Projekt schlagen wir einen Ansatz zur Wahrung des Datenschutzes in Sprachaufnahmen vor, der den Benutzern die Kontrolle darüber gibt, welche persönlichen Informationen, einschließlich ihrer Identität, sie in ihrer Sprache schützen möchten, bevor sie diese mit einem externen Dienst teilen. Die Benutzer können flexibel Anforderungen an die Anonymisierung von verschiedenen Sprecherattributen in Bezug auf ihr Profil (z. B. Alter, Geschlecht) und ihren Zustand (z. B. Emotionen) festlegen. Wir werden nicht alle vorhandenen personenbezogenen Informationen immer automatisch anonymisieren, da je nach Anwendung einige Attribute in unveränderter Form beibehalten werden müssen. Insbesondere da Nutzer von intelligenten Anwendungen oft nicht über die Wahrung oder Verletzung ihres Datenschutzes Bescheid wissen, konzentrieren wir uns darauf, dem Nutzer so viel Kontrolle und Transparenz wie möglich zu bieten, und dabei gleichzeitig die Benutzerfreundlichkeit und Effektivität zu erhalten. Um diesen Datenschutz auch für Sprecher anderer Sprachen als Englisch zu gewährleisten, werden wir einen Mechanismus integrieren, der Komponenten entsprechend der jeweiligen Sprache auswählt beziehungsweise die Komponenten über die aktuelle Sprache informiert. Wir konzentrieren uns auf die wichtigsten in Deutschland gesprochenen Sprachen (Amts- und Fremdsprachen), schlagen aber eine Methode vor, die auf andere Sprachen erweiterbar ist.
DFG-Verfahren Sachbeihilfen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung