Detailseite
Multidimensionale Analyse von simulierten Konversationen
Antragsteller
Professor Dr.-Ing. Sebastian Möller
Fachliche Zuordnung
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Kommunikationstechnik und -netze, Hochfrequenztechnik und photonische Systeme, Signalverarbeitung und maschinelles Lernen für die Informationstechnik
Kommunikationstechnik und -netze, Hochfrequenztechnik und photonische Systeme, Signalverarbeitung und maschinelles Lernen für die Informationstechnik
Förderung
Förderung seit 2022
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 493809605
Im vorhergehenden Forschungsprojekt (Projektnr. 320253669) wurde eine Simulation von Konversationen entwickelt, die den Sprecherwechsel und die Sprachverständlichkeit bei Paketverlusten und Übertragungsverzögerungen modelliert. Die resultierenden simulierten Konversationen wurden daraufhin genutzt, um die Gesamtqualität der Konversation vorherzusagen. Die Konversationsqualität kann jedoch in perzeptive Wahrnehmungsdimensionen der Hör-, Sprech- und Interaktionsphasen der Konversation aufgeteilt werden, um ein tieferes Verständnis der Qualitätsbewertung und potentielle Hinweise auf die Ursache der Störung zu erhalten. Die ITU-T-Empfehlung P.804 standardisiert das dazu passende diagnostische Testverfahren, um die drei Konversationsphasen mit ihren perzeptiven Dimensionen zu erfassen. Ziel dieses Forschungsvorhabens ist es, die Hör-, Sprech- und Interaktionsphasen nach ITU-T-Empfehlung P.804 zu simulieren und mit Hilfe der resultierenden Daten die perzeptiven Dimensionen vorherzusagen. Dafür wird das Testprotokoll der drei Konversationsphasen in die Simulationsumgebung implementiert. Insbesondere für die Simulation der Sprechphase werden Modelle für die Erkennung der Rückkopplung der eigenen Sprache (Echo) und Modelle zur Anpassung der Sprechverhaltens bei dieser Störung entwickelt. Für die Vorhersage der Dimensionen der Hörphasen kann auf das sich in der Standardisierung befindliche Modell P.AMD zurückgegriffen werden. Für die Vorhersage der perzeptiven Dimensionen der Sprech- und Interaktionsphase werden neue Modelle entwickelt und evaluiert. Als Ergebnis des Forschungsvorhabens wird eine neue Simulation sowie ein Vorhersagemodell für gestörte Konversationen erwartet. Dieses Modell und die Simulation sollen international standardisiert werden und zum Industriepartner transferiert werden.
DFG-Verfahren
Sachbeihilfen (Transferprojekt)
Anwendungspartner
Rohde & Schwarz SwissQual AG