Project Details
Anaphernresolution für die Zusammenfassung gesprochener Dialoge (DIANA Summ)
Applicant
Professor Dr. Michael Strube
Subject Area
General and Comparative Linguistics, Experimental Linguistics, Typology, Non-European Languages
Term
from 2004 to 2008
Project identifier
Deutsche Forschungsgemeinschaft (DFG) - Project number 5424319
Die automatische Zusammenfassung gesprochener Dialoge ist ein relativ neues Forschungsgebiet der Computerlinguistik. Existierende Ansätze sind methodisch stark an der Zusammenfassung von geschriebenen Texten orientiert. Sie lassen wichtige Besonderheiten spontan-sprachlicher Dialoge, insbesondere die signifikant höhere Anzahl an Pronomen, außer acht. Es ist zu erwarten, daß die Resolution von Pronomen eine signifikante Verbesserung sowohl für die Erstellung einer Zusammenfassung durch automatische Selektion relevanter Äußerungen als auch für ihre Lesbarkeit bewirkt. Im vorliegenden Projekt soll der Beitrag einer Anaphernresolutionskomponente für die automatische Dialogzusammenfassung untersucht werden. Dazu soll eine solche Komponente entwickelt, in ein weitgehend aus Standardkomponenten bestehendes und auf Selektion relevanter Äußerungen basierendes Zusammenfassungssystem integriert und anschließend ihr Beitrag evaluiert werden. Sowohl für die Anaphernresolutionskomponente als auch für das Zusammenfassungssystem sollen dabei quantitative, auf maschinellem Lernen (Machine Learning, (ML)) basierende Verfahren zum Einsatz kommen. Neben größerer Robustheit haben diese Verfahren den Vorteil, weitgehend domänenunabhängig und damit einfach auf andere Einsatzbereiche übertragbar zu sein. Am Ende des Projekts soll ein praktisch einsetzbares, um Anaphernresolution ergänztes Zusammenfassungssystem für gesprochene Dialoge stehen, das einen ersten Schritt zur automatischen Erzeugung von Gesprächsprotokollen darstellt.
DFG Programme
Research Grants