Effiziente Algorithmen für die Mikroplanung und Realisierung in der Generierung natürlicher Sprache
Zusammenfassung der Projektergebnisse
Im Projekl CRISP wurde ein neuer, effizienter Algorithmus zur Generierung von natürlichsprachlichen Sätzen entwickelt, die eine vorgegebene formale Bedeutungsrepräsentation ausdrücken. Dies ist beispielsweise dann nützlich, wenn man in einem Museum benutzerspezifische Beschreibungen von Ausstellungsstücken anzeigen will, die das Stück mit anderen vergleichen, die der Benutzer zuvor gesehen hat. Das Problem der Satzgenerierung konnte in der Vergangenheit nur effizient gelöst werden, indem es künstlich in zwei Teile aufgetrennt wurde; diese Aufteilung führt aber manchmal dazu, dass unnatürliche Sätze generiert werden müssen und ist aus Software-Engineering-Gesichtspunkten problematisch. In meiner Arbeit konnte ich das Problem lösen, indem ich Techniken zur effizienten Suche für Kl-Planungsprobleme eingesetzt habe. Obwohl modeme Planungsalgorithmen wie erwartet gut mit dem Suchproblem umgehen können, zeigte sich, dass die verfügbaren Implementiemngen allesamt einen Vorverarbeitungsschritt ausführen, der für die CRISP-Anwendung viel mehr Zeit verbraucht als die Suche selbst. In einem Artikel auf einem Planungs-Workshop habe ich dieses Problem erstmals deutHch benannt und analysiert. Ich hoffe darauf, dass zukünftige Planer ohne den Vorverarbeitungsschritt auskommen können und damit den CRISP-Generierer noch schneller machen. Daneben bin ich beim Versuch, CRISP zu Evaluierungszwecken auf Grammatiken im CCG-Formalismus anzuwenden, auf unerwartete Unterschiede zwischen CCG und dem TAG-Formalismus, für den der CRISP-Algorithmus ursprünglich entwickelt ist, gestoßen. Bei näherer Untersuchung konnte ich allerdings zeigen, dass CCG - wie TAG - zu einer Familie von Grammatikformalismen mit regulären Ableitungsstrukturen gehört. Hier ergeben sich aus der Projektarbeit sehr interessante theoretische Fragen zur Interaktion von Valenz und Wortstellung in Grammatikformalismen, die ich erstmals in dieser Schärfe formulieren konnte und in Zukunft näher untersuchen werde. Ein letzter Fokus meiner Arbeit im Projekt war die Organisation der GIVE-Challenge, einer Initiative zur Evaluierung von Sprachgenerierungssystemen. Die Evaluierung solcher Systeme isl ein ungelöstes Problem; wir schlagen hier mit der Evaluierung über das Internet einen ganz neuen Weg ein, und schon jetzt ist die GIVE-Challenge mit über tausend Benutzern (die meisten Laien) die größte Evaluierungsinitiative dieser Art. Auch einige deutschen und amerikanischen Publikumsmedien im Intemet berichteten über GIVE und trugen so zum Evaluierungserfolg mit bei.
Projektbezogene Publikationen (Auswahl)
-
(2007). Generating instructions in virtual environments (GIVE): A challenge and evaluation testbed for NLG. In Proceedings of the Workshop on Shared Tasks and Comparative Evaluation in Natural Language Generation, Arlington
Byron, D., A. Koller, J. Oberlander, L. Stoia, and K. Striegnitz
-
(2007). Sentence generation as planning. In Proceedings of the 45th Annual Meeting of the Association for Computational Linguistics (ACL-07), Prague
Koller, A. and M. Stone
-
(2007). Shared task proposal; Instruction giving in virtual worlds. In M. White and R. Dale (eds). Working group reports of the Workshop on Shared Tasks and Comparative Evaluation in Natural Language Generation
Koller, A., J. Moore, B. di Eugenio, J. Lester, L. Stoia, D. Byron, J. Oberlander, and K. Striegnitz
-
(2008). Experiences with planning for natural language generation. In Proceedings of SPARK-08: The ICAPS-08 Scheduling and Planning Applications Workshop, Sydney, Australia
Koller, A. and R. Petrick
-
(2008). Referring expressions as formulas of description logic. In Proceedings of the 5th International Natural Language Generation Conference, Salt Fork, Ohio
Areces, C, A. Koller, and K. Striegnitz