Detailseite
Induktion von Dokumentgrammatiken zur Repräsentation logischer Hypertext-Dokumentstrukturen
Antragsteller
Professor Dr. Alexander Mehler
Fachliche Zuordnung
Allgemeine und Vergleichende Sprachwissenschaft, Experimentelle Linguistik, Typologie, Außereuropäische Sprachen
Förderung
Förderung von 2005 bis 2009
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 5468400
Mit Dokumentgrammatiken steht ein Repräsentationsformat für die Modellierung von Dokumentstrukturen bereit, das die Ausdrucksmächtigkeit regulärer Baumgrammatiken besitzt. Dieses Instrumentarium findet in der Abbildung diskontinuierlicher Abhängigkeiten mit Hilfe von Constraint-Sprachen eine Erweiterung, die in Form der Caterpillar-Ausdrücke ebenfalls im Bereich regulärer Baumgrammatiken 56 verbleibt. Diesem Angebot an texttechnologischen Repräsentationsformaten steht ein Automatisierungsdefizit gegenüber, und zwar insbesondere im Hinblick auf die Induktion von Dokumentgrammatiken und die Ermittlung von Dokumentstruktur- Constraints. In diesem Projekt sollen die texttechnologische Modellierung mit der computerlinguistischen Grammatikinduktion mit dem Ziel verknüpft werden, Dokumentgrammatiken als strukturelle Klassifikatoren für generische Hypertext- Dokumentstrukturen automatisch zu induzieren und mittels Constraints informationell anzureichern.
DFG-Verfahren
Forschungsgruppen
Teilprojekt zu
FOR 437:
Texttechnologische Informationsmodellierung