Detailseite
Textgrammatische Grundlagen für die (semi)automatische Hypertextualisierung von Dokumenten
Antragstellerin
Professorin Dr. Angelika Storrer
Fachliche Zuordnung
Allgemeine und Vergleichende Sprachwissenschaft, Experimentelle Linguistik, Typologie, Außereuropäische Sprachen
Förderung
Förderung von 2001 bis 2010
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 5468400
Als "Hypertextualisierung" bezeichnet man die Aufbereitung von Dokumenten, die für eine Print-Publikation konzipiert waren, im Hinblick auf die Publikation in einem Hypertextsystem. Durch die wachsende Bedeutung des World Wide Webs werden Prozesse der Hypertextualisierung künftig eine wichtige Rolle im sog. Document Lifecycle spielen, wobei die dabei notwendigen Aufbereitungsprozesse verschiedene Ebenen der Textannotation betreffen. Dringend benötigt werden beim aktuellen Forschungsstand Prinzipien und Strategien zur Segmentierung sequenziell organisierter Dokumente in Module sowie deren Neu-Relationierung durch Links. Das Projekt möchte hierzu einen Beitrag leisten, indem es textgrammatische Forschungsergebnisse, die an der Untersuchung sequenziell organisierter Dokumente gewonnen wurden, für die (teil)automatische Hypertextualisierung nutzbar macht. Im Zentrum steht die Frage, wie die Annotation von Kohärenzstrukturen in sequenziell organisierten Dokumenten für das (semi)automatische linking nach Kohärenzkriterien genutzt werden kann. Ein Korpus mit Dokumenten aus dem Zweckbereich "Wissenstransfer" wird textgrammatisch annotiert und dient dann als Datengrundlage für die (semi)automatische Hypertextualisierung. Texttechnologische Grundlage ist die Extensible Markup Language XML, speziell die XML Linking and Adressing Languages (Xpath, Xpointer, Xlink) sowie der als SGML-Architektur definierte ISO-Standard zu "Topic Maps".
DFG-Verfahren
Forschungsgruppen
Teilprojekt zu
FOR 437:
Texttechnologische Informationsmodellierung