Project Details
Projekt Print View

Text-grammatical foundations for the (semi-)automated text-to-hypertext conversion

Subject Area General and Comparative Linguistics, Experimental Linguistics, Typology, Non-European Languages
Term from 2001 to 2010
Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 5468400
 
Als "Hypertextualisierung" bezeichnet man die Aufbereitung von Dokumenten, die für eine Print-Publikation konzipiert waren, im Hinblick auf die Publikation in einem Hypertextsystem. Durch die wachsende Bedeutung des World Wide Webs werden Prozesse der Hypertextualisierung künftig eine wichtige Rolle im sog. Document Lifecycle spielen, wobei die dabei notwendigen Aufbereitungsprozesse verschiedene Ebenen der Textannotation betreffen. Dringend benötigt werden beim aktuellen Forschungsstand Prinzipien und Strategien zur Segmentierung sequenziell organisierter Dokumente in Module sowie deren Neu-Relationierung durch Links. Das Projekt möchte hierzu einen Beitrag leisten, indem es textgrammatische Forschungsergebnisse, die an der Untersuchung sequenziell organisierter Dokumente gewonnen wurden, für die (teil)automatische Hypertextualisierung nutzbar macht. Im Zentrum steht die Frage, wie die Annotation von Kohärenzstrukturen in sequenziell organisierten Dokumenten für das (semi)automatische linking nach Kohärenzkriterien genutzt werden kann. Ein Korpus mit Dokumenten aus dem Zweckbereich "Wissenstransfer" wird textgrammatisch annotiert und dient dann als Datengrundlage für die (semi)automatische Hypertextualisierung. Texttechnologische Grundlage ist die Extensible Markup Language XML, speziell die XML Linking and Adressing Languages (Xpath, Xpointer, Xlink) sowie der als SGML-Architektur definierte ISO-Standard zu "Topic Maps".
DFG Programme Research Units
 
 

Additional Information

Textvergrößerung und Kontrastanpassung