Project Details
Projekt Print View

Regelbasierte Suche in Textdatenbanken in nichtstandardisierter Rechtschreibung

Subject Area Image and Language Processing, Computer Graphics and Visualisation, Human Computer Interaction, Ubiquitous and Wearable Computing
Term from 2004 to 2015
Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 5434029
 
Im Kontext eines Digitalisierungsprojekts zur Nietzsche-Rezeption aus den Jahren 1865 - 1945, das seit mehreren Jahren in Duisburg in Zusammenarbeit mit dem Nietzsche-Kolleg in Weimar verfolgt wird, beschäftigt sich das RSNSR-Projekt mit der Erforschung und Entwicklung eines linguistischen Regelsystems, einer Transformationsmethodik und zeitabhängiger Filter zur Unterstützung der Suche in Textdokumenten in nichtstandardisierter Rechtschreibung. Es wurde bereits eine Suchmaschine erstellt, welche es durch einen neu entwickelten phonetischen Regelsatz ermöglicht, auf Texten, die mehrere hundert Jahre vor der Rechtschreibvereinheitlichung des Jahres 1901 verfasst wurden, eine Suche mittels orthographisch genormter Schlagwörter durchzuführen. Durch Einführung eines Abstandsbegriffs sind verschiedene Stufen der Ähnlichkeit realisiert. Die Suchmaschine ist in das online-verfügbare HTML-basierte Nietzsche-Archiv integriert. Im Einzelnen verfolgt unser Projekt RSNSR in einem Zeitraum von drei Jahren die folgenden Ziele: - Entwicklung von Zeit- und Ortfiltern für phonetische Regeln, Revision der Regeln aus der Textbasis und aus statistischen Analysen, Vergleich des Wörterbuch- mit dem regelbasierten Ansatz, Nutzung eines Kontrollwörterbuchs gegen Homonymhäufung. - Entwicklung eines neuen adäquaten Abstandsbegriffs auf der Basis eines modifizierten graphematischen und phonetischen Levenshtein-Ähnlichkeitsmaßes, Berücksichtigung typischer Erfassungsfehler, Entwicklung von Unschärfeskalen. - Integration der Suchmaschinen in das Nietzsche Projekt und in andere Systeme, Entwicklung von Regelsätzen und Erweiterung der Suchmaschine auf (früh-)neuhochdeutsche Archive. Es wird ein Erfahrungsaustausch und eine Zusammenarbeit mit anderen Digitalisierungsprojekten wie dem Heidelberger Deutschen Rechtswörterbuch (DRW) angestrebt.
DFG Programme Research Grants
Participating Person Professor Dr. Ulrich Ammon (†)
 
 

Additional Information

Textvergrößerung und Kontrastanpassung