Detailseite
Projekt Druckansicht

Koordinierte Förderinitiative zur Weiterentwicklung von Verfahren für die Optical-Character-Recognition (OCR)

Fachliche Zuordnung Datenmanagement, datenintensive Systeme, Informatik-Methoden in der Wirtschaftsinformatik
Förderung Förderung von 2018 bis 2020
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 409784275
 
Die koordinierte Förderinitiative hat zum Ziel, einerseits Verfahren zu beschreiben und Richtlinien zu erarbeiten, um einen optimalen Workflow sowie eine möglichst weitreichende Standardisierung von OCR bezogenen Prozessen und Metadaten zu erzielen, andererseits die vollständige Transformation des schriftlichen deutschen Kulturerbes in eine maschinenlesbare Form (strukturierter Volltext) konzeptionell vorzubereiten. Vor diesem Hintergrund haben die Projektpartner in der ersten Phrase eine Koordinierungs- und Betreuungsstruktur für Projekte der zweiten Phase der Ausschreibung der DFG (Modulprojektphase) aufgebaut.Für die jetzt beantragte zweite Phase gilt es, gemäß dem in der ersten Projektphase identifizierten primären Desiderat, den Lückenschluss zwischen Forschung und Praxis zu meistern. Dementsprechend sieht die koordinierte Förderinitiative ihre Hauptaufgabe in der Betreuung der Modulprojekte, insbesondere darin, die von diesen erarbeiteten Ergebnisse in möglichst einfacher und transparenter Form einem breiten Nutzerkreis verfügbar zu machen und damit die Verbreitung der sich in den vergangenen Jahren entwickelten "neuen OCR-Welt" deutlich zu erhöhen. Die Perspektive der von der DFG lancierten Initiative zur Volltextdigitalisierung der in den VDs verzeichneten Drucke ist die Verfügbarkeit von wissenschaftlich nutzbaren Text- und Strukturdaten in bisher nicht-erreichten Dimensionen. Das hier dargelegte Arbeitsprogramm bildet den nächsten Schritt in Richtung OCR 2.0.
DFG-Verfahren Forschungsdaten und Software (Wiss. Literaturversorgung und Informationssysteme)
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung