Detailseite
Projekt Druckansicht

ODEM: OCR-D Erweiterung für Massendigitalisierung

Antragstellerin Anke Berghaus-Sprengel
Förderung Förderung von 2021 bis 2024
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 460554747
 
Die Universitäts- und Landesbibliothek Sachsen-Anhalt ist bereits seit vielen Jahren Partner in der Digitalisierung von VD18-Beständen. Dieses Projekt stellt die nächste Weiterentwicklung dieses Bestandsaufbaus dar, in dem die 6,13 Millionen Seiten mittels der in den OCR-D Projektphasen entwickelten Tools um Volltexte angereichert werden.Die Datenmenge und große Diversität der Bestände zeigen bereits, dass es sich bei diesem Projekt um eine Implementierung unter Realbedingungen handelt: In der Massendigitalisierung gibt es eine Vielzahl von auftretenden Sprachen und individuellen Besonderheiten bei Publikationen, die nun mithilfe der OCR-D-Tools, die zu diesem Zweck weiterentwickelt und ergänzt werden, um Volltext ergänzt und so besser nutzbar gemacht werden sollen. Da es sich um bereits digitalisierte Bestände handelt, ist insbesondere die Aktualisierung und Anpassung der Metadaten sowie die Weiternutzung vorhandener Informationen, wie etwa der Strukturierung, für die neu erstellten Ausgabeformate ein zentraler Aspekt dieses Projekts.
DFG-Verfahren Forschungsdaten und Software (Wiss. Literaturversorgung und Informationssysteme)
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung