Detailseite
OLA-HD Service - Ein generischer Dienst für die Langzeitarchivierung historischer Drucke
Antragsteller
Zeki Mustafa Dogan, seit 1/2024; Professor Dr. Ramin Yahyapour
Fachliche Zuordnung
Datenmanagement, datenintensive Systeme, Informatik-Methoden in der Wirtschaftsinformatik
Förderung
Förderung seit 2021
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 460652320
Das primäre Ziel dieses Vorhabens ist die Entwicklung eines produktiven Dienstes für die Langzeitarchivierung von historischen Drucken im Rahmen von OCR-D. Dieser OLA-HD Service genannte Dienst baut auf einem Prototyp des OLA-HD Vorhabens aus der vorherigen, zweiten OCR-D Förderphase auf und realisiert ein produktives Langzeitarchiv zur Integration in OCR-D Workflows. Die Anforderungen an den OLA-HD Service wurden während einer Pilotierungsphase anhand der Bedarfe einzelner, an OCR-D beteiligter Institutionen, erhoben. Darauf aufbauend wird der funktionale Umfang des OLA-HD Service spezifiziert, wobei die generische Verwendungsmöglichkeit des resultierenden Dienstes besonders im Fokus steht. Dies ermöglicht neben der direkten Integration des Dienstes in die Arbeitsabläufe des OCR-D-Frameworks dessen Verwendung auch in möglichst vielen anderen Digitalisierungsvorhaben.Basierend auf den erhobenen Anforderungen implementiert das Vorhaben insbesondere Ziele, die die Bedarfe der Community abbilden und den produktiven Einsatz des Dienstes ermöglichen. Dazu zählen unter anderem optimale Usability, die Erweiterung und Optimierung der Such- und Filterfunktion des OLA-HD Prototypen, Speichermöglichkeiten für Zwischenergebnisse des OCR-Workflows, eine vollumfängliche API für den programmatischen Zugriff auf das Archiv (u.a. für Präsentationssystem) und die einfache Integrationsmöglichkeit in die OCR-Prozessierung. Zudem wird der technische Dienst von Rahmenwerken und Best Practices flankiert, die es Betreibern eines OCR-D Langzeitarchives erlauben, die notwendigen organisatorischen Maßnahmen umzusetzen. Dazu gehören u.a. ein generisches Datenschutzkonzept und die Dokumentation, welche für eine Zertifizierung gemäß CoreTrustSeal benötigt werden.Das Vorhaben wird sich nicht zuletzt eng mit dem OCR-D Koordinierungsgremium und den weiteren Vorhaben der dritten Förderphase abstimmen und die entsprechenden Anforderungen und Vorgaben, welche für die Integration in Community-Workflows und das OCR-D Framework definiert werden, umsetzen.
DFG-Verfahren
Forschungsdaten und Software (Wiss. Literaturversorgung und Informationssysteme)
Mitverantwortlich
Professor Dr. Philipp Wieder
Ehemaliger Antragsteller
Professor Dr. Wolfram Horstmann, bis 12/2023