Detailseite
Workflow Digitale Medien II: Kooperative Dateninfrastrukturen für KI und TDM
Antragsteller
Professor Dr.-Ing. Bela Gipp; Professor Dr. Thomas Stäcker
Förderung
Förderung seit 2026
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 576318340
Anknüpfend an das Projekt Workflow Digitale Medien (WDM) entwickeln die SUB Göttingen und ULB Darmstadt im Vorhaben “Workflow Digitale Medien II: Kooperative Dateninfrastrukturen für KI und TDM” (WDM-II) ein technisches System, in dem eine Community aus Infrastruktureinrichtungen arbeitsteilig Literatur harvesten, aufbereiten und in einem einheitlich strukturierten XML-Format Forschenden für TDM (Text- und Data-Mining) Analysen zur Verfügung stellen kann. Dabei handelt es sich um ein Format für Volltexte und Metadaten, das im WDM-Projekt auf der Grundlage der Text Encoding Initiative (TEI) entwickelt wurde und das sowohl die Bedarfe von Forschenden als auch von Infrastruktureinrichtungen erfüllt. Konkret ist die Etablierung eines webbasierten Bereitstellungssystems ("WDM-Hub") geplant, in das alle Einrichtungen die von ihnen geharvestete und ins TEI-Format konvertierte Literatur, idealerweise inklusive aller zugehörigen Bild- und Supplementary-Information-Dateien, einspielen können. Forschende können die Dateien anschließend sowohl über Schnittstellen als auch eine grafische Benutzeroberfläche abrufen. Während sich das WDM-Projekt auf Open-Access-Literatur beschränkt hat, wird der Fokus nun auch auf lizenzbewehrte Literatur erweitert. Dazu soll geprüft werden, ob und wie ein Rechte- und Rollenmanagementsystem etabliert werden kann, dass, je nach Zustimmung des Verlags, eine Bereitstellung der Literatur nur für berechtigte Nutzende der betreffenden Einrichtung ermöglicht. Um dies realisieren zu können, werden entsprechende Agreements mit den betroffenen Verlagen angestrebt. Die im Projekt gesammelten Erfahrungen sollen in die Erstellung einer öffentlich zugänglichen Handreichung einfließen. Parallel zu den technischen Entwicklungen soll eine Community aus interessierten Infrastruktureinrichtungen aufgebaut werden, die sich arbeitsteilig in das Sammlungsvorhaben einbringen. Um Nutzenden einfachen Zugang zu den über das Projekt bereitgestellten Inhalten zu ermöglichen, soll in der Elektronischen Zeitschriftenbibliothek (EZB) eine Kennzeichnung etabliert werden, die sofort erkennen lässt, dass die jeweilige Zeitschrift in einem für TDM geeigneten Format zur Verfügung steht. Dieses Vorhaben ist als erste von zwei Phasen gedacht, die auf den Entwicklungen des WDM-Projekts aufbauen. Es ist geplant, nach den drei Förderjahren in einem neuen Projekt die entwickelten Systeme zu konsolidieren und die Vernetzung innerhalb der Community weiter zu intensivieren.
DFG-Verfahren
Forschungsdaten und Software (Wiss. Literaturversorgung und Informationssysteme)
