Data and Knowledge Processing (DKPro) - Eine Middleware für sprachtechnologische Anwendungen

Antragsteller Professor Dr.-Ing. Torsten Zesch
Fachliche Zuordnung Allgemeine und Vergleichende Sprachwissenschaft, Experimentelle Linguistik, Typologie, Außereuropäische Sprachen
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung Förderung von 2018 bis 2021
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 390886566
 

Projektbeschreibung

DKPro (Data and Knowledge Processing) ist eine Forschungssoftware für die computerlinguistische Sprachverarbeitung. DKPro bildet hierbei ein Bindeglied zwischen Forschungswerkzeugen auf der einen Seite und Anwendern, die diese Werkzeuge nutzen möchten, auf der anderen. DKPro stellt damit einen essentiellen Baustein in der Softwarelandschaft vieler Forscher dar, der am ehesten mit einer Linux Distribution verglichen werden kann, die als ein Integrator für eine Vielzahl von Werkzeugen dient. Ungeachtet der kontinuierlichen Weiterentwicklung von DKPro seit fast 10 Jahren, wird der Großteil der Wartungs- und Entwicklungsarbeiten durch nur wenige Entwickler erbracht. Obwohl erste Schritte in Richtung eines sich selbst-verwaltenden Gemeinschaftsprojekt bereits unternommen wurden, schreitet dieser Prozess nur langsam voran. Die Struktur dieses Antrags ist daher darauf ausgelegt Mittel bereitzustellen um diesen Prozess zu beschleunigen und DKPro in ein selbstständiges, selbst-verwaltendes und nachhaltiges Projekt zu überführen.Die im Antrag vorgesehenen Arbeitspakete zielen sowohl auf eine technische, als auch administrative Weiterentwicklung ab. Zum einen sollen zukunftssichernde, technische Weiterentwicklungen, die mit derzeitigen Mitteln nicht erbracht werden können, umgesetzt werden. Beispielsweise sollen Schnittstellen zu Infrastrukturanbietern wie CLARIN-D oder analytischen Umgebungen wie KNIME oder RapidMiner bereitgestellt werden. Zum anderen soll eine breite Nutzer- und Entwicklergemeinschaft aufgebaut werden, die sich aktiv an DKPro beteiligt und die Pflege und Weiterentwicklung nach Ende der Förderung sicherstellt. Auf der administrativen Seite ist ein zentrales Ziel die Einrichtung eines Vereins, welcher die weitere Entwicklung von DKPro vorantreibt und die Nutzer- und Entwicklergemeinschaft organisiert, aber auch Lehrgänge und Seminare anbietet. Die existierende Gruppe von DKPro-Entwicklern hat die Notwendigkeit von nachhaltiger Forschungssoftware ebenfalls erkannt und ist gern bereit die im Antrag skizzierte Umgestaltung mit zu gestalten. Der Antragsteller und die Kooperationspartner steuern nicht nur wertvolles technisches Wissen bei, sondern besitzen auch nötige Erfahrungen mit den administrativen Aufgaben, sei es als Vorsitzender einer Fachgesellschaft oder als Entwickler in anderen Open-Source Projekten. DKPro hat daher eine exzellente Ausgangssituation für die Umgestaltung zu einem Gemeinschaftsprojekt. Zudem bietet es bereits Arbeitsabläufe für Archivierung, Versionierung, Dokumentation und Nachverfolgung von Programmfehlern. Außerdem erlaubt das Lizenzmodell die akademische und industrielle Nutzung. Die lückenlose Dokumentation aller Projektphasen wird daher als Referenzbeispiel dienen können, wie ähnliche Transformationsprozesse zu nachhaltiger Forschungssoftware ablaufen können.
DFG-Verfahren Forschungsdaten und Software (Wiss. Literaturversorgung und Informationssysteme)