Detailseite
Eine minimale Infrastruktur für die nachhaltige Bereitstellung erweiterbarer Mehrebenenannotationssoftware für linguistische Korpora
Antragstellerinnen / Antragsteller
Professor Dr. Volker Gast; Professorin Dr. Anke Lüdeling
Fachliche Zuordnung
Allgemeine und Vergleichende Sprachwissenschaft, Experimentelle Linguistik, Typologie, Außereuropäische Sprachen
Sicherheit und Verlässlichkeit, Betriebs-, Kommunikations- und verteilte Systeme
Softwaretechnik und Programmiersprachen
Sicherheit und Verlässlichkeit, Betriebs-, Kommunikations- und verteilte Systeme
Softwaretechnik und Programmiersprachen
Förderung
Förderung von 2018 bis 2022
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 391160252
Ziel des Projekts sind Entwurf, Implementierung, Evaluation und Dokumentation einer minimalen Infrastruktur für die nachhaltige Bereitstellung von Forschungssoftware. Hypothetisch kann eine Infrastruktur im akademischen Kontext nur dann nachhaltig betrieben werden, wenn die von der entsprechenden akademischen Institution dafür bereitzustellenden Mittel für technische Ressourcen und Personal von vornherein langfristig minimiert sind. Am Beispiel der Bereitstellung von Mehrebenenannotationssoftware für linguistische Korpora zeigt das Projekt, dass für eine solche Infrastruktur lediglich vier Komponenten essentiell sind: eine Repositorienplattform für Quellcode; ein Repositorium für die Bereitstellung von Versionen der Software für den Endbenutzer; ein Repositorium für die Bereitstellung von Abhängigkeiten der Software (Softwarebibliotheken); ein Maintainer, der Infrastruktur und bereitgestellte Software pflegt und veröffentlicht und die Benutzer- und Entwicklercommunity organisiert. Lediglich der Maintainer muss durch die wissenschaftliche Institution finanziert werden, für alle anderen Komponenten steht potenziell nachhaltige, kostenfreie externe Infrastruktur bereit. Weitere Voraussetzung für das nachhaltige Bestehen der im Projekt entwickelten Infrastruktur ist die technische Nachhaltigkeit der bereitgestellten Software. Im Rahmen des Projekts wird der Prototyp "GraphAnno" zur Produktionsreife weiterentwickelt. Das resultierende Produkt "Hexatomic" hat durch Erfüllung eines hohen Bedarfs seitens der wissenschaftlichen Community ein großes, nachgewiesenes Nutzungspotenzial in einer Vielzahl linguistischer Disziplinen. "Hexatomic" wird außerdem bereits frühzeitig während der Projektlaufzeit die Voraussetzung der technischen Nachhaltigkeit erfüllen durch die Umsetzung bewährter Methoden der Softwaretechnik, wie z.B. reproduzierbare Builds durch ein automatisiertes Buildsystem, umfassende Dokumentation aller Implementierungsaspekte, eine liberale Open Source-Lizenz, Portabilität und Lauffähigkeit auf verschiedenen Betriebssystemen, umfassende Testsuiten, öffentliche Bereitstellung des Quellcodes, Erweiterbarkeit und Anpassbarkeit durch Modularität und ein generisches Datenmodell, weitreichende Kompatibilität mit anderer Software und Datenstandards sowie strukturierte Communityprozesse. Nicht nur das Entfalten des Nutzungspotenzials von "Hexatomic", auch das Potenzial für langfristige, projektunabhängige Weiterentwicklung wird im Projekt evaluiert und dokumentiert, unter anderem durch Akquise externer Kontribution von funktionalen Modulen. Ebenso wird das minimale Infrastrukturmodell nicht nur konkret implementiert. Seine Implementierung wird vielmehr dokumentiert, getestet, die Testergebnisse wiederum dokumentiert und zu Best Practices verdichtet, die ein wesentliches Projektziel ausmachen. Insgesamt stellt das Projekt einen wichtigen Beitrag zur Evaluation von Mindestvoraussetzungen nachhaltiger Infrastrukturen für wissenschaftliche Software dar.
DFG-Verfahren
Forschungsdaten und Software (Wiss. Literaturversorgung und Informationssysteme)