Detailseite
Projekt Druckansicht

Vernetzte Open-Source-Software (ConnOSS)

Fachliche Zuordnung Künstliche Intelligenz und Maschinelle Lernverfahren
Softwaretechnik und Programmiersprachen
Förderung Förderung seit 2025
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 561044496
 
Maschinell verwertbare Metadaten für Forschungsartefakte sind der Schlüssel zur Umsetzung der FAIR-Leitprinzipien und tragen zu Best Practices sowie zu erhöhter Qualität und Reproduzierbarkeit bei. Umfragen unter Wissenschaftler*innen, welche Forschungssoftware entwickeln, zeigen, dass die meisten von ihnen an automatisierten Verfahren zur Erstellung eines Überblicks über ihre Software interessiert wären, um die FAIRness zu erhöhen, allerdings ohne, dass sie dafür viel zusätzlichen Aufwand betreiben müssten. In den letzten Jahren wird in der wissenschaftlichen Community viel schema.org eingesetzt, ein kontrolliertes Vokabular, das unter anderem die Beschreibung von Datensätzen, Software und Publikationen erlaubt. Auf schema.org aufbauende Projekte wie Codemeta, Bioschemas und Machine-actionable Software Management Plan zielen darauf ab, die Metadaten von Forschungssoftware zu verbessern. Momentan gibt zwar einige strukturierte Metadaten, z. B. aus der GitHub-API und Zitationsdateien, aber es besteht die Notwendigkeit, die Metadaten-Abdeckung mit Ansätzen des maschinellen Lernens unter Verwendung anderer Quellen zu erweitern (z. B. durch Analyse der jeweiligen README-Datei). Das Projekt Connected Open Source Software (ConnOSS) wird eine GitHub/GitLab-Webseiteninfrastruktur bereitstellen, die die Softwareproduktion von Forschungsgruppen mit konsistenten, harmonisierten und angereicherten maschinenverarbeitbaren Metadaten präsentiert und so die Sichtbarkeit und FAIRness von Forschungssoftware verbessert. ConnOSS zielt darauf ab, die FAIRness von Forschungssoftware zu verbessern, indem es eine GitHub/GitLab-Webseiteninfrastruktur mit konsistenten und harmonisierten angereicherten Metadaten über Gruppen und Organisationsrepositorien hinweg bereitstellt, die es Forscher*innen erleichtert, sich an Best Practices zu orientieren und so die Qualität und Reproduzierbarkeit von Forschungssoftware zu verbessern, und die es Aggregatoren ermöglicht, hochqualitative Metadaten zu sammeln und z.B. Wissensgraphen zu erstellen. ConnOSS wird auf bestehenden Ansätzen aufbauen und ein maschinelles Lernverfahren nutzen, um Metadaten anzureichern. Außerdem wird es Forscher*innen mit Tutorials und entsprechenden Schulungen bei der Einführung unterstützen. Darüber hinaus werden die ConnOSS-Infrastruktur und das Modell des maschinellen Lernens zusammen mit den extrahierten Metadaten den FAIR- und Open-Access-Praktiken entsprechen.
DFG-Verfahren Forschungsdaten und Software (Wiss. Literaturversorgung und Informationssysteme)
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung