Asked and Answered (AA): Intelligente Datenanalyse in Software Projekten
Zusammenfassung der Projektergebnisse
Stakeholder von Softwareentwicklungsprojekten (z.B. Manager, Softwareentwickler, etc.) treffen ihre Entscheidungen "meist aus dem Bauch heraus“. Mögliche Erklärungen dafür sind die begrenzte Zeit, die Stakeholder von Softwareprojekten zur Verfügung haben und die in Software- und Systementwicklungsprojekten wachsende Datenmenge, die die Suche nach bestimmten Informationen zeitaufwändig und schwierig macht. Ziel dieses Projekts war es daher, eine Lösung für die Beantwortung von Fragen bereitzustellen, die es den Beteiligten ermöglicht, schnell und einfach die benötigten Informationen zu finden und so ihre Entscheidungsfindung zu unterstützen. Darüber hinaus kann eine solche Lösung auch der Prozessverbesserung, der Sicherheitsanalyse und einer Vielzahl anderer Softwareentwicklungsaufgaben dienen. Mit diesem Projekt konnten wir Datenmanagement- und Zugriffstechniken auf den speziellen Bereich der Softwareentwicklungsprozesse anwenden. Die gemeinsame Arbeit unserer Forschungsgruppen trug dazu bei, die Forschungsschwerpunkte des jeweils anderen zu verstehen und diese Perspektiven in die Bemühungen zur Erreichung unserer gemeinsamen Forschungsziele zu integrieren. Die folgenden Ergebnisse sind aus dem Projekt hervorgegangen: 1. Konzeptueller Rahmen für die Formulierung von Fragen zu Software-Artefakten: Überblick über den Informationsbedarf von Stakeholdern aus der Softwareentwicklung. 2. Extraktion und semantische Anreicherung von Informationen über Software-Artefakte: • Wissensdatenbanken - OLAP-ähnliche Datenbanken und RDF-Triples - mit Daten, die den Informationsbedarf von Stakeholdern aus dem Software-Engineering-Bereich adressieren. • Identifizierung von Trace-Links in der konstruierten Wissensbasis. • Anreicherung der konstruierten Wissensbasis durch maschinelles Lernen und Techniken zur Informationsbeschaffung. 3. Abfrage und Beantwortung von Fragen: • Literaturübersicht über verschiedene Text-to-SQL-Ansätze • Software-Engineering-Datensatz zum Trainieren von Text-zu-SQL-Ansätzen • Überbearbeiteter Text-zu-SQL-Ansatz • Konstruktion von SQL-Abfragen für den Bereich der Softwaretechnik • Ansatz zur wissensbasisunabhängigen Umwandlung von natürlicher Sprache in SQL und SPARQL • Entscheidungshilfe zur Unterscheidung verschiedener Such-/Antwort-Szenarien auf der Grundlage des entschlüsselten Informationsbedarfs.
Projektbezogene Publikationen (Auswahl)
- From Natural Language Questions to SPARQL Queries: A Pattern-based Approach In: Datenbanksysteme für Business, Technologie und Web (BTW 2019), 18. Fachtagung des GI-Fachbereichs Datenbanken und Informationssysteme (DBIS), March, LNI, 2019, Publisher GI, Rostock, Germany
Nadine Steinmetz, Ann-Katrin Arning, Kai-Uwe Sattler
(Siehe online unter https://doi.org/10.18420/btw2019-18) - Structured information in bug report descriptions - influence on irbased bug localization and developers, Softw. Qual. J. 27 (2019) 1315–1337
M. Rath, P. Mäder
(Siehe online unter https://doi.org/10.1007/s11219-019-09445-6) - The SEOSS 33 dataset — Requirements, bug reports, code history, and trace links for entire projects, Data in Brief, Volume 25, 2019
Michael Rath, Patrick Mäder
(Siehe online unter https://doi.org/10.1016/j.dib.2019.104005) - Traceability in the wild: Automatically augmenting incomplete trace links, in: SE/SWM, volume P-292 of LNI, GI, 2019, p. 63
M. Rath, J. Rendall, J. L. C. Guo, J. Cleland-Huang, P. Mäder
(Siehe online unter https://dx.doi.org/10.18420/se2019-15) - Question Answering on OLAP-like Data Sources Proceedings of the Workshops of the EDBT/ICDT 2020 Joint Conference, CEUR Workshop Proceedings, March, 2020, Copenhagen, Denmark
Nadine Steinmetz, Samar Shahabi-Ghahfarokhi, Kai-Uwe Sattler
- Conversational Question Answering Using a Shift of Context Proceedings of the Workshops of the EDBT/ICDT 2021 Joint Conference, CEUR Workshop Proceedings, March, 2021, Nicosia, Cyprus
Nadine Steinmetz, Bhavya Senthil-Kumar, Kai-Uwe Sattler
(Siehe online unter https://doi.org/10.22032/dbt.51535) - Reaching out for the answer: Answertype prediction In: Proceedings of the SeMantic Answertype prediction task (SMART) at ISWC 2021 Semantic Web Challenge co-located with the 20th International Semantic Web Conference (ISWC 2021). SMART 2021, CEUR-WS (2021), 2021
Kanchan Shivashankar, Khaoula Benmaarouf, Nadine Steinmetz
- What is in the KGQA benchmark datasets? Survey on Challenges in Datasets for Question Answering on Knowledge Graphs Journal on Data Semantics, Springer, 2021
Nadine Steinmetz, Kai-Uwe Sattler
(Siehe online unter https://doi.org/10.1007/s13740-021-00128-9) - SEOSS-Queries - a software engineering dataset for text-to-SQL and question answering tasks, Data in Brief, Volume 42, 2022, 108211, ISSN 2352-3409
M.T. Tomova, M. Hofmann, P. Mäder
(Siehe online unter https://doi.org/10.1016/j.dib.2022.108211)