Detailseite
Projekt Druckansicht

QASciInf: Automatische Beantwortung von Fragen für wissenschaftliche Informationen

Fachliche Zuordnung Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung Förderung von 2014 bis 2025
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 252295018
 
Erstellungsjahr 2025

Zusammenfassung der Projektergebnisse

Die Anzahl wissenschaftlicher Artikel nimmt exponentiell zu, was es Wissenschaftlern erschwert, mit der neuesten Forschung Schritt zu halten und von allen relevanten Arbeiten zu profitieren. Es müssen neue Technologien entwickelt werden, um Forschern den Zugang zu dem sich rasant erweiternden Wissensbestand zu erleichtern. Natural Language Processing (NLP), einschließlich Information Retrieval (IR), Question Answering (QA)-Systemen und generative Methoden, kann eine entscheidende Rolle bei der Bewältigung dieser Herausforderung sein. Retrieval wird verwendet, um relevante Informationen für nachgelagerte QA-Systeme zu finden, kann jedoch auch direkt eingesetzt werden, z. B. in der Literaturrecherche. QA-Systeme können auf Basis einer Frage effizient Informationen aus einer Publikation extrahieren. Das Verarbeiten von Tabellen ist eine zentrale Fähigkeit jedes Systems, das auf wissenschaftliche Inhalte angewendet wird, und kann in einem generativen Modell genutzt werden, z. B. um Ergebnisse zusammenzufassen. Zum Zeitpunkt der Antragseinreichung gab es jedoch keine Ressourcen zur Evaluierung von Modellen für wissenschaftliche Aufgaben. Im QASciInf-Projekt haben wir daher Datensätze und Benchmarks veröffentlicht, die relevante Aufgaben definierten und eine systematische Evaluierung von Modellen ermöglichen. Wir haben einen Zero-Shot-Benchmark für Retrieval vorgestellt, um Systeme in Domänen zu evaluieren, in denen sie nicht trainiert wurden (z. B. in wissenschaftlichen Domänen mit wenig Trainingsdaten). 2024 haben wir einen kontextbewussten Retrieval-Benchmark vorgeschlagen, um zu messen, wie gut ein System lange Kontexte, wie wissenschaftliche Publikationen, berücksichtigen kann. Ferner haben wir einen Dialog-Datensatz über Publikationen eingeführt, und 2025 haben wir einen QA-Datensatz mit Experten-Fragen und Antworten über wissenschaftliche Artikel veröffentlicht. Außerdem haben wir einen Table-to-Text-Datensatz über wissenschaftliche Tabellen und deren Beschreibungen vorgestellt. Diese Datensätze und Benchmarks ermöglichen zusammen eine umfassende Evaluierung von NLP-Methoden im wissenschaftlichen Bereich. Darüber hinaus haben wir Methoden entwickelt, die Wissenschaftler bei diesen Aufgaben unterstützen. Dazu haben wir eine Few-Shot Information Retrieval-Aufgabe eingeführt und eine Methode vorgeschlagen, bei der ein System aus wenigen Nutzerdemonstrationen verfeinerte Query-Repräsentationen lernt, was für die Literaturrecherche nützlich ist. Wir haben Baselines evaluiert, um den Dokumentkontext bei der Repräsentation eines einzelnen Abschnitts zu berücksichtigen, was das Retrieval in wissenschaftlichen QA-Szenarien verbessert.Schließlich haben wir eine Pre-Training-Methode vorgestellt, die die numerischen Fähigkeiten von Großen Sprachmodellen (LLMs) verbessert und dadurch Table-to-Text-Generierungsaufgaben optimiert. Abschließend haben wir QA-Systeme in Zusammenarbeit mit dem DFG-geförderten UKP-SQuARE-Projekt evaluiert. Wir haben einen öffentlichen Demonstrator entwickelt, der verschiedene Korpuse und QA-Modelle umfasst und es Nutzern ermöglicht, Methoden zusammenzustellen und zu analysieren.

Projektbezogene Publikationen (Auswahl)

 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung