Detailseite
Automatic Quality Assessment: NLP-Verfahren zur semantischen Kartierung von Lebenswissenschaftlichen Texten (AQUAS)
Antragsteller
Professor Dr. Konrad Förstner
Fachliche Zuordnung
Datenmanagement, datenintensive Systeme, Informatik-Methoden in der Wirtschaftsinformatik
Förderung
Förderung seit 2022
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 509313233
Das wachsende Aufkommen von bewusst gestreuten Fehlinformationen stellt unsere demokratische Gesellschaft vor eine große Herausforderung. Sie werden zunehmend von politischen Interessensgruppen ausgesät, um den öffentlichen Diskurs zu bestimmen. Von den Rezipienten werden diese Falschinformationen mitunter nicht als solche erkannt. Da sich Desinformationen auch in wissenschaftlichen Informationsangeboten finden, betrifft diese Entwicklung auch Wissenschaftler:innen. In den medizinischen Anwendungen der Lebenswissenschaften (LeWi) kann dies gesundheitsgefährdende Auswirkungen haben.In dem hier vorgestellten Vorhaben AQUAS wird der erste deutschsprachige Datensatz zu Desinformation in den Lebenswissenschaften erstellt. Auf dieser Basis soll mit modernen Machine-Learning-(ML)-Verfahren ein ML-Modell erstellt, das in der Lage sein wird, die semantische Nähe von unbekannten Texten zu den Klassen wissenschaftliche Texte, populärwissenschaftliche Texte und desinformierende Texte graduell einzuordnen. Gleichzeitig werden ergänzende Informationen zur guten wissenschaftlichen Praxis der Publikationen bereitgestellt. Mit der Anreicherung und Veröffentlichung der genannten Informationen (Basisset bzw. erweitertes Set an Merkmalen) strebt AQUAS die Unterstützung der Leser:innen an, eine informierte Einschätzung von Literatur zu treffen. Dabei geht es AQUAS nicht um eine abschließende Leseempfehlung der Inhalte oder Zensur.Auf Grundlage des entwickelten Anreicherungs-Methoden wird im Rahmen von AQUAS ein Dienst implementiert, der über eine Programmierschnittstelle (API - Application Programming Interface) angesprochen werden kann. Als erste zentrale Anwendung werden wir diesen Dienst durch das ZB MED Discovery-System LIVIVO nutzen, um die beschriebene Einstufung der Literatur den Nutzenden von ZB MED zur Verfügung zu stellen. Damit werden zunächst die Wissenschaftler:innen der LeWi und Praktiker:innen in Gesundheitsberufen sowie Studierende von der verbesserten Wissensinfrastruktur bei LIVIVO durch AQUAS profitieren. Der Datensatz, das Modell, der Workflow zum Training sowie die Software zum Betrieb des Dienstes werden nach Möglichkeit offen bereitgestellt und so auch für andere Themenfelder nutzbar gemacht.
DFG-Verfahren
Forschungsdaten und Software (Wiss. Literaturversorgung und Informationssysteme)