Detailseite
Erkennung, Verlinkung und Zusammenfassung von Variablen (VADIS)
Antragsteller
Professor Dr. Kai Eckert; Privatdozent Dr. Henning Kroll; Professor Dr. Simone Paolo Ponzetto; Dr. Benjamin Zapilko
Fachliche Zuordnung
Empirische Sozialforschung
Förderung
Förderung seit 2021
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 448491925
In vielen wissenschaftlichen Disziplinen lässt sich zurzeit ein wachsender Trend zur Unterstützung von Forschern durch einen verbesserten Informationszugang über die Verknüpfung von Veröffentlichungen und zugrunde liegender Forschungsdaten beobachten. Open Science unterstützt Aktivitäten zur Verknüpfung und Kontextualisierung von Forschungsdaten, um Reproduzierbarkeit und Wiederverwendbarkeit von Forschungsergebnissen zu verbessern. Publikationen, die über ein Ergebnis einer empirischen Studie berichten, sollten eine direkte Verlinkung zum zitierten Datensatz enthalten und somit direkt zu den zugrunde liegenden Forschungsdaten führen. Für die Umsetzung fehlt es häufig an Standards für die Referenzierung zwischen Publikation und den zitierten Daten und ihren Variablen. Eine von GESIS durchgeführte Nutzerstudie zeigt, dass Forscher von einer stärkeren Verknüpfung und semantischer Annotation wissenschaftlicher Publikationen profitieren würden. Außerdem mangelt es Datenzitationen an Informationen auf der richtigen granularen Ebene der zitierten Daten z.B. zu verwendeten Variablen, womit (Teil-)Daten identifiziert und verifiziert werden könnten, die tatsächlich für eine spezifische Hypothese relevant sind. Die Verbesserung des Zugangs zu wissenschaftlichen Publikationen nach den FAIR-Prinzipien erfordert auch die semantische Indexierung von Texten mit aussagekräftigen Entitäten und einzelnen Variablen, die den Schwerpunkt einer Studie bilden. Diese Anforderungen werden derzeit selten erfüllt.Ziel von VADIS ist, Variablen im Kontext zu suchen und zu nutzen, um dadurch die Reproduzierbarkeit von Forschungsergebnissen zu erhöhen. Durch die Kombination von Text-Mining und Semantic-Web-Technologien soll erreicht werden, dass die Verknüpfungen zwischen Publikationen, ihren Themen und den spezifischen Variablen, die in den Umfragen enthalten sind, identifiziert und genutzt werden können. Die semantischen Verknüpfungen in wissenschaftlichen Texten bilden die Grundlage für die Entwicklung von Anwendungen, die den Nutzern einen besseren Zugang zu wissenschaftlicher Literatur wie Abschnittssuche, Zusammenfassung und Information Retrieval ermöglichen.Um dies zu erreichen, werden Variablen analysiert und verlinkt, indem ihre Referenzierung in Volltexten identifiziert wird, für die Generierung semantischer Links genutzt wird sowie die Resultate als Linked Open Data veröffentlicht werden. Wir entwickeln datengetriebene Profile von Umfragevariablen, die auf kontextunabhängigen und kontextabhängigen Metriken basieren. Durch die Nutzung von Variablenreferenzen, entwickelter Metriken sowie Textzusammenfassungen kann der Zugriff auf Forschungsdaten und Literatur verbessert werden. Die Projektergebnisse werden nahtlos in bestehende Infrastrukturen integriert. Um die Effektivität unseres Frameworks zu messen, werden mehrere Use Cases in einem Prototyp für die Suche und Exploration umgesetzt. Die Verbesserung des Zugangs wird abschließend in einer Nutzerstudie untersucht.
DFG-Verfahren
Forschungsdaten und Software (Wiss. Literaturversorgung und Informationssysteme)