Detailseite
Projekt Druckansicht

Etablierung von kontextuellem Datensatz-Retrieval - Transfer von Konzepten aus dem Dokument-Retrieval in das Datensatz-Retrieval (ConDATA)

Fachliche Zuordnung Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung Förderung von 2018 bis 2022
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 410845317
 
Die Anzahl der verfügbaren Datensätze ist in den letzten Jahren deutlich angestiegen. Das hat bei den Wissenschaftlern zu dem Bedürfnis nach Suchmöglichkeiten geführt, die die Nutzerinteressen und Informationsbedürfnisse effektiv unterstützen. Eine aktuelle Herausforderung im Bereich des Datensatz-Retrievals ist es den Zugang, die Wiederverwendung und die Reproduzierbarkeit bestehender Datensätze für Wissenschaftler sicherzustellen. Insbesondere Wissenschaftler müssen Datensätze zielgenau finden können, um ihre Forschungsarbeiten zu testen und ihre vorläufigen Ergebnisse validieren zu können. Um die Nutzer in der Erfüllung ihrer Informationsbedürfnisse zu unterstützen, zielen Suchsysteme darauf ab, Informationen über die Nutzerinteressen zu sammeln, um die Suchergebnisse entsprechend anzupassen. In diesem Projekt konzentrieren wir uns darauf, den Kontext eines aktuellen Nutzers in Form von eingegebenen Suchanfragen und Reformulierungen sowie gesehener Datensätze einzubeziehen, um auf Basis dessen Kontextualisierungsverfahren zu entwickeln, die entsprechend dem Informationsbedürfnis der Nutzer relevante Datensätze liefern. Um dieses Ziel zu erreichen, entwickelt das Projekt eine fünfstufige Methodologie: 1) Beobachtung des Informationsverhaltens von Nutzern beim Datensatz-Retrieval, 2) Untersuchung bestehender Datensatz-Repräsentationsformate und Vorschlag einer angereicherten Repräsentation, 3) Entwicklung eines kontextsensitiven Modellierungsansatzes für Nutzerprofile, 4) Aufbau eines kontextuellen Datensatz-Retrievalsystems, das unterschiedliche Kontextualisierungsansätze implementiert und 5) Evaluierung der unterschiedlichen Implementationen in einem echten (real-life) Suchsystem. Dieser Entwicklungsprozess wird in ein integriertes Datensatz-Retrievalsystem münden, das die Fortschritte des Dokument-Retrievals übernimmt und diese in den neuen Bereich des Datensatz-Retrievals überführt. Dies erfordert eine Analyse zu welchem Ausmaß Kontextualisierungsverfahren (wie z.B. User profiling, Inhaltsähnlichkeit, Verhaltensähnlichkeit, Popularität, etc.) in das Datensatz-Retrieval überführt werden können. Nachdem geeignete Kontextualisierungsverfahren für die Datensatzsuche in ConDATA identifiziert werden konnten, werden diese in das Suchportal GESIS Suche integriert, um unterschiedliche Kontextualisierungskonzepte zu vergleichen und daraufhin gut funktionierende Verfahren zu empfehlen. Zudem sollten alle Kontextualisierungsverfahren in verschiedenen Forschungsgebieten der Sozial- und Wirtschaftswissenschaften mit ähnlichen Datensatztypen anwendbar sein.Der Hauptbeitrag des Projekts besteht darin, eine Implementierung und Empfehlung erfolgreicher Techniken, Ansätze, Konzepte sowie Umsetzungen eines kontextuellen Datensatz-Retrievalsystems zu liefern. Die Kontextualisierung wird anhand von state-of-the-art Methoden des Information Retrieval umgesetzt, was die Reproduzierbarkeit durch andere Forscher erleichtert.
DFG-Verfahren Forschungsdaten und Software (Wiss. Literaturversorgung und Informationssysteme)
Mitverantwortlich(e) Ameni Kacem Sahraoui, Ph.D.
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung