Project Details
Informetrische Analyse der Verteilungen dokumentspezifischer Tags bei Broad Folksonomies; Nutzung der Ergebnisse beim Information Retrieval
Applicant
Professor Dr. Wolfgang Stock
Subject Area
Security and Dependability, Operating-, Communication- and Distributed Systems
Term
from 2009 to 2012
Project identifier
Deutsche Forschungsgemeinschaft (DFG) - Project number 151041284
Im Information Retrieval geht es um das Auffinden für die Suchanfrage relevanter Ressourcen sowie um das Sortieren der Suchergebnisse nach ihrer Relevanz für die Suchanfrage, um den Nutzer bei der Bewertung der gefundenen Ressourcen zu unterstützen. Bei Folksonomy-basierten Spezialsuchmaschinen, also Ressourcen-spezifischen Suchmaschinen (z.B. für URLs oder Fotos), die mit nutzergenerierten Schlagwörtern (sog. Tags) arbeiten, werden bislang nur selten Tags für die Suche und das Relevance Ranking ausgenutzt. Unsere Vorarbeiten haben ergeben, dass eine Einschränkung der zu durchsuchenden Ressourcenbestände durch eine Konzentration auf die häufigsten Tags (sog. Power Tags) einer Ressourcen-spezifischen Tag-Verteilung zu einem geringeren Recall, aber gleichzeitig auch zu einer gesteigerten Precision der Suchergebnisse führt. Es lässt sich daher vermuten, dass sich Power Tags auch für das Relevance Ranking von Suchtreffern eignen. Unter dem Stichwort „Feature Selection“ wollen wir daher einen Rankingalgorithmus für Folksonomy-basierte Spezialsuchmaschinen erarbeiten und herausfinden, ob sich die Retrievaleffektivität mittels Power Tags verbessert. Als Vergleichsgrundlage sollen auch die durchschnittlich oft genutzten Tags (sog. Luhn Tags) betrachtet und als Feature für das Ranking einbezogen werden. Die Analyse der verschiedenen Ranking- Features (z.B. TF*IDF oder Cosinus) ergibt, welches Feature welche Auswirkungen auf das Ranking hat und welche sich am besten für Folksonomy-basierte Spezialsuchmaschinen eignen.
DFG Programme
Research Grants