Detailseite
Informetrische Analyse der Verteilungen dokumentspezifischer Tags bei Broad Folksonomies; Nutzung der Ergebnisse beim Information Retrieval
Antragsteller
Professor Dr. Wolfgang Stock
Fachliche Zuordnung
Sicherheit und Verlässlichkeit, Betriebs-, Kommunikations- und verteilte Systeme
Förderung
Förderung von 2009 bis 2012
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 151041284
Im Information Retrieval geht es um das Auffinden für die Suchanfrage relevanter Ressourcen sowie um das Sortieren der Suchergebnisse nach ihrer Relevanz für die Suchanfrage, um den Nutzer bei der Bewertung der gefundenen Ressourcen zu unterstützen. Bei Folksonomy-basierten Spezialsuchmaschinen, also Ressourcen-spezifischen Suchmaschinen (z.B. für URLs oder Fotos), die mit nutzergenerierten Schlagwörtern (sog. Tags) arbeiten, werden bislang nur selten Tags für die Suche und das Relevance Ranking ausgenutzt. Unsere Vorarbeiten haben ergeben, dass eine Einschränkung der zu durchsuchenden Ressourcenbestände durch eine Konzentration auf die häufigsten Tags (sog. Power Tags) einer Ressourcen-spezifischen Tag-Verteilung zu einem geringeren Recall, aber gleichzeitig auch zu einer gesteigerten Precision der Suchergebnisse führt. Es lässt sich daher vermuten, dass sich Power Tags auch für das Relevance Ranking von Suchtreffern eignen. Unter dem Stichwort „Feature Selection“ wollen wir daher einen Rankingalgorithmus für Folksonomy-basierte Spezialsuchmaschinen erarbeiten und herausfinden, ob sich die Retrievaleffektivität mittels Power Tags verbessert. Als Vergleichsgrundlage sollen auch die durchschnittlich oft genutzten Tags (sog. Luhn Tags) betrachtet und als Feature für das Ranking einbezogen werden. Die Analyse der verschiedenen Ranking- Features (z.B. TF*IDF oder Cosinus) ergibt, welches Feature welche Auswirkungen auf das Ranking hat und welche sich am besten für Folksonomy-basierte Spezialsuchmaschinen eignen.
DFG-Verfahren
Sachbeihilfen