Project Details
Projekt Print View

Informetrische Analyse der Verteilungen dokumentspezifischer Tags bei Broad Folksonomies; Nutzung der Ergebnisse beim Information Retrieval

Subject Area Security and Dependability, Operating-, Communication- and Distributed Systems
Term from 2009 to 2012
Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 151041284
 
Final Report Year 2012

Final Report Abstract

Das beendete Forschungsprojekt trug zu folgenden Aspekten der wissenschaftlichen Auseinandersetzung mit Folksonomies und Tagging-Systemen im Information Retrieval bei: • Es wurde gezeigt, dass die häufigsten für eine Ressource vergebenen Tags als relevanteste Beschreibung der Ressource eingeschätzt wurden. • Es wurde der T-Index eingeführt, der das Verhältnis zwischen Unique Tags und insgesamt vergebenen Tags für eine Ressource widerspiegelt und als Indikator für die Stabilität einer Tag-Verteilung eingesetzt werden kann. • Tag-Verteilungen unterscheiden sich immens in ihrer Form (Power Law vs. invers-logistische Verteilung). Besonders der Anfang der Tag-Verteilung spielt bei der Bestimmung des Verteilungstyps eine Rolle. Darüber hinaus ist die Anzahl der Power-Tags von der Art der Tag-Verteilung abhängig. • Power-Tags und Luhn-Tags lassen sich eindeutig auf Basis der zugrundeliegenden Tag-Verteilung voneinander abgrenzen. Im Information Retrieval führen sie außerdem zu unterschiedlichen Treffermengen: Die Power-Tags eignen sich insbesondere bei kurzen Suchanfragen und erhöhen die Precision der Suchergebnisse, während die Luhn-Hypothese bei Tags nicht bestätigt werden kann. Längere Suchanfragen profitieren von einer Kombination aus Luhn- und Power-Tags und erhöhen die Precision der Suchergebnisse. • Es zeigte sich, dass eine linguistische Bearbeitung der Tags lediglich zu minimalen Recallsteigerungen, aber zu keiner Verbesserung der Precision führt. • Ein Ranking der Suchergebnisse basierend auf der relativen Termhäufigkeit der Tags ist in der Lage, bei kurzen Suchanfragen viele relevante Treffer auf die vorderen Plätze des Rankings zu bringen. Jedoch übersteigt die Average Precision dieser Suchanfragen nicht die Precision der auf Power-Tags eingeschränkten Suchen. • Für den praktischen Einsatz dieser Retrievaltestergebnisse lässt sich daher schlussfolgern, dass beide Suchmodi zufriedenstellende Recall- und Precisionwerte erreichen, doch die Suche in Power-Tags weniger Rechenaufwand benötigt und kleinere Treffermengen erzielt. Beide Aspekte könnten von Nutzern positiv wahrgenommen werden.

Publications

 
 

Additional Information

Textvergrößerung und Kontrastanpassung