Informetrische Analyse der Verteilungen dokumentspezifischer Tags bei Broad Folksonomies; Nutzung der Ergebnisse beim Information Retrieval
Zusammenfassung der Projektergebnisse
Das beendete Forschungsprojekt trug zu folgenden Aspekten der wissenschaftlichen Auseinandersetzung mit Folksonomies und Tagging-Systemen im Information Retrieval bei: • Es wurde gezeigt, dass die häufigsten für eine Ressource vergebenen Tags als relevanteste Beschreibung der Ressource eingeschätzt wurden. • Es wurde der T-Index eingeführt, der das Verhältnis zwischen Unique Tags und insgesamt vergebenen Tags für eine Ressource widerspiegelt und als Indikator für die Stabilität einer Tag-Verteilung eingesetzt werden kann. • Tag-Verteilungen unterscheiden sich immens in ihrer Form (Power Law vs. invers-logistische Verteilung). Besonders der Anfang der Tag-Verteilung spielt bei der Bestimmung des Verteilungstyps eine Rolle. Darüber hinaus ist die Anzahl der Power-Tags von der Art der Tag-Verteilung abhängig. • Power-Tags und Luhn-Tags lassen sich eindeutig auf Basis der zugrundeliegenden Tag-Verteilung voneinander abgrenzen. Im Information Retrieval führen sie außerdem zu unterschiedlichen Treffermengen: Die Power-Tags eignen sich insbesondere bei kurzen Suchanfragen und erhöhen die Precision der Suchergebnisse, während die Luhn-Hypothese bei Tags nicht bestätigt werden kann. Längere Suchanfragen profitieren von einer Kombination aus Luhn- und Power-Tags und erhöhen die Precision der Suchergebnisse. • Es zeigte sich, dass eine linguistische Bearbeitung der Tags lediglich zu minimalen Recallsteigerungen, aber zu keiner Verbesserung der Precision führt. • Ein Ranking der Suchergebnisse basierend auf der relativen Termhäufigkeit der Tags ist in der Lage, bei kurzen Suchanfragen viele relevante Treffer auf die vorderen Plätze des Rankings zu bringen. Jedoch übersteigt die Average Precision dieser Suchanfragen nicht die Precision der auf Power-Tags eingeschränkten Suchen. • Für den praktischen Einsatz dieser Retrievaltestergebnisse lässt sich daher schlussfolgern, dass beide Suchmodi zufriedenstellende Recall- und Precisionwerte erreichen, doch die Suche in Power-Tags weniger Rechenaufwand benötigt und kleinere Treffermengen erzielt. Beide Aspekte könnten von Nutzern positiv wahrgenommen werden.
Projektbezogene Publikationen (Auswahl)
- (2011). Der T-Index als Stabilitätsindikator für dokument-spezifische Tag-Verteilungen. In J. Griesbaum, T. Mandl, & C. Womser-Hacker (Eds.), Information und Wissen: global, sozial und frei? Proceedings des 12. Internationalen Symposiums für Informationswissenschaft, Hildesheim, Germany (pp. 123-133). Boizenburg: Hülsbusch
Terliesner, J., & Peters, I.
- (2011). Folksonomies, Social Tagging and Information Retrieval. In A. Foster & P. Rafferty (Eds.), Innovations in IR. Perspectives for Theory and Practice (pp. 85-116). London: Facet
Peters, I.
- (2011). Power-Tags as Tools for Social Knowledge Organization Systems. In W. Gaul, A. Geyer-Schulz, L. Schmidt-Thieme, & J. Kunze (Eds.), Challenges at the Interface of Data Analysis, Computer Science, and Optimization. Proceedings of 34th Annual Conference of the Gesellschaft für Klassifikation, Karlsruhe, Germany (pp. 281-290). Berlin, Heidelberg: Springer
Peters, I.
(Siehe online unter https://doi.org/10.1007/978-3-642-24466-7_29) - (2011). Retrieval Effectiveness of Tagging Systems. In Proceedings of the 74th Annual Meeting of the American Society for Information Science and Technology, New Orleans, Louisiana, USA
Peters, I., Schumann, L., Terliesner, J., & Stock, W. G.
(Siehe online unter https://doi.org/10.1002/meet.2011.14504801338)