Pragmatik und Semantik in kollaborativen Tagging-Systemen II
Zusammenfassung der Projektergebnisse
Im abgeschlossenen Projekt PoSTS II wurden die Ideen aus dem Vorgängerprojekt PoSTS I aufgegriffen und erweitert. Ziel des Projektes war die Erforschung von Lernmethoden zur Extraktion von semantischen Beziehungen aus Navigationsdaten kombiniert mit Erkenntnissen aus der Analyse und Modellierung von Navigation in Tagging- und Wiki-Systemen. In diesem Projekt konnten folgende zentrale Ergebnisse erzielt werden: Mithilfe der erforschten Metric-Learning-Methoden konnten wir den RRL-Algorithmus vorstellen, mit dem es möglich ist, Maße für semantische Relationen zu lernen, um so auf spezielle Domänen angepasste Semantik besser erfassen zu können. Ebenso konnten wir ein Modell aufbauend auf Markov Chains entwickeln, mit dem man die Markov-Ordnung von Navigationsdaten effizient bestimmen kann. Diese Analyse mündete in der Entwicklung des Frameworks Hyptrails zur Analyse von Navigation (erhielt den Best Paper Award auf der A*-Konferenz WWW2015). Das Hyptrails-Framework findet bereits breite Anwendung, um sowohl Web-Navigation als auch menschliche, real-world Navigation zu analysieren. Mithilfe des Frameworks konnte gezeigt werden, dass Navigationsdaten in Tagging- sowie in Wiki-Systemen wertvolle semantische Information enthalten. Ebenso konnten wir zeigen, dass sich Navigationsdaten ebenso wie Taggingdaten gut zum Semantiklernen eignen, da mit beiden signifikante Verbesserungen in der Korrelation mit menschlichem Ähnlichkeitsempfinden erzielt werden konnten. Obwohl im Antrag geplant wurde, Navigation und Semantik speziell auf Taggingsystemen zu betrachten, konnten wir die im Projekt entwickelten Navigationsmodelle und Lernalgorithmen sogar allgemein formulieren. Dies bedeutet, dass man Navigationsdaten aller Art (z.B. auch Taxifahrten in New York) modellieren sowie Semantik unabhängig von ihrer Quelle (d.h. nicht zwingend aus Taggingsystemen, sondern auch aus Wikipedia oder Knowledge-Graphen wie ConceptNet) lernen kann. Unsere Ergebnisse lassen sich also - anders als im ursprünglichen Antrag geplant - in einem viel breiteren Setting anwenden.
Projektbezogene Publikationen (Auswahl)
- Detecting Memory and Structure in Human Navigation Patterns Using Markov Chain Models of Varying Order. In: PLOS ONE 9.7 (Juli 2014), S. 1–21
Philipp Singer, Denis Helic, Behnam Taraghi und Markus Strohmaier
(Siehe online unter https://doi.org/10.1371/journal.pone.0102070) - Extracting Semantics from Unconstrained Navigation on Wikipedia. In: Künstliche Intelligenz (2015). Hrsg. von Birte Glimm und Heiner Stuckenschmidt, S. 1–6
Thomas Niebler, Daniel Schlör, Martin Becker und Andreas Hotho
(Siehe online unter https://doi.org/10.1007/s13218-015-0417-5) - HypTrails: A Bayesian Approach for Comparing Hypotheses About Human Trails on the Web. In: Proceedings of the 24th International Conference on World Wide Web. WWW ’15. Florence, Italy: ACM, 2015, S. 1003–1013
Philipp Singer, Denis Helic, Andreas Hotho und Markus Strohmaier
(Siehe online unter https://dx.doi.org/10.1145/2736277.2741080) - Extracting Semantics from Random Walks on Wikipedia: Comparing learning and counting methods. In: Wiki Workshop@ICWSM. Hrsg. von Robert West, Leila Zia, Dario Taraborelli und Jure Leskovec. 2016
Alexander Dallmann, Thomas Niebler, Florian Lemmerich und Andreas Hotho
- FolkTrails: Interpreting Navigation Behavior in a Social Tagging System. In: Proceedings of the 25th ACM International on Conference on Information and Knowledge Management. CIKM ’16. New York, NY, USA: ACM, 2016
Thomas Niebler, Martin Becker, Daniel Zoller, Stephan Doerfel und Andreas Hotho
(Siehe online unter https://dx.doi.org/10.1145/2983323.2983686) - Mining Subgroups with Exceptional Transition Behavior. In: KDD. Hrsg. von Balaji Krishnapuram, Mohak Shah, Alexander J. Smola, Charu Aggarwal, Dou Shen und Rajeev Rastogi. ACM, 2016, S. 965–974
Florian Lemmerich, Martin Becker, Philipp Singer, Denis Helic, Andreas Hotho und Markus Strohmaier
(Siehe online unter https://dx.doi.org/10.1145/2939672.2939752) - SparkTrails: A MapReduce Implementation of HypTrails for Comparing Hypotheses About Human Trails. In: WWW (Companion Volume). Hrsg. von Jacqueline Bourdeau, Jim Hendler, Roger Nkambou, Ian Horrocks und Ben Y. Zhao. ACM, 2016, S. 17–18
Martin Becker, Hauke Mewes, Andreas Hotho, Dimitar Dimitrov, Florian Lemmerich und Markus Strohmaier
(Siehe online unter https://dx.doi.org/10.1145/2872518.2889380) - What Users Actually do in a Social Tagging System: A Study of User Behavior in BibSonomy. In: ACM Transactions on the Web 10.2 (2016), 14:1–14:32
Stephan Doerfel, Daniel Zoller, Philipp Singer, Thomas Niebler, Andreas Hotho und Markus Strohmaier
(Siehe online unter https://doi.org/10.1145/2896821) - Learning Semantic Relatedness from Human Feedback Using Relative Relatedness Learning. In: Proceedings of the ISWC 2017 Posters & Demonstrations and Industry Tracks co-located with 16th International Semantic Web Conference (ISWC 2017), Vienna, Austria, October 23rd - to - 25th, 2017. 2017
Thomas Niebler, Martin Becker, Christian Pölitz und Andreas Hotho
- MixedTrails: Bayesian hypothesis comparison on heterogeneous sequential data. In: Data Mining and Knowledge Discovery 31.5 (Sep. 2017), S. 1359–1390
Martin Becker, Florian Lemmerich, Philipp Singer, Markus Strohmaier und Andreas Hotho
(Siehe online unter https://doi.org/10.1007/s10618-017-0518-x)