Detailseite
Projekt Druckansicht

Semantische Clusteranalyse im Information Retrieval

Fachliche Zuordnung Sicherheit und Verlässlichkeit, Betriebs-, Kommunikations- und verteilte Systeme
Förderung Förderung von 2009 bis 2016
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 91548218
 
Der Fortsetzungsantrag behandelt, wie der Erstantrag, Forschungsfragen der Clusteranalyse im Information Retrieval (IR). Ausgangspunkt des Erstantrags ist die Beobachtung, dass das Optimierungs- und Anpassungspotenzial der Clusteranalyse im IR wenig erforscht ist und für relevante Retrievalprobleme oft nicht ausgeschöpft wird. Um diese Lücke zu schließen, wurden im Rahmen des Erstantrags unter dem Stichwort "semantische Clusteranalyse" u.a. theoretische Grundlagen einer Clusteranalyse im IR geschaffen (Vorbild: das probabilistisches Retrievalmodell), spezialisierte Retrievalmodelle erforscht (Basis: Modelle für Indexing und Repräsentation), neue Strategien und Algorithmen für Web-Anwendungen entwickelt sowie entsprechende Nutzerstudien durchgeführt. Während der Erstantrag durch Retrievalmodelle, Domänenwissen und der kombinierten Anwendung von Fusionierungsprinzipien den Schwerpunkt auf die Einbringung von Semantik in den Clusteringprozess legt, fokussiert der Fortsetzungsantrag darauf, möglichst viel Semantik aus einem durchgeführten Clusteringprozess heraus zu bekommen. Neben der Weiterentwicklung theoretischer Grundlagen behandelt der Fortsetzungsantrag insbesondere die Schnittstelle zwischen Clusteringergebnissen und dem Nutzer (Stichwort: "Menschlicher Zugang"). Ziel ist es, Clusteranalyseprozesse im Information Retrieval für Nutzer verständlicher und leichter interpretierbar zu machen. Auf Seiten der Theorie stehen das Soft- und das Online-Clustering im Mittelpunkt; auf Seiten der Semantik und Clusterinterpretation wurde unter Berücksichtigung aktueller Erkenntnisse ein Arbeitsprogramm mit Forschungsfragen u.a. zum Faceted Clustering, zum semi-supervised Clustering und zur Bewertung von Clusteringergebnissen entwickelt.
DFG-Verfahren Sachbeihilfen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung