Detailseite
Projekt Druckansicht

Empirisch und auf menschlichen Urteilen basierende Analyse der Qualität von Internet-Seiten mit Methoden des Web-Mining

Fachliche Zuordnung Sicherheit und Verlässlichkeit, Betriebs-, Kommunikations- und verteilte Systeme
Förderung Förderung von 2003 bis 2005
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 5404131
 
Die Bewertung von Dokumenten nach ihrer Qualität wird im Zeitalter verteilten und in großen Mengen vorliegenden Wissens zunehmend an Software delegiert. Dies gilt besonders bei der Suche nach Informationen etwa mit Internet-Suchmaschinen, bei der Qualitätsbewertungssysteme als Filter einsetzbar sind. Die starke Heterogenität der Qualität von Internet-Dokumenten lässt hier einen besonderen Mehrwert erwarten.Experimentelle Systeme behandeln verschiedene Aspekte und nutzen unterschiedliche Definitionen von Qualität. Im Einsatz befindliche Systeme nutzen zur Zeit einzelne und begrenzte Aspekte von Qualität. Insbesondere die Analyse der Verlinkungsstruktur des Internets bietet einen Ansatzpunkt für existierende Systeme.Die Komplexität des Qualitätskonzepts und der Dokumente erfordert jedoch auf mehreren Aspekten beruhende Definitionen. Das beantragte Projekt will die bisherige Forschung unter dem Qualitätsaspekt interpretieren und komplexere Qualitätsdefinitionen aus menschlichen Urteilen ableiten. Formale Eigenschaften von Internet-Seiten sollen automatisch extrahiert werden. Menschliche Qualitätsurteile unterschiedlichster Art bilden die Grundlage für Verfahren des maschinellen Lernens. So entstehen Klassifikationssysteme, welche die menschlichen Urteile so weit wie möglich simulieren. Diese sollen in prototypischen Suchund Filtersystemen integriert werden. Wichtige Herausforderungen stellen dabei das Auswerten vorliegender Qualitätsurteile und die Evaluierung der Qualitätsfilter dar.Im Rahmen des Projektes soll eine Habilitationsschrift in der Informationswissenschaft entstehen.
DFG-Verfahren Sachbeihilfen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung