Project Details
Data Mining Algorithmen, die mittels direkten Stichprobenziehungen aus dem Musterraum ein effktives und kontrolliertes Laufzeitverhalten aufweisen.
Applicant
Professor Dr. Thomas Gärtner
Subject Area
Image and Language Processing, Computer Graphics and Visualisation, Human Computer Interaction, Ubiquitous and Wearable Computing
Term
from 2011 to 2017
Project identifier
Deutsche Forschungsgemeinschaft (DFG) - Project number 191169928
Data Mining wird in praktischen Anwendungen oft eingesetzt, um interessante Muster und Regelmäßigkeiten zu entdecken, die in großen Datenbeständen versteckt sind. State-of-the-art Methoden listen dazu alle potentiell interessanten Muster erschöpfend auf, die durch bestimmte Parametereinstellungen spezifiziert werden. So wird zwar garantiert, alle interessanten Muster zu finden, die dazu benötigte Berechnungszeit ist allerdings praktisch unbeschränkt, denn der empfindliche Zusammenhang zwischen den Parametereinstellungen und der Anzahl der aufzuzählenden Muster intransparent ist. In diesem Projekt werden wir Algorithmen entwickeln, die, anstatt eine große Menge von Mustern erschöpfend aufzuzählen, einzelne interessante Muster zufällig generieren. Dazu werden wir Markov-Ketten-Monte-Carlo-Sampling in Kombination mit Techniken wie dem sequentiellen Eingabesampling einsetzen, um einerseits mit hoher Wahrscheinlichkeit interessante Muster zu generieren und andererseits eine praktikable und prognostizierbare Antwortzeit zu erreichen. Dieses fundamental neue Paradigma zur Musterentdeckung hat den weiteren Vorteil, dass es interaktive Prozesse ermöglicht, während denen der zugrundeliegende Interessantheitsbegriff abhängig von Nutzerfeedback iterativ verfeinert wird.
DFG Programme
Research Grants
Participating Person
Professor Dr. Stefan Wrobel