Detailseite
Data Mining Algorithmen, die mittels direkten Stichprobenziehungen aus dem Musterraum ein effktives und kontrolliertes Laufzeitverhalten aufweisen.
Antragsteller
Professor Dr. Thomas Gärtner
Fachliche Zuordnung
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung
Förderung von 2011 bis 2017
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 191169928
Data Mining wird in praktischen Anwendungen oft eingesetzt, um interessante Muster und Regelmäßigkeiten zu entdecken, die in großen Datenbeständen versteckt sind. State-of-the-art Methoden listen dazu alle potentiell interessanten Muster erschöpfend auf, die durch bestimmte Parametereinstellungen spezifiziert werden. So wird zwar garantiert, alle interessanten Muster zu finden, die dazu benötigte Berechnungszeit ist allerdings praktisch unbeschränkt, denn der empfindliche Zusammenhang zwischen den Parametereinstellungen und der Anzahl der aufzuzählenden Muster intransparent ist. In diesem Projekt werden wir Algorithmen entwickeln, die, anstatt eine große Menge von Mustern erschöpfend aufzuzählen, einzelne interessante Muster zufällig generieren. Dazu werden wir Markov-Ketten-Monte-Carlo-Sampling in Kombination mit Techniken wie dem sequentiellen Eingabesampling einsetzen, um einerseits mit hoher Wahrscheinlichkeit interessante Muster zu generieren und andererseits eine praktikable und prognostizierbare Antwortzeit zu erreichen. Dieses fundamental neue Paradigma zur Musterentdeckung hat den weiteren Vorteil, dass es interaktive Prozesse ermöglicht, während denen der zugrundeliegende Interessantheitsbegriff abhängig von Nutzerfeedback iterativ verfeinert wird.
DFG-Verfahren
Sachbeihilfen
Beteiligte Person
Professor Dr. Stefan Wrobel