Detailseite
Effiziente und effektive Data-Mining Lösungen für hochdimensionale Daten
Antragsteller
Professor Dr. Hans-Peter Kriegel
Fachliche Zuordnung
Sicherheit und Verlässlichkeit, Betriebs-, Kommunikations- und verteilte Systeme
Förderung
Förderung von 2005 bis 2010
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 14823303
Die fortschreitende Automatisierung und Vernetzung der modernen Informationsgesellschaft führt zu einem drastischen Anstieg sowohl des Volumens als auch der Komplexität der erfassten Daten. Bei der semiautomatischen Analyse mittels Data Mining Verfahren, insbesondere im Bereich Cluster-Analyse, ergibt sich hieraus das folgende, aus Praxissicht sehr wichtige Problemfeld: Es werden immer mehr Merkmale automatisch erfasst, von denen aber viele für die jeweils betrachtete Data Mining Aufgabe irrelevant, weil etwa verrauscht oder redundant sind. Methoden zur globalen Merkmalsreduktion oder -extraktion führen in der Regel nur sehr eingeschränkt zum Ziel, da in Realdaten typischerweise verschiedene Merkmalsmengen für unterschiedliche Objektgruppen relevant sein können. Deshalb sollen Verfahren zum subspace- und Correlation Clustering entwickelt und untersucht werden, die hochdimensionale Merkmalsräume flexibel und individuell (pro Cluster) auf niedrige Dimensionen skalieren. Das Hauptziel dieses Antrages ist also, innovative Data Mining Verfahren für hochdimensionale Merkmalsräume zu entwickeln.
DFG-Verfahren
Sachbeihilfen
Beteiligte Person
Professor Dr. Christian Böhm