Project Details
Projekt Print View

Paralleles Data-Mining

Subject Area Security and Dependability, Operating-, Communication- and Distributed Systems
Term from 1997 to 2002
Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 5463915
 
..Der Schwerpunkt der nächsten Förderperiode verbleibt bei der Parallelisierung der Vorverarbeitung. Von den klassischen Ansätzen übernehmen wir das Datenflußprinzip, das in*Richtung einer stärkeren Nutzung von Pipelining verbunden mit einer Einbettung effizienzsteigernder Materialisierungsstrategien weiterentwickelt werden soll. Als Grundlage hierfür ist das Informationsmodell aus Abschnitt 2.4.1 zu integrieren. Die bereits genannten Forderungen nach der Erzielung eines hohen Maßes an Pipelining und der Integration von Pipelining und paralleler Materialisierung stellen die besonderen Herausforderungen dar. Erst in einem zweiten Schritt werden wir uns den Lernverfahren zuwenden und auf Basis der gewonnenen Erkenntnisse eine geignete teilmenge auswählen und in das System integrieren. Dabei wollen wir die ParaStation-Plattform nutzen, um gerade die Verfahren zu unterstützen, die sich bisher aufgrund der Beschränkungen gängiger Rechnerverbindungen einer effizienten Parallelisierung verschlossen. Aus datenbanktechnischer Sicht ergibt sich weiteres Optimierungspotential durch die Möglichkeit, Vorverarbeitung und Lernverfahren in einem gemeinsamen Operatorgraphen als ganzes zu optimieren, sowie duch die Ausdehnung der Materialisierungstechnik auf die Operatoren der Lernalgorithmen.
DFG Programme Research Units
 
 

Additional Information

Textvergrößerung und Kontrastanpassung