Project Details
Projekt Print View

Lightweight Compression Techniques for Optimizing Complex Database Queries

Subject Area Security and Dependability, Operating-, Communication- and Distributed Systems
Term from 2014 to 2018
Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 255187874
 
Final Report Year 2019

Final Report Abstract

Die Bedeutung von In-Memory Datenbanksystemen steigt zunehmend sowohl im wissenschaftlichen als auch im kommerziellen Kontext. Derartige Datenbanksysteme verfolgen einen hauptspeicherzentrischen Architekturansatz, der sich dadurch auszeichnet, dass alle performanzkritischen Operationen und internen Datenstrukturen für den Zugriff der Hauptspeicherhierarchie (z.B. effiziente Nutzung der Cachehierarchie etc.) ausgelegt sind. Üblicherweise gehen In-Memory Datenbanksysteme davon aus, dass alle relevanten Datenbestände auch vollständig in den Hauptspeicher eines Rechners oder eines Rechnerverbundes (Clusterkonfiguration) abgelegt werden können. Im Rahmen des Projektes haben wir uns speziell mit dem spaltenorientierten, hauptspeicherzentrischen Architekturansatz auseinandergesetzt, wo die Inhalte von Tabellen spaltenweise (bzw. attributweise) und nicht mehr zeilenweise physisch abgespeichert werden. Der Vorteil dieses Ansatzes besteht darin, dass analytische Anfragen wie beispielsweise Aggregate über Attributen nur noch die Attribute lesen müssen, die für die Beantwortung der Anfrage notwendig sind. In früheren Arbeiten wurde gezeigt, dass damit die Performanz von analytischen Anfragen gegenüber der klassischen zeilenweise Speicherung von Tabellen wesentlich gesteigert wird. Zunehmend werden jedoch Zwischenergebnisse, die während der Anfrageausführung erzeugt werden, zum Performanzengpass in hauptspeicherzentrischen Architekturen, da jeder Zugriff auf ein Zwischenergebnis genauso teuer ist wie ein Zugriff auf die Basisdaten; entsprechend ist auch der Aufwand, Zwischenergebnisse zu generieren ähnlich teuer wie Änderungen an Basisrelationen durchzuführen. Aus diesem Grund bestand die Zielstellung des Projektes darin, den Nutzen leichtgewichtiger Kompressionsverfahren in spaltenorientierten Datenbanksystemen zur Optimierung der Zwischenergebnisse zu eruieren. Die erzielten Forschungsergebnisse für dieses Ziel lassen in Wesentlichen in drei Bereiche einordnen: 1) Es wurde eine umfangreiche, detaillierte und experimentelle Aufarbeitung der leichtgewichtigen Kompressionstechniken durchgeführt und somit eine solide Grundlage für das Projekt geschaffen, 2) es wurden unterschiedliche Integrationsgrade zwischen Planoperatoren und Kompression herausgearbeitet und 3) alle entwickelten Konzepte wurde in einem eigenen Forschungsprototypen MorphStore integriert, um die Ergebnisse umfassend zu evaluieren. Des Weiteren sind eine Vielzahl von nationalen und internationalen Veröffentlichungen während der Projektbearbeitung entstanden.

Publications

 
 

Additional Information

Textvergrößerung und Kontrastanpassung