Modellgetriebener, kostenbasierter Datenbankenentwurf
Final Report Abstract
Die Zielsetzung des Projektes bestand darin, für eine in Softwaremodellen fachlich spezifizierte Datenbankanwendung mit Hilfe einer Kostenanalyse einen optimalen Datenbankentwurf automatisiert zu erstellen. Dies sollte den logischen und physischen Datenbankentwurf umfassen. Nachdem sich Softwaremodelle nur für standardisierte Fälle als für einen vollständigen Datenbankentwurf hinreichend aussagekräftig genug erwiesen und sich im Bereich des logischen Entwurfs ein generelles und signifikantes Optimierungspotential nicht bestätigen ließ, konzentrierte sich das Projekt schwerpunktmäßig auf den physischen Datenbankentwurf und die physische Datenunabhängigkeit. Drei wesentliche Ergebnisse wurden in diesem Bereich erarbeitet. Erstens wurde eine automatische und adaptive Indexoptimierung entwickelt. Indizes werden hier nicht mehr vom Administrator in Handarbeit optimiert, sondern vollständig selbstständig vom Datenbanksystem inkrementell aufgebaut und verwaltet. Der Datenbankadministrator gibt dazu nur ein Ressourcenbudget vor. Zweitens wurde ein automatischer und adaptiver Partitionierungsmechanismus für Universaltabellen entwickelt. Dieser unterteilt eine Universaltabelle selbstständig in Partitionen schematisch ähnlicher Tupel. Auf dieser Basis können Anfragen Partitionen irrelevanter Tupel von der Verarbeitung ausschließen ohne die Tupel selbst lesen zu müssen. Auch hier ist ein Zutun des Datenbankadministrators nicht notwendig. Drittens wurde der physische Datenbankentwurf um die Konfiguration der Datenrepräsentation erweitert. In gängigen Datenbanksystemen ist die primäre Repräsentation fest kodiert, meist lässt sich noch zwischen einer zeilen- und einer spaltenorientierten Repräsentation wählen. Das im Projekt entwickelte Konzept bietet eine echte Konfigurierbarkeit und erlaubt eine freie Optimierung der primären Datenrepräsentation innerhalb eines Systems. Die ersten zwei Ergebnisse sind wichtige Fortschritte im Bereich des automatischen physischen Datenbankentwurfs, das dritte Ergebnis stärkt die physische Datenunabhängigkeit.
Publications
-
Listen to the Customer – Model-driven Database Design. In IDEAS, Seiten 15–20, 2010
Hannes Voigt, Kai Herrmann, Tim Kiefer und Wolfgang Lehner
-
Adaptive Index Buffer. In SMDB, Seiten 308–314. IEEE Computer Society, 2012
Hannes Voigt, Tobias Jäkel, Thomas Kissinger und Wolfgang Lehner
-
SMIX Live – A Self-Managing Index Infrastructure for Dynamic Workloads. In ICDE, Seiten 1225–1228. IEEE Computer Society, 2012
Thomas Kissinger, Hannes Voigt und Wolfgang Lehner
-
SMIX – Self-Managing Indexes for Dynamic Workloads. In SSDBM, Seiten 24–35. ACM, 2013
Hannes Voigt, Thomas Kissinger und Wolfgang Lehner
-
Cinderella – Adaptive Online Partitioning of Heterogeneous Data. In SMDB, 2014
Kai Herrmann, Hannes Voigt und Wolfgang Lehner
-
Flexs – A Logical Model for Physical Data Layout. In ADBIS. Springer, 2014
Hannes Voigt, Alfred Hanisch und Wolfgang Lehner