Detailseite
Projekt Druckansicht

GraphQueryML: Query-Optimierung in Graphdatenbanken unter Verwendung von Machine Learning.

Fachliche Zuordnung Datenmanagement, datenintensive Systeme, Informatik-Methoden in der Wirtschaftsinformatik
Förderung Förderung von 2020 bis 2024
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 441617860
 
Erstellungsjahr 2025

Zusammenfassung der Projektergebnisse

Ziel dieses Projekts war es, den Stand der Technik in der gelernten Abfrageoptimierung zu erweitern, um die Anwendung von maschinellem Lernen auf Abfrageoptimierung in Graphdatenbanksystemen zu ermöglichen. Abfrageoptimierung ist immer noch eines der wichtigsten offenen Probleme der Datenbankforschung. Da relationale Datenbankabfragen immer komplexer werden und Graphdatenbanksysteme an Bedeutung gewinnen, sind viele Ansätze entstanden, die maschinelles Lernen zur Optimierung von Anfragen einsetzen. Konzeptionell können diese Ansätze in drei Gruppen eingeteilt werden. Die erste Gruppe von Ansätzen verwendet maschinelles Lernen, um die Ergebniskardinalitäten einer Abfrage und ihrer Unterabfragen zu schätzen. Diese Schätzungen werden dann in einen traditionellen Abfrageoptimierer eingespeist. Die zweite Gruppe von Ansätzen lernt, gute Ausführungspläne direkt vorherzusagen und ersetzt so den traditionellen Optimierer. Die Ansätze der dritten Gruppe schließlich operieren vollständig außerhalb des traditionellen Optimierers, indem sie Hinweise vorschlagen, die den Optimierer auf einen effizienten Plan lenken. Im Projekt haben wir hauptsächlich zur ersten Gruppe von Ansätzen beigetragen, d.h. zur erlernten Kardinalitätsschätzung. Bevor wir uns den Graphdatenbanksystemen widmeten, führten wir zunächst mehrere Teilprojekte im Umfeld relationaler Datenbanksysteme durch, die immer noch weiter verbreitet sind und für die standardisierte Benchmarks zur Validierung der Beiträge leichter verfügbar sind. Wir haben festgestellt, dass die meisten modernen Verfahren zur erlernten Kardinalitätsschätzung eine unrealistisch große Menge an Trainingsdaten erfordern, und haben untersucht, wie geometrisches Lernen angewendet werden kann, um einen effizienteren erlernten Kardinalitätsschätzer zu erhalten. Als Vorläufer für reguläre Pfadabfragen in Graphdatenbanksystemen untersuchten wir das verwandte Problem der Kardinalitätsschätzung für LIKE-Prädikate in SQL. Wir haben ein neues Schätzverfahren auf der Grundlage eines Sprachmodells entwickelt, das die Genauigkeit bestehender Techniken deutlich übertrifft. In Bezug auf Graphdatenbanksysteme untersuchten wir, wie sequenzbasiertes Lernen auf die Kardinalitätsschätzung für Pfadabfragen angewandt werden kann, und schlugen eine neue Technik vor, die einen geringeren Q-Error aufweist als aktuelle Techniken. Schließlich wurde im Rahmen des Projekts auch der Einsatz von Quantencomputern für die Kardinalitätsschätzung untersucht und ein Ansatz für ein neuronales Quantennetzwerk zur Schätzung der Kardinalität von Join-Abfragen vorgeschlagen. Neben diesen Beiträgen zur ersten Gruppe der erlernten Abfrageoptimierungstechniken entstand im Projekt auch ein neues End-to-End-Benchmark zur Validierung von Ansätzen aus der zweiten und dritten Gruppe. Alle Beiträge dieses Projekts haben zu Publikationen geführt, die auf den wichtigsten A*- Konferenzen der Forschungsgemeinschaft für Datenbanksysteme veröffentlicht wurden.

Projektbezogene Publikationen (Auswahl)

 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung