Project Details
Projekt Print View

Entwicklung von Konzepten für ein quantenlogikbasiertes Retrieval-Datenbank-Anfragesystem: Anfragesprache, interaktive Suchformulierung sowie effiziente Anfrageauswertung

Subject Area Security and Dependability, Operating-, Communication- and Distributed Systems
Term from 2009 to 2014
Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 96336018
 
Final Report Year 2016

Final Report Abstract

Die Suche in einem klassischen Datenbanksystem basiert konzeptionell auf Prädikatenlogik erster Stufe. Dort können die angefragten Daten eine Anfrage nur erfüllen oder nicht erfüllen. Diese sogenannten scharfen Datenbankbedingungen unterstützen keine graduelle Erfüllung. Dies ermöglichen jedoch Retrieval-Systeme mit Retrieval-Bedingungen, welche auf völlig anderen Konzepten, zum Beispiel dem Vektorraummodell, basieren. Damit stellen Retrieval-Bedingungen gegenüber den konventionellen Datenbankbedingungen ein weiteres Suchparadigma dar. Viele moderne Anwendungen, zum Beispiel aus dem Bereich Multimedia, Web und XML, benötigen jedoch die Kombination von Datenbank- und Retrieval-Bedingungen. Die Problematik der Integration dieser Paradigmen für ein „Reasoning about Uncertain Data“ wurde seinerzeit von führenden Datenbankforschern im Lowell-Report als wichtiges Forschungsziel identifiziert. Die Kernidee der 1. Projektphase war die Umsetzung einer solchen Kombination von Datenbank- und Retrieval-Konzepten auf der Grundlage des vereinheitlichenden Formalismus der Quantenmechanik und Quantenlogik. Dieser Ansatz erlaubt die Einbettung von Datenbank- und Retrieval-Bedingungen und schlägt eine elegante Brücke zwischen linearer Algebra, Logik und Wahrscheinlichkeitsrechnung. Damit werden Ergebnisse aus diesen gut erforschten Gebieten zur Lösung von Datenbank- und Retrieval- Fragestellungen erschlossen. In der 2. Projektphase wurde eine Erweiterung des Grundmodells um die grundlegenden Konzepte probilistischer Datenbanken entworfen und umgesetzt. Auch in probabilistischen Datenbanken wird ein striktes, deterministisches Auswertungsmodell als nicht mehr ausreichend angesehen. Insbesondere wenn Daten automatisch extrahiert werden oder aus verschiedenen Quellen stammen, existiert oft eine Unsicherheit über die Genauigkeit der so gewonnenen Daten. Des Weiteren sind menschliche Bewertungen oder Beobachtungen, welche auf Grund ihrer inhärenten Subjektivität oft mit einem Konfidenzwert annotiert werden, ein typisches Anwendungsfeld für probabilistische Datenbanken. Das vorherrschende Anfrage- und Datenmodell ist durch die sogenannte Possible-World-Semantik gegeben. Hier werden mehrere mögliche Zustände für ein und dasselbe System in einer gemeinsamen Datenbank verwaltet. Als Hauptergebnis der 2. Projektphase konnte das probabilistische Datenbanksystem ProQua5 entwickelt und vorgestellt werden. ProQua ist das einzige probabilistische Datenbanksystem, das komplexe logikbasierte Ähnlichkeitsanfragen sowie die Gewichtung von Teilanfragen durch seiner Anfragesprache QSQL2 unterstützt.

Publications

  • A Preference-Based Approach for Interactive Weight Learning: Learning Weights Within a Logic-Based Query Language. Distributed and Parallel Databases, 27(1):31-51, 2010
    David Zellhoefer and Ingo Schmitt
  • QSQL: Incorporating Logic-Based Retrieval Conditions into SQL. In Hiroyuki Kitagawa, Yoshiharu Ishikawa, Qing Li, and Chiemi Watanabe, editors, DASFAA (1), volume 5981 of Lecture Notes in Computer Science, pages 429-443. Springer, 2010
    Sebastian Lehrack and Ingo Schmitt
  • QSQLp: Eine Erweiterung der probabilistischen Many-World-Semantik um Relevanzwahrscheinlichkeiten. In BTW, pages 494-513, 2011
    Sebastian Lehrack, Sascha Saretz, and Ingo Schmitt
  • Towards Quantum-Based DB+IR Processing Based on the Principle of Polyrepresentation. In ECIR, pages 729-732, 2011
    David Zellhoefer, Ingo Frommholz, Ingo Schmitt, Mounia Lalmas, and Keith van Rijsbergen
  • A Top-k Filter for Logic-Based Similarity Conditions on Probabilistic Databases. 16th East-European Conference on Advances in Databases and Information Systems (ADBIS 2012): 268-281, Poznan, Poland
    Sebastian Lehrack and Sascha Saretz
  • Applying Weighted Queries on Probabilistic Databases. 21st ACM International Conference on Information and Knowledge Management (CIKM 2012): 2209-2213, Maui, USA
    Sebastian Lehrack
  • ProQua: A System For Evaluating Logic-Based Scoring Functions On Uncertain Relational Data. In 16st ACM International Conference on Extending Database Technologies (EDBT 2013), Genoa, Italy, March 2013, pages 761-764
    Sebastian Lehrack, Sascha Saretz and Christian Winkel
  • ProQua: Ein Probabilistisches Datenbanksystem für die Auswertung von Ähnlichkeitsanfragen auf unsicheren Datengrundlagen. In BTW 2013, pages 531-534
    Sebastian Lehrack, Sascha Saretz, Christian Winkel
 
 

Additional Information

Textvergrößerung und Kontrastanpassung