Logikbasierte probabilistiche Wissensrepräsentation für relationales Lernen, Modellieren und Inferieren
Zusammenfassung der Projektergebnisse
Die Darstellung und Verarbeitung unsicheren Wissens spielt in vielen Bereichen der Künstlichen Intelligenz eine zentrale Rolle. Dabei werden oft, motiviert durch jeweils andere Blickwinkel und Prioritäten, unterschiedliche Ansätze sowohl qualitativer als auch quantitativer Natur verfolgt. Die Frage des Wissenserwerbs bringt auch das Gebiet des maschinellen Lernens ins Blickfeld. Lernen, Darstellen und Verarbeiten von Wissen sind aufeinander bezogene Prozesse, und die Gestaltung ihres optimalen, transparenten Zusammenspiels stellt eine wissenschaftliche Herausforderung dar. In dem Projekt KReate wurde ein integrativer Wissensrepräsentationsansatz für relationales Lernen, Modellieren und Inferieren in probabilistischen Darstellungsformen entwickelt, wobei probabilistische Regeln der Art " Wenn X und Y Kontakt hatten und X an D erkrankt ist, dann erkrankt Y an D mit Wahrscheinlichkeit 0.8“ betrachtet werden. Solche, mit Wahrscheinlichkeiten versehene relationale, konditionallogische Informationen können in Wissensbasen zur Modellierung des Problembereichs gebündelt, aus Daten extrahiert und zur Inferenz verwendet werden. Das Ziel des Ansatzes ist, integrierte Systeme mit optimaler Abstimmung dieser Prozesse aufeinander zu konzipieren und zu implementieren. Dabei spielt der Begriff des Modells einerseits als zu lernendes Objekt und andererseits als Basis für Inferenzen eine zentrale Rolle. Die Realisierung dieser Zielsetzung erfolgte sowohl unter theoretischen wie auch experimentell-heuristischen Aspekten. Insbesondere stellte die auf Konditionalen beruhende logische Basismethodik für Lernen, Modellieren und Inferenz einen theoretisch anspruchsvollen und praktisch vielseitigen Rahmen für die zentralen Forschungsthemen dieses Projekts dar. Zur Überprüfung der erzielten Forschungsergebnisse wurde die integrierte Entwicklungsumgebung KReator realisiert, die eine schnelle und effiziente Programmentwicklung in unterschiedlichen Formalismen unterstützt und mit deren Hilfe in Kooperation mit verschiedenen Projektpartnern praxisrelevante Aufgabenstellungen bearbeitet wurden. Als besonders schwierig erwies sich die Konzipierung der prädikatenlogischen Grundlagen für einen Wissensrepräsentationsformalismus, der einen passenden Modellbegriff für probabilistische Konditionale erlaubt. Schon in aussagenlogischen Umgebungen erweitert der Konditionaloperator die Schlussfolgerungsmöglichkeiten um eine neue Dimension, findet aber in bedingten Wahrscheinlichkeiten eine intuitive und wohldefinierte probabilistische Umsetzung. Die Erweiterung auf die Interpretation prädikatenlogischer (insbesondere offener) Konditionale machte zunächst die Entwicklung verschiedener neuartiger probabilistischer Semantiken erforderlich, die teilweise sowohl subjektive wie auch statistische Aspekte von Wahrscheinlichkeiten berücksichtigen und damit ein Verständnis solcher Konditionale im Sinne des common sense unterstützen. Auf den so definierten Modellräumen konnte das Prinzip der maximalen Entropie (ME) angewendet werden, um ein informationstheoretisch optimales Modell als Ausgangspunkt für modellbasierte Inferenz auszuwählen. Damit gelang die Übertragung einer im propositionalen Fall sehr erfolgreichen Methodik für die Verarbeitung (subjektiven) probabilistischen Wissens auf prädikatenlogische konditionale Wissensbasen, wobei die verschiedenen Semantiken im Allgemeinen auch zu unterschiedlichen ME-Modellen führen und so eine pointierte Untersuchung der spezifischen semantischen Eigenschaften erlauben. Zur genaueren Untersuchung der Ansprüche des commonsense reasoning wurde ein umfangreicher Katalog von Eigenschaften entwickelt, der zur Evaluation der neuen (ME-)Semantiken genutzt wurde. Im direkten Vergleich mit anderen Ansätzen aus dem Bereich des maschinellen Lernens (z.B. Bayesian Logic Programs, Markov Logic Networks) zeigten sich deutliche Vorteile bzgl. der Qualität der Wissensrepräsentation. Die - für semantische Ansätze typische - hohe Komplexität der Inferenzverfahren konnte durch Ausnutzung struktureller Eigenschaften der ME-Methodik verbessert werden; hier besteht allerdings noch Forschungs- und Entwicklungsbedarf. Die integrierte Entwicklungsumgebung KReator beherbergt nicht nur die neu im Projekt entwickelten Methoden, sondern auch andere gängige Ansätze aus dem Bereich der probabilistisch relationalen Wissensrepräsentation und bietet so eine gute Plattform zum Vergleichen und Testen der Theorien anhand von Beispielen. Durch Plugins kann KReator bequem um weitere Methoden erweitert werden.
Projektbezogene Publikationen (Auswahl)
-
Qualitative Knowledge Discovery. In: Schewe, K.-D. und B. Thalheim (Hrsg.): 3rd International Workshop on Semantics in Data and Knowledge Bases, SDKB 2008. Lecture Notes in Computer Science, Bd. 4925. 2008, S. 88-113.
Kern-Isberner, G., M. Thimm, M. Finthammer
-
Toward Markov Logic with Conditional Probabilities. In: Wilson, D. C. , H. C. Lane (Hrsg.): Proceedings of the Twenty-First International FLAIRS Conference, 2008, S. 643-648, AAAI Press, ISBN 978-1-57735-365-2.
Fisseler, J.
-
An Implementation of Belief Change Operations Based on Probabilistic Conditional Logic. In: Erdem, E., F. Lin und T. Schaub (Hrsg.): Logic Programming and Nonmonotonic Reasoning, 10th Intern. Conf., LPNMR 2009, Potsdam, Germany, September 14-18, 2009. Proceedings, LNCS, Bd. 5753. 2009, S. 496-501.
Finthammer, M., C. Beierle, B. Berger, G. Kern-Isberner
-
Measuring Inconsistency in Probabilistic Knowledge Bases. In: Bilmes, Jeff und Andrew Ng (Hrsg.): Proceedings of the 25th Conference on Uncertainty in Artificial Intelligence (UAI'09), Montreal, Canada, 2009, pp. 530-537.
Thimm, Matthias
-
Probabilistic Reasoning at Optimum Entropy with the MEcore System. In: Lane, H. C. und H. W. Guesgen (Herausgeber): Proceedings 22nd International FLAIRS Conference, FLAIRS 2009. AAAI Press, ISBN 978-1-57735-419-2.
Finthammer, M., C. Beierle, B. Berger, G. Kern-Isberner
-
Towards a Toolbox for Relational Probabilistic Knowledge Representation, Reasoning, and Learning. In: Workshop on Relational Approaches to Knowledge Representation and Learning, Proceedings, Paderborn, Germany, 2009.
Finthammer, M., S. Loh, M. Thimm
-
Automated Reasoning for Relational Probabilistic Knowledge Representation. In: Giesl, J. und R. Hahnle (Hrsg.): Automated Reasoning, 5th International Joint Conference, IJCAR 2010, Edinburgh, UK, July 16-19, 2010. Proceedings, Lecture Notes in Computer Science, Bd. 6173. 2010, S. 218-224.
Beierle, C., M. Finthammer, G. Kern-Isberner, M. Thimm
-
Data Fusion with Probabilistic Conditional Logic. Logic Journal
of the IGPL, Vol. 18. 2010, Issue 4, pp. 488-507.
Fisseler, J., I. Feher
-
On the Problem of Grounding a Relational Probabilistic Conditional Knowledge Base. Proceedings of the 13th International Workshop on Non-Monotonic Reasoning (NMR'10), Toronto, Canada, May 2010.
Loh, S., M. Thimm, G. Kern-Isberner
-
Probabilistic Relational Learning for Medical Diagnosis Based on Ion Mobility Spectrometry. In: Hullermeier, E., R. Kruse und F. Hoffmann (Hrsg.): Proc. IPMU 2010: Information Processing and Management of Uncertainty in Knowledge-Based Systems. Theory and Methods. Communications in Computer and Information Science, Vol. 80; Lecture Notes in Computer Science, Vol. 6178. 2010, pp. 365-375.
Finthammer, M., C. Beierle, J. Fisseler, G. Kern-Isberner, B. Moller, J. I. Baumbach
-
Using Probabilistic Relational Learning to Support Bronchial Carcinoma Diagnosis Based on Ion Mobility Spectrometry.
International Journal for Ion Mobility Spectrometry, Vol. 13. 2010, Issue 2, pp 83–93.
Finthammer, M., C. Beierle, J. Fisseler, G. Kern-Isberner, J. I. Baumbach
-
Evaluation and Comparison Criteria for Approaches to Probabilistic Relational Knowledge Representation. In: Bach, J. und S. Edelkamp (Hrsg.): KI 2011: Advances in Artificial Intelligence. Lecture Notes in Computer Science, Bd. 7006.2011, S. 63-74.
Beierle, C., M. Finthammer, G. Kern-Isberner, M. Thimm
-
Probabilistic Logics in Expert Systems: Approaches, Implementations, and Applications. In: Proceedings of the 22nd
International Conference on Database and Expert Systems Applications (DEXA'11), Lecture Notes in Computer Science, Bd. 6860. 2011, S. 27-46.
Kern-Isberner, G., C. Beierle, M. Finthammer, M. Thimm
-
Transformation Rules for First-Order Probabilistic Conditional
Logic Yielding Parametric Uniformity. KI 2011: Advances in Artificial Intelligence: 34th Annual German Conference on AI, Berlin, Germany, October 4-7,2011, Proceedings. Lecture Notes in Artificial Intelligence, Bd. 7006. 2011, S. 157-168. (Best Theoretical Paper Award).
Janning, R., C. Beierle
-
An Integrated Development Environment for Probabilistic
Relational Reasoning. Logic Journal of the IGPL, Vol. 20. 2012, Issue 5, pp. 831-871.
Finthammer, M., M. Thimm
-
Editorial: Relational approaches to knowledge representation
and learning. Logic Journal of the IGPL, Vol. 20. 2012, Issue 5, pp. 771-773.
Beierle, C., G. Kern-Isberner
-
First-order probabilistic conditional logic and maximum entropy. Logic Journal of the IGPL, Vol. 20. 2012, Issue 5, pp. 796-830.
Fisseler, J.
-
On Probabilistic Inference in Relational Conditional Logics. Logic Journal of the IGPL, Vol. 20. 2012, Issue 5, pp. 872-908.
Thimm, M., G. Kern-Isberner