Detailseite
Projekt Druckansicht

Das Verschmelzen von formalen Methoden und Lerntechniken für die Strategiesynthese in partiell beobachtbaren Markov-Entscheidungsprozessen

Fachliche Zuordnung Theoretische Informatik
Förderung Förderung seit 2025
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 555465011
 
In diesem Projekt befassen wir uns mit dem Problem der Strategiesynthese für teilweise beobachtbare Markov-Entscheidungsprozesse (POMDPs). Obwohl dieses Problem im Allgemeinen unentscheidbar ist, gibt es in der Literatur Teillösungen unter Verwendung von semi-Algorithmen. Diese Ansätze stammen entweder von formalen Methoden, die sich auf eine partielle Entfaltung des typischerweise unendlichen Glaubensraums des POMDP stützen, oder von Lerntechniken, die Stichprobenverfahren verwenden. Formale Methoden bieten starke Garantien, lassen sich aber nicht gut auf große Systeme skalieren, während Lerntechniken größere Systeme handhaben können, aber keine robusten Korrektheitsgarantien bieten. In diesem Projekt wollen wir beide Ansätze zu einem umfassenden Rahmenwerk verschmelzen, das auf große Systeme angewendet werden kann und gleichzeitig die starken Garantien der formalen Methoden beibehält. Unsere neuen Algorithmen werden Techniken der Modellprüfung und des Lernens integrieren, einschließlich Techniken des Automatenlernens, der probabilistischen Modellprüfung, der Analyse von Gegenbeispielen, der probabilistischen Programmverfeinerung und der Monte Carlo Baumsuche mit symbolischen Hinweisen. Außerdem werden wir spezielle Fälle untersuchen, in denen die Entscheidbarkeit wiederhergestellt werden kann, insbesondere indem wir zeigen, wie Multi-Environment-MDPs und parametrische MDPs als entscheidbare Unterklassen von POMDPs betrachtet werden können.
DFG-Verfahren Sachbeihilfen
Internationaler Bezug Belgien
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung