Detailseite
Projekt Druckansicht

Kombinatorische Methoden für das Lernen von Max-Linearen Bayes'schen Netzen

Fachliche Zuordnung Mathematik
Förderung Förderung seit 2024
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 539875257
 
Gerichtete azyklische graphische Modelle, manchmal auch Bayes'sche Netze genannt, sind in der modernen Datenwissenschaft und Statistik aufgrund ihrer Anwendungen auf Kausalität und probabilistische Schlussfolgerungen von entscheidender Bedeutung. Diese statistischen Modelle verwenden gerichtete azyklische Graphen (DAGs auf Englisch), um kausale Beziehungen zwischen Zufallsvariablen darzustellen, und werden häufig durch ein System von Strukturgleichungen spezifiziert, das mit Hilfe des zugehörigen DAGs definiert wird. In diesem Antrag konzentrieren wir uns auf eine relativ neue Familie von gerichteten graphischen Modellen, die als max-linearen Bayes'sche Netze (MLBN) bezeichnet werden. Diese Modelle eignen sich hervorragend für die Modellierung von Kaskadenfehlern und finden in vielen Bereichen Anwendung, in denen dies häufig vorkommt, wie z.B. bei finanziellen Risiken und Wasserverschmutzung. Im Gegensatz zu vielen anderen klassischen Familien graphischer Modelle halten sie sich nicht an das bekannte d-Separationskriterium und weisen daher sehr unterschiedliche Strukturen der bedingten Unabhängigkeit auf. Dies bedeutet, dass viele Standardalgorithmen für das Lernen von graphischen Modellen nicht auf Daten angewandt werden können, die durch ein max-lineares Bayes'sches Netz erzeugt wurden. Während MLBNs nicht d-separationstreu sind, haben Amendola et. al. vor kurzem ein neues graphisches Separationskriterium, die *-Separation, entwickelt, das die bedingte Unabhängigkeit in diesen Modellen charakterisiert. Das Hauptziel unseres Projekts besteht darin, kombinatorische Algorithmen zu entwickeln, die einen DAG rekonstruieren, der die von einem MLBN erzeugten Daten am besten repräsentiert, und die nur die Einhaltung der *-Separation erfordern. Viele der klassischen Algorithmen, die für die d-Separation entwickelt wurden, beruhen auf kombinatorischen Ergebnissen, die beschreiben, wann zwei Graphen Markov-äquivalent sind, welche Art von Konditionierungssätzen für eine d-Separation erforderlich sind und wie sich das Löschen und Hinzufügen von Kanten auf die CI-Relationen des Graphen auswirkt. Durch die Entwicklung analoger Ergebnisse für das neue *-Separationskriterium werden wir in der Lage sein, Algorithmen zu entwickeln, die eine Markov-Äquivalenzklasse von MLBNs aus Daten zu rekonstruieren kann. Ein natürlicher nächster Schritt für kausale Inferenz besteht darin, zu verstehen, welcher Graph in der Äquivalenzklasse die korrekte kausale Struktur kodiert. Dies geschieht häufig mit Interventionen, bei denen zusätzliche Daten durch Beeinflussung einer einzelnen Zufallsvariablen erhoben werden. Für klassische graphische Modelle ist bekannt, wie Interventionen die MECs verändern, aber diese Ergebnisse gelten nicht für MLBNs. Das nächste Ziel unseres Projekts ist es, die MECs für MLBNs zu charakterisieren und daraus abzuleiten, wie viele Interventionen erforderlich sind, um die wahre Kausalstruktur zu bestimmen.
DFG-Verfahren Schwerpunktprogramme
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung