Detailseite
Kombinatorische Methoden für das Lernen von Max-Linearen Bayes'schen Netzen
Antragsteller
Dr. Carlos Améndola Cerón; Benjamin Hollering, Ph.D.
Fachliche Zuordnung
Mathematik
Förderung
Förderung seit 2024
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 539875257
Gerichtete azyklische graphische Modelle, manchmal auch Bayes'sche Netze genannt, sind in der modernen Datenwissenschaft und Statistik aufgrund ihrer Anwendungen auf Kausalität und probabilistische Schlussfolgerungen von entscheidender Bedeutung. Diese statistischen Modelle verwenden gerichtete azyklische Graphen (DAGs auf Englisch), um kausale Beziehungen zwischen Zufallsvariablen darzustellen, und werden häufig durch ein System von Strukturgleichungen spezifiziert, das mit Hilfe des zugehörigen DAGs definiert wird. In diesem Antrag konzentrieren wir uns auf eine relativ neue Familie von gerichteten graphischen Modellen, die als max-linearen Bayes'sche Netze (MLBN) bezeichnet werden. Diese Modelle eignen sich hervorragend für die Modellierung von Kaskadenfehlern und finden in vielen Bereichen Anwendung, in denen dies häufig vorkommt, wie z.B. bei finanziellen Risiken und Wasserverschmutzung. Im Gegensatz zu vielen anderen klassischen Familien graphischer Modelle halten sie sich nicht an das bekannte d-Separationskriterium und weisen daher sehr unterschiedliche Strukturen der bedingten Unabhängigkeit auf. Dies bedeutet, dass viele Standardalgorithmen für das Lernen von graphischen Modellen nicht auf Daten angewandt werden können, die durch ein max-lineares Bayes'sches Netz erzeugt wurden. Während MLBNs nicht d-separationstreu sind, haben Amendola et. al. vor kurzem ein neues graphisches Separationskriterium, die *-Separation, entwickelt, das die bedingte Unabhängigkeit in diesen Modellen charakterisiert. Das Hauptziel unseres Projekts besteht darin, kombinatorische Algorithmen zu entwickeln, die einen DAG rekonstruieren, der die von einem MLBN erzeugten Daten am besten repräsentiert, und die nur die Einhaltung der *-Separation erfordern. Viele der klassischen Algorithmen, die für die d-Separation entwickelt wurden, beruhen auf kombinatorischen Ergebnissen, die beschreiben, wann zwei Graphen Markov-äquivalent sind, welche Art von Konditionierungssätzen für eine d-Separation erforderlich sind und wie sich das Löschen und Hinzufügen von Kanten auf die CI-Relationen des Graphen auswirkt. Durch die Entwicklung analoger Ergebnisse für das neue *-Separationskriterium werden wir in der Lage sein, Algorithmen zu entwickeln, die eine Markov-Äquivalenzklasse von MLBNs aus Daten zu rekonstruieren kann. Ein natürlicher nächster Schritt für kausale Inferenz besteht darin, zu verstehen, welcher Graph in der Äquivalenzklasse die korrekte kausale Struktur kodiert. Dies geschieht häufig mit Interventionen, bei denen zusätzliche Daten durch Beeinflussung einer einzelnen Zufallsvariablen erhoben werden. Für klassische graphische Modelle ist bekannt, wie Interventionen die MECs verändern, aber diese Ergebnisse gelten nicht für MLBNs. Das nächste Ziel unseres Projekts ist es, die MECs für MLBNs zu charakterisieren und daraus abzuleiten, wie viele Interventionen erforderlich sind, um die wahre Kausalstruktur zu bestimmen.
DFG-Verfahren
Schwerpunktprogramme
Teilprojekt zu
SPP 2458:
Kombinatorische Synergien