Anwendung von Nichtgleichgewichtsfluktuationstheoremen in der Bayes'schen Datenanalyse
Zusammenfassung der Projektergebnisse
Statistische Datenanalyse ist für alle quantitativen Wissenschaften von zentraler Bedeutung. Die Auswertung von Beobachtungen erfordert eine systematische Trennung der gesuchten Information von den zufälligen Störungen durch Rauschen, Wechselwirkung mit anderen Systemen, Unzulänglichkeiten der Messgeräte und sonstige unkontrollierbare Einflüsse. Besonders transparent lässt sich dieser Schritt mit Hilfe der Bayes’schen Statistik durchführen, die eine im Mittel optimale Kombination der vor der Messung vorhandenen Information mit der durch die Messung bereitgestellten erlaubt. In der praktischen Durchführung von Bayes-Analysen müssen häufig hochdimensionale Integrale berechnet werden, die von kleinen, mitunter verwinkelten Bereichen dominiert werden. Diese Berechnungen können oft mit numerischen Methoden aus der statistischen Physik effektiv durchgeführt werden. In unserem Projekt haben wir die Übertragung einer erst kürzlich entdeckten Klasse exakter Beziehungen aus der statistischen Physik in die Bayes’sche Datenanalyse untersucht. Anhand qualitativ verschiedener Modellsituationen konnten wir zeigen, dass diese Beziehungen im Fall multimodaler Wahrscheinlichkeitsverteilungen Vorteile gegenüber herkömmlichen Methoden haben, und zwar sowohl für den Problemkreis der Modellselektion als auch bei der Berechnung von Mittelwerten über die letztendliche Verteilung der Modellparameter. Der wesentliche Vorteil des Verfahrens besteht darin, dass es nicht an Gleichgewichtssituationen gebunden ist und damit Probleme mit langen Equilibrierungszeiten vermeidet. Allerdings liegt der Methode ein nichtlinearer Mittelwert zugrunde, der durch seltene Ereignisse dominiert werden kann und mitunter schlecht konvergiert. Daher ist eine systematische Fehleranalyse des Verfahrens unerlässlich, die wir im vorliegenden Projekt durchgeführt haben, und die einen Ausdruck für das Konfidenzintervall des zentralen Schätzers in Abhängigkeit von der Größe der Stichprobe liefert. Unsere Methode hat das Potential für weitere Verfeinerungen und Optimierungen. Wir hoffen sehr, dass unser Verfahren von der großen Gemeinschaft der statistischen Datenanalytiker zur Kenntnis genommen wird und bei realistischen Bayes-Problemen mit Vorteil eingesetzt werden kann. Unsere eigenen Untersuchungen gehören zur theoretischen Grundlagenforschung und scheinen uns für eine öffentlichkeitswirksame Darstellung wenig geeignet.
Projektbezogene Publikationen (Auswahl)
-
“Fast growth simulation in Bayesian model selection”. Workshop “NETADIS Statistical Physics Approaches to Networks Across Disciplines, Hillerod (Denmark), 8. - 22.09.2013
E. Barykina und A. Engel
-
“Prior-predictive value from fast-growth simulations: Error analysis and bias estimation”
A. Favaro, D. Nickelsen, E. Barykina und A. Engel