Detailseite
Projekt Druckansicht

Statistische Theorie zu endlichen Alphabets Strukturen: Inferenz, Algorithmen und Anwendungen

Antragstellerin Professorin Dr. Merle Behr
Fachliche Zuordnung Mathematik
Förderung Förderung von 2018 bis 2020
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 411042450
 
Ein wesentliches Forschungsthema der modernen Statistik sind stark unterbestimmte Modelle. Das heißt, dass die Menge der unbekannten Parameter wesentlich größer ist als die Menge der beobachteten Daten. In solchen Situationen ist es im Allgemeinen unmöglich sinnvolle Schlussfolgerungen über die Parameter zu treffen, da diese nicht identifizierbar sind. Deshalb müssen immer zusätzliche strukturelle Annahmen getroffen werden. Im Wesentlichen benötigt man eine Art „Dünnbesetztheit“ (engl. „Sparsity“): auch wenn der Parameter komplex (z.B. hochdimensional) ist, hat er eine simple (z.B. niedrigdimensionale) zugrunde liegende Struktur.Der Fokus des vorgeschlagenen Forschungsvorhabens basiert auf einer Art der Dünnbesetztheit, die bis jetzt relativ wenig Aufmerksamkeit erhalten hat, nämlich Dünnbesetztheit in den Funktionswerten eines Signals durch ein gegebenes endliches Alphabet (EA). EA-Strukturen tauchen in vielen verschiedenen Bereichen auf, zum Beispiel in der Krebsgenetik, wo DNA Kopiezahlen nur wenige bekannte Werte annehmen können, und in der digitalen Kommunikation mit binären Signalen.Im Theorieteil dieses Vorhabens soll gemeinsam mit Prof. Martin Wainwright (UC Berkeley) und Prof. Bin Yu (UC Berkeley) analysiert werden wie EA-Strukturen sinnvolle Inferenz in unterbestimmten statistischen Modellen ermöglichen, an Stelle von und in Kombination mit klassischer Dünnbesetztheit. Zunächst sollen dabei Modelle für blinde Quellentrennung betrachtet werden. Anschließend sollen diese Resultate für weitere wichtige Klassen statistischer Modelle erweitert werden, insbesondere für hochdimensionale lineare Modelle. Obwohl EA-Strukturen das Identifizierbarkeitsproblem lösen können, führt ihre kombinatorische Natur zu erheblichen Problemen der Berechenbarkeit. Eine wesentliche Aufgabenstellung dieses Vorhabens ist es deshalb diese Lücke zwischen statistischer (minimax) Optimalität und effizienter Berechenbarkeit zu quantifizieren und schnell berechenbare Methoden zu entwickeln, die dennoch statistisch hinreichend effizient sind. Aufbauend darauf soll im Analyseteil eine Modifikation von EA-Strukturen untersucht werden: Die Suche nach Teilgruppen in klinischen Studien, führt häufig zu Segmentierungsproblemen bei denen spezielle EA durch phylogenetische Bäume induziert werden. Hier sollen Multiskalen-Methoden für Baumstrukturen entwickelt werden, da diese nicht nur minimax optimale Schätzer sondern auch Konfidenzaussagen liefern. Insbesondere in medizinischen Anwendungen kann dies von großer Bedeutung sein. In Kooperation mit Prof. Bin Yu (UC Berkeley) und dem Wellcome Trust Center for Human Genetics (Oxford), wollen wir anhand von Datenbeispielen zeigen wie EA-Methoden erhebliche Fortschritte im Bereich der personalisierten Medizin liefern können.
DFG-Verfahren Forschungsstipendien
Internationaler Bezug USA
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung