Detailseite
Statistische Theorie zu endlichen Alphabets Strukturen: Inferenz, Algorithmen und Anwendungen
Antragstellerin
Professorin Dr. Merle Behr
Fachliche Zuordnung
Mathematik
Förderung
Förderung von 2018 bis 2020
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 411042450
Ein wesentliches Forschungsthema der modernen Statistik sind stark unterbestimmte Modelle. Das heißt, dass die Menge der unbekannten Parameter wesentlich größer ist als die Menge der beobachteten Daten. In solchen Situationen ist es im Allgemeinen unmöglich sinnvolle Schlussfolgerungen über die Parameter zu treffen, da diese nicht identifizierbar sind. Deshalb müssen immer zusätzliche strukturelle Annahmen getroffen werden. Im Wesentlichen benötigt man eine Art „Dünnbesetztheit“ (engl. „Sparsity“): auch wenn der Parameter komplex (z.B. hochdimensional) ist, hat er eine simple (z.B. niedrigdimensionale) zugrunde liegende Struktur.Der Fokus des vorgeschlagenen Forschungsvorhabens basiert auf einer Art der Dünnbesetztheit, die bis jetzt relativ wenig Aufmerksamkeit erhalten hat, nämlich Dünnbesetztheit in den Funktionswerten eines Signals durch ein gegebenes endliches Alphabet (EA). EA-Strukturen tauchen in vielen verschiedenen Bereichen auf, zum Beispiel in der Krebsgenetik, wo DNA Kopiezahlen nur wenige bekannte Werte annehmen können, und in der digitalen Kommunikation mit binären Signalen.Im Theorieteil dieses Vorhabens soll gemeinsam mit Prof. Martin Wainwright (UC Berkeley) und Prof. Bin Yu (UC Berkeley) analysiert werden wie EA-Strukturen sinnvolle Inferenz in unterbestimmten statistischen Modellen ermöglichen, an Stelle von und in Kombination mit klassischer Dünnbesetztheit. Zunächst sollen dabei Modelle für blinde Quellentrennung betrachtet werden. Anschließend sollen diese Resultate für weitere wichtige Klassen statistischer Modelle erweitert werden, insbesondere für hochdimensionale lineare Modelle. Obwohl EA-Strukturen das Identifizierbarkeitsproblem lösen können, führt ihre kombinatorische Natur zu erheblichen Problemen der Berechenbarkeit. Eine wesentliche Aufgabenstellung dieses Vorhabens ist es deshalb diese Lücke zwischen statistischer (minimax) Optimalität und effizienter Berechenbarkeit zu quantifizieren und schnell berechenbare Methoden zu entwickeln, die dennoch statistisch hinreichend effizient sind. Aufbauend darauf soll im Analyseteil eine Modifikation von EA-Strukturen untersucht werden: Die Suche nach Teilgruppen in klinischen Studien, führt häufig zu Segmentierungsproblemen bei denen spezielle EA durch phylogenetische Bäume induziert werden. Hier sollen Multiskalen-Methoden für Baumstrukturen entwickelt werden, da diese nicht nur minimax optimale Schätzer sondern auch Konfidenzaussagen liefern. Insbesondere in medizinischen Anwendungen kann dies von großer Bedeutung sein. In Kooperation mit Prof. Bin Yu (UC Berkeley) und dem Wellcome Trust Center for Human Genetics (Oxford), wollen wir anhand von Datenbeispielen zeigen wie EA-Methoden erhebliche Fortschritte im Bereich der personalisierten Medizin liefern können.
DFG-Verfahren
Forschungsstipendien
Internationaler Bezug
USA
Gastgeberinnen / Gastgeber
Professor Martin J. Wainwright; Professorin Dr. Bin Yu