Detailseite
Der sequentielle Markov Koaleszenz Prozess mit räumlicher Heterogenität der Parameter
Antragsteller
Julien Dutheil, Ph.D.
Fachliche Zuordnung
Mathematik
Förderung
Förderung von 2015 bis 2019
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 285412928
Der sequentielle Markov Koaleszenz (SMC) Prozess ist ein Annäherungsverfahren für einen Koaleszenz Prozess unter Rekombination, wodurch er auf Gesamt-Genom Daten anwendbar wird. Der SMC Prozess unterscheidet sich von einem Standard Koaleszenz Prozess dadurch, dass er die Genealogie von Sequenzabschnitten entlang eines Genomalignments statt einer zeitlichen Abfolge betrachtet. Zudem folgt die Genealogie Veränderung entlang des Genoms einem Markov Prozess, was die Anwendung von hidden Markov Modellen für die Ermittlung populations-genomischer Parameter ermöglicht. Im Gegensatz zum SMC Prozess basieren gegenwärtige Modelle auf der Annahme einer Homogenität der Parameter entlang des Genoms. Eine solche Annahme ist aber biologisch nicht gerechtfertigt, da Mutationsrate, Rekombinationsrate und effektive Populationsgröße sehr heterogen sein können. SMC Modelle sind bisher ausschließlich bei Primaten Genomen verwendet worden, die ein großes Genom besitzen in dem die Heterogenität sich ausgleicht. Durch die weitere Verbreitung der Gesamt-Genom Sequenzierungen werden populationsgenomische Daten aber auch zunehmend für Spezies mit kleineren und kompakteren Genomen generiert. In diesen Fällen kann die Parameter Heterogenität von entscheidender Bedeutung werden. Zu diesen neuen Datensätzen gehören insbesondere auch solche für pathogene Pilze, die nicht mit den bisherigen vereinfachten Modellen analysierbar sind. Im vorliegenden Antrag wird die Erweiterung gegenwärtiger SMC Modelle vorgeschlagen um stochastische Prozesse entlang des Genoms zu berücksichtigen. Die Heterogenität wird dabei selbst als Markov Prozess modelliert, der dann mit dem SMC Markov Prozess kombiniert wird, womit man ein Markov-moduliertes sequentielles Markov Modell erhält. In dem Projekt sollen die formalen Eigenschaften eines solchen Markov-modulierten SMC (MMSMC) analytisch und durch Simulationen untersucht werden. Damit sollen dann Beispiel Datensätze von Primaten und Pilzen untersucht werden.
DFG-Verfahren
Schwerpunktprogramme
Teilprojekt zu
SPP 1590:
Probabilistische Strukturen in der Evolution
Internationaler Bezug
Dänemark
Kooperationspartnerinnen / Kooperationspartner
Professor Asger Hobolth, Ph.D.; Professorin Eva Holtgrewe-Stukenbrock, Ph.D.