Detailseite
Projekt Druckansicht

Sind Koaleszenten mit (simultan) multiplen Verschmelzungen geeignete Genealogie-Modelle für Stichproben in realen Populationen?

Antragsteller Dr. Fabian Freund
Fachliche Zuordnung Mathematik
Förderung Förderung von 2015 bis 2020
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 284099193
 
Um zu analysieren, welchen Einflüssen eine reale Population in der Vergangenheit ausgesetzt war, kann man die genetische Diversität einer Stichprobe aus einer realen Population mit ihrer Verteilung unter einem oder mehreren theoretischen Modellen vergleichen, die mögliche Szenarien, unter denen sich die Population entwickelt hat, beschreiben. Solche Modelle beinhalten ein Modell der Genealogie der Stichprobe. Nimmt man eine Stichprobe der Größe n eines einzelnen, selektiv neutralen genetischen Locus ohne Rekombination aus einer sehr viel größeren Population mit zufälliger Partnerwahl und konstanter Populationsgröße, so ist das Standard-Genealogie-Modell der Kingman-n-Coalescent. Der Kingman-n-Coalescent ist ein zufälliger Binärbaum mit n Blättern. Dieses Genealogie-Modell kann erweitert werden, um Einflüsse von z.B. Änderungen in der Populationsgröße oder vorhandener Populationsstruktur zu beschreiben, ohne dass der Baum seine Binärbaum-Eigenschaft verliert. Das Modellieren anderer möglicher Eigenschaften einer Population (etwa reproduction sweepstakes, rapid selection) führt jedoch dazu, dass das Genealogie-Baummodell die Binärbaum-Eigenschaft verliert und ein n-Koaleszent mit (simultan) multiplen Verschmelzungen als mögliches Genealogie-Modell in Frage kommt. Im Rahmen dieses Projekts soll untersucht werden, ob die genetische Diversität in Stichproben aus realen Populationen, für die theoretische Modelle einen n-Koaleszenten mit (simultan) multiplen Verschmelzungen als mögliches Genealogie-Modell voraussagen, auch tatsächlich besser zu diesem Modell passt als zu (erweiterten) Kingman-n-Coalescents. Verschiedene statistische Methoden (gene tree maximum likelihood, approximate Bayesian computation (ABC), approximate likelihood und ein auf minimum-distance-Statistiken basierender Ansatz, alle Methoden bis auf die erste basieren auf dem Frequenz-Spektrum der beobachteten Mutationen) können verwendet werden, um zwischen Koaleszenten mit (simultan) multiplen Verschmelzungen und dem Kingman-n-Coalescent als Genealogie-Modell zu unterscheiden. Weitere Ziele dieses Projekts sind die Weiterentwicklung der ABC-Inferenzmethode und die Entwicklung einer Teststatistik für das beschriebene Inferenz-Problem, die andere genetische Informationen verwendet als das Mutations-Frequenz-Spektrum. Die Inferenz-Qualität der verschiedenen Methoden wird mittels einer Simulationsstudie verglichen werden, um die beste(n) Inferenzmethode(n) zu ermitteln, um zwischen verschiedenen Gruppen von n-Koaleszenten zu unterscheiden. Diese Inferenzmethoden werden auf Stichproben aus Populationen angewendet, für die ein n-Koaleszent mit (simultan) multiplen Verschmelzungen ein biologisch sinnvolles Genealogie-Modell sein könnte, wobei dieses mit anderen, Kingman-n-Coalescent-basierten Modellen verglichen wird. Die Resultate werden im Rahmen der bekannten Eigenschaften der Populationen diskutiert.
DFG-Verfahren Schwerpunktprogramme
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung