Genealogische Eigenschaften spatialer Modelle der Populationsgenetik
Mathematik
Zusammenfassung der Projektergebnisse
An der Schnittstelle zwischen Phylo- und Populationsgenetik und neuerdings stark von der Epidemonologie inspiriert, umfasst die Disziplin der Phylogeographie Modellierungstechniken aus der klassischen theoretischen Biologie und kombiniert sie mit einem räumlichen (2D- oder 3D-) Aspekt mit dem Ziel, geografische Informationen in der Analyse zu nutzen, um die Evolutionsgeschichte eines biologischen Systems oder Aspekte der Virologie wie Richtungsabhängigkeit und Saisonalität bei Pandemieausbrüchen zu verstehen. Ein hervorragendes Beispiel hierfür sind Datensätze, die die Entnahmestellen ihrer Komponenten berücksichtigen (georeferenzierte genomische Daten). In diesem Projekt konzentrierten wir uns auf das Modell des "spatialen Lambda-Fleming-Viot-Prozesses" (ΛV) und analysierten seine statistischen Eigenschaften sowohl in der Zeit vorwärts als auch im (dualen) Ahnenprozess, mit Ergebnissen, die für die Ableitung von Parametern verwendet werden können. Von besonderem Interesse war die räumliche Varianz, bezeichnet mit θ, ein Parameter, der die Geschwindigkeit steuert, mit der sich die genetische Information im Raum ausbreitet, und somit ein Analogon der Reproduktionszahl (R0 ), die in der Epidemonologie z. B. zur Beurteilung der Infektiosität verschiedener Virusstämme verwendet wird. Wir untersuchten die Beziehung zwischen diesem Parameter und der Zeit bis zur Koaleszenz zwischen Abstammungslinien in diesem Modell und beschrieben Methoden zur Schätzung dieses Parameters anhand von Stichprobendaten unter verschiedenen Umständen. Darüber hinaus wurden Ähnlichkeiten und Unterschiede zwischen diesem Modell und klassischen Modellen in der Populationsgenetik herausgearbeitet, insbesondere zu Birth-Death-Prozessen, die häufig für alle Arten von biologischen Inferenzproblemen verwendet werden, aber an sich keine räumliche Komponente aufweisen. Der ΛV wurde mit einer Variante des Birth-Death-Prozesses verglichen, bei welcher der Standort eines lebenden Individuums im Laufe seines Lebens einer Brownschen Bewegung folgt. Dieser Prozess lässt sich nicht so leicht in der Zeit zurückverfolgen wie der ΛV, aber der genalogische Prozess kann durch Markov-Chain Monte Carlo-Simulation approximiert werden, da die Wahrscheinlichkeiten für die Positionen der Vorfahren und die Länge der Verzweigungen leicht berechnet werden können, so dass dieses Modell leicht auf Daten anwendbar ist. Unsere Analyse unterstreicht die Analogie zwischen den beiden Prozessen sowohl vorwärts als auch rückwärts in der Zeit; andererseits beobachteten wir auch divergente Verhaltensweisen der beiden Modelle, wenn kein Prior auf der phylogenetischen Zeitskala angenommen wurde. Zuletzt wurden im Rahmen dieses Projekts kombinatorische Eigenschaften von genealogischen Bäumen untersucht, die für den ΛV, die Birth-Death- und andere biologische Prozesse relevant sind. Insbesondere waren wir in der Lage, die kombinatorische Klasse genealogischer Bäume, die aus diesen Prozessen hervorgehen, zu identifizieren und eine Vermutung bezüglich ihrer Aufzählung zu verifizieren. Vorläufige Versionen von Software-Tools für die oben erwähnte Inferenz wurden ebenfalls zur Verfügung gestellt.
Projektbezogene Publikationen (Auswahl)
-
Rate of coalescence of lineage pairs in the Spatial λ-Fleming–Viot process. Theoretical Population Biology, 146, 15-28.
Wirtz, Johannes & Guindon, Stéphane
-
On the enumeration of leaf-labeled increasing trees with arbitrary node-degree. The Art of Discrete and Applied Mathematics, 7(1), #P1.10.
Wirtz, Johannes
-
On the connections between the spatial Lambda–Fleming–Viot model and other processes for analysing geo-referenced genetic data. Theoretical Population Biology, 158, 139-149.
Wirtz, Johannes & Guindon, Stéphane
