Detailseite
Vor- und Nachteile von Mega-Analysen verglichen mit Meta-Analysen bei genomweiten Assoziationsstudien
Antragstellerin
Professorin Dr. Iris M. Heid
Fachliche Zuordnung
Epidemiologie und Medizinische Biometrie/Statistik
Förderung
Förderung von 2017 bis 2021
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 360274005
Genomweite Assoziationsstudien sind überaus erfolgreich, um genetische Faktoren für komplexe Erkrankungen aufzuspüren. Um die Stichprobengröße und statistische Power zu erhöhen, werden diese Studien derzeit meist als Meta-Analysen von studienspezifischen aggregierten Statistiken für jeder der 0.5 - 30 Millionen genotypisierten und imputierten Varianten durchgeführt. Es besteht die Hypothese, dass das Sammeln von Individualdaten (individual participant data, IPD), welches eine gemeinsame Qualitätskontrolle, gemeinsame Genotyp-Imputation, und eine gemeinsame Modellierung des sehr großen Datensatzes ermöglicht (Mega-Analyse) statt der Meta-Analyse von aggregierten Statistiken die Fähigkeit, Erkrankungsgenorte zu detektieren, stark erhöhen würde. Allerdings gibt es kaum Arbeiten, die vergleichen, welcher Aspekt einer Mega-Analyse versus Meta-Analyse zu wieviel Verbesserung in Datenqualität und Erkrankungslokusdetektion in echten Datenszenarien führt. Solche Evaluationen fehlen aufgrund der hohen Anforderungen an Rechenleistung durch die Genotyp-Imputation und aufgrund des Mangels an geeigneten großen IPD Daten. Es bleibt die Frage, wieviel durch eine Mega-Analyse gewonnen werden kann, und ob es den Aufwand wert ist. Deshalb führen wir eine systematische Untersuchung der einzelnen Aspekte einer Mega-Analyse von großen IPD versus einer Meta-Analyse von studienspezifischen aggregierten Statistiken durch. Wir werden die Verbesserung in der Datenqualität und der Detektion von Erkrankungsgenorten in einem realen großen genomweiten IPD quantifizieren und die Informationen aus dem realen Datensatz mit Simulationsansätzen verbinden. Wir werden den Vergleich auf drei Ebenen, der Qualitätskontrolle, der Imputation und der Modellierung durchführen. Dabei werden auch die seltenen Varianten von Interesse sein.Basierend auf unseren früheren Arbeiten haben wir exklusiven Zugang zu einem großen genomweiten IPD (>40,000 Personen mit und ohne altersbedingten Makuladegeneration). Diese Augenerkrankung und unser Datensatz liefern ein ideales Vorbild, da der Datensatz > 12 Millionen genetische Varianten beinhaltet, inklusive 160,000 seltene Protein-verändernde Varianten, und 34 AMD Genorte mit großen und kleinen Effekten für häufige und seltene Varianten aufweist. Die Ergebnisse dieses Projekts werden zukünftigen genetischen Konsortien aufzeigen, ob der Aufwand, IPD für Mega-Analysen zu sammeln, sich lohnt und zur verbesserten Lokusdetektion führen kann. Die Ergebnisse werden uns auch zu einem verbesserten Verständnis verhelfen, wie große genomweite Multi-Zentrums-Studien, in welchen alle Daten als IPD zur Verfügung stehen, ausgewertet werden sollen.
DFG-Verfahren
Sachbeihilfen