Detailseite
Integration von klinischen und molekularen Patientendaten in Subgruppen-Risikoprädiktionsmodelle als Basis individualisierter Therapie
Antragsteller
Professor Dr. Harald Binder
Fachliche Zuordnung
Epidemiologie und Medizinische Biometrie/Statistik
Förderung
Förderung von 2013 bis 2017
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 243584364
Molekulare Messungen von Patienten, z.B. zur Genexpression, versprechen eine verbesserte Risikovorhersage für Endpunkte wie ein Rezidiv oder Tod bei Krebspatienten. Derartige hochdimensionale Messungen werden auch verwendet, um über Clustering-Techniken molekulare Untergruppen zu identifizieren. Modelle zur Risikovorhersage innerhalb solcher Untergruppen können eine Basis für individualisieren Therapie sein, da sie spezifischere Vorhersagen für einzelne Patienten erlauben. Allerdings fehlt bisher ein objektiver, automatisierter Ansatz, um derartige Modelle für Untergruppen zu entwickeln. Im vorliegenden Projekt wird eine Reihe von methodischen Problemen bearbeitet, um derartige Ansätze zu entwickeln: Bisher wurden Clustering-Ansätze nicht dafür optimiert, optimale Vorhersageleistung anhand von Modellen in Untergruppen zu erzielen, d.h. Clustering-Techniken müssen erst noch mit Techniken zur Anpassung von Vorhersagemodellen verknüpft werden. Auch wird die Zahl von Beobachtungen in Untergruppen oft klein sein, was nach einem Ansatz verlangt, um Information aus den anderen Gruppen noch zu einem gewissen Grad einbeziehen zu können. Sowohl für das Clustering als auch für die Modellanpassung müssen sowohl molekulare als auch klinische Merkmale integriert werden. Während Techniken für eine derartige Kombination für die Modellanpassung schon vorhanden sind, liegt der Fokus bei Clustering-Techniken bisher meist auf molekularen Messungen. Auch zur Auswahl wichtiger Einflussgrößen wurden im Bereich des Clustering erst vor kurzem vermehrt sogenannte Subspace-Techniken betrachtet. Als eine zentrale Technik wird das Projekt die lokalisierte Regression erweitern, die bei der Anpassung von Modellen in einer Untergruppe Beobachtungen aus den anderen Untergruppen einbeziehen kann. Dieser Ansatz wird mit traditionellen Clustering-Techniken kombiniert werden, bevor zu Subspace-Clustering-Techniken übergegangen wird. Neben der Vorhersageleistung wird dabei die Stabilität der identifizierten molekularen Signaturen ein zentrales Bewertungskriterium sein. Die Clustering-Techniken werden so erweitert werden, dass der Unterschied zwischen klinischen und molekularen Merkmalen adäquat berücksichtigt wird. Weiterhin wird Wissen über Gengruppen, z.B. über die gemeinsame Beteiligung an Signalwegen, einbezogen. Das Projekt wird auch Clustering-Techniken entwickeln, die vorrangig Information extrahieren, die komplementär zu der aus den Risikovorhersagemodellen ist, und auch Techniken, welche die Ähnlichkeit von Signaturen als Clustering-Kriterium verwenden. Die Technik der Logic-Regression wird adaptiert, um Beschreibungen der identifizierten Untergruppen und Risikogruppen zu erhalten, und einen Vergleich zu Verfahren zu ermöglichen, die auf der direkten Suche nach Interaktionen aufbauen. Zur Optimierung der Verfahren werden reale Anwendungen mit Genexpressionsmessungen von Brustkrebspatientinnen und SNP-Daten aus einer epidemiologischen Kohorte betrachtet.
DFG-Verfahren
Sachbeihilfen