Detailseite
Projekt Druckansicht

Multivariate Algorithmik für Graph- und Zeichenkettenprobleme der Bioinformatik

Fachliche Zuordnung Theoretische Informatik
Bioinformatik und Theoretische Biologie
Förderung Förderung von 2015 bis 2022
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 289297972
 
Erstellungsjahr 2021

Zusammenfassung der Projektergebnisse

Das Projekt MAGZ beschäftigte sich mit der Fortentwicklung des Ansatzes der multivariaten Algorithmik zur Lösung algorithmisch schwieriger Probleme, mit einem besonderen Fokus auf schwere Graph- und Zeichenkettenprobleme der Bioinformatik. Die multivariate Algorithmik versucht, strukturelle Aspekte von typischen Eingabedaten auszunutzen um so zu effizienten Algorithmen für realistische Probleminstanzen zu gelangen. Diese strukturellen Aspekte werden durch Parameter beschrieben. Auf theoretischer Seite sollten in MAGZ neue Parameter entdeckt werden, welche bisher weniger untersuchte strukturelle Aspekte der Eingabedaten beschreiben. Für Cluster Editing, ein fundamentales Problem im graphbasierten Datenclustern, konnte etwa eine neue Familie von Parametern identifiziert werden, welche sich algorithmisch ausnutzen lassen. Diese Parameter messen, wie weit entfernt die Größe k einer optimale Lösung von einer zuvor berechneten unteren Schranke ℓ für k ist. Daher sind diese Parameter kleiner als der bisher für Cluster Editing verwandte Parameter k und somit können Algorithmen, die diese Parameter verwenden, eine größere Menge an Eingabedaten effizient lösen. Auch für einige Zeichenkettenprobleme mit Anwendungen in der vergleichenden Genomik und synthetischen Biologie konnten substanziell verbesserte FPT-Algorithmen entwickelt werden. Der hier für zwei Probleme verwandte Ansatz der Übersetzung der Zeichenkettenprobleme auf ein Pfadproblem in einem Hilfsgraphen und anschließende Berechnung des Pfades mit algebraischen Algorithmen könnte für weitere schwere Zeichenkettenprobleme vielversprechend sein. Darüber hinaus konnten für eine große Reihe an Teilgraphproblemen scharfe untere Laufzeitschranken bewiesen werden. Diese haben zur Folge, dass exakte Algorithmen für diese Teilgraphprobleme mutmaßlich exponentielle Laufzeit benötigen. Auf praktischer Seite hatte MAGZ zum Ziel, mehrere multivariate Algorithmen so fortzuentwickeln, dass sie etablierten Lösungsansätzen für schwere Probleme, etwa dem ganzzahligen linearen Programmieren (ILP), ebenbürtig sind. Die entwickelten Algorithmen sollten in der Lage sein, exakte Lösungen für schwere Probleme auf Instanzen zu berechnen, die auf genomweiten Daten basieren. Für Graphprobleme bedeutet dies etwa, dass die Probleme auf Graphen mit etwa 100 000 Knoten gelöst werden sollten. Mit FixCon wurde in MAGZ ein generischer Solver für eine große Klasse an Teilgraphproblemen entwickelt. Dieser Solver erreichte das Projektziel, einen den ILPs ebenbürtigen Lösungsalgorithmus zu entwickeln, der diese Teilgraphprobleme auf genomweiten Datensätzen zufriedenstellend löst. Eine Weiterentwicklung und Erweiterung dieses Solvers, etwa für Teilgraphprobleme in gewichteten und gefärbten Graphen, ist geplant.

Projektbezogene Publikationen (Auswahl)

 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung