Project Details
Entwicklung eines Systems zur deklarativen Beschreibung und effizienten Suche hybrider Muster in großen genomischen Datenmengen
Applicant
Professor Dr. Gerhard Steger
Subject Area
Computer Science
Term
from 1998 to 2004
Project identifier
Deutsche Forschungsgemeinschaft (DFG) - Project number 5131314
Es soll ein System entwickelt werden, das es ermöglicht, grosse Biosequenz-Datenbanken nach komplexen Mustern auf Nukleinsäure- und Protein-Ebene zu durchsuchen. Als Muster sind sog. hybride Muster erlaubt, die Sequenzähnlichkeit, strukturelle Ähnlichkeit und weitere, frei definierbare Merkmale, wie z.B. thermodynamische Nebenbedingungen, kombinieren. Es wurde begonnen, eine Bibliothek biologisch relevanter Muster zu erstellen und anhand dieser Testfälle eine deklarative Musterbeschreibungssprache zu entwickeln. Die Erstellung der Muster, die bisher per Hand erfolgte, soll aufbauend auf unserer bisherigen Erfahrung z.T. automatisiert werden, um die Vervollständigung der Bibliothek von Musterbeschreibungen zu beschleunigen. Parallel dazu wurde begonnen, einen Prototypen des Suchwerkzeugs zu erstellen; einige grundlegende Algorithmen zur effizienten Suche der Muster sind bereits implementiert; ihre Integration und die Optimierung der Suchreihenfolge für einzelne Teilmuster stehen noch aus. Die Bibliothek biologisch relevanter Muster soll inkl. Suchwerkzeug und einer Visualisierungskomponente zur vereinfachten Darstellung der Suchantworten im WWW zur Verfügung gestellt werden. Die Erprobung des Werkzeugs an vorliegenden Gendatenbeständen schliesst in ausgewählten Fällen die labortechnische Überprüfung algorithmisch gewonnener Funktionshypothesen ein.
DFG Programme
Priority Programmes