Detailseite
Entwicklung eines Systems zur deklarativen Beschreibung und effizienten Suche hybrider Muster in großen genomischen Datenmengen
Antragsteller
Professor Dr. Gerhard Steger
Fachliche Zuordnung
Informatik
Förderung
Förderung von 1998 bis 2004
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 5131314
Es soll ein System entwickelt werden, das es ermöglicht, grosse Biosequenz-Datenbanken nach komplexen Mustern auf Nukleinsäure- und Protein-Ebene zu durchsuchen. Als Muster sind sog. hybride Muster erlaubt, die Sequenzähnlichkeit, strukturelle Ähnlichkeit und weitere, frei definierbare Merkmale, wie z.B. thermodynamische Nebenbedingungen, kombinieren. Es wurde begonnen, eine Bibliothek biologisch relevanter Muster zu erstellen und anhand dieser Testfälle eine deklarative Musterbeschreibungssprache zu entwickeln. Die Erstellung der Muster, die bisher per Hand erfolgte, soll aufbauend auf unserer bisherigen Erfahrung z.T. automatisiert werden, um die Vervollständigung der Bibliothek von Musterbeschreibungen zu beschleunigen. Parallel dazu wurde begonnen, einen Prototypen des Suchwerkzeugs zu erstellen; einige grundlegende Algorithmen zur effizienten Suche der Muster sind bereits implementiert; ihre Integration und die Optimierung der Suchreihenfolge für einzelne Teilmuster stehen noch aus. Die Bibliothek biologisch relevanter Muster soll inkl. Suchwerkzeug und einer Visualisierungskomponente zur vereinfachten Darstellung der Suchantworten im WWW zur Verfügung gestellt werden. Die Erprobung des Werkzeugs an vorliegenden Gendatenbeständen schliesst in ausgewählten Fällen die labortechnische Überprüfung algorithmisch gewonnener Funktionshypothesen ein.
DFG-Verfahren
Schwerpunktprogramme