Detailseite
Projekt Druckansicht

Praktische und Parallele Textkompression für hochrepetitive Daten

Fachliche Zuordnung Theoretische Informatik
Förderung Förderung seit 2022
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 501086801
 
Wir wollen praktikable Algorithmen zum Komprimieren von hochrepetitiven Daten entwickeln, die die Unzulänglichkeiten aktuell gängiger Kompressoren wie gzip oder bzip2 überwinden. Diese wurden in den 1990er Jahren etabliert und zielten auf Hardware ab, die damals Standard war; ihr Hauptnachteil besteht darin, dass sie keine Wiederholungen von Teilstrings erfassen, die weit auseinander liegen. Das erste Ziel dieses Projekts besteht darin, ein Komprimierungswerkzeug zu entwickeln und zu engineeren, das auch von solchen weit voneinander entfernten Wiederholungen profitiert, aber dennoch nur einen moderaten Speicherbedarf hat.Als zweites Ziel wollen wir die Shared-Memory-Parallelität ausnutzen, die in praktisch jeder CPU vorhanden ist, um die Komprimierung zu beschleunigen, ohne zu viel Komprimierungsverhältnis zu verlieren. Hier möchten wir einen breiteren Blick auf Kompressionsalgorithmen werfen und insbesondere Grammatikkompressoren einbeziehen, die hervorragende Eigenschaften für eine effiziente Parallelisierung haben.Im Idealfall werden beide Ideen zur besseren Nutzung moderner Ressourcen in produktionsreife Software-Repositories (wie Linux-Distributionen) integriert, sodass Endverbraucher problemlos von unseren Algorithmenentwicklungsleistungen profitieren können.
DFG-Verfahren Sachbeihilfen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung