Detailseite
Projekt Druckansicht

Offloading und präventiver Umgang mit korrelierten Fehlern für resiliente Kommunikationsnetze

Fachliche Zuordnung Sicherheit und Verlässlichkeit, Betriebs-, Kommunikations- und verteilte Systeme
Förderung Förderung seit 2022
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 503231190
 
Das Projekt arbeitet an Verbesserungen für resiliente Kommunikationsinfrastrukturen. Zum einen wird die Implementierung komplexer Resilienz-Mechanismen durch Offloading mit Hilfe effizienter Paketverarbeitungs-Frameworks (EPVFs) ermöglicht. Zum anderen werden Netze so geplant und bestehende Netze so angepasst, dass sie korrelierte Fehler besser verkraften können. EPVFs verarbeiten Pakete effizienter als normale User-Space Programme, weil sie einen Teil des Overheads vermeiden, der durch Networking Stack und Kernel verursacht wird. Beispiele für EPVFs sind eBPF, DPDK und Snabb. Sie sind für die Programmierung hochperformanter Virtual Network Functions (VNFs) geeignet, um Gerätefunktionalität auf Server- oder SmartNIC-CPUs auszulagern. Performanz ist für Offloading wichtig. Deswegen werden Bauteile für VNFs wie Änderung von Headern oder En- und Dekapsulierung mit unterschiedlichen EPVFs implementiert und ihr Durchsatz auf Server- und SmartNIC-CPUs umfassend verglichen. Weiter werden unterschiedliche Signalisierungsoptionen für Offloadding untersucht. Neue Netzfunktionen werden implementiert, welche zu komplex für Implementierung auf programmierbarer Hardware sind, und ihre Leistung wird untersucht. Sie verbessern Verfügbarkeit und Sicherheit. Beispiele sind Packet Replication, Elimination, and Ordering Function (PREOF) und Network Attestation for Secure Routing (NASR). Weiter wird Offloading zur Erweiterung von Bestands-Hardware um neue Funktionen untersucht. Beispiele dafür sind MPLS Network Actions (MNAs), welche neue Mechanismen für resiliente Weiterleitung definieren. Diese Aktivitäten sind in die Standardisierung der IETF eingebettet. Korrelierte Ausfälle vieler ähnlicher Komponenten können beispielsweise durch Sicherheitsvorfälle, Software-Fehler oder Update-Probleme ausgelöst werden. Wenn viele Geräte sich eine verwundbare Eigenschaft teilen, kann dies massive Ausfälle verursachen. Wir definieren Generalized Shared Risk Groups (GSRGs) als Menge von Hardware- oder Software-Komponenten eines Netzes, bei denen eine technische Eigenschaft sich überlappt, z.B. CPU, Betriebssystem oder Anwendungsprogramme. Sie unterscheiden sich von normalen Shared Risk Groups, weil sie nicht von einer gemeinsam genutzten Infrastruktur abhängen. GSRGs vergangener Vorfälle werden klassifiziert und für existierende Netze modelliert. Ihre Auswirkung auf Netzbetrieb und Diensterbringung wird als Resilienzmetrik ermittelt. Netze mit heterogenen Komponenten haben mehr GSRGs, die dafür aber kleiner sind. Dies kann die Resilienz verbessern, wenn die heterogenen Komponenten geeignet angeordnet sind und geeignet genutzt werden. Bei der Platzierung heterogener Komponenten in einem Netz besteht somit ein Optimierungspotenzial, ebenso wie bei der Platzierung von Resilienzmechanismen einschließlich deren Offloading. Im Projekt betrachten wir dies sowohl für neue als auch für bestehende Netze, wenn nur wenige Geräte durch neue ausgetauscht werden.
DFG-Verfahren Schwerpunktprogramme
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung