Detailseite
Projekt Druckansicht

Analyse von Dataset Shifts in mobiler Schadsoftware

Antragsteller Dr.-Ing. Daniel Arp
Fachliche Zuordnung Sicherheit und Verlässlichkeit, Betriebs-, Kommunikations- und verteilte Systeme
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung Förderung von 2021 bis 2023
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 456292433
 
Mobile Geräte, wie Smartphones und Tablets, sind in den vergangenenJahren sehr populär geworden und werden mittlerweile von mehrerenMilliarden Menschen weltweit genutzt. Allerdings haben sich dieseGeräte dadurch auch in kurzer Zeit zu einem lukrativen Ziel fürAutoren von Schadsoftware entwickelt, sodass die Zahl neu entdeckterVarianten mobiler Schadanwendungen in den letzten Jahren starkzugenommen hat.Durch die rasante Entwicklung mobiler Schadanwendungen haben bishereingesetzte Erkennungstechniken jedoch häufig Schwierigkeiten, neueSchadsoftware zuverlässig zu erkennen. In jüngster Zeit haben sichdaher maschinelle Lernverfahren als aussichtsreiche Alternativeherauskristallisiert und konnten in verschiedenen Szenarien bereitsgute Ergebnisse erzielen. Mit Hilfe dieser Methoden ist es möglich,große Datenbestände in kurzer Zeit zu analysieren und Erkennungsmusterfür aufkeimende Schadsoftware automatisch zu extrahieren.Im Allgemeinen basieren Lernmethoden allerdings auf der Annahme, dassdie zugrundeliegenden Verteilungen der Daten stationär sind, sich alsoüber die Zeit nicht ändern. In verschiedenen Studien konnte jedochgezeigt werden, dass dies bei mobiler Schadsoftware in der Regel nicht derFall ist, sondern die Verteilungen stattdessen kontinuierlichenÄnderungen unterworfen sind. Dieses in der maschinellen Lerntheorieals "Dataset Shift" bekannte Phänomen hat wiederum zur Folge, dass dieErkennungsleistung aktueller Lernansätze zum Teil drastisch über dieZeit abnimmt.Auch wenn bereits einige Faktoren bekannt sind, die zur Entstehung vonDataset Shifts in diesem Problemfeld beitragen, sind die genauenUrsachen bislang nur unzureichend geklärt. In diesem Forschungsprojektsollen daher die Ursachen für Dataset Shifts in mobilen Daten im Detailerforscht werden und anhand der gewonnenen Erkenntnisse neuelernbasierte Erkennungssysteme entwickelt werden, die im Gegensatz zubisher eingesetzten Verfahren eine robustere Identifikation vonSchadsoftware über die Zeit erlauben.Um dieses Ziel zu erreichen, soll zunächst der Leistungsabfallbestehender Erkennungsmethoden systematisch analysiert werden. Hierzusollen Techniken zur Interpretation verschiedener Lernmodelleeingesetzt werden, um Faktoren zu identifizieren, die zu einem Abfallder Erkennungsleistung dieser Systeme beitragen. Die aus dieserAnalyse gewonnenen Erkenntnisse sollen schließlich genutzt werden, umneue Erkennungssysteme zu entwickeln, die eine robustere Erkennung vonmobiler Schadsoftware über die Zeit erlauben. Darüber hinaus solluntersucht werden, inwieweit bereits aus anderen Bereichen bekannteTechniken zur Kompensation von Dataset Shifts auf den Bereich dermobilen Schadcodeerkennung übertragen werden können.
DFG-Verfahren WBP Stelle
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung