Detailseite
Analyse mathematischer Ausdrücke zur Erkennung verschleierter wissenschaftlicher Plagiate
Antragsteller
Professor Dr.-Ing. Bela Gipp; Dr. Moritz Schubotz
Fachliche Zuordnung
Datenmanagement, datenintensive Systeme, Informatik-Methoden in der Wirtschaftsinformatik
Förderung
Förderung seit 2020
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 437179652
Ziel des Projektes ist die Verbesserung von Verfahren zur Erkennung verschleierter wissenschaftlicher Plagiate, wie z.B. Paraphrasen, Übersetzungen oder Ideenplagiate, speziell für Dokumente in Mathematik, Ingenieur-, Natur- und Technikwissenschaften (MINT).Um dieses Ziel zu erreichen, leisten wir Grundlagenforschung zu der Frage, wie potenziell verdächtige Ähnlichkeiten zwischen Dokumenten durch die Analyse mathematischer Ausdrücke, als text- und sprachunabhängige Merkmale, erkannt werden können. Wir kombinieren diesen neuen, mathematikbasierten Ansatz der Plagiatserkennung mit text- und zitatbasierten Ansätzen aus unserer vorausgegangenen Forschung. Kombinierte Ansätze, die verschiedenartige Ähnlichkeitsmerkmale analysieren, eignen sich am besten, um das breite Spektrum wissenschaftlicher Plagiatsformen zu erkennen.Um die Praxistauglichkeit des mathematikbasierten Ansatzes der Plagiatserkennung sowie verwandter Information-Retrieval-Aufgaben zu erreichen, werden wir Methoden entwickeln, die mathematische Ausdrücke aus wissenschaftlichen Dokumenten in verschiedenen Dateiformaten extrahieren und semantisch anreichern. Hierbei wird das Projektteam eng zusammenarbeiten mit dem bewilligten DFG Projekt von Bela Gipp GI 1259/1-1 „Methoden und Werkzeuge zur Verbesserung des Zugriffs auf mathematisches Wissen in Digitalen Bibliotheken für Such-, Empfehlungs- und Assistenzsysteme”. Dieses Projekt entwickelt Zugriffsmethoden für mathematisches Wissen in Wikipedia. Das vorliegende Projekt wird diese Methoden erweitern und auf wissenschaftliche Dokumente übertragen.Die Erkennung wissenschaftlicher Plagiate ist ein dringendes Problem, z.B. für Bildungs-, Forschungs- und Wissenschaftsförderungseinrichtungen sowie für Verlage. Plagiatserkennungsdienstleister fokussieren sich aktuell jedoch auf die Identifikation kaum verschleierter Plagiatsformen, die typisch für Studierende sind. Die Anbieter vermeiden bislang den Forschungs- und Entwicklungsaufwand, der nötig wäre, um die Erkennung verschleierte Plagiatsformen, die typisch für wissenschaftliche Publikationen sind, zu ermöglichen. Um die wissenschaftliche Community sowie Plagiatserkennungsdienstleister in die Lage zu versetzen, auch sorgfältig verschleierte wissenschaftliche Plagiate besser zu erkennen, werden wir unsere Forschungsbeiträge im freien und quelloffenen Plagiatserkennungssystem HyPlag (www.hyplag.org) umsetzen und unseren Code sowie unsere Forschungsdaten offen zu Verfügung stellen. Um sicherzustellen, dass unsere Forschung den Bedürfnissen von Fachexperten entspricht, werden wir unsere Forschungsbeiträge kontinuierlich mit den Editoren des zbMATH (www.zbMATH.org) evaluieren. Durch die enge Zusammenarbeit mit Mathematikexperten möchten wir mit dem vorliegenden Projekt gleichfalls den Grundstein legen für weitere Beiträge zur Verbesserung des Zugriffs auf mathematisches Wissen, die über den Anwendungsfall der Plagiatserkennung hinausgehen.
DFG-Verfahren
Sachbeihilfen
Kooperationspartner
Professor Dr. Klaus Hulek