Methods and Tools to Advance the Retrieval of Mathematical Knowledge from Digital Libraries for Search-, Recommendation- and Assistance-Systems
Final Report Abstract
Das Ziel dieses Projektes war die Erforschung neuer Ansätze und Technologien zur Verbesserung des Zurgiffs auf mathematische Inhalte und ihre semantischen Informationen für eine breite Palette von Information-Retrieval-Anwednungen. Um dieses Ziel zu erreichen, adressierte das Projekt drei maßgebliche Forschungaufgaben: (1) syntaktische Analyse mathematischer Ausdrücke, (2) semantische Anreicherung mathematischer Ausdrücke und (3) Evaluierung mit Hilfe von Qualitätsmetriken und Demonstratoren. Um unsere Forschungsergebnisse für die Forschungsgemeinschaft nützlich zu machen, veröffentlichten wir Tools, die es Forschern er möglichen, mathematische Ausdrücke effektiver und effizienter zu verarbeiten. Unsere Forschung hat signifikante Beiträge zu verschiedenen Mathematical Information Retrieval (MathIR) Herausforderungen und Systemen geleistet, einschließlich Systemen für die Plagiatserkennung, Empfehlung und Suche, dem ersten mathematischen Typassistenzsystem, mathematische Frage-Antwort- und Tutoringsysteme, Systeme für die automatische Plausibilitätsprüfung für mathematische Ausdrücke in Wikipedia und die automatische Berechenbarkeit von mathematischen Inhalten mittels Computer-Algebra-Systemen (CAS) und weitere. Obwohl unser Projekt sich auf MathIR-Aufgaben konzentrierte, war seine Auswirkung auf andere Forschungsarbeiten im Bereich der natürlichen Sprache bedeutend und führte zu einer umfangreicheren Palette von Demonstratoren als ursprünglich erwartet. Viele dieser Demonstratoren führten neuartige Anwendungen ein, wie das Tutoringsystem PhysWikiQuiz oder LaCASt, das automatisch die Korrektheit von mathematischen Formeln in der Wikipedia oder der Digital Library of Mathematical Functions (DLMF) mittels kommerzieller CAS überprüft. Dieses Projekt hat unsere internationalen Zusammenarbeiten gestärkt, insbesondere mit Kollegen am National Institute of Standards and Technology (NIST) in den USA und dem National Institute of Informatics (NII) in Japan. Mehrere Teilprojekte wurden teilweise in Kursprojekten und Abschlussarbeiten an den Universitäten Konstanz, Wuppertal und Göttingen entwickelt, machten Nachwuchsforschern Spitzen-Technologien zugänglich und sensibilisierten Studierende und Forschende für wichtige Fragestellungen im Hinblick auf MathIR-Technologien. Wir sind fest davon überzeugt, dass dieses Projekt einen nachhaltigen Effekt auf nachfolgende MathIR-Technologien hat. Mehrere der im Rahmen der Förderung initiierten Teilprojekte werden fortgeführt und führten zu nachfolgenden DFG-Projekten, wie zum Beispiel Analyse mathematischer Ausdrücke zur Erkennung verschleierter wissenschaftlicher Plagiate (Projektnummer 437179652).
Publications
-
“Improving the Representation and Conversion of Mathematical Formulae by Considering Their Textual Context”. In: Proc. ACM/IEEE JCDL. ACM, May 2018, pp. 233–242.
M. Schubotz, A. Greiner-Petter, P. Scharpf, N. Meuschke, H. S. Cohl, and B. Gipp.
-
“AnnoMathTeX - a Formula Identifier Annotation Recommender System for STEM Documents”. In: Proceedings of the 13th ACM Conference on Recommender Systems. ACM, Sept. 2019
P. Scharpf, I. Mackerracher, M. Schubotz, J. Beel, C. Breitinger, and B. Gipp.
-
“Improving Academic Plagiarism Detection for STEM Documents by Analyzing Mathematical Content and Citations”. In: 2019 ACM/IEEE Joint Conference on Digital Libraries (JCDL). IEEE, June 2019
N. Meuschke, V. Stange, M. Schubotz, M. Kramer, and B. Gipp.
-
“Semantic Preserving Bijective Mappings for Expressions Involving Special Functions between Computer Algebra Systems and Document Preparation Systems”. In: Aslib Journal of Information Management 71.3
A. Greiner-Petter, M. Schubotz, H. S. Cohl, and B. Gipp.
-
“Classification and Clustering of arXiv Documents, Sections, and Abstracts, Comparing Encodings of Natural and Mathematical Language”. In: Proc. ACM/IEEE JCDL. ACM, Aug. 2020
P. Scharpf, M. Schubotz, A. Youssef, F. Hamborg, N. Meuschke, and B. Gipp.
-
“Discovering Mathematical Objects of Interest — A Study of Mathematical Notations”. In: Proc. WWW. ACM, Apr. 2020, pp. 1445–1456
A. Greiner-Petter, M. Schubotz, F. Müller, et al.
-
“Math-Word Embedding in Math Search and Semantic Extraction”. In: Scientometrics 125.3 (Dec. 2020), pp. 3017–3046. issn: 0138-9130.
A. Greiner-Petter, A. Youssef, T. Ruas, et al.
-
“Comparative Verification of the Digital Library of Mathematical Functions and Computer Algebra Systems”. In: Tools and Algorithms for the Construction and Analysis of Systems - 28th International Conference, (TACAS). Springer
A. Greiner-Petter, H. S. Cohl, A. Youssef, et al.
-
“Do the Math: Making Mathematics in Wikipedia Computable”. In: IEEE Transactions on Pattern Analysis and Machine Intelligence 45.4 (Aug. 2022), pp. 4384–4395. issn: 0162-8828. doi:10.1109/TPAMI.2022.3195261
A. Greiner-Petter, M. Schubotz, C. Breitinger, P. Scharpf, A. Aizawa, and B. Gipp.
-
“Mining Mathematical Documents for Question Answering via Unsupervised Formula Labeling”. In: Proc. ACM/IEEE JCDL. ACM, June 2022
P. Scharpf, M. Schubotz, and B. Gipp.