Automatic Spelling Diagnostic
Final Report Abstract
In diesem Forschungsprojekt konnte gezeigt werden, dass es möglich ist, Rechtschreibfehler mit einem hohen Grad an Genauigkeit automatisch zu erkennen, wenn die Daten in Form von richtig und falsch geschriebenem Text vorliegen. Ferner wurde gezeigt, dass es prinzipiell möglich ist, ein System zu bauen, das die korrekte Schreibung aus der Schülerschreibung rekonstruiert. Für eine Lehrperson ist es wesentlich einfacher, Kindertexte falsch und ggf. richtig geschrieben zu digitalisieren, als selber eine detaillierte Fehleranalyse durchzuführen. Für diesen Zweck wurde das Instrument zur automatischen Analyse via einer Webseite zur Verfügung gestellt. Die Seite bietet ebenso die Möglichkeit, die in diesem Projekt manuell und automatisch annotierte Datenbank über Meta-Daten und Fehlerannotation zu untersuchen. Ferner wurde der gesammelte Korpus anonymisiert und aufbereitet und via LDC zur freien Verfügung gestellt. Um die Annotation des Korpus zu ermöglichen und insbesondere die manuelle Annotation von Fehlerkategorien optimal zu unterstützen, wurde ein maßgeschneidertes Annotationswerkzeug implementiert, das als Dienst über das Internet auch anderen Interessierten zur Verfügung gestellt wird. Die Daten, die aus der manuellen Annotation kommen, können neben der Untersuchung hinsichtlich Fehlerkategorien in unterschiedlichen Schülergruppen auch für das Training und die Evaluation von Modul 1 und Modul 2 in weiterführenden Arbeiten verwendet werden. Am 07.12.2013 wurde im Badischen Tagblatt in einem Zeitungsartikel “Tausende Texte in Sekunden geprüft–Karlsruher Forscher arbeiten an einer Software, die den Rechtschreibunterricht verbessern soll” über das Projekt berichtet; ferner wurde im Rahmen des Wissenschaftsfestivals “Effekte” die Ergebnisse des Projektes einem breiten Publikum vorgestellt.
Publications
- (2014): A Database of Freely Written Texts of German School Students for the Purpose of Automatic Spelling Error Classification. In: Proceedings of The 9th Edition of the Language Resources and Evaluation Conference (LREC), Reykjavik, Iceland, May 26-31
Berkling, Kay; Fay, Johanna; Ghayoomi, Masood; Hein, Katrin; Lavalley, Rémi; Linhuber, Ludwig; Stüker, Sebastian
- (2014): ‘Kleine Wörter’ – systemlinguistische, sprachdidaktische und empirische Untersuchung einer Wortgruppe mit Sonderstellung innerhalb der diagnostischen Rechtschreibanalyse. In: Siekmann, Katja (Hrsg.): Theorie, Empirie und Praxis effektiver Rechtschreibdiagnostik. Stauffenburg Verlag: Tübingen. S. 43-62
Hein, Katrin; Fay, Johanna; Ghayoomi, Masood
- (2015): Preparing Children’s Writing Database for Automated Processing. In: Proceedings of L1 Teaching, Learning and Technology (L1TLT, Satellite of SLaTE), Leipzig, Germany, September 4-5
Lavalley, Rémi; Berkling, Kay; Stüker, Sebastian
- 2015): WISE: A Web-Interface for Spelling Error Recognition: A Description and Evaluation of the Underlying Algorithm (German). In: Proceedings of the International Conference of the German Society of Computational Linguistics and Language Technology (GSCL), Duisburg, Germany, September 30
Berkling, Kay; Lavalley, Rémi
- A Semi- Automatic Word-Level Annotation and Transcription Tool for Spelling Error Categories. In: Proceedings of 2nd International Conference on Learning and Collaboration Technologies in association with HCI International 2015, Los Angeles, California, USA, August 2-7
Linhuber, Ludwig; Stüker, Sebastian; Lavalley, Rémi; Berkling, Kay
(See online at https://doi.org/10.1007/978-3-319-21380-4_100)