Open-access publication of linked dictionaries for cross-linguistic comparison

Applicant Professorin Dr. Barbara Stiebels

Term from 2015 to 2019

Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 276840710

Final Report Year 2019

Final Report Abstract

Das Projekt hatte die Ziele, eine elektronische Wörterbuchreihe für Open-Access-Lexika kleiner/ wenig dokumentierter Sprachen zu erstellen und die Wörterbuchdaten in einer Form zu veröffentlichen, die über die traditionelle Papierform und lineare Struktur hinausgeht und die Möglichkeiten moderner Datenbanken (z. B. Verlinkung zwischen Lexikoneinträgen, Verlinkung zu Mediendateien, many-to-many-Relationen zwischen Beispielen und Lexikoneinträgen, kombinierte Suchanfragen) nutzt. Die Wörterbücher sollten in den in der Sprachtypologie etablierten Rahmen der CLLD-Datenbanken (Cross-Linguistic Linked Data; https://clld.org/) aufgenommen werden. Überdies sollte zur Würdigung der lexikographischen Arbeit in der Feldforschung für die eingereichten Wörterbücher ein Peer-Review-Verfahren etabliert werden Ein wichtiges Ziel des Projektes war zudem die Etablierung eines Workflows, der es erlaubt, die Herausgeberschaft von Dictionaria nach Ablauf der DFG-Förderung an Dritte abzutreten, ohne dass hierzu weitere finanzielle Mittel erforderlich sind. Diese Ziele wurden weitgehend erreicht. Die „Wörterbuchzeitschrift“, der wir den Namen Dictionaria (https://dictionaria.clld.org/) gegeben haben, hat im Projektzeitraum 8 Wörterbücher unterschiedlichen Charakters publiziert und ist nun offen für weitere Publikationen. Die größte Herausforderung des Projekts war die Herausarbeitung des Workflows und die Übertragung der mit üblicher Feldforschungssoftware (z. B. Toolbox/FLEx) erstellten Wörterbücher in das relationale CLDF-Format der CLLD-Datenbanken. Einerseits mussten viele Inkonsistenzen, die sich über viele Jahre in den organisch gewachsenen Wörterbüchern ergeben haben, ausgemerzt werden, andererseits – und noch viel herausfordernder – mussten strukturelle Reorganisationen der Lexikoneinträge (Entfernung von Untereinträgen, relationale Verknüpfungen zu Beispielen und zwischen Einträgen) vorgenommen werden. Dabei ergaben sich je nach Ausgangsformat der Wörterbücher unterschiedliche Probleme. Das letztendlich gewählte Format der Darstellung der Wörterbucheinträge in Dictionaria ist ein sehr guter Kompromiss zwischen einheitlichen Standards bzgl. Worteinträgen und Beispieleinträgen (in Form von Pflichtfeldern wie z. B. Lemma, Wortart, Bedeutungsbeschreibung und Angabe der zugehörigen Beispiele) und Spezifika der jeweiligen Wörterbücher (optionale Felder: z. B. Übersetzung in weitere Zielsprachen, Transliteration in andere Schriftsysteme, wörterbuchspezifische Kodierungen von grammatischer oder semantischer Information; Integration von Audio- und Bilddateien). Für die Datenkonversion von Toolbox/FLEx etc. zu CLDF sind im Projekt eine Reihe von Skripten entwickelt worden, die dem jeweiligen Herausgeberteam die Interaktion mit den Wörterbuchautor*innen bzgl. erforderlicher Überarbeitungen erleichtern. Traditionell hat das Veröffentlichen von Wörterbüchern kein großes Prestige, aber wir sind zuversichtlich, dass sich dieses durch die Existenz von Dictionaria nun langsam ändern wird. Die Online-Wörterbücher von Dictionaria erlauben viele neue Möglichkeiten der Suche und Anzeige von Wörterbuchdaten (inkl. der Einbindung von Bild- und Ton-Elementen). Es ist zu hoffen, dass mit dem wachsenden Prestige von Wörterbuch-Veröffentlichungen mehr und mehr Lexika kleinerer Sprachen auf diese Weise allgemein zugänglich gemacht werden und somit für sprachvergleichende lexikalische Untersuchungen genutzt werden können.

Publications

A uniform data model for joint publication of minor language dictionaries. Max Planck Institute for the Science of Human History
Haspelmath, Martin
Teop – an Oceanic language with multifunctional verbs, nouns and adjectives. In Eva van Lier (ed.), Lexical flexibility in Oceanic languages. Studies in Language. Vol. 41.2, Special Issue. 255-293
Mosel, Ulrike
Corpus compilation and exploitation in language documentation projects. In Kenneth Regh & Lyle Campbell (eds.), The Oxford handbook of endangered languages, 248- 270. Oxford: Oxford University Press
Mosel, Ulrike
Cross-Linguistic Data Formats, advancing data sharing and re-use in comparative linguistics. Scientific Data 5. 180205
Forkel, Robert; List, Johann-Mattis; Greenhill, Simon J.; Rzymski, Christoph; Bank, Sebastian; Cysouw, Michael; Hammarström, Harald; Haspelmath, Martin; Kaiping, Gereon A. & Gray, Russell D.
Cut-verbs of the Oceanic language Teop. A criticial study of collecting and analysing data in a language documentation project. In Helen Bromhead & Zhengdao Ye (eds.), Meaning, life and culture: In conversation with Anna Wierzbicka. S. 355-379
Mosel, Ulrike

Servicenavigation

Hauptnavigation

Open-access publication of linked dictionaries for cross-linguistic comparison

Final Report Abstract

Publications

Additional Information

Servicenavigation

Hauptnavigation

Open-access publication of linked dictionaries for cross-linguistic comparison

Final Report Abstract

Publications

Additional Information

Textvergrößerung und Kontrastanpassung