Implementation of an HPSG grammar of Persian and creation of a machine readable lexicon of Persian
Zusammenfassung der Projektergebnisse
Im PerGram-Projekt wurde eine Beschreibung zentraler Phänomene des Persischen im Rahmen der Head-Driven Phrase Structure Grammar (HPSG) erstellt sowie ein computerverarbeitbares Grammatikfragment für das Persische, ebenfalls im Rahmen der Head-Driven Phrase Structure Grammar, implementiert. Die Grammatik behandelt komplexe Prädikate, verschiedene Valenzklassen von Verben und anderen Köpfen, NP-Strukturen inklusive Ezafe-Konstruktion, Adjektivmodifkation und Relativsätze, freie Relativsätze, Fernabhängigkeiten (Extraktion), Anordnung von Argumenten ditransitiver Verben, Negation, Klitika, resumptive Pronomina, Passiv, Kongruenz und Flexion sowie Wortartenänderung durch Affigierung. Die entwickelten Grammatiken teilen einen gemeinsamen Kern mit Grammatiken, die für weitere Sprachen entwickelt werden. Derzeit sind das Deutsch, Dänisch, Maltesisch, Mandarin Chinesisch, Jiddisch, Englisch, Hindi, Französisch. Die Grammatikfragmente für die genannten Sprachen werden so entwickelt, dass sie einen möglichst großen gemeinsamen Kern bzw. gemeinsame Teilbereiche, die verschiedenen Sprachklassen entsprechen, haben. Bei der Umsetzung des Projekts wurden möglichst wenige sprachspezifische Regeln bzw. Merkmale stipuliert. Sofern sich solche Stipulationen jedoch als unumgänglich herausstellten, war das ein Indiz für Unterschiede zwischen den betrachteten Sprachen. Das Projekt hat somit in einer beschränkungsbasierten Grammatiktheorie einen Beitrag zum typologischen Verständnis von Sprache geleistet.
Projektbezogene Publikationen (Auswahl)
-
2010. A Study of Corpus Development for Persian. International Journal on Asian Language Processing 20(1). 17–33
Ghayoomi, Masood, Saeedeh Momtazi & Mahmood Bijankhan
-
2010. PerGram: A TRALE Implementation of an HPSG Fragment of Persian. In Proceedings of 2010 IEEE International Multiconference on Computer Science and Information Technology – Computational Linguistics Applications (CLA’10). Wisła, Poland, 18–20 October 2010, Bd. 5, 461–467. Polnish Information Processing Society
Müller, Stefan & Masood Ghayoomi
-
2010. Persian Complex Predicates and the Limits of Inheritance- Based Analyses. Journal of Linguistics 46(3). 601–655
Müller, Stefan
-
2011. Lessons from Building a Persian Written Corpus: Peykare. Language Resources and Evaluation 45(2). 143–164
Bijankhan, Mahmood, Javad Sheykhzadegan, Mohammad Bahrani & Masood Ghayoomi
-
2012. Bootstrapping the Development of an HPSG-Based Treebank for Persian. Linguistic Issues in Language Technology 7(1)
Ghayoomi, Masood
-
2015. The CoreGram Project: Theoretical Linguistics, Theory Development and Verification. Journal of Language Modelling 3(1). 21–86
Müller, Stefan