Detailseite
Projekt Druckansicht

Implementation of an HPSG grammar of Persian and creation of a machine readable lexicon of Persian

Fachliche Zuordnung Allgemeine und Vergleichende Sprachwissenschaft, Experimentelle Linguistik, Typologie, Außereuropäische Sprachen
Förderung Förderung von 2009 bis 2014
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 98075836
 
Erstellungsjahr 2018

Zusammenfassung der Projektergebnisse

Im PerGram-Projekt wurde eine Beschreibung zentraler Phänomene des Persischen im Rahmen der Head-Driven Phrase Structure Grammar (HPSG) erstellt sowie ein computerverarbeitbares Grammatikfragment für das Persische, ebenfalls im Rahmen der Head-Driven Phrase Structure Grammar, implementiert. Die Grammatik behandelt komplexe Prädikate, verschiedene Valenzklassen von Verben und anderen Köpfen, NP-Strukturen inklusive Ezafe-Konstruktion, Adjektivmodifkation und Relativsätze, freie Relativsätze, Fernabhängigkeiten (Extraktion), Anordnung von Argumenten ditransitiver Verben, Negation, Klitika, resumptive Pronomina, Passiv, Kongruenz und Flexion sowie Wortartenänderung durch Affigierung. Die entwickelten Grammatiken teilen einen gemeinsamen Kern mit Grammatiken, die für weitere Sprachen entwickelt werden. Derzeit sind das Deutsch, Dänisch, Maltesisch, Mandarin Chinesisch, Jiddisch, Englisch, Hindi, Französisch. Die Grammatikfragmente für die genannten Sprachen werden so entwickelt, dass sie einen möglichst großen gemeinsamen Kern bzw. gemeinsame Teilbereiche, die verschiedenen Sprachklassen entsprechen, haben. Bei der Umsetzung des Projekts wurden möglichst wenige sprachspezifische Regeln bzw. Merkmale stipuliert. Sofern sich solche Stipulationen jedoch als unumgänglich herausstellten, war das ein Indiz für Unterschiede zwischen den betrachteten Sprachen. Das Projekt hat somit in einer beschränkungsbasierten Grammatiktheorie einen Beitrag zum typologischen Verständnis von Sprache geleistet.

Projektbezogene Publikationen (Auswahl)

  • 2010. A Study of Corpus Development for Persian. International Journal on Asian Language Processing 20(1). 17–33
    Ghayoomi, Masood, Saeedeh Momtazi & Mahmood Bijankhan
  • 2010. PerGram: A TRALE Implementation of an HPSG Fragment of Persian. In Proceedings of 2010 IEEE International Multiconference on Computer Science and Information Technology – Computational Linguistics Applications (CLA’10). Wisła, Poland, 18–20 October 2010, Bd. 5, 461–467. Polnish Information Processing Society
    Müller, Stefan & Masood Ghayoomi
    (Siehe online unter https://dx.doi.org/10.1109/IMCSIT.2010.5679946)
  • 2010. Persian Complex Predicates and the Limits of Inheritance- Based Analyses. Journal of Linguistics 46(3). 601–655
    Müller, Stefan
    (Siehe online unter https://doi.org/10.1017/S0022226709990284)
  • 2011. Lessons from Building a Persian Written Corpus: Peykare. Language Resources and Evaluation 45(2). 143–164
    Bijankhan, Mahmood, Javad Sheykhzadegan, Mohammad Bahrani & Masood Ghayoomi
    (Siehe online unter https://doi.org/10.1007/s10579-010-9132-x)
  • 2012. Bootstrapping the Development of an HPSG-Based Treebank for Persian. Linguistic Issues in Language Technology 7(1)
    Ghayoomi, Masood
  • 2015. The CoreGram Project: Theoretical Linguistics, Theory Development and Verification. Journal of Language Modelling 3(1). 21–86
    Müller, Stefan
    (Siehe online unter https://doi.org/10.15398/jlm.v3i1.91)
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung