Project Details
Projekt Print View

A computerized corpus of English in the south-eastern Welsh mining valleys

Subject Area Individual Linguistics, Historical Linguistics
Term from 2001 to 2003
Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 5321126
 
Ziel des Vorhabens ist die Erstellung einer computergestützten Textsammlung (Korpus) des englischen Dialekts in den südost-walisischen Bergbautälern, die als Datenbasis für linguistische Analysen v.a. in den Bereichen Korpuslinguistik, Dialektologie und Soziolinguistik dienen soll. In Zusammenarbeit mit dem Centre for Language and Communication Research, Cardiff University, werden 380 Interviews aus den Jahren 1969-87 (460 Stunden gesprochenes Wort), die in der South Wales Miners´ Library, Swansea, auf Audiokassetten vorliegen, digitalisiert und orthographisch transkribiert, wobei auch anonymisierte Sprecherdaten gespeichert werden. Der transkribierte Text wird einer automatischen Satzanalyse (part-of-speech tagging) unterzogen. Die Audiodateien erlauben Untersuchungen etwa in den Bereichen der Phonetik und Phonologie oder Intonation, während die Textdateien z.B. morphologische syntaktische Analysen ermöglichen und mithilfe spezieller Korpussoftware auch statistisch untersucht werden können. Die Sprecherdaten lassen weiterhin Untersuchungen zur soziolinguistischen Variation zu.
DFG Programme Research Grants
 
 

Additional Information

Textvergrößerung und Kontrastanpassung