Advertisement

Russian Linguistics

, Volume 40, Issue 2, pp 103–132 | Cite as

Who needs particles? A challenge to the classification of particles as a part of speech in Russian

  • Anna Endresen
  • Laura A. Janda
  • Robert Reynolds
  • Francis M. Tyers
Article

Abstract

In 1985, Zwicky argued that ‘particle’ is a pretheoretical notion that should be eliminated from linguistic analysis. We propose a reclassification of Russian particles that implements Zwicky’s directive. Russian particles lack a coherent conceptual basis as a category and many are ambiguous with respect to part of speech. Our corpus analysis of Russian particles addresses theoretical questions about the cognitive status of parts of speech and practical concerns about how particles should be represented in computational models. We focus on nine high-frequency words commonly classed as particles: ešče, tak, ved’, slovno, daže, že, li, da, net. We show that the current tagging of particles in the manually disambiguated Morphological Standard of the Russian National Corpus is not entirely consistent, and that this can create challenges for training a part-of-speech tagger. We offer an alternative tagging scheme that eliminates the category of ‘particle’ altogether. We show that our enriched scheme makes it possible for a part-of-speech tagger to achieve more useful results. Our analysis of particles provides a detailed account of various sub-uses that correspond to different parts of speech, their relationships, and relative distribution. In this sense, our study also contributes to the study of words that exhibit part-of-speech ambiguities.

Keywords

Natural Language Processing Question Word Discourse Marker Gold Standard Corpus Referential Content 
These keywords were added by machine and not by the authors. This process is experimental and the keywords may be updated as the learning algorithm improves.

Кому нужны частицы? Стоит ли определять частицы как отдельную часть речи в русском языке?

Аннотация

В работе 1985 года Цвикки утверждал, что ‘частица’—это до-теоретическое понятие, которое нужно исключить из лингвистического анализа. Следуя установке Цвикки, мы предлагаем пересмотреть традиционный подход к русским частицам и перераспределить соответствующие слова по другим частеречным классам. Ясные содержательные основания для выделения русских частиц как отдельной категории отсутствуют, частеречная принадлежность многих частиц неоднозначна. В нашем корпусном исследовании рассмотрены теоретические вопросы о когнитивном статусе частей речи, а также практические сложности, связанные с представлением частиц в компьютерных моделях обработки данных. В центре внимания девять высокочастотных слов, традиционно определяемых как частицы: еще, так, ведь, словно, даже, же, ли, да, нет. В статье показано, что существующая система частеречной разметки, принятая в Морфологическом стандарте Национального корпуса русского языка (тексты со снятой омонимией), недостаточно последовательна и что это может создать проблемы при обучении частеречного анализатора. В статье предложена альтернативная система разметки, в которой категория ‘частиц’ как отдельной части речи полностью устранена. Благодаря этой улучшенной системе разметки частеречный анализатор может функционировать более успешно. В статье представлен подробный анализ девяти ‘частиц’ с разбором основных подтипов их употреблений, которые соответствуют различным частям речи, также обсуждаются взаимосвязи выделенных подтипов и их распределение в использованной выборке примеров. В этом отношении, данное исследование вносит вклад в изучение слов с неоднозначной частеречной принадлежностью.

References

  1. Andersen, G. & Fretheim, T. (Eds.) (2000). Pragmatic markers and propositional attitude (Pragmatics & Beyond. New Series, 79). Amsterdam, Philadelphia. Google Scholar
  2. Bartoševič, A. (1978). Časticy i leksikografičeskaja praktika. Slavia orientalis, XXVII(3), 331–334. Google Scholar
  3. Bogorodickij, V. A. (1939). Očerki po jazykovedeniju i russkomu jazyku. Moskva. Google Scholar
  4. Brinton, L. J. (1996). Pragmatic markers in English. Grammaticalization and discourse functions (Topics in English Linguistics, 19). Berlin. CrossRefGoogle Scholar
  5. Chomsky, N. (1965). Aspects of the theory of syntax. Cambridge. Google Scholar
  6. Croft, W. (2001). Radical Construction Grammar. Syntactic theory in typological perspective. Oxford. CrossRefGoogle Scholar
  7. Dedaić, M., & Mišković-Luković, M. (2010). South Slavic discourse particles: introduction. In M. Dedaić & M. Mišković-Luković (Eds.), South Slavic discourse particles (Pragmatics & Beyond New Series, 197, pp. 1–22). Amsterdam. CrossRefGoogle Scholar
  8. Drummen, A. (2015). Dramatic pragmatics. A discourse approach to particle use in ancient Greek tragedy and comedy (Doctoral dissertation). Ruprecht-Karls-Universität Heidelberg, Heidelberg. Google Scholar
  9. Erelt, M., Erelt, T., & Ross, K. (2000). Eesti keele käsiraamat. Tallin. Google Scholar
  10. Fries, Ch. C. (1952). The structure of English. New York. Google Scholar
  11. Grišina, E. A., & Savčuk, S. O. (2009). Korpus ustnyx tekstov v Nacional’nom korpuse russkogo jazyka: sostav i struktura. In Nacional’nyj korpus russkogo jazyka. Novye rezul’taty i perspektivy. Available at http://ruscorpora.ru/corpora-biblio-2008.html. Google Scholar
  12. Grišina, E. A., & Ljaševskaja, O. N. (2008). Grammatičeskij slovar’ novyx slov russkogo jazyka. Available at http://dict.ruslang.ru/gram.php. Google Scholar
  13. Halácsy, P., Kornai, A., & Oravecz, C. (2007). HunPos: an open source trigram tagger. In ACL 2007. Proceedings of the 45th Annual Meeting of the Association for Computational Linguistics. Interactive Poster and Demonstration Sessions, June 25–27, 2007, Prague (pp. 209–212). Stroudsburg. Google Scholar
  14. Harris, Z. S. (1951). Methods in structural linguistics. Chicago. Google Scholar
  15. Heinrichs, W. (1981). Die Modalpartikeln im Deutschen und Schwedischen (Linguistische Arbeiten, 101). Tübingen. CrossRefGoogle Scholar
  16. Kasatkina, R. F. (2004). Častica že v roli tekstovogo konnektora (na materiale russkoj dialektnoj reči). In T. M. Nikolaeva (Ed.), Verbal’naja i neverbal’naja opory prostranstva mežfrazovyx svjazej (pp. 71–82). Moskva. Google Scholar
  17. Klobukov, E. V. (2001). Analitičeskie glagoly v russkom jazyke. In S. M. Kuz’mina (Ed.), Žizn’ jazyka. Sbornik statej k 80-letiju Mixaila Viktoroviča Panova (pp. 77–87). Moskva. Google Scholar
  18. Kuznecov, S. A. (Ed.) (1998). Bol’šoj tolkovyj slovar’ russkogo jazyka. Sankt-Peterburg. Google Scholar
  19. Langacker, R. W. (2013). Essentials of cognitive grammar. Oxford. Google Scholar
  20. Makarova, A. (2015). One type of verbal diminutives in Russian: verbs ending in -n’kat’. Russian Linguistics, 39(1), 15–31. CrossRefGoogle Scholar
  21. Malyj akademičeskij slovar’ (1999). Slovar’ russkogo jazyka v četyrex tomax. Moskva. Google Scholar
  22. Manning, C. D. (2011). Part-of-speech tagging from 97 % to 100 %: is it time for some linguistics? In A. Gelbukh (Ed.), Computational Linguistics and Intelligent Text Processing. 12th International Conference, CICLing 2011, Tokyo, Japan, February 2011. Proceedings, Part I (Lecture Notes in Computer Science, 6608, pp. 171–189). Berlin. Google Scholar
  23. McCoy, S. (2003a). Unifying the meaning of multifunctional particles: the case of Russian ŽE. University of Pennsylvania Working Papers in Linguistics, 9(1), 123–135. Google Scholar
  24. McCoy, S. (2003b). Connecting information structure and discourse structure through “Kontrast”: the case of colloquial Russian particles – TO, ŽE, and VED’. Journal of Logic, Language and Information, 12, 319–335. CrossRefGoogle Scholar
  25. Minčenkov, A. G. (2001). Russkie časticy v perevode na anglijskij jazyk. Sankt-Peterburg. Google Scholar
  26. Miot, G. (1987). Il mio primo dizionario. Firenze. Google Scholar
  27. Nikolaeva, T. M. (1985). Funkcii častic v vyskazyvanii (na materiale slavjanskix jazykov). Moskva. Google Scholar
  28. Percov, N. V. (2002). O vozmožnom semantičeskom invariante russkix frazovyx častic uže i ešče. In N. D. Arutjunova (Ed.), Logičeskij analiz jazyka. Semantika načala i konca (pp. 137–145). Moskva. Google Scholar
  29. Plungjan, V. A. (1987). Ocenka verojatnosti v značenii časticy že (k formalizacii semantičeskogo opisanija služebnyx slov). Naučno-texničeskaja informacija. Serija 2: Informacionnye processy i sistemy, 8, 36–40. Google Scholar
  30. Russian National Corpus (RNC). Available at www.ruscorpora.ru.
  31. Šaxmatov, A. A. (1941). Sintaksis russkogo jazyka. Leningrad. Google Scholar
  32. Serianni, L., & Castelvecchi, A. (1997). Italiano: grammatica, sintassi, dubbi. Milano. Google Scholar
  33. Sičinava, D. V. (2005). Obrabotka tekstov s grammatičeskoj razmetkoj: instrukcija razmetčika. Retrieved from http://ruscorpora.ru/sbornik2005/09sitch.pdf (1 March 2016).
  34. Starodumova, E. A. (1997). Russkie časticy (pis’mennaja monologičeskaja reč’) (avtoreferat dissertacii). Moskva. Google Scholar
  35. Švedova, N. Ju. (Ed.) (1980). Russkaja grammatika. Tom I: Fonetika, fonologija, udarenie, intonacija, slovoobrazovanie, morfologija. Moskva. Google Scholar
  36. Tauli, V. (1972). Eesti grammatika (Vol. I). Uppsala. Google Scholar
  37. Timberlake, A. (2004). A reference grammar of Russian. Cambridge. Google Scholar
  38. Vasilyeva, A. N. (1972). Particles in colloquial Russian (manual for English-speaking students of Russian). Moscow. Google Scholar
  39. Vikul’ceva, N. (2004). Semantičeskie, sintaksičeskie i pragmatičeskie osobennosti leksemy VED’ (Master’s thesis). University of Tartu, Tartu. Google Scholar
  40. Vinogradov, V. V. (1972). Russkij jazyk. Grammatičeskoe učenie o slove. Moskva. Google Scholar
  41. Voejkova, M. D. (2009). Problemy ispol’zovanija podkorpusa ustnoj razgovornoj reči (na primere analiza russkix diminutivov). In Nacional’nyj korpus russkogo jazyka. Novye rezul’taty i perspektivy. Available at http://ruscorpora.ru/corpora-biblio-2008.html. Google Scholar
  42. Wierzbicka, A. (1976). Particles and linguistic relativity. International Review of Slavic Linguistics, 1(2–3), 327–367. Google Scholar
  43. Wierzbicka, A. (1988). The semantics of grammar (Studies in Language Companion Series, 18). Amsterdam, Philadelphia. CrossRefGoogle Scholar
  44. Wierzbicka, A. (1992). Semantics, culture, and cognition. Universal human concepts in culture-specific configurations. New York, Oxford. Google Scholar
  45. Zaliznjak, A. A. (1980). Grammatičeskij slovar’ russkogo jazyka. Moskva. Google Scholar
  46. Zwicky, A. M. (1985). Clitics and particles. Language, 61(2), 283–305. CrossRefGoogle Scholar

Copyright information

© Springer Science+Business Media Dordrecht 2016

Authors and Affiliations

  • Anna Endresen
    • 1
  • Laura A. Janda
    • 1
  • Robert Reynolds
    • 1
  • Francis M. Tyers
    • 1
  1. 1.UiT The Arctic University of NorwayTromsøNorway

Personalised recommendations