STATISTICAL DATA ON THE COMPATIBILITY OF THE VERB НАЧАТИИIN RUSSIAN СHRONICLES OF THE XIV-XV CENTURIES

Authors

  • R. A. Vernyaeva Kalashnikov Izhevsk State Technical University

DOI:

https://doi.org/10.22213/2618-9763-2022-4-74-80

Keywords:

Russian Сhronicles, computer linguistics, n-grams, frequency

Abstract

This article provides a description of the compatibility features of the verb ‘начати’ in the Old Russian language. The material for this study was electronic transcriptions of the most ancient Russian Chronicles, published on the portal “Manuscript: Slavic Written Heritage”. Within the framework of this work, a quantitative-statistical research method was used, which allows not only to determine the number of occurrences of a particular language unit, but also to statistically substantiate the combinatorial nature of the components with each other. To obtain statistical data on the compatibility of the verb ‘начати, the module of n-grams of the IAS “Manuscript” was used, which makes it possible to identify text combinations with a different number of components and analyze the frequency of functioning of language units in texts. As part of this work, we used the T-score measure, which allows us to determine the most frequent combinations, as well as to identify how non-random the strength of the connection between words in a phrase is. The analysis of statistical data confirms the effectiveness of the use of association measures when working with the Old Russian text. It was revealed that the verb ‘начати’ is most often combined with the infinitive of imperfective verbs. The dictionaries used in the work demonstrate a fairly wide semantics for the verb ‘начати’. In the chronicle text, we recorded the functioning of this unit in only two meanings.

Author Biography

R. A. Vernyaeva, Kalashnikov Izhevsk State Technical University

PhD of in Philology

References

Баранов В. А. Создание и использование исторических корпусов славянских письменных памятников // WБЩЕЖИТIЕ : the world wide web portal for the study of Cyrillic and Glagolitic manuscripts and early printed books; Ralph Cleminson. - URL: http://www.obshtezhitie.net/mks/Baranov.pdf (дата обращения: 30.11.2022).

Баранов В. А. Создание и использование исторических корпусов славянских письменных памятников // Scripta & e-Scripta. 2019. Vol. 19. Pp. 33-57.

Баранов В. А., Гнутиков Р. М. Инструменты извлечения и приемы подготовки лингвистических данных для статистического анализа в историческом корпусе «Манускрипт» // Исторические исследования в контексте науки о данных: информационные ресурсы, аналитические методы и цифровые технологии : материалы Междунар. конф. Москва, 4-6 дек. 2020. Москва : МАКС Пресс, 2020. 484 с. С. 113-119. - Doi: 10.29003/m1797.978-5-317-06529-4/113-119

Алексеева И. В., Азарова И. В., Миронова Д. М. Кластеризация рукописей на базе совпадения разночтений как основа публикации славянской традиции // Материалы XLIV Междунар. филол. научн. конф.: секция прикладной и математической лингвистики, 11-15 марта 2014 г. / [отв. ред. М. В. Хохлова]. Санкт-Петербург : Филол. фак. СПбГУ, 2014. С. 10-22.

Баранов В. А. Опыт создания модуля n-грамм системы «Манускрипт» и оценки эффективности его использования для поиска коллокаций в корпусе М. В. Ломоносова // Интеллектуальные системы в производстве. 2016. № 4 (31). С. 124-131.

Баранов В. А. Корреляционный анализ биграмм русских евангельских списков XI-XIV веков // Интеллектуальные системы в производстве. 2018. Т. 16, № 4. С. 65-74.

Баранов В. А., Жолобов О. Ф. Древнерусские рукописи как объект статистического анализа // Интеллектуальные системы в производстве. 2019. Т. 17, № 4. С. 63-77. Doi: 10.22213/2410-9304-2019-4-63-77

Борисова Е. Г. Коллокации. Что это такое и как их изучать. Москва : Филология, 1995. 49 с. URL: https://search.rsl.ru/ru/record/01001721026 (дата обращения: 22.11.2022).

Влавацкая М. В. Комбинаторно-семантический анализ коллокаций как метод лингвистического исследования (на примере колоративных коллокаций, образованных по адъективному типу) // Научный диалог. 2020. № 4. С. 40-57.

Хоменко Н. М. Устойчивые словосочетания в древнерусском языке XII-XV вв. (на материале произведений Кирилла Туровского и Епифания Премудрого) : автореферат диссертации на соискание ученой степени кандидата филологических наук. Ленинград, 1990. С. 9.

Хохлова М. В. Исследование лексико-синтаксической сочетаемости в русском языке с помощью статистических методов (на базе корпусов текстов) : автореферат диссертации на соискание ученой степени кандидата филологических наук. Санкт-Петербург, 2010. 27 с. URL: https://www.dissercat.com/content/issledovanie-leksiko-sintaksicheskoi-sochetaemosti-v-russkom-yazyke-s-pomoshchyu-statistiche/read (дата обращения: 22.11.2022).

Лихачев Д. С. Поэтика древнерусской литературы. Москва : Наука, 1979. С. 15.

Ломтев Т. П. Очерки по историческому синтаксису русского языка. Москва : Изд-во МГУ, 1956. С. 63.

Published

30.12.2022

How to Cite

Vernyaeva Р. А. (2022). STATISTICAL DATA ON THE COMPATIBILITY OF THE VERB НАЧАТИИIN RUSSIAN СHRONICLES OF THE XIV-XV CENTURIES. Social’no-Ekonomiceskoe Upravlenie: Teoria I Praktika, 18(4), 74–80. https://doi.org/10.22213/2618-9763-2022-4-74-80

Issue

Section

Articles