СТАТИСТИЧЕСКИЕ ДАННЫЕ СОЧЕТАЕМОСТИ ГЛАГОЛА НАЧАТИ В РУССКИХ ЛЕТОПИСЯХ XIV-XV ВЕКОВ
DOI:
https://doi.org/10.22213/2618-9763-2022-4-74-80Ключевые слова:
русские летописи, компьютерная лингвистика, n-граммы, частотностьАннотация
Представлено описание особенностей сочетаемости глагола ‘начати’ в древнерусском языке. Материалом для настоящего исследования стали электронные транскрипции древнейших русских летописей, опубликованные на портале «Манускрипт: Славянское письменное наследие». В рамках данной работы был использован количественно-статистический метод исследования, позволяющий не только определить количество вхождений той или иной языковой единицы, но и статистически обосновать комбинаторность компонентов друг с другом. Для получения статистических данных сочетаемости глагола ‘начати’ был использован модуль n-грамм ИАС «Манускрипт», который дает возможность выявить текстовые сочетания с разным количеством компонентов и проанализировать частотность функционирования языковых единиц в текстах. В рамках данной работы нами была применена мера T-score, позволяющая определить, наиболее частотные сочетания, а также выявить, насколько неслучайна сила связанности между словами в словосочетании. Анализ статистических данных подтверждает эффективность применения мер ассоциации при работе с древнерусским текстом. Выявлено, что глагол ‘начати’ чаще всего сочетается с инфинитивом глаголов несовершенного вида. Использованные в работе словари демонстрируют достаточно широкую семантику для глагола ‘начати’. В летописном тексте нами зафиксировано функционирование данной единицы лишь в двух значениях.Библиографические ссылки
Баранов В. А. Создание и использование исторических корпусов славянских письменных памятников // WБЩЕЖИТIЕ : the world wide web portal for the study of Cyrillic and Glagolitic manuscripts and early printed books; Ralph Cleminson. - URL: http://www.obshtezhitie.net/mks/Baranov.pdf (дата обращения: 30.11.2022).
Баранов В. А. Создание и использование исторических корпусов славянских письменных памятников // Scripta & e-Scripta. 2019. Vol. 19. Pp. 33-57.
Баранов В. А., Гнутиков Р. М. Инструменты извлечения и приемы подготовки лингвистических данных для статистического анализа в историческом корпусе «Манускрипт» // Исторические исследования в контексте науки о данных: информационные ресурсы, аналитические методы и цифровые технологии : материалы Междунар. конф. Москва, 4-6 дек. 2020. Москва : МАКС Пресс, 2020. 484 с. С. 113-119. - Doi: 10.29003/m1797.978-5-317-06529-4/113-119
Алексеева И. В., Азарова И. В., Миронова Д. М. Кластеризация рукописей на базе совпадения разночтений как основа публикации славянской традиции // Материалы XLIV Междунар. филол. научн. конф.: секция прикладной и математической лингвистики, 11-15 марта 2014 г. / [отв. ред. М. В. Хохлова]. Санкт-Петербург : Филол. фак. СПбГУ, 2014. С. 10-22.
Баранов В. А. Опыт создания модуля n-грамм системы «Манускрипт» и оценки эффективности его использования для поиска коллокаций в корпусе М. В. Ломоносова // Интеллектуальные системы в производстве. 2016. № 4 (31). С. 124-131.
Баранов В. А. Корреляционный анализ биграмм русских евангельских списков XI-XIV веков // Интеллектуальные системы в производстве. 2018. Т. 16, № 4. С. 65-74.
Баранов В. А., Жолобов О. Ф. Древнерусские рукописи как объект статистического анализа // Интеллектуальные системы в производстве. 2019. Т. 17, № 4. С. 63-77. Doi: 10.22213/2410-9304-2019-4-63-77
Борисова Е. Г. Коллокации. Что это такое и как их изучать. Москва : Филология, 1995. 49 с. URL: https://search.rsl.ru/ru/record/01001721026 (дата обращения: 22.11.2022).
Влавацкая М. В. Комбинаторно-семантический анализ коллокаций как метод лингвистического исследования (на примере колоративных коллокаций, образованных по адъективному типу) // Научный диалог. 2020. № 4. С. 40-57.
Хоменко Н. М. Устойчивые словосочетания в древнерусском языке XII-XV вв. (на материале произведений Кирилла Туровского и Епифания Премудрого) : автореферат диссертации на соискание ученой степени кандидата филологических наук. Ленинград, 1990. С. 9.
Хохлова М. В. Исследование лексико-синтаксической сочетаемости в русском языке с помощью статистических методов (на базе корпусов текстов) : автореферат диссертации на соискание ученой степени кандидата филологических наук. Санкт-Петербург, 2010. 27 с. URL: https://www.dissercat.com/content/issledovanie-leksiko-sintaksicheskoi-sochetaemosti-v-russkom-yazyke-s-pomoshchyu-statistiche/read (дата обращения: 22.11.2022).
Лихачев Д. С. Поэтика древнерусской литературы. Москва : Наука, 1979. С. 15.
Ломтев Т. П. Очерки по историческому синтаксису русского языка. Москва : Изд-во МГУ, 1956. С. 63.
Загрузки
Опубликован
Как цитировать
Выпуск
Раздел
Лицензия
Copyright (c) 2022 Р А Верняева
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.