ЛИНГВОСТАТИСТИЧЕСКИЙ АНАЛИЗ ДРЕВНЕРУССКОЙ АНТОЛОГИИ (РНБ, F.п.I. 39)

Авторы

  • В. А. Баранов Ижевский государственный технический университет имени М. Т. Калашникова
  • О. Ф. Жолобов Казанский (Приволжский) федеральный университет

DOI:

https://doi.org/10.22213/2618-9763-2021-2-50-60

Ключевые слова:

Толстовский сборник XIII века, Кирилл Туровский, анонимные тексты, атрибуция, стилометрия, лингвотекстология, метод Дельта

Аннотация

Представлен лингвостатический анализ 29 текстов рукописи XIII века - Толстовского сборника (РНБ, F.п.I. 39), содержащего оригинальные произведения древнерусского автора Кирилла Туровского и переводы текстов Кирилла Иерусалимского, Иоанна Златоуста и неизвестных авторов. Целями работы являются а) верификация выводов об авторстве трех анонимных текстов сборника, приписываемых Кириллу Туровскому, сделанных в ходе их предшествующего анализа традиционными лингвистическими методами и корреляционными методами статистики, а также б) установление возможности использования статистических методов для сопоставления текстов малых объемов. Для измерения межтекстового расстояния применен метод Дельта и его модификация косинус-Дельта, использовано различное количество наиболее частотных слов каждого из текстов - от 50 до 250. Данные извлечены из электронного издания Толстовского сборника. Вычисления и построение дендрограмм осуществлены с помощью пакета Stylo. Анализ дендрограмм подтвердил выводы, сделанные в других работах: три анонимных текста Слово о премудрости, Поучение на Пянтикостии и Поучение в неделю 5-ю по Пасхе не принадлежат Кириллу Туровскому. Обнаружена зависимость группировки текстов от их объема и примененных методов. Обнаружено, что косинус-Дельта, в отличие от классической Дельты, оказывается нечувствительным к различиям в объеме текстов. Кроме того, при использовании косинус-Дельта увеличение количества наиболее частотных слов позволяет обнаружить корреляцию между группировками текстов и их дискурсивной и лексико-синтаксической близостью.

Биографии авторов

В. А. Баранов, Ижевский государственный технический университет имени М. Т. Калашникова

доктор филологических наук, профессор, заведующий кафедрой «Лингвистика»

О. Ф. Жолобов, Казанский (Приволжский) федеральный университет

доктор филологических наук, профессор, профессор кафедры прикладной и экспериментальной лингвистики

Библиографические ссылки

Мартыненко Г. Я. Стилеметрия: возникновение и становление в контексте междисциплинарного взаимодействия // Структурная и прикладная лингвистика. 2014. № 10. С. 3-23.

Мартыненко Г. Я. Стилеметрия: возникновение и становление в контексте междисциплинарного взаимодействия. Ч. 2. Первая половина XX века // Структурная и прикладная лингвистика. 2015. № 11. С. 9-28.

Мартыненко Г. Я. Cтилеметрия: возникновение и становление в контексте междисциплинарного взаимодействия. Ч. 3. Вторая половина XX века: становление новой стилеметрии // Структурная и прикладная лингвистика / под ред. И. С. Николаева. СПб., 2019. С. 5-33.

Зализняк А. А. Слово о полку Игореве. Взгляд лингвиста. М. : Языки славянской культуры, 2004. 352 с.

Миронова Д. М. Применение кластерного анализа в текстологии // Структурная и прикладная лингвистика. Вып. 11 : межвуз. сб. / под ред. А. С. Герда и И. С. Николаева. СПб. : Изд-во С.-Петерб. ун-та, 2015. С. 155-160.

Миронова Д. М. Автоматизированная классификация древних рукописей (на материале 525 списков славянского Евангелия от Матфея XI-XVI вв.) : дис. … канд. филол. наук: 10.02.21 - Прикладная и математическая лингвистика. СПб., 2017. 315 с.

Сводный каталог славяно-русских рукописных книг, хранящихся в СССР. XI-ХIII вв. М. : Наука, 1984. 406 с.

Сводный каталог славяно-русских рукописных книг, хранящихся в России, странах СНГ и Балтии. XIV век. Вып. 1 (Апокалипсис - Летопись Лаврентьевская). М. : Индрик, 2002. 768 с.

Зализняк А. А. Слово о полку Игореве. Взгляд лингвиста. М. : Языки славянской культуры, 2004. 352 с.

Словарь древнерусского языка (XI-XIV вв.): в 10 т. М. : Рус. яз. ; Азбуковник, 1988. Т. VI: (овадъ - покласти). 2000. 608 с.

Жолобов О. Ф. О контрастирующих орфографических системах в рукописи XIII в. (к интернет-изданию Толстовского сборника) // Древняя Русь. Вопросы медиевистики. 2018. 3 (73). С. 77-89.

Жолобов О. Ф. Слово-притча о премудрости в списках XII-XVI вв. // Научное наследие В. А. Богородицкого и современный вектор исследований Казанской лингвистической школы : тр. и материалы Междунар. конф. (Казан. федер. ун-т, 14-17 окт. 2018 г.): в 2 т. / под общ. ред. К. Р. Галиуллина, Е. А. Горобец, Э. А. Исламовой. Казань : Изд-во Казан. ун-та, 2018. Т. 1. С. 85-90.

Новак М. О. Слово на Рождество Христово в Толстовском сборнике XIII в. (РНБ, F.п.I.39): атрибуция и композиция // Девятые Римские Кирилло-Мефодиевские чтения: материалы конф. (Рим - Салерно, 4-9 февр. 2019 г.). С. 137-142.

Oleg F. Zholobov, Victor A. Baranov and Maria O. Novak. Anonymous Vs. Attributed: Cluster Analysis of Tolstovskiĭ Sbornik Texts and Its Interpretation in Terms of Cultural Heritage // Journal of Siberian Federal University. Humanities & Social Sciences, 2020. Vol. 13(12). Pp. 2056-2081. DOI: 10.17516/1997-1370-0704.

Баранов В. А., Жолобов О. Ф. Лингвостатистическое исследование частотных слов в Словах Кирилла Туровского (по рукописи РНБ, F.п.I.39) // Slověne. 2020. Vol. 9. No. 1. C. 29-80. DOI: 10.31168/2305-6754.2020.9.1.2. URL: http://slovene.ru/ 2020_1_Baranov_Zholobov.pdf (дата обращения: 20.04.2021).

Баранов В. А. Корреляционный анализ биграмм русских евангельских списков XI-XIV веков // Интеллектуальные системы в производстве. 2018. Т. 16. № 4. С. 65-74.

Баранов В. А., Жолобов О. Ф. Древнерусские рукописи как объект статистического анализа // Интеллектуальные системы в производстве. 2019. Т. 17. № 4. С. 63-77. DOI 10.22213/2410-9304-2019-4-63-77.

Burrows J. ‘Delta’: A Measure of Stylistic Difference and a Guide to Likely Authorship // Literary and Linguistic Computing. 2002. Vol. 17. No. 3. Pp. 267-287.

Hoover D. L. Testing Burrows’s Delta // Literary and Linguistic Computing. 2004. Vol. 19. No. 4. Pp. 453-475.

Argamon S. Interpreting Burrows’s Delta: Geometric and Probabilistic Foundations // Literary and Linguistic Computing. 2008. Vol. 23. No. 2. Pp. 131-147.

Improving Burrows’ Delta - An empirical evaluation of text distance measures / F. Jannidis, St. Pielstrom, C. Schoch, Th. Vitt // Digital Humanities Conference. 2015. Sydney, Australia. URL: https://www.researchgate.net/ publication/280086768_Improving_Burrows%27_Delta_-_An_empirical_evaluation_of_text_distance_measures (дата обращения: 21.04.2021).

Understanding and explaining Delta measures for authorship attribution / St. Evert, Th. Proisl, F. Jannidis, Is. Reger, St. Pielström, Chr. Schöch, Th. Vitt // Digital Scholarship in the Humanities. 2017. Vol. 32. Issue 2. Pp. 114-116.

Hoover D. L. Testing Burrows’s Delta // Literary and Linguistic Computing. 2004. Vol. 19. No. 4. Pp. 453-475.

Hoover D. Delta, Delta Prime, and Modern American Poetry: Authorship Attribution Theory and Method // Proceedings of the 2005 ALLC/ACH Conference. URL: http://tomcat-stable.hcmc.uvic.ca:8080/ach/ site/xhtml.xq?id=73 (дата обращения: 21.04.2021).

Eder M., Rybicki J. PCA, Delta, JGAAP and Polish Poetry of the 16th and the 17th Centuries: Who Wrote the Dirty Stuff? // Digital Humanities 2009: Conference Abstracts. MD College Park. 2009. Pp. 242-244.

Rybicki J., Eder M. Deeper Delta across genres and languages: Do we really need the most frequent words? // Literary and Linguistic Computing. 2011. Vol. 26. No 3. Pp. 315-321.

Abdul Razzaq A. A., Mustafa T. K. Burrows-Delta Method Fitness for Arabic Text Authorship Stylometric Detection // International Journal of Computer Science and Mobile Computing. 2014. Vol. 3. Issue 6. Pp. 69-78.

Jannidis F., Lauer G. Burrows’s Delta and Its Use in German Literary History // Distant Readings. Topologies of German Culture in the Long Nineteenth Century Studies in German Literature Linguistics and Culture / Eds. M. Erlin, L. Tatlock. Rochester: Camden House, 2014. Pp. 29-54.

Towards a better understanding of Burrows’s Delta in literary authorship attribution / St. Evert, Th. Proisl, F. Jannidis, St. Pielström, Chr. Schöch, Th. Vitt // NAACL HLT Fourth Workshop on Computational Linguistics for Literature. Denver, Colorado. 2015. Pp. 79-88. URL: https://www.researchgate.net/publication/ 279954745 _Towards_a_better_understanding_of_Burrows’s_Delta_in_literary_authorship_attribution (дата обращения: 21.04.2021).

Improving Burrows’ Delta - An empirical evaluation of text distance measures / F. Jannidis, St. Pielstrom, C. Schoch, Th. Vitt. Digital Humanities Conference, 2015, Sydney, Australia. URL: https://www.re searchgate.net/ publication/280086768_Improving_Burrows%27_Delta_-_An_empirical_evaluation_of_text_distance_measures (accessed 21.04.2021).

Savoy J. Estimating the probability of an authorship attribution // Journal of the Association for Information Science and Technology. 2015. Vol. 67 (6). Pp. 1-11.

José Calvo Tello. What does Delta see inside the Author? // Evaluating Stylometric Clusters with Literary Metadata. 2018. Pp. 153-161.

Oakes Michael P. Computer Stylometry of C.S. Lewis’s The Dark Tower and Related Texts // Digital Scholarship in the Humanities. 2018. Vol. 33. Issue 3. Pp. 637-650. DOI: https://doi.org/10.1093/llc/fqx043

Метод Дельты Бёрроуза для определения авторства анонимных и псевдонимных литературных произведений на русском языке / Н. К. Мамаев, М. А. Марусенко, К. Р. Пиотровская, А. Л. Ронжин // Proceedings of the R. Piotrowski's Readings in Language Engineering and Applied Linguistics. СПб. : RWTH Aahen University, 2018. С. 1-14. URL: https://clck.ru/ UQKxh (дата обращения: 20.04.2021).

Об авторстве «писем Берии из заточения» / В. В. Петров, М. А. Марусенко, К. Р. Пиотровская, И. Н. Маньяс, Н. К. Мамаев // Вестник Санкт-Петербургского университета. Право. 2019. Т. 10 (3). С. 586-605. URL: https://lawjournal.spbu.ru/article/ view/5929 (дата обращения: 21.04.2021).

Великанова Н. П., Орехов Б. В. Цифровая текстология: атрибуция текста на примере романа М. А. Шолохова «Тихий Дон» // Мир Шолохова. 2019. 1(11). С. 70-82.

Орехов Б. В. «Илиада» Е. И. Кострова и «Илиада» А. И. Любжина: стилеметрический аспект // Аристей. 2020. Т. 21. С. 282-296. URL: http://aristeas.ru/ 21_10 (дата обращения: 20.04.2021).

Великанова Н. П., Орехов Б. В. Цифровая текстология: атрибуция текста на примере романа М. А. Шолохова «Тихий Дон» // Мир Шолохова. 2019. 1(11). С. 70-82.

Об авторстве «писем Берии из заточения» / В. В. Петров, М. А. Марусенко, К. Р. Пиотровская, И. Н. Маньяс, Н. К. Мамаев // Вестник Санкт-Петербургского университета. Право. 2019. Т. 10 (3). С. 586-605. URL: https://lawjournal.spbu.ru/article/ view/5929 (дата обращения: 21.04.2021).

Там же.

Великанова Н. П., Орехов Б. В. Указ соч.

Мамаев Н. К. [и др.] Указ соч.

Там же.

[Петров В. В.и др.] Указ соч.

Eder M., Rybicki J., Kestemont M. Stylometry with R: A package for computational text analysis // The R Journal. 2016, Vol. 8, No. 1. Pp. 107-121. URL: https://journal.r-project.org/archive/2016/RJ-2016-007/ index.html (дата обращения: 20.04.2021).

Жолобов О. Ф. Толстовский сборник XIII в. как мегатекст // Лингвокультурологические исследования развития русского языка в условиях полиэтнической среды: опыт и перспективы (1-4 октября 2018 г.): тр. и матер.: в 2 т. / под общ. ред. Е. А. Горобец, О. Ф. Жолобова, М. О. Новак. Казань: Изд-во Казан. ун-та, 2018. Т. 2. С. 73-77.

Oleg F. Zholobov, Victor A. Baranov and Maria O. Novak. Anonymous Vs. Attributed: Cluster Analysis of Tolstovskiĭ Sbornik Texts and Its Interpretation in Terms of Cultural Heritage // Journal of Siberian Federal University. Humanities & Social Sciences. 2020. Vol. 13(12). Pp. 2056-2081. DOI: 10.17516/1997-1370-0704.

Жолобов О. Ф. О контрастирующих орфографических системах в рукописи XIII в. (к интернет-изданию Толстовского сборника) // Древняя Русь. Вопросы медиевистики. 2018. 3 (73). С. 77-89.

Жолобов О. Ф. Слово-притча о премудрости в списках XII-XVI вв. // Научное наследие В. А. Богородицкого и современный вектор исследований Казанской лингвистической школы: тр. и матер. междунар. конф. (Казан. федер. ун-т, 14-17 окт. 2018 г.): в 2 т. / под общ. ред. К. Р. Галиуллина, Е. А. Горобец, Э. А. Исламовой. Казань : Изд-во Казан. ун-та, 2018. Т. 1. С. 85-90.

Новак М. О. Указ. соч.

Oleg F. Zholobov, Victor A. Baranov and Maria O. Novak. Anonymous Vs. Attributed: Cluster Analysis of Tolstovskiĭ Sbornik Texts and Its Interpretation in Terms of Cultural Heritage // Journal of Siberian Federal University. Humanities & Social Sciences. 2020. Vol. 13(12). Pp. 2056-2081. DOI: 10.17516/1997-1370-0704.

Загрузки

Опубликован

17.01.2022

Как цитировать

Баранов, В. А., & Жолобов, О. Ф. (2022). ЛИНГВОСТАТИСТИЧЕСКИЙ АНАЛИЗ ДРЕВНЕРУССКОЙ АНТОЛОГИИ (РНБ, F.п.I. 39). Социально-экономическое управление: теория и практика, 17(2), 50–60. https://doi.org/10.22213/2618-9763-2021-2-50-60

Выпуск

Раздел

Статьи