ЛИНГВОСТАТИСТИЧЕСКИЙ АНАЛИЗ ДРЕВНЕРУССКОЙ АНТОЛОГИИ (РНБ, F.п.I. 39)
DOI:
https://doi.org/10.22213/2618-9763-2021-2-50-60Ключевые слова:
Толстовский сборник XIII века, Кирилл Туровский, анонимные тексты, атрибуция, стилометрия, лингвотекстология, метод ДельтаАннотация
Представлен лингвостатический анализ 29 текстов рукописи XIII века - Толстовского сборника (РНБ, F.п.I. 39), содержащего оригинальные произведения древнерусского автора Кирилла Туровского и переводы текстов Кирилла Иерусалимского, Иоанна Златоуста и неизвестных авторов. Целями работы являются а) верификация выводов об авторстве трех анонимных текстов сборника, приписываемых Кириллу Туровскому, сделанных в ходе их предшествующего анализа традиционными лингвистическими методами и корреляционными методами статистики, а также б) установление возможности использования статистических методов для сопоставления текстов малых объемов. Для измерения межтекстового расстояния применен метод Дельта и его модификация косинус-Дельта, использовано различное количество наиболее частотных слов каждого из текстов - от 50 до 250. Данные извлечены из электронного издания Толстовского сборника. Вычисления и построение дендрограмм осуществлены с помощью пакета Stylo. Анализ дендрограмм подтвердил выводы, сделанные в других работах: три анонимных текста Слово о премудрости, Поучение на Пянтикостии и Поучение в неделю 5-ю по Пасхе не принадлежат Кириллу Туровскому. Обнаружена зависимость группировки текстов от их объема и примененных методов. Обнаружено, что косинус-Дельта, в отличие от классической Дельты, оказывается нечувствительным к различиям в объеме текстов. Кроме того, при использовании косинус-Дельта увеличение количества наиболее частотных слов позволяет обнаружить корреляцию между группировками текстов и их дискурсивной и лексико-синтаксической близостью.Библиографические ссылки
Мартыненко Г. Я. Стилеметрия: возникновение и становление в контексте междисциплинарного взаимодействия // Структурная и прикладная лингвистика. 2014. № 10. С. 3-23.
Мартыненко Г. Я. Стилеметрия: возникновение и становление в контексте междисциплинарного взаимодействия. Ч. 2. Первая половина XX века // Структурная и прикладная лингвистика. 2015. № 11. С. 9-28.
Мартыненко Г. Я. Cтилеметрия: возникновение и становление в контексте междисциплинарного взаимодействия. Ч. 3. Вторая половина XX века: становление новой стилеметрии // Структурная и прикладная лингвистика / под ред. И. С. Николаева. СПб., 2019. С. 5-33.
Зализняк А. А. Слово о полку Игореве. Взгляд лингвиста. М. : Языки славянской культуры, 2004. 352 с.
Миронова Д. М. Применение кластерного анализа в текстологии // Структурная и прикладная лингвистика. Вып. 11 : межвуз. сб. / под ред. А. С. Герда и И. С. Николаева. СПб. : Изд-во С.-Петерб. ун-та, 2015. С. 155-160.
Миронова Д. М. Автоматизированная классификация древних рукописей (на материале 525 списков славянского Евангелия от Матфея XI-XVI вв.) : дис. … канд. филол. наук: 10.02.21 - Прикладная и математическая лингвистика. СПб., 2017. 315 с.
Сводный каталог славяно-русских рукописных книг, хранящихся в СССР. XI-ХIII вв. М. : Наука, 1984. 406 с.
Сводный каталог славяно-русских рукописных книг, хранящихся в России, странах СНГ и Балтии. XIV век. Вып. 1 (Апокалипсис - Летопись Лаврентьевская). М. : Индрик, 2002. 768 с.
Зализняк А. А. Слово о полку Игореве. Взгляд лингвиста. М. : Языки славянской культуры, 2004. 352 с.
Словарь древнерусского языка (XI-XIV вв.): в 10 т. М. : Рус. яз. ; Азбуковник, 1988. Т. VI: (овадъ - покласти). 2000. 608 с.
Жолобов О. Ф. О контрастирующих орфографических системах в рукописи XIII в. (к интернет-изданию Толстовского сборника) // Древняя Русь. Вопросы медиевистики. 2018. 3 (73). С. 77-89.
Жолобов О. Ф. Слово-притча о премудрости в списках XII-XVI вв. // Научное наследие В. А. Богородицкого и современный вектор исследований Казанской лингвистической школы : тр. и материалы Междунар. конф. (Казан. федер. ун-т, 14-17 окт. 2018 г.): в 2 т. / под общ. ред. К. Р. Галиуллина, Е. А. Горобец, Э. А. Исламовой. Казань : Изд-во Казан. ун-та, 2018. Т. 1. С. 85-90.
Новак М. О. Слово на Рождество Христово в Толстовском сборнике XIII в. (РНБ, F.п.I.39): атрибуция и композиция // Девятые Римские Кирилло-Мефодиевские чтения: материалы конф. (Рим - Салерно, 4-9 февр. 2019 г.). С. 137-142.
Oleg F. Zholobov, Victor A. Baranov and Maria O. Novak. Anonymous Vs. Attributed: Cluster Analysis of Tolstovskiĭ Sbornik Texts and Its Interpretation in Terms of Cultural Heritage // Journal of Siberian Federal University. Humanities & Social Sciences, 2020. Vol. 13(12). Pp. 2056-2081. DOI: 10.17516/1997-1370-0704.
Баранов В. А., Жолобов О. Ф. Лингвостатистическое исследование частотных слов в Словах Кирилла Туровского (по рукописи РНБ, F.п.I.39) // Slověne. 2020. Vol. 9. No. 1. C. 29-80. DOI: 10.31168/2305-6754.2020.9.1.2. URL: http://slovene.ru/ 2020_1_Baranov_Zholobov.pdf (дата обращения: 20.04.2021).
Баранов В. А. Корреляционный анализ биграмм русских евангельских списков XI-XIV веков // Интеллектуальные системы в производстве. 2018. Т. 16. № 4. С. 65-74.
Баранов В. А., Жолобов О. Ф. Древнерусские рукописи как объект статистического анализа // Интеллектуальные системы в производстве. 2019. Т. 17. № 4. С. 63-77. DOI 10.22213/2410-9304-2019-4-63-77.
Burrows J. ‘Delta’: A Measure of Stylistic Difference and a Guide to Likely Authorship // Literary and Linguistic Computing. 2002. Vol. 17. No. 3. Pp. 267-287.
Hoover D. L. Testing Burrows’s Delta // Literary and Linguistic Computing. 2004. Vol. 19. No. 4. Pp. 453-475.
Argamon S. Interpreting Burrows’s Delta: Geometric and Probabilistic Foundations // Literary and Linguistic Computing. 2008. Vol. 23. No. 2. Pp. 131-147.
Improving Burrows’ Delta - An empirical evaluation of text distance measures / F. Jannidis, St. Pielstrom, C. Schoch, Th. Vitt // Digital Humanities Conference. 2015. Sydney, Australia. URL: https://www.researchgate.net/ publication/280086768_Improving_Burrows%27_Delta_-_An_empirical_evaluation_of_text_distance_measures (дата обращения: 21.04.2021).
Understanding and explaining Delta measures for authorship attribution / St. Evert, Th. Proisl, F. Jannidis, Is. Reger, St. Pielström, Chr. Schöch, Th. Vitt // Digital Scholarship in the Humanities. 2017. Vol. 32. Issue 2. Pp. 114-116.
Hoover D. L. Testing Burrows’s Delta // Literary and Linguistic Computing. 2004. Vol. 19. No. 4. Pp. 453-475.
Hoover D. Delta, Delta Prime, and Modern American Poetry: Authorship Attribution Theory and Method // Proceedings of the 2005 ALLC/ACH Conference. URL: http://tomcat-stable.hcmc.uvic.ca:8080/ach/ site/xhtml.xq?id=73 (дата обращения: 21.04.2021).
Eder M., Rybicki J. PCA, Delta, JGAAP and Polish Poetry of the 16th and the 17th Centuries: Who Wrote the Dirty Stuff? // Digital Humanities 2009: Conference Abstracts. MD College Park. 2009. Pp. 242-244.
Rybicki J., Eder M. Deeper Delta across genres and languages: Do we really need the most frequent words? // Literary and Linguistic Computing. 2011. Vol. 26. No 3. Pp. 315-321.
Abdul Razzaq A. A., Mustafa T. K. Burrows-Delta Method Fitness for Arabic Text Authorship Stylometric Detection // International Journal of Computer Science and Mobile Computing. 2014. Vol. 3. Issue 6. Pp. 69-78.
Jannidis F., Lauer G. Burrows’s Delta and Its Use in German Literary History // Distant Readings. Topologies of German Culture in the Long Nineteenth Century Studies in German Literature Linguistics and Culture / Eds. M. Erlin, L. Tatlock. Rochester: Camden House, 2014. Pp. 29-54.
Towards a better understanding of Burrows’s Delta in literary authorship attribution / St. Evert, Th. Proisl, F. Jannidis, St. Pielström, Chr. Schöch, Th. Vitt // NAACL HLT Fourth Workshop on Computational Linguistics for Literature. Denver, Colorado. 2015. Pp. 79-88. URL: https://www.researchgate.net/publication/ 279954745 _Towards_a_better_understanding_of_Burrows’s_Delta_in_literary_authorship_attribution (дата обращения: 21.04.2021).
Improving Burrows’ Delta - An empirical evaluation of text distance measures / F. Jannidis, St. Pielstrom, C. Schoch, Th. Vitt. Digital Humanities Conference, 2015, Sydney, Australia. URL: https://www.re searchgate.net/ publication/280086768_Improving_Burrows%27_Delta_-_An_empirical_evaluation_of_text_distance_measures (accessed 21.04.2021).
Savoy J. Estimating the probability of an authorship attribution // Journal of the Association for Information Science and Technology. 2015. Vol. 67 (6). Pp. 1-11.
José Calvo Tello. What does Delta see inside the Author? // Evaluating Stylometric Clusters with Literary Metadata. 2018. Pp. 153-161.
Oakes Michael P. Computer Stylometry of C.S. Lewis’s The Dark Tower and Related Texts // Digital Scholarship in the Humanities. 2018. Vol. 33. Issue 3. Pp. 637-650. DOI: https://doi.org/10.1093/llc/fqx043
Метод Дельты Бёрроуза для определения авторства анонимных и псевдонимных литературных произведений на русском языке / Н. К. Мамаев, М. А. Марусенко, К. Р. Пиотровская, А. Л. Ронжин // Proceedings of the R. Piotrowski's Readings in Language Engineering and Applied Linguistics. СПб. : RWTH Aahen University, 2018. С. 1-14. URL: https://clck.ru/ UQKxh (дата обращения: 20.04.2021).
Об авторстве «писем Берии из заточения» / В. В. Петров, М. А. Марусенко, К. Р. Пиотровская, И. Н. Маньяс, Н. К. Мамаев // Вестник Санкт-Петербургского университета. Право. 2019. Т. 10 (3). С. 586-605. URL: https://lawjournal.spbu.ru/article/ view/5929 (дата обращения: 21.04.2021).
Великанова Н. П., Орехов Б. В. Цифровая текстология: атрибуция текста на примере романа М. А. Шолохова «Тихий Дон» // Мир Шолохова. 2019. 1(11). С. 70-82.
Орехов Б. В. «Илиада» Е. И. Кострова и «Илиада» А. И. Любжина: стилеметрический аспект // Аристей. 2020. Т. 21. С. 282-296. URL: http://aristeas.ru/ 21_10 (дата обращения: 20.04.2021).
Великанова Н. П., Орехов Б. В. Цифровая текстология: атрибуция текста на примере романа М. А. Шолохова «Тихий Дон» // Мир Шолохова. 2019. 1(11). С. 70-82.
Об авторстве «писем Берии из заточения» / В. В. Петров, М. А. Марусенко, К. Р. Пиотровская, И. Н. Маньяс, Н. К. Мамаев // Вестник Санкт-Петербургского университета. Право. 2019. Т. 10 (3). С. 586-605. URL: https://lawjournal.spbu.ru/article/ view/5929 (дата обращения: 21.04.2021).
Там же.
Великанова Н. П., Орехов Б. В. Указ соч.
Мамаев Н. К. [и др.] Указ соч.
Там же.
[Петров В. В.и др.] Указ соч.
Eder M., Rybicki J., Kestemont M. Stylometry with R: A package for computational text analysis // The R Journal. 2016, Vol. 8, No. 1. Pp. 107-121. URL: https://journal.r-project.org/archive/2016/RJ-2016-007/ index.html (дата обращения: 20.04.2021).
Жолобов О. Ф. Толстовский сборник XIII в. как мегатекст // Лингвокультурологические исследования развития русского языка в условиях полиэтнической среды: опыт и перспективы (1-4 октября 2018 г.): тр. и матер.: в 2 т. / под общ. ред. Е. А. Горобец, О. Ф. Жолобова, М. О. Новак. Казань: Изд-во Казан. ун-та, 2018. Т. 2. С. 73-77.
Oleg F. Zholobov, Victor A. Baranov and Maria O. Novak. Anonymous Vs. Attributed: Cluster Analysis of Tolstovskiĭ Sbornik Texts and Its Interpretation in Terms of Cultural Heritage // Journal of Siberian Federal University. Humanities & Social Sciences. 2020. Vol. 13(12). Pp. 2056-2081. DOI: 10.17516/1997-1370-0704.
Жолобов О. Ф. О контрастирующих орфографических системах в рукописи XIII в. (к интернет-изданию Толстовского сборника) // Древняя Русь. Вопросы медиевистики. 2018. 3 (73). С. 77-89.
Жолобов О. Ф. Слово-притча о премудрости в списках XII-XVI вв. // Научное наследие В. А. Богородицкого и современный вектор исследований Казанской лингвистической школы: тр. и матер. междунар. конф. (Казан. федер. ун-т, 14-17 окт. 2018 г.): в 2 т. / под общ. ред. К. Р. Галиуллина, Е. А. Горобец, Э. А. Исламовой. Казань : Изд-во Казан. ун-та, 2018. Т. 1. С. 85-90.
Новак М. О. Указ. соч.
Oleg F. Zholobov, Victor A. Baranov and Maria O. Novak. Anonymous Vs. Attributed: Cluster Analysis of Tolstovskiĭ Sbornik Texts and Its Interpretation in Terms of Cultural Heritage // Journal of Siberian Federal University. Humanities & Social Sciences. 2020. Vol. 13(12). Pp. 2056-2081. DOI: 10.17516/1997-1370-0704.
Загрузки
Опубликован
Как цитировать
Выпуск
Раздел
Лицензия
Copyright (c) 2021 Баранов В.А., Жолобов О.Ф.
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.