LINGVO-STATISTICAL ANALYSIS OF THE OLD RUSSIAN ANTHOLOGY (RNL, F.p.I. 39)

Authors

  • V. A. Baranov Kalashnikov Izhevsk State Technical University
  • O. F. Zholobov Kazan (Volga Region) Federal University

DOI:

https://doi.org/10.22213/2618-9763-2021-2-50-60

Keywords:

Tolstoy miscellany of the XIII century, Kirill Turovsky, anonymous texts, attribution, Delta method, stylometry, linguistic textology

Abstract

A linguistic analysis of 29 texts of the 13th century manuscript (the Tolstoy miscellany, RNL, F.p.I. 39), containing the original works of the ancient Russian author Kirill Turovsky and translations of the texts of Cyril of Jerusalem, John Chrysostom and unknown authors is presented. The objectives of the work are a) verification of the conclusions about the authorship of three anonymous texts of the manuscript attributed to Kirill Turovsky, made in the course of their previous analysis using traditional linguistic methods and correlation methods of statistics, and also b) establishing the possibility of using statistical methods to compare small texts. To measure the distance between the texts, the Delta method and its modification the Cosine-Delta were used, a different number of the most frequent words (from 50 to 250) of each of the texts were used. The data were extracted from the electronic edition of the Tolstoy miscellany. Calculations and construction of dendrograms were carried out using the Stylo package. Dendrogram analysis confirmed the findings of other studies: the three anonymous texts - Parable of Wisdom, Sermon on Pentecost and Sermon on the 5th Sunday after Easter - do not belong to Kirill Turovsky. The dependence of the grouping of texts on the size of the texts and applied methods was found. It was found that the cosine-Delta method, in contrast to the classical Delta, turns out to be insensitive to differences in the size of texts. In addition, an increase in the number of the most frequent words when using cosine-delta allows one to find a correlation between groupings of texts and their discursive and lexico-syntactic affinity.

Author Biographies

V. A. Baranov, Kalashnikov Izhevsk State Technical University

Doctor of Philology, Professor

O. F. Zholobov, Kazan (Volga Region) Federal University

Doctor of Philology, Professor

References

Мартыненко Г. Я. Стилеметрия: возникновение и становление в контексте междисциплинарного взаимодействия // Структурная и прикладная лингвистика. 2014. № 10. С. 3-23.

Мартыненко Г. Я. Стилеметрия: возникновение и становление в контексте междисциплинарного взаимодействия. Ч. 2. Первая половина XX века // Структурная и прикладная лингвистика. 2015. № 11. С. 9-28.

Мартыненко Г. Я. Cтилеметрия: возникновение и становление в контексте междисциплинарного взаимодействия. Ч. 3. Вторая половина XX века: становление новой стилеметрии // Структурная и прикладная лингвистика / под ред. И. С. Николаева. СПб., 2019. С. 5-33.

Зализняк А. А. Слово о полку Игореве. Взгляд лингвиста. М. : Языки славянской культуры, 2004. 352 с.

Миронова Д. М. Применение кластерного анализа в текстологии // Структурная и прикладная лингвистика. Вып. 11 : межвуз. сб. / под ред. А. С. Герда и И. С. Николаева. СПб. : Изд-во С.-Петерб. ун-та, 2015. С. 155-160.

Миронова Д. М. Автоматизированная классификация древних рукописей (на материале 525 списков славянского Евангелия от Матфея XI-XVI вв.) : дис. … канд. филол. наук: 10.02.21 - Прикладная и математическая лингвистика. СПб., 2017. 315 с.

Сводный каталог славяно-русских рукописных книг, хранящихся в СССР. XI-ХIII вв. М. : Наука, 1984. 406 с.

Сводный каталог славяно-русских рукописных книг, хранящихся в России, странах СНГ и Балтии. XIV век. Вып. 1 (Апокалипсис - Летопись Лаврентьевская). М. : Индрик, 2002. 768 с.

Зализняк А. А. Слово о полку Игореве. Взгляд лингвиста. М. : Языки славянской культуры, 2004. 352 с.

Словарь древнерусского языка (XI-XIV вв.): в 10 т. М. : Рус. яз. ; Азбуковник, 1988. Т. VI: (овадъ - покласти). 2000. 608 с.

Жолобов О. Ф. О контрастирующих орфографических системах в рукописи XIII в. (к интернет-изданию Толстовского сборника) // Древняя Русь. Вопросы медиевистики. 2018. 3 (73). С. 77-89.

Жолобов О. Ф. Слово-притча о премудрости в списках XII-XVI вв. // Научное наследие В. А. Богородицкого и современный вектор исследований Казанской лингвистической школы : тр. и материалы Междунар. конф. (Казан. федер. ун-т, 14-17 окт. 2018 г.): в 2 т. / под общ. ред. К. Р. Галиуллина, Е. А. Горобец, Э. А. Исламовой. Казань : Изд-во Казан. ун-та, 2018. Т. 1. С. 85-90.

Новак М. О. Слово на Рождество Христово в Толстовском сборнике XIII в. (РНБ, F.п.I.39): атрибуция и композиция // Девятые Римские Кирилло-Мефодиевские чтения: материалы конф. (Рим - Салерно, 4-9 февр. 2019 г.). С. 137-142.

Oleg F. Zholobov, Victor A. Baranov and Maria O. Novak. Anonymous Vs. Attributed: Cluster Analysis of Tolstovskiĭ Sbornik Texts and Its Interpretation in Terms of Cultural Heritage // Journal of Siberian Federal University. Humanities & Social Sciences, 2020. Vol. 13(12). Pp. 2056-2081. DOI: 10.17516/1997-1370-0704.

Баранов В. А., Жолобов О. Ф. Лингвостатистическое исследование частотных слов в Словах Кирилла Туровского (по рукописи РНБ, F.п.I.39) // Slověne. 2020. Vol. 9. No. 1. C. 29-80. DOI: 10.31168/2305-6754.2020.9.1.2. URL: http://slovene.ru/ 2020_1_Baranov_Zholobov.pdf (дата обращения: 20.04.2021).

Баранов В. А. Корреляционный анализ биграмм русских евангельских списков XI-XIV веков // Интеллектуальные системы в производстве. 2018. Т. 16. № 4. С. 65-74.

Баранов В. А., Жолобов О. Ф. Древнерусские рукописи как объект статистического анализа // Интеллектуальные системы в производстве. 2019. Т. 17. № 4. С. 63-77. DOI 10.22213/2410-9304-2019-4-63-77.

Burrows J. ‘Delta’: A Measure of Stylistic Difference and a Guide to Likely Authorship // Literary and Linguistic Computing. 2002. Vol. 17. No. 3. Pp. 267-287.

Hoover D. L. Testing Burrows’s Delta // Literary and Linguistic Computing. 2004. Vol. 19. No. 4. Pp. 453-475.

Argamon S. Interpreting Burrows’s Delta: Geometric and Probabilistic Foundations // Literary and Linguistic Computing. 2008. Vol. 23. No. 2. Pp. 131-147.

Improving Burrows’ Delta - An empirical evaluation of text distance measures / F. Jannidis, St. Pielstrom, C. Schoch, Th. Vitt // Digital Humanities Conference. 2015. Sydney, Australia. URL: https://www.researchgate.net/ publication/280086768_Improving_Burrows%27_Delta_-_An_empirical_evaluation_of_text_distance_measures (дата обращения: 21.04.2021).

Understanding and explaining Delta measures for authorship attribution / St. Evert, Th. Proisl, F. Jannidis, Is. Reger, St. Pielström, Chr. Schöch, Th. Vitt // Digital Scholarship in the Humanities. 2017. Vol. 32. Issue 2. Pp. 114-116.

Hoover D. L. Testing Burrows’s Delta // Literary and Linguistic Computing. 2004. Vol. 19. No. 4. Pp. 453-475.

Hoover D. Delta, Delta Prime, and Modern American Poetry: Authorship Attribution Theory and Method // Proceedings of the 2005 ALLC/ACH Conference. URL: http://tomcat-stable.hcmc.uvic.ca:8080/ach/ site/xhtml.xq?id=73 (дата обращения: 21.04.2021).

Eder M., Rybicki J. PCA, Delta, JGAAP and Polish Poetry of the 16th and the 17th Centuries: Who Wrote the Dirty Stuff? // Digital Humanities 2009: Conference Abstracts. MD College Park. 2009. Pp. 242-244.

Rybicki J., Eder M. Deeper Delta across genres and languages: Do we really need the most frequent words? // Literary and Linguistic Computing. 2011. Vol. 26. No 3. Pp. 315-321.

Abdul Razzaq A. A., Mustafa T. K. Burrows-Delta Method Fitness for Arabic Text Authorship Stylometric Detection // International Journal of Computer Science and Mobile Computing. 2014. Vol. 3. Issue 6. Pp. 69-78.

Jannidis F., Lauer G. Burrows’s Delta and Its Use in German Literary History // Distant Readings. Topologies of German Culture in the Long Nineteenth Century Studies in German Literature Linguistics and Culture / Eds. M. Erlin, L. Tatlock. Rochester: Camden House, 2014. Pp. 29-54.

Towards a better understanding of Burrows’s Delta in literary authorship attribution / St. Evert, Th. Proisl, F. Jannidis, St. Pielström, Chr. Schöch, Th. Vitt // NAACL HLT Fourth Workshop on Computational Linguistics for Literature. Denver, Colorado. 2015. Pp. 79-88. URL: https://www.researchgate.net/publication/ 279954745 _Towards_a_better_understanding_of_Burrows’s_Delta_in_literary_authorship_attribution (дата обращения: 21.04.2021).

Improving Burrows’ Delta - An empirical evaluation of text distance measures / F. Jannidis, St. Pielstrom, C. Schoch, Th. Vitt. Digital Humanities Conference, 2015, Sydney, Australia. URL: https://www.re searchgate.net/ publication/280086768_Improving_Burrows%27_Delta_-_An_empirical_evaluation_of_text_distance_measures (accessed 21.04.2021).

Savoy J. Estimating the probability of an authorship attribution // Journal of the Association for Information Science and Technology. 2015. Vol. 67 (6). Pp. 1-11.

José Calvo Tello. What does Delta see inside the Author? // Evaluating Stylometric Clusters with Literary Metadata. 2018. Pp. 153-161.

Oakes Michael P. Computer Stylometry of C.S. Lewis’s The Dark Tower and Related Texts // Digital Scholarship in the Humanities. 2018. Vol. 33. Issue 3. Pp. 637-650. DOI: https://doi.org/10.1093/llc/fqx043

Метод Дельты Бёрроуза для определения авторства анонимных и псевдонимных литературных произведений на русском языке / Н. К. Мамаев, М. А. Марусенко, К. Р. Пиотровская, А. Л. Ронжин // Proceedings of the R. Piotrowski's Readings in Language Engineering and Applied Linguistics. СПб. : RWTH Aahen University, 2018. С. 1-14. URL: https://clck.ru/ UQKxh (дата обращения: 20.04.2021).

Об авторстве «писем Берии из заточения» / В. В. Петров, М. А. Марусенко, К. Р. Пиотровская, И. Н. Маньяс, Н. К. Мамаев // Вестник Санкт-Петербургского университета. Право. 2019. Т. 10 (3). С. 586-605. URL: https://lawjournal.spbu.ru/article/ view/5929 (дата обращения: 21.04.2021).

Великанова Н. П., Орехов Б. В. Цифровая текстология: атрибуция текста на примере романа М. А. Шолохова «Тихий Дон» // Мир Шолохова. 2019. 1(11). С. 70-82.

Орехов Б. В. «Илиада» Е. И. Кострова и «Илиада» А. И. Любжина: стилеметрический аспект // Аристей. 2020. Т. 21. С. 282-296. URL: http://aristeas.ru/ 21_10 (дата обращения: 20.04.2021).

Великанова Н. П., Орехов Б. В. Цифровая текстология: атрибуция текста на примере романа М. А. Шолохова «Тихий Дон» // Мир Шолохова. 2019. 1(11). С. 70-82.

Об авторстве «писем Берии из заточения» / В. В. Петров, М. А. Марусенко, К. Р. Пиотровская, И. Н. Маньяс, Н. К. Мамаев // Вестник Санкт-Петербургского университета. Право. 2019. Т. 10 (3). С. 586-605. URL: https://lawjournal.spbu.ru/article/ view/5929 (дата обращения: 21.04.2021).

Там же.

Великанова Н. П., Орехов Б. В. Указ соч.

Мамаев Н. К. [и др.] Указ соч.

Там же.

[Петров В. В.и др.] Указ соч.

Eder M., Rybicki J., Kestemont M. Stylometry with R: A package for computational text analysis // The R Journal. 2016, Vol. 8, No. 1. Pp. 107-121. URL: https://journal.r-project.org/archive/2016/RJ-2016-007/ index.html (дата обращения: 20.04.2021).

Жолобов О. Ф. Толстовский сборник XIII в. как мегатекст // Лингвокультурологические исследования развития русского языка в условиях полиэтнической среды: опыт и перспективы (1-4 октября 2018 г.): тр. и матер.: в 2 т. / под общ. ред. Е. А. Горобец, О. Ф. Жолобова, М. О. Новак. Казань: Изд-во Казан. ун-та, 2018. Т. 2. С. 73-77.

Oleg F. Zholobov, Victor A. Baranov and Maria O. Novak. Anonymous Vs. Attributed: Cluster Analysis of Tolstovskiĭ Sbornik Texts and Its Interpretation in Terms of Cultural Heritage // Journal of Siberian Federal University. Humanities & Social Sciences. 2020. Vol. 13(12). Pp. 2056-2081. DOI: 10.17516/1997-1370-0704.

Жолобов О. Ф. О контрастирующих орфографических системах в рукописи XIII в. (к интернет-изданию Толстовского сборника) // Древняя Русь. Вопросы медиевистики. 2018. 3 (73). С. 77-89.

Жолобов О. Ф. Слово-притча о премудрости в списках XII-XVI вв. // Научное наследие В. А. Богородицкого и современный вектор исследований Казанской лингвистической школы: тр. и матер. междунар. конф. (Казан. федер. ун-т, 14-17 окт. 2018 г.): в 2 т. / под общ. ред. К. Р. Галиуллина, Е. А. Горобец, Э. А. Исламовой. Казань : Изд-во Казан. ун-та, 2018. Т. 1. С. 85-90.

Новак М. О. Указ. соч.

Oleg F. Zholobov, Victor A. Baranov and Maria O. Novak. Anonymous Vs. Attributed: Cluster Analysis of Tolstovskiĭ Sbornik Texts and Its Interpretation in Terms of Cultural Heritage // Journal of Siberian Federal University. Humanities & Social Sciences. 2020. Vol. 13(12). Pp. 2056-2081. DOI: 10.17516/1997-1370-0704.

Published

17.01.2022

How to Cite

Baranov В. А., & Zholobov О. Ф. (2022). LINGVO-STATISTICAL ANALYSIS OF THE OLD RUSSIAN ANTHOLOGY (RNL, F.p.I. 39). Social’no-Ekonomiceskoe Upravlenie: Teoria I Praktika, 17(2), 50–60. https://doi.org/10.22213/2618-9763-2021-2-50-60

Issue

Section

Articles