Open-source Text Data Intelligence System Based on the Domestic Visual Programming Environment PolyAnalyst

Authors

  • K. S. Korneev Military Innovation Technopolis«ERA»
  • M. S. Spirin Military Innovation Technopolis«ERA»
  • E. M. Stepanov Military Innovation Technopolis«ERA»
  • D. S. Derunov Military Innovation Technopolis«ERA»

DOI:

https://doi.org/10.22213/2410-9304-2025-2-104-111

Keywords:

PolyAnalyst, data analysis, low-code, artificial intelligence, machine learning, nlp, natural language processing, osint, open data intelligence

Abstract

The article is devoted to the application of natural language processing (NLP) technologies to enhance open-source intelligence (OSINT) analysis in government agencies responsible for ensuring national security. With the ever-increasing data flow from various online sources, efficient information processing and analysis is critical for timely detection and prevention of threats. To solve this task, advanced machine learning and artificial intelligence algorithmsare implemented using low-code principles. This allows significant acceleration of the development and implementation of analytical solutions, minimizing the need for traditional programming and involving specialists with less programming experience, but having expertise in data analysis and OSINT. The central part of the system under consideration is the PolyAnalyst visual programming platform. Its architecture, based on low-code principles, provides users with an intuitive interface for building complex analytical pipelines. The system includes specialized sets of functional nodes designed to perform various stages of data processing. The ETL (Extract, Transform, Load) module provides loading, cleaning and transforming data from various sources. The DataMining module enables the application of machine learning algorithms for pattern discovery and prediction. A key element is the TextMining module, using NLP algorithms to analyze textual information, extract keywords, determine sentiment, and identify entities of interest for OSINT analysis. Finally, the BI (Business Intelligence) module provides analysis resultvisualization and builds interactive reports for easy perception and decision making. Altogether, these modules enable the creation of powerful and flexible analytical systems that can process large volumes of OSINT data efficiently and provide valuable information for strategic national security decision-making.

Author Biographies

K. S. Korneev, Military Innovation Technopolis«ERA»

Junior Researcher

M. S. Spirin, Military Innovation Technopolis«ERA»

Head of Department

E. M. Stepanov, Military Innovation Technopolis«ERA»

Senior Operator

D. S. Derunov, Military Innovation Technopolis«ERA»

Senior Operator

References

Магомадов В. С. Платформы LOW-CODE и NO-CODE как способ сделать программирование более доступным для широкой общественности // МНИЖ. 2021. № 6-1 (108). URL: https://cyberleninka.ru/article/n/platformy-low-code-i-no-code-kak-sposob-sdelat-programmirovanie-bolee-dostupnym-dlya-shirokoy-obschestvennosti (дата обращения: 17.01.2025).

Статьев В. Ю., Докучаев В. А., Маклачкова В. В. Информационная безопасность на пространстве "больших данных" // T-Comm. 2022. № 4. URL: https://cyberleninka.ru/article/n/informatsionnaya-bezopasnost-na-prostranstve-bolshih-dannyh (дата обращения: 20.01.2025).

Басина П. А., Дунаева Д. О., Саркисова А. Ю. Валидация моделей машинного обучения для автоматизированного определения тональности русскоязычных текстов // Вестн. Том. гос. ун-та. 2022. №485. URL: https://cyberleninka.ru/article/n/validatsiya-modeley-mashinnogo-obucheniya-dlya-avtomatiziro-vannogo-opredeleniya-tonalnosti-russkoyazychnyh-tekstov (дата обращения: 20.01.2025).

Карпов Д. К. Обработка больших данных с использованием средств языка Python // StudNet. 2021. № 6. URL: https://cyberleninka.ru /article/n/obrabotka-bolshih-dannyh-s-ispolzovaniem-sredstv-yazyka-python (дата обращения: 18.01.2025).

Арланова А. А., Нобатов А. М. Интеллектуальный анализ данных: виды и методы // Вестник науки. 2023. № 1 (58). URL: https://cyber-leninka.ru/article/n/intellektualnyy-analiz-dannyh-vidy-i-metody (дата обращения: 18.01.2025).

Статистическая модель поиска целевых объектов в социальной сети / Д. И. Сафиканов, А. А. Артамонов, Ю. Е. Фомина, А. И. Черкасский // International Journal of Open Information Technologies. 2024. № 10. URL: https://cyberleninka.ru/article /n/statisticheskaya-model-poiska-tselevyh-obektov-v-sotsialnoy-seti (дата обращения: 18.01.2025).

Кучкаров Т. С. О методах и инструментах анализа больших данных // Экономика и социум. 2023. №12 (115)-2. URL: https://cyberleninka.ru/article/n/o-metodah-i-instrumentah-analiza-bolshih-dannyh (дата обращения: 18.01.2025).

Русакович А. С. Интеллектуальный анализ данных как инструмент поддержки принятия решений // Современные инновации. 2022. № 1 (41). URL: https://cyberleninka.ru/article/n/intellektualnyy-analiz-dannyh-kak-instrument-podderzhki-prinyatiya-resheniy (дата обращения: 17.01.2025).

Соломонов А. А. Оптимизация ETL-процессов для больших данных // Вестник науки. 2024. № 9 (78). URL: https://cyberleninka.ru/article/n/optimizatsiya-etl-protsessov-dlya-bolshih-dannyh (дата обращения: 17.01.2025).

Саркисова А. Ю. Ресурс аналитической платформы polyanalyst в социогуманитарных научных исследованиях. Томск: Издательство Томского государственного университета, 2021. 12 с. URL: https://vital.lib.tsu.ru/vital/access/services/Download/koha:000897657/SOURCE1

Смирнов В. И., Новоселова О. В. Обзор современных методов анализа больших данных для различных предметных областей // Вестник науки. 2024. № 6 (75). URL: https://cyberleninka.ru/article/n/obzor-sovremennyh-metodov-analiza-bolshih-dannyh-dlya-razlichnyh-predmetnyh-oblastey (дата обращения: 18.01.2025).

Zhang Zhipeng, Poguda Aleksey Research on the development of data augmentation techniques in the field of machine translation // International Journal of Open Information Technologies. 2023. № 5. URL: https://cyberleninka.ru/article/n/research-on-the-development-of-data-augmentation-techniques-in-the-field-of-machine-translation (дата обращения: 17.01.2025).

Gruetzemacher R. The Power of Natural Language Processing. - Harvard Business Review, 2022. URL: https://hbr.org/2022/04/the-power-of-natural-language-processing (дата обращения: 01.02.2022).

Воложанина Д. Н., Жукова М. Н. Пересмотр процедуры оценки защищенности методами OSINT в условиях нестабильной международной политической обстановки // Актуальные проблемы авиации и космонавтики. 2022. URL: https://cyberleninka.ru/article/n/peresmotr-protsedury-otsenki-zaschischennosti-metodami-osint-v-usloviyah-nestabilnoy-mezhdunaro-dnoy-politicheskoy-obstanovki (дата обращения: 17.01.2025).

LebidAndrii E., StepanovVitalii V., NazarovMykola S. Use of the OSINT-technologies for civil society institutions // International Journal of Media and Information Literacy. 2023. № 1. URL: https://cyber-leninka.ru/article/n/use-of-the-osint-technologies-for-civil-society-institutions (дата обращения: 17.01.2025).

Published

06.07.2025

How to Cite

Korneev К. С., Spirin М. С., Stepanov Е. М., & Derunov Д. С. (2025). Open-source Text Data Intelligence System Based on the Domestic Visual Programming Environment PolyAnalyst. Intellekt. Sist. Proizv., 23(2), 104–111. https://doi.org/10.22213/2410-9304-2025-2-104-111

Issue

Section

Articles