Об одном подходе к построению информационной системы обработки текстовой информации на основе смысловых групп

Авторы

  • С. В. Моченов
  • Р. Р. Ахметгалеев

DOI:

https://doi.org/10.22213/2410-9304-2019-2-58-64

Ключевые слова:

информационная система, обработка текстовой информации, смысловые группы, сокращение текста, смысловая составляющая, выделение полезной информации

Аннотация

В статье рассматривается подход к анализу текста, основанный на построении и использовании  баз данных частей речи и других членов предложения. Соответствующие базы данных для русскоязычных текстов  формируются на основе экспертных оценок, получаемых в процессе  анализа текстовых массивов с предложениями различной сложности. Актуальность работы связана с проблемой автоматизации поиска и выделения полезной для пользователя информации, необходимой для решения конкретных задач. В процессе анализа формируются различные массивы индексов. Осуществляется: выделение различных сочетаний слов предложения, сравнение их с допустимыми комбинациями из базы данных (формирование смысловых групп), структуризация предложений и формирование иерархической системы смысловых групп. На примерах показаны развернутые результаты работы программного комплекса. При анализе основных частей предложения (темы и ремы) используется одинаковый набор функциональных модулей. Представленные результаты показали принципиальную возможность создания подобной информационной системы анализа текстовой информации на основе изложенного подхода. Разработанный программный комплекс при выделении СГ анализирует комбинации слов, а не отдельные предлоги, союзы и другие вспомогательные элементы предложений. За счет разделения на СГ с использованием экспертных баз данных обеспечивается более полное сохранение смысловой составляющей текста. В дальнейшем предполагается расширение сферы применения  программного комплекса  для  выделения полезной для пользователя информации, сокращения ее объема, уменьшения времени, затрачиваемого на поиск.

Библиографические ссылки

Алексеев А. А. Тематический анализ новостного кластера как основа для автоматического аннотирования // Программная инженерия. 2014. № 3. C. 41–48.

Артюхин В. В., Чяснавичюс Ю. К. Планирование аналитического исследования при помощи методов анализа качественных данных // Прикладная информатика. 2014. № 2. С 23–48.

Герте Н. А., Курушин Д. С., Нестерова Н. М. Моделирование понимания текста как основа автоматизированного реферирования // Материалы VII Международной научной конференции «Индустрия перевода» (Россия, Пермь, 1–3 июня 2015 г.). С. 81–84.

Бледнов А. М., Моченов С. В., Луговских Ю. А. Об одном методе статистической фильтрации текстовой информации // Современные информационные технологии и письменное наследие: от древних рукописей к электронным текстам : материалы Междунар. науч. конф. (Россия, Ижевск, 13–17 июля 2006 г.). С. 126–130.

Бледнов А. М., Моченов С. В., Луговских Ю. А. Векторная модель представления текстовой информации // Современные информационные технологии и письменное наследие от древних рукописей к электронным текстам : материалы Междунар. науч. конф. (Ижевск, 13–17 июля 2006 г). С. 136–145.

Rankel P., Conroy J., Dang H., Nenkova A.A Decade of Automatic Content Evaluation of News Summaries: Reassessing the State of the Art // Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics. 2013. Pp. 131-136.

Захарова И. С., Филиппова Л. Я. Основы информационно-аналитической деятельности: учебное пособие. Киев : Центр учебной литературы, 2013. 336 с.

Курушин Д. С., Нестерова Н. М., Овчинникова И. Г. О возможном подходе к созданию системы автоматического реферирования // Вопросы психолингвистики. М., 2014. № 2 (20). С. 123–128.

[Abstracts - The Writing Center] [Электронный ресурс]. URL: http://writingcenter.unc.edu/handouts/ abstracts/ (дата обращения: 02.04.2018)

Осипов Г. С., Шелманов А. О. Метод повышения качества синтаксического анализа на основе взаимодействия синтаксических и семантических правил // Труды шестой Международной конферен-ции «Системный анализ и информационные технологии». Т. 1. 2015. С. 229–240.

Моченов С. В., Втюрин М. В., Ахметгалеев Р. Р. К вопросу о построении информационной системы обработки текстовой информации на основе смысловых групп // Вестник ИжГТУ имени М. Т. Калашникова. 2018. Т. 21. № 3. С. 166–170.

Там же.

Загрузки

Опубликован

05.07.2019

Как цитировать

Моченов, С. В., & Ахметгалеев, Р. Р. (2019). Об одном подходе к построению информационной системы обработки текстовой информации на основе смысловых групп. Интеллектуальные системы в производстве, 17(2), 58–64. https://doi.org/10.22213/2410-9304-2019-2-58-64

Выпуск

Раздел

Статьи