Разработка информационной системы для уменьшения объема текстовой информации в процессе информационного поиска

Авторы

  • М. В. Втюрин ИжГТУ имени М. Т. Калашникова
  • А. И. Ястребов ИжГТУ имени М. Т. Калашникова
  • С. В. Моченов ИжГТУ имени М. Т. Калашникова

DOI:

https://doi.org/10.22213/2410-9304-2017-3-94-99

Ключевые слова:

обработка текста, информационная система, поисковые слова, сжатие текста, информационный поиск

Аннотация

В статье рассматривается возможность применения пользователями специализированных алгоритмов для информационной системы, обеспечивающей сжатие анализируемой текстовой информации в процессе информационного поиска. Актуальность работы обосновывается сложностью информационного поиска, связанного с решением пользователем конкретной задачи и необходимостью переработки больших объемов текстовых данных. Целью является сокращение объема анализируемой текстовой информации русскоязычных текстов при сохранении их смысловой составляющей. Определены основные функциональные узлы разрабатываемой информационной системы. Модуль поиска совпадений формирует текст, состоящий из нескольких абзацев, содержащих заданные пользователем поисковые словосочетания. Данный текст по объему намного меньше исходного текста и отражает искомую пользователем информацию. Модуль сжатия представляет собой итерационную процедуру, позволяющую дополнительно уменьшить объем текста, выделенный пользователем для анализа. В предлагаемом подходе каждому слову предложения присваивается оценка, определяемая на основе ряда критериев. Разработан графический интерфейс пользователя, имеющий компактные размеры и удобную компоновку элементов. В результате применения описываемого подхода достигается существенное уменьшение объема текстовой информации, обрабатываемой пользователем в процессе информационного поиска. Для большего сокращения объема информации в дальнейшем предполагается проведение разработки модуля сжатия текста и его практическая реализация.

Биографии авторов

М. В. Втюрин, ИжГТУ имени М. Т. Калашникова

магистрант

А. И. Ястребов, ИжГТУ имени М. Т. Калашникова

магистрант

С. В. Моченов, ИжГТУ имени М. Т. Калашникова

кандидат технических наук, профессор

Библиографические ссылки

MCR.DLL // Морфоанализ русского языка. - URL: http://macrocosm.narod.ru/madown.html (дата обращения: 12.04.2017).

Бледнов А. М. Разработка и исследование моделей и информационной технологии семантико-синтаксического анализа русскоязычного текста : дис. … канд. техн. наук. - Ижевск, 2007. - 120 с.

Моченов, С. В. Применение статистических методов для семантического анализа текста / С. В. Моченов, А. М. Бледнов, Ю. А. Луговских. - Ижевск : НИЦ «Регулярная и хаотическая динамика», 2005.

Загрузки

Опубликован

02.10.2017

Как цитировать

Втюрин, М. В., Ястребов, А. И., & Моченов, С. В. (2017). Разработка информационной системы для уменьшения объема текстовой информации в процессе информационного поиска. Интеллектуальные системы в производстве, 15(3), 94–99. https://doi.org/10.22213/2410-9304-2017-3-94-99

Выпуск

Раздел

Информатика, вычислительная техника и управление