Разработка информационной системы для уменьшения объема текстовой информации в процессе информационного поиска
DOI:
https://doi.org/10.22213/2410-9304-2017-3-94-99Ключевые слова:
обработка текста, информационная система, поисковые слова, сжатие текста, информационный поискАннотация
В статье рассматривается возможность применения пользователями специализированных алгоритмов для информационной системы, обеспечивающей сжатие анализируемой текстовой информации в процессе информационного поиска. Актуальность работы обосновывается сложностью информационного поиска, связанного с решением пользователем конкретной задачи и необходимостью переработки больших объемов текстовых данных. Целью является сокращение объема анализируемой текстовой информации русскоязычных текстов при сохранении их смысловой составляющей. Определены основные функциональные узлы разрабатываемой информационной системы. Модуль поиска совпадений формирует текст, состоящий из нескольких абзацев, содержащих заданные пользователем поисковые словосочетания. Данный текст по объему намного меньше исходного текста и отражает искомую пользователем информацию. Модуль сжатия представляет собой итерационную процедуру, позволяющую дополнительно уменьшить объем текста, выделенный пользователем для анализа. В предлагаемом подходе каждому слову предложения присваивается оценка, определяемая на основе ряда критериев. Разработан графический интерфейс пользователя, имеющий компактные размеры и удобную компоновку элементов. В результате применения описываемого подхода достигается существенное уменьшение объема текстовой информации, обрабатываемой пользователем в процессе информационного поиска. Для большего сокращения объема информации в дальнейшем предполагается проведение разработки модуля сжатия текста и его практическая реализация.Библиографические ссылки
MCR.DLL // Морфоанализ русского языка. - URL: http://macrocosm.narod.ru/madown.html (дата обращения: 12.04.2017).
Бледнов А. М. Разработка и исследование моделей и информационной технологии семантико-синтаксического анализа русскоязычного текста : дис. … канд. техн. наук. - Ижевск, 2007. - 120 с.
Моченов, С. В. Применение статистических методов для семантического анализа текста / С. В. Моченов, А. М. Бледнов, Ю. А. Луговских. - Ижевск : НИЦ «Регулярная и хаотическая динамика», 2005.
Загрузки
Опубликован
02.10.2017
Как цитировать
Втюрин, М. В., Ястребов, А. И., & Моченов, С. В. (2017). Разработка информационной системы для уменьшения объема текстовой информации в процессе информационного поиска. Интеллектуальные системы в производстве, 15(3), 94–99. https://doi.org/10.22213/2410-9304-2017-3-94-99
Выпуск
Раздел
Информатика, вычислительная техника и управление