К вопросу о построении информационной системы обработки текстовой информации на основе смысловых групп

Авторы

  • С. В. Моченов ИжГТУ имени М. Т. Калашникова
  • М. В. Втюрин ИжГТУ имени М. Т. Калашникова
  • Р. Р. Ахметгалеев ИжГТУ имени М. Т. Калашникова

DOI:

https://doi.org/10.22213/2413-1172-2018-3-166-171

Ключевые слова:

информационная система, обработка текстовой информации, смысловые группы, сокращение текста, смысловая составляющая, выделение информации

Аннотация

Рассматривается информационный подход к анализу текста, основанный на разбиении предложения на составные части и выделении темы и ремы. Актуальность работы обосновывается необходимостью поиска и выделения полезной для пользователя информации, которую он мог бы использовать при выполнении необходимых научных исследований. Введено понятие структурно-семантических смысловых групп предложений и определены требования к ним. Смысловая группа предложения определяется на основе анализа связей между словами предложения и включает в себя некоторый набор рядом расположенных слов, задающих некоторый новый образ. Описан сценарий анализа текстовой информации на основе предлагаемого подхода. Приведено описание подходов при разбиении текста документа на смысловые группы. Приведены развернутые результаты работы программного комплекса при различной целевой установке на обработку текста. Представленные результаты показывают возможности разработанного программного комплекса: выполнение структуризации отдельных предложений текста; формирование ключевых слов в виде смысловых групп для дальнейшего анализа; отбор смысловых групп, определяющих основной смысл предложений и текста; значительное сокращение текста при сохранении смысловой составляющей. В дальнейшем предполагается расширение функциональных возможностей комплекса и проверка основных идей при обработке больших информационных массивов.

Биографии авторов

С. В. Моченов, ИжГТУ имени М. Т. Калашникова

кандидат технических наук, профессор кафедры «Вычислительная техника»

М. В. Втюрин, ИжГТУ имени М. Т. Калашникова

аспирант

Р. Р. Ахметгалеев, ИжГТУ имени М. Т. Калашникова

аспирант

Библиографические ссылки

Алексеев А. А. Тематический анализ новостного кластера как основа для автоматического аннотирования // Программная инженерия. 2014. № 3. C. 41-48.

Артюхин В. В., Чяснавичюс Ю. К. Планирование аналитического исследования при помощи методов анализа качественных данных // Прикладная информатика. 2014. № 2. С. 23-48.

Герте Н. А., Курушин Д. С., Нестерова Н. М. Моделирование понимания текста как основа автоматизированного реферирования // Материалы VII Междунар. науч. конф. «Индустрия перевода» (Россия, Пермь, 1-3 июня 2015 г.). С. 81-84.

Бледнов А. М., Моченов С. В., Луговских Ю. А. Об одном методе статистической фильтрации текстовой информации // Современные информационные технологии и письменное наследие: от древних рукописей к электронным текстам : материалы междунар. науч. конф. (Россия, Ижевск, 13-17 июля 2006 г.). С. 126-130.

Бледнов А. М., Моченов С. В., Луговских Ю. А. Векторная модель представления текстовой информации // Современные информационные технологии и письменное наследие от древних рукописей к электронным текстам : материалы междунар. науч. конф. (Ижевск, 13-17 июля 2006 г). С. 136-145.

Rankel P., Conroy J., Dang H., Nenkova A. A Decade of Automatic Content Evaluation of News Summaries: Reassessing the State of the Art // Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics. 2013. Pp. 131-136.

Захарова И. С., Филиппова Л. Я. Основы информационно-аналитической деятельности : учебное пособие. Киев : Центр учебной литературы, 2013. 336 с.

Курушин Д. С., Нестерова Н. М., Овчинникова И. Г. О возможном подходе к созданию системы автоматического реферирования // Вопросы психолингвистики. 2014. № 2(20).С. 123-128.

[Abstracts - The Writing Center]. URL: http://writingcenter.unc.edu/handouts/abstracts/ (дата обращения: 02.04.2018).

Осипов Г. С., Шелманов А. О. Метод повышения качества синтаксического анализа на основе взаимодействия синтаксических и семантических правил // Труды Шестой Междунар. конф. «Системный анализ и информационные технологии». 2015. Т. 1. С. 229-240.

Загрузки

Опубликован

16.10.2018

Как цитировать

Моченов, С. В., Втюрин, М. В., & Ахметгалеев, Р. Р. (2018). К вопросу о построении информационной системы обработки текстовой информации на основе смысловых групп. Вестник ИжГТУ имени М.Т. Калашникова, 21(3), 166–171. https://doi.org/10.22213/2413-1172-2018-3-166-171

Выпуск

Раздел

Статьи