Open Access Open Access  Restricted Access Subscription Access

On One Approach to Building An Information System for Processing Text Information Based on Semantic Groups

Mochenov S.V., Akhmetgaleev R.R.

Abstract


The paper considers an approach to text analysis based on the construction and use of databases of parts of speech and other members of a sentence. Corresponding databases for Russian texts are formed on the basis of expert assessments obtained in the process of analyzing text arrays with suggestions of varying complexity. The relevance of the work is related to the problem of automating the search and highlighting useful information for the user that is needed to solve specific problems. In the process of analysis, various index arrays are formed. Selection of various combinations of words of the sentence, comparing them with valid combinations of the database (the formation of semantic groups), structuring sentences, and formation of a hierarchical system of semantic groups are carried out. The examples show the detailed results of the software package. When analyzing the main parts of the sentence (themes and rhemes), the same set of functional modules is used. The presented results showed the fundamental possibility of creating such an information system for analyzing textual information based on the outlined approach. The developed software package when selecting the SG analyzes word combinations, rather than individual prepositions, conjunctions and other auxiliary elements of sentences. Due to the division on the SG using expert databases, a more complete preservation of the semantic component of the text is provided. In the future, it is intended to expand the scope of application of the software system to highlight useful information for the user, reduce its volume, reduce the time spent on search.

Keywords


information system, text processing, semantic groups, text abbreviation, semantic component, selection of useful information

Full Text

Galleys

PDF (Русский)
References References

Алексеев А. А. Тематический анализ новостного кластера как основа для автоматического аннотирования // Программная инженерия. 2014. № 3. C. 41–48.

Артюхин В. В., Чяснавичюс Ю. К. Планирование аналитического исследования при помощи методов анализа качественных данных // Прикладная информатика. 2014. № 2. С 23–48.

Герте Н. А., Курушин Д. С., Нестерова Н. М. Моделирование понимания текста как основа автоматизированного реферирования // Материалы VII Международной научной конференции «Индустрия перевода» (Россия, Пермь, 1–3 июня 2015 г.). С. 81–84.

Бледнов А. М., Моченов С. В., Луговских Ю. А. Об одном методе статистической фильтрации текстовой информации // Современные информационные технологии и письменное наследие: от древних рукописей к электронным текстам : материалы Междунар. науч. конф. (Россия, Ижевск, 13–17 июля 2006 г.). С. 126–130.

Бледнов А. М., Моченов С. В., Луговских Ю. А. Векторная модель представления текстовой информации // Современные информационные технологии и письменное наследие от древних рукописей к электронным текстам : материалы Междунар. науч. конф. (Ижевск, 13–17 июля 2006 г). С. 136–145.

Rankel P., Conroy J., Dang H., Nenkova A.A Decade of Automatic Content Evaluation of News Summaries: Reassessing the State of the Art // Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics. 2013. Pp. 131-136.

Захарова И. С., Филиппова Л. Я. Основы информационно-аналитической деятельности: учебное пособие. Киев : Центр учебной литературы, 2013. 336 с.

Курушин Д. С., Нестерова Н. М., Овчинникова И. Г. О возможном подходе к созданию системы автоматического реферирования // Вопросы психолингвистики. М., 2014. № 2 (20). С. 123–128.

[Abstracts - The Writing Center] [Электронный ресурс]. URL: http://writingcenter.unc.edu/handouts/ abstracts/ (дата обращения: 02.04.2018)

Осипов Г. С., Шелманов А. О. Метод повышения качества синтаксического анализа на основе взаимодействия синтаксических и семантических правил // Труды шестой Международной конферен-ции «Системный анализ и информационные технологии». Т. 1. 2015. С. 229–240.

Моченов С. В., Втюрин М. В., Ахметгалеев Р. Р. К вопросу о построении информационной системы обработки текстовой информации на основе смысловых групп // Вестник ИжГТУ имени М. Т. Калашникова. 2018. Т. 21. № 3. С. 166–170.

Там же.




DOI: http://dx.doi.org/10.22213/2410-9304-2019-2-58-64

Article Metrics

Metrics Loading ...

Metrics powered by PLOS ALM

Refbacks

  • There are currently no refbacks.


Copyright (c) 2019 Моченов С.В., Ахметгалеев Р.Р.

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

ISSN 1813-7911