To the Question of Developing an Information System for Processing Textual Information on the Basis of Semantic Groups
DOI:
https://doi.org/10.22213/2413-1172-2018-3-166-171Keywords:
information system, processing of textual information, semantic groups, reduction of the text, semantic component, allocation of informationAbstract
The paper considers the information approach to the analysis of the text, based on splitting the sentence into its component parts and highlighting the topic and the rheme. The relevance of the work is justified by the need to search and identify useful information for the user, which he could use when performing the necessary scientific research. The concept of structural-semantic groups of sentences is introduced and requirements for them are defined. The sense group of a sentence is determined on the basis of an analysis of the relationships between the words of the sentence; and it includes some set of adjacent words that define some new image. The script of the analysis of the text information on the basis of the offered approach is described. A description of the approaches is provided for splitting the text of a document into semantic groups. The detailed results of the work of the program complex for various target installations for processing text are given. The presented results show the capabilities of the developed software package: the structuring of individual text sentences; formation of key words in the form of semantic groups for further analysis; selection of semantic groups that determine the main meaning of sentences and text; significant reduction of the text while preserving the semantic component. In the future it is supposed to expand the functionality of the complex and check the main ideas when processing large information arrays.References
Алексеев А. А. Тематический анализ новостного кластера как основа для автоматического аннотирования // Программная инженерия. 2014. № 3. C. 41-48.
Артюхин В. В., Чяснавичюс Ю. К. Планирование аналитического исследования при помощи методов анализа качественных данных // Прикладная информатика. 2014. № 2. С. 23-48.
Герте Н. А., Курушин Д. С., Нестерова Н. М. Моделирование понимания текста как основа автоматизированного реферирования // Материалы VII Междунар. науч. конф. «Индустрия перевода» (Россия, Пермь, 1-3 июня 2015 г.). С. 81-84.
Бледнов А. М., Моченов С. В., Луговских Ю. А. Об одном методе статистической фильтрации текстовой информации // Современные информационные технологии и письменное наследие: от древних рукописей к электронным текстам : материалы междунар. науч. конф. (Россия, Ижевск, 13-17 июля 2006 г.). С. 126-130.
Бледнов А. М., Моченов С. В., Луговских Ю. А. Векторная модель представления текстовой информации // Современные информационные технологии и письменное наследие от древних рукописей к электронным текстам : материалы междунар. науч. конф. (Ижевск, 13-17 июля 2006 г). С. 136-145.
Rankel P., Conroy J., Dang H., Nenkova A. A Decade of Automatic Content Evaluation of News Summaries: Reassessing the State of the Art // Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics. 2013. Pp. 131-136.
Захарова И. С., Филиппова Л. Я. Основы информационно-аналитической деятельности : учебное пособие. Киев : Центр учебной литературы, 2013. 336 с.
Курушин Д. С., Нестерова Н. М., Овчинникова И. Г. О возможном подходе к созданию системы автоматического реферирования // Вопросы психолингвистики. 2014. № 2(20).С. 123-128.
[Abstracts - The Writing Center]. URL: http://writingcenter.unc.edu/handouts/abstracts/ (дата обращения: 02.04.2018).
Осипов Г. С., Шелманов А. О. Метод повышения качества синтаксического анализа на основе взаимодействия синтаксических и семантических правил // Труды Шестой Междунар. конф. «Системный анализ и информационные технологии». 2015. Т. 1. С. 229-240.