Автоматизированная система нормализации естественно-языковых текстов

Авторы

  • М. Н. Мокроусов ИжГТУ имени М. Т. Калашникова

Ключевые слова:

автоматическая обработка текста, морфологический анализ, стемминг, нормализация текста, регулярные выражения

Аннотация

В статье представлена автоматизированная система нормализации текста, разделяющая текст на слова, предложения и абзацы и выделяющая в тексте имена собственные, аббревиатуры и буквенно-цифровые последовательности символов. Приводится структура системы, описание ключевых моментов ее работы и результаты экспериментов.

Биография автора

М. Н. Мокроусов, ИжГТУ имени М. Т. Калашникова

кандидат технических наук

Библиографические ссылки

Мокроусов М. Н. Интеллектуальный поиск в задаче извлечения знаний из естественно-языковых текстов // Всероссийская конференция с элементами научной школы для молодежи «Проведение научных исследований в области обработки, хранения, передачи и защиты информации». - В 4 т. Т. 2. - Ульяновск : УлГТУ, 2009. - С. 347-355.

Сокирко А. В. Семантические словари в автоматической обработке текста (по материалам системы ДИАЛИНГ) : дис.. канд. техн. наук. - М., 2001. - 100 с.

Гойвертс Я., Левитан С. Регулярные выражения. Сборник рецептов. - СПб. : Символ-Плюс, 2010.

Загрузки

Опубликован

20.01.2016

Как цитировать

Мокроусов, М. Н. (2016). Автоматизированная система нормализации естественно-языковых текстов. Интеллектуальные системы в производстве, 13(3), 93–96. извлечено от https://izdat.istu.ru/index.php/ISM/article/view/3109

Выпуск

Раздел

Компьютерная лингвистика (архив)