Автоматизированная система нормализации естественно-языковых текстов
Ключевые слова:
автоматическая обработка текста, морфологический анализ, стемминг, нормализация текста, регулярные выраженияАннотация
В статье представлена автоматизированная система нормализации текста, разделяющая текст на слова, предложения и абзацы и выделяющая в тексте имена собственные, аббревиатуры и буквенно-цифровые последовательности символов. Приводится структура системы, описание ключевых моментов ее работы и результаты экспериментов.Библиографические ссылки
Мокроусов М. Н. Интеллектуальный поиск в задаче извлечения знаний из естественно-языковых текстов // Всероссийская конференция с элементами научной школы для молодежи «Проведение научных исследований в области обработки, хранения, передачи и защиты информации». - В 4 т. Т. 2. - Ульяновск : УлГТУ, 2009. - С. 347-355.
Сокирко А. В. Семантические словари в автоматической обработке текста (по материалам системы ДИАЛИНГ) : дис.. канд. техн. наук. - М., 2001. - 100 с.
Гойвертс Я., Левитан С. Регулярные выражения. Сборник рецептов. - СПб. : Символ-Плюс, 2010.
Загрузки
Опубликован
20.01.2016
Как цитировать
Мокроусов, М. Н. (2016). Автоматизированная система нормализации естественно-языковых текстов. Интеллектуальные системы в производстве, 13(3), 93–96. извлечено от https://izdat.istu.ru/index.php/ISM/article/view/3109
Выпуск
Раздел
Компьютерная лингвистика (архив)