ИСПОЛЬЗОВАНИЕ СТАНДАРТА P.862 ДЛЯ СРАВНЕНИЯ КАЧЕСТВА НИЗКОСКОРОСТНЫХ ВОКОДЕРОВ
DOI:
https://doi.org/10.22213/2410-9304-2018-4-109-113Ключевые слова:
сжатие речи, низкоскоростные вокодеры, оценка качества, стандарт P.862Аннотация
Рассматриваются объективные методы оценки качества речевого сигнала: 1) Perceptual Evaluation of Speech (PESQ, рекомендация МСЭ-T P.862) - оценка восприятия качества речи, 2) Listening Quality Objective (LQO, рекомендация, МСЭ-T P.800.1) - качество прослушивания. Приведено краткое описание и схемы работы методики PESQ и формулы для преобразования оценок Raw MOS в MOS-LQO и обратно. Для тестирования были выбраны низкоскоростные вокодеры: 1) MEPLe, 2) Speex, 3) Codec2. Тестирование вокодеров проводилось на битовых скоростях от 700 до 4800 бит/с. Для тестирования использовались аудиофайлы артикуляционных таблиц количеством 20 записей (wav, 8000 КГц, 16 бит, моно). В результате тестирования были построены таблицы и графики для Raw MOS и MOS-LQO оценок выбранных вокодеров. При анализе результатов экспериментов сделан вывод об эффективности применения объективных методов оценки качества речи, и в качестве перспективного для дальнейших разработок вокодера был выделен MELPe, обеспечивающий на битовых скоростях 1200 и 2400 бит/с оценку качества MOS соответственно 2,9...3,2 и 3,0...3,3. Вокодер Speex показал сравнимые с MELPe результаты оценки при большей битовой скорости (4800 бит/с), а вокодер Codec2 показал результаты оценки ниже, чем MELPe.Библиографические ссылки
Тестирование цифровых микросхем и программирование стендового оборудования «Formula 2k» для измерения параметров / А. Н. Копысов, Р. А. Хатбуллин, В. В. Хворенков, Ф. М. Ермаков, К. А. Зырянов // Интеллектуальные системы в производстве. 2017. Т. 15, № 4. C. 29-34. DOI 10.22213/ 2410-9304-2017-4-29-34.
ГОСТ 50840-95. Передача речи по трактам связи. Методы оценки качества, разборчивости и узнаваемости.
ITU-T Rec. P.862: Perceptual evaluation of speech quality (PESQ): An objective method for end-to-end speech quality assessment of narrow-band telephone networks and speech codecs. Available at: http://www.itu.int/ rec/T-REC-P.862 (accessed 01.11.2018).
Там же.
ITU-T Rec. P.800: Methods for subjective determination of transmission quality. Available at: http://www.itu.int/rec/T-REC-P.800 (accessed 01.11.2018).
Audio File Format Specifications. WAVE or RIFF WAVE sound file. Available at: http://www-mmsp.ece.mcgill.ca/Documents/AudioFormats/WAVE/ WAVE.html (accessed 01.11.2018).
MELPe - Enhanced Mixed-Excitation Linear Predictive Vocoder. Available at: http://melpe.org/ (accessed 01.11.2018).
Standard: NATO - STANAG 4591. The 600 bit/s, 1200 bit/s and 2400 bit/s NATO interoperable narrow band voice coder. Available at: https://standards.globalspec.com/std/1664099/natostanag-4591 (accessed 01.11.2018).
Speex: A Free Codec For Free Speech. Available at: https://www.speex.org/ (accessed 01.11.2018).
Standard: ISO/IEC 14496-3. Information technology - Coding of audio-visual objects. Part 3: Audio amendment 4: New levels for AAC profiles technical corrigendum 1. Available at: https://standards.globalspec.com/ std/9907734/iso-iec-14496-3) (accessed 01.11.2018).
Codec2. Available at: http://www.rowetel.com/ ?page_id=452 (accessed 01.11.2018).