Применение нейронной сети YOLOv5 для распознавания наличия средств индивидуальной защиты
DOI:
https://doi.org/10.22213/2410-9304-2022-2-61-67Ключевые слова:
компьютерное зрение, искусственный интеллект, распознавание образов, нейронная сеть, разметка изображений, YOLOАннотация
В статье рассматривается вопросы применения нейронной сети YOLO для автоматического обнаружения и идентификации средств индивидуальной защиты у персонала предприятий на цифровых изображениях. Приведен сравнительный анализ различных архитектур сети YOLOv5 в зависимости от скорости обучения нейронной сети и точности распознавания. Рассмотрены инструменты для обучения нейронной сети на языке Python в среде Google Сolab, которая позволяет эффективно использовать удаленные вычислительные мощности графических процессоров. Рассмотрен пример обучения сети на основе собранного датасета с шестью классами для распознавания наличия средств индивидуальной защиты (с маской; без маски; маска надета неправильно; с головным убором; без головного убора; спец. одежда). Описаны настройки нейронной сети YOLOv5 и рекомендации по улучшению распознавания объектов посредством дополнения датасета изображениями с определенными условиями. Произведены 4 варианта обучения сети с применением архитектуры YOLOv5s и YOLOv5l, а также с различным количеством эпох. Подобрана оптимальная архитектура нейронной сети и количество необходимых эпох. Рассмотрено понятие средней точности (Mean Average Precision - mAP) и приведен сравнительный анализ точности предсказания от выбранной архитектуры сети и настроек. Приведен практический пример распознавания наличия средств индивидуальной защиты на цифровых изображениях с помощью обученной нейронной сети YOLOv5. В среднем точность распознавания составляет 0,7, что является неплохим результатом для решения данного класса задач. В работе рассматриваются вопросы по повышению точности распознавания объектов. Приводятся планы по обнаружению и детекции новых классов средств индивидуальной защиты, а также подтверждение факта прохождения регламентных процедур персоналом предприятий на основе цифрового видеоряда.Библиографические ссылки
Шмаглит Л. А., Голубев М. Н. Использование информации о цвете в алгоритме выделения лиц на изображениях // Материалы XX Международной конференции по компьютерной графике и зрению «ГрафиКон’2010». 2010. C. 331-332.
Визильтер Ю. В. Обработка и анализ изображений в задачах машинного зрения. М. : ФИЗМАТКН, 2010. 245 c.
Lin T.-Y., Maire M., Belongie S., Hays J., Perona P., Ramanan D., Dollar P. and Zitnick C. L. Microsoft coco: Common objects in context // In European Conference on Computer Vision. 2014. Pp. 740-755.
Филичкин С. А. Применение нейронных сетей для распознавания поведенческих функций человека // Экология и безопасность жизнедеятельности : сборник статей XXI Международной научно-практической конференции. Пенза: Пензенский государственный аграрный университет, 2021. С. 206-210.
Elian F., Hariadi F. I. and Arsyad M. I. Implementation of computer vision algorithms for position correction of chip-mounter machine // 2017 International Symposium on Electronics and Smart Devices (ISESD). 2017. Pp. 90-94. DOI 10.1109/ISESD.2017.8253311.
Redmon J., Divvala S., Girshick R. and Farhadi A. You Only Look Once: Unified, Real-Time Object Detection // 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 2016, pp. 779-788. DOI: 10.1109/CVPR.2016.91.
Официальный репозиторий YOLOv5. URL: https://github.com/ultralytics/yolov5 (дата обращения: 26.02.2022).
Ворожцова Н. А., Вологдин С. В. Подготовка набора данных для распознавания показаний с фотографий лицевых панелей приборов учета электроэнергии // Вестник Российского нового университета. Серия: Сложные системы: модели, анализ и управление. 2020. № 4. С. 121-126. DOI 10.25586/RNU.V9187.20.04. P.121.
Vorozhtsova N., Shushkov I., Vologdin S. System approach to development of Intellectual Information Mobile System for Electric Power Metering // E3S Web of Conferences, Irkutsk, 27-29 мая 2019 года. Irkutsk: EDP Sciences. 2019. 114. P. 01004. DOI 10.1051/e3sconf/201911401004.
YaŞar F. G., KusetoĞullari H. Underwater human body detection using computer vision algorithms // 2018 26th Signal Processing and Communications Applications Conference (SIU). 2018. DOI: 10.1109/SIU.2018.8404305.
Sanket J. Mankar, Manoj Demde, Prashant Sharma. Design of computer vision intelligent system for lane detection // 2016 Online International Conference on Green Engineering and Technologies (IC-GET). 2016. Pp. 1-3. DOI: 10.1109/GET.2016.7916843.
Боков П. А., Кравченя П. Д. Экспериментальный анализ точности и производительности разновидностей архитектур YOLO для задач компьютерного зрения. М. : Техносфера, 2018. 47 c.
Senthilkumaran N., Rajesh R. Edge Detection Techniques for Image Segmentation // International Journal of Recent Trends in Engineering. 2009. Vol. 1, No. 2. Pp. 250-254.
Sowmya B., Sheelarani B. Color Image Segmentation Using Soft Computing Techniques // International Journal of Soft Computing Applications. 2009. Issue 4. pp. 69-80.
Umesh Sehgal Edge detection techniques in digital image processing using Fuzzy Logic // International Journal of Research in IT and Management. 2011. Vol.1, Issue 3. Pp. 61-66.
Yu, X, Bui, T.D. Robust Estimation for Range Image Segmentation and Reconstruction // IEEE Transactions on Pattern Analysis and Machine Intelligence. 1994. Vol. 16, Issue 5. pp. 530-538.
Загрузки
Опубликован
Как цитировать
Выпуск
Раздел
Лицензия
Copyright (c) 2022 Cергей Андреевич Филичкин, Сергей Валентинович Вологдин
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.