Прогнозирование производственных показателей с использованием MLP и LSTM: анализ подходов проектирования
DOI:
https://doi.org/10.22213/2410-9304-2025-4-79-85Ключевые слова:
многослойный персептрон, рекуррентные сети, информационная система, производство, проектирование, системный анализ, статистикаАннотация
В статье рассматривается задача прогнозирования производственных показателей с применением методов глубокого обучения на основе полносвязных и рекуррентных нейронных сетей. Основное внимание уделено практической реализации моделей регрессии с использованием многослойного персептрона (MLP) и рекуррентной нейронной сети с долгой краткосрочной памятью (LSTM), а также анализу подходов их проектирования с учетом особенностей исходных данных. Работа охватывает полный цикл построения моделей: сбор и предварительную обработку данных, нормализацию признаков, формирование обучающих и тестовых выборок, построение архитектур нейронных сетей, настройку гиперпараметров, процесс обучения, оценку качества прогнозирования и визуализацию результатов. В качестве прикладного примера рассмотрена задача прогнозирования объема производства на основе реальных исторических данных, характеризующих деятельность производственных объектов за многолетний период. Для моделей MLP данные рассматривались как независимые наблюдения, тогда как для LSTM применялось формирование временных последовательностей фиксированной длины, позволяющее учитывать динамику и долгосрочные зависимости показателей. Проведен сравнительный анализ архитектурных решений, вычислительной сложности, требований к ресурсам и точности прогнозирования. Показано, что LSTM демонстрирует более высокую точность при работе с временными рядами за счет учета временного контекста, однако требует значительно больших вычислительных затрат. В то же время MLP характеризуется простотой реализации и более высокой скоростью обучения, что делает ее целесообразной для задач со слабо выраженной временной структурой данных. Результаты исследования могут быть использованы при проектировании интеллектуальных информационно-аналитических систем для производственного сектора и служат практическим ориентиром при выборе архитектуры нейронной сети в зависимости от характера данных и требований к точности и ресурсам.Библиографические ссылки
Zhu M., Zhang G., Zhang L., Han W., Shi Zh., Lv X. Object segmentation by spraying robot based on multi-layer perceptron // Energies. 2023. Vol. 16, no. 1. P. 232.
Xu F. Research on traffic flow prediction method based on LSTM model and PSO-LSTM model // Applied and Computational Engineering. 2024. Vol. 101, no. 1. P. 154-163.
Oliveira D.D., Rampinelli M., Tozatto G.Z., Andreão R.V., Müller S.M.T.Forecasting vehicular traffic flow using MLP and LSTM // Neural Computing & Applications. 2021. Vol. 33, no, 24. Pp. 17245-17256.
Ahmed Sh., Khan Z.A., Mohsin S.M., Latif Sh., Aslam Sh., Mujlid H., Adil M., Najam Z. Effective and efficient DDoS attack detection using deep learning algorithm, multi-layer perceptron // Future Internet. 2023. Vol. 15, no. 2. Pp. 76-85.
Ahmed Sh. A software framework for predicting the maize yield using modified multi-layer perceptron // Sustainability. 2023. Vol. 15, no. 4. P. 3017.
Murugesan R., Mishra E., Krishnan A.H. Forecasting agricultural commodities prices using deep learning-based models: basic LSTM, BI-LSTM, stacked LSTM, CNN LSTM, and convolutional LSTM // International Journal of Sustainable Agricultural Management and Informatics. 2022. Vol. 8, no. 3. P. 242.
Murugesan R., Mishra E., Krishnan A.H.Forecasting agricultural commodities prices using deep learning-based models: basic LSTM, BI-LSTM, stacked LSTM, CNN LSTM, and convolutional LSTM // International Journal of Sustainable Agricultural Management and Informatics. 2022. Vol. 8, no. 3. P. 242.
Bayram F., Aupke Ph., Ahmed B.S., Kassler A., Theocharis A., Forsman J. DA-LSTM: A dynamic drift-adaptive learning framework for interval load forecasting with LSTM networks // Engineering Applications of Artificial Intelligence. 2023. Vol. 123. P. 106480.
Nurhidayat, Defit S., Sumijan. Data mining dalamakurasitingkatkelayakanpakaiterhadapperalatanperangkatKeras // Jurnal Informasi dan Teknologi. 2020. Pp. 83-88.
Jaiswal G. Stock prediction model using TensorFlow // International Journal for Research in Applied Science and Engineering Technology. 2021. Vol. 9, no. 12. Pp. 99-103.
Nunez-Yanez J., Otero A., de la Torre E.Dynamically reconfigurable variable-precision sparse-dense matrix acceleration in TensorFlow lite // Microprocessors and Microsystems. 2023. Vol. 98. P. 104801.
Zhu M., Min W., Li J., Liu M., Deng Z., Zhang Ya. Constructing a smoothed leaky relu using a linear combination of the smoothed ReLu and identity function // Neural Computing & Applications. 2025. Vol. 37, no. 9. Pp. 6465-6478.
Diederik P. Kingma, Jimmy Lei Ba. Adam: a method for stochastic optimization // Published as a conference paper at ICLR 2015. Pp. 1-15.
Koc I., Arslan E. Dynamic ticket pricing of airlines using variant batch size interpretable multi-variable long short-term memory // Expert Systems with Applications. 2021. Vol. 175. P. 114794.
Shalabh.Interactive web-based data visualization with R, Plotly, and Shiny // Journal of the Royal Statistical Society: Series A (Statistics in Society). 2021. Vol. 184, no. 3. P. 1150
Загрузки
Опубликован
Как цитировать
Выпуск
Раздел
Лицензия
Copyright (c) 2025 Д С Пономарёв

Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.