Алгоритм интерпретации линейных и неэлементарных линейных регрессионных моделей в условиях мультиколлинеарности

Авторы

  • М. П. Базилевский Иркутский государственный университет путей сообщения

DOI:

https://doi.org/10.22213/2410-9304-2023-3-40-47

Ключевые слова:

метод наименьших квадратов, мультиколлинеарность, неэлементарная линейная регрессия, линейная регрессия, интерпретируемость, машинное обучение

Аннотация

При построении моделей машинного обучения все больше исследователей приходят к пониманию того, что помимо точности модели важна и ее интерпретируемость, означающая степень понятности человеку. В настоящее время в науке формируется новая область - интерпретируемое машинное обучение. Статья посвящена исследованию вопросов интерпретации линейных регрессионных моделей. Традиционно линейные регрессии принято интерпретировать в условиях слабой корреляции объясняющих переменных. В таком случае по известному шаблону можно объяснить влияние каждой входной переменной на выходную переменную. Часто же объясняющие переменные сильно коррелируют между собой. В такой ситуации рекомендуют исключать сильно коррелирующие переменные, что приводит, во-первых, к снижению качества модели, во-вторых, к потере целостности исследования и интерпретации изучаемого процесса или явления. В данной работе предложен алгоритм интерпретации линейной регрессии, построенной при любой степени корреляции объясняющих переменных. При слабой корреляции всех объясняющих переменных алгоритм дает традиционную интерпретацию линейной регрессии, а при сильной корреляции, как следует из доказанной в статье теоремы, интерпретация регрессии с несколькими переменными сводится к интерпретации уравнения с одной переменной, но при этом не теряется информация о связях между парами объясняющих переменных. Алгоритм может применяться не только для обычных линейных регрессий, но и для неэлементарных, содержащих помимо объясняющих переменных их пары, преобразованные с помощью бинарных операций min и max. Работа алгоритма продемонстрирована на конкретных примерах.

Биография автора

М. П. Базилевский, Иркутский государственный университет путей сообщения

кандидат технических наук, доцент, доцент кафедры «Математика»,

Библиографические ссылки

Базилевский М. П. Метод построения неэлементарных линейных регрессий на основе аппарата математического программирования // Проблемы управления. 2022. № 4. С. 3-14.

Базилевский М. П. Метод построения неэлементарных линейных регрессий на основе аппарата математического программирования // Проблемы управления. 2022. № 4. С. 3-14.

Базилевский М. П. Отбор информативных операций при построении линейно-неэлементарных регрессионных моделей // International Journal of Open Information Technologies. 2021. Т. 9, № 5. С. 30-35.

Базилевский М. П. Оценивание линейно-неэлементарных регрессионных моделей с помощью метода наименьших квадратов // Моделирование, оптимизация и информационные технологии. 2020. Т. 8, № 4 (31).

Базилевский М. П. Метод построения неэлементарных линейных регрессий на основе аппарата математического программирования // Проблемы управления. 2022. № 4. С. 3-14.

Фёрстер Э., Рёнц Б. Методы корреляционного и регрессионного анализа. М.: Финансы и статистика, 1983. 303 с.

Гефан Г. Д. Эконометрика. Иркутск: ИрГУПС, 2005. 84 с.

Горбач А. Н., Цейтлин Н. А. Покупательское поведение: анализ спонтанных последовательностей и регрессионных моделей в маркетинговых исследованиях. Киев: Освiта УкраЇны, 2011. 220 с.

Kim J. H. Multicollinearity and misleading statistical results // Korean journal of anesthesiology. 2019. Vol. 72, no. 6. Pp. 558-569.

Shrestha N. Detecting multicollinearity in regression analysis // American Journal of Applied Mathematics and Statistics. 2020. Vol. 8, no. 2. Pp. 39-42.

Носков С. И. Технология моделирования объектов с нестабильным функционированием и неопределенностью в данных. Иркутск: Облинформпечать, 1996. 321 с.

Du M., Liu N., Hu X. Techniques for interpretable machine learning // Communications of the ACM. 2019. Vol. 63, no. 1. Pp. 68-77.

Molnar C.Interpretable machine learning. Lulu.com, 2020.

Doshi-Velez F., Kim B. Towards a rigorous science of interpretable machine learning // arXiv preprint arXiv:1702.08608. 2017.

Sarker I. H. Machine learning: Algorithms, real-world applications and research directions // SN computer science. 2021. Vol. 2, no. 3. P. 160.

Janiesch C., Zschech P., Heinrich K. Machine learning and deep learning // Electronic Markets. 2021. Vol. 31, no. 3. Pp. 685-695.

A guide to machine learning for biologists /j. G. Greener, S. M. Kandathil, L. Moffat, D. T. Jones // Nature Reviews Molecular Cell Biology. 2022. Vol. 23, no. 1. Pp. 40-55.

Загрузки

Опубликован

09.10.2023

Как цитировать

Базилевский, М. П. (2023). Алгоритм интерпретации линейных и неэлементарных линейных регрессионных моделей в условиях мультиколлинеарности. Интеллектуальные системы в производстве, 21(3), 40–47. https://doi.org/10.22213/2410-9304-2023-3-40-47

Выпуск

Раздел

Статьи