Алгоритм интерпретации линейных и неэлементарных линейных регрессионных моделей в условиях мультиколлинеарности
DOI:
https://doi.org/10.22213/2410-9304-2023-3-40-47Ключевые слова:
метод наименьших квадратов, мультиколлинеарность, неэлементарная линейная регрессия, линейная регрессия, интерпретируемость, машинное обучениеАннотация
При построении моделей машинного обучения все больше исследователей приходят к пониманию того, что помимо точности модели важна и ее интерпретируемость, означающая степень понятности человеку. В настоящее время в науке формируется новая область - интерпретируемое машинное обучение. Статья посвящена исследованию вопросов интерпретации линейных регрессионных моделей. Традиционно линейные регрессии принято интерпретировать в условиях слабой корреляции объясняющих переменных. В таком случае по известному шаблону можно объяснить влияние каждой входной переменной на выходную переменную. Часто же объясняющие переменные сильно коррелируют между собой. В такой ситуации рекомендуют исключать сильно коррелирующие переменные, что приводит, во-первых, к снижению качества модели, во-вторых, к потере целостности исследования и интерпретации изучаемого процесса или явления. В данной работе предложен алгоритм интерпретации линейной регрессии, построенной при любой степени корреляции объясняющих переменных. При слабой корреляции всех объясняющих переменных алгоритм дает традиционную интерпретацию линейной регрессии, а при сильной корреляции, как следует из доказанной в статье теоремы, интерпретация регрессии с несколькими переменными сводится к интерпретации уравнения с одной переменной, но при этом не теряется информация о связях между парами объясняющих переменных. Алгоритм может применяться не только для обычных линейных регрессий, но и для неэлементарных, содержащих помимо объясняющих переменных их пары, преобразованные с помощью бинарных операций min и max. Работа алгоритма продемонстрирована на конкретных примерах.Библиографические ссылки
Базилевский М. П. Метод построения неэлементарных линейных регрессий на основе аппарата математического программирования // Проблемы управления. 2022. № 4. С. 3-14.
Базилевский М. П. Метод построения неэлементарных линейных регрессий на основе аппарата математического программирования // Проблемы управления. 2022. № 4. С. 3-14.
Базилевский М. П. Отбор информативных операций при построении линейно-неэлементарных регрессионных моделей // International Journal of Open Information Technologies. 2021. Т. 9, № 5. С. 30-35.
Базилевский М. П. Оценивание линейно-неэлементарных регрессионных моделей с помощью метода наименьших квадратов // Моделирование, оптимизация и информационные технологии. 2020. Т. 8, № 4 (31).
Базилевский М. П. Метод построения неэлементарных линейных регрессий на основе аппарата математического программирования // Проблемы управления. 2022. № 4. С. 3-14.
Фёрстер Э., Рёнц Б. Методы корреляционного и регрессионного анализа. М.: Финансы и статистика, 1983. 303 с.
Гефан Г. Д. Эконометрика. Иркутск: ИрГУПС, 2005. 84 с.
Горбач А. Н., Цейтлин Н. А. Покупательское поведение: анализ спонтанных последовательностей и регрессионных моделей в маркетинговых исследованиях. Киев: Освiта УкраЇны, 2011. 220 с.
Kim J. H. Multicollinearity and misleading statistical results // Korean journal of anesthesiology. 2019. Vol. 72, no. 6. Pp. 558-569.
Shrestha N. Detecting multicollinearity in regression analysis // American Journal of Applied Mathematics and Statistics. 2020. Vol. 8, no. 2. Pp. 39-42.
Носков С. И. Технология моделирования объектов с нестабильным функционированием и неопределенностью в данных. Иркутск: Облинформпечать, 1996. 321 с.
Du M., Liu N., Hu X. Techniques for interpretable machine learning // Communications of the ACM. 2019. Vol. 63, no. 1. Pp. 68-77.
Molnar C.Interpretable machine learning. Lulu.com, 2020.
Doshi-Velez F., Kim B. Towards a rigorous science of interpretable machine learning // arXiv preprint arXiv:1702.08608. 2017.
Sarker I. H. Machine learning: Algorithms, real-world applications and research directions // SN computer science. 2021. Vol. 2, no. 3. P. 160.
Janiesch C., Zschech P., Heinrich K. Machine learning and deep learning // Electronic Markets. 2021. Vol. 31, no. 3. Pp. 685-695.
A guide to machine learning for biologists /j. G. Greener, S. M. Kandathil, L. Moffat, D. T. Jones // Nature Reviews Molecular Cell Biology. 2022. Vol. 23, no. 1. Pp. 40-55.
Загрузки
Опубликован
Как цитировать
Выпуск
Раздел
Лицензия
Copyright (c) 2023 Михаил Павлович Базилевский
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.