Идентификация параметров комбинированной кусочно-линейной регрессионной модели
- Авторы: Носков С.И.1
-
Учреждения:
- Иркутский государственный университет путей сообщения
- Выпуск: Том 18, № 4 (2022)
- Страницы: 115-119
- Раздел: Математическое моделирование и информационные технологии
- Статья опубликована: 14.12.2022
- URL: https://vestnikugrasu.org/byusu/article/view/121830
- DOI: https://doi.org/10.18822/byusu202204115-119
- ID: 121830
Цитировать
Полный текст
Аннотация
Предмет исследования: задача оценивания параметров комбинированной кусочно-линейной регрессионной модели.
Цель исследования: применить аппарат линейно-булевого программирования для идентификации ее параметров.
Методы и объекты исследования: объектом исследования является совокупность показателей изобретательской активности в Российской Федерации, методами – регрессионный анализ и математическое программирование.
Основные результаты исследования: описан подход к оцениванию параметров комбинированной кусочно-линейной регрессионной модели посредством применения метода наименьших модулей, что позволяет свести эту задачу к задаче линейно-булевого программирования. Построена комбинированная кусочно-линейная модель изобретательской активности в Российской Федерации, которая может использоваться при проведении различных аналитических и прогнозных расчетов. Выходной переменной модели является количество заявок на выдачу патента, а входными – объем валового внутреннего продукта, численность аспирантов и профессорско-преподавательского состава.
Полный текст
Введение
Весьма часто при исследовании методами математического моделирования сложных технических и социально-экономических объектов исследователи вынуждены применять наряду с линейными различные нелинейные конструкции, в частности, кусочного типа. Так, в работе [1] рассматриваются тендерные предложения китайских компаний, зарегистрированных на бирже. При этом посредством применения непараметрического метода и модели кусочно-линейной регрессии доказывается, что ценообразование предложений имеет эффект привязки. В [2] рассмотрено рассеяние гармонической во времени акустической волны на ограниченном анизотропном неоднородном препятствии, погруженном в неограниченную анизотропную однородную среду, в предположении, что граница препятствия является липшицевой поверхностью. Математическая модель сформулирована в виде краевой задачи переноса для эллиптического уравнения в частных производных типа Гельмгольца второго порядка с кусочно-липшиц-непрерывными переменными коэффициентами. Статья [3] посвящена применению метода кусочной линеаризации для решения проблемы ограничения потока природного газа в трубопроводе, что достигается преобразованием исходной модели в задачу смешанного целочисленного программирования. В [4] изучаются максимально допустимые скорости судов на маршруте из-за таких географических особенностей, как каналы, протоки и океанские течения. При этом сначала формулируется задача нелинейного программирования с последующим ее преобразованием в задачу линейного программирования путем использования кусочно-линейных аппроксимирующих функций. Кроме того, представлена эвристическая процедура для сокращения времени вычислений для задач большой размерности. В работе [5] для модельного описания затрат на топливо для генерирующих установок используется кусочно-квадратичная функция. В [6] осуществляется детальный анализ экономической модели объема производства с дефицитом при использовании общей функции нормы стоимости запасов и кусочно-линейных вогнутых производственных затратах.
Результаты и обсуждение
Оценивание параметров комбинированной кусочно-линейной регрессии как задача линейно-булевого программирования
Пусть при исследовании некоторого сложного объекта произвольной природы методами регрессионного анализа поведение некоторого выходного фактора (зависимой переменной) у определяется значениями входных показателей (независимых переменных) . Наиболее часто при этом (см., например, [7-9]) используется линейная модель (регрессионное уравнение):
, (1)
где k – номер наблюдения, n – длина выборки, - ошибки аппроксимации, не имеющие вероятностной природы, а представляющие собой погрешности модельного описания реального процесса, – вектор оцениваемых параметров. Значительно менее употребительными являются кусочно-линейные модели (см., например, [10-14]), обладающие некоторыми замечательными содержательными свойствами:
, . (2)
, . (3)
Одним из таких свойств является невозможность наращивания (снижения) значений зависимой переменной без зафиксированного в моделях (2) или (3) пропорционального роста (уменьшения) значений всех независимых факторов. В работах [10-14] подробно описаны способы оценивания параметров регрессионных уравнений (2) и (3).
В определенной мере обобщающей модельные конструкции (1) и (2) формой является комбинированная кусочно-линейная модель (в работе [15] несколько схожая модель названа линейно-неэлементарной) вида:
(4)
Здесь и – индексные множества, такие, что:
При этом выполнения обычно накладываемого в подобных случаях условия
не требуется, поскольку допускается вхождение некоторых независимых переменных одновременно и в линейную, и в кусочно-линейную составляющие модели (4). Следовательно, в общем случае ||+|| m, где |A| – число элементов в множестве А.
Идентификацию параметров , , будем проводить на основе применения метода наименьших модулей (МНМ) посредством минимизации функции :
=. (5)
Используем применяемый при оценивании параметров кусочно-линейных регрессий способ сведения МНМ для них к задаче линейно-булевого программирования (ЛБП). Она для задачи (5) примет вид:
, , (6)
, , , (7)
, , , (8)
, , (9)
, , , (10)
. (11)
Здесь М – заранее выбранное большое положительное число.
Задача ЛБП (6) – (11) содержит ||+||+ (2+||) переменных, из которых ||- булевы, и 2 (1+||) ограничений.
Комбинированная кусочно-линейная модель изобретательской активности
Используем описанный выше алгоритм оценивания неизвестных параметров комбинированной кусочно-линейной регрессии (4) для построения модели изобретательской активности в Российской Федерации. Отметим при этом, что подобные проблемы рассматривались в ряде публикаций (см., например, [16-19]).
Введем в рассмотрение переменные:
y – количество заявок на выдачу патента в Российской Федерации (шт.);
– объем валового внутреннего продукта (млрд. руб.);
– численность аспирантов на конец года (чел.);
– численность профессорско-преподавательского состава (тыс. чел.).
В качестве информационной базы исследованием будем использовать статистическую информацию по выделенным факторам за 2000–2020 гг. [19]). Сформируем индексные множества и следующим образом: ={1}, {2,3}. При оценивании параметров регрессии (5) воспользуемся программой [20]. В результате получим следующую комбинированную кусочно-линейную модель:
, (12)
Е=5.68%, s = (2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 2, 2, 2).
Здесь Е – средняя относительная ошибка аппроксимации, s – вектор срабатываний [21], произвольная компонента которого рассчитывается по правилу:
Отметим, что модель (12) обладает весьма приемлемой точностью, что позволяет эффективно ее использовать при проведении различных аналитических и прогнозных расчетов. Анализ вектора срабатываний s позволяет сделать вывод о том, что рост количества заявок на выдачу патента в Российской Федерации в 2010–2012 годах сдерживался численностью профессорско-преподавательского состава, в остальные годы ретроспективного периода – численностью аспирантов. Это обстоятельство указывает на высокую значимость деятельности последних в сфере изобретательской деятельности.
Заключение и выводы
В работе рассмотрена комбинированная кусочно-линейная регрессионная модель, слагаемыми которой являются линейная и кусочная составляющие. Описан алгоритмический способ оценивания ее параметров посредством применения метода наименьших модулей, что позволяет свести эту задачу к задаче линейно-булевого программирования. Разработана комбинированная кусочно-линейная модель изобретательской активности в Российской Федерации, которая может использоваться при проведении различных аналитических и прогнозных расчетов.
Об авторах
Сергей Иванович Носков
Иркутский государственный университет путей сообщения
Автор, ответственный за переписку.
Email: sergey.noskov.57@mail.ru
доктор технических наук, профессор, профессор кафедры «Информационные системы и защита информации»
Россия, ИркутскСписок литературы
- Wang, Y. Market reaction to tender offers: Insights from China / Y. Wang, Y. Qian // Journal of University of Science and Technology of China. – 2021. – 51(12). – Р. 894–911.
- Gorgisheli, S. Boundary-transmission problems of the theory of acoustic waves for piecewise inhomogeneous anisotropic multi-component lipschitz domains / S. Gorgisheli, M. Mrevlish-vili, D. Natroshvili // Transactions of A. Razmadze Mathematical Institute. – 2020. – 174(3). – Р. 303–324.
- Research on double-layer optimized configuration of multi-energy storage in regional integrated energy system with connected distributed wind / Q. Zhang, Z. Ren, R. Ma [et al] // Energies. – 2019. – 12(20). – Р. 3964–3976.
- Planning of vessel speed and fuel bunkering over a route with speed limits / I. E. Nielsen, N. A. Dung Do, J. Jang, G. Bocewicz // Maritime Economics and Logistics. – 2016. – 18(4). – Р. 414–435.
- Solving economic dispatch problem using particle swarm optimization by an evolutionary technique for initializing particles / R. Rahmani, M. F. Othman, R. Yusof, M. Khalid // Journal of Theoretical and Applied Information Technology. –2012. – 46(2). – Р. 526–536.
- Deterministic inventory/production model with general inventory cost rate function and piecewise linear concave production costs / Z. P. Bayindir, S. I. Birbil, J. B. G. A Frenk // European Journal of Operational Research. – 2007. – 179(1). – Р. 114–123.
- Агеев, С. П. Моделирование энергопотребления поточной линии производства пилопродукции / С. П. Агеев, В. И. Жабин, В. И. Мелехов. – Текст : непосредственный // Актуальные проблемы лесного комплекса. –2012. – № 34. – С. 21–24.
- Карпенко, С. М. Прогнозирование электропотребления на горнопромышленных предприятиях с использованием статистических методов / С. М. Карпенко, Н. В. Карпенко, Г. Ю. Безгинов. – Текст : непосредственный // Горная промышленность. – 2022. – № 1. – С. 82–88.
- Радковская, Е. В. Экономико-статистический анализ промышленного развития регионов России / Е. В. Радковская, Г. В. Радковский. – Текст : непосредственный // Фундаментальные исследования. – 2019. – № 10. – С. 69–75.
- Носков, С. И. Построение кусочно-линейной авторегрессионной модели произвольного порядка / С. И. Носков. – Текст : непосредственный // Вестник Югорского государственного университета. – 2022. – № 2 (65). – С. 89–94.
- Носков, С. И. Идентификация параметров кусочно-линейной регрессии / С. И. Носков, Р. В. Лоншаков. – Текст : непосредственный // Информационные технологии и проблемы математического моделирования сложных систем. – 2008. – № 6. – С. 63–64.
- Носков, С. И. Программный комплекс построения некоторых типов кусочно-линейных регрессий / С. И. Носков, А. А. Хоняков. – Текст : непосредственный // Информационные технологии и математическое моделирование в управлении сложными системами. – 2019. – № 3 (4). – С. 47–55.
- Носков, С. И. Идентификация параметров кусочно-линейной функции риска / С. И. Носков. – Текст : непосредственный // Транспортная инфраструктура Сибирского региона. – 2017. – Т. 1. – С. 417–421.
- Носков, С. И. Применение функции риска для моделирования экономических систем / С. И. Носков, А. А. Хоняков. – Текст : непосредственный // Южно-Сибирский научный вестник. – 2020. – № 5 (33). – С. 85–92.
- Базилевский, М. П. Оценивание линейно-неэлементарных регрессионных моделей с помощью метода наименьших квадратов / М. П. Базилевский // Моделирование, оптимизация и информационные технологии. – 2020. – Т. 8. – № 4(31).
- Миролюбова, Т. В. Методические подходы к анализу факторов, влияющих на развитие инновационной системы университета / Т. В. Миролюбова, Л.О. Соломатова. – Текст : непосредственный // Фундаментальные исследования. – 2012. – № 11. – С. 1004–1010.
- Гуриева, Л. К. Анализ инновационной ситуации в регионах Южного федерального округа / Л. К. Гуриева, И. С. Шапка. – Текст : непосредственный // Известия высших учебных заведений. Северо-Кавказский регион. Общественные науки. – 2005. – № 4(132). – С. 51–57.
- Дмитриева, О. А. Регрессионная модель зависимости количества патентов от объема затрат на финансирование научных исследований и разработок / О. А. Дмитриева, Т. Н. Батова. – Текст : непосредственный // Альманах научных работ молодых ученых Университета ИТМО. – 2016. – С. 40–42.
- Носков, С. И. Модификация непрерывной формы метода максимальной согласованности при построении линейной регрессии / С. И. Носков, Ю. А. Бычков. – Текст : непосредственный // Известия Тульского государственного университета. Технические науки. – 2022. – № 5. – С. 88–94.
- Свидетельство о государственной регистрации программы для ЭВМ № 2022617773 Российская Федерация. Программа построения комбинированной кусочно-линейной регрессионной модели: № 2022616675 : заявл. 14.04.2022 : опубл. 25.04.2022 / С. И. Носков, А. А. Хоняков ; заявитель ФГБОУВО «Иркутский государственный университет путей сообщения». – Текст : непосредственный.
- Носков, С. И. Кусочно-линейные регрессионные модели объемов перевозки пассажиров железнодорожным транспортом / С. И. Носков, А. А. Хоняков. – Текст : непосредственный // Модели, системы, сети в экономике, технике, природе и обществе. – 2021. – № 4 (40). – С. 80–89.
Дополнительные файлы
