Идентификация параметров комбинированной кусочно-линейной регрессионной модели

Обложка

Цитировать

Полный текст

Аннотация

Предмет исследования: задача оценивания параметров комбинированной кусочно-линейной регрессионной модели.

Цель исследования: применить аппарат линейно-булевого программирования для идентификации ее параметров.

Методы и объекты исследования: объектом исследования является совокупность показателей изобретательской активности в Российской Федерации, методами – регрессионный анализ и математическое программирование.

Основные результаты исследования: описан подход к оцениванию параметров комбинированной кусочно-линейной регрессионной модели посредством применения метода наименьших модулей, что позволяет свести эту задачу к задаче линейно-булевого программирования. Построена комбинированная кусочно-линейная модель изобретательской активности в Российской Федерации, которая может использоваться при проведении различных аналитических и прогнозных расчетов. Выходной переменной модели является количество заявок на выдачу патента, а входными – объем валового внутреннего продукта, численность аспирантов и профессорско-преподавательского состава.

Полный текст

Введение

Весьма часто при исследовании методами математического моделирования сложных технических и социально-экономических объектов исследователи вынуждены применять наряду с линейными различные нелинейные конструкции, в частности, кусочного типа. Так, в работе [1] рассматриваются тендерные предложения китайских компаний, зарегистрированных на бирже. При этом посредством применения непараметрического метода и модели кусочно-линейной регрессии доказывается, что ценообразование предложений имеет эффект привязки. В [2] рассмотрено рассеяние гармонической во времени акустической волны на ограниченном анизотропном неоднородном препятствии, погруженном в неограниченную анизотропную однородную среду, в предположении, что граница препятствия является липшицевой поверхностью. Математическая модель сформулирована в виде краевой задачи переноса для эллиптического уравнения в частных производных типа Гельмгольца второго порядка с кусочно-липшиц-непрерывными переменными коэффициентами. Статья [3] посвящена применению метода кусочной линеаризации для решения проблемы ограничения потока природного газа в трубопроводе, что достигается преобразованием исходной модели в задачу смешанного целочисленного программирования. В [4] изучаются максимально допустимые скорости судов на маршруте из-за таких географических особенностей, как каналы, протоки и океанские течения. При этом сначала формулируется задача нелинейного программирования с последующим ее преобразованием в задачу линейного программирования путем использования кусочно-линейных аппроксимирующих функций. Кроме того, представлена эвристическая процедура для сокращения времени вычислений для задач большой размерности. В работе [5] для модельного описания затрат на топливо для генерирующих установок используется кусочно-квадратичная функция. В [6] осуществляется детальный анализ экономической модели объема производства с дефицитом при использовании общей функции нормы стоимости запасов и кусочно-линейных вогнутых производственных затратах.

Результаты и обсуждение

Оценивание параметров комбинированной кусочно-линейной регрессии как задача линейно-булевого программирования

Пусть при исследовании некоторого сложного объекта произвольной природы методами регрессионного анализа поведение некоторого выходного фактора (зависимой переменной) у определяется значениями входных показателей (независимых переменных) xi,i=1,m¯. Наиболее часто при этом (см., например, [7-9]) используется линейная модель (регрессионное уравнение):

yk=i=1mαixki+εk,   k=1,n¯,   (1)

где k – номер наблюдения, n – длина выборки, εk - ошибки аппроксимации, не имеющие вероятностной природы, а представляющие собой погрешности модельного описания реального процесса, α – вектор оцениваемых параметров. Значительно менее употребительными являются кусочно-линейные модели (см., например, [10-14]), обладающие некоторыми замечательными содержательными свойствами:

yk=minα1xk1,α2xk2,...,αmxkm+εkk=1,n¯.      (2)

yk=maxα1xk1,α2xk2,...,αmxkm+εkk=1,n¯.     (3)

Одним из таких свойств является невозможность наращивания (снижения) значений зависимой переменной без зафиксированного в моделях (2) или (3) пропорционального роста (уменьшения) значений всех независимых факторов. В работах [10-14] подробно описаны способы оценивания параметров регрессионных уравнений (2) и (3).

В определенной мере обобщающей модельные конструкции (1) и (2) формой является комбинированная кусочно-линейная модель (в работе [15] несколько схожая модель названа линейно-неэлементарной) вида:

yk=iI1αixki+minjI2βjxkj+εk.   (4)

Здесь I1 и I2 – индексные множества, такие, что:

I1I2={1,2,...m}.

При этом выполнения обычно накладываемого в подобных случаях условия

I1I2=

не требуется, поскольку допускается вхождение некоторых независимых переменных одновременно и в линейную, и в кусочно-линейную составляющие модели (4). Следовательно, в общем случае |I1|+|I2| m, где |A| – число элементов в множестве А. 

Идентификацию параметров αiiI1 βj, jI2 будем проводить на основе применения метода наименьших модулей (МНМ) посредством минимизации функции Jα,β:

Jα,β=k=1n|ykiI1αixkiminjI2βjxkj|​ min.   (5)

Используем применяемый при оценивании параметров кусочно-линейных регрессий способ сведения МНМ для них к задаче линейно-булевого программирования (ЛБП). Она для задачи (5) примет вид:

iI1αixki+zk+ukvk=ykk=1,n¯,     (6)

zkβjxkjk=1,n¯, jI2,    (7)

βjxkjzk1σkjMk=1,n¯, jI2,     (8)

jI2σkj=1k=1,n¯,     (9)

σti{0,1}k=1,n¯, jI2,     (10)

Jα,β=k=1nuk+vkmin.    (11)

Здесь М – заранее выбранное большое положительное число.

Задача ЛБП (6) – (11) содержит |I1|+|I2|+ (2+|I2|) переменных, из которых n|I2|- булевы, и 2 n (1+|I2|) ограничений.

Комбинированная кусочно-линейная модель изобретательской активности

Используем описанный выше алгоритм оценивания неизвестных параметров комбинированной кусочно-линейной регрессии (4) для построения модели изобретательской активности в Российской Федерации. Отметим при этом, что подобные проблемы рассматривались в ряде публикаций (см., например, [16-19]).

Введем в рассмотрение переменные:

y – количество заявок на выдачу патента в Российской Федерации (шт.);

х1– объем валового внутреннего продукта (млрд. руб.);

х2 – численность аспирантов на конец года (чел.);

х3– численность профессорско-преподавательского состава (тыс. чел.).

В качестве информационной базы исследованием будем использовать статистическую информацию по выделенным факторам за 2000–2020 гг. [19]). Сформируем индексные множества I1 и I2 следующим образом: I1={1}, {2,3}. При оценивании параметров регрессии (5) воспользуемся программой [20]. В результате получим следующую комбинированную кусочно-линейную модель:

у=2421.9+0.177х1+min{0.242х2,101.12х3},    (12)

Е=5.68%, s = (2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 2, 2, 2).

Здесь Е – средняя относительная ошибка аппроксимации, s – вектор срабатываний [21], произвольная компонента которого skрассчитывается по правилу:

sk=2,  если  0.242хk2101.12хk33,  впротивномслучае.

Отметим, что модель (12) обладает весьма приемлемой точностью, что позволяет эффективно ее использовать при проведении различных аналитических и прогнозных расчетов. Анализ вектора срабатываний s позволяет сделать вывод о том, что рост количества заявок на выдачу патента в Российской Федерации в 2010–2012 годах сдерживался численностью профессорско-преподавательского состава, в остальные годы ретроспективного периода – численностью аспирантов. Это обстоятельство указывает на высокую значимость деятельности последних в сфере изобретательской деятельности.

Заключение и выводы

В работе рассмотрена комбинированная кусочно-линейная регрессионная модель, слагаемыми которой являются линейная и кусочная составляющие. Описан алгоритмический способ оценивания ее параметров посредством применения метода наименьших модулей, что позволяет свести эту задачу к задаче линейно-булевого программирования. Разработана комбинированная кусочно-линейная модель изобретательской активности в Российской Федерации, которая может использоваться при проведении различных аналитических и прогнозных расчетов.

×

Об авторах

Сергей Иванович Носков

Иркутский государственный университет путей сообщения

Автор, ответственный за переписку.
Email: sergey.noskov.57@mail.ru

доктор технических наук, профессор, профессор кафедры «Информационные системы и защита информации»

Россия, Иркутск

Список литературы

  1. Wang, Y. Market reaction to tender offers: Insights from China / Y. Wang, Y. Qian // Journal of University of Science and Technology of China. – 2021. – 51(12). – Р. 894–911.
  2. Gorgisheli, S. Boundary-transmission problems of the theory of acoustic waves for piecewise inhomogeneous anisotropic multi-component lipschitz domains / S. Gorgisheli, M. Mrevlish-vili, D. Natroshvili // Transactions of A. Razmadze Mathematical Institute. – 2020. – 174(3). – Р. 303–324.
  3. Research on double-layer optimized configuration of multi-energy storage in regional integrated energy system with connected distributed wind / Q. Zhang, Z. Ren, R. Ma [et al] // Energies. – 2019. – 12(20). – Р. 3964–3976.
  4. Planning of vessel speed and fuel bunkering over a route with speed limits / I. E. Nielsen, N. A. Dung Do, J. Jang, G. Bocewicz // Maritime Economics and Logistics. – 2016. – 18(4). – Р. 414–435.
  5. Solving economic dispatch problem using particle swarm optimization by an evolutionary technique for initializing particles / R. Rahmani, M. F. Othman, R. Yusof, M. Khalid // Journal of Theoretical and Applied Information Technology. –2012. – 46(2). – Р. 526–536.
  6. Deterministic inventory/production model with general inventory cost rate function and piecewise linear concave production costs / Z. P. Bayindir, S. I. Birbil, J. B. G. A Frenk // European Journal of Operational Research. – 2007. – 179(1). – Р. 114–123.
  7. Агеев, С. П. Моделирование энергопотребления поточной линии производства пилопродукции / С. П. Агеев, В. И. Жабин, В. И. Мелехов. – Текст : непосредственный // Актуальные проблемы лесного комплекса. –2012. – № 34. – С. 21–24.
  8. Карпенко, С. М. Прогнозирование электропотребления на горнопромышленных предприятиях с использованием статистических методов / С. М. Карпенко, Н. В. Карпенко, Г. Ю. Безгинов. – Текст : непосредственный // Горная промышленность. – 2022. – № 1. – С. 82–88.
  9. Радковская, Е. В. Экономико-статистический анализ промышленного развития регионов России / Е. В. Радковская, Г. В. Радковский. – Текст : непосредственный // Фундаментальные исследования. – 2019. – № 10. – С. 69–75.
  10. Носков, С. И. Построение кусочно-линейной авторегрессионной модели произвольного порядка / С. И. Носков. – Текст : непосредственный // Вестник Югорского государственного университета. – 2022. – № 2 (65). – С. 89–94.
  11. Носков, С. И. Идентификация параметров кусочно-линейной регрессии / С. И. Носков, Р. В. Лоншаков. – Текст : непосредственный // Информационные технологии и проблемы математического моделирования сложных систем. – 2008. – № 6. – С. 63–64.
  12. Носков, С. И. Программный комплекс построения некоторых типов кусочно-линейных регрессий / С. И. Носков, А. А. Хоняков. – Текст : непосредственный // Информационные технологии и математическое моделирование в управлении сложными системами. – 2019. – № 3 (4). – С. 47–55.
  13. Носков, С. И. Идентификация параметров кусочно-линейной функции риска / С. И. Носков. – Текст : непосредственный // Транспортная инфраструктура Сибирского региона. – 2017. – Т. 1. – С. 417–421.
  14. Носков, С. И. Применение функции риска для моделирования экономических систем / С. И. Носков, А. А. Хоняков. – Текст : непосредственный // Южно-Сибирский научный вестник. – 2020. – № 5 (33). – С. 85–92.
  15. Базилевский, М. П. Оценивание линейно-неэлементарных регрессионных моделей с помощью метода наименьших квадратов / М. П. Базилевский // Моделирование, оптимизация и информационные технологии. – 2020. – Т. 8. – № 4(31).
  16. Миролюбова, Т. В. Методические подходы к анализу факторов, влияющих на развитие инновационной системы университета / Т. В. Миролюбова, Л.О. Соломатова. – Текст : непосредственный // Фундаментальные исследования. – 2012. – № 11. – С. 1004–1010.
  17. Гуриева, Л. К. Анализ инновационной ситуации в регионах Южного федерального округа / Л. К. Гуриева, И. С. Шапка. – Текст : непосредственный // Известия высших учебных заведений. Северо-Кавказский регион. Общественные науки. – 2005. – № 4(132). – С. 51–57.
  18. Дмитриева, О. А. Регрессионная модель зависимости количества патентов от объема затрат на финансирование научных исследований и разработок / О. А. Дмитриева, Т. Н. Батова. – Текст : непосредственный // Альманах научных работ молодых ученых Университета ИТМО. – 2016. – С. 40–42.
  19. Носков, С. И. Модификация непрерывной формы метода максимальной согласованности при построении линейной регрессии / С. И. Носков, Ю. А. Бычков. – Текст : непосредственный // Известия Тульского государственного университета. Технические науки. – 2022. – № 5. – С. 88–94.
  20. Свидетельство о государственной регистрации программы для ЭВМ № 2022617773 Российская Федерация. Программа построения комбинированной кусочно-линейной регрессионной модели: № 2022616675 : заявл. 14.04.2022 : опубл. 25.04.2022 / С. И. Носков, А. А. Хоняков ; заявитель ФГБОУВО «Иркутский государственный университет путей сообщения». – Текст : непосредственный.
  21. Носков, С. И. Кусочно-линейные регрессионные модели объемов перевозки пассажиров железнодорожным транспортом / С. И. Носков, А. А. Хоняков. – Текст : непосредственный // Модели, системы, сети в экономике, технике, природе и обществе. – 2021. – № 4 (40). – С. 80–89.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Югорский государственный университет, 2022

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution-ShareAlike 4.0 International License.