Improving the quality of the forecast through methods of combining forecasts
- Authors: Rusanov M.A.1, Shergin S.N.2, Tatjankin V.M.3
-
Affiliations:
- Yugorsky Research Institute of Information Technologies
- Yugra State University
- Surgut State University
- Issue: Vol 19, No 3 (2023)
- Pages: 46-51
- Section: MATHEMATICAL MODELING AND INFORMATION TECHNOLOGIES
- URL: https://vestnikugrasu.org/byusu/article/view/622892
- DOI: https://doi.org/10.18822/byusu20230346-51
- ID: 622892
Cite item
Full Text
Abstract
Subject of research: The article is devoted to the comparison of forecasting methods and methods of combining forecasts when forecasting average monthly wages for some regions of the Russian Federation for the period from January 2013 to July 2022.
Purpose of the study: To test the hypothesis of improving forecast quality through forecast pooling methods.
Methods and objects of research: Time series of average monthly wages in the Khanty-Mansi Autonomous Okrug – Yugra, Yamal-Nenets Autonomous Okrug and Sverdlovsk region are used to compare forecasting methods and methods of combining forecasts. The paper considers forecasting methods: TBATS, ARIMA, exponential smoothing, ETS, Theta, STL, polynomial regression and the approach in combining forecasts by the Granger-Ramanathan method.
Main results of research: The paper presents the results of comparison of forecasting methods and approach in combining forecasts by Granger-Ramanathan method. Time series of average monthly wages were taken from statistical collections of Rosstat. The forecast horizon was set at 12, 18 and 24 points. The Granger-Ramanathan method showed that in most cases it is possible to improve the quality of the forecast by combining private forecasts.
Keywords
Full Text
Введение
При проведении исследования был подготовлен обзор литературы по вопросам улучшения качества прогнозов социально-экономических показателей за счет использования методов объединения прогнозов, которые, как показывает практика, демонстрируют лучшие результаты по сравнению с частными моделями прогнозирования.
Вначале были проанализированы статьи, содержащие подходы поиска косвенных показателей, использующихся при прогнозировании социально-экономических показателей. Например, в статье [1] говорится об использовании интеллектуального анализа текста для анализа настроений в новостных онлайн-порталах для предсказания тенденции цен на акции. В статье [2] используется подход применения графа знаний для выявления наиболее значимых связанных показателей с исследуемым показателем. Подобные исследования [1, 2] требуют проведения дополнительных работ по сбору большого объема данных, предобработке и разметке данных, что в разы увеличивает объем исследований.
В статье [3] представлена ретроспектива темы объединенных прогнозов за 50 лет и охватывает все основные направления исследования в этой области.
В данной работе представлен обзор литературы по объединению прогнозов, а также ссылки на доступные реализации программного обеспечения с открытым исходным кодом. Обсуждаются вопросы потенциала и ограничений различных методов объединения прогнозов. Также во введении статьи отмечается рост статей WoS до 13,8%, относящихся к теме объединения прогнозов среди всех статей, относящихся к прогнозированию.
Отдельно авторы выделяют вклад соревнования M-Competition [4, 5] в развитие темы прогнозирования временных рядов.
В статье [6] приводится обзор методов прогнозирования, который рассматривает качество различных методов для прогнозирования экономических показателей, а также разные оценки для валидации качества прогноза.
Среди российских исследователей можно выделить группу исследователей Института экономики РАН [7]. В основе работ лежит подход в объединении прогнозов методами Грейнджера-Раманатхана, метод матрицы парных предпочтений и метод линейной комбинации частных прогнозов с различными весами (веса определяются по матрице коэффициентов парной корреляции).
Для построения частных прогнозов использовались методы: гармонических весов (MGV), адаптивного экспоненциального сглаживания с использованием трэкинг-сигнала (MAEKS), экспоненциального сглаживания (MEKS) и модель Бокса-Дженкинса (ARIMA).
Оценка и сравнение методов проводилось по двум оценкам: средняя абсолютная ошибка и средняя относительная ошибка. Лучший результат показали методы Грейнджера–Раманатхана. Авторы статьи отмечают, что методы хорошо описывают не только плавные изменения, но и кризисные годы с резкими перепадами. Также у авторов статьи [7] можно отметить еще ряд статей посвященных сравнению методов прогнозирования [8, 9, 10].
Результаты и обсуждение
Постановка задачи
Целью статьи является проверка гипотезы о повышении качества прогноза посредством методов объединения прогнозов.
Для проверки гипотезы были решены задачи:
- Подготовлены временные ряды для показателя «Среднемесячная номинальная начисленная заработная плата работников по полному кругу организаций по субъектам Российской Федерации с 2013 года (по месяцам), рублей» для ХМАО-Югры, ЯНАО и Свердловской области.
- Рассчитаны прогнозы частными моделями прогнозирования и методом объединения прогнозов Грейнджера-Раманатхана.
- Проведен сравнительный анализ качества прогноза частными моделями прогнозирования и методом объединения прогнозов Грейнджера-Раманатхана.
Решение
Для проверки гипотезы были выбраны частные модели прогнозирования: TBATS, ARIMA, exponential smoothing (экспоненциальное сглаживание), ETS, Theta, STL, полиномиальная регрессия (Polinom) и метод объединения прогнозов Грейнджера-Раманатхана.
Для проведения эксперимента использовались программные реализации методов прогнозирования из библиотеки skitime языка программирования python. Метод объединения прогнозов был написан на языке программирования python по описанию, представленному в статье [7].
Модель для временных рядов с множественной сезонностью TBATS рассматривалась в работах [11, 12]. TBATS это аббревиатура из:
- Trigonometric seasonality;
- Box-Cox transformation;
- ARMA errors;
- Trend;
- Seasonal components.
Модель была разработана для прогнозирования временных рядов с несколькими сезонными периодами. Например, ежедневные данные могут иметь как недельный, так и годовой компонент сезонности. Также и почасовые данные могут иметь несколько периодов: дневной, недельный или годовой. В рассматриваемом методе преобразование по методу Box-Cox применяется к исходному временному ряду, а затем он моделируется как линейная комбинация экспоненциально сглаженного тренда, сезонного компонента и компонента ARMA. Сезонные компоненты моделируются тригонометрическими функциями через ряды Фурье.
Модель ARIMA представляет собой обобщение модели авторегрессионного скользящего среднего и адаптируется к данным временных рядов для прогнозирования будущих точек. Модели ARIMA могут быть особенно эффективными в тех случаях, когда данные свидетельствуют о нестационарности.
Модель экспоненциального сглаживания (модель Хольта-Винтерса) является одним из методов прогнозирования с использованием экспоненциального сглаживания. Рассматриваемая модель применялась в работе [13]. Сглаживание состоит в создании взвешенного скользящего среднего, вес которого определяется по схеме: чем старше информация об изучаемом явлении, тем меньше значение для текущего прогноза.
Модель экспоненциального сглаживания ETS (M, A, N) реализована так, что в модели учитывается мультипликативная ошибка («M» на первой позиции), аддитивный тренд («A» на второй позиции) и сезонность («N» на третьей позиции) [13].
Theta (theta-метод) основан на концепции преобразования временного ряда с помощью некоторого коэффициента [14, 15]. Полученный ряд сохраняет среднее значение и тенденцию исходных данных, а не их отклонения. Такие ряды называются theta-рядами. Их основной качественной характеристикой является усовершенствование адекватности долгосрочной тенденции данных или увеличение краткосрочных характеристик, в зависимости от значения коэффициента. При применении данной модели исходный временной ряд представляется в виде двух и более theta-рядов. Прогноз делается отдельно для каждого ряда, а итоговый прогноз – это усредненное значение полученных значений.
Модель декомпозиции с сезонностью и трендом (STL) раскладывает временной ряд на сезонный компонент, объединенный тренд, циклический компонент и компонент «погрешности» [16].
Полиномиальная регрессия – это частный случай линейной регрессии, когда подбирается полиномиальное уравнение для данных с криволинейной зависимостью между целевой переменной и независимыми переменными [17].
Для объединения прогнозов использовался метод Грейнджера-Раманатхана с 3, 4 и 5 моделями для объединения. Для каждого объединения прогнозов в сравнении результатов прогнозирования указано свое название: Grandger-3, Grandger-4 и Grandger-5.
Для проведения эксперимента использовались временные ряды «Среднемесячная номинальная начисленная заработная плата работников по полному кругу организаций по субъектам Российской Федерации с 2013 года (по месяцам), рублей» для регионов РФ: ХМАО-Югра, ЯНАО, Свердловская область.
Результаты оценки качества прогноза частными методами прогнозирования и методом объединения прогнозов приведены в таблицах 1-3.
Таблица 1. Результат прогнозирования показателя по данным для ЯНАО
Горизонт прогноза | 12 месяцев | 18 месяцев | 24 месяца | ||||||
Модель | Оценки | Оценки | Оценки | ||||||
SMAPE | MAE | MdAE | SMAPE | MAE | MdAE | SMAPE | MAE | MdAE | |
ExpSmooth | 0.041 | 5459 | 3087 | 0.036 | 4516 | 2957 | 0.031 | 3973 | 2856 |
ETS | 0.064 | 8202 | 6553 | 0.042 | 5304 | 3776 | 0.043 | 5485 | 4520 |
Theta | 0.083 | 10929 | 10894 | 0.070 | 9014 | 7476 | 0.068 | 8775 | 8888 |
ARIMA | 0.086 | 10987 | 9240 | 0.045 | 5729 | 4512 | 0.050 | 6373 | 5329 |
Polinom | 0.082 | 10808 | 8922 | 0.087 | 11211 | 9000 | 0.095 | 11438 | 9873 |
STL | 0.057 | 7388 | 5783 | 0.041 | 5146 | 4175 | 0.038 | 4832 | 4093 |
TBATS | 0.049 | 6542 | 7410 | 0.062 | 7461 | 4008 | 0.049 | 5930 | 3662 |
Grandger – 3 | 0.028 | 3601 | 2072 | 0.038 | 4873 | 3439 | 0.033 | 4140 | 3211 |
Grandger – 4 | 0.032 | 4093 | 3749 | 0.036 | 4491 | 4090 | 0.031 | 4004 | 2761 |
Grandger – 5 | 0.030 | 3943 | 2733 | 0.035 | 4394 | 2454 | 0.030 | 3861 | 2360 |
Таблица 2. Результат прогнозирования показателя по данным для ХМАО-Югры
Горизонт прогноза | 12 месяцев | 18 месяцев | 24 месяца | ||||||
Модель | Оценки | Оценки | Оценки | ||||||
SMAPE | MAE | MdAE | SMAPE | MAE | MdAE | SMAPE | MAE | MdAE | |
ExpSmooth | 0,049 | 4939 | 4380 | 0,061 | 6030 | 3564 | 0,056 | 5418 | 3095 |
ETS | 0,059 | 5701 | 3196 | 0,068 | 6631 | 4195 | 0,061 | 5261 | 5254 |
Theta | 0,073 | 7194 | 5988 | 0,078 | 7578 | 6066 | 0,082 | 7805 | 4994 |
ARIMA | 0,048 | 4711 | 2313 | 0,077 | 7426 | 4304 | 0,068 | 6588 | 3947 |
Polinom | 0,109 | 10747 | 9137 | 0,095 | 9271 | 7674 | 0,098 | 8935 | 8122 |
STL | 0,053 | 5262 | 4136 | 0,068 | 6643 | 4429 | 0,066 | 6465 | 3647 |
TBATS | 0,042 | 4115 | 3500 | 0,051 | 4999 | 2865 | 0,057 | 5569 | 2631 |
Grandger – 3 | 0,038 | 3738 | 2450 | 0,049 | 4934 | 3231 | 0,053 | 5134 | 2986 |
Grandger – 4 | 0,031 | 3022 | 2031 | 0,045 | 4435 | 2771 | 0,043 | 4069 | 3015 |
Grandger – 5 | 0,038 | 3809 | 2323 | 0,054 | 5320 | 3360 | 0,047 | 4295 | 3993 |
Таблица 3. Результат прогнозирования показателя по данным для Свердловской области
Горизонт прогноза | 12 месяцев | 18 месяцев | 24 месяца | ||||||
Модель | Оценки | Оценки | Оценки | ||||||
SMAPE | MAE | MdAE | SMAPE | MAE | MdAE | SMAPE | MAE | MdAE | |
ExpSmooth | 0.017 | 941 | 602 | 0.052 | 2774 | 2435 | 0.054 | 2821 | 2812 |
ETS | 0.046 | 2505 | 2288 | 0.073 | 3853 | 3545 | 0.073 | 3843 | 3569 |
Theta | 0.051 | 2816 | 2731 | 0.080 | 4261 | 3958 | 0.091 | 4772 | 4295 |
ARIMA | 0.021 | 1136 | 875 | 0.065 | 3465 | 3546 | 0.068 | 3595 | 3107 |
Polinom | 0.047 | 2642 | 1835 | 0.048 | 2647 | 1762 | 0.053 | 2815 | 1972 |
STL | 0.046 | 2520 | 2703 | 0.091 | 4808 | 4317 | 0.080 | 4229 | 4148 |
TBATS | 0.022 | 1222 | 770 | 0.055 | 2941 | 2315 | 0.072 | 3743 | 3658 |
Grandger – 3 | 0.016 | 924 | 661 | 0.023 | 1173 | 912 | 0.035 | 1802 | 1550 |
Grandger – 4 | 0.013 | 707 | 556 | 0.016 | 878 | 367 | 0.036 | 1813 | 1397 |
Grandger – 5 | 0.020 | 1118 | 896 | 0.032 | 1776 | 932 | 0.025 | 1258 | 1086 |
Заключение и выводы
В статье приводится сравнение методов прогнозирования и метода объединения прогнозов Грейнджера-Раманатхана на примере прогнозирования показателя «Среднемесячная номинальная начисленная заработная плата работников по полному кругу организаций по субъектам Российской Федерации с 2013 года (по месяцам), рублей» для регионов РФ: ХМАО-Югра, ЯНАО, Свердловская область. Результаты сравнения показывают, что метод объединения прогнозов имеет более высокое качество прогнозирования, чем частные модели прогнозирования.
В статье применяется метод Грейнджера-Раманатхана без ограничения параметров, что не позволяет описать влияние каждой модели, входящей в объединение, на итоговый результат. Но в дальнейшем планируется рассмотреть метод Грейнджера-Раманатхана с ограничениями и линейную комбинацию объединения прогнозов.
About the authors
Mikhail A. Rusanov
Yugorsky Research Institute of Information Technologies
Author for correspondence.
Email: rusanovma@uriit.ru
Head of the Center for Information and Analytical Systems
Russian Federation, Khanty-MansiyskSergey N. Shergin
Yugra State University
Email: ssn@ugrasu.ru
Candidate of Physics and Mathematics, Associate Professor of the Department of Information Technology
Russian Federation, Khanty-MansiyskVitaliy M. Tatjankin
Surgut State University
Email: bambar@bk.ru
Candidate of Technical Sciences, Associate Professor of the Department of Information Technology
Russian Federation, Khanty-MansiyskReferences
- Xie, Y. Stock Market Forecasting Based on Text Mining Technology: A Support Vector Machine Method / Y. Xie, H. Jiang // Journal of Computers. – 2019. – V. 12, № 1. – P. 500–510. – doi: 10.17706/jcp.12.6.500-510.
- Tilly, S. Macroeconomic forecasting with statistically validated knowledge graphs / S. Tilly, G. Livan. – URL: https://arxiv.org/pdf/2104.10457.pdf (date of application: 08.12.2022).
- Wang, X. Forecast combinations: an over 50-year review / X. Wang, B.J. Hyndman, F. Li, Y. Kang. – URL: https://arxiv.org/pdf/2205.04216.pdf (date of application: 08.12.2022).
- Makridakis, S. The M4 Competition: 100,000 time series and 61 forecasting methods / S. Makridakis, E. Spiliotis, V. Assimakopoulos // International Journal of Forecasting. – 2020. – V. 36, № 1. – P. 54–74. – doi: 10.1016/j.ijforecast.2019.04.014.
- Макридакис Соревнования – Makridakis Competitions // Интернет-ресурс wiki. – URL: https://wikicsu.ru/wiki/Makridakis_Competitions (дата обращения 08.12.2022). – Текст : электронный.
- Makridakis, S. Statistical and Machine Learning forecasting methods: Concerns and ways forward / S. Makridakis, E. Spiliotis, V. Assimakopoulos // PLOS ONE. – 2018. – V. 27. – doi: 10.1371/journal.pone.0194889.
- Френкель, А. А. Сравнительный анализ методов построения объединенного прогноза / А. А. Френкель, Н. Н. Волкова, А. А. Сурков, Э. И. Романюк. – Текст : электронный // Вопросы статистики. – 2017. – URL : https://voprstat.elpub.ru/jour/article/view/535/488 (дата обращения 08.12.2022).
- Френкель, А. А. Использование методов гребневой регрессии при объединении прогнозов / А. А. Френкель, Н. Н. Волкова, А. А. Сурков, Э. И. Романюк. – Текст : непосредственный // Финансы: теория и практика. – 2018. – doi: 10.26794/2587-5671-2018-22-4-6-17.
- Сурков, А. А. Применение метода попарных сравнений при объединении экономических прогнозов / А. А Сурков. – URL: https://cyberleninka.ru/article/n/primenenie-metoda-poparnyh-sravneniy-pri-obedinenii-ekonomicheskih-prognozov/viewer (дата обращения 08.12.2022). – Текст : электронный.
- Сурков, А. А. Объединение экономических прогнозов с использованием экспертной информации / А. А Сурков. – URL: https://cyberleninka.ru/article/n/obedinenie-ekonomicheskih-prognozov-s-ispolzovaniem-ekspertnoy-informatsii/viewer (дата обращения 08.12.2022). – Текст : электронный.
- De Livera, A. M. Forecasting time series with complex seasonal patterns using exponential smoothing / A. M. De Livera, R. J. Hyndman, R. D. Snyder // Journal of the American Statistical Association. – 2012. – V. 106, № 496. – P. 1513–1527. – doi: 10.1198/jasa.2011.tm09771
- Hyndman, R. J. Forecasting: principles and practice / R.J. Hyndman, G. Athanasopoulos. – URL: https://otexts.com/fpp3/ (date of application: 19.04.2020).
- Иванов, С. А. Использование модели Хольта для прогнозирования изменения температурного режима в закрытом грунте / С. А. Иванов, И. Ю. Квятковская. – Текст : непосредственный // Вестник СГТУ – 2016. – Т. 82, № 1. – 4 с.
- Assimakopoulos, V. The theta model: a decomposition approach to forecasting / V. Assimakopoulos, K. Nikolopoulos // International Journal of Forecasting. – 2000. – V. 16, №4. – P. 521-530. – doi: 10.1016/S0169-2070(00)00066-2
- Hyndman, R. J. Unmasking the Theta method / R. J. Hyndman, B. Billah // International Journal of Forecasting. – 2003. – V. 19, №2. – P. 287-290. – doi: 10.1016/S0169-2070(01)00143-1
- Cleveland, R. B. STL: A Seasonal-Trend Decomposition Procedure Based on LOESS / R. B. Cleveland, W. S. Cleveland, J.E. McRae, I. Terpenning // Journal of Official Statistics. – 1990. – V. 6. – P. 3-73.
- Proietti, T. Real time estimation in local polynomial regression, with application to trend-cycle analysis / T. Proietti, A. Luati // The Annals of Applied Statistics. – 2009. – V. 2, №4. – P. 1523-1553. – doi: 10.1214/08-AOAS195.