
亚太教育创新
Innovations in Asia-Pacific Education
- 主办单位:未來中國國際出版集團有限公司
- ISSN:3079-3661(P)
- ISSN:3079-9503(O)
- 期刊分类:教育科学
- 出版周期:月刊
- 投稿量:1
- 浏览量:412
相关文章
暂无数据
基于组合模型对中国人均GDP的预测
Forecasting China' s Per Capita GDP Based on the Combined Model
引言
人均国内生产总值(GDP)作为评估一个国家或地区经济发展状况的关键指标,能够直观反映经济总量的增长情况以及居民平均生活水平的改善情况。随着全球经济一体化的加深和各国经济结构的变化,人均GDP的变化趋势成为了经济学研究和政策制定的重要参考。因此,对人均GDP进行科学预测,不仅有助于政府部门制定合理的经济政策,也能为企业投资布局提供参考依据。学术界关于人均GDP的预测,常用的方法是由Box和Jenkins(1970)提出的求和自回归移动平均模型(ARIMA)模型。如李娜和薛俊强(2013)、严彦文(2018)等多位学者基于该模型对不同地区GDP进行了有效预测。为提升预测精度,后续研究转向组合预测模型,例如ARIMA-GMDH模型、DVR-SARIMA模型等,这些模型通过融合单一模型优势,显著降低了预测误差。基于此,本文基于1952—2024年中国人均GDP数据,分别建立ARIMA与Holt模型,并构建两种组合预测模型进行拟合与比较,旨在通过模型性能对比选取最优预测模型,从而对未来中国人均GDP做出可靠预测。
一、模型构建
(二)Holt两参数指数平滑法
Holt两参数指数平滑法主要针对具有线性趋势但不具有季节性特征的时间序列进行预测。该方法基于加法模型,将时间序列拆分为水平部分和趋势部分,并使用两个参数对序列数据进行平滑处理。其核心包括两个步骤:一次平滑和二次平滑。首先对原始数据进行加权平均,得到趋势的初步估计,一般采用加权平均的方法来平滑数据,减弱随机波动的影响。其次,对一次平滑后的结果再进行加权平均,进一步提炼趋势信息,获得更准确的趋势估计。若时间序列呈现较为稳定的线性递增或递减趋势,通常可表示为以下形式:
(三)组合预测模型
组合预测模型是将多个单一预测模型的结果进行合理整合,有效减弱了单一模型在建模过程中受到的随机因素影响,从而提升模型的预测性能。ARIMA预测模型主要针对平稳序列进行预测,Holt两参数指数平滑法考虑了趋势变化,但可能过度预测长期趋势且对参数敏感,为了整合各模型的优势,我们计划构建组合预测模型。基于已建立的ARIMA模型与Holt模型,通过合理确定两模型的权重来建立组合预测模型。然而有众多方法确定权重,不同的方法会得到不同的权重,进而导致不同的预测效果。综合考虑预测性能,本研究选用了方差倒数法和残差倒数法作为权重分配的主要策略,以期获得更优的预测表现。
(四)模型评价指标
模型评价是建模过程中至关重要的环节,不仅决定模型的选择与优化方向,还直接影响模型在实际应用中的有效性和可靠性。因此,开展系统的模型评价尤为重要。为了科学合理地比较不同模型的预测性能,并建立统一的衡量标准,本文选取了均方根误差(RMSE)、平均绝对误差(MAE)、平均绝对百分比误差(MAPE)以及相关系数(R)四个指标作为模型性能的评价依据。若数据集中有N个样本,真实值为
,预测值为
,则各评价指标的计算公式如下:
二、实证分析
(一)数据来源
本文选取我国1952—2024年的人均GDP数据作为研究对象,此数据来源于Wind资讯及国家统计局官方网站。利用Python绘制了人均GDP数据的时序图见图1。从图1观察到人均GDP整体呈现持续上升的趋势,且未表现出明显的周期性波动。2000年以后,增长速度明显加快,但在2020年出现了异常波动,该年人均GDP增长明显缓慢。为了提高模型预测的稳定性和普适性,本文采用2019年和2021年人均GDP数据的均值替代了2020年的异常值。将该数据划分为两部分,其中将1952—2019年的人均GDP数据作为训练集,用于模型的构建与训练;2020—2024年的人均GDP数据则作为验证集,用来检验模型的预测效果及泛化能力。
(二)ARIMA模型的建立与预测
1. 平稳化处理
| t-Statistic | Prob | |
|---|---|---|
| ADF test statistic | -3.5656 | 0.0065 |
| Test critical values:1% level | -3.5369 | |
| 5% level | -2.9079 | |
| 10% level | -2.5915 |
接着,为了确定该序列是否具有随机性特征,对一阶差分序列进行白噪声检验,为后续建模提供依据,检验结果见表2。通过表2可以直观地看到,在各延迟阶数下,LB(Ljung-Box)统计量的值所对应的P值均显著偏小,代表此序列不具备白噪声的统计特性,说明此序列属于非白噪声序列,进而可建立相应的ARIMA模型对其进行分析。
| 延迟阶数 | LB统计量的值 | p-value |
|---|---|---|
| 1 | 26.4112 | 2.75935e-07 |
| 6 | 48.0515 | 1.15398e-08 |
| 12 | 60.5167 | 1.81695e-08 |
2. 模型识别与定阶
| 延迟阶数 | LB统计量的值 | p-value |
|---|---|---|
| 1 | 0.0649 | 0.7988 |
| 2 | 0.1251 | 0.9394 |
| 3 | 0.1252 | 0.9887 |
| 4 | 0.1263 | 0.9981 |
3. Holt两参数指数平滑法预测
(四)组合预测模型
(五)预测
本文建立ARIMA(3,1,0)、Holt两参数指数平滑模型、组合模型Ⅰ、组合模型Ⅱ,分别对2020—2024年我国人均 GDP(共5个数据)进行预测,其预测值如表4示,可以看出本文提出的组合模型Ⅰ和组合模型Ⅱ的预测结果与原人均GDP数据最接近,这说明该模型的预测性能最好。
| 年份 | 真实值 | ARIMA | Holt 两参数平滑指数 | 组合模型Ⅰ | 组合模型Ⅱ |
|---|---|---|---|---|---|
| 2020 | 77282 | 80114.2762 | 76465.6748 | 78881.4138 | 77547.8500 |
| 2021 | 83111 | 84168.4811 | 81473.2043 | 83257.7471 | 82272.6234 |
| 2022 | 87385 | 87874.9490 | 86480.7338 | 87403.8437 | 86894.2580 |
| 2023 | 91746 | 91282.6130 | 91488.2633 | 91352.1022 | 91427.2674 |
| 2024 | 95749 | 94419.7308 | 96495.7928 | 95121.2321 | 95880.0328 |
通过文中的四种模型评价指标进行量化分析,以便更全面地比较各模型的预测性能。根据式(7)-(10)分别计算ARIMA模型、Holt模型、组合模型Ⅰ及组合模型Ⅱ的MSE、MAPE、RMSE和R2,比较结果见表5。从结果可以看出,在四种模型评价指标中,组合模型均优于单一模型,且组合模型Ⅱ的各项指标最佳,RMSE为0.0048,R2到达了0.9946,说明组合模型在综合了ARIMA模型与Holt模型的优势以后,预测人均GDP的精度明显提高。同时,证实不同的权重系数对组合模型的预测精度有一定的影响,组合模型Ⅱ的各项指标均优于组合模型Ⅰ,如 MAPE 提升了0.191%。
| 模型评估指标 | ARIMA模型 | Holt模型 | 组合模型Ⅰ | 组合模型Ⅱ |
|---|---|---|---|---|
| MSE | 2272357.8379 | 958117.3280 | 625852.4341 | 226627.8544 |
| MAPE | 1507.4342 | 978.8347 | 791.1084 | 476.0545 |
| RMSE | 0.0148 | 0.0102 | 0.0067 | 0.0048 |
| R2 | 0.9456 | 0.9771 | 0.9850 | 0.9946 |
根据上述模型评价分析,选取组合模型Ⅱ预测我国2025—2030年人均GDP,预测结果见表6。结果表明,未来六年我国人均GDP稳步增长,但从增长速度上看,略有下降。
| 年份 | 2025 | 2026 | 2027 | 2028 | 2029 | 2030 |
|---|---|---|---|---|---|---|
| 预测值 | 100253.1493 | 104549.3434 | 108773.7300 | 112931.4247 | 117027.2225 | 121065.9326 |
| 增长率 | 0.0618 | 0.0429 | 0.0404 | 0.0382 | 0.0363 | 0.0345 |
三、结论
为了提升人均GDP预测的准确性,本文基于ARIMA模型与Holt模型,分别利用方差倒数法和残差倒数法来确定各单一模型的权重系数,建立不同的ARIMA-Holt组合预测模型。通过文中选取的四项评价指标对各模型的预测效果综合对比,可得出组合预测模型的预测效果明显优于两个单一模型,由此可以说明组合模型能够提高模型的预测精度。值得注意的是,不同的权重分配方法对预测效果存在显著影响,其中基于残差倒数法的组合预测模型优于基于方差倒数法的组合预测模型。本文基于组合预测模型Ⅱ,进一步预测了2025—2030年的我国人均GDP发展趋势,结果显示我国人均GDP将在未来数年内保持稳健且快速的增长态势。
参考文献:
- [1] Janacek G. Time series analysis forecasting and control[J].Journal of Time Series Analysis,2010,31(04):303-303.
- [2] 李娜,薛俊强.基于最优ARIMA模型的我国GDP增长预测[J].统计与决策,2013(09):23-26.
- [3] 严彦文.基于ARIMA模型的山东省GDP的分析与预测[J].数学的实践与认识,2018(04):285-292.
- [4] 刘星辰,冯长焕.基于ARIMA模型分析四川省GDP[J].时代经贸,2020(05):98-101.
- [5] Zhou Z Y, Ou O T. Forecast and Research on GDP of Fujian Province Based on Time Series Analysis[J].Statistics and Applications,2020,09(03):439-447.
- [6] 胡咏琪.ARIMA模型在陕西省GDP预测中的应用研究[J].中国商论,2021(13):174-176.
- [7] 肖丹.基于ARIMA模型的四川省GDP分析与预测[J].生产力研究,2023(10):62-66.
- [8] 尹静,何跃.基于ARIMA-GMDH的GDP预测模型[J].统计与决策,2011(05):35-37.
- [9] 许金炜.基于虚拟变量回归与SARIMA组合模型的GDP预测[J].统计与决策,2016(24):38-41.
- [10] 张敏,党耀国.基于小波变换的组合预测模型在南京市GDP预测中的应用[J].数学的实践与认识,2018(07):111-118.
- [11] 孙彩云,刘翔宇.基于动态组合模型对河北省人均GDP的预测研究[J].数理统计与管理,2022(02):254-263.
- [12] 刘罗曼.时间序列分析中指数平滑法的应用[J].沈阳师范大学学报(自然科学版),2009(04):416-418.
- [13] 张青山.基于组合预测的广西GDP预测研究[D].广西师范大学,2023.
- [14] 魏思宇.基于时间序列模型对我国GDP的预测[D].山东大学,2022.
