
经济管理前沿
Frontiers in Economics and Management
- 主办单位:未來中國國際出版集團有限公司
- ISSN:3079-3696(P)
- ISSN:3079-9090(O)
- 期刊分类:经济管理
- 出版周期:月刊
- 投稿量:3
- 浏览量:486
相关文章
暂无数据
基于时间序列模型的X集团股价预测研究
Application of Time Series Models in Stock Price Forecasting for X Group
引言
股票价格预测是金融经济学与投资实践的核心议题。对投资者而言,精准预测是识别机会、优化配置和管理风险的关键。以X集团为例,其业务横跨智能手机、AIoT和智能电动汽车等多个前沿领域,其股价波动不仅是公司经营的晴雨表,更是市场评估中国高科技产业的重要风向标。然而,股价预测面临显著挑战。股市是一个受基本面、宏观政策、市场情绪及突发事件等多重因素交织影响的复杂系统,导致股价序列呈现出非平稳、非线性的高波动性特征。传统预测模型常存在参数不稳定、精度不足以及对噪声敏感等局限性,使得构建稳健可靠的预测模型异常困难。为应对上述挑战,本文选取了计量经济学中经典且应用广泛的时间序列分析模型作为研究方法。重点围绕AR(自回归)、MA(移动平均)、ARMA(自回归移动平均)及ARIMA(差分自回归移动平均)等模型,构建一套适用于X集团股价的专用分析框架。
本研究旨在通过严谨的实证建模,达成两个核心目标:一是深入探索这些传统统计模型在当今复杂金融市场中的实用价值与局限性;二是为金融时间序列分析的相关研究与课程教学提供一个完整、可操作的典型案例。
一、研究数据来源及清洗
本部分使用python编程语言中财经数据库akshare、matplotlib、pandas、numpy、scipy、statsmodels等库完成,由于X是港股上市公司,故使用财经数据库akshare中的港股历史数据接口stock_hk_daily_hfq_df获取X集团股票价格数据,该数据集包含日期(date)、开盘价(open)、最高价(high)、最低价(low)、收盘价(close)和成交量(volume)等数据,部分数据情况见表1所示。
| date | open | high | low | close | volume | |
|---|---|---|---|---|---|---|
| 0 | 2018-07-09 | 16.60 | 17.00 | 16.00 | 16.80 | 462182642 |
| 1 | 2018-07-10 | 17.00 | 19.34 | 17.00 | 19.00 | 534072218 |
| 2 | 2018-07-11 | 18.50 | 19.80 | 18.30 | 19.00 | 374721138 |
| 3 | 2018-07-12 | 19.40 | 19.70 | 19.02 | 19.26 | 132592630 |
| 4 | 2018-07-13 | 19.60 | 21.80 | 19.52 | 21.45 | 364065075 |
| ... | ... | ... | ... | ... | ... | ... |
| 1631 | 2025-02-24 | 52.20 | 52.35 | 51.05 | 51.60 | 208345620 |
| 1632 | 2025-02-25 | 49.80 | 53.90 | 49.80 | 53.20 | 332349383 |
| 1633 | 2025-02-26 | 54.25 | 56.80 | 53.10 | 56.30 | 395453828 |
| 1634 | 2025-02-27 | 56.60 | 58.70 | 51.40 | 53.10 | 842011809 |
| 1635 | 2025-02-28 | 55.75 | 55.75 | 50.65 | 51.85 | 667093154 |
注:1636 rows * 6 columns
进一步,绘制如图1所示的X集团的港股收盘价格指数图,可以发现X集团的股票价格是一个非平稳时间序列,故而接下来对该数据进行一阶差分和二阶差分,并且将原始数据(close)、股票价格涨跌率数据(rate)、一阶差分(closeDiff_1)和二阶差分(closeDiff_2)数据放在同一幅图(即图2)中进行对比,可以发现,在图2中股票价格涨跌率数据、一阶差分和二阶差分数据都是平稳数据。
二、数据自相关检验
为了保证后续使用数据的平稳性,进一步对数据进行自相关检验,计算自相关系数及p-value,相关结果见表2所示。从表2可以发现,P值显著小于0.05,故拒绝原假设,X集团港股收盘价格具有相关性,需要进行差分处理。
| lag | AC | Q | P-value |
|---|---|---|---|
| 1.0 | 0.990013 | 1604.467718 | 0.0 |
| 2.0 | 0.979571 | 3176.230755 | 0.0 |
| 3.0 | 0.967685 | 4711.021399 | 0.0 |
| 4.0 | 0.956910 | 6212.746211 | 0.0 |
| 5.0 | 0.946608 | 7683.212377 | 0.0 |
| 6.0 | 0.936043 | 9121.918668 | 0.0 |
| 7.0 | 0.926616 | 10532.659520 | 0.0 |
| 8.0 | 0.917151 | 11915.577467 | 0.0 |
| 9.0 | 0.907991 | 13271.844170 | 0.0 |
| 10.0 | 0.900566 | 14606.842057 | 0.0 |
三、AR模型
(一)AR模型的平稳性
本部分对AR模型的平稳性进行检验,检验结果如图3所示。进一步,画出AR模型的特征根进行检验,相关结果见图4所示。通过模型的平稳性检验和特征根可以发现,该数据是平稳时间序列。
(二)AR模型的定阶
本部分绘制时间序列数据的偏自相关函数(partial autocorrelation function,PACF)图,结果如图5所示。从图中可以发现,模型阶次在30阶以上。
(三)AR模型的检验
本部分计算模型的残差,画出模型的残差图,如图6所示。进一步计算出残差的自相关系数检验结果,见表3所示。通过以上检验可以发现,残差无自相关。
| lag | AC | Q | P-value |
|---|---|---|---|
| 1.0 | -0.002137 | 0.007429 | 0.931316 |
| 2.0 | 0.003310 | 0.025264 | 0.987447 |
| 3.0 | -0.001042 | 0.027031 | 0.998828 |
| 4.0 | 0.002416 | 0.036547 | 0.999835 |
| 5.0 | -0.001022 | 0.038251 | 0.999985 |
| 6.0 | -0.001967 | 0.044567 | 0.999998 |
| 7.0 | -0.004218 | 0.073616 | 0.999999 |
| 8.0 | -0.006565 | 0.144033 | 0.999999 |
| 9.0 | -0.000001 | 0.144033 | 1.000000 |
| 10.0 | -0.003189 | 0.160677 | 1.000000 |
(四)AR模型的预测
将原有样本分为训练集和测试集,使用AR模型进行预测,预测结果见表4所示。可以发现,使用简单的AR模型预测的效果不是很好,故进一步考虑使用更多时间序列模型进行预测。
| original | predict | |
|---|---|---|
| 0 | 0.010067 | -0.004658 |
| 1 | 0.071982 | 0.002227 |
| 2 | 0.021694 | 0.000685 |
| 3 | -0.006067 | 0.002799 |
| 4 | 0.051882 | 0.006151 |
| 5 | -0.001934 | 0.00888 |
| 6 | 0.031008 | -0.002224 |
| 7 | 0.058271 | 0.005007 |
| 8 | -0.056838 | -0.003637 |
| 9 | -0.023540 | 0.005538 |
四、MA模型的建立和预测
为了更加准确的对X集团的股票价格进行预测,进一步使用MA(移动平均)模型进行预测,预测结果见图7所示,根据图7的结果可知,虽然MA(移动平均)模型相比AR模型的预测有了更好的表现,但是仍然不够精准。故进一步考虑更多时间序列模型进行预测。
五、ARMA模型的建立和预测
为了更加准确的对X集团的股票价格进行预测,进一步使用ARMA模型进行预测,预测结果见图8所示,根据图8的结果可知,虽然ARMA模型相比前面的时间序列模型的预测有了更好的表现,但是仍然不够精准。故进一步考虑更多时间序列模型进行预测。
六、ARIMA模型的建立和预测
为了更加准确的对X集团的股票价格进行预测,进一步使用ARIMA模型进行预测并对时间序列数据进行单位根检验,检验结果见表5所示,表5的结果显示P值为0.9975,故时间序列是非平稳的。因此,接下来对原时间序列数据进行差分处理。
将经过差分处理后平稳的时间序列进行预测,预测结果见9所示,根据图9的结果可知,相对前面的预测结果,本部分的预测有了进一步提升。
| Value | |
|---|---|
| Test Statistic Value | 1.490964 |
| p-value | 0.997491 |
| Lags Used | 13 |
| Number of Observations Used | 1621 |
| Critical Value(1%) | -3.434391 |
| Critical Value(5%) | -2.863325 |
| Critical Value(10%) | -2.56772 |
参考文献:
- [1] 张思,刘叶,金浩.基于改进Ratio统计量的重尾AR(p)时间序列均值变点检验[J].统计与决策,2024,40(02):52-57.
- [2] 董红斌,韩爽,付强.基于AR与DNN联合模型的地理传感器时间序列预测[J].计算机科学,2023,50(11):41-48.
- [3] 吴波妮.基于时间序列模型的杭州市GDP预测[J].企业改革与管理,2019(23):212-213.
- [4] 叶静.基于贝叶斯的金融时间序列预测研究[J].滁州学院学报,2017,19(05):55-58.
- [5] 潘媛.时间序列分析在金融中的应用[J].经贸实践,2017(18):102.
