
科学研究与应用
Journal of Scientific Research and Applications
- 主办单位:未來中國國際出版集團有限公司
- ISSN:3079-7071(P)
- ISSN:3080-0757(O)
- 期刊分类:科学技术
- 出版周期:月刊
- 投稿量:4
- 浏览量:386
相关文章
暂无数据
基于TCN-GRU-Attention的机场延误预测
Airport Delay Prediction Based on TCN-GRU-Attention
引言
我国经济腾飞带动民航迅猛发展,航班量与旅客激增,航班延误频发,推高航司成本、扰乱机场秩序。延误预测技术通过挖掘历史数据,提前获知延误时长,可帮旅客合理安排行程,减少不满;助航司降低重排与运营成本;亦助机场优化资源、提升调度效率。
学界已展开大量研究,方法分网络与机器学习两大方向:网络模型侧,邵荃用复杂网络量化延误波及,吴薇薇以贝叶斯网络刻画航班间延误传播并用马尔科夫链预测机场状态,Bin Yu用深度信念网络提取关键因子减小误差,王春政构建Agent机场网并用贝叶斯估计参数;统计模型侧,周覃用K-means聚类机场繁忙程度再结合决策树建模,Jacquillat将动态容量模型融入策略队列揭示延误对容量敏感,谷润平引入气象因子使预测指标显著改善。机器学习侧,吴仁彪提出双通道CNN和Spark并行化框架融合航迹与气象数据,李晓霞把K-means与贝叶斯网络结合,陈昱君用自编码器改进BP网络并在浦东数据验证。
鉴于机器学习能自适应挖掘数据关联,本文选用TCN-GRU-Attention模型预测机场延误,其核心是把“机场-时间”双维耦合拆为“短时波动-长时依赖-关键节点”三步:先用TCN替代RNN完成首层时序编码,再在GRU隐状态上显式叠加空间-时间双注意力,实现机场拓扑与延误序列的端到端联合学习,提升预测准确性。
1 数据获取
1.1 数据收集
机场延误预测通常依赖历史航班数据作为基础,包括航班号、计划起降时间、实际起降时间、延误时长、航空公司、机型、航线等信息;同时还需收集气象数据,如能见度、风速、降水、气温等气候因素,这些对航班运行有直接影响。通过对多源异构数据的整合与清洗,为机场延误预测模型提供丰富、可靠的输入基础。
1.2 数据预处理
对航班数据进行必要特征数据缺失的删除,如“航班号、注册号,降落机场”。删除起降机场为国外机场的航班数据;航班延误时间大于6小时,则判定该航班发生异常情况,删除;对天气数据METAR报文进行转换,对于数值型特征采用和机场属于相同的处理方式整理后直接保存使用,字符串型数据采取catboost编码方式进行编码。
航班的延误存在明显的地域特征,例如华东和华北地区是我国航班延误状况最严重的地区,不同地域的气候特征对航班延误的影响各异,同时不同地区的空域管理模式和效率也会影响航班延误。因此对所选数据按照我国民航七大地区进行划分以增强预测的准确度,如表1所示。
| 地区 | 四字码前两位字母 | 主要机场及四字码 |
|---|---|---|
| 华北地区 | ZB | 北京首都国际机场(ZBAA) |
| 东北地区 | ZY | 沈阳桃仙国际机场(ZYTX) |
| 华东地区 | ZS | 上海浦东国际机场(ZSPD) |
| 中南地区 | ZG | 广州白云国际机场(ZGGG) |
| 西南地区 | ZU、ZP | 成都双流国际机场(ZUUU)、昆明长水国际机场(ZPPP) |
| 西北地区 | ZL | 西安咸阳国际机场(ZLXY) |
| 新疆地区 | ZW | 乌鲁木齐地窝堡国际机场(ZWUQ) |
根据《航班正常管理规定》文件,将平均延误时间定义为某时段所有航班延误总时间与该时段内航班数的比值。将目标机场的进港时间序列和关联七大地区机场到达目标机场的延误时间序列作为延误预测的特征变量;以半小时间隔统计该时段内目标机场的进港航班数量和平均进港延误;统计相同时段目标机场的离港平均延误时间为目标变量,预测目标机场半小时的平均离港延误。
1.3 特征提取
对历史数据进行预处理,进而提取与预测目标相关性高的特征。本文结合LightGBM面对大量复杂特征数据的优势,在航班延误数据的大量特征中选出关联度较高的特征,增强后续预测的准确性。对于每个特征,LightGBM会计算该特征在模型中所有分裂的增益和分裂次数,增益越高,特征的分裂次数越多,该特征越重要。通过这两个评估值,LightGBM可以自动为每个特征打分,增益是在分裂树的每个节点上计算,计算每个特征的贡献。对于一个给定的分裂,增益计算公式为:
(1)
其中:样本的梯度(损失函数的一阶导数);:样本的二阶导数;left,right:分裂后的左子集和右子集;:正则化参数,防止过拟合。
2 模型构建
2.1 TCN-GRU-Attention模型
基于TCN、GRU和注意力机制三个部分构建TCN-GRU-Attention组合网络模型,在GRU网络前加入TCN网络,可有效地对输入的历史航班数据进行降维,同时捕捉到更广泛的时序依赖关系。通过引入Attention机制可实现对输出内容权值的自动计算与分配,进一步提高预测精度,并使得模型能够自适应地聚焦于输入序列中的关键部分,提升对复杂时序数据的预测能力,将三部分融合构建出机场延误预测模型。模型简易图如下所示,主要包括5个步骤(图1)。
步骤1:对原始机场延误数据进行归一化操作,确保不同特征具有相似的数值范围,避免量纲差异对模型训练的影响。将归一化后的数据集按8:2划分为测试集和训练集。
步骤2:将训练集数据输入至时间卷积网络(TCN)中,用于提取时间序列特征。TCN能够通过卷积操作处理长时间依赖关系,捕捉机场延误相关的时间动态特征。
步骤3:将经过TCN处理后的特征数据输入到门控循环单元(GRU)模型中,GRU可以更好地捕捉时间序列中的长期依赖关系,进行机场延误时间的初步预测。
步骤4:在GRU模块输出的特征基础上,引入注意力机制,重新计算并分配各时间步的特征权重。注意力机制可以帮助模型关注到对延误预测至关重要的时间步,提升模型的预测准确性。
步骤5:在模型预测完成后,对预测结果进行反归一化操作,将预测值恢复至原始数据尺度,以便与实际值进行对比。
2.2 评价指标
评价指标涵盖RMSE(均方根误差)、MAE(平均绝对误差)、MSE(均方误差),用于衡量模型性能及预测值与真实值之间的误差大小,其中表示真实值,表示预测值。
(2)
(3)
(4)
3 实验分析
3.1 数据样本及特征选取
本文使用首都机场某年3-10月份通航数据,主要包括起飞机场、降落机场、计划起飞时间、实际起飞时间、计划降落时间、实际降落时间等;天气数据选取以北京首都机场为站点观测到的同时间天气情况数据,数据特征包括风向、风速(m/s)、阵风(m/s)、能见度(m)、天气现象等。经1.2所述数据处理方式,对原始数据进行特征提取处理,部分结果如下所示。将处理得到的数据输入特征选取模型,结果如图所示,最终得到包含15个数据特征的有效数据11634条(图2,表2)。
| 特征 | 样例 | 特征 | 样例 | 特征 | 样例 |
|---|---|---|---|---|---|
| ZBAA离岗航班数量 | 7 | 西北 | 29 | 新疆 | 33 |
| 华东 | 7 | 东北 | 14 | 星期 | 3 |
| 中南 | 22 | 时段 | 1 | 能见度 | 5000 |
| 西南 | 13 | 华北 | 23 | 风向 | 360 |
| ZBAA进港平均延误 | 6 | ZBAA进港航班数量 | 2 | 阵风 | 8 |
3.2 实验流程
本文基于融合注意力机制的TCN-GRU模型。将实验数据按照8:2划分为训练集和测试集输入模型,每一条输入数据有15项特征信息。look_back和T设置为10与1,意味着使用过去10个时间步的数据来预测下一个时间步的输出。TNN模块设置两层,卷积核数量为64,第一层的卷积核大小为3,膨胀率为1,第二层卷积核大小相同,膨胀率设置为2,失活率0.2;GRU共有两层,隐藏层神经元个数都为32;激活函数选用RELU;从隐含层提取输出特征,运用注意力机制对输出张量进行整合,生成融合后的数据特征表达式,进而输入全连接层;全连接层神经元数目为1,激活函数为Sigmoid;经过激活函数处理后得到输出结果。模型优化过程采用随机目标函数优化算法Adam。在训练过程中进行模型参数更新,默认初始学习率为0.001,batch⁃size设定为128,迭代次数1000次。损失函数图像如图3所示。
3.3 实验结果
为了分析评估模型性能,选取单一TNN、TCN-GRU、LSTM以及本文模型进行对比实验,按照相同比例的训练集和测试集,采用相同的误差参数进行衡量,由于所得到的误差值属于同一量纲,不存在单位,仅作为一种评价依据,故可通过直接对比误差数值的大小来判定各模型的优劣。表3是不同模型预测结果误差的对比情况。
| 模型 | MAE | RMSE | MSE |
|---|---|---|---|
| LSTM | 11.446 | 15.049 | 226.472 |
| TCN | 9.837 | 12.705 | 161.417 |
| TCN-GRU | 9.241 | 12.583 | 158.332 |
| TCN-GRU-Attention | 8.566 | 12.095 | 146.284 |
从上可以看出TCN-GRU-Attention复合网络结合特征筛选的预测模型在各项误差评价指标均低于其他对比模型,预测表现效果最好。基础的LSTM模型结构较为简单,但由于缺少卷积神经网络对数据的特征抽象提取,其准确性依然不够理想。单一GRU模型虽然适用于提取具有时序特征的延误数据集,但对于复杂机场网络结构中的局部空间关联特征挖掘能力不够充分,会导致延误预测准确率会有所下降。而TCN-GRU-Attention模型表现效果优于TCN-GRU模型,在引入Attention机制后,通过赋予关键特征更高的权重,同时减少冗余信息的权重,从而降低了无效信息对延误预测计算的影响,模型的性能得到了进一步提升。为了更加直观地看出本文预测模型的实际性能,选取部分时间节点的首都机场延误预测值作对比,如图4所示。
4 结语
本文提出了一种基于时间卷积网络(TCN)与门控循环单元(GRU)结合注意力机制与特征提取的模型应用于机场延误预测,结果显示相较于LSTM、TCN、GRU、TCN-GRU模型,本文预测模型的MAE、RMSE、MSE分别为8.566、12.095、146.284均小于其他对比模型,展现出了更强的预测性能,具备较强的适应性和容错能力,能够在复杂的航空运输环境中有效模拟非线性关系。通过预测机场延误,机场和航空公司可优化调度、提高运营效率、减少额外费用,提升客户满意度。同时,预测延误有助于改进安全管理、有效利用资源,并提高航班准点率。但该方法在训练过程中需要对多个学习参数进行反复调优,当面对数据量较少的情况时,模型的学习能力和预测效果可能会受到限制。因此,未来的研究可以集中在优化模型结构和训练流程,以提高其在各种场景下的工作效率和预测精度。
参考文献:
- [1] 邵荃,朱燕,贾萌,等.基于复杂网络理论的航班延误波及分析[J].航空计算技术,2015,45(04):24-28.
- [2] 吴薇薇,孟亭婷,张皓瑜.基于机场延误预测的航班计划优化研究[J].交通运输系统工程与信息,2016,16(06):189-195.
- [3] Yu B, Guo Z, Asian S, et al. Flight delay prediction for commercial air transport: A deep learning approach[J].Transportation research part E,2019,125:203-221.
- [4] 王春政,胡明华,杨磊,等.基于Agent模型的机场网络延误预测[J].航空学报,2021,42(07):452-465.
- [5] 周覃,高强,马农,等.基于聚类分析和CHAID决策树算法的航班延误预测研究[J].理工大学学报,2017(11):32-40.
- [6] Jacquillat A, Odoni A R. Endogenous control of service rates in stochastic and dynamic queuing models of airport congestion[J].Transportation research part E,2015,73:133-151.
- [7] 谷润平,来靖晗,魏志强.基于灰色GA-BP神经网络的航班延误预测方法[J].计算机仿真,2022,39(05):38-43+59.
- [8] 吴仁彪,李佳怡,屈景怡.基于双通道卷积神经网络的航班延误预测模型[J].计算机应用,2018,38(07):2100-2106+2112.
- [9] 吴仁彪,李佳怡,屈景怡.融合气象数据的并行化航班延误预测模型[J].信号处理,2018,34(05):505-512.
- [10] 李晓霞,吴薇薇,韩东,等.基于聚类与贝叶斯网络的航班离港延误预测模型[J].哈尔滨商业大学学报(自然科学版),2020,36(01):110-113+120.
- [11] 陈昱君,孙樊荣,沐瑶,等.离港航班延误时间预测方法[J].科学技术与工程,2022,22(15):6354-6361.
- [12] Rumelhart D, Hinton G E, Williams R J.Learning representations by back-propagating errors[J].Nature,1986,323:533-536.
- [13] 徐纪伟,李亚飞,文刚飞,等.我国机场和航空公司延误率时空特征及变化规律分析[J].交通技术,2021,10(03):119-133.
- [14] Chaudhari S, Polatkan G, Ramanath R,et al. An attentive survey of attention models[J].ACM transactions on intelligent systems and technology,2021,12(05):3465055.
