基于多任务学习与时空特征的共享单车供需联合预测模型

王子豪

当前位置：首页 > 科学研究与应用 > 基于多任务学习与时空特征的共享单车供需联合预测模型

科学研究与应用

Journal of Scientific Research and Applications

主办单位:
未來中國國際出版集團有限公司
ISSN:
3079-7071（P）
ISSN:
3080-0757（O）
期刊分类:
科学技术
出版周期:
月刊
投稿量:
5
浏览量:
645

基于多任务学习与时空特征的共享单车供需联合预测模型

Joint Prediction Model for Bike-Sharing Supply and Demand Based on Multi-Task Learning and Spatiotemporal Features

发布时间：2026-03-31

作者: 王子豪 :大连理工大学辽宁大连;

摘要: 共享单车作为城市交通系统的重要组成部分，主要服务于居民短途出行以及城市“最后一公里”接驳问题。针对共享单车供需时空不平衡及现有单任务预测的问题，本文提出一种基于多任务学习与时空特征的联合预测模型。首先利用注意力时空图卷积网络提取非欧空间下的动态时空特征；其次结合多门控混合专家网络架构，自适应分配专家权重以协同优化借还车双任务。实验结果表明，该模型能有效提升供需联合预测精度，为共享单车调度提供科学依据。

Abstract: As an important component of urban transportation systems, bike-sharing primarily serves residents' short-distance travel and addresses the "last mile" connection issue in cities. Addressing the spatiotemporal imbalance between supply and demand of bike-sharing and the existing problem of single-task prediction, this paper proposes a joint prediction model based on multi-task learning and spatiotemporal features. Firstly, an attention spatiotemporal graph convolutional network is utilized to extract dynamic spatiotemporal features in non-Euclidean space. Secondly, a multi-gated hybrid expert network architecture is combined to adaptively allocate expert weights for collaborative optimization of the bike-sharing and bike-returning dual tasks. Experimental results show that the model can effectively improve the accuracy of joint supply and demand prediction, providing a scientific basis for bike-sharing scheduling.

关键词: 共享单车；供需联合预测；多任务学习；时空图卷积网络；注意力机制

Keywords: bike-sharing; joint supply and demand forecasting; multi-task learning; spatiotemporal graph convolutional network; attention mechanism

引言

共享单车最初诞生于二十世纪六十年代，作为一种新型的绿色出行方式，代表了绿色出行、智慧城市建设与共享经济理念的完美结合，其具有低碳、便捷、可持续发展的特点。共享单车的出现有效地解决了用户出行“最后一公里”问题，同时为全球各大城市的交通拥堵、环境污染问题提供了新的应对思路。特别是在国家“双碳”政策的推动的背景下，共享单车在城市交通结构中的作用愈发凸显。

共享单车系统经历多年发展，目前还是存在一些问题的，例如无序停放、单车损坏/故障、单车供需不平衡等问题。共享单车供需不平衡，既包括空间上的不平衡，也包括时间上的不平衡。针对此问题，对共享单车运营和管理进行深入的研究与规划变得尤为必要。从需求层面，需要准确掌握共享单车实时停车情况的信息，量化各站点区域实时取车/还车需求。从供给层面，运营方提供相匹配的共享单车搬运服务。通过优化单车时空分布、完善调度和搬运机制，企业可以进一步提升共享单车服务的便利性和覆盖范围，推动共享单车在城市交通中的持续健康发展。

1 国内外文献综述

数据预测在调度中起到至关重要的作用，是共享单车系统运营与管控的核心技术与数据支撑之一。共享单车数据预测研究领域，目前积累了相对丰富的研究内容，根据其研究方法的划分，基本上可以分成三类：传统统计学模型、传统机器学习与深度学习。

传统统计学模型注重于对数据进行深入的推断分析，注重于共享单车使用的因果关系的识别和结果的解释。Rixay提出了针对共享单车站点级预测的多元回归模型，研究基于不同共享单车系统的运营数据，确立了一些与共享单车流量显著相关的变量。Tran在前者基础上对共享单车站点级多元回归模型进一步细化，将研究构建的环境变量限定于站点周围300m缓冲区范围内，挖掘了变量在不同使用时间段以及不同用户类型中的异质性。Chen等认为站点的聚类应该考虑时间、天气、社会和交通事件等因素的影响，提出了一种基于动态集群的过度需求预测框架。Zhang将对共享单车系统的预测问题转换为针对共享单车系统的个人出行预测问题，提出了GBRT与Lasso回归模型进行量化描述与预测。

随着支持向量机等机器学习方法成为学者们的关注热点，该类方法也被应用到了交通预测领域。Cui针对地铁接驳共享单车问题，重点研究了地铁站附近共享单车数量的推荐，并将车站的出站客流量作为潜在需求进行研究。焦志伦在共享单车基于每小时的短时预测研究中，对比了套索回归、岭回归、随机森林和迭代决策树等机器学习模型，结果显示随机森林和迭代决策树模型对共享单车短期即时需求预测的结果更精确。王立进一步对比了GBDT、随机森林和BP神经网络，并证明了BP神经网络在共享单车预测中精度水平相对更高。

深度学习模型由于利用人工神经网络作为基础，能够更好地应对海量数据和复杂任务，将预测模型的精度带入到一个新的高度。从共享单车数据时序特点出发，Chen针对共享单车站点级预测，提出一个基于递归神经网络进行站点级别的需求预测，结果表明MAE和RMSE值在车站层面是令人满意的。为提高时序特征提取能力，并解决RNN记忆消散问题，Xu提出了长短时记忆神经网络模型 LSTM 用于共享单车需求的短时预测，在交通小区尺度单点的预测任务上取得了较好的精度结果。Yi在LSTM模型基础上，进一步提出一个捕捉共享单车运营时空特征的卷积循环神经网络模型Conv-LSTM用于预测任务，并证明预测精度优于单时序建模的LSTM。Yang从数据特征工程角度出发，基于真实共享单车数据集提取用于描述站点图结构与流量交互的时滞变量，同时将其作为深度神经网络模型的输入并进行短期共享单车需求预测，证明了基于图结构的特征分析方法在共享单车研究中的有效性，帮助更好理解其需求分布特征并建模。Li提出了一个STG2Vec模型用于学习异构时间图的特征，同时引入动态自注意力机制用于矢量化表示，最终实现有竞争力的共享单车预测精度。Guo考虑共享单车站点之间的联系建立图结构，并在这基础上提出了时空图卷积神经网络ST-GNN预测各站点的单车需求，模型最终较基准模型取得约13%的精度提升。Chen基于共享单车轨迹数据对无桩模式下的虚拟站点进行聚类识别，在此基础上构建加权有向图结构，同时提出GGNN模型进行需求预测。

根据现有研究可以看出针对共享单车供需预测的研究中，各种传统方法在预测精度上存在不足，一些深度学习方法虽然较好地捕捉了数据重要特征，但是存在冗余参数较多，计算规模较大的问题。

2供需预测建模方法

本章详细阐述了供需联合预测模型的原理。通过引入 ASTGCN 的时空双重注意力机制，模型能够动态识别站点间的空间关联与时间重要性；结合MMoE的多门控机制，同时解决共享单车供给需求两个预测任务在时空分布上的异质性问题。

2.1 模型整体架构概述

针对共享单车系统中取车需求与还车供给在时空分布上的高度关联性与异质性，本研究构建了一种基于多门控混合专家网络与注意力时空图卷积网络的联合预测模型——MMoE-ASTGCN模型。

该模型的核心逻辑在于利用MMoE框架的“多门控”机制，自适应地在多个ASTGCN专家网络中提取共享的时空特征，同时为供、需两个不同的预测任务分配特定的权重，以解决传统单任务学习模型难以平衡供需错位的问题。如图1所示，模型主要由输入层、多任务混合专家层、门控网络层以及任务特定塔层组成：

图1共享单车供需联合预测模型

输入层：模型接收三类历史序列数据作为输入，分别定义为邻近时刻序列、日周期序列及周周期序列，以捕捉不同时间跨度下的流量规律。同时，模型还可以引入天气特征及日期标签作为外部辅助特征。

专家层：由多个并行的ASTGCN模块组成。每个模块包含空间注意力机制、时间注意力机制以及时空卷积块，负责提取不同时间维度的深层时空特征。

门控网络：针对取车需求与还车供给两个预测目标，分别设置独立的门控函数。该机制允许模型根据当前输入状态，动态调整每个专家对不同任务的贡献权重，从而实现任务间的特征解耦与信息补充。

任务塔：每个任务配备一个全连接网络，将门控加权后的复合特征映射到最终的预测空间，输出未来时刻的供给量与需求量。

2.2 专家模型

注意力机制(AM)是机器学习中的一种数据处理方法，源于对人类视觉的研究。注意力机制可以帮助模型自动关注输入序列中的关键信息，通过赋予特征向量不同的权重，提高模型的预测性能。专家模型采用ASTGCN模型，该模型通过集成注意力机制与图卷积操作，解决了传统模型难以捕获动态时空演化规律的问题。

2.2.1 时空注意力机制

为刻画共享单车站点间随时间波动的相互影响，模型首先通过时空注意力机制对输入特征进行加权。在不同的时间片下，站点流量的影响力不同。时间注意力机制旨在自动发现历史序列中对当前预测更有贡献的时间点。

其计算公式为：

其中，, , , 均为可学习参数。所得时间注意力矩阵用于调整输入特征的时间重要性分布。

站点间的空间依赖是动态变化的。空间注意力机制通过建模站点间的相关性，动态调整邻接矩阵权重：

其中动态反映了站点间的实时关联强度。

2.2.2 时空卷积模块

时空卷积模块是专家模型的核心部分，包含空间卷积和时间卷积两个部分。在获得注意力权重后，模型进入时空卷积阶段。空间维度上，采用图信号处理中的切比雪夫多项式近似图卷积，结合动态空间注意力矩阵：

时间维度上，利用标准时间轴上的卷积核捕捉时序演化特征。

2.3 多门控混合专家联合架构

2.3.1 混合专家配置

多任务学习旨在设置多个相关联的任务，利用任务之间的传递共享以挖掘数据的潜在特征，主要依赖于底层专家模型的共享。关联特征设有个ASTGCN专家。每个专家可能关注不同的历史跨度（如近期、日周期、周周期）。第个专家的输出记为。

2.3.2 多门控选择机制

对于借车任务（D）和还车任务（S），分别设置门控网络和。门控网络根据输入特征决定各专家的权重：

2.4 损失函数

为了实现端到端的参数优化，模型采用联合损失函数，由借车预测任务损失、还车预测任务损失以及正则化项组成：

其中，为平衡供需任务重要性的超参数，为权重衰减系数。

3 数值分析

本节设置数值实验以验证所提方法的有效性。

3.1订单数据预处理

本文使用的数据为美国纽约市花旗共享单车Citi bike的订单数据。Citi bike是美国最大的共享单车计划，形式为有桩式共享单车，目前存在不同收费标准，包括单次、日票和年度会员。数据从2013年开始，地理空间包括曼哈顿、布鲁克林、皇后区等多数城市中心地带。官网提供的数据为初步处理过的数据，删除工作人员在维修和检查系统时进行的行程、往返任何“测试”站的行程，以及任何长度低于60秒的行程。

本文提取了数据量较大的曼哈顿地区作为研究对象，时间范围限制在2023年1月份，共计超百万条数据与超过700个站点。

3.2 时空特性分析

3.2.1共享单车每日订单量分布

图22023年1月曼哈顿地区共享单车日需求分布图

通过对订单数据进行处理，得到了整个曼哈顿地区2023年1月共享单车出行的日需求分布。如图2所示，整体上，该月的共享单车订单总量有110万左右。曼哈顿地区全天的共享单车出行量有一定周期性，从2023年1月1日（元旦，周日）起到1月3日（假期结束），整个地区的共享单车出行数量呈平稳态势，直到1月4日（周三），共享单车订单明显增多，后续每一周都有类似的出行规律。造成这种现象的原因可以从多个方面去理解：纽约市的共享单车订单情况受到冬季天气、节后恢复、联邦政策(马丁·路德·金纪念日)等的共同影响。

3.2.2共享单车小时订单量分布

图32023年1月曼哈顿地区共享单车订单量按小时的分布状况图

该图以一天24小时为时间轴，分别统计了周一到周日曼哈顿地区共享单车订单量按小时的分布状况。从图3可以发现，曼哈顿共享单车需求在工作日与周末呈现显著差异，反映了城市功能与人群行为的动态变化。

在工作日，夜晚需求量呈现逐渐下降的态势，整体保持极低水平。白天时段具有明显的早高峰期和晚高峰期，这种潮汐效应是曼哈顿居民的上下班需求导致的。在之后的夜间时段，整体需求量呈现递减的态势。到了非工作日，共享单车的出行需求与工作日呈现出不同的态势。周末的共享单车需求呈现平缓的状态，白天的需求量要明显高于工作日，说明居民开始进入白天的娱乐消费活动。到了傍晚时段，共享单车需求量开始下滑，这说明共享单车作为低速短途出行方式，不能满足居民夜间社交娱乐活动的全部需求。

3.2.3共享单车订单量空间分布

对订单数据的空间分布特征分析需要分别选取工作日与周末的不同时段，在曼哈顿城区上绘制该地区共享单车订单开始量(需求)与结束量(供给)的热力图，以此进行空间特性分析。

图42023年1月工作日早高峰订单开始/结束热力图

如图4所示，曼哈顿城区工作日早高峰时段，整个地区共享单车订单达到了峰值，以中央公园为界，订单的开始与结束主要集中在曼哈顿岛南部。其中几乎绝大多数订单都在中城核心区开始或结束，该区域是曼哈顿经济与旅游的核心区域，有多个跨国公司总部聚集。

图52023年1月工作日晚高峰订单开始/结束热力图

如图5所示，曼哈顿城区工作日晚高峰时段，整个地区共享单车订单达到了新的峰值，且由共享单车订单量按小时的分布规律可知：该时段的峰值要高于早高峰时段。与早高峰时段类似，大多数订单的开始与结束主要集中在曼哈顿岛南部。订单的开始与结束分布情况与早高峰相对，呈现“潮汐回流”模式。早高峰订单开始对应晚高峰订单结束，早高峰订单结束对应晚高峰订单开始，这揭示了曼哈顿城区居民工作地点与公共交通站点的方向性。

图62023年1月周末全天订单开始/结束热力图

如图6所示，曼哈顿城区周末全天时段，整个地区共享单车订单变化平缓，大体上反映了居民周末对共享单车的使用情况。整体上，需求的分布较为分散，供给的分布较需求而言更为集中。

3.3站点聚类

通过总结已有研究和本实验所用的数据特征，由于站点数量较多，不利于图数据构建，为了先一步验证模型的有效性，本文选择使用k-means算法进行站点聚类。

使用方差比指数来进行k-means算法中的k值选择。方差比指数的本质是簇间离散度和簇内离散度的比值。当方差比指数为最大值时，说明类别之间协方差最大，k值选取效果最优，分类效果最好。图7展示的是k值取0到50范围内，方差比指数的具体数值。

图7 方差比指数计算

当k=33，方差比指数最大。根据计算结果使用k-means算法将站点分为33个簇。最终的聚类效果如图8所示。

图8 k-means算法划分小区结果

3.4预测结果分析

3.4.1 数据构建与参数设置

依据模型的结构，利用聚类后的站点进行模型输入数据的前期建立工作，分为两个部分，时空图数据构建与动态时序数据提取。首先是时空图数据构建，用于反映聚类站点的初始静态邻接矩阵。加载聚类站点，依据距离阈值构建邻接矩阵作为图数据输入。然后是动态时序数据提取，包括对应时间步内所有聚类站点的供给需求情况。本研究选取小时时间粒度，2023年1月一共可以划分出744个时间步，并对特征进行归一化。

将其中前576个时间步的数据作为训练集，后168个时间步的数据作为验证集。实验基于PyTorch深度学习框架实现，batch size设为32，学习率设置为0.001，最大训练轮数为100，为防止过拟合，引入早停策略，当验证集损失在连续20轮内未下降时终止训练。

3.4.2 模型性能分析

为了全面评估MMoE-ASTGCN模型在共享单车供需预测中的性能，本研究选取回归分析中常用的两个评价指标：MAE和RMSE。

MAE用于衡量预测值与真实值之间残差的绝对值平均数，其对预测误差的反映较为直观。RMSE是误差平方和平均后的算术平方根，能更有效地反映模型预测的稳定性。具体计算公式如下：

最终模型预测情况如表1所示。

表1站点供给需求预测效果对比

模型	站点供给预测		站点需求预测
模型	MAE	RMSE	MAE	RMSE
ARMIA	34.4971	49.1175	35.8365	50.2634
HA	15.3475	25.5829	14.9352	25.3251
GRU	9.5083	15.4979	8.9494	14.2637
LSTM	9.1406	14.7625	8.4863	13.5190
STGCN	6.7445	11.3919	6.1482	12.0593
ASTGCN	5.1710	10.7223	4.5834	10.1704
MMOE-ASTGCN	4.0520	10.0752	3.7895	9.8933

实验结果表明，本文所提MMoE-ASTGCN模型对共享单车取车与还车需求的预测性能优于全部基准模型。

4结论与展望

本文针对共享单车系统中取车需求与还车供给在时空分布上的高度关联性与异质性，同时平衡“取车”与“还车”双任务，提出了一种结合多门控混合专家网络与注意力时空图卷积网络的联合预测模型。引入ASTGCN作为专家网络，利用时空注意力机制动态捕捉站点间随时间变化的关联强度，结合切比雪夫图卷积有效提取了非欧几里得空间下的拓扑特征。创新性地应用MMoE架构，通过门控网络自适应地为供需两个任务分配专家权重。这不仅实现了底层时空特征的共享，还有效缓解了多任务学习中常见的“跷跷板现象”，使得模型能够同时精准预测供给量与需求量。基于美国纽约市花旗共享单车Citi bike的订单数据，实验结果表明：本文提出的模型在MAE和RMSE指标上均取得了最优表现，证明将时空图卷积与多任务学习相结合，能够更准确地捕捉共享单车供需的非线性动态变化，证明了该方法在解决时空异质性问题上的有效性。

本文未来研究可从以下几个方面进行深化与拓展：本文主要考虑了历史订单数据、时间特征与基础气象数据，未来可以引入更多维度的外部变量，例如POI分布数据、实时道路交通拥堵指数等。本文为模型计算简易采用了聚类算法，未来的工作可以尝试直接在站点级别构建大规模图神经网络。本文的研究止步于对未来供需数量的预测，未来可以将MMoE-ASTGCN模型的预测输出作为输入，构建“预测—调度”一体化框架。

参考文献：

[1] DeMaio P. Bike-sharing: History, impacts, models of provision, and future[J]. Journal of public transportation,2009,12(04):41-56.
[2] Yu Q, Xie Y, Li W, et al. GPS data in urban bicycle-sharing: Dynamic electric fence planning with assessment of resource-saving and potential energy consumption increasement[J].Applied energy,2022,322.
[3] Shui C S, Szeto W Y. A review of bicycle-sharing service planning problems[J]. Transportation research part C: emerging technologies,2020,117:102648.
[4] Rixey R A. Station-level forecasting of bikesharing ridership[J].Transportation Research record journal of the transportation research board,2013,2387(01):46-55.
[5] Tran T D, Ovtracht N, D'Arcier B F. Modeling bike sharing system using built environment factors[J].Procedia CIRP,2015,30:293-298.
[6] Chen L, Zhang D, Wang L, et al. Dynamic cluster-based over-demand prediction in bike sharing systems[C]// UbiComp2016 - Proceedings of the2016 ACM International Joint Conference on Pervasive and Ubiquitous Computing.2016.
[7] Zhang J, Xiao P, Li M, et al. Bicycle-sharing system analysis and trip prediction[J].IEEE,2016:174-179.
[8] Cui Y, Lv W, Wang Q, et al. Usage demand forecast and quantity recommendation for urban shared bicycles[C]//2018 International Conference on Cyber-Enabled Distributed Computing and Knowledge Discovery (CyberC).2019.
[9] 焦志伦,金红,刘秉镰,等.大数据驱动下的共享单车短期需求预测——基于机器学习模型的比较分析[J].商业经济与管理,2018(08):11.
[10] 王立. 基于机器学习的共享单车需求量预测模型研究[D].长安大学,2019.
[11] Chen P C, Hsieh H Y, Sigalingging X K, et al. Prediction of Station Level Demand in a Bike Sharing System Using Recurrent Neural Networks[C]//IEEE Vehicular Technology Conference.2017.
[12] Xu C, Ji J, Liu P. The station-free sharing bike demand forecasting with a deep learning approach and large-scale datasets[J].Transportation research part C:emerging technologies,2018,95:47-60.
[13] Yi A, Li Z, Mi G, et al. A deep learning approach on short-term spatiotemporal distribution forecasting of dockless bike-sharing system[J]. Neural computing and applications,2019,31(39):1-13
[14] Yang Y, Heppenstall A, Turner A, et al. Using graph structural information about flows to enhance short-term demand prediction in bike-sharing systems[J]. Computers environment and urban systems,2020,83:101521.
[15] Guo R, Jiang Z, Huang J, et al. BikeNet: Accurate Bike Demand Prediction Using Graph Neural Networks for Station Rebalancing[C]//2019 IEEE SmartWorld, Ubiquitous Intelligence & Computing, Advanced & Trusted Computing, Scalable Computing & Communications, Cloud & Big Data Computing, Internet of People and Smart City Innovation (SmartWorld/SCALCOM/UIC/ATC/CBDCom/IOP/SCI).2020.
[16] Chen J, Li K, Li K, et al. Dynamic planning of bicycle stations in dockless public bicycle-sharing system using gated graph neural network[J].ACM transactions on intelligent systems and technology,2021,12(02).

科学研究与应用

Journal of Scientific Research and Applications

相关文章

基于多任务学习与时空特征的共享单车供需联合预测模型

Joint Prediction Model for Bike-Sharing Supply and Demand Based on Multi-Task Learning and Spatiotemporal Features

引言

1 国内外文献综述

2供需预测建模方法

2.1 模型整体架构概述

2.2 专家模型

2.2.1 时空注意力机制

2.2.2 时空卷积模块

2.3 多门控混合专家联合架构

2.3.1 混合专家配置

2.3.2 多门控选择机制

2.4 损失函数

3 数值分析

3.1订单数据预处理

3.2 时空特性分析

3.2.1共享单车每日订单量分布

3.2.2共享单车小时订单量分布

3.2.3共享单车订单量空间分布

3.3站点聚类

3.4预测结果分析

3.4.1 数据构建与参数设置

3.4.2 模型性能分析

4结论与展望

参考文献：