英文题目:Prediction of Urban Rail Transit Ridership under Rainfall Weather Conditions
中文题目:降雨天气条件下城市轨道交通客流量预测
论文作者:薛飞,姚恩建,郇宁,李斌斌,刘莎莎
论文期刊:Journal Of Transportation Engineering Part A-Systems
论文网址:https://www.sciencedirect.com/science/article/pii/S0264275122000646
摘要:现有研究表明,降雨对公交客流量有显著影响,而对城市轨道交通(Urban Rail Transit,URT)客流量的影响研究较少。本研究利用中国广州连续十三个月收集的每日和每小时城市轨道交通客流量以及降雨数据,探讨了降雨对城市轨道交通客流量的影响,并提出了一种在降雨条件下预测城市轨道交通客流量的方法,该方法通过背景客流量和受降雨影响客流量的总和计算。首先,采用季节性自回归综合移动平均(Seasonal Autoregressive Integrated Moving Average,SAIMA)模型预测背景客流量,然后,提出并利用支持向量回归(Support Vector Regression,SVR)模型估计降雨影响因子,最后,利用最后一个月的数据验证了所提方法的性能。结果显示,所提方法在每日和每小时城市轨道交通客流量预测中表现良好,为量化降雨对城市轨道交通客流量的影响提供了一种新的解决方案,使轨道交通管理者能够更好地理解降雨条件下的客流量变化并做出适当的反应。
关键词:降水量;地铁;客流量;自动收费数据;广州
城市轨道交通(Urban rail transit,URT)在短时间内为大量人员提供安全、便捷、舒适的出行方式,可以缓解城市交通拥堵。同时,城市轨道交通消耗更少的能源来运送更多的乘客,比私家车和公共汽车更环保,是城市交通系统非常重要的组成部分。世界各地,尤其是正在快速城市化的发展中国家的许多城市,建设并运营了大量的城市轨道交通,以满足客运需求并减少对私家车的依赖。准确的城市轨道交通客流预测有助于乘客规划出行方式、线路和出发时间,运营商合理分配运输能力并制定合理的服务时间表,公共机构管理交通投资并加强城市可持续发展。目前,很多学者对正常天气条件和特殊活动条件下的城市轨道交通系统客流预测进行了研究,也显著提高了预测精度。然而,针对恶劣天气条件,特别是阴雨天气条件,很少有学者对城市轨道交通系统的客流预测进行研究,且随着天气预报技术的发展,研究阴雨天气对城市交通系统客流的影响变得越来越重要。
有部分学者研究了降雨天气对私家车、公交车、自行车和地铁客流的影响,发现降雨是影响城市交通系统客流的一个重要天气因素。然而,现有的研究主要集中在发达国家的公交车客流量上,很少关注降雨对发展中国家城市轨道交通客流量的影响。其次,现有的大多数研究都集中在降雨对公共交通每日客流量的影响,很少有研究关注每小时的客流量。因此,研究降雨对发展中国家城市轨道交通客流量的影响具有重要意义。
本研究利用广州城市轨道交通系统入口客流数据和相应的降雨天气数据,分析非雨天和降雨条件下城市轨道交通客流量的分布情况,随后,本研究提出了一种通用计算方法,利用背景和受降雨影响的客流量之和来获得降雨天气条件下城市轨道交通的客流量。之后讨论了影响地铁日、小时客流量的降雨因素,并提出降雨影响因子来表明降雨对地铁背景客流量的实际影响。此外,还进行了降雨要素与相应降雨影响因子之间的相关性分析。基于季节性自回归综合移动平均(Seasonal Autoregressive Integrated Moving Average,SARIMA)模型,校准了降雨条件下日、小时背景客流量的预测模型,并利用支持向量回归(Support Vector Regression,SVR)模型估计了相应的降雨影响因子的预测模型。采用了多元线性回归(Multiple Linear Regression,MLR)模型来验证所提出的SVR模型的优越性,得到了降雨天气条件下的SARIMA+ML和SARIMA+SVR城市轨道交通客流量预测模型,并利用广州2016年7月的地铁客流数据和相应的降雨天气数据对模型的适用性和准确性进行了检验,通过进行相应的仿真,得到了较好的预测模型
根据从广州地铁自动收费系统(获取的客流量数据,发现在无雨天气条件下,城市轨道交通的客流量具有较强的规律性,同一时段和同一天的客流量分布相对一致。然而,这种客流量分布会受到降雨的影响而改变,以2015年11月16日至12月20日广州地铁入口客流为例,图1展示了从7:00到8:00的客流量情况。图表显示,12月3日、4日和9日的7:00到8:00降雨对客流量产生了显著影响。由于在非雨天,城市轨道交通客流量的分布具有较强的规律性,而降雨显著打破了这种规律性,因此本文提出,在特定时间粒度下,受降雨影响的城市轨道交通预测客流量可以通过背景客流量和受降雨影响的客流量的总和来获得。
图1 广州地铁小时客流量图
式中,VF:在某一时间粒度下的预测客流量,表示降雨天气条件下城市轨道交通客流量的预测值,单位为人次;
VB:背景客流量,表示不受降雨影响的客流量,并考虑了URT客流量的内在趋势和季节变化,单位为人次;
VI:受降雨影响的客流量,表示受降雨影响的客流量,单位为人次;
RIF :降雨影响因子,表示降雨对城市轨道交通客流的实际影响程度,单位为%。
因此,在降雨天气条件下,可分三步实现某一时间粒度的城市轨道交通客流预测:第一步是预测背景客流量,第二步预测其降雨影响因子,第三步将前两步得到的值进行组合,得到最终的预测结果。
在探索影响城市轨道交通客流量的降雨因素或预测降雨天气下的客流量时,首先需要预测背景客流量,由于SARIMA模型具有捕捉客流量数据趋势性和周期性特征的优势,在预测公交客流量时,其表现优于其他模型,如随机游走、线性回归、支持向量回归(Support Vector Regression,SVR)、历史平均和简单自回归综合移动平均模型(Autoregressive Integrated Moving Average,ARIMA ).本文采用如表1所示的SARIMA模型来预测URT背景客流:
在获得降雨天气条件下的城市轨道交通背景客流量的基础上,利用公式计算了广州地铁2015年7月6日至2016年6月30日的日降雨影响因子和小时降雨影响因子.
式中,VR :实际客运量,表示降雨天气下城市轨道交通实际客运量,单位为人次。
考虑了降水量、降雨持续时间、趋势、间隔和发生时间等要素,并在表2中定义了以下变量。
关于日降雨影响因子,认为日降雨量、降雨发生时间、日降雨持续时间均有影响。对于小时降雨影响因子,本文假设只要一天有降雨发生,这一天的无雨时刻的小时客流量也会受到降雨的影响;也就是说,滞后冲击的影响时间将长于三个小时。每小时降雨量、区间指标、雨量方差趋势、日降雨量、每日降雨持续时间均预期会影响城市轨道交通交通小时降雨影响因子。
表1 城市轨道交通背景客流量预测模型
表2 降雨影响因子预测模型变量的定义
相关性分析:
利用广州地铁2015年7月6日至2016年6月30日的日降雨影响因子和小时降雨影响因子及相应的降雨要素数据,采用相关分析法进行分析。具体地,如图2所示,分别计算了日降雨影响因子与相应的日降雨量、日降雨持续时间和降雨发生时刻之间的相关性。同时,分别计算小时降水影响因子与对应的每小时降水量、区间指标、降水方差趋势、日降水量、日降水持续时间的相关关系,如图3所示
日降雨影响因子与日降雨量、日降雨持续时间、降雨发生时间O1、降雨发生时间O2呈负相关,相关系数分别为-0.420、-0.604、-0.323、-0.014。日降雨影响因子与降雨发生次数O3、O4、O5呈正相关,相关系数分别为0.071、0.191、0.278。
类似地,小时降雨影响因子与小时降水量、降雨方差趋势、日降水量和日降雨持续时间呈负相关,相关系数分别为?0.176、?0.370、?0.286和?0.404。小时降雨影响因子与时间间隔指标之间存在正相关关系,系数为0.349。日降雨影响因子与降雨发生时间O2和O3的相关系数过低,表明降雨发生时间O2和O3与日降雨影响因子之间的相关性非常差。因此,影响日、小时降雨影响因子的降雨要素可以分别如下表达 :
式中::日降雨影响因子,单位为%;
:小时降雨影响因子,单位为%。
城市轨道交通客流量的降雨影响因子预测可视为一个数学映射问题。自变量 表示一定时间粒度下的降雨天气状态,因变量表示对应的轨道交通客流的降雨影响因子,对于降雨天气状态向量和降雨影响因子,可以考虑映射f,使得
这种映射关系可以辅助确定降雨天气条件对城市轨道交通客流量的影响,实现城市轨道交通客流量的精准预测,本研究构建支持向量回归(Support Vector Regression,SVR)模型来探索映射关系。
图2 日降雨量影响因子与相应潜在自变量的散点图:(a)日降雨量影响因子与日降雨量;(b)日降雨影响因子和日降雨历时;(c)日降雨影响因子和降雨发生时间O1;(d)日降雨影响因子和降雨发生时间O2;(e)日降雨影响因子和降雨发生时间O3;(f)日降雨影响因子和降雨发生时间O4;(g)日降雨影响因子和降雨发生时间O5。
图3 小时降水影响因子与相应潜在自变量的散点图:(a)小时降水影响因子与小时降水量;(b)小时雨量影响因子及区间指标;(c)小时雨量影响因子和雨量方差变化趋势;(d)小时降水影响因子和日降水量;(e)小时降雨影响因子和日降雨历时
支持向量回归(Support Vector Regression Model,SVR)
支持向量回归是一种非常流行的机器学习算法,可以有效地解决非线性问题。SVR算法旨在寻找一个最优的分类平面,使得来自于曲面的所有训练样本的误差最小,将一定时间粒度下的一对降雨状态向量和降雨影响因子作为训练数据集,其中d维降雨状态列向量为输入,一维降雨影响因子为输出。SVR旨在找到一个回归函数,它可以通过准确地使用相应的输入变量来预测未来的输出变量。该函数需要满足如下方程:
式中:w :权重向量;
B :偏差项;
:核函数
流行的核函数包括线性核函数、多项式核函数、径向基函数(Radial Basis Function ,RBF)核函数和Sigmoid核函数。由于径向基函数核函数相对易于实现,建模过程简单以及计算效率高,考虑到本研究的变量向量样本量小、维度高,因此本文采用了RBF核函数。此外,本研究还采用了五折交叉验证策略和简单的网格搜索算法的组合来获取最佳的超参数。
基于日、小时城市轨道交通背景客流量预测模型和相应的降雨影响因子预测模型,得到降雨天气条件下的日、小时城市轨道交通客流量预测模型
式中:VFD :预测日客流量,单位为人次;
VBD :预测的每日背景客流量,单位为人次;
VID :预测日受降雨影响的客流量,单位为人次
式中:VFH :预测日客流量,单位为人次;
VBH :预测的每日背景客流量,单位人次;
VIH :预测日受降雨影响的客流量,单位人次
广州是中国大陆第三大人口城市,总面积为7434平方公里,人口为2015万,2018年的日均城市轨道交通客流量为835.4万人次。广州属于亚热带季风气候,年平均气温较高,约为22°C,雨水资源丰富。平均年降水量超过1800毫米,年降水日数约为150天,雨季为4月至9月。城市轨道交通的日、小时客流量以及相应的降雨天气数据是两个主要数据来源,客流量数据基于广州地铁AFC系统获取。在本研究中,从2015年7月6日到2016年7月31日期间,收集了全网136个站点,13个月的URT站点的每日和小时入口客流数据,某个时间粒度的站点客流量被定义为该站点在这个时间粒度内的入口客流总和,广州地铁网络的分布如图4所示。
图4 广州地铁线路网
广州市的降雨天气数据是从广州气象台获取的,时间跨度和时间粒度与客流量数据相同,降雨数据是按小时收集的,可以获得降雨发生时刻、小时降水量和降雨变化的信息,并计算每日降水量和每日降雨持续时间,研究期间降雨天数和相应的每日降水量分布如图5所示。
图5 降雨日数和日降水量数据
为了探索相同的降雨天气条件是否在工作日和周末对城市和郊区城市轨道交通站点客流量产生相同的影响,本研究分别建立和测试了每日和小时的未分类和分类预测模型,包括整体站点的每日预测模型、工作日城市站点预测模型、周末城市站点预测模型、工作日郊区站点预测模型以及周末郊区站点预测模型。为了验证所提出的SVR模型在预测日降雨影响因子和小时降雨影响因子方面的优越性,选用了多元线性回归(Multiple Linear Regression,MLR)模型作为比较方法。
在研究期间,选择了实际的每日和每小时客流量数据以及相应的降雨数据作为的数据集。其中,从2015年7月6日到2016年6月30日期间的数据被用作构建每个预测模型的训练样本,而从2016年7月1日到2016年7月31日期间的数据则被用作验证每个模型性能的测试样本。国家假期的雨天和假期后的第二天不包括在本研究的研究范围内。因此,共有129天的雨天被选中,其中有92天是工作日,37天是周末。因此,对于每个工作日模型,训练集涵盖了79天的雨天数据,测试集涵盖了13天的雨天数据。同时,每个周末模型的训练集有31天的雨天数据,测试集有6天的雨天数据。利用拟合优度(R-square)和均方根误差(RMSE)来评估每个SVR和MLR预测模型的学习样本的准确性,计算方法如下所示:
式中::降雨影响因子实际值,单位为%;
:降雨影响因子预测值,单位为%;
:实际降雨影响因子平均值,单位为%。
表3列出了各降雨影响因子SVR和MLR预测模型训练集的R方检验结果。根据表3和表4,考虑到空间分布和时间的差异后,分类模型的平均R方和加权平均RMSE均有所改善。同时,每日和每小时的SVR分类预测模型的平均R方分别为0.880和0.800,而每日和每小时的MLR分类预测模型的平均R方分别为0.603和0.426。同时,每日和每小时的SVR分类预测模型的平均RMSE分别为0.0140和0.0256,而每日和每小时的MLR分类预测模型的平均RMSE分别为0.0290和0.0500。
表3 降雨影响因子预测模型训练集的R方检验结果
表4 降雨影响因子预测模型训练集的RMSE检验结果
由上表可看出,降雨影响因子SVR模型具有较高的拟合精度。
将日、小时背景客流量预测模型和相应的分类降雨影响因子预测模型进行集成,得到降雨天气条件下的日、小时城市轨道交通客流SARIMA+SVR和SARIMA+MLR预测模型。计算模型的预测结果,并记录预测精度。采用平均绝对百分比误差( MAPE )指标检验预测模型预测结果的准确性。计算公式如下:
分别计算了SARIMA+SVR和SARIMA+MLR预测模型的日和小时MAPEs,SARIMA + SVR预测模型的日、小时平均绝对百分比误差分别为1.600%和3.868%,而SARIMA+MLR预测模型的日、小时平均绝对百分比误差分别为1.808%和4.305%。通过训练集的相关系数和RMSE以及测试集的MAPE,得出SARIMA + SVR预测模型具有更广泛的适用性和更高的预测精度,在日预测和小时预测上表现更优的结论。多雨天气下的城市轨道交通客流,预测结果如图6和7所示。
图6 实际日客运量与SARIMA+SVR预测日客运量的等值线图
图7 实际小时客流量与SARIMA+SVR预测小时客流量的等值线图
为了理解每个日降雨状态因素如何影响城市轨道交通客流量,并验证相同降雨条件对客流量的空间分布和时间上的差异,利用所提出的每日降雨影响因子预测模型进行了一系列仿真实验。对于给定的每日降雨状态,假定通过所提出的模型计算每日降雨影响因子,以量化降雨对客流量的影响。
输入数据是一系列假设值,表示不同降雨条件的降雨状态要素,在MATLAB 2016a软件中进行,仿真结果是相应的每日降雨影响因子,如图8和图9所示。
图8 日降雨影响因子预测的模拟
图9 日降雨影响因子预测Ⅱ的模拟:( a )对日降雨量0~50mm、降雨历时为0~17 h、降雨开始于早峰的日降雨影响因子进行分类预测;( b )未分类日降雨影响因子预测的日降雨量为0~30mm,降雨历时为3h,降雨开始时间为前峰、后峰、傍晚
对每日客流量的降雨影响的仿真揭示了以下结果:
1.每日降水量和每日降雨持续时间对客流量有负面影响,并且它们对客流量的影响不是线性的。
2.降雨对周末的客流量影响较大,对郊区站点的影响也比城市站点更为显著。
3. 发生在早高峰的相同降雨量对日客流量的影响比发生在晚高峰和晚高峰的相同降雨量对日客流量的影响更明显。
观测到日降水量为10mm、降雨历时为5h、降雨开始于早高峰的日降雨影响因子为-4.682%。由于2018年广州地铁日均客流量为835.4万人次,这10mm的降雨使日均客流量减少了391134人次。由于平均出行距离为11.24 km,平均票价为3.810元/人,日票收入减少了1490220.54元。相同的降雨量对工作日和周末以及对市区和郊区站点影响不同的原因可能是周末出行者占可自由支配出行的比例较高。此外,郊区的城市轨道交通线路密度相对较低,乘客有更大的可能性暴露在降雨中,从而取消出行或转移到其他交通方式。降雨对小时客流量影响的仿如图10和图11所示。
小时降水量、降水变化趋势、日降水量和日降水持续时间对小时客流量有负向影响。此外,降雨对小时客流量的影响随着时间间隔的变长而减小。鉴于这些发现,本研究可以帮助城市轨道交通管理者在阴雨天气下合理地制定运营计划,包括列车调度、车辆调度和乘务员调度计划
图10 小时降雨量影响因子(%)
本文基于2015年7月至2016年7月广州地铁AFC系统获取的日客流量和小时客流量数据以及广州市气象观测站获取的相应降雨天气数据,提出了一种可利用背景客流量和受降雨影响的客流量之和计算的降雨天气条件下城市轨道交通客流量预测方法。日降水量、降雨历时和降雨发生时刻对城市轨道交通日客流量均有影响。具体而言,日降水量和降雨历时具有负向影响,且相同的降雨在早高峰开始的影响比晚高峰更显著。同时,发现小时降水量、区间指标、小时降水量方差趋势、日降水量和日降水持续时间影响小时客流量。小时降水量、降水方差趋势、日降水量和降水持续时间具有负向影响,当前时刻与降雨开始时刻之间的较长时间间隔对当前小时客流量的影响较弱。此外,本文还发现降雨对周末的影响大于工作日的影响,对郊区的影响大于市区。
据此,提出了一种在雨天下的城市轨道交通客流量预测模型(SARIMA+SVR)以及一个比较模型(SARIMA+MLR)。具体而言,根据SARIMA模型,校准了降雨天气条件下的每日和每小时背景客流量预测模型,并分别利用SVR和MLR模型估计了相应的降雨影响因子预测模型。通过利用2016年7月广州地铁的每日和每小时客流量以及相应的降雨天气数据作为测试数据,分别测试了所提出的SARIMA+SVR和SARIMA+MLR预测模型。结果表明,SARIMA+SVR预测模型的每日和每小时客流量的MAPE分别为1.600%和3.868%,表明提出的模型具有很高的预测精度和良好的适用性,能够满足降雨天气条件下URT客流量的短期预测需求。
仿真发现,在广州地铁的运营中,每日降水量为10毫米、降雨持续时间为5小时、降雨开始于早高峰时段时,将使每日客流量减少391,134人次,每日票务收入减少1,490,220.54人民币,这表明降雨有显著的影响。本研究可以帮助城市轨道交通管理者定量了解降雨对客流量的影响,为降雨条件下城市轨道交通的合理运营提供技术支持。