论文题目:Spatiotemporal influence of built environment on intercity commuting trips considering nonlinear effects(考虑非线性效应的建成环境对城际通勤出行的时空影响)
论文作者:李义罡1,姚恩建1*,刘莎莎2,杨扬1,2
论文期刊:Journal of Transport Geography
论文网址:https://www.sciencedirect.com/science/article/pii/S0966692323002168
摘要:理解城际通勤的发生和吸引对于估计城际出行需求、支持交通服务的改善、促进城际协同发展具有重要意义。尽管大量研究调查了城际通勤的特征,但现有文献对城际通勤与建成环境之间关系的研究仍然有限。本研究提出了一种利用多源数据来定量分析建成环境对城际通勤的影响的可行方法。本文对天津到北京的通勤出行进行实证研究。结果表明,与传统模型相比,同时考虑了空间异质性和非线性的模型具有最高的预测精度。此外,就业密度对城际通勤吸引力的影响最大,而初等和中等教育服务显著促进了城际通勤的发生。我们提出的模型、发现和讨论为决策者提供了参考基础,并为区域性规划做出了贡献。
关键词:城际通勤出行,建成环境,技术路线,空间异质性,非线性效应
进入21世纪以来,中国高速交通基础设施迅速发展。随着高铁网络的不断完善,其在减少出行时间方面的优异表现为个体提供了更加灵活的就业机会,显著刺激了包括通勤在内的长距离出行需求。这种变化带来了一个城市的通勤区域从传统的都市圈向其他城市延伸的趋势,并进一步改变了大区域城市群的结构。这种新的现象就引出了城际通勤是如何产生的这一最基本的问题。 既有研究大多是从全局角度进行考虑,认为地区间的经济发展水平、房价、就业供给规模等建成环境是形成城际通勤的主要原因。但是由于空间相关性的存在,出行与建成环境之间的关系应当是具有空间异质性的。相比于全局回归模型,局部回归模型能够在参数估计中体现空间异质性,更好地拟合真实世界,从而为决策提供更准确的信息。
此外,传统的通勤研究方法通常假设建筑环境与通勤出行之间存在线性关系,而最新的研究发现,建筑环境与城市内出行之间的关系事实上是非线性的。其次,城际通勤会受到两个城市的建成环境的影响,这些因素使得城际通勤的建成环境表现出与城内通勤不同的空间异质性和非线性特征。
为了解决以上问题,我们利用从天津到北京的一个月的城际通勤数据,探讨了城际通勤出行与建筑环境之间的复杂关系。本研究主要有以下三方面贡献:
提出了一种基于大规模手机信令数据的方法,可以识别并获取城际通勤全过程的时空信息。该方法打破了不同城市和交通系统之间车票数据无法关联的限制,获得准确的城际通勤数据。
提出了一个同时考虑了空间异质性和非线性效应的分析建成环境影响的框架,揭示了建成环境对城际通勤出行的影响机制。
分别考虑了不同城市的建成环境对城际通勤出行吸引力和产生的影响。
本研究调查了中国北京和天津之间的城际通勤出行。北京是中国的首都,人口2180万,城市总面积12187平方公里。天津毗邻北京,城市人口1370万,城区面积4334平方公里。由于地理位置接近,两座城市共同构成了中国北方最大的大都市区。截至2019年,两市已由一条城际高铁和6条高速公路连接起来,进一步推动了两市一体化进程。下图显示了北京和天津的研究区域,分别有1081个和633个交通小区,覆盖了两个城市的大部分建成区。
图1 研究区域
本文使用的手机信令数据由三部分组成:手机记录、基站信息记录、脱敏的用户信息记录。结合三份数据可以得到手机用户的坐标数据。通过将各个坐标数据按时间顺序联系起来,可以初步获得手机用户的时空移动轨迹。图2展示了时空坐标系中特定个体通勤者的手机信令轨迹。图中的每个红点代表从手机信令数据中获得的时空坐标,红线表示移动过程。
图2 城际通勤者的手机信号轨迹
根据手机信令数据推断城际通勤出行的过程包括以下四个步骤,如图3所示:
图3 推断城际通勤出行的过程
本研究使用2019年5月1日至31日的四个星期的手机信号数据来推断城际通勤行程。完成上述推断过程后,本研究确定了50,060名在天津定居并在北京工作的城际通勤者。2019年5月,这50,060名城际通勤者产生了761,030次从天津(居住地)到北京(工作场所)的城际通勤出行。图4(a)显示了城际通勤者的性别和年龄构成。如图4(b) 所示,城际通勤的出行时间大多在1.5至3.5小时之间,明显长于北京0.85小时的平均通勤时间。通过对比高铁车站的位置与城际通勤出行产生的空间分布可以明显看出,城际通勤出行产生量较高的TAZ位于高铁车站周边。因此在考虑交通属性建成环境时,需要考虑高铁车站的影响。除了通勤研究中常用的变量外,还需要添加从每个小区到最近的城际高铁车站的距离来反映高铁的可达性。
图4 通勤者和通勤时间构成雷达图
解释变量是由三个部分组成:社会经济属性、土地利用属性和交通属性。社会经济属性的数据类型和来源相对多样,包括经济发展数据、企业运营数据、房价数据等。
表1 所有变量的描述性统计
变量 | 描述 | 城市 | 平均值 | 标准差 | 最小值 | 最大值 | 方差膨胀系数 | 莫兰指数 |
城际通勤出行 | 每个交通小区从天津到北京的日均通勤出行(人/km2) | B | 13.03 | 21.56 | 0.64 | 152.31 | 0.33 | |
T | 9.88 | 30.03 | 0.77 | 245.07 | 0.33 | |||
社会经济属性 | ||||||||
经济密度 | 每个交通小区的GDP(百万美元/km2) | B | 42.23 | 17.39 | 0.82 | 66.68 | 4.75 | 0.85 |
产业结构 | 每个交通小区的产业多样性 | B | 1.77 | 0.44 | 0 | 2.31 | 1.44 | 0.28 |
房价 | 每个交通小区的平均房价(万元/m2) | T | 1.90 | 0.94 | 0.62 | 6.41 | 1.10 | 0.73 |
房价(90~150分钟) | 到交通小区的行程时间在90~150分钟的平均房价(万元/m2) | B | 4.26 | 1.47 | 0.56 | 8.95 | 2.58 | 0.78 |
土地利用属性 | ||||||||
人口密度 | 每个交通小区的人数(千人/km2) | B | 11.34 | 12.11 | 0.20 | 52.50 | 3.56 | 0.79 |
T | 6.38 | 16.24 | 0.14 | 89.68 | 6.30 | 0.60 | ||
就业密度 | 每个交通小区的工作岗位数量(千个工作岗位/km2) | B | 4.64 | 8.5 | 0 | 28.54 | 7.57 | -0.46 |
住宅比例 | 每个交通小区的住宅用地占总面积的比例(%) | T | 19.21 | 25.97 | 0 | 90.49 | 1.54 | 0.40 |
商业比例 | 每个交通小区的商业用地占总面积的比例(%) | B | 8.10 | 9.01 | 0 | 46.08 | 1.36 | 0.24 |
土地利用结构 | 每个交通小区的土地利用多样性 | B | 0.53 | 0.20 | 0 | 0.91 | 2.36 | 0.45 |
T | 0.37 | 0.21 | 0 | 0.90 | 1.53 | 0.29 | ||
企业密度 | 每个交通小区的企业数量(个/km2) | B | 92.53 | 111.06 | 0 | 418.55 | 7.34 | 0.51 |
购物服务 | 每个交通小区内商场、超市和便利店的数量(个/km2) | B | 30.69 | 36.05 | 0 | 209.88 | 1.73 | 0.40 |
T | 18.26 | 29.24 | 0 | 181.45 | 4.70 | 0.48 | ||
中小学教育服务 | 每个交通小区内的中小学数量(个/km2) | T | 0.87 | 1.39 | 0 | 10.61 | 1.67 | 0.54 |
交通属性 | ||||||||
道路密度 | 每个交通小区内的道路长度(km/km2) | B | 4.41 | 2.52 | 0.11 | 20.77 | 7.74 | 0.57 |
T | 3.61 | 4.23 | 0.20 | 33.85 | 4.18 | 0.53 | ||
交叉口密度 | 每个交通小区内的交叉口数量(个/km2) | B | 7.24 | 9.29 | 0 | 71.89 | 6.05 | 0.35 |
T | 6.49 | 9.20 | 0 | 64.43 | 8.02 | 0.48 | ||
公交站密度 | 每个交通小区内的公交站数量(个/km2) | B | 3.25 | 2.35 | 0 | 11.88 | 3.74 | 0.52 |
T | 2.73 | 3.98 | 0 | 27.15 | 3.72 | 0.50 | ||
公交线路密度 | 每个交通小区内的公交线路数量(个/km2) | B | 7.67 | 6.84 | 0 | 28.94 | 5.28 | 0.70 |
T | 3.51 | 5.40 | 0 | 28.99 | 8.11 | 0.71 | ||
地铁站密度 | 每个交通小区内的地铁站数量(个/km2) | B | 0.23 | 0.31 | 0 | 1.62 | 2.25 | 0.44 |
T | 0.15 | 0.39 | 0 | 3.44 | 7.88 | 0.54 | ||
RNS | 每个交通小区到最近的城际高铁站的路线距离 | B | 25.86 | 17.92 | 0.45 | 84.23 | 3.23 | -0.95 |
T | 22.19 | 30.32 | 0.38 | 61.68 | 1.61 | -0.94 |
为了揭示建成环境对城际通勤的非线性影响,我们考虑利用基于树的机器学习模型。
GWRFR模型的构建过程包括以下步骤:
步骤1:获取空间权重矩阵。
步骤2:进行训练子集采样。
步骤3:构建决策树模型。
步骤4:将决策树纳入RFR模型。
为了直观地分析各个解释变量对城际通勤出行的影响,在完成模型框架后,可以使用MDI来计算特征的重要性。目标特征的重要性可以使用以下公式计算:
为了进一步研究建成环境与城际通勤之间的复杂关系,本研究使用部分依赖图来描述城际通勤如何部分依赖于每个回归点的目标变量。部分依赖性可以使用以下公式计算:
为了展示考虑空间异质性和非线性效应在建模中的优势,本文使用了建成环境研究中常用的几种模型进行比较分析,包括普通最小二乘(OLS)模型、GWR模型、RFR模型和GBDT模型。分别在北京和天津采用10倍交叉验证方法计算各模型的均方根误差(RMSE)、平均绝对误差(MAE)和拟合优度(R2)。结果显示,与全局线性回归模型(OLS)相比,空间回归模型(GWR)和非线性回归模型(RFR和GBDT)都显着提高了预测精度。研究结果进一步证实,空间异质性和非线性在建成环境与城际通勤出行之间的关系中发挥着重要作用,强调了将空间异质性和非线性纳入回归建模的重要性。
图5展示了北京和天津的R2分布,从图上颜色来看,R2在两个城市的分布并不均匀。
图5 GWRFR模型的R2分布。(a)城际通勤出行的吸引 (b)城际通勤出行的发生
图6展示了建成环境变量在城际通勤出行的发生和吸引中的平均相对重要性。
图6 平均局部变量重要性
通过相对重要性的分析,可以确定各个建成环境变量对城际通勤出行的贡献。然而,这些变量与城际通勤出行之间的关系仍然模糊。因此有必要进一步探讨变量与通勤出行的吸引 和发生之间的复杂关系,这将为管理的规划和政策制定提供基础。根据GWRFR的结果,选择图6中对城际通勤旅行的吸引力和产生贡献最大的前6个建成环境变量。图7和图8中的部分依赖图展示了每个变量对通勤出行的有效范围和阈值。
图7 建成环境对城际通勤出行吸引的非线性影响
图8 建成环境对城际通勤出行发生的非线性影响
随着城际出行便利性和可达性的提高,城际通勤出行的规模显著增加,深刻反映了居民工作场所和居住地的重新选择行为,进一步影响了区域的空间结构。因此,了解城际通勤的空间分布特征及其与建成环境的关系对于政策干预和建设规划至关重要。本文的研究主要针对以下三个方面:
提出了基于手机信令数据获取城际通勤出行时空信息的方法,克服了传统票务数据难以相互关联、无法形成完整的城际通勤出行链的弊端。
构建了一个将地理权重思想融入非线性模型的分析框架,以解决城际通勤出行的空间异质性和非线性效应带来的问题,从而提高城际通勤出行的预测精度。
通过计算相对重要性并绘制部分依赖图,可视化建成环境对城际通勤发生和吸引的影响。
本研究的结果揭示了城际通勤出行与建筑环境之间的空间异质性和非线性关系,在政策制定中应予以考虑。为适应城际通勤出行逐渐增加,提升城际通勤者的出行体验,针对交通服务提出以下三点建议:
在城际高速铁路规划和运营中增加对通勤出行的考虑。除了传统的在高峰时段增加服务班次和可用性的方法外,还应开发新的专用通勤服务来缩短通勤时间,例如为通勤者设置相应的入口和安全线路。
增强工作场所和居住地的公共交通服务能力。根据城际通勤者的空间分布,调整部分公共交通的运营计划、时刻表和停靠策略。此外,应当提供更频繁、更可靠的巴士服务,将交通枢纽与工作场所和住宅连接起来。
开发城际通勤综合交通解决方案。通过将出行即服务 (MaaS) 引入现有的城际和城内交通系统,通勤者只需购买一张票即可完成整个行程。通过城际定制公共交通为通勤者提供无缝衔接的门到门服务。
本研究的一些局限性可以在未来的研究中进一步探讨:首先,本研究仅分析了从天津到北京的城际通勤,其他城市群的城际通勤的可比性尚不清楚。今后需要对多个城市群的城际通勤进行比较研究。其次,未来的研究可以结合SP和RP的调查数据,进一步探讨城际通勤者的出行偏好和模式转换机制。最后,除了城际通勤之外,还可以研究具有其他出行目的的出行者的城际出行与建成环境之间的关系。