您目前的位置: 首页» 科研及成果» 研究进展» How to build vibrant communities by utilizing functional zones?A community-detection-based approach for revealing the association between land use and community vibrancy

How to build vibrant communities by utilizing functional zones?A community-detection-based approach for revealing the association between land use and community vibrancy



英文题目:How to build vibrant communities by utilizing functional zones? A community-detection-based approach for revealing the association between land use and community vibrancy

中文题目:如何利用功能区建设充满活力的社区?基于社区检测的方法,揭示土地利用与社区活力之间的关系

论文作者:郝赫,姚恩建,杨扬,刘莎莎,潘龙,王月

论文期刊:CITIES

论文网址:https://www.sciencedirect.com/science/article/pii/S0264275124006450?via%3Dihub

摘要:

探究土地利用和城市活力之间的关系对于可持续城市发展至关重要。为此,根据Jacobs1962)提出的四个条件,在调查这种关系之前,应该确定合适的地理单元。在本研究中,我们考虑时空人类活动模式,并提出社区构建方法,整合图神经网络(GNN)和门控循环单元(GRU)来识别合适的地理单元。然后,通过时空地理加权回归(GTWR)模型测量土地利用相关变量对社区活力的影响。利用来自北京的手机信号数据,我们初步确定了66个社区,主要包括内部行程(起点和终点在同一个社区)和一小部分社区间行程,呈现出不同的活力模式和不同的土地利用特征。在此基础上,建立了GTWR模型,揭示了土地利用与社区活力之间的关系,发现基于土地利用的变量(如混合土地利用和兴趣点密度)对社区活力具有时空异质性影响,揭示了社区发展重点之间的异质性,如人口密度和功能区结构。因此,本文提出了社区多样化发展策略,为增强城市活力提供了有价值的建议。

关键词:社区检测;社区活力;土地利用;时空地理加权回归(GTWR);多样化发展策略

1.介绍

全球城市化带来了许多挑战,从鬼城城市衰落,所有这些都引起了世界范围内城市规划者的关注(Bierwagen, 2007; Jin et al., 2017; Zhao et al., 2014)。解决上述问题的需求空前激烈。为此,城市规划者、决策者和研究人员将注意力放在如何增强城市区域的活力以优化城市资源和减轻空气污染上。对于城市规划者来说,相关的问题是:什么因素影响城市活力?可以采取什么措施来保持社区活力?可以实施什么样的政策和策略来振兴缺乏活力的街区?

要研究各种因素与城市活力的关系,首先要确定合适的单元来评估城市活力。参照Jacobs 1962)的观点,为了在任何城市创造多样性,城市规划应包括具有混合功能的空间,以及适合步行的短街区、人群密集以及新旧建筑的混合。此外,Jacobs 1962)在进行城市规划时强调了社会动态和街道互动的影响。在关注城市活力的研究中,行政区(De Nadai et al., 2016)、街区(Wu et al., 2018)、交通分析区(TAZs) (Li et al., 2021; Niu et al., 2022)或网格(Chen & Huang, 2024)通常被用作基本单元,为理解城市区域的活力提供了见解。然而,这些单元通常依赖于静态边界(如道路、自然边界和行政边界)获得(Jin et al., 2017),这可能是主观和僵化的,忽视了人类活动和相互作用的动态性。另一方面,虽然对TAZ和网格规模的分析为提高城市活力提供了细粒度的见解,但它们通常被认为是出行分布和土地利用分析的基本单元,这意味着内部活动不是主要考虑因素(Shao, 2004),而且这些单元的土地利用特征通常是同质的。这与在考虑城市活力时,人口密集和混合用途的空间概念形成鲜明对比(Jacobs, 1962)。为了得到与Jacobs1962)一致的单元,Hu等(2021)提取了基于道路的社区,然后分析了这些动态场所的社区活力影响因素。然而,按照(Jacobs, 1962)的方法来划分群落仍然是一个挑战,需要进一步研究,以从不同的空间尺度提供更多的见解。

在确定了评价活力的单元后,对影响因子与城市活力之间的关系进行了广泛的研究,由于基本单元不同,从不同的空间尺度上提供了有价值的见解。关于活力的影响因素,基于土地利用的因素已被广泛考虑。例如,功能区密度(Yue et al., 2017) 和混合土地利用(Wu et al., 2018)已被认为是促进社区活力的重要决定因素。然而,关于土地利用对社区活力的影响存在争议。考虑到居民的时空活动模式,各因素对城市活力的影响可能表现出异质性(Lang et al., 2022; Liu et al., 2020)。例如,混合土地使用可能会增强一个社区的活力,而在另一个社区产生相反的结果(Yue et al., 2017)。

考虑到上面提到的问题,我们的贡献如下:1)在Jacobs1962)提出的四种条件中,我们关注与城市活力最相关的特征,即人口的高度集中,并设计了一种基于社区检测的方法,结合门控循环单元(GRU)来划分社区。该方法考虑了多式联运网络,包括道路、公共汽车和地铁网络,以及一周内的人员移动模式;2)基于已确定的社区,我们开发了一种定量方法来直接评估社区活力,并对这些社区内的人类活动模式进行深入分析。这可以作为检查土地利用对社区活力影响的基础,并允许理解土地利用与社区动态之间复杂的相互作用;3)采用时空地理加权回归(GTWR)模型研究了土地利用与已识别社区活力之间的关系。该模型捕捉了土地利用对社区活力影响的时空异质性,为发展充满活力的社区提供了见解。

本文的其余部分组织如下。第2节回顾了空间单元识别和活力概念的相关研究,并对影响因素进行了考察。第3节概述了研究区域和使用的数据集,这构成了社区识别和回归模型的基础。第4部分介绍了门控循环单元-神经重叠社区检测(GRU-NOCD)模型、社区活力和混合土地利用评估方法以及时空地理加权回归(GTWR)模型。第5节基于回归结果分析了已识别社区的特征以及土地利用对社区活力的影响,随后制定了改善社区活力的多种策略。第6节对全文进行总结,并对未来可能的研究方向进行了讨论。

2. 文献综述

2.1 空间单元识别

许多先前的研究使用预定义的地理单元,如TAZs、网格、行政边界或人口普查区作为基本单元。然而,这些单元通常是基于静态边界(如道路、自然特征和行政区划)推导出来的,这往往无法解释人类活动和相互作用的动态性(Jin et al.,2017)。具体而言,行政边界通常通过“自上而下”的方法确定,这可能导致城市基础设施的不连续性,例如地铁站或建筑物被行政边界划分(Chen, Chen, et al., 2022),从而导致分析中的潜在偏差(Liu et al., 2015)。此外,基本单元的规模也被证明会影响研究结果(Zhou & Yeh, 2021)。例如,TAZs和网格通常被确定为包含同质的土地利用特征,这可能与充满活力的社区的概念不一致(Jacobs, 1962)。因此,适当确定基本单元对于进行稳健的研究至关重要(Peng, 1997)。

越来越多的实证研究使用网络分析技术来解决城市规划问题,这得益于空间网络分析的进步和现实世界数据的可用性(Flammini & Barthe, 2008)。社区检测分析,即根据连接来识别密集连接的顶点组,在研究人员中引起了极大的关注,并已被用于划定地理范围(Fortunato,2010)。例如,(Wang et al., 2022)采用快速展开算法来识别250 m网格的社区,以评估职住平衡。ChenChen等人(2022) 使用自由浮动的共享单车数据构建了一个空间交互网络,并采用莱顿社区检测算法来划定城市活动区。他们的研究结果表明,已确定的活动区边界通常与现有的行政区边界不一致,这凸显了适当确定地理范围的重要性。此外,基于社区检测的方法已应用于与城市功能结构(Cats et al., 2015)、动态运动模式(Zhao et al., 2023)和车站重要性评估(Zhang, Marshall, & Manley, 2021)等相关的研究。

现有的关于划分地理边界的文献显示出一定的局限性。以动态运动结构的识别为例,目前的方法需要对离散时间间隔的人类移动数据采用社区检测算法。它缺乏能够适应临时变化的人类移动模式的生成社区。根据Jacobs1962)的概念,一个充满活力的社区应该表现出高水平的人类活动和相互作用,这意味着在描绘社区时应充分考虑人类活动的集中度和动态。鉴于最近出现的基于深度学习的算法,图神经网络(GNNs)已被证明能够处理各种数据,而循环神经网络(RNNs)在处理序列数据方面已经证明了有效性。在本研究中,我们将这两种方法结合起来,从活动集中度和社会互动方面识别社区,整合静态交通网络和动态人类活动模式。

2.2 邻里活力与影响因素

根据既定的定义,邻里环境-通过一个空间划定的区域,作为人类互动的共享中心,具有各种功能区(Chhetri et al., 2006)。邻里活力的概念(Jacobs, 1962)围绕着人类活动的强度及其在物理环境中的相互作用。Maas2010)认为邻里尺度的活力可以通过三个主要指标来衡量:街道和公共场所持续的人流,他们的活动和机会,以及这些活动发生的环境。这三个指标为活力的测量提供了有价值的见解,并阐明了潜在的影响因素。

测量邻里活力已被证明是一项复杂的任务,促使学者们应用不同的数据并采用不同的定量方法。关于使用的数据,Sung等人(2013)使用长达十年的努力收集的步行活动数据进行了第一个成功测试Jacobs理论的研究。随着技术和应用的发展,手机数据成为漫长而昂贵的活动调查数据收集的有价值的替代方案,并被广泛用于测量城市活力(Botta & Guti´ errez- Roig, 2021; Chen & Huang, 2024; Collins et al., 2023; De Nadai et al., 2016),这也是使用移动应用程序的数据的基础(Chen, Zhao, et al., 2022; Niu et al., 2022)。在定量方法方面,研究人员采用了各种方法来测量邻里活力,包括直接方法和间接方法。间接方法通常涉及评估影响人类活动的指标,如功能区的可达性、物理环境和社会经济因素(Yue et al., 2017)。直接法侧重于直接反映人类活动强度的指标,如手机用户数量(Yue et al., 2017)、APP使用强度(Li et al., 2020)、步行活动频率(Sung & Lee, 2015)。

如第1节所述,社区活力受到多种因素的影响,包括但不限于社区安全、建筑密度、娱乐机会等。大量研究表明,混合土地利用(Yue et al., 2017) 和不同功能区的密度在衡量邻里关系中起着关键作用活力。混合土地利用是指在一个相对较小的区域内,满足人类需求的多种功能区,包括商店、学校、公园和其他建筑。同样,功能区的密度与个人的行为和心理密切相关,它们提供有助于社区活力的服务(Eun & Kim, 2017)。例如,Chen, Zhao等人(2022)将移动电话位置请求数据与城市夜间灯光数据一起应用于中国深圳的城市活力,并进行了GTWR分析,以检查土地利用,街道配置和城市活力之间的关系。(Niu et al., 2022)利用人口密度、社会密度和经济活动强度组成指数来评估中国广州的社区活力,然后利用局部熵图和随机森林回归来研究活力的时空变化。

总的来说,现有的研究解决了社区活力的定义和影响因素。类似地,我们提出了一种利用手机信号数据来测量邻里活力的方法,并揭示了功能区密度、混合土地利用和邻里活力之间的关系。不同的是,在本研究中,我们首先使用基于社区检测的方法确定社区,并在确定的社区基础上,分析土地利用对社区活力的影响。

3.研究区域和数据集

3.1 研究区域

本文以北京为研究区域,选取合适的分析单元,进而考察社区活力与土地利用特征之间的关系。北京,中国的首都,是位于中国东北地区的一座特大城市。截至2021年底,全市共有16个区,包括6个市区和10个郊区,人口2188.7万(Beijing Municipal Bureau of Statistics, 2022)。然而,城市与郊区在城市形态和人口分布上存在显著差异。城市区域以密集建成区和不同功能区为特征,由于人类活动水平高,导致社区边界的准确划分面临挑战超越社区边界的活动。此外,不明确的社区边界使得很难评估社区活力并将充满活力的社区作为参考。此外,在过去的十年中,快速和不受控制的城市扩张导致了诸如长距离通勤、空气污染和交通拥堵等问题,这些都是北京和世界各地城市面临的挑战。因此,北京的城区,即朝阳、海淀、西城、东城、丰台和石景山,是城市规划者描绘城市空间结构和调查充满活力的社区属性的合适和具有代表性的案例(图1)。



1 北京及研究区的空间分布

3.2 数据集

3.2.1 出行数据集

利用出行数据作为评估社区活力的重要代理,其基础是它能捕捉人们活动的能力模式和揭示整个城市功能区的分布。在本研究中,从手机信号数据中提取的出行数据被特别选择来划定社区边界,并作为计算社区活力的基础。手机信令数据以30分钟的频率从基站收集,广泛用于分析人类活动模式(Wang et al., 2022)。在本研究中,从移动通信提供商(中国联通)获得了2021517日至2021523日为期一周的手机信令数据集,以生成人类出行数据集。值得注意的是,中国联通在北京的市场份额约为20%,这表明所提供的数据代表了捕捉城市人类活动的特征。此外,考虑到该数据是在COVID-19大流行期间收集的,值得注意的是,它在反映人类活动模式方面具有代表性。自COVID-19大流行发生以来,北京政府积极实施预防措施,遏制病毒的传播。通过2020年的精细化管理,2021年疫情得到有效控制。自2021316日起,北京实施常态化疫情防控措施,逐步有序恢复生产和日常生活活动(The People’s Government of Beijing Municipality, 2021)。就连旅游业也出现了明显的复苏(Su, 2021)。因此,在整个2021年,北京市内出行相对未受疫情影响,人们的出行模式与疫情前相似。综上所示,2021517日至2021523日的手机信号数据可以在一定程度上反映北京的人类活动模式。然而,COVID-19确实对人类活动施加了一定的限制,这在采取行动时应该考虑到评估我们的结果。

在采用社区检测方法时,我们需要一定的基本单元来聚合出行和交通网络数据,这对于社区识别至关重要。考虑到北京城区面积较大,且1 km ×1 km网格的细化程度足以捕捉该空间尺度下的人类活动,本研究选择1 km ×1 km网格作为基本单元(Chen, Zhao, et al., 2022; Lang et al., 2022)。为了生成出行数据集,当用户的位置在一定时间内保持不变时,将手机信令数据分割成部分,表示发生了一次出行。随后,为了保护用户的隐私,将出行数据聚合到上述1公里×1公里网格上,并将起点和目的地匹配到网格上,在中国联通平台上进行处理。最后,行程数据集包含 702.7 万条行程记录,其中工作日和周末平均分别为 105 万和 88.9 万条,说明了这些时间范围之间的不同出行模式。行程数据集中的每条记录都包含起始网格的ID、结束网格的ID、行程次数和日期。

3.2.2 道路和公交网络

交通网络已被认为是评估城市物理紧凑性和社区可达性的实用工具(Lang et al., 2022; Zhang, Duan, & Li, 2021)。在本研究中,通过整合道路、地铁和公交网络构建了一个多式联运网络,并进一步用于评估社区提供顺畅交通的能力(详见4.1.1节)。道路网络数据来源于OpenStreetMap OSM Haklay & Weber, 2008),这是一种开放获取和可编辑的世界地图,使用名为OSMnxPython包来获取和简化。路网数据集包括北京市区的28818个顶点(代表路口)和42671个边(代表道路)。

除了道路网络,交通网络在为出行者提供出行服务方面也很重要。因此,我们使用爬虫技术访问北京市区的地铁和公交网络。公交网络数据集包括21条地铁线路和981条公交线路,包括4253个公交站点。

3.2.3 POI

兴趣点(POI)数据是新兴的公共数据,可以有效地反映人类的行为和活动(Zhong et al., 2020)。与遥感数据等传统数据集相比,POI数据具有量大、易获取、更新频繁等优点(Lan et al. 2021)。近年来,POI数据被广泛应用于城市功能区识别(Yao et al. 2017)、混合土地利用分析(Liu et al., 2020; Yue et al., 2017),以及评估城市活力(Lang et al., 2022; Wu et al., 2018)等。在本研究中,利用API技术访问中国地图提供商Auto Navi MapPOI数据。该数据集由14个主要类别中的137个子类别组成,共涵盖360498个覆盖北京市区的POI。每个POI记录包括名称、类别、经度、纬度和相关详细信息。

3.2.4 工作地点和居住地点数据集

工作地点和居住地点数据集代表了城市背景下就业和家庭的空间分布,并在分析工作-住房平衡(Wang et al., 2022)、城市形态等方面发现了广泛的应用。认识到POI数据集在精确表示工作地点和居住地点方面的局限性,本研究引入了这两个数据集,它们捕获了工作地点和居住地点分布,并提供了人口分布的写照,人口分布是社区活力的重要代表(Delcl et al., 2022)。与出行数据集类似,工作和家庭位置是通过汇总手机用户在正常工作时间或睡眠时间内的长期停留位置来确定的。具体来说,用户的工作地点或居住地点是通过整合每月时间范围内的识别结果来确定的。由于这两个位置涉及敏感的用户信息,因此数据在网格级别进行汇总。由此产生的工作地点数据集包含1380条记录,每条记录都包含网格ID和工人数量。反过来,获得的居住地数据集包含1380条记录,每条记录包含网格ID和居民计数。本研究使用的所有数据综合列于表1中。

1 数据描述



4.方法学

本节介绍了用于划定社区边界和分析土地利用对社区活力影响的方法。具体来说,基本单元是1公里×1公里网格,然后使用社区检测方法将其聚合成社区。随后,利用这些社区来评估土地利用与社区活力之间的关系。

4.1. 门控循环单元-神经重叠社区检测

根据Jacobs1962)的概念,一个充满活力的城市应该开发混合用途的空间,以及短的,可步行的街区,大量的人群,强烈的社会互动和新旧建筑的混合。在本研究中,我们主要考虑了三个条件,即可步行街区、人口大量集中和强烈的社会互动,来描绘社区,并研究土地利用与社区活力之间的关系。关于可步行街区,一个社区应该表现出紧凑的物理结构,以促进人类的流动性,并拥有与人类活动互动的有吸引力的功能区(Dantzig & Saaty, 1973),这意味着一个社区应该有足够的交通基础设施,也可以加强社会互动。就人口密集和强烈的社会互动而言,一个充满活力的社区应该有高水平的人类活动。考虑到出行是人类活动的伴随产物,人类活动可以通过前往该社区的出行次数来反映,包括内部行程和来自外部社区的行程。结合可步行街区的特点,在识别社区时,更应该关注社区内的行程。此外,在划定时还应考虑到社区的重叠特征(Yang & Leskovec, 2014)和人类活动的动态性。

为了描述整合上述点的群落,采用了神经重叠群落检测(Neural Overlapping Community Detection, NOCD)算法(Shchur & gnnemann, 2019),结合图神经网络(Graph Neural Networks, GNN) (Scarselli et al., 2009)和伯努利—泊松(Bernoulli-Poisson, BP)模型。这种创新的算法可以有效地解决使用输入邻接性和属性矩阵的社区检测任务,使其非常适合考虑人类内部活动和交通基础设施的要求。此外,为了探索研究区域人类活动的时间变化,将门控循环单元(GRU)整合到NOCD中。本文提出的研究区域社区检测算法命名为GRU-NOCD(详见4.1.2节)。

4.1.1. 邻接矩阵和属性矩阵

交通基础设施是人类活动的基础,被广泛应用于城市活力(Lang et al., 2022)、行程生成(Calvo et al., 2019)和通勤模式(Bai et al., 2020)等分析。为了认识交通基础设施对人类活动的影响,我们纳入了可用的交通网络,包括道路、公共汽车和地铁,以生成邻接矩阵。生成邻接矩阵的过程如图2a)所示。最初,交通网络被整合到1公里×1公里网格中。网格之间的权重由式(1)计算。



其中是网格和网格之间的连接权重,是网格和网格之间对应不同模式的链路数。是常数系数,计算方法是使用该模式的出行次数(万人次)除以该模式的链路数,表示每种模式每个链路所承载的平均出行量。不同网络的常数因子,在一定程度上可以反映出每个环节对人类流动性的贡献。根据最新报告(Beijing Municipal Bureau of Statistics, 2022),的取值分别为0.1900.8250.021

交通网络的互联性作为一种静态属性,反映了社区内人类活动的基础设施。然而,一个良好的社区被期望拥有大量的人类活动,这些活动总是涉及出行。因此,以属性矩阵的形式整合出行数据来划分社区的边界,这被广泛用于分析出行模式(Zhao et al., 2023)。图2b)显示了生成N×N出行矩阵(属性矩阵)的进度,其中表示时间。关于出行矩阵中权重的计算一直存在争议。一种常见的方法是将行程汇总为基本单元,如TAZs或网格,其中使用出行数作为权重(Lee & Rhee, 2022)。这种方法产生的图形可以被GNN有效地利用(Lee & Rhee, 2022)。此外,考虑到个人的出行模式可能会根据一周的时间而变化,特别是在工作日和周末之间,本研究生成了一周的出行矩阵来描绘社区边界,从而捕获动态移动模式。



2 邻接矩阵和属性矩阵

4.1.2. GRU-NOCD架构

NOCDGRU-NOCD模型的主干,它提供了一种考虑物理紧凑性和活动模式的无监督方法。值得注意的是,与其他无监督社区检测算法,如InfoMap Rosvall & Bergstrom, 2008)或快速展开(Blondel et al., 2008)相比,基于GNN的方法为社区检测任务提供了优势(Shchur & Günnemann, 2019)。为了捕获时间依赖性出行模式,递归神经网络(RNN)可能是合适的,因为它能够处理序列数据。然而,传统的RNN在梯度消失和梯度爆炸等局限性。为了解决这些问题,开发了LSTMGRU模型。此外,GRU模型具有与LSTM相似的门控机制结构(Chung et al., 2014),并且比LSTM参数更少,训练成本更低,因此被选择用于捕获动态活动模式。GRU-NOCD模型基于邻接矩阵和属性矩阵建立,如图3所示。



3 GRU-NOCD 的框架

3显示了GRU-NOCD框架的四个主要部分:1GRU-NOCD主干,2)社区检测模块,3)时间依赖建模,4)损失函数。主干包括社区检测模块和时间依赖建模组件。

4.1.2.1. 社区检测模块。如图3b)所示,基于给定邻接矩阵A和属性矩阵,图卷积网络(Graph convoltional Network, GCN)层可以生成隐藏节点表示矩阵。本研究采用双层GCN作为NOCD的基础。隐藏节点表示矩阵 是社区归属矩阵的基础。计算可以表示为:



其中,表示归一化邻接矩阵,表示与单位矩阵相加的邻接矩阵;的对角度矩阵;为第时刻的属性矩阵。为第层的权值矩阵。为激活函数,即本研究中的relu函数。

4.1.2.2. 时间依赖性建模。整合时间依赖性是精确动态活动模式的关键。如图3 c)所示,为社区检测模块生成的输入;为前一隐藏状态;为复位门,其中控制以往信息与当前输入的整合程度;为更新门,控制对以前信息的保存程度;是当前存储的内存内容。计算可以表示如下。



其中,表示 Hadamard 积,是当前信息,即 GRU 的输出,是训练进度中的偏差。在每次捕获特征后,该模型将保留历史移动模式的特征,并可以识别每次考虑特征的社区。

4.1.2.3. 损失函数。在每处由GCNGRU层计算后,得到社团隶属矩阵GRU-NOCD的目标是生成能更好地保持网络和移动紧凑性的NOCD在伯努利-泊松模型中使用负对数似然的思想,可以表示为:



式(7)表示,uv属于同一群落的概率越大,uv之间存在边的可能性就越大。然而,现实世界的图通常是稀疏的,导致式(7)中的第二项提供了更大的贡献。NOCD模型对损失函数进行如下调整:

其中,是包含在节点集中的节点,分别是节点的向量。式(7)表示属于同一社区的概率越大,之间有边的可能性就越大。然而,现实世界的图通常是稀疏的,导致式(7)中的第二项提供了更大的贡献。NOCD 模型对损失函数的调整如下:



其中,分别是边缘和非边缘上的均匀分布(Shchur & nnemann, 2019)。结合L2正则化,最终的损失函数可以表示为:

其中,
表示L2正则化的损失,是控制其贡献的超参数。利用反向传播进行梯度计算,最终的损失函数由Adam优化器进行优化。在本研究中,经过500epoch的训练,我们可以得到群落隶属矩阵。对于某一节点是一个与群落数长度相同的行向量。每个元素表示属于相应社区的节点的隶属度。在本研究中,我们用的最大元素来确定节点的群落。

最重要的是,GRU-NOCD模型考虑了社区内的物理连通性和时间依赖性活动模式。选择社区内出行的聚类系数(CC)作为指标,以确定适当的社区数量。
可以用数学表达式表示如下。





其中,为群落的聚类系数,为群落中现有三角形的数量,为群落内的节点数量,为平均聚类系数,按群落规模加权。

4.2. 群落活力与土地利用多样性

4.2.1. 社区活力

2.2节所述,社区活力通常被定义为人们集中的强度(Jacobs, 1962),特别是与建筑和空间内部和周围发生的人类活动有关(Montgomery, 1998)。当使用手机数据、社会媒体数据或应用程序数据来衡量社区活力时,内部活动的强度(Chen, Zhao, et al., 2022; Collins et al., 2023; Lang et al., 2022)或经过某一区域(Chen & Huang, 2024)通常被用作活力的代表。因此,我们选择目的地在社区内的出行作为该社区内发生的人类活动的指标,包括两部分:社区内出行和来自其他社区的出行。此外,参考Liu等人(2020),前往外部社区的出行被认为不会吸引个人聚集在该社区内,因此也包括在社区活力的计算中。因此,本研究中的社区活力定义如下:



其中,表示社区在时刻在时刻的出行活力;是社区在时间的自生成行程次数;是社区在时间的流入次数;是社区在时间的流出次数。总体而言,式(12)计算了社区在时间的活动强度。

4.2.2. 测量土地利用多样性的希尔数

2.2节所示,现有文献表明,高密度的人口、功能区和混合土地利用是促进社区魅力的关键因素(Montgomery, 1998)。密度可以很容易地通过POI数据集获得。然而,关于如何准确测量混合土地利用存在争议。基于熵的方法(Christian et al., 2011;Xia et al., 2020)是常用的方法,但有人认为熵的内容主要关注不确定性而不是多样性(Jost, 2006),这使得熵可能不适合测量混合土地利用。参考(Song et al., 2013),混合土地利用最常见的定量测量具有很强的关联性,可以概括为本研究中选择用于测量混合土地利用的希尔数(Hill, 1973),如下所示。



其中,表示多样性;是影响测量结果的参数。是可选类别的数量。是第类的相对丰度。式(13)的形式更加直观,在统计上更加严谨(Chao et al., 2014)。在本研究中,0.4,这是GTWR模型的测试优化值。

4.3. 时空地理加权回归

传统的线性回归方法是全局估计自变量的影响。然而,根据假定的地理第二定律(Goodchild, 2003),空间区域表现出异质性,这表明各种因素对因变量的影响因其空间位置而异。此外,人类活动模式会随着时间的推移而发生重大变化,例如工作日和周末之间的差异。这意味着,应该结合时间视角来衡量社区活力与因素之间的关联。为了全面评估因素对社区活力的时空影响,我们采用了时空地理加权回归(GTWR)模型,该模型被认为可以有效地同时建模时空关系(Huang et al., 2010)。GTWR模型的表达式如下:



其中,
表示时空位置,即本研究中特定时间的一个社区;为社区的坐标;表示观测时间。表示社区在特定时间的活跃度;是特定时间群落的第个解释变量;为误差项;是待估计系数;以及为截距。因此,GTWR模型可以结合时空异质性估算系数。系数的估计过程如下。



其中,为基于时空距离的权重矩阵。因此,GTWR模型的关键是在空间和时间尺度上定义距离。在空间维度上,一个空间距离可以用欧几里得距离公式来计算,可以表示为:



其中,表示空间距离。一般来说,空间距离以米或公里为单位,不同于时间距离(以小时或天为单位)。时间距离可以用以下方法计算:



其中,表示时间距离。根据空间和时间距离,可以通过以下方式获得时空距离:



其中,表示时空距离;是控制时空距离贡献的参数。基于时空距离,上面提到的权重矩阵可以构造为:



其中,表示决定随时空距离增加而衰减率的带宽。在本研究中,最佳带宽由交叉验证方法确定。

5. 结果

在本节中,通过提议的GRA-NOCD模型确定了具有稳健的基础设施运输和大量社区内部出行的社区。随后,分析了这些社区的特征,包括人类活动和社区活力。为了进一步研究土地利用对社区活力的影响,本文建立了时空地理加权回归(GTWR)模型来量化各种土地利用因素的影响。最后,针对不同土地利用模式的社区,提出了异质发展策略。

5.1. 社区识别

划定社区边界的第一步是确定社区的数量。如第1节所述,根据Jacobs1962)的观点,为了精细地增强社区活力,社区的规模应该相当小,这意味着人类活动倾向于集中在出行距离较短的社区。在本研究中,短途出行通常被认为是半径5公里以内的出行(Liu et al., 2015)。因此,我们进行了一系列实验来确定最优的社区数量,并进一步确定了研究区域内的66个社区,聚类系数为1.91×109。为了验证GRU-NOCD模型的有效性,我们将结果与使用其他社区检测算法(包括标签传播、快速展开、贪婪模块化和Infomap)获得的结果进行了比较。比较结果如表2所示。结果表明,GRU-NOCD模型可以识别出适当数量的高聚类系数群落,这是捕捉群落活力的必要条件。图4显示了使用GRU-NOCD模型进行群落检测的结果。

2 群落识别结果的比较



为了直观地呈现社区检测结果,我们应用了一个九色地图来可视化识别的社区,这意味着每个相邻的社区都被分配了不同的颜色。识别结果表明,社区在地理上是集群的,主要由相邻的网格组成,小社区围绕着大社区,特别是在研究区域的西北、西南和东北。此外,在行政边界和社区边界之间观察到明显的差异。具体来说,许多社区跨越了两个甚至三个行政区域,这表明现有的行政区域可能不适合覆盖人类活动。值得注意的是,一些社区只包含几个网格,根据这些社区的出行构成,原因可能是其中一些主要由社区内出行组成,使其与相邻社区隔离。另一个原因可能是,尽管社区内出行数量较少,但进出出行相对分布均匀,导致难以与邻近社区融合。尽管如此,获得的带有几个网格的社区也可以揭示人类活动与土地利用之间的关系,这对进一步的分析有价值。



4 基于交通网络和出行的社区检测结果

5.2. 社区属性

在确定社区之后,应该分析社区的人类活动模式,原因有两个:1) 检查网格是否聚集成专注于人类活动的社区,2) 调查各群落的人类活动模式,作为进一步分析的基础。考虑到在本研究中,社区活力是基于自生、流入和流出的出行计算的,并且人类活动模式在工作日和周末之间是不同的,因此我们分别分析了依赖于时间的人类活动模式,如图5所示。图5展示了工作日(2021519日,星期三)和周末(2021522日,星期六)社区的出行构成,特别关注了出行次数最多的前10个社区。结果表明,自生成出行构成了社区内人类出行的主要部分,这意味着GRU-NOCD模型对社区内出行给予了足够的重视。同时,图5的结果显示了社区和天数之间的出行模式差异,这反映在自生出行、流入出行和流出出行的大小上。



5 社区的出行组成。(在左侧,数字是相应社区的索引,“o”表示从相关社区生成的行程。同样,右侧与左侧共享定义。)

为了进行更深入的分析,图6显示了工作日和周末不同类别的出行密度分布。如图6所示,每个社区的出行空间分布在工作日和周末之间表现出相似性,这意味着确定的社区揭示了一周内变化的时间依赖性流动模式。在自发出行的分布上,靠近市中心或朝阳区的社区表现出更高的出行强度,表明建筑密集集中或土地混合利用的地区更能有效地满足居民的多样化需求。此外,值得注意的是,除了混合土地利用的社区外,城市社区在工作日产生的自生出行强度往往较低。这可能是由于人们在周末的出行时间往往较短,导致在此期间社区内的人类活动较多。此外,研究发现,在工作日表现出较高自生出行强度的社区具有良好的工作-住房关系(Wang et al., 2022)。反过来,考虑到周末与工作相关的出行减少,这些社区的自生出行强度比工作日要小。相对于其他出行强度,工作日和周末的流入和流出出行的空间分布高度相似。值得注意的是,周末流入和流出的出行强度明显较低,这可能是由于周末通勤出行较少所致。至于比较列中的三类出行,图6表明,混合用地的建成社区在工作日对居民更具吸引力。



6出行密度分布(比较列表示出行密度的差异,其计算方法是工作日的出行密度减去周末的出行密度)

结合式(12),图7给出了社区活力的分布,揭示了社区活力同时受到地点和时间的影响。具体来说,图7a, b)分别可视化了工作日和周末社区活力的分布情况。工作日的平均社区活力为288.43,低于周末的平均社区活力(552.29)。值得注意的是,高活力的社区都位于市中心附近。



7 社区活力的分布和比较(比较表示社区活力的差异,该差异由工作日的社区活力减去周末的社区活力计算得出)

从图6和图7可以得出几点启示。首先,社区活力在工作日和周末之间的空间分布表现出相似性,表明社区活力与社区特征密切相关。由此可见,社区特征可能是影响社区活力的重要因素。

其次,图6中的流入和流出出行分布是相似的,这是可以理解的,对于某个社区来说,考虑到出去的内部居民会回来,进入的外部居民会离开,流入和流出的出行通常是平衡的。因此,从日常生活的角度来看,满足社区内部的人的需求可能是提高社区活力的关键。第三,高活力的社区往往表现出组织良好的形式,如朝阳和东城区。在这些洞见的基础上,社区活力的空间异质性可能源于社区形态、人口密度等各种社区特征。

为了进一步分析社区活力的时间变化模式,图8可视化了四种具有独特特征的趋势,表明社区活力具有较强的时间格局。



8 社区活力随时间的不同趋势

最重要的是,在分析因素与社区活力之间的关系时,考虑空间和时间模式至关重要。虽然社区活力可能与社区本身的特征(如社区形式、人口密度和建筑密度)有关,但影响因素对社区活力具有时空影响。这意味着一个因素给社区活力带来的影响程度是与时间和空间相关的。因此,我们采用GTWR模型来分析土地利用对社区活力的影响。

5.3. 土地利用对社区活力的影响

5.3.1. 模型说明

5.2节所述,土地利用可能对社区活力产生时空影响。为了揭示社区活力与土地利用等因素之间的关系,建立了GTWR模型,以捕捉土地利用的时空异质性对社区活力的影响。因变量为一周内所有社区的社区活力。解释变量包括社会经济和基于POI的土地利用变量。表3列出了解释变量的描述性统计。其中,就业密度采用表1中的工作地点数据集作为社会经济变量进行计算,可以弥补反映工作地点分布强度的POI数据的不足。值得注意的是,由于多重共线性问题,没有使用住宅位置数据集,这在多重共线性检验的结果中得到了解释。参考相关研究,将POI数据分为商业、住宅、休闲、旅游和其他五类(He et al., 2022;Lan et al., 2021),其中商业区由用于商业开发的区域组成,如金融保险公司、保安公司;其他片区则包含很少使用的功能区。此外,所有社区的希尔数以作为混合土地利用指标进行计算。值得注意的是,表3显示最小的希尔数为0,即对应的群落没有POI。根据所使用的数据,所有没有任何POI的数据对应的是一个只有一个网格组成的社区,完全位于山区,社区活力小于20。考虑到它不属于城市建成区,也没有与旅游或娱乐相关的POI,因此在构建GTWR模型时,该社区将被移除。

3 自变量的描述性统计



在构建GTWR模型之前,应采用多重共线性检验和莫兰斯指数检验。方差膨胀因子(VIF)用于评估多重共线性问题。大于10VIF表明存在多重共线性(Wheeler, 2007)。莫兰斯指数用于评价自变量之间的空间关联。莫兰斯指数为正意味着自变量的值在空间上聚集,这意味着相邻区域之间的趋势相似。相反,负的莫兰斯指数意味着自变量的值在空间上是离散的(Ma et al., 2020)。值得注意的是,从居住地点数据中得到的居住人口密度VIF32.00;因此,我们去掉这个变量,重新进行多重共线性和莫兰斯指数检验。表4列出了这两个测试的最终结果。

4 自变量的多重共线性和莫兰斯指数检验的结果



5.3.2. GTWR结果

5列出了GTWR模型的估计结果,R2值(0.962)表明GTWR模型很好地揭示了群落活力与解释变量之间的相关性。此外,表5显示了回归系数的分位数值,其中相同的解释变量对社区活力既有积极的影响,也有消极的影响,这与之前调查中国建成环境与城市活力之间时空格局的研究一致(Chen & Huang, 2024; Chen, Zhao, et al., 2022),但表现出与以往研究不同的模式(Sung & Lee, 2015; Yue et al., 2017),反映了解释变量对社区活力的影响随时间和空间的变化而变化。

5 GTWR 模型的估计



5.3.3. 估计系数的时空模式

对于时变模式,估计系数在一周内波动较小(同一社区的估计系数在一周内相似)。可能是由于以下原因造成的:1)因变量为每日社区活力,被证明高度依赖于自生出行的次数。然而,自生成出行的模式在一周内是相似的,这最终导致估计系数在几天内的变化很小;2GRU-NOCD模型在考虑日常移动模式和识别社区可以解释人类日常活动模式的情况下划定社区边界。它可能会引起群落活力的轻微变化,并可能随着时间的推移进一步产生稳健的估计系数。因此,我们关注回归系数的空间分布。图9分别给出了解释变量在工作日和周末对社区活力影响的空间分布。根据上述原因,工作日和周末的空间分布格局相似。因此,我们以工作日的空间分布为例,分析混合土地利用对社区活力影响的空间异质性以及不同功能区对社区活力影响的空间异质性。



9 每日群落活力回归系数的空间分布

5.3.3.1. 混合土地利用对社区活力的影响。关于希尔数估计系数的空间分布,我们揭示了一个新的见解,即混合土地利用可能并不总是与社区活力呈正相关关系,这与(Yue et al., 2017)的研究一致,但与(Liu et al., 2020)的结果存在冲突。希尔数的积极作用主要集中在北京城区的西部和东南部。在这些地区,一个社区的混合土地利用越好,该社区的活力就越高。究其原因,可能是一个具有复杂和自成一体的功能区的社区,能够产生更多的人类活动。另一个原因是,对于这些社区来说,并没有单一类别的功能区主导着它们的吸引力。例如,海淀区主要由大学等教育区组成,这对人类活动的吸引力不大。特别是,海淀区希尔数影响最大的区域位于仅由森林组成的公园内,进一步证明了上述观点。关于希尔数对社区活力的负面影响,对应的社区具有单一功能区类别所产生的足够特征。

5.3.3.2. 某些功能区对社区活力的影响。由图9可知,某一类POI对社区活力的积极影响可能是由于以下几个方面:1)这一类POI对人类活动具有优越的吸引力;2)缺乏这样的POI。对于前者,以休闲密度为例,东城区东南部附近地区可以通过建设更多的休闲区来提升社区活力。这些区域是北京最繁忙的商业街,吸引了大量的顾客,这是可以理解的。就后者而言,以石景山区为例,石景山区有很多森林、公园、景点,导致人口密度和就业机会不足,这可以从就业和居住密度的分布上得到证明。此外,特定类别的POI对社区活力的负面影响可能是因为相应的社区不需要该类别的POI或这类POI的密度太大。证明前者的一个最直观的例子是,“其他”密度对大多数社区活力都有负面影响。这种现象很容易理解,因为属于“其他”类别的POI与人类的不寻常需求相对应,例如汽车购买和农业。为了说明后者,我们以住宅密度的分布为例。朝阳区西南是居民楼的集中地,居民数量较多。这些地区有足够的住宅建筑,需要功能区来满足多样化的人文需求。

5.3.3.3. 土地利用对微型社区的影响。如5.1节所述,有些社区仅由几个网格组成,称为微型社区,这可能是由于社区内出行的高度集中,甚至是进出出行的分布。对于社区内出行高度集中的微型社区,良好的混合土地利用和较大的人口密度可能是形成这些社区的主要原因。例如,自生密度为4097.67次出行/km2的社区51平均居住人口密度为4350.67/km2,希尔数相对较高,为4.40,这意味着混合土地利用满足了居民多样化的需求。此外,根据GTWR模型的估计结果,希尔数对社区活力有正向影响。上述社区51的特征和估计提供了有益的见解,即良好的混合土地利用可以在小区域内满足多样化的居民需求,形成集中人类活动的较小社区,并有助于实现可持续发展目标,例如缩短城市的平均出行距离。对于进出出行分布均匀的迷你社区来说,糟糕的城市发展条件可能是导致个人离开这个社区的主要原因。具体而言,这些社区主要分布在海淀和丰台区的西北侧,靠近山区或在山区内,城市化程度较低,体现在POI数量、居住人口密度和工作人口密度较小。因此,这些微型社区所包含的人类活动强度较低。此外,这些社区的外部行程分布相对均匀,与其他社区没有很强的相互作用,因此它们被确定为较小的独立社区。根据估算结果,某些类型的POI和人口密度对其社区活力有积极影响,为改善这些社区提供了有益的见解。

5.4. 社区多样化发展策略

结合GTWR模型估算结果,总结了提高社区活力的多样化发展策略,包括三部分:1)发展混合土地利用;2)有针对性的发展策略;3) 更多好的微型社区,更少差的微型社区。

首先,本研究中的社区活力是从日常角度来定义的,这意味着自生出行可能是社区活力的主导因素。因此,提高社区日常活力可以通过增加混合土地利用程度,在相当小的区域内满足多样化的人类需求来实现,类似于中国的“15分钟社区生活圈”概念(Song et al., 2024)。本研究将希尔数作为混合土地利用的指标,考察希尔数与社区活力的正相关关系。然而,并不是北京主城区的所有区域都与混合土地利用呈正相关。如5.3.3节所述,混合土地利用的积极效应主要集中在北京城区的西部和东南部。在这些地区,土地利用特征相对同质性较强。以海淀区为例,海淀区以集中了大量的学校、大学和研究机构而闻名,它可能无法满足学生和居民对体育、购物、娱乐等活动的多样化需求。因此,在学校和住宅区之间发展多样化的功能区,可能有助于提高社区活力。其次,社区对不同的功能区有不同的偏好,这意味着社区可能被特定类别的功能区所主导,需要有针对性的发展战略。虽然流入和流出的行程在日常层面上是平衡的,但它们也会带来社区活力的大波动。

例如,在图8a)中,一个商业建成区对应的社区活力相对较高,在夜间达到高峰。在GTWR模型估算的基础上,一些社区的活力与混合土地利用呈负相关,但与某些类别的功能区呈正相关。例如,石景山区就业密度对社区活力的影响最为显著,这表明与混合用地和其他功能区相比,石景山区是北京城区中人口密度最低的区域,人口密度是提升社区活力的重要因素。在开发这一区域时,应该考虑更多的激励措施和政策,比如住房补贴和企业搬迁。总而言之,在追求进一步发展的时候,应该考虑不同区域现有建成环境的作用,比如海淀的教育作用,朝阳的商业作用。努力应该更侧重于找出必要的因素,增强它们的活力。

第三,以两种类型的微型社区为研究对象,认为高度自给自足的微型社区在减少出行距离、缓解交通拥堵、减少空气污染等方面有利于北京的可持续发展。因此,应考虑在已确定的社区基础上,形成更多这类微型社区。虽然确定了一些人类活动高度集中的社区,但它们比这些微型社区更大。为了进一步将这些社区划分为更小的社区,应该研究功能区的定向分配。对于城市发展条件较差、人类活动较少的微型社区,利用邻近社区的资源进行开发可能是一个不错的选择。例如,丰台区北部靠近几个大型火车站,拥有更多的娱乐和观光选择会增加游客探索周边地区的欲望,从而改善这些微型社区与其他已建成社区之间的联系。

6. 结语

本研究的主要目标是确定适合作为衡量社区活力的基本单元的社区,并进一步阐明土地利用与社区活力之间的关系,考虑影响的时空异质性。随后,本研究为城市规划者提出了多样化政策和策略,以发展充满活力的社区。为了实现这些目标,研究人员利用手机信号和交通网络数据来识别社区,同时利用POI和工作场所数据来揭示土地利用与社区活力之间的关系。通过数据驱动的方法,我们揭示了主要由内部行程组成的空间结构,并为土地利用对社区活力的影响提供了有价值的见解。

本研究提出了一种基于深度学习的方法,将交通网络和日常人类活动数据整合在一起,从人类活动的大集中度、社会互动和可步行街道的角度来确定用于调查土地利用与社区活力之间关系的单元。研究结果证明,已识别的社区有效地捕捉了人类内部活动,并揭示了一周内随时间变化的人类流动模式。

基于已确定的社区,我们分析了社区中不同类别的行程和活力。结果表明,土地利用对社区活力的影响存在显著的时空异质性,这在回归模型中得到了进一步的解释。回归结果为研究土地利用对社区活力的影响提供了新的思路。具体而言,土地利用变量对社区活力既有积极的影响,也有消极的影响,这在增强社区活力的背景下代表了一种新颖的见解。在一些功能区组成简单的社区中,混合土地利用对社区活力产生了积极影响。从功能区的角度来看,某一类功能区对社区活力的积极影响可能是由于这一类功能区对人类活动具有优越的吸引力,也可能是缺乏这类功能区。相反,某一类功能区对社区活力的负面影响可能归因于社区对此类功能区的需求不足或此类功能区的密度过高。这提供了一种见解,即在考虑社区的形式时,应该考虑社区的位置和不同功能区的贡献。

上述调查结果可作为制定全市社区发展政策和战略的基础。在估算结果的基础上,提出了社区多样化发展策略,从1)发展混合土地利用;2)有针对性的发展策略;3) 更多好的微型社区,更少差的微型社区,三个角度提升社区活力。

本研究为未来的研究留下了空间。关于使用的数据,在COVID-19大流行期间收集了手机数据。尽管北京自2021316日起实施常态化疫情防控措施(The People’s Government of Beijing Municipality, 2021),放松了出行限制,降低了COVID-19对人类活动的影响,但社会交往的程度不可避免地受到影响。因此,未来的研究应考虑根据正常时期收集的数据识别社区并评估活力。此外,社区活力是一个宽泛而难以捉摸的测量概念,无法通过部分手机信令数据直接测量。在未来的研究中,纳入不同的数据源,如社交媒体数据,可以提供更全面的社区活力评估。此外,在提出社区多样化发展战略时,本研究主要考虑社会经济和土地利用变量对社区活力的影响。然而,在城市化过程中,城市规划者会考虑城市形态的合理性和城市内部的发展趋势。因此,未来的研究应提供与城市区域规划相一致的发展战略。