一种城市分区域内服务设施需求识别方法及系统转让专利

申请号 : CN202210812583.2

文献号 : CN114897444B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王璞陈伟赵雷

申请人 : 苏州大学

摘要 :

本发明公开了一种城市分区域内服务设施需求识别方法及系统,包括以下步骤:基于各级行政区域划分方法对城市区域进行划分,并提取城市区域内的多维度特征;构建城市区域空间属性图;采用变分图自编码器对城市区域空间属性图编码,得到城市区域的潜在隐特征;融合Top‑k最相似功能城市区域的潜在隐特征;采用具有时空限制的贝叶斯模型,得到用户轨迹访问特征;结合城市区域的潜在隐特征和用户轨迹访问特征,通过多层感知机和归一化指数函数,得到最终的城市区域内服务设施需求概率分布。本发明考虑区域特征数据的稀疏性和动态性,综合城市宏观大数据与居民微观位置社会化数据,准确预测城市区域缺少的各类服务设施。

权利要求 :

1.一种城市分区域内服务设施需求识别方法,其特征在于:包括以下步骤:S1、基于各级行政区域划分方法对城市区域进行划分,并提取城市区域内的多维度特征;其中,多维度特征包括城市区域内的地理特征、交通特征及现有服务设施分布特征,所述交通特征包括用户轨迹特征;

S2、根据城市区域划分和提取的多维度特征,构建城市区域空间属性图;其中,所述城市区域空间属性图为城市区域之间的邻接关系所构成的无向图结构,图中的节点为每一个划分后的城市区域,节点之间的无向边表示区域地理空间上的邻接关系;

S3、采用变分图自编码器对城市区域空间属性图编码,得到城市区域的潜在隐特征;同时,根据城市区域之间的功能相似性,融合Top‑k最相似功能城市区域的潜在隐特征;

S4、根据用户轨迹特征和用户轨迹目的地附近的服务设施,采用具有时空限制的贝叶斯模型,计算用户轨迹目的地的服务设施访问概率,得到用户轨迹访问特征;

S5、结合城市区域的潜在隐特征和用户轨迹访问特征,通过多层感知机和归一化指数函数,得到最终的城市区域内服务设施需求概率分布;

所述步骤S4具体包括以下步骤:

S41、给定一个用户的时空行为轨迹 ,贝叶斯概率

推断模型首先选择轨迹目的地位置点 周围的在路网空间距离阈值 内一系列服务设施作为访问推断候选设施集 , ;

S42、定义服务设施访问的影响因素:路网距离、服务设施流行时间段、服务设施吸引力和用户访问喜好;综合影响因素因子,令用户 的轨迹为,轨迹目的地位置点 所在的区域是 , ;

S43、用户 在轨迹目的地区域 内访问了某个服务设施 的概率表示为:其中, 为位置点 到服务设施 的最短路网距离,为非负的参数;

表示目的地时间戳 对应的前后时间段 内 所

属服务设施类别 的流行度,从整个服务设施签到数据的设施类别分布中得出,其最终值表示为0 1之间的一个归一化权重; 是服务设施 的服务吸引力,通过用户对~该服务设施的评价或打分文本数据中提取分析得出,其最终值表示为0 1之间的一个归一~化权重; 是用户 对服务设施类别为 的访问喜好程度,从用户对所有服务设施签到记录中和服务设施类别为 的服务设施的签到之比得出,其最终值表示为0 1~之间的一个归一化权重;

S44、根据以上S43中公式,求得用户对行程轨迹目的位置点 附近的距离阈值 范围内所有服务设施 的访问概率,再反向推断出用户轨迹对应区域内缺少的服务设施概率;

S45、综合用户轨迹出发位置点 所在区域的服务设施缺失情况,除了轨迹目的地位置点 所在的区域 之外,轨迹经过的其他所有区域也都认为需求对应的服务设施:令用户 在其行程轨迹 中顺序经过的区域集合为,其中,出发地区域为 ,目的地区域为 , ,则,对于集合中的每一个区域 ,在时间段 内,服务设施 缺失的概率为 ;

S46、设在时间段 内, 为所有从区域 出发和经过 的轨迹用户集合,用户 对应的行程轨迹为 ,那么 在时间段 内服务设施 缺失的概率如下:其中, 表示在区域 中用户 对应的行程轨迹 里所隐含的服务设施缺失的概率, 表示在区域 中用户 对应的行程轨迹 里所隐含的服务设施 缺失的概率;

对于区域 ,得到对应服务设施类别为 的需求概率 ,定义为:其中, 代表类别为c的具体服务设施 , 表示类别为c的设施集, 表示区域 中类别为c的服务设施 的需求概率, 表示区域 中服务设施 的需求概率,C为服务设施类别集合。

2.如权利要求1所述的一种城市分区域内服务设施需求识别方法,其特征在于:采用两级的行政区域划分方法对城市区域进行划分,包括:按照第一级行政区域进行划分,在每一个第一级行政区域内再按照第二级行政区域划分,最终划分所有城市区域,其中,第一级行政区域包括市辖区,第二级行政区域包括行政街道、镇和乡。

3.如权利要求1所述的一种城市分区域内服务设施需求识别方法,其特征在于:所述地理特征包括:人口面积特征向量M、区域功能特征向量B和房地产价格特征向量V;

所述交通特征包括:公共交通特征向量O和私人交通特征向量U;其中,所述私人交通特征向量U包括用户轨迹特征;

所述现有服务设施分布特征为对每一个城市区域建立一个基于路网空间距离的网络结构向量E,网络节点为服务设施类别,网络节点之间的边两两相连,边权重为节点服务设施类别对应的所有具体服务设施之间归一化的平均路网空间距离。

4.如权利要求3所述的一种城市分区域内服务设施需求识别方法,其特征在于:所述城市区域空间属性图表示为 ,其中,节点集 是划分的城市区域的集合, ,m是划分区域的个数, 为邻接矩阵表示节点之间的邻居关系,是区域内部代表性的汇总特征矩阵;结合区域之间的地理

邻接关系,城市区域空间属性图 的邻接矩阵 为: 。

5.如权利要求4所述的一种城市分区域内服务设施需求识别方法,其特征在于:所述步骤S3中采用无监督模型中的变分图自编码器将城市区域空间属性图 的原始节点特征映射至低维度的潜在空间,从而得到节点区域的潜在特征嵌入;其中,在变分图自编码的编码阶段,通过两层图卷积,使模型学习得到区域潜在隐特征的正态分布,然后再从正态分布中采样获得真正的区域潜在隐特征表示;在解码阶段,使用向量内积操作,将编码阶段得到的区域潜在隐特征向量重构并还原为城市区域空间属性图的邻接矩阵 。

6.如权利要求5所述的一种城市分区域内服务设施需求识别方法,其特征在于:获得真正的区域潜在隐特征表示,具体包括以下步骤:变分图自编码的编码部分包含两层图卷积操作:第一层图卷积将整个区域空间属性图作为输入,得到低维空间的特征矩阵 ,过程表示如下:其中,为 的对角度矩阵, 是可学习的权重矩阵,激活层使用了ReLU激活函数;

根据变分图自编码器的定义,潜在隐特征从一个高斯先验分布中采样得到的,第二层图卷积用于评估该先验分布的两个参数,该层的输入为 和 ,输出为多维高斯分布的均值向量 和协方差矩阵 ,整个计算过程为:其中, 为可学习的权重矩阵;

在潜在隐特征的生成阶段,采用重参数化技巧近似采样操作:将变量的随机性转移到高斯分布的元变量中,模型通过学习将高斯分布的均值和方差进行调整,要求的真正的区域潜在隐特征表示为:其中, 服从标准正态分布 ,则 服从正态分布 ,先

采样一个标准正态分布 ,再通过 变换得到真正的区域潜在隐特征z。

7.如权利要求1所述的一种城市分区域内服务设施需求识别方法,其特征在于:根据城市区域之间的功能相似性,融合Top‑k最相似功能城市区域的潜在隐特征,具体包括以下步骤:采用区域功能识别框架DRoF,计算所有区域 对应的功能分布向量;

令当前的城市区域为 ,计算 和其所在的一级行政区之外其他所有区域 的功能相似度 ;

设 是 与 的最短路网距离,则:

其中, 为 与 的功能分布向量 和 的余弦相似度, 为 内两个路网距离最远区域之间的最短路网距离, 则表示 与 之间归一化的最短路网距离;

基于功能相似度 从大到小对所有被评估的区域排序,得到Top‑k最相关功能的区域集合 ;

将 内所有的采样变换隐特征向量与区域 的采样变换隐特征向量融合,即得到区域 最终的潜在隐特征向量表示:其中, 是所有区域之间共享且可学习的权重参数矩阵,代表区域 与 之间采样变换隐特征的相关性; 和 分别代表了区域 与区域 的采样变换隐特征向量,同时,本身作为隐特征融合的一部分参与计算。

8.如权利要求1所述的一种城市分区域内服务设施需求识别方法,其特征在于:所述步骤S5具体包括:多层感知机的输入为区域空间最终的潜在隐特征 ,1≤i≤m,全连接隐藏层的激活部分使用ReLU激活函数,多层感知机的输出通过归一化指数函数Softmax映射得到最终的设施需求概率,在时间区间段t内,过程表示如下:其中, 表示向多层感知机输入的时间段t内区域 最终的潜在隐特征, 为隐藏层的状态, 、 、 和 是需要学习的参数, 代表了多层感知机的输出, 是归一化指数函数的输出,即 表示时间段t内区域 的设施需求概率。

9.一种城市分区域内服务设施需求识别系统,其特征在于:采用如权利要求1‑8中任一项所述的一种城市分区域内服务设施需求识别方法进行服务设施需求识别。

说明书 :

一种城市分区域内服务设施需求识别方法及系统

技术领域

[0001] 本发明涉及城市规划技术领域,具体涉及一种城市分区域内服务设施需求识别方法及系统。

背景技术

[0002] 城市是由土地空间、建筑设施和居民用户等组成的一个有机整体,城市的不断发展会逐步培育出不同的功能区域,例如教育区、商业区、工业区或居住区等,此外城市有着天然的行政区域划分,城市行政管理人员也会对不同区域的功能进行规划和设计。这些由居民的实际活动方式自然形成或管理者人为设计的功能区域,支撑着居民不同的城市工作生活需求,是一种有价值的组织形式,可以构建起整个城市的详细知识,并随着城市的发展而变化。理解城市区域的功能并掌握其变化趋势,根据区域内当前服务设施的配置和分布情况,可以预测服务设施在未来的需求或不足等情况,从而做到提前预知与提早规划,对服务城市居民和完善城市建设都有积极的作用。
[0003] 服务设施一般包括了公共设施(如公共卫生间、共享自行车点和快递物流网点等)以及商业设施(如充电桩、商店和餐厅等)。城市区域服务设施的需求分析,需要考虑和评估一系列的影响因素,比如路网结构、交通流量、人群流动性、兴趣点和居民社交媒体网络等。这些复杂且变化的特征使得区域需求分析成为了一项非常具有挑战性的任务。传统意义上,城市规划者需要依靠劳动密集型调查来为他们的决策提供信息支持,比如随机发放一定数量的调查问卷或有针对性的排查走访等,然而通过该方法获得的资料可能不够充分和及时。近年来,城市规划者也会利用部分城市大数据来决策,例如道路网络、路网交通流量或居民流动性等,但是,他们缺乏对城市居民日常行为模式的真正理解和运用。居民作为城市的重要组成元素,设施的规划设计终究是要为居民服务的,“人”应当作为一个重要的感知计算单元参与到区域需求的研究过程中。
[0004] 当前城市服务设施的区域需求分析研究工作主要从城市的宏观角度出发,分析城市时空大数据,提取城市区域的多维时空特征,然后再根据区域的流行程度进行推荐与分析。然而,随着传感器技术和位置社交媒体网络的发展应用,居民大量的位置社会化数据被记录下来。当前的研究缺乏从城市居民的微观角度来考虑服务设施的区域需求识别问题,没有深入挖掘用户的时空行为轨迹、服务设施位置签到和社交关系网络活动等数据,也没有充分提取用户社会化活动中相关的地理空间特征以及社会关系的关联特征,从而未能准确分析和了解居民用户还缺少什么设施、需要什么服务。
[0005] 此外,城市的热点区域、服务设施和居民都是变化的,目前区域内设施缺失或不足的需求预测工作没有考虑区域特征数据的稀疏性和动态性等特征,也没有综合利用城市的宏观大数据与居民的微观位置社会化数据。同时,它们还忽略了用户访问服务设施的城市路网轨迹对途经区域设施需求的影响,以及城市宏观规划下不同区域的功能权重与设施限制等问题,从而导致了在区域设施的需求预测上存在着低准确率等问题。

发明内容

[0006] 本发明的目的是提供一种城市分区域内服务设施需求识别方法及系统,考虑区域特征数据的稀疏性和动态性,综合城市宏观大数据与居民微观位置社会化数据,准确预测城市区域缺少的各类服务设施。
[0007] 为了解决上述技术问题,本发明提供了一种城市分区域内服务设施需求识别方法,包括以下步骤:
[0008] S1、基于各级行政区域划分方法对城市区域进行划分,并提取城市区域内的多维度特征;其中,多维度特征包括城市区域内的地理特征、交通特征及现有服务设施分布特征,所述交通特征包括用户轨迹特征;
[0009] S2、根据城市区域划分和提取的多维度特征,构建城市区域空间属性图;其中,所述城市区域空间属性图为城市区域之间的邻接关系所构成的无向图结构,图中的节点为每一个划分后的城市区域,节点之间的无向边表示区域地理空间上的邻接关系;
[0010] S3、采用变分图自编码器对城市区域空间属性图编码,得到城市区域的潜在隐特征;同时,根据城市区域之间的功能相似性,融合Top‑k最相似功能城市区域的潜在隐特征;
[0011] S4、根据用户轨迹特征和用户轨迹目的地附近的服务设施,采用具有时空限制的贝叶斯模型,计算用户轨迹目的地的服务设施访问概率,得到用户轨迹访问特征;
[0012] S5、结合城市区域的潜在隐特征和用户轨迹访问特征,通过多层感知机和归一化指数函数,得到最终的城市区域内服务设施需求概率分布。
[0013] 作为本发明的进一步改进,采用两级的行政区域划分方法对城市区域进行划分,包括:
[0014] 按照第一级行政区域进行划分,在每一个第一级行政区域内再按照第二级行政区域划分,最终划分所有城市区域,其中,第一级行政区域包括市辖区,第二级行政区域包括行政街道、镇和乡。
[0015] 作为本发明的进一步改进,所述地理特征包括:人口面积特征M、区域功能特征B和房地产价格特征V;
[0016] 所述交通特征包括:公共交通特征O和私人交通特征U;其中,所述私人交通特征U包括用户轨迹特征;
[0017] 所述现有服务设施分布特征为对每一个城市区域建立一个基于路网空间距离的网络结构E,网络节点为服务设施类别,网络节点之间的边两两相连,边权重为节点服务设施类别对应的所有具体服务设施之间归一化的平均路网空间距离。
[0018] 作为本发明的进一步改进,所述城市区域空间属性图表示为 ,其中,节点集 是划分的城市区域的集合, , 为邻接矩阵表示节点
之间的邻居关系, 是区域内部代表性的汇总特征矩阵;结
合区域之间的地理邻接关系,城市区域空间属性图 的邻接矩阵 为:

[0019] 作为本发明的进一步改进,所述步骤S3中采用无监督模型中的变分图自编码器将城市区域空间属性图 的原始节点特征映射至低维度的潜在空间,从而得到节点区域的潜在特征嵌入;其中,在变分图自编码的编码阶段,通过两层图卷积,使模型学习得到区域潜在隐特征的正态分布,然后再从正态分布中采样获得真正的区域潜在隐特征表示;在解码阶段,使用向量内积操作,将编码阶段得到的区域潜在隐特征向量重构并还原为城市区域空间属性图的邻接矩阵 。
[0020] 作为本发明的进一步改进,获得真正的区域潜在隐特征表示,具体包括以下步骤:
[0021] 变分图自编码的编码部分包含两层图卷积操作:第一层图卷积将整个区域空间属性图 作为输入,得到低维空间的特征矩阵 ,该过程表示如下:
[0022]
[0023] 其中,为 的对角度矩阵, 是可学习的权重矩阵,激活层使用了ReLU激活函数;
[0024] 根据变分图自编码器的定义,潜在隐特征从一个高斯先验分布中采样得到的,第二层图卷积用于评估该先验分布的两个参数,该层的输入为 和 ,输出为多维高斯分布的均值向量 和协方差矩阵 ,整个计算过程为:
[0025]
[0026] 其中, 为可学习的权重矩阵;
[0027] 在潜在隐特征的生成阶段,采用重参数化技巧近似采样操作:将变量的随机性转移到高斯分布的元变量中,模型通过学习将高斯分布的均值和方差进行调整,要求的区域潜在隐特征表示为:
[0028]
[0029] 其中, 服从标准正态分布 ,则 服从正态分布,先采样一个标准正态分布 ,再通过 变换得到真正的区域潜在隐特征z。
[0030] 作为本发明的进一步改进,根据城市区域之间的功能相似性,融合Top‑k最相似功能城市区域的潜在隐特征,具体包括以下步骤:
[0031] 采用区域功能识别框架DRoF,计算所有区域 对应的功能分布向量 ;
[0032] 令当前的城市区域为 ,计算 和其所在的一级行政区之外其他所有区域 的功能相似度 ;
[0033] 设 是 与 的最短路网距离,则:
[0034]
[0035] 其中, 为 与 的功能分布向量 和 的余弦相似度, 为内两个路网距离最远区域之间的最短路网距离, 则表示 与 之间归一
化的最短路网距离;
[0036] 基于功能相似度 从大到小对所有被评估的区域排序,得到Top‑k最相关功能的区域集合 ;
[0037] 将 内所有的采样隐特征向量与区域 的采样隐特征向量融合,即得到 最终的潜在隐特征向量表示:
[0038]
[0039] 其中, 是所有区域之间共享且可学习的权重参数矩阵,代表区域 与 之间隐特征的相关性; 和 分别代表了区域 与区域 的采样隐特征向量,同时, 本身作为隐特征融合的一部分参与计算。
[0040] 作为本发明的进一步改进,所述步骤S4具体包括以下步骤:
[0041] S41、给定一个用户的时空行为轨迹 ,贝叶斯概率推断模型首先选择轨迹目的地位置点 周围的在路网空间距离阈值 内一系列服务设施作为访问推断候选设施集 , ;
[0042] S42、定义服务设施访问的影响因素:路网距离、服务设施流行时间段、服务设施吸引力和用户访问喜好;综合影响因素因子,令用户 的轨迹为,轨迹目的地位置点 所在的区域是 , ;
[0043] S43、用户 在轨迹目的地区域 内访问了某个服务设施 的概率表示为:
[0044]
[0045] 其中, 为位置点 到服务设施 的最短路网距离,为非负的参数;表示目的地时间戳 对应的前后时间段 内 所
属服务设施类别 的流行度,从整个服务设施签到数据的设施类别分布中得出,其最终值表示为0 1之间的一个归一化权重; 是服务设施 的服务吸引力,通过用户对
~
该服务设施的评价或打分等文本数据中提取分析得出,其最终值表示为0 1之间的一个归~
一化权重; 是用户 对服务设施类别为 的访问喜好程度,从用户对所有
服务设施签到记录中和服务设施类别为 的服务设施的签到之比得出,其最终值表示为0
1之间的一个归一化权重;
~
[0046] S44、根据以上S43中公式,求得用户对行程轨迹目的位置点 附近的距离阈值范围内所有服务设施 的访问概率,再反向推断出用户轨迹对应区域内缺少的服务设施概率;
[0047] S45、综合用户轨迹出发位置点 所在区域的服务设施缺失情况,除了轨迹目的地位置点 所在的区域 之外,轨迹经过的其他所有区域也都认为需求对应的服务设施:令用户 在其行程轨迹 中顺序经过的区域集合为,其中,出发地区域为 ,目的地区域为 , ,则,对于集合
中的每一个区域 ,在时间段 内,服务设施 缺失的概率为 ;
[0048] S46、设在时间段 内, 为所有从区域 出发和经过 的轨迹用户集合,用户 对应的行程轨迹为 ,那么 在时间段 内服务设施 缺失的概率如下:
[0049]
[0050] 其中, 表示在区域 中用户 对应的行程轨迹 里所隐含的服务设施 缺失的概率, 在区域 中用户 对应的行程轨迹 里所隐含
的服务设施 缺失的概率;
[0051] 对于区域 ,得到对应服务设施类别为 的需求概率 ,定义为:
[0052]
[0053] 其中, 代表类别为c的具体服务设施 , 表示类别为c的设施集,表示区域 中类别为c的服务设施 的需求概率, 表示区域 中服
务设施 的需求概率。
[0054] 作为本发明的进一步改进,所述步骤S5具体包括:
[0055] 多层感知机的输入为区域空间潜在隐特征 ,全连接隐藏层的激活部分使用ReLU激活函数,多层感知机的输出通过归一化指数函数Softmax映射得到最终的设施需求概率,在时间区间段t内,该过程表示如下:
[0056]
[0057]
[0058]
[0059] 其中, 表示最终向多层感知机输入的时间段t内区域 的潜在隐特征, 为隐藏层的状态, , , 和 是需要学习的参数, 代表了多层感知机的输出, 是归一化指数函数的输出。
[0060] 一种城市分区域内服务设施需求识别系统,采用如上所述的一种城市分区域内服务设施需求识别方法进行服务设施需求识别。
[0061] 本发明的有益效果:由于城市区域发展的不平衡以及持续建设的需要,本发明采用基于变分图自编码器的区域设施需求预测模型,通过图结构表示城市区域划分的关联关系、除了用户轨迹所在的起止区域外还考虑了轨迹对经过的其他所有城市区域里的设施需求影响情况,能够准确的分析和识别区域内还缺少哪些服务设施;宏观层面,为城市管理者提供科学层面的决策参考,完善城市的功能布局和促进城市的健康发展,并改善城市的环境和交通等问题;微观层面,对于商户和居民,可以最大化城市资源的调配和利用,在提高商家经济收益的同时,也为居民提供了更加便捷的工作和生活服务。

附图说明

[0062] 图1是本发明方法流程示意图。

具体实施方式

[0063] 下面结合附图和具体实施例对本发明作进一步说明,以使本领域的技术人员可以更好地理解本发明并能予以实施,但所举实施例不作为对本发明的限定。
[0064] 参考图1,本发明提供了一种城市分区域内服务设施需求识别方法,包括以下步骤:
[0065] S1、基于各级行政区域划分方法对城市区域进行划分,并提取城市区域内的多维度特征;其中,多维度特征包括城市区域内的地理特征、交通特征及现有服务设施分布特征,所述交通特征包括用户轨迹特征;
[0066] S2、根据城市区域划分和提取的多维度特征,构建城市区域空间属性图;其中,所述城市区域空间属性图为城市区域之间的邻接关系所构成的无向图结构,图中的节点为每一个划分后的城市区域,节点之间的无向边表示区域地理空间上的邻接关系;
[0067] S3、采用变分图自编码器对城市区域空间属性图编码,得到城市区域的潜在隐特征;同时,根据城市区域之间的功能相似性,融合Top‑k最相似功能城市区域的潜在隐特征;
[0068] S4、根据用户轨迹特征和用户轨迹目的地附近的服务设施,采用具有时空限制的贝叶斯模型,计算用户轨迹目的地的服务设施访问概率,得到用户轨迹访问特征;
[0069] S5、结合城市区域的潜在隐特征和用户轨迹访问特征,通过多层感知机和归一化指数函数,得到最终的城市区域内服务设施需求概率分布。
[0070] 城市的热点区域、服务设施和居民都是随着时间动态变化的,同时获取的各类数据也存在着稀疏性和不确定性等情况,为了解决这些问题与不足,从而能够准确的预测城市区域目前缺少的各类服务设施,提出了基于变分图自编码器的区域设施需求预测模型。具体来说,本发明先基于各级行政区划对城市区域进行划分,然后提取区域内的多维度特征,采用变分图自编码器对不确定的区域特征编码,并将每个潜在特征表示为概率分布形式;同时,根据区域之间的功能相似性,进一步融合Top‑k区域的潜在特征;接下来,分析用户轨迹目的地附近设施的特性,采用贝叶斯概率方法推断目的地所访问的具体服务设施;
最后,结合城市区域的潜在特征和用户的轨迹访问特征,通过多层感知机和归一化指数函数,得到最终的区域设施需求概率分布。本发明能够准确的分析和识别区域内还缺少哪些服务设施,从而为城市管理者提供科学层面的决策参考,完善城市的功能布局和促进城市的健康发展,并改善城市的环境和交通等问题;对于商户和居民,可以最大化城市资源的调配和利用,在提高商家经济收益的同时,为居民提供了更加便捷的工作和生活服务。
[0071] 下面通过具体步骤内容展开进行说明本发明包括的实施过程及效果:
[0072] 一、城市区域的划分:
[0073] 在城市的宏观规划中,不同的行政区域通常具有不同的主体功能定位,此外,由于行政管理主体的不同,即使是同一类功能的区域,在不同的行政区划下也可能会有一定的差异。因此,采用两级的行政区域划分方法,首先按照市辖区(一级行政区划)进行划分,然后在每一个市辖区内再按照行政街道(二级行政区划,例如镇、乡等)划分。最终划分后的所有区域集合可以表示为 。
[0074] 二、区域特征的提取与表示:
[0075] 在城市两级行政划分的基础上,从区域的地理和交通统计信息、区域内现有服务设施分布这两大类具有代表性的特征入手进行处理。
[0076] 2.1 人口和面积:
[0077] 人口和面积从宏观层面描述了区域的特性,表示为特征向量M;
[0078] 2.2 区域功能:
[0079] 功能定位是区域的另一个宏观特征,对服务设施规划有着重要的影响。通过城市区域功能识别模型计算,最终得到的区域功能描述通过词嵌入(Word Embedding)技术编码,其特征向量表示为B;
[0080] 2.3 房地产价格:
[0081] 房地产价格是区域价值的一种重要体现,可以用未来时间段内的平均价值变动趋势来表示。采用最小二乘法(Least Squares Method)预测接下来一段时间内(如3个月)的房价变化趋势,并表示为向量形式V;
[0082] 2.4 公共交通:
[0083] 由于便捷和廉价等特性,公共交通是居民出行的首选方式之一,可以用来描述人群流量的整体移动模式。提取区域内的公交线路和地铁线路,以及对应站点的客流量信息,统一表示为向量O;
[0084] 2.5 私人交通:
[0085] 私人交通描述了居民个性化的移动模式,例如出租车和共享单车的行驶轨迹等,它是理解居民出行行为意图的主要数据源之一。通过区域内的轨迹流入量/流出量,以及车辆平均移动速度等信息来描述,特征向量表示为U;
[0086] 2.6 区域服务设施分布网络:
[0087] 为了描述区域内部现有服务设施的空间分布和类别配置等信息,对每一个城市区域建立一个基于路网空间距离的网络结构(图结构)。网络节点是服务设施类别,节点之间的边两两相连,边权重为节点服务设施类别对应的所有具体服务设施之间归一化的平均路网空间距离,形式化的表示为 。 为全连接网络,其中, 表示服务设施类别集合, 是节点的邻接矩阵, 代表两个服务设施类别节点 和 包含的所有服务设施之间的路网平均距离, 为节点的特征矩阵,且 的每个元素都代表了区域内某一类服务设施的总数量。然后,再通过神经网络中的“压平”(Flatten)操作将 转换为向量形式E。
[0088] 接下来,将地理、交通和服务设施分布等统计特征信息连接在一起,综合的描述城市区域,最终的汇总特征向量表示为 。对于某一类的单个向量不对齐情况,可以通过补零的方式将它们都对齐后再合并汇总。
[0089] 三、区域属性图的构建:
[0090] 在城市区域划分和区域特征提取的基础上,创建区域空间属性图,用于区域潜在空间隐特征的学习和表示。区域空间属性图是由城市区域之间的邻接关系所构成的无向图结构,图节点为每一个划分后的城市区域,节点之间的无向边表示区域地理空间上的邻接关系。形式化的定义为 ,其中,节点集 是划分区域的集合, 为邻接矩阵,表示节点之间的邻居关系, 是区域内部代表性的
汇总特征矩阵。结合区域之间的地理邻接关系,区域空间属性图 的邻接矩阵 可以定义为: 。
[0091] 四、用户轨迹目的地访问服务设施推断:
[0092] 居民用户的日常交通出行轨迹一般都代表了他们的移动行为模式,根据用户出行轨迹目的地所要访问的服务设施,可以反向推断出用户的出行计划。然后,汇总区域内所有用户的出行目的地信息,就可以得到该区域(轨迹出发地)和所有经过区域里缺少的服务设施。然而,通过车辆传感器获得的用户出行轨迹数据信息是有限的,一般只包含了路线一系列位置点的GPS信息和时间戳,无法直接获得用户轨迹目的地具体访问的服务设施。因此,采用了一种基于时空限制的贝叶斯模型,计算用户轨迹行程目的地的服务设施访问概率。
[0093] 给定一个用户的行为轨迹 ,贝叶斯概率推断模型首先选择轨迹目的地位置 周围的在路网空间距离阈值 内一系列服务设施作为访问推断候选设施集 , , 。然后,从四个方面考虑服务设施访问
的影响因素:(1)路网距离;(2)服务设施流行时间段;(3)服务设施吸引力;(4)用户访问喜好。综合这四类影响因子,令用户 的轨迹为 ,轨迹目
的地位置 所在的区域是 , 。因此,用户 在轨迹目的地区域 内访问了某个
服务设施 的概率可以表示为:
[0094]
[0095] 其中, 为位置点 到服务设施 的最短路网距离,为非负的参数;表示目的地时间戳 对应的前后时间段 内 所
属服务设施类别 的流行度,从整个服务设施签到数据的设施类别分布中得出,其最终值表示为0 1之间的一个归一化权重; 是服务设施 的服务吸引力,通过用户对
~
该服务设施的评价或打分等文本数据中提取分析得出,其最终值表示为0 1之间的一个归~
一化权重; 是用户 对服务设施类别为 的访问喜好程度,从用户对所有
服务设施签到记录中和服务设施类别为 的签到之比得出,其最终值表示为0 1之间的一~
个归一化权重;
[0096] 根据以上公式,首先可以求得用户对行程轨迹目的位置点 附近的距离阈值范围内所有服务设施 的访问概率,然后再反向推断出用户轨迹对应区域内缺少的服务设施概率。
[0097] 为了提高预测准确性,不仅考虑了用户轨迹出发位置 所在区域的服务设施缺失情况,除了轨迹目的地位置点 所在的区域 之外,轨迹经过的其他所有区域也都认为需求对应的服务设施:令用户 在其行程轨迹 中顺序经过的区域集合为 ,其中,出发地区域为 ,目的地区域为 ,
,则,对于集合 中的每一个区域 ,在时间段 内,服务设施 缺
失的概率为 。设在时间段 内, 为所有从区域 出发和经过 的轨迹用户
集合,用户 对应的行程轨迹为 ,那么 在时间段 内服务设施 缺失的概率可以表示如下:
[0098]
[0099] 其中, 表示在区域 中用户 对应的行程轨迹 里所隐含的服务设施 缺失的概率, 在区域 中用户 对应的行程轨迹 里所隐含
的服务设施 缺失的概率;
[0100] 对于区域 ,也可以得到对应服务设施类别为 的需求概率 ,定义为:
[0101]
[0102] 其中, 代表类别为c的具体服务设施 , 表示类别为c的设施集,表示区域 中类别为c的服务设施 的需求概率, 表示区域 中服
务设施 的需求概率。
[0103] 五、区域特征的嵌入和动态表示:
[0104] 为了处理城市区域众多的原始特征,采用无监督模型中的变分图自编码器(Variational Graph Auto‑Encoder,VGAE),将区域空间属性图 的原始节点特征映射至低维度的潜在空间,从而得到节点区域的潜在特征嵌入,支撑接下来的服务设施需求预测任务。在变分图自编码器的编码阶段,通过两层图卷积,使模型学习得到区域潜在隐特征的正态分布,然后再从这些正态分布中采样获得真正的区域隐特征表示;在解码阶段,使用向量内积操作,将编码阶段得到的区域隐特征向量重构并还原为区域空间属性图 的邻接矩阵 。
[0105] VGAE的编码部分包含两层图卷积操作,第一层图卷积将整个区域空间属性图作为输入,得到低维空间的特征矩阵 ,该过程表示如下:
[0106]
[0107] 其中,为 的对角度矩阵, 是可学习的权重矩阵,激活层使用了ReLU激活函数。
[0108] 根据变分图自编码器的定义,潜在空间隐特征z是从一个高斯先验分布中采样得到的,因此第二层图卷积用于评估这个先验分布的两个参数。该层的输入为 和 ,输出为多维高斯分布的均值向量 和协方差矩阵 ,整个计算过程定义为:
[0109]
[0110] 其中, 为可学习的权重矩阵。
[0111] 在隐特征 的生成阶段,采用重参数化技巧(Reparameterization Trick)近似采样操作。将变量的随机性转移到高斯分布的元变量中,使原先无法求导或不能梯度传播的中间节点可以求导,而模型需要学习的是如何将高斯分布的均值和方差进行调整。要求的隐特征可以表示为:
[0112]
[0113] 其中, 服从标准正态分布 ,那么 也就服从正态分布。因此,先采样一个标准正态分布 ,再通过 变换就可以得到隐特征z。
[0114] 六、潜在特征的融合:
[0115] 基于变分图自编码器对区域空间属性图编码,能够充分利用邻居区域的特征信息,得到节点合适的潜在特征分布表示。然而,由于两层图卷积的局部性,并不能捕捉位于较远空间距离但功能相似的区域之间的关联性。因此,考虑城市区域的全局关系,引入基于全局空间关联的区域特征融合模块,通过整合Top‑k最相似功能区域的特征,使得区域的潜在空间隐特征具有更加完善的表达性。
[0116] 在区域特征的融合过程中,首先使用区域功能识别框架DRoF,计算所有区域对应的功能分布向量 。令当前的城市区域为 ,计算和其所在的一级行政区(市辖区)之外其他所有区域 的功能相似度 。设 是
与 的最短路网距离,那么有:
[0117]
[0118] 其中, 为 与 的功能分布向量 和 的余弦相似度, 为内两个路网距离最远区域之间的最短路网距离, 则表示 与 之间归一化的
最短路网距离。
[0119] 基于功能相似度 从大到小对所有被评估的区域排序,就可以得到Top‑k最相关功能的区域集合 。然后,将它们的采样隐特征向量与区域 的采样隐特征向量融合,即可得到 最终的隐特征向量表示:
[0120]
[0121] 其中, 是所有区域之间共享且可学习的权重参数矩阵,代表了区域 与 之间隐特征的相关性。 和 分别代表了区域 与区域 的采样隐特征向量,同时, 本身作为隐特征融合的一部分参与计算。
[0122] 七、区域服务设施的需求预测:
[0123] 城市区域设施需求预测的目的是分析区域内目前还缺少哪些服务设施,从具体服务设施(Brand)和服务设施类别(Category)两个方面分别预测它们的需求概率分布情况。从设施类别角度考虑,可能有快餐店、学校、加油站或超市等服务设施大类。而从服务设施的角度考虑,则需要预测设施类别里面的具体品牌,例如快餐店可能包含了肯德基、麦当劳、德克士和必胜客等,学校也可能包含了幼儿园、小学和中学等。因此,对于区域设施需求的预测结果,设施类别的概率分布结果为一个向量,每个向量元素代表了一种服务设施类别;服务设施的概率分布结果为一个矩阵,矩阵的每一行为一种设施类别,每一列为一种具体的设施品牌。此外,设施需求预测问题还要考虑时间片的影响,例如,以周次或者月份为时间片,在若干个连续的周次或者若干个月份之间,识别区域内设施需求的概率变化情况。
[0124] 在区域服务设施需求预测模型的输出阶段,采用了具有一个隐藏层的多层感知机(Multi‑Layer Perceptron,MLP)和归一化指数函数(Softmax)以获得最终的概率分布结果。多层感知机的输入为区域潜在空间隐特征 ,全连接隐藏层的激活部分使用了ReLU激活函数,多层感知机的输出通过Softmax映射得到最终的设施需求概率。在时间片t内,该过程表示如下:
[0125]
[0126]
[0127]
[0128] 其中, 表示最终向多层感知机输入的时间段t内区域 的潜在隐特征, 为隐藏层的状态, , , 和 是需要学习的参数, 代表了多层感知机的输出, 是归一化指数函数的输出。
[0129] 近年来,传感器技术和位置社交网络得到了迅速的发展与应用。通过GPS设备,移动对象越来越多的时空轨迹数据都被记录下来,例如出租车、私家车和共享单车等的行驶轨迹数据。此外,社交媒体网络平台的使用也十分普遍,例如新浪微博和豆瓣等,越来越多的用户在这些平台上相互关注并发布了大量的内容数据。这些社交媒体含有关于用户行为的丰富信息,主要包括了以图结构表示的社会网络,代表用户之间的关注关系、相互依赖或交往互动,以及由用户主动生成的位置社交媒体数据,例如签到文本、照片和视频等。因此,充分融合与利用城市的宏观结构大数据和居民的微观行为活动数据,能够准确的预测城市区域目前缺少的服务设施,供城市管理者决策参考使用。
[0130] 本发明还提供了一种城市分区域内服务设施需求识别系统,采用如上所述的一种城市分区域内服务设施需求识别方法进行服务设施需求识别。原理和过程一致,重复之处不再赘述,可根据功能性将系统分为四个模块:
[0131] 输入模块,包括原有服务设施信息输入、城市区域统计信息、城市区域路网信息和用户及公共交通时空轨迹等基本信息输入;
[0132] 预处理模块,包括城市区域的划分、区域特征的提取与表示、区域属性图的构建和用户轨迹目的地访问服务设施推断;
[0133] 图特征嵌入模块,包括区域特征的嵌入和动态表示,以及区域潜在隐特征的融合;
[0134] 需求预测输出模块,用于区域服务设施的需求预测。
[0135] 本发明采用图结构表示城市区域划分的关联关系,使用一种时空限制的贝叶斯模型推断用户轨迹目的地访问设施的概率,变分图自编码器生成区域潜在隐特征的概率分布,除了用户轨迹所在的起止区域外,还考虑了轨迹对经过的其他所有城市区域里的设施需求影响情况,克服了城市的热点区域、服务设施和居民都是随着时间动态变化的,各类数据存在稀疏性和不确定性的问题,准确的分析和识别区域内服务设施,从城市全局视角出发,识别不同区域内的各类服务设施需求,对于城市管理者、商户和居民等都具有重要的意义。
[0136] 以上所述实施例仅是为充分说明本发明而所举的较佳的实施例,本发明的保护范围不限于此。本技术领域的技术人员在本发明基础上所作的等同替代或变换,均在本发明的保护范围之内。本发明的保护范围以权利要求书为准。