一种热点路径的确定方法及设备转让专利

申请号 : CN201410167036.9

文献号 : CN105091889B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 袁明轩曾嘉谭浩宇

申请人 : 华为技术有限公司

摘要 :

本发明实施例公开了一种热点路径的确定方法及设备。本发明实施例方法包括:对获取到的用户轨迹测量数据中的每一条测量路径进行基于隐马尔科夫模型的模糊地图匹配计算,得到每一条测量路径的可选路径集合;利用每一条测量路径的可选路径集合及道路网络的拓扑结构信息确定道路网络的所有路段的车流量数据;利用拓扑结构信息、用户输入的起始位置和目的位置确定候选路径集合;根据所有路段的车流量数据及候选路径集合确定基于概率的热点路径。通过对用户轨迹测量数据进行基于隐马尔科夫模型的模糊地图匹配计算以确定热点路径,能够有效提高热点路径的准确性。

权利要求 :

1.一种热点路径的确定方法,其特征在于,包括:

对获取到的用户轨迹测量数据中的每一条测量路径进行基于隐马尔科夫模型的模糊地图匹配计算,得到所述每一条测量路径的可选路径集合,其中,一所述可选路径集合中包含一测量路径的所有可选路径中归一化匹配概率排在前N的可选路径,所述用户轨迹测量数据为预置时间段内行驶于预置区域的道路网络的用户的轨迹测量数据,所述N为正整数;

利用所述每一条测量路径的可选路径集合及所述道路网络的拓扑结构信息确定所述道路网络的所有路段的车流量数据;

利用所述拓扑结构信息、用户输入的起始位置和目的位置确定候选路径集合,所述候选路径集合中的路径均是以所述起始位置为起点、所述目的位置为终点的路径的集合;

根据所述所有路段的车流量数据及所述候选路径集合确定基于概率的热点路径;

所述根据所述所有路段的车流量数据及所述候选路径集合确定基于概率的热点路径之前还包括:判断所述所有路段的车流量数据是否为非稀疏数据;

若所述所有路段的车流量数据为非稀疏数据,则确定所述所有路段的车流量数据为所述道路网络的路段的车流量数据集合;

若所述所有路段的车流量数据为稀疏数据,则基于多变量线性回归的共同筛选技术,或者基于所述多变量线性回归的共同筛选技术和半监督学习的训练机制填补所述所有路段中属于不可用路段的车流量数据,得到优化后的所有路段的车流量数据,将所述优化后的所有路段的车流量数据作为所述道路网络的路段的车流量数据集合,所述不可用路段是指车流量数据小于预先设置的阈值的路段。

2.根据权利要求1所述的方法,其特征在于,所述基于多变量线性回归的共同筛选技术填补所述所有路段中属于不可用路段的车流量数据,得到优化后的所有路段的车流量数据,包括:将所述所有路段的车流量数据构建为矩阵M,且矩阵M如下所示:

其中,v1,v2,......,vn为所述路段的起点或终点,F12,F13,F1n,......,Fnn均表示路段的车流量数据,其中F11,F22,F33,......,Fnn的值均为0;

对所述矩阵M进行低阶近似分解,将所述矩阵M近似表示为XTX,其中所述X表示矩阵X,所述XT表示矩阵X的转置矩阵;

求解目标函数||M-XTX||2在条件rank(X)

将所述矩阵M中不可用路段的车流量数据用X’T X’中所述不可用路段的车流量数据代替,得到优化后的矩阵M,所述优化后的矩阵M为所述优化后的所有路段的车流量数据。

3.根据权利要求1所述的方法,其特征在于,所述基于所述多变量线性回归的共同筛选技术和半监督学习的训练机制填补所述所有路段中属于不可用路段的车流量数据,得到优化后的所有路段的车流量数据,包括:将所述所有路段的车流量数据构建为矩阵Mi,且矩阵Mi如下所示:

其中,v1,v2,......,vn为所述路段的起点或终点,F12,F13,F1n,......,Fnn均表示路段的车流量数据,其中F11,F22,F33,......,Fnn的值均为0;i的初始值为0,执行以下步骤:对所述矩阵Mi进行低阶近似分解,将所述矩阵Mi近似表示XjTXj,其中所述Xj表示矩阵Xj,所述XjT矩阵为Xj的转置矩阵;

求解目标函数||Mi-XjTXj||在条件rank(Xj)

若所述矩阵Mi中不可用路段的数量大于z,则将所述矩阵Mi中任意z个不可用路段的车流量数据用在Xj’TXj’中对应的不可用路段的车流量数据代替,得到矩阵Mi+1;令i=i+1,返回执行所述对所述矩阵Mi进行低阶近似分解的步骤,所述z为预设阈值;

若所述矩阵Mi中不可用路段的数量小于或等于z,则将所述矩阵Mi中的不可用路段的车流量数据用在Xj’TXj’中所述不可用路段的车流量数据代替,得到矩阵Mi+1,将所述矩阵Mi+1作为优化后的所有路段的车流量数据。

4.根据权利要求1所述的方法,其特征在于,所述对获取到的用户轨迹测量数据中的每一条测量路径进行基于隐马尔科夫模型的模糊地图匹配计算,得到所述每一条测量路径的可选路径集合,包括:根据所述拓扑结构信息计算获取到的用户的轨迹测量数据中的每一条测量路径上的每一个节点的候选匹配边集,所述候选匹配边集为节点可能位于的路段的集合;

利用所述每一条测量路径上的每一个节点的候选匹配边集构建所述每一条测量路径的隐马尔克夫模型,得到所述每一条测量路径的可选路径集合。

5.根据权利要求4所述的方法,其特征在于,所述根据所述道路网络的拓扑结构信息计算所述每一条测量路径上的每一个节点的候选匹配边集,包括:按照如下方式确定测量路径的每一个节点的候选匹配边集:

若测量路径A的节点i的轨迹测量数据为(Xi,Yi,Ti),则节点i的测量位置是(Xi,Yi),假设所述节点i的实际位置是(X′i,Yi'),则计算在所述拓扑结构信息中满足匹配公式的路段,所述满足匹配公式的路段的集合为所述节点i的候选匹配边集,所述候选匹配边集中包含所述节点i可能位于的路段及在所述可能位于的路段的概率;

所述匹配公式为:

P{(Xi,Yi)|(X′i,Y′i)在e上}>θ

其中,Xi表示所述节点i的经度,Yi表示所述节点i的纬度,e表示路段e,P表示概率,θ为预先设置的数值。

6.根据权利要求5所述的方法,其特征在于,所述利用所述每一条测量路径上的每一个节点的候选匹配边集构建所述每一条测量路径的隐马尔克夫模型,得到所述每一条测量路径的可选路径集合包括:按照如下方式确定每一条测量路径的可选路径集合:

利用所述测量路径A上的每一个节点的候选匹配边集构建隐马尔科夫模型,确定所述测量路径A的所有可选路径,所述可选路径上的路段的概率为候选匹配边集中节点在所述路段上的概率;

基于道路网络的拓扑结构信息和测量路径A的每一个节点的候选匹配边集,计算测量路径A上相邻两个节点取不同的候选匹配边时的转换概率;

根据所述测量路径A的每一条可选路径上的路段的概率及所述转换概率计算所述每一条可选路径的匹配概率,所述匹配概率等于可选路径的所有路段的概率及所述可选路径的相连路段之间的转换概率之间的乘积;

从所述所有可选路径中选择匹配概率排在前N的可选路径作为所述测量路径A的可选路径集合,且将所述可选路径集合中的每一条可选路径的匹配概率进行归一化得到所述每一条可选路径的归一化匹配概率。

7.根据权利要求6所述的方法,其特征在于,所述利用所述每一条测量路径的可选路径集合确定所述道路网络的所有路段的车流量数据,包括:确定所述道路网络中的每一条路段在所述所有测量路径的所有的可选路径集合中出现的次数S及S次出现的路段概率的集合,所述S为正整数;

根据所述每一条路段的出现的次数S及S次出现的路段概率的集合计算每一条路段的车流量数据,所述车流量数据中包含路段出现次数为k的概率的集合,所述k的值为1至S。

8.根据权利要求6所述的方法,其特征在于,所述根据所述车流量数据及所述候选路径集合确定基于概率的热点路径包括:从所述车流量数据集合中获取所述候选路径集合中的每一条候选路径的每一条路段的车流量数据;

利用预先设置的函数族计算所述候选路径集合中的候选路径的每一条路段的车流量数据对应的流量分布值;

根据所述每一条路径的每一条路段的车流量数据对应的流量分布值确定基于概率的热点路径。

9.根据权利要求8所述的方法,其特征在于,所述根据所述每一条路径的每一条路段的车流量数据对应的流量分布值确定基于概率的热点路径包括:将所述候选路径集合中的每一条候选路径的所有路段对应的流量分布值按照从小到大的顺序进行排序作为所述每一条候选路径的路径热度;

从所述候选路径集合中选择两条候选路径,分别作为候选路径a和候选路径b,其中,所述候选路径a的路径热度为Freqa,且Freqa=,Freqa中包含La个路段的流量分布值,候选路径b的路径热度Freqb,且Freqb=,Freqb中包含Lb个路段的流量分布值;

判断所述候选路径a的路径热度是否高于所述候选路径b的路径热度;

若存在一个k,且k的取值范围为{1,2,…….,min(La,Lb)},使得Fak

若存在一个k,且k的取值范围为{1,2,…….,min(La,Lb)},使得Fak>Fbk;且对所有小于k的i,满足Fai=Fbi,或者在La>Lb且对于所有小于等于Lb的i,满足Fai=Fbi,其中,k和i均为正整数,则确定候选路径a的路径热度高于候选路径b,且若候选路径集合中包含未被选择过的候选路径,令候选路径b=候选路径c,返回执行所述判断所述候选路径a的路径热度是否高于所述候选路径b的路径热度,所述候选路径c为所述候选路径集合中未被选择过的候选路径,若候选路径集合中不包含未被选择过的候选路径,则确定所述候选路径a为热点路径;

若La=Lb,且k的取值范围为{1,2,…….,La或Lb}时,Fai=Fbi,则确定候选路径a与候选路径b的路径热度相同,且若候选路径集合中包含未被选择过的候选路径,则令候选路径a=候选路径c,返回执行所述判断所述候选路径a的路径热度是否高于所述候选路径b的路径热度,或者,令候选路径b=候选路径c,返回执行所述判断所述候选路径a的路径热度是否高于所述候选路径b的路径热度,所述候选路径c为所述候选路径集合中未被选择过的候选路径;若候选路径集合中不包含未被选择过的候选路径,则确定所述候选路径a或者候选路径b为热点路径。

10.一种热点路径的确定设备,其特征在于,包括:

第一计算单元,用于对获取到的用户轨迹测量数据中的每一条测量路径进行基于隐马尔科夫模型的模糊地图匹配计算,得到所述每一条测量路径的可选路径集合,其中,一所述可选路径集合中包含一测量路径的所有可选路径中归一化匹配概率排在前N的可选路径,所述用户轨迹测量数据为预置时间段内行驶于预置区域的道路网络的用户的轨迹测量数据,所述N为正整数;

第一确定单元,用于在所述第一计算单元得到所述每一条测量路径的可选路径集合之后,利用所述每一条测量路径的可选路径集合及所述道路网络的拓扑结构信息确定所述道路网络的所有路段的车流量数据;

第二确定单元,用于在所述第一确定单元确定所述道路网络的所有路段的车流量数据之后,利用所述拓扑结构信息、用户输入的起始位置和目的位置确定候选路径集合,所述候选路径集合中的路径均是以所述起始位置为起点,所述目的位置为终点的路径的集合;

第三确定单元,用于在所述第二确定单元得到所述候选路径集合之后,根据所述所有路段的车流量数据及所述候选路径集合确定基于概率的热点路径;

判断单元,用于在所述第二确定单元得到所述候选路径集合之后,判断所述所有路段的车流量数据是否为非稀疏数据;

第四确定单元,用于若所述判断单元确定所述所有路段的车流量数据为非稀疏数据,则确定所述所有路段的车流量数据为所述道路网络的路段的车流量数据集合;

第五确定单元,用于若所述判断单元确定所述所有路段的车流量数据为稀疏数据,则基于多变量线性回归的共同筛选技术,或者基于所述多变量线性回归的共同筛选技术和半监督学习的训练机制填补所述所有路段中属于不可用路段的车流量数据,得到优化后的所有路段的车流量数据,将所述优化后的所有路段的车流量数据作为所述道路网络的路段的车流量数据集合,所述不可用路段是指车流量数据小于预先设置的阈值的路段。

11.根据权利要求10所述的设备,其特征在于,所述第五确定单元具体用于:

若所述判断单元确定所述所有路段的车流量数据为稀疏数据,将所述所有路段的车流量数据构建为矩阵M,且矩阵M如下所示:其中,v1,v2,......,vn为所述路段的起点或终点,F12,F13,F1n,......,Fnn均表示路段的车流量数据,其中F11,F22,F33,......,Fnn的值均为0;

对所述矩阵M进行低阶近似分解,将所述矩阵M近似表示为XTX,其中所述X表示矩阵X,所述XT表示矩阵X的转置矩阵;

求解目标函数||M-XTX||2在条件rank(X)

将所述矩阵M中不可用路段的车流量数据用X’TX’中所述不可用路段的车流量数据代替,得到优化后的矩阵M,所述优化后的矩阵M为所述优化后的所有路段的车流量数据。

12.根据权利要求10所述的设备,其特征在于,所述第五确定单元具体用于:

若所述判断单元确定所述所有路段的车流量数据为稀疏数据,将所述所有路段的车流量数据构建为矩阵Mi,且矩阵Mi如下所示:其中,v1,v2,......,vn为所述路段的起点或终点,F12,F13,F1n,......,Fnn均表示路段的车流量数据,其中F11,F22,F33,......,Fnn的值均为0;i的初始值为0,执行以下步骤:对所述矩阵Mi进行低阶近似分解,将所述矩阵Mi近似表示XjTXj,其中所述Xj表示矩阵Xj,所述XjT矩阵为Xj的转置矩阵;

求解目标函数||Mi-XjTXj||在条件rank(Xj)

若所述矩阵Mi中不可用路段的数量大于z,则将所述矩阵Mi中任意z个不可用路段的车流量数据用在Xj’TXj’中对应的不可用路段的车流量数据代替,得到矩阵Mi+1;令i=i+1,返回执行所述对所述矩阵Mi进行低阶近似分解的步骤,所述z为预设阈值;

若所述矩阵Mi中不可用路段的数量小于或等于z,则将所述矩阵Mi中的不可用路段的车流量数据用在Xj’TXj’中所述不可用路段的车流量数据代替,得到矩阵Mi+1,将所述矩阵Mi+1作为优化后的所有路段的车流量数据。

13.根据权利要求10所述的设备,其特征在于,所述第一计算单元包括:

边集计算单元,用于根据所述拓扑结构信息计算获取到的用户的轨迹测量数据中的每一条测量路径上的每一个节点的候选匹配边集,所述候选匹配边集为节点可能位于的路段的集合;

可选路径计算单元,用于在所述边集计算单元得到所述候选匹配边集之后,利用所述每一条测量路径上的每一个节点的候选匹配边集构建所述每一条测量路径的隐马尔克夫模型,得到所述每一条测量路径的可选路径集合。

14.根据权利要求13所述的设备,其特征在于,所述边集计算单元具体用于:

按照如下方式确定测量路径的每一个节点的候选匹配边集:

若测量路径A的节点i的轨迹测量数据为(Xi,Yi,Ti),则节点i的测量位置是(Xi,Yi),假设所述节点i的实际位置是(X′i,Yi'),则计算在所述拓扑结构信息中满足匹配公式的路段,所述满足匹配公式的路段的集合为所述节点i的候选匹配边集,所述候选匹配边集中包含所述节点i可能位于的路段及在所述可能位于的路段的概率;

所述匹配公式为:

P{(Xi,Yi)|(X′i,Y′i)在e上}>θ

其中,Xi表示所述节点i的经度,Yi表示所述节点i的纬度,e表示路段e,P表示概率,θ为预先设置的数值。

15.根据权利要求14所述的设备,其特征在于,所述可选路径计算单元具体用于:

按照如下方式确定每一条测量路径的可选路径集合:

利用所述测量路径A上的每一个节点的候选匹配边集构建隐马尔科夫模型,确定所述测量路径A的所有可选路径,所述可选路径上的路段的概率为候选匹配边集中节点在所述路段上的概率;

基于道路网络的拓扑结构信息和测量路径A的每一个节点的候选匹配边集,计算测量路径A上相邻两个节点取不同的候选匹配边时的转换概率;

根据所述测量路径A的每一条可选路径上的路段的概率及所述转换概率计算所述每一条可选路径的匹配概率,所述匹配概率等于可选路径的所有路段的概率及所述可选路径的相连路段之间的转换概率之间的乘积;

从所述所有可选路径中选择匹配概率排在前N的可选路径作为所述测量路径A的可选路径集合,且将所述可选路径集合中的每一条可选路径的匹配概率进行归一化得到所述每一条可选路径的归一化匹配概率。

16.根据权利要求15所述的设备,其特征在于,所述第一确定单元包括:

第六确定单元,用于在所述第一计算单元得到所述每一条测量路径的可选路径集合之后,确定所述道路网络中的每一条路段在所述所有测量路径的所有的可选路径集合中出现的次数S及S次出现的路段概率的集合,所述S为正整数;

第二计算单元,用于在所述第六确定单元确定所述每一条路段的出现次数S及S次出现的路段概率的集合之后,根据所述每一条路段的出现的次数S及S次出现的路段概率的集合计算每一条路段的车流量数据,所述车流量数据中包含路段出现次数为k的概率的集合,所述k的值为1至S。

17.根据权利要求15所述的设备,其特征在于,所述第三确定单元包括:

获取单元,用于从所述车流量数据集合中获取所述候选路径集合中的每一条候选路径的每一条路段的车流量数据;

第三计算单元,用于在所述获取单元得到所述候选路径集合中的每一条候选路径的每一条路段的车流量数据之后,利用预先设置的函数族计算所述候选路径集合中的候选路径的每一条路段的车流量数据对应的流量分布值;

第六确定单元,用于在所述第三计算单元得到所述每一条路段的车流量数据对应的流量分布值之后,根据所述每一条候选路径的每一条路段的车流量数据对应的流量分布值确定基于概率的热点路径。

18.根据权利要求17所述的设备,其特征在于,所述第六确定单元具体用于:

将所述候选路径集合中的每一条候选路径的所有路段对应的流量分布值按照从小到大的顺序进行排序作为所述每一条候选路径的路径热度;

从所述候选路径集合中选择两条候选路径,分别作为候选路径a和候选路径b,其中,所述候选路径a的路径热度为Freqa,且Freqa=,Freqa中包含La个路段的流量分布值,候选路径b的路径热度Freqb,且Freqb=,Freqb中包含Lb个路段的流量分布值;

判断所述候选路径a的路径热度是否高于所述候选路径b的路径热度;

若存在一个k,且k的取值范围为{1,2,…….,min(La,Lb)},使得Fak

若存在一个k,且k的取值范围为{1,2,…….,min(La,Lb)},使得Fak>Fbk;且对所有小于k的i,满足Fai=Fbi,或者在La>Lb且对于所有小于等于Lb的i,满足Fai=Fbi,其中,k和i均为正整数,则确定候选路径a的路径热度高于候选路径b,且若候选路径集合中包含未被选择过的候选路径,令候选路径b=候选路径c,返回执行所述判断所述候选路径a的路径热度是否高于所述候选路径b的路径热度,所述候选路径c为所述候选路径集合中未被选择过的候选路径,若候选路径集合中不包含未被选择过的候选路径,则确定所述候选路径a为热点路径;

若La=Lb,且k的取值范围为{1,2,…….,La或Lb}时,Fai=Fbi,则确定候选路径a与候选路径b的路径热度相同,且若候选路径集合中包含未被选择过的候选路径,则令候选路径a=候选路径c,返回执行所述判断所述候选路径a的路径热度是否高于所述候选路径b的路径热度,或者,令候选路径b=候选路径c,返回执行所述判断所述候选路径a的路径热度是否高于所述候选路径b的路径热度,所述候选路径c为所述候选路径集合中未被选择过的候选路径;若候选路径集合中不包含未被选择过的候选路径,则确定所述候选路径a或者候选路径b为热点路径。

说明书 :

一种热点路径的确定方法及设备

技术领域

[0001] 本发明涉及网络路径搜索的方法,尤其涉及一种热点路径的确定方法及设备。

背景技术

[0002] 近年来,随着移动网络的爆炸式增长和移动智能设备的广泛应用,移动用户的轨迹数据成为一种重要的大数据来源。用户的轨迹数据又被称为用户时空分布数据。比如用户开着全球定位系统(英文全称为:Global Positioning System,缩写为:GPS)服务的时候,该用户在时空移动的信息就是这个用户的轨迹数据。用户使用移动网络时,基站记录的移动宽带(英文全称为:Mobile Broadband,缩写为:MBB)数据中也含有大量用户的轨迹数据。对用户的轨迹数据进行统计和深度挖掘带来了很多新的商业应用,比如店铺选址、服务推荐、交通管理和地图修复等。这些新的商业应用是当前工业界研究的焦点之一。
[0003] 对于车辆导航服务,对用户的轨迹数据使用热点路径(英文全称为:Most Frequent Path,缩写为:MFP)算法可以得到反映出行群体的集体智慧的最优路径。相比最短路径算法、最快路径算法等仅使用道路属性的算法,热点路径算法得到的路径能够体现多种因素的共同结果,具有更好的用户体验,其中,热点路径是指从出发地到目的地最常被用户使用的路径。但是,在MBB数据集上使用现有的热点路径算法面临着问题,即利用MBB数据确定的用户位置信息仅能精确到100米左右,而现有地图匹配算法难以将这种具有较高误差的数据精确地映射到道路网络上。因此会造成热点路径计算不准确的问题

发明内容

[0004] 本发明实施例提供了一种热点路径的确定方法及设备,用于解决现有技术中的热点路径计算不准确的问题。
[0005] 本发明第一方面提供了一种热点路径的确定方法,包括:
[0006] 对获取到的用户轨迹测量数据中的每一条测量路径进行基于隐马尔科夫模型的模糊地图匹配计算,得到所述每一条测量路径的可选路径集合,其中,一所述可选路径集合中包含一测量路径的所有可选路径中归一化匹配概率排在前N的可选路径,所述用户轨迹测量数据为预置时间段内行驶于预置区域的道路网络的用户的轨迹测量数据,所述N为正整数;
[0007] 利用所述每一条测量路径的可选路径集合及所述道路网络的拓扑结构信息确定所述道路网络的所有路段的车流量数据;
[0008] 利用所述拓扑结构信息、用户输入的起始位置和目的位置确定候选路径集合,所述候选路径集合中的路径均是以所述起始位置为起点,所述目的位置为终点的路径的集合;
[0009] 根据所述所有路段的车流量数据及所述候选路径集合确定基于概率的热点路径。
[0010] 在第一方面第一种可能的实现方式中,所述根据所述所有路段的车流量数据及所述候选路径集合确定基于概率的热点路径之前还包括:
[0011] 判断所述所有路段的车流量数据是否为非稀疏数据;
[0012] 若所述所有路段的车流量数据为非稀疏数据,则确定所述所有路段的车流量数据为所述道路网络的路段的车流量数据集合;
[0013] 若所述所有路段的车流量数据为稀疏数据,则基于多变量线性回归的共同筛选技术,或者基于所述多变量线性回归的共同筛选技术和半监督学习的训练机制填补所述所有路段中属于不可用路段的车流量数据,得到优化后的所有路段的车流量数据,将所述优化后的所有路段的车流量数据作为所述道路网络的路段的车流量数据集合,所述不可用路段是指车流量数据小于预先设置的阈值的路段。
[0014] 结合第一方面第一种可能的实现方式,在第一方面第二种可能的实现方式中,所述基于多变量线性回归的共同筛选技术填补所述所有路段中属于不可用路段的车流量数据,得到优化后的所有路段的车流量数据,包括:
[0015] 将所述所有路段的车流量数据构建为矩阵M,且矩阵M如下所示:
[0016]
[0017] 其中,v1,v2,......,vn为所述路段的起点或终点,F12,F13,F1n,......,Fnn均表示路段的车流量数据,其中F11,F22,F33,......,Fnn的值均为0;
[0018] 对所述矩阵M进行低阶近似分解,将所述矩阵M近似表示为XTX,其中所述X表示矩阵X,所述XT表示矩阵X的转置矩阵;
[0019] 求解目标函数||M-XTX||2在条件rank(X)
[0020] 将所述矩阵M中不可用路段的车流量数据用X’TX’中所述不可用路段的车流量数据代替,得到优化后的矩阵M,所述优化后的矩阵M为所述优化后的所有路段的车流量数据。
[0021] 结合第一方面第一种可能的实现方式,在第一方面第三种可能的实现方式中,所述基于所述多变量线性回归的共同筛选技术和半监督学习的训练机制填补所述所有路段中属于不可用路段的车流量数据,得到优化后的所有路段的车流量数据,包括:
[0022] 将所述所有路段的车流量数据构建为矩阵Mi,且矩阵Mi如下所示:
[0023]
[0024] 其中,v1,v2,......,vn为所述路段的起点或终点,F12,F13,F1n,......,Fnn均表示路段的车流量数据,其中F11,F22,F33,......,Fnn的值均为0;i的初始值为0,执行以下步骤:
[0025] 对所述矩阵Mi进行低阶近似分解,将所述矩阵Mi近似表示XjTXj,其中所述Xj表示矩阵Xj,所述XjT矩阵为Xj的转置矩阵;
[0026] 求解目标函数||Mi-XjTXj||在条件rank(Xj)
[0027] 若所述矩阵Mi中不可用路段的数量大于z,则将所述矩阵Mi中任意z个不可用路段的车流量数据用在Xj’TXj’中对应的不可用路段的车流量数据代替,得到矩阵Mi+1;令i=i+1,返回执行所述对所述矩阵Mi进行低阶近似分解的步骤,所述z为预设阈值;
[0028] 若所述矩阵Mi中不可用路段的数量小于或等于z,则将所述矩阵Mi中的不可用路段T的车流量数据用在Xj’Xj’中所述不可用路段的车流量数据代替,得到矩阵Mi+1,将所述矩阵Mi+1作为优化后的所有路段的车流量数据。
[0029] 结合第一方面或者第一方面第一种可能的实现方式,在第一方面第四种可能的实现方式中,所述对获取到的用户轨迹测量数据中的每一条测量路径进行基于隐马尔科夫模型的模糊地图匹配计算,得到所述每一条测量路径的可选路径集合,包括:
[0030] 根据所述拓扑结构信息计算获取到的用户的轨迹测量数据中的每一条测量路径上的每一个节点的候选匹配边集,所述候选匹配边集为节点可能位于的路段的集合;
[0031] 利用所述每一条测量路径上的每一个节点的候选匹配边集构建所述每一条测量路径的隐马尔克夫模型,得到所述每一条测量路径的可选路径集合。
[0032] 结合第一方面第四种可能的实现方式,在第一方面第五种可能的实现方式中,所述根据所述道路网络的拓扑结构信息计算所述每一条测量路径上的每一个节点的候选匹配边集,包括:
[0033] 按照如下方式确定测量路径的每一个节点的候选匹配边集:
[0034] 若测量路径A的节点i的轨迹测量数据为(Xi,Yi,Ti),则节点i的测量位置是(Xi,Yi),假设所述节点i的实际位置是(Xi',Yi'),则计算在所述拓扑结构信息中满足匹配公式的路段,所述满足匹配公式的路段的集合为所述节点i的候选匹配边集,所述候选匹配边集中包含所述节点i可能位于的路段及在所述可能在路段的概率;
[0035] 所述匹配公式为:
[0036] P{(Xi,Yi)|(X'i,Y'i)在e上}>θ
[0037] 其中,Xi表示所述节点i的经度,Yi表示所述节点i的纬度,e表示路段e,P表示概率,θ为预先设置的数值。
[0038] 结合第一方面第五种可能的实现方式,在第一方面第六种可能的实现方式中,所述利用所述每一条测量路径上的每一个节点的候选匹配边集构建所述每一条测量路径的隐马尔克夫模型,得到所述每一条测量路径的可选路径集合包括:
[0039] 按照如下方式确定每一条测量路径的可选路径集合:
[0040] 利用所述测量路径A上的每一个节点的候选匹配边集构建隐马尔科夫模型,确定所述测量路径A的所有可选路径,所述可选路径上的路段的概率为候选匹配边集中节点在所述路段上的概率;
[0041] 基于道路网络的拓扑结构信息和测量路径A的每一个节点的候选匹配边集,计算测量路径A上相邻两个节点取不同的候选匹配边时的转换概率;
[0042] 根据所述测量路径A的每一条可选路径上的路段的概率及所述转换概率计算所述每一条可选路径的匹配概率,所述匹配概率等于可选路径的所有路段的概率及所述可选路径的相连路段之间的转换概率之间的乘积;
[0043] 从所述所有可选路径中选择匹配概率排在前N的可选路径作为所述测量路径A的可选路径集合,且将所述可选路径集合中的每一条可选路径的匹配概率进行归一化得到所述每一条可选路径的归一化匹配概率。
[0044] 结合第一方面第六种可能的实现方式,在第一方面第七种可能的实现方式中,所述利用所述每一条测量路径的可选路径集合确定所述道路网络的所有路段的车流量数据,包括:
[0045] 确定所述道路网络中的每一条路段在所述所有测量路径的所有的可选路径集合中出现的次数S及S次出现的路段概率的集合,所述S为正整数;
[0046] 根据所述每一条路段的出现的次数S及S次出现的路段概率的集合计算每一条路段的车流量数据,所述车流量数据中包含路段出现次数为k的概率的集合,所述k的值为1至S。
[0047] 结合第一方面第六种可能的实现方式,在第一方面第八种可能的实现方式中,所述根据所述车流量数据及所述候选路径集合确定基于概率的热点路径包括:
[0048] 从所述车流量数据集合中获取所述候选路径集合中的每一条候选路径的每一条路段的车流量数据;
[0049] 利用预先设置的函数族计算所述候选路径集合中的候选路径的每一条路段的车流量数据对应的流量分布值;
[0050] 根据所述每一条路径的每一条路段的车流量数据对应的流量分布值确定基于概率的热点路径。
[0051] 结合第一方面第八种可能的实现方式,在第一方面第九种可能的实现方式中,所述根据所述每一条路径的每一条路段的车流量数据对应的流量分布值确定基于概率的热点路径包括:
[0052] 将所述候选路径集合中的每一条候选路径的所有路段对应的流量分布值按照从小到大的顺序进行排序作为所述每一条候选路径的路径热度;
[0053] 从所述候选路径集合中选择两条候选路径,分别作为候选路径a和候选路径b,其中,所述候选路径a的路径热度为Freqa,且Freqa=,Freqa中包含La个路段的流量分布值,候选路径b的路径热度Freqb,且Freqb=,Freqb中包含Lb个路段的流量分布值;
[0054] 判断所述候选路径a的路径热度是否高于所述候选路径b的路径热度;
[0055] 若存在一个k,且k的取值范围为{1,2,…….,min(La,Lb)},使得Fak
[0056] 若存在一个k,且k的取值范围为{1,2,…….,min(La,Lb)},使得Fak>Fbk;且对所有小于k的i,满足Fai=Fbi,或者在La>Lb且对于所有小于等于Lb的i,满足Fai=Fbi,其中,k和i均为正整数,则确定候选路径a的路径热度高于候选路径b,且若候选路径集合中包含未被选择过的候选路径,令候选路径b=候选路径c,返回执行所述判断所述候选路径a的路径热度是否高于所述候选路径b的路径热度,所述候选路径c为所述候选路径集合中未被选择过的候选路径,若候选路径集合中不包含未被选择过的候选路径,则确定所述候选路径a为热点路径;
[0057] 若La=Lb,且k的取值范围为{1,2,…….,La或Lb}时,Fai=Fbi,则确定候选路径a与候选路径b的路径热度相同,且若候选路径集合中包含未被选择过的候选路径,则令候选路径a=候选路径c,返回执行所述判断所述候选路径a的路径热度是否高于所述候选路径b的路径热度,或者,令候选路径b=候选路径c,返回执行所述判断所述候选路径a的路径热度是否高于所述候选路径b的路径热度,所述候选路径c为所述候选路径集合中未被选择过的候选路径;若候选路径集合中不包含未被选择过的候选路径,则确定所述候选路径a或者候选路径b为热点路径。
[0058] 本发明第二方面提供了一种热点路径的确定设备,包括:
[0059] 第一计算单元,用于对获取到的用户轨迹测量数据中的每一条测量路径进行基于隐马尔科夫模型的模糊地图匹配计算,得到所述每一条测量路径的可选路径集合,其中,一所述可选路径集合中包含一测量路径的所有可选路径中归一化匹配概率排在前N的可选路径,所述用户轨迹测量数据为预置时间段内行驶于预置区域的道路网络的用户的轨迹测量数据,所述N为正整数;
[0060] 第一确定单元,用于在所述第一计算单元得到所述每一条测量路径的可选路径集合之后,利用所述每一条测量路径的可选路径集合及所述道路网络的拓扑结构信息确定所述道路网络的所有路段的车流量数据;
[0061] 第二确定单元,用于在所述第一确定单元确定所述道路网络的所有路段的车流量数据之后,利用所述拓扑结构信息、用户输入的起始位置和目的位置确定候选路径集合,所述候选路径集合中的路径均是以所述起始位置为起点,所述目的位置为终点的路径的集合;
[0062] 第三确定单元,用于在所述第二确定单元得到所述候选路径集合之后,根据所述所有路段的车流量数据及所述候选路径集合确定基于概率的热点路径。
[0063] 在第二方面第一种可能的实现方式中,所述设备还包括:
[0064] 判断单元,用于在所述第二确定单元得到所述候选路径集合之后,判断所述所有路段的车流量数据是否为非稀疏数据;
[0065] 第四确定单元,用于若所述判断单元确定所述所有路段的车流量数据为非稀疏数据,则确定所述所有路段的车流量数据为所述道路网络的路段的车流量数据集合;
[0066] 第五确定单元,用于若所述判断单元确定所述所有路段的车流量数据为稀疏数据,则基于多变量线性回归的共同筛选技术,或者基于所述多变量线性回归的共同筛选技术和半监督学习的训练机制填补所述所有路段中属于不可用路段的车流量数据,得到优化后的所有路段的车流量数据,将所述优化后的所有路段的车流量数据作为所述道路网络的路段的车流量数据集合,所述不可用路段是指车流量数据小于预先设置的阈值的路段。
[0067] 结合第二方面第一种可能的实现方式,在第二方面第二种可能的实现方式中,所述第五确定单元具体用于:
[0068] 若所述判断单元确定所述所有路段的车流量数据为稀疏数据,将所述所有路段的车流量数据构建为矩阵M,且矩阵M如下所示:
[0069]
[0070] 其中,v1,v2,......,vn为所述路段的起点或终点,F12,F13,F1n,......,Fnn均表示路段的车流量数据,其中F11,F22,F33,......,Fnn的值均为0;
[0071] 对所述矩阵M进行低阶近似分解,将所述矩阵M近似表示为XTX,其中所述X表示矩阵X,所述XT表示矩阵X的转置矩阵;
[0072] 求解目标函数||M-XTX||2在条件rank(X)
[0073] 将所述矩阵M中不可用路段的车流量数据用X’TX’中所述不可用路段的车流量数据代替,得到优化后的矩阵M,所述优化后的矩阵M为所述优化后的所有路段的车流量数据。
[0074] 结合第二方面第一种可能的实现方式,在第二方面第三种可能的实现方式中,所述第五确定单元具体用于:
[0075] 若所述判断单元确定所述所有路段的车流量数据为稀疏数据,将所述所有路段的车流量数据构建为矩阵Mi,且矩阵Mi如下所示:
[0076]
[0077] 其中,v1,v2,......,vn为所述路段的起点或终点,F12,F13,F1n,......,Fnn均表示路段的车流量数据,其中F11,F22,F33,......,Fnn的值均为0;i的初始值为0,执行以下步骤:
[0078] 对所述矩阵Mi进行低阶近似分解,将所述矩阵Mi近似表示XjTXj,其中所述Xj表示矩T阵Xj,所述Xj矩阵为Xj的转置矩阵;
[0079] 求解目标函数||Mi-XjTXj||在条件rank(Xj)
[0080] 若所述矩阵Mi中不可用路段的数量大于z,则将所述矩阵Mi中任意z个不可用路段T的车流量数据用在Xj’Xj’中对应的不可用路段的车流量数据代替,得到矩阵Mi+1;令i=i+
1,返回执行所述对所述矩阵Mi进行低阶近似分解的步骤,所述z为预设阈值;
[0081] 若所述矩阵Mi中不可用路段的数量小于或等于z,则将所述矩阵Mi中的不可用路段的车流量数据用在Xj’TXj’中所述不可用路段的车流量数据代替,得到矩阵Mi+1,将所述矩阵Mi+1作为优化后的所有路段的车流量数据。
[0082] 结合第二方面或者第二方面第一种可能的实现方式,在第二方面第四种可能的实现方式中,所述第一计算单元包括:
[0083] 边集计算单元,用于根据所述拓扑结构信息计算获取到的用户的轨迹测量数据中的每一条测量路径上的每一个节点的候选匹配边集,所述候选匹配边集为节点可能位于的路段的集合;
[0084] 可选路径计算单元,用于在所述边集计算单元得到所述候选匹配边集之后,利用所述每一条测量路径上的每一个节点的候选匹配边集构建所述每一条测量路径的隐马尔克夫模型,得到所述每一条测量路径的可选路径集合。
[0085] 结合第二方面第四种可能的实现方式,在第二方面第五种可能的实现方式中,所述边集计算单元具体用于:
[0086] 按照如下方式确定测量路径的每一个节点的候选匹配边集:
[0087] 若测量路径A的节点i的轨迹测量数据为(Xi,Yi,Ti),则节点i的测量位置是(Xi,Yi),假设所述节点i的实际位置是(Xi',Yi'),则计算在所述拓扑结构信息中满足匹配公式的路段,所述满足匹配公式的路段的集合为所述节点i的候选匹配边集,所述候选匹配边集中包含所述节点i可能位于的路段及在所述可能在路段的概率;
[0088] 所述匹配公式为:
[0089] P{(Xi,Yi)|(X'i,Y'i)在e上}>θ
[0090] 其中,Xi表示所述节点i的经度,Yi表示所述节点i的纬度,e表示路段e,P表示概率,θ为预先设置的数值。
[0091] 结合第二方面第五种可能的实现方式,在第二方面第六种可能的实现方式中,所述可选路径计算单元具体用于:
[0092] 按照如下方式确定每一条测量路径的可选路径集合:
[0093] 利用所述测量路径A上的每一个节点的候选匹配边集构建隐马尔科夫模型,确定所述测量路径A的所有可选路径,所述可选路径上的路段的概率为候选匹配边集中节点在所述路段上的概率;
[0094] 基于道路网络的拓扑结构信息和测量路径A的每一个节点的候选匹配边集,计算测量路径A上相邻两个节点取不同的候选匹配边时的转换概率;
[0095] 根据所述测量路径A的每一条可选路径上的路段的概率及所述转换概率计算所述每一条可选路径的匹配概率,所述匹配概率等于可选路径的所有路段的概率及所述可选路径的相连路段之间的转换概率之间的乘积;
[0096] 从所述所有可选路径中选择匹配概率排在前N的可选路径作为所述测量路径A的可选路径集合,且将所述可选路径集合中的每一条可选路径的匹配概率进行归一化得到所述每一条可选路径的归一化匹配概率。
[0097] 结合第二方面第六种可能的实现方式,在第二方面第七种可能的实现方式中,所述第一确定单元包括:
[0098] 第六确定单元,用于在所述第一计算单元得到所述每一条测量路径的可选路径集合之后,确定所述道路网络中的每一条路段在所述所有测量路径的所有的可选路径集合中出现的次数S及S次出现的路段概率的集合,所述S为正整数;
[0099] 第二计算单元,用于在所述第六确定单元确定所述每一条路段的出现次数S及S次出现的路段概率的集合之后,根据所述每一条路段的出现的次数S及S次出现的路段概率的集合计算每一条路段的车流量数据,所述车流量数据中包含路段出现次数为k的概率的集合,所述k的值为1至S。
[0100] 结合第二方面第七种可能的实现方式,在第二方面第八种可能的实现方式中,所述第三确定单元包括:
[0101] 获取单元,用于在所述第四确定单元或者所述第五确定单元之后,从所述车流量数据集合中获取所述候选路径集合中的每一条候选路径的每一条路段的车流量数据;
[0102] 第三计算单元,用于在所述获取单元得到所述候选路径集合中的每一条候选路径的每一条路段的车流量数据之后,利用预先设置的函数族计算所述候选路径集合中的候选路径的每一条路段的车流量数据对应的流量分布值;
[0103] 第六确定单元,用于在所述第三计算单元得到所述每一条路段的车流量数据对应的流量分布值之后,根据所述每一条路径的每一条路段的车流量数据对应的流量分布值确定基于概率的热点路径。
[0104] 结合第二方面第八种可能的实现方式,在第二方面第九种可能的实现方式中,所述第六确定单元具体用于:
[0105] 将所述候选路径集合中的每一条候选路径的所有路段对应的流量分布值按照从小到大的顺序进行排序作为所述每一条候选路径的路径热度;
[0106] 从所述候选路径集合中选择两条候选路径,分别作为候选路径a和候选路径b,其中,所述候选路径a的路径热度为Freqa,且Freqa=,Freqa中包含La个路段的流量分布值,候选路径b的路径热度Freqb,且Freqb=,Freqb中包含Lb个路段的流量分布值;
[0107] 判断所述候选路径a的路径热度是否高于所述候选路径b的路径热度;
[0108] 若存在一个k,且k的取值范围为{1,2,…….,min(La,Lb)},使得Fak
[0109] 若存在一个k,且k的取值范围为{1,2,…….,min(La,Lb)},使得Fak>Fbk;且对所有小于k的i,满足Fai=Fbi,或者在La>Lb且对于所有小于等于Lb的i,满足Fai=Fbi,其中,k和i均为正整数,则确定候选路径a的路径热度高于候选路径b,且若候选路径集合中包含未被选择过的候选路径,令候选路径b=候选路径c,返回执行所述判断所述候选路径a的路径热度是否高于所述候选路径b的路径热度,所述候选路径c为所述候选路径集合中未被选择过的候选路径,若候选路径集合中不包含未被选择过的候选路径,则确定所述候选路径a为热点路径;
[0110] 若La=Lb,且k的取值范围为{1,2,…….,La或Lb}时,Fai=Fbi,则确定候选路径a与候选路径b的路径热度相同,且若候选路径集合中包含未被选择过的候选路径,则令候选路径a=候选路径c,返回执行所述判断所述候选路径a的路径热度是否高于所述候选路径b的路径热度,或者,令候选路径b=候选路径c,返回执行所述判断所述候选路径a的路径热度是否高于所述候选路径b的路径热度,所述候选路径c为所述候选路径集合中未被选择过的候选路径;若候选路径集合中不包含未被选择过的候选路径,则确定所述候选路径a或者候选路径b为热点路径。
[0111] 从以上技术方案可以看出,本发明实施例具有以下优点:
[0112] 对获取到的用户轨迹测量数据中的每一条测量路径进行基于隐马尔科夫模型的模糊地图匹配计算,得到每一条测量路径的可选路径集合,一个可选路径集合中包含了一条测量路径的所有可选路径中归一化匹配概率排在前N的可选路径,且将利用每一条测量路径的可选路径集合及道路网络的拓扑结构信息确定该道路网络的所有路段的车流量数据,利用该拓扑结构信息、用户输入的起始位置及目的位置确定候选路径集合,根据该所有路段的车流量数据及候选路径集合确定基于概率的热点路径,通过对用户轨迹测量数据进行基于隐马尔科夫模型的模糊地图匹配计算,得到每一条测量路径的可选路径集合,保留了用户轨迹测量数据中的一部分不确定信息,得到所有可能匹配的路径分布,能够有效提高热点路径的准确性。

附图说明

[0113] 图1为本发明实施例中热点路径的确定方法的一个示意图;
[0114] 图2为本发明实施例中热点路径的确定方法的另一示意图;
[0115] 图3为本发明实施例中热点路径的确定装置的一个示意图;
[0116] 图4为本发明实施例中热点路径的确定装置的另一示意图;
[0117] 图5为本发明实施例中热点路径的确定装置的另一示意图。

具体实施方式

[0118] 本发明实施例提供了一种热点路径的确定方法及设备,用于解决现有技术中的热点路径计算不准确的问题。
[0119] 下面通过具体实施例,分别进行详细的说明。
[0120] 为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
[0121] 本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0122] 请参阅图1,为本发明实施例中一种热点路径的确定方法的实施例,包括:
[0123] 101、对获取到的用户轨迹测量数据中的每一条测量路径进行基于隐马尔科夫模型的模糊地图匹配计算,得到每一条测量路径的可选路径集合;
[0124] 在本发明实施例中,热点路径的确定设备(简称:设备)可从服务器获取到用户轨迹测量数据,其中,设备从服务器获取到的用户轨迹测量数据为预置时间段内经过预置区域的道路网路的用户的轨迹测量数据,用户的轨迹测量数据是指用户在道路网络的行驶过程中所经过的路段的位置信息及时间信息等,例如:若汽车用户A驾车处于深圳市区内,则该汽车用户A的汽车上的用于确定热点路径的设备可以从服务器上获取在半个小时内行驶于深圳市区的道路网络的用户的轨迹测量数据。
[0125] 在本发明实施例中,设备科对获取到的用户轨迹测量数据中的每一条测量路径进行基于隐马尔科夫模型的模糊地图匹配计算,得到每一条测量路径的可选路径集合,其中,一可选路径集合中包含一测量路径的所有可选路径中归一化匹配概率排在前N的可选路径,且该N为正整数。
[0126] 通过基于隐马尔科夫模型进行模糊地图匹配计算可在得到的可选路径集合中保留用户轨迹测量数据的部分不确定性,得到所有可能匹配的路径分布,使得利用测量路径的可选路径集合得到的热点路径能够更加准确及有效。
[0127] 102、利用每一条测量路径的可选路径集合及道路网络的拓扑结构信息确定道路网络的所有路段的车流量数据;
[0128] 在本发明实施例中,设备在基于隐马尔科夫模型进行模糊地图匹配计算,得到每一条测量路径的可选路径集合之后,将利用每一条测量路径的可选路径集合及道路网络的拓扑结构信息确定道路网络的所有路段的车流量数据。
[0129] 103、利用拓扑结构信息、用户输入的起始位置和目的位置确定候选路径集合,候选路径集合中的路径均是以起始位置为起点,目的位置为终点的路径的集合;
[0130] 在本发明实施例中,设备将利用该道路网络的拓扑结构信息,用户输入的起始位置和目的位置确定候选路径集合,且该候选路径集合中的路径均是以起始位置为起点,目的位置为终端的路径的集合。例如:用户在使用该设备查找路线时,可输入起始位置为国贸大厦,目的位置为世界之窗,则该设备可利用网络道路的拓扑结构信息确定从国贸大厦至世界之窗可选的路径,即确定候选路径集合。
[0131] 104、根据所有路段的车流量数据及候选路径集合确定基于概率的热点路径。
[0132] 在本发明实施例中,设备在确定用户输入的起始位置和目的位置的候选路径集合之后,可根据所有路段的车流量数据及候选路径集合确定基于概率的热点路径。
[0133] 在本发明实施例中,设备对获取到的用户轨迹测量数据中的每一条测量路径进行基于隐马尔科夫模型的模糊地图匹配计算,得到每一条测量路径的可选路径集合,且将利用每一条测量路径的可选路径集合及道路网络的拓扑结构信息确定该道路网络的所有路段的车流量数据,利用该拓扑结构信息、用户输入的起始位置及目的位置确定候选路径集合,根据该所有路段的车流量数据及候选路径集合确定基于概率的热点路径,通过对用户轨迹测量数据进行基于隐马尔科夫模型的模糊地图匹配计算,得到每一条测量路径的可选路径集合,保留了用户轨迹测量数据中的一部分不确定信息,能够有效提高热点路径的准确性。
[0134] 为了更好地理解本发明实施例中热点路径的确定方法的技术方案,请参阅图2,为本发明实施例中一种热点路径的确定方法的实施例,包括:
[0135] 201、根据拓扑结构信息计算获取到的用户轨迹测量数据中的每一条测量路径上的每一个节点的候选匹配边集,候选匹配边集为节点可能位于的路段的集合;
[0136] 在本发明实施例中,用户轨迹测量数据中的测量路径由多个节点构成,该节点为实际节点,设备在获取到用户轨迹测量数据之后,将根据道路网络的拓扑结构信息计算用户轨迹测量数据中的每一条测量路径上的每一个节点的候选匹配边集,其中,候选匹配边集为节点可能位于的路段的集合。
[0137] 在本发明实施例中,设备将按照如下方式确定用户轨迹测量数据中的每一条测量路径上的每一个节点的候选匹配边集,以测量路径A的节点i为例:
[0138] 1)若测量路径A的节点i的轨迹测量数据为(Xi,Yi,Ti),则节点i的测量位置是(Xi,Yi),测量时间为Ti,假设节点i的实际位置是(Xi',Yi'),则计算在拓扑结构信息中满足匹配公式的路段,满足匹配公式的路段的集合为节点i的候选匹配边集,候选匹配边集中包含节点i可能位于的路段及在可能位于的路段的概率;
[0139] 其中,匹配公式为:
[0140] P{(Xi,Yi)|(X'i,Y'i)在e上}>θ
[0141] 其中,Xi表示节点i的经度,Yi表示节点i的纬度,e表示路段e,P表示概率,θ为预先设置的数值。
[0142] 通过上述的匹配公式,设备可计算每一条测量路径上的每一个节点的候选匹配边集。
[0143] 202、利用每一条测量路径上的每一个节点的候选匹配边集构建每一条测量路径的隐马尔克夫模型,基于隐马尔科夫模型进行模糊地图匹配计算,得到每一条测量路径的可选路径集合;
[0144] 在本发明实施例中,设备得到轨迹测量数据中的所有节点分别对应的候选匹配边集之后,将利用每一条测量路径上的每一个节点的候选匹配边集构建该测量路径的隐马尔科夫模型,以进行模糊地图匹配计算,基于隐马尔科夫模型进行模糊地图匹配计算,得到每一条测量路径的可选路径集合。
[0145] 在本发明实施例中,设备可按照如下方式确定每一条测量路径的可选路径集合,以测量路径A为例:
[0146] 1)设备利用测量路径A上的每一个节点的候选匹配边集构建隐马尔科夫模型,确定测量路径A的所有可选路径,可选路径上的路段的概率为候选匹配边集中节点在路段上的概率,因此,设备可以得到测量路径A的所有可选路径及每一条可选路径的每一条路段的概率。
[0147] 2)基于道路网络的拓扑结构信息和测量路径A的每一个节点的候选匹配边集,计算测量路径A上相邻两个节点取不同的候选匹配边时的转换概率;
[0148] 在本发明实施例中,设备将基于道路网络的拓扑结构信息和测量路径A的每一个节点的候选匹配边集,计算测量路径A相邻两个节点取不同的候选匹配边时的转换概率,例如:例如:若测量路径A的节点轨迹为a1->a2->a3,且节点a1的候选匹配边集包括候选匹配边e1和e2,节点a2的候选匹配边集包括候选匹配边e3、e4和e5,节点a3的候选匹配边集为包括候选匹配边e6。则需要基于道路网络的拓扑结构信息分别计算e1->e3、e1->e4、e1->e5、e2->e3、e2->e4、e2->e5、e3->e6、e4->e6、e5->e6的转换概率。
[0149] 其中,候选匹配边集是对应原始的测量路径中的节点的,两个候选边之间的转换概率由距离和时间决定。例如,以节点a1到a2的可选路径e1到e3为例,将a1投影到e1上得到点b1,即b1是边e1上离a1最近的点;类似地,将a2投影到e3上得到点b2。对于a1到a2这条原始测量路段而言,候选匹配边e1到e3的转换概率由b1到b2的最短路径长度L,以及所用时间Δt决定,其中,最短路径长度可根据b1和b2在道路网络的拓扑结构信息中的具体位置确定。具体地,通常认为车辆速度满足正态分布N(V,dv),其中V、dv分别为所有车辆的平均速度和方差(该平均速度和方差的计算为现有技术,此处不做赘述),则从b1到b2的速度为V’=L/Δt,因此e1到e3的转换概率为V’在正态分布N(V,dv)下的概率,即
其中 为正态分布的概率密度函数。
[0150] 按照上述方式,可得到测量路径A上的两个相邻节点取不同的候选匹配边时的转换概率。
[0151] 3)根据测量路径A的每一条可选路径上的路段的概率及转换概率计算每一条可选路径的匹配概率,匹配概率等于可选路径的所有路段的概率及可选路径的相连路段之间的转换概率之间的乘积;例如:候选路径为:e3→e4→e4→e3,该候选路径的匹配概率为:P{e3→e4→e4→e3}=P{(x1,y1)|(x1’,y1’)在e3上}×P34(t2-t1)×P{(x2,y2)|(x2’,y2’)在e4上}×P44(t3-t2)×P{(x3,y3)|(x3’,y3’)在e4上}×P43(t4-t3)×P{(x4,y4)|(x4’,y4’)在e3上},其中P{(x1,y1)|(x1’,y1’)在e3上}表示t1时间测量路径上的测量点在e3上的概率,P34(t2-t1)表示e3与e4之间在时间间隔t2-t1的时间段的转换概率,其他的含义可以以此类推。
[0152] 4)从所有可选路径中选择匹配概率排在前N的可选路径作为测量路径A的可选路径集合,且将可选路径集合中的每一条可选路径的匹配概率进行归一化得到每一条可选路径的归一化匹配概率。例如:测量路径A的可选路径集合表示为H={(path1,p1),(path2,p2),……,(pathn,pn)},其中,p1+p2+……+pn=1,其中,path表示可选路径,p表示可选路径的匹配概率。
[0153] 请参阅2,为本发明实施例中一条测量路径的基于隐马尔科夫模型的模糊地图匹配算法得到候选路径的示例图,其中,t1,t2,t3,t4分别表示测量路径上的测量时间不同的四个节点,虚线和实线构成测量路径上的所有路径集合,其中,实线构成测量路径的可选路径集合,且在图2中,测量路径的可选路径集合包含六条可选路径,分别为:e3→e1→e1→e1,e3→e1→e1→e1,e3→e1→e3→e1,e3→e1→e3→e3,e3→e4→e3→e1,e3→e4→e3→e3,e3→e4→e4→e3。
[0154] 通过上述步骤1)至4),可实现基于隐马尔科夫模型的模糊地图匹配计算。
[0155] 203、确定道路网络中的每一条路段在所有测量路径的所有的可选路径集合中出现的次数S及S次出现的路段概率的集合,S为正整数;
[0156] 在本发明实施例中,设备在得到用户轨迹测量数据中的每一条测量路径的可选路径集合之后,将基于道路网络的拓扑结构信息确定道路网络中的每一条路段在所有测量路径的所有可选路径集合中出现的次数S及S次出现路段概率的集合。
[0157] 204、根据每一条路段的出现的次数S及S次出现的路段概率的集合计算每一条路段的车流量数据,车流量数据中包含路段出现次数为k的概率的集合,k的值为1至S;
[0158] 在本发明实施例中,设备将根据道路网络的网络拓扑结构中的每一条路段出现的次数S及S次出现的路段概率的集合计算每一条路段的车流量数据,且车流量数据中将包含该路段出现次数为K的概率的集合,其中,K为1至S,例如:若路段出现的次数S为5次,则将分别计算该路段出现1次的概率,出现2次的概率,出现3次的概率,出现4次的概率及出现5次的概率,且构成该路段的车流量数据。例如:路段eij的起点和终点分别为vi和vj,则可以使用Fij=(f0,f1,……,fs)表示路段eij的车流量数据,其中,fk表示路段eij的出现次数(实际流量)为k的概率,且为了更好的理解本发明实施例中的车流量数据,以计算路段eij的车流量数据为例描述车流量数据的计算方式:若路段eij出现的次数为3次,且3次的路段概率的集合为(p1,p2,p3),则f0=(1-p1)(1-p2)(1-p3),f1=p1(1-p2)(1-p3)+p2(1-p1)(1-p3)+p3(1-p1)(1-p2),f2=p1*p2(1-p3)+p1*(1-p2)*p3+(1-p1)*p2*p3,f3=p1*p2*p3。通过利用上述的车流量数据的计算方式,能够实现以概率方式描述路段的流量的目的。
[0159] 205、判断所有路段的车流量数据是否为非稀疏数据,若是,则执行步骤206、若否,则执行步骤207;
[0160] 206、确定所有路段的车流量数据为道路网络的路段的车流量数据集合,继续执行步骤208;
[0161] 207、基于多变量线性回归的共同筛选技术,或者基于多变量线性回归的共同筛选技术和半监督学习的训练机制填补所有路段中属于不可用路段的车流量数据,得到优化后的所有路段的车流量数据,将优化后的所有路段的车流量数据作为道路网络的路段的车流量数据集合,继续执行步骤208;
[0162] 在本发明实施例中,在所有路段的车流量数据为稀疏数据的情况下,设备利用该所有路段的车流量数据将存在无法确定热点路径的可能,因此,为了避免因数据稀疏导致的无法确定热点路径的问题,设备将对所有路段的车流量数据是否为非稀疏数据进行判断,且若所有路段的车流量数据为非稀疏数据,则确定该所有路段的车流量数据为道路网络的路段的车流量数据集合。
[0163] 若所有路段的车流量数据为稀疏数据,则设备将基于多变量线性回归的共同筛选技术,或者基于多变量线性回归的共同筛选技术和半监督学习的训练机制调补该所有路段中属于不可用路段的车流量数据,得到优化后的所有路段的车流量数据,并将优化后的所有路段的车流量数据作为道路网络的车流量数据集合,其中,不可用路段是指车流量数据小于预先设置的阈值的路段,例如:路段在所有测量路径的所有候选路径集合中出现的次数小于或等于10次。
[0164] 在本发明实施例中,设备在确定所有路段的车流量数据为稀疏数据后,可基于多变量线性回归的共同筛选技术填补该所有路段中属于不可用路段的车流量数据,具体的,可采用如下方式:
[0165] 设备将所有路段的车流量数据构建为矩阵M,且矩阵M如下所示:
[0166]
[0167] 其中,v1,v2,......,vn为路段的起点或终点,F12,F13,F1n,......,Fnn均表示路段的车流量数据,其中F11,F22,F33,......,Fnn的值均为0;
[0168] 对矩阵M进行低阶近似分解,将矩阵M近似表示为XTX,其中X表示矩阵X,XT表示矩阵X的转置矩阵;
[0169] 求解目标函数||M-XTX||2在条件rank(X)
[0170] 将矩阵M中不可用路段的车流量数据用X’T X’中不可用路段的车流量数据代替,得到优化后的矩阵M,优化后的矩阵M为优化后的所有路段的车流量数据。
[0171] 在本发明实施例中,设备在确定所有路段的车流量数据为稀疏数据后,可基于多变量线性回归的共同筛选技术和半监督学习的训练机制填补所有路段中属于不可用路段的车流量数据,得到优化后的所有路段的车流量数据,包括:
[0172] 设备将所有路段的车流量数据构建为矩阵Mi,且矩阵Mi如下所示:
[0173]
[0174] 其中,v1,v2,......,vn为路段的起点或终点,F12,F13,F1n,......,Fnn均表示路段的车流量数据,其中F11,F22,F33,......,Fnn的值均为0;i的初始值为0,执行以下步骤:
[0175] 设备对矩阵Mi进行低阶近似分解,将矩阵Mi近似表示XjTXj,其中Xj表示矩阵Xj,XjT矩阵为Xj的转置矩阵;
[0176] 接着,设备将求解目标函数||Mi-XjTXj||在条件rank(Xj)
[0177] 若矩阵Mi中不可用路段的数量大于z,则将矩阵Mi中任意z个不可用路段的车流量数据用在Xj’TXj’中对应的不可用路段的车流量数据代替,得到矩阵Mi+1;令i=i+1,返回执行对矩阵Mi进行低阶近似分解的步骤;
[0178] 若矩阵Mi中不可用路段的数量小于或等于z,则将矩阵Mi中的不可用路段的车流量数据用在Xj’TXj’中该不可用路段的车流量数据代替,得到矩阵Mi+1,将矩阵Mi+1作为优化后的所有路段的车流量数据。例如:若Mi中的F12为不可用路段的数据,则使用Xj’TXj’中F12替换Mi中的F12。
[0179] 208、利用拓扑结构信息、用户输入的起始位置和目的位置确定候选路径集合,候选路径集合中的路径均是以起始位置为起点,目的位置为终点的路径的集合;
[0180] 在本发明实施例中,设备在得到道路网络的车流量数据集合之后,将利用拓扑结构信息,用户输入的起始位置和目的位置确定候选路径集合,候选路径集合中的路径均是以起始位置为起点,目的位置为终端的路径的集合,使得设备可利用道路网络的车流量数据集合从候选路径集合中选择热点路径。
[0181] 209、从车流量数据集合中获取候选路径集合中的每一条候选路径的每一条路段的车流量数据;
[0182] 在本发明实施例中,设备在得到道路网路的车流量数据集合及候选路径集合之后,将从车流量数据集合中获取候选路径集合中的每一条候选路径的每一条路段的车流量数据。
[0183] 210、根据候选路径集合中的候选路径的路段的车流量数据及预先设置的函数族确定基于概率的热点路径。
[0184] 在本发明实施例中,函数族coma-α是用于两条路径之间比较概率大小的,其中,参数α的范围为[0,1]。
[0185] 其中,根据候选路径集合中的候选路径的路段的车流量数据及预先设置的函数族确定基于概率的热点路径具体可以为:
[0186] 1)设备将候选路径集合中的每一条候选路径的所有路段的车流量数据根据预先设置的函数族进行比较,按照车流量数据从小到大的顺序进行排序,作为每一条候选路径的路径热度;
[0187] 具体的,以路段e1和路段e2进行概率比较为例进行说明,路段e1和路段e2的车流量数据分别为F1和F2,利用F1和F2计算P1和P2,其中,P1表示路段e1的车流量数据F1大于路段e2的车流量数据F2的概率,可表示为:P1=P{Actual Flow(e1)
[0188] 具体的:令F1=(f0,f1,……,fs),F2=(g0,g1,……,gt)
[0189] 则
[0190]
[0191] 其中,0<=i<=s,0<=j<=t。
[0192] 其中,利用族函数comp-α比较路段e1和路段e2的车流量数据F1和F2的大小,具体为:
[0193] 若|P1-P2|>α,且P1>P2时,Comp-α(F1,F2)的值为-1,即F1α,且P1F2;其他情况下,Comp-α(F1,F2)的值为0,即F1=F2。
[0194] 通过上述方式可以对候选路径的所有路段的车流量数据进行概率比较,按照车流量数据从小到大的顺序进行排序,例如:候选路径包含路段a,b,c,d,e,则可先将路段a的车流量数据分别与路段b,c,d,e的车流量数据进行比较,将路段b的车流量数据分别与路段c,d,e的车流量数据进行比较,将路段c的车流量数据分别与路段d、路段e的车流量数据进行比较,将路段d的车流量数据与路段e的车流量数据进行比较,结合所有的比较结果,即可确定路段a,b,c,d,e的车流量数据从小到大的排序,将该排序结果作为候选路径的路径热度。
[0195] 2)从候选路径集合中选择两条候选路径,分别作为候选路径a和候选路径b,其中,候选路径a的路径热度为Freqa,且Freqa=,Freqa中包含La个路段的车流量数据,候选路径b的路径热度Freqb,且Freqb=,Freqb中包含Lb个路段的车流量数据;
[0196] 判断候选路径a的路径热度是否高于候选路径b的路径热度;
[0197] 若存在一个k,且k的取值范围为{1,2,…….,min(La,Lb)},使得Fak
[0198] 若存在一个k,且k的取值范围为{1,2,…….,min(La,Lb)},使得Fak>Fbk;且对所有小于k的i,满足Fai=Fbi,或者在La>Lb且对于所有小于等于Lb的i,满足Fai=Fbi,其中,k和i均为正整数,则确定候选路径a的路径热度高于候选路径b,且若候选路径集合中包含未被选择过的候选路径,令候选路径b=候选路径c,返回执行判断候选路径a的路径热度是否高于候选路径b的路径热度的步骤,候选路径c为候选路径集合中未被选择过的候选路径,若候选路径集合中不包含未被选择过的候选路径,则确定候选路径a为热点路径;
[0199] 若La=Lb,且k的取值范围为{1,2,…….,La或Lb}时,Fai=Fbi,则确定候选路径a与候选路径b的路径热度相同,且若候选路径集合中包含未被选择过的候选路径,则令候选路径a=候选路径c,返回执行判断候选路径a的路径热度是否高于候选路径b的路径热度的步骤,或者,令候选路径b=候选路径c,返回执行判断候选路径a的路径热度是否高于候选路径b的路径热度的步骤,候选路径c为候选路径集合中未被选择过的候选路径;若候选路径集合中不包含未被选择过的候选路径,则确定候选路径a或者候选路径b为热点路径。
[0200] 在本发明实施例中,设备根据拓扑结构信息计算获取到的用户轨迹测量数据中的每一条测量路径上的每一个节点的候选匹配边集,并利用每一条测量路径上的每一个节点的候选匹配边集构建每一条测量路径的隐马尔科夫模型,基于隐马尔科夫模型进行模糊地图匹配计算,得到每一条测量路径的可选路径集合,确定道路网络中的每一条路段在所有测量路径的所有可选路径集合中出现的次数S及S次出现的路段概率的集合,根据每一条路段的出现次数S及S次出现的路段概率的集合计算每一条路段的车流量数据,若所有路段的车流量数据为非稀疏数据,则确定该所有路段的车流量数据为道路网络的路段的车流量数据集合,若所有路段的车流量数据为稀疏数据,则基于多变量线性回归的共同筛选技术,或者基于多变量线性回归的共同筛选技术和半监督学习的训练机制填补所有路段中属于不可用路段的车流量数据,将优化后的所有路段的车流量数据作为道路网络的路段的车流量数据集合,并从该车流量数据集合中获取已确定的候选路径集合中的每一条候选路径的每一条路段的车流量数据,利用预先设置的函数族计算候选路径集合中的候选路径的每一条路段的车流量数据对应的流量分布值,根据每一条路径的每一条路段的流量分布值确定基于概率的热点路径,通过基于隐马尔科夫模型的模糊地图匹配计算,能够在得到的测量路径的可选路径集合中保留测量数据中的一部分不确定信息,得到所有可能匹配的路径分布,有效提高热点路径计算的准确性,同时,在确定热点路径时,基于多变量线性回归的共同筛选技术,或者,基于多变量线性回归的共同筛选技术和半监督学习的训练机制填补所有路段中属于不可用路段的车流量数据,避免稀疏数据带来的无法确定热点路径的问题,提高了热点路径确定的准确性。
[0201] 需要说明的是,本发明实施例中描述的热点路径的确定方法通常用于汽车用户确定行车路线,用户在汽车上可以安装热点路径的确定设备,或者在汽车已有的控制系统上安装能够执行上述热点路径的确定方法的软件,以帮助用户确定行车路线
[0202] 请参阅图3,为本发明实施例中热点路径的确定装置的结构,包括:
[0203] 第一计算单元301,用于对获取到的用户轨迹测量数据中的每一条测量路径进行基于隐马尔科夫模型的模糊地图匹配计算,得到所述每一条测量路径的可选路径集合,一所述可选路径集合中包含一测量路径的所有可选路径中归一化匹配概率排在前N的可选路径,所述用户轨迹测量数据为预置时间段内行驶于预置区域的道路网络的用户的轨迹测量数据,所述N为正整数;
[0204] 第一确定单元302,用于在所述第一计算单元301得到所述每一条测量路径的可选路径集合之后,利用所述每一条测量路径的可选路径集合及所述道路网络的拓扑结构信息确定所述道路网络的所有路段的车流量数据;
[0205] 第二确定单元303,用于在所述第一确定单元302确定所述道路网络的所有路段的车流量数据之后,利用所述拓扑结构信息、用户输入的起始位置和目的位置确定候选路径集合,所述候选路径集合中的路径均是以所述起始位置为起点,所述目的位置为终点的路径的集合;
[0206] 第三确定单元304,用于在所述第二确定单元303得到所述候选路径集合之后,根据所述所有路段的车流量数据及所述候选路径集合确定基于概率的热点路径。
[0207] 在本发明实施例中,热点路径的确定设备中的第一计算单元301对获取到的用户轨迹测量数据中的每一条测量路径进行基于隐马尔科夫模型的模糊地图匹配计算,得到所述每一条测量路径的可选路径集合,其中,一所述可选路径集合中包含一测量路径的所有可选路径中归一化匹配概率排在前N的可选路径,所述用户轨迹测量数据为预置时间段内行驶于预置区域的道路网络的用户的轨迹测量数据,所述N为正整数;接着第一确定单元302利用所述每一条测量路径的可选路径集合及所述道路网络的拓扑结构信息确定所述道路网络的所有路段的车流量数据;并由第二确定单元303利用所述拓扑结构信息、用户输入的起始位置和目的位置确定候选路径集合,所述候选路径集合中的路径均是以所述起始位置为起点,所述目的位置为终点的路径的集合;最后,第三确定单元304,根据所述所有路段的车流量数据及所述候选路径集合确定基于概率的热点路径。
[0208] 在本发明实施例中,设备对获取到的用户轨迹测量数据中的每一条测量路径进行基于隐马尔科夫模型的模糊地图匹配计算,得到每一条测量路径的可选路径集合,且将利用每一条测量路径的可选路径集合及道路网络的拓扑结构信息确定该道路网络的所有路段的车流量数据,利用该拓扑结构信息、用户输入的起始位置及目的位置确定候选路径集合,根据该所有路段的车流量数据及候选路径集合确定基于概率的热点路径,通过对用户轨迹测量数据进行基于隐马尔科夫模型的模糊地图匹配计算,得到每一条测量路径的可选路径集合,保留了用户轨迹测量数据中的一部分不确定信息,能够有效提高热点路径的准确性。
[0209] 为了更好的理解本发明实施例中的热点路径的确定装置,请参阅图4,包括:如图3所示实施例中描述的第一计算单元301、第一确定单元302、第二确定单元303及第三确定单元304,且与图3所示实施例描述的内容相似,此处不做赘述。
[0210] 在本发明实施例中,设备还包括:
[0211] 判断单元401,用于在所述第二确定单元302得到所述候选路径集合之后,判断所述所有路段的车流量数据是否为非稀疏数据;
[0212] 第四确定单元402,用于若所述判断单元401确定所述所有路段的车流量数据为非稀疏数据,则确定所述所有路段的车流量数据为所述道路网络的路段的车流量数据集合;
[0213] 第五确定单元403,用于若所述判断单元401确定所述所有路段的车流量数据为稀疏数据,则基于多变量线性回归的共同筛选技术,或者基于所述多变量线性回归的共同筛选技术和半监督学习的训练机制填补所述所有路段中属于不可用路段的车流量数据,得到优化后的所有路段的车流量数据,将所述优化后的所有路段的车流量数据作为所述道路网络的路段的车流量数据集合,所述不可用路段是指车流量数据小于预先设置的阈值的路段。
[0214] 在本发明实施例中,第三确定单元302具体用于在所述第四确定单元402或者所述第五确定单元403之后,根据所述车流量数据集合及所述候选路径集合确定基于概率的热点路径。
[0215] 其中,第五确定单元403具体用于:
[0216] 若所述判断单元401确定所述所有路段的车流量数据为稀疏数据,将所述所有路段的车流量数据构建为矩阵M,且矩阵M如下所示:
[0217]
[0218] 其中,v1,v2,......,vn为所述路段的起点或终点,F12,F13,F1n,......,Fnn均表示路段的车流量数据,其中F11,F22,F33,......,Fnn的值均为0;
[0219] 对所述矩阵M进行低阶近似分解,将所述矩阵M近似表示为XTX,其中所述X表示矩阵X,所述XT表示矩阵X的转置矩阵;
[0220] 求解目标函数||M-XTX||2在条件rank(X)
[0221] 将所述矩阵M中不可用路段的车流量数据用X’TX’中所述不可用路段的车流量数据代替,得到优化后的矩阵M,所述优化后的矩阵M为所述优化后的所有路段的车流量数据。
[0222] 或者,第五确定单元403具体用于:
[0223] 若所述判断单元确定所述所有路段的车流量数据为稀疏数据,将所述所有路段的车流量数据构建为矩阵Mi,且矩阵Mi如下所示:
[0224]
[0225] 其中,v1,v2,......,vn为所述路段的起点或终点,F12,F13,F1n,......,Fnn均表示路段的车流量数据,其中F11,F22,F33,......,Fnn的值均为0;i的初始值为0,执行以下步骤:
[0226] 对所述矩阵Mi进行低阶近似分解,将所述矩阵Mi近似表示XjTXj,其中所述Xj表示T矩阵Xj,所述Xj矩阵Xj的转置矩阵;
[0227] 求解目标函数||Mi-XjTXj||在条件rank(Xj)
[0228] 若所述矩阵Mi中不可用路段的数量大于z,则将所述矩阵Mi中任意z个不可用路段的车流量数据用在Xj’TXj’中对应的不可用路段的车流量数据代替,得到矩阵Mi+1;令i=i+1,返回执行所述对所述矩阵Mi进行低阶近似分解的步骤;
[0229] 若所述矩阵Mi中不可用路段的数量小于或等于z,则将所述矩阵Mi中的不可用路段的车流量数据用在Xj’TXj’中所述不可用路段的车流量数据代替,得到矩阵Mi+1,将所述矩阵Mi+1作为优化后的所有路段的车流量数据。
[0230] 在本发明实施例中,第一计算单元301包括:
[0231] 边集计算单元404,用于根据所述拓扑结构信息计算获取到的用户的轨迹测量数据中的每一条测量路径上的每一个节点的候选匹配边集,所述候选匹配边集为节点可能位于的路段的集合;
[0232] 可选路径计算单元405,用于在所述边集计算单元404得到所述候选匹配边集之后,利用所述每一条测量路径上的每一个节点的候选匹配边集构建所述每一条测量路径的隐马尔克夫模型,得到所述每一条测量路径的可选路径集合。
[0233] 且边集计算单元404具体用于:
[0234] 按照如下方式确定测量路径的每一个节点的候选匹配边集:
[0235] 若测量路径A的节点i的轨迹测量数据为(Xi,Yi,Ti),则节点i的测量位置是(Xi,Yi),假设所述节点i的实际位置是(Xi',Yi'),则计算在所述拓扑结构信息中满足匹配公式的路段,所述满足匹配公式的路段的集合为所述节点i的候选匹配边集,所述候选匹配边集中包含所述节点i可能位于的路段及在所述可能在路段的概率;
[0236] 所述匹配公式为:
[0237] P{(Xi,Yi)|(X'i,Y'i)在e上}>θ
[0238] 其中,Xi表示所述节点i的经度,Yi表示所述节点i的纬度,e表示路段e,P表示概率,θ为预先设置的数值。
[0239] 且可选路径计算单元405具体用于:
[0240] 按照如下方式确定每一条测量路径的可选路径集合:
[0241] 利用所述测量路径A上的每一个节点的候选匹配边集构建隐马尔科夫模型,确定所述测量路径A的所有可选路径,所述可选路径上的路段的概率为候选匹配边集中节点在所述路段上的概率;
[0242] 基于道路网络的拓扑结构信息和测量路径A的每一个节点的候选匹配边集,计算测量路径A上相邻两个节点取不同的候选匹配边时的转换概率;
[0243] 根据所述测量路径A的每一条可选路径上的路段的概率及所述转换概率计算所述每一条可选路径的匹配概率,所述匹配概率等于可选路径的所有路段的概率及所述可选路径的相连路段之间的转换概率之间的乘积;
[0244] 从所述所有可选路径中选择匹配概率排在前N的可选路径作为所述测量路径A的可选路径集合,且将所述可选路径集合中的每一条可选路径的匹配概率进行归一化得到所述每一条可选路径的归一化匹配概率。
[0245] 在本发明实施例中,第一确定单元302包括:
[0246] 第六确定单元406,用于在所述第一计算单元301得到所述每一条测量路径的可选路径集合之后,确定所述道路网络中的每一条路段在所述所有测量路径的所有的可选路径集合中出现的次数S及S次出现的路段概率的集合,所述S为正整数;
[0247] 第二计算单元407,用于在所述第六确定单元406确定所述每一条路段的出现次数S及S次出现的路段概率的集合之后,根据所述每一条路段的出现的次数S及S次出现的路段概率的集合计算每一条路段的车流量数据,所述车流量数据中包含路段出现次数为k的概率的集合,所述k的值为1至S。
[0248] 在本发明实施例中,第三确定单元304包括:
[0249] 获取单元408,用于在所述第四确定单元402或者所述第五确定单元403之后,从所述车流量数据集合中获取所述候选路径集合中的每一条候选路径的每一条路段的车流量数据;
[0250] 第三计算单元409,用于在所述获取单元408得到所述候选路径集合中的每一条候选路径的每一条路段的车流量数据之后,利用预先设置的函数族计算所述候选路径集合中的候选路径的每一条路段的车流量数据对应的流量分布值;
[0251] 第六确定单元410,用于在所述第三计算单元409得到所述每一条路段的车流量数据对应的流量分布值之后,根据所述每一条路径的每一条路段的车流量数据对应的流量分布值确定基于概率的热点路径。
[0252] 在本发明实施例中,第六确定单元410具体用于:
[0253] 将所述候选路径集合中的每一条候选路径的所有路段对应的流量分布值按照从小到大的顺序进行排序作为所述每一条候选路径的路径热度;
[0254] 从所述候选路径集合中选择两条候选路径,分别作为候选路径a和候选路径b,其中,所述候选路径a的路径热度为Freqa,且Freqa=,Freqa中包含La个路段的流量分布值,候选路径b的路径热度Freqb,且Freqb=,Freqb中包含Lb个路段的流量分布值;
[0255] 判断所述候选路径a的路径热度是否高于所述候选路径b的路径热度;
[0256] 若存在一个k,且k的取值范围为{1,2,…….,min(La,Lb)},使得Fak
[0257] 若存在一个k,且k的取值范围为{1,2,…….,min(La,Lb)},使得Fak>Fbk;且对所有小于k的i,满足Fai=Fbi,或者在La>Lb且对于所有小于等于Lb的i,满足Fai=Fbi,其中,k和i均为正整数,则确定候选路径a的路径热度高于候选路径b,且若候选路径集合中包含未被选择过的候选路径,令候选路径b=候选路径c,返回执行所述判断所述候选路径a的路径热度是否高于所述候选路径b的路径热度,所述候选路径c为所述候选路径集合中未被选择过的候选路径,若候选路径集合中不包含未被选择过的候选路径,则确定所述候选路径a为热点路径;
[0258] 若La=Lb,且k的取值范围为{1,2,…….,La或Lb}时,Fai=Fbi,则确定候选路径a与候选路径b的路径热度相同,且若候选路径集合中包含未被选择过的候选路径,则令候选路径a=候选路径c,返回执行所述判断所述候选路径a的路径热度是否高于所述候选路径b的路径热度,或者,令候选路径b=候选路径c,返回执行所述判断所述候选路径a的路径热度是否高于所述候选路径b的路径热度,所述候选路径c为所述候选路径集合中未被选择过的候选路径;若候选路径集合中不包含未被选择过的候选路径,则确定所述候选路径a或者候选路径b为热点路径。
[0259] 在本发明实施例中,第一计算单元301中的边集计算单元404根据拓扑结构信息计算获取到的用户的轨迹测量数据中的每一条测量路径上的每一个节点的候选匹配边集,具体的:边集计算单元404按照如下方式确定测量路径的每一个节点的候选匹配边集:
[0260] 若测量路径A的节点i的轨迹测量数据为(Xi,Yi,Ti),则节点i的测量位置是(Xi,Yi),假设所述节点i的实际位置是(Xi',Yi'),则计算在所述拓扑结构信息中满足匹配公式的路段,所述满足匹配公式的路段的集合为所述节点i的候选匹配边集,所述候选匹配边集中包含所述节点i可能位于的路段及在所述可能在路段的概率;
[0261] 所述匹配公式为:
[0262] P{(Xi,Yi)|(X'i,Y'i)在e上}>θ
[0263] 其中,Xi表示所述节点i的经度,Yi表示所述节点i的纬度,e表示路段e,P表示概率,θ为预先设置的数值。
[0264] 接着,由第一计算单元301中的可选路径计算单元405利用每一条测量路径上的每一个节点的候选匹配边集构建每一条测量路径的隐马尔科夫模型,得到每一条测量路径的可选路径集合,且具体的:可选路径计算单元405按照如下方式确定每一条测量路径的可选路径集合:利用所述测量路径A上的每一个节点的候选匹配边集构建隐马尔科夫模型,确定所述测量路径A的所有可选路径,所述可选路径上的路段的概率为候选匹配边集中节点在所述路段上的概率;基于道路网络的拓扑结构信息和测量路径A的每一个节点的候选匹配边集,计算测量路径A上相邻两个节点取不同的候选匹配边时的转换概率;根据所述测量路径A的每一条可选路径上的路段的概率及所述转换概率计算所述每一条可选路径的匹配概率,所述匹配概率等于可选路径的所有路段的概率及所述可选路径的相连路段之间的转换概率之间的乘积;从所述所有可选路径中选择匹配概率排在前N的可选路径作为所述测量路径A的可选路径集合,且将所述可选路径集合中的每一条可选路径的匹配概率进行归一化得到所述每一条可选路径的归一化匹配概率。
[0265] 接着,第一确定单元302中的第六确定单元406确定所述道路网络中的每一条路段在所述所有测量路径的所有的可选路径集合中出现的次数S及S次出现的路段概率的集合,所述S为正整数;且由第一确定单元302中的第二计算单元407根据所述每一条路段的出现的次数S及S次出现的路段概率的集合计算每一条路段的车流量数据,所述车流量数据中包含路段出现次数为k的概率的集合,所述k的值为1至S。
[0266] 接着第二确定单元303利用所述拓扑结构信息、用户输入的起始位置和目的位置确定候选路径集合,且判断单元401判断所述所有路段的车流量数据是否为非稀疏数据,若所述判断单元401确定所述所有路段的车流量数据为非稀疏数据,则第四确定单元402确定所述所有路段的车流量数据为所述道路网络的路段的车流量数据集合;若所述判断单元401确定所述所有路段的车流量数据为稀疏数据,则第五确定单元403基于多变量线性回归的共同筛选技术,或者基于所述多变量线性回归的共同筛选技术和半监督学习的训练机制填补所述所有路段中属于不可用路段的车流量数据,得到优化后的所有路段的车流量数据,将所述优化后的所有路段的车流量数据作为所述道路网络的路段的车流量数据集合,所述不可用路段是指车流量数据小于预先设置的阈值的路段。
[0267] 其中,具体的,若所述判断单元401确定所述所有路段的车流量数据为稀疏数据,[0268] 将所述所有路段的车流量数据构建为矩阵M,且矩阵M如下所示:
[0269]
[0270] 其中,v1,v2,......,vn为所述路段的起点或终点,F12,F13,F1n,......,Fnn均表示路段的车流量数据,其中F11,F22,F33,......,Fnn的值均为0;
[0271] 对所述矩阵M进行低阶近似分解,将所述矩阵M近似表示为XTX,其中所述X表示矩阵X,所述XT表示矩阵X的转置矩阵;
[0272] 求解目标函数||M-XTX||2在条件rank(X)
[0273] 将所述矩阵M中不可用路段的车流量数据用X’TX’中所述不可用路段的车流量数据代替,得到优化后的矩阵M,所述优化后的矩阵M为所述优化后的所有路段的车流量数据。
[0274] 或者,若所述判断单元401确定所述所有路段的车流量数据为稀疏数据,第五确定单元403将所述所有路段的车流量数据构建为矩阵Mi,且矩阵Mi如下所示:
[0275]
[0276] 其中,v1,v2,......,vn为所述路段的起点或终点,F12,F13,F1n,......,Fnn均表示路段的车流量数据,其中F11,F22,F33,......,Fnn的值均为0;i的初始值为0,执行以下步骤:
[0277] 对所述矩阵Mi进行低阶近似分解,将所述矩阵Mi近似表示XjTXj,其中所述Xj表示矩阵Xj,所述XjT矩阵Xj的转置矩阵;
[0278] 求解目标函数||Mi-XjTXj||在条件rank(Xj)
[0279] 若所述矩阵Mi中不可用路段的数量大于z,则将所述矩阵Mi中任意z个不可用路段的车流量数据用在Xj’TXj’中对应的不可用路段的车流量数据代替,得到矩阵Mi+1;令i=i+1,返回执行所述对所述矩阵Mi进行低阶近似分解的步骤;
[0280] 若所述矩阵Mi中不可用路段的数量小于或等于z,则将所述矩阵Mi中的不可用路段T的车流量数据用在Xj’Xj’中所述不可用路段的车流量数据代替,得到矩阵Mi+1,将所述矩阵Mi+1作为优化后的所有路段的车流量数据。
[0281] 在第四确定单元402或者第五确定单元403获取候选路径集合中的每一条候选路径的每一条路段的车流量数据之后,第三确定单元304中的获取单元408从所述车流量数据集合中获取所述候选路径集合中的每一条候选路径的每一条路段的车流量数据,及第三计算单元409,利用预先设置的函数族计算所述候选路径集合中的候选路径的每一条路段的车流量数据对应的流量分布值;并由第六确定单元410根据所述每一条路径的每一条路段的车流量数据对应的流量分布值确定基于概率的热点路径。
[0282] 其中,具体的,第六确定单元410按照如下方式进行处理:
[0283] 将所述候选路径集合中的每一条候选路径的所有路段对应的流量分布值按照从小到大的顺序进行排序作为所述每一条候选路径的路径热度;
[0284] 从所述候选路径集合中选择两条候选路径,分别作为候选路径a和候选路径b,其中,所述候选路径a的路径热度为Freqa,且Freqa=,Freqa中包含La个路段的流量分布值,候选路径b的路径热度Freqb,且Freqb=,Freqb中包含Lb个路段的流量分布值;
[0285] 判断所述候选路径a的路径热度是否高于所述候选路径b的路径热度;
[0286] 若存在一个k,且k的取值范围为{1,2,…….,min(La,Lb)},使得Fak
[0287] 若存在一个k,且k的取值范围为{1,2,…….,min(La,Lb)},使得Fak>Fbk;且对所有小于k的i,满足Fai=Fbi,或者在La>Lb且对于所有小于等于Lb的i,满足Fai=Fbi,其中,k和i均为正整数,则确定候选路径a的路径热度高于候选路径b,且若候选路径集合中包含未被选择过的候选路径,令候选路径b=候选路径c,返回执行所述判断所述候选路径a的路径热度是否高于所述候选路径b的路径热度,所述候选路径c为所述候选路径集合中未被选择过的候选路径,若候选路径集合中不包含未被选择过的候选路径,则确定所述候选路径a为热点路径;
[0288] 若La=Lb,且k的取值范围为{1,2,…….,La或Lb}时,Fai=Fbi,则确定候选路径a与候选路径b的路径热度相同,且若候选路径集合中包含未被选择过的候选路径,则令候选路径a=候选路径c,返回执行所述判断所述候选路径a的路径热度是否高于所述候选路径b的路径热度,或者,令候选路径b=候选路径c,返回执行所述判断所述候选路径a的路径热度是否高于所述候选路径b的路径热度,所述候选路径c为所述候选路径集合中未被选择过的候选路径;若候选路径集合中不包含未被选择过的候选路径,则确定所述候选路径a或者候选路径b为热点路径。
[0289] 在本发明实施例中,设备根据拓扑结构信息计算获取到的用户轨迹测量数据中的每一条测量路径上的每一个节点的候选匹配边集,并利用每一条测量路径上的每一个节点的候选匹配边集构建每一条测量路径的隐马尔科夫模型,基于隐马尔科夫模型进行模糊地图匹配计算,得到每一条测量路径的可选路径集合,确定道路网络中的每一条路段在所有测量路径的所有可选路径集合中出现的次数S及S次出现的路段概率的集合,根据每一条路段的出现次数S及S次出现的路段概率的集合计算每一条路段的车流量数据,若所有路段的车流量数据为非稀疏数据,则确定该所有路段的车流量数据为道路网络的路段的车流量数据集合,若所有路段的车流量数据为稀疏数据,则基于多变量线性回归的共同筛选技术,或者基于多变量线性回归的共同筛选技术和半监督学习的训练机制填补所有路段中属于不可用路段的车流量数据,将优化后的所有路段的车流量数据作为道路网络的路段的车流量数据集合,并从该车流量数据集合中获取已确定的候选路径集合中的每一条候选路径的每一条路段的车流量数据,利用预先设置的函数族计算候选路径集合中的候选路径的每一条路段的车流量数据对应的流量分布值,根据每一条路径的每一条路段的流量分布值确定基于概率的热点路径,通过基于隐马尔科夫模型的模糊地图匹配计算,能够在得到的测量路径的可选路径集合中保留测量数据中的一部分不确定信息,得到所有可能匹配的路径分布,有效提高热点路径计算的准确性,同时,在确定热点路径时,基于多变量线性回归的共同筛选技术,或者,基于多变量线性回归的共同筛选技术和半监督学习的训练机制填补所有路段中属于不可用路段的车流量数据,避免稀疏数据带来的无法确定热点路径的问题,提高了热点路径确定的准确性。
[0290] 请参阅图5,为本发明实施例中热点路径的确定设备的结构实施例,包括:
[0291] 处理器501、接收装置502、发送装置503及存储器504;
[0292] 其中,处理器501用于对获取到的用户轨迹测量数据中的每一条测量路径进行基于隐马尔科夫模型的模糊地图匹配计算,得到所述每一条测量路径的可选路径集合,其中,一所述可选路径集合中包含一测量路径的所有可选路径中归一化匹配概率排在前N的可选路径,所述用户轨迹测量数据为预置时间段内行驶于预置区域的道路网络的用户的轨迹测量数据,所述N为正整数;利用所述每一条测量路径的可选路径集合及所述道路网络的拓扑结构信息确定所述道路网络的所有路段的车流量数据;利用所述拓扑结构信息、用户输入的起始位置和目的位置确定候选路径集合,所述候选路径集合中的路径均是以所述起始位置为起点,所述目的位置为终点的路径的集合;根据所述所有路段的车流量数据及所述候选路径集合确定基于概率的热点路径。
[0293] 本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
[0294] 以上对本发明所提供的一种热点路径的确定方法及设备进行了详细介绍,对于本领域的一般技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。