基于高速公路收费数据的省际出行流量估算方法转让专利

申请号 : CN202110307548.0

文献号 : CN113096413B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 四兵锋王婷高自友赵芳杨珍珍

申请人 : 北京交通大学

摘要 :

本发明提供了一种基于高速公路收费数据的省际出行流量估算方法。该方法包括:提取高速公路收费数据中的跨省出行相关的数据字段数据;对提取的高速公路收费数据进行数据预处理;根据数据预处理后的高速公路收费数据提取省际出行链集合,基于提取的省际出行链集合计算高速公路省际出行O‑D及O‑D交通量。本发明基于全国的高速公路收费数据,结合全国高速公路网络拓扑数据、全国收费站基础信息数据等,给出了高速公路省际出行链的提取算法,计算了高速公路省际出行流量,并与统计得到的实际断面流量进行对比,有效提高了省际断面流量推算的实用性。

权利要求 :

1.一种基于高速公路收费数据的省际出行流量估算方法,其特征在于,包括:提取高速公路收费数据中的跨省出行相关的数据字段数据;

对提取的高速公路收费数据进行数据预处理;

根据数据预处理后的高速公路收费数据提取省际出行链集合,基于提取的省际出行链集合计算高速公路省际出行O‑D及O‑D交通量;其中,所述的根据数据清洗处理后的数据字段数据提取省际出行链集合,包括:步骤1:设省际出行链集合Ω为空集,读取高速公路收费数据集,并将其按照卡号和入口收费时间升序排列,排序后的数据集记为N,建立一个空队列Q,执行步骤2;

步骤2:读取数据集N中的第一条记录N1,并将记录N1中的入口收费站 和出口收费站添加到队列Q中,令i=2,执行步骤3;

步骤3:读取数据集N中的第i条记录Ni,执行步骤4;

步骤4:判断第i条记录的卡号idi和第i‑1条记录的卡号idi‑1是否相等,如果是,则执行步骤5;否则执行步骤7;

步骤5:判断第i条记录的入口收费站 和第i‑1条记录的出口收费站 是否互为直接相邻节点,且这两个收费站均属于省界收费站集合Sp,若以上两个条件都满足执行步骤

6;否则执行步骤7;

enter

步骤6:判断第i条记录的入口收费时间Ti 和第i‑1条记录的出口收费时间 是否相等,如果是执行步骤8;否则执行步骤7;

步骤7:置Q为空队列,执行步骤8;

步骤8:将 和 添加到队列Q末尾,执行步骤9;

步骤9:判断队列Q中的第一个元素和最后一个元素是否均为非省界收费站且这两个收费站所属的省份不同,如果是,将队列Q添加到省际出行链集合Ω,并清空队列Q中的所有元素,执行步骤10;否则执行步骤10;

步骤10:判断当前记录是否为最后一条记录,如果是则结束;否则置i=i+1,转到步骤

3;

所述的基于提取的省际出行链集合计算高速公路省际出行O‑D及O‑D交通量,包括:rs

基于省际出行链集合Φ计算研究时间段内各O‑D对(r,s)和O‑D交通需求量q ,包括如下的处理步骤:

步骤1‑1:初始化,设置省际出行O‑D对集合W为空集,令n=1;

步骤2‑1:读取省际出行链集合Φ中的第n条出行链 判断由 的首元素和末元素组成的O‑D对w是否存在于集合W中,如果不存在,将O‑D对w添加到集合W中,并设O‑D对w的交通w w w

量q=1;否则,设O‑D对w的交通量q=q+1;

步骤3‑1:判断当前省际出行链 是否为最后一条出行链,如果是,则结束,输出O‑D对w

集合W和O‑D出行量q,w∈W;否则,令n=n+1,执行步骤2‑1;

根据高速公路省际出行O‑D及O‑D交通量计算出省界收费站位置处的断面流量,包括如下的处理步骤:

步骤1‑2:输入高速公路拓扑网络,建立高速公路省界断面集合H,设置所有省界断面的h

流量初始值为x=0, 令k=1;

k

步骤2‑2:读取集合W中的第k个O‑D对wk,及其对应的O‑D交通量q;

步骤3‑2:计算第k个O‑D对之间的最短路径,并获取最短路径所经过的省界收费断面集H(wk);

h h k

步骤4‑2:对于最短路径中的所有高速公路省界断面h∈H(wk),x=x+q;

步骤5‑2:判断当前O‑D对wk是否为最后一个O‑D对,如果是,则结束,输出高速公路省界h

断面流量x , 否则,令k=k+1,执行步骤2‑2。

2.根据权利要求1所述的方法,其特征在于,所述的提取高速公路收费数据中的跨省出行相关的数据字段数据,包括:提取高速公路收费数据中的跨省出行相关的数据字段,该数据字段包括;收费卡ID、入口收费站编号、出口收费站编号、入口收费时间、出口收费时间和交易金额。

3.根据权利要求1所述的方法,其特征在于,所述的对提取的高速公路收费数据进行数据预处理后,包括:

剔除提取的高速公路收费数据中的省内出行数据;

根据下述的7种清洗规则对剔除处理后的高速公路收费数据进行数据清洗处理,具体如下:

(1)清除卡号、出入口收费站和时间字段中存在明显错误或缺失的收费数据;

(2)清除入口收费站和出口收费站相同的收费数据;

(3)清除出口收费时间早于或等于入口收费时间的收费数据;

(4)清除在高速公路收费系统中停留时间超过设定时长的收费数据;

(5)清除出口或入口收费时间不在研究时段内的收费数据;

(6)清除缴纳费用高于实际行驶里程或时间的收费数据;

(7)清除出入口收费站编号无法识别,不能与实际收费站相对应的收费数据。

4.根据权利要求1所述的方法,其特征在于,所述的方法还包括:基于省际出行链集合统计省界收费站位置处的实际断面流量,包括如下的处理步骤:h

步骤1:初始化,设置所有省界收费站位置处的实际断面流量的初始值为y=0,令n=1;

步骤2:读取省际出行链集合Φ中的第n条出行链步骤3:提取出行链 中顺序排列的m个省界收费站,添加到集合Hm中;

h h

步骤4:对于任意的h∈Hm,令y=y+1;

步骤5:判断当前省际出行链 是否为最后一条出行链,如果是,则结束,输出高速公路h

实际断面流量y , 否则令n=n+1,执行步骤2。

说明书 :

基于高速公路收费数据的省际出行流量估算方法

技术领域

[0001] 本发明涉及高速公路运营管理技术领域,尤其涉及一种基于高速公路收费数据的省际出行流量估算方法。

背景技术

[0002] 高速公路跨省出行,是指车辆从某省的入口收费站驶入高速公路网络,再从其他省份驶出高速公路网络的单次出行。跨省出行流量是指特定时间段内,各省之间完成跨省
出行的车辆数。跨省出行流量可以作为高速公路省间费用清分的重要依据,如何科学、准确
地估算跨省出行流量是交通领域的热点问题之一。
[0003] 取消省界收费站之前,我国高速公路以省为单位运营收费,跨省出行的车辆在每个省停车收费,无需省际清分。取消省界收费站之后,我国高速公路收费由省际收费站收费
模式改为龙门架分段式收费模式,省际清分问题随之出现。现状龙门架分段式收费模式存
在诸多问题。首先车辆的ETC安装率有待提高;其次门架识别存在故障频发、计费错误、多次
扣费和扣费延迟等问题。因此,结合交通模型与方法,提出解决高速公路网络清分问题的新
思路,成为高速公路运营管理中的重要问题。
[0004] 与高速公路清分问题类似,多运营主体的大规模城市轨道交通网络也存在清分问题,且现有研究成果比较丰富。城市轨道交通网络的清分是以AFC刷卡数据为基础,采用交
通流分配模型来推算网络断面客流分布状况,从而达到清分目的。然而,直接应用现有的城
市轨道交通网络客流分配算法还存在缺陷,一方面,相比于城市轨道交通网络,全国高速公
路网络的规模更为庞大,这对流量分配算法的计算效率提出更高要求;另一方面,相对于规
范程度更高的AFC数据,全国高速公路收费数据是以省为单位进行管理的,数据规范性、完
整性与一致性存在不足,这也为数据处理带来难度。如何通过海量的高速公路收费数据,准
确、快速及完整地获取跨省出行流量成为一个难点。

发明内容

[0005] 本发明的实施例提供了一种基于高速公路收费数据的省际出行流量估算方法,以克服现有技术的问题。
[0006] 为了实现上述目的,本发明采取了如下技术方案。
[0007] 一种基于高速公路收费数据的省际出行流量估算方法,包括:
[0008] 提取高速公路收费数据中的跨省出行相关的数据字段数据;
[0009] 对提取的高速公路收费数据进行数据预处理;
[0010] 根据数据预处理后的高速公路收费数据提取省际出行链集合,基于提取的省际出行链集合计算高速公路省际出行O‑D及O‑D交通量。
[0011] 优选地,所述的提取高速公路收费数据中的跨省出行相关的数据字段数据,包括:
[0012] 提取高速公路收费数据中的跨省出行相关的数据字段,该数据字段包括;收费卡ID、入口收费站编号、出口收费站编号、入口收费时间、出口收费时间和交易金额。
[0013] 优选地,所述的对提取的高速公路收费数据进行数据预处理后,包括:
[0014] 剔除提取的高速公路收费数据中的省内出行数据;
[0015] 根据下述的7种清洗规则对剔除处理后的高速公路收费数据进行数据清洗处理,具体如下:
[0016] (1)清除卡号、出入口收费站和时间字段中存在明显错误或缺失的收费数据;
[0017] (2)清除入口收费站和出口收费站相同的收费数据;
[0018] (3)清除出口收费时间早于或等于入口收费时间的收费数据;
[0019] (4)清除在高速公路收费系统中停留时间超过设定时长的收费数据;
[0020] (5)清除出口或入口收费时间不在研究时段内的收费数据;
[0021] (6)清除缴纳费用高于实际行驶里程或时间的收费数据;
[0022] (7)清除出入口收费站编号无法识别,不能与实际收费站相对应的收费数据。
[0023] 优选地,所述的根据数据清洗处理后的数据字段数据提取省际出行链集合,包括:
[0024] 步骤1:初始化。设省际出行链集合Ω为空集,读取高速公路收费数据集,并将其按照卡号和入口收费时间升序排列,排序后的数据集记为N,建立一个空队列Q,执行步骤2;
[0025] 步骤2:读取数据集N中的第一条记录N1,并将记录N1中的入口收费站 和出口收费站 添加到队列Q中,令i=2,执行步骤3;
[0026] 步骤3:读取数据集N中的第i条记录Ni,执行步骤4;
[0027] 步骤4:判断第i条记录的卡号idi和第i‑1条记录的卡号idi‑1是否相等,如果是,则执行步骤5;否则执行步骤7;
[0028] 步骤5:判断第i条记录的入口收费站 和第i‑1条记录的出口收费站 是否互为直接相邻节点,且这两个收费站均属于省界收费站集合Sp,若以上两个条件都满足执行
步骤6;否则执行步骤7;
[0029] 步骤6:判断第i条记录的入口收费时间 和第i‑1条记录的出口收费时间 是否相等,如果是执行步骤8;否则执行步骤7;
[0030] 步骤7:置Q为空队列,执行步骤8;
[0031] 步骤8:将 和 添加到队列Q末尾,执行步骤9;
[0032] 步骤9:判断队列Q中的第一个元素和最后一个元素是否均为非省界收费站且这两个收费站所属的省份不同,如果是,将队列Q添加到省际出行链集合Ω,并清空队列Q中的所
有元素,执行步骤10;否则执行步骤10;
[0033] 步骤10:判断当前记录是否为最后一条记录,如果是则结束;否则置i=i+1,转到步骤3。
[0034] 优选地,所述的基于提取的省际出行链集合计算高速公路省际出行O‑D及O‑D交通量,包括:
[0035] 基于省际出行链集合Φ计算研究时间段内各O‑D对(r,s)和O‑D交通需求量qrs,包括如下的处理步骤:
[0036] 步骤1:初始化,设置省际出行O‑D对集合W为空集,令n=1;
[0037] 步骤2:读取省际出行链集合Φ中的第n条出行链 判断由 的首元素和末元素组成的O‑D对w是否存在于集合W中,如果不存在,将O‑D对w添加到集合W中,并设O‑D对w的交
w w w
通量q=1;否则,设O‑D对w的交通量q=q+1;
[0038] 步骤3:判断当前省际出行链 是否为最后一条出行链,如果是,则结束,输出O‑Dw
对集合W和O‑D出行量q,w∈W;否则,令n=n+1,执行步骤2。
[0039] 优选地,所述的方法还包括:
[0040] 根据高速公路省际出行O‑D及O‑D交通量计算出省界收费站位置处的断面流量,包括如下的处理步骤:
[0041] 步骤1:输入高速公路拓扑网络,建立高速公路省界断面集合H,设置所有省界断面h
的流量初始值为x=0, 令k=1;
[0042] 步骤2:读取集合W中的第k个O‑D对wk,及其对应的O‑D交通量qk;
[0043] 步骤3:计算第k个O‑D对之间的最短路径,并获取最短路径所经过的省界收费断面集H(wk);
[0044] 步骤4:对于最短路径中的所有高速公路省界断面h∈H(wk),xh=xh+qk;
[0045] 步骤5:判断当前O‑D对wk是否为最后一个O‑D对,如果是,则结束,输出高速公路省h
界断面流量x , 否则,令k=k+1,执行步骤2。
[0046] 优选地,所述的方法还包括:
[0047] 基于省际出行链集合统计省界收费站位置处的实际断面流量,包括如下的处理步骤:
[0048] 步骤1:初始化,设置所有省界收费站位置处的实际断面流量的初始值为yh=0,令n=1;
[0049] 步骤2:读取省际出行链集合Φ中的第n条出行链
[0050] 步骤3:提取出行链 中顺序排列的m个省界收费站,添加到集合Hm中;
[0051] 步骤4:对于任意的h∈Hm,令yh=yh+1;
[0052] 步骤5:判断当前省际出行链 是否为最后一条出行链,如果是,则结束,输出高速h
公路实际断面流量y , 否则令n=n+1,执行步骤2。
[0053] 由上述本发明的实施例提供的技术方案可以看出,本发明实施例基于全国的高速公路收费数据,结合全国高速公路网络拓扑数据、全国收费站基础信息数据等,给出了高速
公路省际出行链的提取算法,计算了高速公路省际出行流量,并与统计得到的实际断面流
量进行对比,有效提高了省际断面流量推算的实用性。
[0054] 本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

[0055] 为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本
领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的
附图。
[0056] 图1为本发明实施例提供的一种基于高速公路收费数据的省际出行流量估算方法的处理流程图;
[0057] 图2为本发明实施例提供的一种根据高速公路收费数据提取省际出行链的具体方法的具体流程图;
[0058] 图3为本发明实施例提供的一种采用省际出行链集合Ω,计算研究时间段内各O‑Drs
对(r,s)和O‑D交通需求量q 的处理流程图;
[0059] 图4为本发明实施例提供的一种计算省界断面流量的方法的处理流程图;
[0060] 图5为本发明实施例提供的一种基于省际出行链数据集,统计实际断面流量的方法的处理流程图;
[0061] 图6为本发明实施例提供的一种预测路径与实际路径对比示意图。

具体实施方式

[0062] 下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参
考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
[0063] 本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措
辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加
一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元
件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在
中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞
“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。
[0064] 本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该
理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意
义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
[0065] 为便于对本发明实施例的理解,下面将结合附图以几个具体实施例为例做进一步的解释说明,且各个实施例并不构成对本发明实施例的限定。
[0066] 实施例一
[0067] 为了解决现有技术的不足,提高省际流量估算的数据有效性和计算效率,提高省际流量估算的数据有效性和计算效率,本发明提供了一种基于高速公路收费数据的省际出
行流量估算方法,该方法首先预处理高速公路收费数据。原始的高速公路收费数据存在大
量冗余,还存在缺失或异常的错误数据,为保证数据质量,首先进行数据预处理。该方法的
处理流程如图1所示,包括如下的处理步骤:
[0068] 步骤S10:提取高速公路收费数据中的跨省出行相关的数据字段。通常情况下,高速公路收费数据包含与出行车辆信息、交易时间地点信息、交易金额信息等有关的24个字
段。根据需要,本发明仅选择使用其中与跨省行为密切相关的6个字段,即收费卡ID、入口收
费站编号、出口收费站编号、入口收费时间、出口收费时间和交易金额。
[0069] 步骤S20:剔除省内出行数据。省内出行数据是指仅在同一省份内部进行的出行活动产生的数据,其入口收费站和出口收费站为相同省份的非省界收费站。省内出行数据与
跨省出行流量的大小无关。由于在高速公路收费数据中,省内出行数据的占比很大(约占
80%),因此,为了节省储存空间和提升计算效率,在本步骤率先将省内出行数据剔除。
[0070] 收费数据清洗。高速公路收费数据存在大量的缺失和明显错误,为保证数据质量,需要对收费数据进行清洗。本发明针对高速公路收费数据制定了7种清洗规则,具体如下:
[0071] (1)清除卡号、出入口收费站和时间等关键字段存在明显错误或缺失的收费数据;
[0072] (2)清除入口收费站和出口收费站相同的收费数据;
[0073] (3)清除出口收费时间早于或等于入口收费时间的收费数据;
[0074] (4)清除在高速公路收费系统中停留时间过长的收费数据,入口时间和出口时间的间隔超过72小时被认为是停留时间过长;
[0075] (5)清除出口或入口收费时间不在研究时段内的收费数据;
[0076] (6)清除缴纳费用明显高于实际行驶里程或时间的收费数据;
[0077] (7)清除出入口收费站编号无法识别,不能与实际收费站相对应的收费数据。
[0078] 步骤S30:根据收费数据中包含的车辆进出高速公路网络的时间和收费站等时间空间信息,提取跨省出行的省际出行链。取消省界收费站之前,跨省出行的车辆每经过一个
省份,都在跨过省界或出行结束时缴费。因此,车辆的一次跨省出行会产生两条及以上的收
费记录。将一次跨省出行的收费记录按照时间和出行轨迹排列的链路称省际出行链,本发
明实施例提供的一种根据高速公路收费数据提取省际出行链的具体方法的具体流程如图2
所示,包括如下的处理步骤:
[0079] 步骤1:初始化。设省际出行链集合Ω为空集,读取高速公路收费数据集,并将其按照卡号和入口收费时间升序排列,排序后的数据集记为N,建立一个空队列Q,执行步骤2;
[0080] 步骤2:读取数据集N中的第一条记录N1,并将记录N1中的入口收费站 和出口收费站 添加到队列Q中,令i=2,执行步骤3;
[0081] 步骤3:读取数据集N中的第i条记录Ni,执行步骤4;
[0082] 步骤4:判断第i条记录的卡号idi和第i‑1条记录的卡号idi‑1是否相等,如果是,则执行步骤5;否则执行步骤7;
[0083] 步骤5:判断第i条记录的入口收费站 和第i‑1条记录的出口收费站 是否互为直接相邻节点,且这两个收费站均属于省界收费站集合Sp,若以上两个条件都满足执行
步骤6;否则执行步骤7;
[0084] 步骤6:判断第i条记录的入口收费时间 和第i‑1条记录的出口收费时间 是否相等,如果是执行步骤8;否则执行步骤7;
[0085] 步骤7:置Q为空队列,执行步骤8;
[0086] 步骤8:将 和 添加到队列Q末尾,执行步骤9;
[0087] 步骤9:判断队列Q中的第一个元素和最后一个元素是否均为非省界收费站且这两个收费站所属的省份不同,如果是,将队列Q添加到省际出行链集合Ω,并清空队列Q中的所
有元素,执行步骤10;否则执行步骤10;
[0088] 步骤10:判断当前记录是否为最后一条记录,如果是则结束;否则置i=i+1,转到步骤3。
[0089] 输出:省际出行链集合Φ。
[0090] 步骤S40:基于提取的省际出行链集合,计算高速公路省际出行O‑D及O‑D交通量。
[0091] 基于收费数据提取的省际出行链包含了研究时段内一次省际出行的O‑D信息。采rs
用省际出行链集合Ω,计算研究时间段内各O‑D对(r,s)和O‑D交通需求量q 的处理流程如
图3所示,包括如下的处理步骤:
[0092] 步骤1:初始化,设置省际出行O‑D对集合W为空集,令n=1;
[0093] 步骤2:读取省际出行链集合Φ中的第n条出行链 判断由 的首元素和末元素w
组成O‑D对w是否存在于集合W,如果不存在,将O‑D对w添加到集合W,并设O‑D对w的交通量q
w w
=1;否则,设O‑D对w的交通量q=q+1;
[0094] 步骤3:判断当前省际出行链 是否为最后一条出行链,如果是则结束;否则令n=n+1,执行步骤2;
[0095] 输出:O‑D对集合W和O‑D出行量qw,w∈W。
[0096] 步骤S50:基于省际出行O‑D集合W和对应的O‑D交通量,进行高速公路省际出行量估算。
[0097] 其中,省际出行量是指位于我国省界线附近高速公路路段的断面流量。在本发明中,将高速公路省际出行断面流量具体定义为省界收费站位置处的断面流量,即省界断面
流量。本发明实施例提供的一种计算省界断面流量的方法的处理流程如图4所示,包括如下
的处理步骤:
[0098] 步骤1:输入高速公路拓扑网络,建立高速公路省界断面集合H,设置所有省界断面h
的流量初始值为x=0, 令k=1;
[0099] 步骤2:读取集合W中的第k个O‑D对wk,及其对应的O‑D交通量qk;
[0100] 步骤3:计算第k个O‑D对之间的最短路径,并获取最短路径所经过的省界收费断面集H(wk);
[0101] 步骤4:对于最短路径中的所有高速公路省界断面h∈H(wk),xh=xh+qk;
[0102] 步骤5:判断当前O‑D对wk是否为最后一个O‑D对,如果是则结束;否则令k=k+1,执行步骤2;
h
[0103] 输出:高速公路省界断面流量x ,
[0104] 步骤S60:基于省际出行链集合Φ,对研究时间段内实际经过高速公路省际出行断面的流量进行统计,并对估算的省界断面流量进行校验。
[0105] 本发明实施例提供的一种基于省际出行链数据集,统计实际断面流量的方法的处理流程如图5所示,包括如下的处理步骤:
h
[0106] 步骤1:初始化,设置所有实际断面流量的初始值为y=0, 令n=1;
[0107] 步骤2:读取省际出行链集合Φ中的第n条出行链
[0108] 步骤3:提取出行链 中顺序排列的m个省界收费站,添加到集合Hm中;
[0109] 步骤4:对于任意的h∈Hm,令yh=yh+1;
[0110] 步骤5:判断当前省际出行链 是否为最后一条出行链,如果是则结束;否则令n=n+1,执行步骤2;
[0111] 输出:高速公路实际断面流量yh,
[0112] 本发明针对全国高速公路收费数据的规范性、完整性与一致性存在不足,和现有的客流分配算法无法满足全国高速公路省际清分需要等问题,综合考虑了省际流量估算的
数据有效性和计算效率,提供了一种基于高速公路收费数据的省际出行流量估算方法。
[0113] 实施例二
[0114] 本方法基于全国高速公路收费数据,对省际出行流量进行了估算。为保证收费数据的质量,并清除原始数据中存在的大量冗余,首先预处理高速公路收费数据。收费数据的
预处理包括根据需要提取数据字段、剔除与省际出行量无关的省内收费数据、清洗存在缺
失或明显错误的数据。其次,根据收费数据中车辆进出高速公路网络的时空信息,提取了跨
省出行的省际出行链。省际出行链是将一次跨省出行的所有收费记录,按照时间和出行轨
迹排列的链路。省际出行链完整地包含了研究时段内省际出行的O‑D信息和途径的所有省
界收费站。因此,可基于省际出行链集合提取高速公路省际出行的所有O‑D和O‑D交通量。最
后,基于高速公路拓扑网络和省际出行O‑D,采用交通流分配方法对O‑D交通量进行网络加
载,完成高速公路省界断面流量的估算。此外,为了保证估算结果的精度,本发明基于省际
出行链集合,统计了研究时间段内经过各个省界断面的实际流量,并利用省界断面实际流
量对省界断面流量的估算结果进行了比对和校验。
[0115] 在这里,用部分高速公路收费数据对本发明所发明的省际出行流量估算方法进行说明。预处理后,并以“收费卡ID”(简称“卡号”)为主要关键字、“入口收费时间”为次要关键
字将收费数据升序排列的收费数据样例如表1所示。其中,入口收费时间和出口收费时间的
默认年月日为2018年6月1日。对表1涉及到的各入口收费站和出口收费站的补充信息如表2
所示。表2中收费站的顺序编号为各收费站在全国高速公路收费站数据集S中的序列号。
[0116] 表1:高速公路收费数据样例
[0117]
[0118]
[0119] 表2:收费站补充信息
[0120]
[0121]
[0122] 基于以上收费数据样例共提取出4条省际出行链,用收费站的顺序编号表示这4条省际出行链中的元素,如下表3所示。4条省际出行链在地理地图上的可视化分别如图5(a‑
d)中的“实际路径”所示。提取的省际出行链均满足以下特征:
[0123] (1)在空间上相互连续。在省际出行链中,前一条收费记录的出口收费站和后一条收费记录的入口收费站在省界处连续。例如,编号为1的收费记录的出口收费站和编号为2
的收费记录的入口收费站在浙苏省界通过一段很短的高速公路直接相连。
[0124] (2)在时间上相互衔接。在省际出行链中,前一条收费记录的出口收费时间等于后一条收费记录的入口收费时间,两条记录在时间上相互衔接。例如,编号为1的收费记录的
出口收费时间和编号为2的收费记录的入口收费时间相等,均为09:13。
[0125] (3)收费站属性特征。省际出行链的首元素和末元素均为非省界收费站,且所属省份不同;其他收费站均为省界收费站。例如,在表3中编号为1的省际出行链中,收费站8326
和6968均为非省界收费站,且分别属于浙江省和山东省;收费站8098,8099,7027和7019均
为省界收费站。
[0126] 表3:收费数据样例提取的省际出行链
[0127]
[0128]
[0129] 基于省际出行链提取省际出行O‑D及O‑D交通量。从表3所示的4条省际出行链中,共提取出4个不同的O‑D对,分别为(8326,6968)、(315,913)、(6017,7301)和(152,4574)。这
4个O‑D对的O‑D交通量均为1。
[0130] 图6为本发明实施例提供的一种预测路径与实际路径对比示意图。基于省际出行O‑D估算高速公路省际出行量的具体计算步骤如下:
[0131] (1)O‑D对(8326,6968):基于高速公路拓扑网络计算O‑D对(8326,6968)的最短路径,如图5(a)中的“预测路径”所示,该最短路径共经过4个省界断面,分别为8098,8099,
7027和7019,这4个断面的省界断面流量分别加1;
[0132] (2)O‑D对(315,913):计算O‑D对(315,913)的最短路径如图5(b)中的“预测路径”所示,该最短路径共经过2个省界断面,分别为481和489,这2个断面的省界断面流量分别加
1;
[0133] (3)O‑D对(6017,7301):计算O‑D对(6017,7301)的最短路径如图5(c)中的“预测路径”所示,该最短路径共经过4个省界断面,分别为6490,6491,6914和6087,这4个断面的省
界断面流量分别加1;
[0134] (4)O‑D对(152,4574):计算O‑D对(152,4574)的最短路径如图5(d)中的“预测路径”所示,该最短路径共经过4个省界断面,分别为839,861,2356和2412,这4个断面的省界
断面流量分别加1。
[0135] 计算的省界断面流量结果为:省界断面8098,8099,7027,7019,481,489,6490,6491,6914,6087,839,861,2356和2412的流量均为1,其他省界断面的流量为0。
[0136] 最后,通过统计省际断面的实际流量,对估算的省界断面流量结果进行校验。提取第一条省际出行链中的省界收费站,分别为8098,8099,7027和7019,这4个省界收费站的实
际断面流量分别加1;提取第二条省际出行链中的省界收费站,分别为481和489,这2个省界
收费站的实际断面流量分别加1;提取第三条省际出行链中的省界收费站,分别为6490,
6491,6914和6087,这4个省界收费站的实际断面流量分别加1;提取第四条省际出行链中的
省界收费站,分别为839,861,2356和2412,这4个省界收费站的实际断面流量分别加1。
[0137] 最终结果为:省界断面8098,8099,7027,7019,481,489,6490,6491,6914,6087,839,861,2356和2412的实际流量均为1,其他省界断面的实际流量为0。经检验,根据表1收
费数据样例计算得到的省界断面流量的估算结果与实际值完全一致。
[0138] 综上所述,本发明实施例基于全国的高速公路收费数据,结合全国高速公路网络拓扑数据、全国收费站基础信息数据等,给出了高速公路省际出行链的提取算法,计算了高
速公路省际出行流量,并与统计得到的实际断面流量进行对比,有效提高了省际断面流量
推算的实用性。
[0139] 本发明实施例的基于高速公路收费数据的省际出行流量估算方法在流量分配过程中考虑了出行者的实际选择行为,即出行者更倾向于选择最短路出行,使得O‑D对之间的
预测路径更接近实际。
[0140] 本发明实施例的基于高速公路收费数据的省际出行流量估算方法用于解决大规模网络的清分问题。
[0141] 本发明提出的省际出行链提取算法、省际断面流量估算方法等结构简单,通过设置外循环,逐条处理集合中的数据,有效保证了算法的计算效率。
[0142] 本发明实施例的基于高速公路收费数据的省际出行流量估算方法基于简单实用的全有全无流量分配算法,对省际出行O‑D进行网络加载,容易实施。
[0143] 本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
[0144] 通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质
上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品
可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备
(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些
部分所述的方法。
[0145] 本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或
系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法
实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为
分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或
者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根
据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术
人员在不付出创造性劳动的情况下,即可以理解并实施。
[0146] 以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,
都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围
为准。