一种公交站点可达性的预测方法、系统及存储介质转让专利

申请号 : CN202210818914.3

文献号 : CN114971085B

文献日 : 2022-11-11

本发明提供了一种公交站点可达性的预测方法、系统及存储介质，通过围绕公交网络基础设施数据、公交GPS运行数据、IC卡刷卡数据的加工及处理,实现公交网络站点可达性的实时运行监测的全面性和准确性，获取公交GPS数据、刷卡数据等交通相关参数,并根据乘客上、下车站点与时间的对应关系及公交站点、全公交路网的平均出行时间等数据的计算处理，解决了公交运行指标覆盖范围有限导致有效数据提供不全面的缺陷，为评估全公交路网交通可达性提供了有力的数据支撑。

1.一种公交站点可达性的预测方法，其特征在于，包括如下步骤：

S1，获取待计算公交路网的公交线路数据、预设历史时间段内的公交运行GPS数据以及乘客IC卡刷卡记录数据，其中，所述公交线路数据包括公交运行线路信息以及每个所述公交线路的站点信息；

S2，根据所述公交线路的站点信息、公交运行GPS数据以及乘客IC卡刷卡记录数据，建立乘客上车站点与时间的对应关系；

S3，根据预设历史时间段内的乘客历史出行记录获取乘客出行链，依据所述乘客出行链以及所述乘客上车站点的位置与时间的对应关系建立乘客下车站点与时间的对应关系；

其中，所述出行链包括多次出行在时间线上闭合的闭合链和多次出行在时间线上断裂的非闭合链，所述非闭合链包括：出行链断裂以及无出行链；其中，所述出行链断裂情况下：

首先将乘客上车站点的下游站点记为下游站点集合；

然后根据乘客近期出行链，生成乘客高频上车站点，记为高频站点集合；

最后将下游站点集合与高频站点集合的交集，记为潜在下车站点集合；

再通过计算乘客在所有潜在下车站点的下车概率，取所述下车概率中概率最大的公交站点为乘客下车站点；

其中，根据公式计算乘客在潜在下车站点r的下车概率Cr，其中，Vr为历史数据中乘客在其中一个所述潜在下车站点r的上车次数，B为潜在下车站点集合，∑r∈BUr为历史数据中，乘客在潜在下车站点r的上车次数总和；

所述无出行链的情况下：

首先将乘客上车站点的下游站点记为潜在下车站点集合；

然后根据各站点上车客流量和下车客流量计算乘客在各个下游站点下车的概率，取所述各个下游站点下车的概率中概率最大的公交站点为乘客下车站点；

S4，根据预设历史时间段内的乘客上车站点与时间的对应关系和乘客下车站点与时间的对应关系，计算α时间段内从站点i出发到达站点j的出行量qij，α、α时间段内从站点i出发到达站点j的平均出行时间Tij，α以及乘客在α时间段内从站点i出发到达所有目的站点所需的平均可达时间ti，α；其中，α为对应的统计时间段；

S5，基于乘客在所述α时间段内从站点i出发到达所有目的站点所需的平均可达时间ti，α，根据所述α时间段内从站点i出发到达站点j的出行量qij，α通过加权计算公交路网所有站点的平均可达时间阈值tα；

S6，根据公交路网所有站点的平均可达时间阈值tα获得所述公交路网所有公交站点的动态交通可达性评估结果；其中，根据公式计算所述公交路网所有公交站点的动态交通可达性A，其中，M为α时间段内从站点i出发到达站点j，并且出行时间小于全路网公交站点出行时间阈值的目的站点集合，∑j∈Mqij，α为α时间段内从站点i出发到达站点j，并且到达站点j在目的站点集合M内的出行量。

2.根据权利要求1所述的一种公交站点可达性的预测方法，其特征在于，所述步骤S4具体包括步骤：根据公式qij，α＝∑kqk，ij，α，计算乘客在所述α时间段内从站点i出发到达站点j的出行量qij，α，其中，k为出行起讫点满足条件的乘客数，k∈[0,+∞]且为自然数，qk，ij，α为α时间段内，出行起讫点满足条件的k个所述乘客从站点i出发到达站点j的出行量；

根据公式计算乘客在所述α时间段内从站点i出发到达站点j的平均

出行时间Tij，α，其中，Tk，ij，α为α时间段内，k个所述乘客从站点i出发到达站点j的出行时间；

根据公式计算乘客在所述α时间段内从所述站点i出发到达所有

目的站点所需的平均可达时间ti，α，其中，n为从所述站点i出发，乘客不经过换乘即可到达的目的站点集合，s∈n，s是所述站点集合n里的子站点，tis，α为α时间段内从所述站点i到目的站点s的出行时间，qis，α为α时间段内所述站点i到目的站点s的出行量。

3.根据权利要求1或2所述的一种公交站点可达性的预测方法，其特征在于，所述步骤S5具体包括步骤：基于在所述α时间段内从站点i出发到达所有目的站点所需的平均可达时间ti，α，根据公式计算所述公交路网在α时间段内所有公交站点的平均可达时间阈值tα，其中，Qα为α时间段内全公交路网站点的出行总量，h为公交路网的站点总数。

4.根据权利要求1所述的一种公交站点可达性的预测方法，其特征在于，所述步骤S1还包括公交运行乘客IC卡刷卡记录信息以及对所述公交路网的公交线路数据、预设历史时间段内的公交运行GPS数据以及乘客IC卡刷卡记录数据进行数据预处理，所述数据预处理包括数据集成、数据变换、数据清洗以及数据规约。

5.根据权利要求1所述的一种公交站点可达性的预测方法，其特征在于，所述步骤S2具体包括步骤：首先将刷卡记录与公交GPS进行匹配，根据车辆标识号，匹配最接近该刷卡记录中刷卡时刻的公交GPS记录，然后将乘客上车站点的经纬度信息匹配至IC卡刷卡表中；

其次将所述IC卡刷卡表与所述公交站点进行匹配，获取乘客上车站点的位置与时间。

6.一种公交站点可达性的预测系统，其特征在于，包括存储器、处理器以及存储在所述存储器内并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时，实现如权利要求1‑5中任一项所述的一种公交站点可达性的预测方法的步骤。

7.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1‑5中任一项所述的一种公交站点可达性的预测方法的步骤。

一种公交站点可达性的预测方法、系统及存储介质

技术领域

[0001] 本发明涉及城市公交规划领域，尤其涉及一种公交站点可达性的预测方法、系统及存储介质。

背景技术

[0002] 近年来公共交通作为解决城市日益严重的交通拥堵问题的根本措施，但其自身在线路、站点等基础设施布设在缺科学性与合理性的考虑上尚显不足，较为突出的现象表现为乘客出行需求与公交线路站点供给能力不匹配，乘客在公交出行中往往面临多次换乘、非直达线路以及高昂的候车时间等问题。随着我国公交都市建设进程加快，以及公交运行方面数据归集的丰富性与完备性，借助乘客实时出行数据来客观、合理地分析乘客实际出行需求满足程度成为可能。

[0003] 公交站点可达性作为衡量公交网络便捷程度的重要指标，能较好地反映乘客需求的满足程度，目前现有城市公交运行指标覆盖公交路网范围有限，无法针对公交路网进行全空间(站点)、全时段的有效数据采集和分析，因此不能达到公交线网运行监测工作全面性、可靠性的目的；而且现有公交路网运行监测工作无法针对站点之间、公交供给与乘客需求之间进行行程时间、乘客需求满足程度的计算和估计，从而不能提高公交网络的服务水平与高效性，并且现有公交路网运行监测设备不完备，在公交站点或线路沿线新布设覆盖公交全路网的运行监测设备的建设成本和维护成本较高，不能以较低的成本达到即时响应路网运行的状态的目的。

[0004] 鉴于此，有必要提供一种公交站点可达性的预测方法，以解决或至少缓解上述公交运行指标覆盖范围有限导致有效数据提供不全面的缺陷。

发明内容

[0005] 本发明的主要目的是提供一种公交站点可达性的预测方法，旨在解决上述公交运行指标覆盖范围有限导致有效数据提供不全面的技术问题。

[0006] 为实现上述目的，本发明提供了一种公交站点可达性的预测方法，包括：

[0007] S1，获取待计算公交路网的公交线路数据、预设历史时间段内的公交运行GPS数据以及乘客IC卡刷卡记录数据，其中，所述公交线路数据包括公交运行线路信息以及每个所述公交线路的站点信息；

[0008] S2，根据所述公交线路的站点信息、公交运行GPS数据以及乘客IC卡刷卡记录数据，建立乘客上车站点与时间的对应关系；

[0009] S3，根据预设历史时间段内的乘客历史出行记录获取乘客出行链，依据所述乘客出行链以及所述乘客上车站点的位置与时间的对应关系建立乘客下车站点与时间的对应关系；其中，所述出行链包括多次出行在时间线上闭合的闭合链和多次出行在时间线上断裂的非闭合链，所述非闭合链包括：出行链断裂以及无出行链；其中，

[0010] 所述出行链断裂情况下：

[0011] 首先将乘客上车站点的下游站点记为下游站点集合；

[0012] 然后根据乘客近期出行链，生成乘客高频上车站点，记为高频站点集合；

[0013] 最后将下游站点集合与高频站点集合的交集，记为潜在下车站点集合；

[0014] 再通过计算乘客在所有潜在下车站点的下车概率，取所述下车概率中概率最大的公交站点为乘客下车站点；

[0015] 其中，根据公式计算乘客在潜在下车站点的下车概率Cr，其中，Vr为历史数据中乘客在所述站点r的上车次数，B为潜在下车站点集合，∑r∈BUr为历史数据中，乘客在潜在下车站点r的上车次数总和；

[0016] 所述无出行链的情况下：

[0017] 首先将乘客上车站点的下游站点记为潜在下车站点集合；

[0018] 然后根据各站点上车客流量和下车客流量计算乘客在各个下游站点下车的概率，取所述各个下游站点下车的概率中概率最大的公交站点为乘客下车站点；

[0019] 其中，根据公式计算乘客在各个下游站点下车的概率，其中，Li为历史数据中站点i的上车乘客量，D为站点i下游站点集合，∑m∈DZm为历史数据中下游各站点m的上车乘客量总和。

[0020] S4，根据预设历史时间段内的乘客上车站点与时间的对应关系和乘客下车站点与时间的对应关系，计算α时间段内从站点i出发到达站点j的出行量qij，α、α时间段内从站点i出发到达站点j的平均出行时间Tij，α以及乘客在α时间段内从站点i出发到达所有目的站点所需的平均可达时间ti，α；其中，α为对应的统计时间段；

[0021] S5，基于乘客在所述α时间段内从站点i出发到达所有目的站点所需的平均可达时间ti，α，根据所述α时间段内从站点i出发到达站点j的出行量qij，α通过加权计算公交路网所有站点的平均可达时间阈值tα；

[0022] S6，根据公交路网所有站点的平均可达时间阈值tα获得所述公交路网所有公交站点的动态交通可达性评估结果；其中，根据公式计算所述公交路网所有公交站点的动态交通可达性A，其中，M为α时间段内从站点i出发到达站点j，并且出行时间小于全路网公交站点出行时间阈值的目的站点集合，∑j∈Mqij，α为α时间段内从站点i出发到达站点j，并且到达站点j在目的站点集合M内的出行量。

[0023] 进一步地，所述步骤S4具体包括步骤：

[0024] 根据公式qij，α＝∑kqk.ij，α，计算乘客在所述α时间段内从站点i出发到达站点j的出行量qij，α，其中，k为出行起讫点满足条件的乘客数，k∈[0,+∞]且为自然数，qk，ij，α为α时间段内，出行起讫点满足条件的k个所述乘客从站点i出发到达站点j的出行量；

[0025] 根据公式计算乘客在所述α时间段内从站点i出发到达站点j的平均出行时间Tij，α，其中，Tk，ij，α为α时间段内，k个所述乘客从站点i出发到达站点j的出行时间；

[0026] 根据公式计算乘客在所述α时间段内从所述站点i出发到达所有目的站点所需的平均可达时间ti，α，其中，n为从所述站点i出发，乘客不经过换乘即可到达的目的站点集合，s∈n，s是所述站点集合n里的子站点，tis，α为α时间段内从所述站点i到目的站点s的出行时间，qis，α为α时间段内所述站点i到目的站点s的出行量。

[0027] 进一步地，所述步骤S5具体包括步骤：

[0028] 基于在所述α时间段内从站点i出发到达所有目的站点所需的平均可达时间ti，α，根据公式计算所述公交路网在α时间段内所有公交站点的平均可达时间阈值tα，其中，Qα为α时间段内全公交路网站点的出行总量，h为公交路网的站点总数。

[0029] 进一步地，所述步骤S1还包括获取公交运行乘客IC卡刷卡记录信息以及对所述公交路网的公交线路数据、预设历史时间段内的公交运行GPS数据以及乘客IC卡刷卡记录数据进行数据预处理；所述数据预处理包括数据集成、数据变换、数据清洗以及数据规约。

[0030] 进一步地，所述步骤S2具体包括步骤：

[0031] 首先将刷卡记录与公交GPS进行匹配，根据车辆标识号，匹配最接近该刷卡记录中刷卡时刻的公交GPS记录，然后将乘客上车站点的经纬度信息匹配至IC卡刷卡表中；

[0032] 其次将所述IC卡刷卡表与所述公交站点进行匹配，获取乘客上车站点的位置与时间。

[0033] 本发明还提供一种公交站点可达性的预测系统，包括存储器、处理器以及存储在所述存储器内并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时，实现如上述任一项所述的一种公交站点可达性的预测方法的步骤。

[0034] 本发明还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如上述任一项所述的一种公交站点可达性的预测方法的步骤。

[0035] 与现有技术相比，本发明具有以下优点：

[0036] 本发明提供了一种公交站点可达性的预测方法，通过围绕公交网络基础设施数据、公交GPS运行数据、IC卡刷卡数据的加工及处理,实现公交网络站点可达性的实时运行监测的全面性和准确性，获取公交GPS数据、刷卡数据等交通相关参数,根据乘客上、下车站点与时间的对应关系及公交站点、全公交路网的平均出行时间等指标的计算处理，解决了公交运行指标覆盖范围有限导致有效数据提供不全面的缺陷，为评估全公交路网交通可达性提供了有力的数据支撑。

附图说明

[0037] 为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图示出的结构获得其他的附图。

[0038] 图1为本发明的一种公交站点可达性的预测方法的流程示意图。

[0039] 本发明目的的实现、功能特点及优点将结合实施方式，参照附图做进一步说明。

具体实施方式

[0040] 下面将结合本发明实施方式中的附图，对本发明实施方式中的技术方案进行清楚、完整地描述，显然，所描述的实施方式仅仅是本发明的一部分实施方式，而不是全部的实施方式。基于本发明中的实施方式，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式，都属于本发明保护的范围。

[0041] 需要说明，本发明实施方式中所有方向性指示(诸如上、下……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等，如果该特定姿态发生改变时，则该方向性指示也相应地随之改变。

[0042] 另外，在本发明中如涉及“第一”、“第二”等的描述仅用于描述目的，而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。

[0043] 并且，本发明各个实施方式之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本发明要求的保护范围之内。

[0044] 请参阅附图1，本发明提供了一种公交站点可达性的预测方法，包括如下步骤：

[0045] S1，获取待计算公交路网的公交线路数据、预设历史时间段内的公交运行GPS数据以及公交运行乘客IC卡刷卡记录信息，其中，所述公交线路数据包括公交线路信息以及每个所述公交线路的站点信息；

[0046] 具体的，如表1所示，所述公交线路数据信息包括线路编号、线路名称、线路方向、线路总长、途经站点数量等字段；如表2所示，每个所述公交线路的站点信息包括公交站点编号、公交站点名称、经度、纬度、线路序列、线路数量等字段；如表3所示，所述公交车GPS记录信息记录了公交车在路段运行的时空轨迹，包括车辆唯一标识、记录日期、记录时刻、车辆瞬时速度、车辆所属线路编号、车辆所属线路名称、经度、纬度、与正北方向的顺时针夹角等字段，还包括停站时间、出发时间、到站时间、时间‑位置记录；如表4所示，乘客IC卡刷卡记录信息记录了乘客使用IC刷卡的基本信息，包括IC卡编号、IC卡类型、车辆唯一标识、线路名称、刷卡日期、刷卡时刻、车辆唯一标识等字段。

[0047] 表1公交线路信息表

[0048]

[0049]

[0050] 表2公交路线的站点信息表

[0051]字段名字段说明注释
StationID 公交站点编号唯一标识
StationName 公交站点名称
Lng 经度
Lat 纬度
LinesStr 线路序列停靠线路的集合
LinesNum 线路数量停靠线路的数量
...... ...... ......

[0052] 表3公交GPS记录信息表

[0053]字段名字段说明注释
BusNum 车辆唯一标识唯一标识
Date 记录日期
Time 记录时刻
Lng 经度
Lat 纬度
LineID 车辆所属线路编号
LineName 车辆所属线路名称
Speed 车辆瞬时速度
Angle 与正北方向的顺时针夹角
...... ...... ......

[0054] 表4乘客IC卡刷卡信息表

[0055]

[0056]

[0057] S2，根据所述公交站点信息、公交运行GPS数据以及乘客IC卡刷卡记录数据，建立乘客上车站点与时间的对应关系；

[0058] 具体的，公交线路刷卡设备采用一票制收费，乘客只在上车时刷卡，下车时并不需要刷卡，因此每条刷卡数据只记录了乘客刷卡的线路编号、车辆编号、IC卡编号以及刷卡时刻，但并未记录乘客具体的上车站点。为此，通过公交站点信息以及公交运行GPS数据进行匹配，以获取公交刷卡数据的具体上车站点的位置与时刻，为线路客流估计、出行需求预测提供数据支持。

[0059] S3，根据预设历史时间段内的乘客历史出行记录获取乘客出行链，依据所述乘客出行链以及所述乘客上车站点的位置与时间的对应关系建立乘客下车站点与时间的对应关系；其中，所述出行链包括多次出行在时间线上闭合的闭合链和多次出行在时间线上断裂的非闭合链，所述非闭合链包括：出行链断裂以及无出行链；

[0060] 具体的，所述出行链是指具有一项或者多项出行目的的人,在某个时间段内根据出行目的排列出的往返行程,该行程中含有大量的空间、时间、活动类型及出行方式等信息；由于乘客下车时并不需要刷卡，所以需要从乘客的出行链建立乘客下车站点的位置与时间的联系。所述出行链闭合是在该乘客历史出行数据中能够获取该乘客完整出行链，依次连接乘客多次出行的上车站点，生成乘客完整出行轨迹，从而判断乘客此次出行的下车站点为其下一次出行记录的上车站点。所述出行链断裂是在该乘客历史出行数据中能够获取该乘客不完整的出行链情况下，参考乘客近期相似出行链，乘客会在上车站点的下游且近期上车频次高的站点下车。所述无出行链是在当该乘客历史出行数据中不存在出行记录的情况下，将乘客上车站点的下游站点记为潜在下车站点集合。

[0061] S4，根据预设历史时间段内的乘客上车站点与时间的对应关系和乘客下车站点与时间的对应关系，计算α时间段内从站点i出发到达站点j的出行量qij，α、α时间段内从站点i出发到达站点j的平均出行时间Tij，α以及乘客在α时间段内从站点i出发到达所有目的站点所需的平均可达时间ti，α；其中，α为对应的统计时间段；

[0062] 具体的，根据乘客上、下车站点与时间的对应关系，可以通过公式出计算从起始站点到目的站点的出行量qij，α、平均出行时间Tij，α以及从站点i出发到达所有目的站点所需的平均可达时间ti，α，以供后续使用。

[0063] S5，基于乘客在所述α时间段内从站点i出发到达所有目的站点所需的平均可达时间ti，α，根据所述α时间段内从站点i出发到达站点j的出行量qij，α通过加权计算公交路网所有站点的平均可达时间阈值tα；

[0064] S6，根据公交路网所有站点的平均可达时间阈值tα获得所述公交路网所有公交站点的动态交通可达性评估结果。

[0065] 具体的，所述可达性即便捷性，是指从出行地到目的地的方便程度，通过公交站点动态可达性实现对全路网站点实时可达性的计算，展示了不同区域的公共交通服务水平存在较大差异，便于为决策者从站点设置和线网优化等方面针对性地提出改善对策。

[0066] 进一步地，所述步骤S4具体包括步骤：

[0067] 根据公式qij，α＝∑kqk.ij，α，计算乘客在所述α时间段内从站点i出发到达站点j的出行量qij，α，其中，k为出行起讫点满足条件的乘客数，k∈[0,+∞]且为自然数，qk，ij，α为α时间段内，出行起讫点满足条件的k个所述乘客从站点i出发到达站点j的出行量；

[0068] 具体的，可以通过公式qij，α＝∑kqk.ij，α计算出乘客在所述α时间段内从站点i出发到达站点j的出行量。

[0069] 根据公式计算乘客在所述α时间段内从站点i出发到达站点j的平均出行时间Tij，α，其中，Tk，ij，α为α时间段内，k个所述乘客从站点i出发到达站点j的出行时间；

[0070] 具体的，乘客在所述公交路网起讫站点间的平均出行时间可以根据公式计算得到，需要注意的是，本领域技术人员还可以根据实际需要采用其他
公式计算乘客在所述公交路网起讫站点间的平均出行时间。

[0071] 根据公式计算乘客在所述α时间段内从所述站点i出发到达所有目的站点所需的平均可达时间ti，α，其中，n为从所述站点i出发，乘客不经过换乘即可到达的目的站点集合，s∈n，s是所述站点集合n里的子站点，tis，α为α时间段内从所述站点i到目的站点s的出行时间，qis，α为α时间段内所述站点i到目的站点s的出行量。

[0072] 具体的，所述站点i的平均可达时间可以根据公式计算得到，需要注意的是，本领域技术人员还可以根据实际需要采用其他公式计算所述站点i的平均可达时间。

[0073] 进一步地，所述步骤S5具体包括步骤：

[0074] 基于在所述α时间段内从站点i出发到达所有目的站点所需的平均可达时间ti，α，根据公式计算所述公交路网在α时间段内所有公交站点的平均可达时间阈值tα，其中，Qα为α时间段内全公交路网站点的出行总量，h为公交路网的站点总数。

[0075] 具体的，所述路网公交站点的出行时间阈值，可以基于从站点i出发到达所有目的站点所需的平均可达时间ti，α通过公式计算得到，同时，本领域技术人员还可以根据实际需要采用其他公式计算所述路网公交站点的出行时间阈值。

[0076] 进一步地，所述步骤S6具体包括：

[0077] 根据公式计算所述公交路网所有公交站点的动态交通可达性A，其中，M为α时间段内从站点i出发到达站点j，并且出行时间小于全路网公交站点出行时间阈值的目的站点集合，∑j∈Mqij，α为α时间段内从站点i出发到达站点j，并且到达站点j在目的站点集合M内的出行量。

[0078] 具体的，所述交通可达性可以是利用城市公共交通系统从出发点到达目标点的便利程度，根据公式实现了对公交路网所有公交站点的动态交通可达性的计算，同时，本领域技术人员还可以根据实际需要采用其他方式计算公交站点动态交通可达性。

[0079] 进一步地，所述步骤S3具体包括步骤：

[0080] 所述出行链断裂情况下：

[0081] 首先将乘客上车站点的下游站点记为下游站点集合；

[0082] 然后根据乘客近期出行链，生成乘客高频上车站点，记为高频站点集合；

[0083] 最后将下游站点集合与高频站点集合的交集，记为潜在下车站点集合；

[0084] 再通过计算乘客在所有潜在下车站点的下车概率，取所述下车概率中概率最大的公交站点为乘客下车站点；

[0085] 其中，根据公式计算乘客在潜在下车站点的下车概率Cr，其中，Vr为历史数据中乘客在所述站点r的上车次数，B为潜在下车站点集合，∑r∈BUr为历史数据中，乘客在潜在下车站点r的上车次数总和。具体的，通过公式本领域技术人员可以通过分析得出乘客在某站点的下车概率与近期在该站点的上车次数成正比。

[0086] 具体的，由于乘客发生不可抗拒的原因或者设备出现问题导致出行链出现断裂，不能形成完成的出行链，因此需要将乘客上车站点的下游站点记为下游站点集合，再根据乘客近期的出行链，判断生成乘客的高频上车站点，并设置为高频站点集合，然后将下游站点集合与高频站点集合的交集，设置为潜在下车站点集合。

[0087] 进一步地，所述步骤S3具体包括步骤：

[0088] 所述无出行链的情况下：

[0089] 首先将乘客上车站点的下游站点记为潜在下车站点集合；

[0090] 然后根据各站点上车客流量和下车客流量计算乘客在各个下游站点下车的概率，取所述各个下游站点下车的概率中概率最大的公交站点为乘客下车站点。

[0091] 其中，根据公式计算乘客在各个下游站点下车的概率Pi，其中，Li为历史数据中站点i的上车乘客量，D为站点i下游站点集合，∑m∈DZm为历史数据中下游各站点m的上车乘客量总和。具体的，根据公式本领域技术人员可以分析得出乘客在下游某站点下车的概率与该站点的上车客流量成正比。

[0092] 进一步地，所述S1步骤还包括获取公交运行乘客IC卡刷卡记录信息以及对所述公交路网的公交线路数据、预设历史时间段内的公交运行GPS数据以及乘客IC卡刷卡记录数据进行数据预处理；所述数据预处理包括数据集成、数据变换、数据清洗以及数据规约。

[0093] 具体的，所述数据集成首先将公交GPS数据和公交站点基础信息进行融合，然后根据乘客IC刷卡时间及车辆编号匹配该车辆最近邻时间段所处的站点，只保留匹配后的数据，形成新的乘客上车信息记录表；所述数据变换基于乘客上车站点‑乘客下车站点、乘客上车时间‑乘客下车时间的出行信息形式对形成的乘客上、下车信息进行起讫点划分，得到所述公交路网中各站点间乘客出行量以及出行时间；所述数据变换是指结合当前算法需要，将数据转换为特定的、规划化的形式，或通过已有数据的属性结构进行新属性的构造；所述数据清洗清除或筛选所述公交GPS数据与所述乘客IC卡刷卡数据中可能会存在的异常数据，由于检测设备自身故障、人工错误操作、数据采集和传输的操作过程故障等意外因素，所述公交GPS数据与乘客IC卡刷卡数据中可能会存在异常数据，因此采用数据清洗将所述异常数据进行清除或者筛选；所述数据规约限定站点出行量以及公交可达性的获取范围，以减小对不必要数据的获取。具体的，考虑到站点出行量及可达性研究不涉及收费、计费等相关内容，因此将此类字段进行精简处理，只保留公交站点出行量、出行时间等研究需要的到达时间、IC卡编号、经纬度坐标等关键字段。

[0094] 需要注意的是，所述数据清洗步骤中的所述异常数据包括缺失数据、错误数据和特殊行为数据；所述缺失数据为因公交GPS数据与乘客IC刷卡数据关键数据字段缺失而导致的不完整数据；所述错误数据为在正常逻辑或规则上出现错误的数据；所述特殊行为数据为非正常行驶状态下的车辆数据，主要表现在车速过大或过小的情况，或者与现实情况不符或偏离正常范围的情况。具体的，缺失数据中缺失的关键数据可以是GPS记录信息中的记录时间、车辆所属路线、经纬度位置以及IC刷卡数据中IC卡编号、刷卡时刻、车辆唯一标识等；出现错位的情形可能为由于系统问题导致IC卡数据编码无法与线路站点信息匹配、车辆到达下一站点时间早于上一站点、刷卡时段不在公交车运营时间范围内、公交线路中存在同一编号对应不同的站点；

[0095] 进一步地，所述步骤S2具体包括步骤：

[0096] 首先将刷卡记录与公交GPS进行匹配，根据车辆标识号，匹配最接近该刷卡记录中刷卡时刻的公交GPS记录，然后将乘客上车站点的经纬度信息匹配至IC卡刷卡表中；

[0097] 其次将所述IC卡刷卡表与所述公交站点进行匹配，获取乘客上车站点的位置与时间。

[0098] 具体的，将刷卡记录与公交GPS进行匹配，根据车辆标识号，匹配最接近该刷卡记录中刷卡时刻的公交GPS记录，然后将乘客上车站点的经纬度信息匹配至IC卡刷卡表中，可以通过创建伪代码实现。伪代码如下：

[0099] Select BusNum,Lng,Lat from GPS_table where GPS_table.BusNum＝IC_table.BusNum and min(|GPS_table.time‑IC_table.time|)as temp_data

[0100] Add temp_data to IC_table where temp_data.BusNum＝IC_table.BusNum[0101] 具体的，将所述IC卡刷卡表与所述公交站点进行匹配，获取乘客上车站点的位置与时间，可以通过创建伪代码实现。伪代码如下：

[0102] Select StationID,StationName,Lng,Lat,BusNum from gjz_table where IC_table.BusNum in gjz_table.LinesStr as temp_data1

[0103] Select*from temp_data1 where min(dis((IC_table.Lng,temp_data1.Lng2),(IC_table.Lat1,temp_data1.Lat)))in temp_data1 as temp_data2

[0104] Add temp_data2 to IC_table wheretemp_data2.BusNum＝IC_table.BusNum[0105] 本发明还提供了一种公交站点可达性的预测方法，其特征在于，包括存储器、处理器以及存储在所述存储器内并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时，实现如上述任一项所述的一种公交站点可达性的预测方法的步骤。在本发明的具体实施例中，计算系统的处理器执行计算机程序时实现上述的公交站点可达性的预测方法的步骤，通过现有的公交GPS记录信息以及乘客IC卡刷卡记录信息对待计算公交路网的公交站点可达性进行监测，不需要重新增设路网站点监测设备，实现了公交网络站点可达性的实时运行监测的全面性和准确性，同时，又节约了公交站点监测设备的建设成本和建设时间。

[0106] 本发明还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如上述任一项所述的公交站点可达性的预测方法的步骤。在本发明的具体实施例中，计算机可读存储介质中存储的计算机程序被处理器执行时可以实现上述的一种公交站点可达性的预测方法的步骤，通过现有的公交GPS记录信息以及乘客IC卡刷卡记录信息对待计算公交路网的公交站点可达性进行监测，不需要重新增设路网站点监测设备，实现了公交网络站点可达性的实时运行监测的全面性和准确性，同时，又节约了公交站点监测设备的建设成本和建设时间。

[0107] 本发明的上述技术方案中，以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是在本发明的技术构思下，利用本发明说明书及附图内容所作的等效结构变换，或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围。

一种公交站点可达性的预测方法、系统及存储介质转让专利

申请号 : CN202210818914.3

文献号 : CN114971085B

文献日 : 2022-11-11

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 戴剑军 , 谢英杰 , 黎乐潇 , 黄会敏

申请人 : 湖南省交通科学研究院有限公司

摘要 :

权利要求 :

说明书 :