基于马尔科夫链的公共自行车站点供需预测方法转让专利

申请号 : CN201510050755.7

文献号 : CN104636828B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 杨飞黄奕慧谭玉龙

申请人 : 西南交通大学

摘要 :

本发明公开了一种基于马尔科夫链的公共自行车站点供需预测方法,运用公共自行车租赁站点终端的自行车租借数据,通过构建借、还车辆的转移概率矩阵,建立关于站点重要度的平衡稳态方程,预测站点的每日借还需求量。本发明的积极效果是:利用了马尔科夫链这一概率统计学上的经典方法,结合公共自行车租赁站点的实际问题,提出了切实可用的借还车辆供需预测方法,为以后指导公共自行车站点的桩位具体建设问题以及平衡调度问题提供理论指导,具有很好的行业应用前景。

权利要求 :

1.一种基于马尔科夫链的公共自行车站点供需预测方法,其特征在于:包括以下步骤:第一步、公共自行车站点供需信息的采集及数据库创建:搜集公共自行车站点的终端刷卡数据,并采集如下信息:借出站点名称、借出站点编号、还车站点名称、还车站点编号、借车时刻、还车时刻、用车时间、持卡种类;

第二步、数据预处理:

2.1站点重新编号:

根据站点编号按从小到大的顺序对站点进行排序,然后按照1,2,3…这样连续不间断的顺序重新给站点标号;

2.2剔除无效数据:

(1)剔除管理卡刷卡数据;

(2)剔除异常数据,包括:在同一站点刷卡借车与还车,且两次刷卡时间相差在5分钟以内的数据;以及借还刷卡时间超过一天的数据;

第三步、建立转移概率矩阵:

3.1构建各个站点之间的平均借还矩阵:

首先利用剔除无效数据后剩余的有效数据,构建各天的原始借还矩阵,矩阵阶数为n×n,n为公共自行车站点的个数,矩阵的元素aij表示从i站点借出到j站点归还的车辆数;然后对至少一个月的相应的aij进行平均,得到各个站点间的平均借还矩阵;

3.2构建借车的转移概率矩阵P:

根据马尔科夫链构建借车的转移概率矩阵P,矩阵阶数为n×n,矩阵的元素pij表示从i站点借出到j站点归还的车辆数占所有从i站点借出的车辆数的比例:其中,Pi表示所有从i站点借出的车辆数:

3.3构建还车的转移概率矩阵Q:

根据马尔科夫链构建还车的转移概率矩阵Q,矩阵阶数为n×n,矩阵的元素qij表示从i站点借出到j站点归还的车辆数占所有到j站点归还的车辆数的比例:其中,qj表示所有到j站点归还的车辆数:

第四步、计算各个站点的借、还车的分配权重:

4.1求解借车的平衡稳态方程:

首先,建立π,π是一个(x1,x2,...,xi,...xn)的行向量,元素xi作为站点i的借车分配权重,其中xi≥0,且 然后,建立借车的平衡稳态方程πP=π;最后,通过求解借车的平衡稳态方程得到各个站点的借车分配权重;

4.2求解还车的平衡稳态方程:

首先,建立π*,π*是一个(y1,y2,...,yj,...yn)的行向量,元素yj作为站点j的还车分配权重,其中yj≥0,且 然后,建立还车的平衡稳态方程π*Q=π*;最后,通过求解还车的平衡稳态方程得到各个站点的还车分配权重;

第五步、利用预测的公共自行车的日总需求量预测公共自行车站点未来的借车与还车需求,其中,公共自行车的日总需求量的预测公式为:式中:B为公共自行车的日总需求量,单位万辆;R1、R2分别为规划常住人口、规划流动人口,单位万人;t1,t2分别为常住人口、流动人口的日均出行次数,单位次/人日;s为公共自行车占全方式出行比例;v为公共自行车日均周转率,次/日。

2.根据权利要求1所述的基于马尔科夫链的公共自行车站点供需预测方法,其特征在于:第五步所述公共自行车站点未来的借车需求等于日总需求量乘以该站点的借车分配权重;所述公共自行车站点未来的还车需求等于日总需求量乘以该站点的还车分配权重。

说明书 :

基于马尔科夫链的公共自行车站点供需预测方法

技术领域

[0001] 本发明属于交通规划中公共自行车系统规划领域,尤其针对公共自行车的借还需求量进行预测的方法。

背景技术

[0002] 公共自行车系统作为公共交通体系的重要组成部分,解决了轨道交通和地面公共交通均无法满足的“最后一公里”的末端交通需求。该系统具有使用便捷、可达性高、收费低廉、低碳环保等特征,可以作为公共交通体系中的毛细血管,提供“门到门”服务,有效满足短距离出行的需求,大大延伸公共交通的服务范围。
[0003] 随着各地公共自行车系统的逐渐建立,在普及使用时也出现了一系列问题,其中突出存在的问题主要有两方面,一方面是政府投入太大,入不敷出;另一方面是居民在站点借车难、还车难。这两个问题的矛头都指向公共自行车的借还需求量不平衡,能否妥善解决公共自行车的供需矛盾成为公共自行车系统能否进一步发展的关键。
[0004] 解决公共自行车的借还需求量问题对指导租赁站点的规模建设和系统调度安排上都有着重要的作用。科学合理的租赁点建设规模既可以最大程度地满足需求,又可以节省建设成本。通过对不同租赁点之间的公共自行车进行及时而合理的调度,可以提高公共自行车的周转率,解决因不同租赁点公共自行车数量不均衡而导致的“借车难或还车难”等问题。
[0005] 目前,解决自行车供需矛盾问题的理论方法主要有两种:
[0006] 一种是建立在经验基础上的借还需求量预测。这种预测方法曾在巴黎和杭州等国内外城市的公共自行车站点需求预测中采用,通过分析居民数量,服务半径或者类比现有同等城市发展经验,得出未来的自行车供需量。这种预测方式的缺陷是:预测方法是基于该城市的特点,是一定的统计规律得到的预测规律,并不是对每一个城市都能适用,尤其面对城市规模差距大,顾客选择出行方式行为差距大的地方,预测结果精度大打折扣。
[0007] 另一种是建立在“四阶段规划”模型基础上的供需预测模型。这种传统的预测方法需要首先进行交通小区划分,然后进行小区OD分配,再按照出行方式划分,得到交通小区之间采用公共自行车的OD量,通过OD量来预测公共自行车站点的供需情况。但是这种预测也存在着以下的问题:每个交通小区可能含有多个公共自行车站点,每个站点由于地理位置的不同,其重要性也有着明显差别,以传统的预测方式预测的供需关系没有办法指导具体站点的供需预测问题,这使得具体站点在供需补给上与真实需求不匹配,市民无车可借、无处停车的现象不能真实得到缓解,政府对站点桩位的投资并不能真正的受惠于民、遭到浪费。

发明内容

[0008] 为了克服现有技术的上述缺点,本发明提出了一种基于马尔科夫链的公共自行车站点供需预测方法,基于马尔科夫链的站点供需预测技术恰恰解决了现有技术的以上难题,不受限于城市规模和行人行为选择的不同,能够预测每个公共自行车站点的供需情况。本发明方法运用公共自行车租赁站点终端的自行车租借数据,基于马尔科夫链的稳态分布性质,构建借还车辆的转移概率矩阵,求解稳态向量,将稳态向量中的元素作为对应站点的分配权重,预测站点的借车以及还车需求量。
[0009] 本发明解决其技术问题所采用的技术方案是:一种基于马尔科夫链的公共自行车站点供需预测方法,包括以下步骤:
[0010] 第一步、公共自行车站点供需信息的采集及数据库创建:
[0011] 搜集公共自行车站点的终端刷卡数据,并采集如下信息:借出站点名称、借出站点编号、还车站点名称、还车站点编号、借车时刻、还车时刻、用车时间、持卡种类;
[0012] 第二步、数据预处理:
[0013] 2.1站点重新编号:
[0014] 根据站点编号按从小到大的顺序对站点进行排序,然后按照1,2,3…这样连续不间断的顺序重新给站点标号;
[0015] 2.2剔除无效数据:
[0016] (1)剔除管理卡刷卡数据;
[0017] (2)剔除异常数据,包括:在同一站点刷卡借、还,且两次刷卡时间相差在5分钟以内的数据;以及借还刷卡时间超过一天的数据;
[0018] 第三步、建立转移概率矩阵:
[0019] 3.1构建各个站点之间的平均借还矩阵:
[0020] 首先利用剔除无效数据后剩余的有效数据,构建各天的原始借还矩阵,矩阵阶数为n×n,n为公共自行车站点的个数,矩阵的元素aij表示从i站点借出到j站点归还的车辆数;然后对至少一个月的相应的aij进行平均,得到各个站点间的平均借还矩阵;
[0021] 3.2构建借车的转移概率矩阵P:
[0022] 根据马尔科夫链构建借车的转移概率矩阵P,矩阵阶数为n×n,矩阵的元素pij表示从i站点借出到j站点归还的车辆数占所有从i站点借出的车辆数的比例:
[0023]
[0024] 其中,Pi表示所有从i站点借出的车辆数:
[0025] 3.3构建还车的转移概率矩阵Q:
[0026] 根据马尔科夫链构建还车的转移概率矩阵Q,矩阵阶数为n×n,矩阵的元素qij表示从i站点借出到j站点归还的车辆数占所有到j站点归还的车辆数的比例:
[0027]
[0028] 其中,qj表示所有到j站点归还的车辆数:
[0029] 第四步、计算各个站点的借、还车的分配权重:
[0030] 4.1求解借车的平衡稳态方程:
[0031] 首先,建立π,π是一个(x1,x2,...,xi,...xn)的行向量,元素xi作为站点i的借车分配权重,其中xi≥0,且 然后,建立平衡稳态方程πP=π;最后,通过求解稳态平衡方程得到各个站点的借车分配权重;
[0032] 4.2求解还车的平衡稳态方程:
[0033] 首先,建立π*,π*是一个(y1,y2,...,yj,...yn)的行向量,元素yj作为站点j的还车分配权重,其中yj≥0,且 然后,然后,建立平衡稳态方程π*Q=π*;最后,通过求解稳态平衡方程得到各个站点的还车分配权重;
[0034] 第五步、利用预测的公共自行车的日总需求量预测公共自行车站点未来的借、还车需求。
[0035] 与现有技术相比,本发明的积极效果是:本发明的突出优点就是利用了马尔科夫链这一概率统计学上的经典方法,结合公共自行车租赁站点的实际问题,提出切实可用的借还车辆供需预测方法,为以后指导公共自行车站点的桩位具体建设问题以及平衡调度问题提供理论指导,具有很好的行业应用前景。
[0036] 本发明针对目前公共自行车系统站点需求预测,缺少合理科学的方法,或者采用的方法,如传统“四阶段”法不太适用等问题,提出了一种以概率论为基础的马尔科夫链模型的方法,对公共自行车站点的借车与还车需求进行预测。运用公共自行车的刷卡数据,通过对各个站点停车还车情况进行统计,计算出各个站点之间的借车与还车的概率,分别建立借车以及还车的转移矩阵,并计算出其稳态向量。然后依据未来年的土地、人口、出行信息等,通过出行分析法预测出未来年的公共自行车出行总量。最后,结合公共自行车出行总量,和计算出的稳态向量中的元素对应站点的分配权重,得到未来年的各个站点的借车以及还车的日总需求量。
[0037] 本方法的优点在于:利用了马尔科夫链这一概率统计学上的经典方法,而公共自行车系统与马尔科夫链模型的适用条件能够很好的契合,因而能够运用马尔科夫链这一概率论中经典的方法来科学地指导公共自行车站点的借车、还车需求预测。该方法能够弥补现有的经验法其科学性不足的弊端,以及传统“四阶段”法只能够落实到交通小区,没办法细致到公共自行车站点的弊端。该发明可以运用于公共自行车系统的后期规划,或者已建公共自行车系统站点规模的调整等。

附图说明

[0038] 本发明将通过例子并参照附图的方式说明,其中:
[0039] 图1是2013年6月日平均借车量预测值与真实值的对比状况;
[0040] 图2是2013年9月日平均借车量预测值与真实值的对比状况;
[0041] 图3是2013年12月日平均借车量预测值与真实值的对比状况;
[0042] 图4是2013年6月日平均还车量预测值与真实值的对比状况;
[0043] 图5是2013年9月日平均还车量预测值与真实值的对比状况;
[0044] 图6是2013年12月日平均还车量预测值与真实值的对比状况。

具体实施方式

[0045] 基于马尔科夫链算法提供公共自行车具体站点的借还需求量预测方法,能比较准确的估算出各站点实际借车还车的需求状况。具体方法包括以下步骤:
[0046] 第一步、公共自行车站点供需信息的采集及数据库创建:
[0047] 利用公共自行车站点的终端刷卡数据,进行具体站点的所有种类刷卡的数据的搜集。采集数据内容包括:借出站点名称、借出站点编号、还车站点名称、还车站点编号、借车时刻、还车时刻、用车时间、持卡种类等相关信息。
[0048] 第二步、数据预处理:
[0049] 2.1站点重新编号:
[0050] 将搜集的数据输入电脑,对站点进行重新编号,先按从小到大的顺序对站点ID进行排序,然后按照1,2,3…这样连续不间断的顺序重新给站点标号。
[0051] 2.2剔除无效数据:
[0052] (1)剔除非居民数据:
[0053] 刷卡数据分为两种,一种是会员卡刷卡,提供居民借还公共自行车服务,一种是管理卡刷卡,提供调度者对车辆进行统一调度安排。其中会员卡刷卡数据正是我们需要采集的居民出行数据,而管理卡刷卡数据与居民出行无直接关联,需要剔除。
[0054] (2)剔除异常数据:
[0055] 异常数据有两种,一种是在同一站点刷卡借还且两次刷卡时间相差过短的数据(比如用车时间在5分钟以下的数据),这部分数据被认为不是在一次出行的情况下产生的数据,该数据的产生可能是因为出行者在借车后发现车子有问题或者临时放弃采用公共自行车出行,实际并不产生出行,故这样的数据应该被筛除;另一种是借还刷卡时间超过一天的数据,由于下一步运算中只是对一天内的出行做统计分析,所以这样的数据需要被剔除。
[0056] 第三步、建立转移概率矩阵:
[0057] 3.1构建各个站点之间的平均借还矩阵:
[0058] 首先建立一天的借还矩阵,将剔除无效数据后剩余的有效数据,通过Excel的数据分析功能,或者matlab编程,构建一天的n×n的原始借还矩阵,n为站点的个数。其中,矩阵的元素aij表示从i站点借出到j站点归还的车辆数;然后采集至少一个月的数据,按照相同方式剔除筛选处理数据后,分别建立各天的借还矩阵;最后,通过对每个借还矩阵中对应元素aij进行算术平均,得到一个各个站点间的平均借还矩阵。采集至少一个月的数据是为了保证数据的连续性,以消除随机性,确保数据的可靠。
[0059] 3.2构建借车的转移概率矩阵P:
[0060] 根据马尔科夫链,构建借车的转移概率矩阵P。借车的转移概率矩阵P的元素pij表示从i站点借出到j站点归还的车辆数占所有从i站点借出的车辆数的比例,即:
[0061]
[0062] 其中,以一天的数据为统计单位,Pi表示所有从i站点借出的车辆数,[0063] 3.3构建还车的转移概率矩阵Q:
[0064] 根据马尔科夫链,构建还车的转移概率矩阵Q。还车的转移概率矩阵Q的元素qij表示从i站点借出到j站点归还的车辆数占所有到j站点归还的车辆数的比例,即:
[0065]
[0066] 其中,以一天的数据为统计单位,qj表示所有到j站点归还的车辆数,[0067] 第四步、计算各个站点的借、还车的分配权重:
[0068] 4.1求解借车的平衡稳态方程:
[0069] 首先,建立π,π是一个(x1,x2,...,xi,...xn)的行向量,本专利将元素xi作为站点i的借车分配权重,其中xi≥0,且 然后,根据马尔科夫链稳态分布的性质πP=π,P表示借车的转移概率矩阵,建立方程;最后,求解方程得到马尔科夫链中的稳态向量π;
[0070] 4.2求解还车的平衡稳态方程:
[0071] 首先,建立π*,π*是一个(y1,y2,...,yj,...yn)的行向量,本专利将元素yj作为站点j的还车分配权重,其中yj≥0,且 然后,根据马尔科夫链稳态分布的性质π*Q=π*,Q表示还车的转移概率矩阵,建立方程;最后,求解方程得到马尔科夫链中的稳态向量π*;
[0072] 第五步、预测所有公共自行车的日总借车需求量和还车需求量:
[0073] 预测的公共自行车的日总需求量与求得的借还车的稳态向量中相应站点的对应元素xi的乘积,即为该站点预测的未来的借、还车需求。其中总需求量需要借鉴考虑的因素有要土地利用性质,人均日出行次数,各种出行交通方式的承担率,公共自行车经常使用人口量等。
[0074] 公共自行车的日总需求量可采用以下公式进行预测:
[0075]
[0076] 式中:B为规划公共自行车总体规模,单位万辆;R1、R2分别为规划常住人口、规划流动人口,单位万人;t1,t2分别为常住人口、流动人口的日均出行次数,单位次/人日;s为公共自行车占全方式出行比例;v为公共自行车日均周转率,次/日。
[0077] 第六步、估算站点的未来的借、还车需求:
[0078] 对于借车需求,用日总借车需求量乘以具体站点的借车分配权重,得到未来的借车供需情况;
[0079] 对于还车需求,用日总借车需求量乘以具体站点的还车分配权重,得到未来的还车供需情况。
[0080] 以下,我们运用某城市公共自行车刷卡数据进行了针对某城市公共自行车系统进行了方法的验证。本次试验以某城市2013年3月份工作日非下雨天的公共自行车的刷卡数据为基础,分别建立借车与还车的转移矩阵,计算其稳态向量,然后分别预测某城市公共自行车各站点2103年月6月、9月以及12月各10个工作日的平均日借车量、平均日还车量。技术应用结果表明:预测结果相对误差在20%的以内的站点所占比例能够达到70%,预测值在其历史数据的波动范围的15%到85%的区间内的比例达到了95%,这对于弹性较大的公共自行车出行来说,这样的误差是完全可接受的,技术运用的效果较好。
[0081] 图1至图6是不同月份日平均借车量、还车量的预测值与真实值对比情况,其中,每幅图的横坐标表示真实值、纵坐标表示预测值,直线表示函数y=x,如果,点落到直线上表示真实值预测值相等,点越接近直线,其表示预测值与真实值越接近。从图中可以看出,不同月份其预测值与真实值的分布相差不大,说明预测的结果较为稳定,不会随时间推移而改变。同时,可以看出所有图中的所有点均落在直线附近,只有少数点离直线稍微远点,说明预测精度比较高。
[0082] 具体的验证过程如下:
[0083] 以某城市2013年6月,站点借车量需求预测为例进行基于马尔科夫链的公共自行车站点供需预测技术介绍:
[0084] 步骤一:公共自行车站点供需信息的采集及数据库创建
[0085] 1.1基础数据采集:
[0086] 下表是某城市公共自行车刷卡部分数据样例:
[0087]
[0088] 本次试验选取某城市2013年3月工作日(周一至周五)正常天气(非雨、雪等恶劣天气)下的数据作为基础数据,进行相应的处理,本次试验涉及到的某城市城区的224个站点。
[0089] 步骤二:数据预处理
[0090] 2.1:站点重新编号:
[0091] 将原来站点不连续的站点编号,从小到大排列,然后重新按从小到大给其编成连续的站点编号,方便后续的数据处理。
[0092] 表1站点重新编号样例
[0093]原站点编号 1 3 5 6 8
重编后编号 1 2 3 4 5
[0094] 2.2:剔除无效数据
[0095] (1)剔除非居民出行数据
[0096] 工作人员因车辆调度、维修等借还车辆时会采用工作人员特有的管理卡,而管理卡所生成的刷卡数据并不是居民正常出行所产生的数据,故将这部分数据删除,而剩余的普通会员卡数据则为居民出行的数据。
[0097] (2)剔除非正常出行的数据
[0098] 这里涉及剔除的数据有两种,一种是借还车辆在同一站点,而用车时间在5min中以下的数据,这部分数据则被认为不是在一次出行的情况下产生的数据,故将其剔除。另一种为借车还车不在同一天的数据,由于本次数据处理是以天作单位,超出一天的数据则被认为非正常出行数据。
[0099] 步骤三:建立转移矩阵
[0100] 3.1构建各个站点之间的平均借还矩阵
[0101] 将剔除无效数据后剩余的有效数据,通过Excel的数据分析功能,或者matlab编程,构建一个224*224的借还矩阵。其中,矩阵的元素aij表示,一次出行从i站点借出到j站点归还的车辆数。将所选的2013年3月份20天工作日非恶劣天气下的数据,分别构建其借还矩阵,然后将矩阵中对应位置的元素求算数平均,得到平均借还矩阵
[0102] 表2平均借还矩阵样例(站点编号为1-5)
[0103]
[0104] 3.2构建借车的转移矩阵
[0105] 借车的转移矩阵P,是由从i站点借出到j站点归还的车辆数的概率pij所组成的。其中以一天的数据位统计单位,第i行j列的数据pij表示一天中从第i站点借出到第j站点归还的车辆占所有从第i站点借出车辆的比例,这样得到的一个224*224的转移矩阵。
[0106] 表3转移矩阵样例(站点编号为1-5)
[0107]
[0108] 步骤四:求解稳态向量
[0109] 首先,建立π,π是一个(x1,x2,x3......)的行向量,本专利将元素xi作为站点i的借车分配权重,其中xi≥0,且 n表示站点个数;然后,根据马尔科夫链稳态分布的性质πP=π,P表示借车转移概率矩阵,建立方程;最后,利用MATLAB编程求解,得到马尔科夫链中的稳态向量π;
[0110] 表4稳态向量求解样例(站点编号为1-5)
[0111]站点编号 x1 x2 x3 x4 x5
稳态向量值 0.230104 0.218257 0.206386 0.203022 0.142231
[0112] 步骤五:预测公共自行车出行总量
[0113] 本次实验采用了某城市2013年6月公共自行车的刷卡数据,得到了公共自行车的出行总量数据,因而暂时不涉及公共自行车总量的预测。
[0114] 步骤六:预测站点借车需求
[0115] 将步骤五中的所得的2013年6月公共自行车出行总量,与步骤四中所求得稳态向量π中相应站点的对应元素分配权重xi相乘,即可得到224个站点的每个站点的借车需求。假设已得站点编号为1-5的站点其总借车需求为500次,其各站点的借车需求如下表所示:
[0116]站点编号 x1 x2 x3 x4 x5
预测借车需求 115 109 103 102 71