基于机器学习算法的公交实时到站预测方法、装置和设备转让专利
申请号 : CN202011236681.3
文献号 : CN112509317B
文献日 : 2021-11-09
发明人 : 陈欢 , 罗建平 , 杨森彬 , 李志武 , 陈招帆 , 黄钦炎 , 梁娜
申请人 : 广州交信投科技股份有限公司
摘要 :
权利要求 :
1.一种基于机器学习算法的公交实时到站预测方法,其特征在于,所述方法包括:响应于客户端发起的针对于待预测公交的到站时长预测请求,确定与所述到站时长预测请求匹配的实时交通信息以及历史交通信息;
将所述实时交通信息输入预设的高峰判别模型,根据所述高峰判别模型输出得到与所述到站时长预测请求匹配的高峰状态标识;
将所述高峰状态标识、所述实时交通信息以及所述历史交通信息输入预设的到站预测模型,根据所述到站预测模型输出得到所述待预测公交的到站预测时长,并将所述到站预测时长返回至所述客户端;
所述将所述实时交通信息输入预设的高峰判别模型之前,还包括:确定样本行驶位置区间,以及经过所述样本行驶位置区间的多个样本公交对应的样本高峰状态标识;
确定与各样本公交匹配的多个样本关联公交;所述样本关联公交为当前样本时刻前经过所述样本行驶位置区间的前预设个数的公交;所述当前样本时刻为所述样本公交进入所述样本行驶位置区间的进入时刻;
获取各样本关联公交的样本行驶时长信息,并根据所述样本行驶时长信息得到多个样本斜率特征信息;包括:利用所述各样本关联公交的样本行驶时长信息的前后顺序进行作差处理,得到所述多个样本斜率特征信息;
对所述样本行驶时长信息进行对数平滑处理,得到多个样本行驶时长特征信息;
确定所述当前样本时刻的时间特征信息;
基于所述样本高峰状态标识,利用所述样本斜率特征信息、所述样本行驶时长特征信息,以及所述当前样本时刻的时间特征信息对预设的神经网络模型进行训练,得到所述高峰判别模型。
2.根据权利要求1所述的方法,其特征在于,所述待预测公交的个数为多个;
所述确定与所述到站时长预测请求匹配的实时交通信息以及历史交通信息,包括:从多个所述待预测公交中确定出与所述到站时长预测请求匹配的目标公交;
获取所述目标公交的第一位置,以及与所述到站时长预测请求匹配的第二位置;
基于所述第一位置以及所述第二位置,确定所述目标公交的行驶位置区间;
获取与所述行驶位置区间匹配的实时交通信息,作为所述到站时长预测请求匹配的实时交通信息。
3.根据权利要求2所述的方法,其特征在于,所述获取与所述行驶位置区间匹配的实时交通信息,包括:
确定预设个数的与所述目标公交匹配的关联公交;所述关联公交为当前时刻前经过所述行驶位置区间的前预设个数的公交;所述当前时刻为所述到站时长预测请求的触发时刻;
获取各关联公交经过所述行驶位置区间对应的行驶时长信息,得到预设个数的行驶时长信息;
将所述预设个数的行驶时长信息作为所述实时交通信息。
4.根据权利要求3所述的方法,其特征在于,所述将所述实时交通信息输入预设的高峰判别模型,根据所述高峰判别模型输出得到与所述到站时长预测请求匹配的高峰状态标识,包括:
将所述预设个数的行驶时长信息输入所述高峰判别模型,确定各行驶时长信息对应的各关联公交的行驶顺序;
基于所述行驶顺序,确定与所述预设个数的行驶时长信息对应的多个斜率特征信息;
对所述行驶时长信息进行对数平滑处理,得到预设个数的行驶时长特征信息;
根据所述行驶时长特征信息、所述斜率特征信息以及所述当前时刻的时间特征信息确定所述高峰状态标识。
5.根据权利要求4所述的方法,其特征在于,所述基于所述行驶顺序,确定与所述预设个数的行驶时长信息对应的多个斜率特征信息,包括:确定第一行驶时长信息,以及所述第一行驶时长信息对应的关联公交的第一行驶顺序;
若所述第一行驶顺序不是末尾行驶顺序,则将所述第一行驶顺序的下一个行驶顺序作为第二行驶顺序,确定所述第二行驶顺序对应的关联公交的第二行驶时长信息;
基于所述第二行驶时长信息以及所述第一行驶时长信息确定与所述第一行驶时长信息匹配的斜率特征信息。
6.根据权利要求2所述的方法,其特征在于,所述行驶位置区间包括多个子行驶位置区间;所述实时交通信息包括:实时行驶时长信息;
所述获取与所述行驶位置区间匹配的实时交通信息,包括:确定各子行驶位置区间对应的子关联公交;所述子关联公交为当前时刻前经过所述各子行驶位置区间前一个公交;所述当前时刻为所述到站时长预测请求的触发时刻;
确定各子关联公交经过所述各子行驶位置区间对应的子实时行驶时长信息;
对所述子实时行驶时长信息进行求和处理,得到所述实时行驶时长信息。
7.一种基于机器学习算法的公交实时到站预测装置,其特征在于,所述装置包括:预测请求响应模块,用于响应于客户端发起的针对于待预测公交的到站时长预测请求,确定与所述到站时长预测请求匹配的实时交通信息以及历史交通信息;
高峰标识确定模块,用于将所述实时交通信息输入预设的高峰判别模型,根据所述高峰判别模型输出得到与所述到站时长预测请求匹配的高峰状态标识;
到站时长预测模块,用于将所述高峰状态标识、所述实时交通信息以及所述历史交通信息输入预设的到站预测模型,根据所述到站预测模型输出得到所述待预测公交的到站预测时长,并将所述到站预测时长返回至所述客户端;
高峰模型训练模块,用于确定样本行驶位置区间,以及经过所述样本行驶位置区间的多个样本公交对应的样本高峰状态标识;确定与各样本公交匹配的多个样本关联公交;所述样本关联公交为当前样本时刻前经过所述样本行驶位置区间的前预设个数的公交;所述当前样本时刻为所述样本公交进入所述样本行驶位置区间的进入时刻;获取各样本关联公交的样本行驶时长信息,并根据所述样本行驶时长信息得到多个样本斜率特征信息;包括:利用所述各样本关联公交的样本行驶时长信息的前后顺序进行作差处理,得到所述多个样本斜率特征信息;对所述样本行驶时长信息进行对数平滑处理,得到多个样本行驶时长特征信息;确定所述当前样本时刻的时间特征信息;基于所述样本高峰状态标识,利用所述样本斜率特征信息、所述样本行驶时长特征信息,以及所述当前样本时刻的时间特征信息对预设的神经网络模型进行训练,得到所述高峰判别模型。
8.根据权利要求7所述的装置,其特征在于,所述待预测公交的个数为多个;所述预测请求响应模块,进一步用于从多个所述待预测公交中确定出与所述到站时长预测请求匹配的目标公交;获取所述目标公交的第一位置,以及与所述到站时长预测请求匹配的第二位置;基于所述第一位置以及所述第二位置,确定所述目标公交的行驶位置区间;获取与所述行驶位置区间匹配的实时交通信息,作为所述到站时长预测请求匹配的实时交通信息。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
说明书 :
基于机器学习算法的公交实时到站预测方法、装置和设备
技术领域
背景技术
需要进行公交到站预测,通过将公交实时运行信息输入到站预测模型,从而实现对公交到
站时长的预测。
发明内容
站预测时长返回至所述客户端。
与所述到站时长预测请求匹配的目标公交;获取所述目标公交的第一位置,以及与所述到
站时长预测请求匹配的第二位置;基于所述第一位置以及所述第二位置,确定所述目标公
交的行驶位置区间;获取与所述行驶位置区间匹配的实时交通信息,作为所述到站时长预
测请求匹配的实时交通信息。
驶位置区间的前预设个数的公交;所述当前时刻为所述到站时长预测请求的触发时刻;获
取各关联公交经过所述行驶位置区间对应的行驶时长信息,得到预设个数的行驶时长信
息;将所述预设个数的行驶时长信息作为所述实时交通信息。
预设个数的行驶时长信息输入所述高峰判别模型,确定各行驶时长信息对应的各关联公交
的行驶顺序;基于所述行驶顺序,确定与所述预设个数的行驶时长信息对应的多个斜率特
征信息;对所述行驶时长信息进行对数平滑处理,得到预设个数的行驶时长特征信息;根据
所述行驶时长特征信息、所述斜率特征信息以及所述当前时刻的时间特征信息确定所述高
峰状态标识。
对应的关联公交的第一行驶顺序;若所述第一行驶顺序不是末尾行驶顺序,则将所述第一
行驶顺序的下一个行驶顺序作为第二行驶顺序,确定所述第二行驶顺序对应的关联公交的
第二行驶时长信息;基于所述第二行驶时长信息以及所述第一行驶时长信息确定与所述第
一行驶时长信息匹配的斜率特征信息。
括:确定各子行驶位置区间对应的子关联公交;所述子关联公交为当前时刻前经过所述各
子行驶位置区间前一个公交;所述当前时刻为所述到站时长预测请求的触发时刻;确定各
子关联公交经过所述各子行驶位置区间对应的子实时行驶时长信息;对所述子实时行驶时
长信息进行求和处理,得到所述实时行驶时长信息。
样本高峰状态标识;确定与各样本公交匹配的多个样本关联公交;所述样本关联公交为当
前样本时刻前经过所述样本行驶位置区间的前预设个数的公交;所述当前样本时刻为所述
样本公交进入所述样本行驶位置区间的进入时刻;获取各样本关联公交的样本行驶时长信
息,并根据所述样本行驶时长信息得到多个样本斜率特征信息;对所述样本行驶时长信息
进行对数平滑处理,得到多个样本行驶时长特征信息;确定所述当前样本时刻的时间特征
信息;基于所述样本高峰状态标识,利用所述样本斜率特征信息、所述样本行驶时长特征信
息,以及所述当前样本时刻的时间特征信息对预设的神经网络模型进行训练,得到所述高
峰判别模型。
站预测时长,并将所述到站预测时长返回至所述客户端。
请求匹配的实时交通信息以及历史交通信息;将实时交通信息输入预设的高峰判别模型,
根据高峰判别模型输出得到与到站时长预测请求匹配的高峰状态标识;将高峰状态标识、
实时交通信息以及历史交通信息输入预设的到站预测模型,根据到站预测模型输出得到待
预测公交的到站预测时长,并将到站预测时长返回至客户端。本申请通过高峰判别模型可
以准确识别出到站时长预测请求的高峰状态,并结合到站预测模型,可以提高高峰状态下
得到的到站预测时长的准确性。
附图说明
具体实施方式
用于限定本申请。
现公交到站时长预测的实时预测系统。用户可通过客户端101向服务器102发起对于公交的
到站时长预测请求,服务器102得到该请求后可以进行响应,从存储有交通数据的数据库中
找到与请求匹配的实时交通信息以及历史交通信息,并且将实时交通信息输入预先训练好
的高峰判别模型,确定当前的高峰状态标识,再将高峰状态标识与实时交通信息以及历史
交通信息输入预先训练好的到站预测模型,从而得到到站预测的时长并返回客户端101。其
中,客户端101可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式
可穿戴设备,服务器102可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
到站时长预测请求,发送至服务器102。服务器102则可以对接收到的到站时长预测请求进
行响应,并利用预先存储有多种交通数据的数据库中,找到与该请求匹配的实时交通信息,
例如当前时间段其他公交在待预测公交的行驶路段上的实时行驶时长,以及与该请求匹配
的历史交通信息,例如,在行驶路段的路面状况等信息,或者驾驶该待预测公交的驾驶员的
相关驾驶习惯等等。
包括有高峰上行状态标识,高峰下行状态标识以及平峰状态标识等等。具体来说,服务器
102可以将步骤S101中得到的与到站时长预测请求匹配的实时交通信息输入预先训练好的
高峰判别模型,就可以通过高峰判别模型得到对应的高峰状态标识。
时长返回至客户端101。
进行特征提取后训练而成,其中提取的特征可以包括有交通路况特征,驾驶员特征,驾驶时
间特征,以及驾驶时刻是否处于高峰状态等多个特征训练而成。
出得到的预测结果作为待预测公交的到站预测时长,并将预测结果通过网络返回至客户端
101中进行显示。
信息以及历史交通信息;将实时交通信息输入预设的高峰判别模型,根据高峰判别模型输
出得到与到站时长预测请求匹配的高峰状态标识;将高峰状态标识、实时交通信息以及历
史交通信息输入预设的到站预测模型,根据到站预测模型输出得到待预测公交的到站预测
时长,并将到站预测时长返回至客户端101。本申请通过高峰判别模型可以准确识别出到站
时长预测请求的高峰状态,并结合到站预测模型,可以提高高峰状态下得到的到站预测时
长的准确性。
长预测请求匹配的目标公交车,作为目标公交,该目标公交的确定可以是由到站时长预测
请求决定。例如,用户A选择了需要预测A方向的B路公交车到C公交车站的时长,那么待预测
公交即为A方向的B路公交车,服务器102则可以查询所有A方向的B路公交车中未到达C公交
车站且与C公交车站之间距离最短的公交车作为目标公交。
体来说,服务器102可以利用公交上设置的定位设备确定第一位置,以及读取客户端101触
发的到站时长预测请求中选择的站点作为第二位置,也可以是直接读取客户端101的位置
信息,并找到与该位置信息距离最短的站点作为第二位置。之后,服务器102再基于得到第
一位置以及第二位置,分别作为区间端点,按照目标公交的行驶路线得到对应的行驶位置
区间。
作为到站时长预测请求匹配的实时交通信息。
刻。
配的公交,预设个数可以根据需要对服务器102进行设定,可以是10个,如果目标公交是公
交汽车,那么关联公交则指的是当前时刻之前通过行驶位置区间的10台公交汽车。
时长信息中提取出各行驶时长信息中对应的各关联公交的行驶顺序。
间的变化趋势,即斜率特征信息。
个数的行驶时长信息一一对应的行驶时长特征信息。
102除了需要得到的行驶时长特征信息以及斜率特征信息进行高峰状态的判别外,还需要
确定当前时刻对应的时间特征信息,并利用行驶时长特征信息、斜率特征信息以及当前时
刻的时间特征信息确定高峰状态标识。
序则是第一行驶顺序的下一个行驶顺序,第二行驶时长信息则指的是第二行驶顺序对应的
关联公交的行驶时长信息。具体地,服务器102可以将得到的预设个数的行驶时长信息,分
别作为第一行驶时长信息,并确定每个第一行驶时长信息对应的第一行驶顺序以及第二行
驶顺序,再通过第二行驶顺序确定出对应的关联公交的第二行驶时长信息。
间的行驶顺序分别是关联公交A、关联公交B,以及关联公交C。那么服务器102可以分别将行
驶时长信息A、行驶时长信息B,以及行驶时长信息C分别作为第一行驶时长信息,而假如行
驶时长信息A作为第一行驶时长信息,由于其行驶顺序不是末尾行驶顺序,则可以将下一行
驶顺序对应的关联公交的行驶时长信息,作为其对应的第二行驶时长信息,即将行驶时长
信息B作为第二行驶时长信息;而如果行驶时长信息B作为第一行驶时长信息,那么则可以
确定行驶时长信息C为对应的第二行驶时长信息。
一行驶时长信息匹配的斜率特征信息。
可将预设个数的行驶时长信息做平滑处理,得到多个行驶时长特征信息以及斜率特征信
息,并得到高峰状态标识,可以提高得到的高峰状态标识的准确性。
对应的子关联公交;子关联公交为当前时刻前经过各子行驶位置区间前一个公交;当前时
刻为到站时长预测请求的触发时刻;确定各子关联公交经过各子行驶位置区间对应的子实
时行驶时长信息;对子实时行驶时长信息进行求和处理,得到实时行驶时长信息。
置区间构成,服务器102可以分别获取到站时长预测请求的触发时刻前一个通过地点A到地
点B的子关联公交A,前一个通过地点B到地点C的子关联公交B,以及前一个通过地点C到地
点D的子关联公交C,并分别获取子关联公交A,子关联公交B以及子关联公交C通过对应子行
驶位置区间的子实时行驶时长信息A、子实时行驶时长信息B以及子实时行驶时长信息C,进
行求和处理,作为实时行驶时长信息。
实时行驶时长信息,进行求和处理,得到最终的实时行驶时长信息,可以进一步保证实时行
驶时长信息的实时性,由此提高得到的到站预测时长的实时性与准确性。
离开时间以及到达时间等等相关信息,那么站点A到站点B之间的区间即为其中一个样本行
驶位置区间。样本高峰状态标识则指的是该样本公交通过样本行驶位置区间对应的样本高
峰状态标识,用于表示通过样本行驶位置区间时该区间是否处于高峰状态,可以是包括有
高峰上行状态,高峰下行状态以及平峰状态等等。
进入样本行驶位置区间的进入时刻。
102确定样本公交以及其对应的样本行驶位置区间后,可以基于得到样本行驶位置区间从
交通数据库中查询经过上述样本行驶位置区间当前时刻之前预设个数的公交,例如样本行
驶位置区间为区间A,那么服务器102则可以从交通数据库中找到通过区间A的样本公交,并
且得到各个样本公交的通过时间,找到与当前时刻最接近的预设个数的样本公交,作为样
本关联公交。
驶时长信息,利用各样本行驶时长信息的前后顺序作差处理,确定出多个样本斜率特征信
息。
征,例如是星期几、是否是节假日、对应的小时区间等等。
高峰判别模型。
进行训练,例如可以是时序的神经网络LSTM模型,从而得到最终的高峰判别模型。
以通过LSTM算法,可以进一步提高模型训练的效率。
峰时间段可以准确预测候车时长的候车时长预测模型,用户通过发起预测请求,触发高平
峰判别模型根据实时车辆特征得到高平峰判别因子,同时触发候车时长预测回归模型根据
得到的高平峰判别因子以及实时公交畅行指数等实时车辆特征得到候车时长,并将候车时
长反馈至预测请求发起用户。
(start_id)、离站时间(sd_time)、到达公交站点(end_id)、到站时间(ea_time)、中途经过
的公交站点(mid_station_id)、离开站点到到达站点所用时长(label),最后遍历不同站点
的有序不重复组合,得到基础数据集。
峰、高峰上行或高峰下行时段。
路上车流、拥堵等动态(实时)情况也会对公交行驶产生影响。
速度,进而影响候车时长。
例、当天所在的日期类型(工作日或节假日)有多少天、当天之前最近的连续不同的日期类
型(工作日或节假日)天数以及当天之后最近的连续的日期类型(工作日或节假日)天数。
模型中。
公交车实时到站预测,很大程度缓解高峰预测不准的问题。
骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图中的至少一部
分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完
成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是
可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
其中:
到站预测时长返回至客户端。
置,以及与到站时长预测请求匹配的第二位置;基于第一位置以及第二位置,确定目标公交
的行驶位置区间;获取与行驶位置区间匹配的实时交通信息,作为到站时长预测请求匹配
的实时交通信息。
当前时刻为到站时长预测请求的触发时刻;获取各关联公交经过行驶位置区间对应的行驶
时长信息,得到预设个数的行驶时长信息;将预设个数的行驶时长信息作为实时交通信息。
确定与预设个数的行驶时长信息对应的多个斜率特征信息;对行驶时长信息进行对数平滑
处理,得到预设个数的行驶时长特征信息;根据行驶时长特征信息、斜率特征信息以及当前
时刻的时间特征信息确定高峰状态标识。
序,则将第一行驶顺序的下一个行驶顺序作为第二行驶顺序,确定第二行驶顺序对应的关
联公交的第二行驶时长信息;基于第二行驶时长信息以及第一行驶时长信息确定与第一行
驶时长信息匹配的斜率特征信息。
联公交;子关联公交为当前时刻前经过各子行驶位置区间前一个公交;当前时刻为到站时
长预测请求的触发时刻;确定各子关联公交经过各子行驶位置区间对应的子实时行驶时长
信息;对子实时行驶时长信息进行求和处理,得到实时行驶时长信息。
本高峰状态标识;确定与各样本公交匹配的多个样本关联公交;样本关联公交为当前样本
时刻前经过样本行驶位置区间的前预设个数的公交;当前样本时刻为样本公交进入样本行
驶位置区间的进入时刻;获取各样本关联公交的样本行驶时长信息,并根据样本行驶时长
信息得到多个样本斜率特征信息;对样本行驶时长信息进行对数平滑处理,得到多个样本
行驶时长特征信息;确定当前样本时刻的时间特征信息;基于样本高峰状态标识,利用样本
斜率特征信息、样本行驶时长特征信息,以及当前样本时刻的时间特征信息对预设的神经
网络模型进行训练,得到高峰判别模型。
置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式
内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储
器中,以便于处理器调用执行以上各个模块对应的操作。
其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易
失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该
内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备
的数据库用于存储实时交通信息。该计算机设备的网络接口用于与外部的终端通过网络连
接通信。该计算机程序被处理器执行时以实现一种机器学习算法的公交到站预测方法。
备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,
本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可
包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read‑
Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器
(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种
形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存
储器(Dynamic Random Access Memory,DRAM)等。
盾,都应当认为是本说明书记载的范围。
说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护
范围。因此,本申请专利的保护范围应以所附权利要求为准。