无信号灯控制下的行人过街预测方法转让专利

申请号 : CN202111084179.X

文献号 : CN113793502B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 葛淑娴王巍凌帅伦小翔多葭宁刘丽王小静董得龙吴俊峰朱洪东袁新润仲宇璐辛秀颖贾宁宋伟

申请人 : 国网电动汽车服务(天津)有限公司国网天津市电力公司国家电网有限公司

摘要 :

本发明涉及一种无信号灯控制下的行人过街预测方法,其技术特点是:步骤1、使用数据采集子系统采集路口行人、机动车轨迹数据;步骤2、使用模型预测子系统构建GBDT预测模型,使用GBDT预测模型对数据采集子系统采集的数据进行初步预测;步骤3、使用模型调优子系统对GBDT预测模型进行优化并选取最优参数。本发明采用GBDT技术,能够根据实时采集到的轨迹数据实现对行人过街行为的预测功能,本发明可应用于自动驾驶中的车路协同场景,实现对无信号道路交叉口行人过街行为的实时预判功能,对车辆速度进行控制,有助于自动驾驶车辆在运行时根据道路状况更好地实时决策。

权利要求 :

1.一种无信号灯控制下的行人过街预测方法,其特征在于:包括以下步骤:步骤1、使用数据采集子系统采集路口行人、机动车轨迹数据;

步骤2、使用模型预测子系统构建GBDT预测模型,使用GBDT预测模型对数据采集子系统采集的数据进行初步预测;

步骤3、使用模型调优子系统对GBDT预测模型进行优化并选取最优参数;

所述步骤1的具体实现方法包括以下步骤:

步骤1.1、将路口区域划分为交叉区域、等待区域以及行走区域,所述等待区域为机动车道边界线两侧2m宽度的区域;所述交叉区域为机动车道除去等待区域的部分;所述行走区域为等待区域外侧的区域;

步骤1.2、数据采集子系统采集行人位置点所落在区域,判断行人过街行为,所述行人过街行为包括Wait和Go;

步骤1.3、数据采集子系统按照如下三个模型预测变量存储数据:行人特性、车辆特性、环境特性;

所述步骤1.2的具体实现方法为:对于一条行人轨迹及该条行人轨迹的一个特定位置点,执行以下步骤:步骤1.2.1、如果该位置点落在行走区域或交叉区域内,则转到下一个位置点;

步骤1.2.2、如果该位置点落在等待区域内并且没有将要经过的车辆,则转到下一个位置点;

步骤1.2.3:如果该位置点落在等待区域内并且有将要经过的车辆,则按下述步骤执行:步骤1.2.3.1:如果当前时刻t行人和将要通过的车辆的坐标满足:xp,t>xv,t以及yp,t>yv,t,并且在接下来的时刻t+i满足:xp,t+i>xv,t+i以及yp,t+i>yv,t+i,那么记录所有的候选因素,并生成一个‘go’标记的样本,其中xp,t表示时刻t行人位置的横坐标,xv,t表示时刻t车辆位置的横坐标,yp,t表示时刻t行人位置的纵坐标,yv,t表示时刻t车辆位置的纵坐标;

步骤1.2.3.2、否则,数据采集子系统记录所有的候选因素,并生成一个‘wait’标记的样本;

步骤1.2.4、移动至下一个位置点,重复执行步骤1.2.3至步骤1.2.4,待当前轨迹的位置点执行完毕后移动到下一条轨迹数据,对下一条轨迹数据的位置点重复执行步骤1.2.1至步骤1.2.4。

2.根据权利要求1所述的无信号灯控制下的行人过街预测方法,其特征在于:所述行人特性包括如下变量:行人当前行走速度、行人从轨迹开始时间t0到当前时间t的平均速度、行人从轨迹开始时间t0到当前时间t的最大速度、行人行走轨迹的直线率、行人到达路边后的等待时间、同时等待过街的行人数量;所述车辆特性包括以下变量:机动车的当前速度、机动车从轨迹开始时间t0到当前时间t的最大速度、机动车从轨迹开始时间t0到当前时间t的速度方差和即将驶过的机动车数量;所述环境特性包括以下变量:即将驶过的机动车与行人在车道方向的距离和即将驶过的机动车与行人在人行横道方向的距离。

3.根据权利要求1所述的无信号灯控制下的行人过街预测方法,其特征在于:所述步骤

2的具体实现方法包括以下步骤:

步骤2.1、模型预测子系统接收步骤1采集的数据;

步骤2.2、生成GBDT预测模型:首先,用数据学习一个初始行人过街行为预测模型,并得到行人过街行为的预测值以及预测之后的残差,然后,预测模型基于前面预测模型的残差来学习,下一个模型在残差减少的梯度方上建立模型,使得残差往梯度方向上减少,直到预测值和真实值的残差为零,最后,对于测试样本的预测值,就是前面许多个预测模型预测值的累加:步骤2.3、确定最小化损失函数:给定前一个集成行人过街行为预测模型Fm‑1,每次新增的预测模型hm通过模型拟合使得损失函数值Lm最小;

步骤2.4、在GBDT预测模型中加入正则项。

4.根据权利要求1所述的无信号灯控制下的行人过街预测方法,其特征在于:所述步骤

3的具体实现方法包括以下步骤:

步骤3.1、模型调优子系统选取数据集,生成训练集:以bootstrap的方式从数据采集子系统采集到的数据集中抽取N个样本用作GBDT预测模型的每一个基分类器训练集,生成基分类器;

步骤3.2、选取特征,确定最佳分裂点:设M为输入数据的特征个数,对于基分类器的每个节点分裂时,先从这M个特征中选取m个特征,然后再在这m个特征中选择最佳分裂点进行分裂;

步骤3.3、计算基本模型误差:对于基分类器,使用OOB数据作为测试集计算其预测误差;

步骤3.4、计算整体模型误差:重复步骤3.1至步骤3.3,计算所有基分类器的预测误差,取平均值后得到GBDT预测模型的预测误差;

步骤3.5、选取不同的参数组合方式:按照步骤3.1至步骤3.4计算GBDT预测模型的预测误差,选取预测误差最小的模型作为最终的训练模型;

步骤3.6、采用投票的方式得到模型分类结果:使用每一个基分类器对输入的样本进行分类,选择该样本被预测最多的那一类作为分类结果。

说明书 :

无信号灯控制下的行人过街预测方法

技术领域

[0001] 本发明属于自动化技术领域,涉及交通参与者的行为建模与预测系统,尤其是一种无信号灯控制下的行人过街预测方法。

背景技术

[0002] 长期以来,无信号灯交叉口行人过街行为都是关乎道路安全的一个重要问题,据世界卫生组织报道,所有与道具交通事故有关的死亡案例中有超过一半发生在行人、骑行者之中。
[0003] 道路交通死亡事故问题在中低收入国家变得越来越严重,其中,低收入国家的道路交通死亡率是高收入国家的三倍以上;中等收入国家的情况虽然要好于低收入国家,但依然不容乐观。造成这种现象的原因不仅是因为中低收入国家道路使用者中的弱势群体的比例更高,而且也由于缺乏道路安全意识和相关政策。尽管各国已经出台相关的“车让行人”政策,但让路率仍然是个未知数,因此,理解行人是否做出以及如何做出安全的过街行为是至关重要的,理解行人过街的决策机制是促进实现道路安全的重中之重。目前行人过街行为决策机制主要从两方面进行研究:
[0004] (1)利用基于心理学理论的调查,从人类认知的视角出发探索行人过街行为的形成机理,计划行为理论(Theory of planned behavior,TPB)是其中被广泛应用的理论之一,其主要思想是探索众多主观因素对不恰当过街行为造成的危险的影响,这些因素主要包括行为态度、主观规范和知觉行为控制。
[0005] (2)利用历史客观数据并基于传统统计学习模型研究行人过街行为的技术方法,这类方法主要使用的是非轨迹数据探究行人过街时的等待与不等待行为。
[0006] 上述决策机制并不能实现对行人过街行为的实时预判,其主要考虑的是主观因素,对于客观因素如环境和车辆特性并没有充分考虑,因此,其存在以下问题:
[0007] (1)传统统计学习模型更多的是使用非轨迹数据来研究行人的过街行为决策机制,这无法体现出车辆和行人的移动特性对于行人过街行为决策的影响,不能动态地刻画行人的过街行为。
[0008] (2)现有的行人过街行为预测的相关技术无法解释各种预测因子的重要性,不能给出不同预测因子的重要性排名,这在某种程度上会影响预测模型的解释能力。
[0009] (3)传统模型的预测准确率不高,存在预测结果不平衡的问题,会将‘go’行为错误预测为‘wait’行为。

发明内容

[0010] 本发明的目的在于克服现有技术的不足,提供一种设计合理、速度快且准确可靠的无信号灯控制下的行人过街预测方法。
[0011] 本发明解决现有的技术问题是采取以下技术方案实现的:
[0012] 一种无信号灯控制下的行人过街预测方法,包括以下步骤:
[0013] 步骤1、使用数据采集子系统采集路口行人、机动车轨迹数据;
[0014] 步骤2、使用模型预测子系统构建GBDT预测模型,使用GBDT预测模型对数据采集子系统采集的数据进行初步预测;
[0015] 步骤3、使用模型调优子系统对GBDT预测模型进行优化并选取最优参数。
[0016] 而且,所述步骤1的具体实现方法包括以下步骤:
[0017] 步骤1.1、将路口区域划分为交叉区域、等待区域以及行走区域,所述等待区域为机动车道边界线两侧2m宽度的区域;所述交叉区域为机动车道除去等待区域的部分;所述行走区域为等待区域外侧的区域;
[0018] 步骤1.2、数据采集子系统采集行人位置点所落在区域,判断行人过街行为,所述行人过街行为包括Wait和Go;
[0019] 步骤1.3、数据采集子系统按照如下三个模型预测变量存储数据:行人特性、车辆特性、环境特性。
[0020] 而且,所述步骤1.2的具体实现方法为:对于一条行人轨迹及该条行人轨迹的一个特定位置点,执行以下步骤:
[0021] 步骤1.2.1、如果该位置点落在行走区域或交叉区域内,则转到下一个位置点;
[0022] 步骤1.2.2、如果该位置点落在等待区域内并且没有将要经过的车辆,则转到下一个位置点;
[0023] 步骤1.2.3:如果该位置点落在等待区域内并且有将要经过的车辆,则按下述步骤执行:
[0024] 步骤1.2.3.1:如果当前时刻t行人和将要通过的车辆的坐标满足:xp,t>xv,t以及yp,t>yv,t,并且在接下来的时刻t+i满足:xp,t+i>xv,t+i以及yp,t+i>yv,t+i,那么记录所有的候选因素,并生成一个‘go’标记的样本,其中xp,t表示时刻t行人位置的横坐标,xv,t表示时刻t车辆位置的横坐标,yp,t表示时刻t行人位置的纵坐标,yv,t表示时刻t车辆位置的纵坐标;
[0025] 步骤1.2.3.2、否则,数据采集子系统记录所有的候选因素,并生成一个‘wait’标记的样本;
[0026] 步骤1.2.4、移动至下一个位置点,重复上述步骤,待当前轨迹的位置点执行完毕后移动到下一条轨迹数据,对下一条轨迹数据的位置点重复上述步骤。
[0027] 步骤1.3、数据采集子系统按照行人特性、车辆特性、环境特性存储行人、机动车轨迹数据。
[0028] 而且,所述行人特性包括如下变量:行人当前行走速度、行人从轨迹开始时间t0到当前时间t的平均速度、行人从轨迹开始时间t0到当前时间t的最大速度、行人行走轨迹的直线率、行人到达路边后的等待时间、同时等待过街的行人数量;所述车辆特性包括以下变量:机动车的当前速度、机动车从轨迹开始时间t0到当前时间t的最大速度、机动车从轨迹开始时间t0到当前时间t的速度方差和即将驶过的机动车数量;所述环境特性包括以下变量:即将驶过的机动车与行人在车道方向的距离和即将驶过的机动车与行人在人行横道方向的距离。
[0029] 而且,所述步骤2的具体实现方法包括以下步骤:
[0030] 步骤2.1、模型预测子系统接收步骤1采集的数据;
[0031] 步骤2.2、生成GBDT预测模型:首先,用数据学习一个初始行人过街行为预测模型,并得到行人过街行为的预测值以及预测之后的残差,然后,预测模型基于前面预测模型的残差来学习,下一个模型在残差减少的梯度方上建立模型,使得残差往梯度方向上减少,直到预测值和真实值的残差为零,最后,对于测试样本的预测值,就是前面许多个预测模型预测值的累加:
[0032] 步骤2.3、确定最小化损失函数:给定前一个集成行人过街行为预测模型Fm‑1,每次新增的预测模型hm通过模型拟合使得损失函数值Lm最小;
[0033] 步骤2.4、在GBDT预测模型中加入正则项。
[0034] 而且,所述步骤3的具体实现方法包括以下步骤:
[0035] 步骤3.1、模型调优子系统选取数据集,生成训练集:以bootstrap的方式从数据采集子系统采集到的数据集中抽取N个样本用作GBDT预测模型的每一个基分类器训练集,生成基分类器;
[0036] 步骤3.2、选取特征,确定最佳分裂点:设M为输入数据的特征个数,对于基分类器的每个节点分裂时,先从这M个特征中选取m个特征,然后再在这m个特征中选择最佳分裂点进行分裂;
[0037] 步骤3.3、计算基本模型误差:对于基分类器,使用OOB数据作为测试集计算其预测误差;
[0038] 步骤3.4、计算整体模型误差:重复步骤3.1至步骤3.3,计算所有基分类器的预测误差,取平均值后得到GBDT预测模型的预测误差;
[0039] 步骤3.5、选取不同的参数组合方式:按照步骤3.1至步骤3.4计算GBDT预测模型的预测误差,选取预测误差最小的模型作为最终的训练模型;
[0040] 步骤3.6、采用投票的方式得到模型分类结果:使用每一个基分类器对输入的样本进行分类,选择该样本被预测最多的那一类作为分类结果。
[0041] 本发明的优点和积极效果是:
[0042] 1、本发明采用梯度提升决策树(GBDT)技术,通过采集行人过街的轨迹数据,并基于采集到的数据建立过街行为预测模型,最终调优之后的预测模型能够根据实时采集到的轨迹数据实现对行人过街行为的预测功能,并能够给出预测变量的重要性排名,有助于车辆自动驾驶系统更加深入地理解行人的过街行为。本发明可应用于自动驾驶中的车路协同场景,实现对无信号道路交叉口行人过街行为的实时预判功能,对车辆速度进行控制,有助于自动驾驶车辆在运行时根据道路状况更好地实时决策。
[0043] 2、本发明通过使用轨迹数据而不是静态数据,使得该预测系统比以往模型的预测结果更加精确,进一步解释了车辆和行人特征对行人过街决策的影响。并且数据采集子系统能够实时收集行人数据,实现了行人过街行为的动态预测,可对三大类决策变量进行扩展。
[0044] 3、本发明通过GBDT集成学习模型的使用并基于变量重要性的计算方法,可以额外识别不同决策变量的重要性程度,并给出不同变量的重要性排名,能够为车辆自动驾驶系统提供决策支持。

附图说明

[0045] 图1是本发明的预测模型生成的总体流程图;
[0046] 图2是本发明的交叉区域、等待区域以及行走区域划分示意图;
[0047] 图3是数据采集区域示意图;
[0048] 图4是视频图像中的行人数据采集点位置图;
[0049] 图5是视频图像中机动车及行人行走轨迹示意图。

具体实施方式

[0050] 以下结合附图对本发明实施例做进一步详述。
[0051] 一种无信号灯控制下的行人过街预测方法,如图1所示,其通过三个系统运行的数据采集子系统、模型预测子系统和模型调优子系统实现行人过街预测功能,具体包括以下步骤:
[0052] 步骤1、通过数据采集子系统采集路口行人、机动车轨迹数据。
[0053] 本步骤的具体实现方法包括以下步骤:
[0054] 步骤1.1、将路口区域划分为三个区域:交叉区域、等待区域以及行走区域。
[0055] 如图2所示,等待区域为机动车道边界线两侧2m宽度的区域,值得注意的是部分行人在过街时不在车道外等待而是走进车道近距离的等待来往的车辆通过,因此,等待区域被定义为距车道边界2m的双侧区域。
[0056] 交叉区域为机动车道的剩余区域,即机动车道除去等待区域的部分。
[0057] 行走区域为等待区域外侧的区域,即行人必须经过行走区域后才能到达等待区域。
[0058] 步骤1.2、数据采集子系统采集行人位置点所落在区域,判断行人过街行为(Wait or Go,WOG)。
[0059] 如图3至图5所示,数据采集子系统自动记录行人的行走轨迹,然后根据采集到的行人过街的轨迹数据依照以下准则,并通过检查不同时刻行人轨迹的位置点来判断行人的过街行为(Wait or Go,WOG)。其中:
[0060] 对于一条行人轨迹及该条行人轨迹的一个特定位置点,执行以下步骤:
[0061] 步骤1.2.1:如果该位置点落在行走区域或交叉区域内,则无法确定行人在该位置点的过街行为(WOG),转到下一个位置点。
[0062] 步骤1.2.2:如果该位置点落在等待区域内并且没有将要经过的车辆,则无法确定该行人在该位置点的过街行为(WOG),转到下一个位置点。
[0063] 步骤1.2.3:如果该位置点落在等待区域内并且有将要经过的车辆,然后执行:
[0064] 步骤1.2.3.1:如果当前时刻t行人和将要通过的车辆的坐标满足:xp,t>xv,t以及yp,t>yv,t,并且在接下来的时刻t+i满足:xp,t+i>xv,t+i以及yp,t+i>yv,t+i,那么数据采集子系统记录所有的候选因素(行人特性、车辆特性以及环境特性),并生成一个‘go’标记的样本。其中,xp,t表示时刻t行人位置的横坐标,xv,t表示时刻t车辆位置的横坐标,yp,t表示时刻t行人位置的纵坐标,yv,t表示时刻t车辆位置的纵坐标。
[0065] 步骤1.2.3.2:否则,数据采集子系统记录所有的候选因素,并生成一个‘wait’标记的样本。
[0066] 步骤1.2.4:移动至下一个位置点,重复上述步骤,待当前轨迹的位置点执行完毕后移动到下一条轨迹数据,对下一条轨迹数据的位置点重复上述步骤。
[0067] 步骤1.3、数据采集子系统按照如下三个模型预测变量存储数据:行人特性、车辆特性、环境特性。具体变量见下表:
[0068] 表1‑1.预测模型变量
[0069]
[0070] 步骤2、采用模型预测子系统构建GBDT预测模型,使用GBDT预测模型对数据采集子系统采集的数据进行初步预测。
[0071] 本发明采用梯度提升决策树(GBDT)技术实现预测功能。GBDT是一种Boosting的方法,其主要思想是,每一次建立模型是在之前建立模型损失函数的梯度下降方向。损失函数是评价模型性能(一般为拟合程度+正则项),认为损失函数越小,性能越好。而让损失函数持续下降,就能使得模型不断改性提升性能,其最好的方法就是使损失函数沿着梯度方向下降。
[0072] 本步骤的具体实现方法包括以下步骤:
[0073] 步骤2.1、数据输入。输入数据采集子系统采集到的数据,并选取适当的损失函数衡量GBDT模型的拟合效果。
[0074] 步骤2.2、生成初步GBDT预测模型。首先,用数据学习一个初始行人过街行为预测模型,并得到行人过街行为的预测值,以及预测之后的残差,然后,预测模型就要基于前面预测模型的残差来学习,下一个模型主要在残差减少的梯度方上建立模型,使得残差往梯度方向上减少,直到预测值和真实值的残差为零。最后,对于测试样本的预测值,就是前面许多个预测模型预测值的累加。
[0075] 假定xi是决策变量的集合,目标预测值yi的表达式如下:
[0076]
[0077] 其中hm代表基分类器,基分类器的学习能力较弱。
[0078] GBDT模型是一种贪婪性的预测模型,模型表达式如下:
[0079] Fm(x)=Fm‑1(x)+hm(x)        (2)
[0080] 步骤2.3、确定最小化损失函数。给定前一个集成行人过街行为预测模型Fm‑1,每次新增的预测模型hm通过模型拟合使得损失函数值Lm最小。其中hm满足下式:
[0081]
[0082] 通过一阶泰勒公式展开,l近似表示为下式:
[0083]
[0084] 对于一个二分类问题而言,由于回归树的预测值是连续的,因此对于一个预测值(0或1),FM(xi)=∑mhm(xi)的值并不是完全相同的。由值FM(xi)到某一分类的映射取决于损失函数。给定目标值xi预测值为正分类的概率为p(yi=1|xi)=σFM(xi),其中σ代表sigmoid函数。
[0085] 步骤2.4、为解决过拟合问题,在GBDT预测模型中加入正则项。学习率(收缩因子)可作为正则项减少每一个基本预测模型的贡献,记模型学习率为ξ(0<ξ<1),加入正则项之后的模型表达式如下:
[0086] Fm(x)=Fm‑1(x)+ξ*hm(x)       (5)
[0087] 随着学习率(收缩因子)的减小,训练模型的最优损失函数也会降低,模型的拟合效果就会越好。然而这将会要求预测系统增加更多的基本预测模型。因此,在基本模型的数量和学习率之间进行权衡是有必要的。对于GBDT模型的另一个重要的参数是预测模型(决策树)的复杂度,复杂度代表预测模型的深度。为了捕捉解释变量之间更多的复杂关系,增加模型的深度是有必要的。总而言之,预测模型的最优性能取决于基本模型的数量、学习率以及模型的复杂度三个参数的整体选择。
[0088] 步骤3、采用模型调优子系统对GBDT预测模型进行优化并选取最优参数。
[0089] GBDT预测模型可以通过集成众多决策树的方式建立一个森林,森林里面有很多的决策树组成。GBDT属于bagging集成算法,采用bootstrap的方法进行随机抽取训练数据。假定一个数据集的大小为N,有放回的随机抽样N次作为一棵树的训练集。由概率论的知识可知数据集中大约有1/3的数据是没有被选取到的,这部分数据被称为袋外数据(Out of bag,OOB)。那么这1/3的OOB数据可作为基分类器的测试集,因此对于GBDT算法来说是不需要划分训练集和测试集的。
[0090] 本步骤的具体实现方法为:
[0091] 步骤3.1:选取数据集,生成训练集。以bootstrap的方式从数据采集子系统采集到的数据集中抽取N个样本用作GBDT模型的每一个基分类器训练集,生成基分类器。
[0092] 步骤3.2:选取特征,确定最佳分裂点。设M为输入数据的特征个数,对于基分类器的每个节点分裂时,先从这M个特征中选取m个特征,然后再在这m个特征中选择最佳分裂点进行分裂。
[0093] 步骤3.3:计算基本模型误差。对于(1)中的基分类器,使用OOB数据作为测试集计算其预测误差。
[0094] 步骤3.4:计算整体模型误差。重复步骤3.1至3.3,计算所有基分类器的预测误差,取平均值即可得到GBDT模型的预测误差。
[0095] 步骤3.5:选取不同的参数组合方式。按照步骤3.1至3.4计算模型的预测误差,选取预测误差最小的模型作为最终的训练模型。
[0096] 步骤3.6:采用投票的方式得到模型分类结果。让每一个基分类器对输入的样本进行分类,选择该样本被预测最多的那一类作为分类结果。
[0097] 需要强调的是,本发明所述的实施例是说明性的,而不是限定性的,因此本发明包括并不限于具体实施方式中所述的实施例,凡是由本领域技术人员根据本发明的技术方案得出的其他实施方式,同样属于本发明保护的范围。