基于动机与风险评估的无人驾驶车辆智能决策方法转让专利

申请号 : CN202011069519.7

文献号 : CN112242059B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王一松王春燕赵万忠刘利锋秦亚娟刘晓强王展

申请人 : 南京航空航天大学

摘要 :

本发明公开了一种基于动机与风险评估的无人驾驶车辆智能决策方法,首先对高速环境下车辆需要进行状态改变时的周围环境条件、动机进行分析。在此基础上,提取了改变驾驶状态的动机,并将其作为行为决策的核心,在有动机触发时才进行决策,而其他情况下仍保持当前行驶状态。同时,建立无人驾驶车辆周围环境风险评估模型对决策结果进行动态验证,判断决策合理性、计算决策最优目标点。本发明能避免无人驾驶汽车行驶过程中决策系统过多无意义决策,提升计算效率,实现在动态不确定环境下的无人驾驶汽车实时、高效、安全的驾驶决策。

权利要求 :

1.基于动机与风险评估的无人驾驶车辆智能决策方法,其特征在于,包括以下步骤:步骤1),利用NGSIM数据库中的数据计算得到数据库中记录的每一辆无人驾驶车辆在高速环境下的侧向速度、侧向位置、周围可行驶空间,并将行驶状态改变时无人驾驶车辆的速度、位置变化作为先验知识进行总结归类,得到第一至第三触发条件;所述周围可行驶空间为向量形式、包含自车行驶方向上与左前、前、右前、左后、右后车辆的距离;所述第一触发条件为:期望车速值与自车实际车速值相差大于3m/s;所述第二触发条件为:车前空间小于最小安全碰撞距离;所述第三触发条件为:车辆驶入驶出匝道;

所述的NGSIM数据库选用US‑101数据集,其数据包括:车辆进入检测路段先后编号、开始检测时刻为起点的时间序列编号、车头中心距路段左侧边缘距离X、车头中心距路段起点距离Y、车辆瞬时速度、车辆瞬时加速度;首先将数据进行绘图分析,计算车辆改变行驶状态时的侧向速度、侧向加速度以及周围可行驶空间,然后记录车辆状态发生改变后的速度、位置信息并将其作为先验知识进行总结归类;

步骤2),将步骤1)中的第一至第三触发条件作为动机决策算法依据,利用激光雷达及摄像头识别周围车辆状态信息并与归类结果进行匹配,通过NGSIM数据库获取的先验知识输出每种匹配结果可行的候选执行动作;

针对第一触发条件,利用径向基神经网络即RBF网络模拟行驶状态改变时车速变化过程计算出期望车速,并根据环境条件进行加减速操作;所述利用径向基神经网络即RBF网络模拟行驶状态改变时车速变化过程计算出期望车速的具体步骤为:根据NGSIM数据库获取的先验知识选取自车车速ve、与前车的相对速度vr、自车速度与道路限速的差值vl以及两侧空间gl、gr作为RBF的输入,利用K‑均值聚类算法对输入样本作预处理选择RBF中心:

2

dij=||Xi‑cj||

2

式中,||Xi‑cj||表示第i个样本数据与第j个聚类中心的距离;Kj表示样本i归属于中心j;

由K‑均值聚类法确定好隐含层中心参数后,对RBF网络进行训练;初始化隐含层到输出层的权值和各中心参数对应的宽度向量,利用梯度下降法对参数进行训练以决定每个聚类中心所代表的特征在输出中的占比:式中,Δwf为隐含层权重变化量,Δcf为中心参数变化量,Δdf为中心参数对应宽度向量变化量,η为学习因子;E为RBF神经网络评价函数, eg为第g个样本数据输入时网络预测输出与期望输出的差值,N为样本数;

由RBF网络预测的期望车速表达式如下:T

式中,X=[ve vr vl gr gl] ;Cf为隐含层各神经元的中心参数;f即为隐含层神经元个数;w为隐含层到输出层的连接权值;为基函数,针对第二触发条件和第三触发条件,计算当前车速条件下最小安全碰撞距离,采用制动转向相结合进行避障,以保证行驶安全,具体计算过程如下:采用正弦函数曲线模拟车辆换道路线,计算碰撞时间tc:式中,W为前车车宽;τ为安全裕度;Ld为车道宽;te为预设的换道时间;

自车与障碍物不发生碰撞的必要条件是自车与前车在纵向方向还未发生碰撞时,车辆转过的侧向位移要大于前车车宽;因此,匀速换道避障和减速换道避障时的最小安全距离分别为:

式中, 和 分别为自车与前车当前k时刻车速;demax为自车最大减速度;df,k为前车当前k时刻的减速度;

以相对速度和车前距离作为三种行动的转换指标,则紧急情况下采取的三种行动的概率分别为:

式中,vη为转换临界值,在相对速度较大时采用转向避障收益更大,同时限制值的存在也可保障车辆在只需轻微制动时不采取过激或是复杂行为;β为触发紧急情况的条件参数;

式中, 表示在时刻t时,车辆处于侧向位置为q、加速度为0时的危险度,即当车辆保持当前行驶状态时依然有碰撞风险,需要采取相应的避障措施;

步骤3),建立风险评估模型,将执行动作中所包含的加速度、侧向位置信息映射到基于其他车辆行为预测的风险评估模型中,进行动态环境验证,利用风险评估的动态验证过程筛选满足决策方式的所有候选执行动作,去除风险值高于预设安全阈值的候选动作;

风险评估模型通过对下一时刻可行驶范围内的状态点进行评估而求得自车周围的风险情况,从而建立风险map图,每一个状态点在t时刻表示为:式中,ae,min和ae,max表示自车允许的最小和最大加速度;Δae=ae,max‑ae,min;Cp为车速和路径候选点个数;lmin为道路的下边界位置;

通过计算车头时距Th和碰撞时间TTC对每个状态点进行评估:式中,D(t)表示t时刻自车与前车的距离;Ve(t)和Vf(t)分别表示t时刻自车和前车的速度;L为前车车长;ε为损失因子;

风险评估模型ξ(s,T)为:

式中,s为周围车辆个数;ωTh和ωTTC为权重因子,分别取1和4;ε表示预测车辆与自车分属不同车道时的影响,两车在同一车道内时ε=1,两车不在同一车道时随着车道距离的增加ε减小;γ为时间损失因子,当前时刻状态获取的周围车辆状态信息最为准确也对当前时刻的决策影响最大,随着预测时间的增大,不确定性越大,对当前时刻决策的影响也越小;

因此γ为随时间增大而减小的变量;

利用风险评估模型动态验证筛选候选动作的过程为,将所有候选执行动作都通过不同的加速度与侧向位置序列表示:

式中 和 分别表示风险评估中车辆t+NP时刻的加速度与侧向位置序列;π表示不同的决策动机;Cp为车速和路径候选点个数;

在加速度与侧向位置的候选序列基础上建立目标函数,寻找最适合当前交通环境,兼顾安全性与高效性的目标点:

式中, 表示在t时刻的i个加速度值所组成的序列; 表示在t时刻的j个目标侧向位置所组成的序列; 表示在t时刻的i个为保障安全性所求解产生的加速度向量;

表示在t时刻的j个为保障安全性所求解的侧向位置向量; 表示为保障安全性产生的三种决策行为; 分别表示在t时刻由RBF神经网络求解的加速度向量和侧向位置向量;β和λ为影响因子,β+λ=1;

由安全性要求产生决策行为的加速度与侧向位置序列,式中,D0为自车与前车的实际距离;a0表示加速度为零的状态;

式中,q0为当前时刻车辆所在车道中心线的位置;

RBF模拟驾驶员主观动机产生当前时刻的期望速度,由这一决策行为产生的加速度、侧向位置序列如下:

式中, 分别表示一个时长T后自车所能达到的最大速度与最小速度;

根据风险度与驾驶规则建立评价函数,对上述产生的候选序列进行筛选选取局部最优点:

式中,J是评价函数计算得到的候选序列的评价值,(a‑a0)(q‑qe)可以表示依据驾驶规则得到的加速时向内测换道,减速时向外侧换道的倾向,N为其影响因子; 表示车辆制动避障时与决策前状态的接近程度,M为其影响因子并且M<N;

为先决条件,将不满足安全风险的候选点排除以保证安全性;l和κ分别为极小的正负数;

步骤4),根据风险度与驾驶规则建立执行动作评价函数,将候选执行动作代入评价函数中比较,选取评价函数值最大的执行动作计算最优目标终点,并根据最优目标终点对无人驾驶车辆速度与路径进行动态规划。

说明书 :

基于动机与风险评估的无人驾驶车辆智能决策方法

技术领域

[0001] 本发明涉及无人驾驶汽车决策技术领域,尤其涉及一种基于动机与风险评估的无人驾驶车辆智能决策方法。

背景技术

[0002] 随着计算机与通讯技术的飞速发展,自动驾驶汽车获得了越来越多的关注。全球各大汽车公司也在加大对自动驾驶更高等级技术的研发力度。为了应对不同场景而研发的
如BSD、CTA、IACC等高级辅助技术和决策算法相继投入市场。其中,面临各种交通环境以及
应急情况的行为决策与规划是保证车辆安全、高效行驶的核心技术。目前驾驶行为决策主
要以基于规则的或是基于学习算法的决策系统为主。基于规则的行为决策方法将无人驾驶
车辆的行为进行划分,根据行驶规则、知识、经验以及交通规则等建立行为规则库,根据不
同的环境信息划分车辆状态,不同的车辆状态间依据规则逻辑由不同的驾驶行为进行转
换。其中以有限状态机模型(FSM)应用较为广泛。例如中国专利申请号CN201911389109.8,
名称“基于深度学习的智能驾驶决策方法及系统”中将实时外部环境数据和实时内部运行
数据输入深度学习模块以获取车辆实时控制指令;中国专利申请号CN201811524283.4,名
称“一种基于规则与学习模型的无人驾驶汽车驶离高速的方法”中将规则模型与学习模型
在不同环境下切换决策实现无人驾驶汽车安全下匝道任务。以上专利的决策系统依托神经
网络模型或有限状态机模型进行决策,但神经网络需要的样本数量往往很大且容易过拟
合,参数不易确定。有限状态机模型没有充分考虑环境的不确定性,在复杂的环境中,许多
因素往往不能提前精确建模且在复杂环境下涉及状态增多时不便于管理。同时现有方法大
多需要进行全局搜索,即在每一次决策步长内对每一个可能到达位置,每一条候选轨迹进
行筛选。而在实际人类驾驶员驾驶时,其并不是每时每刻都在头脑中规划所有可行的轨迹,
这极大地降低了计算效率以及实时性。

发明内容

[0003] 本发明所要解决的技术问题是针对背景技术中所涉及到的缺陷,提供一种基于动机与风险评估的无人驾驶车辆智能决策方法。
[0004] 本发明为解决上述技术问题采用以下技术方案:
[0005] 本发明所要解决的技术问题是针对于上述现有技术的不足,提供一种基于动机与风险评估的无人驾驶车辆智能决策方法,包括以下步骤:
[0006] 步骤1),利用NGSIM数据库中的数据计算得到数据库中记录的每一辆无人驾驶车辆在高速环境下的侧向速度、侧向位置、周围可行驶空间,并将行驶状态改变时无人驾驶车
辆的速度、位置变化作为先验知识进行总结归类,得到第一至第三触发条件;所述周围可行
驶空间为向量形式、包含自车行驶方向上与左前、前、右前、左后、右后车辆的距离;所述第
一触发条件为:期望车速值与自车实际车速值相差大于3m/s;所述第二触发条件为:车前空
间小于最小安全碰撞距离;所述第三触发条件为:车辆驶入驶出匝道;
[0007] 步骤2),将步骤1)中的第一至第三触发条件作为动机决策算法依据,利用激光雷达及摄像头识别周围车辆状态信息并与归类结果进行匹配,通过NGSIM数据库获取的先验
知识输出每种匹配结果可行的候选执行动作;
[0008] 步骤3),建立风险评估模型,将执行动作中所包含的加速度、侧向位置信息映射到基于其他车辆行为预测的风险评估模型中,进行动态环境验证,利用风险评估的动态验证
过程筛选满足决策方式的所有候选执行动作,去除风险值高于预设安全阈值的候选动作;
[0009] 步骤4),根据风险度与驾驶规则建立执行动作评价函数,将候选执行动作代入评价函数中比较,选取评价函数值最大的执行动作计算最优目标终点,并根据最优目标终点
对无人驾驶车辆速度与路径进行动态规划。
[0010] 作为本发明一种基于动机与风险评估的无人驾驶车辆智能决策方法进一步的优化方案,所述步骤1)中的NGSIM数据库选用US‑101数据集,其数据包括:车辆进入检测路段
先后编号、开始检测时刻为起点的时间序列编号、车头中心距路段左侧边缘距离X、车头中
心距路段起点距离Y、车辆瞬时速度、车辆瞬时加速度;首先将数据进行绘图分析,计算车辆
改变行驶状态时的侧向速度、侧向加速度以及周围可行驶空间,然后记录车辆状态发生改
变后的速度、位置信息并将其作为先验知识进行总结归类。
[0011] 上述三种触发条件为NGSIM数据库离线归类得到,在车辆实际行驶过程中,需要依据周围车辆状态信息以及自车状态在线实时计算期望车速、最小安全碰撞距离值。
[0012] 作为本发明一种基于动机与风险评估的无人驾驶车辆智能决策方法进一步的优化方案,所述步骤2)中,针对第一触发条件,利用径向基神经网络即RBF网络模拟行驶状态
改变时车速变化过程计算出期望车速,并根据环境条件进行加减速操作;针对第二触发条
件和第三触发条件,计算当前车速条件下最小安全碰撞距离,采用制动转向相结合进行避
障,以保证行驶安全。
[0013] 作为本发明一种基于动机与风险评估的无人驾驶车辆智能决策方法进一步的优化方案,所述利用径向基神经网络即RBF网络模拟行驶状态改变时车速变化过程计算出期
望车速的具体步骤为:
[0014] 根据NGSIM数据库获取的先验知识选取自车车速ve、与前车的相对速度vr、自车速度与道路限速的差值vl以及两侧空间gl、gr作为RBF的输入,利用K‑均值聚类算法对输入样
本作预处理选择RBF中心:
[0015] dij=||Xi‑cj||2
[0016]
[0017] 式中,||Xi‑cj||2表示第i个样本数据与第j个聚类中心的距离;Kj表示样本i归属于中心j;
[0018] 由K‑均值聚类法确定好隐含层中心参数后,对RBF网络进行训练;初始化隐含层到输出层的权值和各中心参数对应的宽度向量,利用梯度下降法对参数进行训练以决定每个
聚类中心所代表的特征在输出中的占比:
[0019]
[0020] 式中,Δwf为隐含层权重变化量,Δcf为中心参数变化量,Δdf为中心参数对应宽度向量变化量,η为学习因子;E为RBF神经网络评价函数, eg
为第g个样本数据输入时网络预测输出与期望输出的差值,N为样本数;
[0021] 由RBF网络预测的期望车速表达式如下:
[0022]
[0023] 式中,X=[ve vr vl gr gl]T;Cf为隐含层各神经元的中心参数;f即为隐含层神经元个数;w为隐含层到输出层的连接权值;为基函数,
[0024] 作为本发明一种基于动机与风险评估的无人驾驶车辆智能决策方法进一步的优化方案,计算当前车速条件下最小安全碰撞距离,采用制动转向相结合进行避障的具体计
算过程如下:
[0025] 采用正弦函数曲线模拟车辆换道路线,计算碰撞时间tc:
[0026]
[0027] 式中,W为前车车宽;τ为安全裕度;Ld为车道宽;te为预设的换道时间;将te设定为3.5s,Ld取3.75m;
[0028] 自车与障碍物不发生碰撞的必要条件是自车与前车在纵向方向还未发生碰撞时,车辆转过的侧向位移要大于前车车宽;因此,匀速换道避障和减速换道避障时的最小安全
距离分别为:
[0029]
[0030]
[0031] 式中, 和 分别为自车与前车当前k时刻车速;demax为自车最大减速度;df,k为前车当前k时刻的减速度;
[0032] 以相对速度和车前距离作为三种行动的转换指标;则紧急情况下采取的三种行动的概率分别为:
[0033]
[0034] 式中,vη为转换临界值,在相对速度较大时采用转向避障收益更大,同时限制值的存在也可保障车辆在只需轻微制动时不采取过激或是复杂行为;β为触发紧急情况的条件
参数;
[0035]
[0036] 式中, 表示在时刻t时,车辆处于侧向位置为q、加速度为0时的危险度,即当车辆保持当前行驶状态时依然有碰撞风险,需要采取相应的避障措施。
[0037] 作为本发明一种基于动机与风险评估的无人驾驶车辆智能决策方法进一步的优化方案,所述步骤3)中的风险评估模型通过对下一时刻可行驶范围内的状态点进行评估而
求得自车周围的风险情况,从而建立风险map图,每一个状态点在t时刻表示为:
[0038]
[0039] 式中,ae,min和ae,max表示自车允许的最小和最大加速度;Δae=ae,max‑ae,min;Cp为车速和路径候选点个数;lmin为道路的下边界位置;
[0040] 通过计算车头时距Th和碰撞时间TTC对每个状态点进行评估:
[0041]
[0042] 式中,D(t)表示t时刻自车与前车的距离;Ve(t)和Vf(t)分别表示t时刻自车和前车的速度;L为前车车长;ε为损失因子;
[0043] 风险评估模型ξ(s,T)为:
[0044]
[0045] 式中,s为周围车辆个数;ωTh和ωTTC为权重因子,分别取1和4;ε表示预测车辆与自车分属不同车道时的影响,两车在同一车道内时ε=1,两车不在同一车道时随着车道距离
的增加ε减小;γ为时间损失因子,当前时刻状态获取的周围车辆状态信息最为准确也对当
前时刻的决策影响最大,随着预测时间的增大,不确定性越大,对当前时刻决策的影响也越
小;因此γ为随时间增大而减小的变量。
[0046] 作为本发明一种基于动机与风险评估的无人驾驶车辆智能决策方法进一步的优化方案,所述步骤3)中利用风险评估模型动态验证筛选候选动作的过程为,将所有候选执
行动作都通过不同的加速度与侧向位置序列表示:
[0047]
[0048]
[0049] 式中 和 分别表示风险评估中车辆t+NP时刻的加速度与侧向位置序列;π表示不同的决策动机;Cp为车速和路径候选点个数;
[0050] 在加速度与侧向位置的候选序列基础上建立目标函数,寻找最适合当前交通环境,兼顾安全性与高效性的目标点:
[0051]
[0052] 式中, 表示在t时刻的i个加速度值所组成的序列; 表示在t时刻的j个目标侧向位置所组成的序列; 表示在t时刻的i个为保障安全性所求解产生的加速度向
量; 表示在t时刻的j个为保障安全性所求解的侧向位置向量;表示为保障安全性产
生的三种决策行为; 分别表示在t时刻由RBF神经网络求解的加速度向量和侧向
位置向量;β和λ为影响因子,β+λ=1;
[0053] 由安全性要求产生决策行为的加速度与侧向位置序列,
[0054]
[0055] 式中,D0为自车与前车的实际距离;a0表示加速度为零的状态;
[0056]
[0057] 式中,q0为当前时刻车辆所在车道中心线的位置;
[0058] RBF模拟驾驶员主观动机产生当前时刻的期望速度,由这一决策行为产生的加速度、侧向位置序列如下:
[0059]
[0060] 式中, 分别表示一个时长T后自车所能达到的最大速度与最小速度;
[0061] 根据风险度与驾驶规则建立评价函数,对上述产生的候选序列进行筛选选取局部最优点:
[0062]
[0063] 式中,J是评价函数计算得到的候选序列的评价值,(a‑a0)(q‑qe)可以表示依据驾驶规则得到的加速时向内测换道,减速时向外侧换道的倾向,N为其影响因子;
表示车辆制动避障时与决策前状态的接近程度,M为其影响因子并且M<N;
为先决条件,将不满足安全风险的候选点排除以保证安全性;和κ分
别为极小的正负数。
[0064] 最后利用评价函数对每个候选点进行评估,通过比较找到评价函数最大值所对应的加速度与侧向位置值,二者所组成的坐标(a,q|Jmax)即为经过风险评估验证后的局部最
优点。
[0065] 本发明采用以上技术方案与现有技术相比,具有以下技术效果:
[0066] 1.本发明提出的基于动机与风险评估的无人驾驶车辆智能决策方法,适用于无人驾驶汽车高速环境下的智能决策。将高速环境下车辆需要进行状态改变时的周围环境条
件、动机作为智能决策的核心,在有动机触发时才进行决策,而其他情况下仍保持当前行驶
状态,更加符合人类驾驶员决策行为;同时,其可以避免过多无意义决策,大大提高计算效
率,保证决策过程的实时性要求;
[0067] 2.本发明提出的风险评估动态验证过程充分考虑了交通环境的动态变化性,是对以动机为核心的决策算法的进一步完善。利用加速度与侧向位置序列具体化候选决策行
为,通过评价函数判断决策的合理性,大大提高了无人驾驶车辆行驶的安全性。

附图说明

[0068] 图1为本发明决策方法的原理图;
[0069] 图2为本发明基于RBF网络求期望速度的原理图;
[0070] 图3为本发明风险评估模型原理图。

具体实施方式

[0071] 下面结合附图对本发明的技术方案做进一步的详细说明:
[0072] 本发明可以以许多不同的形式实现,而不应当认为限于这里所述的实施例。相反,提供这些实施例以便使本公开透彻且完整,并且将向本领域技术人员充分表达本发明的范
围。在附图中,为了清楚起见放大了组件。
[0073] 参照图1所示,本发明的一种基于动机与风险评估的无人驾驶车辆智能决策方法,通过分析并提取正常驾驶员在高速环境下改变当前驾驶状态时的触发动机,参考其作为智
能决策的核心可以避免过多无意义决策,提高计算效率。同时,利用可以反映未来时域的风
险评估模型,将所提出的基于动机的决策方法映射到风险评估中,去寻找满足当前决策的
局部最优点作为下一时刻的目标终点;具体包括以下步骤:
[0074] 步骤1),利用NGSIM数据库中的数据计算得到数据库中记录的每一辆无人驾驶车辆在高速环境下的侧向速度、侧向位置、周围可行驶空间,并将行驶状态改变时无人驾驶车
辆的速度、位置变化作为先验知识进行总结归类,得到第一至第三触发条件;所述周围可行
驶空间为向量形式、包含自车行驶方向上与左前、前、右前、左后、右后车辆的距离;所述第
一触发条件为:期望车速值与自车实际车速值相差大于3m/s;所述第二触发条件为:车前空
间小于最小安全碰撞距离;所述第三触发条件为:车辆驶入驶出匝道;
[0075] 步骤2),将步骤1)中的第一至第三触发条件作为动机决策算法依据,利用激光雷达及摄像头识别周围车辆状态信息并与归类结果进行匹配,通过NGSIM数据库获取的先验
知识输出每种匹配结果可行的候选执行动作;
[0076] 步骤3),建立风险评估模型,将执行动作中所包含的加速度、侧向位置信息映射到基于其他车辆行为预测的风险评估模型中,进行动态环境验证,利用风险评估的动态验证
过程筛选满足决策方式的所有候选执行动作,去除风险值高于预设安全阈值的候选动作;
[0077] 步骤4),根据风险度与驾驶规则建立执行动作评价函数,将候选执行动作代入评价函数中比较,选取评价函数值最大的执行动作计算最优目标终点,并根据最优目标终点
对无人驾驶车辆速度与路径进行动态规划。
[0078] 所述步骤1)中的NGSIM数据库选用US‑101数据集,其数据包括:车辆进入检测路段先后编号、开始检测时刻为起点的时间序列编号、车头中心距路段左侧边缘距离X、车头中
心距路段起点距离Y、车辆瞬时速度、车辆瞬时加速度;首先将数据进行绘图分析,计算车辆
改变行驶状态时的侧向速度、侧向加速度以及周围可行驶空间,然后记录车辆状态发生改
变后的速度、位置信息并将其作为先验知识进行总结归类。
[0079] 上述三种触发条件为NGSIM数据库离线归类得到,在车辆实际行驶过程中,需要依据周围车辆状态信息以及自车状态在线实时计算期望车速、最小安全碰撞距离值。
[0080] 所述步骤2)中,针对第一触发条件,利用径向基神经网络即RBF网络模拟行驶状态改变时车速变化过程计算出期望车速,并根据环境条件进行加减速操作;针对第二触发条
件和第三触发条件,计算当前车速条件下最小安全碰撞距离,采用制动转向相结合进行避
障,以保证行驶安全。
[0081] 如图2所示,所述利用径向基神经网络即RBF网络模拟行驶状态改变时车速变化过程计算出期望车速的具体步骤为:
[0082] 根据NGSIM数据库获取的先验知识选取自车车速ve、与前车的相对速度vr、自车速度与道路限速的差值vl以及两侧空间gl、gr作为RBF的输入,利用K‑均值聚类算法对输入样
本作预处理选择RBF中心:
[0083] dij=||Xi‑cj||2
[0084]
[0085] 式中,||Xi‑cj||2表示第i个样本数据与第j个聚类中心的距离;Kj表示样本i归属于中心j;
[0086] 由K‑均值聚类法确定好隐含层中心参数后,对RBF网络进行训练;初始化隐含层到输出层的权值和各中心参数对应的宽度向量,利用梯度下降法对参数进行训练以决定每个
聚类中心所代表的特征在输出中的占比:
[0087]
[0088] 式中,Δwf为隐含层权重变化量,Δcf为中心参数变化量,Δdf为中心参数对应宽度向量变化量,η为学习因子;E为RBF神经网络评价函数, eg
为第g个样本数据输入时网络预测输出与期望输出的差值,N为样本数;
[0089] 由RBF网络预测的期望车速表达式如下:
[0090]
[0091] 式中,X=[ve vr vl gr gl]T;Cf为隐含层各神经元的中心参数;f即为隐含层神经元个数;w为隐含层到输出层的连接权值;为基函数,
[0092] 计算当前车速条件下最小安全碰撞距离,采用制动转向相结合进行避障的具体计算过程如下:
[0093] 采用正弦函数曲线模拟车辆换道路线,计算碰撞时间tc:
[0094]
[0095] 式中,W为前车车宽;τ为安全裕度;Ld为车道宽;te为预设的换道时间;将te设定为3.5s,Ld取3.75m;
[0096] 自车与障碍物不发生碰撞的必要条件是自车与前车在纵向方向还未发生碰撞时,车辆转过的侧向位移要大于前车车宽。因此,匀速换道避障和减速换道避障时的最小安全
距离分别为:
[0097]
[0098]
[0099] 式中, 和 分别为自车与前车当前k时刻车速;demax为自车最大减速度;df,k为前车当前k时刻的减速度;
[0100] 以相对速度和车前距离作为三种行动的转换指标。则紧急情况下采取的三种行动的概率分别为:
[0101]
[0102] 式中,vη为转换临界值,在相对速度较大时采用转向避障收益更大,同时限制值的存在也可保障车辆在只需轻微制动时不采取过激或是复杂行为。β为触发紧急情况的条件
参数。
[0103]
[0104] 式中, 表示在时刻t时,车辆处于侧向位置为q、加速度为0时的危险度,即当车辆保持当前行驶状态时依然有碰撞风险,需要采取相应的避障措施。
[0105] 如图3所示,所述步骤3)中的风险评估模型通过对下一时刻可行驶范围内的状态点进行评估而求得自车周围的风险情况,从而建立风险map图,每一个状态点在t时刻表示
为:
[0106]
[0107] 式中,ae,min和ae,max表示自车允许的最小和最大加速度;Δae=ae,max‑ae,min;Cp为车速和路径候选点个数;lmin为道路的下边界位置;
[0108] 通过计算车头时距Th和碰撞时间TTC对每个状态点进行评估:
[0109]
[0110] 式中,D(t)表示t时刻自车与前车的距离;Ve(t)和Vf(t)分别表示t时刻自车和前车的速度;L为前车车长;ε为损失因子;
[0111] 风险评估模型ξ(s,T)为:
[0112]
[0113] 式中,s为周围车辆个数;ωTh和ωTTC为权重因子,分别取1和4;ε表示预测车辆与自车分属不同车道时的影响,两车在同一车道内时ε=1,两车不在同一车道时随着车道距离
的增加ε减小;γ为时间损失因子,当前时刻状态获取的周围车辆状态信息最为准确也对当
前时刻的决策影响最大,随着预测时间的增大,不确定性越大,对当前时刻决策的影响也越
小。因此γ为随时间增大而减小的变量。
[0114] 所述步骤3)中利用风险评估模型动态验证筛选候选动作的过程为,将所有候选执行动作都通过不同的加速度与侧向位置序列表示:
[0115]
[0116]
[0117] 式中 和 分别表示风险评估中车辆t+NP时刻的加速度与侧向位置序列;π表示不同的决策动机;Cp为车速和路径候选点个数;
[0118] 在加速度与侧向位置的候选序列基础上建立目标函数,寻找最适合当前交通环境,兼顾安全性与高效性的目标点:
[0119]
[0120] 式中, 表示在t时刻的i个加速度值所组成的序列; 表示在t时刻的j个目标侧向位置所组成的序列; 表示在t时刻的i个为保障安全性所求解产生的加速度向
量; 表示在t时刻的j个为保障安全性所求解的侧向位置向量;表示为保障安全性产
生的三种决策行为; 分别表示在t时刻由RBF神经网络求解的加速度向量和侧向
位置向量;β和λ为影响因子,β+λ=1;
[0121] 由安全性要求产生决策行为的加速度与侧向位置序列,
[0122]
[0123] 式中,D0为自车与前车的实际距离;a0表示加速度为零的状态。
[0124]
[0125] 式中,q0为当前时刻车辆所在车道中心线的位置。
[0126] RBF模拟驾驶员主观动机产生当前时刻的期望速度,由这一决策行为产生的加速度、侧向位置序列如下:
[0127]
[0128] 式中, 分别表示一个时长T后自车所能达到的最大速度与最小速度。
[0129] 根据风险度与驾驶规则建立评价函数,对上述产生的候选序列进行筛选选取局部最优点:
[0130]
[0131] 式中,J是评价函数计算得到的候选序列的评价值,(a‑a0)(q‑qe)可以表示依据驾驶规则得到的加速时向内测换道,减速时向外侧换道的倾向,N为其影响因子;
表示车辆制动避障时与决策前状态的接近程度,M为其影响因子并且M<N;
为先决条件,将不满足安全风险的候选点排除以保证安全性;和κ
分别为极小的正负数。
[0132] 最后利用评价函数对每个候选点进行评估,通过比较找到评价函数最大值所对应的加速度与侧向位置值,二者所组成的坐标(a,q|Jmax)即为经过风险评估验证后的局部最
优点。
[0133] 本技术领域技术人员可以理解的是,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还
应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中
的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
[0134] 以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限制本发
明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明
的保护范围之内。