一种考虑车辆双向交互的智能车预测决策融合方法转让专利

申请号 : CN202010002358.3

文献号 : CN110936954B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 黄云丰赵万忠邹松春王春燕

申请人 : 南京航空航天大学

摘要 :

本发明公开了一种考虑车辆双向交互的智能车预测决策融合方法,包括步骤如下:建立POMDP模型;通过车载感知系统获取自车及周围车辆的初始状态,得到初始状态和初始观察;将第k步观察输入IMM算法更新得到模型转移矩阵;预测周围车辆的纵向运动,计算得到第k步的置信状态;通过POMDP算法计算出最大状态‑动作值函数,并取相应的动作作为智能车第k步的动作;将k步的状态和动作代入状态转移函数计算得到k+1步的状态和观察;判断迭代次数是否达到最大迭代次数。本发明将IMM算法与POMPD算法相结合,解决了传统方法预测结果不准确,决策结果不满足安全性要求的问题。

权利要求 :

1.一种考虑车辆双向交互的智能车预测决策融合方法,其特征在于,包括步骤如下:步骤1:建立部分可观测马尔可夫决策模型:{S,O,A,P,R},其中,S为车辆状态集合,O为观察集合,A为动作集合,P为状态转移函数,R为回报函数;

步骤2:通过车载感知系统获取自车及周围车辆的初始状态,得到初始状态s0和初始观察o0;

步骤3:将第k步观察ok输入交互多模型算法更新得到模型转移矩阵Tk,k=0,1,2,…,N;

预测周围车辆的纵向运动,计算得到第k步的置信状态;

步骤4:通过部分可观测马尔可夫决策算法计算出最大状态-动作值函数Q(sk,ak)max,并取相应的动作作为智能车第k步的动作Ak=ak;

步骤5:将k步的状态sk和动作Ak代入状态转移函数P计算得到k+1步的状态sk+1和观察ok+1;

步骤6:判断迭代次数是否达到最大迭代次数N;若达到最大迭代次数,则结束;若未达到迭代次数,则k=k+1并返回步骤3;

所述步骤1具体包括:

11)车辆状态集合S包括智能车状态以及周围车辆状态,具体为:式中,sego为智能车状态,si为第i辆周围车辆状态,i=1,2,…,n,n为周围车辆数目;

sego,si具体为:

式中,xego为智能车x方向的坐标,yego为智能车y方向坐标,θego为智能车横摆角,vego为智能车质心速度,xi为第i辆周围车辆x方向的坐标,yi为第i辆周围车辆y方向的坐标,vi为第i辆周围车辆x方向的速度, 为第i辆周围车辆隐藏状态车辆加速度;

12)观察集合O具体为:

O={Δx1,Δv1,Δx2,Δv2,…,Δxi,Δvi}式中,Δxi为智能车与第i辆周围车辆x方向的相对距离,Δvi为智能车与第i辆周围车辆x方向的相对速度;

Δxi,Δvi具体为:

Δxi=xego-xi-L,Δvi=vegocosθego-vi式中,L为车辆长度;

13)动作集合A具体为:

A={LT,ST,RT};

式中,LT表示车辆横摆角向左转一个角度,ST表示横摆角不变,RT表示横摆角向右转一个角度;将驾驶动作参数化为:LT=1°,ST=0,RT=-1°

14)状态转移函数P具体为:

式中,am为IMM算法中周围车辆第m个加速模型,m为加速模型的个数;

15)回报函数R具体为:

式中,

c0为车辆宽度的一半,Sr为道路条件参数;

所述步骤3具体包括:

31)周围车辆加速模型为:

32)第i辆周围车辆在k步模型转移矩阵 为3阶矩阵,具体为:

33)通过k-1步的模型预测概率 和加速度 更新得到k步的模型预测概率 即得到k步的置信状态

2.根据权利要求1所述的考虑车辆双向交互的智能车预测决策融合方法,其特征在于,所述步骤4中的状态-动作值函数Q(sk,ak)具体为:式中,γ为折扣因子,R为回报值,sk为k步的状态,ak为k步的动作。

说明书 :

一种考虑车辆双向交互的智能车预测决策融合方法

技术领域

[0001] 本发明属于智能车决策技术领域,具体指代一种考虑车辆双向交互的智能车预测决策融合方法。

背景技术

[0002] 随着人工智能的发展,智能汽车的研究成为汽车领域的研究热点。智能车主要包括感知系统、决策系统以及执行系统。决策系统作为智能汽车的关键部分,可分为三个部分:周围车辆运动预测部分、决策部分和轨迹规划部分;周围车辆运动预测部分需要预测出周围车辆未来的行驶状态;决策部分需要根据车辆的行驶状态以及周围的车辆状态做出安全可行的意图决策;轨迹规划部分则根据决策结果给出相应的行驶轨迹。周围车辆运动状态的预测通常仅考虑周围车辆自车的状态参数而忽略智能车对其的影响,导致预测结果不准确,与实际相差较大。目前,大多数车辆的决策系统仅考虑周围车辆当前的状态,而没有考虑周围车辆未来行驶状态的变化,使决策系统做出危险的行为决策,导致智能车与周围车辆发生碰撞。因此,在决策过程中有必要对周围车辆未来的运动状态进行预测。

发明内容

[0003] 针对于上述现有技术的不足,本发明的目的在于提供一种考虑车辆双向交互的智能车预测决策融合方法,以解决现有技术中车辆预测结果不准确,决策结果不可行的问题;本发明能够有效的对周围车辆的运动状态进行预测,同时使智能车决策出安全可行的行驶意图和行驶轨迹。
[0004] 为达到上述目的,本发明采用的技术方案如下:
[0005] 本发明的一种考虑车辆双向交互的智能车预测决策融合方法,包括步骤如下:
[0006] 步骤1:建立POMDP(部分可观测马尔可夫决策)模型:{S,O,A,P,R},其中,S为车辆状态集合,O为观察集合,A为动作集合,P为状态转移函数,R为回报函数;
[0007] 步骤2:通过车载感知系统获取自车及周围车辆的初始状态,得到初始状态s0和初始观察o0;
[0008] 步骤3:将第k步观察ok输入IMM(交互多模型)算法更新得到模型转移矩阵Tk,k=0,1,2,…,N;预测周围车辆的纵向运动,计算得到第k步的置信状态;
[0009] 步骤4:通过POMDP算法计算出最大状态-动作值函数Q(sk,ak)max,并取相应的动作作为智能车第k步的动作Ak=ak;
[0010] 步骤5:将k步的状态sk和动作Ak代入状态转移函数P计算得到k+1步的状态sk+1和观察ok+1;
[0011] 步骤6:判断迭代次数是否达到最大迭代次数N;若达到最大迭代次数,则结束;若未达到迭代次数,则k=k+1并返回步骤3。
[0012] 优选的,所述步骤1具体包括:
[0013] 11)车辆状态集合S包括智能车状态以及周围车辆状态,具体为:
[0014] S={sego,s1,s2,…,sn}
[0015] 式中,sego为智能车状态,si为第i辆周围车辆状态,i=1,2,…,n,n为周围车辆数目;
[0016] sego,si具体为:
[0017] sego={xego,yego,θego,vego},
[0018] 式中,xego为智能车x方向的坐标,yego为智能车y方向坐标,θego为智能车横摆角,vego为智能车质心速度,xi为第i辆周围车辆x方向的坐标,yi为第i辆周围车辆y方向的坐标,vi为第i辆周围车辆x方向的速度, 为第i辆周围车辆隐藏状态车辆加速度;
[0019] 12)观察集合O具体为:
[0020] O={Δx1,Δv1,Δx2,Δv2,…,Δxi,Δvi}
[0021] 式中,Δxi为智能车与第i辆周围车辆x方向的相对距离,Δvi为智能车与第i辆周围车辆x方向的相对速度;
[0022] Δxi,Δvi具体为:
[0023] Δxi=xego-xi-L,Δvi=vegocosθego-vi
[0024] 式中,L为车辆长度;
[0025] 13)动作集合A具体为:
[0026] A={LT,ST,RT};
[0027] 式中,LT表示车辆横摆角向左转一个角度,ST表示横摆角不变,RT表示横摆角向右转一个角度;将驾驶动作参数化为:
[0028] LT=1°,ST=0,RT=-1°
[0029] 14)状态转移函数P具体为:
[0030]
[0031] 式中,am为IMM算法中周围车辆第m个加速模型,m为加速模型的个数;
[0032] 15)回报函数R具体为:
[0033]
[0034] 式中,c0为车辆宽度的一半,Sr为道路条件参数。
[0035] 优选的,所述步骤3具体包括:
[0036] 31)周围车辆加速模型为:
[0037]
[0038] 32)第i辆周围车辆在k步模型转移矩阵 为3阶矩阵,具体为:
[0039]
[0040]
[0041] 33)通过k-1步的模型预测概率 和加速度 更新得到k步的模型预测概率即得到k步的置信状态
[0042] 优选的,所述步骤5中的状态值函数Q(sk,ak)具体为:
[0043]
[0044] 式中,γ为折扣因子,R为回报值,sk为k步的状态,ak为k步的动作。
[0045] 本发明的有益效果:
[0046] 本发明将IMM算法与POMPD算法相结合,解决了传统方法预测结果不准确,决策结果不满足安全性要求的问题。在决策过程中采用POMDP算法,考虑了周围车辆未来运动状态对智能车的影响,在预测过程中,通过改进IMM算法中的模型转移矩阵,考虑了智能车对周围车辆的影响,使预测更加符合实际情况,预测结果更加准确,从而使决策部分的决策结果更加安全可行。

附图说明

[0047] 图1为本发明预测决策融合方法整体框图。

具体实施方式

[0048] 为了便于本领域技术人员的理解,下面结合实施例与附图对本发明作进一步的说明,实施方式提及的内容并非对本发明的限定。
[0049] 参照图1所示,本发明的一种考虑车辆双向交互的智能车预测决策融合方法,包括步骤如下:
[0050] 步骤1:建立POMDP(部分可观测马尔可夫决策)模型:{S,O,A,P,R},其中,S为车辆状态集合,O为观察集合,A为动作集合,P为状态转移函数,R为回报函数;其中,[0051] 11)车辆状态集合S包括智能车状态以及周围车辆状态,具体为:
[0052] S={sego,s1,s2,…,sn}
[0053] 式中,sego为智能车状态,si为第i辆周围车辆状态,i=1,2,…,n,n为周围车辆数目;
[0054] sego,si具体为:
[0055] sego={xego,yego,θego,vego},
[0056] 式中,xego为智能车x方向的坐标,yego为智能车y方向坐标,θego为智能车横摆角,vego为智能车质心速度,xi为第i辆周围车辆x方向的坐标,yi为第i辆周围车辆y方向的坐标,vi为第i辆周围车辆x方向的速度, 为第i辆周围车辆隐藏状态车辆加速度;
[0057] 12)观察集合O具体为:
[0058] O={Δx1,Δv1,Δx2,Δv2,…,Δxi,Δvi}
[0059] 式中,Δxi为智能车与第i辆周围车辆x方向的相对距离,Δvi为智能车与第i辆周围车辆x方向的相对速度;
[0060] Δxi,Δvi具体为:
[0061] Δxi=xego-xi-L,Δvi=vegocosθego-vi
[0062] 式中,L为车辆长度;
[0063] 13)动作集合A具体为:
[0064] A={LT,ST,RT};
[0065] 式中,LT表示车辆横摆角向左转一个角度,ST表示横摆角不变,RT表示横摆角向右转一个角度;将驾驶动作参数化为:
[0066] LT=1°,ST=0,RT=-1°
[0067] 14)状态转移函数P具体为:
[0068]
[0069] 式中,am为IMM算法中周围车辆第m个加速模型,m为加速模型的个数;
[0070] 15)回报函数R具体为:
[0071]
[0072] 式中,c0为车辆宽度的一半,Sr为道路条件参数。
[0073] 步骤2:通过车载感知系统获取自车及周围车辆的初始状态,得到初始状态s0和初始观察o0。
[0074] 步骤3:将第k步观察ok输入IMM(交互多模型)算法更新得到模型转移矩阵Tk,k=0,1,2,…,N;预测周围车辆的纵向运动,计算得到第k步的置信状态;
[0075] 31)周围车辆加速模型为:
[0076]
[0077] 32)第i辆周围车辆在k步模型转移矩阵 为3阶矩阵,具体为:
[0078]
[0079]
[0080] 33)通过k-1步的模型预测概率 和加速度 更新得到k步的模型预测概率即得到k步的置信状态
[0081] 步骤4:通过POMDP算法计算出最大状态-动作值函数Q(sk,ak)max,并取相应的动作作为智能车第k步的动作Ak=ak。
[0082] 步骤5:将k步的状态sk和动作Ak代入状态转移函数P计算得到k+1步的状态sk+1和观察ok+1;
[0083] 状态值函数Q(sk,ak)具体为:
[0084]
[0085] 式中,γ为折扣因子,R为回报值,sk为k步的状态,ak为k步的动作。
[0086] 步骤6:判断迭代次数是否达到最大迭代次数N;若达到最大迭代次数,则结束;若未达到迭代次数,则k=k+1并返回步骤3。
[0087] 本发明具体应用途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进,这些改进也应视为本发明的保护范围。