基于GMM-HMM的高速公路他车超车换道意图识别方法转让专利

申请号 : CN202210866316.3

文献号 : CN115171389B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 曲婷刘普俊杜少毅

申请人 : 吉林大学

摘要 :

基于GMM‑HMM的高速公路他车超车换道意图识别方法,涉及智能驾驶或辅助驾驶系统领域,解决现有存在观测序列的长度并不可控,各组观测序列的长度参差不齐以及超车换道或直行过程末段的数据一般与过程前段的数据差距较大且数据不可逆等问题,本发明提取大量他车超车后换道及超车后不换道过程数据,对数据进行预处理;运用K‑means聚类算法分别对换道和直行过程数据进行聚类,确定GMM‑HMM隐状态数和高斯分量个数及训练初值;对换道和直行的单次行驶过程数据进行GMM‑HMM参数训练后进行参数合并,求得最终参数值;计算测试集数据在直行和换道模型下的观测序列概率,较大者即为识别结果。本发明提高对结构化道路上他车驾驶意图识别的准确性,满足智能驾驶的决策需求。

权利要求 :

1.基于GMM‑HMM的高速公路他车超车换道意图识别方法,其特征是:该方法由以下步骤实现:步骤一、提取超车后换道及超车后直行的样本数据,并选择特征参数;所述特征参数包括超车车辆横向速度vy,超车车辆右侧车身离车道线距离Δy以及两车的车速差Δvx;将所述样本数据划分为观测数据和测试数据;

步骤二、基于K‑means算法分别对步骤一特征参数对应的超车后换道数据和超车后直行数据进行聚类以确定隐状态个数;再根据聚类结果对各隐状态对应数据进行聚类,聚类个数由肘部法则确定,取较大者为高斯分量个数;

步骤三、对GMM‑HMM模型参数进行训练;

先对各组长度不等观测数据进行一次GMM‑HMM参数训练迭代,将本次迭代结果进行融合作为本次迭代最终结果;重复该过程直至结果收敛;

采用Baum‑Welch算法对各个参数进行优化迭代;

分别计算各组长度不等观测序列的前向后向概率αt(i)、βt(i),和放大系数由 得多组观测序列状态转移矩阵;

式中,K为序列组数,前向概率αt(i)=p(o1,o2,...,ot,qt=si|λ),后向概率βt(i)=p(ot+1,ot+2,...,oT|qt=si,λ),λ为模型参数,O={o1,o2,...,oT}为观测序列,长度为T的状态序列Q={q1,q2,...,qT},qt∈S,t=1,2,...,T;S为隐状态集合,S={s1,s2,...,sN};

其他GMM‑HMM参数同理,重复该过程直至收敛;

步骤四、对测试集数据进行测试;

分别计算测试集观测序列在超车换道和超车直行模型中后验概率,取后验概率值大的作为辨识结果。

2.根据权利要求1所述的基于GMM‑HMM的高速公路他车超车换道意图识别方法,其特征在于:步骤二中,获取GMM‑HMM训练初值,所述训练初值包括隐状态个数、各隐状态包含的高斯分量个数、各高斯分量的权重、高斯均值矩阵和协方差矩阵。

说明书 :

基于GMM‑HMM的高速公路他车超车换道意图识别方法

技术领域

[0001] 本发明涉及智能驾驶或辅助驾驶系统领域,具体涉及一种基于高斯混合模型(Gaussian Mixture Model,GMM)和隐马尔可夫模型(Hidden Markov Model,HMM)的高速公路他车超车换道意图识别方法。

背景技术

[0002] 现阶段自动驾驶技术在高速公路上的自动化水平始终未能突破三级,依据美国汽车工程师协会对驾驶自动化的分类,三级与四级的主要区别为当发生紧急情况时,驾驶员可以无需响应动态驾驶任务回退(Dynamic Driving Task Fallback,DDT FALLBACK),即无需接管方向盘,系统可自行实现最低风险条件。而要在高速公路工况下实现该要求,准确识别周围车辆的驾驶意图,满足驾驶决策系统的前置输入是必不可少的。
[0003] 我国《道路交通安全法实施条例》规定,高速公路同方向有两条车道的,左侧车道最低车速为每小时100公里;同方向有三条以上车道的,左侧车道最低车速为每小时110公里。当无人车位于左侧第二条车道时,若左侧车道有车辆正在进行超车,及时且准确地识别出该车辆是否会进行换道显得尤为重要,如若不能提前做出减速或其他安全避障行为,换道车每小时百公里的速度将导致重大交通事故。
[0004] 目前已存在较多利用HMM辨识他车换道意图的方法,例如借鉴语音识别方法,训练多个HMM分类器,通过计算各个分类器观测序列的后验概率判断驾驶意图。该方法的一个缺点是,在训练HMM参数时,训练数据需为等长的观测序列,或者将多组观测序列合并为一组再进行训练。然而超车换道或直行过程持续的时间具有随机性,观测序列的长度并不可控,各组观测序列的长度参差不齐;同时,由于且不可逆,超车换道或直行过程并不严格遵循一般HMM的规律,更偏向于左‑右隐马尔可夫模型(状态转移具有不可逆性),因此各组数据并不能简单合成一组观测向量进行HMM参数训练。
[0005] HMM经常和GMM结合使用,利用GMM良好的函数特性拟合HMM的输出概率矩阵。在GMM‑HMM训练中,大多将协方差矩阵设置为对角阵,一是为了减少训练参数个数,加速训练过程;二是确保协方差矩阵为非奇异阵;又或是多个高斯模型共用一个完全协方差矩阵,提高迭代速度。然而现代计算机发展迅速,足以处理该问题下所涉及的数据量,并不需要对协方差矩阵进行约束。

发明内容

[0006] 本发明为解决现有采用HMM辨识他车换道意图方法,存在观测序列的长度并不可控,各组观测序列的长度参差不齐以及超车换道或直行过程末段的数据一般与过程前段的数据差距较大且数据不可逆等问题;提供一种基于GMM‑HMM的高速公路他车换道意图识别方法,提高对高速工况下他车驾驶意图识别的准确性。
[0007] 基于GMM‑HMM的高速公路他车换道意图识别方法,包括以下步骤:
[0008] 步骤一、提取超车后换道及超车后直行的样本数据,并选择特征参数;所述特征参数包括超车车辆横向速度vy,超车车辆右侧车身离车道线距离Δy以及两车的车速差Δvx;将所述样本数据划分为观测数据和测试数据;
[0009] 步骤二、基于K‑means算法对步骤一特征参数对应的超车后换道数据和超车后直行数据进行聚类以确定隐状态个数;再根据聚类结果对各隐状态对应数据进行聚类以确定对应高斯分个量数;
[0010] 步骤三、对GMM‑HMM模型参数进行训练;
[0011] 先对各组观测数据进行一次GMM‑HMM参数训练迭代,将本次迭代结果进行融合作为本次迭代最终结果;重复该过程直至结果收敛;
[0012] 步骤四、对测试集数据进行测试;
[0013] 分别计算测试集观测序列在超车换道和超车直行模型中后验概率,取后验概率值大的作为辨识结果。
[0014] 本发明的有益效果:
[0015] (1)本发明充分考虑换道过程数据特征,选用多组长度不等观测数据并行求解GMM‑HMM模型,更贴近实际情形。
[0016] (2)本发明充分考虑所选特征参数的物理含义,选用能反映各参数间相关性的完全协方差矩阵,虽然参数较多,但结合并行求解算法仍有较高求解速度。

附图说明

[0017] 图1为样本数据箱形图。
[0018] 图2为聚类准则函数随隐状态数变化图。
[0019] 图3为聚类准则函数随高斯分量数变化图。
[0020] 图4为测试集辨识结果图。
[0021] 图5为一次超车换道识别结果图。

具体实施方式

[0022] 结合图1至图5说明本实施方式,基于GMM‑HMM的高速公路他车换道意图识别方法,针对高速公路上,最左侧车道车辆超车后的驾驶意图识别,包括继续直行和换道两种驾驶意图。使用Frenet坐标系(车道线方向和垂直车道线方向),相对大地静止。该方法由以下步骤实现:
[0023] 步骤一、从high‑D数据集中提取大量超车后换道及超车后直行的数据,并选择所需特征参数;
[0024] 选择使用无人机在高速公路上记录的数据集——high‑D。数据特征提取包括以下三项:超车车辆横向速度vy,超车车辆右侧车身离车道线距离Δy(换道前为正,换道后为负),以及两车的车速差Δvx。对直行阶段的数据提取需确保自车与前车的车距足够大,允许超车车辆进行换道行为。提取的样本数据统计如附图1所示。
[0025] 步骤二、运用K‑means聚类算法对数据进行聚类。先进行隐状态数据聚类,再进行高斯分量数据聚类,获取GMM‑HMM训练初值,包括隐状态数、各隐状态包含的高斯分量个数、各高斯分量的权重、均值矩阵和协方差矩阵;
[0026] 基于K‑means算法聚类;分别对超车换道和超车直行数据进行聚类以确定隐状态数;再依据聚类结果对各隐状态对应数据进行聚类以确定对应高斯分量数。聚类个数由“肘部法则”确定。本例中隐状态聚类结果k隐=3;对各隐状态对应数据聚类,并采用“肘部法则”确定高斯分量个数时发现各隐状态“肘部”不一致,则取最大值,本例中k高=4。
[0027] 步骤三、开始进行GMM‑HMM参数训练。先对各组观测数据进行一次GMM‑HMM参数训练迭代,将本轮迭代结果进行融合作为本次迭代最终结果;重复该过程直至结果收敛;
[0028] 步骤三一、GMM‑HMM参数介绍;GMM‑HMM模型参数可用一个五元组表示:λ={π,A,c,μ,Σ},其中π为初始状态概率向量;A为状态转移矩阵;c为高斯分量权重系数;μ为高斯均值矩阵;Σ为高斯协方差矩阵。与HMM相比,输出概率矩阵B由连续概率密度函数GMM拟合。下面给出GMM‑HMM参数的符号化表达式:
[0029] 隐状态集合S={s1,s2,...,sN},这里超车换道和超车直行模型都为N=3(K‑means第一次聚类结果);
[0030] 长度为T的状态序列Q={q1,q2,...,qT},qt∈S,t=1,2,...,T;
[0031] 对应的观测序列O={o1,o2,...,oT},ot∈Rn为列向量,在本例中,ot=[vy,Δy,ΔTvx];
[0032] 初始状态概率向量 πi=P(q1=si);
[0033] 状态转移概率矩阵A=[aij]N×N,aij=P(qt+1=sj|qt=si);
[0034] 输出概率密度函数 其中M由K‑means聚类算法确定,这里超车换道模型对应M=4,超车直行模型对应M=3(K‑means第二次聚类结果);o∈O;cjm为在状态j下,第m个高斯分量的权重系数,满足:
[0035]
[0036] cjm≥0,1≤j≤M,1≤m≤M
[0037] μjm为在状态j下,第m个高斯分量的均值矩阵,μjm∈Rn为列向量;Σjm为在状态j下,n×n第m个高斯分量的协方差矩阵,Σjm∈R ; 为状态j下第m个n维高斯概率密度函数:
[0038]
[0039] 输出概率密度函数满足:
[0040]
[0041] 步骤三二、设置初值;
[0042] 在GMM‑HMM参数训练过程中,π、A和c的初值对最终的训练结果影响不大,可以按均值设置,即:
[0043]
[0044]
[0045]
[0046] 高斯均值矩阵[μjm]N×M和协方差矩阵[Σjm]N×M的初值则对训练结果影响较大,初值设置不合理不仅影响结果的准确度,甚至可能导致迭代过程无法收敛。采用K‑means算法寻求合理初值,将步骤3聚类结果(各个高斯分量数据)的均值和协方差作为迭代初值可以有效提高训练成功率。
[0047] 步骤三三、GMM‑HMM模型参数训练;
[0048] GMM‑HMM的参数训练也称为参数学习,即已知观测序列O={o1,o2,...,oT},学习模型参数λ={π,A,c,μ,Σ},使得在该参数下,观测序列概率p(O|λ)最大。采用Baum‑Welch算法(EM算法)对各个参数进行优化迭代,引入前向概率αt(i)=p(o1,o2,...,ot,qt=si|λ),以及后向概率βt(i)=p(ot+1,ot+2,...,oT|qt=si,λ),具体公式如下:
[0049] α1(i)=πibi(o1),1≤i≤N  (4)
[0050]
[0051] βT(i)=1,1≤i≤N  (6)
[0052]
[0053] 由前向概率定义可得:
[0054]
[0055] 1)状态转移矩阵的迭代更新公式:
[0056]
[0057] 其中ξt(i,j)=p(qt=si,qt+1=sj|O,λ),γt(i)=p(qt=si|O,λ),具体如下:
[0058]
[0059]
[0060] 2)初始状态概率向量的迭代更新公式:
[0061] πi=p(q1=si|O,λ)=γ1(i),1≤i≤N  (12)
[0062] 3)高斯混合模型各个参数的迭代更新公式:
[0063]
[0064]
[0065]
[0066] 其中γt(j,m)=p(qt=sj,component=m|O,λ),p(component=m)即第j个观测值来自第k个高斯分量的概率。具体如下:
[0067]
[0068] 4)实际训练中的缩放问题;
[0069] 由前向后向概率定义可知,随着时间步的增大,迭代的概率值将呈指数级减小,尤其是当选用GMM做输出概率分布函数时,更为明显。为了防止迭代计算超过计算机精度下限,通常会将前向后向概率进行放大,具体如下:
[0070] 首先,前向概率的放大;
[0071] 引进缩放系数ct:
[0072]
[0073] 对时间步t,首先计算
[0074]
[0075] 得出放大后的αt(i),即归一化:
[0076]
[0077] 递推可得:
[0078]
[0079] 其中cτ与ct定义相同。
[0080] 结合式可得:
[0081]
[0082] 然后,后向概率的放大;
[0083] 由于后向概率与前向概率数量级接近,因此可直接使用前向概率的缩放系数:
[0084]
[0085] 最后,前向后向概率放大后的GMM‑HMM参数迭代公式
[0086] 由于 所以
[0087]
[0088] 将放大后前向后向概率带入可得:
[0089]
[0090] 其中
[0091]
[0092]
[0093] 其中,
[0094] 式成立的前提为求和的各项放大系数与时间t无关,由
[0095]
[0096] 可知,各项放大系数与时间步t无关,式成立。
[0097] 步骤四、考虑多个观测序列的迭代更新公式;
[0098] 由单序列aij的迭代更新公式 可知,Baum‑Welch算法是计算各个时刻由状态si转移到sj的概率/频率,并在整个时间长度内求和,再和整个时间段内处于si的频率作比。因此当数据为多组观测数据时,只需将各序列对应的频率相加即可,即:
[0099]
[0100] 其中K为序列组数。
[0101] 结合式:
[0102]
[0103] 于是考虑放大系数的多组观测序列迭代公式为:
[0104]
[0105] 其余GMM‑HMM参数同理。
[0106] 步骤六、对测试集数据进行测试。分别计算测试集观测序列在超车换道和超车直行模型中后验概率,较大者即为辨识结果。由下式得观测序列后验概率为:
[0107]
[0108] 分别计算测试集数据在超车换道λ换道和超车直行λ直行模型下的观测序列后验概率,较大者即为意图识别结果。测试集准确率为94.93%,如附图4所示。单次超车换道识别过程如附图5所示。
[0109] 以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0110] 以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。