基于态势评估技术的移动机器人行为选择方法转让专利

申请号 : CN201711144615.1

文献号 : CN107932508B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 柴慧敏赵昀瑶方敏

申请人 : 西安电子科技大学

摘要 :

本发明公开了一种基于态势评估技术的移动机器人行为选择方法,其实现步骤为:(1)建立移动机器人坐标系;(2)获取目标数据;(3)提取环境态势要素;(4)建立贝叶斯网络模型;(5)进行贝叶斯网络模型的推理;(6)输出结果。本发明利用态势评估技术提取移动机器人的环境态势要素,能够使移动机器人对其周围环境获得一定的认知,自主选择下一步的行为。本发明在建立贝叶斯网络模型时表现的更为明显,使一些移动机器人行为选择的经验知识融入到贝叶斯网络中,使得移动机器人行为的选择更加准确。

权利要求 :

1.一种基于态势评估技术的移动机器人行为选择方法,其特征在于,包括如下步骤:(1)建立移动机器人坐标系:

以移动机器人的中心为坐标原点,移动机器人的正前方向为X轴正向,移动机器人的正后方向为X轴负向,移动机器人的正右方向为Y轴正向,移动机器人的正左方向为Y轴负向,移动机器人的正下方向为Z轴正向,移动机器人的正上方向为Z轴负向,建立一个三维移动机器人坐标系;

(2)获取目标数据:

(2a)采用平面标定法,获取移动机器人配置的单目相机的焦距、相机主点坐标两个内部参数;

(2b)分别利用移动机器人配置的二维激光测距数据仪和单目相机,测量和识别同一障碍对象的不同角度的测距数据和图像数据,通过该障碍对象下的测距数据和图像数据之间的几何关系,获取移动机器人的二维激光测距坐标系与单目相机坐标系之间的旋转矩阵、平移向量两个转换参数;

(2c)将二维激光测距数据仪测量的二维激光测距坐标系下的测距数据,转换为单目相机坐标系下的图像数据;

(2d)将转换后的数据映射到对应的图像数据,并对映射前后的两种数据进行融合,得到测距数据与图像数据的融合后的A、D两个目标数据,其中,A表示单目相机识别的目标与机器人坐标系Y轴正向的夹角,单位为度,D表示单目相机识别的目标与移动机器人中心的距离,单位为厘米;

(3)获取障碍物:

将满足取值范围的单目相机识别的目标,添加到与取值范围对应的移动机器人的环境态势要素集合中,得到正右方障碍物、偏右方障碍物、正前方障碍物、偏左方障碍物和正左方障碍物;

(4)建立贝叶斯网络模型:

(4a)提取直线行走、避障和逃离U型陷阱三种子行为的判别准则中的关于障碍物的下述描述:正前方、偏右方、偏左方、正左方、正右方障碍物,障碍物与移动机器人行进方向平行,正前方障碍物,偏左方障碍物,偏右方障碍物,正左方障碍物,正右方障碍物作为征兆节点;

(4b)将移动机器人的直线行走、避障和逃离U型陷阱独立的三种子行为,作为结果节点;

(4c)利用诊断式贝叶斯网络建模方式,将征兆节点作为结果节点的父节点,组成贝叶斯网络模型结构;

(4d)将贝叶斯网络模型中所有征兆节点和结果节点均设置为二值离散节点;将征兆节点存在障碍物状态下的参数值设置为0.5,不存在障碍物状态下的参数值设置为0.5;将结果节点在满足判别准则条件下的参数值设置为1,不满足判别准则条件下的参数值设置为

0;

(5)进行贝叶斯网络模型的推理:

(5a)将征兆节点作为证据节点,将证据节点在不同状态下的证据值,分别输入到贝叶斯网络模型中;

(5b)采用贝叶斯网络精确推理算法,对输入证据值后的贝叶斯网络模型进行推理,计算各结果节点的后验概率值;

(6)确定移动机器人的子行为:

在满足判别准则条件下的后验概率值中选择一个最大的结果节点,将该结果节点所表示的子行为,作为移动机器人选择下一步移动时的子行为类型。

2.根据权利要求1所述的基于态势评估技术的移动机器人行为选择方法,其特征在于,步骤(2a)中所述的平面标定法是指,从不同角度对放置在移动机器人配置的单目相机前的棋盘标定板拍摄多幅图像,检测出每张图像中包含线段的终点、线段的转折点的特征点,利用拍摄多幅图像中的特征点与棋盘标定板间的位置对应关系,分别计算移动机器人配置的单目相机的焦距、相机主点坐标两个内部参数。

3.根据权利要求1所述的基于态势评估技术的移动机器人行为选择方法,其特征在于,步骤(3)中所述的将满足取值范围的单目相机识别的目标,添加到与取值范围对应的移动机器人的环境态势要素集合中,作为对应的障碍物是指:A.将满足10°≤A≤20°且0cm≤D≤160cm的单目相机识别的目标,添加到移动机器人正右方的环境态势要素集合中,得到正右方障碍物;

B.将满足20°<A≤60°且0cm≤D≤226cm的单目相机识别的目标,添加到移动机器人偏右方的环境态势要素集合中,得到偏右方障碍物;

C.将满足60°<A<120°且0cm≤D≤160cm的单目相机识别的目标,添加到移动机器人正前方的环境态势要素集合中,得到正前方障碍物;

D.将满足120°≤A<160°且0cm≤D≤226cm的单目相机识别的目标,添加到移动机器人偏左方的环境态势要素集合中,得到偏左方障碍物;

E.将满足160°≤A≤170°且0cm≤D≤160cm的单目相机识别的目标,添加到移动机器人正左方的环境态势要素集合中,得到正左方障碍物;

其中,A表示单目相机识别的目标与机器人坐标系Y轴正向的夹角,单位为度,D表示单目相机识别的目标与移动机器人中心的距离,单位为厘米。

4.根据权利要求1所述的基于态势评估技术的移动机器人行为选择方法,其特征在于,步骤(4a)中所述的直线行走、避障和逃离U型陷阱三种子行为是指,直线行走子行为是移动机器人沿着当前行进方向直线移动的行为;避障子行为是移动机器人绕开其正前方、偏右方、偏左方、正左方、正右方的障碍物的行为;逃离U型陷阱子行为是移动机器人已进入U型陷阱中,旋转1800离开的行为;其中,移动机器人已进入U型陷阱中,是指移动机器人当前位置的正前方、正左方、正右方均有障碍物存在。

5.根据权利要求1所述的基于态势评估技术的移动机器人行为选择方法,其特征在于,步骤(4a)中所述的直线行走、避障和逃离U型陷阱三种子行为的判别准则是指:A.若移动机器人的正前方、偏右方、偏左方、正左方、正右方没有障碍物,则移动机器人选择直线行走;

B.若移动机器人的偏右方、偏左方、正左方、正右方有障碍物,但与移动机器人行进方向平行,则移动机器人选择直线行走;

C.若移动机器人的正前方有障碍物,则移动机器人选择避障;

D.若移动机器人的偏左方有障碍物,则移动机器人选择避障;

E.若移动机器人的偏右方有障碍物,则移动机器人选择避障;

F.若移动机器人的正前方、偏左方均有障碍物,则移动机器人选择避障;

G.若移动机器人的正前方、偏右方均有障碍物,则移动机器人选择避障;

H.若移动机器人的偏右方、偏左方均有障碍物,则移动机器人选择避障;

I.若移动机器人的正前方、偏左方、偏右方均有障碍物,则移动机器人选择避障;

J.若移动机器人的正前方、正左方、正右方均有障碍物,则移动机器人选择逃离U型陷阱。

6.根据权利要求1所述的基于态势评估技术的移动机器人行为选择方法,其特征在于,步骤(4a)中所述的征兆节点包括,正前方、偏右方、偏左方、正左方、正右方的障碍物节点,与移动机器人行进方向平行的障碍物节点,正前方的障碍物节点,偏左方的障碍物节点,偏右方的障碍物节点,正左方的障碍物节点,正右方的障碍物节点。

7.根据权利要求1所述的基于态势评估技术的移动机器人行为选择方法,其特征在于,步骤(4b)中所述的结果节点包括,直线行走的节点,避障的节点,逃离U型陷阱的节点。

8.根据权利要求1所述的基于态势评估技术的移动机器人行为选择方法,其特征在于,步骤(5a)中所述证据节点在不同状态下的证据值是指:A.将正右方、正左方、正前方、偏右方、偏左方的环境态势要素集合,均为空时的正前方、偏右方、偏左方、正左方、正右方的障碍物证据节点,在不存在障碍物状态下的证据值设置为1,其余情况下的正前方、偏右方、偏左方、正左方、正右方的障碍物证据节点,在存在障碍物状态下的证据值设置为1;

B.将正右方、正左方、正前方、偏右方、偏左方的环境态势要素集合,均为空时的与机器人行进方向平行的障碍物证据节点,在存在障碍物状态下的证据值设置为1,其余情况下的与机器人行进方向平行的障碍物证据节点,在不存在障碍物状态下的证据值设置为1;

C.将正前方的环境态势要素集合不为空时的正前方的障碍物证据节点,在存在障碍物状态下的证据值设置为1,其余情况下的正前方的障碍物证据节点,在不存在障碍物状态下的证据值设置为1;

D.将偏左方的环境态势要素集合不为空时的偏左方的障碍物证据节点,在存在障碍物状态下的证据值设置为1,其余情况下的偏左方的障碍物证据节点,在不存在障碍物状态下的证据值设置为1;

E.将偏右方的环境态势要素集合不为空时的偏右方的障碍物证据节点,在存在障碍物状态下的证据值设置为1,其余情况下的偏右方的障碍物证据节点,在不存在障碍物状态下的证据值设置为1;

F.将正左方的环境态势要素集合不为空时的正左方的障碍物证据节点,在存在障碍物状态下的证据值设置为1,其余情况下的正左方的障碍物证据节点,在不存在障碍物状态下的证据值设置为1;

G.将正右方的环境态势要素集合不为空时的正右方的障碍物证据节点,在存在障碍物状态下的证据值设置为1,其余情况下的正右方的障碍物证据节点,在不存在障碍物状态下的证据值设置为1;

H.将正右方或正左方的环境态势要素集合不为空,正前方、偏右方、偏左方的环境态势要素集合,均为空时的与机器人行进方向平行的障碍物证据节点,在存在障碍物状态下的证据值设置为1,其余情况下的与机器人行进方向平行的障碍物证据节点,在不存在障碍物状态下的证据值为1。

9.根据权利要求1所述的基于态势评估技术的移动机器人行为选择方法,其特征在于,步骤(5b)中所述的贝叶斯网络精确推理算法是指,根据设置的征兆节点的参数值、结果节点的参数值和证据值,通过概率推理,计算出结果节点的后验概率值。

说明书 :

基于态势评估技术的移动机器人行为选择方法

技术领域

[0001] 本发明属于计算机技术领域,更进一步涉及机器人技术领域中的一种基于态势评估技术的移动机器人行为选择方法。本发明可用于实际应用中移动机器人在未知环境局部路径规划过程中的行为选择。

背景技术

[0002] 以前的移动机器人行为选择方法都是基于一些对应场景苛刻的条件下的,例如单一的激活条件和采用特定的神经网络。但这在现实世界中是很难满足的。目前,实现移动机器人局部路径规划过程中的行为选择方法主要是:定义移动机器人的基本行为单元,并给出不同的基本行为单元之间的切换条件,在有移动机器人传感器获得的局部环境信息符合某种切换条件时,就可以进行行为的选择。现实世界的场景中,几乎很难准确给出与切换条件对应的所有预定义行为,因为行为的选择与具体的问题高度依赖,且移动机器人行为选择的切换条件具有多样性。而态势评估技术作为信息融合过程中的关键步骤,是当今科学研究中的一个重要课题,它可以紧密结合规则知识,改进多级网络模型,降低了网络模型的复杂度,提高了规则匹配效率。该优点在进行贝叶斯网络推理时表现的更为明显,使一些移动机器人行为选择的经验知识融入到贝叶斯网络精确推理算法中。
[0003] 张琦在其发表的论文“移动机器人的路径规划与定位技术研究”(哈尔滨工业大学,博士学位论文,2014.6)中提出了采用激活条件来选择移动机器人行为的方法。该方法建立了移动机器人行为选择的若干个激活条件,依据由移动机器人传感器获得的障碍物目标信息与激活条件进行匹配判断,在满足了某个行为的激活条件后,移动机器人将进行行为的切换,即完成行为选择。该方法存在的不足之处是:所给的行为激活条件较为单一,智能化水平较低,很难实现移动机器人在未知的复杂环境中具有智能选择的功能。
[0004] 钟云胜等人在其发表的论文“基于MLP和SPSO的机器人行为选择与运动控制方法”(计算机应用研究,2017,35(8))中提出了一种基于多层感知前馈神经网络和简化粒子群算法的选择方法。该方法根据机器人配置的图像和红外传感器获得目标位置和障碍物位置,通过MLP前馈神经网络从预定义行为中选择所需执行的行为。该方法采用了一种简化粒子群算法实时地计算神经网络的权重参数,具有实时的特点,但是,该方法存在的不足之处是:很难将一些机器人行为选择的经验知识融入到MLP前馈神经网络中。

发明内容

[0005] 本发明的目的在于克服上述已有技术的不足,提出一种基于态势评估技术的移动机器人行为选择方法。本发明通过采用态势评估技术解决移动机器人行为的选择问题。将态势评估技术用于机器人局部路径规划。该技术可以紧密结合行为选择的规则知识,提取移动机器人正前方、偏右方、偏左方、正左方、正右方的环境态势要素,以获得多个行为选择的激活条件。
[0006] 为实现上述目的,本发明具体实现步骤包括如下:
[0007] (1)建立移动机器人坐标系:
[0008] 以移动机器人的中心为坐标原点,移动机器人的正前方向为X轴正向,移动机器人的正后方向为X轴负向,移动机器人的正右方向为Y轴正向,移动机器人的正左方向为Y轴负向,移动机器人的正下方向为Z轴正向,移动机器人的正上方向为Z轴负向,建立一个三维移动机器人坐标系;
[0009] (2)获取目标数据:
[0010] (2a)采用平面标定法,获取移动机器人配置的单目相机的焦距、相机主点坐标两个内部参数;
[0011] (2b)分别利用移动机器人配置的二维激光测距数据仪和单目相机,测量和识别同一障碍对象的不同角度的测距数据和图像数据,通过该障碍对象下的测距数据和图像数据之间的几何关系,获取移动机器人的二维激光测距坐标系与单目相机坐标系之间的旋转矩阵、平移向量两个转换参数;
[0012] (2c)将二维激光测距数据仪测量的二维激光测距坐标系下的测距数据,转换为单目相机坐标系下的图像数据;
[0013] (2d)将转换后的数据映射到对应的图像数据,并对映射前后的两种数据进行融合,得到测距数据与图像数据的融合后的A、D两个目标数据,其中,A表示单目相机识别的目标与机器人坐标系Y轴正向的夹角,单位为度,D表示单目相机识别的目标与移动机器人中心的距离,单位为厘米;
[0014] (3)获取障碍物:
[0015] 将满足取值范围的单目相机识别的目标,添加到与取值范围对应的移动机器人的环境态势要素集合中,得到正右方障碍物、偏右方障碍物、正前方障碍物、偏左方障碍物和正左方障碍物;
[0016] (4)建立贝叶斯网络模型:
[0017] (4a)提取直线行走、避障和逃离U型陷阱三种子行为的判别准则中的关于障碍物的下述描述:正前方、偏右方、偏左方、正左方、正右方障碍物,障碍物与移动机器人行进方向平行,正前方障碍物,偏左方障碍物,偏右方障碍物,正左方障碍物,正右方障碍物作为征兆节点;
[0018] (4b)将移动机器人的直线行走、避障和逃离U型陷阱独立的三种子行为,作为结果节点;
[0019] (4c)利用诊断式贝叶斯网络建模方式,将征兆节点作为结果节点的父节点,组成贝叶斯网络模型结构;
[0020] (4d)将贝叶斯网络模型中所有征兆节点和结果节点均设置为二值离散节点;将征兆节点存在障碍物状态下的参数值设置为0.5,不存在障碍物状态下的参数值设置为0.5;将结果节点在满足判别准则条件下的参数值设置为1,不满足判别准则条件下的参数值设置为0;
[0021] (5)进行贝叶斯网络模型的推理:
[0022] (5a)将征兆节点作为证据节点,将证据节点在不同状态下的证据值,分别输入到贝叶斯网络模型中;
[0023] (5b)采用贝叶斯网络精确推理算法,对输入证据值后的贝叶斯网络模型进行推理,计算各结果节点的后验概率值;
[0024] (6)确定移动机器人的子行为:
[0025] 在满足判别准则条件下的后验概率值中选择一个最大的结果节点,将该结果节点所表示的子行为,作为移动机器人选择下一步移动时的子行为类型。
[0026] 本发明与现有技术相比具有以下优点:
[0027] 第一,本发明通过态势评估技术提取移动机器人正前方、偏右方、偏左方、正左方、正右方的环境态势要素,获得多个行为选择的激活条件,利用态势评估技术提取环境态势要素,克服了现有技术中激活条件过于单一,智能化水平较低的不足,使得本发明在未知的复杂环境中的激活条件更全面,提高了移动机器人行为选择的智能性。
[0028] 第二,本发明利用态势评估技术构造移动机器人行为选择的贝叶斯网络模型,这个模型可以紧密结合规则知识,克服了现有技术中很难将一些机器人行为选择的经验知识融入到复杂网络中的不足,使得本发明降低了模型的复杂度,提高了规则匹配效率。

附图说明

[0029] 图1为本发明的流程图;
[0030] 图2为本发明贝叶斯网络的结构图。

具体实施方式

[0031] 下面结合附图对本发明的具体实施方式作进一步详细的描述。
[0032] 结合附图1对本发明的具体步骤描述如下:
[0033] 步骤1,建立移动机器人坐标系。
[0034] 以移动机器人的几何中心为坐标原点,移动机器人的正前方向为X轴正向,移动机器人的正后方向为X轴负向,移动机器人的正右方向为Y轴正向,移动机器人的正左方向为Y轴负向,移动机器人的正下方向为Z轴正向,移动机器人的正上方向为Z轴负向,建立一个三维移动机器人坐标系。
[0035] 步骤2,获取目标数据。
[0036] 采用平面标定法,从不同角度对放置在移动机器人配置的单目相机前的棋盘标定板拍摄多幅图像,检测出每张图像中包含线段的终点、线段的转折点的特征点,利用拍摄多幅图像中的特征点与棋盘标定板间的位置对应关系,分别计算移动机器人配置的单目相机的焦距、相机主点坐标两个内部参数。
[0037] 分别利用移动机器人配置的二维激光测距数据仪和单目相机,测量和识别同一障碍对象的不同角度的测距数据和图像数据,通过该障碍对象下的测距数据和图像数据之间的几何关系,获取移动机器人的二维激光测距坐标系与单目相机坐标系之间的旋转矩阵、平移向量两个转换参数。
[0038] 根据旋转矩阵、平移向量两个转换参数,将二维激光测距数据仪测量的二维激光测距坐标系下的测距数据,转换为单目相机坐标系下的图像数据。
[0039] 将转换后的数据映射到对应的图像数据,并对映射前后的两种数据进行融合,得到测距数据与图像数据的融合后的A、D两个目标数据,其中,A表示单目相机识别的图像目标与机器人坐标系Y轴正向的夹角,即单目相机识别的图像目标到移动机器人坐标原点的向量与移动机器人坐标系Y轴正向的夹角,单位为度,取值范围为[0°,180°],D表示单目相机识别的图像目标与移动机器人几何中心的距离,单位为厘米。
[0040] 步骤3,获取障碍物。
[0041] 将满足取值范围的单目相机识别的目标,添加到与取值范围对应的移动机器人的环境态势要素集合中,得到正右方障碍物、偏右方障碍物、正前方障碍物、偏左方障碍物和正左方障碍物,具体操作方式如下:
[0042] a.将满足10°≤A≤20°且0cm≤D≤160cm的单目相机识别的目标,添加到移动机器人正右方的环境态势要素集合中,得到正右方障碍物。
[0043] b.将满足20°<A≤60°且0cm≤D≤226cm的单目相机识别的目标,添加到移动机器人偏右方的环境态势要素集合中,得到偏右方障碍物。
[0044] c.将满足60°<A<120°且0cm≤D≤160cm的单目相机识别的目标,添加到移动机器人正前方的环境态势要素集合中,得到正前方障碍物。
[0045] d.将满足120°≤A<160°且0cm≤D≤226cm的单目相机识别的目标,添加到移动机器人偏左方的环境态势要素集合中,得到偏左方障碍物。
[0046] e.将满足160°≤A≤170°且0cm≤D≤160cm的单目相机识别的目标,添加到移动机器人正左方的环境态势要素集合中,得到正左方障碍物。
[0047] 其中,A表示单目相机识别的目标与机器人坐标系Y轴正向的夹角,单位为度,D表示单目相机识别的目标与移动机器人中心的距离,单位为厘米。
[0048] 步骤4,建立贝叶斯网络模型。
[0049] 提取直线行走、避障和逃离U型陷阱三种子行为的判别准则中的关于障碍物的下述描述:正前方、偏右方、偏左方、正左方、正右方障碍物,障碍物与移动机器人行进方向平行,正前方障碍物,偏左方障碍物,偏右方障碍物,正左方障碍物,正右方障碍物作为征兆节点,具体操作步骤如下:
[0050] 将移动机器人的局部路径规划问题分解为独立的三种子行为:直线行走子行为、避障子行为和逃离U型陷阱子行为;其中,直线行走子行为是移动机器人沿着当前行进方向直线移动的行为;避障子行为是移动机器人绕开其正前方、偏右方、偏左方、正左方、正右方的障碍物的行为;逃离U型陷阱子行为是移动机器人已进入U型陷阱中,旋转180°离开的行为;其中,移动机器人已进入U型陷阱中,是指移动机器人当前位置的正前方、正左方、正右方均有障碍物存在。
[0051] 直线行走、避障和逃离U型陷阱三种子行为的判别准则为:
[0052] a.若移动机器人的正前方、偏右方、偏左方、正左方、正右方没有障碍物,则移动机器人选择直线行走。
[0053] b.若移动机器人的偏右方、偏左方、正左方、正右方有障碍物,但与移动机器人行进方向平行,则移动机器人选择直线行走。
[0054] c.若移动机器人的正前方有障碍物,则移动机器人选择避障。
[0055] d.若移动机器人的偏左方有障碍物,则移动机器人选择避障。
[0056] e.若移动机器人的偏右方有障碍物,则移动机器人选择避障。
[0057] f.若移动机器人的正前方、偏左方均有障碍物,则移动机器人选择避障。
[0058] g.若移动机器人的正前方、偏右方均有障碍物,则移动机器人选择避障。
[0059] h.若移动机器人的偏右方、偏左方均有障碍物,则移动机器人选择避障。
[0060] i.若移动机器人的正前方、偏左方、偏右方均有障碍物,则移动机器人选择避障。
[0061] j.若移动机器人的正前方、正左方、正右方均有障碍物,则移动机器人选择逃离U型陷阱。
[0062] 征兆节点包括,正前方、偏右方、偏左方、正左方、正右方的障碍物节点,与移动机器人行进方向平行的障碍物节点,正前方的障碍物节点,偏左方的障碍物节点,偏右方的障碍物节点,正左方的障碍物节点,正右方的障碍物节点。
[0063] 将移动机器人的直线行走、避障和逃离U型陷阱独立的三种子行为,作为结果节点。结果节点包括,直线行走的节点,避障的节点,逃离U型陷阱的节点。
[0064] 利用诊断式贝叶斯网络建模方式,将征兆节点作为结果节点的父节点,结果节点作为征兆节点的子节点,组成贝叶斯网络模型结构。
[0065] 参照附图2,建立的贝叶斯网络模型结构具体为:直线行走的节点(S1)的父节点为正前方、偏右方、偏左方、正左方、正右方的障碍物节点(T1),与机器人行进方向平行的障碍物节点(T2);避障的节点(S2)的父节点为偏右方的障碍物节点(T3),偏左方的障碍物节点(T4),正前方的障碍物节点(T5);逃离U型陷阱的节点(S3)的父节点为正前方的障碍物节点(T5),正右方的障碍物节点(T6),正左方的障碍物节点(T7);增加一个行为选择的节点(C),将结果节点:直线行走的节点(S1)、避障的节点(S2)、逃离U型陷阱的节点(S3),作为行为选择节点的父节点。
[0066] 根据直线行走、避障和逃离U型陷阱三种子行为的判别准则,将贝叶斯网络模型中所有征兆节点和结果节点均设置为二值离散节点;将征兆节点存在障碍物状态下的参数值设置为0.5,不存在障碍物状态下的参数值设置为0.5,用N表示;将结果节点在满足判别准则条件下的参数值设置为1,不满足判别准则条件下的参数值设置为0;将行为选择节点设置为四值离散节点,取值状态为:s0、s1、s2、s3,其中,s0表示错误,s1表示直线行走,s2表示避障,s3表示逃离U型陷阱;
[0067] 将行为选择节点在直线行走节点在满足判别准则条件下的s0参数值设置为1,在直线行走节点在不满足判别准则条件下的s0参数值设置为0;将行为选择节点在避障节点在满足判别准则条件下的s1参数值设置为1,在避障节点在不满足判别准则条件下的s1参数值设置为0;将行为选择节点在逃离U型陷阱节点在满足判别准则条件下的s2参数值设置为1,在逃离U型陷阱节点在不满足判别准则条件下的情况下的s2参数值设置为0;将行为选择节点在直线行走节点满足判别准则、避障节点满足判别准则、逃离U型陷阱节点满足判别准则条件下的s3参数值设置为1,其余情况下的s3参数值设置为0。
[0068] 步骤5,进行贝叶斯网络模型的推理。
[0069] 将征兆节点作为证据节点,将证据节点在不同状态下的证据值,分别输入到贝叶斯网络模型中。
[0070] 证据节点在不同状态下的证据值具体为:
[0071] a.将正右方、正左方、正前方、偏右方、偏左方的环境态势要素集合,均为空时的正前方、偏右方、偏左方、正左方、正右方的障碍物证据节点,在不存在障碍物状态下的证据值设置为1,其余情况下的正前方、偏右方、偏左方、正左方、正右方的障碍物证据节点,在存在障碍物状态下的证据值设置为1。
[0072] b.将正右方、正左方、正前方、偏右方、偏左方的环境态势要素集合,均为空时的与机器人行进方向平行的障碍物证据节点,在存在障碍物状态下的证据值设置为1,其余情况下的与机器人行进方向平行的障碍物证据节点,在不存在障碍物状态下的证据值设置为1。
[0073] c.将正前方的环境态势要素集合不为空时的正前方的障碍物证据节点,在存在障碍物状态下的证据值设置为1,其余情况下的正前方的障碍物证据节点,在不存在障碍物状态下的证据值设置为1。
[0074] d.将偏左方的环境态势要素集合不为空时的偏左方的障碍物证据节点,在存在障碍物状态下的证据值设置为1,其余情况下的偏左方的障碍物证据节点,在不存在障碍物状态下的证据值设置为1。
[0075] e.将偏右方的环境态势要素集合不为空时的偏右方的障碍物证据节点,在存在障碍物状态下的证据值设置为1,其余情况下的偏右方的障碍物证据节点,在不存在障碍物状态下的证据值设置为1。
[0076] f.将正左方的环境态势要素集合不为空时的正左方的障碍物证据节点,在存在障碍物状态下的证据值设置为1,其余情况下的正左方的障碍物证据节点,在不存在障碍物状态下的证据值设置为1。
[0077] g.将正右方的环境态势要素集合不为空时的正右方的障碍物证据节点,在存在障碍物状态下的证据值设置为1,其余情况下的正右方的障碍物证据节点,在不存在障碍物状态下的证据值设置为1。
[0078] h.将正右方或正左方的环境态势要素集合不为空,正前方、偏右方、偏左方的环境态势要素集合,均为空时的与机器人行进方向平行的障碍物证据节点,在存在障碍物状态下的证据值设置为1,其余情况下的与机器人行进方向平行的障碍物证据节点,在不存在障碍物状态下的证据值为1。
[0079] 采用贝叶斯网络精确推理算法,在已确定的移动机器人行为选择贝叶斯网络模型的基础上,分别输入7个征兆节点:正前方、偏右方、偏左方、正左方、正右方障碍物节点(T1),障碍物与移动机器人行进方向平行节点(T2),偏右方障碍物节点(T3),偏左方障碍物节点(T4),正前方障碍物节点(T5),正右方障碍物节点(T6),正左方障碍物节点(T7)的证据值,证据值分别用e1,e2,...,e7表示,则构成证据集:E={e1,e2,...,e7},以输入的证据集E为后验条件,精确计算直线行走节点(S1)、避障节点(S2)和逃离U型陷阱节点(S3)的后验概率值:P(S1=Y/E),P(S2=Y/E),P(S3=Y/E),在满足判别准则条件下的后验概率值P(S1=Y/E),P(S2=Y/E),P(S3=Y/E)中选择一个最大的结果节点,将该结果节点所表示的子行为,作为移动机器人选择下一步移动时的子行为类型。
[0080] 下面以P(S1=Y/E)的计算过程为例,说明各结果节点的后验概率值的具体计算步骤如下:
[0081]
[0082] 其中,α表示比例因子,P(e1),P(e2),P(e3),P(e4),P(e5),P(e6),P(e7),P(S1=Y/e1,e2)可以从该贝叶斯网络的参数中直接获取, 可以依据贝叶斯网络参数求和计算给出。为了消掉比例因子α,依照上式过程同样计算:P(S1=N/E)=αP(S1=N,E),因为计算是同一节点的后验概率,比例因子α相同。则P(S1/E)=α<P(S1=Y/E),P(S1=N/E)>,进一步进行归一化处理:
[0083]
[0084]
[0085] 即得到P(S1=Y/E)的精确值。
[0086] 步骤6,确定移动机器人的子行为。
[0087] 在满足判别准则条件下的后验概率值中选择一个最大的结果节点,将该结果节点所表示的子行为,作为移动机器人选择下一步移动时的子行为类型,具体操作方式如下:
[0088] 从行为选择节点中,选择一个后验概率值最大的取值状态:若后验概率值最大的取值状态为s1,则移动机器人下一步选择的行为:直线行走;若后验概率值最大的取值状态为s2,则移动机器人下一步选择的行为:避障;若后验概率值最大的取值状态为s3,则移动机器人下一步选择的行为:逃离U型陷阱;若后验概率值最大的取值状态为s0,则移动机器人下一步选择行为发生错误。