移动机器人的路径规划方法、装置、电子设备及存储介质转让专利

申请号 : CN202310029725.2

文献号 : CN115930969B

文献日 : 2023-06-02

本发明涉及机器人导航技术领域，具体公开了一种移动机器人的路径规划方法、装置、电子设备及存储介质，其中，方法包括以下步骤：获取栅格地图，栅格地图包含起点信息、终点信息及至少一个障碍物信息；根据栅格地图生成关于障碍物信息的维诺图，维诺图具有多个围绕障碍物信息的泰森多边形；根据每个泰森多边形的每个边与该泰森多边形所围绕的障碍物信息之间的距离信息生成每个边的奖励信息；根据所述奖励信息获取启发式代价值中的碰撞代价值，并利用A*搜索泰森多边形的边生成导航路径；该方法充分考虑路径与障碍物信息之间的位置关系而生成避障效果好的导航路径，使得导航路径能兼顾路径长度和避障功能。

1.一种移动机器人的路径规划方法，用于生成移动机器人的移动路径，其特征在于，所述方法包括以下步骤：获取栅格地图，所述栅格地图包含起点信息、终点信息及至少一个障碍物信息；

根据所述栅格地图生成关于所述障碍物信息的维诺图，所述维诺图具有多个围绕所述障碍物信息的泰森多边形；

根据每个所述泰森多边形的每个边与该泰森多边形所围绕的障碍物信息之间的距离信息生成每个边的奖励信息；

根据所述奖励信息获取启发式代价值中的碰撞代价值，并利用A*搜索所述泰森多边形的边生成导航路径；

所述根据每个所述泰森多边形的每个边与该泰森多边形所围绕的障碍物信息之间的距离信息生成每个边的奖励信息的步骤包括：根据所述距离信息生成每个所述泰森多边形的每个边的碰撞风险信息，所述碰撞风险信息与所述距离信息负相关；

根据所述碰撞风险信息生成每个所述泰森多边形的每个边的奖励信息，所述碰撞风险信息与所述奖励信息负相关；

所述根据所述距离信息生成每个所述泰森多边形的每个边的碰撞风险信息的步骤包括：沿边的延伸方向积分获取每个所述泰森多边形的每个边的距离信息的积分值，并根据所述积分值生成对应边的碰撞风险信息。

2.根据权利要求1所述的移动机器人的路径规划方法，其特征在于，所述利用A*搜索所述泰森多边形的边生成导航路径的步骤以所述泰森多边形的顶点作为搜索对象，并以顶点与起点信息之间的路径距离作为实际代价值。

3.根据权利要求1所述的移动机器人的路径规划方法，其特征在于，所述根据所述栅格地图生成关于所述障碍物信息的维诺图的步骤包括：根据所述障碍物信息在所述栅格地图中生成德洛内三角网；

根据所述德洛内三角网在所述栅格地图中生成所述泰森多边形以获取所述维诺图。

4.根据权利要求1所述的移动机器人的路径规划方法，其特征在于，所述方法还包括步骤：对所述导航路径进行平滑化处理。

5.根据权利要求4所述的移动机器人的路径规划方法，其特征在于，所述对所述导航路径进行平滑化处理的步骤包括：根据碰撞惩罚、平滑惩罚、长度惩罚设定关于所述导航路径平滑化处理的损失函数；

根据梯度下降法更新所述损失函数至收敛以平滑化处理所述导航路径。

6.一种移动机器人的路径规划装置，用于生成移动机器人的移动路径，其特征在于，所述装置包括：地图获取模块，用于获取栅格地图，所述栅格地图包含起点信息、终点信息及至少一个障碍物信息；

维诺图生成模块，用于根据所述栅格地图生成关于所述障碍物信息的维诺图，所述维诺图具有多个围绕所述障碍物信息的泰森多边形；

奖励模块，用于根据每个所述泰森多边形的每个边与该泰森多边形所围绕的障碍物信息之间的距离信息生成每个边的奖励信息；

路径生成模块，用于根据所述奖励信息获取启发式代价值中的碰撞代价值，并利用A*搜索所述泰森多边形的边生成导航路径；

根据所述碰撞风险信息生成每个所述泰森多边形的每个边的奖励信息，所述碰撞风险信息与所述奖励信息负相关；

7.一种电子设备，其特征在于，包括处理器以及存储器，所述存储器存储有计算机可读取指令，当所述计算机可读取指令由所述处理器执行时，运行如权利要求1‑5任一项所述方法中的步骤。

8.一种存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时运行如权利要求1‑5任一项所述方法中的步骤。

移动机器人的路径规划方法、装置、电子设备及存储介质

技术领域

[0001] 本申请涉及机器人导航技术领域，具体而言，涉及一种移动机器人的路径规划方法、装置、电子设备及存储介质。

背景技术

[0002] 近些年来，随着自动驾驶、机器人等行业的加速发展。对于移动机器人而言，其核心问题之一是如何保证机器人安全、可靠、快速、稳定地导航，这需要稳定、高效的路径规划算法来实现。

[0003] 现有的机器人的路径规划算法一般为：先进行全局的路径搜索，然后在局部进行细致的运动规划。现有的全局的路径搜索经常使用的规划算法都只能从完备性的角度找到可达路径，即寻找路径最短的导航路径，其对障碍物也只能进行简单规避，无法对狭窄和宽阔的两条不同路径进行区分，更加安全的路径生成需要局部规划器进行处理，无法兼顾路径长度和避障功能取得最优解。

[0004] 针对上述问题，目前尚未有有效的技术解决方案。

发明内容

[0005] 本申请的目的在于提供一种移动机器人的路径规划方法、装置、电子设备及存储介质，以兼顾路径长度和避障功能进行路径规划。

[0006] 第一方面，本申请提供了一种移动机器人的路径规划方法，用于生成移动机器人的移动路径，所述方法包括以下步骤：

[0007] 获取栅格地图，所述栅格地图包含起点信息、终点信息及至少一个障碍物信息；

[0008] 根据所述栅格地图生成关于所述障碍物信息的维诺图，所述维诺图具有多个围绕所述障碍物信息的泰森多边形；

[0009] 根据每个所述泰森多边形的每个边与该泰森多边形所围绕的障碍物信息之间的距离信息生成每个边的奖励信息；

[0010] 以所述根据所述奖励信息获取启发式代价值中的碰撞代价值，并利用A*搜索所述泰森多边形的边生成导航路径。

[0011] 本申请的移动机器人的路径规划方法利用维诺图中的泰森多边形的顶点和边形成路径搜索可用的路径点和路径段，构成了导航路径的生成基础，并基于边与障碍物信息之间的距离关系设定奖励信息以获取启发式代价值中的碰撞代价值，使得A*搜索过程能充分考虑路径与障碍物信息之间的位置关系而生成避障效果好的导航路径。

[0012] 所述的移动机器人的路径规划方法，其中，所述利用A*搜索所述泰森多边形的边生成导航路径的步骤以所述泰森多边形的顶点作为搜索对象，并以顶点与起点信息之间的路径距离作为实际代价值。

[0013] 该示例的方法在维诺图中进行路径搜索时，能根据边与障碍物信息之间的距离信息动态设置碰撞代价值，从而使得A*搜索算法能充分考虑路径与障碍物信息之间的位置关系而生成避障效果好的导航路径。

[0014] 所述的移动机器人的路径规划方法，其中，所述根据所述栅格地图生成关于所述障碍物信息的维诺图的步骤包括：

[0015] 根据所述障碍物信息在所述栅格地图中生成德洛内三角网；

[0016] 根据所述德洛内三角网在所述栅格地图中生成所述泰森多边形以获取所述维诺图。

[0017] 所述的移动机器人的路径规划方法，其中，所述根据每个所述泰森多边形的每个边与该泰森多边形所围绕的障碍物信息之间的距离信息生成每个边的奖励信息的步骤包括：

[0018] 根据所述距离信息生成每个所述泰森多边形的每个边的碰撞风险信息，所述碰撞风险信息与所述距离信息负相关；

[0019] 根据所述碰撞风险信息生成每个所述泰森多边形的每个边的奖励信息，所述碰撞风险信息与所述奖励信息负相关。

[0020] 所述的移动机器人的路径规划方法，其中，所述根据所述距离信息生成每个所述泰森多边形的每个边的碰撞风险信息的步骤包括：

[0021] 沿边的延伸方向积分获取每个所述泰森多边形的每个边的距离信息的积分值，并根据所述积分值生成对应边的碰撞风险信息。

[0022] 所述的移动机器人的路径规划方法，其中，所述方法还包括步骤：

[0023] 对所述导航路径进行平滑化处理。

[0024] 所述的移动机器人的路径规划方法，其中，所述对所述导航路径进行平滑化处理的步骤包括：

[0025] 根据碰撞惩罚、平滑惩罚、长度惩罚设定关于所述导航路径平滑化处理的损失函数；

[0026] 根据梯度下降法更新所述损失函数至收敛以平滑化处理所述导航路径。

[0027] 第二方面，本申请还提供了一种移动机器人的路径规划装置，用于生成移动机器人的移动路径，所述装置包括：

[0028] 地图获取模块，用于获取栅格地图，所述栅格地图包含起点信息、终点信息及至少一个障碍物信息；

[0029] 维诺图生成模块，用于根据所述栅格地图生成关于所述障碍物信息的维诺图，所述维诺图具有多个围绕所述障碍物信息的泰森多边形；

[0030] 奖励模块，用于根据每个所述泰森多边形的每个边与该泰森多边形所围绕的障碍物信息之间的距离信息生成每个边的奖励信息；

[0031] 路径生成模块，用于根据所述奖励信息获取启发式代价值中的碰撞代价值，并利用A*搜索所述泰森多边形的边生成导航路径。

[0032] 本申请的移动机器人的路径规划装置利用维诺图中的泰森多边形的顶点和边形成路径搜索可用的路径点和路径段，构成了导航路径的生成基础，并基于边与障碍物信息之间的距离关系设定奖励信息以获取启发式代价值中的碰撞代价值，使得A*搜索过程能充分考虑路径与障碍物信息之间的位置关系而生成避障效果好的导航路径，使得导航路径能兼顾路径长度和避障功能。

[0033] 第三方面，本申请还提供了一种电子设备，包括处理器以及存储器，所述存储器存储有计算机可读取指令，当所述计算机可读取指令由所述处理器执行时，运行如上述第一方面提供的所述方法中的步骤。

[0034] 第四方面，本申请还提供了一种存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时运行如上述第一方面提供的所述方法中的步骤。

[0035] 由上可知，本申请提供了一种移动机器人的路径规划方法、装置、电子设备及存储介质，尤其适用于全局路径规划，其中，方法利用维诺图中的泰森多边形的顶点和边形成路径搜索可用的路径点和路径段，构成了具有避障特性的导航路径的生成基础，并基于边与障碍物信息之间的距离关系设定奖励信息以获取启发式代价值中的碰撞代价值，使得A*搜索过程能充分考虑路径与障碍物信息之间的位置关系而生成避障效果好的导航路径，使得导航路径能兼顾路径长度和避障功能。

附图说明

[0036] 图1为本申请实施例提供的移动机器人的路径规划方法的流程图。

[0037] 图2为一些实施例中的包含障碍物信息的栅格地图。

[0038] 图3为一些实施例中的包含障碍物信息的维诺图。

[0039] 图4为基于本申请实施例提供的移动机器人的路径规划方法在栅格地图生成的导航路径的示意图。

[0040] 图5为本申请实施例提供的移动机器人的路径规划装置的结构示意图。

[0041] 图6为本申请实施例提供的电子设备的结构示意图。

[0042] 附图标记：201、地图获取模块；202、维诺图生成模块；203、奖励模块；204、路径生成模块；205、平滑化处理模块；301、处理器；302、存储器；303、通信总线。

具体实施方式

[0043] 下面将结合本申请实施例中附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

[0044] 应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。同时，在本申请的描述中，术语“第一”、“第二”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

[0045] 第一方面，请参照图1‑图4，本申请一些实施例提供了一种移动机器人的路径规划方法，用于生成移动机器人的移动路径，方法包括以下步骤：

[0046] S1、获取栅格地图，栅格地图包含起点信息、终点信息及至少一个障碍物信息；

[0047] S2、根据栅格地图生成关于障碍物信息的维诺图，维诺图具有多个围绕障碍物信息的泰森多边形；

[0048] S3、根据每个泰森多边形的每个边与该泰森多边形所围绕的障碍物信息之间的距离信息生成每个边的奖励信息；

[0049] S4、根据奖励信息获取启发式代价值中的碰撞代价值，并利用A*搜索泰森多边形的边生成导航路径。

[0050] 具体地，起点信息为移动机器人在栅格地图上的位置，终点信息为移动机器人在栅格地图上的移动目的地；障碍物信息为结合环境地图和实际环境检测获取的障碍物分布、体积在栅格地图上显示的障碍物数据，可基于搭载在移动机器人上的传感器扫描环境获取，也可以基于固定设置在场景中的传感器扫描环境获取，还可以基于搭载在其他移动设备上的传感器扫描环境获取；如图2所示，栅格地图为黑白二值地图，地图边界和障碍物信息显示为黑色区域，移动机器人可通行的区域显示为白色区域，本申请实施例的移动机器人的路径规划方法规划导航路径的过程为在白色区域中寻找连接起点信息和终点信息的路径的搜索过程。

[0051] 更具体地，栅格地图可以采用现有的建图工具或建图算法根据预设的地图数据和/或基于传感器采集的感知数据进行生成，该生成过程属于现有技术，在此不再赘述。

[0052] 更具体地，维诺图（Voronoi图）又称冯洛诺伊图，是基于泰森多边形对空间平面进行剖分的手段，泰森多边形是一组由连接两邻点的线段的垂直平分线组成的连续多边形；一个泰森多边形内的任一点到构成该多边形的Voronoi点的距离小于到其他多边形Voronoi点的距离。

[0053] 更具体地，步骤S2生成的维诺图关联于障碍物信息，即该维诺图为以障碍物信息作为Voronoi点集而生成，其生成过程可以是提取障碍物信息的关键节点作为Voronoi点集，也可以是将障碍物信息坍缩生成的节点作为Voronoi点集，还可以是将障碍物信息拆分为多个组成部分后并提取不同组成部分的质心作为Voronoi点集；因此，在本申请实施例中，维诺图为根据栅格地图的地图边界及栅格地图中的障碍物信息生成，相应地，基于障碍物信息获取的Voronoi点集中的点位于对应的泰森多边形的中心，表征障碍物信息位于对应的泰森多边形的中心，以使泰森多边形围绕对应的障碍物信息。

[0054] 更具体地，如图3所示，维诺图由有限个的泰森多边形构成，除了地图边界外，每个完整的泰森多边形的中心均有障碍物信息，在起点信息和终点信息之间存在可行路径的情况下，该维诺图中必然存在基于泰森多边形顶点连接而成的从起点信息指向终点信息的有效路径，其中，若起点信息和终点信息分别在某一泰森多边形的边或顶点上，必然有由泰森多边形边构成的至少一条不触碰障碍物（即不与栅格地图中的障碍物信息重叠）的有效路径，而若起点信息和终点信息均不在泰森多边形的边或顶点上，起点信息和终点信息对应邻近的泰森多边形的顶点与其他泰森多边形边也能构成对应的有效路径，故本申请实施例中的维诺图能作为生成导航路径的路线基础，即泰森多边形的边构成了导航路径的路径段。

[0055] 更具体地，距离信息表征了泰森多边形的边与其中心的障碍物信息之间的距离关系，由于栅格地图中的泰森多边形的边没有体积数据，故根据维诺图获取的导航路径也不能根据移动机器人的体积来实际反馈障碍物信息与移动机器人的碰撞概率，因此，在生成导航路径的过程中，本申请实施例的方法基于距离信息生成的奖励信息能反映移动机器人沿该泰森多边形的边进行移动时与对应的障碍物碰撞的可能性。

[0056] 更具体地，在本申请实施例中，奖励信息相当于附加在泰森多边形的边上的权值，附带奖励信息的维诺图相当于转化为基于奖励信息加权的无向图，使得步骤S4能根据该无向图进行导航路径的搜索。

[0057] 更具体地，A*搜索算法，又称A星算法，是一种启发式搜索算法，即属于静态路网中求解最短路径最有效的搜索方法；其中，A*搜索算法在搜索每个路径点的过程需要考虑实际代价值和启发式代价值，其中，实际代价值为从起点到对应路径点（本申请实施例中的泰森多边形的顶点）的路径长度，启发式代价值为该路径点到终点的路径长度，在本申请实施例中，在启发式代价值的基础上增加了以奖励信息计算生成的碰撞代价值，在本申请实施例中，碰撞代价值根据维诺图最大边长与对应边的奖励信息之比计算获取，即本申请实施例中的A*搜索算法的启发式代价值为路径点到终点的路径长度及对应路径所在边的碰撞代价值之和，从而使得奖励信息能引导A*搜索算法的搜索方向，即本申请实施例的方法在搜索生成导航路径的过程中以泰森多边形的边上的权值作为引导进行搜索，使得搜索过程中获取的路径更倾向于距离信息更大的路径，从而使得获取的导航路径能尽可能地避开障碍物。

[0058] 本申请实施例的移动机器人的路径规划方法尤其适用于全局路径规划，其利用维诺图中的泰森多边形的顶点和边形成路径搜索可用的路径点和路径段，构成了导航路径的生成基础，并基于边与障碍物信息之间的距离关系设定奖励信息以获取启发式代价值中的碰撞代价值，使得A*搜索过程能充分考虑路径与障碍物信息之间的位置关系而生成避障效果好的导航路径，使得导航路径能兼顾路径长度和避障功能。

[0059] 更具体地，本申请实施例的方法还适用于局部路径的规划过程，即将原本的移动过程分为多个局部移动过程，从而产生多个阶段性的终点信息，采用本方法相当于基于当前起点信息和对应阶段性的终点信息在栅格地图中生成局部维诺图，并基于局部维诺图生成对应阶段性终点信息的导航路径，从而指导移动机器人逐步移动。

[0060] 在一些优选的实施方式中，利用A*搜索泰森多边形的边生成导航路径的步骤以泰森多边形的顶点作为搜索对象，并以顶点与起点信息之间的路径距离作为实际代价值。

[0061] 具体地，基于前述内容可知，实际代价值为从起点到对应路径点的路径长度，由于本申请实施例的方法是基于泰森多边形的边进行路径搜索的，因此，在该A*搜索过程中，需以连接泰森多边形的边的顶点作为搜索对象，并根据已搜索的部分的路径距离（即以对应已选取的泰森多边形的边的长度之和）作为实际代价值。

[0062] 更具体地，A*搜索一般基于f(n)=g(n)+h(n)进行，其中，n为路径点，f(n)为通往该路径点n的总代价，g（n）为起点到路径点n的实际代价值，h（n）为路径点n到终点的启发式代价值；在本申请实施例中，将启发式代价值中的碰撞代价值定义为h（2 n），启发式代价值中的其余代价值定义为h（1 n），h（2 n）可以是额外增加的代价，还可以是与h1(n) 按设定权重进行叠加的代价，在本申请实施例中优选为后者，故有：

[0063] f(n)=g(n)+λ1h1(n)+λ2h2(n) （1）

[0064] 其中，λ1和λ2为设定权重，满足λ1+λ2=1，且均为非负常量，h2(n)为路径点n到终点的碰撞代价值，即路径点n到终点的泰森多边形的边的奖励信息计算的碰撞代价值之和，本申请实施例的方法在维诺图中进行路径搜索时，能根据边与障碍物信息之间的距离信息动态设置碰撞代价值，从而使得A*搜索算法利用f(n)进行导航路径搜索时能充分考虑路径与障碍物信息之间的位置关系而生成避障效果好的导航路径；其中，λ1越大则导航路径搜索效率越快、导航路径越短。

[0065] 更具体地，根据实际需要设定λ1和λ2的大小能调节导航路径的性能的倾向性，λ2设定越大，对应的导航路径的避障效果越好，λ1设定越大，对应的导航路径的移动效率越高。

[0066] 在一些优选的实施方式中，当A*搜索算法在维诺图中进行搜索时，将λ1和λ2设定为0.5，使得导航路径能有效兼顾路径长度和避障功能；当A*搜索算法在维诺图外进行搜索时，A*搜索脱离泰森多边形的边进行路径搜索，为避免碰撞代价值扰乱A*搜索的搜索能力，将此时的λ1和λ2分别设定为1和0。

[0067] 在一些优选的实施方式中，根据栅格地图生成关于障碍物信息的维诺图的步骤包括：

[0068] S21、根据障碍物信息在栅格地图中生成德洛内三角网；

[0069] S22、根据德洛内三角网在栅格地图中生成泰森多边形以获取维诺图。

[0070] 具体地，基于前述内容可知，障碍物信息作为Voronoi点集使用，故步骤S21能基于这些Voronoi点集生成德洛内三角网，在本申请实施例中，德洛内三角网（Delaunay三角网，Delaunay triangulation）是一系列相连的但不重叠的以Voronoi点作为角点的三角形的集合, 而且这些三角形的外接圆不包含这个面域的其他Voronoi点。

[0071] 应当理解的是，获取维诺图的过程为以栅格地图的边界作为图形边界来生成泰森多边形的过程，或以局部维诺图的边界作为图形边界来生成泰森多边形的过程。

[0072] 在一些优选的实施方式中，步骤S21包括：

[0073] S211、将障碍物信息划分为局部障碍物信息，以局部障碍物信息的中点作为Voronoi点构成Voronoi点集；

[0074] S212、基于该Voronoi点集在栅格地图中生成德洛内三角网。

[0075] 具体地，为避免体积过大或者具有中部空腔的障碍物信息影响泰森多边形的生成，本申请实施例的方法将具有上述特点的障碍物信息划分为多个局部障碍物信息，再获取对应的Voronoi点来生成德洛内三角网，以使得泰森多边形关于障碍物信息的生成位置、分布、数量更合理，从而使得A*搜索获取的导航路径能更充分地考虑图上障碍物信息的形态、分布特点。

[0076] 更具体地，根据维诺图的定义，维诺图中任意泰森多边形在空间剖分上都是等分的，因此，每个局部障碍物信息均位于对应泰森多边形的中心（对应于Voronoi点）。

[0077] 在一些优选的实施方式中，根据每个泰森多边形的每个边与该泰森多边形所围绕的障碍物信息之间的距离信息生成每个边的奖励信息的步骤包括：

[0078] S31、根据距离信息生成每个泰森多边形的每个边的碰撞风险信息，碰撞风险信息与距离信息负相关；

[0079] S32、根据碰撞风险信息生成每个泰森多边形的每个边的奖励信息，碰撞风险信息与奖励信息负相关。

[0080] 具体地，在移动机器人沿导航路径移动时，移动机器人距离障碍物越近越容易发生碰撞意外，故距离信息能反映泰森多边形的边所在的路径段的碰撞风险（collision risk），因此，在本申请实施例中，能根据边的距离信息设定与之负相关的碰撞风险信息；在更进一步的实施方式中，步骤S31可以是根据距离信息的倒数生成每个泰森多边形的每个边的碰撞风险信息，碰撞风险信息与距离信息的倒数正相关。

[0081] 更具体地，移动机器人的导航路径应当具备适当的避障功能和相对优秀的移动效率，本申请实施例的方法生成的维诺图为在栅格地图上根据障碍物信息生成的，其对应的泰森多边形为围绕障碍物信息生成的，因此，A*搜索根据维诺图必然能获取高效移动、高效避障的导航路径，为了进一步优化避障效果，本申请实施例的方法引用了基于距离信息设定的奖励信息，该奖励信息与碰撞风险信息负相关，即与距离信息正相关，使得A*搜索在搜索泰森多边形顶点的过程中能更倾向于远离障碍物信息的顶点，以尽可能避免移动机器人沿导航路径移动过程中出现碰撞意外。

[0082] 应当理解的是，虽然维诺图的生成过程是基于障碍物信息获取的Voronoi点集进行的，但为了避免出现碰撞意外，该距离信息为基于泰森多边形的边与栅格地图中实际标记的障碍物信息的距离进行计算的。

[0083] 在一些优选的实施方式中，根据距离信息生成每个泰森多边形的每个边的碰撞风险信息的步骤包括：

[0084] S311、沿边的延伸方向积分获取每个泰森多边形的每个边的距离信息的积分值，并根据积分值生成对应边的碰撞风险信息。

[0085] 具体地，距离信息可以为最小距离，也可以为上述边的延伸方向积分产生的积分值；若单纯采用最小距离生成奖励信息，则奖励信息只能反映边与障碍物信息之间的最小距离关系，但导航路径应当考虑整个路径段的碰撞风险，即需要根据比较不同路径段各个位置与障碍物之间的位置关系来判断碰撞风险，从而使得搜索到的路径段更可靠，使得移动机器人在整个移动过程中均能有效避障，因此，在本申请实施例中，步骤S31优选为采用步骤S311生成碰撞风险信息。

[0086] 更具体地，在栅格地图中，沿边的延伸方向积分获取每个泰森多边形的每个边的距离信息的积分值相当于获取该边的各个位置与障碍物信息之间的最小距离之和。

[0087] 更具体地，本申请实施例的方法基于该奖励信息能计算获取启发式代价值中的碰撞代价值，故A*搜索过程中的h2(n)相当于根据沿路径点n到终点的泰森多边形的边的距离信息的积分值总和设定的奖励值所计算获取的碰撞代价值，故能反映该搜索过程中余下路径整体的碰撞风险，若对于不同的余下路径具有相同或相近的h1(n)，则对于路径点n的搜索行为相当于最小化碰撞代价值（最大化该奖励值），即获取整体碰撞风险最低的余下路径，相对地，对于整个搜索过程而言，获取导航路径的目标等价于在维诺图中寻找一条从起点信息到终点信息的泰森多边形与障碍物信息之间的距离信息的积分值最大的路径。

[0088] 在一些优选的实施方式中，方法还包括步骤：

[0089] S5、对导航路径进行平滑化处理。

[0090] 具体地，步骤S1‑步骤S4获取的导航路径基于泰森多边形生成，使得路径较为粗略，尤其是在对应于泰森多边形的顶点处明显存在转角路径，存在平滑性不足的问题，不利于移动机器人移动，因此，本申请实施例的方法针对基于步骤S1‑步骤S4获取的导航路径进行平滑化处理，以优化整个导航路径，使其更适用于移动机器人使用。

[0091] 更具体地，由于步骤S1‑步骤S4获取的导航路径具有优异的避障功能，故该平滑化处理过程可采用现有技术中的平滑处理手段进行优化，而不会导致优化后的导航路径引起碰撞意外。

[0092] 在一些优选的实施方式中，对导航路径进行平滑化处理的步骤包括：

[0093] S51、根据碰撞惩罚、平滑惩罚、长度惩罚设定关于导航路径平滑化处理的损失函数；

[0094] S52、根据梯度下降法更新损失函数至收敛以平滑化处理导航路径。

[0095] 具体地，为确保平滑化处理过程具有通用性，能适用于不同形态的导航路径，并保证平滑化处理后的导航路径依然符合移动机器人使用，本申请实施例的平滑化处理设置碰撞惩罚、平滑惩罚、长度惩罚作为约束手段以引导平滑化处理过程；其中，碰撞惩罚为关于与障碍物距离的惩罚，其与障碍物距离越远对应产生的惩罚值越小；平滑惩罚为关于导航路径平滑度的惩罚，其平滑度越平滑对应产生的惩罚值越小；长度惩罚为关于导航路径整体长度的惩罚，其长度越大对应产生的惩罚值越大。

[0096] 更具体地，在本申请实施例中，损失函数可以是基于等权值的碰撞惩罚、平滑惩罚、长度惩罚叠加设定构建，也可以根据使用需求针对不同惩罚设定不同的权值的碰撞惩罚、平滑惩罚、长度惩罚叠加设定构建。

[0097] 更具体地，该平滑化处理优选为针对导航路径中的路径点（泰森多边形的顶点）进行处理。

[0098] 更具体地，在本申请实施例中，该平滑化处理的损失函数loss优选为：

[0099] （2）

[0100] 其中，为碰撞惩罚，为平滑惩罚，为长度惩罚；其中，、、分别为碰撞惩罚权值、平滑惩罚权值和长度惩罚权值，、、分别为碰撞惩罚函数、平滑惩罚函数和长度惩罚函数，o、s、l分别为碰撞惩罚、平滑惩罚和长度惩罚的下标，N为路径点的总数，i为路径点的编号，为第i个路径点的位置，为第i+1个路径点与第i个路径点的位置偏差，有，故为第i+2个
路径点与第i+1个路径点的位置偏差，为最近的障碍物的位置，为障碍物距离阈值，其中，和均为栅格地图中的坐标数据。

[0101] 更具体地，该损失函数用于指导约束平滑化处理过程，最小化该损失函数至收敛能获取最优平滑化处理的导航路径，使得平滑处理化后的导航路径兼顾碰撞风险低、平滑度高及路线长度短的特点。

[0102] 更具体地，平滑化处理过程相当于最小化损失函数的过程，本申请实施例的方法优选采用梯度下降法同时更新、、以提高平滑化处理效率、效果。

[0103] 在本申请实施例中，碰撞惩罚函数、平滑惩罚函数、长度惩罚函数优选采用平方损失函数，故对应的惩罚函数分别基于下面各个梯度进行优化：

[0104] （3）

[0105] （4）

[0106] （5）

[0107] 更具体地，为了进一步提高平滑化处理的处理效果，本申请实施例的平滑化处理的优化过程设定迭代次数为50次，避免损失函数难以收敛时花费过多时间进行导航路径的平滑化处理；根据经验数据可知，式（2）一般利用式（3）（4）（5）进行30次左右的迭代优化便能收敛。

[0108] 在一些优选的实施方式中，、、分别优选设置为0.2、0.6和0.2。

[0109] 具体地，根据经验数据可知，碰撞惩罚权值设定过大容易导致导航路径在狭窄区域处的路径点变得稀疏，更多的路径点被推向狭窄区域外部，也不利于损失函数收敛，因此在本申请实施例中，将碰撞惩罚权值设置为0.2，确保平滑化处理后的导航路径上的路径点分布较为均匀。

[0110] 第二方面，请参照图5，本申请一些实施例还提供了一种移动机器人的路径规划装置，用于生成移动机器人的移动路径，装置包括：

[0111] 地图获取模块201，用于获取栅格地图，栅格地图包含起点信息、终点信息及至少一个障碍物信息；

[0112] 维诺图生成模块202，用于根据栅格地图生成关于障碍物信息的维诺图，维诺图具有多个围绕障碍物信息的泰森多边形；

[0113] 奖励模块203，用于根据每个泰森多边形的每个边与该泰森多边形所围绕的障碍物信息之间的距离信息生成每个边的奖励信息；

[0114] 路径生成模块204，用于根据奖励信息获取启发式代价值中的碰撞代价值，并利用A*搜索泰森多边形的边生成导航路径。

[0115] 本申请实施例的移动机器人的路径规划装置尤其适用于全局路径规划，其利用维诺图中的泰森多边形的顶点和边形成路径搜索可用的路径点和路径段，构成了导航路径的生成基础，并基于边与障碍物信息之间的距离关系设定奖励信息以获取启发式代价值中的碰撞代价值，使得A*搜索过程能充分考虑路径与障碍物信息之间的位置关系而生成避障效果好的导航路径，使得导航路径能兼顾路径长度和避障功能。

[0116] 在一些优选的实施方式中，该装置还包括：

[0117] 平滑化处理模块205，用于对导航路径进行平滑化处理。

[0118] 在一些优选的实施方式中，本申请实施例的移动机器人的路径规划装置用于执行上述第一方面提供的移动机器人的路径规划方法。

[0119] 第三方面，请参照图6，本申请提供一种电子设备，包括：处理器301和存储器302，处理器301和存储器302通过通信总线303和/或其他形式的连接机构（未标出）互连并相互通讯，存储器302存储有处理器301可执行的计算机可读取指令，当电子设备运行时，处理器301执行该计算机可读取指令，以执行时执行上述实施例的任一可选的实现方式中的方法。

[0120] 第四方面，本申请实施例提供一种存储介质，其上存储有计算机程序，该计算机程序被处理器执行时，执行上述实施例的任一可选的实现方式中的方法。其中，存储介质可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器（Static Random Access Memory, 简称SRAM），电可擦除可编程只读存储器（Electrically Erasable Programmable Read‑Only Memory, 简称EEPROM），可擦除可编程只读存储器（Erasable Programmable Read Only Memory, 简称EPROM），可编程只读存储器（Programmable Red‑Only Memory, 简称PROM），只读存储器（Read‑Only Memory, 简称ROM），磁存储器，快闪存储器，磁盘或光盘。

[0121] 综上，本申请实施例提供了一种移动机器人的路径规划方法、装置、电子设备及存储介质，尤其适用于全局路径规划，其中，方法利用维诺图中的泰森多边形的顶点和边形成路径搜索可用的路径点和路径段，构成了具有避障特性的导航路径的生成基础，并基于边与障碍物信息之间的距离关系设定奖励信息以获取启发式代价值中的碰撞代价值，使得A*搜索过程能充分考虑路径与障碍物信息之间的位置关系而生成避障效果好的导航路径，使得导航路径能兼顾路径长度和避障功能。

[0122] 在本申请所提供的实施例中，应该理解到，所揭露装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

[0123] 另外，作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

[0124] 再者，在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

[0125] 在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。

[0126] 以上所述仅为本申请的实施例而已，并不用于限制本申请的保护范围，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

移动机器人的路径规划方法、装置、电子设备及存储介质转让专利

申请号 : CN202310029725.2

文献号 : CN115930969B

文献日 : 2023-06-02

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 黃桢 , 许金鹏 , 刘智辉

申请人 : 季华实验室

摘要 :

权利要求 :

说明书 :