一种基于物联网的无人库房机械臂的控制方法和系统转让专利

申请号 : CN202111409043.1

文献号 : CN114516045B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 吴勇

申请人 : 苏州永固智能科技有限公司

摘要 :

本发明涉及智能档案存取管理技术领域,具体涉及一种基于物联网的无人库房机械臂的控制方法。不同放置顺序下的各目标档案盒对应的放置前特征和非理想放置后特征组成不同的放置前后特征矩阵;目标档案盒放置过程中机械臂撑开两侧档案盒的时间,为撑开特征;将不同放置顺序下的放置前后特征矩阵分别输入神经网络,输出不同放置顺序下各目标档案盒对应的撑开特征;神经网络损失值最小对应的放置顺序,为最合适的放置顺序;根据最合适的放置顺序及其对应的各目标档案盒的撑开特征控制机械臂进行放作。本发明保证多个档案盒在放置时具有最大的效率以及尽可能不对后续其他档案盒的放置产生影响。

权利要求 :

1.一种基于物联网的无人库房机械臂的控制方法,其特征在于,该方法包括:模拟目标档案盒在不同放置顺序下的放置过程,根据各目标档案盒放置前后与目标位置邻近的其他档案盒的倾倒方向获得其他档案盒的状态特征;根据其他档案盒与目标位置的距离获得其位置特征;目标档案盒放置前后其他档案盒的状态特征和位置特征组成目标档案盒对应的放置前特征和非理想放置后特征;

目标档案盒放置过程中机械臂撑开两侧档案盒的时间,为撑开特征;不同放置顺序下的各目标档案盒对应的放置前特征和非理想放置后特征组成不同的放置前后特征矩阵;

将不同放置顺序下的放置前后特征矩阵分别输入神经网络,输出不同放置顺序下各目标档案盒对应的撑开特征,同时获得不同放置顺序对应的神经网络损失值;神经网络损失值最小对应的放置顺序,为最合适的放置顺序;根据最合适的放置顺序及其对应的各目标档案盒的撑开特征控制机械臂进行放置操作。

2.根据权利要求1所述的一种基于物联网的无人库房机械臂的控制方法,其特征在于,所述放置前特征和放置后特征的获取包括:分别获得目标档案盒放置前后同层其他档案盒的连通域;对连通域内像素点的坐标进行成分分析获得特征值最大的主成分方向,为其他档案盒的状态特征,该状态特征为二维单位向量;其他档案盒的状态特征和其他档案盒与目标位置的距离构成一个三维向量;分别获取放置前后由同层其他档案盒对应的三维向量构成三维向量序列,为目标档案盒的放置前特征和放置后特征。

3.根据权利要求1所述的一种基于物联网的无人库房机械臂的控制方法,其特征在于,所述神经网络的训练过程具体为:通过模拟某种放置顺序下单个目标档案盒理想放置过程,获得其放置前特征和理想放置后特征;由非理想放置后特征与理想放置后特征的差异获得放置干扰程度;根据机械臂撑开目标档案盒两侧档案盒的时间获得放置效率;由放置干扰程度与放置效率的比值获得第一损失,利用第一损失训练神经网络;当第一损失收敛,输入放置前特征和非理想放置后特征,输出目标档案盒的撑开特征,此时单个目标档案盒是在最优放置策略进行放置的;

根据最优放置策略下目标档案盒放置后特征与理想放置后特征的差异以及撑开特征获得最优放置向量;针对目标档案盒的最优放置向量进行聚类,获得各类别中最大的最优放置向量均值;

根据最优放置策略下放置干扰程度和放置效率的比值获得目标档案盒最优放置向量的特征指标;根据最优放置向量的特征指标、最优放置向量与最大的最优放置向量均值的差值、放置干扰程度与放置效率的比值获得第二损失,利用第二损失训练神经网络,神经网络训练完成。

4.根据权利要求3所述的一种基于物联网的无人库房机械臂的控制方法,其特征在于,所述非理想放置后特征和理想放置特征的差异为一个偏移向量,并利用梯度下降算法不断更新偏移向量,直至第一损失和第二损失收敛。

5.根据权利要求1所述的一种基于物联网的无人库房机械臂的控制方法,其特征在于,所述目标档案盒的最优放置向量的特征指标具体为:

其中, 表示在最优放置策略下放置时第k种放置顺序中第i个目标档案盒的最优放置向量的特征指标; 表示在最优放置策略下放置时第k种放置顺序中第i个目标档案盒的放置效率; 表示在最优放置策略下放置时第k种放置顺序中第i个目标档案盒的放置干扰程度。

6.根据权利要求3所述的一种基于物联网的无人库房机械臂的控制方法,其特征在于,所述第二损失具体为:

其中,Loss2为第二损失; 为归一化系数;N为目标档案盒的个数; 表示在第k种放置顺序中对第i个目标档案盒的关注系数; 表示在最优放置策略下放置时第k种放置顺序中第i个目标档案盒的最优放置向量的特征指标; 表示第k种放置顺序中第i个目标档案盒放置时的放置干扰程度; 表示第k种放置顺序中第i个目标档案盒放置时的放置效率。

7.根据权利要求6所述的一种基于物联网的无人库房机械臂的控制方法,其特征在于,所述关注系数具体为:根据第k种放置顺序中第i个目标档案盒的最优放置向量与最大的最优放置向量均值差值的L2范数获得。

8.一种基于物联网的无人库房机械的控制系统,其特征在于,该系统包括:特征获取模块,用于模拟目标档案盒在不同放置顺序下的放置过程,根据各目标档案盒放置前后与目标位置邻近的其他档案盒的倾倒方向获得其他档案盒的状态特征;根据其他档案盒与目标位置的距离获得其位置特征;目标档案盒放置前后其他档案盒的状态特征和位置特征组成目标档案盒对应的放置前特征和非理想放置后特征;目标档案盒放置过程中机械臂撑开两侧档案盒的时间,为撑开特征;

放置顺序选取模块,用于不同放置顺序下的各目标档案盒对应的放置前特征和非理想放置后特征组成不同的放置前后特征矩阵;将不同放置顺序下的放置前后特征矩阵分别输入神经网络,输出不同放置顺序下各目标档案盒对应的撑开特征,同时获得不同放置顺序对应的神经网络损失值;神经网络损失值最小对应的放置顺序,为最合适的放置顺序;根据最合适的放置顺序及其对应的各目标档案盒的撑开特征控制机械臂进行放置操作。

9.根据权利要求8所述的一种基于物联网的无人库房机械的控制系统,其特征在于,所述特征获取模块还用于分别获得目标档案盒放置前后同层其他档案盒的连通域;对连通域内像素点的坐标进行成分分析获得特征值最大的主成分方向,为其他档案盒的状态特征,该状态特征为二维单位向量;其他档案盒的状态特征和其他档案盒与目标位置的距离构成一个三维向量;分别获取放置前后由同层其他档案盒对应的三维向量构成三维向量序列,为目标档案盒的放置前特征和放置后特征。

10.根据权利要求8所述的一种基于物联网的无人库房机械的控制系统,其特征在于,放置顺序选取模块,还用于训练神经网络,具体为通过模拟某种放置顺序下单个目标档案盒理想放置过程,获得其放置前特征和理想放置后特征;由非理想放置后特征与理想放置后特征的差异获得放置干扰程度;根据机械臂撑开目标档案盒两侧档案盒的时间获得放置效率;由放置干扰程度与放置效率的比值获得第一损失,利用第一损失训练神经网络;当第一损失收敛,输入放置前特征和非理想放置后特征,输出目标档案盒的撑开特征,此时单个目标档案盒是在最优放置策略进行放置的;

根据最优放置策略下目标档案盒放置后特征与理想放置后特征的差异以及撑开特征获得最优放置向量;针对目标档案盒的最优放置向量进行聚类,获得各类别中最大的最优放置向量均值;

根据最优放置策略下放置干扰程度和放置效率的比值获得目标档案盒最优放置向量的特征指标;根据最优放置向量的特征指标、最优放置向量与最大的最优放置向量均值的差值、放置干扰程度与放置效率的比值获得第二损失,利用第二损失训练神经网络,神经网络训练完成。

说明书 :

一种基于物联网的无人库房机械臂的控制方法和系统

技术领域

[0001] 本发明涉及智能档案存取管理技术领域,具体涉及一种基于物联网的无人库房机械臂的控制方法和系统。

背景技术

[0002] 档案管理系统是档案库房建设的重要环节,其中基于物联网的无人档案库房管理系统是最先进的、最符合未来档案管理的发展趋势。现有的基于物联网的无人档案库房管理系统已经初步投入使用,例如自动化、智能化的出库入库系统、档案盘点系统、档案自动取放系统,这些都极大的节省了人力,降低了档案管理的难度。但是现有的档案管理系统依然存在一些难以忽略的、尚未解决的问题。
[0003] 现有的档案取放系统利用机器人的机械臂来完成档案的取放操作,在存放档案的过程中经常会遇到一些问题,例如,当需要将一个档案盒存放在两个档案盒之间的位置时,由于两个档案盒之间间隙小,机械臂无法将档案盒塞到两个档案盒之间;虽然机械臂可以将两个档案盒之间的缝隙扩展撑开,但是这个操作会导致两侧的多个档案盒倾倒,而档案盒倾倒之后对后续其他位置的档案盒取放造成影响,导致后续档案盒取放困难或效率低;虽然为了防止两侧的档案盒倾倒,机械臂在撑开缝隙时要轻微缓慢,但是这样会导致档案的存放过程效率低。如果需要在同一个位置或区域存放多个档案盒,那么存放过程效率会非常低。

发明内容

[0004] 为了解决上述技术问题,本发明的目的在于提供一种基于物联网的无人库房机械臂的控制方法和系统,所采用的技术方案具体如下:
[0005] 第一方面,本发明一个实施例提供了一种基于物联网的无人库房机械臂的控制方法:模拟目标档案盒在不同放置顺序下的放置过程,根据各目标档案盒放置前后与目标位置邻近的其他档案盒的倾倒方向获得其他档案盒的状态特征;根据其他档案盒与目标位置的距离获得其位置特征;目标档案盒放置前后其他档案盒的状态特征和位置特征组成目标档案盒对应的放置前特征和非理想放置后特征;目标档案盒放置过程中机械臂撑开两侧档案盒的时间,为撑开特征;
[0006] 不同放置顺序下的各目标档案盒对应的放置前特征和非理想放置后特征组成不同的放置前后特征矩阵;将不同放置顺序下的放置前后特征矩阵分别输入神经网络,输出不同放置顺序下各目标档案盒对应的撑开特征,同时获得不同放置顺序对应的神经网络损失值;神经网络损失值最小对应的放置顺序,为最合适的放置顺序;根据最合适的放置顺序及其对应的各目标档案盒的撑开特征控制机械臂进行放置操作。
[0007] 优选地,分别获得目标档案盒放置前后同层其他档案盒的连通域;对连通域内像素点的坐标进行成分分析获得特征值最大的主成分方向,为其他档案盒的状态特征,该状态特征为二维单位向量;其他档案盒的状态特征和其他档案盒与目标位置的距离构成一个三维向量;分别获取放置前后由同层其他档案盒对应的三维向量构成三维向量序列,为目标档案盒的放置前特征和放置后特征。
[0008] 优选地,神经网络的训练过程具体为:通过模拟某种放置顺序下单个目标档案盒理想放置过程,获得其放置前特征和理想放置后特征;由非理想放置后特征与理想放置后特征的差异获得放置干扰程度;根据机械臂撑开目标档案盒两侧档案盒的时间获得放置效率;由放置干扰程度与放置效率的比值获得第一损失,利用第一损失训练神经网络;当第一损失收敛,输入放置前特征和非理想放置后特征,输出目标档案盒的撑开特征,此时单个目标档案盒是在最优放置策略进行放置的;
[0009] 根据最优放置策略下目标档案盒放置后特征与理想放置后特征的差异以及撑开特征获得最优放置向量;针对目标档案盒的最优放置向量进行聚类,获得各类别中最大的最优放置向量均值;
[0010] 根据最优放置策略下放置干扰程度和放置效率的比值获得目标档案盒最优放置向量的特征指标;根据最优放置向量的特征指标、最优放置向量与最大的最优放置向量均值的差值、放置干扰程度与放置效率的比值获得第二损失,利用第二损失训练神经网络,神经网络训练完成。
[0011] 优选地,非理想放置后特征和理想放置特征的差异为一个偏移向量,并利用梯度下降算法不断更新偏移向量,直至第一损失和第二损失收敛。
[0012] 优选地,目标档案盒的最优放置向量的特征指标具体为:
[0013]
[0014] 其中,M0ki表示在最优放置策略下放置时第k种放置顺序中第i个目标档案盒的最优放置向量的特征指标;F0ki表示在最优放置策略下放置时第k种放置顺序中第i个目标档案盒的放置效率;Q0ki表示在最优放置策略下放置时第k种放置顺序中第i个目标档案盒的放置干扰程度。
[0015] 优选地,第二损失具体为:
[0016]
[0017] 其中,Loss2为第二损失; 为归一化系数;N为目标档案盒的个数;w0ki表示在第k种放置顺序中对第i个目标档案盒的关注系数;M0ki表示在最优放置策略下放置时第k种放置顺序中第i个目标档案盒的最优放置向量的特征指标;Qki表示第k种放置顺序中第i个目标档案盒放置时的放置干扰程度;Fki表示第k种放置顺序中第i个目标档案盒放置时的放置效率。
[0018] 优选地,关注系数具体为:根据第k种放置顺序中第i个目标档案盒的最优放置向量与最大的最优放置向量均值差值的L2范数获得。
[0019] 第二方面,本发明另一个实施例提供了一种基于物联网的无人库房机械臂的控制系统。系统包括:特征获取模块,用于模拟目标档案盒在不同放置顺序下的放置过程,根据各目标档案盒放置前后与目标位置邻近的其他档案盒的倾倒方向获得其他档案盒的状态特征;根据其他档案盒与目标位置的距离获得其位置特征;目标档案盒放置前后其他档案盒的状态特征和位置特征组成目标档案盒对应的放置前特征和非理想放置后特征;目标档案盒放置过程中机械臂撑开两侧档案盒的时间,为撑开特征;
[0020] 放置顺序选取模块,用于不同放置顺序下的各目标档案盒对应的放置前特征和非理想放置后特征组成不同的放置前后特征矩阵;将不同放置顺序下的放置前后特征矩阵分别输入神经网络,输出不同放置顺序下各目标档案盒对应的撑开特征,同时获得不同放置顺序对应的神经网络损失值;神经网络损失值最小对应的放置顺序,为最合适的放置顺序;根据最合适的放置顺序及其对应的各目标档案盒的撑开特征控制机械臂进行放置操作。
[0021] 优选地,特征获取模块还用于分别获得目标档案盒放置前后同层其他档案盒的连通域;对连通域内像素点的坐标进行成分分析获得特征值最大的主成分方向,为其他档案盒的状态特征,该状态特征为二维单位向量;其他档案盒的状态特征和其他档案盒与目标位置的距离构成一个三维向量;分别获取放置前后由同层其他档案盒对应的三维向量构成三维向量序列,为目标档案盒的放置前特征和放置后特征。
[0022] 优选地,放置顺序选取模块,还用于训练神经网络,具体为通过模拟某种放置顺序下单个目标档案盒理想放置过程,获得其放置前特征和理想放置后特征;由非理想放置后特征与理想放置后特征的差异获得放置干扰程度;根据机械臂撑开目标档案盒两侧档案盒的时间获得放置效率;由放置干扰程度与放置效率的比值获得第一损失,利用第一损失训练神经网络;当第一损失收敛,输入放置前特征和非理想放置后特征,输出目标档案盒的撑开特征,此时单个目标档案盒是在最优放置策略进行放置的;
[0023] 根据最优放置策略下目标档案盒放置后特征与理想放置后特征的差异以及撑开特征获得最优放置向量;针对目标档案盒的最优放置向量进行聚类,获得各类别中最大的最优放置向量均值;
[0024] 根据最优放置策略下放置干扰程度和放置效率的比值获得目标档案盒最优放置向量的特征指标;根据最优放置向量的特征指标、最优放置向量与最大的最优放置向量均值的差值、放置干扰程度与放置效率的比值获得第二损失,利用第二损失训练神经网络,神经网络训练完成。
[0025] 本发明实施例至少具有如下有益效果:本发明通过获取档案盒在放置前后档案架上其他档案盒的特征和机械臂撑开特征的关系,来获得每个档案盒在单独存放时的最优放置向量和特征指标,用于获得不同档案盒在统一整体放置时的重要性。然后根据每个档案盒在单独存放时的重要性以及来获得统一整体放置时的最优放置过程。保证多个档案盒在放置时具有最大的效率以及尽可能不对后续其他档案盒的放置产生影响。

附图说明

[0026] 为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
[0027] 图1为本发明的一个实施例提供的一种基于物联网的无人库房机械臂的控制方法流程图。

具体实施方式

[0028] 为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于物联网的无人库房机械臂的控制方法和系统,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构、或特点可由任何合适形式组合。
[0029] 除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
[0030] 下面结合附图具体的说明本发明所提供的一种基于物联网的无人库房机械臂的控制方法和系统的具体方案。
[0031] 实施例1
[0032] 本发明的主要应用场景为:无人库房中利用机械臂对档案盒的存取过程,机械臂在放置档案盒时若档案盒放置位置的空隙不够大,会把档案盒放置位置两侧的档案盒撑开进行放置,撑开两档案盒的过程可能会对其他档案盒的摆放状态造成影响,从而降低多个档案盒进行放置时的放置效率;本发明应用于撑开档案盒的机械臂控制。
[0033] 请参阅图1,其示出了本发明一个实施例提供的一种基于物联网的无人库房机械臂的控制方法的步骤流程图,该方法包括以下步骤:
[0034] 步骤一:构造基于物联网的档案柜可视化系统,具体过程如下:
[0035] 在档案室内安装多个相机,每个相机都朝向不同的档案柜上的档案盒,相机上安装通信设备,构建物联网系统,该系统将所有相机实时采集的图像均上传至中心服务器上。本实施例利用这些相机采集的图像获得档案柜上每个档案盒的位置,具体方法为:
[0036] 在档案柜上放置棋盘格,获取相机采集的任意一张RGB图像,该图像中都包含棋盘格,由于相机的透视和视角问题,导致图像中的棋盘格不再平行于相机平面,本实施例将图像输入关键点检测网络中获得棋盘格上的关键点,所述的关键点是棋盘格上的网格点,然后对这些关键点进行投影变换,使得这些关键点构成的网格面(棋盘格)正对相机、平行相机平面。
[0037] 某一时刻不同相机在同一个档案柜上采集的多张图像,包含着档案柜不同位置的图像信息,这些图像都进行上述投影变换,使得这些图像都正视相机;然后将投影变换后的图像拼接融合在一起,构成档案柜的正视全景图,正视全景图包含一个档案柜中所有档案盒的图像信息。
[0038] 将上述每张投影变换前的图像输入实例分割网络,例如MaskR‑CNN,获得图像上每个档案盒的连通域,本实施例所述的档案盒的连通域不是指档案盒所有面在图像上的区域,而是指档案盒朝向档案柜外部的侧面在图像上的区域。然后将每个档案盒的连通域通过同样的投影变换映射到档案柜的正视全景图上。
[0039] 至此,在某一时刻获得了某个档案柜的正视全景图,以及正视全景图上每个档案盒的连通域。将每个档案柜的正视全景图实时显示在屏幕上,并标注处每个档案盒的连通域,这样就构造出档案盒室内档案盒的可视化系统。
[0040] 步骤二:获得放置过程中与放置目标位置相邻近的两侧档案盒的状态特征和位置特征,进而获得目标档案盒对应的放置前特征和放置后特征。
[0041] 现有档案盒自动取放系统或方法的工作过程大致为:设计可以在档案柜之间自由移动的机器人,机器人通过视觉定位系统获取需要取放的档案盒的位置,然后机器人利用机械臂从该位置取出档案盒或者将档案盒放置在该位置处。但是在放置档案盒时,由于放置档案盒的位置两侧存在相邻近的两个档案盒,这两个档案盒之间的缝隙如果较小,则无法放置档案盒,那么就需要将档案盒放置到别的位置,这样一来导致档案盒的放置位置改变,不利于档案盒的分类管理或查询。本实施例的方法是利用机械臂将这个缝隙撑开,使其能够恰好放置下一个档案盒,但是机械臂在撑开缝隙时会导致两侧的其他档案盒倾倒,不利于后续档案盒的取放操作,特别是需要在一个档案柜上同一层连续存放多个档案盒时,导致档案盒取放效率低下,甚至无法进行取放操作或者导致档案柜上的档案盒摆放不整齐。
[0042] 针对上述问题本发明提出一种机械臂的控制方法,使得在档案柜的同一层上连续放置多个档案盒时具有较高的放置效率,且不影响后续的取放操作。将需要被放置到档案柜上的档案盒称为目标档案盒,被放置的位置称为目标位置,一个目标档案盒对应一个目标位置,本实施例中档案盒的宽度都是一样的。
[0043] 机器人进行多次目标档案盒的放置操作,所述的放置操作是指:首先机器人利用视觉定位系统获得目标档案盒所要存放的位置,即目标位置;然后利用机械臂将目标位置的间隙撑开,使该位置恰好能够放置一个档案盒;最后机械臂将目标档案盒放置在目标位置处。这个操作过程就是一个档案盒的存放过程,其中的存放位置和机械臂撑开间隙的时间是可以获得的。
[0044] 在放置操作中,在档案柜的正视全景图上,获得目标位置,以及同层其他所有档案盒的连通域。获取每个档案盒连通域内所有像素坐标的均值,该均值作为每个档案盒在档案柜上的位置。另外,对于某个连通域内的所有像素坐标,利用PCA算法获得这些像素坐标的主成分方向,由PCA算法可知:可获得两个主成分方向,每个主成分方向都是一个二维单位向量,每个主成分方向对应一个特征值。本实施例获取特征值最大的主成分方向,称为某个档案盒的状态特征,用于表示档案盒的倾倒方向。对于正常放置的档案盒,其状态特征是一个竖直向上的单位向量;对于平放在档案柜上的档案盒,其状态特征是一个水平朝向的单位向量;对于倾倒的档案盒,其状态特征为和竖直方向有夹角的单位向量。至此,上述给出了在放置操作中,任意时刻档案柜上每一层每个档案盒的位置状态特征的方法。
[0045] 当放置一个目标档案盒前,获取档案柜上(同一层)每个档案盒的位置与目标位置的水平距离,该水平距离称为放置该目标档案盒时每个档案盒的位置特征。本实施例获取目标位置左右两个各M/2个档案盒的状态特征和位置特征,优选地,本实施例M=10,如果档案柜上的档案盒太少,就利用计算机生成一些虚拟的竖直放置的、紧挨着的档案盒,生成过程是简单常规的几何处理过程;目标档案盒放置之前,获取目标位置两侧各M/2个档案盒的状态特征和位置特征,每个档案盒的状态特征和位置特征构成一个三维向量,M个档案盒对应的三维向量构成一个三维向量序列,称为这个目标档案盒的放置前特征;目标档案盒放置之后,获取刚放置好的目标档案盒两侧各M/2个档案盒的状态特征和位置特征,每个档案盒的状态特征和位置特征构成一个三维向量,M个档案盒对应的三维向量构成一个三维向量序列,称为这个目标档案盒的放置后特征。
[0046] 在放置这个目标档案盒时,撑开的时间称为撑开特征。本实施例机械臂撑开缝隙的大小为档案盒的宽度,当已知撑开的时间时便可获知撑开缝隙时的速度。至此每完成一次目标档案盒的放置操作就获得该目标档案盒的一组放置前特征、放置后特征和撑开特征。
[0047] 步骤三:根据模拟不同放置顺序下目标档案盒放置过程,获得放置前特征、放置后特征和撑开特征,训练神经网络获得放置前后特征与撑开特征的关系;同时获得最合适的放置顺序以及最合适的放置顺序下各目标档案盒的撑开特征,从而控制机械臂对目标档案盒进行放置操作,具体过程如下:
[0048] 在历史上模拟的多次档案盒放置操作中,获得多组的放置前特征、放置后特征和撑开特征,本实施例以放置前特征和放置后特征为数据,以撑开特征为数据对应的标签,构建一个数据集。构建一个神经网络,该神经网络是由6层全连接层构成,该神经网络的输入为放置前特征和放置后特征,输出的是撑开特征。根据上述数据集利用均方差损失函数,使用随机梯度下降法训练该神经网络,使其收敛。该神经网络用于表征放置前特征和放置后特征与撑开特征的关系。
[0049] 在当前时刻存放目标档案盒时,可能需要在一个档案柜上同一层存放多个档案盒,本发明需要获取一种正确的存放顺序放置操作,保证放置的效率高且不影响后续的取放操作。
[0050] 假设当前有N个档案盒需要依次存放在档案柜的某一层上,获取第i个目标档案盒的目标位置,目标位置的获取方法为:在放置档案盒时,为了保证档案盒摆放的有条理,有次序,方便查询与查找或管理,目标档案盒的放置位置是由档案柜上已经放置了什么编号的档案盒决定的,本发明将目标档案盒放置在与其编号最接近的档案盒旁边并紧挨着这个档案盒,即与目标档案盒编号接近的档案盒旁的一个档案盒宽度的位置就是目标位置。
[0051] N个档案盒按照顺序依次放置时共有K=N!种放置顺序。为了减少计算量当N>8时,从其中随机选择N个进行放置。不同的放置顺序有不同的放置效率以及对后续档案盒的取放有不同的影响,对每种放置顺序进行分析处理。模拟目标档案盒在不同放置顺序下的放置过程,根据各目标档案盒放置前后与目标位置邻近的其他档案盒的倾倒方向获得其他档案盒的状态特征;根据其他档案盒与目标位置的距离获得其位置特征;目标档案盒放置前后其他档案盒的状态特征和位置特征组成目标档案盒对应的放置前特征和非理想放置后特征;目标档案盒放置过程中机械臂撑开两侧档案盒的时间,为撑开特征。
[0052] 本实施例需要模拟每种放置顺序的放置过程,在某种放置顺序中,将N个档案盒按顺序放置在档案柜上,本发明假设该放置过程是理想的,所述的理想存放过程是指存放每个目标档案盒的时候不改变其他档案盒的状态特征,每个目标档案盒视为一个有固定长宽高的刚体盒子;需要注意的是:当把一个目标档案盒存放到档案柜上时,由于机械臂的撑开过程,导致其他档案盒的位置可能发生改变,位置改变的结果根据简单的几何分析就可以获得。本实施例利用计算机模拟这个理想放置过程,获得每放置一个目标档案盒之后其他档案盒的位置。
[0053] 第k种放置顺序中,如果放置过程是理想的,放置第i个目标档案盒前后,其他档案盒的状态特征是已知的,位置特征也是可以求取的,也就是说第k种放置顺序中,第i个档案盒的放置前特征和放置后特征是已知的,分别记为aki,bki。
[0054] 在第k中放置顺序中,在已知第i个目标档案盒放置前特征aki时,需要根据神经网络获得第i个目标档案盒放置过程中的一个撑开特征,期望让这个档案盒在放置过程中具有较高的放置效率和较低的影响与干扰。具体方法为:
[0055] 对于非理想放置过程,假设第i个目标档案盒放置后特征bki+Δbki,其中bki是理想放置过程的放置后特征,Δbki是一个待更新参数,表示实际放置过程和理想放置过程的差异。将aki与bki+Δbki输入神经网络中,获得的输出结果为cki,其表示放置第i个档案盒时机械臂上机械臂的撑开特征,即撑开的时间。
[0056] 获得目标档案盒放置后的放置干扰程度:
[0057] Qki=||Δbki||2
[0058] Qki表示Δbki的L2范数,该值越小表示放置后特征越接近理想放置后特征,对其他档案盒的影响和干扰就越小。
[0059] 放置目标档案盒的放置效率为:
[0060] Fki=exp(‑cki)
[0061] 该值越大说明可以更快的撑开缝隙,撑开效率越大。
[0062] 为了保证放置过程中具有较高的放置效率和较低的影响与干扰,本实施例期望获取一个合适的Δbki令Qki最小且Fki最大,具体方法为:重新构造神经网络的损失函数,为第一损失:
[0063]
[0064] 然后保持神经网络的参数不变,将Δbki视为可更新参数,将aki与bki+Δbki作为输入数据,利用梯度下降算法更新Δbki,使Δbki收敛。当Δbki收敛之后,获得放置效率、放置干扰程度和撑开特征,分别记为F0ki、Q0ki和c0ki,那么以c0ki所示的撑开时间来约束撑开时的速度将缝隙撑开到一个档案盒的宽度,然后放置目标档案盒i;如果缝隙宽度大于档案盒宽度,则不进行撑开,直接进行放置,此时撑开时间记为0。
[0065] aki是理想放置前特征,bki+Δbki为理想放置后偏移特征,其中Δbki成为偏移向量,是一个待更新参数,因此在使用Loss1训练神经网络时,网络的输入为理想放置前特征和理想放置后偏移特征。优选地,Δbki的初始值是一个三维的0向量,当使用Loss1训练时Δbki会不断的更新变化,直至Loss1收敛到最小值。
[0066] 以撑开特征c0ki进行放置过程就是放置效率和放置干扰程度最小的放置策略,即最优的放置策略。
[0067] 至此在第k中放置顺序中,获得了第i个目标档案盒最优的放置策略,将v0ki=[F0ki,Q0ki]称为第k种顺序过程中第i个目标档案盒的最优放置向量,用于表示最小的放置干扰程度与最大的放置效率。获得最优放置向量v0ki的特征指标:
[0068]
[0069] 其中,M0ki表示在最优放置策略下放置时第k种放置顺序中第i个目标档案盒的最优放置向量的特征指标;F0ki表示最优放置策略下放置时第k种放置顺序中第i个目标档案盒的放置效率;Q0ki表示最优放置策略下放置时第k种放置顺序中第i个目标档案盒的放置干扰程度。
[0070] 在第k种放置顺序中,获得所有目标档案盒的最优放置向量,对这些最优放置向量进行聚类,可以获得多个类别,每个类别都是一些最优放置向量构成的集合,同一个类别中的最优放置向量集中分布在一起,表示这些最优放置向量对应的目标档案盒具有近似的放置效率和放置干扰程度。获取每个类别中所有最优放置向量的特征指标的均值,保留均值最大的类别,记为S0k,这个类别中每个最优放置向量对应的目标档案盒的放置过程或放置策略最符合期望;在后续,本实施例期望较多的关注或保留这些目标档案盒的放置策略。
[0071] 上述为每个目标档案盒获得的放置过程或放置策略只是针对目标档案盒单独放置时获得的。本实施例需要让第k种放置顺序中所有的N个目标档案盒的放置过程的放置效率是最大的、放置干扰程度是最小的。那么就获取N个同样参数的神经网络,将aki与bki+Δbki重新输入第i个神经网络中,获得的输出结果为cki,放置干扰程度为Qki=||Δbki||2,放置效率Fki=exp(‑cki)。
[0072] 重新构建一个损失函数,为第二损失:
[0073]
[0074] 其中,Loss2为第二损失; 为归一化系数;N为目标档案盒的个数;w0ki表示在第k种放置顺序中对第i个目标档案盒的关注系数;M0ki表示在最优放置策略下放置时第k种放置顺序中第i个目标档案盒的最优放置向量的特征指标;Qki表示第k种放置顺序中第i个目标档案盒放置时的放置干扰程度;Fki表示第k种放置顺序中第i个目标档案盒放置时的放置效率。
[0075] 为了保证整个放置过程最优,本实施例期望Qki最小、Fki最大。w0ki表示在第k中放置顺序中,对第i个目标档案盒的关注系数。计算方法为:获取上述第i个目标档案盒的最优放置向量v0i以及S0ki中所有最优放置向量的均值v0,那么w0i=exp(‑||v0i‑v0||2);
[0076] 因为类别S0ki中所有最优放置向量对应的目标档案盒的放置过程最符合期望,本发明期望尽可能的保留与这些目标档案盒的放置过程。即||v0i‑v0||2越小w0i越大,说明第i个目标档案盒在单独放置时越靠近期望的放置过程,那么在考虑整体的放置过程中就越有必要考虑第i个目标档案盒单独放置时的放置过程,以保证尽可能使整个放置过程最优;
[0077] M0ki表示第i个目标档案盒单独放置时的特征指标,该值越大,本实施例就更加关注第i个目标档案盒整体的放置过程中的放置情况。
[0078] 保持所有神经网络的参数不变,利用梯度下降法更新改变Δbki,i=1,2,...,N,使这些值收敛,并利用第二损失训练神经网络,当收敛之后,第二损失Loss2收敛且取值最小,每个神经网络输出的就是每个目标档案盒放置时的撑开特征,机械臂就按照这些撑开特征并遵循第k种顺序放置目标档案盒时,可以达到放置效率是最大、放置干扰程度是最小的目的,不仅放的快,还不影响后续的放置与取出,此时整个放置过程是最优的。
[0079] 其中,当第二损失Loss2收敛时, 的大小记为第k种放置顺序的综合特征指标,该值越大,说明第k种放置顺序越合适。模拟获得第k种放置顺序中各目标档案盒的放置前特征和非理想放置特征,由各目标档案盒对应的放置前特征和非理想放置后特征构成放置前后特征矩阵;将放置前后特征矩阵输入神经网络,输出第k种放置顺序中各目标档案盒的撑开特征,同时获得第k种放置顺序的综合特征指标。
[0080] 不同放置顺序下的各目标档案盒对应的放置前特征和非理想放置后特征组成不同的放置前后特征矩阵;将不同放置顺序下的放置前后特征矩阵分别输入神经网络,输出不同放置顺序下各目标档案盒对应的撑开特征,同时获得不同放置顺序对应的神经网络损失值;至此为K种放置顺序中的每个目标档案盒的放置过程分配了具体放置时的撑开特征,以及对应的综合特征指标;神经网络损失值最小对应的放置顺序,即 最大时对应的放置顺序为最合适的放置顺序;根据最合适的放置顺序及其对应的各目标档案盒的撑开特征控制机械臂进行放置操作。
[0081] 本实施例获取综合特征指标最大的放置顺序,以及每个目标档案盒的放置时的撑开特征。然后控制机械臂进行档案盒的放置。此次实现了N个目标档案盒的按顺序的放置操作,使得在放置的时候具有较高的放置效率,且不干扰后续的取放操作;通过撑开时间等参数来大致获得放置N个目标档案盒所需的时间,可用于来协同其他机器人的放置过程。
[0082] 实施例2
[0083] 本实施例提供了一种系统实施例。一种基于物联网的无人库房机械臂的控制系统,该系统包括:特征获取模块,用于模拟目标档案盒在不同放置顺序下的放置过程,根据各目标档案盒放置前后与目标位置邻近的其他档案盒的倾倒方向获得其他档案盒的状态特征;根据其他档案盒与目标位置的距离获得其位置特征;目标档案盒放置前后其他档案盒的状态特征和位置特征组成目标档案盒对应的放置前特征和非理想放置后特征;目标档案盒放置过程中机械臂撑开两侧档案盒的时间,为撑开特征;
[0084] 放置顺序选取模块,用于不同放置顺序下的各目标档案盒对应的放置前特征和非理想放置后特征组成不同的放置前后特征矩阵;将不同放置顺序下的放置前后特征矩阵分别输入神经网络,输出不同放置顺序下各目标档案盒对应的撑开特征,同时获得不同放置顺序对应的神经网络损失值;神经网络损失值最小对应的放置顺序,为最合适的放置顺序;根据最合适的放置顺序及其对应的各目标档案盒的撑开特征控制机械臂进行放置操作。
[0085] 优选地,特征获取模块还用于分别获得目标档案盒放置前后同层其他档案盒的连通域;对连通域内像素点的坐标进行成分分析获得特征值最大的主成分方向,为其他档案盒的状态特征,该状态特征为二维单位向量;其他档案盒的状态特征和其他档案盒与目标位置的距离构成一个三维向量;分别获取放置前后由同层其他档案盒对应的三维向量构成三维向量序列,为目标档案盒的放置前特征和放置后特征。
[0086] 优选地,放置顺序选取模块,还用于训练神经网络,具体为通过模拟某种放置顺序下单个目标档案盒理想放置过程,获得其放置前特征和理想放置后特征;由非理想放置后特征与理想放置后特征的差异获得放置干扰程度;根据机械臂撑开目标档案盒两侧档案盒的时间获得放置效率;由放置干扰程度与放置效率的比值获得第一损失,利用第一损失训练神经网络;当第一损失收敛,输入放置前特征和非理想放置后特征,输出目标档案盒的撑开特征,此时单个目标档案盒是在最优放置策略进行放置的;
[0087] 根据最优放置策略下目标档案盒放置后特征与理想放置后特征的差异以及撑开特征获得最优放置向量;针对目标档案盒的最优放置向量进行聚类,获得各类别中最大的最优放置向量均值;
[0088] 根据最优放置策略下放置干扰程度和放置效率的比值获得目标档案盒最优放置向量的特征指标;根据最优放置向量的特征指标、最优放置向量与最大的最优放置向量均值的差值、放置干扰程度与放置效率的比值获得第二损失,利用第二损失训练神经网络,神经网络训练完成。
[0089] 需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0090] 本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
[0091] 以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。