数据处理方法、装置及控制设备转让专利

申请号 : CN201811165917.1

文献号 : CN109291049B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 丁磊

申请人 : 北京木业邦科技有限公司

摘要 :

本发明实施例提供数据处理方法、装置及控制设备,属于人工智能领域。该方法包括:获取样本数据;根据预设在第一应用场景下的第一神经网络模型对所述样本数据进行处理,以控制执行机构在第二应用场景下进行输出;获取输出结果数据;将所述输出结果数据作为反馈数据对所述第一神经网络模型进行再训练,修正所述第一神经网络模型以适应所述第二应用场景。从而使得该装置能够在更换工作场所后,通过学习来适应新的工作场所,进而有效增加了适应范围,使得该装置能够适应更多的工作场所,进而有效降低了设备的开发成本和开发周期。

权利要求 :

1.一种数据处理方法,其特征在于,所述方法包括:

获取样本数据;

根据预设在第一应用场景下的第一神经网络模型对所述样本数据进行处理,以控制执行机构在第二应用场景下进行输出;

获取输出结果数据;

根据已适应所述第二应用场景的第二神经网络模型对所述样本数据进行处理后,获取所述第二神经网络模型控制所述执行机构在所述第二应用场景下进行输出的理想结果数据作为比对数据;

将所述比对数据与所述输出结果数据一起作为反馈数据对所述第一神经网络模型进行再训练,修正所述第一神经网络模型以适应所述第二应用场景。

2.根据权利要求1所述的方法,其特征在于,所述将所述输出结果数据作为反馈数据对所述第一神经网络模型进行再训练包括:在每次获得一个所述输出结果数据后,就将所述输出结果数据与所述比对数据一起作为反馈数据对所述第一神经网络模型进行再训练;或者,在获得的所述输出结果数据的数量达到预设值后,将所有的所述输出结果数据与所述比对数据一起作为反馈数据对所述第一神经网络模型进行再训练。

3.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述输出结果数据和所述比对数据获取所述第一神经网络模型在所述第二应用场景下的执行准确率;

当所述准确率超过预设阈值时,确认所述第一神经网络模型已适应所述第二应用场景。

4.根据权利要求1所述的方法,其特征在于,所述理想结果数据为虚拟执行输出的数据。

5.一种数据处理装置,其特征在于,包括:

第一获取模块,用于获取样本数据;

模型控制模块,用于根据预设在第一应用场景下的第一神经网络模型对所述样本数据进行处理,以控制执行机构在第二应用场景下进行输出;

第二获取模块,用于获取输出结果数据;

第三获取模块,用于根据已适应所述第二应用场景的第二神经网络模型对所述样本数据进行处理后,获取所述第二神经网络模型控制执行机构在所述第二应用场景下进行输出的理想结果数据作为比对数据;

第一再训练模块,用于将所述比对数据与所述输出结果数据一起作为反馈数据对所述第一神经网络模型进行再训练,修正所述第一神经网络模型以适应所述第二应用场景。

6.根据权利要求5所述的装置,其特征在于,所述第一再训练模块还用于:在每次获得一个所述输出结果数据后,就将所述输出结果数据与所述比对数据一起作为反馈数据对所述第一神经网络模型进行再训练;或者,在获得的所述输出结果数据的数量达到预设值后,将所有的所述输出结果数据与所述比对数据一起作为反馈数据对所述第一神经网络模型进行再训练。

7.根据权利要求5所述的装置,其特征在于,所述装置还包括:第四获取模块,用于根据所述输出结果数据和所述比对数据获取所述第一神经网络模型在所述第二应用场景下的执行准确率;

模式切换模块,用于当所述准确率超过预设阈值时,确认所述第一神经网络模型已适应所述第二应用场景。

8.一种控制设备,其特征在于,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如权利要求1-4中任一权项所述的方法。

9.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,该计算机指令被处理器执行时实现权利要求1-4任一项所述的方法。

说明书 :

数据处理方法、装置及控制设备

技术领域

[0001] 本发明涉及人工智能领域,具体而言,涉及数据处理方法、装置及控制设备。

背景技术

[0002] 随着人工智能技术的发展,使得自动化设备能够具有一定的适用性,目前自动化生产线可以应用机器人、或自动化机械设备来完成一些特定的任务,例如对物体的挑选、搬运、分类等。这些自动化设备可以通过装配传感器和对应的控制模块来完成所述特定的任务。一般而言,控制模块使用固定的视觉和控制算法,例如通过一个视觉传感器,识别一个质量有残缺的工件,并通过机械臂的伺服电机驱动机械臂或简单的抓取设备来完成工件的挑选。然而,这种设备必须提前设计并安装调试,才能完成指定的任务。例如,在一些非常细分的工业领域,例如木材加工领域,由于木材的非标准化属性,使得加工该设备往往很难提前确定需求。也就是说,对设备的需求往往处在多样化和随时变动的需求。例如,一个木材加工厂今天需要一个分选木板的设备,而明天可能需要一个对木板进行钻孔的需求。再或者,一家工厂的分选的木板尺寸为1米*0.5米,而另外一家工厂需要分选的木板尺寸为0.2米*0.1米。因此就要开发很多套自动化设备去满足多样化的需求,从而会有效提高设备的开发成本以及开发周期。

发明内容

[0003] 为解决上述问题,本发明实施例提供数据处理方法、装置及控制设备。
[0004] 第一方面,本发明实施例提供了一种数据处理方法,应用于自动化机器人系统,所述系统包括控制中心和执行机构,所述方法包括:获取样本数据;根据预设在第一应用场景下的第一神经网络模型对所述样本数据进行处理,以控制执行机构在第二应用场景下进行输出;获取输出结果数据;将所述输出结果数据作为反馈数据对所述第一神经网络模型进行再训练,修正所述第一神经网络模型以适应所述第二应用场景。
[0005] 进一步地,所述将所述输出结果数据作为反馈数据对所述第一神经网络模型进行再训练包括:在每次获得一个所述输出结果数据后,就将所述输出结果数据作为反馈数据对所述第一神经网络模型进行再训练;或者,在获得的所述输出结果数据的数量达到预设值后,将所有的所述输出结果数据作为反馈数据对所述第一神经网络模型进行再训练。
[0006] 进一步地,所述方法还包括:获取比对数据;将所述比对数据与所述输出结果数据一起作为反馈数据对所述第一神经网络模型进行再训练。
[0007] 进一步地,所述方法还包括:根据所述输出结果数据和所述比对数据获取所述第一神经网络模型在所述第二应用场景下的执行准确率;当所述准确率超过预设阈值时,确认所述第一神经网络模型已适应所述第二应用场景。
[0008] 进一步地,所述获取比对数据包括以下至少一个步骤:根据所述第一神经网络模型对所述样本数据进行处理后,获取所述第一神经网络模型控制所述执行机构在第一应用场景下进行输出的期望结果数据作为比对数据;根据已适应所述第二应用场景的第二神经网络模型对所述样本数据进行处理后,获取所述第二神经网络模型控制执行机构在所述第二应用场景下进行输出的理想结果数据作为比对数据;和/或获取对所述输出结果数据的人工标注信息作为比对数据。
[0009] 进一步地,所述期望结果数据和/或所述理想结果数据为虚拟执行输出的数据。
[0010] 第二方面,本发明实施例提供一种数据处理装置,所述装置包括:第一获取模块,用于获取样本数据;模型控制模块,用于根据预设在第一应用场景下的第一神经网络模型对所述样本数据进行处理,以控制执行机构在第二应用场景下进行输出;第二获取模块,用于获取输出结果数据;第一再训练模块,用于将所述输出结果数据作为反馈数据对所述第一神经网络模型进行再训练,修正所述第一神经网络模型以适应所述第二应用场景。
[0011] 进一步地,所述第一再训练模块还用于:在每次获得一个所述输出结果数据后,就将所述输出结果数据作为反馈数据对所述第一神经网络模型进行再训练;或者,在获得的所述输出结果数据的数量达到预设值后,将所有的所述输出结果数据作为反馈数据对所述第一神经网络模型进行再训练。
[0012] 第三方面,本发明实施例提供一种控制设备,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如上述第一方面提供的方法。
[0013] 第四方面,本发明实施例提供了一种计算机可读存储介质,用于存储数据处理装置所用的计算机指令,其包含用于执行上述第一方面中数据处理方法所涉及的计算机指令。
[0014] 与现有技术相比,本发明实施例提供的数据处理方法、装置及控制设备带来了以下有益效果:通过获取样本数据;根据预设在第一应用场景下的第一神经网络模型对所述样本数据进行处理,以控制执行机构在第二应用场景下进行输出;获取输出结果数据;将所述输出结果数据作为反馈数据对所述第一神经网络模型进行再训练,修正所述第一神经网络模型以适应所述第二应用场景,从而使得第一神经网络模型能够适应第二应用场景,进而使得能够在更换应用场景后,通过学习来适应新的应用场景,进而有效增加了适应范围,使得能够适应更多的应用场景,而无需再为新的应用场景开发新的设备,进而有效降低了设备的开发成本和开发周期。
[0015] 本发明的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明实施例了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

[0016] 为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0017] 图1为本发明第一实施例提供的一种数据处理方法的流程图;
[0018] 图2为图1所示的一种数据处理方法中的神经网络示意图;
[0019] 图3为图1所示的一种数据处理方法中的一种工作场所示意图;
[0020] 图4为图1所示的一种数据处理方法中的另一种工作场所示意图;
[0021] 图5为本发明第二实施例提供的一种数据处理装置的结构框图;
[0022] 图6为本发明第三实施例提供的一种自动化机器人系统的结构框图;
[0023] 图7示出了一种可应用于本发明实施例中的控制设备的结构框图。

具体实施方式

[0024] 下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0025] 第一实施例
[0026] 由于现有技术是通过提前设计并安装调试,以完成指定的任务。从而使得设备无法满足各种多变的需求,为了能够适应多变的工作场景,本实施例提供了一种数据处理方法,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。以下对本实施例进行详细介绍。
[0027] 请参照图1,图1为本发明实施例提供的一种数据处理方法的流程图,所述方法应用于自动化机器人系统,所述方法包括如下步骤:
[0028] 步骤S101:获取样本数据。
[0029] 其中,所述样本数据为通过至少一个传感器采集的、将要被执行机构所处理的对象(工件)的相关数据。
[0030] 在本申请一个优选实施例中,典型地,传感器包括图像传感器,待处理对象(工件)包括木板时,样本数据为放置在工作台上的木板的至少一幅图像数据。
[0031] 可选地,第一神经网络模型可以是空白神经网络,也就是神经网络的节点权重值随机化生成。
[0032] 可选地,第一神经网络模型可以为一个预训练的神经网络,例如一个预训练的在正方形木板中央钻孔的神经网络。
[0033] 步骤S102:根据预设在第一应用场景下的第一神经网络模型对所述样本数据进行处理,以控制执行机构在第二应用场景下进行输出。
[0034] 可选地,第一应用场景可以为空白场景,也可以为非空白场景,例如,在正方形木板中央钻孔的工作场景。第二应用场景为工作场景,即该第一神经网络模型需要工作的场景,例如在正方形木板中央钻孔的工作场景。
[0035] 可选地,所述执行机构能够在二维或三维空间内移动。
[0036] 可选的,所述执行机构还包括一个操作装置,例如夹具、刀具、钻头、锯条等。
[0037] 步骤S103:获取输出结果数据。
[0038] 其中,所述输出结果数据为通过至少一个传感器采集的、执行机构在第二应用场景下进行输出的相关数据。例如,样本被执行后的图像数据。
[0039] 在本申请一个优选实施例中,典型地,传感器包括图像传感器。
[0040] 可选地,所述系统还包括多个压力传感器,多个所述压力传感器均与控制中心连接;其中,多个所述压力传感器包括第一压力传感器和第二压力传感器,所述第一压力传感器置于工件样本之下,用于采集执行机构在第二应用场景下的输出结果数据,所述第二压力传感器置于工件分选停放处,用于采集执行机构在第二应用场景下的输出结果数据。可选地,多个所述压力传感器还包括第三压力传感器,所述第三压力传感器设于所述工件样本之上,所述第三压力传感器用于采集所述执行机构在所述工件样本上执行的输出结果数据,并将所述输出结果数据发送至控制中心。例如,所述输出结果数据可以是坐标信息,如执行机构在工件样本上的点击坐标。
[0041] 举例来说,通过驱动伺服系统以控制执行机构进行工作,将钻头运行至该坐标(xi,yi,zi)对应的位置。此时,第一神经网络模型认为钻头应与工件样本中心的孔洞重合。然而,由于系统缺乏传感器的角度信息以及执行机构的位置信息,钻头并没有到达预期的位置(xc,yc,zc),也就是工件样本的中心位置。此时,控制中心通过与钻头相连的导线,发送一个已知信号到钻头。同时,控制中心通过与工件样本底部导电板相连的导线搜索该信号。
如果控制中心搜索到发送的已知信号,则认为钻头通过工件样本中的孔抵达导电板,也就是任务完成。反之,则控制中心认为钻头没有到达预定义的位置。此时,控制中心获得一个数据记录,该记录包括了工件样本的图像数据以及获得的输出结果数据。
[0042] 进一步,控制中心根据预定义规则,得到另外一个输出结果数据。例如,控制中心可以随机生成一个坐标,将执行机构驱动到对应的位置。进一步,控制中心根据第一神经网络模型的输出,将执行机构驱动到对应的位置,再次通过信号接收器检测钻头是否到达坐标(xc,yc,zc)。再例如,控制中心可以驱动预设传送装置,得到另外一个样本,并重复上述步骤。通过反复迭代上述步骤,控制中心获得大量的图像数据以及对应的结果,其中包含钻头到达坐标(xc,yc,zc)的数据以及钻头没有到达(xc,yc,zc)的数据。
[0043] 作为另一种实施方式,该系统还包括两个压力传感器,两个压力传感器分别为第一压力传感器和第二压力传感器,控制中心分别与第一压力传感器和第二压力传感器连接,两个压力传感器用于得到抓取任务的输出结果数据。其中第一压力传感器置于工件样本之下,第二压力传感器置于工件分选停放处之上。控制中心在每次执行任务之后,通过两个压力传感器的取值得到任务执行的结果。
[0044] 在另外一种实施方式中,工件样本之上置于一块透明的第三压力传感器,该传感器能够得到精确位置的压力传感数据。控制中心与该第三压力传感器相连,并在控制中心中预制一个坐标点。当系统执行任务后,如果执行机构到达正确位置,则第三压力传感器反馈一个正确的坐标值,控制中心根据该坐标值与本地预存的坐标值的匹配度得到输出结果数据。步骤S104:将所述输出结果数据作为反馈数据对所述第一神经网络模型进行再训练,修正所述第一神经网络模型以适应所述第二应用场景。
[0045] 作为一种实施方式,步骤S104包括:在每次获得一个所述输出结果数据后,就将所述输出结果数据作为反馈数据对所述第一神经网络模型进行再训练;或者,在获得的所述输出结果数据的数量达到预设值后,将所有的所述输出结果数据作为反馈数据对所述第一神经网络模型进行再训练。其中,预设值的选取可以根据实际需求进行设置,在此,不作具体限定。一般来说,预设值越大越好。
[0046] 在一可选的实施例中,所述方法还包括:获取比对数据;将所述比对数据与所述输出结果数据一起作为反馈数据对所述第一神经网络模型进行再训练。
[0047] 可选地,所述获取比对数据包括以下至少一个步骤:根据所述第一神经网络模型对所述样本数据进行处理后,获取所述第一神经网络模型控制所述执行机构在第一应用场景下进行输出的期望结果数据作为比对数据;根据已适应所述第二应用场景的第二神经网络模型对所述样本数据进行处理后,获取所述第二神经网络模型控制执行机构在所述第二应用场景下进行输出的理想结果数据作为比对数据;和/或获取对所述输出结果数据的人工标注信息作为比对数据。例如,在第二应用场景下,将能够正常执行任务的系统B在执行任务后所得到的结果作为理想结果数据,例如执行机构B的钻头上安装有红色的标记笔,在执行机构B执行任务后,所得到的理想结果数据为工件样本的固定区域上被红色的标记笔所标记。
[0048] 可选地,所述期望结果数据和/或所述理想结果数据为虚拟执行输出的数据。
[0049] 可选地,虚拟执行可以为模拟执行,即不采用实际的设备执行输出。
[0050] 可选地,为了提高训练效率和准确性,虚拟执行为实际执行,采用实际的设备执行输出。
[0051] 其中,人工标注信息即人工对输出结果的评价信息,可包括质量、理想结果、偏差、改进方式等。
[0052] 在一可选地实施例中,所述方法还包括:根据所述输出结果数据和所述比对数据获取所述第一神经网络模型在所述第二应用场景下的执行准确率;当所述准确率超过预设阈值时,确认所述第一神经网络模型已适应所述第二应用场景(即结束训练,进入在第二应用场景的工作模式)。
[0053] 预设阈值的选取可以根据实际需求进行设置,在此,不作具体限定。一般来说,预设阈值越大表示训练效果越好。
[0054] 进一步地,在得到足够多的输出结果数据后,将所有的所述输出结果数据作为反馈数据对所述第一神经网络模型进行再训练。
[0055] 可选地,可以直接将第一神经网络模型转入学习模式,并通过例如反向传播算法改变第一神经网络模型的节点权值。
[0056] 在一种实施方式中,在得到足够多的任务成功数据和任务失败数据后,并根据任务成功数据和任务失败数据生成一个新的训练集,重新训练一个空白神经网络(即第一神经网络模型)。
[0057] 在另一种实施方式中,在第一神经网络模型中增加新的节点,并根据新的训练数据改变整个网络的节点权值。如图2所示方式A中,系统在进行神经网络再训练时,首先在第一神经网络模型之上增加一层或多层神经网络,并通过获得的输出结果数据作为反馈数据对整个神经网络进行训练。在如图2所示方式B中,系统在第一神经网络模型的每一层增加新的节点,并使之与第一神经网络模型的前一层节点相连接,并通过获得的输出结果数据作为反馈数据对整个神经网络进行训练。
[0058] 进一步,系统还可以记录当前的设置和对应的神经网络。或者,系统可以预存执行多种任务的神经网络。在学习模式下,系统调入最接近的神经网络模型,并在该模型下快速完成神经网络的再训练。在实际使用中,在完成学习模式训练后,将模式切换为工作模式,在该模式下,使用被训练好的第一神经网络模型输出结果数据,以控制执行机构对工件进行工作。例如,对工件进行打孔,并在打孔后将工件移动至目的地。
[0059] 作为一种应用场景,如图3所示,当该系统在G1工作场景时,系统可以正常运转。如图4所示,由于临时的需求,工厂需要将该系统应用到G2工作场景。此时,只需要将图像传感器和执行机构拆卸下来,并安装到G2的工作场所。同时将夹具更换为钻头。进一步,将系统配置为学习模式,并在设置G2中自动进行学习。最后,系统自动切换至设置G2的工作模式。此时,只需要将设置G2中的工件不断输入至工作场所即可完成任务。因此,两种设置可以全部基于一套系统,并且没有特殊的安装和调试需求。从而有效提供了适应性,并且有效降低了设备的开发成本和开发周期。例如在木材加工厂中,由于经常更换工作场所,为每一家单独开发一套设备的成本高昂,尤其是在使用基于机器学习的算法时,新系统的开发意味着从头积累海量的训练数据,这大大提高了设备的开发成本和开发周期。而通过使用本发明实施例提供的数据处理方法,能够有效降低开发成本和开发周期的同时,还能够适用于各种工作场所。
[0060] 本发明实施例提供的数据处理方法,通过获取样本数据;根据预设在第一应用场景下的第一神经网络模型对所述样本数据进行处理,以控制执行机构在第二应用场景下进行输出;获取输出结果数据;将所述输出结果数据作为反馈数据对所述第一神经网络模型进行再训练,修正所述第一神经网络模型以适应所述第二应用场景,从而使得第一神经网络模型能够适应第二应用场景,进而使得能够在更换应用场景后,通过学习来适应新的应用场景,进而有效增加了适应范围,使得能够适应更多的应用场景,而无需再为新的应用场景开发新的设备,进而有效降低了设备的开发成本和开发周期。
[0061] 第二实施例
[0062] 对应于第一实施例中的数据处理方法,图5示出了采用第一实施例所示的数据处理方法一一对应的数据处理装置。如图5所示,所述数据处理装置400包括第一获取模块410、模型控制模块420、第二获取模块430和第一再训练模块440。其中,第一获取模块410、模型控制模块420、第二获取模块430和第一再训练模块440的实现功能与第一实施例中对应的步聚一一对应,为避免赘述,本实施例不一一详述。
[0063] 第一获取模块410,用于获取样本数据。
[0064] 可选地,第一获取模块410包括至少一个传感器。
[0065] 可选地,至少一个传感器可以是但不限于RGB的图像传感器、激光测距传感器、超声传感器、X射线传感器、电磁波传感器等。
[0066] 模型控制模块420,用于根据预设在第一应用场景下的第一神经网络模型对所述样本数据进行处理,以控制执行机构在第二应用场景下进行输出。
[0067] 第二获取模块430,用于获取输出结果数据。
[0068] 可选地,第二获取模块430包括至少一个传感器,第二获取模块430中的传感器与第一获取模块410中的传感器相同或不同。
[0069] 第一再训练模块440,用于将所述输出结果数据作为反馈数据对所述第一神经网络模型进行再训练,修正所述第一神经网络模型以适应所述第二应用场景。
[0070] 可选地,所述第一再训练模块440还用于:在每次获得一个所述输出结果数据后,就将所述输出结果数据作为反馈数据对所述第一神经网络模型进行再训练;或者,在获得的所述输出结果数据的数量达到预设值后,将所有的所述输出结果数据作为反馈数据对所述第一神经网络模型进行再训练。
[0071] 在一可选的实施例中,所述装置400还包括:
[0072] 第三获取模块,用于获取比对数据;
[0073] 第二再训练模块,用于将所述比对数据与所述输出结果数据一起作为反馈数据对所述第一神经网络模型进行再训练。
[0074] 在一可选的实施例中,所述装置400还包括:
[0075] 第四获取模块,用于根据所述输出结果数据和所述比对数据获取所述第一神经网络模型在所述第二应用场景下的执行准确率;
[0076] 模式切换模块,用于当所述准确率超过预设阈值时,确认所述第一神经网络模型已适应所述第二应用场景。
[0077] 可选地,所述第三获取模块包括以下至少一个子模块:
[0078] 第一子模块,用于根据所述第一神经网络模型对所述样本数据进行处理后,获取所述第一神经网络模型控制所述执行机构在第一应用场景下进行输出的期望结果数据作为比对数据;
[0079] 第二子模块,用于根据已适应所述第二应用场景的第二神经网络模型对所述样本数据进行处理后,获取所述第二神经网络模型控制执行机构在所述第二应用场景下进行输出的理想结果数据作为比对数据;和/或第三子模块,用于获取对所述输出结果数据的人工标注信息作为比对数据。
[0080] 可选地,所述期望结果数据和/或所述理想结果数据为虚拟执行输出的数据。
[0081] 可选地,虚拟执行可以为模拟执行,即不采用实际的设备执行输出。
[0082] 可选地,为了提高训练效率和准确性,虚拟执行为实际执行,采用实际的设备执行输出。
[0083] 第三实施例
[0084] 如图6所述,是基于机器学习的自动化机器人系统400的示意图。所述基于机器学习的自动化机器人系统400包括:控制中心410和执行机构420。
[0085] 控制中心410与执行机构420连接;控制中心410用于获取样本数据;根据预设在第一应用场景下的第一神经网络模型对所述样本数据进行处理,以控制执行机构420在第二应用场景下进行输出;获取输出结果数据;将所述输出结果数据作为反馈数据对所述第一神经网络模型进行再训练,修正所述第一神经网络模型以适应所述第二应用场景。
[0086] 可选地,控制中心410包括第一获取模块,第一获取模块包括至少一个传感器,第一获取模块用于获取样本数据。
[0087] 执行机构420用于在控制中心410的控制下在第二应用场景下进行输出。
[0088] 其中,执行机构420能够在二维或三维空间内移动。
[0089] 可选的,所述执行机构420还包括一个操作装置,操作装置可以是但不限于夹具、刀具、钻头、锯条等。
[0090] 在一可选的实施例中,该系统400还包括至少一个传感器,所述传感器的采集区域覆盖整个工作空间,所述传感器用于采集所述反馈数据,并将所述反馈数据发送给所述控制中心。
[0091] 可选地,传感器可以是但不限于RGB的图像传感器、激光测距传感器、超声传感器、X射线传感器、电磁波传感器等。
[0092] 其中,所述传感器并不预设任何安装位置,但需要能够覆盖整个工作空间。在一可选的实施例中,该系统400还包括多个压力传感器,多个所述压力传感器均与所述控制中心410连接;其中,多个所述压力传感器包括第一压力传感器和第二压力传感器,所述第一压力传感器置于工件样本之下,用于采集执行机构420在第二应用场景下的输出结果数据,所述第二压力传感器置于工件分选停放处,用于采集执行机构420在第二应用场景下的输出结果数据。
[0093] 可选地,多个所述压力传感器还包括第三压力传感器,所述第三压力传感器与控制中心410连接,所述第三压力传感器设于所述工件样本之上,所述第三压力传感器用于采集所述执行机构420在所述工件样本上执行的输出结果数据,并将所述输出结果数据发送至控制中心410。
[0094] 可选地,控制中心410还用于:在每次获得一个所述输出结果数据后,就将所述输出结果数据作为反馈数据对所述第一神经网络模型进行再训练;或者,在获得的所述输出结果数据的数量达到预设值后,将所有的所述输出结果数据作为反馈数据对所述第一神经网络模型进行再训练。
[0095] 在一可选地实施例中,控制中心410还用于获取比对数据;将所述比对数据与所述输出结果数据一起作为反馈数据对所述第一神经网络模型进行再训练。
[0096] 在一可选地实施例中,控制中心410还用于:根据所述输出结果数据和所述比对数据获取所述第一神经网络模型在所述第二应用场景下的执行准确率;当所述准确率超过预设阈值时,确认所述第一神经网络模型已适应所述第二应用场景。
[0097] 第四实施例
[0098] 如图7所示,是控制设备300的示意图。所述控制设备300包括存储器302、处理器304以及存储在所述存储器302中并可在所述处理器304上运行的计算机可读取指令303。当所述计算机可读取指令303由所述处理器304执行时,运行如第一实施例中的所述数据处理方法,为避免重复,此处不再赘述。。
[0099] 示例性的,计算机可读取指令303可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器302中,并由处理器304执行,以完成本发明。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机可读取指令303在控制设备300中的执行过程。例如,计算机程序303可以被分割成第二实施例中的第一获取模块410、模型控制模块420、第二获取模块430和第一再训练模块440,各模块的具体功能如第一实施例或第二实施例所述,在此不一一赘述。
[0100] 其中,存储器302可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器302用于存储程序,所述处理器304在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流程定义的方法可以应用于处理器304中,或者由处理器
304实现。
[0101] 处理器304可能是一种集成电路芯片,具有信号的处理能力。上述的处理器304可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0102] 可以理解的是,图7所示的结构仅为控制设备300的一种结构示意图,控制设备300还可以包括比图7所示更多或更少的组件。图7中所示的各组件可以采用硬件、软件或其组合实现。
[0103] 综上所述,本发明实施例提供数据处理方法、装置及控制设备,通过获取样本数据;根据预设在第一应用场景下的第一神经网络模型对所述样本数据进行处理,以控制执行机构在第二应用场景下进行输出;获取输出结果数据;将所述输出结果数据作为反馈数据对所述第一神经网络模型进行再训练,修正所述第一神经网络模型以适应所述第二应用场景,从而使得第一神经网络模型能够适应第二应用场景,进而使得能够在更换应用场景后,通过学习来适应新的应用场景,进而有效增加了适应范围,使得能够适应更多的应用场景,而无需再为新的应用场景开发新的设备,进而有效降低了设备的开发成本和开发周期。
[0104] 在本发明所提供的几个实施例中,应该理解到,所揭露的系统和方法,也可以通过其它的方式实现。以上所描述的系统实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0105] 另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
[0106] 所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者控制设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0107] 以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。