机器学习装置、示教装置的冲击抑制系统及机器学习方法转让专利

申请号 : CN201810006949.0

文献号 : CN108284434B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 杉山裕亮

申请人 : 发那科株式会社

摘要 :

本发明提供一种机器学习装置、示教装置的冲击抑制系统及机器学习方法。机器学习装置(2),学习对示教装置(10)的冲击,其具备:状态观测部(21),其观测基于所述示教装置(10)的倾斜度或所述示教装置(10)的当前位置的数据;标签取得部(23),其取得基于所述示教装置(10)受到的冲击的标签;以及学习部(22),其基于所述状态观测部(21)的输出及所述标签取得部(23)的输出来生成学习模型。

权利要求 :

1.一种机器学习装置,其学习对示教装置的冲击,其特征在于,该机器学习装置具备:

状态观测部,其观测基于所述示教装置的倾斜度或所述示教装置的当前位置的数据;

标签取得部,其取得基于所述示教装置受到的冲击的标签;以及学习部,其基于所述状态观测部的输出及所述标签取得部的输出来生成学习模型,所述学习部具备:误差计算部,其基于所述状态观测部及所述标签取得部的输出来计算误差;以及学习模型更新部,其基于所述状态观测部及所述误差计算部的输出来更新学习模型,该学习模型用于确定对所述示教装置的冲击的误差。

2.根据权利要求1所述的机器学习装置,其特征在于,所述状态观测部还观测基于按下所述示教装置的按钮的速度、作业内容、作业时间的长度、作业时间段及操作者中的至少1个的数据。

3.根据权利要求1或2所述的机器学习装置,其特征在于,所述标签取得部取得基于所述示教装置受到的冲击是否大于预定阈值的所述标签。

4.根据权利要求1所述的机器学习装置,其特征在于,所述机器学习装置具备神经网络。

5.根据权利要求1所述的机器学习装置,其特征在于,所述机器学习装置能够与至少1个其他机器学习装置相连接,在与至少1个所述其他机器学习装置之间相互交换或共享由所述机器学习装置的所述学习部生成的学习模型。

6.一种示教装置的冲击抑制系统,其特征在于,该系统具有:

权利要求1至5中任一项所述的机器学习装置、通过所述机器学习装置来学习冲击的所述示教装置、以及利用所述机器学习装置的输出的输出利用部,所述输出利用部以抑制所述示教装置的冲击的方式进行动作。

7.根据权利要求6所述的示教装置的冲击抑制系统,其特征在于,所述输出利用部基于所述机器学习装置的输出,在所述示教装置受到冲击前,进行警报输出或注意提醒来提前抑制所述示教装置受到的冲击。

8.根据权利要求7所述的示教装置的冲击抑制系统,其特征在于,所述输出利用部在所述示教装置受到预定阈值以上的大的冲击之前,对利用了光或声的警报、声音、显示器显示以及振动中的至少1个进行使用,提前抑制所述示教装置受到的大的冲击。

9.一种机器学习方法,其学习对示教装置的冲击,其特征在于,观测基于所述示教装置的倾斜度或所述示教装置的当前位置的状态数据,取得基于所述示教装置受到的冲击的标签,基于观测到的所述状态数据及所述标签来生成学习模型,所述学习模型的生成包括:

基于观测到的所述状态数据及所述标签来计算误差;

基于观测到的所述状态数据及计算出的所述误差来更新学习模型,该学习模式用于确定对所述示教装置的冲击的误差。

10.根据权利要求9所述的机器学习方法,其特征在于,所述状态数据还包含基于按下所述示教装置的按钮的速度、作业内容、作业时间的长度、作业时间段以及操作者中的至少1个的数据。

11.根据权利要求9或10所述的机器学习方法,其特征在于,所述标签基于所述示教装置受到的冲击是否大于预定阈值。

说明书 :

机器学习装置、示教装置的冲击抑制系统及机器学习方法

技术领域

[0001] 本发明涉及学习对示教装置的冲击的机器学习装置、示教装置的冲击抑制系统及机器学习方法。

背景技术

[0002] 过去,例如在对由机器人或CNC(Computer Numerical Control,计算机数字控制)装置控制的机床示教动作的情况下,使用与机器人控制装置或CNC装置相连接的示教装置(示教操作盘,示教盒,示教板,TP)来进行。这里,由于在示教盒受到强烈冲击时大多会发生故障,因此要求提前预知这样的强烈冲击并进行抑制。
[0003] 此外,在本说明书中,虽然没有对使用示教盒的系统进行详细叙述,但是本实施方式可以广泛应用于工业用机器人或协作机器人等各种机器人、或者对由CNC装置控制的各种机床等进行示教的示教盒(示教装置)、以及使用示教盒的系统。
[0004] 另外,过去,作为在有可能由于示教板的操作而变为危险状态的情况下对操作者提醒危险的技术,例如日本特开2003-011076号公报公开了一种示教板,其通过第1颜色对在某个模式下可选择的按键进行照明,进而对预先设定好的有可能引起危险状态的条件与进行控制对象的操作的时刻的所述机床控制器的状态进行比较,通过第2颜色对其结果是被判定为虽可操作但若按下则有可能引起危险的按键进行照明。
[0005] 另外,过去,例如作为一种廉价地提供保护操作盘的框体和电子电路免受落下的冲击的构造的技术,日本特开平11-179688号公报公开了一种操作盘,其在操作盘的框体上具备从外周部凸出的形状尺寸的保护板,通过保护板的变形或破损来吸收落下时的冲击,即使保护板变形或破损,也只是更换保护板。
[0006] 进一步地,过去,例如,作为被设为在由落下所引起的故障期间中仍能够继续使用机器人的机器人示教装置,日本特开2005-224872号公报公开了以下技术:设置示教装置主体、保持部、保持部固定部件等,通过保持部的弹性或塑性变形来吸收落下时的冲击,能够不受其影响地继续使用示教装置主体,即使在使用机器人的过程中也能够容易卸下已发生塑性变形的保持部,进行更换或矫正塑性变形并再次安装。
[0007] 如上所述,过去提出了各种示教板,但是并未提出提前预知对示教板的冲击并进行抑制的示教板。即,由于示教盒被各种操作者(用户)在各种环境下使用,因此可以认为难以提前预知针对示教盒的冲击(强烈冲击)并进行抑制。

发明内容

[0008] 本发明的目的在于,提供可以提前预知针对示教装置的冲击并进行抑制的机器学习装置、示教装置的冲击抑制系统及机器学习方法。
[0009] 根据本发明所涉及的第1实施方式,提供一种机器学习装置,其学习对示教装置的冲击,其中,该机器学习装置具备:状态观测部,其观测基于所述示教装置的倾斜度或所述示教装置的当前位置的数据;标签取得部,其取得基于所述示教装置受到的冲击的标签;以及学习部,其基于所述状态观测部的输出及所述标签取得部的输出来生成学习模型。
[0010] 根据本发明所涉及的第2实施方式,提供一种示教装置的冲击抑制系统,其中,该示教装置的冲击抑制系统具有:上述第1实施方式的机器学习装置、通过所述机器学习装置来学习冲击的所述示教装置、以及利用所述机器学习装置的输出的输出利用部,所述输出利用部以抑制所述示教装置的冲击的方式来进行动作。
[0011] 根据本发明所涉及的第3实施方式,提供一种机器学习方法,其学习对示教装置的冲击,其中,观测基于所述示教装置的倾斜度或所述示教装置的当前位置的状态数据,取得基于所述示教装置受到的冲击的标签,并且基于观测到的所述状态数据及所述标签来生成学习模型。

附图说明

[0012] 通过参照以下附图,将更明确地理解本发明。
[0013] 图1是示意性地表示本实施方式所涉及的示教装置的冲击抑制系统的图。
[0014] 图2是示意性地表示图1所示的示教装置的一个例子的图。
[0015] 图3是表示图1所示的机器学习装置中的学习部的一个例子的框图。
[0016] 图4是用于说明应用于图1所示的机器学习装置的处理的一个例子的流程图。

具体实施方式

[0017] 下面,参照附图,对本发明所涉及的机器学习装置、示教装置的冲击抑制系统及机器学习方法的实施方式进行详细说明。图1是示意性地表示本实施方式所涉及的示教装置的冲击抑制系统的图,图2是示意性地表示图1所示的示教装置的一个例子的图。
[0018] 如图1所示,本实施方式的示教盒的冲击抑制系统200包含机器学习装置2及输出利用部3。机器学习装置2包含:状态观测部21、学习部22及标签取得部23,环境1包含示教盒(示教装置)10及操作者100。另外,如图2所示,示教盒10包含显示部(显示器)11及按钮(操作键)12。此外,示教盒10当然也可以包括例如后述的通过声音来进行注意提醒时的扬声器、或者通过光或声来进行警报输出时的灯或蜂鸣器这样的其他各种结构。
[0019] 这里,机器学习装置2例如可以设置于控制机器人的机器人控制装置(未图示)或控制机床的CNC装置(未图示),但是也可以内置于示教盒10。另外,机器学习装置2例如也可以针对多个机器人或多台机床,设置于经由网络(例如、因特网或以太网(注册商标))的云服务器或雾服务器中。
[0020] 作为从环境1提供的输入数据(状态数据:状态变量),状态观测部21例如对示教盒10的倾斜度、示教盒10的当前位置、按下示教盒10的按钮的速度(按下按钮的时间间隔)、使用示教盒10来进行的作业内容、作业时间的长度、作业时间段以及操作示教盒10的操作者
100中的至少1个数据进行观测。
[0021] 标签取得部23取得基于示教盒10受到的冲击是否大于预定阈值的标签。学习部22基于状态观测部21的输出(状态数据)以及标签取得部23的输出(标签)来生成学习模型。
[0022] 这里,示教盒10的倾斜度例如可以从设置于示教盒10的加速度传感器或倾斜传感器的输出而得到,示教盒10的当前位置例如可以从设置于使用示教盒10的作业区域的上方的摄像机或区域传感器的输出而得到。另外,按下示教盒10的按钮的速度可以从示教盒10或机器人控制装置等得到,使用示教盒10来进行的作业内容、作业时间的长度及作业时间段可以从机器人控制装置等的程序或时钟功能得到。
[0023] 进一步地,操作示教盒10的操作者100例如可以从使用机器人控制装置等时输入的各操作者的ID输入等得到。另外,示教盒10收到的冲击例如可以从设置于示教盒10的加速度传感器得到。
[0024] 即,状态观测部21不只是将示教盒10的倾斜度及示教盒10的当前位置作为状态数据进行观测,例如还会将与操作者100是否仓促(例如,若操作者100仓促,则易于发生使示教盒10落下的失误)相关联的按下示教盒10的按钮的速度、或者与示教盒10刚接通(开启)电源后或最初操作时(例如,操作者100最初操作时容易发生失误)或示教操作(例如,复杂的示教操作容易发生失误)相关联的作业内容作为状态数据来进行观测。
[0025] 进一步地,状态观测部21例如将与作业是否较长(例如,若作业时间较长,则操作者100的集中力降低,易于发生失误)相关联的作业时间的长度、或者与操作者100进行作业的时间段(例如,午饭后操作者100犯困容易发生失误)相关联的作业时间段、或者与各操作者100(例如,特定的操作者100粗鲁地操作示教盒10,容易发生失误)相关联的操作者作为状态数据来进行观测。此外,上述状态观测部21所观测的状态数据仅为例子,当然也可以观测环境1中的其他各种数据。
[0026] 输出利用部3接收机器学习装置2的输出(通过学习模型更新部222更新后的学习模型),以抑制示教盒10的冲击的方式来进行动作。即,输出利用部3基于机器学习装置2的输出,例如在示教盒10掉下并造成较大冲击的情况下,事前进行注意提醒或警报输出。
[0027] 具体地,由设置在示教盒10中的扬声器输出“可能受到冲击。请注意。”这样的声音,对操作者100提醒注意,或者使设置在示教盒10中的灯点亮或闪烁,或者使设置在示教盒10中的蜂鸣器进行动作、或从扬声器播放出旋律等,由此对操作者100输出警报(提醒注意)。进一步地,例如在示教盒10的显示器11上显示提醒注意的语句,或者使示教盒10振动来对操作者100提醒注意。此外,注意提醒或警报输出并不限于从示教盒10自身发出,当然也可以利用机器人或机床、或者机器人控制装置或CNC装置、或者设置于机器人或机床的周边的各种单元来进行。
[0028] 由此,操作者100可以在示教盒10实际受到较大冲击前,掌握示教盒10可能受到较大冲击的状况,可以提前抑制(防止)示教盒10受到较大冲击的情况。即,可以提前预知针对示教盒(示教装置)的冲击并进行抑制。
[0029] 另外,如上所述,可以将多个机器学习装置2设置在经由网络(通信介质)的云服务器或雾服务器中,但是还可以构成为经由通信介质相互共享或交换数据。即,机器学习装置2可以与至少1个其他机器学习装置相连接,在与至少1个其他机器学习装置之间,可以相互交换或共享由机器学习装置2的学习部22生成的学习模型。
[0030] 图3是表示图1所示的机器学习装置中的学习部的一个例子的框图。如图3所示,学习部22包括误差计算部221及学习模型更新部222。误差计算部221接收来自状态观测部21的状态数据(示教盒10的倾斜度、示教盒10的当前位置、按下示教盒10的按钮的速度、作业内容、作业时间的长度、作业时间段及操作者等)、以及来自标签取得部23的标签(示教盒10受到较强冲击),并计算误差。学习模型更新部222接收来自状态观测部21的状态数据及误差计算部的输出,并对确定针对示教盒10的冲击的误差的学习模型进行更新。此外,学习模型更新部222的输出(已更新的学习模型)被输出至所述输出利用部3。
[0031] 以上,机器学习装置2例如可以使用神经网络来构成。此外,在实际构成机器学习装置2时,也可以使用通用的计算机或者处理器,但是例如在应用GPGPU(General-Purpose computing on Graphics Processing Units,通用图形处理器)或大规模PC集群等时,可以更高速地进行处理。
[0032] 图4是用于说明应用于图1所示的机器学习装置的处理的一个例子的流程图。如图4所示,若示教装置的冲击抑制系统200(示教装置10)电源接通并开始机器学习(学习开始),则在步骤ST1中,状态观测部21取得状态数据,进入步骤ST2。这里,作为状态数据(输入数据),例如,如上所述那样具有示教盒(示教装置)10的倾斜度、示教盒10的当前位置、按下示教盒10的按钮的速度(按下按钮的时间间隔)、使用示教盒10所进行的作业内容、作业时间的长度、作业时间段以及操作示教盒10的操作者。
[0033] 在步骤ST2中,对已取得的状态数据与存储的警报设定进行比较并进入步骤ST3,判定是否存在与已取得的状态数据相似(类似)的警报设定。在步骤ST3中,若判定为存在与已取得的状态数据相似的警报设定(是),则进入步骤ST4,另外,若判定为没有与已取得的状态数据相似的警报设定(否),则进入步骤ST11。
[0034] 在步骤ST4中,判定警报设定标志的阈值是否在一定以上,例如判定警报设定X标志的阈值是否在一定以上。在步骤ST4中,若判定为警报设定X标志的阈值为一定以上(是),则进入步骤ST5,并进行注意提醒(警报输出),进而,进入步骤ST6。这里,作为步骤ST5中的注意提醒,例如对利用光(灯的点亮或闪烁)或声(蜂鸣器或旋律)的警报、声音、显示器显示及振动中的至少1个进行利用,可以提前抑制(防止)将示教盒10受到的较大冲击。此外,在步骤ST4中,若判定为警报设定X标志的阈值不在一定以上(否),则进入步骤ST11。
[0035] 在步骤ST6中,增加持续警报设定标志,进入步骤ST7,并判定持续警报设定标志是否在阈值以上。这里,持续警报设定标志,基于机器学习的结果,例如对于在某些状况下示教盒10频繁掉落的、非一时性的持续的情况下的警报,增加该持续警报设定标志。
[0036] 接着,进入步骤ST7,若判定为持续警报设定标志不在阈值以上(否),则进入步骤ST8,判定示教盒10是否已受到较强冲击。另一方面,在步骤ST7中,若判定为持续警报设定标志在阈值以上(是),则进入步骤ST17,并判定示教装置10(冲击抑制系统200)是否电源断开。
[0037] 在步骤ST8中,若判定为示教盒10已受到较强冲击(是),则进入步骤ST9,并且例如增加警报设定X标志,另外,若判定为示教盒10未受到较强冲击(否),则进入步骤ST10,并且例如减少警报设定X标志。并且,在进行步骤ST9及ST10的处理后,进入步骤ST17,判定示教装置10是否电源断开。
[0038] 在步骤ST3中,若判定为没有与已取得的状态数据相似的警报设定(否),或者在步骤ST4中,判定为警报设定X标志的阈值不在一定以上(否),则进入步骤ST11,在步骤ST11中,判定示教盒10是否已受到冲击。在步骤ST11中,若判定为示教盒10已受到较强冲击(是),则进入步骤ST12,并取得示教盒10受到冲击的稍早前的状态数据,并进入步骤ST13。在步骤ST13中,对在步骤ST12中取得的受到冲击的稍早前的状态数据与存储的警报设定(进行警报输出的情况下的设定数据)进行比较,并进入步骤ST14。
[0039] 在步骤ST14中,判定是否存在相似的警报设定数据(例如,判定是否与警报设定Y相似),例如若判定为与警报设定Y相似(是),则进入步骤ST15,并增加警报设定Y标志,另外,若判定为与警报设定Y不相似(否),则进入步骤ST16,并新设定警报设定Z标志。并且在进行步骤ST15及ST16的处理后,进入步骤ST17,判定示教装置10是否电源断开。此外,在步骤ST11中,在判定为示教盒10未受到较强冲击时(否),仍进入步骤ST17,判定示教装置10是否电源断开。
[0040] 在步骤ST17中,若判定为示教装置10(冲击抑制系统)电源未断开(否),则返回步骤ST1并重复同样的处理,若判定为示教装置10电源断开(是),则结束处理。
[0041] 这样,根据本实施方式,状态观测部21将示教盒10受到较强冲击前不久的数据作为状态数据来进行观测,并执行参照图1~图3来说明的机器学习,由此可以提前预知针对示教盒(示教装置)的冲击并进行抑制。此外,本实施方式可以广泛应用于对工业用机器人或协作机器人等各种机器人、或者由CNC装置控制的各种机床等进行示教的示教装置、以及使用示教装置的系统。
[0042] 根据本实施方式所涉及的机器学习装置、示教装置的冲击抑制系统及机器学习方法,实现能够提前预知针对示教装置的冲击并进行抑制的效果。
[0043] 以上,对实施方式进行了说明,但是这里所记载的所有例子和条件,目的在于帮助理解应用于发明及技术的发明概念,所记载的例子和条件并不特别意在对发明的范围有所制限。另外,说明书的这些记载并未示出发明的优点及缺点。虽然详细记载了发明的实施方式,但是应该理解为能够以不脱离发明的精神及范围的方式进行各种变更、置换、变形。