一种融合多信息的变导纳遥操作控制方法转让专利

申请号 : CN201510555862.5

文献号 : CN105242533B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 黄攀峰潘吉祥鹿振宇刘正雄孟中杰

申请人 : 西北工业大学

摘要 :

本发明公开了一种融合多信息的变导纳遥操作控制方法,属于空间机器人领域和远程操作领域。本发明设计了包含阻尼的自适应控制器,将操作者的行为意识融合到控制器设计中,并产生控制信号Uh,能够通过自适应调整阻尼比减轻操作者压力;其次,对从端环境建模并实时反馈控制信号Ue,环境信息的实时采集和修正使系统保持稳定;最后,通过使用隐式马尔可夫模型(HMW)进行任务辨识,并根据实际操作需求适应性的变更任务指令,从而保证操作连续性和提高操作效率。

权利要求 :

1.一种融合多信息的变导纳遥操作控制方法,其特征在于,包括以下步骤:

1)从端环境动力学特性分析及生成反馈信号Ue:

操作者控制手控器对机械臂末端进行操作,首先对从端环境进行动力学特性分析,使用弹簧阻尼模型表示:其中,ke表示位置参数,de表示速度参数,xs表示从端机械臂末端的实时位置,xo表示从端操作对象的起始位置;确定其中的模型参数信息或者在操作者控制机械臂末端进行操作过程中进行评估;

在上述弹簧阻尼模型中加入质量模块构成导纳控制,导纳控制输入力fd生成期望的位置xd和位置修正量δxd,其物理学模型如下:其中,x0表示操作对象的起始位置,输入力fd和位置控制器用来驱动从端机械臂到期望的位置;采用使用位置/力控制模式,其中位置信息由主端发送到从端,从端机械臂执行相应的动作,并反馈力控制信号Ue,控制系统二阶质量-弹簧-阻尼模型为:其中,ke,d表示由自由空间操作到接触操作过程中所需的最小阻尼,位置参数ke能够修c c改环境与从端机械臂的交互频率ω和阻尼率ξ,则:

为了达到期望的阻尼率 调整主端阻尼dd的大小,dd的适应性表达式为其中,是位置参数的评估值,需要通过递推最小二乘方法进行评估;

2)主端操作者行为建模及生成控制信号Uh:

在得到从端环境的反馈信号Ue后,需要对主端操作者行为进行建模和辨识,通过求解手臂位置变化的极小值来建立模型,假设起始、终点处速度为零、加速度为零,从而得到关于手臂位置的五次多项式:

5 4 3

x(t)=xi+(xf-xi)(6τ-15τ+10τ)    (7)其中, xi、ti、Tt、xf分别表示初始位置、初始时间、手臂运动时间及终点位置;

将得到的手臂位置参数加入到控制器设计中,即考虑手臂阻抗,同样的由质量-弹簧-阻尼模型表述:其中,kh、dh分别表示位置参数及速度参数,mh为手臂质量;为了获取控制力fh需要对mh、kh、dh进行辨识,其中,手臂质量通过离线辨识,并将其设定为常值;通过改变手臂的位置参数来进一步改变速度参数:其中, 表示导纳控制器的阻尼,α是比例项, 表示人手臂刚度系数;

通过改变控制力的大小及速度方向,区分操作者是加速运动还是减速运动,从而使控制器阻尼系数在加速/减速过程中相应地减少/增加,使系统保持稳定:其中, Uh表示主端经过适应控制后发出的控制信号,参数d0的作用是当无适应性发生时保证系统稳定,是对适应性的加权值;

3)获取任务指令T:

在获取到反馈信号Ue及控制信号Uh后,控制器阻尼由操作者控制力及环境力决定,下一步针对操作任务,开始获取任务指令T:如果任务种类未知,通过在遥操作系统中添加任务辨识功能;另外,遥操作系统中添加有效的辅助作用能够提高操作性能,选取虚拟夹具作为辅助手段,针对不同操作任务,选取不同的虚拟夹具进行辅助作用;

4)由反馈信号Ue、控制信号Uh及任务指令T设计控制器:控制器设计中由主端向从端发送控制信号Uh及任务指令T:其中,δx表示机械臂末端位置变化率,作为统计值,δx的变化反映任务不同,其中加权值α的变化反映主端操作者控制从端机械臂的适应性,方便操作者执行复杂任务;

从端机械臂与未知环境发生作用时会产生相应的反馈信号Ue,同时结合主端的控制信号Uh及任务指令T进行综合控制:其中, ke,d表示自由操作到接触操作所需最小阻尼,θk表示从端机械臂的位置参数,同时决定交互频率及阻尼率的大小。

2.根据权利要求1所述的融合多信息的变导纳遥操作控制方法,其特征在于,所述步骤

1)中,确定模型参数信息或者在操作者控制机械臂末端进行操作过程中进行评估的具体方法为:从端操作对象起始位置xo:通过摄像机、激光探测器、视觉追踪测量工具获取操作对象的位置信息,同时传感器带来的未知因素要根据被评估系统的可靠性在控制器设计中进行考虑;机械臂末端与操作对象接触过程中,使用辨识技术实时对环境模型参数进行评估。

3.根据权利要求1所述的融合多信息的变导纳遥操作控制方法,其特征在于,所述步骤

3)中的任务辨识使用隐式马尔可夫模型进行任务辨识。

4.根据权利要求1或3所述的融合多信息的变导纳遥操作控制方法,其特征在于,所述步骤3)中的虚拟夹具为引导型或禁止型虚拟夹具。

说明书 :

一种融合多信息的变导纳遥操作控制方法

【技术领域】

[0001] 本发明属于空间机器人领域和远程操作领域,涉及一种融合多信息的变导纳遥操作控制方法。【背景技术】
[0002] 从上世纪60年代空间机器人开始应用到今天,空间机器人的应用领域在不断地扩大,同时空间机器人所承担任务的复杂性也在不断增加:从结构化已知环境中的重复性操作到非结构化未知环境中的非重复性操作,而且其精度要求也越来越高,需要完成一些诸如运动目标捕获,卫星装配,卫星维修之类的精密任务,同时要求操作者具备灵活且稳定的操作。考虑操作环境的未知性、操作者行为的不确定性和操作任务的复杂性等因素,空间机器人需要具备较强的环境适应能力、操作者需要具备操作行为适应性变更能力,并且操作任务指令可以实时生成和传送。从长远看,能够对环境进行感知、高度自主、能代替人类从事各种空间作业而不需要人类干涉的智能机器人是空间机器人的最终发展方向,但受现有技术(传感器技术,人工智能技术,控制技术等)水平的限制,能够在复杂的非结构环境中全自主工作的智能空间机器人在相当长一段时间内是难以实现的,一个现实的选择就是从全自主方式转向局部自主方式,即有人参与的机器人局部自主方式,机器人在完成底层控制方面有优势,能够精确地完成诸如位置控制、力控制这类任务,而人类在智能决策,异常情况处理等方面有优势。有人参与的机器人局部自主控制方式综合了两者的长处,可以大大提高系统的控制精度和对外界的适应能力。另外,提高任务指令的精确度以及适应性变更能力也是空间遥操作需要解决的问题。
[0003] 一个双向力反馈遥操作系统允许操作者通过接受力反馈在遥远环境中进行复杂的操作。操作者通过力反馈设备来控制从端的机械手,并通过信息交互通道完成控制信号、反馈信号及任务指令的接收及发送。遥操作系统中控制器设计的主要目标是提高鲁棒性、临场感、任务执行度及透明性。理论上,这些目标能够在不失去闭环系统稳定性的前提下同时得到优化,为此,系统的特征参数比如主从设备的类型、传感器和时延、信道上的数据包丢失都应在控制器设计上得到考虑。为了实现更高性能的遥操作系统,本发明考虑将环境因素、操作者行为及任务指令等影响因素进行整合,使系统得到更大的改进。传统空间遥操作系统中控制器的设计只针对影响遥操作性能的主要因素进行设计,但在实际操作过程中,环境因素的不可控、操作者行为的不稳定及任务指令的模糊与时延等都是造成操作系统不稳定的因素,另外,对控制器适应性的设计也是提高系统稳定性的一种方法。【发明内容】
[0004] 本发明的目的在于解决上述现有技术中的问题,提供一种融合多信息的变导纳遥操作控制方法,该方法是将环境因素、操作者行为及任务信息整合在一起设计控制器。
[0005] 为达到上述目的,本发明所采用的技术方案包括以下步骤:
[0006] 1)从端环境动力学特性分析及生成反馈信号Ue:
[0007] 操作者控制手控器对机械臂末端进行操作,首先对从端环境进行动力学特性分析,使用弹簧阻尼模型表示:
[0008]
[0009] 其中,ke表示位置参数,de表示速度参数,xs表示从端机械臂末端的实时位置,xo表示从端操作对象的起始位置;确定其中的模型参数信息或者在操作者控制机械臂末端进行操作过程中进行评估;
[0010] 在上述弹簧阻尼模型中加入质量模块构成导纳控制,导纳控制输入力fd生成期望的位置xd和位置修正量δxd,其物理学模型如下:
[0011]
[0012] 其中,x0表示操作对象的起始位置,输入力fd和位置控制器用来驱动从端机械臂到期望的位置;采用使用位置/力控制模式,其中位置信息由主端发送到从端,从端机械臂执行相应的动作,并反馈力控制信号Ue,控制系统二阶质量-弹簧-阻尼模型为:
[0013]
[0014] 其中,ke,d表示由自由空间操作到接触操作过程中所需的最小阻尼,位置参数ke能够修改环境与从端机械臂的交互频率ωc和阻尼率ξc,则:
[0015]
[0016]
[0017] 为了达到期望的阻尼率 调整主端阻尼dd的大小,dd的适应性表达式为[0018]
[0019] 其中,是位置参数的评估值,需要通过递推最小二乘方法进行评估;
[0020] 2)主端操作者行为建模及生成控制信号Uh:
[0021] 在得到从端环境的反馈信号Ue后,需要对主端操作者行为进行建模和辨识,通过求解手臂位置变化的极小值来建立模型,假设起始、终点处速度为零、加速度为零,从而得到关于手臂位置的五次多项式:
[0022] x(t)=xi+(xf-xi)(6τ5-15τ4+10τ3)   (7)
[0023] 其中, xi、ti、Tt、xf分别表示初始位置、初始时间、手臂运动时间及终点位置;
[0024] 将得到的手臂位置参数加入到控制器设计中,即考虑手臂阻抗,同样的由质量-弹簧-阻尼模型表述:
[0025]
[0026] 其中,kh、dh分别表示位置参数及速度参数,mh为手臂质量;为了获取控制力fh需要对mh、kh、dh进行辨识,其中,手臂质量通过离线辨识,并将其设定为常值;通过改变手臂的位置参数来进一步改变速度参数:
[0027]
[0028] 其中, 表示导纳控制器的阻尼,α是比例项,表示人手臂刚度系数;
[0029] 通过改变控制力的大小及速度方向,区分操作者是加速运动还是减速运动,从而使控制器阻尼系数在加速/减速过程中相应地减少/增加,使系统保持稳定:
[0030]
[0031] 其中, Uh表示主端经过适应控制后发出的控制信号,参数d0的作用是当无适应性发生时保证系统稳定,是对适应性的加权值;
[0032] 3)获取任务指令T:
[0033] 在获取到反馈信号Ue及控制信号Uh后,控制器阻尼由操作者控制力及环境力决定,下一步针对操作任务,开始获取任务指令T:如果任务种类未知,通过在遥操作系统中添加任务辨识功能;另外,遥操作系统中添加有效的辅助作用能够提高操作性能,选取虚拟夹具作为辅助手段,针对不同操作任务,选取不同的虚拟夹具进行辅助作用;
[0034] 4)由反馈信号Ue、控制信号Uh及任务指令T设计控制器:
[0035] 控制器设计中由主端向从端发送控制信号Uh及任务指令T:
[0036]
[0037] 其中,δx表示机械臂末端位置变化率,作为统计值,δx的变化反映任务不同,其中加权值α的变化反映主端操作者控制从端机械臂的适应性,方便操作者执行复杂任务;
[0038] 从端机械臂与未知环境发生作用时会产生相应的反馈信号Ue,同时结合主端的控制信号Uh及任务指令T进行综合控制:
[0039]
[0040] 其中, ke,d表示自由操作到接触操作所需最小阻尼,θk表示从端机械臂的位置参数,同时决定交互频率及阻尼率的大小。
[0041] 本发明进一步的改进在于:
[0042] 所述步骤1)中,确定模型参数信息或者在操作者控制机械臂末端进行操作过程中进行评估的具体方法为:
[0043] 从端操作对象起始位置xo:通过摄像机、激光探测器、视觉追踪测量等测量工具获取操作对象的位置信息,同时传感器带来的未知因素要根据被评估系统的可靠性在控制器设计中进行考虑;机械臂末端与操作对象接触过程中,使用辨识技术实时对环境模型参数进行评估。
[0044] 所述步骤3)中的任务辨识使用隐式马尔可夫模型进行任务辨识。
[0045] 所述步骤3)中的虚拟夹具为引导型或禁止型虚拟夹具。
[0046] 与现有技术相比,本发明具有以下有益效果:
[0047] 本发明融合了操作者行为、环境变化因素以及任务指令等多种信息,与传统控制器设计中只考虑单一的控制因素相比具有更好的控制效果。首先,设计了包含阻尼的自适应控制器,将操作者的行为意识融合到控制器设计中,并产生控制信号Uh,能够通过自适应调整阻尼比减轻操作者压力;其次,对从端环境建模并实时反馈控制信号Ue,环境信息的实时采集和修正使系统保持稳定;最后,通过使用隐式马尔可夫模型(HMW)进行任务辨识,并根据实际操作需求适应性的变更任务指令,从而保证操作连续性和提高操作效率。【附图说明】
[0048] 图1为本发明导纳控制原理图;
[0049] 图2为本发明融合环境因素的变导纳控制原理图;
[0050] 图3为本发明融合操作者感知的变导纳控制图;
[0051] 图4为本发明多信息融合控制器设计图;
[0052] 图5为本发明避障实验示意图。【具体实施方式】
[0053] 下面结合附图对本发明做进一步详细描述:
[0054] 参见图1至图5,本发明包括以下步骤:
[0055] 步骤一:从端环境动力学特性分析及生成反馈信号Ue:
[0056] 操作者控制手控器等设备对机械臂末端进行操作,首先对从端环境进行动力学特性分析,使用弹簧阻尼模型表示:
[0057]
[0058] 其中,ke表示位置参数,de表示速度参数,xs表示从端机械臂末端的实时位置,xo表示从端操作对象的起始位置。由分析可知,应该首先确定其中的模型参数信息或者在操作者控制机械臂末端进行操作过程中进行评估,具体的评估方法为:
[0059] 从端操作对象起始位置xo:通过摄像机、激光探测器、视觉追踪测量等测量工具获取操作对象的位置信息,同时传感器带来的未知因素要根据被评估系统的可靠性在控制器设计中进行考虑。
[0060] 位置参数ke及速度参数de:机械臂末端与操作对象接触过程中,使用合适的辨识技术能实时对环境模型参数进行评估,例如递归最小二乘法,环境模型参数评估的重要作用是提高参数收敛到真值的速度且保证模型假设的准确性。
[0061] 在上述弹簧阻尼模型中加入质量模块构成导纳控制,如图1所示,导纳控制输入力fd生成期望的位置xd和位置修正量δxd。相关的物理学模型如下:
[0062]
[0063] 其中,x0表示操作对象的起始位置,输入力fd和位置控制器用来驱动从端机械臂到期望的位置。此外,将环境信息整合到控制器设计中,把控制参数由固定改为自适应,便是融合环境因素的自适应导纳控制方法。如图2所示,从端机械臂和环境作用过程中,产生位置信息xs和环境作用力fe,其中对xs进行反复采集达到校正从端机械臂的效果,fe作为从端的反馈值将其整合到控制器设计中,并产生相应的反馈信号。该方法采用位置/力控制模式,其中位置信息由主端发送到从端,从端机械臂执行相应的动作,并反馈力控制信号Ue,控制系统二阶质量-弹簧-阻尼模型为:
[0064]
[0065] 其中,ke,d表示由自由空间操作到接触操作过程中所需的最小阻尼,位置参数ke可以修改环境与从端机械臂的交互频率ωc和阻尼率ξc,
[0066]
[0067]
[0068] 为了达到期望的阻尼率 需要相应的调整主端阻尼dd的大小,dd的适应性表达式为
[0069]
[0070] 其中,是位置参数的评估值,需要通过递推最小二乘方法进行评估。
[0071] 步骤二:主端操作者行为建模及生成控制信号Uh:
[0072] 在得到从端环境的反馈信号Ue后,需要对主端操作者行为进行建模和辨识,提出一种手臂最小化颤动模型,通过求解手臂位置变化的极小值来建立模型,假设起始、终点处速度为零、加速度为零,从而得到关于手臂位置的五次多项式:
[0073] x(t)=xi+(xf-xi)(6τ5-15τ4+10τ3)   (7)
[0074] 其中, xi、ti、Tt、xf分别表示初始位置、初始时间、手臂运动时间及终点位置,这些参数经过辨识后可以得出手臂运动轨迹大致呈直线而速度呈抛物线型。
[0075] 将得到的手臂位置参数加入到控制器设计中,即考虑手臂阻抗,同样的可由经典的质量-弹簧-阻尼模型表述:
[0076]
[0077] 其中,kh、dh分别表示位置参数及速度参数,mh为手臂质量。为了获取控制力fh需要对mh、kh、dh进行辨识,其中,手臂质量可以通过离线辨识,并且由于质量参数变化很小,可以将其设定为常值,位置及速度参数的有效改变可以改善人机协同操作性能。这里通过改变手臂的位置参数(刚度)来进一步改变速度参数(阻尼):
[0078]
[0079] 其中, 表示导纳控制器的阻尼,α是比例项,表示人手臂刚度系数。对于给定的手臂刚度系数,取合适的比例值使控制器阻尼尽可能小,可以提高控制精度。
[0080] 由于操作者的感知意识对控制的影响,提出融合操作者感知的变导纳控制方法,如图3所示,操作者自身的操作速度 可以得到,将其作为反馈值与控制力fh进行整合,通过改变控制力的大小及速度方向,可以区分操作者是加速运动还是减速运动,从而使控制器阻尼系数在加速/减速过程中相应地减少/增加,使系统保持稳定:
[0081]
[0082] 其中, Uh表示主端经过适应控制后发出的控制信号,参数d0的作用是当无适应性发生时保证系统稳定,是对适应性的加权值。通过这个方法,当减小阻尼时,操作者控制机械臂加速运动只需更少的力气,当增加阻尼时,可以简化定位和位置保持等运动。
[0083] 步骤三:获取任务指令T:
[0084] 在获取到反馈信号Ue及控制信号Uh后,控制器阻尼可以由操作者控制力及环境力决定,下一步针对操作任务,开始获取任务指令T:如果任务种类未知,比如轴孔装配、避障、跟踪等,可以通过在遥操作系统中添加任务辨识功能,通常使用隐式马尔可夫模型(HMW)进行任务辨识,它是一种隐式的统计学模型,可以对多个简单任务进行辨识,并根据实际操作需求适应性的变更任务指令。另外,遥操作系统中添加有效的辅助作用可以提高操作性能,通常选取虚拟夹具作为辅助手段,针对不同操作任务,选取不同的虚拟夹具(引导型或禁止型)进行辅助作用。
[0085] 步骤四:由反馈信号Ue、控制信号Uh及任务指令T设计控制器:
[0086] 综合环境因素、操作者控制及具体任务指令后,一个带有阻尼的包含控制信号、反馈信号及任务指令的自适应控制器设计如图4所示:
[0087] 控制器设计中由主端向从端发送控制信号Uh及任务指令T
[0088]
[0089] 其中,δx表示机械臂末端位置变化率,作为统计值,δx的变化反映任务不同,其中加权值α的变化反映主端操作者控制从端机械臂的适应性,方便操作者执行复杂任务。
[0090] 另一方面,从端机械臂与未知环境发生作用时会产生相应的反馈信号Ue,由于环境的未知因素较多,需要通过传感器获取较准确的位置速度等信息,同时结合主端的控制信号Uh及任务指令T进行综合控制
[0091]
[0092] 其中, ke,d表示自由操作到接触操作所需最小阻尼,θk表示从端机械臂的位置参数,同时决定交互频率及阻尼率的大小。
[0093] 实施例:
[0094] 本发明的一个具体实施例是使用多信息融合的自适应控制器控制机械臂末端在虚拟环境中进行避障实验,具体过程如下:
[0095] 1.构造实验场景:
[0096] 实验中主端选用3自由度的Force Dimension Omega3.0手控器,从端是一个6自由度的虚拟机械臂,手控器控制机械臂末端,操作平台是基于CHAI3D仿真平台搭建,由OpenGL底层图形库创建三维视景窗口,操作者通过仿真平台控制从端机械臂完成实验任务。
[0097] 2.信息交互通道设置:
[0098] 实验中手控器宿主机作为信息交互的核心,设计任务指令接收模块、控制信号发送模块及反馈信号接收模块,其中,任务指令由其他计算机设备生成并通过网络进行传输,控制信号由手控器所在的人机交互平台生成并发送,从端机械臂与环境之间的交互信息反馈回主端。
[0099] 3.实验场景参数设置:
[0100] 实验中,操作者控制机械臂末端在虚拟环境中进行避障实验,首先需要进行任务规划:
[0101] 设定机械臂末端起始点位置为S(0,0,0),目标点位置为D(0,6.28,0),单位为mm。
[0102] 设定两个静态球形障碍物,球心坐标分别为O1(0,1.6,0.8),O2(0,2.2,-1.2),其中O1为半径为0.5mm,O2的半径为0.8mm。
[0103] 4.控制器参数设置:
[0104] 实验中,要求操作者控制机械臂末端避开障碍物,故需要在机械臂末端接近障碍物时,操作者行为及任务指令做出适应性改变
[0105]
[0106] 其中, 中令d0=0.5(无适应性需求时保证操作稳定),0.1<α<1,最小阻尼ke,d=0.3,0.1<θk<1,δx由任务进行过程中HMW模型实时计算得到。
[0107] 5.避障实验:
[0108] 操作者控制Force Dimension Omega3.0手控器对虚拟场景中的机械臂末端进行操作,如图5所示,机械臂末端从起始位置S出发向目标位置D移动,中间需要对障碍物O1、O2进行适应性躲避,实验中,通过记录操作时间及碰撞次数验证控制器设计是否有效。
[0109] 实验结果表明,适当的调整适应性权值α及阻尼比θk的值可以较高效的完成实验任务,控制器设计对操作者、环境及任务具备适应性调整能力。
[0110] 以上内容仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明权利要求书的保护范围之内。