基于概率模型的机器人离散型轨迹的表征与泛化方法转让专利

申请号 : CN201910973457.3

文献号 : CN110653824B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 林立民

申请人 : 同济人工智能研究院(苏州)有限公司

摘要 :

本发明涉及一种基于概率模型的机器人离散型轨迹的表征与泛化方法,包括离散型轨迹的示教:将轨迹拆分呈成多段,分别对各段轨迹的进行示教,获取离散型轨迹表征的数据来源,对离散型轨迹表征:基于多个GMM对机器人轨迹进行建模,提取多段轨迹之间的相关关系,对示教轨迹进行表征,对轨迹泛化输出:通过GMR对多段轨迹进行拼接,实现轨迹的泛化输出,使得输出的轨迹具有平滑性。本发明示教过程简单化和可操作性强;可基于时间信息对各段轨迹进行平滑性拼接;通过学习多机械臂的多任务约束关系,从而使得机器人的多机械臂能够协同完成多任务。

权利要求 :

1.一种基于概率模型的机器人离散型轨迹的表征与泛化方法,其特征在于:包括:(1)、离散型轨迹的示教:将轨迹拆分成多段,分别对各段轨迹进行示教,获取离散型轨迹表征的数据来源,示教数据的来源利用拖动示教的策略获取,先对示教数据进行表示:对于二维示教数据,本文将其表示为:其中,yi,s,yi,t分别表示示教轨迹的空间信息和时间信息,T表示示教轨迹中示教点的个数,(2)、对离散型轨迹表征:通过多个高斯混合模型(GMM)对机器人轨迹进行建模,提取多段轨迹之间的相关关系,对示教轨迹进行表征,对离散型轨迹表征与参数学习:

对于多维示教变量y,建模GMM为:其中,p(y)表示概率密度函数,N(y,μk,∑k)表示以μk为均值,∑k为协方差矩阵的高斯概率密度函数,

对于示教样本集y=(y1,y2…yT),通过隐变量γt,K的引入,将数据展开成完全数据:(yt,γt,1,γt,2...γt,K),t=1,2...T                                    (3),若yt由第1类采样而来,则有γt,1=1,γt,2=0…γt,K=0表示为(yt,1,0,…0),完全数据的似然函数为:

完全数据的对数似然函数为:

定义Q函数如下:

i i i

其中,E(γt,K|yt,μ,∑,π)就是对γ的估计:对Q函数进行求导,并令其导数为0,可得:其中 分别表示第(i+1)次迭代,第k个类的均值,协方差矩阵和所占的权重,(3)、对轨迹泛化输出:通过高斯混合回归(GMR)对多段轨迹进行拼接,实现轨迹的泛化输出,

I o I o

对于示教轨迹的数据点y=[y ,y],首先利用概率模型将示教数据点的分布P(y ,y)建o I o I o I o

模为GMM,接着通过GMR计算条件变量(y |y)的期望E(y|y)和协方差Cov(y |y),将E(y |I o I

y)作为泛化的输出数据点,在Cov(y|y)约束下生成具有平滑性的运动轨迹,对于T个D维示教数据点构成的数据集,建模GMM如下:其中,πk是模型的先验概率,N(y,μk,∑k)是以μk为均值,以∑k为方差的高斯分布,并且有:

I o I

在给定y和第k个高斯分布下,条件变量(y|y,k)也符合高斯分布,即:O I

(y|y,k)~N(μ′k,∑′k)   (13),其中,μ’k,∑’k分别为:

o I

对于整个GMM,则有(y|y)满足:其中,hk满足:

o I

由此可得条件变量(y|y)的均值μ和协方差∑为:

2.根据权利要求1所述的基于概率模型的机器人离散型轨迹的表征与泛化方法,其特征在于:利用k均值聚类算法(k‑means)对数据进行聚类,划分示教数据的所属类别,利用最大期望算法(EM算法)对高斯混合模型(GMM)的数据进行学习。

3.根据权利要求2所述的基于概率模型的机器人离散型轨迹的表征与泛化方法,其特征在于:利用最大期望算法(EM算法)对高斯混合模型(GMM)的数据进行学习时,利用估计步骤(E‑step)和最大化步骤(M‑step)循环进行直到参数收敛。

4.根据权利要求3所述的基于概率模型的机器人离散型轨迹的表征与泛化方法,其特征在于:在估计步骤(E‑step)中,包括:(1)、对采样数据做分类划分,(2)、对各个类(k=1,2…K),求样本产生的概率P(yt,γt|μ,Σ,π),(3)、求采样数据产生的概率Q函数。

5.根据权利要求4所述的基于概率模型的机器人离散型轨迹的表征与泛化方法,其特征在于:在最大化步骤(M‑step)中最大化Q函数来优化高斯混合模型(GMM)的参数。

6.根据权利要求1所述的基于概率模型的机器人离散型轨迹的表征与泛化方法,其特征在于:在(1)中:利用拖动示教的策略获取离散型轨迹表征的数据来源。

7.根据权利要求1所述的基于概率模型的机器人离散型轨迹的表征与泛化方法,其特征在于:在(2)中:利用Matlab编程实现高斯混合模型(GMM)对示教轨迹进行表征。

8.根据权利要求1所述的基于概率模型的机器人离散型轨迹的表征与泛化方法,其特征在于:通过高斯混合模型(GMM)对机器人轨迹进行建模时,用概率模型提取多段轨迹之间的相关关系。

9.根据权利要求1所述的基于概率模型的机器人离散型轨迹的表征与泛化方法,其特征在于:在(3)中:通过高斯混合回归(GMR)对轨迹泛化输出时,保存为.mat文件作为控制系统的期望轨迹。

10.根据权利要求1所述的基于概率模型的机器人离散型轨迹的表征与泛化方法,其特征在于:其还包括(4)、控制系统设计:利用泛化输出的轨迹作为控制系统的期望轨迹,使得机器人轨迹跟踪该期望轨迹。

说明书 :

基于概率模型的机器人离散型轨迹的表征与泛化方法

技术领域

[0001] 本发明涉及一种基于概率模型的机器人离散型轨迹的表征与泛化方法。

背景技术

[0002] 示教学习可以让机器人学习人类在未知环境下如何执行灵巧的操作任务,以及在新的环境和任务目标下生成满足需求的机器人轨迹。基于示教学习的轨迹生成策略能够充
分提取示教轨迹的特征,生成具有一定泛化性的机器人轨迹。
[0003] 离散型轨迹在人类生活中较为常见,如汉字书写等。但是示教学习领域对于离散型轨迹的特征提取的研究较少。当前对于机器人离散型轨迹的表征与泛化的研究主要存在
以下几点不足:
[0004] (1)、示教轨迹复杂、繁琐。当前离散型示教数据的获取基本都是通过连续化获得。当学习的轨迹较为复杂时,这种示教策略明显显得繁琐,示教过程需要大量的时间成本,也
需要一定的技巧对轨迹进行连续化的设计。
[0005] (2)、缺乏相应的轨迹拼接策略。与连续型的轨迹不同,离散型的轨迹是由多段轨迹组成,各段轨迹之间存在一定的空间约束和时间约束,当前对离散型轨迹的表征与泛化
的研究缺乏相应的策略来将离散的多段轨迹进行拼接,不能在满足原有轨迹的相关约束的
同时,使得最后的输出轨迹能够具有较好的平滑性。

发明内容

[0006] 本发明的目的是提供一种基于概率模型的机器人离散型轨迹的表征与泛化方法。
[0007] 为达到上述目的,本发明采用的技术方案是:
[0008] 一种基于概率模型的机器人离散型轨迹的表征与泛化方法,包括:
[0009] (1)、离散型轨迹的示教:将轨迹拆分呈成多段,分别对各段轨迹的进行示教,获取离散型轨迹表征的数据来源,
[0010] (2)、对离散型轨迹表征:基于多个高斯混合模型(GMM,Gaussian Mixture Model)对机器人轨迹进行建模,提取多段轨迹之间的相关关系,对示教轨迹进行表征,
[0011] (3)、对轨迹泛化输出:通过高斯混合回归(GMR,Gaussian Mixture Regression)对多段轨迹进行拼接,实现轨迹的泛化输出,使得输出的轨迹具有平滑性。
[0012] 优选地,利用k均值聚类算法(k‑means)对数据进行聚类,划分示教数据的所属类别,利用最大期望算法(EM算法)对高斯混合模型(GMM)的数据进行学习。
[0013] 进一步优选地,利用最大期望算法(EM算法)对高斯混合模型(GMM)的数据进行学习时,利用估计步骤(E‑step)和最大化步骤(M‑step)循环进行直到参数收敛。
[0014] 进一步优选地,在估计步骤(E‑step)中,包括:
[0015] (1)、对采样数据做分类划分,
[0016] (2)、对各个类(k=1,2…K),求样本产生的概率P(yt,γt|μ,Σ,π),
[0017] (3)、求采样数据产生的概率Q函数。
[0018] 进一步优选地,在最大化步骤(M‑step)中最大化Q函数来优化高斯混合模型(GMM)的参数。
[0019] 优选地,在(1)中:利用拖动示教的策略获取离散型轨迹表征的数据来源。
[0020] 优选地,在(2)中:利用Matlab编程实现高斯混合模型(GMM)对示教轨迹进行表征。
[0021] 优选地,通过高斯混合模型(GMM)对机器人轨迹进行建模时,用概率模型提取多段轨迹之间的相关关系。
[0022] 优选地,在(3)中:通过高斯混合回归(GMR)对轨迹泛化输出时,保存为.mat文件作为控制系统的期望轨迹。
[0023] 优选地,该方法还包括(4)、利用泛化输出的轨迹作为控制系统的期望轨迹,使得机器人轨迹跟踪该期望轨迹
[0024] 进一步优选地,机器人通过多机械臂多任务协同进行控制系统的轨迹学习。
[0025] 由于上述技术方案运用,本发明与现有技术相比具有下列优点和效果:
[0026] 1、对复杂的机器人离散型轨迹进行离散化分段示教,使得示教过程简单化和可操作性强;
[0027] 2、采用多个GMM表征多段离散型轨迹,并在各段轨迹之间均引入了时间维度信息,在最终可以利用GMR进行轨迹泛化输出时基于时间信息对各段轨迹进行平滑性拼接;
[0028] 3、通过学习多机械臂的多任务约束关系,从而使得机器人的多机械臂能够协同完成多任务。

附图说明

[0029] 附图1为本实施例方法的流程示意图;
[0030] 附图2为本实施例中GMM模型参数学习示意图;
[0031] 附图3为本实施例中轨迹的示教、GMM表征和GMR泛化输出轨迹图;
[0032] 附图4为轨迹“打”字的连续型示教策略的表征与泛化轨迹图;
[0033] 附图5为轨迹“打”字的离散型示教策略的表征与泛化轨迹图;
[0034] 附图6为多机械臂多任务协同的轨迹输出图。

具体实施方式

[0035] 下面结合附图及实施案例对本发明作进一步描述:
[0036] 如图所示:一种基于概率模型的机器人离散型轨迹的表征与泛化方法,包括:
[0037] (1)、离散型轨迹的示教:
[0038] 示教数据的来源利用拖动示教的策略获取,先对示教数据进行表示:对于二维示教数据,本文将其表示为:
[0039]
[0040] 其中,yi,s,yi,t分别表示示教轨迹的空间信息和时间信息,T表示示教轨迹中示教点的个数。
[0041] (2)、对离散型轨迹表征与参数学习:
[0042] 对于多维示教变量y,建模GMM为:
[0043]
[0044] 其中,p(y)表示概率密度函数,N(y,μk,∑k)表示以μk为均值,∑k为协方差矩阵的高斯概率密度函数。
[0045] 相对比于高斯模型的参数估计,高斯混合模型的参数估计更加复杂,主要原因在于隐变量的存在无法利用极大似然估计的方法求取模型的参数。对于示教样本集Y=(y1,
y2…yT),通过隐变量γt,K的引入,可以将数据展开成完全数据:
[0046] (yt,γt,1,γt,2…γt,K),t=1,2...T  (3)
[0047] 若yt由第1类采样而来,则有γt,1=1,γt,2=0…γt,K=0表示为(yt,1,0,…0)。
[0048] 完全数据的似然函数为:
[0049]
[0050] 完全数据的对数似然函数为:
[0051]
[0052] 定义Q函数如下:
[0053]
[0054] 其中,E(γt,K|yt,μi,∑i,πi)就是对γ的估计:
[0055]
[0056] 对Q函数进行求导,并另其导数为0,可得:
[0057]
[0058]
[0059]
[0060] 其中 分别表示第(i+1)次迭代,第k个类的均值,协方差矩阵和所占的权重。
[0061] (3)、对轨迹泛化输出:
[0062] 示教轨迹经GMM表征编码后,利用GMR进行轨迹输出。
[0063] 对于示教轨迹的数据点y=[yI,yo],首先利用概率模型将示教数据点的分布P(yI,o o I o I o I
y)建模为GMM,接着通过GMR计算条件变量(y|y)的期望E(y|y)和协方差Cov(y|y),将E
o I o I
(y|y)作为泛化的输出数据点,在Cov(y|y)约束下生成具有平滑性的运动轨迹。
[0064] 对于T个D维示教数据点构成的数据集,建模GMM如下:
[0065]
[0066] 其中,πk是模型的先验概率,N(y,μk,∑k)是以μk为均值,以∑k为方差的高斯分布,并且有:
[0067]
[0068] 在给定yI和第k个高斯分布下,条件变量(yo|yI,k)的也符合高斯分布,即:
[0069] (yo|yI,k)~N(μ′k,∑′k)  (13)
[0070] 其中,μk,∑k分别为:
[0071]
[0072]
[0073] 对于整个GMM,则有(yo|yI)满足:
[0074]
[0075] 其中,hk满足:
[0076]
[0077] 由此可得条件变量(yo|yI)的均值μ和协方差∑为:
[0078]
[0079]
[0080] (4)、控制系统设计:
[0081] 在工作空间上对控制系统进行设计,机器人多机械臂进行多任务协同的轨迹学习I o I o
策略。GMM的示教数据集可以表示为y=[y ,y],其中y和y分别是查询向量和待编码向量。
I o
在基于GMM的机器人轨迹表征学习中,示教数据集是y=[y t,ys],即查询向量是时间信息,
待编码向量是轨迹的空间信息。对于多机械臂多任务协同的轨迹学习,以某一个机械臂的
I I O O O
二维空间向量(y s1,y s2)作为查询向量,以其余机械臂的二维空间向量(y s1,y s2,y s3,
O O
ys4…ys2n)作为待编码向量,进行轨迹的表征与学习。比如,对于双机械臂双任务学习,需
I I O O I I I O
要构建4维(2×2)机器人示教数据集y=(y s1,ys2,ys1,ys2),即y=(ys1,y s2),y=(ys1,
O I o I
ys2)。在轨迹泛化输出过程中,以y为查询点,利用GMR估计P(y|y)对其余的二维空间信息
O
y进行输出,从而实现双机械臂双任务协同。
[0082] 上述实施例只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人士能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡根据本发明
精神实质所作的等效变化或修饰,都应涵盖在本发明的保护范围之内。