3D深度语义感知方法及装置转让专利

申请号 : CN201811403410.5

文献号 : CN109657702B

文献日 : 2023-02-07

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

本发明公开了一种3D深度语义感知算法及装置，所述3D深度语义感知算法包括：获取一3D影像；将所述3D影像与一预存影像库匹配，预存影像库中每一预存影像上的影像点标记有语义信息；通过人工智能深度学习算法利用所述预存影像上影像点的语义信息来感知所述3D影像上影像点的语义信息。本发明的3D深度语义感知算法及装置能够获取更加规范的数字点云，使获取的3D影像更加容易管理、控制，而且能够降低运算所耗资源。

1.一种3D深度语义感知方法，其特征在于，所述3D深度语义感知方法包括：获取一3D影像；

将所述3D影像与一预存影像库匹配，预存影像库中每一预存影像上的影像点标记有语义信息；

通过人工智能深度学习算法利用所述预存影像上影像点的语义信息来感知所述3D影像上影像点的语义信息；

预存影像库中每一预存影像上设有表示影像点之间关系的函数式，所述3D深度语义感知方法还包括：通过人工智能深度学习算法利用所述预存影像上函数式来设置所述3D影像上影像点之间的函数式；

预存影像库中每一预存影像划分为若干区域，每一区域内设有表示同一区域内影像点之间关系的函数式，所述3D深度语义感知方法还包括：通过人工智能深度学习算法利用所述预存影像上的区域位置在所述3D影像上划分区域；

对于所述3D影像上的一目标区域，通过人工智能深度学习算法利用所述预存影像上函数式来设置所述3D影像上所述目标区域内的影像点之间的函数式；

其中，所述3D深度语义感知方法包括：

对于预存影像库中一目标预存影像，获取目标预存影像中相邻影像点之间的函数式，所述函数式为多项式函数；

通过人工智能深度学习获取若干穿过相邻影像点之间的分割线，并计算分割线穿过的全部相邻影像点之间的多项式函数的最高次项的次数总和，以次数总和低于预设值的分割线划分目标预存影像的区域。

2.如权利要求1所述的3D深度语义感知方法，其特征在于，所述3D深度语义感知方法包括：获取目标影像生成所述预存影像库，所述目标影像为通过工业用3D摄像机获取精确影像，并在所述精确影像上的目标影像点上标记语义信息。

3.一种3D深度语义感知装置，其特征在于，所述3D深度语义感知装置包括一获取模块、一匹配模块以及一处理模块，所述获取模块用于获取一3D影像；

所述匹配模块用于将所述3D影像与一预存影像库匹配，预存影像库中每一预存影像上的影像点标记有语义信息；

所述处理模块用于通过人工智能深度学习算法利用所述预存影像上影像点的语义信息来感知所述3D影像上影像点的语义信息；

其中，预存影像库中每一预存影像上设有表示影像点之间关系的函数式，所述处理模块还用于通过人工智能深度学习算法利用所述预存影像上函数式来设置所述3D影像上影像点之间的函数式；

其中，预存影像库中每一预存影像划分为若干区域，每一区域内设有表示同一区域内影像点之间关系的函数式，所述处理模块还用于通过人工智能深度学习算法利用所述预存影像上的区域位置在所述3D影像上划分区域；

对于所述3D影像上的一目标区域，所述处理模块还用于通过人工智能深度学习算法利用所述预存影像上函数式来设置所述3D影像上所述目标区域内的影像点之间的函数式；

其中，所述3D深度语义感知装置包括一分析模块以及一计算模块，对于预存影像库中一目标预存影像，所述分析模块用于获取目标预存影像中相邻影像点之间的函数式，所述函数式为多项式函数；

所述计算模块用于通过人工智能深度学习获取若干穿过相邻影像点之间的分割线，并计算分割线穿过的全部相邻影像点之间的多项式函数的最高次项的次数总和，以次数总和低于预设值的分割线划分目标预存影像的区域。

4.如权利要求3所述的3D深度语义感知装置，其特征在于，所述3D深度语义感知装置包括一生成模块，所述生成模块用于获取目标影像生成所述预存影像库，所述目标影像为通过工业用3D摄像机获取精确影像，并在所述精确影像上的目标影像点上标记语义信息。

3D深度语义感知方法及装置

技术领域

[0001] 本发明涉及一种3D深度语义感知方法及装置。

背景技术

[0002] 3D摄像机，利用的是3D镜头制造的摄像机，通常具有两个摄像镜头以上，间距与人眼间距相近，能够拍摄出类似人眼所见的针对同一场景的不同图像。全息3D具有圆盘5镜头以上。

[0003] 第一台3D摄像机迄今3D革命全部围绕好莱坞重磅大片和重大体育赛事展开。随着3D摄像机的问世，这项技术距离家庭用户又近了一步。在这款摄像机推出以后，我们今后就可以用3D镜头捕捉人生每一个难忘瞬间，比如孩子迈出的第一步，大学毕业庆典等。

[0004] 3D摄像机通常有两个以上镜头。3D摄像机本身的功能就像人脑一样，可以将两个镜头图像融合在一起，变成一个3D图像。这些图像可以在3D电视上播放，观众佩戴所谓的主动式快门眼镜即可观看，也可通过裸眼3D显示设备直接观看。3D快门式眼镜能够以每秒60次的速度令左右眼镜的镜片快速交错开关。这意味着每只眼睛看到的是同一场景的稍显不同的画面，所以大脑会由此以为其是在欣赏以3D呈现的单张照片。

[0005] 现有的3D摄像机获取的影像不容易处理、控制，3D影像所占空间较大的缺陷。

发明内容

[0006] 本发明要解决的技术问题是为了克服现有技术中3D摄像机获取的影像不容易处理、控制，3D影像所占空间较大的缺陷，提供一种能够获取更加规范的数字点云，使获取的3D影像更加容易管理、控制的3D深度语义感知方法及装置。

[0007] 本发明是通过下述技术方案来解决上述技术问题：

[0008] 一种3D深度语义感知方法，其特点在于，所述3D深度语义感知方法包括：

[0009] 获取一3D影像；

[0010] 将所述3D影像与一预存影像库匹配，预存影像库中每一预存影像上的影像点标记有语义信息；

[0011] 通过人工智能深度学习算法利用所述预存影像上影像点的语义信息来感知所述3D影像上影像点的语义信息。

[0012] 所述3D影像为人脸影像。

[0013] 机器学习通过算法，让机器可以从外界输入的大量的数据中学习到规律，从而进行识别判断。本申请通过对标准影像（预存影像库）中的影像进行学习，获取预存影像库中影像的规律，从而能够给3D影像进行标记，使计算机自动识别各个数字点的语义（符号所蕴含的意义就是语义）。

[0014] 较佳地，所述3D深度语义感知方法包括：

[0015] 获取目标影像生成所述预存影像库，所述目标影像为通过工业用3D摄像机获取精确影像，并在所述精确影像上的目标影像点上标记语义信息。

[0016] 较佳地，预存影像库中每一预存影像上设有表示影像点之间关系的函数式，所述3D深度语义感知方法包括：

[0017] 通过人工智能深度学习算法利用所述预存影像上函数式来设置所述3D影像上影像点之间的函数式。

[0018] 较佳地，预存影像库中每一预存影像划分为若干区域，每一区域内设有表示同一区域内影像点之间关系的函数式，所述3D深度语义感知方法包括：

[0019] 通过人工智能深度学习算法利用所述预存影像上的区域位置在所述3D影像上划分区域；

[0020] 对于所述3D影像上的一目标区域，通过人工智能深度学习算法利用所述预存影像上函数式来设置所述3D影像上所述目标区域内的影像点之间的函数式。

[0021] 较佳地，所述3D深度语义感知方法包括：

[0022] 对于预存影像库中一目标预存影像，获取目标预存影像中相邻影像点之间的函数式，所述函数式为多项式函数；

[0023] 通过人工智能深度学习获取若干穿过相邻影像点之间的分割线，并计算分割线穿过的全部相邻影像点之间的多项式函数的最高次项的次数总和，以次数总和低于预设值的分割线划分目标预存影像的区域。

[0024] 本发明还提供一种3D深度语义感知装置，其特点在于，所述3D深度语义感知装置包括一获取模块、一匹配模块以及一处理模块，

[0025] 所述获取模块用于获取一3D影像；

[0026] 所述匹配模块用于将所述3D影像与一预存影像库匹配，预存影像库中每一预存影像上的影像点标记有语义信息；

[0027] 所述处理模块用于通过人工智能深度学习算法利用所述预存影像上影像点的语义信息来感知所述3D影像上影像点的语义信息。

[0028] 较佳地，所述3D深度语义感知装置包括一生成模块，

[0029] 所述生成模块用于获取目标影像生成所述预存影像库，所述目标影像为通过工业用3D摄像机获取精确影像，并在所述精确影像上的目标影像点上标记语义信息。

[0030] 较佳地，预存影像库中每一预存影像上设有表示影像点之间关系的函数式，[0031] 所述处理模块还用于通过人工智能深度学习算法利用所述预存影像上函数式来设置所述3D影像上影像点之间的函数式。

[0032] 较佳地，预存影像库中每一预存影像划分为若干区域，每一区域内设有表示同一区域内影像点之间关系的函数式，

[0033] 所述处理模块还用于通过人工智能深度学习算法利用所述预存影像上的区域位置在所述3D影像上划分区域；

[0034] 对于所述3D影像上的一目标区域，所述处理模块还用于通过人工智能深度学习算法利用所述预存影像上函数式来设置所述3D影像上所述目标区域内的影像点之间的函数式。

[0035] 较佳地，所述3D深度语义感知装置包括一分析模块以及一计算模块，[0036] 对于预存影像库中一目标预存影像，所述分析模块用于获取目标预存影像中相邻影像点之间的函数式，所述函数式为多项式函数；

[0037] 所述计算模块用于通过人工智能深度学习获取若干穿过相邻影像点之间的分割线，并计算分割线穿过的全部相邻影像点之间的多项式函数的最高次项的次数总和，以次数总和低于预设值的分割线划分目标预存影像的区域。

[0038] 在符合本领域常识的基础上，上述各优选条件，可任意组合，即得本发明各较佳实例。

[0039] 本发明的积极进步效果在于：

[0040] 本发明的3D深度语义感知方法及装置能够获取更加规范的数字点云，使获取的3D影像更加容易管理、控制，而且能够降低运算所耗资源。

附图说明

[0041] 图1为本发明实施例1的3D深度语义感知方法的流程图。

[0042] 图2为本发明实施例2的3D深度语义感知方法的流程图。

具体实施方式

[0043] 下面通过实施例的方式进一步说明本发明，但并不因此将本发明限制在所述的实施例范围之中。

[0044] 实施例1

[0045] 本实施例提供一种3D深度语义感知装置，所述3D深度语义感知装置包括一获取模块、一匹配模块、一生成模块以及一处理模块，

[0046] 所述获取模块用于获取一3D影像；

[0047] 所述匹配模块用于将所述3D影像与一预存影像库匹配，预存影像库中每一预存影像上的影像点标记有语义信息；

[0048] 所述处理模块用于通过人工智能深度学习算法利用所述预存影像上影像点的语义信息来感知所述3D影像上影像点的语义信息。

[0049] 预存影像库匹配通过生成模块获取，所述生成模块用于获取目标影像生成所述预存影像库，所述目标影像为通过工业用3D摄像机获取精确影像，并在所述精确影像上的目标影像点上标记语义信息。

[0050] 预存影像库中的数字点（影像点），标记语义信息可以通过手工标记也可以通过人工智能识别影像点的身份，然后添加语义信息。所述语义信息能够记载影像点的身份，从而将初始3D影像进行数字化处理，让机器获取影像中各个影像点的含义。

[0051] 本申请通过对标准影像（预存影像库）中的影像进行学习，获取预存影像库中影像的规律，从而能够给3D影像进行标记，使计算机自动识别各个数字点的语义（符号所蕴含的意义就是语义）。

[0052] 参见图1，利用上述3D深度语义感知装置，本实施例还提供一种3D深度语义感知方法，包括：

[0053] 步骤100、获取一3D影像；

[0054] 步骤101、将所述3D影像与一预存影像库匹配，预存影像库中每一预存影像上的影像点标记有语义信息；

[0055] 步骤102、通过人工智能深度学习算法利用所述预存影像上影像点的语义信息来感知所述3D影像上影像点的语义信息。

[0056] 本实施例还提供预存影像库的生成方法，包括：获取目标影像生成所述预存影像库，所述目标影像为通过工业用3D摄像机获取精确影像，并在所述精确影像上的目标影像点上标记语义信息。

[0057] 本实施例的3D深度语义感知方法及装置能够获取更加规范的数字点云，使获取的3D影像更加容易管理、控制，而且能够降低运算所耗资源。

[0058] 实施例2

[0059] 本实施例与实施例1基本相同，不同之处仅在于：

[0060] 所述3D深度语义感知装置包括一分析模块以及一计算模块。

[0061] 预存影像库中每一预存影像上设有表示影像点之间关系的函数式，[0062] 所述处理模块还用于通过人工智能深度学习算法利用所述预存影像上函数式来设置所述3D影像上影像点之间的函数式。

[0063] 具体地，预存影像库中每一预存影像划分为若干区域，每一区域内设有表示同一区域内影像点之间关系的函数式，

[0064] 所述处理模块还用于通过人工智能深度学习算法利用所述预存影像上的区域位置在所述3D影像上划分区域；

[0065] 对于所述3D影像上的一目标区域，所述处理模块还用于通过人工智能深度学习算法利用所述预存影像上函数式来设置所述3D影像上所述目标区域内的影像点之间的函数式。

[0066] 为了将3D影像进一步数字化，本实施例为3D影像添加联动关系，使得调节一个影像点时会对其他影像点做出联动调节。通过对人脸空间形状的学习，能够获取影像点之间的关联，从而应用到影像修改、整形等领域。

[0067] 由于每个影像点之间的联系非常复杂，如果从整体来计算一个影像点移动会牵连哪些影像点，计算量非常的庞大，因此将联动关系较为明显的影像点划分为同一区域，从而切断和区域外影像点的联系，能够降低计算量。

[0068] 进一步地，本实施例提供了一种如何划分区域的方式，包括：

[0069] 对于预存影像库中一目标预存影像，所述分析模块用于获取目标预存影像中相邻影像点之间的函数式，所述函数式为多项式函数；

[0070] 所述计算模块用于通过人工智能深度学习获取若干穿过相邻影像点之间的分割线，并计算分割线穿过的全部相邻影像点之间的多项式函数的最高次项的次数总和，以次数总和低于预设值的分割线划分目标预存影像的区域。

[0071] 参见图2，相对应地，本实施例的3D深度语义感知方法中，在实施例1步骤101后包括：

[0072] 步骤200、对于预存影像库中一目标预存影像，获取目标预存影像中相邻影像点之间的函数式，所述函数式为多项式函数；

[0073] 步骤201、通过人工智能深度学习获取若干穿过相邻影像点之间的分割线，并计算分割线穿过的全部相邻影像点之间的多项式函数的最高次项的次数总和，以次数总和低于预设值的分割线划分目标预存影像的区域。

[0074] 步骤200和步骤201实现了通过人工智能深度学习算法利用所述预存影像上的区域位置在所述3D影像上划分区域；

[0075] 步骤202、对于所述3D影像上的一目标区域，通过人工智能深度学习算法利用所述预存影像上函数式来设置所述3D影像上所述目标区域内的影像点之间的函数式。

[0076] 虽然以上描述了本发明的具体实施方式，但是本领域的技术人员应当理解，这些仅是举例说明，本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下，可以对这些实施方式做出多种变更或修改，但这些变更和修改均落入本发明的保护范围。