一种隐藏语音数据的图像处理方法及系统转让专利

申请号 : CN201811547535.5

文献号 : CN109788161B

文献日 : 2020-01-03

本发明公开一种隐藏语音数据的图像处理方法及系统，该方法包括根据用户个人信息生成音频隐藏和提取的秘钥；接收用户上传的原始图片和原始语音并进行预处理；结合生成的秘钥，对预处理后的原始图片和原始语音进行隐藏混合处理，生成混合语音图片；计算混合语音图片与原始图片的峰值信噪比，并判断所述峰值信噪比是否小于设定的标准值；若是则重新上传原始图片，并返回预处理步骤，否则根据用户要求将混合语音图片保存到指定的本地位置或者云服务器内；最后从指定位置读取混合语音图片，结合生成的秘钥，提取混合语音图片中隐藏的语音信息。应用本发明，即保证图片质量不会产生过大改变，又能使图片的嵌入容量具有较大的提升。

1.一种隐藏语音数据的图像处理方法，其特征在于，所述图像处理方法包括：根据用户个人信息生成音频隐藏和提取的秘钥；

接收用户上传的原始图片和原始语音，并对所述原始图片和所述原始语音进行预处理；具体包括：将所述原始语音转换为对应编码；将所述对应编码进行九进制转换，生成语音编码序列，并记录所述语音编码序列的长度；读取所述原始图片的尺寸；判断所述语音编码序列的长度是否小于所述原始图片的尺寸；若是，则将所述原始图片转换为相应的原始像素矩阵；若否，则重新上传原始图片，返回读取所述原始图片尺寸的步骤；

结合生成的秘钥，对预处理后的原始图片和原始语音进行隐藏混合处理，生成混合语音图片；

计算所述混合语音图片与所述原始图片的峰值信噪比；

判断所述峰值信噪比是否小于设定的标准值，得到判断结果；

若所述判断结果表示所述峰值信噪比小于设定的标准值，则重新上传原始图片，并返回对所述原始图片和所述原始语音进行预处理步骤；

若所述判断结果表示所述峰值信噪比大于或者等于设定的标准值，则根据用户要求将所述混合语音图片保存到指定的本地位置或者云服务器内；

从所述指定的本地位置或者所述云服务器中读取所述混合语音图片，结合生成的秘钥，提取所述混合语音图片中隐藏的语音信息。

2.根据权利要求1所述的隐藏语音数据的图像处理方法，其特征在于，所述根据用户个人信息生成音频隐藏和提取的秘钥，具体包括：将用户的个人信息N、时间戳T以及随机数R进行拼接，得到拼接结果R’；所述拼接结果R’＝N||T||R；

将所述拼接结果R’作为种子，通过随机数产生器生成秘钥。

3.根据权利要求1所述的隐藏语音数据的图像处理方法，其特征在于，所述根据预处理后的原始图片和原始语音，结合生成的秘钥进行隐藏混合处理，生成混合语音图片，具体包括：根据所述秘钥，生成秘钥矩阵；

根据所述秘钥矩阵，对所述原始像素矩阵和所述语音编码序列进行隐藏混合处理，生成混合语音图片。

4.根据权利要求3所述的隐藏语音数据的图像处理方法，其特征在于，所述根据所述秘钥，生成秘钥矩阵，具体包括：将所述秘钥作为混沌映射的种子生成混沌序列；

将所述混沌序列转换为九进制序列，并以所述九进制序列的前9个不同数字作为初始子矩阵；

根据所述初始子矩阵的最左边一列和所述混沌序列，将所述初始子矩阵扩充为变换子矩阵；其中，所述变换子矩阵为3*256大小的矩阵；

将86个所述变换子矩阵上下叠加，取其中的256行形成最终的秘钥矩阵，所述秘钥矩阵的大小为256*256。

5.根据权利要求3所述的隐藏语音数据的图像处理方法，其特征在于，所述根据所述秘钥矩阵，对所述原始像素矩阵和所述语音编码序列进行隐藏混合处理，生成混合语音图片，具体包括：将所述原始像素矩阵中的像素两两一组形成原始像素对序列；所述原始像素对序列包括多个原始像素对；

依次读取所述原始像素对序列中的原始像素对，并在所述秘钥矩阵找到每个所述原始像素对所对应的原点；

判断所述原点是否等于所述语音编码序列；

若否，则在所述原点所在坐标的周围8个元素中找出与所述语音编码序列相等的元素点，并将所述元素点所处坐标替换所述原点对应的原始像素对，生成新像素对；

若是，则保留所述原点对应的原始像素对，重复判断步骤，直到所有所述语音编码序列被读取完毕；

将生成的所述新像素对和保留的所述原始像素对，生成新像素矩阵；

根据所述新像素矩阵，生成混合语音图片。

6.根据权利要求1所述的隐藏语音数据的图像处理方法，其特征在于，所述结合生成的秘钥，提取所述混合语音图片中隐藏的语音信息，具体包括：将所述混合语音图片转换成混合像素矩阵，并将所述混合像素矩阵中的像素两两一组形成混合像素对序列；所述混合像素对序列包括多个混合像素对；

依次读取所述混合像素对序列中的混合像素对，并在所述秘钥矩阵找到每个所述混合像素对所对应的语音点；

根据所有所述语音点，生成新语音编码序列；

将所述新语音编码序列通过九进制解码，获得隐藏在所述混合语音图片中的语音信息。

7.一种隐藏语音数据的图像处理系统，其特征在于，所述图像处理系统包括：秘钥生成模块，用于根据用户个人信息生成音频隐藏和提取的秘钥；

预处理模块，用于接收用户上传的原始图片和原始语音，并对所述原始图片和所述原始语音进行预处理；具体包括：将所述原始语音转换为对应编码；将所述对应编码进行九进制转换，生成语音编码序列，并记录所述语音编码序列的长度；读取所述原始图片的尺寸；

判断所述语音编码序列的长度是否小于所述原始图片的尺寸；若是，则将所述原始图片转换为相应的原始像素矩阵；若否，则重新上传原始图片，返回读取所述原始图片尺寸的步骤；

混合语音图片生成模块，用于结合生成的秘钥，对预处理后的原始图片和原始语音进行隐藏混合处理，生成混合语音图片；

峰值信噪比计算模块，用于计算所述混合语音图片与所述原始图片的峰值信噪比；

判断结果得到模块，用于判断所述峰值信噪比是否小于设定的标准值，得到判断结果；

返回模块，用于当所述判断结果表示所述峰值信噪比小于设定的标准值时，重新上传原始图片，并返回预处理模块；

混合语音图片保存模块，用于当所述判断结果表示所述峰值信噪比大于或者等于设定的标准值时，根据用户要求将所述混合语音图片保存到指定的本地位置或者云服务器内；

语音信息提取模块，用于从所述指定的本地位置或者所述云服务器中读取所述混合语音图片，结合生成的秘钥，提取所述混合语音图片中隐藏的语音信息。

一种隐藏语音数据的图像处理方法及系统

技术领域

[0001] 本发明涉及语音数据隐藏技术领域，特别是涉及一种隐藏语音数据的图像处理方法及系统，可被应用到图片版权的语音认证、语音弹幕、支付宝商家二维码的防伪语音认证、对盲人识图的语音自动讲解等方面。

背景技术

[0002] 随着互联网技术的日新月异，人们越来越喜欢通过互联网进行聊天，观看视频、图片等，网络上传输着大量的多媒体文件，通过图片隐藏技术对多媒体文件处理后，不仅在信息安全领域，例如图片的语音认证、语音弹幕、支付宝商家二维码的防伪语音认证、对盲人识图的语音自动讲解等方面上带来更多新的内容。

[0003] 图片隐藏技术是一种通过多媒体文件，例如图片、声音等传递秘密信息的技术。图片的信息隐藏技术主要需要对两个因素进行考量——图片质量和嵌入容量，需要在图片中嵌入语音的同时保证图片的质量并不因此产生改变，但是这是互相矛盾的两个条件，嵌入容量增加的同时，图片中存在更多的噪声，图片质量因此下降。所以，必须寻找一个折中的办法，既能保证图片质量不会产生过大改变，又能使图片的嵌入容量也能达到较大的提升。

发明内容

[0004] 本发明的目的是提供一种隐藏语音数据的图像处理方法及系统，解决了现有技术中存在的在图片中嵌入语音时图片质量下降的问题。

[0005] 为实现上述目的，本发明提供了如下方案：

[0006] 一种隐藏语音数据的图像处理方法，所述图像处理方法包括：

[0007] 根据用户个人信息生成音频隐藏和提取的秘钥；

[0008] 接收用户上传的原始图片和原始语音，并对所述原始图片和所述原始语音进行预处理；

[0009] 结合生成的秘钥，对预处理后的原始图片和原始语音进行隐藏混合处理，生成混合语音图片；

[0010] 计算所述混合语音图片与所述原始图片的峰值信噪比；

[0011] 判断所述峰值信噪比是否小于设定的标准值，得到判断结果；

[0012] 若所述判断结果表示所述峰值信噪比小于设定的标准值，则重新上传原始图片，并返回对所述原始图片和所述原始语音进行预处理步骤；

[0013] 若所述判断结果表示所述峰值信噪比大于或者等于设定的标准值，则根据用户要求将所述混合语音图片保存到指定的本地位置或者云服务器内；

[0014] 从所述指定的本地位置或者所述云服务器中读取所述混合语音图片，结合生成的秘钥，提取所述混合语音图片中隐藏的语音信息。

[0015] 可选的，所述根据用户个人信息生成音频隐藏和提取的秘钥，具体包括：

[0016] 将用户的个人信息N、时间戳T以及随机数R进行拼接，得到拼接结果R’；所述拼接结果R’＝N||T||R；

[0017] 将所述拼接结果R’作为种子，通过随机数产生器生成秘钥。

[0018] 可选的，所述对所述原始图片和所述原始语音进行预处理，具体包括：

[0019] 将所述原始语音转换为对应编码；

[0020] 将所述对应编码进行九进制转换，生成语音编码序列，并记录所述语音编码序列的长度；

[0021] 读取所述原始图片的尺寸；

[0022] 判断所述语音编码序列的长度是否小于所述原始图片的尺寸；

[0023] 若是，则将所述原始图片转换为相应的原始像素矩阵；

[0024] 若否，则重新上传原始图片，返回读取所述原始图片尺寸的步骤。

[0025] 可选的，所述根据预处理后的原始图片和原始语音，结合生成的秘钥进行隐藏混合处理，生成混合语音图片，具体包括：

[0026] 根据所述秘钥，生成秘钥矩阵；

[0027] 根据所述秘钥矩阵，对所述原始像素矩阵和所述语音编码序列进行隐藏混合处理，生成混合语音图片。

[0028] 可选的，所述根据所述秘钥，生成秘钥矩阵，具体包括：

[0029] 将所述秘钥作为混沌映射的种子生成混沌序列；

[0030] 将所述混沌序列转换为九进制序列，并以所述九进制序列的前9个不同数字作为初始子矩阵；

[0031] 根据所述初始子矩阵的最左边一列和所述混沌序列，将所述初始子矩阵扩充为变换子矩阵；其中，所述变换子矩阵为3*256大小的矩阵；

[0032] 将86个所述变换子矩阵上下叠加，取其中的256行形成最终的秘钥矩阵，所述秘钥矩阵的大小为256*256。

[0033] 可选的，所述根据所述秘钥矩阵，对所述原始像素矩阵和所述语音编码序列进行隐藏混合处理，生成混合语音图片，具体包括：

[0034] 将所述原始像素矩阵中的像素两两一组形成原始像素对序列；所述原始像素对序列包括多个原始像素对；

[0035] 依次读取所述原始像素对序列中的原始像素对，并在所述秘钥矩阵找到每个所述原始像素对所对应的原点；

[0036] 判断所述原点是否等于所述语音编码序列；

[0037] 若否，则在所述原点所在坐标的周围8个元素中找出与所述语音编码序列相等的元素点，并将所述元素点所处坐标替换所述原点对应的原始像素对，生成新像素对；

[0038] 若是，则保留所述原点对应的原始像素对，重复判断步骤，直到所有所述语音编码序列被读取完毕；

[0039] 将生成的所述新像素对和保留的所述原始像素对，生成新像素矩阵；

[0040] 根据所述新像素矩阵，生成混合语音图片。

[0041] 可选的，所述结合生成的秘钥，提取所述混合语音图片中隐藏的语音信息，具体包括：

[0042] 将所述混合语音图片转换成混合像素矩阵，并将所述混合像素矩阵中的像素两两一组形成混合像素对序列；所述混合像素对序列包括多个混合像素对；

[0043] 依次读取所述混合像素对序列中的混合像素对，并在所述秘钥矩阵找到每个所述混合像素对所对应的语音点；

[0044] 根据所有所述语音点，生成新语音编码序列；

[0045] 将所述新语音编码序列通过九进制解码，获得隐藏在所述混合语音图片中的语音信息。

[0046] 一种隐藏语音数据的图像处理系统，所述图像处理系统包括：

[0047] 秘钥生成模块，用于根据用户个人信息生成音频隐藏和提取的秘钥；

[0048] 预处理模块，用于接收用户上传的原始图片和原始语音，并对所述原始图片和所述原始语音进行预处理；

[0049] 混合语音图片生成模块，用于结合生成的秘钥，对预处理后的原始图片和原始语音进行隐藏混合处理，生成混合语音图片；

[0050] 峰值信噪比计算模块，用于计算所述混合语音图片与所述原始图片的峰值信噪比；

[0051] 判断结果得到模块，用于判断所述峰值信噪比是否小于设定的标准值，得到判断结果；

[0052] 返回模块，用于当所述判断结果表示所述峰值信噪比小于设定的标准值时，重新上传原始图片，并返回预处理模块；

[0053] 混合语音图片保存模块，用于当所述判断结果表示所述峰值信噪比大于或者等于设定的标准值时，根据用户要求将所述混合语音图片保存到指定的本地位置或者云服务器内；

[0054] 语音信息提取模块，用于从所述指定的本地位置或者所述云服务器中读取所述混合语音图片，结合生成的秘钥，提取所述混合语音图片中隐藏的语音信息。

[0055] 根据本发明提供的具体实施例，本发明公开了以下技术效果：

[0056] 本发明提供了一种隐藏语音数据的图像处理方法及系统，该方法包括根据用户个人信息生成音频隐藏和提取的秘钥；接收用户上传的原始图片和原始语音并进行预处理；结合生成的秘钥，对预处理后的原始图片和原始语音进行隐藏混合处理，生成混合语音图片；计算混合语音图片与原始图片的峰值信噪比，并判断所述峰值信噪比是否小于设定的标准值；若是则重新上传原始图片，并返回预处理步骤，否则根据用户要求将混合语音图片保存到指定的本地位置或者云服务器内；最后从指定位置读取混合语音图片，结合生成的秘钥，提取混合语音图片中隐藏的语音信息。与现有技术相比，本发明通过对图片产生肉眼不可区分的改动的前提下，对音频进行了秘密混合，并根据秘钥在对应图片中提取语音数据，可用于音频认证、语音弹幕、支付宝商家二维码的防伪语音认证、对盲人识图的语音自动讲解等方面，有巨大的应用价值。

附图说明

[0057] 为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

[0058] 图1为本发明实施例隐藏语音数据的图像处理方法的流程示意图；

[0059] 图2为本发明实施例隐藏语音数据的图像处理系统的结构示意图；

[0060] 图3为本发明实施例秘钥生成流程图；

[0061] 图4为本发明实施例预处理方法流程图；

[0062] 图5为本发明实施例语音隐藏方法流程图；

[0063] 图6为本发明实施例混合语音图片保存方法流程图；

[0064] 图7为本发明实施例语音提取方法流程图。

具体实施方式

[0065] 下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

[0066] 本发明的目的是提供一种隐藏语音数据的图像处理方法及系统，在对图片产生肉眼不可区分的改动的前提下，嵌入用户的语音内容，即保证图片质量不会产生过大改变，又能使图片的嵌入容量具有较大的提升。

[0067] 为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

[0068] 图1为本发明实施例隐藏语音数据的图像处理方法的流程示意图，如图1 所示，本发明实施例提供的一种隐藏语音数据的图像处理方法包括以下几个步骤：

[0069] 步骤101：根据用户个人信息生成音频隐藏和提取的秘钥。

[0070] 步骤102：接收用户上传的原始图片和原始语音，并对所述原始图片和所述原始语音进行预处理。

[0071] 步骤103：结合生成的秘钥，对预处理后的原始图片和原始语音进行隐藏混合处理，生成混合语音图片。

[0072] 步骤104：计算所述混合语音图片与所述原始图片的峰值信噪比；

[0073] 步骤105：判断所述峰值信噪比是否小于设定的标准值，得到判断结果；若所述判断结果表示所述峰值信噪比小于设定的标准值，则执行步骤106；若所述判断结果表示所述峰值信噪比大于或者等于设定的标准值，则执行步骤 107。

[0074] 步骤106：重新上传原始图片，并返回步骤102。

[0075] 步骤107：根据用户要求将所述混合语音图片保存到指定的本地位置或者云服务器内。

[0076] 步骤108：从所述指定的本地位置或者所述云服务器中读取所述混合语音图片，结合生成的秘钥，提取所述混合语音图片中隐藏的语音信息。

[0077] 图2为本发明实施例隐藏语音数据的图像处理系统的结构示意图，如图2 所示，本发明实施例提供的隐藏语音数据的图像处理系统包括：

[0078] 秘钥生成模块1，用于根据用户个人信息生成音频隐藏和提取的秘钥。

[0079] 预处理模块2，用于接收用户上传的原始图片和原始语音，并对所述原始图片和所述原始语音进行预处理。

[0080] 混合语音图片生成模块3，用于结合生成的秘钥，对预处理后的原始图片和原始语音进行隐藏混合处理，生成混合语音图片。

[0081] 峰值信噪比计算模块4，用于计算所述混合语音图片与所述原始图片的峰值信噪比；

[0082] 判断结果得到模块5，用于判断所述峰值信噪比是否小于设定的标准值，得到判断结果。

[0083] 返回模块6，用于当所述判断结果表示所述峰值信噪比小于设定的标准值时，重新上传原始图片，并返回预处理模块。

[0084] 混合语音图片保存模块7，用于当所述判断结果表示所述峰值信噪比大于或者等于设定的标准值时，根据用户要求将所述混合语音图片保存到指定的本地位置或者云服务器内。

[0085] 语音信息提取模块8，用于从所述指定的本地位置或者所述云服务器中读取所述混合语音图片，结合生成的秘钥，提取所述混合语音图片中隐藏的语音信息。

[0086] 作为优先的，步骤101具体实现如图3所示，包括以下子步骤：

[0087] 步骤1.1：将用户的个人信息N、时间戳T以及随机数R进行拼接，得到拼接结果R’；所述拼接结果R’＝N||T||R。

[0088] 步骤1.2：将拼接结果R’作为种子，通过随机数产生器生成秘钥k。

[0089] 作为优先的，步骤102具体实现如图4所示，包括以下子步骤：

[0090] 步骤2.1：接收用户上传的原始语音C，并将原始语音C转换为对应编码 d。

[0091] 步骤2.2：将对应编码d进行九进制转换，生成语音编码序列Ni，并记录语音编码序列Ni的长度l。

[0092] 步骤2.3：接收用户上传的原始图片P，读取原始图片P的尺寸，并将原始图片P的尺寸与语音编码序列Ni的长度l进行比较。

[0093] 步骤2.4：若原始图片P尺寸大于或者等于语音编码序列Ni的长度l，则将原始图片P转换为相应的原始像素矩阵Pm，以保证所有语音编码序列Ni能够放入原始图片P中。

[0094] 步骤2.4：若原始图片P的尺寸小于语音编码序列Ni的长度l，则重新上传原始语音C。

[0095] 作为优先的，步骤103具体实现如图5所示，包括两个大步骤：

[0096] 步骤3.1：根据秘钥k，生成秘钥矩阵M；

[0097] 步骤3.1具体包括：

[0098] 步骤3.1.1：将秘钥k作为混沌映射的种子生成混沌序列S，将混沌序列S 转换为九进制序列，并以九进制序列的前9个不同数字作为初始子矩阵m0。

[0099] 例如秘钥k作为种子通过逻辑映射(混沌算法的一种)生成的混沌序列为 S1，S2，S3，.....，去除S1-S200以保证混沌的效果，从将S200之后的20个转变为九进制数，从前往后取9个不同的九进制数，例如前九个不同的九进制数为053782146，则生成的初始矩阵m0为[0
5 3，7 8 2，1 4 6]，如果取不到不同的九个九进制数则继续往后转换20位直到取够为止。

[0100] 步骤3.1.2：根据初始子矩阵m0的最左边一列和混沌序列S，将初始子矩阵m0扩充为变换子矩阵m1；其中，变换子矩阵m1为3*256大小的矩阵。

[0101] 例如，此时初始子矩阵m0为[0 5 3，7 8 2，1 4 6]，则将混沌序列S未使用的后一位转变为六进制的数，如果为0则在初始子矩阵m0右侧添加一列为[0 7 1]T，如果为1则在初始子矩阵m0右侧添加[0 1 7]，如果为2则在初始子矩阵m0右侧添加[1 0 7].....(此处规则可以进行修改，共计6种不同的排列方式对应6个不同的数字)。假设添加后的矩阵为m0’＝[0 5 3 0，7 8 2 7，1 4 6 1]，此时添加新的一列应以第二列即[5 8 4]T作为基础，根据未使用的混沌序列Si生成的新六进制数作为规则的参照，对第二列进行乱序并添加在m0’右侧一列，并以此类推直至生成3*256大小的变换子矩阵m1。

[0102] 步骤3.1.3：将86个变换子矩阵m1上下叠加，取其中的256行形成最终的秘钥矩阵M，其中，秘钥矩阵M的大小为256*256。

[0103] 步骤3.2：根据秘钥矩阵，对所述原始像素矩阵和所述语音编码序列进行隐藏混合处理，生成混合语音图片。

[0104] 步骤3.2具体包括：

[0105] 步骤3.2.1：将原始像素矩阵Pm中的像素两两一组形成原始像素对序列(xi，yi)；其中，所述原始像素对序列(xi，yi)包括多个原始像素对。

[0106] 步骤3.2.2：依次读取原始像素对序列(xi，yi)中的原始像素对，并在秘钥矩阵M中找到每个原始像素对所对应的原点si。例如第一对原始像素对为 (142，168)，则对应秘钥矩阵M第143行，169列的元素即为s1。

[0107] 步骤3.2.3：将原点si与语音编码序列Ni进行比较；如果原点si等于语音编码序列Ni，则保留原点si对应的原始像素对；如果原点si不等于语音编码序列Ni，则在原点si所在坐标的周围8个元素中找出与语音编码序列Ni相等的元素点，并将该元素点所处坐标(xi’，yi’)替换原始像素对(xi，yi)，生成新像素对。

[0108] 例如步骤3.2.2中找的到元素s1为5，如果N1＝5，则(x1’，y1’)＝(x1， y1)，如果Ni＝2≠s1，则在s1所在坐标(142，168)周围8个元素，即(142±1， 168±1)的位置，寻找与Ni相等的元素的坐标，此处假设为(143，169)，则将原始像素对(142，168)修改为新像素对(143，
169)。

[0109] 重复步骤3.2.2-3.2.3直到所有语音编码序列Ni被读取完毕。

[0110] 步骤3.2.4：将生成的所述新像素对和保留的所述原始像素对，生成新像素矩阵Pm’，并根据新像素矩阵Pm’，生成混合语音图片P’。

[0111] 作为优先的，步骤104-107具体实现如图6所示，包括以下子步骤：

[0112] 步骤4.1：将混合语音图片P’和原始图片P进行比较，计算混合语音图片 P’与原始图片P的峰值信噪比(PSNR值)，并将计算得到的峰值信噪比与标准值(此处设置为40，可根据实际需求设定)进行比较，以作为隐藏效果的指标。

[0113] 通过下列公式计算混合语音图片P’与原始图片P的峰值信噪比。

[0114]

[0115]

[0116] 如果PSNR值＜40dB，则认为隐藏效果较差，选择分辨率更大的图片后重新从步骤102开始执行，如果PSNR值＞40dB，则认为隐藏效果较好，进入步骤4.2。

[0117] 步骤4.2：同时显示混合语音图片P’和原始图片P，并根据用户要求将所述混合语音图片P’传输保存到指定的本地位置或者云服务器内。

[0118] 作为优先的，步骤108具体实现如图7所示，包括以下子步骤：

[0119] 步骤5.1：从指定的本地位置或者所述云服务器中读取混合语音图片P”和读取秘钥k’之后，与步骤3.1相同生成秘钥矩阵M。步骤3.1已作出举例，在此不再叙述。

[0120] 步骤5.2：将读取的混合语音图片P”转换成混合像素矩阵，并将混合像素矩阵中的像素两两一组形成混合像素对序列(xi”，yi”)。其中，混合像素对序列包括多对混合像素对。

[0121] 步骤5.3：依次读取所述混合像素对，并在秘钥矩阵M找到每个混合像素对所对应的语音点，并根据所有所述语音点，生成新语音编码序列Ni’。

[0122] 例如第一混合对像素对为(143，169)，则读取秘钥矩阵M中第144行第 169列元素，假设为2；第二对混合像素对为(110，152)，则读取秘钥矩阵M 中第111行第153列元素，假设为5，......直到读取完毕整个混合像素对序列 (xi”，yi”)。

[0123] 步骤5.4：将所述新语音编码序列通过九进制解码，获得隐藏在所述混合语音图片中的语音信息C’。

[0124] 与现有技术相比，本发明通过对图片进行肉眼不可见的改动对音频进行了秘密混合，并根据秘钥在对应图片中提取语音数据。可用于音频认证、语音弹幕、支付宝商家二维码的防伪语音认证、对盲人识图的语音自动讲解等方面，为认证、防伪、语音讲解等方面提供了新的技术、方便了人们的生活，具有很好的应用价值。

[0125] 本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

[0126] 本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处。综上所述，本说明书内容不应理解为对本发明的限制。

一种隐藏语音数据的图像处理方法及系统转让专利

申请号 : CN201811547535.5

文献号 : CN109788161B

文献日 : 2020-01-03

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 张亦茹 , 张劭辰

申请人 : 张亦茹 , 张劭辰

摘要 :

权利要求 :

说明书 :