一种智能家庭设备管控方法和系统转让专利

申请号 : CN202111147183.6

文献号 : CN113593565B

文献日 : 2021-12-17

本发明提供了一种智能家庭设备管控方法，包括：接收用户语音信息；对语音信息进行分解，并通过神经网络模型进行特征提取，识别出用户语音特征，分离出用户话语；将用户话语输入语音识别模型进行语音识别，生成文本信息；根据生成的文本信息进行语义分析，语义信息中包括智能设备、操作及功能状态；根据语义信息识别出智能设备、操作及功能状态，向相应的智能设备发出控制指令，并使得相应智能设备执行对应操作及设定为对应功能状态；本发明提供的方法，首先通过在混杂音中识别出用户语音特征，分离出用户话语，然后进行语音识别和语义分析，精确地得出用户语音指令中的智能设备、操作及功能状态，从而能够实现准确控制智能设备，提高用户体验。

1.一种智能家庭设备管控方法，其特征在于，包括如下步骤：接收用户语音信息；

对语音信息进行分解，并通过神经网络模型对分解后语音信息进行特征提取，识别出用户语音特征，分离出用户话语；

对语音信息进行分解，并通过神经网络模型对分解后语音信息进行特征提取，分离出用户话语，具体包括：

首先将语音信息根据不同的频段进行分解；

并通过神经网络模型对分解后语音信息进行特征提取，提前录入的用户语音特征进行比对确定出用户语音特征，识别出用户语音特征；

根据包含用户语音特征对应的语音频段，分离出用户话语；

将用户话语输入语音识别模型进行语音识别，生成相应的文本信息；所述语音识别模型包括采样层和语音识别层，采样层进行卷积和下采样处理，获取局部信息特征向量；再将得到的局部信息特征向量输入语音识别模型的语音识别层进行处理，获取所述用户话语对应的文本信息；

根据生成的文本信息进行语义分析，获取待分析文本信息中的实体；根据所述实体，获取所述实体对应的结构化实体向量，所述结构化实体向量用于指示所述实体的标识以及所述实体的属性；对所述结构化实体向量进行特征提取，得到实体特征；对所述实体特征、所述文本的词法特征和所述文本的句法特征进行融合，得到所述文本的语义特征，所述语义特征用于获取所述文本的语义信息，所述语义信息中包括智能设备、操作及功能状态；

根据语义信息识别出智能设备、操作及功能状态，向相应的智能设备发出控制指令，并使得相应智能设备执行对应操作及设定为对应功能状态。

2.根据权利要求1所述的一种智能家庭设备管控方法，其特征在于，还包括：接收智能设备根据控制指令发出的反馈信息；

当所述反馈信息表示控制指令操作成功时，回复信息，完成操作。

3.根据权利要求1所述的一种智能家庭设备管控方法，其特征在于，所有步骤之前还包括：

录入用户语音信息，根据录入的语音信息，识别用户语音特征。

4.一种智能家庭设备管控系统，其特征在于，包括：语音输入单元：接收用户语音信息；

分离语音单元：对语音信息进行分解，并通过神经网络模型对分解后语音信息进行特征提取，识别出用户语音特征，分离出用户话语；

分离语音单元中，对语音信息进行分解，并通过神经网络模型对分解后语音信息进行特征提取，分离出用户话语，具体包括：首先将语音信息根据不同的频段进行分解；

并通过神经网络模型对分解后语音信息进行特征提取，提前录入的用户语音特征进行比对确定出用户语音特征，识别出用户语音特征；

根据包含用户语音特征对应的语音频段，分离出用户话语；

语音识别单元：将用户话语输入语音识别模型进行语音识别，生成相应的文本信息；所述语音识别模型包括采样层和语音识别层，采样层进行卷积和下采样处理，获取局部信息特征向量；再将得到的局部信息特征向量输入语音识别模型的语音识别层进行处理，获取所述用户话语对应的文本信息；

语义分析单元：根据生成的文本信息进行语义分析，获取待分析文本信息中的实体；根据所述实体，获取所述实体对应的结构化实体向量，所述结构化实体向量用于指示所述实体的标识以及所述实体的属性；对所述结构化实体向量进行特征提取，得到实体特征；对所述实体特征、所述文本的词法特征和所述文本的句法特征进行融合，得到所述文本的语义特征，所述语义特征用于获取所述文本的语义信息，所述语义信息中包括智能设备、操作及功能状态；

指令操作单元：根据语义信息识别出智能设备、操作及功能状态，向相应的智能设备发出控制指令，并使得相应智能设备执行对应操作及设定为对应功能状态。

5.根据权利要求4所述的一种智能家庭设备管控系统，其特征在于，还包括：反馈单元：接收智能设备根据控制指令发出的反馈信息；

当所述反馈信息表示控制指令操作成功时，回复信息，完成操作。

6.根据权利要求4所述的一种智能家庭设备管控系统，其特征在于，还包括：预设单元：录入用户语音信息，根据录入的语音信息，识别用户语音特征。

7.一种电子设备，其特征在于，包括处理器、存储器以及存储在所述存储器中且被配置由所述处理执行的计算机程序，所述处理器执行所述计算机程序时实现如权利要求1至3任一项所述的一种智能家庭设备管控方法。

8.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1‑3中任一所述的一种智能家庭设备管控方法。

一种智能家庭设备管控方法和系统

技术领域

[0001] 本发明智能家庭设备领域，特别是指一种智能家庭设备管控方法和系统。

背景技术

[0002] 随着计算机网络技术的发展，人工智能的应用越来越广泛，例如生产制造、娱乐、交易等等，各行各业都致力于人工智能的研究，尤其是智能家居。

[0003] 目前，已经有许多智能家居产品可以满足人们对一些日常生活需求。用户可以通过终端设备(例如手持终端、智能手机)上运行的用户界面实现对智能家居的控制和使用。
然而，不同的智能家居往往拥有不同的终端设备，或者用户界面，因此用户常常需要使用多
个终端设备，或者安装多个的客户端，对用户来说，操作复杂，智能程度不够，用户体验不
好；后面通过语音控制智能设备的方式也开始出现，控制是变得越来越便捷，但存在语音控
制不准确的问题，也同样困扰着用户。

发明内容

[0004] 本发明的主要目的在于克服现有技术中的上述缺陷，提出一种智能家庭设备管控方法，首先通过在混杂音中识别出用户语音特征，分离出用户话语，然后进行语音识别和语
义分析，精确地得出用户语音指令中的智能设备、操作及功能状态，从而能够实现准确控制
智能设备，提高用户体验。

[0005] 本发明采用如下技术方案：

[0006] 一种智能家庭设备管控方法，包括如下步骤：

[0007] 接收用户语音信息；

[0008] 对语音信息进行分解，并通过神经网络模型对分解后语音信息进行特征提取，识别出用户语音特征，分离出用户话语；

[0009] 将用户话语输入语音识别模型进行语音识别，生成相应的文本信息；所述语音识别模型包括采样层和语音识别层，采样层进行卷积和下采样处理，获取局部信息特征向量；
再将得到的局部信息特征向量输入语音识别模型的语音识别层进行处理，获取所述用户话
语对应的文本信息；

[0010] 根据生成的文本信息进行语义分析，获取待分析文本信息中的实体；根据所述实体，获取所述实体对应的结构化实体向量，所述结构化实体向量用于指示所述实体的标识
以及所述实体的属性；对所述结构化实体向量进行特征提取，得到实体特征；对所述实体特
征、所述文本的词法特征和所述文本的句法特征进行融合，得到所述文本的语义特征，所述
语义特征用于获取所述文本的语义信息，所述语义信息中包括智能设备、操作及功能状态；

[0011] 根据语义信息识别出智能设备、操作及功能状态，向相应的智能设备发出控制指令，并使得相应智能设备执行对应操作及设定为对应功能状态。

[0012] 具体地，还包括：

[0013] 接收智能设备根据控制指令发出的反馈信息；

[0014] 当所述反馈信息表示控制指令操作成功时，回复信息，完成操作。

[0015] 具体地，所有步骤之前还包括：

[0016] 录入用户语音信息，根据录入的语音信息，识别用户语音特征。

[0017] 具体地，对语音信息进行分解，并通过神经网络模型对分解后语音信息进行特征提取，分离出用户话语，具体包括：

[0018] 首先将语音信息根据不同的频段进行分解；

[0019] 并通过神经网络模型对分解后语音信息进行特征提取，提前录入的用户语音特征进行比对确定出用户语音特征，识别出用户语音特征；

[0020] 根据包含用户语音特征对应的语音频段，分离出用户话语。

[0021] 本发明另一实施例提供一种智能家庭设备管控系统，包括：

[0022] 语音输入单元：接收用户语音信息；

[0023] 分离语音单元：对语音信息进行分解，并通过神经网络模型对分解后语音信息进行特征提取，识别出用户语音特征，分离出用户话语；

[0024] 语音识别单元：将用户话语输入语音识别模型进行语音识别，生成相应的文本信息；所述语音识别模型包括采样层和语音识别层，采样层进行卷积和下采样处理，获取局部
信息特征向量；再将得到的局部信息特征向量输入语音识别模型的语音识别层进行处理，
获取所述用户话语对应的文本信息；

[0025] 语义分析单元：根据生成的文本信息进行语义分析，获取待分析文本信息中的实体；根据所述实体，获取所述实体对应的结构化实体向量，所述结构化实体向量用于指示所
述实体的标识以及所述实体的属性；对所述结构化实体向量进行特征提取，得到实体特征；
对所述实体特征、所述文本的词法特征和所述文本的句法特征进行融合，得到所述文本的
语义特征，所述语义特征用于获取所述文本的语义信息，所述语义信息中包括智能设备、操
作及功能状态；

[0026] 指令操作单元：根据语义信息识别出智能设备、操作及功能状态，向相应的智能设备发出控制指令，并使得相应智能设备执行对应操作及设定为对应功能状态。

[0027] 具体地，还包括：

[0028] 反馈单元：接收智能设备根据控制指令发出的反馈信息；

[0029] 当所述反馈信息表示控制指令操作成功时，回复信息，完成操作。

[0030] 具体地，还包括：

[0031] 预设单元：录入用户语音信息，根据录入的语音信息，识别用户语音特征。

[0032] 具体地，分离语音单元中，对语音信息进行分解，并通过神经网络模型对分解后语音信息进行特征提取，分离出用户话语，具体包括：

[0033] 首先将语音信息根据不同的频段进行分解；

[0034] 并通过神经网络模型对分解后语音信息进行特征提取，提前录入的用户语音特征进行比对确定出用户语音特征，识别出用户语音特征；

[0035] 根据包含用户语音特征对应的语音频段，分离出用户话语。

[0036] 本发明再一实施例提供一种电子设备，包括处理器、存储器以及存储在所述存储器中且被配置由所述处理执行的计算机程序，所述处理器执行所述计算机程序时实现如上
述的一种智能家庭设备管控方法。

[0037] 本发明又一实施例提供一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如上述的一种智能家庭设备管控方法。

[0038] 由上述对本发明的描述可知，与现有技术相比，本发明具有如下有益效果：

[0039] （1）本发明提出了一种智能家庭设备管控方法，首先接收用户语音信息；对语音信息进行分解，并通过神经网络模型对分解后语音信息进行特征提取，识别出用户语音特征，
分离出用户话语；将用户话语输入语音识别模型进行语音识别，生成相应的文本信息；根据
生成的文本信息进行语义分析，所述语义信息中包括智能设备、操作及功能状态；根据语义
信息识别出智能设备、操作及功能状态，向相应的智能设备发出控制指令，并使得相应智能
设备执行对应操作及设定为对应功能状态；本发明提供的方法，首先通过在混杂音中识别
出用户语音特征，分离出用户话语，然后进行语音识别和语义分析，精确地得出用户语音指
令中的智能设备、操作及功能状态，从而能够实现准确控制智能设备，提高用户体验。

[0040] （2）本发明提供的方法中，对语音信息进行分解，并通过神经网络模型对分解后语音信息进行特征提取，识别出用户语音特征，分离出用户话语；首先剔除干扰信息，分离出
用户的智能设备控制话语，为实现智能设备的精确控制提供基础。

[0041] （3）本发明提供的方法中，根据生成的文本信息进行语义分析，本发明通过融合实体特征、词法特征和句法特征，实现了异构信息的融合，将实体特征、词法特征和句法特征
这三种不同向量空间的语义信息结合，在一起，来识别语义，从而提高语义理解的准确性，
进而提高智能设备控制的精确性。

附图说明

[0042] 图1为本发明实施例提供的一种智能家庭设备管控方法流程图；

[0043] 图2为本发明实施例提供的一种智能家庭设备管控系统的结构图；

[0044] 图3为本发明实施例提供的一种电子设备的实施例示意图；

[0045] 图4为本发明实施例提供的一种计算机可读存储介质的实施例示意图。

具体实施方式

[0046] 以下通过具体实施方式对本发明作进一步的描述。

[0047] 本发明提出了一种智能家庭设备管控方法，首先通过在混杂音中识别出用户语音特征，分离出用户话语，然后进行语音识别和语义分析，精确地得出用户语音指令中的智能
设备、操作及功能状态，从而能够实现准确控制智能设备，提高用户体验。

[0048] 如图1为本发明方案一种智能家庭设备管控方法流程图；具体包括如下步骤：

[0049] S101：接收用户的语音信息；

[0050] 智能家庭设备，包括智能电视、智能空调、智能冰箱等等，当用户需要使用这些智能设备时，只需要发出语音指令即可，如“打开空调，温度设为26度”、“打开电视，频道为中
央一套”等等；本发明提出的方法，是首先接受用户的语音信息；

[0051] 在此步骤之前，还包括，录入用户语音信息，根据录入的语音信息，识别用户语音特征；

[0052] 由于方法中要根据用户的语音特征进行分析，所以需要提前录入用户的语音信息，根据录入的语音信息识别出语音特征，当然，可以录入多个用户的语音信息，这样，其他
用户也能够实现智能家庭设备的控制。

[0053] S102：对语音信息进行分解，并通过神经网络模型对分解后语音信息进行特征提取，识别出用户语音特征，分离出用户话语；

[0054] 对语音信息进行分解，并通过神经网络模型对分解后语音信息进行特征提取，分离出用户话语，具体包括：

[0055] 首先将语音信息根据不同的频段进行分解；

[0056] 并通过神经网络模型对分解后语音信息进行特征提取，提前录入的用户语音特征进行比对确定出用户语音特征，识别出用户语音特征；

[0057] 神经网络模型为CNN网络或ResNet网络，用户的语音特征为声纹特征，声纹特征具有独特性，本发明实施例应用CNN网络，具体提取过程为：

[0058] 所述CNN网络包括卷积层、池化层和全连接层，将语音矩阵输入卷积层进行局部特征提取，得到特征向量C＝[c1 , c2 ,…,cm ]，其中，cj为一个滤波器得到的特征向量，cj＝
[c1 ,c2 ,...,cn‑h+1]，m为卷积核个数， h是卷积核的尺寸，ci为局部特征向量，而ci＝f(ω
×xi:i+h‑1 +b)，其中，ci是卷积操作所提取的局部特征；f代表非线性函数；ω是大小为h
×d的滤波器；h是卷积核的尺寸，代表h个字； xi:i+h‑1是i到i+h‑1的h个字组成的向量；b是
偏置项；池化层通过采用MaxPooling技术对特征向量cj进行下采样，求得局部值的最优解
Mj，得到下采样后的的特征向量M，然后将所述特征向量M输入全连接层得到向量U。

[0059] 根据包含用户语音特征对应的语音频段，分离出用户话语。

[0060] 由于用户在发出语音信息控制智能设备时，有用的语音信息中通常会包含有背景音，包括家中宠物的叫声、碰撞物体发出的声音等等，导致语音控制失灵或者控制不准确；

[0061] 因此，首先对语音信息进行分解，本发明实施例中分解方法主要根据声音的频率，将语音信息分解成多个频段；频段越多，控制精确性越高，但会导致算法比较复杂，延时严
重，考虑到控制精确性和延时的均衡，本发明实施例分为4个频段，<300HZ，300Hz‑1KHz，
1KHz‑3.4KHz，>3.4KHz。

[0062] S103：将用户话语输入语音识别模型进行语音识别，生成相应的文本信息；所述语音识别模型包括采样层和语音识别层，采样层进行卷积和下采样处理，获取局部信息特征
向量；再将得到的局部信息特征向量输入语音识别模型的语音识别层进行处理，获取所述
用户话语对应的文本信息；

[0063] 采样层包括卷积层和池化层，通过采样层中的卷积层对用户话语进行卷积处理，并将卷积结果输入采样层中的池化层，通过最大池化的方法对卷积结果进行下采样操作，
得到局部信息特征向量。最大池化方法为：取局部接受域中值最大的点；卷积和下采样具体
操作为现有技术内容，具体不进行赘述。

[0064] 本发明实施例采用的语音识别模型长短期记忆网络（LSTM）加CTC（Connectionist temporal classification）算法，语音识别的主要过程是：（1）从声音波形中提取声学特
征；（2）将声学特征转换成发音的因素；（3）使用解码技术转变成能读懂的文本信息；解码过
程对给定的音素序列和若干假设词序列计算声学模型和语言模型分数，将总体输出分数最
高的序列作为识别的结果。

[0065] S104：根据生成的文本信息进行语义分析，获取待分析文本信息中的实体；根据所述实体，获取所述实体对应的结构化实体向量，所述结构化实体向量用于指示所述实体的
标识以及所述实体的属性；对所述结构化实体向量进行特征提取，得到实体特征；对所述实
体特征、所述文本的词法特征和所述文本的句法特征进行融合，得到所述文本的语义特征，
所述语义特征用于获取所述文本的语义信息，所述语义信息中包括智能设备、操作及功能
状态；

[0066] 本发明通过融合实体特征、词法特征和句法特征，实现了异构信息的融合，将实体特征、词法特征和句法特征这三种不同向量空间的语义信息结合，在一起，来识别语义，从
而提高语义理解的准确性；

[0067] 语义信息中包括智能设备、操作及功能状态，如“打开空调，温度设为26度”中的语音指令，“空调”为智能设备，“打开”为操作、“温度设为26度”为功能状态，再如“打开电视，
频道为中央一套”，“电视”为智能设备、“打开”为操作，“频道为中央一套”。

[0068] S105：根据语义信息识别出智能设备、操作及功能状态，向相应的智能设备发出控制指令，并使得相应智能设备执行对应操作及设定为对应功能状态。

[0069] 智能设备接收到控制指令后，执行相应的动作，并反馈信息，如“已完成”或“空调已打开，温度已设为26度”等；

[0070] 接收智能设备根据控制指令发出的反馈信息；

[0071] 当所述反馈信息表示控制指令操作成功时，回复信息，完成操作。

[0072] 回复信息，如“收到，谢谢”！

[0073] 如图2，本发明另一实施例提供一种智能家庭设备管控系统，包括：

[0074] 语音输入单元201：接收用户的语音信息；

[0075] 智能家庭设备，包括智能电视、智能空调、智能冰箱等等，当用户需要使用这些智能设备时，只需要发出语音指令即可，如“打开空调，温度设为26度”、“打开电视，频道为中
央一套”等等；本发明提出的方法，是首先接受用户的语音信息；

[0076] 此外，还包括预设单元，录入用户语音信息，根据录入的语音信息，识别用户语音特征；

[0077] 由于方法中要根据用户的语音特征进行分析，所以需要提前录入用户的语音信息，根据录入的语音信息识别出语音特征，当然，可以录入多个用户的语音信息，这样，其他
用户也能够实现智能家庭设备的控制。

[0078] 分离语音单元202：对语音信息进行分解，并通过神经网络模型对分解后语音信息进行特征提取，识别出用户语音特征，分离出用户话语；

[0079] 对语音信息进行分解，并通过神经网络模型对分解后语音信息进行特征提取，分离出用户话语，具体包括：

[0080] 首先将语音信息根据不同的频段进行分解；

[0081] 并通过神经网络模型对分解后语音信息进行特征提取，提前录入的用户语音特征进行比对确定出用户语音特征，识别出用户语音特征；

[0082] 根据包含用户语音特征对应的语音频段，分离出用户话语。

[0083] 由于用户在发出语音信息控制智能设备时，有用的语音信息中通常会包含有背景音，包括家中宠物的叫声、碰撞物体发出的声音等等，导致语音控制失灵或者控制不准确；

[0084] 因此，首先对语音信息进行分解，本发明实施例中分解方法主要根据声音的频率，将语音信息分解成多个频段；频段越多，控制精确性越高，但会导致算法比较复杂，延时严
重，考虑到控制精确性和延时的均衡，本发明实施例分为4个频段，<300HZ，300Hz‑1KHz，
1KHz‑3.4KHz，>3.4KHz。

[0085] 语音识别单元203：将用户话语输入语音识别模型进行语音识别，生成相应的文本信息；所述语音识别模型包括采样层和语音识别层，采样层进行卷积和下采样处理，获取局
部信息特征向量；再将得到的局部信息特征向量输入语音识别模型的语音识别层进行处
理，获取所述用户话语对应的文本信息；

[0086] 本发明实施例采用的语音识别模型长短期记忆网络（LSTM）加CTC（Connectionist temporal classification）算法，语音识别的主要过程是：（1）从声音波形中提取声学特
征；（2）将声学特征转换成发音的因素；（3）使用解码技术转变成能读懂的文本信息；解码过
程对给定的音素序列和若干假设词序列计算声学模型和语言模型分数，将总体输出分数最
高的序列作为识别的结果。

[0087] 语义分析单元204：根据生成的文本信息进行语义分析，获取待分析文本信息中的实体；根据所述实体，获取所述实体对应的结构化实体向量，所述结构化实体向量用于指示
所述实体的标识以及所述实体的属性；对所述结构化实体向量进行特征提取，得到实体特
征；对所述实体特征、所述文本的词法特征和所述文本的句法特征进行融合，得到所述文本
的语义特征，所述语义特征用于获取所述文本的语义信息，所述语义信息中包括智能设备、
操作及功能状态；

[0088] 本发明通过融合实体特征、词法特征和句法特征，实现了异构信息的融合，将实体特征、词法特征和句法特征这三种不同向量空间的语义信息结合，在一起，来识别语义，从
而提高语义理解的准确性；

[0089] 语义信息中包括智能设备、操作及功能状态，如“打开空调，温度设为26度”中的语音指令，“空调”为智能设备，“打开”为操作、“温度设为26度”为功能状态，再如“打开电视，
频道为中央一套”，“电视”为智能设备、“打开”为操作，“频道为中央一套”。

[0090] 指令操作单元205：根据语义信息识别出智能设备、操作及功能状态，向相应的智能设备发出控制指令，并使得相应智能设备执行对应操作及设定为对应功能状态。

[0091] 智能设备接收到控制指令后，执行相应的动作，并反馈信息，如“已完成”或“空调已打开，温度已设为26度”等；

[0092] 反馈单元：接收智能设备根据控制指令发出的反馈信息；

[0093] 当所述反馈信息表示控制指令操作成功时，回复信息，完成操作。

[0094] 回复信息，如“收到，谢谢”！

[0095] 如图3所示，本发明实施例提供了一种电子设备300，包括存储器310、处理器320及存储在存储器320上并可在处理器320上运行的计算机程序311，处理器320执行计算机程序
311时实现本发明实施例提供的一种智能家庭设备管控方法。

[0096] 在具体实施过程中，处理器320执行计算机程序311时，可以实现图1对应的实施例中任一实施方式。

[0097] 由于本实施例所介绍的电子设备为实施本发明实施例中一种数据处理装置所采用的设备，故而基于本发明实施例中所介绍的方法，本领域所属技术人员能够了解本实施
例的电子设备的具体实施方式以及其各种变化形式，所以在此对于该电子设备如何实现本
发明实施例中的方法不再详细介绍，只要本领域所属技术人员实施本发明实施例中的方法
所采用的设备，都属于本发明所欲保护的范围。

[0098] 请参阅图4，图4为本发明实施例提供的一种计算机可读存储介质的实施例示意图。

[0099] 如图4所示，本实施例提供了一种计算机可读存储介质400，其上存储有计算机程序411，该计算机程序411被处理器执行时实现本发明实施例提供的一种一种智能家庭设备
管控方法；

[0100] 在具体实施过程中，该计算机程序411被处理器执行时可以实现图1对应的实施例中任一实施方式。

[0101] 需要说明的是，在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详细描述的部分，可以参见其它实施例的相关描述。

[0102] 本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实
施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机
可用存储介质（包括但不限于磁盘存储器、CD‑ROM、光学存储器等）上实施的计算机程序产
品的形式。

[0103] 本发明提出了一种智能家庭设备管控方法，首先接收用户语音信息；对语音信息进行分解，并通过神经网络模型对分解后语音信息进行特征提取，识别出用户语音特征，分
离出用户话语；将用户话语输入语音识别模型进行语音识别，生成相应的文本信息；根据生
成的文本信息进行语义分析，所述语义信息中包括智能设备、操作及功能状态；根据语义信
息识别出智能设备、操作及功能状态，向相应的智能设备发出控制指令，并使得相应智能设
备执行对应操作及设定为对应功能状态；本发明提供的方法，首先通过在混杂音中识别出
用户语音特征，分离出用户话语，然后进行语音识别和语义分析，精确地得出用户语音指令
中的智能设备、操作及功能状态，从而能够实现准确控制智能设备，提高用户体验。

[0104] 本发明提供的方法中，对语音信息进行分解，并通过神经网络模型对分解后语音信息进行特征提取，识别出用户语音特征，分离出用户话语；首先剔除干扰信息，分离出用
户的智能设备控制话语，为实现智能设备的精确控制提供基础。

[0105] 本发明提供的方法中，根据生成的文本信息进行语义分析，本发明通过融合实体特征、词法特征和句法特征，实现了异构信息的融合，将实体特征、词法特征和句法特征这
三种不同向量空间的语义信息结合，在一起，来识别语义，从而提高语义理解的准确性，进
而提高智能设备控制的精确性。

[0106] 上述仅为本发明的具体实施方式，但本发明的设计构思并不局限于此，凡利用此构思对本发明进行非实质性的改动，均应属于侵犯本发明保护范围的行为。

一种智能家庭设备管控方法和系统转让专利

申请号 : CN202111147183.6

文献号 : CN113593565B

文献日 : 2021-12-17

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 黄晓娜

申请人 : 深圳大生活家科技有限公司

摘要 :

权利要求 :

说明书 :