一种安保预警方法及系统转让专利
申请号 : CN202110775181.5
文献号 : CN113241060B
文献日 : 2021-12-17
发明人 : 姚娟娟 , 钟南山
申请人 : 明品云(北京)数据科技有限公司
摘要 :
权利要求 :
1.一种安保预警方法,其特征在于,包括:获取训练集,所述训练集包括:多个语音样本,以及与所述语音样本相对应的情感标签;
将所述训练集输入神经网络进行训练,获取安保预警模型;
所述神经网络包括:用于根据语音样本的第一语音特征进行第一情感判定的第一神经网络、用于根据语音样本中的情感语句和情感副词进行第二情感判定的第二神经网络,以及用于根据第一神经网络和第二神经网络的输出结果进行最终情感判定与预警的情感判定网络;
采集目标场所的语音数据;
将所述语音数据输入所述安保预警模型进行情感判定与预警,完成安保预警;
将所述训练集输入神经网络进行训练,获取安保预警模型的步骤包括:根据预设的第一损失函数和所述第一神经网络输出的第一情感判定结果,对所述第一神经网络进行训练;
根据预设的第二损失函数和所述第二神经网络输出的第二情感判定结果,对所述第二神经网络进行训练,获取安保预警模型;
所述第一损失函数的数学表达为:其中,为第一损失函数,为预设的第一权值,为预设的第二权值,为样本数,为真实情感标签,为第一神经网络输出的第一情感识别结果中的情感标签,T为常见的代价函数,K1为第一神经网络的第一误差值,为第一控制参数,为第一惩罚项;
所述第二损失函数的数学表达为:其中,为第二损失函数,为预设的第三权值,为预设的第四权值,为样本数,为真实情感标签,为第二神经网络输出的第二情感识别结果中的情感标签,T为常见的代价函数,K2为第一神经网络的第二误差值,为第二控制参数,为第二惩罚项;
第一情感判定结果的获取步骤包括:将所述训练集输入所述第一神经网络进行人声分离,获取一个或多个人声语音;
对所述人声语音进行第一语音特征提取,获取第一语音特征,所述第一语音特征包括:声纹特征、语速特征、语调特征和音量特征;
将所述声纹特征与预设的声纹特征库中的特征进行匹配,获取与所述声纹特征相对应的身份信息;
根据所述身份信息,确定目标人物;
根据所述语速特征,判断对应语速是否超出预设的语速阈值范围,获取第一判断结果;
将所述语调特征输入预设的语调特征库进行匹配,获取语调匹配结果;
根据所述音量特征,判断对应音量是否超出预设的音量阈值范围,获取第二判断结果;
根据所述第一判断结果、语调匹配结果和第二判断结果,获取与目标人物相对应的情感标签作为第一情感判定结果。
2.根据权利要求1所述的安保预警方法,其特征在于,还包括:采集目标场所的视频数据;
对所述视频数据进行人物框选,获取人物框;
对所述人物框进行唇形框选,获取所述视频数据中的唇形框;
将所述唇形框输入第三神经网络进行特征提取,获取第一唇形特征;
获取对应时刻的语音数据,对语音数据进行目标语音特征提取,获取目标语音特征;
将所述目标语音特征输入第四神经网络进行处理,获取对应的第二唇形特征;
将同一时刻的第一唇形特征和第二唇形特征进行对比,获取对比结果;
根据所述对比结果,确定所述语音数据与所述人物框的对应关系;
根据所述对应关系和所述安保预警模型输出的安保预警结果,确定对应的目标预警人物,进而进行安保预警。
3.根据权利要求1所述的安保预警方法,其特征在于,所述第二情感判定结果的获取步骤包括:
将所述训练集输入第二神经网络进行第二情感判定,获取第二情感判定结果;
所述第二神经网络包括:用于获取情感语句的隐马尔科夫语音识别子网络、用于对所述情感语句进行语义识别的长短期记忆子网络和用于获取情感副词的卷积神经子网络。
4.根据权利要求3所述的安保预警方法,其特征在于,将所述训练集输入第二神经网络进行第二情感判定,获取第二情感判定结果的步骤包括:将所述训练集输入所述隐马尔科夫语音识别子网络进行第二语音特征提取,获取第二语音特征;
根据所述第二语音特征,获取对应的语音文本;
对所述语音文本进行情感语句提取,获取一个或多个情感语句;
将所述情感语句输入所述长短期记忆子网络进行语义识别,获取语义识别结果;
根据所述语义识别结果,获取对应的情感标签;
将所述情感语句输入所述卷积神经子网络进行情感副词提取,获取情感副词;
根据所述情感标签和情感副词,获取第二情感判定结果。
5.根据权利要求4所述的安保预警方法,其特征在于,根据所述情感标签和情感副词,获取第二情感判定结果的步骤包括:将所述情感副词输出预设的情感副词库进行匹配,获取对应的程度权值;
根据所述程度权值,对所述情感标签进行打分,获取打分结果;
当所述打分结果超出预设的分数阈值时,则确定对应的情感标签为所述第二情感判定结果。
6.根据权利要求1所述的安保预警方法,其特征在于,将所述第一情感判定结果和所述第二情感判定结果分别输入情感判定网络进行情感标签匹配,判断所述第一情感判定结果中的情感标签和所述第二情感判定结果中的情感标签的相似度是否超出预设的相似度阈值,获取第三判断结果;
根据所述第三判断结果,确定一个或多个目标情感标签;
获取所述多个目标情感标签的置信度,判断所述置信度是否超出阈值的置信度阈值,获取第四判断结果;
根据所述第四判断结果,获取最终情感标签。
7.根据权利要求6所述的安保预警方法,其特征在于,对所述最终情感标签进行累计,若预设时间段内,同一目标人物的最终情感标签为负面情感标签的数量超出预设的数量阈值,则将对应的目标人物确定为目标预警人物,进行预警或警示,并将预警信息传输至关联终端。
8.一种安保预警系统,其特征在于,包括:训练集获取模块,用于获取训练集,所述训练集包括:多个语音样本,以及与所述语音样本相对应的情感标签;
训练模块,用于将所述训练集输入神经网络进行训练,获取安保预警模型;所述神经网络包括:用于根据语音样本的第一语音特征进行第一情感判定的第一神经网络、用于根据语音样本中的情感语句和情感副词进行第二情感判定的第二神经网络,以及用于根据第一神经网络和第二神经网络的输出结果进行最终情感判定与预警的情感判定网络;将所述训练集输入神经网络进行训练,获取安保预警模型的步骤包括:根据预设的第一损失函数和所述第一神经网络输出的第一情感判定结果,对所述第一神经网络进行训练;根据预设的第二损失函数和所述第二神经网络输出的第二情感判定结果,对所述第二神经网络进行训练,获取安保预警模型;
采集模块,用于采集目标场所的语音数据;
安保预警模块,用于将所述语音数据输入所述安保预警模型进行情感判定与预警,完成安保预警;所述训练集获取模块、训练模块、采集模块和安保预警模块连接;
所述第一损失函数的数学表达为:其中,为第一损失函数,为预设的第一权值,为预设的第二权值,为样本数,为真实情感标签,为第一神经网络输出的第一情感识别结果中的情感标签,T为常见的代价函数,K1为第一神经网络的第一误差值,为第一控制参数,为第一惩罚项;
所述第二损失函数的数学表达为:其中,为第二损失函数,为预设的第三权值,为预设的第四权值,为样本数,为真实情感标签,为第二神经网络输出的第二情感识别结果中的情感标签,T为常见的代价函数,K2为第一神经网络的第二误差值,为第二控制参数,为第二惩罚项;
第一情感判定结果的获取步骤包括:将所述训练集输入所述第一神经网络进行人声分离,获取一个或多个人声语音;
对所述人声语音进行第一语音特征提取,获取第一语音特征,所述第一语音特征包括:声纹特征、语速特征、语调特征和音量特征;
将所述声纹特征与预设的声纹特征库中的特征进行匹配,获取与所述声纹特征相对应的身份信息;
根据所述身份信息,确定目标人物;
根据所述语速特征,判断对应语速是否超出预设的语速阈值范围,获取第一判断结果;
将所述语调特征输入预设的语调特征库进行匹配,获取语调匹配结果;
根据所述音量特征,判断对应音量是否超出预设的音量阈值范围,获取第二判断结果;
根据所述第一判断结果、语调匹配结果和第二判断结果,获取与目标人物相对应的情感标签作为第一情感判定结果。
说明书 :
一种安保预警方法及系统
技术领域
背景技术
电子监控或人为监控的方式,对公共场所的安全进行监测。然而,上述方法不具备一定的提
前预知性,相关安保人员需要等到争吵或事故发生之后,才能得到警示并做出反应,不能对
即将发生的争吵等进行提前干预,容易导致事故的发生,造成不必要的损失。
发明内容
能对即将发生的争吵等进行提前干预的问题。
络,以及用于根据第一神经网络和第二神经网络的输出结果进行最终情感判定与预警的情
感判定网络;
络。
中的情感标签的相似度是否超出预设的相似度阈值,获取第三判断结果;
人物,进行预警或警示,并将预警信息传输至关联终端。
根据语音样本中的情感语句和情感副词进行第二情感判定的第二神经网络,以及用于根据
第一神经网络和第二神经网络的输出结果进行最终情感判定与预警的情感判定网络;将所
述训练集输入神经网络进行训练,获取安保预警模型的步骤包括:根据预设的第一损失函
数和所述第一神经网络输出的第一情感判定结果,对所述第一神经网络进行训练;根据预
设的第二损失函数和所述第二神经网络输出的第二情感判定结果,对所述第二神经网络进
行训练,获取安保预警模型;
情感判定的第一神经网络、用于根据语音样本中的情感语句和情感副词进行第二情感判定
的第二神经网络,以及用于根据第一神经网络和第二神经网络的输出结果进行最终情感判
定与预警的情感判定网络;并将目标场所的语音数据输入所述安保预警模型进行情感判定
与预警,能够通过对语音数据中的目标人物的情感进行分析,针对负面情感或情绪较高,且
容易发生争吵或冲突等事故的目标人物进行提前预警,具备一定的提前预知性,有助于相
关安保人员提前进行介入与干预,避免发生冲突等事故,精确率较高。
附图说明
具体实施方式
施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离
本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施
例中的特征可以相互组合。
绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也
可能更为复杂。
如:在医院或诊疗室等公共场所,经常出现医患情感过激,而产生冲突,存在一定的安全隐
患。目前,通常采用电子监控或人为监控的方式,对公共场所的安全进行监测。然而,上述方
法不具备一定的提前预知性,相关安保人员需要等到争吵或事故发生之后,才能得到警示
并做出反应,不能对即将发生的争吵等进行提前干预,容易导致事故的发生,造成不必要的
损失。因此,发明人提出一种安保预警方法及系统,通过将训练集输入神经网络进行训练,
获取安保预警模型;所述神经网络包括:用于根据语音样本的第一语音特征进行第一情感
判定的第一神经网络、用于根据语音样本中的情感语句和情感副词进行第二情感判定的第
二神经网络,以及用于根据第一神经网络和第二神经网络的输出结果进行最终情感判定与
预警的情感判定网络;并将目标场所的语音数据输入所述安保预警模型进行情感判定与预
警,能够通过对语音数据中的目标人物的情感进行分析,针对负面情感或情绪较高,且容易
发生争吵或冲突等事故的目标人物进行提前预警,具备一定的提前预知性,有助于相关安
保人员提前进行介入与干预,避免发生冲突等事故,精确率较高,可实施性较强,成本较低。
样本中的情感语句和情感副词进行第二情感判定的第二神经网络,以及用于根据第一神经
网络和第二神经网络的输出结果进行最终情感判定与预警的情感判定网络;通过对语音样
本进行多次情感判定,提高最终情感判定的准确性,便于进行安保预警。
容易发生争吵或冲突等事故的目标人物进行提前预警,具备一定的提前预知性,有助于相
关安保人员提前进行介入与干预,避免发生冲突等事故,精确率较高,可实施性较强,成本
较低,实施较方便。
人员。本实施例中的安保预警方法,还包括:
该时刻的语音数据与目标人物框的对应关系。
述对应关系,确定视频数据中对应的人物框,帮助安保人员确定目标预警人物的具体形象
或样貌,有助于安保人员提前进行准确干预。
价函数,K1为第一神经网络的第一误差值,为第一控制参数,为第一惩罚项。可以理解
的,常见的代价函数包括:指数函数和对数函数等代价函数,第一控制参数为用于控制第一
神经网络迭代学习过程中去相关性的偏好程度的参数。通过采用上述第一损失函数对第一
神经网络进行训练,有效提高第一神经网络的情感识别精确度。
价函数,K2为第一神经网络的第二误差值,为第二控制参数,为第二惩罚项。可以理解
的,常见的代价函数包括:指数函数和对数函数等代价函数,第二控制参数为用于控制第二
神经网络迭代学习过程中去相关性的偏好程度的参数。通过采用第二损失函数对第二神经
网络进行训练,有效提高第二神经网络的情感判定精确度。
噪声。
速特征、语调特征和音量特征,有助于对人声语音中携带的声音类型的情感或情绪进行精
准识别与判定。
语调特征框进行匹配,能够较好地确定与所述语调特征相对应的情感标签。
不同语速阈值范围以及不同音量阈值范围对应的情感标签不同。
惊讶和恐惧等。
子网络。
感判定,能够有效提高第二情感判定的准确性。
值。
的情感标签的相似度是否超出预设的相似度阈值,获取第三判断结果;
目标预警人物,进行预警或警示,并将预警信息传输至关联终端。例如:当预设时间段内,同
一目标人物的最终情感标签为愤怒,且数量超出预设的数量阈值时,则确定该目标人物为
目标预警人物并进行警示,将预警信息传输至安保人员的终端,提示相关安保人员进行提
前介入与干预,避免发生不必要的冲突,消除一定的安全隐患。所述负面情感标签包括:悲
伤、愤怒、过激和恐惧等。
根据语音样本中的情感语句和情感副词进行第二情感判定的第二神经网络,以及用于根据
第一神经网络和第二神经网络的输出结果进行最终情感判定与预警的情感判定网络;
训练集输入神经网络进行训练,获取安保预警模型;所述神经网络包括:用于根据语音样本
的第一语音特征进行第一情感判定的第一神经网络、用于根据语音样本中的情感语句和情
感副词进行第二情感判定的第二神经网络,以及用于根据第一神经网络和第二神经网络的
输出结果进行最终情感判定与预警的情感判定网络;并将目标场所的语音数据输入所述安
保预警模型进行情感判定与预警,能够通过对语音数据中的目标人物的情感进行分析,针
对负面情感或情绪较高,且容易发生争吵或冲突等事故的目标人物进行提前预警,具备一
定的提前预知性,有助于相关安保人员提前进行介入与干预,避免发生冲突等事故,精确率
较高。
络。
判定结果中的情感标签的相似度是否超出预设的相似度阈值,获取第三判断结果;
目标预警人物,进行预警或警示,并将预警信息传输至关联终端。
可以存储于一计算机可读存储介质中。该程序在执行时,执行包括上述各方法实施例的步
骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
口用于进行通信,处理器和收发器用于运行计算机程序,使电子终端执行如上方法的各个
步骤。
(Digital Signal Processing,简称DSP)、专用集成电路(Application Specific
Integrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,
简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完
成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。