通话的方法及装置转让专利

申请号 : CN201810460502.0

文献号 : CN108616667B

文献日 : 2021-02-19

本公开提供了一种用于通话的方法，包括：接收用户输入，所述用户输入表明所述用户期望结束通话；响应于所述用户输入，根据通话对方发送的音频信号和/或通信链路状态确定所述通话对方是否要结束通话；以及在通话对方发送的音频信号和/或通信链路状态表明所述通话对方要结束通话的情况下，结束通话。本公开还提供了一种用于通话的装置。利用本公开提供的用于通话的方法及装置可以至少部分的解决在通话对方希望保持通话的情形下，用户由于不知情而直接结束通话的问题，有助于提升用户体验度。

1.一种用于通话的方法，包括：

接收用户输入，所述用户输入表明所述用户期望结束通话；

响应于所述用户输入，根据通话对方发送的音频信号和通信链路状态确定所述通话对方是否要结束通话；

在通话对方发送的音频信号和通信链路状态表明所述通话对方要结束通话的情况下，结束通话；以及在通话对方发送的音频信号和通信链路状态表征所述通话对方要保持通话的情况下，输出提示信息；

根据通话对方发送的音频信号和通信链路状态确定所述通话对方是否要结束通话包括：在通话过程中，获取所述通话对方发送的音频信号的第一声纹特征；

响应于接收到所述通话对方发送的包含通话结束词的音频信号，获取所述包含通话结束词的音频信号的第二声纹特征；

如果所述第一声纹特征与所述第二声纹特征相匹配，或者如果所述第二声纹特征与预先存储的该通话对方的第三声纹特征相匹配，则确定所述通话对方要结束通话。

2.根据权利要求1所述的方法，其中：所述用户输入包括以下任意一种：对应于结束通话的操作、对应于手机关屏的操作或者通话过程中使接近传感器远离物体的操作。

3.根据权利要求1所述的方法，其中：

根据通话对方发送的音频信号和通信链路状态确定所述通话对方是否要结束通话包括：如果通信链路状态为断开，或者通话对方发送的音频信号的音量的值持续小于第一设定音量阈值，则确定所述通话对方要结束通话；

如果通信链路状态为接通，且通话对方发送的音频信号的音量的值大于第一设定音量阈值，则确定所述通话对方要保持通话；

如果通信链路状态为接通，通话对方发送的音频信号的音量的值大于第二设定音量阈值、且持续时长超过第一设定时长阈值，则确定所述通话对方要保持通话。

4.根据权利要求1所述的方法，其中：

根据通话对方发送的音频信号和通信链路状态确定所述通话对方是否要结束通话包括：如果通信链路状态为断开，则确定所述通话对方要结束通话；

如果通信链路状态为接通，在通话对方发送的音频信号的音量的值持续小于第一设定音量阈值的情况下，确定所述通话对方要结束通话；

如果通信链路状态为接通，在通话对方发送的音频信号中包含一个或多个通话结束词，或者通话对方发送的音频信号中包含一个或多个所述通话结束词且至少一个所述通话结束词对应的音频信号的音量的值大于第三设定音量阈值的情况下，确定所述通话对方要结束通话；

如果通信链路状态为接通，在通话对方发送的音频信号的音量的值大于第一设定音量阈值，且所述音频信号中不包括所述通话结束词的情况下，确定所述通话对方要保持通话；

如果通信链路状态为接通，在通话对方发送的音频信号的音量的值大于第二设定音量阈值、持续时长超过第一设定时长阈值，且所述音频信号中不包括所述通话结束词的情况下，确定所述通话对方要保持通话；

如果通话对方发送的音频信号中包含一个或多个通话保持词，或者通话对方发送的音频信号中包含一个或多个所述通话保持词且至少一个所述通话保持词对应的音频信号的音量的值大于第四设定音量阈值，则确定所述通话对方要保持通话。

5.根据权利要求1所述的方法，还包括：

在通话过程中，如果所述通话对方的身份属性对应于所述用户不希望保持通话的类别，则响应于所述用户输入结束通话。

6.根据权利要求1所述的方法，还包括：

在通话过程中，如果一个或多个传感器获取的信号表明所述用户处于不便于接听电话的情形，则响应于所述用户输入结束通话。

7.根据权利要求1所述的方法，其中，所述输出提示信息包括以下任意一种或多种：对应于图形用户界面中结束通话的图形以闪动的方式进行提示；

虚化对应于图形用户界面中结束通话的图形，以及在结束通话的图形的位置展示当前接收到的音频信号的波形图；

响应于当前接收到的音频信号中包括通话保持词，执行震动。

8.一种用于通话的装置，包括：

一个或多个处理器；

可读存储介质，用于存储一个或多个计算机程序，所述计算机程序在被所述处理器执行时，实现根据权利要求1 7中任一项所述的方法。

通话的方法及装置

技术领域

[0001] 本公开涉及一种通话的方法及装置。

背景技术

[0002] 通信终端在人们的日常生活中扮演着越来越重要的角色，人们可以利用通信终端实现多种功能，例如利用智能手机进行听音乐、看视频、进行语音聊天、可视聊天等。其中，语音通话是通信终端最基本的功能，也是很多场合下人们首选的信息交互方式。

[0003] 语音通话有自身的特点，当一方挂断通话，而另一方还有未传递的信息时，则需要重新创建一次通话来传递其它信息，这会降低用户体验度。

发明内容

[0004] 本公开的一个方面提供了一种用于通话的方法及装置方法，包括：

[0005] 接收用户输入，其中所述用户输入表明所述用户期望结束通话时，响应于所述用户输入，根据通话对方发送的音频信号和/或通信链路状态确定所述通话对方是否要结束通话，这样可以帮助用户确定通话对方是否还有未传递的信息，在通话对方发送的音频信号和/或通信链路状态表明所述通话对方要结束通话的情况下结束通话。

[0006] 可选地，在通话对方发送的音频信号和/或通信链路状态表征所述通话对方要保持通话的情况下，输出提示信息以帮助用户得知通话对方还有未传递的信息，避免用户在不知通话对方还有未传递信息的情况下直接结束通话。

[0007] 可选地，表明所述用户期望结束通话的用户输入，包括但不限于以下任意一种：对应于结束通话的操作、对应于手机关屏的操作或者通话过程中使接近传感器远离物体的操作。

[0008] 可选地，所述通话对方是否要结束通话可以通过以下操作确定，第一方面，如果通信链路状态为断开，或者通话对方发送的音频信号的音量的值持续小于第一设定音量阈值，则确定所述通话对方要结束通话，第二方面，如果通信链路状态为接通，且通话对方发送的音频信号的音量的值大于第一设定音量阈值，则确定所述通话对方要保持通话，第三方面，如果通信链路状态为接通，通话对方发送的音频信号的音量的值大于第二设定音量阈值、且持续时长超过第一设定时长阈值，则确定所述通话对方要保持通话。

[0009] 可选地，所述通话对方是否要结束通话还可以通过以下操作确定，第一方面，如果通信链路状态为断开，则确定所述通话对方要结束通话，第二方面，如果通信链路状态为接通，在通话对方发送的音频信号的音量的值持续小于第一设定音量阈值的情况下，确定所述通话对方要结束通话，第三方面，如果通信链路状态为接通，在通话对方发送的音频信号中包含一个或多个通话结束词，或者通话对方发送的音频信号中包含一个或多个所述通话结束词且至少一个所述通话结束词对应的音频信号的音量的值大于第三设定音量阈值的情况下，确定所述通话对方要结束通话，第四方面，如果通信链路状态为接通，在通话对方发送的音频信号的音量的值大于第一设定音量阈值，且所述音频信号中不包括所述通话结束词的情况下，确定所述通话对方要保持通话，第五方面，如果通信链路状态为接通，在通话对方发送的音频信号的音量的值大于第二设定音量阈值、持续时长超过第一设定时长阈值，且所述音频信号中不包括所述通话结束词的情况下，确定所述通话对方要保持通话，第六方面，如果通话对方发送的音频信号中包含一个或多个通话保持词，或者通话对方发送的音频信号中包含一个或多个所述通话保持词且至少一个所述通话保持词对应的音频信号的音量的值大于第四设定音量阈值，则确定所述通话对方要保持通话。

[0010] 可选地，所述方法还可以包括如下操作：在通话过程中，获取所述通话对方发送的音频信号的第一声纹特征，该第一声纹特征可以用于表征通话对方的身份，以及响应于接收到所述通话对方发送的包含通话结束词的音频信号，获取所述包含通话结束词的音频信号的第二声纹特征，该第二声纹特征可以用于表征包含通话结束词的音频信号所对应的说话人的身份信息，如果所述第一声纹特征与所述第二声纹特征相匹配则表明包含通话结束词的音频信号是由所述通话对方发送，或者如果所述第二声纹特征与预先存储的该通话对方的第三声纹特征相匹配表明通话结束词是有通话对方发送，则确定所述通话对方要结束通话，这样可以避免误将通话对方周边说话人发出的包含通话结束词的音频信号误判为通话对方发送的音频信号。

[0011] 可选地，所述方法还可以包括如下操作：在通话过程中，如果所述通话对方的身份属性对应于所述用户不希望保持通话的类别，则响应于所述用户输入结束通话。这样可以避免用户不便于快捷的结束不希望保持的通话。

[0012] 可选地，所述方法还可以包括如下操作：在通话过程中，如果一个或多个传感器获取的信号表明所述用户处于不便于接听电话的情形，则响应于所述用户输入结束通话。

[0013] 可选地，所述提示信息可以通过以下任意一种或多种形式对用户进行提示：第一种形式，对应于图形用户界面中结束通话的图形以闪动的方式进行提示，以便于用户直观的了解通话对方仍在传递信息，第二种形式，虚化对应于图形用户界面中结束通话的图形，以及在结束通话的图形的位置展示当前接收到的音频信号的波形图，这种形式可以给用户提示通话对方仍在传递的信息量及信息重要度，如波形图中波形越复杂则表明正在传递的信息量越多，波形图中波峰越高，则表明正在传递的信息越重要，第三种形式，响应于当前接收到的音频信号中包括通话保持词，执行震动，这种形式对于通话对方在准备结束通话期间，突然想起有重要信息未传递给对方时更加适用，可以有效避免用户在通话对方发送包含通话保持词的音频信号后，由于不知情而结束通话。

[0014] 本公开的另一个方面提供了一种用于通话的系统，该系统可以包括如下模块：接收模块、确定模块和通话结束模块，其中，所述接收模块用于接收用户输入，所述用户输入表明所述用户期望结束通话，所述确定模块用于响应于所述用户输入，根据通话对方发送的音频信号和/或通信链路状态确定所述通话对方是否要结束通话，所述通话结束模块用于在通话对方发送的音频信号和/或通信链路状态表明所述通话对方要结束通话的情况下，结束通话。

[0015] 可选地，通话系统还可以包括：提示模块，该提示模块用于在通话对方发送的音频信号和/或通信链路状态表征所述通话对方要保持通话的情况下，输出提示信息。

[0016] 可选地，表明所述用户期望结束通话的用户输入包括但不限于以下任意一种：对应于结束通话的操作、对应于手机关屏的操作或者通话过程中使接近传感器远离物体的操作。

[0017] 可选地，所述确定模块可以包括如下单元：第一确定单元、第二确定单元和第三确定单元。其中，所述第一确定单元用于如果通信链路状态为断开，或者通话对方发送的音频信号的音量的值持续小于第一设定音量阈值，则确定所述通话对方要结束通话，所述第二确定单元用于如果通信链路状态为接通，且通话对方发送的音频信号的音量的值大于第一设定音量阈值，则确定所述通话对方要保持通话，所述第三确定单元用于如果通信链路状态为接通，通话对方发送的音频信号的音量的值大于第二设定音量阈值、且持续时长超过第一设定时长阈值，则确定所述通话对方要保持通话。

[0018] 可选地，所述确定模块可以包括如下单元：第四确定单元、第五确定单元、第六确定单元、第七确定单元、第八确定单元和第九确定单元，其中，所述第四确定单元用于如果通信链路状态为断开，则确定所述通话对方要结束通话，所述第五确定单元用于如果通信链路状态为接通，在通话对方发送的音频信号的音量的值持续小于第一设定音量阈值的情况下，确定所述通话对方要结束通话，所述第六确定单元用于如果通信链路状态为接通，在通话对方发送的音频信号中包含一个或多个通话结束词，或者通话对方发送的音频信号中包含一个或多个所述通话结束词且至少一个所述通话结束词对应的音频信号的音量的值大于第三设定音量阈值的情况下，确定所述通话对方要结束通话，所述第七确定单元用于如果通信链路状态为接通，在通话对方发送的音频信号的音量的值大于第一设定音量阈值，且所述音频信号中不包括所述通话结束词的情况下，确定所述通话对方要保持通话，所述第八确定单元，用于如果通信链路状态为接通，在通话对方发送的音频信号的音量的值大于第二设定音量阈值、持续时长超过第一设定时长阈值，且所述音频信号中不包括所述通话结束词的情况下，确定所述通话对方要保持通话，所述第九确定单元用于如果通话对方发送的音频信号中包含一个或多个通话保持词，或者通话对方发送的音频信号中包含一个或多个所述通话保持词且至少一个所述通话保持词对应的音频信号的音量的值大于第四设定音量阈值，则确定所述通话对方要保持通话。

[0019] 可选地，通话系统还可以包括：第一声纹获取模块和第二声纹获取模块，其中，所述第一声纹获取模块用于在通话过程中，获取所述通话对方发送的音频信号的第一声纹特征，所述第二声纹获取模块，用于响应于接收到所述通话对方发送的包含通话结束词的音频信号，获取所述包含通话结束词的音频信号的第二声纹特征，所述确定模块具体用于如果所述第一声纹特征与所述第二声纹特征相匹配，或者如果所述第二声纹特征与预先存储的该通话对方的第三声纹特征相匹配，则确定所述通话对方要结束通话。

[0020] 可选地，通话系统还可以包括：身份属性获取模块，所述身份属性获取模块用于在通话过程中获取所述通话对方的身份属性，所述通话结束模块具体用于在通话过程中，如果所述通话对方的身份属性对应于所述用户不希望保持通话的类别，则响应于所述用户输入结束通话。

[0021] 可选地，通话系统还可以包括：传感器信号获取模块，该传感器信号获取模块用于在通话过程中通过一个或多个传感器获取信号，所述通话结束模块具体用于在通话过程中，如果一个或多个传感器获取的信号表明所述用户处于不便于接听电话的情形，则响应于所述用户输入结束通话。

[0022] 可选地，所述提示模块具体可以包括以下任意一种或多种单元：第一提示单元、第二提示单元或第三提示单元，其中，所述第一提示单元用于对应于图形用户界面中结束通话的图形以闪动的方式进行提示，所述第二提示单元用于虚化对应于图形用户界面中结束通话的图形，以及在结束通话的图形的位置展示当前接收到的音频信号的波形图，所述第三提示单元用于响应于当前接收到的音频信号中包括通话保持词，执行震动。

[0023] 本公开的另一个方面提供了一种用于通话的装置，包括：接收器和一个或多个处理器，其中，所述接收器用于接收用户输入，所述用户输入表明所述用户期望结束通话，所述处理器运行程序，以执行如上所述的方法。

[0024] 本公开的另一方面提供了一种非易失性存储介质，存储有计算机可执行指令，所述指令在被执行时用于实现如上所述的方法。

[0025] 本公开的另一方面提供了一种计算机程序，所述计算机程序包括计算机可执行指令，所述指令在被执行时用于实现如上所述的方法。

附图说明

[0026] 为了更完整地理解本公开及其优势，现在将参考结合附图的以下描述，其中：

[0027] 图1A示意性示出了根据本公开实施例的通话的方法及装置的第一种应用场景；

[0028] 图1B示意性示出了根据本公开实施例的通话的方法及装置的第二种应用场景；

[0029] 图2A示意性示出了根据本公开实施例的用于通话的方法的第一种流程图；

[0030] 图2B示意性示出了根据本公开实施例的用于通话的方法的第二种流程图；

[0031] 图2C示意性示出了根据本公开实施例的用于通话的方法的第三种流程图；

[0032] 图2D示意性示出了根据本公开实施例的用于通话的方法的第四种流程图；

[0033] 图2E示意性示出了根据本公开实施例的用于通话的方法的第五种流程图；

[0034] 图3A示意性示出了根据本公开实施例的用于通话的系统的第一种框图；

[0035] 图3B示意性示出了根据本公开实施例的用于通话的系统的第二种框图；

[0036] 图3C示意性示出了根据本公开实施例的用于通话的系统的第三种框图；

[0037] 图3D示意性示出了根据本公开实施例的用于通话的系统的第四种框图；

[0038] 图3E示意性示出了根据本公开实施例的用于通话的系统的第五种框图；

[0039] 图4示意性示出了根据本公开实施例的用于通话的装置的框图。

具体实施方式

[0040] 以下，将参照附图来描述本公开的实施例。但是应该理解，这些描述只是示例性的，而并非要限制本公开的范围。在下面的详细描述中，为便于解释，阐述了许多具体的细节以提供对本公开实施例的全面理解。然而，明显地，一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外，在以下说明中，省略了对公知结构和技术的描述，以避免不必要地混淆本公开的概念。

[0041] 在此使用的术语仅仅是为了描述具体实施例，而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在，但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。

[0042] 在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义，除非另外定义。应注意，这里使用的术语应解释为具有与本说明书的上下文相一致的含义，而不应以理想化或过于刻板的方式来解释。

[0043] 在使用类似于“A、B和C等中至少一个”这样的表述的情况下，一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如，“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下，一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如，“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。本领域技术人员还应理解，实质上任意表示两个或更多可选项目的转折连词和/或短语，无论是在说明书、权利要求书还是附图中，都应被理解为给出了包括这些项目之一、这些项目任一方、或两个项目的可能性。例如，短语“A或B”应当被理解为包括“A”或“B”、或“A和B”的可能性。

[0044] 附图中示出了一些方框图和/或流程图。应理解，方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器，从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。需要说明的是，上述计算机可以指包括通话功能的计算机设备，例如，具有通话功能的移动终端，更具体地，可以为手机、智能手机等。

[0045] 因此，本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外，本公开的技术可以采取存储有指令的计算机可读介质上的计算机程序产品的形式，该计算机程序产品可供指令执行系统使用或者结合指令执行系统使用。在本公开的上下文中，计算机可读介质可以是能够包含、存储、传送、传播或传输指令的任意介质。例如，计算机可读介质可以包括但不限于电、磁、光、电磁、红外或半导体系统、装置、器件或传播介质。计算机可读介质的具体示例包括：磁存储装置，如磁带或硬盘(HDD)；光存储装置，如光盘(CD-ROM)；存储器，如随机存取存储器(RAM)或闪存；和/或有线/无线通信链路。

[0046] 本公开的实施例提供了一种用于通话的方法以及能够应用该方法的系统。该方法包括接收用户输入，当所述用户输入表明所述用户期望结束通话时，响应于所述用户输入，根据通话对方发送的音频信号和/或通信链路状态确定所述通话对方是否要结束通话，以及在通话对方发送的音频信号和/或通信链路状态表明所述通话对方要结束通话的情况下，结束通话。这样使得本公开可以在用户的输入表明所述用户期望结束通话时，首先通过通话对方发送的音频信号和/或通信链路状态确定所述通话对方是否要结束通话，如果通话对方要结束通话时才执行结束通话的操作，这样可以避免通话对方还希望继续保持通话时，用户不知道通话对方希望保持通话而直接结束通话，导致通话对方希望传送的信息不能在本次通话过程中传送给用户，造成用户体验度低的情况发生。

[0047] 图1A至图1B示意性示出了根据本公开实施例的通话的方法及装置的应用场景。需要注意的是，图1A至图1B所示的应用场景仅为可以应用本公开实施例的场景的示例，以帮助本领域技术人员理解本公开的技术内容，但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。例如，还可以为通话双方使用具有通话功能的手表、眼镜、平板电脑等进行通话。

[0048] 如图1A所示，示意性示出了根据本公开实施例的通话的方法及装置的第一种应用场景。

[0049] 其中，用户通过手机与通话对方进行通话，手机上设置有接近传感器(Proximity Sensor，p-sensor)，当用户将手机远离头部时，p-sensor会给手机处理器发送表明手机远离头部的信号，此时处理器会预判用户有结束通话的意图，处理器会根据通话对方发送的音频信号和/或通信链路状态确定所述通话对方是否要结束通话，如果是，则执行用户输入。当然，还可以由用户进行二次确认后再结束通话，例如，当处理器在接收到p-sensor发送的表明手机远离头部的信号、确定通话对方要结束通话、且接收到用户输入的结束通话对应的指令时，结束通话。

[0050] 如图1B所示，示意性示出了根据本公开实施例的通话的方法及装置的第二种应用场景。

[0051] 其中，用户通过手机与通话对方进行通话，手机与通话耳机相连接，当用户通过手机屏上展示的结束通话的图形或者通话耳机的结束通话按键给手机输入表明所述用户期望结束通话对应的操作时，处理器确定用户有结束通话的意图，然后，处理器会根据通话对方发送的音频信号和/或通信链路状态确定所述通话对方是否要结束通话，如果是，则执行用户输入。例如，当处理器在接收到用户输入的结束通话对应的信号、且确定通话对方要结束通话时，结束通话。当然，当前场景还可以应用于利用手机的免提功能进行通话的场景，在此不再详述。

[0052] 图2A至图2E示意性示出了根据本公开实施例的用于通话的方法的多种流程图。

[0053] 如图2A所示，该方法包括操作S201～S203。

[0054] 在操作S201，接收用户输入，所述用户输入表明所述用户期望结束通话。

[0055] 其中，用户的输入可以为现有技术中的任意一种输入，例如，输入字符、输入特定指令，具体地，如点击、滑动等操作。本实施例中的用户输入为特定的用户输入，该用户输入表明所述用户期望结束通话，在一个具体实施例中，所述用户输入包括以下任意一种：对应于结束通话的操作、对应于手机关屏的操作或者通话过程中使接近传感器远离物体的操作。

[0056] 其中，对应于结束通话的操作可以为预设的操作：对对应于图形用户界面中结束通话的图形进行点击、滑动等操作，对手机进行对应于结束通话的预设的操作(甩动、将手机屏的正面放在其它物体上等)；对应于手机关屏的操作：对对应于图形用户界面中熄灭屏幕的图形进行点击、滑动等操作，对手机进行对应于熄灭屏幕的预设的操作(甩动、将手机屏的正面放在其它物体上等)；对应于通话过程中使接近传感器远离物体的操作：使具有接近传感器的手机远离物体(如头部)的操作等。

[0057] 在操作S202，响应于所述用户输入，根据通话对方发送的音频信号和/或通信链路状态确定所述通话对方是否要结束通话。

[0058] 如果通信链路状态为断开，则表明通话对方已结束通话，则可以确定所述通话对方要结束通话；如果通话对方还在发送音频信号则可以根据接收的音频信号判断对方是否要结束通话。

[0059] 在一个具体实施例中，根据通话对方发送的音频信号和/或通信链路状态确定所述通话对方是否要结束通话包括：

[0060] 如果通信链路状态为断开，或者通话对方发送的音频信号的音量的值持续小于第一设定音量阈值，则确定所述通话对方要结束通话。其中，当通话对方发送的音频信号的音量的值持续小于第一设定音量阈值，则表明即使通话对方仍然在说话，但是可能不是对着麦克风说话，这就表明通话对方已经没有需要传送给用户的信息，即通话对方希望结束通话。所述第一设定音量阈值可以根据经验或实验而定，单位可以为分贝。

[0061] 如果通信链路状态为接通，且通话对方发送的音频信号的音量的值大于第一设定音量阈值，则确定所述通话对方要保持通话。其中，如果通话对方发送的音频信号的音量的值大于第一设定音量阈值，则表明通话对方发送的音频信号中至少部分承载有希望传送给用户的信息，即所述通话对方要保持通话。

[0062] 如果通信链路状态为接通，通话对方发送的音频信号的音量的值大于第二设定音量阈值、且持续时长超过第一设定时长阈值，则确定所述通话对方要保持通话。其中，如果通话对方发送的音频信号的音量的值大于第二设定音量阈值、且持续时长超过第一设定时长阈值，则表明通话对方一直在说话，尽管声音可能较小，但是可以表明通话对方在持续给用户发送信息。需要说明的是，该第二设定音量阈值可以≤该第一设定音量阈值，第一设定时长阈值可以根据经验或实验结果而定，例如，可以为以正常语速说完一个短语或指定个数字所需的时长。

[0063] 通过上述操作即可确定所述通话对方是否要结束通话。

[0064] 在另一个具体实施例中，为了更加准确的确定通话对方是否要结束通话，所述根据通话对方发送的音频信号和/或通信链路状态确定所述通话对方是否要结束通话可以包括如下所示的多种方式。

[0065] 如果通信链路状态为断开，则确定所述通话对方要结束通话。

[0066] 如果通信链路状态为接通，在通话对方发送的音频信号的音量的值持续小于第一设定音量阈值的情况下，确定所述通话对方要结束通话。

[0067] 如果通信链路状态为接通，在通话对方发送的音频信号中包含一个或多个通话结束词，或者通话对方发送的音频信号中包含一个或多个所述通话结束词且至少一个所述通话结束词对应的音频信号的音量的值大于第三设定音量阈值的情况下，确定所述通话对方要结束通话。其中，所述通话结束词可以为预先设定并存储在通话设备中的预设词语，例如，再见、拜拜、下次聊、回头聊、挂了、就这样吧等。通话结束词的识别过程可以包括：将音频信号输入预先训练好的语音识别模型中进行语音识别，在识别得到音频信号对应的词语后，通过匹配的方法判断当前的音频信号中是否包括通话结束词。当然，为了提升语音识别的准确率，还可以进行降噪，以及通过端点检测技术获取音频信号中的句子或短语等操作，在此不再详述。第三设定音量阈值可以≤第二设定音量阈值。

[0068] 如果通信链路状态为接通，在通话对方发送的音频信号的音量的值大于第一设定音量阈值，且所述音频信号中不包括所述通话结束词的情况下，确定所述通话对方要保持通话。

[0069] 如果通信链路状态为接通，在通话对方发送的音频信号的音量的值大于第二设定音量阈值、持续时长超过第一设定时长阈值，且所述音频信号中不包括所述通话结束词的情况下，确定所述通话对方要保持通话。通话结束词的识别过程可以如上所述，在此不再详述。

[0070] 如果通话对方发送的音频信号中包含一个或多个通话保持词，或者通话对方发送的音频信号中包含一个或多个所述通话保持词且至少一个所述通话保持词对应的音频信号的音量的值大于第四设定音量阈值，则确定所述通话对方要保持通话。其中，所述通话保持词可以为预先设定并存储在通话设备中的预设词语，例如，等等、等一下、还有、喂、还在吗、在吗、差点忘了、对了等表明通话对方希望保持通话的词语。通话结束词的识别过程可以包括：将音频信号输入预先训练好的语音识别模型中进行语音识别，在识别得到音频信号对应的词语后，通过匹配的方法判断当前的音频信号中是否包括通话保持词。当然，为了提升语音识别的准确率，还可以进行降噪，以及通过端点检测技术获取音频信号中的句子或短语等操作，在此不再详述。第四设定音量阈值可以≤第二设定音量阈值。

[0071] 在操作S203，在通话对方发送的音频信号和/或通信链路状态表明所述通话对方要结束通话的情况下，结束通话。

[0072] 在本公开的实施例中，当通话对方要结束通话的情况下，才会直接响应表明用户想结束通话的用户输入，这样可以至少部分地避免用户不知道通话对方希望保持通话时直接挂断电话的情况发生。

[0073] 如图2B所示，示意性示出了根据本公开实施例的用于通话的方法的第二种流程图。

[0074] 在本实施例中，所述方法还可以进一步包括操作S204，在通话对方发送的音频信号和/或通信链路状态表征所述通话对方要保持通话的情况下，输出提示信息。

[0075] 具体地，在一个具体实施例中，所述通话对方要保持通话可以对应如下情形：第一种情形，通信链路状态为接通，且通话对方发送的音频信号的音量的值大于第一设定音量阈值；第二种情形，通信链路状态为接通，通话对方发送的音频信号的音量的值大于第二设定音量阈值、且持续时长超过第一设定时长阈值。

[0076] 在另一个具体实施例中，所述通话对方要保持通话可以对应如下情形：第一种情形，通信链路状态为接通，在通话对方发送的音频信号的音量的值大于第一设定音量阈值，且所述音频信号中不包括所述通话结束词；第二种情形，通信链路状态为接通，在通话对方发送的音频信号的音量的值大于第二设定音量阈值、持续时长超过第一设定时长阈值，且所述音频信号中不包括所述通话结束词；第三种情形，通话对方发送的音频信号中包含一个或多个通话保持词，或者通话对方发送的音频信号中包含一个或多个所述通话保持词且至少一个所述通话保持词对应的音频信号的音量的值大于第四设定音量阈值。需要说明的是，本实施例在确定通话对方要保持通话的准确度高于上一个实施例。关于设定音量阈值和设定时长阈值可以参考图2A对应的实施例。

[0077] 所述输出提示信息可以以声光的形式进行提示，还可以通过机械振动等形式进行提示。

[0078] 在一个具体实施例中，所述输出提示信息可以包括以下任意一种或多种：对应于图形用户界面中结束通话的图形以闪动的方式进行提示；例如，结束通话对应的图像进行闪动。

[0079] 虚化对应于图形用户界面中结束通话的图形，以及在结束通话的图形的位置展示当前接收到的音频信号的波形图；例如，在结束通话的图形的位置显示波形图，该波形图显示实时接收到的音频的波形，当波形越复杂时表明通话对方发送的信息量越大，当波形的峰值越高时表明通话对方说话的声音越大。

[0080] 响应于当前接收到的音频信号中包括通话保持词，执行震动。这样可以通过振动的方式提示用户：通话对方有重要信息正在或即将发送过来，避免错失重要信息。

[0081] 如图2C所示，示意性示出了根据本公开实施例的用于通话的方法的第三种流程图。

[0082] 在本实施例中，所述方法还可以进一步包括操作S205～S207。

[0083] 在操作S205，在通话过程中，获取所述通话对方发送的音频信号的第一声纹特征。由于声纹特征尤其适合远程身份确认，且通话过程中易于获取通话对方的音频信号，因此，本实施例中通过声纹特征确定包含通话结束词的音频的说话人与通话对方是否为同一人。
具体地，声纹特征可以包括以下任意一种或多种：声学特征(倒频谱)、词法特征(如说话人相关的词的n-gram，音素n-gram)、韵律特征(利用n-gram描述的基音和能量“姿势”)、语音信息(包括语种、方言和口音信息)、通道信息(使用何种通道)等。

[0084] 在操作S206，响应于接收到所述通话对方发送的包含通话结束词的音频信号，获取所述包含通话结束词的音频信号的第二声纹特征。具体地，第二声纹特征的提取过程可以同第一声纹特征的提取过程，区别仅在于特征提取的对象不同：第一声纹特征对应通话过程中不包括通话结束词的音频信号，第二声纹特征对应通话过程中包括通话结束词的音频信号，优选地，第二声纹特征对应通话过程中接收用户输入之后的包括通话结束词的音频信号，其中，所述用户输入表明所述用户期望结束通话。

[0085] 在操作S207，如果所述第一声纹特征与所述第二声纹特征相匹配，或者如果所述第二声纹特征与预先存储的该通话对方的第三声纹特征相匹配，则确定所述通话对方要结束通话。

[0086] 具体地，匹配方法可以包括如下几种方式：隐式马尔可夫模型(HMM)法，例如，可以使用单状态的HMM或高斯混合模型(GMM)；神经网络法，例如，预先训练声纹识别的神经网络以进行声纹识别。此外，对于预先存储的该通话对方的第三声纹特征，优选第三声纹特征为预先利用通话对方发出的关于通话结束词的语音中提取的声纹特征，此时，可以采用模板匹配法，准确率和效率都较高。

[0087] 本公开的实施例中在接收到包含通话结束词的音频信号后，进一步通过声纹特征判断该包含通话结束词的音频信号是否为通话对方发出的，以排除诸如通话对方周边的说话人说出的语音中包含通话结束词时，使得误判为通话对方希望结束通话的情况发生，这样可以有助于提升用户体验度。

[0088] 如图2D所示，示意性示出了根据本公开实施例的用于通话的方法的第四种流程图。

[0089] 在本实施例中，所述方法还可以进一步包括操作S208，在通话过程中，如果所述通话对方的身份属性对应于所述用户不希望保持通话的类别，则响应于所述用户输入结束通话。

[0090] 在本实施例中，身份属性可以为在通讯录中存储的通话对方的分组的类别，例如，家人、领导、客户、同事、同学、陌生人等；也可以是根据通话对方的联系方式确定的分类，例如，服务器根据联系方式(手机号码、座机号码、手机号码所属的公司的类别等)给出的联系方式所属的类别，可以为普通来电、推销电话、骚扰电话、未知来电等。不同的类别可以设定不同的响应等级，例如，对于家人、领导、客户、同事设定最高的提示等级，即一旦通话对方在用户倾向于结束通话时发送音频信号，以最明显的方式提示用户：通话对方希望保持通话；对于推销电话、骚扰电话等设置最低的提示等级，一旦用户期望结束通话则执行结束通话。

[0091] 进一步地，上述第一设定音量阈值、第二设定音量阈值、第三设定音量阈值、第四设定阈值、第一设定时长阈值等可以为动态阈值，不同的类别对应不同的阈值，例如，越重要的类别对应的阈值的灵敏度越高，在此不再一一列举。

[0092] 此外，不同的类别对应的提示方式也可以不同。例如，重要的类别以更明显的形式进行提示。

[0093] 通过上述操作可以便于用户快捷地结束不愿意保持的通话，提升用户体验满意度。

[0094] 如图2E所示，示意性示出了根据本公开实施例的用于通话的方法的第五种流程图。

[0095] 在本实施例中，所述方法还可以进一步包括操作S209，在通话过程中，如果一个或多个传感器获取的信号表明所述用户处于不便于接听电话的情形，则响应于所述用户输入结束通话。

[0096] 在本实施例中，可以通过一个或多个传感器采集的信息判断用户当前所处的状态，进而判断用户当前是否方便接听电话，如果不方便接听电话，则可以直接响应于所述用户输入结束通话。例如，当速度传感器和/或GPS采集的信号表明用户在跑步的状态下(如终端移动速度大于预设的第一速度阈值且小于预设的第二速度阈值)，则表明用户当前不方便接听电话，可以直接响应于所述用户输入结束通话。又例如，当电压传感器采集的信号表明电量水平很低，则表明用户当前不方便接听电话，可以直接响应于所述用户输入结束通话。再例如，当电流传感器采集的信号表明当前处于充电状态、且速度传感器和/或GPS采集的信号表明用户在高速运动(如终端移动速度大于预设的第二速度阈值)，则表明用户可能处于驾驶状态，不方便接听电话，可以直接响应于所述用户输入结束通话。第一速度阈值、第二速度阈值可以根据经验或实验结果而定，例如，第一速度阈值可以为正常走路的速度。

[0097] 通过上述操作可以便于用户及时结束通话，提升用户体验满意度。

[0098] 图3A至图3E示意性示出了根据本公开实施例的用于通话的系统的框图。

[0099] 如图3A所示，示意性示出了根据本公开实施例的用于通话的系统的第一种框图。

[0100] 该用于通话的系统，可以包括如下模块：接收模块301、确定模块302和通话结束模块303。

[0101] 其中，接收模块301用于接收用户输入，所述用户输入表明所述用户期望结束通话。

[0102] 确定模块302用于响应于所述用户输入，根据通话对方发送的音频信号和/或通信链路状态确定所述通话对方是否要结束通话。以及

[0103] 通话结束模块303用于在通话对方发送的音频信号和/或通信链路状态表明所述通话对方要结束通话的情况下，结束通话。

[0104] 根据本公开的实施例，所述用户输入可以包括以下任意一种：对应于结束通话的操作、对应于手机关屏的操作或者通话过程中使接近传感器远离物体的操作。

[0105] 在一个具体实施例中，所述确定模块302可以包括第一确定单元、第二确定单元和第三确定单元。

[0106] 其中，第一确定单元用于如果通信链路状态为断开，或者通话对方发送的音频信号的音量的值持续小于第一设定音量阈值，则确定所述通话对方要结束通话。

[0107] 第二确定单元用于如果通信链路状态为接通，且通话对方发送的音频信号的音量的值大于第一设定音量阈值，则确定所述通话对方要保持通话。

[0108] 第三确定单元用于如果通信链路状态为接通，通话对方发送的音频信号的音量的值大于第二设定音量阈值、且持续时长超过第一设定时长阈值，则确定所述通话对方要保持通话。

[0109] 在另一个具体实施例中，所述确定模块302可以包括如下单元：第四确定单元、第五确定单元、第六确定单元、第七确定单元、第八确定单元和第九确定单元。

[0110] 其中，第四确定单元用于如果通信链路状态为断开，则确定所述通话对方要结束通话。

[0111] 第五确定单元用于如果通信链路状态为接通，在通话对方发送的音频信号的音量的值持续小于第一设定音量阈值的情况下，确定所述通话对方要结束通话。

[0112] 第六确定单元用于如果通信链路状态为接通，在通话对方发送的音频信号中包含一个或多个通话结束词，或者通话对方发送的音频信号中包含一个或多个所述通话结束词且至少一个所述通话结束词对应的音频信号的音量的值大于第三设定音量阈值的情况下，确定所述通话对方要结束通话。

[0113] 第七确定单元用于如果通信链路状态为接通，在通话对方发送的音频信号的音量的值大于第一设定音量阈值，且所述音频信号中不包括所述通话结束词的情况下，确定所述通话对方要保持通话。

[0114] 第八确定单元用于如果通信链路状态为接通，在通话对方发送的音频信号的音量的值大于第二设定音量阈值、持续时长超过第一设定时长阈值，且所述音频信号中不包括所述通话结束词的情况下，确定所述通话对方要保持通话。

[0115] 第九确定单元用于如果通话对方发送的音频信号中包含一个或多个通话保持词，或者通话对方发送的音频信号中包含一个或多个所述通话保持词且至少一个所述通话保持词对应的音频信号的音量的值大于第四设定音量阈值，则确定所述通话对方要保持通话。

[0116] 如图3B所示，示意性示出了根据本公开实施例的用于通话的系统的第二种框图。在本实施例中，所示系统还可以包括提示模块304。

[0117] 其中，提示模块304用于在通话对方发送的音频信号和/或通信链路状态表征所述通话对方要保持通话的情况下，输出提示信息。

[0118] 在一个优选的实施例中，所述提示模块304包括以下任意一种或多种单元：第一提示单元、第二提示单元或第三提示单元。

[0119] 其中，第一提示单元用于对应于图形用户界面中结束通话的图形以闪动的方式进行提示。

[0120] 第二提示单元用于虚化对应于图形用户界面中结束通话的图形，以及在结束通话的图形的位置展示当前接收到的音频信号的波形图。

[0121] 第三提示单元用于响应于当前接收到的音频信号中包括通话保持词，执行震动。

[0122] 如图3C所示，示意性示出了根据本公开实施例的用于通话的系统的第三种框图。

[0123] 在本实施例中，所述系统还可以包括如下模块：第一声纹获取模块305和第二声纹获取模块306。

[0124] 其中，第一声纹获取模块305用于在通话过程中，获取所述通话对方发送的音频信号的第一声纹特征。

[0125] 第二声纹获取模块306用于响应于接收到所述通话对方发送的包含通话结束词的音频信号，获取所述包含通话结束词的音频信号的第二声纹特征。

[0126] 所述确定模块302具体用于如果所述第一声纹特征与所述第二声纹特征相匹配，或者如果所述第二声纹特征与预先存储的该通话对方的第三声纹特征相匹配，则确定所述通话对方要结束通话。

[0127] 为了进一步提升系统的准确度，如图3D所示，示意性示出了根据本公开实施例的用于通话的系统的第四种框图。

[0128] 在本实施例中，所述系统还可以包括身份属性获取模块307。

[0129] 其中，身份属性获取模块307用于在通话过程中获取所述通话对方的身份属性。

[0130] 所述通话结束模块303具体用于在通话过程中，如果所述通话对方的身份属性对应于所述用户不希望保持通话的类别，则响应于所述用户输入结束通话。

[0131] 在另一个实施例中，如图3E所示，示意性示出了根据本公开实施例的用于通话的系统的第五种框图。

[0132] 在本实施例中，所述系统还可以包括传感器信号获取模块308。

[0133] 其中，传感器信号获取模块308用于在通话过程中通过一个或多个传感器获取信号。

[0134] 所述通话结束模块303具体用于在通话过程中，如果一个或多个传感器获取的信号表明所述用户处于不便于接听电话的情形，则响应于所述用户输入结束通话。

[0135] 图4示意性示出了根据本公开实施例的用于通话的装置的框图。图4示出的装置仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

[0136] 如图4所示，用于通话的装置400包括处理器410和可读存储介质420。该装置400可以执行根据本公开实施例的方法。

[0137] 具体地，处理器410例如可以包括通用微处理器、指令集处理器和/或相关芯片组和/或专用微处理器(例如，专用集成电路(ASIC))，等等。处理器410还可以包括用于缓存用途的板载存储器。处理器410可以是用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。

[0138] 可读存储介质420，例如可以是能够包含、存储、传送、传播或传输指令的任意介质。例如，可读存储介质可以包括但不限于电、磁、光、电磁、红外或半导体系统、装置、器件或传播介质。可读存储介质420的具体示例包括：磁存储装置，如磁带或硬盘(HDD)；存储器，如随机访问存储器(RAM)、只读存储器(ROM)；光存储装置，如光盘(CD-ROM)；和/或有线/无线通信链路。

[0139] 可读存储介质420可以包括计算机程序421，该计算机程序421可以包括代码/计算机可执行指令，其在由处理器410执行时使得处理器410执行根据本公开实施例的方法或其任何变形。

[0140] 计算机程序421可被配置为具有例如包括计算机程序模块的计算机程序代码。例如，在示例实施例中，计算机程序421中的代码可以包括一个或多个程序模块，例如包括程序模块421A、程序模块421B等。应当注意，模块的划分方式和个数并不是固定的，本领域技术人员可以根据实际情况使用合适的程序模块或程序模块组合，当这些程序模块组合被处理器410执行时，使得处理器410可以执行根据本公开实施例的方法或其任何变形。

[0141] 根据本公开的实施例，处理器410可以与可读存储介质420进行交互，来执行根据本公开实施例的方法或其任何变形。

[0142] 根据本发明的实施例，接收模块301、确定模块302、通话结束模块303、提示模块304、第一声纹获取模块305、第二声纹获取模块306、身份属性获取模块307、传感器信号获取模块308中的至少一个可以实现为参考图4描述的计算机程序模块，其在被处理器410执行时，可以实现上面描述的相应操作。

[0143] 本公开还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的设备/装置/系统中所包含的；也可以是单独存在，而未装配入该设备/装置/系统中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被执行时，实现根据本公开实施例的方法。

[0144] 根据本公开的实施例，计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、有线、光缆、射频信号等等，或者上述的任意合适的组合。

[0145] 附图中的流程图和框图，图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

[0146] 本领域技术人员可以理解，本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合或/或结合，即使这样的组合或结合没有明确记载于本公开中。特别地，在不脱离本公开精神和教导的情况下，本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。

[0147] 尽管已经参照本公开的特定示例性实施例示出并描述了本公开，但是本领域技术人员应该理解，在不背离所附权利要求及其等同物限定的本公开的精神和范围的情况下，可以对本公开进行形式和细节上的多种改变。因此，本公开的范围不应该限于上述实施例，而是应该不仅由所附权利要求来进行确定，还由所附权利要求的等同物来进行限定。

通话的方法及装置转让专利

申请号 : CN201810460502.0

文献号 : CN108616667B

文献日 : 2021-02-19

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 谢军 , 张雪元

申请人 : 联想(北京)有限公司

摘要 :

权利要求 :

说明书 :