一种智能音箱及智能音箱使用的方法转让专利

申请号 : CN201810973579.8

文献号 : CN110858883A

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 邱振青吴海全张恩勤曹磊师瑞文

申请人 : 深圳市冠旭电子股份有限公司

摘要 :

本发明适用于智能家居技术领域,提供了一种智能音箱及智能音箱使用的方法,其中,该智能音箱使用的方法包括:麦克风阵列采集语音信息,并根据所述语音信息确定声源方向,控制模块根据所述声源方向,控制与所述声源方向对应的屏幕显示所述摄像头采集的图像信息和/或所述无线通信模块接收到的图像信息,及控制所述智能音箱播放所述麦克风阵列采集的语音信息和/或所述无线通信模块接收到的语音信息。通过本发明可以支持多种应用场景的使用,提高了智能音箱的使用率,具有较强的易用性和实用性。

权利要求 :

1.一种智能音箱,其特征在于,包括:

控制模块、麦克风阵列、无线通信模块、摄像头和至少两个屏幕;

所述麦克风阵列、所述无线通信模块、所述摄像头和所述屏幕均与所述控制模块连接;

所述麦克风阵列,用于采集语音信息,并根据所述语音信息确定声源方向;

所述控制模块,用于根据所述声源方向,控制与所述声源方向对应的屏幕显示所述摄像头采集的图像信息和/或所述无线通信模块接收到的图像信息,及控制所述智能音箱播放所述麦克风阵列采集的语音信息和/或所述无线通信模块接收到的语音信息。

2.根据权利要求1所述的智能音箱,其特征在于,所述智能音箱还包括:唤醒模块;

所述唤醒模块与所述控制模块连接;

所述唤醒模块在检测到预设的唤醒关键词后,唤醒所述智能音箱。

3.根据权利要求1或2所述的智能音箱,其特征在于,当确定的所述声源方向为一个时,所述控制模块具体用于,控制距离所述声源方向最近的屏幕显示所述摄像头采集的图像信息和/或所述无线通信模块接收到的图像信息,及控制所述智能音箱播放所述麦克风阵列采集的语音信息和/或所述无线通信模块接收到的语音信息。

4.根据权利要求3所述的智能音箱,其特征在于,所述智能音箱还包括:音频处理模块,所述音频处理模块包括数字信号处理器、功率放大器和扬声器;

所述数字信号处理器、功率放大器和扬声器均与所述控制模块连接。

5.根据权利要求1或2所述的智能音箱,其特征在于,当确定的所述声源方向为多个时,所述控制模块具体用于,确定所述声源方向中的每一个声源方向与预设基准方向所成的角度,当存在屏幕对应的视角范围包含所述角度时,控制所述屏幕显示所述摄像头采集的图像信息和/或所述无线通信模块接收到的图像信息,及控制所述智能音箱播放所述麦克风阵列采集的语音信息和/或所述无线通信模块接收到的语音信息。

6.根据权利要求1所述的智能音箱,其特征在于,所述智能音箱还包括:按键模块;

所述按键模块与所述控制模块连接;

所述控制模块,用于在所述按键模块接收到按键指令时,控制所述智能音箱音量的调节。

7.一种智能音箱使用的方法,其特征在于,所述智能音箱包括:控制模块、麦克风阵列、无线通信模块、摄像头和至少两个屏幕,所述麦克风阵列、所述无线通信模块、所述摄像头和所述屏幕均与所述控制模块连接,所述方法包括:所述麦克风阵列采集语音信息,并根据所述语音信息确定声源方向;

所述控制模块根据所述声源方向,控制与所述声源方向对应的屏幕显示所述摄像头采集的图像信息和/或所述无线通信模块接收到的图像信息,及控制所述智能音箱播放所述麦克风阵列采集的语音信息和/或所述无线通信模块接收到的语音信息。

8.根据权利要求7所述的方法,其特征在于,控制所述声源方向对应的屏幕显示所述摄像头采集的图像信息和/或所述无线通信模块接收到的图像信息,及控制所述智能音箱播放所述麦克风阵列采集的语音信息和/或所述无线通信模块接收到的语音信息包括:当确定的所述声源方向为一个时,所述控制模块控制距离所述声源方向最近的屏幕显示所述摄像头采集的图像信息和/或所述无线通信模块接收到的图像信息,及控制所述智能音箱播放所述麦克风阵列采集的语音信息和/或所述无线通信模块接收到的语音信息。

9.根据权利要求7所述的方法,其特征在于,控制所述声源方向对应的屏幕显示所述摄像头采集的图像信息和/或所述无线通信模块接收到的图像信息,及控制所述智能音箱播放所述麦克风阵列采集的语音信息和/或所述无线通信模块接收到的语音信息还包括:当确定的所述声源方向为多个时,所述控制模块确定所述声源方向中的每一个声源方向与预设基准方向所成的角度,当存在屏幕对应的视角范围包含所述角度时,控制所述屏幕显示所述摄像头采集的图像信息和/或所述无线通信模块接收到的图像信息,及控制所述智能音箱播放所述麦克风阵列采集的语音信息和/或所述无线通信模块接收到的语音信息。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求7至9任一项所述方法的步骤。

11.一种视频会议系统,包括:至少两个如权利要求1至6任一项所述的智能音箱。

12.如权利要求11所述的视频会议系统,其特征在于,所述视频会议系统还包括:分别与所述至少两个智能音箱连接的服务器。

说明书 :

一种智能音箱及智能音箱使用的方法

技术领域

[0001] 本发明涉及智能家居技术领域,尤其涉及一种智能音箱、智能音箱使用的方法及计算机可读存储介质。

背景技术

[0002] 随着互联网技术的兴起,极大地丰富了人们相互之间的沟通方式,使身处不同地域的人们沟通起来更加方便。其中,视频会议系统作为一种重要的远程交流技术,因其便捷、高效等优点,受到人们的一致好评。
[0003] 然而市场上的智能音箱设备在支持视频通话时,一般仅能在一个方向上显示当前的视频画面,不能满足群体视频会议场景下用户的需求,使用率较低。

发明内容

[0004] 鉴于此,本发明实施例提供了一种智能音箱及智能音箱使用的方法,可以同时在多个方向上显示视频会议的图像信息,能够在方便用户使用的同时提高智能音箱的使用率。
[0005] 本发明实施例的第一方面提供了一种智能音箱,包括:
[0006] 控制模块、麦克风阵列、无线通信模块、摄像头和至少两个屏幕;
[0007] 所述麦克风阵列、所述无线通信模块、所述摄像头和所述屏幕均与所述控制模块连接;
[0008] 所述麦克风阵列,用于采集语音信息,并根据所述语音信息确定声源方向;
[0009] 所述控制模块,用于根据所述声源方向,控制与所述声源方向对应的屏幕显示所述摄像头采集的图像信息和/或所述无线通信模块接收到的图像信息,及控制所述智能音箱播放所述麦克风阵列采集的语音信息和/或所述无线通信模块接收到的语音信息。
[0010] 本发明实施例的第二方面提供了一种智能音箱使用的方法,所述智能音箱包括:
[0011] 控制模块、麦克风阵列、无线通信模块、摄像头和至少两个屏幕,所述麦克风阵列、所述无线通信模块、所述摄像头和所述屏幕均与所述控制模块连接,所述方法包括:
[0012] 所述麦克风阵列采集语音信息,并根据所述语音信息确定声源方向;
[0013] 所述控制模块根据所述声源方向,控制与所述声源方向对应的屏幕显示所述摄像头采集的图像信息和/或所述无线通信模块接收到的图像信息,及控制所述智能音箱播放所述麦克风阵列采集的语音信息和/或所述无线通信模块接收到的语音信息。
[0014] 本发明实施例的第三方面提供了一种计算机可读存储介质,包括:该计算机可读存储介质上存储有计算机程序,上述计算机程序被处理器执行时实现上述第二方面提及的方法。
[0015] 本发明实施例与现有技术相比存在的有益效果是:在本实施例中,所述智能音箱包括:控制模块、麦克风阵列、无线通信模块、摄像头和至少两个屏幕,所述麦克风阵列、所述无线通信模块、所述摄像头和所述屏幕均与所述控制模块连接,所述方法包括:所述麦克风阵列采集语音信息,并根据所述语音信息确定声源方向,所述控制模块根据所述声源方向,控制与所述声源方向对应的屏幕显示所述摄像头采集的图像信息和/或所述无线通信模块接收到的图像信息,及控制所述智能音箱播放所述麦克风阵列采集的语音信息和/或所述无线通信模块接收到的语音信息。通过本发明实施例,能够使各个方向的与会人员在听到声音的同时,清晰看到视频会议的画面,大大提高了智能音箱的使用率,具有较强的易用性和实用性。

附图说明

[0016] 为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0017] 图1为本发明实施例一提供的智能音箱的结构示意图;
[0018] 图2为本发明实施例二提供的智能音箱的具体结构示意图;
[0019] 图3为本发明实施例三提供的智能音箱使用的方法的流程示意图;
[0020] 图4为本发明实施例四提供的智能音箱使用的方法的具体实现过程示意图;
[0021] 图5为本发明实施例五提供的智能音箱使用的方法的具体实现过程示意图;
[0022] 图6为本发明实施例六提供的视频会议系统的结构示意图。

具体实施方式

[0023] 以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
[0024] 应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
[0025] 还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
[0026] 还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
[0027] 如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
[0028] 应理解,本实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
[0029] 需要说明的是,本发明中可以包括任意数量的智能音箱以使得两个或更多用户能够进行视频会议,其中,所述智能音箱包括无线音箱。
[0030] 为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
[0031] 实施例一
[0032] 图1是本发明实施例一提供的智能音箱的结构示意图,该智能音箱可以包括:
[0033] 控制模块11、麦克风阵列12、无线通信模块13、摄像头14和屏幕15。
[0034] 本发明实施例中,所述麦克风阵列12、无线通信模块13、所述摄像头14和所述屏幕15均与所述控制模块11连接。
[0035] 所述麦克风阵列12,用于采集语音信息,并根据所述语音信息确定声源方向,其中,可以基于到达时间差的定位算法来确定所述声源方向。应当理解,所述麦克风阵列12是由一定数目的麦克风组成,用来对声场的空间特性进行采样并处理的系统。可选的,所述麦克风的数量为7,呈环状排列。
[0036] 所述无线通信模块13,用于与服务器进行交互,从而将本地采集的语音信息和/或图像信息发送至服务器,并接收整个视频会议过程中对端采集的语音信息和/或图像信息。可选的,所述无线通信模块13可包括:WiFi通信子模块和蓝牙通信子模块。进一步的,通过服务器接收除所述麦克风阵列12采集的语音信息以外的语音信息和/或除所述摄像头14采集的图像信息以外的图像信息。需需要说明的是,考虑到本申请中的智能音箱主要应用于视频会议场景中,在使用智能音箱上的麦克风阵列进行语音信息采集时,需要经智能音箱播放出来,让本地用户听到。
[0037] 所述摄像头14,用于采集用户的图像信息。需要说明的是,所述摄像头14的类型和数量可以根据实际情况来进行灵活的选取,包括但不限于一个普通的摄像头、一个360度的全景摄像头或一个摄像头阵列。
[0038] 所述屏幕15,用于显示所述摄像头14采集的图像信息和/或所述无线通信模块13接收到的图像信息。可选的,所述屏幕的数量至少为2个。
[0039] 所述控制模块11,用于根据所述声源方向,控制最靠近所述声源方向的屏幕显示所述摄像头14采集的图像信息和/或所述无线通信模块13接收到的图像信息;另外,所述控制模块11,还用于控制所述智能音箱播放所述麦克风阵列采集12的语音信息和/或所述无线通信模块13接收的语音信息。可选的,所述控制模块11包含一主控芯片,所述主控芯片为APQ8009芯片。
[0040] 在本发明实施例中,通过所述麦克风阵列采集语音信息,并根据所述语音信息确定声源方向,通过所述控制模块根据所述声源方向,控制与所述声源方向对应的屏幕显示所述摄像头采集的图像信息和/或所述无线通信模块接收到的图像信息,同时控制所述智能音箱播放所述麦克风阵列采集的语音信息和/或所述无线通信模块接收到的语音信息,可以满足多人视频会议的场景需求,使得智能音箱的实用性提高,功能更加齐全,人们使用更加方便。
[0041] 实施例二
[0042] 图2是本发明实施例二提供的智能音箱的具体结构示意图,该智能音箱可以包括:
[0043] 控制模块21、麦克风阵列22、无线通信模块23、摄像头24、屏幕25、唤醒模块26、音频处理模块27和按键模块28。
[0044] 其中,麦克风阵列22、无线通信模块23、摄像头24和屏幕25、唤醒模块26、音频处理模块27和按键模块28均与所述控制模块21连接。需要说明的是,所述控制模块21、所述麦克风阵列22、无线通信模块23、所述摄像头24和所述屏幕25与实施例一中的所述控制模块11、麦克风阵列12、无线通信模块13、所述摄像头14和所述屏幕15相同,在此不作重复赘述。
[0045] 所述唤醒模块26在检测到预设的唤醒关键词后,唤醒所述智能音箱,以使得所述智能音箱处于工作状态。
[0046] 所述音频处理模块27包括:数字信号处理器、功率放大器和扬声器,所述数字信号处理器、功率放大器和扬声器均与所述控制模块21连接,所述数字信号处理器的输出端与所述功率放大器的输入端连接,所述功率放大器的输出端与所述扬声器的输入端连接。应当理解,由于所述麦克风阵列22采集的语音信息和/或所述无线通信模块23接收到的语音信息中包含很多噪声,如果直接将其播放,会影响最终的播放效果,使得用户体验感降低。可选的,通过包含所述音频处理模块27在内的数字信号处理系统对所述麦克风阵列22采集的语音信息和/或所述无线通信模块23接收到的语音信息进行处理。
[0047] 所述按键模块28,用于接收用户的按键指令,并通过所述控制模块控制所述智能音箱音量的调节。
[0048] 由上可见,本发明实施例相比于实施例一,增加了唤醒模块,可以在检测到预设的唤醒关键词后,唤醒所述智能音箱,使其进入工作状态;并且,增加了音频处理模块,可以使所述智能音箱播放的语音更加好听;另外,还增加了按键模块,可以结合所述控制模块来进行智能音箱音量的调节,从而满足用户在不同应用场景下的不同需求,提高用户的体验感,具有较强的易用性和实用性。
[0049] 实施例三
[0050] 本发明实施例三提供的智能音箱使用的方法的流程示意图,该方法可以包括以下步骤:
[0051] S301:麦克风阵列采集语音信息,并根据所述语音信息确定声源方向。
[0052] 其中,所述述智能音箱包括:控制模块、麦克风阵列、无线通信模块、摄像头和至少两个屏幕,所述麦克风阵列、所述无线通信模块、所述摄像头和所述屏幕均与所述控制模块连接。
[0053] 可选的,通过所述麦克风阵列采集语音信息,并将所述语音信息处理为语音数据,根据所述语音数据确定所述语音信息对应的声源方向。
[0054] S302:所述控制模块根据所述声源方向,控制与所述声源方向对应的屏幕显示所述摄像头采集的图像信息和/或所述无线通信模块接收到的图像信息,及控制所述智能音箱播放所述麦克风阵列采集的语音信息和/或所述无线通信模块接收到的语音信息。
[0055] 应理解,所述屏幕显示的图像可以仅为所述摄像头采集的图像信息,即:己方的图像信息;也可以仅为所述无线通信模块接收到的图像信息,即:对方的图像信息;还可以是包括所述摄像头采集的图像信息和所述无线通信模块接收到的图像信息,即:同时显示己方和对方的图像信息,具体显示的信息可以根据实际的需求和屏幕的大小进行灵活的设置。可选的,所述屏幕以不同比例同时显示所述摄像头采集的图像信息和所述无线通信模块接收到的图像信息。
[0056] 还应理解,所述智能音箱播放的语音可以仅为所述麦克风阵列采集的语音信息,即:己方的语音信息;也可以仅为所述无线通信模块接收到的语音信息,即:对方的语音信息;还可以是包括所述麦克风阵列采集的语音信息和所述无线通信模块接收到的语音信息,即:同时显示己方和对方的语音信息,具体显示的信息可以根据实际的需求和音频处理模块的处理效果进行灵活的设置。可选的,所述智能音箱播放所述无线通信模块接收到的语音信息。
[0057] 由上可见,本发明实施例通过所述麦克风阵列采集语音信息,并根据所述语音信息确定声源方向,所述控制模块根据所述声源方向,控制与所述声源方向对应的屏幕显示所述摄像头采集的图像信息和/或所述无线通信模块接收到的图像信息,及控制所述智能音箱播放所述麦克风阵列采集的语音信息和/或所述无线通信模块接收到的语音信息,可以使处于各个方向上的用户除了能听见与你通话的人的声音外还能进行语音交流,并且看到他们的表情和动作,使处于不同地方的人就像在同一会议室内沟通,能够在提升用户体验感的同时提高智能音箱的使用率,具有较强的易用性和实用性。
[0058] 实施例四
[0059] 本发明实施例四提供的智能音箱使用的方法的具体实现过程示意图,是对上述实施例三中的步骤S301、S302的进一步细化和说明,该方法可以包括以下步骤:
[0060] S401:所述麦克风阵列采集语音信息。
[0061] 其中,上述步骤S401和上述实施例三中的步骤S301基本相同,此处不再赘述。
[0062] S402:检测所述语音信息是否包含预设的唤醒关键词,若检测到预设的唤醒关键词,则唤醒所述智能音箱。
[0063] 其中,所述唤醒关键词为预先定义的将所述智能音箱从待机状态切换到工作状态的词语。可选的,根据用户的喜好来灵活设置所述预设的唤醒关键词。
[0064] S403:在唤醒所述智能音箱后,根据所述语音信息确定声源方向。
[0065] 其中,上述步骤S403和上述实施例三中的步骤S301基本相同,此处不再赘述。
[0066] S404:当确定的所述声源方向为一个,所述控制模块控制距离所述声源方向最近的屏幕显示所述摄像头采集的图像信息和/或所述无线通信模块接收到的图像信息,及控制所述智能音箱播放所述麦克风阵列采集的语音信息和/或所述无线通信模块接收到的语音信息。
[0067] 应理解,考虑到本发明中的应用场景包括:一对一的单人视频会议模式、一对多的群体视频会议模式和多对多的群体视频会议模式,因此所述声源的方向可能有一个或多个,其中本发明实施例中仅以声源方向只有一个时为例进行解释和说明,关于多个声源方向的描述可详见实施例五。
[0068] 还应理解,当所述声源方向为一个时,通过控制距离所述声源方向最近的屏幕显示所述摄像头采集的图像信息和/或所述无线通信模块接收到的图像信息,可以最大程度的保证用户观看到清晰的视频画面。其中,声源到屏幕的距离可以根据声源到麦克风阵列的距离换算得到。
[0069] 由上可见,本发明实施例相比于实施例三,增加了语音唤醒步骤和对所述声源方向进行判断的步骤,通过语音唤醒步骤可以及时将所述智能音箱从待机状态切换到工作状态,加快了数据处理的速度;另外,对于声源方向仅有一个的情形,控制距离所述声源方向最近的屏幕显示所述摄像头采集的图像信息和/或所述无线通信模块接收到的图像信息,可以获取较佳的观看效果,使得智能音箱的使用率得以提高,具有较强的易用性和实用性。
[0070] 实施例五
[0071] 本发明实施例五提供的智能音箱使用的方法的具体实现过程示意图,是对上述实施例三中的步骤S301、S302的又一步细化和说明,该方法可以包括以下步骤:
[0072] S501:所述麦克风阵列采集语音信息。
[0073] S502:检测所述语音信息是否包含预设的唤醒关键词,若检测到预设的唤醒关键词,则唤醒所述智能音箱。
[0074] S503:在唤醒所述智能音箱后,所述麦克风阵列根据所述语音信息确定声源方向。
[0075] 其中,上述步骤S501-S503和上述实施例四中的步骤S401-S403基本相同,可参照上述实施例中的相关描述,此处不再赘述。
[0076] S504:当确定的所述声源方向为多个时,所述控制模块确定所述声源方向中的每一个声源方向与预设基准方向所成的角度,当存在屏幕对应的视角范围包含所述角度时,控制所述屏幕显示所述摄像头采集的图像信息和/或所述无线通信模块接收到的图像信息,及控制所述智能音箱播放所述麦克风阵列采集的语音信息和/或所述无线通信模块接收到的语音信息。
[0077] 可选的,所述预设基准方向为所述麦克风阵列安装时设定的基准方向。
[0078] 其中,所述视角范围是指用户可以从不同的方向清晰地观察到屏幕上所有内容的最大角度范围,应当理解,所述视角范围与屏幕的数量有关。
[0079] 示例性的,在一种具体的应用场景中,若所述智能音箱安装有三个屏幕,则第一个屏幕对应的视角范围为(0,120°],第二个屏幕对应的视角范围为(120°,240°],第三个屏幕对应的视角范围为(240°,360°],当所述控制模块确定所述声源方向与预设基准方向所成的角度小于或者等于120°时,控制所述第一个屏幕处于工作状态,显示所述摄像头采集的图像信息和/或所述无线通信模块接收到的图像信息;当所述控制模块确定所述声源方向与预设基准方向所成的角度落在(120°,240°]区间时,控制所述第二个屏幕处于工作状态,显示所述摄像头采集的图像信息和/或所述无线通信模块接收到的图像信息;当所述控制模块确定所述声源方向与预设基准方向所成的角度落在(240°,360°]区间时,控制所述第三个屏幕处于工作状态,显示所述摄像头采集的图像信息和/或所述无线通信模块接收到的图像信息。
[0080] 还应理解,上述应用场景中,为了使本地和远端能进行同样的交流和显示,在显示所述摄像头采集的图像信息和/或所述无线通信模块接收到的图像信息的同时,所述控制模块还可以控制所述智能音箱播放所述麦克风阵列采集的语音信息和/或所述无线通信模块接收到的语音信息。
[0081] 由上可见,本发明实施例相比于实施例三,给出了当声源方向为多个时的具体实现方式,可以更好地控制屏幕的工作状态,从而提高智能音箱的使用率,具有较强的易用性和实用性。
[0082] 实施例六
[0083] 图6是本发明实施例六提供的视频会议系统的结构示意图,该视频会议系统可以包括:
[0084] 两个以上的智能音箱以及分别与所述至少两个智能音箱连接的服务器,其中所述智能音箱在实施例一中已详细说明过,此处不再赘述。
[0085] 下面以一种具体的应用场景为例对本发明实施例中的视频会议系统进行描述,如图6所示的视频会议系统包括:第一智能音箱61、第二智能音箱62以及服务器63,其中第一智能音箱61由本地用户使用,第二智能音箱62由对端的远程用户使用。需要说明的是,本申请中暂不对本地用户的数量和远程用户的数量进行限制,可以分别是一个或多个,具体数量可视情况而定。当本地用户和对端用户双方分别开启各自的智能音箱后,第一智能音箱61通过自带的摄像头和麦克风阵列来分别采集本地的图像信息和语音信息,并将采集的图像信息和语音信息通过无线通信模块发送至服务器,当服务器在接收到第二智能音箱62的请求消息后,将第一智能音箱61发送的图像信息和语音信息转发至第二智能音箱62,并接收第二智能音箱62发送的图像信息和语音信息,当服务器接收到第一智能音箱61的请求消息后,将第二智能音箱62发送的图像信息和语音信息转发至第一智能音箱61,当第一智能音箱61根据本地采集的语音信息确定了声源的方向后,控制与声源方向对应的屏幕显示本地和/或对端采集的图像信息,并控制智能音箱61播放本地和/或对端采集的语音信息,这样对于本地用户来说就可以在听到对方语音的同时又看到包含对方图像在内的画面。
[0086] 所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0087] 在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
[0088] 本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0089] 在本发明所提供的实施例中,应该理解到,所揭露的终端设备和方法,可以通过其它的方式实现。例如,以上所描述的终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
[0090] 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0091] 所述集成的模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
[0092] 以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。