双面屏终端控制方法、双面屏终端及计算机可读存储介质转让专利

申请号 : CN201811009259.7

文献号 : CN109167880B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 姚青俊

申请人 : 努比亚技术有限公司

摘要 :

本发明公开了一种双面屏终端控制方法,所述双面屏终端包括主屏和辅屏,该方法包括:在监测到主屏处于通话模式时,开启语音采集模式采集语音信息;对采集到的语音信息进行识别,以确定采集到的语音信息是否涉及联系人信息;若确认采集到的语音信息涉及联系人信息,则确定涉及的联系人信息对应的通讯应用软件;唤醒辅屏,并在辅屏启动确定的通讯应用软件。本发明还公开了一种双面屏终端及计算机可读存储介质。本发明提高用户通话时查找联系人信息的便捷性,可充分发挥双面屏优势,从而提升了用户体验。

权利要求 :

1.一种双面屏终端控制方法,其特征在于,所述双面屏终端包括主屏和辅屏,所述方法包括:

在监测到主屏处于通话模式时,开启语音采集模式采集语音信息;

对采集到的语音信息进行识别,以确定采集到的语音信息是否涉及联系人信息;

若确认采集到的语音信息涉及联系人信息,则确定涉及的联系人信息对应的通讯应用软件;

唤醒辅屏,并在辅屏启动确定的通讯应用软件;

所述确定涉及的联系人信息对应的通讯应用软件的步骤包括:基于预存关键词库中,预存关键词与通讯应用软件的映射关系,确定基于语音信息识别出的关键词对应的通讯应用软件,作为涉及的联系人信息对应的通讯应用软件;

所述对采集到的语音信息进行识别,以确定采集到的语音信息是否涉及联系人信息的步骤包括:

对采集到的语音信息进行关键词识别;

将识别出的关键词与预存关键词库进行比对;

若在预存关键词库中,比对到与识别出的关键词匹配的预存关键词,则确认采集到的语音信息涉及联系人信息;

所述对采集到的语音信息进行关键词识别的步骤包括:对采集到的语音信息进行VAD检测,根据检测结果截取所述语音信息中的语音;

用预设长度的帧对截取出的语音进行分割,对分割得到的每帧语音中进行特征提取,得到特征向量;

将提取的特征向量输入预设声学模型,分析采集到的语音信息,以识别出关键词。

2.如权利要求1所述的双面屏终端控制方法,其特征在于,所述对采集到的语音信息进行关键词识别的步骤之前,包括:建立声学模型。

3.如权利要求2所述的双面屏终端控制方法,其特征在于,所述建立声学模型的步骤包括:

获取训练样本,所述训练样本为用于训练声学模型的语音信息;

根据所述训练样本,采用深度学习方法训练得到基于深度神经网络的声学模型。

4.如权利要求3所述的双面屏终端控制方法,其特征在于,所述根据所述训练样本,采用深度学习方法训练得到基于深度神经网络的声学模型的步骤包括:根据所述训练样本训练隐马尔科夫模型和高斯混合模型;

根据所述训练样本,以及训练好的隐马尔科夫模型和高斯混合模型,训练得到基于深度神经网络的声学模型。

5.如权利要求1所述的双面屏终端控制方法,其特征在于,所述方法还包括:确定在预设时长阈值内是否侦测到用户基于辅屏的触控操作;

若在预设时长阈值内未侦测到用户基于辅屏的触控操作,则熄灭辅屏。

6.一种双面屏终端,其特征在于,所述双面屏终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的双面屏终端控制程序,所述双面屏终端控制程序被所述处理器执行时实现如权利要求1至5中任一项所述的双面屏终端控制方法的步骤。

7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有双面屏终端控制程序,所述双面屏终端控制程序被处理器执行时实现如权利要求1至5中任一项所述的双面屏终端控制方法的步骤。

说明书 :

双面屏终端控制方法、双面屏终端及计算机可读存储介质

技术领域

[0001] 本发明涉及通信技术领域,尤其涉及一种双面屏终端控制方法、双面屏终端及计算机可读存储介质。

背景技术

[0002] 双面屏终端凭借其在内容显示上的优势变得越来越流行。以双面屏手机为例,双面屏手机是指拥有主屏和辅屏两个屏幕的手机,其两个屏幕中间通过旋转轴连接,通过旋
转轴的旋转可以将两个屏幕拼接在一起,这种双面屏手机的设计可以让用户在一个双面屏
手机上操作两个屏幕,实现了利用有限的机身尺寸展示更多的内容信息,满足了消费者的
体验需求。
[0003] 目前,双面屏手机仅在主屏配置听筒,当用户通过主屏进行通话时,如果对方询问某个联系人的联系方式,用户需先点亮屏幕,再把通话界面切换至后台,然后打开询问的联
系方式所在的应用软件进行查找,结束通话时还需将通话界面切换至前台再进行挂断操
作,操作步骤过于繁琐。
[0004] 上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。

发明内容

[0005] 本发明的主要目的在于提供一种双面屏终端控制方法、双面屏终端及计算机可读存储介质,旨在提高用户通话时查找联系人信息的便捷性,可充分发挥双面屏优势,从而提
升了用户体验。
[0006] 为实现上述目的,本发明提供一种双面屏终端控制方法,所述双面屏终端包括主屏和辅屏,所述方法包括:
[0007] 在监测到主屏处于通话模式时,开启语音采集模式采集语音信息;
[0008] 对采集到的语音信息进行识别,以确定采集到的语音信息是否涉及联系人信息;
[0009] 若确认采集到的语音信息涉及联系人信息,则确定涉及的联系人信息对应的通讯应用软件;
[0010] 唤醒辅屏,并在辅屏启动确定的通讯应用软件。
[0011] 可选地,所述对采集到的语音信息进行识别,以确定采集到的语音信息是否涉及联系人信息的步骤包括:
[0012] 对采集到的语音信息进行关键词识别;
[0013] 将识别出的关键词与预存关键词库进行比对;
[0014] 若在预存关键词库中,比对到与识别出的关键词匹配的预存关键词,则确认采集到的语音信息涉及联系人信息。
[0015] 可选地,所述对采集到的语音信息进行关键词识别的步骤包括:
[0016] 对采集到的语音信息进行预处理;
[0017] 对预处理后的语音信息进行特征提取;
[0018] 将提取的特征输入预设声学模型,分析采集到的语音信息,以识别出关键词。
[0019] 可选地,所述确定涉及的联系人信息对应的通讯应用软件的步骤包括:
[0020] 基于预存关键词库中,预存关键词与通讯应用软件的映射关系,确定识别出的关键词对应的通讯应用软件,作为涉及的联系人信息对应的通讯应用软件。
[0021] 可选地,所述对采集到的语音信息进行关键词识别的步骤之前,包括:
[0022] 建立声学模型。
[0023] 可选地,所述建立声学模型的步骤包括:
[0024] 获取训练样本,所述训练样本为用于训练声学模型的语音信息;
[0025] 根据所述训练样本,采用深度学习方法训练得到基于深度神经网络的声学模型。
[0026] 可选地,所述根据所述训练样本,采用深度学习方法训练得到基于深度神经网络的声学模型的步骤包括:
[0027] 根据所述训练样本训练隐马尔科夫模型和高斯混合模型;
[0028] 根据所述训练样本,以及训练好的隐马尔科夫模型和高斯混合模型,训练得到基于深度神经网络的声学模型。
[0029] 可选地,所述方法还包括:
[0030] 确定在预设时长阈值内是否侦测到用户基于辅屏的触控操作;
[0031] 若在预设时长阈值内未侦测到用户基于辅屏的触控操作,则熄灭辅屏。
[0032] 此外,为实现上述目的,本发明还提供一种双面屏终端,所述双面屏终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的双面屏终端控制程序,所
述双面屏终端控制程序被所述处理器执行时实现如上所述的双面屏终端控制方法的步骤。
[0033] 此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有双面屏终端控制程序,所述双面屏终端控制程序被处理器执行时实现如
上所述的双面屏终端控制方法的步骤。
[0034] 本发明在监测到主屏处于通话模式时,开启语音采集模式采集语音信息;对采集到的语音信息进行识别,以确定采集到的语音信息是否涉及联系人信息;若确认采集到的
语音信息涉及联系人信息,则确定涉及的联系人信息对应的通讯应用软件;唤醒辅屏,并在
辅屏启动确定的通讯应用软件。通过上述方式,用户在通话过程中,若对方向用户询问某个
联系人的信息,双面屏终端则直接在辅屏启动联系人信息所在的通讯应用软件,供用户查
找,可避免用户将通话界面切换至后台再进入通讯应用软件的操作,充分发挥了双面屏优
势,提高了便捷性,从而提升了用户体验。

附图说明

[0035] 图1为实现本发明各个实施例的一种移动终端的硬件结构示意图;
[0036] 图2为本发明实施例提供的一种通信网络系统架构图;
[0037] 图3为本发明双面屏终端控制方法第一实施例的流程示意图;
[0038] 图4为本发明双面屏终端控制方法第一实施例的细化流程示意图。
[0039] 图5为本发明双面屏终端控制方法第一实施例中通话时双面屏终端在辅屏启动微信应用的场景示意图。
[0040] 本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

[0041] 应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0042] 在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合
地使用。
[0043] 终端可以以各种形式来实施。例如,本发明中描述的终端可以包括诸如手机、平板电脑、笔记本电脑、掌上电脑、个人数字助理(Personal Digital Assistant,PDA)、便捷式
媒体播放器(Portable Media Player,PMP)、导航装置、可穿戴设备、智能手环、计步器等移
动终端,以及诸如数字TV、台式计算机等固定终端。
[0044] 后续描述中将以移动终端为例进行说明,本领域技术人员将理解的是,除了特别用于移动目的的元件之外,根据本发明的实施方式的构造也能够应用于固定类型的终端。
[0045] 请参阅图1,其为实现本发明各个实施例的一种移动终端的硬件结构示意图,该移动终端100可以包括:RF(Radio Frequency,射频)单元101、Wi‑Fi模块102、音频输出单元
103、A/V(音频/视频)输入单元104、传感器105、显示单元106、用户输入单元107、接口单元
108、存储器109、处理器110、以及电源111等部件。本领域技术人员可以理解,图1中示出的
移动终端结构并不构成对移动终端的限定,移动终端可以包括比图示更多或更少的部件,
或者组合某些部件,或者不同的部件布置。
[0046] 下面结合图1对移动终端的各个部件进行具体的介绍:
[0047] 射频单元101可用于收发信息或通话过程中,信号的接收和发送,具体的,将基站的下行信息接收后,给处理器110处理;另外,将上行的数据发送给基站。通常,射频单元101
包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射
频单元101还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信
标准或协议,包括但不限于GSM(Global System of Mobile communication,全球移动通讯
系统)、GPRS(General Packet Radio Service,通用分组无线服务)、CDMA2000(Code 
Division Multiple Access 2000,码分多址2000)、WCDMA(Wideband Code Division 
Multiple Access,宽带码分多址)、TD‑SCDMA(Time Division‑Synchronous Code 
Division Multiple Access,时分同步码分多址)、FDD‑LTE(Frequency Division 
Duplexing‑Long Term Evolution,频分双工长期演进)和TDD‑LTE(Time Division 
Duplexing‑Long Term Evolution,分时双工长期演进)等。
[0048] WiFi属于短距离无线传输技术,移动终端通过WiFi模块102可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图1示
出了WiFi模块102,但是可以理解的是,其并不属于移动终端的必须构成,完全可以根据需
要在不改变发明的本质的范围内而省略。
[0049] 音频输出单元103可以在移动终端100处于呼叫信号接收模式、通话模式、记录模式、语音识别模式、广播接收模式等等模式下时,将射频单元101或WiFi模块102接收的或者
在存储器109中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元103
还可以提供与移动终端100执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消
息接收声音等等)。音频输出单元103可以包括扬声器、蜂鸣器等等。
[0050] A/V输入单元104用于接收音频或视频信号。A/V输入单元104可以包括图形处理器(Graphics Processing Unit,GPU)1041和麦克风1042,图形处理器1041对在视频捕获模式
或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处
理。处理后的图像帧可以显示在显示单元106上。经图形处理器1041处理后的图像帧可以存
储在存储器109(或其它存储介质)中或者经由射频单元101或WiFi模块102进行发送。麦克
风1042可以在电话通话模式、记录模式、语音识别模式等等运行模式中经由麦克风1042接
收声音(音频数据),并且能够将这样的声音处理为音频数据。处理后的音频(语音)数据可
以在电话通话模式的情况下转换为可经由射频单元101发送到移动通信基站的格式输出。
麦克风1042可以实施各种类型的噪声消除(或抑制)算法以消除(或抑制)在接收和发送音
频信号的过程中产生的噪声或者干扰。
[0051] 移动终端100还包括至少一种传感器105,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境
光线的明暗来调节显示面板1061的亮度,接近传感器可在移动终端100移动到耳边时,关闭
显示面板1061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般
为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用
(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;
至于手机还可配置的指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、
湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
[0052] 显示单元106用于显示由用户输入的信息或提供给用户的信息。显示单元106可包括显示面板1061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管
(Organic Light‑Emitting Diode,OLED)等形式来配置显示面板1061。
[0053] 用户输入单元107可用于接收输入的数字或字符信息,以及产生与移动终端的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元107可包括触控面板1071以
及其他输入设备1072。触控面板1071,也称为触摸屏,可收集用户在其上或附近的触摸操作
(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1071上或在触控面板1071
附近的操作),并根据预先设定的程式驱动相应的连接装置。触控面板1071可包括触摸检测
装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带
来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它
转换成触点坐标,再送给处理器110,并能接收处理器110发来的命令并加以执行。此外,可
以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1071。除了触控面板
1071,用户输入单元107还可以包括其他输入设备1072。具体地,其他输入设备1072可以包
括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中
的一种或多种,具体此处不做限定。
[0054] 进一步的,触控面板1071可覆盖显示面板1061,当触控面板1071检测到在其上或附近的触摸操作后,传送给处理器110以确定触摸事件的类型,随后处理器110根据触摸事
件的类型在显示面板1061上提供相应的视觉输出。虽然在图1中,触控面板1071与显示面板
1061是作为两个独立的部件来实现移动终端的输入和输出功能,但是在某些实施例中,可
以将触控面板1071与显示面板1061集成而实现移动终端的输入和输出功能,具体此处不做
限定。
[0055] 接口单元108用作至少一个外部装置与移动终端100连接可以通过的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无
线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端
口、视频I/O端口、耳机端口等等。接口单元108可以用于接收来自外部装置的输入(例如,数
据信息、电力等等)并且将接收到的输入传输到移动终端100内的一个或多个元件或者可以
用于在移动终端100和外部装置之间传输数据。
[0056] 存储器109可用于存储软件程序以及各种数据。存储器109可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声
音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如
音频数据、电话本等)等。此外,存储器109可以包括高速随机存取存储器,还可以包括非易
失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
[0057] 处理器110是移动终端的控制中心,利用各种接口和线路连接整个移动终端的各个部分,通过运行或执行存储在存储器109内的软件程序和/或模块,以及调用存储在存储
器109内的数据,执行移动终端的各种功能和处理数据,从而对移动终端进行整体监控。处
理器110可包括一个或多个处理单元;优选的,处理器110可集成应用处理器和调制解调处
理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要
处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器110中。
[0058] 移动终端100还可以包括给各个部件供电的电源111(比如电池),优选的,电源111可以通过电源管理系统与处理器110逻辑相连,从而通过电源管理系统实现管理充电、放
电、以及功耗管理等功能。
[0059] 尽管图1未示出,移动终端100还可以包括蓝牙模块等,在此不再赘述。
[0060] 基于上述移动终端硬件结构,提出本发明双面屏终端的各个实施例。
[0061] 本发明双面屏终端实施例中,双面屏终端包括主屏和辅屏,主屏和辅屏可以通过一旋转轴连接,通过旋转轴的旋转,可以将主屏和辅屏调至任意夹角。
[0062] 请参照图1,在本发明终端的一实施例中,该终端包括:存储器109、处理器110和存储在所述存储器109上并可在所述处理器110上运行的双面屏终端控制程序,所述双面屏终
端控制程序被所述处理器110执行时实现以下步骤:
[0063] 在监测到主屏处于通话模式时,开启语音采集模式采集语音信息;
[0064] 对采集到的语音信息进行识别,以确定采集到的语音信息是否涉及联系人信息;
[0065] 若确认采集到的语音信息涉及联系人信息,则确定涉及的联系人信息对应的通讯应用软件;
[0066] 唤醒辅屏,并在辅屏启动确定的通讯应用软件。
[0067] 进一步地,所述双面屏终端控制程序被所述处理器110执行时还实现以下步骤:
[0068] 对采集到的语音信息进行关键词识别;
[0069] 将识别出的关键词与预存关键词库进行比对;
[0070] 若在预存关键词库中,比对到与识别出的关键词匹配的预存关键词,则确认采集到的语音信息涉及联系人信息。
[0071] 进一步地,所述双面屏终端控制程序被所述处理器110执行时还实现以下步骤:
[0072] 对采集到的语音信息进行预处理;
[0073] 对预处理后的语音信息进行特征提取;
[0074] 将提取的特征输入预设声学模型,分析采集到的语音信息,以识别出关键词。
[0075] 进一步地,所述双面屏终端控制程序被所述处理器110执行时还实现以下步骤:
[0076] 基于预存关键词库中,预存关键词与通讯应用软件的映射关系,确定识别出的关键词对应的通讯应用软件,作为涉及的联系人信息对应的通讯应用软件。
[0077] 进一步地,所述双面屏终端控制程序被所述处理器110执行时还实现以下步骤:
[0078] 建立声学模型。
[0079] 进一步地,所述双面屏终端控制程序被所述处理器110执行时还实现以下步骤:
[0080] 获取训练样本,所述训练样本为用于训练声学模型的语音信息;
[0081] 根据所述训练样本,采用深度学习方法训练得到基于深度神经网络的声学模型。
[0082] 进一步地,所述双面屏终端控制程序被所述处理器110执行时还实现以下步骤:
[0083] 根据所述训练样本训练隐马尔科夫模型和高斯混合模型;
[0084] 根据所述训练样本,以及训练好的隐马尔科夫模型和高斯混合模型,训练得到基于深度神经网络的声学模型。
[0085] 进一步地,所述双面屏终端控制程序被所述处理器110执行时还实现以下步骤:
[0086] 确定在预设时长阈值内是否侦测到用户基于辅屏的触控操作;
[0087] 若在预设时长阈值内未侦测到用户基于辅屏的触控操作,则熄灭辅屏。
[0088] 为了便于理解本发明实施例,下面对本发明的移动终端所基于的通信网络系统进行描述。
[0089] 请参阅图2,图2为本发明实施例提供的一种通信网络系统架构图,该通信网络系统为通用移动通信技术的LTE系统,该LTE系统包括依次通讯连接的UE(User Equipment,用
户设备)201,E‑UTRAN(Evolved UMTS Terrestrial Radio Access Network,演进式UMTS陆
地无线接入网)202,EPC(Evolved Packet Core,演进式分组核心网)203和运营商的IP业务
204。
[0090] 具体地,UE201可以是上述终端100,此处不再赘述。
[0091] E‑UTRAN202包括eNodeB2021和其它eNodeB2022等。其中,eNodeB2021可以通过回程(backhaul)(例如X2接口)与其它eNodeB2022连接,eNodeB2021连接到EPC203,
eNodeB2021可以提供UE201到EPC203的接入。
[0092] EPC203可以包括MME(Mobility Management Entity,移动性管理实体)2031,HSS(Home Subscriber Server,归属用户服务器)2032,其它MME2033,SGW(Serving Gate Way,
服务网关)2034,PGW(PDN Gate Way,分组数据网络网关)2035和PCRF(Policy and 
Charging Rules Function,政策和资费功能实体)2036等。其中,MME2031是处理UE201和
EPC203之间信令的控制节点,提供承载和连接管理。HSS2032用于提供一些寄存器来管理诸
如归属位置寄存器(图中未示)之类的功能,并且保存有一些有关服务特征、数据速率等用
户专用的信息。所有用户数据都可以通过SGW2034进行发送,PGW2035可以提供UE 201的IP
地址分配以及其它功能,PCRF2036是业务数据流和IP承载资源的策略与计费控制策略决策
点,它为策略与计费执行功能单元(图中未示)选择及提供可用的策略和计费控制决策。
[0093] IP业务204可以包括因特网、内联网、IMS(IP Multimedia Subsystem,IP多媒体子系统)或其它IP业务等。
[0094] 虽然上述以LTE系统为例进行了介绍,但本领域技术人员应当知晓,本发明不仅仅适用于LTE系统,也可以适用于其他无线通信系统,例如GSM、CDMA2000、WCDMA、TD‑SCDMA以
及未来新的网络系统等,此处不做限定。
[0095] 基于上述终端硬件结构以及通信网络系统,提出本发明双面屏终端控制方法各个实施例。
[0096] 本发明提供一种双面屏终端控制方法。
[0097] 参照图3,图3为本发明双面屏终端控制方法第一实施例的流程示意图。
[0098] 在本实施例中,所述双面屏终端控制方法可选应用于双面屏终端中,所述双面屏终端包括主屏和辅屏,所述双面屏终端控制方法包括以下步骤:
[0099] 步骤S10,在监测到主屏处于通话模式时,开启语音采集模式采集语音信息;
[0100] 在本实施例中,双面屏终端的主屏配置有听筒和麦克风,来电处理在主屏中进行,当用户通过主屏进行通话时,辅屏处于熄屏状态。目前,用户通过主屏进行通话时,如果对
方询问某个联系人的联系方式,用户需先点亮屏幕,再把通话界面切换至后台,然后打开询
问的联系方式所在的应用软件进行查找,结束通话时还需将通话界面切换至前台再进行挂
断操作,操作步骤过于繁琐。对此,本实施例提出一种双面屏终端控制方法,以提高用户通
话时查找联系人信息的便捷性。
[0101] 在本实施例中,双面屏终端安装有通讯应用软件,通讯应用软件包括但不限于电话应用、微信应用、QQ应用等。用户可以进入电话应用的设置界面预先为通话模式设置语音
采集权限,以在双面屏终端处于通话模式时调用麦克风开启语音采集模式。
[0102] 首先,当双面屏终端监测到主屏处于通话模式时,开启语音采集模式采集语音信息,即,双面屏终端在监测到主屏处于通话模式时调用麦克风采集语音信息。
[0103] 步骤S20,对采集到的语音信息进行识别,以确定采集到的语音信息是否涉及联系人信息;
[0104] 在采集到语音信息之后,双面屏终端对采集到的语音信息进行识别,以判断采集到的语音信息是否涉及联系人信息。具体地,参照图4,步骤S20可以包括:
[0105] 步骤S21,对采集到的语音信息进行关键词识别;
[0106] 步骤S22,将识别出的关键词与预存关键词库进行比对;
[0107] 步骤S23,若在预存关键词库中,比对到与识别出的关键词匹配的预存关键词,则确认采集到的语音信息涉及联系人信息。
[0108] 双面屏终端对采集到的语音信息进行识别的方式,是对采集到的语音信息进行关键词识别。在本实施例中,在对采集到的语音信息进行关键词识别之前,先建立关键词库,
建立关键词库的方式,是双面屏终端通过系统设置界面接收用户输入的与联系人信息相关
的关键词,例如电话号码、微信号码、QQ号码等,然后将用户输入的关键词与对应的通讯应
用软件进行关联存储,例如将电话号码与电话应用进行关联存储、将微信号码与微信应用
进行关联存储、将QQ号码与QQ应用进行关联存储等,由此,基于关联存储的关键词和通讯应
用软件,即可建立关键词库。
[0109] 所述对采集到的语音信息进行关键词识别的步骤包括:
[0110] 对采集到的语音信息进行预处理;
[0111] 对预处理后的语音信息进行特征提取;
[0112] 将提取的特征输入预设声学模型,分析采集到的语音信息,以识别出关键词。
[0113] 即,双面屏终端首先对采集到的语音信息进行VAD检测(Voice Activity Detection,语音端点检测,又称语音活动检测),对采集到的语音信息进行VAD检测,能够区
分语音信息中的语音和非语音(背景噪音),之后,截取语音信息中的语音,对截取出的语音
进行特征提取,提取出反映语音特征的关键特征参数形成特征矢量序列,其中,该关键特征
参数为MFCC(Mel Frequency Cepstrum Coefficient,梅尔频率倒谱系数)。具体地,用长度
约为10ms的帧去分割截取出的语音,然后从每帧中提取出MFCC特征,组成特征向量。将提取
出的特征输入预设声学模型,即可识别出关键词。
[0114] 双面屏终端在识别出关键词之后,则将识别出的关键词与预存关键词库进行比对,即,查找预存关键词库,判断预存关键词库中是否存在与识别出的关键词相匹配的预存
关键词,如果预存关键词库中存在与识别出的关键词相匹配的预存关键词,则说明识别出
的关键词与联系人信息相关,可以确认采集到的语音信息涉及联系人信息,也就是可以确
认对方在与用户通话时有询问某个联系人信息。
[0115] 步骤S30,若确认采集到的语音信息涉及联系人信息,则确定涉及的联系人信息对应的通讯应用软件;
[0116] 双面屏终端如果确认采集到的语音信息涉及联系人信息,则进一步确定涉及的联系人信息对应的通讯应用软件。具体地,步骤S30,可以包括:
[0117] 基于预存关键词库中,预存关键词与通讯应用软件的映射关系,确定识别出的关键词对应的通讯应用软件,作为涉及的联系人信息对应的通讯应用软件。
[0118] 即,在本实施例中,双面屏终端如果确认采集到的语音信息涉及联系人信息,则基于预存关键词库中与识别出的关键词相匹配的预存关键词,结合预存关键词库中预存关键
词与通讯应用软件的映射关系,即可确定识别出的关键词对应的通讯应用软件,最终将该
确定的通讯应用软件,作为通话的语音信息中涉及的联系人信息所对应的通讯应用软件。
[0119] 步骤S40,唤醒辅屏,并在辅屏启动确定的通讯应用软件。
[0120] 双面屏终端在确定通话中涉及的联系人信息所对应的通讯应用软件之后,则唤醒辅屏,并在辅屏启动确定的通讯应用软件,供用户直接在打开的通讯应用软件中,查找通话
时对方询问的联系人信息,比如通话中对方询问的是某个共同好友的微信号码,双面屏终
端则在辅屏启动微信应用,此处可参照图5,图5为通话时双面屏终端在辅屏启动微信应用
的场景示意图,由此,避免用户将通话界面切换至后台再进入通讯应用软件的操作,且在通
话结束时,也不必将通话界面切换至前台再进行挂断操作,可以充分发挥双面屏优势,简化
操作,从而提高了用户体验。
[0121] 在本实施例中,所述方法还包括:
[0122] 步骤S50,确定在预设时长阈值内是否侦测到用户基于辅屏的触控操作;
[0123] 步骤S60,若在预设时长阈值内未侦测到用户基于辅屏的触控操作,则熄灭辅屏。
[0124] 双面屏终端在唤醒辅屏,并在辅屏启动确定的通讯应用软件之后,侦测用户基于辅屏的触控操作,如果在预设时长阈值内(比如20S内)未侦测到用户基于辅屏的触控操作,
则熄灭辅屏,可避免用户未进行查找联系人的操作时,辅屏一直亮屏,消耗双面屏终端电量
的情况。
[0125] 在本实施例中,在监测到主屏处于通话模式时,开启语音采集模式采集语音信息;对采集到的语音信息进行识别,以确定采集到的语音信息是否涉及联系人信息;若确认采
集到的语音信息涉及联系人信息,则确定涉及的联系人信息对应的通讯应用软件;唤醒辅
屏,并在辅屏启动确定的通讯应用软件。通过上述方式,用户在通话过程中,若对方向用户
询问某个联系人的信息,双面屏终端则直接在辅屏启动相应的通讯应用软件供用户查找,
可避免用户将通话界面切换至后台再进入通讯应用软件的操作,充分发挥了双面屏优势,
提高了便捷性,从而提升了用户体验。
[0126] 进一步地,基于第一实施例提出本发明双面屏终端控制方法的第二实施例。
[0127] 双面屏终端控制方法的第二实施例与双面屏终端控制方法的第一实施例的区别在于,所述步骤S21之前,可以包括:
[0128] S50,建立声学模型。
[0129] 其中,步骤S50,可以包括:
[0130] 获取训练样本,所述训练样本为用于训练声学模型的语音信息;
[0131] 根据所述训练样本,采用深度学习方法训练得到基于深度神经网络的声学模型。
[0132] 在本实施例中,为对用户通话中的语音信息进行关键词识别,双面屏终端需预先建立声学模型。首先获取训练样本,该训练样本为用于训练基于深度神经网络的声学模型
的语音信息,然后根据该训练样本,采用深度学习方法训练得到基于深度神经网络的声学
模型。具体地,所述根据所述训练样本,采用深度学习方法训练得到基于深度神经网络的声
学模型的步骤,可以包括:
[0133] 根据所述训练样本训练隐马尔科夫模型和高斯混合模型;
[0134] 根据所述训练样,以及训练好的隐马尔科夫模型和高斯混合模型,训练得到基于深度神经网络的声学模型。
[0135] 即,根据训练样本训练隐马尔科夫模型(HMM)和高斯混合模型(GMM),再基于HMM模型和GMM模型进行声学模型建模。训练HMM模型的过程,采用了前向后向算法(Baum‑Welch算
法):
[0136] E(estimate)‑step:给定observation序列,估计时刻t处于状态sj的概率;
[0137] M(maximization)‑step:根据该概率重新估计HMM参数。
[0138] 训练GMM模型的过程,采用了EM(期望最大化)算法:
[0139] E(estimate)‑step:根据当前参数(means,variances,mixing parameters)估计P(j|x);
[0140] M(maximization)‑step:根据当前P(j|x)计算GMM参数。
[0141] 训练中在整个训练集上对参数进行迭代地更新,直至收敛,得到最终参数,HMM模型和GMM模型即训练完成。需要说明的是,HMM模型和GMM模型的训练速度较快,且HMM模型和
GMM模型参数量小,可以容易地嵌入到双面屏终端中。
[0142] 之后,基于训练好的隐马尔科夫模型和高斯混合模型,对训练样本进行起始帧和结束帧对齐处理,然后构建深度神经网络模型,基于处理后的训练样本,训练深度神经网络
模型,得到基于深度神经网络的声学模型。
[0143] 在本实施例中,双面屏终端需预先建立声学模型,以对用户通话中的语音信息进行关键词识别,能够提高语音信息识别的识别速度和准确度。
[0144] 此外,本发明实施例还提出一种计算机可读存储介质。
[0145] 本发明计算机可读存储介质上存储有双面屏终端控制程序,所述双面屏终端控制程序被处理器执行时实现如下步骤:
[0146] 在监测到主屏处于通话模式时,开启语音采集模式采集语音信息;
[0147] 对采集到的语音信息进行识别,以确定采集到的语音信息是否涉及联系人信息;
[0148] 若确认采集到的语音信息涉及联系人信息,则确定涉及的联系人信息对应的通讯应用软件;
[0149] 唤醒辅屏,并在辅屏启动确定的通讯应用软件。
[0150] 进一步地,所述双面屏终端控制程序被处理器执行时还实现如下步骤:
[0151] 对采集到的语音信息进行关键词识别;
[0152] 将识别出的关键词与预存关键词库进行比对;
[0153] 若在预存关键词库中,比对到与识别出的关键词匹配的预存关键词,则确认采集到的语音信息涉及联系人信息。
[0154] 进一步地,所述双面屏终端控制程序被处理器执行时还实现如下步骤:
[0155] 对采集到的语音信息进行预处理;
[0156] 对预处理后的语音信息进行特征提取;
[0157] 将提取的特征输入预设声学模型,分析采集到的语音信息,以识别出关键词。
[0158] 进一步地,所述双面屏终端控制程序被处理器执行时还实现如下步骤:
[0159] 基于预存关键词库中,预存关键词与通讯应用软件的映射关系,确定识别出的关键词对应的通讯应用软件,作为涉及的联系人信息对应的通讯应用软件。
[0160] 进一步地,所述双面屏终端控制程序被处理器执行时还实现如下步骤:
[0161] 建立声学模型。
[0162] 进一步地,所述双面屏终端控制程序被处理器执行时还实现如下步骤:
[0163] 获取训练样本,所述训练样本为用于训练声学模型的语音信息;
[0164] 根据所述训练样本,采用深度学习方法训练得到基于深度神经网络的声学模型。
[0165] 进一步地,所述双面屏终端控制程序被处理器执行时还实现如下步骤:
[0166] 根据所述训练样本训练隐马尔科夫模型和高斯混合模型;
[0167] 根据所述训练样本,以及训练好的隐马尔科夫模型和高斯混合模型,训练得到基于深度神经网络的声学模型。
[0168] 进一步地,所述双面屏终端控制程序被处理器执行时还实现如下步骤:
[0169] 确定在预设时长阈值内是否侦测到用户基于辅屏的触控操作;
[0170] 若在预设时长阈值内未侦测到用户基于辅屏的触控操作,则熄灭辅屏。
[0171] 其中,在所述处理器上运行的双面屏终端控制程序被执行时所实现的方法可参照本发明双面屏终端控制方法各个实施例,此处不再赘述。
[0172] 需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而
且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有
的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该
要素的过程、方法、物品或者系统中还存在另外的相同要素。
[0173] 上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
[0174] 通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下
前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做
出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质
(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服
务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
[0175] 以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技
术领域,均同理包括在本发明的专利保护范围内。