信息处理方法、装置、终端设备及存储介质转让专利

申请号 : CN201710866985.X

文献号 : CN107613392B

文献日 : 2019-09-27

相似专利: 请登录后查看

本申请实施例公开了一种信息处理方法、装置、终端设备及存储介质，该方法获取和直播内容关联的数据信息，依据所述数据信息确定所述直播内容对应的筛选数据集；获取当前准备显示的弹幕数据，依据所述筛选数据集对所述弹幕数据进行筛选得到弹幕信息；将所述弹幕信息显示在终端设备中。本方案使得终端设备显示信息的效率提高，显示信息的内容针对性更强，减少了无用信息对用户的干扰。

1.一种信息处理方法，其特征在于，包括：

获取和直播内容关联的数据信息，依据所述数据信息确定所述直播内容对应的筛选数据集；

获取当前准备显示的弹幕数据，依据所述筛选数据集对所述弹幕数据进行筛选得到弹幕信息，其中，所述当前准备显示的弹幕数据包括服务器发送的采集的其它终端设备上传的弹幕数据；

将所述弹幕信息显示在终端设备中；

其中，所述依据所述数据信息确定所述直播内容对应的筛选数据集包括：

依据所述数据信息以及存储的映射关系表确定和所述直播内容对应的筛选数据集，其中，所述映射关系表记录了不同主题以及所述主题对应的一个或多个关键词；

相应的，在所述依据所述数据信息以及存储的映射关系表确定和所述直播内容对应的筛选数据集之前，还包括：对历史直播内容和与所述历史直播内容对应的历史弹幕信息进行记录，并对所述历史弹幕信息中的文字内容的频率进行统计，将频率大于预设阈值的文字内容保留，将保留的文字内容作为训练完毕的机器模型的输入，获得所述机器模型输出的关键词，将所述历史直播内容作为主题与所述关键词进行关联以生成映射关系表。

2.根据权利要求1所述的方法，其特征在于，所述获取和直播内容关联的数据信息，依据所述数据信息确定所述直播内容对应的筛选数据集包括：通过预设接口获取直播内容对应的直播主题、直播公告和直播板块类别，依据所述直播主题、所述直播公告和所述直播板块类别确定所述直播内容对应的筛选数据集。

3.根据权利要求1所述的方法，其特征在于，所述获取和直播内容关联的数据信息，依据所述数据信息确定所述直播内容对应的筛选数据集包括：获取终端设备显示的直播画面，对所述直播画面进行图像识别，依据图像识别结果确定所述直播内容对应的筛选数据集。

4.根据权利要求1所述的方法，其特征在于，所述获取和直播内容关联的数据信息，依据所述数据信息确定所述直播内容对应的筛选数据集包括：获取终端设备播放的声音信息，对所述声音信息进行语音识别，依据语音识别结果确定所述直播内容对应的筛选数据集。

5.根据权利要求1-4中任一项所述的方法，其特征在于，所述依据所述筛选数据集对所述弹幕数据进行筛选得到弹幕信息包括：依据所述弹幕数据确定各自对应的主题信息，依据所述主题信息以及所述筛选数据集中记录的主题内容对所述弹幕数据进行筛选得到弹幕信息。

6.根据权利要求1-4中任一项所述的方法，其特征在于，所述将所述弹幕信息显示在终端设备中包括：将所述弹幕信息按照预设格式显示在终端设备中，所述预设格式包括弹幕颜色、弹幕透明度、弹幕字体大小、弹幕持续时间和弹幕移动速度中的至少一种。

7.一种信息处理装置，其特征在于，包括：

获取模块，用于获取和直播内容关联的数据信息；

数据集确定模块，用于依据所述数据信息确定所述直播内容对应的筛选数据集，所述依据所述数据信息确定所述直播内容对应的筛选数据集包括：依据所述数据信息以及存储的映射关系表确定和所述直播内容对应的筛选数据集，其中，所述映射关系表记录了不同主题以及所述主题对应的一个或多个关键词，相应的，在所述依据所述数据信息以及存储的映射关系表确定和所述直播内容对应的筛选数据集之前，还包括：对历史直播内容和与所述历史直播内容对应的历史弹幕信息进行记录，并对所述历史弹幕信息中的文字内容的频率进行统计，将频率大于预设阈值的文字内容保留，将保留的文字内容作为训练完毕的机器模型的输入，获得所述机器模型输出的关键词，将所述历史直播内容作为主题与所述关键词进行关联以生成映射关系表；

筛选模块，用于获取当前准备显示的弹幕数据，依据所述筛选数据集对所述弹幕数据进行筛选得到弹幕信息，其中，当前准备显示的弹幕数据包括服务器发送的采集的其它终端设备上传的弹幕数据；

显示模块，用于将所述弹幕信息显示在终端设备中。

8.一种终端设备，包括：处理器、存储器以及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1-6中任一项所述的信息处理方法。

9.一种包含终端设备可执行指令的存储介质，其特征在于，所述终端设备可执行指令在由终端设备处理器执行时用于执行如权利要求1-6中任一项所述的信息处理方法。

信息处理方法、装置、终端设备及存储介质

技术领域

[0001] 本申请实施例涉及计算机技术，尤其涉及一种信息处理方法、装置、终端设备及存储介质。

背景技术

[0002] 随着终端设备普及程度的提高，越来越多的用户使用终端设备执行各种各样的功能以满足自身需求，如使用终端设备阅读文字、观看视频、听音乐、玩游戏等。当用户在使用终端设备看视频(如电影、电视剧)、直播内容或听音乐时，为了增加用户的参与度以及提升用户的使用体验，会在终端设备屏幕上同步显示弹幕信息，该弹幕信息为观看该视频、直播内容或听同一音乐时用户输入的个性化内容。

[0003] 现有技术中，对弹幕等用户输入的个性化内容的处理存在缺陷，需要改进。

发明内容

[0004] 本发明提供了一种信息处理方法、装置、终端设备及存储介质，使得终端设备显示信息的效率提高，显示信息的内容针对性更强，减少了无用信息对用户的干扰。

[0005] 第一方面，本申请实施例提供了一种信息处理方法，包括：

[0006] 获取和直播内容关联的数据信息，依据所述数据信息确定所述直播内容对应的筛选数据集；

[0007] 获取当前准备显示的弹幕数据，依据所述筛选数据集对所述弹幕数据进行筛选得到弹幕信息；

[0008] 将所述弹幕信息显示在终端设备中。

[0009] 第二方面，本申请实施例还提供了一种信息处理装置，包括：

[0010] 获取模块，用于获取和直播内容关联的数据信息；

[0011] 数据集确定模块，用于依据所述数据信息确定所述直播内容对应的筛选数据集；

[0012] 筛选模块，用于获取当前准备显示的弹幕数据，依据所述筛选数据集对所述弹幕数据进行筛选得到弹幕信息；

[0013] 显示模块，用于将所述弹幕信息显示在终端设备中。

[0014] 第三方面，本申请实施例还提供了一种终端设备，包括：处理器、存储器以及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如本申请实施例所述的信息处理方法。

[0015] 第四方面，本申请实施例还提供了一种包含终端设备可执行指令的存储介质，所述终端设备可执行指令在由终端设备处理器执行时用于执行本申请实施例所述的信息处理方法。

[0016] 本方案依据获取的和直播内容关联的数据信息进行筛选数据集的确定，并依据该确定出的筛选数据集对将要显示的弹幕进行过滤，使得终端设备显示信息的效率提高，显示信息的内容针对性更强，减少了无用信息对用户的干扰。

附图说明

[0017] 通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

[0018] 图1是本申请实施例提供的一种信息处理方法的流程图；

[0019] 图2是本申请实施例提供的另一种信息处理方法的流程图；

[0020] 图3是本申请实施例提供的另一种信息处理方法的流程图；

[0021] 图4是本申请实施例提供的另一种信息处理方法的流程图；

[0022] 图5是本申请实施例提供的一种信息处理装置的结构框图；

[0023] 图6是本申请实施例提供的一种终端设备的结构示意图。

具体实施方式

[0024] 下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

[0025] 图1是本申请实施例提供的一种信息处理方法的流程图，本实施例可适用于用户使用终端设备观看视频、音频、直播内容时终端设备显示信息的情况，该方法可以由本申请实施例提供的终端设备来执行，该终端设备的信息处理装置可采用软件和/或硬件的方式实现，如图1所示，本实施例提供的具体方案如下：

[0026] 步骤S101、获取和直播内容关联的数据信息，依据所述数据信息确定所述直播内容对应的筛选数据集。

[0027] 当用户使用终端设备(智能手机、平板电脑、台式电脑)进行视频(电影、电视剧)、音频(歌曲)或者观看直播时，在终端设备的显示界面会实时(延时)显示自己以及网友发送的弹幕，用户通过阅读、发送弹幕使得自身的参与性显著增强。由于弹幕内容的随机性以及不同人群的不同观点使得弹幕内容并不一定是用户需要的，针对单一用户而言，可能存在大量无用弹幕，不利于用户的观感，也不利于用户找到自己想要看到的弹幕。

[0028] 在一个实施例中，在终端设备显示弹幕之前，获取和直播内容关联的数据信息，依据所述数据信息确定所述直播内容对应的筛选数据集。其中，和直播内容关联的数据信息包括直播主题、直播公告、直播板块类别、直播画面以及直播过程中的声音信息等。其中，直播主题、直播公告和直播板块类别可通过预设接口获取；该直播画面为直播过程中终端设备显示的画面内容，可采取截屏方式获取，还可以对服务器推送过来的直播视频流进行解码得到每一帧的画面图像数据流，进而确定直播画面内容；该声音信息可通过采集终端设备扬声器发出的声音信息获取或者对服务器推送的音频流文件进行解析得到。当获取到直播内容关联的数据信息后，依据所述数据信息确定所述直播内容对应的筛选数据集。

[0029] 在一个实施例中，依据数据信息确定直播内容对应的筛选数据集包括：依据所述数据信息以及存储的映射关系表确定和所述直播内容对应的筛选数据集。示例性的，可对数据信息中记录的内容进行关键词提取得到多个关键词，根据提取出的多个关键词以及映射关系表确定和直播内容对应的筛选数据集。其中，映射关系表记录有不同关键词对应的主题内容，该主题内容可以包括不同的生活主题，如运动类、饮食类、出行类；该主题内容还可以包括不同的职业主题，如律师类、程序员类、文案类；该主题内容还可以包括不同的年龄主题，如儿童类、青年类、成年类、老年类等；该主题内容还可以包括不同的地域主题，如北京、上海、广州、河北、山西等。其中，映射关系表中记录了不同主题以及各自对应的一个或多个关键词，示例性的，如下表所示：

[0030] 表1

[0031]主题1 关键词A1 关键词B1 关键词C1 ......
主题2 关键词A2 关键词B2 关键词C2 ......
主题3 关键词A3 关键词B3 关键词C3 ......
........... ........... ........... ........... ......

[0032] 其中，依据直播内容关联的数据信息确定对应的关键词后可通过上述映射关系表以确定数据信息对应的一个或多个主题作为筛选数据集，即筛选数据集依据特定的直播内容产生，包含符合直播内容的一个或多个主题。在一个实施例中，依据直播内容关联的数据信息确定对应的关键词包括：将所述数据信息作为输入，输入到训练得到的机器学习模型中以输出表征直播内容的关键词。示例性的，当直播内容关联的数据信息为直播公告时，例如直播公告为“童装展览秀”，通过该机器学习模型可以得到对应的关键词包括儿童，进而确定出筛选数据集中的主题包括儿童类。其中，该机器学习模型可由监督式学习、非监督式学习、半监督式学习或强化学习得到，学习过程中使用的算法包括：回归算法、基于实例的算法、正则化算法、决策树算法、贝叶斯算法、基于核的算法、聚类算法、关联规则算法、人工神经网络算法、深度学习算法以及降低维度算法等。在一个实施例中，映射关系表可由服务器生成后发送至终端设备进行存储，以使终端设备依据用户关联的数据信息确定对应的筛选数据集，示例性的，该映射关系表由服务器通过对大量数据样本进行学习得到，通过学习训练建立各个主题以及每个主题对应的一个或多个关键词。

[0033] 步骤S102、获取当前准备显示的弹幕数据，依据所述筛选数据集对所述弹幕数据进行筛选得到弹幕信息。

[0034] 其中，当前准备显示的弹幕数据包括服务器发送的采集的其它终端设备上传的弹幕数据，不同用户可在使用终端设备过程中输入弹幕数据，以上传至服务器，服务器在播放对应的音视频过程中可实时或分时的将弹幕数据下发至观看该音视频信息的终端设备中以进行弹幕数据的显示。在一个实施例中，当确定和直播内容对应的筛选数据集后，获取当前准备显示的弹幕数据，其中，该弹幕数据可以是在音视频资源下载过程中同步下载得到。

[0035] 当获取到预显示的弹幕数据后，依据确定出的筛选数据集对准备显示的弹幕数据进行筛选，在一个实施例中，在依据所述筛选数据集对所述弹幕数据进行筛选得到弹幕信息之前，还包括：检测智能筛选事件是否被触发，如果是，则依据确定出的筛选数据集对准备显示的弹幕数据进行筛选。其中，该智能筛选事件可通过接收用户对预设按钮的点击操作触发。在另一个实施例中，在依据所述筛选数据集对所述弹幕数据进行筛选得到弹幕信息之前，还包括：检测准备显示的弹幕数据的数据量，当数据量大于预设数据量时，依据确定出的筛选数据集对准备显示的弹幕数据进行筛选。其中，该预设数据量可以是单位时间如3秒、5秒或8秒内终端设备屏幕显示的弹幕数量，如5秒内需要显示100条弹幕数据，则依据确定出的筛选数据集对准备显示的弹幕数据进行筛选。

[0036] 在一个实施例中，依据所述筛选数据集对所述弹幕数据进行筛选得到弹幕信息包括：去除弹幕数据中匹配到的筛选数据集中需要去除的数据内容。示例性的，筛选数据集中可以记录有需要去除的弹幕数据的特征关键词，当检测到准备显示的弹幕数据包含该特征关键词时，对该条弹幕数据进行删除。其中，特征关键词可以是不良用语。筛选数据集中还可以记录有需要去除的弹幕数据的特征主题，对准备显示的每条弹幕数据进行特征提取，以确定是否满足筛选数据集中的特征主题，如准备显示的弹幕数据中存在一条弹幕数据为“666666”，则对该条弹幕进行特征提取得到其为一条重复数字字符的弹幕数据，如果筛选数据集中存在重复数字字符的特征主题，则对该条弹幕进行去除，不进行弹幕显示。

[0037] 在另一个实施例中，所述依据所述筛选数据集对所述弹幕数据进行筛选得到弹幕信息包括：依据所述弹幕数据确定各自对应的主题信息，依据所述主题信息以及所述筛选数据集中记录的主题内容对所述弹幕数据进行筛选得到弹幕信息。示例性的，当前准备显示的弹幕数据由n条，其中，将每一条弹幕数据作为机器学习训练模型的输入，相应的得到各自的主题信息作为输出，该机器学习训练模型可以是由服务器经过大量样本进行训练学习得到，可由监督式学习、非监督式学习、半监督式学习或强化学习得到，学习过程中使用的算法包括：回归算法、基于实例的算法、正则化算法、决策树算法、贝叶斯算法、基于核的算法、聚类算法、关联规则算法、人工神经网络算法、深度学习算法以及降低维度算法等。当确定出每条弹幕数据对应的主题信息后，查询筛选数据集进行主题信息和筛选数据集中记录的主题内容的匹配，将匹配成功的弹幕数据筛选出来组成弹幕信息以进行显示。

[0038] 在一个实施例中，在所述依据所述数据信息以及存储的映射关系表确定和所述直播内容对应的筛选数据集之前，还包括：依据历史直播内容和对应的历史弹幕信息确定映射关系表，并进行存储。该实施例中，对历史直播内容和其对应的历史弹幕信息进行记录，并对历史弹幕信息中出现的文字内容的频率进行统计，将频率大于预设阈值(如频率大于20％)的文字内容进行保留，将该文字内容作为训练完毕的机器模型(模型训练过程如前所述，此处不再赘述)的输入，输出对应的关键词，将该关键词和对应的直播内容进行关联以生成映射关系表。

[0039] 在另一个实施例中，在所述依据所述数据信息以及存储的映射关系表确定和所述直播内容对应的筛选数据集之前，还包括：依据屏幕的显示信息以及用户的点选操作确定映射关系表，并进行存储。该实施例中，映射关系表的建立可依据用户的点选操作生成，示例性的，在未对弹幕数据进行筛选前，终端设备正常显示弹幕数据，当弹幕数据显示在触摸屏中时，用户可对自己感兴趣的弹幕进行点击，通过对用户点击的弹幕进行机器学习以生成映射关系表。举例而言，当用户在观看NBA直播时，显示屏幕中显示了一条关于“乔丹”的弹幕，如用户对篮球明星乔丹的事件非常关注，则可点击该条弹幕信息，此时相应的在后台对该点击事件进行处理，生成/添加关键词“乔丹”至映射关系表中，并相应的映射至“篮球”/“运动”主题。

[0040] 步骤S103、将所述弹幕信息显示在终端设备中。

[0041] 当用户在使用终端设备观看音视频时，弹幕信息会随着音视频的播放在显示屏中进行相应显示。在一个实施例中，对未处理的准备显示的弹幕数据进行筛选得到弹幕信息，将该弹幕信息按照预设格式显示在终端设备中，未被筛选出的弹幕数据按照正常显示情况进行显示，预设格式包括弹幕颜色、弹幕透明度、弹幕字体大小、弹幕持续时间和弹幕移动速度中的至少一种。在一个实施例中，预设格式为弹幕颜色时，将筛选出的弹幕信息设置为鲜艳颜色(如黄色、绿色、红色)进行显示；预设格式为弹幕透明度时，将未被筛选出的弹幕设置为透明，筛选出的弹幕信息透明度设置为0，即不进行透明设置；预设格式为字体大小时，将筛选出的弹幕信息字体设置为未被筛选出的弹幕的字体的1.5倍；预设格式为弹幕持续时间时，将筛选出的弹幕信息持续时间设置为未被筛选出的弹幕的字体的2倍；预设格式为弹幕移动速度时，将筛选出的弹幕信息持续时间设置为未被筛选出的弹幕的移动速度一半，即筛选出的弹幕信息的移动速度慢于未被筛选出的弹幕数据。通过上述设置，将符合当前直播主题的弹幕内容突出显示，使得筛选出的弹幕信息显示效果更为突出，便于用户阅读。

[0042] 由上述内容可知，在用户在观看直播时，和直播主题相关的弹幕被突出显示或者将无关弹幕内容在显示之前进行滤出，使得用户终端设备显示信息的效率提高，显示信息的内容针对性更强，减少了无用信息对用户的干扰。

[0043] 图2是本申请实施例提供的另一种信息处理方法的流程图，可选的，所述获取和直播内容关联的数据信息，依据所述数据信息确定所述直播内容对应的筛选数据集包括：通过预设接口获取直播内容对应的直播主题、直播公告和直播板块类别，依据所述直播主题、所述直播公告和所述直播板块类别确定所述直播内容对应的筛选数据集。如图2所示，技术方案具体如下：

[0044] 步骤S201、通过预设接口获取直播内容对应的直播主题、直播公告和直播板块类别。

[0045] 终端设备除了电话功能外，越来越多的用户开始使用终端设备观看直播内容，而直播内容的特色之一包括直播过程中观看用户之间的弹幕互动，通常直播内容包括直播的主题、直播公告以及直播板块类别等。在一个实施例中，当用户使用终端设备观看直播内容时，通过预设接口获取直播内容对应的直播主题、直播公告和直播板块类别，其中，该预设接口可以是设置的Android通用接口，还可以是设置添加的监听回调接口或者构造函数内部子接口。

[0046] 步骤S202、依据所述直播主题、所述直播公告和所述直播板块类别以及存储的映射关系表确定和所述直播内容对应的筛选数据集。

[0047] 在一个实施例中，可通过对直播主题和直播公告进行关键词提取，示例性的，可采用基于语义的统计语言模型、基于高维聚类的中文关键词提取算法或基于分离模型的中文关键词提取算法进行关键词提取，依据提取得到的关键词在映射关系表中记录的关键词进行匹配，还可以直接采用直播板块类别的名称进行关键词匹配，如果匹配成功，则将匹配到的映射关系表中关键词对应的主题作为筛选主题得到筛选数据集，以用于后续对弹幕数据进行筛选。

[0048] 步骤S203、获取当前准备显示的弹幕数据，依据所述弹幕数据确定各自对应的主题信息。

[0049] 步骤S204、依据所述主题信息以及所述筛选数据集中记录的主题内容对所述弹幕数据进行筛选得到弹幕信息。

[0050] 步骤S205、将所述弹幕信息按照预设格式显示在终端设备中。

[0051] 由上述可知，本方案在对弹幕数据进行筛选时，依据直播内容中的直播主题、直播公告以及直播板块类别作为确定筛选数据集的依据，其表征了直播内容涉及的核心，由此使得筛选出的弹幕更加符合直播内容，针对性更强，避免用户被大量无用弹幕干扰。

[0052] 图3是本申请实施例提供的另一种信息处理方法的流程图，可选的，所述获取和直播内容关联的数据信息，依据所述数据信息确定所述直播内容对应的筛选数据集包括：获取终端设备显示的直播画面，对所述直播画面进行图像识别，依据图像识别结果以及映射关系表确定所述直播内容对应的筛选数据集。如图3所示，技术方案具体如下：

[0053] 步骤S301、获取终端设备显示的直播画面，对所述直播画面进行图像识别。

[0054] 在一个实施例中，在终端设备直播过程中，每隔预设时间(如1分钟、5分钟或10分钟)对直播内容画面进行内容截取，对截取到的图像内容进行图像识别以得到此刻直播画面对应的关键词，如识别出直播画面为健身房，则相应的可确定出该直播画面对应的关键词为健身、运动；如识别出的画面为餐厅，则相应的可确定出该直播画面对应的关键词为美食。该实施例中使用的图像识别算法包括：卷积神经网络算法以及基于特征匹配的图像识别算法(ORB算法、SIFT算法)。在另一个实施例中，可依据接收到的服务器推送的信息流在后台生成对应的图像画面，该图像画面可隐藏显示在当前直播画面中，通过对该隐藏层的图像画面进行提取，进行图像识别以得到对应的关键词。

[0055] 步骤S302、依据图像识别结果以及映射关系表确定所述直播内容对应的筛选数据集。

[0056] 在一个实施例中，该映射关系表中记录有不同关键词对应的主题内容，依据提取得到的关键词与在映射关系表中记录的关键词进行匹配，如果匹配成功，则将匹配到的映射关系表中关键词对应的主题作为筛选主题得到筛选数据集，以用于后续对弹幕数据进行筛选。

[0057] 步骤S303、获取当前准备显示的弹幕数据，依据所述弹幕数据确定各自对应的主题信息。

[0058] 步骤S304、依据所述主题信息以及所述筛选数据集中记录的主题内容对所述弹幕数据进行筛选得到弹幕信息。

[0059] 步骤S305、将所述弹幕信息按照预设格式显示在终端设备中。

[0060] 由上述可知，通过对直播内容的直播画面进行图像识别，依据图像识别结果以及映射关系表确定筛选数据集，使得后续筛选出的弹幕信息与直播内容更加贴近，无用内容得到删除或非突出显示，便于用户在大量弹幕信息中阅读有用内容。

[0061] 图4是本申请实施例提供的另一种信息处理方法的流程图，可选的，所述获取和直播内容关联的数据信息，依据所述数据信息确定所述直播内容对应的筛选数据集包括：获取终端设备播放的声音信息，对所述声音信息进行语音识别，依据语音识别结果以及映射关系表确定所述直播内容对应的筛选数据集。如图4所示，技术方案具体如下：

[0062] 步骤S401、获取终端设备播放的声音信息，对所述声音信息进行语音识别。

[0063] 在一个实施例中，可通过对播放设备扬声器发出的声音进行采集，将采集到的模拟信号转化为数字信号以得到声音信息，在另一实施例中，还可以是通过对终端设备输出的准备播放的信息流进行采集、编解码以得到声音信息。对获取到的声音信息进行语音识别得到相应的文字信息，再对文字信息进行关键词提取得到声音信息对应的关键词。其中，使用到的语音识别算法包括：隐马尔科夫模型算法或动态时间规整算法，关键词提取可采用基于语义的统计语言模型、基于高维聚类的中文关键词提取算法或基于分离模型的中文关键词提取算法进行关键词提取。

[0064] 步骤S402、依据语音识别结果以及映射关系表确定所述直播内容对应的筛选数据集。

[0065] 在一个实施例中，该映射关系表中记录有不同关键词对应的主题内容，依据提取得到的关键词与在映射关系表中记录的关键词进行匹配，如果匹配成功，则将匹配到的映射关系表中关键词对应的主题作为筛选主题得到筛选数据集，以用于后续对弹幕数据进行筛选。

[0066] 步骤S403、获取当前准备显示的弹幕数据，依据所述弹幕数据确定各自对应的主题信息。

[0067] 步骤S404、依据所述主题信息以及所述筛选数据集中记录的主题内容对所述弹幕数据进行筛选得到弹幕信息。

[0068] 步骤S405、将所述弹幕信息按照预设格式显示在终端设备中。

[0069] 由上述可知，通过对直播过程中的声音信息进行识别，依据识别结果以及映射关系表确定筛选数据集，使得后续筛选出的弹幕信息与直播内容更加贴近，无用内容得到删除或非突出显示，而声音识别具备识别准确率高、实时性强的特点，使得筛选后的弹幕进一步提高了针对性。

[0070] 图5是本申请实施例提供的一种信息处理装置的结构框图，该装置用于执行上述实施例提供的信息处理方法，具备执行方法相应的功能模块和有益效果。如图5所示，该装置具体包括：获取模块101、数据集确定模块102、筛选模块103和显示模块104。

[0071] 其中，获取模块101用于获取和直播内容关联的数据信息，数据集确定模块102用于依据所述数据信息确定所述直播内容对应的筛选数据集。

[0072] 当用户使用终端设备(智能手机、平板电脑、台式电脑)进行视频(电影、电视剧)、音频(歌曲)或者观看直播时，在终端设备的显示界面会实时(延时)显示自己以及网友发送的弹幕，用户通过阅读、发送弹幕使得自身的参与性显著增强。由于弹幕内容的随机性以及不同人群的不同观点使得弹幕内容并不一定是用户需要的，针对单一用户而言，可能存在大量无用弹幕，不利于用户的观感，也不利于用户找到自己想要看到的弹幕。

[0073] 在一个实施例中，在终端设备显示弹幕之前，获取和直播内容关联的数据信息，依据所述数据信息确定所述直播内容对应的筛选数据集。其中，和直播内容关联的数据信息包括直播主题、直播公告、直播板块类别、直播画面以及直播过程中的声音信息等。其中，直播主题、直播公告和直播板块类别可通过预设接口获取；该直播画面为直播过程中终端设备显示的画面内容，可采取截屏方式获取，还可以对服务器推送过来的直播视频流进行解码得到每一帧的画面图像数据流，进而确定直播画面内容；该声音信息可通过采集终端设备扬声器发出的声音信息获取或者对服务器推送的音频流文件进行解析得到。当获取到直播内容关联的数据信息后，依据所述数据信息确定所述直播内容对应的筛选数据集。

[0074] 在一个实施例中，依据数据信息确定直播内容对应的筛选数据集包括：依据所述数据信息以及存储的映射关系表确定和所述直播内容对应的筛选数据集。示例性的，可对数据信息中记录的内容进行关键词提取得到多个关键词，根据提取出的多个关键词以及映射关系表确定和直播内容对应的筛选数据集。其中，映射关系表记录有不同关键词对应的主题内容，该主题内容可以包括不同的生活主题，如运动类、饮食类、出行类；该主题内容还可以包括不同的职业主题，如律师类、程序员类、文案类；该主题内容还可以包括不同的年龄主题，如儿童类、青年类、成年类、老年类等；该主题内容还可以包括不同的地域主题，如北京、上海、广州、河北、山西等。

[0075] 其中，依据直播内容关联的数据信息确定对应的关键词后可通过上述映射关系表以确定数据信息对应的一个或多个主题作为筛选数据集，即筛选数据集依据特定的直播内容产生，包含符合直播内容的一个或多个主题。在一个实施例中，依据直播内容关联的数据信息确定对应的关键词包括：将所述数据信息作为输入，输入到训练得到的机器学习模型中以输出表征直播内容的关键词。示例性的，当直播内容关联的数据信息为直播公告时，例如直播公告为“童装展览秀”，通过该机器学习模型可以得到对应的关键词包括儿童，进而确定出筛选数据集中的主题包括儿童类。其中，该机器学习模型可由监督式学习、非监督式学习、半监督式学习或强化学习得到，学习过程中使用的算法包括：回归算法、基于实例的算法、正则化算法、决策树算法、贝叶斯算法、基于核的算法、聚类算法、关联规则算法、人工神经网络算法、深度学习算法以及降低维度算法等。在一个实施例中，映射关系表可由服务器生成后发送至终端设备进行存储，以使终端设备依据用户关联的数据信息确定对应的筛选数据集，示例性的，该映射关系表由服务器通过对大量数据样本进行学习得到，通过学习训练建立各个主题以及每个主题对应的一个或多个关键词。

[0076] 筛选模块103，用于获取当前准备显示的弹幕数据，依据所述筛选数据集对所述弹幕数据进行筛选得到弹幕信息。

[0077] 其中，当前准备显示的弹幕数据包括服务器发送的采集的其它终端设备上传的弹幕数据，不同用户可在使用终端设备过程中输入弹幕数据，以上传至服务器，服务器在播放对应的音视频过程中可实时或分时的将弹幕数据下发至观看该音视频信息的终端设备中以进行弹幕数据的显示。在一个实施例中，当确定和直播内容对应的筛选数据集后，获取当前准备显示的弹幕数据，其中，该弹幕数据可以是在音视频资源下载过程中同步下载得到。

[0078] 当获取到预显示的弹幕数据后，依据确定出的筛选数据集对准备显示的弹幕数据进行筛选，在一个实施例中，在依据所述筛选数据集对所述弹幕数据进行筛选得到弹幕信息之前，还包括：检测智能筛选事件是否被触发，如果是，则依据确定出的筛选数据集对准备显示的弹幕数据进行筛选。其中，该智能筛选事件可通过接收用户对预设按钮的点击操作触发。在另一个实施例中，在依据所述筛选数据集对所述弹幕数据进行筛选得到弹幕信息之前，还包括：检测准备显示的弹幕数据的数据量，当数据量大于预设数据量时，依据确定出的筛选数据集对准备显示的弹幕数据进行筛选。其中，该预设数据量可以是单位时间如3秒、5秒或8秒内终端设备屏幕显示的弹幕数量，如5秒内需要显示100条弹幕数据，则依据确定出的筛选数据集对准备显示的弹幕数据进行筛选。

[0079] 在一个实施例中，依据所述筛选数据集对所述弹幕数据进行筛选得到弹幕信息包括：去除弹幕数据中匹配到的筛选数据集中需要去除的数据内容。示例性的，筛选数据集中可以记录有需要去除的弹幕数据的特征关键词，当检测到准备显示的弹幕数据包含该特征关键词时，对该条弹幕数据进行删除。其中，特征关键词可以是不良用语。筛选数据集中还可以记录有需要去除的弹幕数据的特征主题，对准备显示的每条弹幕数据进行特征提取，以确定是否满足筛选数据集中的特征主题，如准备显示的弹幕数据中存在一条弹幕数据为“666666”，则对该条弹幕进行特征提取得到其为一条重复数字字符的弹幕数据，如果筛选数据集中存在重复数字字符的特征主题，则对该条弹幕进行去除，不进行弹幕显示。

[0080] 在另一个实施例中，所述依据所述筛选数据集对所述弹幕数据进行筛选得到弹幕信息包括：依据所述弹幕数据确定各自对应的主题信息，依据所述主题信息以及所述筛选数据集中记录的主题内容对所述弹幕数据进行筛选得到弹幕信息。示例性的，当前准备显示的弹幕数据由n条，其中，将每一条弹幕数据作为机器学习训练模型的输入，相应的得到各自的主题信息作为输出，该机器学习训练模型可以是由服务器经过大量样本进行训练学习得到，可由监督式学习、非监督式学习、半监督式学习或强化学习得到，学习过程中使用的算法包括：回归算法、基于实例的算法、正则化算法、决策树算法、贝叶斯算法、基于核的算法、聚类算法、关联规则算法、人工神经网络算法、深度学习算法以及降低维度算法等。当确定出每条弹幕数据对应的主题信息后，查询筛选数据集进行主题信息和筛选数据集中记录的主题内容的匹配，将匹配成功的弹幕数据筛选出来组成弹幕信息以进行显示。

[0081] 在一个实施例中，在所述依据所述数据信息以及存储的映射关系表确定和所述直播内容对应的筛选数据集之前，还包括：依据历史直播内容和对应的历史弹幕信息确定映射关系表，并进行存储。该实施例中，对历史直播内容和其对应的历史弹幕信息进行记录，并对历史弹幕信息中出现的文字内容的频率进行统计，将频率大于预设阈值(如频率大于20％)的文字内容进行保留，将该文字内容作为训练完毕的机器模型(模型训练过程如前所述，此处不再赘述)的输入，输出对应的关键词，将该关键词和对应的直播内容进行关联以生成映射关系表。

[0082] 在另一个实施例中，在所述依据所述数据信息以及存储的映射关系表确定和所述直播内容对应的筛选数据集之前，还包括：依据屏幕的显示信息以及用户的点选操作确定映射关系表，并进行存储。该实施例中，映射关系表的建立可依据用户的点选操作生成，示例性的，在未对弹幕数据进行筛选前，终端设备正常显示弹幕数据，当弹幕数据显示在触摸屏中时，用户可对自己感兴趣的弹幕进行点击，通过对用户点击的弹幕进行机器学习以生成映射关系表。举例而言，当用户在观看NBA直播时，显示屏幕中显示了一条关于“乔丹”的弹幕，如用户对篮球明星乔丹的事件非常关注，则可点击该条弹幕信息，此时相应的在后台对该点击事件进行处理，生成/添加关键词“乔丹”至映射关系表中，并相应的映射至“篮球”/“运动”主题。

[0083] 显示模块104，用于将所述弹幕信息显示在终端设备中。

[0084] 当用户在使用终端设备观看音视频时，弹幕信息会随着音视频的播放在显示屏中进行相应显示。在一个实施例中，对未处理的准备显示的弹幕数据进行筛选得到弹幕信息，将该弹幕信息按照预设格式显示在终端设备中，未被筛选出的弹幕数据按照正常显示情况进行显示，预设格式包括弹幕颜色、弹幕透明度、弹幕字体大小、弹幕持续时间和弹幕移动速度中的至少一种。在一个实施例中，预设格式为弹幕颜色时，将筛选出的弹幕信息设置为鲜艳颜色(如黄色、绿色、红色)进行显示；预设格式为弹幕透明度时，将未被筛选出的弹幕设置为透明，筛选出的弹幕信息透明度设置为0，即不进行透明设置；预设格式为字体大小时，将筛选出的弹幕信息字体设置为未被筛选出的弹幕的字体的1.5倍；预设格式为弹幕持续时间时，将筛选出的弹幕信息持续时间设置为未被筛选出的弹幕的字体的2倍；预设格式为弹幕移动速度时，将筛选出的弹幕信息持续时间设置为未被筛选出的弹幕的移动速度一半，即筛选出的弹幕信息的移动速度慢于未被筛选出的弹幕数据。通过上述设置，将符合当前直播主题的弹幕内容突出显示，使得筛选出的弹幕信息显示效果更为突出，便于用户阅读。

[0085] 由上述内容可知，在用户在观看直播时，和直播主题相关的弹幕被突出显示或者将无关弹幕内容在显示之前进行滤出，使得用户终端设备显示信息的效率提高，显示信息的内容针对性更强，减少了无用信息对用户的干扰。

[0086] 在一个可能的实施例中，所述数据集确定模块102具体用于：

[0087] 依据所述数据信息以及存储的映射关系表确定和所述直播内容对应的筛选数据集；

[0088] 所述数据集确定模块102还用于：

[0089] 在所述依据所述数据信息以及存储的映射关系表确定和所述直播内容对应的筛选数据集之前，依据历史直播内容和对应的历史弹幕信息确定映射关系表，并进行存储。

[0090] 在一个可能的实施例中，所述获取模块101具体用于：

[0091] 通过预设接口获取直播内容对应的直播主题、直播公告和直播板块类别；

[0092] 所述数据集确定模块102具体用于：依据所述直播主题、所述直播公告和所述直播板块类别确定所述直播内容对应的筛选数据集。

[0093] 在一个可能的实施例中，所述获取模块101具体用于：

[0094] 获取终端设备显示的直播画面，对所述直播画面进行图像识别；

[0095] 所述数据集确定模块102具体用于：依据图像识别结果确定所述直播内容对应的筛选数据集。

[0096] 在一个可能的实施例中，所述获取模块101具体用于：

[0097] 获取终端设备播放的声音信息，对所述声音信息进行语音识别；

[0098] 所述数据集确定模块102具体用于：依据语音识别结果确定所述直播内容对应的筛选数据集。

[0099] 在一个可能的实施例中，所述筛选模块103具体用于：

[0100] 依据所述弹幕数据确定各自对应的主题信息，依据所述主题信息以及所述筛选数据集中记录的主题内容对所述弹幕数据进行筛选得到弹幕信息。

[0101] 在一个可能的实施例中，所述显示模块104具体用于：

[0102] 将所述弹幕信息按照预设格式显示在终端设备中，所述预设格式包括弹幕颜色、弹幕透明度、弹幕字体大小、弹幕持续时间和弹幕移动速度中的至少一种。

[0103] 本实施例在上述各实施例的基础上提供了一种终端设备，图6是本申请实施例提供的一种终端设备的结构示意图，如图6所示，该终端设备200包括：存储器201、处理器(Central Processing Unit，CPU)202、外设接口203、RF(Radio Frequency，射频)电路205、音频电路206、扬声器211、电源管理芯片208、输入/输出(I/O)子系统209、触摸屏212、其他输入/控制设备210以及外部端口204，这些部件通过一个或多个通信总线或信号线207来通信。

[0104] 应该理解的是，图示终端设备200仅仅是终端设备的一个范例，并且终端设备200可以具有比图中所示出的更多的或者更少的部件，可以组合两个或更多的部件，或者可以具有不同的部件配置。图中所示出的各种部件可以在包括一个或多个信号处理和/或专用集成电路在内的硬件、软件、或硬件和软件的组合中实现。

[0105] 下面就本实施例提供的用于多开应用的权限管理的终端设备进行详细的描述，该终端设备以智能手机为例。

[0106] 存储器201，所述存储器201可以被CPU202、外设接口203等访问，所述存储器201可以包括高速随机存取存储器，还可以包括非易失性存储器，例如一个或多个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

[0107] 外设接口203，所述外设接口203可以将设备的输入和输出外设连接到CPU202和存储器201。

[0108] I/O子系统209，所述I/O子系统209可以将设备上的输入输出外设，例如触摸屏212和其他输入/控制设备210，连接到外设接口203。I/O子系统209可以包括显示控制器2091和用于控制其他输入/控制设备210的一个或多个输入控制器2092。其中，一个或多个输入控制器2092从其他输入/控制设备210接收电信号或者向其他输入/控制设备210发送电信号，其他输入/控制设备210可以包括物理按钮(按压按钮、摇臂按钮等)、拨号盘、滑动开关、操纵杆、点击滚轮。值得说明的是，输入控制器2092可以与以下任一个连接：键盘、红外端口、USB接口以及诸如鼠标的指示设备。

[0109] 触摸屏212，所述触摸屏212是用户终端与用户之间的输入接口和输出接口，将可视输出显示给用户，可视输出可以包括图形、文本、图标、视频等。

[0110] I/O子系统209中的显示控制器2091从触摸屏212接收电信号或者向触摸屏212发送电信号。触摸屏212检测触摸屏上的接触，显示控制器2091将检测到的接触转换为与显示在触摸屏212上的用户界面对象的交互，即实现人机交互，显示在触摸屏212上的用户界面对象可以是运行游戏的图标、联网到相应网络的图标等。值得说明的是，设备还可以包括光鼠，光鼠是不显示可视输出的触摸敏感表面，或者是由触摸屏形成的触摸敏感表面的延伸。

[0111] RF电路205，主要用于建立手机与无线网络(即网络侧)的通信，实现手机与无线网络的数据接收和发送。例如收发短信息、电子邮件等。具体地，RF电路205接收并发送RF信号，RF信号也称为电磁信号，RF电路205将电信号转换为电磁信号或将电磁信号转换为电信号，并且通过该电磁信号与通信网络以及其他设备进行通信。RF电路205可以包括用于执行这些功能的已知电路，其包括但不限于天线系统、RF收发机、一个或多个放大器、调谐器、一个或多个振荡器、数字信号处理器、CODEC(COder-DECoder，编译码器)芯片组、用户标识模块(Subscriber Identity Module，SIM)等等。

[0112] 音频电路206，主要用于从外设接口203接收音频数据，将该音频数据转换为电信号，并且将该电信号发送给扬声器211。

[0113] 扬声器211，用于将手机通过RF电路205从无线网络接收的语音信号，还原为声音并向用户播放该声音。

[0114] 电源管理芯片208，用于为CPU202、I/O子系统及外设接口所连接的硬件进行供电及电源管理。

[0115] 上述实施例中提供的终端设备的信息处理装置及终端设备可执行本发明任意实施例所提供的终端设备的信息处理方法，具备执行该方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节，可参见本发明任意实施例所提供的终端设备的信息处理方法。

[0116] 本申请实施例还提供一种包含终端设备可执行指令的存储介质，所述终端设备可执行指令在由终端设备处理器执行时用于执行一种信息处理方法，该方法包括：

[0117] 获取和直播内容关联的数据信息，依据所述数据信息确定所述直播内容对应的筛选数据集；

[0118] 获取当前准备显示的弹幕数据，依据所述筛选数据集对所述弹幕数据进行筛选得到弹幕信息；

[0119] 将所述弹幕信息显示在终端设备中。

[0120] 在一个可能的实施例中，所述依据所述数据信息确定所述直播内容对应的筛选数据集包括：

[0121] 依据所述数据信息以及存储的映射关系表确定和所述直播内容对应的筛选数据集；

[0122] 相应的，在所述依据所述数据信息以及存储的映射关系表确定和所述直播内容对应的筛选数据集之前，还包括：

[0123] 依据历史直播内容和对应的历史弹幕信息确定映射关系表，并进行存储。

[0124] 在一个可能的实施例中，所述获取和直播内容关联的数据信息，依据所述数据信息确定所述直播内容对应的筛选数据集包括：

[0125] 通过预设接口获取直播内容对应的直播主题、直播公告和直播板块类别，依据所述直播主题、所述直播公告和所述直播板块类别确定所述直播内容对应的筛选数据集。

[0126] 在一个可能的实施例中，所述获取和直播内容关联的数据信息，依据所述数据信息确定所述直播内容对应的筛选数据集包括：

[0127] 获取终端设备显示的直播画面，对所述直播画面进行图像识别，依据图像识别结果确定所述直播内容对应的筛选数据集。

[0128] 在一个可能的实施例中，所述获取和直播内容关联的数据信息，依据所述数据信息确定所述直播内容对应的筛选数据集包括：

[0129] 获取终端设备播放的声音信息，对所述声音信息进行语音识别，依据语音识别结果确定所述直播内容对应的筛选数据集。

[0130] 在一个可能的实施例中，所述依据所述筛选数据集对所述弹幕数据进行筛选得到弹幕信息包括：

[0131] 依据所述弹幕数据确定各自对应的主题信息，依据所述主题信息以及所述筛选数据集中记录的主题内容对所述弹幕数据进行筛选得到弹幕信息。

[0132] 在一个可能的实施例中，所述将所述弹幕信息显示在终端设备中包括：

[0133] 将所述弹幕信息按照预设格式显示在终端设备中，所述预设格式包括弹幕颜色、弹幕透明度、弹幕字体大小、弹幕持续时间和弹幕移动速度中的至少一种。

[0134] 存储介质——任何的各种类型的存储器设备或存储设备。术语“存储介质”旨在包括：安装介质，例如CD-ROM、软盘或磁带装置；计算机系统存储器或随机存取存储器，诸如DRAM、DDR RAM、SRAM、EDO RAM，兰巴斯(Rambus)RAM等；非易失性存储器，诸如闪存、磁介质(例如硬盘或光存储)；寄存器或其它相似类型的存储器元件等。存储介质可以还包括其它类型的存储器或其组合。另外，存储介质可以位于程序在其中被执行的第一计算机系统中，或者可以位于不同的第二计算机系统中，第二计算机系统通过网络(诸如因特网)连接到第一计算机系统。第二计算机系统可以提供程序指令给第一计算机用于执行。术语“存储介质”可以包括可以驻留在不同位置中(例如在通过网络连接的不同计算机系统中)的两个或更多存储介质。存储介质可以存储可由一个或多个处理器执行的程序指令(例如具体实现为计算机程序)。

[0135] 当然，本申请实施例所提供的一种包含计算机可执行指令的存储介质，其计算机可执行指令不限于如上所述的信息处理方法操作，还可以执行本发明任意实施例所提供的信息处理方法中的相关操作。

[0136] 注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

信息处理方法、装置、终端设备及存储介质转让专利

申请号 : CN201710866985.X

文献号 : CN107613392B

文献日 : 2019-09-27

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 梁昆

申请人 : OPPO广东移动通信有限公司

摘要 :

权利要求 :

说明书 :