一种视频特征信息的展示方法和装置转让专利

申请号 : CN201510993368.7

文献号 : CN106921891B

文献日 : 2020-02-11

本发明实施例提供了一种视频特征信息的展示方法和装置，该方法包括：获取视频数据的一个或多个弹幕文本；对所述一个或多个弹幕文本进行聚类，获得一个或多个弹幕分类；根据所述一个或多个弹幕分类从所述视频数据中识别一个或多个关键视频片段；提取所述关键视频片段对应的视频特征信息；将所述视频特征信息推送至客户端进行展示。本发明实施例避免了用户再次通过观看整个视频数据筛选出感兴趣的部分，大大减少了耗时，减少了带宽资源的浪费，提高了效率。

1.一种视频特征信息的展示方法，包括：获取视频数据的一个或多个弹幕文本；

对所述一个或多个弹幕文本进行聚类，获得一个或多个弹幕分类；

根据所述一个或多个弹幕分类从所述视频数据中识别具有某个受欢迎主题的一个或多个关键视频片段；

提取所述关键视频片段对应的视频特征信息；

将所述视频特征信息推送至客户端进行展示。

2.如权利要求1所述的方法，其特征在于，所述对所述一个或多个弹幕文本进行聚类，获得一个或多个弹幕分类的步骤包括：从所述一个或多个弹幕文本中提取弹幕中心文本；

对所述弹幕中心文本配置弹幕分类；

计算所述一个或多个弹幕文本与所述弹幕中心文本的一个或多个相似度；

当所述相似度高于预设的相似度阈值时，将所述弹幕文本划入所述弹幕中心文本所属的弹幕分类中。

3.如权利要求2所述的方法，其特征在于，所述从所述一个或多个弹幕文本中提取弹幕中心文本的步骤包括：对所述一个或多个弹幕文本进行分词处理，获取一个或多个文本分词；

统计所述一个或多个文本分词的词频；

查询所述一个或多个文本分词的文本权重；

结合所述词频和所述文本权重，计算所述文本分词的弹幕权重；

当所述弹幕权重高于预设的权重阈值时，确定所述文本分词为弹幕中心文本。

4.如权利要求1或2或所述的方法，其特征在于，所述根据所述一个或多个弹幕分类从所述视频数据中识别一个或多个关键视频片段的步骤包括：对所述视频数据划分为一个或多个视频片段；

在所述一个或多个视频片段中，统计所述一个或多个弹幕分类中弹幕文本的数量；

按照所述数量从所述一个或多个视频片段中选取关键视频片段。

5.如权利要求4或所述的方法，其特征在于，所述按照所述数量从所述一个或多个视频片段中选取关键视频片段的步骤包括：查询所述视频数据的视频类型；

查询所述视频类型对应的系数；

当所述数量超过预设的数量阈值与所述系数的乘积时，确定所述弹幕分类所属的视频片段为关键视频片段。

6.如权利要求4或所述的方法，其特征在于，所述根据所述一个或多个弹幕分类从所述视频数据中识别一个或多个关键视频片段的步骤还包括：当关键视频片段相邻时，合并相邻的关键视频片段。

7.如权利要求1或2或3或5或6所述的方法，其特征在于，所述提取所述关键视频片段对应的视频特征信息的步骤包括：提取所述关键视频片段对应的时间区间，作为视频特征信息。

8.如权利要求2或3所述的方法，其特征在于，所述提取所述关键视频片段对应的视频特征信息的步骤包括：将所述弹幕中心文本设置为视频特征信息。

9.如权利要求1或2或3或5或6所述的方法，其特征在于，所述提取所述关键视频片段对应的视频特征信息的步骤包括：查找所述关键视频片段对应的字幕数据；

采用所述字幕数据生成文本摘要信息，作为视频特征信息。

10.如权利要求1或2或3或5或6所述的方法，其特征在于，所述提取所述关键视频片段对应的视频特征信息的步骤包括：采用所述关键视频片段中的视频数据生成视频摘要信息，作为视频特征信息。

11.一种视频特征信息的展示装置，包括：弹幕文本获取模块，适于获取视频数据的一个或多个弹幕文本；

弹幕文本聚类模块，适于对所述一个或多个弹幕文本进行聚类，获得一个或多个弹幕分类；

关键视频片段识别模块，适于根据所述一个或多个弹幕分类从所述视频数据中识别具有某个受欢迎主题的一个或多个关键视频片段；

视频特征信息提取模块，适于提取所述关键视频片段对应的视频特征信息；

视频特征信息推送模块，适于将所述视频特征信息推送至客户端进行展示。

12.如权利要求11所述的装置，其特征在于，所述弹幕文本聚类模块还适于：从所述一个或多个弹幕文本中提取弹幕中心文本；

对所述弹幕中心文本配置弹幕分类；

计算所述一个或多个弹幕文本与所述弹幕中心文本的一个或多个相似度；

当所述相似度高于预设的相似度阈值时，将所述弹幕文本划入所述弹幕中心文本所属的弹幕分类中。

13.如权利要求12所述的装置，其特征在于，所述弹幕文本聚类模块还适于：对所述一个或多个弹幕文本进行分词处理，获取一个或多个文本分词；

统计所述一个或多个文本分词的词频；

查询所述一个或多个文本分词的文本权重；

结合所述词频和所述文本权重，计算所述文本分词的弹幕权重；

当所述弹幕权重高于预设的权重阈值时，确定所述文本分词为弹幕中心文本。

14.如权利要求11或12或所述的装置，其特征在于，所述关键视频片段识别模块还适于：对所述视频数据划分为一个或多个视频片段；

在所述一个或多个视频片段中，统计所述一个或多个弹幕分类中弹幕文本的数量；

按照所述数量从所述一个或多个视频片段中选取关键视频片段。

15.如权利要求14或所述的装置，其特征在于，所述关键视频片段识别模块还适于：查询所述视频数据的视频类型；

查询所述视频类型对应的系数；

当所述数量超过预设的数量阈值与所述系数的乘积时，确定所述弹幕分类所属的视频片段为关键视频片段。

16.如权利要求14或所述的装置，其特征在于，所述关键视频片段识别模块还适于：当关键视频片段相邻时，合并相邻的关键视频片段。

17.如权利要求11或12或13或15或16所述的装置，其特征在于，所述视频特征信息提取模块还适于：提取所述关键视频片段对应的时间区间，作为视频特征信息。

18.如权利要求12或13所述的装置，其特征在于，所述视频特征信息提取模块还适于：将所述弹幕中心文本设置为视频特征信息。

19.如权利要求11或12或13或15或16所述的装置，其特征在于，所述视频特征信息提取模块还适于：查找所述关键视频片段对应的字幕数据；

采用所述字幕数据生成文本摘要信息，作为视频特征信息。

20.如权利要求11或12或13或15或16所述的装置，其特征在于，所述视频特征信息提取模块还适于：采用所述关键视频片段中的视频数据生成视频摘要信息，作为视频特征信息。

一种视频特征信息的展示方法和装置

技术领域

[0001] 本发明涉及多媒体处理的技术领域，特别是涉及一种视频特征信息的展示方法和一种视频特征信息的展示装置。

背景技术

[0002] 随着互联网的高速发展，网上的信息量急剧增加，其中包含了大量的视频数据，例如，新闻视频、综艺类节目、电视剧、电影等等。

[0003] 用户对于视频数据的了解，大多源于对整个视频数据的简介，基于视频数据的简介，用户会选择观看或不观看。

[0004] 但是，视频数据的时间一般比较长，如电视剧一集长达40分钟，一部电视剧多达数十集，而电影一部长达2个多小时。

[0005] 这些时长很长的视频数据中包含的信息量比较大，但是，不一定所有的视频数据都是用户感兴趣的，用户若需要从中筛选出感兴趣的部分，需要浏览整个视频数据，消耗大量的时间、浪费许多带宽资源，效率很低。

发明内容

[0006] 鉴于上述问题，提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种视频特征信息的展示方法和相应的一种视频特征信息的展示装置。

[0007] 依据本发明的一个方面，提供了一种视频特征信息的展示方法，包括：

[0008] 获取视频数据的一个或多个弹幕文本；

[0009] 对所述一个或多个弹幕文本进行聚类，获得一个或多个弹幕分类；

[0010] 根据所述一个或多个弹幕分类从所述视频数据中识别一个或多个关键视频片段；

[0011] 提取所述关键视频片段对应的视频特征信息；

[0012] 将所述视频特征信息推送至客户端进行展示。

[0013] 可选地，所述对所述一个或多个弹幕文本进行聚类，获得一个或多个弹幕分类的步骤包括：

[0014] 从所述一个或多个弹幕文本中提取弹幕中心文本；

[0015] 对所述弹幕中心文本配置弹幕分类；

[0016] 计算所述一个或多个弹幕文本与所述弹幕中心文本的一个或多个相似度；

[0017] 当所述相似度高于预设的相似度阈值时，将所述弹幕文本划入所述弹幕中心文本所属的弹幕分类中。

[0018] 可选地，所述从所述一个或多个弹幕文本中提取弹幕中心文本的步骤包括：

[0019] 对所述一个或多个弹幕文本进行分词处理，获取一个或多个文本分词；

[0020] 统计所述一个或多个文本分词的词频；

[0021] 查询所述一个或多个文本分词的文本权重；

[0022] 结合所述词频和所述文本权重，计算所述文本分词的弹幕权重；

[0023] 当所述弹幕权重高于预设的权重阈值时，确定所述文本分词为弹幕中心文本。

[0024] 可选地，所述根据所述一个或多个弹幕分类从所述视频数据中识别一个或多个关键视频片段的步骤包括：

[0025] 对所述视频数据划分为一个或多个视频片段；

[0026] 在所述一个或多个视频片段中，统计所述一个或多个弹幕分类中弹幕文本的数量；

[0027] 按照所述数量从所述一个或多个视频片段中选取关键视频片段。

[0028] 可选地，所述按照所述数量从所述一个或多个视频片段中选取关键视频片段的步骤包括：

[0029] 查询所述视频数据的视频类型；

[0030] 查询所述视频类型对应的系数；

[0031] 当所述数量超过预设的数量阈值与所述系数的乘积时，确定所述弹幕分类所属的视频片段为关键视频片段。

[0032] 可选地，所述根据所述一个或多个弹幕分类从所述视频数据中识别一个或多个关键视频片段的步骤还包括：

[0033] 当关键视频片段相邻时，合并相邻的关键视频片段。

[0034] 可选地，所述提取所述关键视频片段对应的视频特征信息的步骤包括：

[0035] 提取所述关键视频片段对应的时间区间，作为视频特征信息。

[0036] 可选地，所述提取所述关键视频片段对应的视频特征信息的步骤包括：

[0037] 将所述弹幕中心文本设置为视频特征信息。

[0038] 可选地，所述提取所述关键视频片段对应的视频特征信息的步骤包括：

[0039] 查找所述关键视频片段对应的字幕数据；

[0040] 采用所述字幕数据生成文本摘要信息，作为视频特征信息。

[0041] 可选地，所述提取所述关键视频片段对应的视频特征信息的步骤包括：

[0042] 采用所述关键视频片段中的视频数据生成视频摘要信息，作为视频特征信息。

[0043] 根据本发明的另一方面，提供了一种视频特征信息的展示装置，包括：

[0044] 弹幕文本获取模块，适于获取视频数据的一个或多个弹幕文本；

[0045] 弹幕文本聚类模块，适于对所述一个或多个弹幕文本进行聚类，获得一个或多个弹幕分类；

[0046] 关键视频片段识别模块，适于根据所述一个或多个弹幕分类从所述视频数据中识别一个或多个关键视频片段；

[0047] 视频特征信息提取模块，适于提取所述关键视频片段对应的视频特征信息；

[0048] 视频特征信息推送模块，适于将所述视频特征信息推送至客户端进行展示。

[0049] 可选地，所述弹幕文本聚类模块还适于：

[0050] 从所述一个或多个弹幕文本中提取弹幕中心文本；

[0051] 对所述弹幕中心文本配置弹幕分类；

[0052] 计算所述一个或多个弹幕文本与所述弹幕中心文本的一个或多个相似度；

[0053] 当所述相似度高于预设的相似度阈值时，将所述弹幕文本划入所述弹幕中心文本所属的弹幕分类中。

[0054] 可选地，所述弹幕文本聚类模块还适于：

[0055] 对所述一个或多个弹幕文本进行分词处理，获取一个或多个文本分词；

[0056] 统计所述一个或多个文本分词的词频；

[0057] 查询所述一个或多个文本分词的文本权重；

[0058] 结合所述词频和所述文本权重，计算所述文本分词的弹幕权重；

[0059] 当所述弹幕权重高于预设的权重阈值时，确定所述文本分词为弹幕中心文本。

[0060] 可选地，所述关键视频片段识别模块还适于：

[0061] 对所述视频数据划分为一个或多个视频片段；

[0062] 在所述一个或多个视频片段中，统计所述一个或多个弹幕分类中弹幕文本的数量；

[0063] 按照所述数量从所述一个或多个视频片段中选取关键视频片段。

[0064] 可选地，所述关键视频片段识别模块还适于：

[0065] 查询所述视频数据的视频类型；

[0066] 查询所述视频类型对应的系数；

[0067] 当所述数量超过预设的数量阈值与所述系数的乘积时，确定所述弹幕分类所属的视频片段为关键视频片段。

[0068] 可选地，所述关键视频片段识别模块还适于：

[0069] 当关键视频片段相邻时，合并相邻的关键视频片段。

[0070] 可选地，所述视频特征信息提取模块还适于：

[0071] 提取所述关键视频片段对应的时间区间，作为视频特征信息。

[0072] 可选地，所述视频特征信息提取模块还适于：

[0073] 将所述弹幕中心文本设置为视频特征信息。

[0074] 可选地，所述视频特征信息提取模块还适于：

[0075] 查找所述关键视频片段对应的字幕数据；

[0076] 采用所述字幕数据生成文本摘要信息，作为视频特征信息。

[0077] 可选地，所述视频特征信息提取模块还适于：

[0078] 采用所述关键视频片段中的视频数据生成视频摘要信息，作为视频特征信息。

[0079] 本发明实施例对视频数据的弹幕文本进行聚类，基于弹幕分类识别关键视频片段，并将该关键视频片段的视频特征信息推送至客户端进行展示，实现了视频主题的挖掘，避免了用户再次通过观看整个视频数据筛选出感兴趣的部分，大大减少了耗时，减少了带宽资源的浪费，提高了效率。

[0080] 上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

[0081] 通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

[0082] 图1示出了根据本发明一个实施例的一种视频特征信息的展示方法实施例的步骤流程图；以及

[0083] 图2示出了根据本发明一个实施例的一种视频特征信息的展示装置实施例的结构框图。

具体实施方式

[0084] 下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

[0085] 参照图1，示出了根据本发明一个实施例的一种视频特征信息的展示方法实施例的步骤流程图，具体可以包括如下步骤：

[0086] 步骤101，获取视频数据的一个或多个弹幕文本；

[0087] 弹幕(barrage)文本，是指以字幕形式在播放的视频数据之上显示的评论信息。

[0088] 在本发明实施例中，可以通过在线视频网站等方式收集的弹幕文本，以挖掘出有价值的视频片段。

[0089] 步骤102，对所述一个或多个弹幕文本进行聚类，获得一个或多个弹幕分类；

[0090] 弹幕文本，可以给观众一种“实时互动”的错觉，虽然不同弹幕的发送时间有所区别，但是其一般会集中在视频数据中某一个时间点出现，因此，在某段视频数据中发送的弹幕基本上也可能具有相同的主题，通过聚类，可以挖掘出该主题。

[0091] 在本发明的一种可选实施例中，步骤102可以包括如下子步骤：

[0092] 子步骤S11，从所述一个或多个弹幕文本中提取弹幕中心文本；

[0093] 在本发明实施例中，可以从众多的弹幕文本中挖掘出重要的文本，作为弹幕中心文本。

[0094] 在本发明实施例的一种可选示例中，子步骤S11进一步可以包括如下子步骤：

[0095] 子步骤S111，对所述一个或多个弹幕文本进行分词处理，获取一个或多个文本分词；

[0096] 本发明实施例中，可以如下的一种或多种方式进行分词处理：

[0097] 1、基于字符串匹配的分词：是指按照一定的策略将待分析的汉字串与一个预置的机器词典中的词条进行匹配，若在词典中找到某个字符串，则匹配成功(识别出一个词)。

[0098] 2、基于特征扫描或标志切分的分词：是指优先在待分析字符串中识别和切分出一些带有明显特征的词，以这些词作为断点，可将原字符串分为较小的串再来进机械分词，从而减少匹配的错误率；或者将分词和词类标注结合起来，利用丰富的词类信息对分词决策提供帮助，并且在标注过程中又反过来对分词结果进行检验、调整，从而提高切分的准确率。

[0099] 3、基于理解的分词：是指通过让计算机模拟人对句子的理解，达到识别词的效果。其基本思想就是在分词的同时进行句法、语义分析，利用句法信息和语义信息来处理歧义现象。它通常包括三个部分：分词子系统、句法语义子系统、总控部分。在总控部分的协调下，分词子系统可以获得有关词、句子等的句法和语义信息来对分词歧义进行判断，即它模拟了人对句子的理解过程。

[0100] 4、基于统计的分词方法：是指，中文信息中由于字与字相邻共现的频率或概率能够较好的反映成词的可信度，所以可以对语料中相邻共现的各个字的组合的频度进行统计，计算它们的互现信息，以及计算两个汉字X、Y的相邻共现概率。互现信息可以体现汉字之间结合关系的紧密程度。当紧密程度高于某一个阈值时，便可认为此字组可能构成了一个词。

[0101] 当然，上述分词处理方式只是作为示例，在实施本发明实施例时，可以根据实际情况设置其他分词处理方式，本发明实施例对此不加以限制。另外，除了上述分词处理方式外，本领域技术人员还可以根据实际需要采用其它分词处理方式，本发明实施例对此也不加以限制。

[0102] 子步骤S112，统计所述一个或多个文本分词的词频；

[0103] 若分词完成，则可以统计各文本分词的词频。

[0104] 子步骤S113，查询所述一个或多个文本分词的文本权重；

[0105] 在本发明实施例中，可以按照基于搜索热度、时事新闻等因素，预先对不同的词配置文本权重，是一种动态的权重配置方式。

[0106] 若文本分词匹配上该词，则可以对该文本分词配置该文本权重。

[0107] 子步骤S114，结合所述词频和所述文本权重，计算所述文本分词的弹幕权重；

[0108] 子步骤S115，当所述弹幕权重高于预设的权重阈值时，确定所述文本分词为弹幕中心文本。

[0109] 在本发明实施例中，可以通过讲词频与文本权重相乘，获得最终的弹幕权重。

[0110] 若该弹幕权重高于一权重阈值，则表示该弹幕权重高较高，可以将该文本分词设置为弹幕中心文本。

[0111] 子步骤S12，对所述弹幕中心文本配置弹幕分类；

[0112] 在本发明实施例中，该弹幕中心文本可以作为一个弹幕分类的中心，划分弹幕分类。

[0113] 需要说明的是，若弹幕中心文本属于相似的文本，表征同一个主题，则该弹幕文本划入同一个弹幕分类中。

[0114] 子步骤S13，计算所述一个或多个弹幕文本与所述弹幕中心文本的一个或多个相似度；

[0115] 子步骤S14，当所述相似度高于预设的相似度阈值时，将所述弹幕文本划入所述弹幕中心文本所属的弹幕分类中。

[0116] 在本发明实施例中，可以通过word2vec(word to vector)计算弹幕文本与弹幕中心文本的相似度、

[0117] word2vec，顾名思义，这是一个将单词转换成向量形式的工具。

[0118] 通过转换，可以把对文本内容的处理简化为向量空间中的向量运算，计算出向量空间上的相似度，来表示文本语义上的相似度。

[0119] word2vec为计算向量词提供了一种有效的连续词袋(bag-of-words)和skip-gram架构实现，word2vec遵循Apache License 2.0开源协议。

[0120] word2vec主要是将文本语料库转换成词向量，它会先从训练文本数据中构建一个词汇，然后获取向量表示词，由此产生的词向量可以作为某项功能用在许多自然语言处理和机器学习应用中。

[0121] 在举例子之前，引入余弦距离(Cosine distance)这个概念：

[0122] 通过测量两个向量内积空间的夹角的余弦值来度量它们之间的相似性。0度角的余弦值是1，而其他任何角度的余弦值都不大于1；并且其最小值是-1。从而两个向量之间的角度的余弦值确定两个向量是否大致指向相同的方向。

[0123] 两个向量有相同的指向时，余弦相似度的值为1；两个向量夹角为90°时，余弦相似度的值为0；两个向量指向完全相反的方向时，余弦相似度的值为-1。在比较过程中，向量的规模大小不予考虑，仅仅考虑到向量的指向方向。

[0124] 余弦相似度通常用于两个向量的夹角小于90°之内，因此余弦相似度的值为0到1之间。

[0125] 然后可以通过distance工具根据转换后的向量计算出余弦距离，来表示向量(词语)的相似度。

[0126] 例如，输入“france”，distance工具会计算并显示与“france”距离最相近的词，如下：

[0127]Word Cosine distance
spain 0.678515
belgium 0.665923
netherlands 0.652428
italy 0.633130
switzerland 0.622323
luxembourg 0.610033
portugal 0.577154
russia 0.571507
germany 0.563291
catalonia 0.534176

[0128] 当然，词向量也可以从巨大的数据集中导出词类，通过执行词向量顶部的K-means聚类即可实现词聚类(Word clustering)。

[0129] 步骤103，根据所述一个或多个弹幕分类从所述视频数据中识别一个或多个关键视频片段；

[0130] 在具体实现中，可以基于聚类后的弹幕文本，挖掘出用户行为偏向，从而从视频数据识别具有某个受欢迎主题的关键视频片段。

[0131] 在本发明的一种可选实施例中，步骤103可以包括如下子步骤：

[0132] 子步骤S21，对所述视频数据划分为一个或多个视频片段；

[0133] 在具体实现中，为了减少计算量，可以每间隔一定的时间，如3分钟，就可以切分一个视频片段。

[0134] 当然，为了提高切分的精确度，也可以按照基于时空联合的视频对象分割算法、基于运动一致性的视频分割算法、基于帧间差分的分割算法、基于贝叶斯与MRF的分割算法等方式，将视频数据按照场景切分成一个或多个视频片段。

[0135] 子步骤S22，在所述一个或多个视频片段中，统计所述一个或多个弹幕分类中弹幕文本的数量；

[0136] 在本发明实施例中，弹幕文本具有时间信息，因此，可以统计在一个视频片段中，属于同一个类别的弹幕文本的数量，挖掘主题的集中程度。

[0137] 子步骤S23，按照所述数量从所述一个或多个视频片段中选取关键视频片段。

[0138] 由于不同视频类型的视频数据的受众群体不同，例如，抗战剧的受众群体多为中老年人，动漫视频的受众群体多为年轻的学生，军事节目的受众群体多为中年男性，等等。

[0139] 不同的受众群体具有不同的行为习惯，其对弹幕文本的习惯也有所不同，因此，可以针对视频数据的视频类型设置一系数，以动态调整阈值。

[0140] 在具体实现中，可以查询视频数据的视频类型，查询视频类型对应的系数，当数量超过预设的数量阈值与系数的乘积时，确定弹幕分类所属的视频片段为关键视频片段。

[0141] 需要说明的是，当关键视频片段相邻时，可以合并相邻的关键视频片段。

[0142] 步骤104，提取所述关键视频片段对应的视频特征信息；

[0143] 在本发明实施例中，可以从关键视频片段中挖掘出表征该关键视频片段特征的视频特征信息。

[0144] 在一种视频特征信息中，可以提取关键视频片段对应的时间区间，即起始时间和结束时间，作为视频特征信息。

[0145] 在另一种视频特征信息中，可以将所述弹幕中心文本设置为视频特征信息，体现该关键视频片段的主题。

[0146] 在另一种视频特征信息中，可以查找关键视频片段对应的字幕数据，通过文本摘要算法(如TextTeaser)等方式，采用字幕数据生成文本摘要信息，作为视频特征信息。

[0147] 在另一种视频特征信息中，可以通过视频摘要生成算法，如基于关键帧(key frame)的视频摘要生成算法、基于语义内容相关挖掘的视频摘要生成算法等等，采用所述关键视频片段中的视频数据生成视频摘要信息，作为视频特征信息。

[0148] 当然，上述视频数据信息只是作为示例，在实施本发明实施例时，可以根据实际情况设置其他视频数据信息，本发明实施例对此不加以限制。另外，除了上述视频数据信息外，本领域技术人员还可以根据实际需要采用其它视频数据信息，本发明实施例对此也不加以限制。

[0149] 步骤105，将所述视频特征信息推送至客户端进行展示。

[0150] 在具体实现中，可以基于不同的场景将视频特征信息推送至客户端进行展示。

[0151] 若客户端主动请求发送搜索关键词，则服务器可以搜索匹配的视频特征信息返回给客户端进行展示。

[0152] 若客户端加载某个页面，如某个视频所在的页面，则服务器可以将包含视频特征信息的页面数据返回给客户端，将该视频特征信息推荐给客户端。

[0153] 若客户端的某些行为数据与视频特征信息，则服务器可以主动将该视频特征信息推送至客户端。

[0154] 本发明实施例对视频数据的弹幕文本进行聚类，基于弹幕分类识别关键视频片段，并将该关键视频片段的视频特征信息推送至客户端进行展示，实现了视频主题的挖掘，避免了用户再次通过观看整个视频数据筛选出感兴趣的部分，大大减少了耗时，减少了带宽资源的浪费，提高了效率。

[0155] 对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明实施例并不受所描述的动作顺序的限制，因为依据本发明实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本发明实施例所必须的。

[0156] 参照图2，示出了根据本发明一个实施例的一种视频特征信息的展示装置实施例的结构框图，具体可以包括如下模块：

[0157] 弹幕文本获取模块201，适于获取视频数据的一个或多个弹幕文本；

[0158] 弹幕文本聚类模块202，适于对所述一个或多个弹幕文本进行聚类，获得一个或多个弹幕分类；

[0159] 关键视频片段识别模块203，适于根据所述一个或多个弹幕分类从所述视频数据中识别一个或多个关键视频片段；

[0160] 视频特征信息提取模块204，适于提取所述关键视频片段对应的视频特征信息；

[0161] 视频特征信息推送模块205，适于将所述视频特征信息推送至客户端进行展示。

[0162] 在本发明的一种可选实施例中，所述弹幕文本聚类模块202还可以适于：

[0163] 从所述一个或多个弹幕文本中提取弹幕中心文本；

[0164] 对所述弹幕中心文本配置弹幕分类；

[0165] 计算所述一个或多个弹幕文本与所述弹幕中心文本的一个或多个相似度；

[0166] 当所述相似度高于预设的相似度阈值时，将所述弹幕文本划入所述弹幕中心文本所属的弹幕分类中。

[0167] 在本发明的一种可选实施例中，所述弹幕文本聚类模块202还可以适于：

[0168] 对所述一个或多个弹幕文本进行分词处理，获取一个或多个文本分词；

[0169] 统计所述一个或多个文本分词的词频；

[0170] 查询所述一个或多个文本分词的文本权重；

[0171] 结合所述词频和所述文本权重，计算所述文本分词的弹幕权重；

[0172] 当所述弹幕权重高于预设的权重阈值时，确定所述文本分词为弹幕中心文本。

[0173] 在本发明的一种可选实施例中，所述关键视频片段识别模块203还可以适于：

[0174] 对所述视频数据划分为一个或多个视频片段；

[0175] 在所述一个或多个视频片段中，统计所述一个或多个弹幕分类中弹幕文本的数量；

[0176] 按照所述数量从所述一个或多个视频片段中选取关键视频片段。

[0177] 在本发明的一种可选实施例中，所述关键视频片段识别模块203还可以适于：

[0178] 查询所述视频数据的视频类型；

[0179] 查询所述视频类型对应的系数；

[0180] 当所述数量超过预设的数量阈值与所述系数的乘积时，确定所述弹幕分类所属的视频片段为关键视频片段。

[0181] 在本发明的一种可选实施例中，所述关键视频片段识别模块203还可以适于：

[0182] 当关键视频片段相邻时，合并相邻的关键视频片段。

[0183] 在本发明的一种可选实施例中，所述视频特征信息提取模块204还可以适于：

[0184] 提取所述关键视频片段对应的时间区间，作为视频特征信息。

[0185] 在本发明的一种可选实施例中，所述视频特征信息提取模块204还可以适于：

[0186] 将所述弹幕中心文本设置为视频特征信息。

[0187] 在本发明的一种可选实施例中，所述视频特征信息提取模块204还可以适于：

[0188] 查找所述关键视频片段对应的字幕数据；

[0189] 采用所述字幕数据生成文本摘要信息，作为视频特征信息。

[0190] 在本发明的一种可选实施例中，所述视频特征信息提取模块204还可以适于：

[0191] 采用所述关键视频片段中的视频数据生成视频摘要信息，作为视频特征信息。

[0192] 对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

[0193] 在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造这类系统所要求的结构是显而易见的。此外，本发明也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明的内容，并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

[0194] 在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

[0195] 类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

[0196] 本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

[0197] 此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在下面的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

[0198] 本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的视频特征信息的展示设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

[0199] 应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

一种视频特征信息的展示方法和装置转让专利

申请号 : CN201510993368.7

文献号 : CN106921891B

文献日 : 2020-02-11

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 陈新

申请人 : 北京奇虎科技有限公司 , 奇智软件(北京)有限公司

摘要 :

权利要求 :

说明书 :