针对视频搜索的观看时间聚类转让专利

申请号 : CN201680057938.4

文献号 : CN108140041B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 贾斯汀·刘易斯罗伯特·亚历山大·德宾

申请人 : 谷歌有限责任公司

摘要 :

除了其他之外,本文档还描述了系统、方法、装置和其他技术,用于使用关于在客户端装置处呈现各种视频多长时间的信息来确定后续视频推荐和搜索结果。在一些实施方式中,计算可包括建模设备、前端服务器、请求管理器、一个或多个视频文件存储装置、视频选择器、或它们的一些或全部的组合。视频选择器能够选择用于多个数字化视频之中的特定数字化视频的视频内容,以响应于请求而派发给计算装置。所述选择能够至少部分地基于由所述建模设备所指示的、所述特定数字化视频在与具有以下特征的用户相关联的客户端装置处被呈现了多长时间:所述特征与提交了对视频内容的所述请求的用户的一个或多个特征相匹配。

权利要求 :

1.一种用于通过网络派发视频的计算系统,所述计算系统包括:

建模设备,所述建模设备(i)对于所述计算系统通过网络已经在客户端装置处呈现的各种数字化视频获得观看时间信息,所述观看时间信息指定所述各种数字化视频在所述客户端装置处被呈现的时间量,(ii)基于与所述客户端装置相关联的用户的特征将所述观看时间信息分组成不同的群组,以及(iii)基于观看时间信息的分组并且对于多个用户群组中的每个特定用户群组,确定指示所述各种数字化视频中的每一个被呈现给该特定用户群组内的用户达多长时间的累加观看时间;

前端服务器,所述前端服务器接收对视频内容的请求并且通过所述网络将响应于所述请求而识别的视频内容派发给与所述计算系统分离的计算装置以供呈现在所述计算装置处;

请求管理器,所述请求管理器包括一个或多个处理器,所述请求管理器分析对视频内容的所述请求并且识别所述请求中对于视频内容的选择标准,所述请求包括识别提交了对视频内容的所述请求的用户的一个或多个特征;

一个或多个视频文件存储装置,所述一个或多个视频文件存储装置存储已经通过各种参与方使能够用于通过所述网络分发的多个数字化视频;以及视频选择器,所述视频选择器包括一个或多个处理器,所述视频选择器从所述视频文件存储装置中选择所述多个数字化视频之中的特定数字化视频的视频内容,以响应于所述请求而派发给所述计算装置,其中,所述选择至少部分地基于由所述建模设备所指示的、指示所述特定数字化视频已经在与具有以下特征的用户相关联的客户端装置处被呈现了多长时间的第一累加观看时间:该特征与提交了对视频内容的所述请求的所述用户的一个或多个特征相匹配。

2.根据权利要求1所述的计算系统,其中,所述建模设备:

通过将所述观看时间信息的相应百分比指派给不同的观看者类别来将所述观看时间信息分组成不同的群组,所述不同的观看者类别对应于与呈现了所述各种数字化视频的客户端装置相关联的用户的不同特征的集合;以及对于每个相应观看者类别,在数字化视频群组中的、已至少部分地在与所述相应类别中的用户相关联的计算装置处被呈现的数字化视频之中,识别所述相应观看者类别中的用户的观看时间的分布。

3.根据权利要求1所述的计算系统,其中,对于在所述一个或多个视频文件存储装置上存储的所述多个数字化视频之中的每个相应数字化视频,所述建模设备:根据所述观看时间信息并且对于多个观看者类别之中的每个相应观看者类别,识别所述相应数字化视频在与所述相应观看者类别中的用户相关联的客户端装置处被呈现了多长时间;以及对于多个观看者类别之中的每个相应观看者类别并且基于所述相应数字化视频在与所述相应观看者类别中的用户相关联的客户端装置处被呈现了多长时间,向所述相应数字化视频指派评分,所述评分指示所述相应数字化视频与所述相应观看者类别的相关性。

4.根据权利要求1所述的计算系统,其中,提交了对视频内容的所述请求的所述用户的所述一个或多个特征包括所述用户的人口统计学特征或所述用户的行为特征中的至少一个。

5.根据权利要求4所述的计算系统,其中,提交了对视频内容的所述请求的所述用户的一个或多个特征包括至少指示所述用户的年龄或性别的人口统计学特征。

6.根据权利要求4所述的计算系统,其中:

提交了对视频内容的所述请求的所述用户的一个或多个特征包括行为特征,所述行为特征指示由所述用户在所述用户提交了对视频内容的所述请求的相同会话中所提交的一个或多个查询;以及所述视频选择器至少基于在其他用户也提交了所述一个或多个查询或者被确定为与所述一个或多个查询类似的至少一个查询的会话期间、所述特定数字化视频在与所述其他用户相关联的客户端装置处被呈现了多长时间,来选择派发所述多个数字化视频之中的所述特定数字化视频的所述视频内容。

7.根据权利要求4所述的计算系统,其中:

提交了对视频内容的所述请求的所述用户的所述一个或多个特征包括指示与对视频内容的所述请求相关联的用户的导航历史的行为特征;以及所述视频选择器至少基于在导致其它用户观看所述特定数字化视频的浏览会话中、所述特定数字化视频在与具有与提交了所述请求的所述用户相同或类似的导航历史的所述其他用户相关联的客户端装置处被呈现了多长时间,来选择派发所述多个数字化视频之中的所述特定数字化视频的所述视频内容。

8.根据权利要求1所述的计算系统,其中,所述视频选择器还被配置为选择视频内容以派发给各种计算装置,作为给所述各种计算装置的相应用户的推荐。

9.根据权利要求1所述的计算系统,其中:

响应于接收到对视频内容的所述请求,所述请求管理器被配置为识别所请求的视频内容的一个或多个主题,包括根据作为所述请求的一部分的用户录入的查询中的至少一个来识别主题、或者根据与所述请求中未包括的用户相关联的信息来识别主题;以及所述视频选择器被配置为通过以下步骤来选择视频内容以派发给所述计算装置:识别被确定为与所述一个或多个主题相关的数字化视频;

至少部分地基于所识别的数字化视频中的每个视频已经在与具有以下特征的用户相关联的客户端装置处被呈现了多长时间,来对所识别的数字化视频进行排名:所述特征与提交了对视频内容的所述请求的所述用户的所述一个或多个特征相匹配;以及基于所述排名,选择一个或多个排名靠前的数字化视频的视频内容以派发给所述计算装置,包括所述特定数字化视频的所述视频内容。

10.根据权利要求1所述的计算系统,还包括仪器管理器,所述仪器管理器包括一个或多个处理器,所述仪器管理器在各种网页中生成并嵌入计算机代码,所述各种网页由所述计算系统派发给各种客户端装置以供呈现各种数字化视频,其中,所述计算机代码被配置为当在所述各种客户端装置上执行时使得所述各种计算装置周期性地通过网络向所述计算系统报告所述各种数字化视频在所述各种客户端装置处被呈现的时间量。

11.根据权利要求1所述的计算系统,其中:

所述前端服务器被配置为通过将所述特定数字化视频的所述视频内容流传输至所述计算装置来派发所述视频内容,以及所述计算装置被配置为(i)从所述计算系统接收所述特定数字化视频的所述视频内容的流以及(ii)播放所述视频内容的流。

12.一种用于通过网络派发视频的计算机实现方法,包括:

在计算系统处获得数据,对于多个计算装置之中被派发了由所述计算系统托管的第一视频的至少一部分的每个相应计算装置,所述数据指示在该相应计算装置处发生的用于所述第一视频的相应观看时间;

对于用于所述第一视频的每一个相应观看时间,基于该相应观看时间所发生的相应计算装置的用户的一个或多个特征,将该相应观看时间归因于多个观看者类别中的一个或多个观看者类别;

对于所述多个观看者类别之中的每个相应观看者类别,将已经归因于该相应观看者类别的相应观看时间累加,以生成用于该相应观看者类别的累加观看时间,其中,用于该相应观看者类别的累加观看时间指示所述第一视频被呈现给该相应观看者类别内的用户达多长时间;

使用至少基于用于所述多个观看者类别之中的、匹配第一用户的特定观看者类别的所述第一视频的累加观看时间的标准,来确定是否向所述第一用户提供所述第一视频的视频内容;以及响应于所述计算系统确定用于将所述第一视频的视频内容提供给所述第一用户的所述标准被满足,向所述第一用户的第一计算装置派发所述第一视频的视频内容以供呈现在所述第一计算装置处。

13.根据权利要求12所述的计算机实现方法,其中,确定是否向所述第一用户提供所述第一视频的视频内容包括确定用于匹配所述第一用户的所述特定观看者类别的所述第一视频的累加观看时间是否满足阈值观看时间。

14.根据权利要求12所述的计算机实现方法,其中,确定是否向所述第一用户提供所述第一视频的视频内容包括:至少基于用于匹配所述第一用户的所述特定观看者类别的多个候选视频的相应累加观看时间,对包括所述第一视频的所述多个候选视频进行排名;以及基于所述排名选择所述多个候选视频中的一个或多个视频的视频内容。

15.根据权利要求12所述的计算机实现方法,其中,所述多个观看者类别基于观看者的人口统计学特征和观看者的在线行为特征中的至少一个对观看者进行分类。

16.根据权利要求12所述的计算机实现方法,还包括:

对于所述多个观看者类别中的每个相应观看者类别,将相应质量评分指派给该相应观看者类别;

识别所述多个观看者类别之中的第一观看者类别中的用户对所述第一视频的第一观看时间;

响应于识别所述第一观看时间,将所述第一视频的创建者的性能评分增加基于所述第一观看时间和指派给所述第一观看者类别的所述相应质量评分的量;

识别所述多个观看者类别之中的第二观看者类别中的用户对所述第一视频的第二观看时间;以及响应于识别到所述第二观看时间,将所述第一视频的所述创建者的所述性能评分增加基于所述第二观看时间和指派给所述第二观看者类别的相应质量评分的量。

17.根据权利要求16所述的计算机实现方法,包括基于作为相应观看者类别中的观看者观看由所述计算系统托管的视频的结果而生成的收益,来确定分配给所述相应观看者类别的所述相应质量评分。

18.根据权利要求12所述的计算机实现方法,其中,对于所述多个观看者类别之中的每个相应观看者类别,该相应观看者类别的累加观看时间指示该相应观看者类别内的用户对所述第一视频的观看时间的总计。

19.根据权利要求12所述的计算机实现方法,其中:

派发所述第一视频的视频内容以供呈现在所述第一计算装置处包括将所述第一视频的视频内容流传输至所述第一计算装置,以及所述第一计算装置被配置为(i)从所述计算系统接收所述第一视频的视频内容的流以及(ii)播放所述第一视频的视频内容的流。

20.一个或多个非暂时性计算机可读介质,所述一个或多个非暂时性计算机可读介质具有其上存储的指令,所述指令在由一个或多个处理器执行时使得执行操作,所述操作包括:在计算系统处获得数据,对于多个计算装置之中被派发了由所述计算系统托管的第一视频的至少一部分的每个相应计算装置,所述数据指示在该相应计算装置处发生的用于所述第一视频的相应观看时间;

对于用于所述第一视频的每个相应观看时间,基于发生了该相应观看时间的相应计算装置的用户的一个或多个特征,将该相应观看时间归因于多个观看者类别之中的一个或多个观看者类别;

对于所述多个观看者类别之中的每个相应观看者类别,将已经归因于该相应观看者类别的相应观看时间累加,以生成用于该相应观看者类别的累加观看时间,其中,用于该相应观看者类别的累加观看时间指示所述第一视频被呈现给该相应观看者类别内的用户达多长时间;以及使用至少基于用于所述多个观看者类别之中的、匹配第一用户的特定观看者类别的所述第一视频的累加观看时间的标准,来确定是否向所述第一用户提供所述第一视频的视频内容;以及响应于所述计算系统确定用于将所述第一视频的视频内容提供给所述第一用户的所述标准被满足,向所述第一用户的第一计算装置派发所述第一视频的视频内容以供呈现在所述第一计算装置处。

21.根据权利要求20所述的一个或多个非暂时性计算机可读介质,其中,确定是否向所述第一用户提供所述第一视频的视频内容包括确定用于匹配所述第一用户的所述特定观看者类别的所述第一视频的累加观看时间是否满足阈值观看时间。

22.根据权利要求20所述的一个或多个非暂时性计算机可读介质,其中确定是否向所述第一用户提供所述第一视频的视频内容包括:至少基于用于匹配所述第一用户的所述特定观看者类别的多个候选视频的相应累加观看时间,对包括所述第一视频的所述多个候选视频进行排名;以及基于所述排名选择所述多个候选视频中的一个或多个视频的视频内容。

23.根据权利要求20所述的一个或多个非暂时性计算机可读介质,其中:

派发所述第一视频的视频内容以供呈现在所述第一计算装置处包括将所述第一视频的视频内容流传输至所述第一计算装置,以及所述第一计算装置被配置为(i)从所述计算系统接收所述第一视频的视频内容的流以及(ii)播放所述第一视频的视频内容的流。

说明书 :

针对视频搜索的观看时间聚类

技术领域

[0001] 本文档主题通常涉及一种用于搜索数字化视频内容并且确定视频内容以通过通信网络派发的计算机实现技术。

背景技术

[0002] 视频共享服务为视频内容创建者通过网络(诸如,互联网)向其他参与者分发数字化视频提供平台。视频共享服务可以通过包括处于一个或多个位置的一个或多个服务器的计算系统来实现。内容创建者能够将他们的视频连同描述视频的元数据一起上传到计算系统,计算系统使用其以索引视频编制,从而使这些视频对于表示有兴趣观看它们的用户是可发现的。然后,视频共享服务能够接收来自请求视频内容的用户的搜索查询。在一些实例中,视频共享服务基于将与视频相关联的主题与用户已经提交给视频共享服务的搜索查询中指示的主题进行比较来选择视频以派发给用户。

发明内容

[0003] 本文档在一些方案中一般地描述了用于使用关于各种类别的用户已经观看在线视频多长时间的信息来改善视频搜索结果和推荐的系统、方法、装置、和其他技术。当请求用户被提供了一组不包括该请求用户期望针对特定查询接收到的视频的视频搜索结果时,该用户可以通过迭代的方式修改查询,直到为该请求用户识别到更合适的视频。有时候,即使结果确实包括用户期望接收的一个或多个视频,它们也不一定在显示给用户的靠前结果之中。这样能够导致有价值网络资源的不必要使用,也就是,服务器、客户端或路由器中的处理资源、通信链路上的带宽等的使用,仅仅为了处理由请求用户提交的多个搜索请求。这些搜索技术被认为是低效的并且是对有价值的处理资源和网络资源的损耗。本实施例旨在克服这些低效率。本文中描述实施例提出,使用关于正在请求视频或者过去已经请求视频的用户或用户装置的一个或多个测量和/或存储的属性和特征,向请求用户提供一组搜索结果。例如,视频搜索系统可以将观看时间信息使用作为探试法(heuristic),用于进行排名并选择视频内容以派发给用户。在一些实施方式中,视频搜索系统还可以基于已经由各种类别的用户观看他们的视频多长时间来进一步对视频内容创建者进行评分,并且能够将创建者的评分用作探试法,用于进行排名并选择视频内容以派发给用户。
[0004] 在一些实施方式中,本文中描述主题能够包括用于通过网络来派发视频的计算系统。计算系统能够包括建模设备、前端服务器、请求管理器、一个或多个视频文件存储装置、视频选择器、或它们的一部分或全部的组合。所述建模设备(i)对于所述计算系统已经通过网络在客户端装置处呈现的各种数字化视频获得观看时间信息,所述观看时间信息指定所述各种数字化视频在客户端装置处被呈现的时间量,(ii)基于与客户端装置相关联的用户特征将观看时间信息分组成不同的群组,以及(iii)基于观看时间信息的分组来确定所述各种数字化视频被呈现给不同群组的用户达多长时间。所述前端服务器接收对视频内容的请求并且通过网络将响应于所述请求而识别的视频内容派发给与计算系统分离的计算装置。所述请求管理器包括一个或多个处理器,所述请求管理器分析对视频内容的所述请求并且识别请求中的选择标准,所述请求包括识别提交了对视频内容的所述请求的用户的一个或多个特征。所述一个或多个视频文件存储装置存储已经通过各种参与方使可用于通过网络分发的多个数字化视频。所述视频选择器包括一个或多个处理器,所述视频选择器从所述视频文件存储装置中选择用于多个数字化视频之中的特定数字化视频的视频内容,以响应于请求而派发给所述计算装置,其中,所述选择至少部分地基于所述建模设备所指示的、所述特定数字化视频已经在与具有以下特征的用户相关联的客户端装置处被呈现了多长时间:该特征与提交了对视频内容的所述请求的用户的一个或多个特征相匹配。
[0005] 这些和其他实施方式能够选择性地包括以下特征中的一个或多个。
[0006] 建模设备能够通过将观看时间信息的相应部分指派给不同的观看者类别来将观看时间信息分组成不同的群组,所述不同的观看者类别对应于与呈现了各种数字化视频的客户端装置相关联的用户的不同特征的集合。建模设备还能够对于每个相应观看者类别,在数字化视频群组中的、已至少部分地在与所述相应类别中的用户相关联的计算装置处被呈现的数字化视频之中,识别该相应观看者类别中的用户的观看时间的分布。
[0007] 对于在一个或多个视频文件存储装置上存储的多个数字化视频之中的每个相应数字化视频,所述建模设备能够:根据观看时间信息并且对于多个观看者类别之中的每个相应观看者类别,识别所述相应数字化视频在与所述相应观看者类别中的用户相关联的客户端装置处被呈现了多长时间;以及对于所述多个观看者类别之中的每个相应观看者类别并且基于所述相应数字化视频在与该相应观看者类别中的用户相关联的客户端装置处被呈现了多长时间,向该相应数字化视频指派评分,所述评分指示该相应数字化视频与该相应观看者类别的相关性。
[0008] 通过视频选择器选择的用于特定数字化视频的视频内容能够包括所述特定数字化视频、所述特定数字化视频的标题、所述特定数字化视频的描述、或者到所述特定数字化视频的超链接中的至少其中一个。
[0009] 提交了对视频内容的所述请求的所述用户的所述一个或多个特征能够包括所述用户的人口统计学特征或所述用户的行为特征中的至少一个。
[0010] 提交了对视频内容的所述请求的所述用户的所述一个或多个特征可包括至少指示所述用户的年龄或性别的人口统计学特征。
[0011] 提交了对视频内容的所述请求的所述用户的一个或多个特征能够包括行为特征,所述行为特征指示由所述用户在所述用户提交了对视频内容的所述请求的相同会话中所提交的一个或多个查询。视频选择器能够至少基于在其他用户也提交了所述一个或多个查询或者被确定为与所述一个或多个查询类似的至少一个查询的会话期间、所述特定数字化视频在与所述其他用户相关联的客户端装置处被呈现了多长时间,来选择派发用于多个数字化视频之中的特定数字化视频的视频内容。
[0012] 提交了对视频内容的所述请求的所述用户的所述一个或多个特征包括指示与对视频内容的所述请求相关联的所述用户的导航历史的行为特征。所述视频选择器至少基于在导致了其他用户观看所述特定数字化视频的浏览会话中、所述特定数字化视频在与具有与提交了所述请求的所述用户相同或类似导航历史的所述其他用户相关联的客户端装置处被呈现了多长时间,来选择派发用于所述多个数字化视频之中的所述特定数字化视频的视频内容。
[0013] 视频选择器还被配置为选择视频内容以派发给各种计算装置,作为给所述各种计算装置的相应用户的推荐。
[0014] 响应于接收到针对视频内容的所述请求,所述请求管理器被配置为识别所请求的视频内容的一个或多个主题,包括根据作为所述请求的一部分的用户录入的查询中的至少一个来识别主题,或者根据与所述请求中未包括的用户相关联的信息来识别主题。视频选择器可以被配置为通过以下步骤来选择视频内容以派发给计算装置:识别被确定为与所述一个或多个主题相关的数字化视频;至少部分地基于所识别的数字化视频中的每个视频已经在与具有以下特征的用户相关联的客户端装置处被呈现了多长时间,来对所识别的数字化视频进行排名:所述特征与提交了对视频内容的所述请求的所述用户的所述一个或多个特征相匹配;以及基于所述排名,选择用于一个或多个排名靠前的数字化视频的视频内容以派发给所述计算装置,包括用于所述特定数字化视频的所述视频内容。
[0015] 该系统还包括仪器管理器,所述仪器管理器包括一个或多个处理器,所述仪器管理器在各种网页中生成并嵌入计算机代码,所述各种网页由计算系统派发给所述各种客户端装置以供呈现各种数字化视频,其中,所述计算机代码被配置为当在所述各种客户端装置上被执行时使得所述各种计算装置周期性地通过网络向计算系统报告所述各种数字化视频在所述各种客户端装置处被呈现的时间量。
[0016] 本文中描述主题的一些实施方式能够包括计算机实现方法。该方法能够包括:在计算系统处获得数据,对于多个计算装置之中的被派发了由所述计算系统托管的第一视频的至少一部分的每个相应计算装置,所述数据指示在该相应计算装置处发生的用于第一视频的相应观看时间;对于每一个相应观看时间,基于该相应观看时间所发生的相应计算装置的用户的一个或多个特征,将该相应观看时间与多个观看者类别中的一个或多个观看者类别相关联;对于所述多个观看者类别之中的每个相应观看者类别,将与该相应观看者类别相关的相应观看时间累加,以生成用于该相应观看者类别的累加观看时间;以及在所述关联之后,至少基于用于匹配第一用户的观看者类别的所述第一视频的所述累加观看时间,来确定是否向所述第一用户提供与所述第一视频相关联的视频内容。
[0017] 这些和其他实施方式能够选择性地包括以下特征的一个或多个。
[0018] 确定是否向所述第一用户提供与所述第一视频相关联的视频内容包括确定用于匹配所述第一用户的观看者类别的第一视频的所述累加观看时间是否满足阈值观看时间。
[0019] 确定是否向所述第一用户提供与所述第一视频相关联的视频内容包括:至少基于用于匹配所述第一用户的所述观看者类别的多个候选视频的相应累加观看时间,对包括所述第一视频的所述多个候选视频进行排名;以及基于所述排名选择与所述多个候选视频中的一个或多个视频相关联的视频内容。
[0020] 所述多个观看者类别能够基于观看者的人口统计学特征和观看者的在线行为特征中的至少一个对观看者进行分类。
[0021] 对于所述多个观看者类别中的每个相应观看者类别,能够将相应质量评分指派给相应观看者类别。
[0022] 能够识别所述多个观看者类别之中的第一观看者类别中的用户对第一视频的第一观看时间;响应于识别第一观看时间,能够将所述第一视频的创建者的性能评分增加基于所述第一观看时间和指派给第一观看者类别的所述相应质量评分的量;能够识别所述多个观看者类别之中的第二观看者类别中的用户对第一视频的第二观看时间。
[0023] 响应于识别到第二观看时间,将所述第一视频的所述创建者的所述性能评分增加基于所述第二观看时间和指派给所述第二观看者类别的相应质量评分的量。
[0024] 该方法能够包括基于作为相应观看者类别中的观看者观看由所述计算系统托管的视频的结果而生成的收益,来确定分配给相应观看者类别的所述相应质量评分。
[0025] 本文中描述主题的一些实施方式能够包括一个或多个非暂时性计算机可读介质,所述一个或多个非暂时性计算机可读介质具有其上存储的指令,所述指令在由一个或多个处理器执行时使得执行以下操作。所述操作能够包括在计算系统处获得数据,对于多个计算装置之中的被派发了由所述计算系统托管的第一视频的至少一部分的每个相应计算装置,所述数据指示在该相应计算装置处发生的用于第一视频的相应观看时间;对于每个相应观看时间,基于发生了所述相应观看时间的相应计算装置的用户的一个或多个特征,将该相应观看时间与多个观看者类别之中的一个或多个观看者类别关联;对于所述多个观看者类别之中的每个相应观看者类别,将与该相应观看者类别相关的相应观看时间累加,以生成用于该相应观看者类别的累加观看时间;以及在所述关联之后,至少部分地基于用于匹配第一用户的观看者类别的第一视频的所述累加观看时间,来确定是否向所述第一用户提供与所述第一视频相关联的视频内容。
[0026] 本文中描述主题的一些实施方式能够包括用于通过网络派发视频的计算系统。该计算系统能够包括:建模设备,所述建模设备获得用于计算系统已经通过网络呈现的各种数字化视频的观看时间信息,所述设备包括用于测量与系统的一个或多个用户相关联的一个或多个属性的第一处理器,包括测量相应用户对一个或多个视频的观看时间信息(例如,测量所述一个或多个视频在与该相应用户相关联的计算装置处被呈现了多长时间);建模设备还被配置为基于观看各种视频的用户的所存储或所测量的特征将所测量的观看时间信息分组成不同的群组,并且基于所述分组确定不同群组的用户已经观看各种视频多长时间;前端服务器,所述前端服务器接收对视频内容的请求并且将响应于所述请求而识别的视频内容通过网络派发给与计算系统分离的计算装置;请求管理器,所述请求管理器包括一个或多个处理器,所述请求管理器分析对视频内容的所述请求并且识别所述请求中的选择标准,包括识别提交了对视频内容的所述请求的用户的一个或多个特征;一个或多个视频文件存储装置,所述一个或多个视频文件存储装置存储已经通过各种参与方使能够用于通过所述网络分发的多个数字化视频;以及视频选择器,所述视频选择器包括一个或多个处理器,所述视频选择器从所述视频文件存储装置中选择用于多个数字化视频之中的特定数字化视频的视频内容,以响应于所述请求而派发给计算装置,其中,所述选择至少部分地基于由所述建模设备所指示的、所述特定数字化视频已经由具有以下特征的用户观看了多长时间:所述特征与提交了对视频内容的所述请求的用户的一个或多个特征相匹配。
[0027] 在一些实施方式中,本文中描述技术在某些实例中可以实现以下优点的一个或多个。通常,观看时间和创建者性能探试法可以允许视频搜索系统更好地识别用户有兴趣观看的视频。类似地,视频搜索系统可以降低向用户的计算装置派发与用户的搜索查询并非充分相关、或者用户并非特别有兴趣观看的视频这种情况的发生。作为为用户提供更好的视频选择的结果,搜索系统可以节约服务器资源,否则这些资源会浪费在向用户派发用户并非有兴趣观看的视频上面。类似地,这些技术可以通过降低与不良视频选择有关的视频业务的量来节约网络带宽,并且可以通过降低用户实际上没有兴趣观看的视频的回放时间来节省用户装置上的电力。在一些实施方式中,创建者性能评分能够鼓励创建者生成质量视频内容,质量视频内容被指向其与视频共享服务的交互不成比例地增强服务的价值的某些类别的观看者。

附图说明

[0028] 图1A和图1B图示各种用户与视频搜索系统交互,以请求在线视频内容的概念图。在图1B中,视频搜索系统使用观看时间和创建者性能探试法来为用户改善视频内容的选择。
[0029] 图2描绘其中能够在计算机系统之间捕捉、分析、和共享视频内容的示例环境的方框图。
[0030] 图3示出包括视频搜索系统和视频存储系统的示例计算系统的方框图,该示例计算系统使用视频观看时间信息来确定视频内容,以派发给观看者的与计算系统通信的各种计算装置。
[0031] 图4描绘用于基于关于观看者的各种群体已经观看不同视频多长时间的历史信息来生成观看时间模型的示例过程的流程图,视频搜索系统使用该观看时间模型来影响对用于派发给用户的视频内容的选择。
[0032] 图5是使用关于其他观看者(与第一观看者类似)在过去的时间段期间已经观看各种视频多长时间的信息,来选择视频内容以服务给观看者的计算装置的示例过程的流程图。
[0033] 图6是用于确定创建者性能评分并使用它对视频内容进行排名以及分配向创建者分发的资产,以改善提交给视频共享服务的视频的质量的示例过程的流程图。
[0034] 图7示出可以使用以实现本文中描述计算机实现方法和其他技术的计算装置和移动计算装置的示例。
[0035] 在各个附图之中相同的标记表示相同的元素。

具体实施方式

[0036] 用于提供视频共享服务的一些技术可以基于查询信息提供结果,这些技术具有上述缺点,导致对有用网络和处理资源的压力。本文中描述实施例提出一种基于一个或多个属性对视频数据进行聚类和分类的方法,所述一个或多个属性涉及通过系统的一个或多个用户已经执行的动作,或者涉及与系统上存储的关于所述用户的特征。用户的动作可以是过去的事件或实时的事件,诸如关于过去的搜索、先前的选择、对一个或多个类似视频的响应等所获得的数据。还可以使用诸如用户偏好和个人信息的所存储的细节这样的特征。在一些方案中,本文档通常描述了使用关于各种类别的用户已经观看在线视频多长时间的信息来改善视频搜索结果和推荐的系统、方法、装置、和其他技术。
[0037] 在一些示例中,计算系统可以实现在线视频共享服务,该服务托管由独立创建者的集合提交的视频并使得创建者的视频可用于通过网络(例如,互联网)分发给一个或多个观看者。观看者可以访问相应客户端装置上的视频共享服务并搜索该服务上托管的视频。系统还可以向观看者呈现对观看者很可能是感兴趣的推荐。
[0038] 根据本文中描述技术,可以将历史视频观看时间数据使用作为探试法,用于确定要呈现给用户的视频搜索结果和推荐。例如,计算系统可以识别与已经提交视频搜索请求的特定观看者相关联的人口统计学特征或行为特征。基于观看者的特征,系统可以将观看者分类成一个或多个观看者类别,并且根据相同或相关类别中的其他观看者确定已经累加高观看时间的视频。然后,例如在系统响应于观看者的查询而返回的搜索结果中,可以提升这些类别中具有较高观看时间的视频。在一些实施方式中,可以将本文中描述技术附加地或可替选地应用于基于在不同的观看者类别中其各自视频的观看时间度量对与服务相关联的创建者进行评分和排名。然后,系统能够将创建者的评分或排名使用作为用于确定视频搜索结果和推荐以及用于在创建者之间分发资产的进一步探试法。
[0039] 参照图1A和图1B,示出用户与视频搜索系统进行交互以请求在线视频内容的概念图。这些附图示出,在一些实施方式中,视频搜索系统能够基于观看时间探试法、创建者性能探试法或者这两者来改善视频内容的选择以派发给用户,以便更有效地向用户提供用户很可能感兴趣的视频内容。通过期初向用户派发更相关的视频内容,本文中描述技术可以更好地使用系统资源,因为用户不需要对在达到满意的视频之前播放不同的视频进行很多查询或选择。因此,视频搜索系统的服务器可以使用更少的计算资源以及降低识别不满意的视频内容并将其传输给用户的成本。此外,可以通过降低网络携载给用户装置的不满意视频内容的数据的量来节约将用户的装置连接到视频搜索系统的服务器的通信网络(例如,局域网、广域网、无线网络和/或互联网)的带宽。在某些情况下,这对于无线和蜂窝数据网络尤其重要,在这些网络中,其中由单个用户消耗的带宽的量受到严密管制,以便确保平均而言,网络的容量不会由于大量用户的活动而被淹没。流传输视频和其他视频内容需要相对较大的带宽量(例如,与文本、静态图像、或某些其他内容类型相比),因此降低网络上传输的不必要视频内容的量对网络性能会有显著影响。
[0040] 在一些实施方式中,本文中描述使用观看时间探试法、创建者性能探试法或者它们的组合来更好地将视频内容指向用户的技术还能够改善用户的计算装置的方案。在用户装置上下载、流传输、和播放视频通常是计算成本费用很大的活动。当实施例提议下载、流传输、和/或播放被识别为用户有兴趣观看的视频内容时,可以通过当前所述实施例来降低这些费用的一部分。此外,对于移动装置和其他电池供电的计算装置,节省由于与获取和处理不满意的视频内容有关的活动的计算费用能够节约功率并降低装置上的电池损耗,从而延长装置的电池寿命。此外,移动装置的用户还可以受益于更有效地达到期望的内容,例如因为,可以降低对来自与移动运营商网络上的用户账户相关联的有限数据计划的不满意视频内容花费的数据的量。
[0041] 在图1A中,示出用户102使用移动计算装置104以向视频服务器106提交视频搜索查询。移动计算装置104例如可以是智能手机、平板计算装置、上网本、笔记本计算机、或可穿戴装置。虽然未示出,但是用户可以可替选地提交来自其他类型的计算机的查询,例如能够流传输在线视频内容的台式计算机、电视装置等。在图1A的示例中,用户102将搜索查询提交给搜索系统的视频服务器106,搜索系统提供视频共享服务,但是在响应于搜索请求而选择视频内容以派发给计算装置104方面不能使用观看时间探试法或创建者性能探试法(如同至少部分地基于观看时间数据确定的)。视频服务器106通常可以包括一个或多个计算机的集合,并且可以跨越处于一个或多个地理分离位置中的一个或多个计算机进行处理。
[0042] 在图1A的示例中,从用户102发起视频搜索会话的时间起,用户102在最终获得满意的视频内容之前提交对三个搜索请求的查询。在图1A中将各个搜索请求和响应表示为阶段110-120。因此,在阶段110处,用户102经由他的或她的移动装置104向视频服务器106提交对第一搜索请求110的查询。在阶段112处,视频服务器106响应于第一搜索请求向用户102提供用于一个或多个视频的内容。用户102可以查看由服务器106提供的初始视频内容并确定他或她通常对那些视频不感兴趣(也就是,视频不令人满意)。在一些实施方式中,作为对搜索请求的响应,视频服务器106可以返回多个搜索结果的列表,这些搜索结果分别识别视频服务器106已经确定为与请求相关的多个视频中的不同视频。用户102可以从列表中选择搜索结果,以使移动装置104开始流传输并播放由所选择的搜索结果引用的特定视频。
[0043] 在一些实例中,通过选择一个搜索结果并且只观看相对应视频的短片段直到用户102所见已足以决定他或她是希望观看该视频的更多内容(例如,因为该视频是令人满意并且与用户有兴趣观看的主题有关)还是他或她希望找到另一个视频,用户102可以“浏览”搜索结果直到找到满意的内容。在一些情况下,如果用户102没有响应于第一查询而找到满意的视频,那么用户可以细化查询并且提交更新的搜索。浏览视频结果的新列表的过程可以重复进行,如果没有识别到满意的视频,则执行更新的搜索。因此,用户102在阶段114处提交第二视频查询,在阶段116处接收第二响应。在阶段118处,直到用户102提交具有第三查询的搜索请求,视频服务器106才用识别到用户102发现满意的一个或多个视频(如阶段120的检查标记所示)的结果响应。因为用户观看了视频中并非用户102最终想要观看的部分,所以导致观看视频的每个新的搜索请求提交和选择的搜索结果消耗视频服务器106处的CPU周期,消耗网络带宽,以及有助于移动装置104上的电池损耗。
[0044] 与图1A的场景不同,图1B中表示场景提供计算系统的视频服务器156,其能够使用观看时间模型158和创建者模型160中的至少一个作为探试法,来确定要向特定用户152呈现的视频内容(例如,响应于搜索请求或作为推荐)。通常,在此场景中,用户152使用他的或她的移动装置154向视频服务器156提交视频查询(阶段122),而视频服务器156提供一个或多个视频结果作为对搜索请求的响应(阶段124)。相对于服务器106在图1A的场景中提供的初始结果,在该实例中,改善了服务器156发送给移动装置154的初始视频结果。例如,用户152甚至可以在服务器156对视频搜索会话的第一查询的响应中找到满意的视频内容,或他或她想要定位的特定视频。通常,作为使用观看时间和/或创建者性能探试法的结果,服务器106能够为用户152识别更多的相关视频。因此,用户152不需要浏览很多视频片段或作为很多精细查询进行提交以定位满意的内容。因此,图1B中用户152的视频搜索会话对视频服务器156产生更少的计算压力(strain),使用更少的网络资源/带宽,并且降低移动装置154上不必要的CPU周期和电池损耗。
[0045] 注意的是,图1A和图1B所描述的场景表示了一般可以通过在视频服务器系统处使用观看时间和创建者性能探试法来实现的优点。但是,并不会总是响应于初始搜索而将满意的内容派发给用户,但跨很多用户的聚合体验中以及随着时间的推移,在本文中描述的一些实施方式中,这些探试法能够促进更好、更早地识别要派发给用户的相关视频内容。相应地,这样能够带来如上所述的很多优点。
[0046] 图2描述其中能够在计算机系统之间捕捉、分析、和共享视频观看时间数据的示例环境200的方框图。数据通信网络202使数据能够在多个电子装置与系统之间通信。在该环境200中,用户能够访问视频内容、提供视频内容、交换信息、以及通过网络202搜索视频。网络202例如能够包括局域网(LAN)、蜂窝电话和数据网络、广域网(WAN)(例如,互联网)、或它们的组合。网络上的链接能够是有线链接或无线链接或两者。此外,视频内容创建者能够使用视频创建者系统226生成并创建视频以通过网络200共享。
[0047] 在一些实施方式中,环境200包括视频搜索系统210。在操作中,视频搜索系统210能够实现视频共享服务,视频共享服务使各种参与方(创建者)能够进行可用于在线分发给其他参与方(观看者)的数字化视频。可以从网站或者与一个或多个域相关联的应用程序访问视频分享服务。例如,参与方可以将原始视频内容上传到视频搜索系统210,并且视频搜索系统210能够将视频存储在视频存储系统211中并且将这些视频在该视频存储系统211中索引。然后在观看者系统218处的观看者可以根据观看者的一个或多个偏好查询视频搜索系统210以请求视频内容。在一些实施方式中,将视频搜索系统210配置为基于在一个时间段上通过类似情景的用户的群组观看各种视频多长时间的指示来向用户提供视频内容。下面参照图3进一步描述视频搜索系统210和视频存储系统211的细节。
[0048] 通常,每个观看者能够通过与相应观看者相关联的观看者系统218访问视频。给定的观看者系统218能够包括能够通过网络202请求、接收和播放视频的电子装置或装置的集合。示例观看者系统218可以包括智能电话、平板计算装置、笔记本电脑、台式电脑、智能电视装置、可穿戴计算装置、虚拟现实装置、增强现实装置、或它们的两个或更多个的组合。观看者系统218可以包括用户应用程序,例如网络浏览器或本地媒体播放器应用程序,它们通常响应于用户动作而通过网络202发送和接收数据。网络浏览器能够使用户能够显示通常位于互联网或局域网的网站处的网页上的文本、图像、视频、音乐以及其他信息并且与其进行交互。媒体播放器应用程序可以播放从视频搜索系统210下载或流传输的数字化视频,并且可以生成观看时间报告,该观看时间报告被发送回到视频搜索系统210,以识别观看者怎样观看在观看者系统218上的所派发的视频。
[0049] 在一些实施方式中,环境200能够包括发布者网站204,该发布者网站204包括一个或多个资源205,所述一个或多个资源205与域相关联并且通过处于由一个或多个位置的一个或多个服务器托管。通常,网站是以超文本标记语言(HTML)格式化的网页的集合,其能够包含文本、图像、多媒体内容(例如,视频)、和编程元素,例如脚本。每个网站204由内容发布者维护,该内容发布者是控制、管理和/或拥有网站204的实体。发布者网站204能够提供各种不同的网页,诸如在视频搜索系统210处呈现通过视频共享服务托管的视频的网页。
[0050] 在此情景下,资源205能够包括由发布者网站204通过网络202提供且具有资源地址(例如,统一资源定位符(URL))的任何数据。资源可以是HTML页面、电子文档、图像文件、视频文件、音频文件、和馈入源等。资源可以包括嵌入信息,例如,元信息和超链接、和/或嵌入式指令,例如客户端脚本。
[0051] 在一些实施方式中,环境200能够包括内容项目管理系统220,该内容项目管理系统220通常提供补充内容项目(例如,广告),用于呈现有视频搜索系统210派发给观看者系统218的视频。在一些实施方式中,内容项目管理系统220允许补充内容提供者限定选择规则,这些规则考虑特定视频观看者的特征,以向观看者提供相关补充内容。示例选择规则包括关键词选择,其中补充内容提供商为搜索查询、视频或视频内容元数据中呈现的关键词提供报价。能够选择与关键词相关联的补充内容项目,用于在与视频内容相关联的补充内容槽段中显示,这些关键词具有导致响应于竞卖而授予补充项目槽段的报价。例如,可以在观看者的装置上播放的视频附近或者在观看者装置上播放的一部分视频上方以横幅格式呈现补充内容。在一些实施方式中,系统可以使将补充内容以视频片段的形式呈现给观看者,作为为观看者播放所请求的视频之前的前序(lead-in)。当观看者选择补充内容项目时,观看者的装置能够生成对与所选内容相关联的登录页面的请求。
[0052] 补充内容项目管理系统220能够包括存储活动数据222和性能数据224的数据存储系统。活动数据222例如能够存储用于补充内容提供者的补充内容项目、选择信息、和预算信息。性能数据224能够存储指示所派发的补充内容项目的性能的数据。这种性能数据例如能够包括用于补充内容项目的点击率、用于补充内容项目的印象数目、以及用于补充内容项目的转换的数目。
[0053] 在一些实施方式中,能够将活动数据222和性能数据224用作向补充内容项目选择程序的输入。具体而言,内容项目管理系统220响应于对补充内容的每个请求来进行选择程序,以选择响应于该请求而提供的项目。系统220能够根据评分对补充内容项目进行排名,在一些实施方式中,该评分与基于补充内容项目报价的价格以及在性能数据224中指定的一个或多个参数成比例。能够选择由竞卖导致的最高排名的补充内容项目并且将其提供给请求用户装置。
[0054] 转向到图3,示出示例包括视频搜索系统302和视频存储系统304的计算系统300的方框图,该计算系统300使用视频观看时间信息来确定视频内容,以派发给各种观看者的与计算系统300通信的计算装置。在一些实施方式中,可以将图2的视频搜索系统210实现为图3的视频搜索系统302。在一些实施方式中,可以将视频存储系统211实现为图3的视频存储系统304。在一些实施方式中,可以将计算系统300进一步配置为执行分别由图4、图5和图6中的流程图表示的过程400、500、和/或600。视频搜索系统302和视频搜索系统304的每个可以在处于一个或多个位置的一个或多个计算机上实现。系统302和304的计算机可以通过参照图7描绘和描述的软件和硬件的组合来实现。
[0055] 在一些实施方式中,视频搜索系统302提供在线视频共享服务,其中各种参与方能够将数字化视频上传到服务,以使视频可用于分发给一个或多个其他参与方。出于本文档的目的,提交(例如,上传)用于通过服务分发的视频的参与方称为创建者,而通过服务观看视频的参与方称为观看者。在很多情况下,“创建者”可以包括有机地创建了他们自己的视频来与其他人共享的参与方,但是“创建者”还可以指的是这样的参与方,该参与方上传实际上通过一个或多个其他参与方创建的、但第一参与方希望在服务中共享的内容。视频搜索系统302可以包括创建者平台328,创建者平台328为创建者提供界面,以提交和监视他们的视频在共享服务中的性能。创建者可以利用服务向账户332注册并且可以使用各种工具330来促进视频内容的创建和分发。
[0056] 在一些实施方式中,视频搜索系统302可以实施策略和技术限制以防止参与方在不需要来自内容原始创建者的适当授权的情况下通过视频共享服务分发内容。视频搜索系统302通常可操作为至少部分地基于指示不同观看者类别中的用户已经观看不同视频多长时间的观看时间信息,来选择要作为给用户的推荐或者作为对用户提交的搜索查询的响应而提供的视频内容。在一些实施方式中,观看者能够流传输由计算系统300托管的数字化视频。在一些实施方式中,观看者能够下载由计算系统300托管的全部或部分数字化视频,以允许观看者例如在稍后离线观看视频。
[0057] 视频存储系统304通常负责存储、维护、和索引用于已经使可用于视频共享服务上分发的视频的视频内容。视频存储系统304能够包括视频内容存储库334和索引336。视频内容存储库304包括一个或多个处理器以及处于一个或多个位置的一个或多个存储装置,所述一个或多个存储装置存储用于大量数字化视频的视频内容。例如,当创建者将视频上传到视频搜索系统302用于共享时,能够针对搜索将视频文件提供给视频存储系统304、处理(例如,压缩并且制作为符合一个或多个标准分辨率)、存储、和索引。通常,视频内容可以包括实际的数字化视频本身以及关于数字化视频的相关元数据。例如,视频内容存储库334可以识别用于给定视频的标题、简短文本描述、和创建者ID,并且视频内容存储库334可以将元数据与视频存储系统304中的数字化视频文件相关。索引336包括使视频内容可搜索的信息,诸如对用于各种视频的所识别的元数据的引用、散列表等。视频存储系统304和视频搜索系统302能够在相互之间传递消息,以识别和提供要派发给与系统300分离的计算装置的视频内容(例如,通过互联网)。
[0058] 在一些实施方式中,视频搜索系统300能够包括观看时间建模设备306、视频内容选择器316、观看者简档管理器318、网络接口(前端服务器)324、请求管理器326、创建者平台328、或这些组件的全部或一部分的组合。通常可将这些组件中的每个实现为处于一个或多个位置的一个或多个计算机的硬件和软件的组合,诸如参照图7描述的计算机。
[0059] 通常网络接口324被配置为使能够用于视频搜索系统302的网络通信。网络接口324能够从创建者的计算装置接收请求,以使数字化的视频内容可用于在由搜索系统302提供的共享服务上分发。此外,网络接口324能够从观看者的计算装置接收请求,以提供用于向观看者呈现的共享视频内容,并且能够响应于他们的请求向观看者的计算装置派发视频内容。
[0060] 如由网络接口324所指示的是,通常将请求管理器326配置为处理从远离视频搜索系统302的计算装置接收的请求。对于来自观看者的计算装置的对视频内容的请求,请求管理器326能够分析所述请求,以识别要响应于所述请求而派发给观看者的计算装置的视频内容的一个或多个选择标准。该选择标准可以在给定请求的内容中明确指示和/或可以基于与该请求相关联的信息从到请求外部的数据源中识别。作为示例,一些请求可以明确包括识别由观看者录入和提交的一个或多个词项的搜索查询,其中所述词项指示用户已经针对搜索所指向(targeted)的视频内容的主题。
[0061] 但是,一些请求可能不包括搜索查询,或者可能不会明确识别已经请求的视频内容的主题。然而,请求管理器326可以基于与请求相关联的详细数据或元数据来识别用于该请求的主题或其他选择标准,诸如要向其呈现视频内容的用户的身份、指派给该请求的时间戳(指示提交请求的时间)、或者用户的指示要向其提交所请求的视频内容的位置的位置信息。例如,请求管理器326能够基于对请求的分析来识别目标观看者,然后能够从观看者简档管理器218识别用户的一个或多个特征,并且通过视频内容选择器316将其用作选择标准,用于确定要响应于请求而派发的视频内容。例如,当请求视频搜索系统302向用户提供对视频内容的推荐时(诸如,在用户首次访问视频共享服务的主页时并且在用户录入查询之前),视频内容请求可以不包括查询,因此仅通过已经访问主页就能够自动向用户呈现有用于观看对于用户可能感兴趣的数字化视频的选项。
[0062] 通常将观看时间建模设备306配置为基于观看时间数据来确定用于对视频、创建者、或两者进行评分的模型,观看时间数据识别到具有不同特征的各种观看者已经观看由视频搜索系统302托管的各种数字化视频多长时间(并且在视频存储系统304上存储的各种数字化视频多长时间)。如同视频搜索系统302的其他组件和子组件,建模设备306能够包括处于一个或多个位置的一个或多个计算机,所述一个或多个计算机包括一个或多个处理器和/或一个或多个计算机可读存储装置。建模设备306能够包括观看时间数据存储库308、仪器引擎310、一个或多个观看时间模型312、一个或多个创建者性能模型314、或它们的组合。
[0063] 观看时间存储库308存储在网络接口324接收的观看时间数据,其识别各种观看者已经观看由视频搜索系统302托管和呈现的视频多长时间。在一些实施方式中,观看时间存储库308能够包括数据库,该数据库记录从相应观看者的计算装置提供给视频搜索系统302的观看时间报告。每次从观看者的计算装置接收观看时间报告,能够在观看时间数据存储库308的数据库中添加或更新条目。在一些实施方式中,能够将观看者的计算装置上的视频回放应用配置为当观看者观看给定视频时和/或在观看者已经完成观看给定视频的全部或一部分之后,自动生成观看时间报告并提供给视频搜索系统302。
[0064] 例如,当观看者开始播放视频时,视频回放应用能够自动将指示视频开始时间的时间戳发送到在数据库中登录的视频搜索系统302。当观看者继续观看视频时,视频回放应用能够周期性地(例如,每1秒或更慢)对视频搜索系统302进行ping,以确认用户在继续播放视频。当观看者停止播放视频时,视频回放应用能够向视频搜索系统302发送消息,指示观看者已经停止视频,并且能够将消息记录在数据库中,以指示在会话中由观看者对视频的总观看时间。在一些实施方式中,视频回放应用可以存储用户观看的一个或多个视频的日志以及视频在一个时间段上(例如,在浏览会话的过程中、一小时、一天、一星期、一个月、一年等)的相应观看时间。然后,能够将存储的日志定期传输到视频搜索系统302,并且建模设备306能够将所记录的数据登记在观看时间数据存储库308中。在一些实施方式中,观看时间数据存储库308因此可以包括识别多个不同数字化视频的数据,并且对于每个相应视频,可以包括通过多个观看者中的每个观看者对视频的相应观看时间。
[0065] 在一些实施方式中,建模设备306能够包括仪器引擎310(或者仪器引擎可以是视频搜索系统302的独立组件)。通常将仪器引擎310配置为生成可执行代码或其他指令并将其注入到与客户端装置上视频的回放相关联的网页或应用中,以使客户端装置将观看时间数据报告回到视频搜索系统302。例如,仪器引擎310可以将脚本插入到呈现视频的网页中,并且当脚本在客户端计算装置处的网络浏览器中执行时,脚本监视正在客户端装置上播放的视频的状态,并且记录观看时间数据。然后,脚本能够不同步地将观看时间信息报告给视频搜索系统302。
[0066] 建模设备306还可操作为使用来自观察时间数据存储库308的信息以及关于其观看时间在观看时间数据存储库308中反映的观看者的信息来产生一个或多个观看时间模型312。在一些实施方式中,建模设备306能够从观看者简档管理器318访问或以其它方式获得关于观看者的信息。观看者简档管理器318通常可操作为将唯一识别符指派给观看者并将关于观看者的一个或多个特征的信息与他们的相应识别符相关。在一些实施方式中,通常能够将观看者的特征分类成两个类别的中的一个,即人口统计学特征和行为特征。人口统计学特征可以涵盖观看者的个人特征(例如,年龄组、性别)和/或观看者的外部特征(例如,其中观看视频的地理位置、观看视频的日时刻、计算装置的类型、其上观看者观看视频的计算装置的类型、用于观看视频的视频回放应用、用于观看视频的浏览器应用、观看者的网络连接带宽)。
[0067] 行为特征通常涉及观看者与观看特定视频相关联而采取的动作。行为特征的一个示例是在导致观看者观看特定视频的用户会话期间用户向视频搜索系统和/或另一个计算系统(例如,一般搜索引擎)提交的一个或多个查询的集合。例如,观看者1可能已经访问了由视频搜索系统302提供的视频共享服务的主页并且录入了第一查询“足球”。在响应于第一查询而看见视频结果的列表之后,观看者1录入精细的查询“hail mary”。作为响应于第二查询的视频内容,视频搜索系统302向观看者1的计算装置返回视频搜索结果的第二列表,观看者1从其中选择要观看的第一视频。汤姆的计算装置能够生成观看时间报告,观看时间报告被发送到视频搜索系统302,其包括识别第一视频的信息、识别观看者1的信息(例如,观看者1的唯一ID)、识别观看者1观看第一视频多长时间的信息、以及识别第一查询和第二查询的信息。然后,视频搜索系统302能够处理和存储来自观看时间数据存储库308、行为数据存储库322、或两者中的报告的信息的全部或一部分。因此,系统302能够将用于第一视频的观看时间与关联于第一查询、第二查询、或两者(或从第一查询和/或第二查询中提取的关键词)的观看者类别相关联。行为特征的其他示例包括观看者导航数据,其识别在将观看者引导到给定视频的会话中用户访问的一个或多个网页;观看历史数据,其指示其中在用户也观看作为某些观看时间数据的主题的特定视频的会话中用户观看的一个或多个视频;内容项目的点击数据或转换数据(例如广告),其为用户选择的与观看特定视频相关的。在一些实施方式中,观看者简档管理器318可以存储这样的数据,其识别用于选择视频内容或其他内容以派发给观看者的一个或多个内容定向参数。观看者简档管理器318、建模设备318、或两者可以将特定观看时间片段与生成观看时间的观看者的行为特征相关。在一些实施方式中,可以将由人口统计学数据存储库320和行为数据存储库322管理的数据存储在处于一个或多个位置的装置上的一个或多个数据库中。
[0068] 在一些实施方式中,如由人口统计学数据存储库320和/或行为数据存储库322所指示的是,观看者简档管理器318可以通过根据观看者的特征将其分组来限定多个观看者类别。在一些实施方式中,仅将每个独特的观看者指派给多个观看者类别的中的一个(即,观看者类别的特征的相应集合是不重叠的)。作为一个基本示例,可以基于年龄组特征和性别特征的相应组合来限定四个观看者类别,其中每个特征具有两个可能的替代值。第一组可以由25-35岁的男性观看者组成,第二组可以由25-35岁的女性观看者组成,第三组可以由35岁以上的男性用户组成,第四组可以由35岁以上的女性用户组成。当然,因为简档管理器318基于特征的增加数目和/或这些特征的可能值的增加数目来限定观看者类别,所以观看者类别的总数目可能会迅速增加。例如,通过将用户分成5个年龄组(而不是2个)中的一个,观看者类别的数目可以从4增加到10。通常,根据可用的观看者数据,可以根据需要粗略或细致地限定观看者类别。例如,可以使用数十个或数百个特征的组合来限定非常细致的观看者类别,或者还可以使用仅仅少数几个特征的组合来限定比较粗略的观看者类别。
[0069] 在一些实施方式中,观看者简档管理器318可以通过根据观看者的特征将其分组来限定多个观看者类别,其中观看者类别中的至少一些相互部分地重叠。因此,简档管理器318可以视情况将单个观看者指派给两个或更多个部分重叠的观看者类别。例如,第一观看者类别可以由以下观看者组成:(1)通过提交具有第一关键词的搜索查询来达到视频,以及(2)年龄在21-25岁。第二观看者类别可以由以下观看者组成:(1)通过提交具有第一关键词的搜索查询来达到视频,以及(2)为女性。因此,在本示例中,通过提交具有第一关键词的搜索查询来达到视频的观看者2、21-25岁之间的女性观看者适合第一观看者类别和第二观看者类别,因为它们并非是相互排斥的类别。
[0070] 可以通过各种技术或技术组合的任何来获得观看者特征和其他观看者简档信息。在一些实施方式中,观看者可以通过视频搜索系统302维护账户,并且用户可以自愿将人口统计学信息提供给视频搜索系统302,作为其账户数据的部分。在一些实施方式中,观看者信息可以从接收自观看者的计算装置的通信导出,该信息包括对从观看者的计算装置发送的视频内容和观看时间报告的请求。例如,位置数据可以从接收自观看者的计算装置的消息或者从接收自观看者的计算装置的消息导出,并且基于所述位置数据,能够将地理位置与观看者相关。在一些实施方式中,视频搜索系统302可以从除了观看者的计算装置本身之外的外部源获得观看者信息。例如,视频搜索系统302可以从社交网络获得社交数据,或者可以以其它方式从互联网上的网页或其他公共可用文档确定关于观看者的信息。
[0071] 在其中这里讨论的系统和其他技术收集关于用户(例如,观看者)的个人信息或者可以使用个人信息的情况下,可以向用户提供有以控制程序或特征是否收集用户信息的机会(例如,关于用户的观看时间、社交网络、社交动作或活动、职业、用户的偏好、用户的搜索历史、用户的导航历史、或用户的当前位置的信息),或以控制是否和/或怎样从视频服务器接收可能与用户更相关的内容的机会。此外,某些数据在存储或使用之前可以以一种或多种方式进行处理,从而删除个人身份信息。例如,可以对用户的身份进行处理,从而不能够对用户确定个人可识别信息,或者可以在获得位置信息(例如城市、邮政编码、或州等级)的情况下将用户的地理位置一般化,从而不能够确定用户的具体位置。因此,用户可以具有对关于用户怎样收集信息并且这样由系统使用的控制。
[0072] 再参照视频搜索系统302的建模设备306,如通过观看时间数据存储库308指示的是,建模设备306可以基于视频观察时间数据,以及如同观看者简档管理器318指示的是,基于其活动产生观看时间数据的观看者的特征,生成、存储、和维护(例如,更新)一个或多个观看时间模型312。通常,观看时间模型312存储指示观看者的各种群组观看单个视频或视频的群组多长时间的数据。在一些实施方式中,建模设备306基于相应视频或视频的群组的观看者的特征,通过对相应视频或视频的群组将观看时间分组来生成观看时间模型312。在一些实施方式中,建模设备306从观看者简档管理器318中识别适当的观看者群组。因此,由观看者群组采用的建模设备306可以与由观看者简档管理器318限定的观看者类别相对应,使得观看时间模型312指示观看者类别中的每个内的各种观看者观看单个视频或视频的群组多长时间。例如,观看时间数据存储库308可以示出在特定时间段上(例如,一小时、一天、一周、或一个月),5000个独特的观看者针对在所有观看者之中共8小时的累加观看时间观看特定视频。如观看者简档管理器318指示的是,观看时间模型312可以相应地在各种观看者类别之中指定用于特定视频的观看时间的分布。例如,观看时间模型312可以指示,8小时总观看时间中的37分钟是与位于城市地理地区的男性观看者相关联,总观看时间中的4.5小时是与乡村地理地区的女性观看者相关联,总观看时间中的70分钟是与农村地理地区的男性观看者相关联,并且该8小时观看时间中的剩余量是与位于城市地理地区的女性观看者相关联。因此,如通过每个类别中的观看者对视频的相对观看时间指示的是,观看时间模型312对于特定视频指示通过观看者的不同类别对该视频的相对兴趣。类似地,建模设备306可以增加其已经在视频共享服务或相关服务(例如社交网络)上达到一定状态的观看者的观看时间,作为对那些达到该状态的观看者的奖励,或者由于该状态表明观看者的观看习惯中的信任的级别而增加其已经在视频共享服务或相关服务(例如社交网络)上达到一定状态的观看者的观看时间。例如,相对于视频共享服务的未注册观看者的观看时间,可以提高视频共享服务的注册成员的观看时间。
[0073] 如上所述,在一些实施方式中,观看者简档管理器318能够限定部分重叠的观看者类别,使得给定的观看者能够属于多个不同的观看者类别。在这种实施方式中,建模设备306可以根据各种标准,根据观看者所属的观看者类别中的每个来分配观看者的观看时间。
例如,建模设备306可以将观看者的观看时间的40%分配给用户所属的第一观看者类别,并且能够将观看者的观看时间的剩余60%分配给用户所属的第二观看者类别。在一些实施方式中,在每个可用观看者类别之中观看者观看时间的分配能够基于指派给可用观看者类别的评分。例如,评分可以反映每个观看者类别对视频搜索系统302的相对值。例如,给定观看者可以属于第一观看者类别和第二观看者类别,建模设备306已经分别向它们指派评分5和
10。因此,根据观看者类别评分,可以将观看者的观看时间的1/3分配给第一观看者类别,将观看者的观看时间的2/3分配给第二观看者类别。在一些实施方式中,在每个可用观看者类别之中观看者观看时间的分配能够基于关于观看者或关于用于将用户分类成一个或多个观看者类别的数据的其他信息。例如,观看者简档管理器218可以处理关于观看者的数据,并且可以确定存在观看者是男性的可能性为百分之七十五,观看者是女性的可能性为百分之二十五。因为观看者简档管理器218对观看者的性别分类没有完全的信心,所以可以将观看者的观看时间的75%分配给至少部分由男性特征限定的观看者类别,将观看者的观看时间的25%分配给至少部分由女性特征限定的观看者类别。
[0074] 在一些实例中,针对视频的群组而不是单个视频或者除了单个视频之外来保持对观看者的观看时间的追踪可能是有用的。因此,在一些实施方式中,建模设备306可以确定观看时间模型312,对于视频的多个群组中的每个群组,观看时间模型312指示视频的观看时间在各种观看者类别之中的分布。例如,建模设备306可以分析来自观看时间数据存储库308的数据,以确定通过由观看者的群体在一个时间段里相应视频的群组中的总的视频的观看时间。然后,建模设备能够通过观看者类别将用于每个视频群组的观看时间分组,以生成观看时间分布。如通过视频存储系统304指示的是,建模设备306可以根据各种标准将视频分组。例如,可以通过创建者、通过通道、通过年龄(例如,从提交视频用于在视频共享服务上分发开始的时间量)、通过类型(例如,产品评论、音乐视频、动画、电视节目、动作、喜剧、恐怖、儿童视频)、通过受欢迎程度(例如,观看的总数)、或者它们的两个或更多个的组合将视频分组。通过为视频的群组确定观看时间分布,在一些实施方式中,通过由具有以下特征的观看者从具有相对高观看时间的视频的一个或多个群组中选择视频,视频选择器
316能够响应于对视频内容的请求更容易地确定视频内容以派发给观看者的计算装置,所述特征与要向其呈现所选择的视频内容的观看者的特征相匹配。
[0075] 因为视频搜索系统302可以不断地从观看者收集新的观看时间数据,所以可以将建模设备312配置为在连续或周期性的基础上更新或重新生成观看时间模型312(以及内容性能模型314)。在一些实施方式中,可以基于观看时间数据的滚动窗口来维护模型312、314。例如,每天一次,建模设备312可以基于过去7天发生的观看时间来更新模型312、314。
然后,每天,能够将模型312、314更新为并入来自最近一天的观看时间数据,并且丢弃超过一周旧的观看时间数据。在一些实施方式中,建模设备306能够用全新的一组数据来更新模型312、314(例如,可以每周仅使用来自最近一周的数据来重新生成模型)。在一些实施方式中,建模设备312、314可以不时地更新模型,以并入最近收集的一组观看时间数据而不丢弃较老的观看时间数据。
[0076] 观看时间模型312可以以各种方式组织视频观看时间信息的分组。在一些实施方式中,每个相应视频或视频群组可以与多个值相关,所述多个值分别指示在多个观看者类别的相应观看者类别中通过观看者对相应视频或视频的群组总(累加)的观看时间。在一些实施方式中,观看时间模型312可以指示相反的情况。即,对于多个观看者类别中的每个类别,可以在一组视频或视频的群组之中分配相应观看者类别中的观看者的观看时间。
[0077] 在一些实施方式中,观看时间模型312能够对于一个时间段上通过视频搜索系统302派发的每个视频或视频群组来指示用于多个观看者类别中的每个类别之中的相应视频或视频群组的观看时间的分布。如果在该时间段期间没有观看者观看特定类别内的给定视频,那么指派给该类别的观看时间可以为空(零)。在一些实施方式中,观看时间模型312可以识别针对每个观看者类别的实际观看时间总和(例如,第一类别中的观看者观看视频总共132分钟,而第二类别中的观看者观看视频总共61分钟)。在一些实施方式中,观看时间模型312可以识别针对每个观看者类别的相对观看时间总和(例如,对于该视频的观看时间的
68%由第一类别中的观看者观看,而对于该视频的观看时间的32%由第二类别中的观看者观看)。在一些实施方式中,视频搜索系统302可以将某些观看者的观看时间看得比其他观看者的观看时间更重要,并且因此在确定用于观看时间模型312的观看时间分布时,建模设备306可以加权单个观看者或观看者的群组的观看时间。例如,作为视频或视频的群组主题的某领域名人或专家可以具有它们的实际观看时间的三倍,或者可以降低其他用户的观看时间。
[0078] 在一些实施方式中,建模设备306能够使用视频观看时间数据来确定一个或多个创建者性能模型314。一般而言,创建者性能模型314识别创建者性能评分(即,针对已经向视频共享服务提交视频供分发的参与者的评分)。建模设备306能够基于各种类别的观看者已经观看创建者的视频多长时间来确定创建者的性能评分。通过这种方式,视频搜索系统302能够利用观看时间信息作为用于评估视频共享服务上的创建者的性能的度量。此外,并且如针对视频内容选择器316进一步所述,在一些实施方式中,能够将创建者性能评分使用作为用于排名和确定视频内容以派发给观看者的探试法。在一些实施方式中,视频搜索系统302还可以至少部分地基于性能评分来确定怎样将资产分配给创建者。
[0079] 在一些实施方式中,建模设备306可以如下确定创建者性能评分。首先,建模设备306从观看时间数据存储库308访问关于观看者在一个时间段上已经观看各种视频多长时间的信息。然后,建模设备306从观看者简档管理器318识别一个或多个观看者类别的集合,它将形成创建者性能评分的基础。在一些实施方式中,所识别的观看者类别的集合可以是涵盖所有观看者的观看者类别的完整集合,或者所识别的观看者类别的集合可以包括少于完整集合中的观看者类别的全部。例如,如果观看者类别的完整集合包括(1)超过45岁的男性,(2)35-45岁的男性,(3)超过45岁的女性,以及(4)35-45岁的女性,那么建模设备306可以基于所有四个类别(完整集合)中观看者的观看时间或者基于少于全部四个类别中观看者的观看时间,来确定创建者性能评分。
[0080] 然后,建模设备306通过基于其观看导致相应观看时间的观看者的特征将观看时间的相应片段指派给观看者类别中适当的类别,来为所识别的观看者类别中的每个生成观看时间的群组。例如,可以将通过其属于第一观看者类别的一个或多个观看者对一个或多个视频的观看时间指派给用于第一观看者类别的观看时间群组,可以将通过其属于第二观看者类别的一个或多个观看者对一个或多个视频的观看时间指派给用于第二观看者类别的观看时间群组,等。然后,基于这些分组,建模设备306累加每个观看者类别中的观看时间,以确定总观看时间,对于每个观看者类别,总观看时间指示在限定时间间隔上(例如,一天、一周、一个月)该类别内的观看者花费观看视频的时间的总量。建模设备306还通过创建者分解每个观看者类别中的总观看时间。也就是说,在每个观看者类别中,建模设备306识别通过该类别中的观看者观看的视频的所有创建者,并且对于识别的创建者中的每个确定用于该类别的总观看时间有多少是相应创建者的视频的观看时间。作为示例,建模设备306可以确定,在一个月的过程中,年龄45-55岁的观看者观看总共2000小时的视频,而年龄56-65岁的观看者在这个月上观看总共4000小时的视频。通过年龄45-55岁的观看者在这个月上对视频共享服务上通过第一创建者分发的多个视频的总观看时间可以被确定为130小时。通过年龄56-65岁的观看者在这个月上对视频共享服务上通过第一创建者分发的多个视频的总观看时间可以被确定为25小时。因此,与56-65岁的类别相比,能够看出第一创建者的视频对用于45-55岁的类别的总观看时间贡献更大的份额。
[0081] 此外,在确定创建者性能评分的过程中,建模设备306能够识别针对每个观看者类别的评分,该评分指示建模设备306在确定创建者性能评分方面将从观看者类别中的每个类别提供观看时间的多少权重。例如,可以对来自不同观看者类别的观看时间进行相互不同的加权,以奖励这样的创建者,该创建者的视频从视频共享服务认为更有价值的观看者类别相比于从视频共享服务认为价值较低的观看者类别生成更多的观看时间。因此,如果视频共享服务将视频内容指向观看者的特定人口统计学,那么与通过其他人口统计学中的观看者产生的观看时间相比,创建者能够为通过目标人口统计学中的观看者产生的观看时间接收更多信用。在一些实施方式中,建模设备306可以基于通过在一个时间段期间播放经由视频共享服务分发的视频,相应观看者类别中的观看者为这个时间段里的视频共享服务生成多少收益,来确定观看者类别评分。例如,视频搜索系统302可以连同第三参与方支付视频共享服务来呈现的附加赞助内容一起派发视频内容,用于向观看者呈现。因此,视频共享服务能够从派发赞助内容中生成收益,并且能够将收益归因于派发给观看者的视频内容的个别实例以及归因于派发给用户的相应类别的视频内容的集合。在一些实施方式中,建模设备306能够将评分指派给各种观看者类别,该评分与从派发赞助内容给各种观看者类别中的观看者生成的收益相对应。
[0082] 使用观看者类别评分以及与各种观看者类别相关联的观看时间,建模设备306能够计算创建者性能评分。在一些实施方式中,用于给定创建者的创建者性能评分能够通过以下步骤来计算:(1)对于每个相应观看者类别,确定(i)可归因于与给定创建者相关联的视频的相应观看者类别的总观看时间的份额,和(ii)用于相应观看者类别的观看者类别评分的乘积,以及(2)将所有观看者类别中的乘积求和。例如,考虑到这样的场景,其中第一类别的观看者在一个时间段上观看100分钟的视频,而第二类别的观看者在相同的时间段里观看200分钟的视频。通过第一类别中的观看者归因于特定创建者的视频的观看时间的份额是20分钟,而通过第二类别中的观看者归因于相同创建者的视频的观看时间的份额也是20分钟。用于第一视频的观看者类别评分为50,并且用于第二视频的观看者类别评分为
250。用于特定创建者的创建者性能评分能够被计算为(20/100)*(50)+(20/200)*(250)=
35。在一些实施方式中,视频共享服务能够使用创建者性能评分作为用于向创建者分发资产(例如,积分、鼓励、成员身份、对创造性工具的访问、或收益)的模型或探试法。
[0083] 视频内容选择器316可操作为响应于对视频内容的请求而选择视频内容以派发给各种计算装置。通常,视频内容选择器316能够基于如同观看时间模型312指示的观看时间信息,基于如同创建者性能模型314指示的创建者性能评分,或者基于这两者,来选择视频内容来派发。响应于来自特定观看者的请求,视频内容选择器316可以基于历史上识别一个或多个视频来选择用于一个或多个视频的视频内容以派发给特定观看者的计算装置,或者通过具备以下特征的各种观看者来观看与所述一个或多个视频相似的其他视频持续较长的时间,所述特征与针对其视频内容所指向的观看者的特征相匹配或相类似。例如,视频内容选择器316可以从请求管理器326识别提交了对视频内容的请求的用户是来自新墨西哥州Albuquerque的中年男性。然后,视频内容选择器316能够查询观看时间模型312,以识别观看时间数据指示的视频,所述视频被匹配请求用户的相同简档的其他用户优选(例如,观看更长时间)。通常,与通过匹配的或类似的观看者具有较低观看时间的视频相比,通过匹配或类似的观看者具有较高观看时间的视频更有可能响应于请求而被选择。继续前面的示例,视频内容选择器316可以被确定为与来自Albuquerque的中年男性的请求相关的多个视频进行排名。可以基于多个探试法对视频进行排名,包括候选视频的主题与请求的一个或多个主题、观看时间探试法和/或创建者性能探试法的匹配有多紧密。关于观看时间探试法,候选视频能够通过来自Albuquerque的中年男性或者通过类似人口统计学中的观看者观看视频在排名中更久。关于创建者性能探试法,可以在排名中提升通过具有更高性能评分的创建者的候选视频。然后,视频选择器316能够选择用于排名靠前的候选视频中的一个或多个的视频内容,以派发给请求用户的计算装置。在一些实施方式中,所派发的内容可以是数字视频本身。在一些实施方式中,所派发的内容不一定包括数字视频本身,但是可包括对数字视频的引用(例如,包括所选视频的标题、描述、和/或代表性图像的搜索结果)。
[0084] 在一些实施方式中,视频选择器316可以应用回退(backing-off)技术来识别与已经请求视频内容的用户的特征类似的观看者特征(以及因此观看者类别)。例如,视频选择器316不是限制对新墨西哥州Albuquerque的中年男性观看者对观看时间的分析,而是查询观看时间模型312,以识别通过整个美国西南部的中年男性观看者的视频观看时间。通过扩展相关地理区域(例如通过回退),可以分析更多数据点,以确定更可靠的结果。
[0085] 转向到图4,示出了用于基于关于观看者的各种群组观看不同视频多长时间的历史信息来生成观看时间模型的示例过程400的流程图,视频搜索系统能够使用该观看时间模型来影响对用于派发给用户的视频内容的选择。从过程400得出的观察时间模型通常等同于已经参照图3所描述的观看时间模型312。在一些实施方式中,可以贯穿本文档所讨论的系统和装置来执行过程400,包括通过图3的观看时间建模设备306。
[0086] 当计算系统获得观看时间数据的集合时,这些过程能够始于阶段402。观看时间数据能够为各种视频中的每个视频指示各种观看者在他们相应的计算装置观看视频多长时间。例如,表示观看者已经用于仅5秒观看10分钟视频的数据可以强烈提示观看者对该视频不感兴趣。但是,基本上观看整个视频的观看者更有可能对该视频感兴趣。因此,观看时间用作用于推断观看者对视频感兴趣程度的代表。在一些实例中,能够通过个别观看者的计算装置将观看时间数据报告给产生观看时间模型的中央计算系统。在一些实施方式中,计算系统可以使用关于观看者观看各种视频的时间的实际长度的数据来生成观看时间模型。但是,就实际观看时间可能与较短视频相比更偏爱较长视频而言,在一些实施方式中,计算系统能够将观看时间数据标准化,使得其表示整个视频长度被观看者观看的部分(例如,观看者1观看视频1的30%,观看者2观看视频1的78%)。
[0087] 在阶段404处,计算系统识别在观看时间数据中表示其视频观看的观看者的特征。这些特征可以包括观看者的人口特征、观看者的行为特征、观看者的其他特征、或它们的组合。在阶段406处,计算系统将观看者分组成不同观看者类别的集合。每个观看者类别能够包括彼此共享相同特征的集合的观看者。例如,可以将使用相同或类似搜索查询达到他们相应视频的所有观看者分组在一起,或者将在相同地理地区中具有相同或类似导航历史的所有观看者分组成一个观看者类别。在一些实施方式中,系统可以以非常细致的等级将观看者分组,使得群组中的所有观看者共享多个特征的相同集合。然后,通过将其观看者满足类似性的阈值级别的群组合并,系统可以将细致的群组中的一些集群在一起(例如,具有类似特征的观看者或者具有类似观看时间分布的群组)。在阶段408处,系统将观看时间信息与适当的观看者类别相关。例如,能够将用于通过第一观看者类别中的观看者观看的视频的观看时间分组在一起,能够将用于通过第二类别中的观看者观看的视频的观看时间分组在一起,等。在阶段410处,计算系统确定通过观看者类别中的每个中的观看者对视频的观看时间的分布,在阶段412处,将关于这些分布的信息存储在观看时间模型中。
[0088] 图5是用于使用关于与目标用户类似的用户在过去的时间段期间已经观看各种视频多长时间的信息,来选择视频内容以派发给目标用户的计算装置的示例过程500的流程图。在一些实施方式中,可以通过本文档讨论的计算系统和装置来执行过程500,包括通过参照图3讨论的视频搜索系统302。
[0089] 在阶段502处,视频搜索系统接收将视频内容派发给用户的请求。该请求可能源自用户作为搜索用于特定视频内容的请求,或者例如该请求可能已经生成,以向用户提供非请求的视频推荐。在阶段504处,搜索系统识别与该请求相关联的选择标准。可以在请求中明确指定选择标准(例如,搜索查询中的关键词),或者可以基于该请求中包含的信息(例如,请求中识别的用户的特征)从请求中导出选择标准。在一些实施方式中,系统能够识别包括视频主题(阶段506)和用户特征(阶段508)两者的选择标准。在阶段510处,视频系统访问一个或多个观看时间模型,诸如参照图3和图4所述的观看时间模型。例如,观看时间模型可以指示通过不同类别的观看者对各种视频的观看时间的分布。在阶段512处,系统能够响应于接收的请求,来确定用于一组候选视频的内容以派发给用户。可以基于选择标准(例如,匹配查询中指定的主题的视频)并且基于由观看时间模型指示的观看时间分布来选择候选视频。在阶段514处,搜索系统根据一个或多个探试法对候选视频进行排名,以确定被确定为与用户最相关的视频的有序的列表。在一些实施方式中,系统可以至少部分地基于已经通过其特征与目标用户的特征相匹配或是类似的用户来观看候选视频的全部或部分多长时间,从而对视频进行排名。例如,与具有较短观看时间的视频相比,可以在排名中提升已经通过匹配的或类似的用户观看较长时间的视频(或者针对其观看较大比例的视频)。在阶段516处,系统选择用于一个或多个排名靠前的视频的视频内容以派发给用户,并且在阶段518处,系统派发所选择的视频内容。
[0090] 图6示出用于确定和使用创建者性能评分,以对视频内容进行排名以及以分配向创建者分发的资产,用于改善提交给视频共享服务的视频的质量的示例过程600的流程图。在一些实施方式中,可以通过本文中讨论的系统和装置来执行过程600,包括通过图3的视频搜索系统302。
[0091] 在阶段602处,计算系统访问指示通过不同观看者类别中的观看者对各种视频的观看时间的分布的观看时间模型。在一些实施方式中,可以将通过观看时间模型指示的数据使用以确定创建者性能评分。附加地或可替选地,可以在数据被处理用于使用在观看时间模型之前基于原始观看时间数据部分地确定创建者性能评分。
[0092] 在阶段604处,计算系统使用观看时间数据以确定创建者性能模型。至少部分地基于各种类别中的观看者已经观看创建者的相应视频多长时间,创建者性能模型指示用于创建者的评分,该评分反映他们的视频的关于各种观看者类别的相对性能。来自某些类别中的观看者的观看时间可能比来自其他类别中的观看者的观看时间更有价值,并且因此创建者性能模型能够在计算创建者性能模型时考虑应用于各种观看者类别的不同权重。在一些实施方式中,用于确定创建者性能模型的操作由阶段606-612表示。在阶段606处,系统确定通过每个相应观看者类别中的观看者对视频的总观看时间。在阶段608处,系统为每个观看者类别确定可归因于各种创建者的视频的用于观看者类别的总观看时间的相应份额。在阶段610处,系统确定用于各种用户类别的评分,其中该评分能够使用以将来自每个观看者类别的观看时间的贡献加权到创建者的性能评分。在一些实施方式中,观看者类别评分能够基于通过将视频派发给相应观看者类别中的观看者生成的收益的量。在阶段612处,系统基于归因于每个观看者类别中的各种创建者的观看时间的份额,并且基于观看者类别评分,来确定用于创建者中的每个的创建者性能评分。
[0093] 一旦已经确定创建者性能模型,系统就使用该模型以及由该模型指示的评分,以针对彼此对创建者进行排名(阶段614)。然后,系统可以根据创建者性能评分和/或排名将资产分发给创建者(阶段616)。此外,系统还可以使用创建者性能评分和/或排名作为用于选择针对质量视频的内容的探试法,以响应于请求而派发给计算装置(阶段618)。
[0094] 图7示出可以用于实现本文中描述计算机实现方法和其他技术的计算装置700和移动计算装置的示例。计算装置700旨在表示各种形式的数字计算机,诸如膝上型计算机、台式计算机、工作站、个人数字助理、服务器、刀片服务器、大型机、以及其他的适当计算机。移动计算装置旨在表示各种形式的移动装置,诸如个人数字助理、蜂窝电话、智能电话、和其他类似的计算装置。这里所示的组件、它们的连接和关系、以及它们的功能仅仅是示例的,并非要限制本文档所述和/或要求保护的本发明的实施方式。
[0095] 计算装置700包括处理器702、存储器704、存储装置706、连接到存储器704和多个高速扩展端口710的高速接口708、连接到低速扩展端口714的低速接口712、以及存储装置706。处理器702、存储器704、存储装置706、高速接口708、高速扩展端口710和低速接口712的中的每个使用各种总线互连,并且可以根据需要在公共主板上安装或以其他方式安装。
处理器702能够处理用于在计算装置700中执行的指令,包括在存储器704中或存储装置706上存储的指令,以在外部输入/输出装置(诸如,联接到高速接口708的显示器716)上显示用于GUI的图形信息。在其他实施方式中,可以连同多个存储器和多种类型的存储器一起视情况使用多个处理器和/或多个总线。此外,可以连接多个计算装置,每个装置提供必要操作的部分(例如,作为服务器库、刀片服务器的群组、或多处理器系统)。
[0096] 存储器704将信息存储在计算装置700中。在一些实施方式中,存储器704是一个易失性存储器单元或多个易失性存储器单元。在一些实施方式中,存储器704是一个非易失性存储单元或多个非易失性存储单元。存储器704也可以是另一种形式的计算机可读介质,例如磁盘或光盘。
[0097] 存储装置706能够为计算装置700提供大容量存储。在一些实施方式中,存储装置706可以是计算机可读介质或者包含计算机可读介质,诸如软盘装置、硬盘装置、光盘装置、或磁带装置、闪速存储器或其他类似的固态存储装置、或装置的阵列,包括存储区域网络或其他配置中的装置。此外,计算机程序产品可以包含在被执行时执行一个或多个方法(诸如上述方法)的指令。此外,计算机程序产品还能够以有形方式在计算机可读介质或机器可读介质(诸如,存储器704、存储装置706、或处理器702上的存储器)中实施。
[0098] 高速接口708管理用于计算装置700的带宽密集型操作,而低速接口712管理较低带宽密集型操作。功能的这种分配仅仅是示例性的。在一些实施方式中,高速接口708被连接到存储器704、显示器716(例如,通过图形处理器或加速器)并且被连接到高速扩展端口710,该高速扩展端口710可以容纳各种扩展卡(未示出)。在该实施方式中,低速接口712被连接到存储装置706和低速扩展端口714。可以包括各种通信端口(例如,USB、蓝牙、以太网、无线以太网)的低速扩展端口714可以例如通过网络适配器连接到一个或多个输入/输出装置,诸如键盘、点击装置、扫描仪、或联网装置(诸如,交换机或路由器)。
[0099] 如附图所示,计算装置700可以以多种不同的形式来实现。例如,可以将其实现为标准服务器720,或者在这种服务器的群组中多次实现。此外,其可以在个人计算机(诸如,膝上型计算机722)中实现。此外,其可以被实现为机架服务器系统724的部分。可替选地,来自计算装置700的组件可以与移动装置中的其他组件(未示出)组合,诸如,移动计算装置750。这种装置中的每个可以包含计算装置700和移动计算装置750的一个或多个,并且整个系统可以由相互通信的多个计算装置组成。
[0100] 除其他组件之外,移动计算装置750还包括处理器752、存储器764、输入/输出装置(诸如,显示器754)、通信接口766、和收发器768。移动计算装置750还可以被设置有存储装置,诸如微型驱动器或其他装置,以提供附加的存储。处理器752、存储器764、显示器754、通信接口766、和收发器768中的每个使用各种总线互连,并且可以视情况将若干组件安装在公共主板上或以其他方式安装。
[0101] 处理器752能够执行移动计算装置750中的指令,包括在存储器764中存储的指令。处理器752可以被实现为包括分离的多个模拟和数字处理器的芯片的芯片组。处理器752例如可以提供用于移动计算装置750的其他组件的协调,诸如用户界面的控制、通过移动计算装置750运行的应用、以及通过移动计算装置750的无线通信。
[0102] 处理器752可以通过联接到显示器754的控制接口758和显示器接口756与用户进行通信。显示器754例如可以是TFT(薄膜晶体管液晶显示器)显示器或OLED(有机发光二极管)显示器、或其他适当的显示技术。显示接口756可以包括用于驱动显示器754以向用户呈现图形和其他信息的适当电路。控制接口758可以接收来自用户的命令并转换它们,用于提交给处理器752。此外,外部接口762可以提供与处理器752的通信,以便使移动计算装置750与其他装置能够近场通信。例如,在一些实施方式中,外部接口762可以提供用于有线通信,而在其他实施方式中,外部接口762可以提供用于无线通信,并且多个接口还可以被使用。
[0103] 存储器764将信息存储在移动计算装置750中。能够将存储器764实现为计算机可读介质或媒介、一个易失性存储器单元或多个易失性存储器单元单元、或者一个非易失性存储器单元或多个非易失性存储器单元单元中的一个或多个。此外,还可以提供扩展存储器774并且通过扩展接口772连接到移动计算装置750,扩展接口772例如可以包括SIMM(单列直插式存储器模块)卡接口。扩展存储器774可以为移动计算装置750提供额外的存储空间,或者还可以存储用于移动计算装置750的应用程序或其他信息。具体地,扩展存储器774可以包括用于执行或补充上述过程的指令,并且还可以包括安全信息。因此,例如,可以提供扩展存储器774作为用于移动计算装置750的安全模块,并且可以利用允许安全使用移动计算装置750的指令来编程。此外,可以连同附加信息一起经由SIMM卡提供安全应用,诸如以不被黑客攻击的方式将识别信息置入SIMM卡。
[0104] 存储器例如可以包括闪速存储器和/或NVRAM存储器(非易失性随机存取存储器),如下所述。计算机程序产品包含在被执行时执行一个或多个方法(诸如上述方法)的指令。计算机程序产品能够是计算机可读介质或机器可读介质,诸如存储器764、扩展存储器774、或处理器752上的存储器。在一些实施方式中,能够例如通过收发器768或外部接口762,在传播信号中接收计算机程序产品。
[0105] 移动计算装置750可以通过通信接口766进行无线通信,通信接口766在必要时可以包括数字信号处理电路。通信接口766可以提供用于各种模式或协议下的通信,诸如GSM语音呼叫(全球移动通信系统)、SMS(短消息服务)、EMS(增强型消息服务)、或MMS消息(多媒体消息服务)、CDMA(码分多址)、TDMA(时分多址)、PDC(个人数字蜂窝)、WCDMA(宽带码分多址)、CDMA2000、或GPRS(通用分组无线业务)等。这种通信例如可以通过使用射频的收发器768来发生。此外,诸如使用蓝牙、WiFi、或其他这种收发器(未示出)可以发生短距通信。此外,GPS(全球定位系统)接收器模块770可以向移动计算装置750提供可以视情况通过移动计算装置750上运行的应用程序来使用的附加的与导航和位置有关的无线数据。
[0106] 此外,移动计算装置750可以使用音频编解码器760以听觉方式进行通信,音频编解码器760可以从用户接收语音信息并将其转换为可用的数字信息。同样,音频编解码器760可以例如在移动计算装置750的耳机中通过诸如扬声器为用户生成可听见的声音。这种声音可以包括来自语音电话呼叫的声音,可以包括记录的声音(例如,语音消息、音乐文件等),并且还可以包括通过在移动计算装置750上运行的应用程序生成的声音。
[0107] 如附图所示,可以以多种不同形式来实现移动计算装置750。例如,可以将其实现为蜂窝电话780。还可以将其实现为智能电话782、个人数字助理、或其他类似移动装置的部分。
[0108] 可以在数字电子电路、集成电路、专门设计的ASIC(专用集成电路)、计算机硬件、固件、软件、和/或其组合中实现这里所述系统和技术的各种实施方式。这些各种实施方式能够包括在可编程系统上是可执行和/或可解释的一个或多个计算机程序中的实施方式,可编程系统包括至少一个可编程处理器,可编程处理器可以是专用或通用的,所述至少一个可编程处理器被联接以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且以向存储系统、至少一个输入装置、和至少一个输出装置发送数据和指令。
[0109] 这些计算机程序(还称为程序、软件、软件应用程序或代码)包括用于可编程处理器的机器指令,并且能够在高级程序和/或面向对象的编程语言和/或在汇编/机器语言中实现。如本文所使用的是,术语机器可读介质和计算机可读介质指的是用于向可编程处理器提供机器指令和/或数据的任何计算机程序产品、设备和/或装置(例如,磁盘、光盘、存储器、可编程逻辑器件(PLD)),该术语机器可读介质和计算机可读介质包括接收机器指令作为机器可读信号的机器可读介质。术语机器可读信号指的是用于向可编程处理器提供机器指令和/或数据的任何信号。
[0110] 为了提供与用户的交互,这里所述系统和技术能够在具有用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或LCD(液晶显示器)监视器)以及用户能够由其向计算机提供输入的键盘和指示装置(例如鼠标或轨迹球)的计算机上实现。还能够使用其他类型的装置提供用于与用户的交互;例如,向用户提供的反馈能够是任何形式的感官反馈(例如,视觉反馈、听觉反馈、或触觉反馈);并且能够以任何形式接收来自用户的输入,这些输入包括声音、语音或触觉输入。
[0111] 这里所描述系统和技术能够在包括后端组件(例如,作为数据服务器)、或包括中间件组件(例如,应用服务器)、或包括前端组件(例如,具有图形用户界面或Web浏览器的客户端计算机,用户可以由其与这里描述系统和技术的实施方式交互)、或者这种后端组件、中间件组件、或前端组件的任何组合的计算系统中实现。系统的组件能够通过数字数据通信的任何形式或介质(例如,通信网络)互连。通信网络的示例包括局域网(LAN)、广域网(WAN)、和互联网。
[0112] 计算系统能够包括客户端和服务器。客户端和服务器通一般互远离并且常相通过通信网络进行交互。客户端与服务器之间的关系是通过在各个计算机上运行、相互具有客户端-服务器关系的计算机程序产生的。
[0113] 在其中本文的系统、方法、装置、和其他技术收集关于用户的个人信息(例如,背景数据)或者可以使用个人信息的情况下,可以向用户提供有以控制程序或部件是否收集用户信息(例如,关于用户的社交网络、社交动作或活动、职业、用户的偏好、或用户的当前位置的信息),或者以控制是否和/或怎样接收来自可能与用户更相关的内容服务器的内容的机会。此外,某些数据在存储或使用之前可以以一种或多种方式进行处理,使得去除个人身份信息。例如,可以对用户的身份进行处理,使得不能够对用户确定个人可识别信息,或者可以在其中获得位置信息(诸如城市、邮政编码或州等级)的情况下将用户的地理位置概括化,使得不能够确定用户的具体位置。因此,用户可以具有对关于用户怎样收集信息并由内容服务器使用控制。
[0114] 虽然上面详细描述了各种实施方式,但是其他修改也是可能的。此外,附图中描述的逻辑流程不要求所示特定顺序或连续顺序来实现期望的结果。此外,可以提供其他步骤,或者从所述流程删除步骤,可以向所述系统添加其他组件,或者从所述系统删除组件。因此,其他实施方式均落入以下权利要求的范围。