信息推送方法和装置转让专利

申请号 : CN201710897852.9

文献号 : CN107506495B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王修充于海任昭春

申请人 : 北京京东尚科信息技术有限公司北京京东世纪贸易有限公司

摘要 :

本申请实施例公开了信息推送方法和装置。该方法的一具体实施方式包括:获取第一预设时间段内的预设网站上的目标用户行为数据,其中,目标用户行为数据包括至少一个目标物品标识;获取至少一个目标物品标识中的各个目标物品标识所指示的目标物品的品类,生成目标物品品类集合;基于目标物品品类集合,生成目标分布式表示;计算目标分布式表示与候选分布式表示集合中的各个候选分布式表示的相似度;基于所计算的相似度,从各个候选分布式表示所对应的候选推送信息中选取出候选推送信息作为待推送信息,并推送给目标用户。该实施方式丰富了信息推送的内容。

权利要求 :

1.一种信息推送方法,其特征在于,所述方法包括:

获取第一预设时间段内的预设网站上的目标用户行为数据,其中,所述目标用户行为数据包括至少一个目标物品标识;

获取所述至少一个目标物品标识中的各个目标物品标识所指示的目标物品的品类,生成目标物品品类集合;

基于所述目标物品品类集合,生成目标分布式表示,其中,所述目标分布式表示用于描述所述目标物品品类集合中的各个目标物品品类之间的关联关系;

计算所述目标分布式表示与候选分布式表示集合中的各个候选分布式表示的相似度,其中,候选分布式表示是基于候选用户行为数据包括的至少一个候选物品标识中的各个候选物品标识所指示的候选物品的品类生成的候选物品品类集合生成的;

基于所计算的相似度,从各个候选分布式表示所对应的候选推送信息中选取出候选推送信息作为待推送信息,并推送给目标用户。

2.根据权利要求1所述的方法,其特征在于,所述基于所述目标物品品类集合,生成目标分布式表示,包括:从预先生成的物品品类的分布式表示集合中查找出所述目标物品品类集合中的各个目标物品品类的分布式表示,其中,所述物品品类的分布式表示集合中的每个物品品类的分布式表示用于描述该物品品类与所述物品品类的分布式表示集合中除该物品品类之外的其他物品品类之间的关联关系;

计算由各个目标物品品类的分布式表示组成的分布式表示集合的平均值;

基于由各个目标物品品类的分布式表示组成的分布式表示集合的平均值,生成目标分布式表示。

3.根据权利要求2所述的方法,其特征在于,所述基于由各个目标物品品类的分布式表示组成的分布式表示集合的平均值,生成目标分布式表示,包括:分别计算各个目标物品品类的分布式表示与由各个目标物品品类的分布式表示组成的分布式表示集合的平均值之间的差值;

选取出差值处于预设差值范围内的目标物品品类的分布式表示;

计算所选取的目标物品品类的分布式表示的平均值,并作为目标分布式表示。

4.根据权利要求2所述的方法,其特征在于,所述方法还包括生成物品品类的分布式表示集合的步骤,所述生成物品品类的分布式表示集合的步骤包括:获取第二预设时间段内的所述预设网站上的候选用户行为数据集合,其中,候选用户行为数据包括多个候选物品标识;

对于所述候选用户行为数据集合中的每个候选用户行为数据,获取该候选用户行为数据中的至少一个候选物品标识中的各个候选物品标识所指示的候选物品的品类,生成该候选用户行为数据所对应的候选物品品类集合;

将各个候选用户行为数据所对应的候选物品品类集合输入至预先训练的语言模型中,得到物品品类的分布式表示集合,其中,所述语言模型用于将物品品类表征为物品品类的分布式表示。

5.根据权利要求4所述的方法,其特征在于,所述方法还包括生成候选分布式表示集合的步骤,所述生成候选分布式标识集合的步骤包括:对于所述候选用户行为数据集合中的每个候选用户行为数据,从物品品类的分布式表示集合中查找出该候选用户行为数据所对应的候选物品品类集合中的各个候选物品品类的分布式表示;

计算各个候选物品品类的分布式表示的平均值;

基于各个候选物品品类的分布式表示的平均值,生成该候选用户行为数据所对应的候选分布式表示。

6.根据权利要求1所述的方法,其特征在于,所述计算所述目标分布式表示与候选分布式表示集合中的各个候选分布式表示的相似度,包括:利用余弦相似度算法计算所述目标分布式表示与候选分布式表示集合中的各个候选分布式表示的相似度。

7.根据权利要求1所述的方法,其特征在于,所述基于所计算的相似度,从各个候选分布式表示所对应的候选推送信息中选取出候选推送信息作为待推送信息,包括:将各个候选分布式表示按照相似度大小顺序进行排序,从相似度大的一侧开始选取出预设数目个候选分布式表示;

获取所选取的候选分布式表示所对应的候选用户行为数据;

将所获取的候选用户行为数据所包括的候选物品标识所指示的候选物品的信息作为待推送信息。

8.根据权利要求1-7之一所述的方法,其特征在于,用户行为数据包括以下至少一项:用户浏览数据、用户点击数据、用户下单数据、用户评论数据,物品标识包括以下至少一项:用户所浏览物品的物品标识、用户所点击物品的物品标识、用户所下单物品的物品标识,用户所评论物品的物品标识。

9.一种信息推送装置,其特征在于,所述装置包括:

获取单元,配置用于获取第一预设时间段内的预设网站上的目标用户行为数据,其中,所述目标用户行为数据包括至少一个目标物品标识;

第一生成单元,配置用于获取所述至少一个目标物品标识中的各个目标物品标识所指示的目标物品的品类,生成目标物品品类集合;

第二生成单元,配置用于基于所述目标物品品类集合,生成目标分布式表示,其中,所述目标分布式表示用于描述所述目标物品品类集合中的各个目标物品品类之间的关联关系;

计算单元,配置用于计算所述目标分布式表示与候选分布式表示集合中的各个候选分布式表示的相似度,其中,候选分布式表示是基于候选用户行为数据包括的至少一个候选物品标识中的各个候选物品标识所指示的候选物品的品类生成的候选物品品类集合生成的;

选取单元,配置用于基于所计算的相似度,从各个候选分布式表示所对应的候选推送信息中选取出候选推送信息作为待推送信息,并推送给目标用户。

10.根据权利要求9所述的装置,其特征在于,所述第二生成单元包括:第一查找子单元,配置用于从预先生成的物品品类的分布式表示集合中查找出所述目标物品品类集合中的各个目标物品品类的分布式表示,其中,所述物品品类的分布式表示集合中的每个物品品类的分布式表示用于描述该物品品类与所述物品品类的分布式表示集合中除该物品品类之外的其他物品品类之间的关联关系;

第一计算子单元,配置用于计算由各个目标物品品类的分布式表示组成的分布式表示集合的平均值;

第一生成子单元,配置用于基于由各个目标物品品类的分布式表示组成的分布式表示集合的平均值,生成目标分布式表示。

11.根据权利要求10所述的装置,其特征在于,所述装置还包括第三生成单元,所述第三生成单元包括:第一获取子单元,配置用于获取第二预设时间段内的所述预设网站上的候选用户行为数据集合,其中,候选用户行为数据包括多个候选物品标识;

第二生成子单元,配置用于对于所述候选用户行为数据集合中的每个候选用户行为数据,获取该候选用户行为数据中的至少一个候选物品标识中的各个候选物品标识所指示的候选物品的品类,生成该候选用户行为数据所对应的候选物品品类集合;

输入子单元,配置用于将各个候选用户行为数据所对应的候选物品品类集合输入至预先训练的语言模型中,得到物品品类的分布式表示集合,其中,所述语言模型用于将物品品类表征为物品品类的分布式表示。

12.根据权利要求9所述的装置,其特征在于,所述选取单元包括:排序子单元,配置用于将各个候选分布式表示按照相似度大小顺序进行排序,从相似度大的一侧开始选取出预设数目个候选分布式表示;

第二获取子单元,配置用于获取所选取的候选分布式表示所对应的候选用户行为数据;

作为子单元,配置用于将所获取的候选用户行为数据所包括的候选物品标识所指示的候选物品的信息作为待推送信息。

13.一种电子设备,其特征在于,所述电子设备包括:

一个或多个处理器;

存储装置,用于存储一个或多个程序;

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8中任一所述的方法。

14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-8中任一所述的方法。

说明书 :

信息推送方法和装置

技术领域

[0001] 本申请涉及计算机技术领域,具体涉及互联网技术领域,尤其涉及信息推送方法和装置。

背景技术

[0002] 信息推送,又称为“网络广播”,是通过一定的技术标准或协议,在互联网上通过推送用户需要的信息来减少信息过载的一项技术。信息推送技术通过主动推送信息给用户,可以减少用户在网络上搜索所花的时间。
[0003] 然而,现有的信息推送方式通常是将用户历史行为数据中的物品标识所指示的物品的物品信息推送给用户,信息推送内容不丰富。

发明内容

[0004] 本申请实施例的目的在于提出一种改进的信息推送方法和装置,来解决以上背景技术部分提到的技术问题。
[0005] 第一方面,本申请实施例提供了一种信息推送方法,该方法包括:获取第一预设时间段内的预设网站上的目标用户行为数据,其中,目标用户行为数据包括至少一个目标物品标识;获取至少一个目标物品标识中的各个目标物品标识所指示的目标物品的品类,生成目标物品品类集合;基于目标物品品类集合,生成目标分布式表示,其中,目标分布式表示用于描述目标物品品类集合中的各个目标物品品类之间的关联关系;计算目标分布式表示与候选分布式表示集合中的各个候选分布式表示的相似度;基于所计算的相似度,从各个候选分布式表示所对应的候选推送信息中选取出候选推送信息作为待推送信息,并推送给目标用户。
[0006] 在一些实施例中,基于目标物品品类集合,生成目标分布式表示,包括:从预先生成的物品品类的分布式表示集合中查找出目标物品品类集合中的各个目标物品品类的分布式表示,其中,物品品类的分布式表示集合中的每个物品品类的分布式表示用于描述该物品品类与其他物品品类之间的关联关系;计算由各个目标物品品类的分布式表示组成的分布式表示集合的平均值;基于由各个目标物品品类的分布式表示组成的分布式表示集合的平均值,生成目标分布式表示。
[0007] 在一些实施例中,基于由各个目标物品品类的分布式表示组成的分布式表示集合的平均值,生成目标分布式表示,包括:分别计算各个目标物品品类的分布式表示与由各个目标物品品类的分布式表示组成的分布式表示集合的平均值之间的差值;选取出差值处于预设差值范围内的目标物品品类的分布式表示;计算所选取的目标物品品类的分布式表示的平均值,并作为目标分布式表示。
[0008] 在一些实施例中,该方法还包括生成物品品类的分布式表示集合的步骤,生成物品品类的分布式表示集合的步骤包括:获取第二预设时间段内的预设网站上的候选用户行为数据集合,其中,候选用户行为数据包括多个候选物品标识;对于候选用户行为数据集合中的每个候选用户行为数据,获取该候选用户行为数据中的至少一个候选物品标识中的各个候选物品标识所指示的候选物品的品类,生成该候选用户行为数据所对应的候选物品品类集合;将各个候选用户行为数据所对应的候选物品品类集合输入至预先训练的语言模型中,得到物品品类的分布式表示集合,其中,语言模型用于将物品品类表征为物品品类的分布式表示。
[0009] 在一些实施例中,该方法还包括生成候选分布式表示集合的步骤,生成候选分布式标识集合的步骤包括:对于候选用户行为数据集合中的每个候选用户行为数据,从物品品类的分布式表示集合中查找出该候选用户行为数据所对应的候选物品品类集合中的各个候选物品品类的分布式表示;计算各个候选物品品类的分布式表示的平均值;基于各个候选物品品类的分布式表示的平均值,生成该候选用户行为数据所对应的候选分布式表示。
[0010] 在一些实施例中,计算目标分布式表示与候选分布式表示集合中的各个候选分布式表示的相似度,包括:利用余弦相似度算法计算目标分布式表示与候选分布式表示集合中的各个候选分布式表示的相似度。
[0011] 在一些实施例中,基于所计算的相似度,从各个候选分布式表示所对应的候选推送信息中选取出候选推送信息作为待推送信息,包括:将各个候选分布式表示按照相似度大小顺序进行排序,从相似度大的一侧开始选取出预设数目个候选分布式表示;获取所选取的候选分布式表示所对应的候选用户行为数据;将所获取的候选用户行为数据所包括的候选物品标识所指示的候选物品的信息作为待推送信息。
[0012] 在一些实施例中,用户行为数据包括以下至少一项:用户浏览数据、用户点击数据、用户下单数据、用户评论数据,物品标识包括以下至少一项:用户所浏览物品的物品标识、用户所点击物品的物品标识、用户所下单物品的物品标识,用户所评论物品的物品标识。
[0013] 第二方面,本申请实施例提供了一种信息推送装置,该装置包括:获取单元,配置用于获取第一预设时间段内的预设网站上的目标用户行为数据,其中,目标用户行为数据包括至少一个目标物品标识;第一生成单元,配置用于获取至少一个目标物品标识中的各个目标物品标识所指示的目标物品的品类,生成目标物品品类集合;第二生成单元,配置用于基于目标物品品类集合,生成目标分布式表示,其中,目标分布式表示用于描述目标物品品类集合中的各个目标物品品类之间的关联关系;计算单元,配置用于计算目标分布式表示与候选分布式表示集合中的各个候选分布式表示的相似度;选取单元,配置用于基于所计算的相似度,从各个候选分布式表示所对应的候选推送信息中选取出候选推送信息作为待推送信息,并推送给目标用户。
[0014] 在一些实施例中,第二生成单元包括:第一查找子单元,配置用于从预先生成的物品品类的分布式表示集合中查找出目标物品品类集合中的各个目标物品品类的分布式表示,其中,物品品类的分布式表示集合中的每个物品品类的分布式表示用于描述该物品品类与其他物品品类之间的关联关系;第一计算子单元,配置用于计算由各个目标物品品类的分布式表示组成的分布式表示集合的平均值;第一生成子单元,配置用于基于由各个目标物品品类的分布式表示组成的分布式表示集合的平均值,生成目标分布式表示。
[0015] 在一些实施例中,第一生成子单元包括:第一计算模块,配置用于分别计算各个目标物品品类的分布式表示与由各个目标物品品类的分布式表示组成的分布式表示集合的平均值之间的差值;选取模块,配置用于选取出差值处于预设差值范围内的目标物品品类的分布式表示;第二计算模块,配置用于计算所选取的目标物品品类的分布式表示的平均值,并作为目标分布式表示。
[0016] 在一些实施例中,该装置还包括第三生成单元,第三生成单元包括:第一获取子单元,配置用于获取第二预设时间段内的预设网站上的候选用户行为数据集合,其中,候选用户行为数据包括多个候选物品标识;第二生成子单元,配置用于对于候选用户行为数据集合中的每个候选用户行为数据,获取该候选用户行为数据中的至少一个候选物品标识中的各个候选物品标识所指示的候选物品的品类,生成该候选用户行为数据所对应的候选物品品类集合;输入子单元,配置用于将各个候选用户行为数据所对应的候选物品品类集合输入至预先训练的语言模型中,得到物品品类的分布式表示集合,其中,语言模型用于将物品品类表征为物品品类的分布式表示。
[0017] 在一些实施例中,该装置还包括第四生成单元,第四生成单元包括:第二查找子单元,配置用于对于候选用户行为数据集合中的每个候选用户行为数据,从物品品类的分布式表示集合中查找出该候选用户行为数据所对应的候选物品品类集合中的各个候选物品品类的分布式表示;第二计算子单元,配置用于计算各个候选物品品类的分布式表示的平均值;第三生成子单元,配置用于基于各个候选物品品类的分布式表示的平均值,生成该候选用户行为数据所对应的候选分布式表示。
[0018] 在一些实施例中,计算单元进一步配置用于:利用余弦相似度算法计算目标分布式表示与候选分布式表示集合中的各个候选分布式表示的相似度。
[0019] 在一些实施例中,选取单元包括:排序子单元,配置用于将各个候选分布式表示按照相似度大小顺序进行排序,从相似度大的一侧开始选取出预设数目个候选分布式表示;第二获取子单元,配置用于获取所选取的候选分布式表示所对应的候选用户行为数据;作为子单元,配置用于将所获取的候选用户行为数据所包括的候选物品标识所指示的候选物品的信息作为待推送信息。
[0020] 在一些实施例中,用户行为数据包括以下至少一项:用户浏览数据、用户点击数据、用户下单数据、用户评论数据,物品标识包括以下至少一项:用户所浏览物品的物品标识、用户所点击物品的物品标识、用户所下单物品的物品标识,用户所评论物品的物品标识。
[0021] 第三方面,本申请实施例提供了一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。
[0022] 第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。
[0023] 本申请实施例提供的信息推送方法和装置,通过获取目标用户行为数据中的至少一个目标物品标识中的各个目标物品标识所指示的目标物品的品类,以生成目标物品品类集合;然后对目标物品品类集合进行分析,从而得到用于描述目标物品品类集合中的各个目标物品品类之间的关联关系的目标分布式表示;最后计算目标分布式表示与候选分布式表示集合中的各个候选分布式表示的相似度,以便基于相似度,从各个候选分布式表示所对应的候选推送信息中选取出待推送信息,并推送给目标用户。从候选分布式表示所对应的候选推送信息中选取待推送信息,丰富了信息推送的内容。

附图说明

[0024] 通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
[0025] 图1是本申请实施例可以应用于其中的示例性系统架构图;
[0026] 图2是根据本申请的信息推送方法的一个实施例的流程图;
[0027] 图3是根据本申请实施例的信息推送方法的一个应用场景的示意图;
[0028] 图4是根据本申请的信息推送方法的又一个实施例的流程图;
[0029] 图5是根据本申请的信息推送装置的一个实施例的结构示意图;
[0030] 图6是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。

具体实施方式

[0031] 下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
[0032] 需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0033] 图1示出了可以应用本申请实施例的信息推送方法或信息推送装置的示例性系统架构100。
[0034] 如图1所示,系统架构100可以包括终端设备101、102、103、网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0035] 用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103可以是具有显示屏并且支持信息浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
[0036] 服务器105可以是提供各种服务的服务器。例如,服务器105可以是各种网站的后台服务器。后台服务器102可以对目标用户行为数据进行分析等处理,并将处理结果(例如待推送信息)发送至终端设备101、102、103。
[0037] 需要说明的是,本申请实施例所提供的信息推送方法一般由服务器105执行,相应地,信息推送装置一般设置于服务器105中。
[0038] 应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
[0039] 继续参考图2,其示出了根据本申请的信息推送方法的一个实施例的流程200。该信息推送方法,包括以下步骤:
[0040] 步骤201,获取第一预设时间段内的预设网站上的目标用户行为数据。
[0041] 在本实施例中,信息推送方法运行于其上的电子设备(例如图1所示的服务器105)可以获取第一预设时间段(例如前一周或前一个月)内的预设网站(例如某电子商务网站)上的目标用户行为数据。
[0042] 在本实施例中,用户可以是预设网站的注册用户。用户行为数据可以是用户在预设网站上执行预设行为操作时所产生的操作数据。其中,预设行为操作可以包括但不限于以下至少一项:浏览操作、点击操作、下单操作或评论操作。用户行为数据可以包括但不限于以下至少一项:用户浏览数据、用户点击数据、用户下单数据、用户评论数据。通常,目标用户可以是预设网站的任意一个注册用户。目标用户行为数据可以包括但不限于以下至少一项:目标用户浏览数据、目标用户点击数据、目标用户下单数据、目标用户评论数据。
[0043] 在本实施例中,用户行为数据可以包括至少一个物品标识。其中,物品标识可以由数字、字母、符号组成,用于唯一标识物品。例如,物品标识可以是物品的SKU(Stock Keeping Unit,库存量单位)号,其中,SKU号是物品统一编号的简称,每种物品对应有唯一的SKU号。这里,物品标识可以包括但不限于以下至少一项:用户所浏览物品的物品标识、用户所点击物品的物品标识、用户所下单物品的物品标识,用户所评论物品的物品标识。通常,目标用户行为数据可以包括至少一个目标物品标识。目标物品标识可以包括但不限于以下至少一项:目标用户所浏览物品的物品标识、目标用户所点击物品的物品标识、目标用户所下单物品的物品标识,目标用户所评论物品的物品标识。
[0044] 步骤202,获取至少一个目标物品标识中的各个目标物品标识所指示的目标物品的品类,生成目标物品品类集合。
[0045] 在本实施例中,基于步骤201所获取的目标用户行为数据中的至少一个目标物品标识,电子设备可以获取至少一个目标物品标识中的各个目标物品标识所指示的目标物品的品类,以便生成目标物品品类集合。其中,物品的品类可以是三级品类。以家电类物品为例,三级品类可以包括但不限于冰箱类、洗衣机类、空调类、电视机类等等。
[0046] 步骤203,基于目标物品品类集合,生成目标分布式表示。
[0047] 在本实施例中,电子设备可以对步骤202所生成的目标物品品类集合进行分析,从而生成目标分布式表示。其中,目标分布式表示可以用于描述目标物品品类集合中的各个目标物品品类之间的关联关系。通常,用户在较短的时间段内前后执行预设行为操作的物品之间存在较强的上下文关系,即属于相关或相似的物品。同样地,目标物品品类集合中处于前后顺序的目标物品品类之间也存在较强的上下文关系,即属于相关或相似的品类。这里,电子设备可以将存在较强上下文关系的目标物品品类映射到空间中的对应分布式表示中。这样相似或相关的目标物品品类在空间的分布式表示上也处于较近的位置上。作为示例,目标分布式表示可以是向量,向量中的元素可以用于描述两个目标物品品类之间的关联关系,向量中的元素值可以用于是两个目标物品品类之间的关联度。通常,目标物品品类集合是有序集合,两个目标物品品类在目标物品品类集合中距离越近,则这两个目标物品品类之间的关联度越大。例如,两个相邻的目标物品品类之间的关联度是0.9,间隔一个目标物品品类的两个目标物品品类之间的关联度是0.7。
[0048] 步骤204,计算目标分布式表示与候选分布式表示集合中的各个候选分布式表示的相似度。
[0049] 在本实施例中,基于步骤203所生成的目标分布式表示,电子设备可以计算目标分布式表示与候选分布式表示集合中的各个候选分布式表示的相似度。其中,目标分布式表示和候选分布式表示之间的相似度可以用目标分布式表示和候选分布式表示之间的距离来表示。通常,距离越小或越接近某一个数值,相似度越高,距离越大或越偏离某一个数值,相似度越低。
[0050] 在本实施例的一些可选的实现方式中,电子设备可以利用余弦相似度算法计算目标分布式表示与候选分布式表示集合中的各个候选分布式表示的相似度。其中,余弦相似度算法可以通过计算两个向量之间的余弦距离(即夹角余弦值)来评估它们的相似度。通常,两个向量之间的夹角越小,余弦距离越接近于1,相似度越高;两个向量之间的夹角越大,余弦距离越偏离1,相似度越低。
[0051] 在本实施例的一些可选的实现方式中,电子设备可以通过计算目标分布式表示与候选分布式表示集合中的各个候选分布式表示之间的欧氏距离来评估相似度。其中,欧氏距离又可以被称为欧几里得度量(euclidean metric),通常指在m维空间中两个点之间的真实距离,或者向量的自然长度(即该点到原点的距离)。在二维和三维空间中的欧氏距离就是两点之间的实际距离。通常,两个向量之间的欧氏距离越小,相似度越高;两个向量之间的欧氏距离越大,相似度越低。
[0052] 步骤205,基于所计算的相似度,从各个候选分布式表示所对应的候选推送信息中选取出候选推送信息作为待推送信息,并推送给目标用户。
[0053] 在本实施例中,基于步骤204所计算的相似度,电子设备可以从各个候选分布式表示所对应的候选推送信息中选取出待推送信息,并推送给目标用户所使用的终端设备(例如图1所示的终端设备101、102、103)。其中,候选分布式表示可以是通过对候选用户行为数据进行分析而得到的。候选分布式表示所对应的候选推送信息可以是候选用户行为数据所包括的候选物品标识所指示的候选物品的信息。作为示例,电子设备可以将目标分布式表示与各个候选分布式表示的相似度分别与预设相似度阈值进行比较,并选取出相似度大于预设相似度阈值的候选分布式表示所对应的候选推送信息作为待推送信息。
[0054] 在本实施例的一些可选的实现方式中,电子设备可以首先将各个候选分布式表示按照相似度大小顺序进行排序,并从相似度大的一侧开始选取出预设数目个候选分布式表示;然后获取所选取的候选分布式表示所对应的候选用户行为数据;最后将所获取的候选用户行为数据所包括的候选物品标识所指示的候选物品的信息作为待推送信息。这里,电子设备可以将各个候选分布式表示按照相似度从大到小的顺序进行排序,也可以将各个候选分布式表示按照相似度从小到大的顺序进行排序。
[0055] 继续参见图3,图3是根据本申请实施例的信息推送方法的应用场景的一个示意图。在图3的应用场景中,首先,服务器可以获取前一周内的某电子商务网站上的目标用户行为数据,其中,目标用户行为数据包括目标物品标识A001、A002和A003;而后,电子设备可以获取目标物品标识A001、A002和A003所指示的目标物品的品类,以生成目标物品的品类集合,其中,目标物品标识A001和A002所指示的目标物品的品类均属于空调类,目标物品标识A003所指示的目标物品的品类是电视机类;之后,电子设备可以对目标物品品类集合进行分析,生成用于描述空调类和电视机类之间的关联关系目标分布式表示;然后,电子设备可以计算目标分布式表示与候选分布式表示集合中的各个候选分布式表示的相似度,其中,候选分布式表示集合中可以包括候选分布式表示A、候选分布式表示B、候选分布式表示C;最后,电子设备可以选取出与目标分布式表示相似度最高的候选分布式表示A,并将候选分布式表示A所对应的候选推送信息作为待推送信息,并推送给目标用户,其中,待推送信息如301所示,包括某空调的信息、某空调清洗剂的信息、某电视机的信息和某电视柜的信息。
[0056] 本申请实施例提供的信息推送方法,通过获取目标用户行为数据中的至少一个目标物品标识中的各个目标物品标识所指示的目标物品的品类,以生成目标物品品类集合;然后对目标物品品类集合进行分析,从而得到用于描述目标物品品类集合中的各个目标物品品类之间的关联关系的目标分布式表示;最后计算目标分布式表示与候选分布式表示集合中的各个候选分布式表示的相似度,以便基于相似度,从各个候选分布式表示所对应的候选推送信息中选取出待推送信息,并推送给目标用户。从候选分布式表示所对应的候选推送信息中选取待推送信息,丰富了信息推送的内容。
[0057] 进一步参考图4,其示出了信息推送方法的一个实施例的流程400。该信息推送方法的流程400,包括以下步骤:
[0058] 步骤401,获取第一预设时间段内的预设网站上的目标用户行为数据。
[0059] 在本实施例中,信息推送方法运行于其上的电子设备(例如图1所示的服务器105)可以获取第一预设时间段(例如前一周或前一个月)内的预设网站(例如某电子商务网站)上的目标用户行为数据。其中,目标用户行为数据可以包括至少一个目标物品标识[0060] 步骤402,获取至少一个目标物品标识中的各个目标物品标识所指示的目标物品的品类,生成目标物品品类集合。
[0061] 在本实施例中,基于步骤401所获取的目标用户行为数据中的至少一个目标物品标识,电子设备可以获取至少一个目标物品标识中的各个目标物品标识所指示的目标物品的品类,以便生成目标物品品类集合。
[0062] 步骤403,从预先生成的物品品类的分布式表示集合中查找出目标物品品类集合中的各个目标物品品类的分布式表示。
[0063] 在本实施例中,电子设备可以将目标物品品类集合中的各个目标物品品类分别与物品品类的分布式表示集合中的每个物品品类的分布式表示所对应的物品品类进行匹配,若一个目标物品品类与一个物品品类的分布式表示所对应的物品品类相同,则匹配成功,且匹配成功的物品品类的分布式表示就是该目标物品品类的分布式表示。
[0064] 在本实施例中,物品品类的分布式表示集合中的每个物品品类的分布式表示可以用于描述该物品品类与其他物品品类之间的关联关系。其中,物品品类的分布式表示集合可以是通过多种方式生成的。作为示例,对于每个物品品类,本领域技术人员可以根据经验获取与该物品品类相关的多个其他物品品类,并根据经验为各个其他物品品类设置相关度,从而使电子设备可以根据相关度将物品品类映射到空间中的对应分布式表示中。这样,相关度高的其他物品品类与该物品品类在空间的分布式表示上也处于较近的位置上。
[0065] 在本实施例的一些可选的实现方式中,电子设备可以通过以下步骤生成物品品类的分布式表示集合:
[0066] 首先,获取第二预设时间段内的预设网站上的候选用户行为数据集合。
[0067] 这里,电子设备可以获取第二预设时间段(例如前一周或前一个月)内的预设网站(例如某电子商务网站)上的候选用户行为数据。其中,候选用户可以是预设网站的多个注册用户。候选用户行为数据可以是候选用户在预设网站上执行预设行为操作时所产生的操作数据。候选用户行为数据可以包括但不限于以下至少一项:候选用户浏览数据、候选用户点击数据、候选用户下单数据、候选用户评论数据。候选用户行为数据可以包括多个候选物品标识。候选物品标识可以包括但不限于以下至少一项:候选用户所浏览物品的物品标识、候选用户所点击物品的物品标识、候选用户所下单物品的物品标识,候选用户所评论物品的物品标识。
[0068] 然后,对于候选用户行为数据集合中的每个候选用户行为数据,获取该候选用户行为数据中的至少一个候选物品标识中的各个候选物品标识所指示的候选物品的品类,生成该候选用户行为数据所对应的候选物品品类集合。
[0069] 最后,将各个候选用户行为数据所对应的候选物品品类集合输入至预先训练的语言模型中,得到物品品类的分布式表示集合。
[0070] 这里,电子设备可以将各个候选用户行为数据所对应的候选物品品类集合输入至预先训练的语言模型中,从而得到物品品类的分布式表示集合。其中,语言模型可以用于将物品品类表征为物品品类的分布式表示。作为一种示例,语言模型可以是CBOW(Continuous Bag-of-Words)模型。CBOW模型是现有的语言模型,将某特定词的上下文相关的其他词对应的词向量作为输入,将该特定词的词向量作为输出,训练即可得到CBOW模型。作为另一种示例,语言模型可以是skip-gram模型。skip-gram模型也是现有的语言模型,其与CBOW模型的思路相反,将某特定词的词向量作为输入,将该特定词的上下文相关的其他词对应的词向量作为输出,训练即可得到skip-gram模型。
[0071] 步骤404,计算由各个目标物品品类的分布式表示组成的分布式表示集合的平均值。
[0072] 在本实施例中,基于步骤403所查找出的各个目标物品品类的分布式表示,电子设备可以计算由各个目标物品品类的分布式表示组成的分布式表示集合的平均值。作为示例,各个目标物品品类的分布式表示是向量,平均值也可以是向量,且平均值中的元素是用于描述两个物品品类之间的平均关联关系。对于平均值中的每个元素,电子设备可以获取分布式表示集合中的与平均值中的该元素相应的元素,并计算所获取到的元素的平均值,作为平均值中的该元素的值。其中,若平均值中的该元素用于描述某两个物品品类之间的平均关联关系,则分布式表示集合中的与平均值中的该元素相应的元素就是用于描述这两个物品品类之间的关联关系的元素。步骤405,基于由各个目标物品品类的分布式表示组成的分布式表示集合的平均值,生成目标分布式表示。
[0073] 在本实施例中,基于步骤404所计算的由各个目标物品品类的分布式表示组成的分布式表示集合的平均值,电子设备可以生成目标分布式表示。
[0074] 作为一种示例,电子设备可以将由各个目标物品品类的分布式表示组成的分布式表示集合的平均值作为目标分布式表示。
[0075] 作为另一种示例,电子设备可以对由各个目标物品品类的分布式表示组成的分布式表示集合的平均值进一步处理,从而生成目标分布式表示。
[0076] 具体地,电子设备可以通过以下步骤对进一步处理:
[0077] 首先,分别计算各个目标物品品类的分布式表示与由各个目标物品品类的分布式表示组成的分布式表示集合的平均值之间的差值。
[0078] 然后,选取出差值处于预设差值范围内的目标物品品类的分布式表示。
[0079] 最后,计算所选取的目标物品品类的分布式表示的平均值,并作为目标分布式表示。
[0080] 步骤406,计算目标分布式表示与候选分布式表示集合中的各个候选分布式表示的相似度。
[0081] 在本实施例中,基于步骤405所生成的目标分布式表示,电子设备可以计算目标分布式表示与候选分布式表示集合中的各个候选分布式表示的相似度。其中,目标分布式表示和候选分布式表示之间的相似度可以用于目标分布式表示和候选分布式表示之间的距离来表示。通常,距离越小或越接近某一个数值,相似度越高,距离越大或越偏离某一个数值,相似度越低。
[0082] 在本实施例的一些可选的实现方式中,电子设备可以通过以下步骤生成候选分布式表示集合:
[0083] 首先,对于候选用户行为数据集合中的每个候选用户行为数据,从物品品类的分布式表示集合中查找出该候选用户行为数据所对应的候选物品品类集合中的各个候选物品品类的分布式表示。
[0084] 这里,电子设备可以将候选物品品类集合中的各个候选物品品类分别与物品品类的分布式表示集合中的每个物品品类的分布式表示所对应的物品品类进行匹配,若一个候选物品品类与一个物品品类的分布式表示所对应的物品品类相同,则匹配成功,且匹配成功的物品品类的分布式表示就是该候选物品品类的分布式表示。
[0085] 然后,计算各个候选物品品类的分布式表示的平均值。
[0086] 最后,基于各个候选物品品类的分布式表示的平均值,生成该候选用户行为数据所对应的候选分布式表示。
[0087] 这里,电子设备可以将各个候选物品品类的分布式表示的平均值作为候选分布式表示,也可以对各个候选物品品类的分布式表示的平均值进一步处理,从而生成候选分布式表示。
[0088] 步骤407,基于所计算的相似度,从各个候选分布式表示所对应的候选推送信息中选取出候选推送信息作为待推送信息,并推送给目标用户。
[0089] 在本实施例中,基于步骤406所计算的相似度,电子设备可以从各个候选分布式表示所对应的候选推送信息中选取出待推送信息,并推送给目标用户的终端设备(例如图1所示的终端设备101、102、103)。其中,候选分布式表示可以是通过对候选用户行为数据进行分析而得到的。候选分布式表示所对应的候选推送信息可以是候选用户行为数据所包括的候选物品标识所指示的候选物品的信息。
[0090] 从图4中可以看出,与图2对应的实施例相比,本实施例中的信息推送方法的流程400突出了生成目标分布式表示的步骤。由此,本实施例描述的方案从预先生成的物品品类的分布式表示集合中查找目标物品品类集合中的各个目标物品品类的分布式表示,并利用各个目标物品品类的分布式表示,生成目标分布式表示,不提高了生成目标分布式表示的效率,还提高了生成目标分布式表示的准确度。
[0091] 进一步参考图5,作为对上述各图所示方法的实现,本申请提供了一种信息推送装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
[0092] 如图5所示,本实施例的信息推送装置500可以包括:获取单元501、第一生成单元502、第二生成单元503、计算单元504和选取单元505。其中,获取单元501,配置用于获取第一预设时间段内的预设网站上的目标用户行为数据,其中,目标用户行为数据包括至少一个目标物品标识;第一生成单元502,配置用于获取至少一个目标物品标识中的各个目标物品标识所指示的目标物品的品类,生成目标物品品类集合;第二生成单元503,配置用于基于目标物品品类集合,生成目标分布式表示,其中,目标分布式表示用于描述目标物品品类集合中的各个目标物品品类之间的关联关系;计算单元504,配置用于计算目标分布式表示与候选分布式表示集合中的各个候选分布式表示的相似度;选取单元505,配置用于基于所计算的相似度,从各个候选分布式表示所对应的候选推送信息中选取出候选推送信息作为待推送信息,并推送给目标用户。
[0093] 在本实施例中,信息推送装置500中:获取单元501、第一生成单元502、第二生成单元503、计算单元504和选取单元505的具体处理及其所带来的技术效果可分别参考图2对应实施例中的步骤201、步骤202、步骤203、步骤204和步骤205的相关说明,在此不再赘述。
[0094] 在本实施例的一些可选的实现方式中,第二生成单元503可以包括:第一查找子单元(图中未示出),配置用于从预先生成的物品品类的分布式表示集合中查找出目标物品品类集合中的各个目标物品品类的分布式表示,其中,物品品类的分布式表示集合中的每个物品品类的分布式表示用于描述该物品品类与其他物品品类之间的关联关系;第一计算子单元(图中未示出),配置用于计算由各个目标物品品类的分布式表示组成的分布式表示集合的平均值;第一生成子单元(图中未示出),配置用于基于由各个目标物品品类的分布式表示组成的分布式表示集合的平均值,生成目标分布式表示。
[0095] 在本实施例的一些可选的实现方式中,第一生成子单元可以包括:第一计算模块(图中未示出),配置用于分别计算各个目标物品品类的分布式表示与由各个目标物品品类的分布式表示组成的分布式表示集合的平均值之间的差值;选取模块(图中未示出),配置用于选取出差值处于预设差值范围内的目标物品品类的分布式表示;第二计算模块(图中未示出),配置用于计算所选取的目标物品品类的分布式表示的平均值,并作为目标分布式表示。
[0096] 在本实施例的一些可选的实现方式中,信息推送装置500还可以包括第三生成单元(图中未示出),第三生成单元可以包括:第一获取子单元(图中未示出),配置用于获取第二预设时间段内的预设网站上的候选用户行为数据集合,其中,候选用户行为数据包括多个候选物品标识;第二生成子单元(图中未示出),配置用于对于候选用户行为数据集合中的每个候选用户行为数据,获取该候选用户行为数据中的至少一个候选物品标识中的各个候选物品标识所指示的候选物品的品类,生成该候选用户行为数据所对应的候选物品品类集合;输入子单元(图中未示出),配置用于将各个候选用户行为数据所对应的候选物品品类集合输入至预先训练的语言模型中,得到物品品类的分布式表示集合,其中,语言模型用于将物品品类表征为物品品类的分布式表示。
[0097] 在本实施例的一些可选的实现方式中,信息推送装置500还可以包括第四生成单元(图中未示出),第四生成单元可以包括:第二查找子单元(图中未示出),配置用于对于候选用户行为数据集合中的每个候选用户行为数据,从物品品类的分布式表示集合中查找出该候选用户行为数据所对应的候选物品品类集合中的各个候选物品品类的分布式表示;第二计算子单元(图中未示出),配置用于计算各个候选物品品类的分布式表示的平均值;第三生成子单元第二计算子单元,配置用于基于各个候选物品品类的分布式表示的平均值,生成该候选用户行为数据所对应的候选分布式表示。
[0098] 在本实施例的一些可选的实现方式中,计算单元504可以进一步配置用于:利用余弦相似度算法计算目标分布式表示与候选分布式表示集合中的各个候选分布式表示的相似度。
[0099] 在本实施例的一些可选的实现方式中,选取单元505可以包括:排序子单元(图中未示出),配置用于将各个候选分布式表示按照相似度大小顺序进行排序,从相似度大的一侧开始选取出预设数目个候选分布式表示;第二获取子单元(图中未示出),配置用于获取所选取的候选分布式表示所对应的候选用户行为数据;作为子单元(图中未示出),配置用于将所获取的候选用户行为数据所包括的候选物品标识所指示的候选物品的信息作为待推送信息。
[0100] 在本实施例的一些可选的实现方式中,用户行为数据包括以下至少一项:用户浏览数据、用户点击数据、用户下单数据、用户评论数据,物品标识包括以下至少一项:用户所浏览物品的物品标识、用户所点击物品的物品标识、用户所下单物品的物品标识,用户所评论物品的物品标识。
[0101] 下面参考图6,其示出了适于用来实现本申请实施例的电子设备的计算机系统600的结构示意图。图6示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
[0102] 如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
[0103] 以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
[0104] 特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的方法中限定的上述功能。
[0105] 需要说明的是,本申请上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是但不限于:电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
[0106] 附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0107] 描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括获取单元、第一生成单元、第二生成单元、计算单元和选取单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,获取单元还可以被描述为“获取第一预设时间段内的预设网站上的目标用户行为数据的单元”。
[0108] 作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取第一预设时间段内的预设网站上的目标用户行为数据,其中,目标用户行为数据包括至少一个目标物品标识;获取至少一个目标物品标识中的各个目标物品标识所指示的目标物品的品类,生成目标物品品类集合;基于目标物品品类集合,生成目标分布式表示,其中,目标分布式表示用于描述目标物品品类集合中的各个目标物品品类之间的关联关系;计算目标分布式表示与候选分布式表示集合中的各个候选分布式表示的相似度;基于所计算的相似度,从各个候选分布式表示所对应的候选推送信息中选取出候选推送信息作为待推送信息,并推送给目标用户。
[0109] 以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。