确定用户可比属性收敛度的方法、装置、介质和电子设备转让专利

申请号 : CN202010613942.2

文献号 : CN111753208B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 李嘉晨郭凯

申请人 : 贝壳找房(北京)科技有限公司

摘要 :

公开了一种确定用户可比属性收敛度的方法、装置、介质以及电子设备。其中的方法包括:根据用户操作数据,获取多个待处理用户和多个可比属性收敛用户分别在各偏好枚举值上的偏好度;根据用户操作数据,获取多个待处理用户和多个可比属性收敛用户的各类行为的行为特征;根据多个待处理用户在各偏好枚举值上的偏好度和各类行为的行为特征与至少部分可比属性收敛用户在各偏好枚举值上的偏好度和各类行为的行为特征的相似度,确定多个待处理用户的可比属性收敛度。本公开通过引入用户可比属性收敛度,有利于丰富网络侧的信息推送策略,从而有利于使信息推送策略更加灵活,进而有利于更好的满足用户需求,最终有利于提高目标行为的发生概率。

权利要求 :

1.一种确定用户可比属性收敛度的方法,包括:根据用户操作数据,获取多个待处理用户和多个可比属性收敛用户分别在各偏好枚举值上的偏好度;其中,所述可比属性为不同用户间进行比较的属性,所述可比属性收敛用户为已经针对其标的成功执行了目标行为的用户;

根据所述用户操作数据,获取所述多个待处理用户和多个可比属性收敛用户的各类行为的行为特征;

确定所述多个待处理用户在各偏好枚举值上的偏好度和各类行为的行为特征与至少部分可比属性收敛用户在各偏好枚举值上的偏好度和各类行为的行为特征的相似度;

根据所述相似度,确定所述多个待处理用户的可比属性收敛度;其中,所述可比属性收敛度用于表示用户的可比属性的稳定程度;

其中,根据所述相似度,确定所述多个待处理用户的可比属性收敛度,包括:针对任一待处理用户,获取以该待处理用户为圆心,由预定数量的第一可比属性收敛用户所形成的区域的半径;其中,所述第一可比属性收敛用户包括:在各偏好枚举值上的偏好度和各类行为的行为特征与该待处理用户在各偏好枚举值上的偏好度和各类行为的行为特征的相似度满足预定相似度要求的可比属性收敛用户;

将所述半径的倒数作为该待处理用户的可比属性收敛度。

2. 根据权利要求1所述的方法,其中,所述根据用户操作数据,获取多个待处理用户和多个可比属性收敛用户分别在各偏好枚举值上的偏好度,包括:根据基于同一地理位置区域的标的的用户操作数据,获取各待处理用户和各可比属性收敛用户分别在各偏好枚举值上的偏好度;和/或所述根据所述用户操作数据,获取所述多个待处理用户和多个可比属性收敛用户的各类行为的行为特征,包括:

根据基于同一地理位置区域的标的的用户操作数据,获取各待处理用户和各可比属性收敛用户的各类行为的行为特征。

3.根据权利要求1所述的方法,其中,所述根据用户操作数据,获取多个待处理用户和多个可比属性收敛用户分别在各偏好枚举值上的偏好度,包括:根据用户操作数据,获取各待处理用户和各可比属性收敛用户分别在各偏好枚举值上的各类行为的行为统计量;

根据所述用户操作数据,获取各待处理用户的各类行为的衰减系数和各可比属性收敛用户的各类行为的衰减系数;

根据所述用户操作数据,获取各类行为的权重系数;

根据各待处理用户和各可比属性收敛用户分别在各偏好枚举值上的各类行为的行为统计量、所述各类行为的衰减系数以及各类行为的权重系数,分别确定各待处理用户和各可比属性收敛用户分别在各偏好枚举值上的偏好度。

4.根据权利要求3所述的方法,其中,所述根据所述用户操作数据,获取各待处理用户的各类行为的衰减系数和各可比属性收敛用户的各类行为的衰减系数,包括:针对各待处理用户和可比属性收敛用户中的任一用户,根据所述用户操作数据,获取该用户的各类行为的行为统计量和该用户的各类行为的末次行为时间到预定时间的时间间隔;

根据该用户的各类行为的行为统计量和该用户的各类行为的末次行为时间到预定时间的时间间隔,获取该用户的第一沉默概率;

针对任一类行为,调整该类行为的末次行为时间到预定时间的时间间隔,并根据所述各类行为的行为统计量和调整后形成的各类行为的末次行为时间到预定时间的时间间隔,获取该用户的第二沉默概率;

若所述第二沉默概率为所述第一沉默概率的一半,则根据获取的所述用户的各类行为的末次行为时间到预定时间的时间间隔和所述调整后形成的各类行为的末次行为时间到预定时间的时间间隔,确定该用户的该类行为的半衰期;

根据所述半衰期,确定该用户的该类行为的衰减系数。

5.根据权利要求3所述的方法,其中,所述根据所述用户操作数据,获取各类行为的权重系数,包括:

针对任一类行为,根据所述用户操作数据,获取在第一预定时间范围内发生该类行为的第一用户数量以及在所述第一预定时间范围后的第二预定时间范围内发生目标行为的第二用户数量;

将所述第二用户数量和第一用户数量的比值,作为该类行为的权重系数。

6.根据权利要求1至5中任一项所述的方法,其中,所述根据所述用户操作数据,获取所述多个待处理用户和多个可比属性收敛用户的各类行为的行为特征,包括:针对多个待处理用户和多个可比属性收敛用户中的任一用户的任一类行为,根据所述用户操作数据,获取该用户的属于该类行为的所有行为在所有偏好枚举值上的行为统计量;

其中,所述行为统计量被作为该用户的该类行为的行为特征。

7.根据权利要求1至5中任一项所述的方法,其中,所述根据所述用户操作数据,获取所述多个待处理用户和多个可比属性收敛用户的各类行为的行为特征,包括:针对多个待处理用户和多个可比属性收敛用户中的任一用户的任一类行为,根据所述用户操作数据,获取该用户的属于该类行为的所有行为在所有偏好枚举值上的行为统计量和该类行为的衰减系数;

根据该用户的属于该类行为的所有行为在所有偏好枚举值上的行为统计量和该类行为的衰减系数,确定该用户的该类行为的单次行为平均衰减量;

其中,所述单次行为平均衰减量被作为该用户的该类行为的行为特征。

8.根据权利要求1至5中任一项所述的方法,其中,所述确定所述多个待处理用户在各偏好枚举值上的偏好度和各类行为的行为特征与至少部分可比属性收敛用户在各偏好枚举值上的偏好度和各类行为的行为特征的相似度,根据所述相似度,确定所述多个待处理用户的可比属性收敛度,包括:

根据所述多个待处理用户在各偏好枚举值上的偏好度以及各类行为的行为特征,对所述多个待处理用户进行聚类处理,获得多个类簇;

确定各类簇的质心用户在各偏好枚举值上的偏好度和各类行为的行为特征与至少部分可比属性收敛用户在各偏好枚举值上的偏好度和各类行为的行为特征的相似度;

根据所述相似度,确定各质心用户的可比属性收敛度;

根据所述各质心用户的可比属性收敛度,确定各质心用户所在类簇中的各待处理用户的可比属性收敛度。

9.根据权利要求8所述的方法,其中,所述确定各类簇的质心用户在各偏好枚举值上的偏好度和各类行为的行为特征与至少部分可比属性收敛用户在各偏好枚举值上的偏好度和各类行为的行为特征的相似度,根据所述相似度,确定各质心用户的可比属性收敛度,包括:

针对任一质心用户,依次计算该质心用户在各偏好枚举值上的偏好度和各类行为的行为特征与可比属性收敛用户在各偏好枚举值上的偏好度和各类行为的行为特征的距离;

根据当前获得的所有距离,在确定出预设最大半径形成的区域中的可比属性收敛用户的数量达到预定最大数量时,则停止所述距离的计算,并根据所述预设最大半径和初始迭代步长确定当前半径;

确定当前半径形成的区域中的可比属性收敛用户的数量;

若所述当前半径形成的区域中的可比属性收敛用户的数量等于预定数量,则根据所述当前半径,确定该质心用户的可比属性收敛度。

10.根据权利要求9所述的方法,其中,所述确定各类簇的质心用户在各偏好枚举值上的偏好度和各类行为的行为特征与至少部分可比属性收敛用户在各偏好枚举值上的偏好度和各类行为的行为特征的相似度,根据所述相似度,确定各质心用户的可比属性收敛度,还包括:

若所述当前半径形成的区域中的可比属性收敛用户的数量大于预定数量,则根据第一迭代步长缩小所述当前半径,并再次确定当前半径形成的区域中的可比属性收敛用户的数量;

若所述当前半径形成的区域中的可比属性收敛用户的数量小于预定数量,则根据第二迭代步长增大所述当前半径,并再次确定当前半径形成的区域中的可比属性收敛用户的数量。

11.一种确定用户可比属性收敛度的装置,其中,所述装置包括:获取偏好度模块,用于根据用户操作数据,获取多个待处理用户和多个可比属性收敛用户分别在各偏好枚举值上的偏好度;其中,所述可比属性为不同用户间进行比较的属性,所述可比属性收敛用户为已经针对其标的成功执行了目标行为的用户;

获取行为特征模块,用于根据所述用户操作数据,获取所述多个待处理用户和多个可比属性收敛用户的各类行为的行为特征;

确定相似收敛度模块,用于确定所述多个待处理用户在各偏好枚举值上的偏好度和各类行为的行为特征与至少部分可比属性收敛用户在各偏好枚举值上的偏好度和各类行为的行为特征的相似度;

确定收敛度模块,用于根据所述相似度,确定所述多个待处理用户的可比属性收敛度,具体用于:针对任一待处理用户,获取以该待处理用户为圆心,由预定数量的第一可比属性收敛用户所形成的区域的半径,将所述半径的倒数作为该待处理用户的可比属性收敛度;

其中,所述可比属性收敛度用于表示用户的可比属性的稳定程度;所述第一可比属性收敛用户包括:在各偏好枚举值上的偏好度和各类行为的行为特征与该待处理用户在各偏好枚举值上的偏好度和各类行为的行为特征的相似度满足预定相似度要求的可比属性收敛用户。

12. 根据权利要求11所述的装置,其中,所述获取偏好度模块进一步用于:根据基于同一地理位置区域的标的的用户操作数据,获取各待处理用户和各可比属性收敛用户分别在各偏好枚举值上的偏好度;和/或所述获取行为特征模块进一步用于:根据基于同一地理位置区域的标的的用户操作数据,获取各待处理用户和各可比属性收敛用户的各类行为的行为特征。

13.根据权利要求11所述的装置,其中,所述获取偏好度模块包括:第一子模块,用于根据用户操作数据,获取各待处理用户和各可比属性收敛用户分别在各偏好枚举值上的各类行为的行为统计量;

第二子模块,用于根据所述用户操作数据,获取各待处理用户的各类行为的衰减系数和各可比属性收敛用户的各类行为的衰减系数;

第三子模块,用于根据所述用户操作数据,获取各类行为的权重系数;

第四子模块,用于根据各待处理用户和各可比属性收敛用户分别在各偏好枚举值上的各类行为的行为统计量、所述各类行为的衰减系数以及各类行为的权重系数,分别确定各待处理用户和各可比属性收敛用户分别在各偏好枚举值上的偏好度。

14.根据权利要求13所述的装置,其中,所述第二子模块进一步用于:针对各待处理用户和可比属性收敛用户中的任一用户,根据所述用户操作数据,获取该用户的各类行为的行为统计量和该用户的各类行为的末次行为时间到预定时间的时间间隔;

根据该用户的各类行为的行为统计量和该用户的各类行为的末次行为时间到预定时间的时间间隔,获取该用户的第一沉默概率;

针对任一类行为,调整该类行为的末次行为时间到预定时间的时间间隔,并根据所述各类行为的行为统计量和调整后形成的各类行为的末次行为时间到预定时间的时间间隔,获取该用户的第二沉默概率;

若所述第二沉默概率为所述第一沉默概率的一半,则根据获取的所述用户的各类行为的末次行为时间到预定时间的时间间隔和所述调整后形成的各类行为的末次行为时间到预定时间的时间间隔,确定该用户的该类行为的半衰期;

根据所述半衰期,确定该用户的该类行为的衰减系数。

15.根据权利要求13所述的装置,其中,所述第三子模块进一步用于:针对任一类行为,根据所述用户操作数据,获取在第一预定时间范围内发生该类行为的第一用户数量以及在所述第一预定时间范围后的第二预定时间范围内发生目标行为的第二用户数量;

将所述第二用户数量和第一用户数量的比值,作为该类行为的权重系数。

16.根据权利要求11至15中任一项所述的装置,其中,所述获取行为特征模块包括:第五子模块,用于针对多个待处理用户和多个可比属性收敛用户中的任一用户的任一类行为,根据所述用户操作数据,获取该用户的属于该类行为的所有行为在所有偏好枚举值上的行为统计量;

其中,所述行为统计量被作为该用户的该类行为的行为特征。

17.根据权利要求11至15中任一项所述的装置,其中,所述获取行为特征模块包括:第六子模块,用于:

针对多个待处理用户和多个可比属性收敛用户中的任一用户的任一类行为,根据所述用户操作数据,获取该用户的属于该类行为的所有行为在所有偏好枚举值上的行为统计量和该类行为的衰减系数;

根据该用户的属于该类行为的所有行为在所有偏好枚举值上的行为统计量和该类行为的衰减系数,确定该用户的该类行为的单次行为平均衰减量;

其中,所述单次行为平均衰减量被作为该用户的该类行为的行为特征。

18.根据权利要求11至15中任一项所述的装置,其中,所述确定相似收敛度模块包括:第七子模块,用于根据所述多个待处理用户在各偏好枚举值上的偏好度以及各类行为的行为特征,对所述多个待处理用户进行聚类处理,获得多个类簇;

第八子模块,用于确定各类簇的质心用户在各偏好枚举值上的偏好度和各类行为的行为特征与至少部分可比属性收敛用户在各偏好枚举值上的偏好度和各类行为的行为特征的相似度;

所述确定收敛度模块包括:

第九子模块,用于确定各质心用户的可比属性收敛度,根据所述各质心用户的可比属性收敛度,确定各质心用户所在类簇中的各待处理用户的可比属性收敛度。

19.根据权利要求18所述的装置,其中,所述第八子模块进一步用于:针对任一质心用户,依次计算该质心用户在各偏好枚举值上的偏好度和各类行为的行为特征与可比属性收敛用户在各偏好枚举值上的偏好度和各类行为的行为特征的距离;

根据当前获得的所有距离,在确定出预设最大半径形成的区域中的可比属性收敛用户的数量达到预定最大数量时,则停止所述距离的计算,并根据所述预设最大半径和初始迭代步长确定当前半径;

所述第九子模块进一步用于:

确定当前半径形成的区域中的可比属性收敛用户的数量;

若所述当前半径形成的区域中的可比属性收敛用户的数量等于预定数量,则根据所述当前半径,确定该质心用户的可比属性收敛度。

20.根据权利要求19所述的装置,其中,所述第九子模块进一步还用于:若所述当前半径形成的区域中的可比属性收敛用户的数量大于预定数量,则根据第一迭代步长缩小所述当前半径,并再次确定当前半径形成的区域中的可比属性收敛用户的数量;

若所述当前半径形成的区域中的可比属性收敛用户的数量小于预定数量,则根据第二迭代步长增大所述当前半径,并再次确定当前半径形成的区域中的可比属性收敛用户的数量。

21.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1‑10中任一项所述的方法。

22.一种电子设备,所述电子设备包括:处理器;

用于存储所述处理器可执行指令的存储器;

所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1‑10中任一项所述的方法。

说明书 :

确定用户可比属性收敛度的方法、装置、介质和电子设备

技术领域

[0001] 本公开涉及计算机技术,尤其是涉及一种确定用户可比属性收敛度的方法、确定用户可比属性收敛度的装置、存储介质以及电子设备。

背景技术

[0002] 目前,在信息推荐技术中,一种常见的信息推荐的实现方式为:根据用户的网络行为确定用户的偏好,并根据用户的偏好为用户提供相应的推荐信息,以便于满足用户需求。
[0003] 虽然用户的网络行为往往与用户的偏好相关,而用户的偏好可以在一定程度上反映出用户需求,但是,有时候基于用户的弱网络行为或者少网络行为等确定出的用户的偏
好,并不能准确的反映出用户需求,因此,如果仅仅根据用户的偏好向用户提供相应的推荐
信息,有时并不能满足用户需求。

发明内容

[0004] 为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种确定用户可比属性收敛度的方法、确定用户可比属性收敛度的装置、存储介质以及电子设备。
[0005] 根据本公开实施例的一个方面,提供了一种确定用户可比属性收敛度的方法,该方法包括:根据用户操作数据,获取多个待处理用户和多个可比属性收敛用户分别在各偏
好枚举值上的偏好度;根据所述用户操作数据,获取所述多个待处理用户和多个可比属性
收敛用户的各类行为的行为特征;确定所述多个待处理用户在各偏好枚举值上的偏好度和
各类行为的行为特征与至少部分可比属性收敛用户在各偏好枚举值上的偏好度和各类行
为的行为特征的相似度;根据所述相似度,确定所述多个待处理用户的可比属性收敛度。
[0006] 在本公开一实施方式中,所述根据用户操作数据,获取多个待处理用户和多个可比属性收敛用户分别在各偏好枚举值上的偏好度,包括:根据基于同一地理位置区域的标
的的用户操作数据,获取各待处理用户和各可比属性收敛用户分别在各偏好枚举值上的偏
好度;和/或,所述根据所述用户操作数据,获取所述多个待处理用户和多个可比属性收敛
用户的各行为的行为特征,包括:根据基于同一地理位置区域的标的的用户操作数据,获取
各待处理用户和各可比属性收敛用户的各行为的行为特征。
[0007] 在本公开又一实施方式中,所述根据用户操作数据,获取多个待处理用户和多个可比属性收敛用户分别在各偏好枚举值上的偏好度,包括:根据用户操作数据,获取各待处
理用户和各可比属性收敛用户分别在各偏好枚举值上的各类行为的行为统计量;根据所述
用户操作数据,获取各待处理用户的各类行为的衰减系数和各可比属性收敛用户的各类行
为的衰减系数;根据所述用户操作数据,获取各类行为的权重系数;根据各待处理用户和各
可比属性收敛用户分别在各偏好枚举值上的各类行为的行为统计量、所述各类行为的衰减
系数以及各类行为的权重系数,分别确定各待处理用户和各可比属性收敛用户分别在各偏
好枚举值上的偏好度。
[0008] 在本公开再一实施方式中,所述根据所述用户操作数据,获取各待处理用户的各类行为的衰减系数和各可比属性收敛用户的各类行为的衰减系数,包括:针对各待处理用
户和可比属性收敛用户中的任一用户,根据所述用户操作数据,获取该用户的各类行为的
行为统计量和该用户的各类行为的末次行为时间到预定时间的时间间隔;根据该用户的各
类行为的行为统计量和该用户的各类行为的末次行为时间到预定时间的时间间隔,获取该
用户的第一沉默概率;针对任一类行为,调整该类行为的末次行为时间到预定时间的时间
间隔,并根据所述各类行为的行为统计量和所述调整后形成的各类行为的末次行为时间到
预定时间的时间间隔,获取该用户的第二沉默概率;若所述第二沉默概率为所述第一沉默
概率的一半,则根据所述末次行为时间到预定时间的时间间隔和所述调整后的末次行为时
间到预定时间的时间间隔,确定该用户的该类行为的半衰期;根据所述半衰期,确定该用户
的该类行为的衰减系数。
[0009] 在本公开再一实施方式中,所述根据所述用户操作数据,获取各类行为的权重系数,包括:针对任一类行为,根据所述用户操作数据,获取在第一预定时间范围内发生该类
行为的第一用户数量以及在所述第一预定时间范围后的第二预定时间范围内发生目标行
为的第二用户数量;将所述第二用户数量和第一用户数量的比值,作为该类行为的权重系
数。
[0010] 在本公开再一实施方式中,所述根据所述用户操作数据,获取所述多个待处理用户和多个可比属性收敛用户的各类行为的行为特征,包括:针对多个待处理用户和多个可
比属性收敛用户中的任一用户的任一类行为,根据所述用户操作数据,获取该用户的属于
该类行为的所有行为在所有偏好枚举值上的行为统计量;其中,所述行为统计量被作为该
用户的该类行为的行为特征。
[0011] 在本公开再一实施方式中,所述根据所述用户操作数据,获取所述多个待处理用户和多个可比属性收敛用户的各类行为的行为特征,包括:针对多个待处理用户和多个可
比属性收敛用户中的任一用户的任一类行为,根据所述用户操作数据,获取该用户的属于
该类行为的所有行为在所有偏好枚举值上的行为统计量和该类行为的衰减系数;根据该用
户的属于该类行为的所有行为在所有偏好枚举值上的行为统计量和该类行为的衰减系数,
确定该用户的该类行为的单次行为平均衰减量;其中,所述单次行为平均衰减量被作为该
用户的该类行为的行为特征。
[0012] 在本公开再一实施方式中,所述根据所述相似度,确定所述多个待处理用户的可比属性收敛度,包括:针对任一待处理用户,根据预定数量的第一可比属性收敛用户所形成
的区域的半径,确定该待处理用户的可比属性收敛度;其中,所述第一可比属性收敛用户包
括:在各偏好枚举值上的偏好度和各类行为的行为特征与该待处理用户在各偏好枚举值上
的偏好度和各类行为的行为特征的相似度满足预定相似度要求的可比属性收敛用户。
[0013] 在本公开再一实施方式中,所述确定所述多个待处理用户在各偏好枚举值上的偏好度和各类行为的行为特征与至少部分可比属性收敛用户在各偏好枚举值上的偏好度和
各类行为的行为特征的相似度,根据所述相似度,确定所述多个待处理用户的可比属性收
敛度,包括:根据所述多个待处理用户在各偏好枚举值上的偏好度以及各类行为的行为特
征,对所述多个待处理用户进行聚类处理,获得多个类簇;确定各类簇的质心用户在各偏好
枚举值上的偏好度和各类行为的行为特征与至少部分可比属性收敛用户在各偏好枚举值
上的偏好度和各类行为的行为特征的相似度;根据所述相似度,确定各质心用户的可比属
性收敛度;根据所述各质心用户的可比属性收敛度,确定各质心用户所在类簇中的各待处
理用户的可比属性收敛度。
[0014] 在本公开再一实施方式中,所述确定各类簇的质心用户在各偏好枚举值上的偏好度和各类行为的行为特征与至少部分可比属性收敛用户在各偏好枚举值上的偏好度和各
类行为的行为特征的相似度,根据所述相似度,确定各质心用户的可比属性收敛度,包括:
针对任一质心用户,依次计算该质心用户在各偏好枚举值上的偏好度和各类行为的行为特
征与可比属性收敛用户在各偏好枚举值上的偏好度和各类行为的行为特征的距离;根据当
前获得的所有距离,在确定出预设最大半径形成的区域中的可比属性收敛用户的数量达到
预定最大数量时,则停止所述距离的计算,并根据所述预设最大半径和初始迭代步长确定
当前半径;确定当前半径形成的区域中的可比属性收敛用户的数量;若所述当前半径形成
的区域中的可比属性收敛用户的数量等于预定数量,则根据所述当前半径,确定该质心用
户的可比属性收敛度。
[0015] 在本公开再一实施方式中,所述确定各类簇的质心用户在各偏好枚举值上的偏好度和各类行为的行为特征与至少部分可比属性收敛用户在各偏好枚举值上的偏好度和各
类行为的行为特征的相似度,根据所述相似度,确定各质心用户的可比属性收敛度,还包
括:若所述当前半径形成的区域中的可比属性收敛用户的数量大于预定数量,则根据第一
迭代步长缩小所述当前半径,并再次确定当前半径形成的区域中的可比属性收敛用户的数
量;若所述当前半径形成的区域中的可比属性收敛用户的数量小于预定数量,则根据第二
迭代步长增大所述当前半径,并再次确定当前半径形成的区域中的可比属性收敛用户的数
量。
[0016] 根据本公开实施例的另一个方面,提供一种确定用户可比属性收敛度的装置,该装置包括:获取偏好度模块,用于根据用户操作数据,获取多个待处理用户和多个可比属性
收敛用户分别在各偏好枚举值上的偏好度;获取行为特征模块,用于根据所述用户操作数
据,获取所述多个待处理用户和多个可比属性收敛用户的各类行为的行为特征;确定相似
收敛度模块,用于确定所述多个待处理用户在各偏好枚举值上的偏好度和各类行为的行为
特征与至少部分可比属性收敛用户在各偏好枚举值上的偏好度和各类行为的行为特征的
相似度;确定收敛度模块,用于根据所述相似度,确定所述多个待处理用户的可比属性收敛
度。
[0017] 在本公开一实施方式中,所述获取偏好度模块进一步用于:根据基于同一地理位置区域的标的的用户操作数据,获取各待处理用户和各可比属性收敛用户分别在各偏好枚
举值上的偏好度;和/或,所述获取行为特征模块进一步用于:根据基于同一地理位置区域
的标的的用户操作数据,获取各待处理用户和各可比属性收敛用户的各行为的行为特征。
[0018] 在本公开又一实施方式中,所述获取偏好度模块包括:第一子模块,用于根据用户操作数据,获取各待处理用户和各可比属性收敛用户分别在各偏好枚举值上的各类行为的
行为统计量;第二子模块,用于根据所述用户操作数据,获取各待处理用户的各类行为的衰
减系数和各可比属性收敛用户的各类行为的衰减系数;第三子模块,用于根据所述用户操
作数据,获取各类行为的权重系数;第四子模块,用于根据各待处理用户和各可比属性收敛
用户分别在各偏好枚举值上的各类行为的行为统计量、所述各类行为的衰减系数以及各类
行为的权重系数,分别确定各待处理用户和各可比属性收敛用户分别在各偏好枚举值上的
偏好度。
[0019] 在本公开再一实施方式中,所述第二子模块进一步用于:针对各待处理用户和可比属性收敛用户中的任一用户,根据所述用户操作数据,获取该用户的各类行为的行为统
计量和该用户的各类行为的末次行为时间到预定时间的时间间隔;根据该用户的各类行为
的行为统计量和该用户的各类行为的末次行为时间到预定时间的时间间隔,获取该用户的
第一沉默概率;针对任一类行为,调整该类行为的末次行为时间到预定时间的时间间隔,并
根据所述各类行为的行为统计量和所述调整后形成的各类行为的末次行为时间到预定时
间的时间间隔,获取该用户的第二沉默概率;若所述第二沉默概率为所述第一沉默概率的
一半,则根据所述末次行为时间到预定时间的时间间隔和所述调整后的末次行为时间到预
定时间的时间间隔,确定该用户的该类行为的半衰期;根据所述半衰期,确定该用户的该类
行为的衰减系数。
[0020] 在本公开再一实施方式中,所述第三子模块进一步用于:针对任一类行为,根据所述用户操作数据,获取在第一预定时间范围内发生该类行为的第一用户数量以及在所述第
一预定时间范围后的第二预定时间范围内发生目标行为的第二用户数量;将所述第二用户
数量和第一用户数量的比值,作为该类行为的权重系数。
[0021] 在本公开再一实施方式中,所述获取行为特征模块包括:第五子模块,用于针对多个待处理用户和多个可比属性收敛用户中的任一用户的任一类行为,根据所述用户操作数
据,获取该用户的属于该类行为的所有行为在所有偏好枚举值上的行为统计量;其中,所述
行为统计量被作为该用户的该类行为的行为特征。
[0022] 在本公开再一实施方式中,所述获取行为特征模块包括:第六子模块,用于:针对多个待处理用户和多个可比属性收敛用户中的任一用户的任一类行为,根据所述用户操作
数据,获取该用户的属于该类行为的所有行为在所有偏好枚举值上的行为统计量和该类行
为的衰减系数;根据该用户的属于该类行为的所有行为在所有偏好枚举值上的行为统计量
和该类行为的衰减系数,确定该用户的该类行为的单次行为平均衰减量;其中,所述单次行
为平均衰减量被作为该用户的该类行为的行为特征。
[0023] 在本公开再一实施方式中,所述确定收敛度模块进一步用于:针对任一待处理用户,根据预定数量的第一可比属性收敛用户所形成的区域的半径,确定该待处理用户的可
比属性收敛度;其中,所述第一可比属性收敛用户包括:在各偏好枚举值上的偏好度和各类
行为的行为特征与该待处理用户在各偏好枚举值上的偏好度和各类行为的行为特征的相
似度满足预定相似度要求的可比属性收敛用户。
[0024] 在本公开再一实施方式中,所述确定相似度收敛度模块包括:第七子模块,用于根据所述多个待处理用户在各偏好枚举值上的偏好度以及各类行为的行为特征,对所述多个
待处理用户进行聚类处理,获得多个类簇;第八子模块,用于确定各类簇的质心用户在各偏
好枚举值上的偏好度和各类行为的行为特征与至少部分可比属性收敛用户在各偏好枚举
值上的偏好度和各类行为的行为特征的相似度;所述确定收敛度模块包括:第九子模块,用
于确定各质心用户的可比属性收敛度,根据所述各质心用户的可比属性收敛度,确定各质
心用户所在类簇中的各待处理用户的可比属性收敛度。
[0025] 在本公开再一实施方式中,所述第八子模块进一步用于:针对任一质心用户,依次计算该质心用户在各偏好枚举值上的偏好度和各类行为的行为特征与可比属性收敛用户
在各偏好枚举值上的偏好度和各类行为的行为特征的距离;根据当前获得的所有距离,在
确定出预设最大半径形成的区域中的可比属性收敛用户的数量达到预定最大数量时,则停
止所述距离的计算,并根据所述预设最大半径和初始迭代步长确定当前半径;所述第九子
模块进一步用于:
[0026] 确定当前半径形成的区域中的可比属性收敛用户的数量;若所述当前半径形成的区域中的可比属性收敛用户的数量等于预定数量,则根据所述当前半径,确定该质心用户
的可比属性收敛度。
[0027] 在本公开再一实施方式中,所述第九子模块进一步还用于:若所述当前半径形成的区域中的可比属性收敛用户的数量大于预定数量,则根据第一迭代步长缩小所述当前半
径,并再次确定当前半径形成的区域中的可比属性收敛用户的数量;若所述当前半径形成
的区域中的可比属性收敛用户的数量小于预定数量,则根据第二迭代步长增大所述当前半
径,并再次确定当前半径形成的区域中的可比属性收敛用户的数量。
[0028] 根据本公开实施例的再一方面,提供一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述方法。
[0029] 根据本公开实施例的又一方面,提供一种电子设备,该电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执
行指令,并执行所述指令,以实现上述方法。
[0030] 基于本公开上述实施例提供的一种确定用户可比属性收敛度的方法和装置,本公开通过引入用户可比属性收敛度,有利于丰富网络侧的信息推送策略,从而有利于使信息
推送策略更加灵活;由于可比属性收敛用户的大量行为常常集中在特定的一个或者多个偏
好枚举值上,且可比属性收敛用户在各类行为上也常常具有一定的行为特征,因此,本公开
通过利用待处理用户在各偏好枚举值上的偏好度和各类行为的行为特征与可比属性收敛
用户在各偏好枚举值上的偏好度和各类行为的行为特征的相似度,来确定待处理用户的可
比属性收敛度,有利于较为客观准确的确定出用户的可比属性收敛度。由此可知,本公开提
供的技术方案有利于更好的满足用户需求,最终有利于提高目标行为的发生概率。
[0031] 下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。

附图说明

[0032] 构成说明书的一部分的附图描述了本公开的实施例,并且连同描述一起用于解释本公开的原理。
[0033] 参照附图,根据下面的详细描述,可以更加清楚地理解本公开,其中:
[0034] 图1为本公开的确定用户可比属性收敛度的方法一个实施例的流程图;
[0035] 图2为本公开的获取多个待处理用户和多个可比属性收敛用户分别在各偏好枚举值上的偏好度一实施例的流程图;
[0036] 图3为本公开的获取一用户的各类行为的衰减系数一实施例的流程图;
[0037] 图4为本公开的确定所有待处理用户的可比属性收敛度一实施例的流程图;
[0038] 图5为本公开的确定一质心用户的可比属性收敛度一实施例的流程图;
[0039] 图6为本公开的确定用户可比属性收敛度的装置一个实施例的结构示意图;
[0040] 图7为本公开一示例性实施例提供的电子设备的结构图。

具体实施方式

[0041] 下面将参考附图详细地描述根据本公开的示例实施例。显然,所描述的实施例仅仅是本公开的一部分实施例,而不是本公开的全部实施例,应理解,本公开不受这里描述的
示例实施例的限制。
[0042] 应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
[0043] 本领域技术人员可以理解,本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺
序。
[0044] 还应理解,在本公开实施例中,“多个”可以指两个或者两个以上,“至少一个”可以指一个、两个或两个以上。
[0045] 还应理解,对于本公开实施例中提及的任一部件、数据或结构,在没有明确限定或者在前后文给出相反启示的情况下,一般可以理解为一个或多个。
[0046] 另外,本公开中术语“和/或”,仅是一种描述关联对象的关联关系,表示可以存在三种关系,如A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,
本公开中字符“/”,一般表示前后关联对象是一种“或”的关系。
[0047] 还应理解,本公开对各个实施例的描述着重强调各个实施例之间的不同之处,其相同或相似之处可以相互参考,为了简洁,不再一一赘述。
[0048] 同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
[0049] 以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
[0050] 对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
[0051] 应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
[0052] 本公开的实施例可以应用于终端设备、计算机系统、服务器等电子设备,其可与众多其它通用或者专用计算系统环境或配置一起操作。适于与终端设备、计算机系统或者服
务器等电子设备一起使用的众所周知的终端设备、计算系统、环境和/或配置的例子包括但
不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于
微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统、大型计算
机系统和包括上述任何系统的分布式云计算技术环境等等。
[0053] 终端设备、计算机系统、服务器等电子设备可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目
标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计
算机系统/服务器可以在分布式云计算环境中实施。在分布式云计算环境中,任务可以是由
通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包
括存储设备的本地或远程计算系统存储介质上。
[0054] 本公开概述
[0055] 在实现本公开的过程中,发明人发现,在用户的可比属性已经较为收敛的应用场景中,根据当前确定出的用户偏好向用户推送相应的信息,往往能够在较大程度上满足用
户需求。然而,在用户的可比属性并不收敛的应用场景中,如果仍然根据当前确定出的用户
偏好向用户推送相应的信息,则信息推送存在的偏差往往较大,即推送的信息很难满足用
户需求。如果能够较为客观准确的确定出用户的可比属性的收敛度,则有利于丰富网络侧
的信息推送策略,使信息推送策略更加灵活,从而有利于更好的满足用户需求。
[0056] 示例性概述
[0057] 本公开提供的确定用户可比属性收敛度的应用场景的一个例子如下:
[0058] 在房产领域,假设有多个用户分别使用各自的终端设备(如计算机或者智能移动电话等)访问一房产公司提供的网站。网络侧可以分别获得每一个用户的可比属性收敛度,
对于可比属性收敛度满足预定收敛度要求的用户(如可比属性收敛度达到第一预定收敛度
阈值的用户),网络侧可以向这部分用户的终端设备推送较多数量的与用户的偏好相符合
的楼盘信息;而对于可比属性收敛度不满足预定收敛度要求的用户(如可比属性收敛度低
于第二预定收敛度阈值的用户),网络侧可以向这部分用户的终端设备推送较多数量的当
前热度较高的楼盘信息等。
[0059] 在一用户持续访问房产公司提供的网站的过程中,该用户的可比属性收敛度往往会越来越高,即用户需求越来越明确。在上述可比属性收敛度不满足预定收敛度要求的用
户的当前可比属性收敛度已经满足预定收敛度要求的情况下,网络侧可以由向这样的用户
的终端设备推送较多数量的当前热度较高的楼盘信息,转变为:向这样的用户的终端设备
推送较多数量的与该用户的偏好相符合的楼盘信息。
[0060] 如果一用户很长一段时间不再持续的访问房屋房产公司提供的网站,该用户的可比属性收敛度往往会越来越低,即该用户需求越来越不明确。在上述可比属性收敛度满足
预定收敛度要求的用户的可比属性收敛度已经不再满足预定收敛度要求的情况下,网络侧
可以由向这样的用户的终端设备推送较多数量的与该用户的偏好相符合的楼盘信息,转变
为:向这样的用户的终端设备推送较多数量的当前热度较高的楼盘信息等。
[0061] 示例性方法
[0062] 图1为本公开的确定用户可比属性收敛度的方法一个实施例的流程图。图1所示的实施例的方法包括步骤:S100、S101、S102以及S103。下面对各步骤分别进行说明。
[0063] S100、根据用户操作数据,获取多个待处理用户和多个可比属性收敛用户分别在各偏好枚举值上的偏好度。
[0064] 本公开中的用户操作数据可以是指由于用户本人和/或网络侧维护人员等,通过对计算机或者智能移动电话等设备的操作,而生成的用于描述用户行为的用户操作数据。
本公开中的用户操作数据可以包括:在服务器一侧形成的操作日志或者访问日志等信息。
本公开对此不作限定。
[0065] 本公开中的待处理用户可以是指需要确定用户可比属性收敛度的用户。本公开的可比属性可以是指不同用户间可以进行比较的属性。可比属性收敛度可以表示出用户的可
比属性的稳定程度。本公开中的可比属性收敛用户可以是指已经针对其标的,成功执行了
目标行为的用户。本公开中的标的可以是指用户行为所针对的对象。本公开中的标的也可
以称为行为标的或者行为对象等。标的在不同应用场景可以表现为不同的内容。例如,在房
产领域,本公开的标的可以为房屋。再例如,在商品零售领域,本公开的标的可以为零售商
品等。本公开中的目标行为可以根据实际应用场景的具体需求设置。例如,目标行为可以为
标的成交行为或者成功委托行为等,本公开对此不作限定。
[0066] 在一个例子中,对于房产领域而言,本公开中的待处理用户可以具体为访问过房产公司提供的网站,且当前需要买房或者需要租房的用户;本公开中的可比属性收敛用户
可以具体为访问过房产公司提供的网站,且当前已经成功买房或者成功租房的用户。
[0067] 本公开中的偏好枚举值可以是指用户的标的的属性信息的枚举值。标的的属性信息可以是指用于描述标的自身所具有的特点的信息。一个例子,假设本公开中的标的(即行
为对象)为房屋,且行为对象属性信息可以包括:房屋性质、房屋位置、房屋面积、厅室结构、
房屋类型以及房屋结构等属性元素,其中的房屋性质可以包括:新房和二手房等枚举值,其
中的房屋位置可以包括:二环内、二环至三环之间、三环至四环之间、四环至五环之间、五环
到六环之间和六环之外等枚举值;其中的房屋面积可以包括:40平方米以内、40‑60平方米、
60‑80平方米、80‑100平方米、100‑140平方米以及140平方米以上等枚举值,其中的厅室结
构可以包括:开间、一室一厅、二室一厅、三室一厅、四室一厅以及至少五室一厅等枚举值;
其中的房屋类型可以包括:普通住宅和别墅等枚举值,其中的房屋结构可以包括:砖混结构
和非砖混结构等枚举值;在上述假设的情况下,本公开中的偏好枚举值可以包括:新房、二
手房、二环内、二环至三环之间、三环至四环之间、四环至五环之间、五环到六环之间、六环
之外、40平方米以内、40‑60平方米、60‑80平方米、80‑100平方米、100‑140平方米、140平方
米以上、一室一厅、开间、二室一厅、三室一厅、四室一厅、至少五室一厅、砖混结构、非砖混
结构、普通住宅以及别墅等中的部分或者所有。在不同的实际应用领域中,本公开的偏好枚
举值可能会随着标的的不同而不同,本公开不限定偏好枚举值的具体内容。另外,本公开中
的偏好枚举值也可以称为标的属性枚举值。
[0068] 本公开中的待处理用户在各偏好枚举值上的偏好度可以是指待处理用户对标的(如房屋)的属性信息所包含的各枚举值的喜好程度或倾向程度等。同样的,本公开中的可
比属性收敛用户在各偏好枚举值上的偏好度可以是指可比属性收敛用户对标的(如房屋)
的属性信息所包含的各枚举值的喜好程度或倾向程度等。
[0069] 对于多个待处理用户和多个可比属性收敛用户中的任一用户而言,本公开可以通过对用户操作数据进行该用户基于不同枚举值的用户行为数量的统计,获得该用户的多个
基于枚举值的行为统计量,并利用各基于枚举值的行为统计量,获得该用户在各偏好枚举
值上的偏好度。基于枚举值的行为统计量可以表示出每一个枚举值各自对应的行为统计
量。
[0070] S101、根据用户操作数据,获取多个待处理用户和多个可比属性收敛用户的各类行为的行为特征。
[0071] 本公开中的各类行为可以根据实际应用场景的具体需求设置。一个例子,在房产领域,本公开中的各类行为可以包括:房屋详情页的PV(Page View,页面浏览)类行为、关键
词搜索类行为、用户关注房屋类行为、用户产生商机类行为以及用户的带看房屋类行为等。
本公开不限制各类行为的类数量以及各类行为的具体表现形式等。
[0072] 本公开中的待处理用户的各类行为的行为特征可以是指:用于描述待处理用户所执行的各行为各自所属的一类行为所具有的特征的信息。同样的,本公开中的可比属性收
敛用户的各类行为的行为特征可以是指:用于描述可比属性收敛用户所执行的各行为各自
所属的一类行为所具有的特征的信息。
[0073] 在通常情况下,多个待处理用户和多个可比属性收敛用户中的任一用户的任一类行为的行为特征可以包括:该类行为的至少一行为特征元素。本公开中的行为特征元素可
以是指用于描述用户所执行的属于同一类行为的所有行为所具有的特征的基本信息单元。
也就是说,对于任一用户而言,该用户执行的属于同一类行为的所有行为具有一个或多个
特征点,每一个特征点即为一个行为特征元素。对于多个待处理用户和多个可比属性收敛
用户中的任一用户而言,本公开可以通过对用户操作数据进行该用户所执行的各类行为的
行为量的统计,获得该用户的各类行为的行为统计量,并进一步利用各类行为的行为统计
量,获得该用户的各类行为的行为特征。
[0074] S102、确定多个待处理用户在各偏好枚举值上的偏好度和各类行为的行为特征与至少部分可比属性收敛用户在各偏好枚举值上的偏好度和各类行为的行为特征的相似度。
[0075] 本公开中的一待处理用户在各偏好枚举值上的偏好度和各类行为的行为特征可以认为是一条记录,本公开中的一可比属性收敛用户在各偏好枚举值上的偏好度和各类行
为的行为特征同样可以认为是一条记录。本公开可以通过计算两条记录的距离,获得两条
记录的相似度。
[0076] S103、根据上述相似度,确定多个待处理用户的可比属性收敛度。
[0077] 通常情况下,本公开可以在获取到一待处理用户在各偏好枚举值上的偏好度和各类行为的行为特征与部分可比属性收敛用户在各偏好枚举值上的偏好度和各类行为的行
为特征的相似度的情况下,确定出该待处理用户的可比属性收敛度。另外,本公开可以在获
取到部分待处理用户在各偏好枚举值上的偏好度和各类行为的行为特征与部分可比属性
收敛用户在各偏好枚举值上的偏好度和各类行为的行为特征的相似度的情况下,确定出所
有待处理用户的可比属性收敛度。
[0078] 针对任一待处理用户而言,本公开可以通过对该待处理用户对应的多个相似度进行进一步的处理,获得该待处理用户的可比属性收敛度。
[0079] 本公开通过引入用户可比属性收敛度,有利于丰富网络侧的信息推送策略,从而有利于使信息推送策略更加灵活;由于可比属性收敛用户的大量行为常常集中在特定的一
个或者多个偏好枚举值上,且可比属性收敛用户在各类行为上也常常具有一定的行为特
征,因此,本公开通过利用待处理用户在各偏好枚举值上的偏好度和各类行为的行为特征
与可比属性收敛用户在各偏好枚举值上的偏好度和各类行为的行为特征的相似度,来确定
待处理用户的可比属性收敛度,有利于较为客观准确的确定出用户可比属性的收敛度。由
此可知,本公开提供的技术方案有利于更好的满足用户需求,最终有利于提高目标行为的
发生概率。
[0080] 在一个可选示例中,本公开在确定用户可比属性收敛度的过程中,可以考虑地理位置区域(如城市)。这里的地理位置区域可以是指标的所在的地理位置区域。即所有待处
理用户的标的和所有可比属性收敛用户的标的应属于同一地理位置区域(如同一城市)。不
可排除的是,在一些应用场景中,本公开中的地理位置区域也可以是指待处理用户和可比
属性收敛用户所在的地理位置区域。
[0081] 在用户操作数据是以标的为基础而产生的情况下,本公开中的用户操作数据可以具体为基于同一地理位置区域(如同一城市)的标的的用户操作数据。即本公开是根据基于
同一地理位置区域的标的的用户操作数据,获取多个待处理用户和多个可比属性收敛用户
分别在各偏好枚举值上的偏好度的。同样的,本公开是根据基于同一地理位置区域的标的
的用户操作数据,获取多个待处理用户和多个可比属性收敛用户的各类行为的行为特征
的。在该应用场景中,本公开中的所有待处理用户和所有可比属性收敛用户可以不处于同
一地理位置区域,如处于不同城市。由于位于不同省市等地理位置区域的标的,尤其是价值
不菲的标的(如房产等),在标的数量、标的类型和标的价格等方面通常存在较大差异,因
此,往往会导致对不同地理位置区域中的标的产生需求的用户在各偏好枚举值上的偏好度
以及各类行为的行为特征存在一定的差异,本公开通过区分标的的地理位置区域,来确定
用户可比属性收敛度,有利于使确定出的用户可比属性收敛更客观准确。
[0082] 在一个可选示例中,本公开在确定用户在各偏好枚举值上的偏好度的过程中,不仅可以考虑行为的权重系数,还可以考虑行为的衰减系数。即本公开可以利用行为的权重
系数和行为的衰减系数来确定用户在各偏好枚举值上的偏好度。
[0083] 可选的,本公开中的获取多个待处理用户和多个可比属性收敛用户分别在各偏好枚举值上的偏好度的一个例子,如图2所示。
[0084] 图2中,S200、根据用户操作数据,获取各待处理用户和各可比属性收敛用户分别在各偏好枚举值上的各类行为的行为统计量。
[0085] 可选的,针对所有待处理用户和所有可比属性收敛用户中的任一用户而言,本公开可以从用户操作数据中获得该用户在一段时间内的所有行为(如最近N天的所有行为),
之后,本公开可以以偏好枚举值为单位,对该用户的所有行为进行行为量的统计,例如,如
果该用户的所有行为总共涉及n1个不同的偏好枚举值,且该用户的所有行为总共涉及n2类
行为,则本公开可以通过执行n1×n2次统计,获得n1×n2个行为统计量,且每一个行为统计
量对应在一个偏好枚举值上的一类行为的行为统计量。
[0086] 一个更具体的例子,假设所有待处理用户和所有可比属性收敛用户中的任一用户的所有行为总共包括m1+m2次行为;其中m1次行为均涉及偏好枚举值a(如新房),且m1次行
为涉及房屋详情页的PV类行为和用户产生商机类行为这两类行为,假设m11次行为属于房
屋详情页的PV类行为,且m12次行为属于用户产生商机类行为;其中m2次行为均涉及偏好枚
举值b(如二手房),且m2次行为涉及屋详情页的PV类行为和用户产生商机类行为这两类行
为,假设m21次行为属于房屋详情页的PV类行为,m22次行为属于用户产生商机类行为。在上
述假设条件下,本公开可以对该用户的m1+m2次行为进行4次行为量统计,获得4个行为统计
量,其中第一个行为统计量为:用户在偏好枚举值a上的房屋详情页的PV类行为的行为统计
量,其中第二个行为统计量为:用户在偏好枚举值a上的用户产生商机类行为的行为统计
量,其中第三个行为统计量为:用户在偏好枚举值b上的房屋详情页的PV类行为的行为统计
量,其中第四个行为统计量为:用户在偏好枚举值b上的用户产生商机类行为的行为统计
量。
[0087] S201、根据用户操作数据,获取各待处理用户的各类行为的衰减系数和各可比属性收敛用户的各类行为的衰减系数。
[0088] 可选的,本公开中的一个衰减系数对应一个用户的一类行为。即本公开的衰减系数与行为的类型相关,而与行为所对应的偏好枚举值无关。也就是说,本公开中的一个衰减
系数对应一个用户在不同偏好枚举值上的同一类行为。本公开中的衰减系数可以表示出用
户的一类行为中的某一次行为(如末次行为等)的执行时间到预定时间的时长(如执行时间
距今的时长等),在可比属性收敛度方面所起的作用。
[0089] 本公开可以利用预先设置的模型获得用户的各类行为的衰减系数。具体获得用户的各类行为的衰减系数的一个例子如下述针对图3的描述。
[0090] S202、根据用户操作数据,获取各类行为的权重系数。
[0091] 可选的,本公开中的一个权重系数对应所有用户(包括所有待处理用户和所有可比属性收敛用户)的一类行为。即本公开的权重系数与行为的类型相关,而与行为所对应的
偏好枚举值无关,也与具体的用户无关。也就是说,本公开中的一个权重系数对应所有用户
在所有偏好枚举值上的同一类行为。本公开中的权重系数可以表示出所有用户的一类行为
在可比属性收敛度方面所起的作用。
[0092] 可选的,本公开可以利用执行了一类行为的所有用户是否在后续执行了目标行为的具体情况,确定该类行为的权重系数。一个具体的例子如下:
[0093] 首先,假设所有待处理用户和所有可比属性收敛用户形成用户集合,且假设所有类行为形成类行为集合,那么,对于类行为集合中的第一类行为(如用户产生商机类行为),
本公开可以根据用户操作数据,获得用户集合内的所有用户中在第一预定时间范围内执行
了第一类行为的用户的数量,本公开将该数量称为第一用户数量。其中的第一预定时间范
围内可以为预定单日内(如T日)或者预定多日内(如T日至T+i日)等。
[0094] 其次,本公开可以根据用户操作数据,获得用户集合内的所有用户中在第一预定时间范围后的第二预定时间范围内(如第一预定时间范围后的7天内等)执行了目标行为的
用户的数量,本公开将该数量称为第二用户数量。其中的第二预定时间范围的起始时间不
早于第一预定时间范围的结束时间,且第二预定时间范围内可以为第一预定时间范围之后
的预定单日内(如T1日)或者预定多日内(如T1日到T1+j日)。
[0095] 最后,本公开可以将第二用户数量与第一用户数量的比值,作为第一类行为的权重系数。
[0096] 依照上述方式,本公开可以获得类行为集合中的第二类行为的权重系数、第三类行为的权重系数、……、以及最后一类行为的权重系数。
[0097] 可选的,一个更为具体的例子为:假定所有待处理用户和所有可比属性收敛用户形成用户集合。本公开通过对用户操作数据进行统计获得:用户集合中,在T日执行过用户
产生商机类行为的用户的数量为100,且这100位用户中,在T日之后的多日内(如7日内),有
5位用户执行过目标行为(如成交行为),则本公开可以确定出用户集合中的所有用户的用
户产生商机类行为的权重系数均为1/20。同样本的,本公开通过对用户操作数据进行统计
获得:用户集合中,在T日执行过房屋详情页的PV类行为的用户的数量为100,且这100位用
户中,在T日之后的多日内(如7日内),有1位用户执行过目标行为(如成交行为),则本公开
可以确定出用户集合中的所有用户的房屋详情页的PV类行为的权重系数均为1/100。
[0098] 本公开通过利用执行过一类行为的用户数量以及执行过目标行为的用户数量的比值,来确定所有用户的该类行为的权重系数,不仅能够较为便捷的获得各类行为的权重
系数,而且有利于使权重系数较更为客观准确的反映出各类行为与用户成熟之间的关系,
从而有利于更为客观准确的衡量用户在各偏好枚举值上的偏好度。
[0099] S203、根据各待处理用户和各可比属性收敛用户分别在各偏好枚举值上的各类行为的行为统计量、各类行为的衰减系数和各类行为的权重系数,分别确定各待处理用户和
各可比属性收敛用户分别在各偏好枚举值上的偏好度。
[0100] 可选的,本公开可以利用衰减系数和权重系数,对相应的行为统计量进行线性求和的方式,确定出用户在各偏好枚举值上的偏好度。一个具体的例子如下:
[0101] 对于所有待处理用户和所有可比属性收敛用户中的任一用户的一个偏好枚举值而言,假设该用户有n类行为涉及该偏好枚举值,该用户的第1类行为的行为统计量为x1,该
用户的第2类行为的行为统计量为x2,……,该用户的第n类行为的行为统计量为xn,假设该
用户的第1类行为的衰减系数为a1,该用户的第2类行为的衰减系数为a2,……,该用户的第
n类行为的衰减系数为an,假设所有用户的第1类行为的权重系数均为b1,所有用户的第2类
行为的权重系数均为b2,……,所有用户的第n类行为的权重系数均为bn;
[0102] 在上述假设的情况下,该用户在一偏好枚举值的偏好度可以为下述公式(1)的计算结果:
[0103] x1×a1×b1+x2×a2×b2+……+xn×an×bn公式(1)
[0104] 公开可以采用类似的方式获得该用户在每一个偏好枚举值上的偏好度,进而本公开可以采用类似的方式获得每一个用户在每一个偏好枚举值上的偏好度。
[0105] 不同用户针对同一偏好枚举值所执行的同一类行为,往往会由于不同用户执行过的其他行为的不同,而对该偏好枚举值的偏好度的影响存在差异,本公开通过为每一用户
的每一类行为分别设置衰减系数,有利于体现出每一用户在每一偏好枚举值上的每一类行
为的行为统计量,各自对用户在相应偏好枚举值的偏好度上的影响。由于不同类行为对于
偏好度的影响通常存在差异,例如,房屋详情页的PV类行为对偏好度的影响很可能不如用
户的带看房屋类行为对偏好度的影响大,因此,本公开通过针对所有用户的各类行为分别
设置权重系数,有利于体现出用户在每一偏好枚举值上的每一类行为的行为统计量,各自
对用户在相应偏好枚举值的偏好度上的影响。由此可知,本公开通过利用用户在各偏好枚
举值上的各类行为的行为统计量、各类行为的衰减系数和各类行为的权重系数,来确定用
户分别在各偏好枚举值上的偏好度,有利于客观准确的衡量每一个用户各自在各偏好枚举
值上的偏好度。
[0106] 在一个可选示例中,对于所有待处理用户和所有可比属性收敛用户中的任一用户,本公开获取该用户的各类行为的衰减系数的一个例子,如图3所示。
[0107] 图3中,S300、根据用户操作数据,获取一用户的各类行为的行为统计量和各类行为的末次行为时间到预定时间的时间间隔。
[0108] 可选的,S300中的用户的各类行为的行为统计量是以行为类型为单位,对用户操作数据中的该用户所执行的所有行为进行统计获得的,即S300中的用户的各类行为的行为
统计量与偏好枚举值无关。
[0109] 一个更为具体的例子,假设一用户的所有行为总共包括m1+m2次行为;其中m1次行为均涉及偏好枚举值a(如新房),且m1次行为涉及房屋详情页的PV类行为和用户产生商机
类行为这两类行为,假设m11次行为属于房屋详情页的PV类行为,且m12次行为属于用户产
生商机类行为;其中m2次行为均涉及偏好枚举值b(如二手房),且m2次行为涉及屋详情页的
PV类行为和用户产生商机类行为这两类行为,假设m21次行为属于房屋详情页的PV类行为,
且m22次行为属于用户产生商机类行为。
[0110] 在上述假设条件下,本公开可以对m1+m2次行为进行2次行为量统计,获得2个行为统计量,其中第一个行为统计量为:用户在偏好枚举值a和偏好枚举值b上的房屋详情页的
PV类行为的行为统计量,其中第二个行为统计量为:用户在偏好枚举值a和偏好枚举值b上
的用户产生商机类行为的行为统计量。
[0111] 可选的,本公开中的各类行为的末次行为时间到预定时间的时间间隔可以为各类行为的末次时间分别与当前时间或者当前时间的前一天的24点等预定时间之间的时长(如
X日等)。其中的末次行为时间可以是指末次行为的发生时间。
[0112] S301、根据该用户的各类行为的行为统计量和该用户的各类行为的末次行为时间到预定时间的时间间隔,获取该用户的第一沉默概率。
[0113] 可选的,本公开中的用户的第一沉默概率可以是指用户在执行某一类行为的末次行为后的一段时间范围内(如末次行为之后的七天内),该用户不发生任何行为的可能性。
本公开可以利用预设模型获得用户的第一沉默概率。具体的,本公开可以将该用户的各类
行为的行为统计量和该用户的各类行为的末次行为时间距今时间间隔一起作为模型输入,
提供给预设模型,经由该预设模型进行沉默概率预测处理,并输出一概率值,本公开可以直
接将该预设模型输出的概率值作为第一沉默概率,也可以将预设模型输出的概率值进行映
射等处理的结果作为第一沉默概率。
[0114] 一个更为具体的例子,假设本公开中的末次行为时间到预定时间的时间间隔为末次行为距今时间,且假设本公开共有三类行为,分别为:房屋详情页的PV类行为、用户产生
商机类行为以及用户的带看房屋类行为。对于所有待处理用户和所有可比属性收敛用户中
的一用户而言,假设该用户的房屋详情页的PV类行为的行为量为x1,且末次行为距今时间
为s1,假设该用户的用户产生商机类行为的行为量为x2,且末次行为距今时间为s2,假设该
用户的带看房屋类行为的行为量为x3,且末次行为距今时间为s3。上述s1、s2和s3均可以称
为末次行为初始距今时间。
[0115] 在上述假设条件下,本公开可以将x1、x2、x3、s1、s2和s3一起作为模型输入,提供给预设模型,预设模型会针对该模型输入,形成一预定取值范围内的概率值。例如,该预定
取值范围可以为0‑1。该概率值即为该用户的第一沉默概率,例如,该预设模型输出该用户
在最后一次执行了一类行为(如x1对应的类行为)后的7天内,不会发生上述三类行为中的
任何一类行为的可能性。
[0116] 可选的,本公开中的预设模型可以为基于树的分类模型,例如,基于树的二分类模型等(如Xgboost等决策树)。该预设模型的训练样本可以包括:基于可比属性收敛用户的用
户操作数据形成的训练样本,该预设模型的训练样本也可以包括:基于待处理用户的用户
操作数据形成的训练样本。本公开的训练样本通常包括:各类行为的行为统计量、各类行为
的末次行为时间到一特定时间的时间间隔以及用于表示是否沉默的标签。训练样本的标签
用于调整预设模型的模型参数。例如,预设模型会针对每一个训练样本分别输出一概率值,
每一概率值分别表示相应用户在特定时间后的X(如7)日内,不执行任一类行为的可能性。
本公开可以利用预设模型输出的各概率值与训练样本的标签之间的差异进行损失计算,并
利用损失计算结果调整预设模型的模型参数。具体训练过程在此不再进行详细描述。
[0117] S302、判断是否获得了该用户的所有类行为的衰减系数,如果还未获得该用户的所有类行为的衰减系数,则到S303;如果已经获得了该用户的所有类行为的衰减系数,则到
S308。
[0118] 可选的,本公开需要获得该用户的所有类行为的衰减系数。续前例,如果当前已经获得了该用户的上述三类行为各自的衰减系数,则到S308,如果当前还未获得该用户的上
述三类行为各自的衰减系数,则到S303。
[0119] S303、选取一未获得衰减系数的类行为。
[0120] S304、调整当前选取出的该类行为的末次行为时间到一预定时间的时间间隔,并根据该用户的各类行为的行为统计量以及调整后形成的各类行为的末次行为时间分别到
预定时间的时间间隔,获取该用户的第二沉默概率。
[0121] 可选的,本公开每次仅针对模型输入中的其中一类行为的末次行为时间到预定时间的时间间隔进行调整,并用该调整后的末次行为时间到预定时间的时间间隔替换前次模
型输入中的相应的末次行为时间到预定时间的时间间隔,从而再次形成模型输入,通过将
当前形成的模型输入提供给预设模型,经由该预设模型进行沉默概率预测处理,本公开可
以直接将该预设模型输出的概率值作为第二沉默概率,同样的,本公开也可以将该预设模
型输出的概率值进行映射等处理的结果作为第二沉默概率。
[0122] 续前例,本公开可以对s1、s2和s3中的一个(如s1)进行调整,例如,将s1更新为s1+Δs(Δs大于0),然后,将x1、x2、x3、更新后的s1、s2和s3一起作为模型输入,提供给预设模
型,经由该预设模型进行沉默概率预测处理,并输出该用户的第二沉默概率,例如,该预设
模型输出该用户在未来7天内不会发生上述三类行为中的任何一类行为的可能性。
[0123] S305、判断当前获得的第二沉默概率是否为第一沉默概率的一半,如果第二沉默概率为第一沉默概率的一半,则到S306;如果当前获得的第二沉默概率不为第一沉默概率
的一半,则返回304。
[0124] S306、根据当前选取出的该类行为的末次行为时间到预定时间的时间间隔和当前调整后的末次行为时间到预定时间的时间间隔,确定该用户的该类行为的半衰期。
[0125] 可选的,本公开可以将当前选取出的该类行为的末次行为时间到预定时间的时间间隔和当前调整后的末次行为时间到预定时间的时间间隔的差值,作为该用户的当前选取
出的该类行为的半衰期。例如,假设用户的一类行为的末次行为初始距今时间为1天,而当
前调整后的该类行为的末次行为距今时间为10天,则该用户的该类行为的半衰期为9天。
[0126] S307、根据该用户的该类行为的半衰期,确定该用户的该类行为的衰减系数。返回S302。
[0127] 可选的,本公开可以采用多种方式,利用半衰期确定衰减系数。例如,本公开可以将用户的一类行为的半衰期代入到牛顿冷却法中,从而获得该用户的该类行为的衰减系
数。本公开对利用半衰期确定衰减系数的实现方式不作限定。
[0128] S308、结束本次获取该用户的各类行为的衰减系数的流程。
[0129] 本公开通过一次调整一类行为的末次行为时间到预定时间的时间间隔,获得一类行为的半衰期,进而获得一类行为的衰减系数,相较于采用默认的半衰期获得衰减系数的
方式,有利于提高半衰期的准确性。
[0130] 在一个可选示例中,本公开中的任一类行为的行为特征可以包括:该类行为的行为统计量以及该类行为的单次行为平均衰减量中的至少一个。
[0131] 可选的,本公开获取各待处理用户和各可比属性收敛用户的各类行为的行为统计量的方式可以包括:针对所有待处理用户和所有可比属性收敛用户中的任一用户的任一类
行为,本公开可以根据该用户的用户操作数据,获取该用户的属于该类行为的所有行为在
所有偏好枚举值上的行为统计量。例如,本公开可以从用户操作数据中获得该用户的所有
行为,并以类行为为单位,对该用户的所有行为的进行行为量的统计,也就是说,如果该用
户的所有行为总共涉及n1个不同的枚举值,且该用户的所有行为总共涉及n2类行为,则本
公开可以通过执行n2次统计,从而获得n2个行为统计量,且每一个行为统计量均对应在所
有枚举值。即本公开的一类行为的行为统计量与行为所对应的偏好枚举值无关。
[0132] 由于用户执行各类行为的行为量往往与用户的需求有密切联系,例如,用户执行各类行为的行为量越多,则用户偏好往往越明显,用户的可比属性收敛度往往越高;因此,
本公开通过将用户的各类行为的行为统计量作为用户的各类行为的行为特征,有利于对用
户可比属性收敛度进行客观的衡量,从而有利于提高用户可比属性收敛度的准确性。
[0133] 可选的,本公开获取各待处理用户和各可比属性收敛用户的各类行为的单次行为平均衰减量的方式可以包括如下步骤:
[0134] 首先,针对所有待处理用户和所有可比属性收敛用户中的任一用户的任一类行为而言,本公开可以根据该用户的用户操作数据,获取该用户的属于该类行为的所有行为在
所有偏好枚举值上的行为统计量和该类行为的衰减系数。获取该用户的属于该类行为的所
有行为在所有偏好枚举值上的行为统计量和该类行为的衰减系数的具体实现方式可以参
见上述实施例中的相关描述。另外,如果本公开通过前述其他步骤中已经获得了行为统计
量和衰减系数,则本步骤直接引用即可。
[0135] 其次,本公开可以根据该用户的属于该类行为的所有行为在所有偏好枚举值上的行为统计量和该类行为的衰减系数,确定该用户的该类行为的单次行为平均衰减量。具体
的,本公开可以利用该类行为的衰减系数对属于该类行为的所有行为分别进行衰减处理,
并对衰减后的所有结果求和,本公开可以将该和值与该类行为的行为统计量相除,并将获
得的商作为该用户的该类行为的单次行为平均衰减量。本公开确定一用户的一类行为的单
次行为平均衰减量的一个例子如下:
[0136] 假设一用户的所有行为总共包括m1+m2次行为;其中m1次行为均涉及偏好枚举值a(如新房),且m1次行为涉及房屋详情页的PV类行为和用户产生商机类行为这两类行为,假
设m11次行为属于房屋详情页的PV类行为,且m12次行为属于用户产生商机类行为;其中m2
次行为均涉及偏好枚举值b(如二手房),且m2次行为涉及屋详情页的PV类行为和用户产生
商机类行为这两类行为,假设m21次行为属于房屋详情页的PV类行为,且m22次行为属于用
户产生商机类行为。
[0137] 在上述假设条件下,本公开通过对m1+m2次行为进行2次行为量统计,获得2个行为统计量,其中第一个行为统计量为:用户在偏好枚举值a和偏好枚举值b上的房屋详情页的
PV类行为的行为统计量,其中第二个行为统计量为:用户在偏好枚举值a和偏好枚举值b上
的用户产生商机类行为的行为统计量。
[0138] 假设本公开获得的房屋详情页的PV类行为的衰减系数为r1,则本公开可以利用衰减系数r1对属于房屋详情页的PV类行为的每一个行为分别进行衰减处理,获得m11+m21个
衰减处理结果,本公开可以对这m11+m21个衰减处理结果求和,获得第一和值,本公开可以
将第一和值与m11+m21的商,作为该用户的房屋详情页的PV类行为的单次行为平均衰减量。
[0139] 假设本公开获得的用户产生商机类行为的衰减系数为r2,则本公开可以利用衰减系数r2对属于用户产生商机类行为的每一个行为分别进行衰减处理,获得m12+m22个衰减
处理结果,本公开可以对这m12+m22个衰减处理结果求和,获得第二和值,本公开可以将第
二和值与m11+m21的商,作为该用户的用户产生商机类行为的单次行为平均衰减量。
[0140] 由于一类行为的单次行为平均衰减量可以反映出该类行为与预定时间的时间间距(如距今时间等),因此,单次行为平均衰减量往往与用户的可比属性收敛度相关,例如,
一类行为的单次行为平均衰减量越小,表示该类行为与预定时间的时间间距越大,则用户
偏好的变异可能性越高,即用户的可比属性收敛度越低。本公开通过将用户的各类行为的
单次行为平均衰减量作为用户的各类行为的行为特征,有利于对用户可比属性收敛度进行
客观的衡量,从而有利于提高用户可比属性收敛度的准确性。
[0141] 在一个可选示例中,本公开是根据一区域的半径来确定待处理用户的可比属性收敛度的,且该区域的半径由预定数量的第一可比属性收敛用户决定。也就是说,针对任一待
处理用户而言,本公开可以根据预定数量的第一可比属性收敛用户所形成的区域的半径,
确定该待处理用户的可比属性收敛度。其中的第一可比属性收敛用户可以是指在各偏好枚
举值上的偏好度和各类行为的行为特征与该待处理用户在各偏好枚举值上的偏好度和各
类行为的行为特征的相似度满足预定相似度要求的可比属性收敛用户。
[0142] 可选的,本公开可以先寻找在各偏好枚举值上的偏好度和各类行为的行为特征与一待处理用户在各偏好枚举值上的偏好度和各类行为的行为特征的相似度满足预定相似
度要求的预定数量的可比属性收敛用户(即寻找预定数量的第一可比属性收敛用户),从而
本公开可以以该待处理用户为圆心,获得预定数量的可比属性收敛用户形成的圆的半径;
进而本公开可以利用该半径获得该待处理用户的可比属性收敛度。例如,可以将该半径的
倒数作为该待处理用户的可比属性收敛度。本公开可以采用多种方式寻找预定数量的第一
可比属性收敛用户,一种快速寻找到预定数量的第一可比属性收敛用户的方式如下述针对
图5的描述。
[0143] 在通常情况下,待处理用户的可比属性越收敛,则环绕在待处理用户周围的可比属性收敛用户的数量往往越多,因此,待处理用户的可比属性收敛度往往与环绕在待处理
用户的预定数量的可比属性收敛用户形成的区域大小相关,例如,区域半径越小,则表示待
处理用户的可比属性收敛度越高。本公开通过利用预定数量的第一可比属性收敛用户形成
的区域的半径来确定待处理用户的可比属性收敛度,有利于便捷客观准确衡量用户可比属
性收敛度,从而有利于提高用户可比属性收敛度的准确性。
[0144] 在一个可选示例中,待处理用户和可比属性收敛用户的数量往往较多,如果针对每一个待处理用户均采用计算相似度的方式,来确定每一个待处理用户的可比属性收敛
度,则往往会耗费大量的计算资源。为了降低确定各待处理用户的可比属性收敛度的计算
资源的消耗,本公开可以对待处理用户进行聚类处理,并将一个类簇中的所有待处理用户
作为一个用户,在确定出该用户的可比属性收敛度之后,可以将该可比属性收敛度作为该
类簇中的所有待处理用户的可比属性收敛度。具体的,本公开确定所有待处理用户的可比
属性收敛度的一个例子,如图4所示。
[0145] 图4中,S400、根据多个待处理用户在各偏好枚举值上的偏好度以及各类行为的行为特征,对多个待处理用户进行聚类处理,获得多个类簇。
[0146] 可选的,本公开可以根据所有待处理用户在各偏好枚举值上的偏好度以及各类行为的行为特征,对所有待处理用户进行基于密度的聚类处理(如DBSCAN聚类处理等)。具体
的聚类过程在此不再详细说明。
[0147] S401、根据各类簇的质心用户在各偏好枚举值上的偏好度和各类行为的行为特征与至少部分可比属性收敛用户在各偏好枚举值上的偏好度和各类行为的行为特征的相似
度,确定各质心用户的可比属性收敛度。
[0148] 可选的,本公开中的质心用户也可以称为质心样本或者中心用户等。即质心用户为位于一个类簇的中心位置的用户。本公开可以计算各类簇的质心用户在各偏好枚举值上
的偏好度和各类行为的行为特征与至少部分可比属性收敛用户在各偏好枚举值上的偏好
度和各类行为的行为特征的距离(如欧式距离等),并将计算出的距离作为相似度。本公开
可以根据计算出的距离寻找到预定数量的第一可比属性收敛用户,一个具体的例子如下述
针对图5的描述。
[0149] S402、根据各质心用户的可比属性收敛度,确定各质心用户所在类簇中的各待处理用户的可比属性收敛度。
[0150] 可选的,对于任一类簇而言,本公开可以将质心用户的可比属性收敛度作为该类簇中的每一个待处理用户的可比属性收敛度。另外,本公开也可以根据一个类簇中的各待
处理用户与质心用户之间的距离,对质心用户的可比属性收敛度进行相应的处理,从而获
得该类簇中的各待处理用户的可比属性收敛度。例如,可以将质心用户的可比属性收敛度
作为类簇中与质心用户距离较近的待处理用户的可比属性收敛度,而使类簇中与质心用户
距离较远的待处理用户的可比属性收敛度设置为低于质心用户的可比属性收敛度。
[0151] 在一个可选示例中,对于任一质心用户而言,本公开确定该质心用户的可比属性收敛度的一个例子如图5所示。
[0152] 图5中,S500、依次计算一质心用户在各偏好枚举值上的偏好度和各类行为的行为特征与可比属性收敛用户在各偏好枚举值上的偏好度和各类行为的行为特征的距离。
[0153] 可选的,本公开可以从可比属性收敛用户集合中随机选取可比属性收敛用户,并计算该质心用户在各偏好枚举值上的偏好度和各类行为的行为特征与该可比属性收敛用
户在各偏好枚举值上的偏好度和各类行为的行为特征的距离(如欧式距离等)。
[0154] S501、根据当前获得的所有距离,判断预设最大半径形成的区域中的可比属性收敛用户的数量是否达到预定最大数量,如果达到预定最大数量,则到S502;如果未达到预定
最大数量,则返回S500。
[0155] 可选的,本公开预先设置有预设最大半径MAX,该预设最大半径MAX可以是从预定取值范围内随机选取出的一个数值。在当前计算出的一距离小于最大半径MAX时,对该距离
进行计数,直到当前计数值达到预定最大数量。
[0156] S502、停止上述距离的计算,并根据预设最大半径和初始迭代步长确定当前半径。
[0157] 可选的,本公开预先设置有初始迭代步长,例如,初始迭代步长可以为预设最大半径MAX的一半。本公开可以利用初始迭代步长对预设最大半径进行缩短处理,获得当前半
径。
[0158] S503、确定当前半径形成的区域中的可比属性收敛用户的数量。
[0159] 可选的,本公开可以利用S501中计算出的距离,来确定当前半径形成的区域中的可比属性收敛用户的数量,即本公开可以从S501中计算出的所有距离中选取出小于当前半
径的距离,从而获得位于当前半径形成的区域中的可比属性收敛用户的数量。
[0160] S504、判断当前半径形成的区域中的可比属性收敛用户的数量,如果当前半径形成的区域中的可比属性收敛用户的数量等于预定数量,则到S505;如果当前半径形成的区
域中的可比属性收敛用户的数量大于预定数量,则到S506;如果当前半径形成的区域中的
可比属性收敛用户的数量小于预定数量,则到S507。
[0161] S505、根据当前半径,确定该质心用户的可比属性收敛度。
[0162] 可选的,本公开可以将当前半径的倒数作为该质心用户的可比属性收敛度。
[0163] S506、根据第一迭代步长缩小当前半径,并返回S503。
[0164] 可选的,本公开中的第一迭代步长可以利用上一次迭代步长、当前半径形成的区域中的最大距离和最小距离获得,例如,本公开可以计算最小距离和最大距离的比值,并将
当前迭代步长与该比值的乘积作为下一次迭代步长,即第一迭代步长。本公开可以利用当
前半径与第一迭代步长的差值更新当前半径。
[0165] S507、根据第二迭代步长增大当前半径,并返回S503。
[0166] 可选的,本公开中的第二迭代步长可以与第一迭代步长相同,也可以与第一迭代步长不相同。本公开可以利用上一次迭代步长、当前半径形成的区域中的最大距离和最小
距离获得第二迭代步长,例如,本公开可以计算最小距离和最大距离的比值,并将当前迭代
步长与该比值的乘积作为下一次迭代步长,即第二迭代步长。本公开可以利用当前半径与
第二迭代步长的和值更新当前半径。
[0167] 本公开通过不断的更新当前半径,不仅可以便捷的寻找到预定数量的可比属性收敛用户,而且,有利于在最大程度上降低计算量。
[0168] 示例性装置
[0169] 图6为本公开的确定用户可比属性收敛度的装置一个实施例的结构示意图。该实施例的装置可用于实现本公开上述各方法实施例。
[0170] 如图6所示,本实施例的装置可以包括:获取偏好度模块600、获取行为特征模块601、确定相似度602以及确定收敛度模块603。
[0171] 获取偏好度模块600用于根据用户操作数据,获取多个待处理用户和多个可比属性收敛用户分别在各偏好枚举值上的偏好度。例如,获取偏好度模块600可以根据基于同一
地理位置区域的标的的用户操作数据,获取各待处理用户和各可比属性收敛用户分别在各
偏好枚举值上的偏好度。
[0172] 在一个可选示例中,获取偏好度模块600可以包括:第一子模块6001、第二子模块6002、第三子模块6003以及第四子模块6004。其中的第一子模块6001用于根据用户操作数
据,获取各待处理用户和各可比属性收敛用户分别在各偏好枚举值上的各类行为的行为统
计量。其中的第二子模块6002用于根据用户操作数据,获取各待处理用户的各类行为的衰
减系数和各可比属性收敛用户的各类行为的衰减系数。例如,针对各待处理用户和可比属
性收敛用户中的任一用户,第二子模块6002可以根据用户操作数据,获取该用户的各类行
为的行为统计量和该用户的各类行为的末次行为时间到预定时间的时间间隔,并根据该用
户的各类行为的行为统计量以及该用户的各类行为的末次行为时间到预定时间的时间间
隔,获取该用户的第一沉默概率;针对任一类行为,第二子模块6002调整该类行为的末次行
为时间到预定时间的时间间隔,并根据所述各类行为的行为统计量和所述调整后形成的各
类行为的末次行为时间到预定时间的时间间隔,获取该用户的第二沉默概率;若所述第二
沉默概率为所述第一沉默概率的一半,则第二子模块6002根据末次行为时间到预定时间的
时间间隔和调整后的末次行为时间到预定时间的时间间隔,确定该用户的该类行为的半衰
期;第二子模块6002根据该半衰期,确定该用户的该类行为的衰减系数。其中的第三子模块
6003用于根据用户操作数据,获取各类行为的权重系数。例如,针对任一类行为,第三子模
块6003可以根据用户操作数据,获取在第一预定时间范围内发生该类行为的第一用户数量
以及在第一预定时间范围后的第二预定时间范围内发生目标行为的第二用户数量;第三子
模块6003将第二用户数量和第一用户数量的比值,作为该类行为的权重系数。其中的第四
子模块6004用于根据各待处理用户和各可比属性收敛用户分别在各偏好枚举值上的各类
行为的行为统计量、各类行为的衰减系数以及各类行为的权重系数,分别确定各待处理用
户和各可比属性收敛用户分别在各偏好枚举值上的偏好度。
[0173] 获取行为特征模块601用于根据用户操作数据,获取多个待处理用户和多个可比属性收敛用户的各类行为的行为特征。例如,获取行为特征模块601可以根据基于同一地理
位置区域的标的的用户操作数据,获取各待处理用户和各可比属性收敛用户的各行为的行
为特征。
[0174] 在一个可选示例中,获取行为特征模块601可以包括:第五子模块6011。针对多个待处理用户和多个可比属性收敛用户中的任一用户的任一类行为,第五子模块6011用于根
据用户操作数据,获取该用户的属于该类行为的所有行为在所有偏好枚举值上的行为统计
量;其中的行为统计量被作为该用户的该类行为的行为特征。
[0175] 在一个可选示例中,获取行为特征模块601可以包括:第六子模块6012。针对多个待处理用户和多个可比属性收敛用户中的任一用户的任一类行为,第六子模块6012可以根
据用户操作数据,获取该用户的属于该类行为的所有行为在所有偏好枚举值上的行为统计
量和该类行为的衰减系数,第六子模块6012可以根据该用户的属于该类行为的所有行为在
所有偏好枚举值上的行为统计量和该类行为的衰减系数,确定该用户的该类行为的单次行
为平均衰减量;其中的单次行为平均衰减量被作为该用户的该类行为的行为特征。
[0176] 确定相似收敛度模块602用于确定多个待处理用户在各偏好枚举值上的偏好度和各类行为的行为特征与至少部分可比属性收敛用户在各偏好枚举值上的偏好度和各类行
为的行为特征的相似度。
[0177] 在一个可选示例中,确定相似度收敛度模块602可以包括:第七子模块6021和第八子模块6022。其中的第七子模块6021用于根据多个待处理用户在各偏好枚举值上的偏好度
以及各类行为的行为特征,对多个待处理用户进行聚类处理,获得多个类簇。其中的第八子
模块6022用于确定各类簇的质心用户在各偏好枚举值上的偏好度和各类行为的行为特征
与至少部分可比属性收敛用户在各偏好枚举值上的偏好度和各类行为的行为特征的相似
度。例如,针对任一质心用户,第八子模块6022可以依次计算该质心用户在各偏好枚举值上
的偏好度和各类行为的行为特征与可比属性收敛用户在各偏好枚举值上的偏好度和各类
行为的行为特征的距离,第八子模块6022根据当前获得的所有距离,在确定出预设最大半
径形成的区域中的可比属性收敛用户的数量达到预定最大数量时,则停止距离的计算,并
根据预设最大半径和初始迭代步长确定当前半径。
[0178] 确定收敛度模块603用于根据确定相似收敛度模块602确定出的相似度,确定多个待处理用户的可比属性收敛度。例如,针对任一待处理用户,确定收敛度模块603根据预定
数量的第一可比属性收敛用户所形成的区域的半径,确定该待处理用户的可比属性收敛
度;其中的第一可比属性收敛用户包括:在各偏好枚举值上的偏好度和各类行为的行为特
征与该待处理用户在各偏好枚举值上的偏好度和各类行为的行为特征的相似度满足预定
相似度要求的可比属性收敛用户。
[0179] 在一个可选示例中,确定收敛度模块603包括:第九子模块6031。第九子模块6031用于确定各质心用户的可比属性收敛度,根据各质心用户的可比属性收敛度,确定各质心
用户所在类簇中的各待处理用户的可比属性收敛度。例如,第九子模块6031确定当前半径
形成的区域中的可比属性收敛用户的数量,若当前半径形成的区域中的可比属性收敛用户
的数量等于预定数量,则第九子模块6031根据当前半径,确定该质心用户的可比属性收敛
度。若当前半径形成的区域中的可比属性收敛用户的数量大于预定数量,则第九子模块
6031可以根据第一迭代步长缩小当前半径,并再次确定当前半径形成的区域中的可比属性
收敛用户的数量;若当前半径形成的区域中的可比属性收敛用户的数量小于预定数量,则
第九子模块6031根据第二迭代步长增大所述当前半径,并再次确定当前半径形成的区域中
的可比属性收敛用户的数量。
[0180] 上述各模块及其包括的子模块和单元具体执行的操作可以参见上述方法实施例中针对图1‑图5的描述,在此不再详细说明。
[0181] 示例性电子设备
[0182] 下面参考图7来描述根据本公开实施例的电子设备。图7示出了根据本公开实施例的电子设备的框图。如图7所示,电子设备71包括一个或多个处理器711和存储器712。
[0183] 处理器711可以是中央处理单元(CPU)或者具有确定用户可比属性收敛度的能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备71中的其他组件以执
行期望的功能。
[0184] 存储器712可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存
储器,例如,可以包括:随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失
性存储器,例如,可以包括:只读存储器(ROM)、硬盘以及闪存等。在所述计算机可读存储介
质上可以存储一个或多个计算机程序指令,处理器711可以运行所述程序指令,以实现上文
所述的本公开的各个实施例的确定用户可比属性收敛度的方法以及/或者其他期望的功
能。在所述计算机可读存储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内
容。
[0185] 在一个示例中,电子设备71还可以包括:输入装置713以及输出装置714等,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。此外,该输入设备713还可以包
括例如键盘、鼠标等等。该输出装置714可以向外部输出各种信息。该输出设备714可以包括
例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
[0186] 当然,为了简化,图7中仅示出了该电子设备71中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备71还
可以包括任何其他适当的组件。
[0187] 示例性计算机程序产品和计算机可读存储介质
[0188] 除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述
“示例性方法”部分中描述的根据本公开各种实施例的确定用户可比属性收敛度的方法中
的步骤。
[0189] 所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如
Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程
序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软
件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备
或服务器上执行。
[0190] 此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方
法”部分中描述的根据本公开各种实施例的确定用户可比属性收敛度的方法中的步骤。
[0191] 所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电
磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的
例子(非穷举的列举)可以包括:具有一个或者多个导线的电连接、便携式盘、硬盘、随机存
取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式
紧凑盘只读存储器(CD‑ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
[0192] 以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势以及效果等是本公
开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解
的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。
[0193] 本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例
而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部
分说明即可。
[0194] 本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到
的,可以按任意方式连接、布置、配置这些器件、装置、设备以及系统。诸如“包括”、“包含、
“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词
汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所
使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
[0195] 可能以许多方式来实现本公开的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于所述方法的步骤的上述顺序
仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特
别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序
包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据
本公开的方法的程序的记录介质。
[0196] 还需要指出的是,在本公开的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。
[0197] 提供所公开的方面的以上描述,以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改等对于本领域技术人员而言,是非常显而易见的,并且在此定
义的一般原理可以应用于其他方面,而不脱离本公开的范围。因此,本公开不意图被限制到
在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
[0198] 为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此公开的形式中。尽管以上已经讨论了多个示例方面以及实施例,但是本领
域技术人员将认识到其某些变型、修改、改变、添加和子组合。