确定用户可比属性收敛度的方法、装置、介质和电子设备转让专利
申请号 : CN202010613942.2
文献号 : CN111753208B
文献日 : 2021-08-31
发明人 : 李嘉晨 , 郭凯
申请人 : 贝壳找房(北京)科技有限公司
摘要 :
权利要求 :
1.一种确定用户可比属性收敛度的方法,包括:根据用户操作数据,获取多个待处理用户和多个可比属性收敛用户分别在各偏好枚举值上的偏好度;其中,所述可比属性为不同用户间进行比较的属性,所述可比属性收敛用户为已经针对其标的成功执行了目标行为的用户;
根据所述用户操作数据,获取所述多个待处理用户和多个可比属性收敛用户的各类行为的行为特征;
确定所述多个待处理用户在各偏好枚举值上的偏好度和各类行为的行为特征与至少部分可比属性收敛用户在各偏好枚举值上的偏好度和各类行为的行为特征的相似度;
根据所述相似度,确定所述多个待处理用户的可比属性收敛度;其中,所述可比属性收敛度用于表示用户的可比属性的稳定程度;
其中,根据所述相似度,确定所述多个待处理用户的可比属性收敛度,包括:针对任一待处理用户,获取以该待处理用户为圆心,由预定数量的第一可比属性收敛用户所形成的区域的半径;其中,所述第一可比属性收敛用户包括:在各偏好枚举值上的偏好度和各类行为的行为特征与该待处理用户在各偏好枚举值上的偏好度和各类行为的行为特征的相似度满足预定相似度要求的可比属性收敛用户;
将所述半径的倒数作为该待处理用户的可比属性收敛度。
2. 根据权利要求1所述的方法,其中,所述根据用户操作数据,获取多个待处理用户和多个可比属性收敛用户分别在各偏好枚举值上的偏好度,包括:根据基于同一地理位置区域的标的的用户操作数据,获取各待处理用户和各可比属性收敛用户分别在各偏好枚举值上的偏好度;和/或所述根据所述用户操作数据,获取所述多个待处理用户和多个可比属性收敛用户的各类行为的行为特征,包括:
根据基于同一地理位置区域的标的的用户操作数据,获取各待处理用户和各可比属性收敛用户的各类行为的行为特征。
3.根据权利要求1所述的方法,其中,所述根据用户操作数据,获取多个待处理用户和多个可比属性收敛用户分别在各偏好枚举值上的偏好度,包括:根据用户操作数据,获取各待处理用户和各可比属性收敛用户分别在各偏好枚举值上的各类行为的行为统计量;
根据所述用户操作数据,获取各待处理用户的各类行为的衰减系数和各可比属性收敛用户的各类行为的衰减系数;
根据所述用户操作数据,获取各类行为的权重系数;
根据各待处理用户和各可比属性收敛用户分别在各偏好枚举值上的各类行为的行为统计量、所述各类行为的衰减系数以及各类行为的权重系数,分别确定各待处理用户和各可比属性收敛用户分别在各偏好枚举值上的偏好度。
4.根据权利要求3所述的方法,其中,所述根据所述用户操作数据,获取各待处理用户的各类行为的衰减系数和各可比属性收敛用户的各类行为的衰减系数,包括:针对各待处理用户和可比属性收敛用户中的任一用户,根据所述用户操作数据,获取该用户的各类行为的行为统计量和该用户的各类行为的末次行为时间到预定时间的时间间隔;
根据该用户的各类行为的行为统计量和该用户的各类行为的末次行为时间到预定时间的时间间隔,获取该用户的第一沉默概率;
针对任一类行为,调整该类行为的末次行为时间到预定时间的时间间隔,并根据所述各类行为的行为统计量和调整后形成的各类行为的末次行为时间到预定时间的时间间隔,获取该用户的第二沉默概率;
若所述第二沉默概率为所述第一沉默概率的一半,则根据获取的所述用户的各类行为的末次行为时间到预定时间的时间间隔和所述调整后形成的各类行为的末次行为时间到预定时间的时间间隔,确定该用户的该类行为的半衰期;
根据所述半衰期,确定该用户的该类行为的衰减系数。
5.根据权利要求3所述的方法,其中,所述根据所述用户操作数据,获取各类行为的权重系数,包括:
针对任一类行为,根据所述用户操作数据,获取在第一预定时间范围内发生该类行为的第一用户数量以及在所述第一预定时间范围后的第二预定时间范围内发生目标行为的第二用户数量;
将所述第二用户数量和第一用户数量的比值,作为该类行为的权重系数。
6.根据权利要求1至5中任一项所述的方法,其中,所述根据所述用户操作数据,获取所述多个待处理用户和多个可比属性收敛用户的各类行为的行为特征,包括:针对多个待处理用户和多个可比属性收敛用户中的任一用户的任一类行为,根据所述用户操作数据,获取该用户的属于该类行为的所有行为在所有偏好枚举值上的行为统计量;
其中,所述行为统计量被作为该用户的该类行为的行为特征。
7.根据权利要求1至5中任一项所述的方法,其中,所述根据所述用户操作数据,获取所述多个待处理用户和多个可比属性收敛用户的各类行为的行为特征,包括:针对多个待处理用户和多个可比属性收敛用户中的任一用户的任一类行为,根据所述用户操作数据,获取该用户的属于该类行为的所有行为在所有偏好枚举值上的行为统计量和该类行为的衰减系数;
根据该用户的属于该类行为的所有行为在所有偏好枚举值上的行为统计量和该类行为的衰减系数,确定该用户的该类行为的单次行为平均衰减量;
其中,所述单次行为平均衰减量被作为该用户的该类行为的行为特征。
8.根据权利要求1至5中任一项所述的方法,其中,所述确定所述多个待处理用户在各偏好枚举值上的偏好度和各类行为的行为特征与至少部分可比属性收敛用户在各偏好枚举值上的偏好度和各类行为的行为特征的相似度,根据所述相似度,确定所述多个待处理用户的可比属性收敛度,包括:
根据所述多个待处理用户在各偏好枚举值上的偏好度以及各类行为的行为特征,对所述多个待处理用户进行聚类处理,获得多个类簇;
确定各类簇的质心用户在各偏好枚举值上的偏好度和各类行为的行为特征与至少部分可比属性收敛用户在各偏好枚举值上的偏好度和各类行为的行为特征的相似度;
根据所述相似度,确定各质心用户的可比属性收敛度;
根据所述各质心用户的可比属性收敛度,确定各质心用户所在类簇中的各待处理用户的可比属性收敛度。
9.根据权利要求8所述的方法,其中,所述确定各类簇的质心用户在各偏好枚举值上的偏好度和各类行为的行为特征与至少部分可比属性收敛用户在各偏好枚举值上的偏好度和各类行为的行为特征的相似度,根据所述相似度,确定各质心用户的可比属性收敛度,包括:
针对任一质心用户,依次计算该质心用户在各偏好枚举值上的偏好度和各类行为的行为特征与可比属性收敛用户在各偏好枚举值上的偏好度和各类行为的行为特征的距离;
根据当前获得的所有距离,在确定出预设最大半径形成的区域中的可比属性收敛用户的数量达到预定最大数量时,则停止所述距离的计算,并根据所述预设最大半径和初始迭代步长确定当前半径;
确定当前半径形成的区域中的可比属性收敛用户的数量;
若所述当前半径形成的区域中的可比属性收敛用户的数量等于预定数量,则根据所述当前半径,确定该质心用户的可比属性收敛度。
10.根据权利要求9所述的方法,其中,所述确定各类簇的质心用户在各偏好枚举值上的偏好度和各类行为的行为特征与至少部分可比属性收敛用户在各偏好枚举值上的偏好度和各类行为的行为特征的相似度,根据所述相似度,确定各质心用户的可比属性收敛度,还包括:
若所述当前半径形成的区域中的可比属性收敛用户的数量大于预定数量,则根据第一迭代步长缩小所述当前半径,并再次确定当前半径形成的区域中的可比属性收敛用户的数量;
若所述当前半径形成的区域中的可比属性收敛用户的数量小于预定数量,则根据第二迭代步长增大所述当前半径,并再次确定当前半径形成的区域中的可比属性收敛用户的数量。
11.一种确定用户可比属性收敛度的装置,其中,所述装置包括:获取偏好度模块,用于根据用户操作数据,获取多个待处理用户和多个可比属性收敛用户分别在各偏好枚举值上的偏好度;其中,所述可比属性为不同用户间进行比较的属性,所述可比属性收敛用户为已经针对其标的成功执行了目标行为的用户;
获取行为特征模块,用于根据所述用户操作数据,获取所述多个待处理用户和多个可比属性收敛用户的各类行为的行为特征;
确定相似收敛度模块,用于确定所述多个待处理用户在各偏好枚举值上的偏好度和各类行为的行为特征与至少部分可比属性收敛用户在各偏好枚举值上的偏好度和各类行为的行为特征的相似度;
确定收敛度模块,用于根据所述相似度,确定所述多个待处理用户的可比属性收敛度,具体用于:针对任一待处理用户,获取以该待处理用户为圆心,由预定数量的第一可比属性收敛用户所形成的区域的半径,将所述半径的倒数作为该待处理用户的可比属性收敛度;
其中,所述可比属性收敛度用于表示用户的可比属性的稳定程度;所述第一可比属性收敛用户包括:在各偏好枚举值上的偏好度和各类行为的行为特征与该待处理用户在各偏好枚举值上的偏好度和各类行为的行为特征的相似度满足预定相似度要求的可比属性收敛用户。
12. 根据权利要求11所述的装置,其中,所述获取偏好度模块进一步用于:根据基于同一地理位置区域的标的的用户操作数据,获取各待处理用户和各可比属性收敛用户分别在各偏好枚举值上的偏好度;和/或所述获取行为特征模块进一步用于:根据基于同一地理位置区域的标的的用户操作数据,获取各待处理用户和各可比属性收敛用户的各类行为的行为特征。
13.根据权利要求11所述的装置,其中,所述获取偏好度模块包括:第一子模块,用于根据用户操作数据,获取各待处理用户和各可比属性收敛用户分别在各偏好枚举值上的各类行为的行为统计量;
第二子模块,用于根据所述用户操作数据,获取各待处理用户的各类行为的衰减系数和各可比属性收敛用户的各类行为的衰减系数;
第三子模块,用于根据所述用户操作数据,获取各类行为的权重系数;
第四子模块,用于根据各待处理用户和各可比属性收敛用户分别在各偏好枚举值上的各类行为的行为统计量、所述各类行为的衰减系数以及各类行为的权重系数,分别确定各待处理用户和各可比属性收敛用户分别在各偏好枚举值上的偏好度。
14.根据权利要求13所述的装置,其中,所述第二子模块进一步用于:针对各待处理用户和可比属性收敛用户中的任一用户,根据所述用户操作数据,获取该用户的各类行为的行为统计量和该用户的各类行为的末次行为时间到预定时间的时间间隔;
根据该用户的各类行为的行为统计量和该用户的各类行为的末次行为时间到预定时间的时间间隔,获取该用户的第一沉默概率;
针对任一类行为,调整该类行为的末次行为时间到预定时间的时间间隔,并根据所述各类行为的行为统计量和调整后形成的各类行为的末次行为时间到预定时间的时间间隔,获取该用户的第二沉默概率;
若所述第二沉默概率为所述第一沉默概率的一半,则根据获取的所述用户的各类行为的末次行为时间到预定时间的时间间隔和所述调整后形成的各类行为的末次行为时间到预定时间的时间间隔,确定该用户的该类行为的半衰期;
根据所述半衰期,确定该用户的该类行为的衰减系数。
15.根据权利要求13所述的装置,其中,所述第三子模块进一步用于:针对任一类行为,根据所述用户操作数据,获取在第一预定时间范围内发生该类行为的第一用户数量以及在所述第一预定时间范围后的第二预定时间范围内发生目标行为的第二用户数量;
将所述第二用户数量和第一用户数量的比值,作为该类行为的权重系数。
16.根据权利要求11至15中任一项所述的装置,其中,所述获取行为特征模块包括:第五子模块,用于针对多个待处理用户和多个可比属性收敛用户中的任一用户的任一类行为,根据所述用户操作数据,获取该用户的属于该类行为的所有行为在所有偏好枚举值上的行为统计量;
其中,所述行为统计量被作为该用户的该类行为的行为特征。
17.根据权利要求11至15中任一项所述的装置,其中,所述获取行为特征模块包括:第六子模块,用于:
针对多个待处理用户和多个可比属性收敛用户中的任一用户的任一类行为,根据所述用户操作数据,获取该用户的属于该类行为的所有行为在所有偏好枚举值上的行为统计量和该类行为的衰减系数;
根据该用户的属于该类行为的所有行为在所有偏好枚举值上的行为统计量和该类行为的衰减系数,确定该用户的该类行为的单次行为平均衰减量;
其中,所述单次行为平均衰减量被作为该用户的该类行为的行为特征。
18.根据权利要求11至15中任一项所述的装置,其中,所述确定相似收敛度模块包括:第七子模块,用于根据所述多个待处理用户在各偏好枚举值上的偏好度以及各类行为的行为特征,对所述多个待处理用户进行聚类处理,获得多个类簇;
第八子模块,用于确定各类簇的质心用户在各偏好枚举值上的偏好度和各类行为的行为特征与至少部分可比属性收敛用户在各偏好枚举值上的偏好度和各类行为的行为特征的相似度;
所述确定收敛度模块包括:
第九子模块,用于确定各质心用户的可比属性收敛度,根据所述各质心用户的可比属性收敛度,确定各质心用户所在类簇中的各待处理用户的可比属性收敛度。
19.根据权利要求18所述的装置,其中,所述第八子模块进一步用于:针对任一质心用户,依次计算该质心用户在各偏好枚举值上的偏好度和各类行为的行为特征与可比属性收敛用户在各偏好枚举值上的偏好度和各类行为的行为特征的距离;
根据当前获得的所有距离,在确定出预设最大半径形成的区域中的可比属性收敛用户的数量达到预定最大数量时,则停止所述距离的计算,并根据所述预设最大半径和初始迭代步长确定当前半径;
所述第九子模块进一步用于:
确定当前半径形成的区域中的可比属性收敛用户的数量;
若所述当前半径形成的区域中的可比属性收敛用户的数量等于预定数量,则根据所述当前半径,确定该质心用户的可比属性收敛度。
20.根据权利要求19所述的装置,其中,所述第九子模块进一步还用于:若所述当前半径形成的区域中的可比属性收敛用户的数量大于预定数量,则根据第一迭代步长缩小所述当前半径,并再次确定当前半径形成的区域中的可比属性收敛用户的数量;
若所述当前半径形成的区域中的可比属性收敛用户的数量小于预定数量,则根据第二迭代步长增大所述当前半径,并再次确定当前半径形成的区域中的可比属性收敛用户的数量。
21.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1‑10中任一项所述的方法。
22.一种电子设备,所述电子设备包括:处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1‑10中任一项所述的方法。
说明书 :
确定用户可比属性收敛度的方法、装置、介质和电子设备
技术领域
背景技术
好,并不能准确的反映出用户需求,因此,如果仅仅根据用户的偏好向用户提供相应的推荐
信息,有时并不能满足用户需求。
发明内容
好枚举值上的偏好度;根据所述用户操作数据,获取所述多个待处理用户和多个可比属性
收敛用户的各类行为的行为特征;确定所述多个待处理用户在各偏好枚举值上的偏好度和
各类行为的行为特征与至少部分可比属性收敛用户在各偏好枚举值上的偏好度和各类行
为的行为特征的相似度;根据所述相似度,确定所述多个待处理用户的可比属性收敛度。
的的用户操作数据,获取各待处理用户和各可比属性收敛用户分别在各偏好枚举值上的偏
好度;和/或,所述根据所述用户操作数据,获取所述多个待处理用户和多个可比属性收敛
用户的各行为的行为特征,包括:根据基于同一地理位置区域的标的的用户操作数据,获取
各待处理用户和各可比属性收敛用户的各行为的行为特征。
理用户和各可比属性收敛用户分别在各偏好枚举值上的各类行为的行为统计量;根据所述
用户操作数据,获取各待处理用户的各类行为的衰减系数和各可比属性收敛用户的各类行
为的衰减系数;根据所述用户操作数据,获取各类行为的权重系数;根据各待处理用户和各
可比属性收敛用户分别在各偏好枚举值上的各类行为的行为统计量、所述各类行为的衰减
系数以及各类行为的权重系数,分别确定各待处理用户和各可比属性收敛用户分别在各偏
好枚举值上的偏好度。
户和可比属性收敛用户中的任一用户,根据所述用户操作数据,获取该用户的各类行为的
行为统计量和该用户的各类行为的末次行为时间到预定时间的时间间隔;根据该用户的各
类行为的行为统计量和该用户的各类行为的末次行为时间到预定时间的时间间隔,获取该
用户的第一沉默概率;针对任一类行为,调整该类行为的末次行为时间到预定时间的时间
间隔,并根据所述各类行为的行为统计量和所述调整后形成的各类行为的末次行为时间到
预定时间的时间间隔,获取该用户的第二沉默概率;若所述第二沉默概率为所述第一沉默
概率的一半,则根据所述末次行为时间到预定时间的时间间隔和所述调整后的末次行为时
间到预定时间的时间间隔,确定该用户的该类行为的半衰期;根据所述半衰期,确定该用户
的该类行为的衰减系数。
行为的第一用户数量以及在所述第一预定时间范围后的第二预定时间范围内发生目标行
为的第二用户数量;将所述第二用户数量和第一用户数量的比值,作为该类行为的权重系
数。
比属性收敛用户中的任一用户的任一类行为,根据所述用户操作数据,获取该用户的属于
该类行为的所有行为在所有偏好枚举值上的行为统计量;其中,所述行为统计量被作为该
用户的该类行为的行为特征。
比属性收敛用户中的任一用户的任一类行为,根据所述用户操作数据,获取该用户的属于
该类行为的所有行为在所有偏好枚举值上的行为统计量和该类行为的衰减系数;根据该用
户的属于该类行为的所有行为在所有偏好枚举值上的行为统计量和该类行为的衰减系数,
确定该用户的该类行为的单次行为平均衰减量;其中,所述单次行为平均衰减量被作为该
用户的该类行为的行为特征。
的区域的半径,确定该待处理用户的可比属性收敛度;其中,所述第一可比属性收敛用户包
括:在各偏好枚举值上的偏好度和各类行为的行为特征与该待处理用户在各偏好枚举值上
的偏好度和各类行为的行为特征的相似度满足预定相似度要求的可比属性收敛用户。
各类行为的行为特征的相似度,根据所述相似度,确定所述多个待处理用户的可比属性收
敛度,包括:根据所述多个待处理用户在各偏好枚举值上的偏好度以及各类行为的行为特
征,对所述多个待处理用户进行聚类处理,获得多个类簇;确定各类簇的质心用户在各偏好
枚举值上的偏好度和各类行为的行为特征与至少部分可比属性收敛用户在各偏好枚举值
上的偏好度和各类行为的行为特征的相似度;根据所述相似度,确定各质心用户的可比属
性收敛度;根据所述各质心用户的可比属性收敛度,确定各质心用户所在类簇中的各待处
理用户的可比属性收敛度。
类行为的行为特征的相似度,根据所述相似度,确定各质心用户的可比属性收敛度,包括:
针对任一质心用户,依次计算该质心用户在各偏好枚举值上的偏好度和各类行为的行为特
征与可比属性收敛用户在各偏好枚举值上的偏好度和各类行为的行为特征的距离;根据当
前获得的所有距离,在确定出预设最大半径形成的区域中的可比属性收敛用户的数量达到
预定最大数量时,则停止所述距离的计算,并根据所述预设最大半径和初始迭代步长确定
当前半径;确定当前半径形成的区域中的可比属性收敛用户的数量;若所述当前半径形成
的区域中的可比属性收敛用户的数量等于预定数量,则根据所述当前半径,确定该质心用
户的可比属性收敛度。
类行为的行为特征的相似度,根据所述相似度,确定各质心用户的可比属性收敛度,还包
括:若所述当前半径形成的区域中的可比属性收敛用户的数量大于预定数量,则根据第一
迭代步长缩小所述当前半径,并再次确定当前半径形成的区域中的可比属性收敛用户的数
量;若所述当前半径形成的区域中的可比属性收敛用户的数量小于预定数量,则根据第二
迭代步长增大所述当前半径,并再次确定当前半径形成的区域中的可比属性收敛用户的数
量。
收敛用户分别在各偏好枚举值上的偏好度;获取行为特征模块,用于根据所述用户操作数
据,获取所述多个待处理用户和多个可比属性收敛用户的各类行为的行为特征;确定相似
收敛度模块,用于确定所述多个待处理用户在各偏好枚举值上的偏好度和各类行为的行为
特征与至少部分可比属性收敛用户在各偏好枚举值上的偏好度和各类行为的行为特征的
相似度;确定收敛度模块,用于根据所述相似度,确定所述多个待处理用户的可比属性收敛
度。
举值上的偏好度;和/或,所述获取行为特征模块进一步用于:根据基于同一地理位置区域
的标的的用户操作数据,获取各待处理用户和各可比属性收敛用户的各行为的行为特征。
行为统计量;第二子模块,用于根据所述用户操作数据,获取各待处理用户的各类行为的衰
减系数和各可比属性收敛用户的各类行为的衰减系数;第三子模块,用于根据所述用户操
作数据,获取各类行为的权重系数;第四子模块,用于根据各待处理用户和各可比属性收敛
用户分别在各偏好枚举值上的各类行为的行为统计量、所述各类行为的衰减系数以及各类
行为的权重系数,分别确定各待处理用户和各可比属性收敛用户分别在各偏好枚举值上的
偏好度。
计量和该用户的各类行为的末次行为时间到预定时间的时间间隔;根据该用户的各类行为
的行为统计量和该用户的各类行为的末次行为时间到预定时间的时间间隔,获取该用户的
第一沉默概率;针对任一类行为,调整该类行为的末次行为时间到预定时间的时间间隔,并
根据所述各类行为的行为统计量和所述调整后形成的各类行为的末次行为时间到预定时
间的时间间隔,获取该用户的第二沉默概率;若所述第二沉默概率为所述第一沉默概率的
一半,则根据所述末次行为时间到预定时间的时间间隔和所述调整后的末次行为时间到预
定时间的时间间隔,确定该用户的该类行为的半衰期;根据所述半衰期,确定该用户的该类
行为的衰减系数。
一预定时间范围后的第二预定时间范围内发生目标行为的第二用户数量;将所述第二用户
数量和第一用户数量的比值,作为该类行为的权重系数。
据,获取该用户的属于该类行为的所有行为在所有偏好枚举值上的行为统计量;其中,所述
行为统计量被作为该用户的该类行为的行为特征。
数据,获取该用户的属于该类行为的所有行为在所有偏好枚举值上的行为统计量和该类行
为的衰减系数;根据该用户的属于该类行为的所有行为在所有偏好枚举值上的行为统计量
和该类行为的衰减系数,确定该用户的该类行为的单次行为平均衰减量;其中,所述单次行
为平均衰减量被作为该用户的该类行为的行为特征。
比属性收敛度;其中,所述第一可比属性收敛用户包括:在各偏好枚举值上的偏好度和各类
行为的行为特征与该待处理用户在各偏好枚举值上的偏好度和各类行为的行为特征的相
似度满足预定相似度要求的可比属性收敛用户。
待处理用户进行聚类处理,获得多个类簇;第八子模块,用于确定各类簇的质心用户在各偏
好枚举值上的偏好度和各类行为的行为特征与至少部分可比属性收敛用户在各偏好枚举
值上的偏好度和各类行为的行为特征的相似度;所述确定收敛度模块包括:第九子模块,用
于确定各质心用户的可比属性收敛度,根据所述各质心用户的可比属性收敛度,确定各质
心用户所在类簇中的各待处理用户的可比属性收敛度。
在各偏好枚举值上的偏好度和各类行为的行为特征的距离;根据当前获得的所有距离,在
确定出预设最大半径形成的区域中的可比属性收敛用户的数量达到预定最大数量时,则停
止所述距离的计算,并根据所述预设最大半径和初始迭代步长确定当前半径;所述第九子
模块进一步用于:
的可比属性收敛度。
径,并再次确定当前半径形成的区域中的可比属性收敛用户的数量;若所述当前半径形成
的区域中的可比属性收敛用户的数量小于预定数量,则根据第二迭代步长增大所述当前半
径,并再次确定当前半径形成的区域中的可比属性收敛用户的数量。
行指令,并执行所述指令,以实现上述方法。
推送策略更加灵活;由于可比属性收敛用户的大量行为常常集中在特定的一个或者多个偏
好枚举值上,且可比属性收敛用户在各类行为上也常常具有一定的行为特征,因此,本公开
通过利用待处理用户在各偏好枚举值上的偏好度和各类行为的行为特征与可比属性收敛
用户在各偏好枚举值上的偏好度和各类行为的行为特征的相似度,来确定待处理用户的可
比属性收敛度,有利于较为客观准确的确定出用户的可比属性收敛度。由此可知,本公开提
供的技术方案有利于更好的满足用户需求,最终有利于提高目标行为的发生概率。
附图说明
具体实施方式
示例实施例的限制。
序。
本公开中字符“/”,一般表示前后关联对象是一种“或”的关系。
务器等电子设备一起使用的众所周知的终端设备、计算系统、环境和/或配置的例子包括但
不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于
微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统、大型计算
机系统和包括上述任何系统的分布式云计算技术环境等等。
标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计
算机系统/服务器可以在分布式云计算环境中实施。在分布式云计算环境中,任务可以是由
通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包
括存储设备的本地或远程计算系统存储介质上。
户需求。然而,在用户的可比属性并不收敛的应用场景中,如果仍然根据当前确定出的用户
偏好向用户推送相应的信息,则信息推送存在的偏差往往较大,即推送的信息很难满足用
户需求。如果能够较为客观准确的确定出用户的可比属性的收敛度,则有利于丰富网络侧
的信息推送策略,使信息推送策略更加灵活,从而有利于更好的满足用户需求。
对于可比属性收敛度满足预定收敛度要求的用户(如可比属性收敛度达到第一预定收敛度
阈值的用户),网络侧可以向这部分用户的终端设备推送较多数量的与用户的偏好相符合
的楼盘信息;而对于可比属性收敛度不满足预定收敛度要求的用户(如可比属性收敛度低
于第二预定收敛度阈值的用户),网络侧可以向这部分用户的终端设备推送较多数量的当
前热度较高的楼盘信息等。
户的当前可比属性收敛度已经满足预定收敛度要求的情况下,网络侧可以由向这样的用户
的终端设备推送较多数量的当前热度较高的楼盘信息,转变为:向这样的用户的终端设备
推送较多数量的与该用户的偏好相符合的楼盘信息。
预定收敛度要求的用户的可比属性收敛度已经不再满足预定收敛度要求的情况下,网络侧
可以由向这样的用户的终端设备推送较多数量的与该用户的偏好相符合的楼盘信息,转变
为:向这样的用户的终端设备推送较多数量的当前热度较高的楼盘信息等。
本公开中的用户操作数据可以包括:在服务器一侧形成的操作日志或者访问日志等信息。
本公开对此不作限定。
比属性的稳定程度。本公开中的可比属性收敛用户可以是指已经针对其标的,成功执行了
目标行为的用户。本公开中的标的可以是指用户行为所针对的对象。本公开中的标的也可
以称为行为标的或者行为对象等。标的在不同应用场景可以表现为不同的内容。例如,在房
产领域,本公开的标的可以为房屋。再例如,在商品零售领域,本公开的标的可以为零售商
品等。本公开中的目标行为可以根据实际应用场景的具体需求设置。例如,目标行为可以为
标的成交行为或者成功委托行为等,本公开对此不作限定。
可以具体为访问过房产公司提供的网站,且当前已经成功买房或者成功租房的用户。
为对象)为房屋,且行为对象属性信息可以包括:房屋性质、房屋位置、房屋面积、厅室结构、
房屋类型以及房屋结构等属性元素,其中的房屋性质可以包括:新房和二手房等枚举值,其
中的房屋位置可以包括:二环内、二环至三环之间、三环至四环之间、四环至五环之间、五环
到六环之间和六环之外等枚举值;其中的房屋面积可以包括:40平方米以内、40‑60平方米、
60‑80平方米、80‑100平方米、100‑140平方米以及140平方米以上等枚举值,其中的厅室结
构可以包括:开间、一室一厅、二室一厅、三室一厅、四室一厅以及至少五室一厅等枚举值;
其中的房屋类型可以包括:普通住宅和别墅等枚举值,其中的房屋结构可以包括:砖混结构
和非砖混结构等枚举值;在上述假设的情况下,本公开中的偏好枚举值可以包括:新房、二
手房、二环内、二环至三环之间、三环至四环之间、四环至五环之间、五环到六环之间、六环
之外、40平方米以内、40‑60平方米、60‑80平方米、80‑100平方米、100‑140平方米、140平方
米以上、一室一厅、开间、二室一厅、三室一厅、四室一厅、至少五室一厅、砖混结构、非砖混
结构、普通住宅以及别墅等中的部分或者所有。在不同的实际应用领域中,本公开的偏好枚
举值可能会随着标的的不同而不同,本公开不限定偏好枚举值的具体内容。另外,本公开中
的偏好枚举值也可以称为标的属性枚举值。
比属性收敛用户在各偏好枚举值上的偏好度可以是指可比属性收敛用户对标的(如房屋)
的属性信息所包含的各枚举值的喜好程度或倾向程度等。
基于枚举值的行为统计量,并利用各基于枚举值的行为统计量,获得该用户在各偏好枚举
值上的偏好度。基于枚举值的行为统计量可以表示出每一个枚举值各自对应的行为统计
量。
词搜索类行为、用户关注房屋类行为、用户产生商机类行为以及用户的带看房屋类行为等。
本公开不限制各类行为的类数量以及各类行为的具体表现形式等。
敛用户的各类行为的行为特征可以是指:用于描述可比属性收敛用户所执行的各行为各自
所属的一类行为所具有的特征的信息。
以是指用于描述用户所执行的属于同一类行为的所有行为所具有的特征的基本信息单元。
也就是说,对于任一用户而言,该用户执行的属于同一类行为的所有行为具有一个或多个
特征点,每一个特征点即为一个行为特征元素。对于多个待处理用户和多个可比属性收敛
用户中的任一用户而言,本公开可以通过对用户操作数据进行该用户所执行的各类行为的
行为量的统计,获得该用户的各类行为的行为统计量,并进一步利用各类行为的行为统计
量,获得该用户的各类行为的行为特征。
为的行为特征同样可以认为是一条记录。本公开可以通过计算两条记录的距离,获得两条
记录的相似度。
为特征的相似度的情况下,确定出该待处理用户的可比属性收敛度。另外,本公开可以在获
取到部分待处理用户在各偏好枚举值上的偏好度和各类行为的行为特征与部分可比属性
收敛用户在各偏好枚举值上的偏好度和各类行为的行为特征的相似度的情况下,确定出所
有待处理用户的可比属性收敛度。
个或者多个偏好枚举值上,且可比属性收敛用户在各类行为上也常常具有一定的行为特
征,因此,本公开通过利用待处理用户在各偏好枚举值上的偏好度和各类行为的行为特征
与可比属性收敛用户在各偏好枚举值上的偏好度和各类行为的行为特征的相似度,来确定
待处理用户的可比属性收敛度,有利于较为客观准确的确定出用户可比属性的收敛度。由
此可知,本公开提供的技术方案有利于更好的满足用户需求,最终有利于提高目标行为的
发生概率。
理用户的标的和所有可比属性收敛用户的标的应属于同一地理位置区域(如同一城市)。不
可排除的是,在一些应用场景中,本公开中的地理位置区域也可以是指待处理用户和可比
属性收敛用户所在的地理位置区域。
同一地理位置区域的标的的用户操作数据,获取多个待处理用户和多个可比属性收敛用户
分别在各偏好枚举值上的偏好度的。同样的,本公开是根据基于同一地理位置区域的标的
的用户操作数据,获取多个待处理用户和多个可比属性收敛用户的各类行为的行为特征
的。在该应用场景中,本公开中的所有待处理用户和所有可比属性收敛用户可以不处于同
一地理位置区域,如处于不同城市。由于位于不同省市等地理位置区域的标的,尤其是价值
不菲的标的(如房产等),在标的数量、标的类型和标的价格等方面通常存在较大差异,因
此,往往会导致对不同地理位置区域中的标的产生需求的用户在各偏好枚举值上的偏好度
以及各类行为的行为特征存在一定的差异,本公开通过区分标的的地理位置区域,来确定
用户可比属性收敛度,有利于使确定出的用户可比属性收敛更客观准确。
系数和行为的衰减系数来确定用户在各偏好枚举值上的偏好度。
之后,本公开可以以偏好枚举值为单位,对该用户的所有行为进行行为量的统计,例如,如
果该用户的所有行为总共涉及n1个不同的偏好枚举值,且该用户的所有行为总共涉及n2类
行为,则本公开可以通过执行n1×n2次统计,获得n1×n2个行为统计量,且每一个行为统计
量对应在一个偏好枚举值上的一类行为的行为统计量。
为涉及房屋详情页的PV类行为和用户产生商机类行为这两类行为,假设m11次行为属于房
屋详情页的PV类行为,且m12次行为属于用户产生商机类行为;其中m2次行为均涉及偏好枚
举值b(如二手房),且m2次行为涉及屋详情页的PV类行为和用户产生商机类行为这两类行
为,假设m21次行为属于房屋详情页的PV类行为,m22次行为属于用户产生商机类行为。在上
述假设条件下,本公开可以对该用户的m1+m2次行为进行4次行为量统计,获得4个行为统计
量,其中第一个行为统计量为:用户在偏好枚举值a上的房屋详情页的PV类行为的行为统计
量,其中第二个行为统计量为:用户在偏好枚举值a上的用户产生商机类行为的行为统计
量,其中第三个行为统计量为:用户在偏好枚举值b上的房屋详情页的PV类行为的行为统计
量,其中第四个行为统计量为:用户在偏好枚举值b上的用户产生商机类行为的行为统计
量。
系数对应一个用户在不同偏好枚举值上的同一类行为。本公开中的衰减系数可以表示出用
户的一类行为中的某一次行为(如末次行为等)的执行时间到预定时间的时长(如执行时间
距今的时长等),在可比属性收敛度方面所起的作用。
偏好枚举值无关,也与具体的用户无关。也就是说,本公开中的一个权重系数对应所有用户
在所有偏好枚举值上的同一类行为。本公开中的权重系数可以表示出所有用户的一类行为
在可比属性收敛度方面所起的作用。
本公开可以根据用户操作数据,获得用户集合内的所有用户中在第一预定时间范围内执行
了第一类行为的用户的数量,本公开将该数量称为第一用户数量。其中的第一预定时间范
围内可以为预定单日内(如T日)或者预定多日内(如T日至T+i日)等。
用户的数量,本公开将该数量称为第二用户数量。其中的第二预定时间范围的起始时间不
早于第一预定时间范围的结束时间,且第二预定时间范围内可以为第一预定时间范围之后
的预定单日内(如T1日)或者预定多日内(如T1日到T1+j日)。
产生商机类行为的用户的数量为100,且这100位用户中,在T日之后的多日内(如7日内),有
5位用户执行过目标行为(如成交行为),则本公开可以确定出用户集合中的所有用户的用
户产生商机类行为的权重系数均为1/20。同样本的,本公开通过对用户操作数据进行统计
获得:用户集合中,在T日执行过房屋详情页的PV类行为的用户的数量为100,且这100位用
户中,在T日之后的多日内(如7日内),有1位用户执行过目标行为(如成交行为),则本公开
可以确定出用户集合中的所有用户的房屋详情页的PV类行为的权重系数均为1/100。
系数,而且有利于使权重系数较更为客观准确的反映出各类行为与用户成熟之间的关系,
从而有利于更为客观准确的衡量用户在各偏好枚举值上的偏好度。
各可比属性收敛用户分别在各偏好枚举值上的偏好度。
用户的第2类行为的行为统计量为x2,……,该用户的第n类行为的行为统计量为xn,假设该
用户的第1类行为的衰减系数为a1,该用户的第2类行为的衰减系数为a2,……,该用户的第
n类行为的衰减系数为an,假设所有用户的第1类行为的权重系数均为b1,所有用户的第2类
行为的权重系数均为b2,……,所有用户的第n类行为的权重系数均为bn;
的每一类行为分别设置衰减系数,有利于体现出每一用户在每一偏好枚举值上的每一类行
为的行为统计量,各自对用户在相应偏好枚举值的偏好度上的影响。由于不同类行为对于
偏好度的影响通常存在差异,例如,房屋详情页的PV类行为对偏好度的影响很可能不如用
户的带看房屋类行为对偏好度的影响大,因此,本公开通过针对所有用户的各类行为分别
设置权重系数,有利于体现出用户在每一偏好枚举值上的每一类行为的行为统计量,各自
对用户在相应偏好枚举值的偏好度上的影响。由此可知,本公开通过利用用户在各偏好枚
举值上的各类行为的行为统计量、各类行为的衰减系数和各类行为的权重系数,来确定用
户分别在各偏好枚举值上的偏好度,有利于客观准确的衡量每一个用户各自在各偏好枚举
值上的偏好度。
统计量与偏好枚举值无关。
类行为这两类行为,假设m11次行为属于房屋详情页的PV类行为,且m12次行为属于用户产
生商机类行为;其中m2次行为均涉及偏好枚举值b(如二手房),且m2次行为涉及屋详情页的
PV类行为和用户产生商机类行为这两类行为,假设m21次行为属于房屋详情页的PV类行为,
且m22次行为属于用户产生商机类行为。
PV类行为的行为统计量,其中第二个行为统计量为:用户在偏好枚举值a和偏好枚举值b上
的用户产生商机类行为的行为统计量。
X日等)。其中的末次行为时间可以是指末次行为的发生时间。
本公开可以利用预设模型获得用户的第一沉默概率。具体的,本公开可以将该用户的各类
行为的行为统计量和该用户的各类行为的末次行为时间距今时间间隔一起作为模型输入,
提供给预设模型,经由该预设模型进行沉默概率预测处理,并输出一概率值,本公开可以直
接将该预设模型输出的概率值作为第一沉默概率,也可以将预设模型输出的概率值进行映
射等处理的结果作为第一沉默概率。
商机类行为以及用户的带看房屋类行为。对于所有待处理用户和所有可比属性收敛用户中
的一用户而言,假设该用户的房屋详情页的PV类行为的行为量为x1,且末次行为距今时间
为s1,假设该用户的用户产生商机类行为的行为量为x2,且末次行为距今时间为s2,假设该
用户的带看房屋类行为的行为量为x3,且末次行为距今时间为s3。上述s1、s2和s3均可以称
为末次行为初始距今时间。
取值范围可以为0‑1。该概率值即为该用户的第一沉默概率,例如,该预设模型输出该用户
在最后一次执行了一类行为(如x1对应的类行为)后的7天内,不会发生上述三类行为中的
任何一类行为的可能性。
户操作数据形成的训练样本,该预设模型的训练样本也可以包括:基于待处理用户的用户
操作数据形成的训练样本。本公开的训练样本通常包括:各类行为的行为统计量、各类行为
的末次行为时间到一特定时间的时间间隔以及用于表示是否沉默的标签。训练样本的标签
用于调整预设模型的模型参数。例如,预设模型会针对每一个训练样本分别输出一概率值,
每一概率值分别表示相应用户在特定时间后的X(如7)日内,不执行任一类行为的可能性。
本公开可以利用预设模型输出的各概率值与训练样本的标签之间的差异进行损失计算,并
利用损失计算结果调整预设模型的模型参数。具体训练过程在此不再进行详细描述。
S308。
述三类行为各自的衰减系数,则到S303。
预定时间的时间间隔,获取该用户的第二沉默概率。
型输入中的相应的末次行为时间到预定时间的时间间隔,从而再次形成模型输入,通过将
当前形成的模型输入提供给预设模型,经由该预设模型进行沉默概率预测处理,本公开可
以直接将该预设模型输出的概率值作为第二沉默概率,同样的,本公开也可以将该预设模
型输出的概率值进行映射等处理的结果作为第二沉默概率。
型,经由该预设模型进行沉默概率预测处理,并输出该用户的第二沉默概率,例如,该预设
模型输出该用户在未来7天内不会发生上述三类行为中的任何一类行为的可能性。
的一半,则返回304。
出的该类行为的半衰期。例如,假设用户的一类行为的末次行为初始距今时间为1天,而当
前调整后的该类行为的末次行为距今时间为10天,则该用户的该类行为的半衰期为9天。
数。本公开对利用半衰期确定衰减系数的实现方式不作限定。
方式,有利于提高半衰期的准确性。
行为,本公开可以根据该用户的用户操作数据,获取该用户的属于该类行为的所有行为在
所有偏好枚举值上的行为统计量。例如,本公开可以从用户操作数据中获得该用户的所有
行为,并以类行为为单位,对该用户的所有行为的进行行为量的统计,也就是说,如果该用
户的所有行为总共涉及n1个不同的枚举值,且该用户的所有行为总共涉及n2类行为,则本
公开可以通过执行n2次统计,从而获得n2个行为统计量,且每一个行为统计量均对应在所
有枚举值。即本公开的一类行为的行为统计量与行为所对应的偏好枚举值无关。
本公开通过将用户的各类行为的行为统计量作为用户的各类行为的行为特征,有利于对用
户可比属性收敛度进行客观的衡量,从而有利于提高用户可比属性收敛度的准确性。
所有偏好枚举值上的行为统计量和该类行为的衰减系数。获取该用户的属于该类行为的所
有行为在所有偏好枚举值上的行为统计量和该类行为的衰减系数的具体实现方式可以参
见上述实施例中的相关描述。另外,如果本公开通过前述其他步骤中已经获得了行为统计
量和衰减系数,则本步骤直接引用即可。
的,本公开可以利用该类行为的衰减系数对属于该类行为的所有行为分别进行衰减处理,
并对衰减后的所有结果求和,本公开可以将该和值与该类行为的行为统计量相除,并将获
得的商作为该用户的该类行为的单次行为平均衰减量。本公开确定一用户的一类行为的单
次行为平均衰减量的一个例子如下:
设m11次行为属于房屋详情页的PV类行为,且m12次行为属于用户产生商机类行为;其中m2
次行为均涉及偏好枚举值b(如二手房),且m2次行为涉及屋详情页的PV类行为和用户产生
商机类行为这两类行为,假设m21次行为属于房屋详情页的PV类行为,且m22次行为属于用
户产生商机类行为。
PV类行为的行为统计量,其中第二个行为统计量为:用户在偏好枚举值a和偏好枚举值b上
的用户产生商机类行为的行为统计量。
衰减处理结果,本公开可以对这m11+m21个衰减处理结果求和,获得第一和值,本公开可以
将第一和值与m11+m21的商,作为该用户的房屋详情页的PV类行为的单次行为平均衰减量。
处理结果,本公开可以对这m12+m22个衰减处理结果求和,获得第二和值,本公开可以将第
二和值与m11+m21的商,作为该用户的用户产生商机类行为的单次行为平均衰减量。
一类行为的单次行为平均衰减量越小,表示该类行为与预定时间的时间间距越大,则用户
偏好的变异可能性越高,即用户的可比属性收敛度越低。本公开通过将用户的各类行为的
单次行为平均衰减量作为用户的各类行为的行为特征,有利于对用户可比属性收敛度进行
客观的衡量,从而有利于提高用户可比属性收敛度的准确性。
处理用户而言,本公开可以根据预定数量的第一可比属性收敛用户所形成的区域的半径,
确定该待处理用户的可比属性收敛度。其中的第一可比属性收敛用户可以是指在各偏好枚
举值上的偏好度和各类行为的行为特征与该待处理用户在各偏好枚举值上的偏好度和各
类行为的行为特征的相似度满足预定相似度要求的可比属性收敛用户。
度要求的预定数量的可比属性收敛用户(即寻找预定数量的第一可比属性收敛用户),从而
本公开可以以该待处理用户为圆心,获得预定数量的可比属性收敛用户形成的圆的半径;
进而本公开可以利用该半径获得该待处理用户的可比属性收敛度。例如,可以将该半径的
倒数作为该待处理用户的可比属性收敛度。本公开可以采用多种方式寻找预定数量的第一
可比属性收敛用户,一种快速寻找到预定数量的第一可比属性收敛用户的方式如下述针对
图5的描述。
用户的预定数量的可比属性收敛用户形成的区域大小相关,例如,区域半径越小,则表示待
处理用户的可比属性收敛度越高。本公开通过利用预定数量的第一可比属性收敛用户形成
的区域的半径来确定待处理用户的可比属性收敛度,有利于便捷客观准确衡量用户可比属
性收敛度,从而有利于提高用户可比属性收敛度的准确性。
度,则往往会耗费大量的计算资源。为了降低确定各待处理用户的可比属性收敛度的计算
资源的消耗,本公开可以对待处理用户进行聚类处理,并将一个类簇中的所有待处理用户
作为一个用户,在确定出该用户的可比属性收敛度之后,可以将该可比属性收敛度作为该
类簇中的所有待处理用户的可比属性收敛度。具体的,本公开确定所有待处理用户的可比
属性收敛度的一个例子,如图4所示。
的聚类过程在此不再详细说明。
度,确定各质心用户的可比属性收敛度。
的偏好度和各类行为的行为特征与至少部分可比属性收敛用户在各偏好枚举值上的偏好
度和各类行为的行为特征的距离(如欧式距离等),并将计算出的距离作为相似度。本公开
可以根据计算出的距离寻找到预定数量的第一可比属性收敛用户,一个具体的例子如下述
针对图5的描述。
处理用户与质心用户之间的距离,对质心用户的可比属性收敛度进行相应的处理,从而获
得该类簇中的各待处理用户的可比属性收敛度。例如,可以将质心用户的可比属性收敛度
作为类簇中与质心用户距离较近的待处理用户的可比属性收敛度,而使类簇中与质心用户
距离较远的待处理用户的可比属性收敛度设置为低于质心用户的可比属性收敛度。
户在各偏好枚举值上的偏好度和各类行为的行为特征的距离(如欧式距离等)。
最大数量,则返回S500。
进行计数,直到当前计数值达到预定最大数量。
径。
径的距离,从而获得位于当前半径形成的区域中的可比属性收敛用户的数量。
域中的可比属性收敛用户的数量大于预定数量,则到S506;如果当前半径形成的区域中的
可比属性收敛用户的数量小于预定数量,则到S507。
当前迭代步长与该比值的乘积作为下一次迭代步长,即第一迭代步长。本公开可以利用当
前半径与第一迭代步长的差值更新当前半径。
距离获得第二迭代步长,例如,本公开可以计算最小距离和最大距离的比值,并将当前迭代
步长与该比值的乘积作为下一次迭代步长,即第二迭代步长。本公开可以利用当前半径与
第二迭代步长的和值更新当前半径。
地理位置区域的标的的用户操作数据,获取各待处理用户和各可比属性收敛用户分别在各
偏好枚举值上的偏好度。
据,获取各待处理用户和各可比属性收敛用户分别在各偏好枚举值上的各类行为的行为统
计量。其中的第二子模块6002用于根据用户操作数据,获取各待处理用户的各类行为的衰
减系数和各可比属性收敛用户的各类行为的衰减系数。例如,针对各待处理用户和可比属
性收敛用户中的任一用户,第二子模块6002可以根据用户操作数据,获取该用户的各类行
为的行为统计量和该用户的各类行为的末次行为时间到预定时间的时间间隔,并根据该用
户的各类行为的行为统计量以及该用户的各类行为的末次行为时间到预定时间的时间间
隔,获取该用户的第一沉默概率;针对任一类行为,第二子模块6002调整该类行为的末次行
为时间到预定时间的时间间隔,并根据所述各类行为的行为统计量和所述调整后形成的各
类行为的末次行为时间到预定时间的时间间隔,获取该用户的第二沉默概率;若所述第二
沉默概率为所述第一沉默概率的一半,则第二子模块6002根据末次行为时间到预定时间的
时间间隔和调整后的末次行为时间到预定时间的时间间隔,确定该用户的该类行为的半衰
期;第二子模块6002根据该半衰期,确定该用户的该类行为的衰减系数。其中的第三子模块
6003用于根据用户操作数据,获取各类行为的权重系数。例如,针对任一类行为,第三子模
块6003可以根据用户操作数据,获取在第一预定时间范围内发生该类行为的第一用户数量
以及在第一预定时间范围后的第二预定时间范围内发生目标行为的第二用户数量;第三子
模块6003将第二用户数量和第一用户数量的比值,作为该类行为的权重系数。其中的第四
子模块6004用于根据各待处理用户和各可比属性收敛用户分别在各偏好枚举值上的各类
行为的行为统计量、各类行为的衰减系数以及各类行为的权重系数,分别确定各待处理用
户和各可比属性收敛用户分别在各偏好枚举值上的偏好度。
位置区域的标的的用户操作数据,获取各待处理用户和各可比属性收敛用户的各行为的行
为特征。
据用户操作数据,获取该用户的属于该类行为的所有行为在所有偏好枚举值上的行为统计
量;其中的行为统计量被作为该用户的该类行为的行为特征。
据用户操作数据,获取该用户的属于该类行为的所有行为在所有偏好枚举值上的行为统计
量和该类行为的衰减系数,第六子模块6012可以根据该用户的属于该类行为的所有行为在
所有偏好枚举值上的行为统计量和该类行为的衰减系数,确定该用户的该类行为的单次行
为平均衰减量;其中的单次行为平均衰减量被作为该用户的该类行为的行为特征。
为的行为特征的相似度。
以及各类行为的行为特征,对多个待处理用户进行聚类处理,获得多个类簇。其中的第八子
模块6022用于确定各类簇的质心用户在各偏好枚举值上的偏好度和各类行为的行为特征
与至少部分可比属性收敛用户在各偏好枚举值上的偏好度和各类行为的行为特征的相似
度。例如,针对任一质心用户,第八子模块6022可以依次计算该质心用户在各偏好枚举值上
的偏好度和各类行为的行为特征与可比属性收敛用户在各偏好枚举值上的偏好度和各类
行为的行为特征的距离,第八子模块6022根据当前获得的所有距离,在确定出预设最大半
径形成的区域中的可比属性收敛用户的数量达到预定最大数量时,则停止距离的计算,并
根据预设最大半径和初始迭代步长确定当前半径。
数量的第一可比属性收敛用户所形成的区域的半径,确定该待处理用户的可比属性收敛
度;其中的第一可比属性收敛用户包括:在各偏好枚举值上的偏好度和各类行为的行为特
征与该待处理用户在各偏好枚举值上的偏好度和各类行为的行为特征的相似度满足预定
相似度要求的可比属性收敛用户。
用户所在类簇中的各待处理用户的可比属性收敛度。例如,第九子模块6031确定当前半径
形成的区域中的可比属性收敛用户的数量,若当前半径形成的区域中的可比属性收敛用户
的数量等于预定数量,则第九子模块6031根据当前半径,确定该质心用户的可比属性收敛
度。若当前半径形成的区域中的可比属性收敛用户的数量大于预定数量,则第九子模块
6031可以根据第一迭代步长缩小当前半径,并再次确定当前半径形成的区域中的可比属性
收敛用户的数量;若当前半径形成的区域中的可比属性收敛用户的数量小于预定数量,则
第九子模块6031根据第二迭代步长增大所述当前半径,并再次确定当前半径形成的区域中
的可比属性收敛用户的数量。
行期望的功能。
储器,例如,可以包括:随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失
性存储器,例如,可以包括:只读存储器(ROM)、硬盘以及闪存等。在所述计算机可读存储介
质上可以存储一个或多个计算机程序指令,处理器711可以运行所述程序指令,以实现上文
所述的本公开的各个实施例的确定用户可比属性收敛度的方法以及/或者其他期望的功
能。在所述计算机可读存储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内
容。
括例如键盘、鼠标等等。该输出装置714可以向外部输出各种信息。该输出设备714可以包括
例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
可以包括任何其他适当的组件。
“示例性方法”部分中描述的根据本公开各种实施例的确定用户可比属性收敛度的方法中
的步骤。
Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程
序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软
件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备
或服务器上执行。
法”部分中描述的根据本公开各种实施例的确定用户可比属性收敛度的方法中的步骤。
磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的
例子(非穷举的列举)可以包括:具有一个或者多个导线的电连接、便携式盘、硬盘、随机存
取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式
紧凑盘只读存储器(CD‑ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解
的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。
而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部
分说明即可。
的,可以按任意方式连接、布置、配置这些器件、装置、设备以及系统。诸如“包括”、“包含、
“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词
汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所
使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特
别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序
包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据
本公开的方法的程序的记录介质。
义的一般原理可以应用于其他方面,而不脱离本公开的范围。因此,本公开不意图被限制到
在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
域技术人员将认识到其某些变型、修改、改变、添加和子组合。