对象数据处理方法、装置、计算机设备和存储介质转让专利

申请号 : CN202110217636.1

文献号 : CN112580902B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 郑森烈

申请人 : 腾讯科技(深圳)有限公司

摘要 :

本申请涉及一种对象数据处理方法、装置、计算机设备和存储介质。该方法涉及机器学习领域的决策树模型,方法包括:根据与对象画像数据的各画像维度对应的对象行为数据中属于对样本对象实施目标策略的第一命中类别的占比,将与各画像维度对应的对象行为数据转换为对应目标策略的策略效果;将与各画像维度对应的策略效果输入决策树模型,以决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标,对决策树模型进行训练,得到群体划分决策树;基于从群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,确定对应目标策略的较优细分群体。采用本方法能够提高从测试结果中挖掘细分群体策略结果的效率。

权利要求 :

1.一种对象数据处理方法,其特征在于,所述方法包括:获取各样本对象对应的对象画像数据、对象行为数据以及对应目标策略的命中类别,所述命中类别包括对所述样本对象实施所述目标策略的第一命中类别和未对所述样本对象实施所述目标策略的第二命中类别中的一种;

根据与所述对象画像数据的各画像维度对应的对象行为数据中属于所述第一命中类别的占比,将与各所述画像维度对应的对象行为数据转换为对应所述目标策略的策略效果;

将与各所述画像维度对应的策略效果输入决策树模型,以所述决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标,对所述决策树模型进行训练,得到群体划分决策树;

基于从所述群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,确定对应所述目标策略的较优细分群体。

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:对各所述样本对象对应的对象画像数据进行分类,得到各所述画像维度及属于各所述画像维度的维度属性;

对各所述样本对象对应的对象行为数据按所述维度属性进行归类,得到对应各所述维度属性的对象行为数据;

根据属于相同画像维度的维度属性所对应的对象行为数据,获得各所述画像维度对应的对象行为数据。

3.根据权利要求2所述的方法,其特征在于,所述根据与所述对象画像数据的各画像维度对应的对象行为数据中属于所述第一命中类别的占比,将与各所述画像维度对应的对象行为数据转换为对应所述目标策略的策略效果,包括:对于每个画像维度,确定所述画像维度所包括的维度属性;

对于每个维度属性,确定所述维度属性对应的对象行为数据中属于所述第一命中类别的占比,根据所述占比将所述维度属性对应的对象行为数据转换为所述维度属性对应的策略效果;

根据所述画像维度包括的所有维度属性各自对应的策略效果,计算所述画像维度对应所述目标策略的策略效果。

4.根据权利要求3所述的方法,其特征在于,所述根据所述占比将所述维度属性对应的对象行为数据转换为所述维度属性对应的策略效果,包括:根据所述占比确定属于所述第一命中类别的对象行为数据的第一权重系数;

根据所述占比确定属于所述第二命中类别的对象行为数据的第二权重系数;

按所述第一权重系数,将所述维度属性对应的对象行为数据中属于所述第一命中类别的样本对象对应的对象行为数据,转换为样本对象对应的策略效果;

按所述第二权重系数,将所述维度属性对应的对象行为数据中属于所述第二命中类别的样本对象对应的对象行为数据,转换为样本对象对应的策略效果;

对所述维度属性对应的每个样本对象的策略效果求平均值,获得所述维度属性对应的策略效果。

5.根据权利要求4所述的方法,其特征在于,属于所述第一命中类别的样本对象对应的策略效果通过以下公式计算得到:其中, 表示属于所述第一命中类别的第 个样本对象对应的策略效果; 表示所述画像维度, 表示所述画像维度的第 个维度属性; 表示所述第 个维度属性对应的对象行为数据中属于所述第一命中类别的占比; 表示属于所述第一命中类别的第 个样本对象的对象行为数据;

属于所述第二命中类别的样本对象对应的策略效果通过以下公式计算得到:其中, 表示属于所述第二命中类别的第 个样本对象对应的策略效果; 表示所述画像维度, 表示所述画像维度的第 个维度属性; 表示所述第 个维度属性对应的对象行为数据中属于所述第一命中类别的占比; 表示属于所述第二命中类别的第 个样本对象的对象行为数据。

6.根据权利要求3所述的方法,其特征在于,所述根据所述画像维度包括的所有维度属性各自对应的策略效果,计算所述画像维度对应所述目标策略的策略效果,包括:根据所述画像维度包括的各所述维度属性各自对应的策略效果以及各所述维度属性对应的每个样本对象的策略效果,对各所述维度属性对应的每个样本对象的策略效果求均方误差;

对所述画像维度包括的所有维度属性各自对应的均方误差求和,获得所述画像维度对应所述目标策略的策略效果。

7.根据权利要求1所述的方法,其特征在于,所述将与各所述画像维度对应的策略效果输入决策树模型,以所述决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标,对所述决策树模型进行训练,得到群体划分决策树,包括:将与各所述画像维度对应的所述策略效果输入所述决策树模型;

根据各所述画像维度对应所述目标策略的策略效果,确定所述决策树模型的根节点;

迭代地确定当前所述决策树模型中从所述根节点到末尾子节点构成的画像维度组合,将当前确定的画像维度组合与各剩余画像维度构成的各候选画像维度组合分别对应的对象行为数据转换为相应策略效果,并根据各所述策略效果从各剩余画像维度中确定以所述末尾子节点为父节点的子节点后,获得更新的决策树模型;

基于停止迭代时的决策树模型,获得所述群体划分决策树。

8.根据权利要求7所述的方法,其特征在于,所述方法还包括:确定所述根节点表示的画像维度与各剩余画像维度构成的各候选画像维度组合分别对应的对象行为数据;

按照各候选画像维度组合对应的对象行为数据中属于所述第一命中类别的占比,将各候选画像维度组合对应的对象行为数据转换为各候选画像维度组合对应的策略效果;

根据各候选画像维度组合对应的策略效果,从各剩余画像维度中确定与所述根节点相连的子节点。

9.根据权利要求7所述的方法,其特征在于,所述将当前确定的画像维度组合与各剩余画像维度构成的各候选画像维度组合分别对应的对象行为数据转换为相应策略效果,包括:

分别确定各候选画像维度组合所包括的维度组合属性;

对所述样本对象对应的对象行为数据按所述维度组合属性进行归类,得到各所述维度组合属性分别对应的对象行为数据;

根据属于相同候选画像维度组合的维度组合属性所对应的对象行为数据,获得各候选画像维度组合对应的对象行为数据;

根据各候选画像维度组合对应的对象行为数据中属于所述第一命中类别的占比,将与各候选画像维度组合对应的对象行为数据转换为对应所述目标策略的策略效果。

10.根据权利要求9所述的方法,其特征在于,所述根据各候选画像维度组合对应的对象行为数据中属于所述第一命中类别的占比,将与各候选画像维度组合对应的对象行为数据转换为对应所述目标策略的策略效果,包括:对于每个候选画像维度组合,确定所述候选画像维度组合所包括的维度组合属性;

对于每个维度组合属性,确定所述维度组合属性对应的对象行为数据中属于所述第一命中类别的占比,根据所述维度组合属性对应的对象行为数据中属于所述第一命中类别的占比,将所述维度组合属性对应的对象行为数据转换为所述维度组合属性对应的策略效果;

根据所述候选画像维度组合包括的所有维度组合属性各自对应的策略效果,计算所述候选画像维度组合对应所述目标策略的策略效果。

11.根据权利要求10所述的方法,其特征在于,所述根据所述维度组合属性对应的对象行为数据中属于所述第一命中类别的占比,将所述维度组合属性对应的对象行为数据转换为所述维度组合属性对应的策略效果,包括:根据所述维度组合属性对应的对象行为数据中属于所述第一命中类别的占比,确定属于所述第一命中类别的对象行为数据的第一权重系数;

根据所述维度组合属性对应的对象行为数据中属于所述第一命中类别的占比,确定属于所述第二命中类别的对象行为数据的第二权重系数;

按所述第一权重系数,将所述维度组合属性对应的对象行为数据中属于所述第一命中类别的样本对象对应的对象行为数据,转换为样本对象对应的策略效果;

按所述第二权重系数,将所述维度组合属性对应的对象行为数据中属于所述第二命中类别的样本对象对应的对象行为数据,转换为样本对象对应的策略效果;

对所述维度组合属性对应的每个样本对象的策略效果求平均值,获得所述维度组合属性对应的策略效果。

12.根据权利要求10所述的方法,其特征在于,所述根据所述候选画像维度组合包括的所有维度组合属性各自对应的策略效果,计算所述候选画像维度组合对应所述目标策略的策略效果,包括:

对归类至所述维度组合属性的每个样本对象的策略效果求均方误差;

对所述候选画像维度组合包括的所有维度组合属性各自对应的均方误差求和,获得所述候选画像维度组合对应所述目标策略的策略效果。

13.根据权利要求7所述的方法,其特征在于,所述根据各所述策略效果从各剩余画像维度中确定以所述末尾子节点为父节点的子节点,包括:确定各候选画像维度组合对应的策略效果中,策略效果最小值对应的画像维度组合;

将构成所述策略效果最小值对应的画像维度组合的剩余画像维度,作为所述决策树模型中以所述末尾子节点为父节点的子节点。

14.根据权利要求7所述的方法,其特征在于,所述方法还包括:在更新所述决策树模型时,确定所述决策树模型中从根节点到所述子节点构成的画像维度组合对应的样本对象数量;

修剪所述样本对象数量小于预设阈值的子节点。

15.根据权利要求7所述的方法,其特征在于,所述基于从所述群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,确定对应所述目标策略的较优细分群体,包括:

基于停止迭代时所述群体划分决策树中从所述根节点到叶子节点所表示的各细分群体分别对应的策略效果,将大于阈值的策略效果所对应的细分群体,作为所述较优细分群体。

16.一种对象数据处理装置,其特征在于,所述装置包括:获取模块,用于获取各样本对象对应的对象画像数据、对象行为数据以及对应目标策略的命中类别,所述命中类别包括对所述样本对象实施所述目标策略的第一命中类别和未对所述样本对象实施所述目标策略的第二命中类别中的一种;

转换模块,用于根据与所述对象画像数据的各画像维度对应的对象行为数据中属于所述第一命中类别的占比,将与各所述画像维度对应的对象行为数据转换为对应所述目标策略的策略效果;

训练模块,用于将与各所述画像维度对应的策略效果输入决策树模型,以所述决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标,对所述决策树模型进行训练,得到群体划分决策树;

确定模块,用于基于从所述群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,确定对应所述目标策略的较优细分群体。

17.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至15中任一项所述的方法的步骤。

18.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至15中任一项所述的方法的步骤。

说明书 :

对象数据处理方法、装置、计算机设备和存储介质

技术领域

[0001] 本申请涉及计算机技术领域,特别是涉及一种对象数据处理方法、装置、计算机设备和存储介质。

背景技术

[0002] A/B测试是将被测试对象划分为A组和B组,对A组对象实施目标策略,对B组对象不实施目标策略,通过分析A组和B组的被测试对象的对象行为数据的差异,来确定对优化指
标最有效的策略。
[0003] 随着计算机技术和人工智能技术的发展,A/B测试有了广泛的应用。比如,在互联网产品优化场景下,通过A/B测试的测试结果来确定是否上线优化策略。在互联网产品上线
初期,优化策略往往能够获得整体被测试对象的认可,即A/B测试的测试结果呈现明显的倾
向,而随着互联网产品的不断优化,后续的优化策略往往只能获得部分被测试对象的认可,
即A/B测试的测试结果不能呈现明显的倾向,此时需要从更细粒度的层面分析测试结果,通
常是将被测试对象划分为不同的细分群体,从测试结果中挖掘各细分群体对应的测试结
果,以获得测试效果好的细分群体。
[0004] 然而,目前的细粒度分析方式,是对被测试对象的不同画像维度的不同属性进行组合,从而将被测试对象划分为不同的细分群体。画像维度比如包括城市、年龄和性别等,
城市的属性值比如包括北京、上海、深圳、广州等,年龄的属性值比如1‑100岁,性别的属性
值包括男性和女性,由于画像维度众多、画像维度的属性值众多等因素,对不同的属性值进
行组合,常常会遭遇组合爆炸的问题,导致计算性能瓶颈,进而导致从测试结果中挖掘细分
群体测试结果的效率低。

发明内容

[0005] 基于此,有必要针对上述技术问题,提供一种能够提升从测试结果中挖掘细分群体测试结果的效率的对象数据处理方法、装置、计算机设备和存储介质。
[0006] 一种对象数据处理方法,该方法包括:
[0007] 获取各样本对象对应的对象画像数据、对象行为数据以及对应目标策略的命中类别,命中类别包括对样本对象实施目标策略的第一命中类别和未对样本对象实施目标策略
的第二命中类别中的一种;
[0008] 根据与对象画像数据的各画像维度对应的对象行为数据中属于第一命中类别的占比,将与各画像维度对应的对象行为数据转换为对应目标策略的策略效果;
[0009] 将与各画像维度对应的策略效果输入决策树模型,以决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标,对决策树模型进行训练,得到群体划分决策
树;
[0010] 基于从群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,确定对应目标策略的较优细分群体。
[0011] 在一个实施例中,该方法还包括:
[0012] 对各样本对象对应的对象画像数据进行分类,得到各画像维度及属于各画像维度的维度属性;
[0013] 对各样本对象对应的对象行为数据按维度属性进行归类,得到对应各维度属性的对象行为数据;
[0014] 根据属于相同画像维度的维度属性所对应的对象行为数据,获得各画像维度对应的对象行为数据。
[0015] 在一个实施例中,根据与对象画像数据的各画像维度对应的对象行为数据中属于第一命中类别的占比,将与各画像维度对应的对象行为数据转换为对应目标策略的策略效
果,包括:
[0016] 对于每个画像维度,确定画像维度所包括的维度属性;
[0017] 对于每个维度属性,确定维度属性对应的对象行为数据中属于第一命中类别的占比,根据占比将维度属性对应的对象行为数据转换为维度属性对应的策略效果;
[0018] 根据画像维度包括的所有维度属性各自对应的策略效果,计算画像维度对应目标策略的策略效果。
[0019] 在一个实施例中,根据占比将维度属性对应的对象行为数据转换为维度属性对应的策略效果,包括:
[0020] 根据占比确定属于第一命中类别的对象行为数据的第一权重系数;
[0021] 根据占比确定属于第二命中类别的对象行为数据的第二权重系数;
[0022] 按第一权重系数,将维度属性对应的对象行为数据中属于第一命中类别的样本对象对应的对象行为数据,转换为样本对象对应的策略效果;
[0023] 按第二权重系数,将维度属性对应的对象行为数据中属于第二命中类别的样本对象对应的对象行为数据,转换为样本对象对应的策略效果;
[0024] 对维度属性对应的每个样本对象的策略效果求平均值,获得维度属性对应的策略效果。
[0025] 在一个实施例中,属于第一命中类别的样本对象对应的策略效果通过以下公式计算得到:
[0026]
[0027] 其中, 表示属于第一命中类别的第 个样本对象对应的策略效果; 表示画像维度, 表示画像维度的第 个维度属性; 表示第 个维度属性对应的对象行为
数据中属于第一命中类别的占比; 表示属于第一命中类别的第 个样本对象的对象行
为数据;
[0028] 属于第二命中类别的样本对象对应的策略效果通过以下公式计算得到:
[0029]
[0030] 其中, 表示属于第二命中类别的第 个样本对象对应的策略效果; 表示画像维度, 表示画像维度的第 个维度属性; 表示第 个维度属性对应的对象行为数
据中属于第一命中类别的占比; 表示属于第二命中类别的第 个样本对象的对象行为数
据。
[0031] 在一个实施例中,根据画像维度包括的所有维度属性各自对应的策略效果,计算画像维度对应目标策略的策略效果,包括:
[0032] 根据画像维度包括的各维度属性各自对应的策略效果以及各维度属性对应的每个样本对象的策略效果,对各维度属性对应的每个样本对象的策略效果求均方误差;
[0033] 对画像维度包括的所有维度属性各自对应的均方误差求和,获得画像维度对应目标策略的策略效果。
[0034] 在一个实施例中,将与各画像维度对应的策略效果输入决策树模型,以决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标,对决策树模型进行训练,
得到群体划分决策树,包括:
[0035] 将与各画像维度对应的策略效果输入决策树模型;
[0036] 根据各画像维度对应目标策略的策略效果,确定决策树模型的根节点;
[0037] 迭代地确定当前决策树模型中从根节点到末尾子节点构成的画像维度组合,将当前确定的画像维度组合与各剩余画像维度构成的各候选画像维度组合分别对应的对象行
为数据转换为相应策略效果,并根据各策略效果从各剩余画像维度中确定以末尾子节点为
父节点的子节点后,获得更新的决策树模型;
[0038] 基于停止迭代时的决策树模型,获得群体划分决策树。
[0039] 在一个实施例中,该方法还包括:
[0040] 确定根节点表示的画像维度与各剩余画像维度构成的各候选画像维度组合分别对应的对象行为数据;
[0041] 按照各候选画像维度组合对应的对象行为数据中属于第一命中类别的占比,将各候选画像维度组合对应的对象行为数据转换为各候选画像维度组合对应的策略效果;
[0042] 根据各候选画像维度组合对应的策略效果,从各剩余画像维度中确定与根节点相连的子节点。
[0043] 在一个实施例中,将当前确定的画像维度组合与各剩余画像维度构成的各候选画像维度组合分别对应的对象行为数据转换为相应策略效果,包括:
[0044] 分别确定各候选画像维度组合所包括的维度组合属性;
[0045] 对样本对象对应的对象行为数据按维度组合属性进行归类,得到各维度组合属性分别对应的对象行为数据;
[0046] 根据属于相同候选画像维度组合的维度组合属性所对应的对象行为数据,获得各候选画像维度组合对应的对象行为数据;
[0047] 根据各候选画像维度组合对应的对象行为数据中属于第一命中类别的占比,将与各候选画像维度组合对应的对象行为数据转换为对应目标策略的策略效果。
[0048] 在一个实施例中,根据各候选画像维度组合对应的对象行为数据中属于第一命中类别的占比,将与各候选画像维度组合对应的对象行为数据转换为对应目标策略的策略效
果,包括:
[0049] 对于每个候选画像维度组合,确定候选画像维度组合所包括的维度组合属性;
[0050] 对于每个维度组合属性,确定维度组合属性对应的对象行为数据中属于第一命中类别的占比,根据占比将维度组合属性对应的对象行为数据转换为维度组合属性对应的策
略效果;
[0051] 根据候选画像维度组合包括的所有维度组合属性各自对应的策略效果,计算候选画像维度组合对应目标策略的策略效果。
[0052] 在一个实施例中,根据占比将维度组合属性对应的对象行为数据转换为维度组合属性对应的策略效果,包括:
[0053] 根据占比确定属于第一命中类别的对象行为数据的第一权重系数;
[0054] 根据占比确定属于第二命中类别的对象行为数据的第二权重系数;
[0055] 按第一权重系数,将维度组合属性对应的对象行为数据中属于第一命中类别的样本对象对应的对象行为数据,转换为样本对象对应的策略效果;
[0056] 按第二权重系数,将维度组合属性对应的对象行为数据中属于第二命中类别的样本对象对应的对象行为数据,转换为样本对象对应的策略效果;
[0057] 对维度组合属性对应的每个样本对象的策略效果求平均值,获得维度组合属性对应的策略效果。
[0058] 在一个实施例中,根据候选画像维度组合包括的所有维度组合属性各自对应的策略效果,计算候选画像维度组合对应目标策略的策略效果,包括:
[0059] 对归类至维度组合属性的每个样本对象的策略效果求均方误差;
[0060] 对候选画像维度组合包括的所有维度组合属性各自对应的均方误差求和,获得候选画像维度组合对应目标策略的策略效果。
[0061] 在一个实施例中,根据各策略效果从各剩余画像维度中确定以末尾子节点为父节点的子节点,包括:
[0062] 确定各候选画像维度组合对应的策略效果中,策略效果最小值对应的画像维度组合;
[0063] 将构成策略效果最小值对应的画像维度组合的剩余画像维度,作为决策树模型中以末尾子节点为父节点的子节点。
[0064] 在一个实施例中,该方法还包括:
[0065] 在更新决策树模型时,确定决策树模型中从根节点到子节点构成的画像维度组合对应的样本对象数量;
[0066] 修剪样本对象数量小于预设阈值的子节点。
[0067] 在一个实施例中,基于从群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,确定对应目标策略的较优细分群体,包括:
[0068] 基于停止迭代时群体划分决策树中从根节点到叶子节点所表示的各细分群体分别对应的策略效果,将大于阈值的策略效果所对应的细分群体,作为较优细分群体。
[0069] 在一个实施例中,该方法还包括:
[0070] 获得群体划分决策树后,从根节点开始遍历群体划分决策树;
[0071] 当从根节点到当前遍历到的节点所构成的画像维度组合所对应的样本对象数量小于预设阈值时,从群体划分决策树修剪当前遍历到的节点。
[0072] 在一个实施例中,该方法还包括:
[0073] 获取与各对象标识对应的对象画像数据;
[0074] 根据对象画像数据确定与较优细分群体匹配的目标对象标识;
[0075] 对以目标对象标识登录的目标应用程序实施目标策略。
[0076] 一种对象数据处理装置,该装置包括:
[0077] 获取模块,用于获取各样本对象对应的对象画像数据、对象行为数据以及对应目标策略的命中类别,命中类别包括对样本对象实施目标策略的第一命中类别和未对样本对
象实施目标策略的第二命中类别中的一种;
[0078] 转换模块,用于根据与对象画像数据的各画像维度对应的对象行为数据中属于第一命中类别的占比,将与各画像维度对应的对象行为数据转换为对应目标策略的策略效
果;
[0079] 训练模块,用于将与各画像维度对应的策略效果输入决策树模型,以决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标,对决策树模型进行训练,得
到群体划分决策树;
[0080] 确定模块,用于基于从群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,确定对应目标策略的较优细分群体。
[0081] 一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现以下步骤:
[0082] 获取各样本对象对应的对象画像数据、对象行为数据以及对应目标策略的命中类别,命中类别包括对样本对象实施目标策略的第一命中类别和未对样本对象实施目标策略
的第二命中类别中的一种;
[0083] 根据与对象画像数据的各画像维度对应的对象行为数据中属于第一命中类别的占比,将与各画像维度对应的对象行为数据转换为对应目标策略的策略效果;
[0084] 将与各画像维度对应的策略效果输入决策树模型,以决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标,对决策树模型进行训练,得到群体划分决策
树;
[0085] 基于从群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,确定对应目标策略的较优细分群体。
[0086] 一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
[0087] 获取各样本对象对应的对象画像数据、对象行为数据以及对应目标策略的命中类别,命中类别包括对样本对象实施目标策略的第一命中类别和未对样本对象实施目标策略
的第二命中类别中的一种;
[0088] 根据与对象画像数据的各画像维度对应的对象行为数据中属于第一命中类别的占比,将与各画像维度对应的对象行为数据转换为对应目标策略的策略效果;
[0089] 将与各画像维度对应的策略效果输入决策树模型,以决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标,对决策树模型进行训练,得到群体划分决策
树;
[0090] 基于从群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,确定对应目标策略的较优细分群体。
[0091] 一种计算机程序,计算机程序包括计算机指令,计算机指令存储在计算机可读存储介质中,计算机设备的处理器从计算机可读存储介质读取计算机指令,处理器执行计算
机指令,使得计算机设备执行上述方法的步骤。
[0092] 获取各样本对象对应的对象画像数据、对象行为数据以及对应目标策略的命中类别,命中类别包括对样本对象实施目标策略的第一命中类别和未对样本对象实施目标策略
的第二命中类别中的一种;
[0093] 根据与对象画像数据的各画像维度对应的对象行为数据中属于第一命中类别的占比,将与各画像维度对应的对象行为数据转换为对应目标策略的策略效果;
[0094] 将与各画像维度对应的策略效果输入决策树模型,以决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标,对决策树模型进行训练,得到群体划分决策
树;
[0095] 基于从群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,确定对应目标策略的较优细分群体。
[0096] 上述对象数据处理方法、装置、计算机设备和存储介质,一方面,根据与对象画像数据的各画像维度对应的对象行为数据中属于第一命中类别的占比,将与各画像维度对应
的对象行为数据转换为对应目标策略的策略效果,解决了在AB测试场景下无法获取样本对
象的策略效果的问题,使得本申请实施例可基于决策树算法从测试结果中挖掘细分群体的
策略结果;另一方面,将与各画像维度对应的策略效果输入决策树模型,以决策树模型中节
点所表示的画像维度组合对应的策略效果最优化为目标,对决策树模型进行训练得到群体
划分决策树,基于从群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的
策略效果,即可确定对应目标策略的较优细分群体,由于以决策树模型中节点所表示的画
像维度组合对应的策略效果最优化为目标训练决策树模型,能够减少画像维度组合数量,
且能够保证群体划分决策树中节点所表示的画像维度组合具有局部最优的特性,从而避免
传统技术中组合爆炸的问题,提高从测试结果中挖掘细分群体策略结果的效率。

附图说明

[0097] 图1为一个实施例中对象数据处理方法的应用环境图;
[0098] 图2为一个实施例中对象数据处理方法的流程示意图;
[0099] 图3为一个实施例中决策树模型的训练数据的示意图;
[0100] 图4(a)为一个实施例中计算画像维度对应的策略效果的流程示意图;
[0101] 图4(b)为另一个实施例中计算画像维度对应的策略效果的流程示意图;
[0102] 图5为一个实施例中群体划分决策树的示意图;
[0103] 图6(a)为一个实施例中计算候选画像维度组合对应的策略效果的流程示意图;
[0104] 图6(b)为另一个实施例中计算候选画像维度组合对应的策略效果的流程示意图;
[0105] 图7为一个实施例中获取维度属性对应的策略效果的细化流程示意图;
[0106] 图8为另一个实施例中对象数据处理方法的流程示意图;
[0107] 图9为一个实施例中对象数据处理装置的结构框图;
[0108] 图10为一个实施例中计算机设备的内部结构图。

具体实施方式

[0109] 为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不
用于限定本申请。
[0110] 本申请实施例提供的对象数据处理方法,涉及人工智能(Artificial Intelligence, AI)技术,人工智能是利用数字计算机或者数字计算机控制的机器模拟、延
伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应
用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生
产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智
能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
[0111] 人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、
大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机
视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
[0112] 本申请实施例提供的对象数据处理方法,主要涉及人工智能领域的机器学习(Machine Learning, ML)技术。机器学习是一门多领域交叉学科,涉及概率论、统计学、逼
近论、凸分析、算法复杂度理论等多门学科,专门研究计算机怎样模拟或实现人类的学习行
为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习
是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机
器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教
学习等技术。
[0113] 本申请实施例提供的对象数据处理方法,涉及区块链技术。区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链
(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数
据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和
生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。
[0114] 区块链底层平台可以包括用户管理、基础服务、智能合约以及运营监控等处理模块。其中,用户管理模块负责所有区块链参与者的身份信息管理,包括维护公私钥生成(账
户管理)、密钥管理以及用户真实身份和区块链地址对应关系维护(权限管理)等,并且在授
权的情况下,监管和审计某些真实身份的交易情况,提供风险控制的规则配置(风控审计);
基础服务模块部署在所有区块链节点设备上,用来验证业务请求的有效性,并对有效请求
完成共识后记录到存储上,对于一个新的业务请求,基础服务先对接口适配解析和鉴权处
理(接口适配),然后通过共识算法将业务信息加密(共识管理),在加密之后完整一致的传
输至共享账本上(网络通信),并进行记录存储;智能合约模块负责合约的注册发行以及合
约触发和合约执行,开发人员可以通过某种编程语言定义合约逻辑,发布到区块链上(合约
注册),根据合约条款的逻辑,调用密钥或者其它的事件触发执行,完成合约逻辑,同时还提
供对合约升级注销的功能;运营监控模块主要负责产品发布过程中的部署、配置的修改、合
约设置、云适配以及产品运行中的实时状态的可视化输出,例如:告警、监控网络情况、监控
节点设备健康状态等。
[0115] 平台产品服务层提供典型应用的基本能力和实现框架,开发人员可以基于这些基本能力,叠加业务的特性,完成业务逻辑的区块链实现。应用服务层提供基于区块链方案的
应用服务给业务参与方进行使用。
[0116] 本申请实施例提供的对象数据处理方法,主要涉及机器学习领域的决策树技术。例如,在本申请实施例中,将与对象画像数据的各画像维度对应的策略效果输入决策树模
型,以决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标,对决策树
模型进行训练,得到群体划分决策树,这样,基于从群体划分决策树的根节点到叶子节点所
表示的各细分群体分别对应的策略效果,即可确定对应目标策略的较优细分群体,也即是
测试效果好的细分群体。
[0117] 本申请提供的对象数据处理方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。终端102获取各样本对象对应的对象画像数据、对象
行为数据以及对应目标策略的命中类别,命中类别包括对样本对象实施目标策略的第一命
中类别和未对样本对象实施目标策略的第二命中类别中的一种,将各样本对象对应的对象
画像数据、对象行为数据以及对应目标策略的命中类别发送至服务器104,服务器104根据
与对象画像数据的各画像维度对应的对象行为数据中属于第一命中类别的占比,将与各画
像维度对应的对象行为数据转换为对应目标策略的策略效果,将与各画像维度对应的策略
效果输入决策树模型,以决策树模型中节点所表示的画像维度组合对应的策略效果最优化
为目标,对决策树模型进行训练,得到群体划分决策树,基于从群体划分决策树的根节点到
叶子节点所表示的各细分群体分别对应的策略效果,确定对应目标策略的较优细分群体,
服务器104可将较优细分群体发送至终端102。
[0118] 在另一些实施例中,终端102或者服务器104也可以独立完成较优细分群体的筛选。以终端102为例,终端102获取各样本对象对应的对象画像数据、对象行为数据以及对应
目标策略的命中类别,根据与对象画像数据的各画像维度对应的对象行为数据中属于第一
命中类别的占比,将与各画像维度对应的对象行为数据转换为对应目标策略的策略效果,
将与各画像维度对应的策略效果输入决策树模型,以决策树模型中节点所表示的画像维度
组合对应的策略效果最优化为目标,对决策树模型进行训练,得到群体划分决策树,基于从
群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,确定对应
目标策略的较优细分群体。
[0119] 其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集
群来实现。
[0120] 本申请实施例提供的对象数据处理方法,其执行主体可以是本申请实施例提供的对象数据处理装置,或者集成了该对象数据处理装置的计算机设备,其中该对象数据处理
装置可以采用硬件或软件的方式实现。计算机设备可以是图1中所示的终端102或服务器
104。
[0121] 本申请实施例提供的对象数据处理方法,可应用于对A/B测试的测试结果进行细粒度分析,从测试结果中挖掘各细分群体对应的测试结果,以获得测试效果好的细分群体。
在一个实施例中,本申请实施例可应用于互联网产品上线场景,具体是对互联网产品上线
场景中所采用的A/B测试的测试结果进行细粒度分析,从测试结果中挖掘测试效果好的细
分群体,以对测试效果好的细分群体上线A/B测试的测试内容。比如,测试内容可以是针对
互联网产品提出的新方案或者优化方案,从测试结果中挖掘测试效果好的细分群体,以对
测试效果好的细分群体针对性上线新方案或者优化方案。
[0122] 在一个实施例中,如图2所示,提供了一种对象数据处理方法,本实施例主要以该方法应用于计算机设备(上述图1中的终端102或服务器104)来举例说明,包括以下步骤:
[0123] 步骤S202,获取各样本对象对应的对象画像数据、对象行为数据以及对应目标策略的命中类别,命中类别包括对样本对象实施目标策略的第一命中类别和未对样本对象实
施目标策略的第二命中类别中的一种。
[0124] 其中,样本对象是A/B测试的被测试对象。目标策略是A/B测试的测试内容。在一个实施例中,目标策略可以是针对互联网产品的实施方案,比如用户界面(UI,User 
Interface)设计方案、文案策划方案、页面布局方案、功能设计方案、算法设计方案,等等。
目标策略可以是针对互联网产品所提出的新方案或者优化方案,比如针对传统的用户界面
所提出的优化设计方案。
[0125] 其中,命中类别用于描述样本对象所命中的测试类别。在本申请实施例中,计算机设备将各样本对象划分至第一命中类别和第二命中类别,对第一命中类别的样本对象实施
目标策略,对第二命中类别的样本对象不实施目标策略。计算机设备可对第二命中类别的
样本对象实施除目标策略以外的其它策略,也可不对样本对象实施任何策略。
[0126] 其中,对象行为数据是描述用户行为的数据,用户行为比如点击行为、浏览行为、互动行为等,对象行为数据比如点击率、浏览时长、互动次数等。对象行为数据可反映样本
对象在A/B测试中的测试结果,对象行为数据与A/B测试的优化指标相匹配,比如A/B测试的
优化指标为点击率,对象行为数据也为点击率。
[0127] 其中,对象画像数据是描述用户属性的数据。用户属性可以是用户所固有的生理特性,比如年龄、性别等;用户属性也可以是用户作为社会人所具有的特性,比如居住地、学
历、行业、收入等;用户属性还可以是用户作为互联网产品使用者所具有的特性,比如注册
时长、在线时长等。
[0128] 举例说明,参照图3,图3为一个实施例中决策树模型的训练数据的示意图。以目标策略为用户界面的优化设计方案为例,对第一命中类别的样本对象实施优化设计方案对应
的用户界面,对第二命中类别的样本对象实施传统的用户界面。可以看到,各样本对象对应
的对象画像数据可以是各样本对象的居住地、性别、年龄、注册时长等,各样本对象对应的
对象行为数据可以是各样本对象在所属命中类别对应的用户界面的点击率。
[0129] 在一个实施例中,计算机设备获取各样本对象对应的对象画像数据、对象行为数据以及对应目标策略的命中类别。
[0130] 下面介绍一下发明人的思路:
[0131] 发明人发现,传统的细粒度分析方式大多是先对被测试对象的不同属性的属性值进行组合,将被测试对象划分为不同的细分群体,从测试结果中挖掘各细分群体对应的测
试结果,以获得测试效果好的细分群体。但是,这种细粒度分析方式常常遭遇组合爆炸的问
题,导致计算性能瓶颈,进而导致从测试结果中挖掘细分群体测试结果的效率低。为了提升
从测试结果中挖掘细分群体测试结果的效率,就需要解决组合爆炸的问题,鉴于决策树算
法具有特征选择的特性,发明人想到可基于决策树算法从测试结果中挖掘细分群体对应的
测试结果。
[0132] 其中,决策树算法是机器学习领域中的分类与回归方法。在决策树模型的训练过程中,不断地从训练数据中筛选当前最优特征作为节点,各节点以对应的特征作为分裂标
准,节点的分支表示分裂结果,由此由上至下递归地生成节点,最终训练好的决策树呈树形
结构。由于不断地选择当前最优特征作为节点,能够减少决策树中节点所表示的组合数量,
且能够保证决策树中节点所表示的组合具有局部最优的特性。
[0133] 发明人发现,基于决策树算法分析A/B测试的测试结果存在技术障碍。决策树算法需要样本对象的策略效果作为训练数据,这里的策略效果定义为对样本对象实施目标策略
和未对样本对象实施目标策略时,样本对象的对象行为数据的差异。而由于A/B测试的特
性,无法同时获得对样本对象实施目标策略和未对样本对象实施目标策略时,样本对象的
对象行为数据,也就是说,无法获得样本对象的策略效果。为此,发明人经过大量的研究发
现,样本对象的策略效果可基于样本对象的对象行为数据转换得到,故本申请实施例可先
将样本对象的对象行为数据转换为样本对象的策略效果,再基于决策树算法从测试结果中
挖掘细分群体对应的测试结果。
[0134] 步骤S204,根据与对象画像数据的各画像维度对应的对象行为数据中属于第一命中类别的占比,将与各画像维度对应的对象行为数据转换为对应目标策略的策略效果。
[0135] 其中,画像维度可用于描述对象画像数据所包括的用户属性。继续参照图3,对象画像数据的画像维度可以是居住地、性别、年龄、注册时长等。在另一些实施例中,画像维度
也可用于描述对象画像数据所包括的属性值。继续参照图3,对象画像数据的画像维度可以
是深圳、上海、男性、女性、>20岁、≤20岁、>3年、≤3年等。下面以画像维度用于描述对象
画像数据所包括的用户属性为例,介绍本申请实施例的方案。
[0136] 在一个实施例中,每个画像维度可划分为多于一个维度属性,维度属性用于描述各样本对象在画像维度下的属性值,以画像维度为性别为例,性别所包括的维度属性为男
性和女性。对于具有连续属性的画像维度,比如年龄、注册时长、居住地(比如居住地包括深
圳、上海、武汉、长沙等多个城市)等,计算机设备可基于通用的离散化策略确定至少一个划
分点,根据至少一个划分点生成画像维度的维度属性。通用的离散化策略比如二分法等。以
年龄为例,年龄所包括的维度属性可以是>20岁、≤20岁;以居住地为例,居住地所包括的
维度属性可以是二线以上城市、二线及以下城市。
[0137] 在一个实施例中,计算机设备对各样本对象对应的对象画像数据进行分类,得到各画像维度及属于各画像维度的维度属性;对各样本对象对应的对象行为数据按维度属性
进行归类,得到对应各维度属性的对象行为数据;根据属于相同画像维度的维度属性所对
应的对象行为数据,获得各画像维度对应的对象行为数据。
[0138] 在一个实施例中,画像维度对应的对象行为数据,可以是画像维度所包括的维度属性各自对应的对象行为数据,维度属性对应的对象行为数据,可以是满足维度属性的样
本对象的对象行为数据。
[0139] 继续参照图3,计算机设备对各样本对象对应的对象画像数据进行分类,得到居住地、性别、年龄、注册时长等画像维度,以及属于居住地的维度属性深圳、上海,属于性别的
维度属性女性和男性,属于年龄的维度属性>20岁、≤20岁,属于注册时长的维度属性>3
年、≤3年。计算机设备对各样本对象对应的对象行为数据按维度属性进行归类,以居住地
为例,居住地所包括的维度属性为深圳、上海,深圳对应的对象行为数据是对象1、对象2和
对象5的点击率,上海对应的对象行为数据是对象3和对象4的点击率,居住地对应的对象行
为数据是对象1、对象2、对象3、对象4和对象5的点击率。
[0140] 在一个实施例中,画像维度对应目标策略的策略效果,可由画像维度所包括的维度属性对应目标策略的策略效果计算得到,维度属性对应目标策略的策略效果,可由满足
维度属性的样本对象的策略效果计算得到。继续参照图3,以居住地为例,居住地对应的策
略效果,可由深圳和上海各自对应的策略效果计算得到,深圳对应的策略效果,可由对象1、
对象2和对象5的策略效果计算得到。
[0141] 在一个实施例中,步骤S204包括:对于每个画像维度,确定画像维度所包括的维度属性;对于每个维度属性,确定维度属性对应的对象行为数据中属于第一命中类别的占比,
根据占比将维度属性对应的对象行为数据转换为维度属性对应的策略效果;根据画像维度
包括的所有维度属性各自对应的策略效果,计算画像维度对应目标策略的策略效果。
[0142] 在一个实施例中,计算机设备获取画像维度包括的所有维度属性,根据各维度属性分别对应的对象行为数据中属于第一命中类别的占比,将各维度属性对应的对象行为数
据转换为对应目标策略的策略效果,根据画像维度包括的所有维度属性分别对应目标策略
的策略效果,计算画像维度对应目标策略的策略效果。
[0143] 在一个实施例中,对于每个维度属性,计算机设备确定维度属性对应的对象行为数据中属于第一命中类别的占比,根据占比将满足维度属性的样本对象的对象行为数据,
转换为样本对象对应目标策略的策略效果,基于满足维度属性的样本对象的策略效果,获
得维度属性对应的策略效果。
[0144] 在一个实施例中,计算机设备根据样本对象的对象行为数据,以及样本对象所属的维度属性对应的对象行为数据中属于第一命中类别的占比,计算样本对象对应目标策略
的策略效果。关于样本对象的策略效果的具体计算方式,可参照后续实施例,在此不再赘
述。
[0145] 举例说明,参照图4(a),图4(a)为一个实施例中计算画像维度对应的策略效果的流程示意图。以画像维度为居住地为例,对于居住地在深圳的对象1、对象2和对象5,计算机
设备根据对象1、对象2和对象5的对象行为数据中属于第一命中类别的占比,以及对象1、对
象2和对象5的对象行为数据,计算得到对象1、对象2和对象5的策略效果,根据对象1、对象2
和对象5的策略效果,计算得到深圳对应的策略效果;同理,计算机设备根据对象3和对象4
的策略效果,计算得到上海对应的策略效果;计算机设备根据深圳对应的策略效果以及上
海对应的策略效果,计算得到居住地对应的策略效果。
[0146] 关于画像维度对应目标策略的策略效果的计算方式,可采用以下步骤:
[0147] 在一个实施例中,计算机设备根据画像维度包括的所有维度属性各自对应的策略效果,计算画像维度对应的策略效果,计算方式可以是对画像维度包括的所有维度属性各
自对应的策略效果求和或者求均值等。在该种求解方式中,计算机设备根据满足维度属性
的样本对象的策略效果,计算维度属性对应的策略效果,计算方式可以是对满足维度属性
的样本对象的策略效果求和或者求均值等。在该种求解方式中,画像维度对应的策略效果,
可用于反映画像维度对应的样本对象的整体策略效果。为了方便介绍,在后续实施例中将
该种求解方式称为第一种求解方式。
[0148] 在一个实施例中,计算机设备根据画像维度包括的各维度属性各自对应的策略效果以及各维度属性对应的每个样本对象的策略效果,对各维度属性对应的样本对象的策略
效果求均方误差;对画像维度包括的所有维度属性各自对应的均方误差求和或者求均值
等,获得画像维度对应目标策略的策略效果。在该种求解方式中,计算机设备对满足维度属
性的样本对象的策略效果求均值,得到维度属性对应的策略效果。为了方便介绍,在后续实
施例中将该种求解方式称为第二种求解方式。
[0149] 举例说明,参照图4(b),图4(b)为另一个实施例中计算画像维度对应的策略效果的流程示意图。以画像维度为居住地为例,对于居住地在深圳的对象1、对象2和对象5,计算
机设备对对象1、对象2和对象5的策略效果求均值,计算得到深圳对应的策略效果;同理,计
算机设备对对象3和对象4的策略效果求均值,计算得到上海对应的策略效果;计算机设备
根据深圳对应的策略效果以及对象1、对象2和对象5的策略效果,对对象1、对象2和对象5的
策略效果求均方误差,并根据上海对应的策略效果以及对象3和对象4的策略效果,对对象3
和对象4的策略效果求均方误差;计算机设备对深圳和上海各自对应的均方误差求和,获得
居住地对应的策略效果。
[0150] 继续参照图4(b),以深圳为例,深圳对应的均方误差的求解方式可以是:计算机设备对对象1、对象2和对象5的策略效果求均值,根据对象1的策略效果与均值之差、对象2的
策略效果与均值之差、对象5的策略效果与均值之差的平方和,获得深圳对应的均方误差。
在第二种求解方式中,画像维度对应的策略效果,可用于反映以画像维度作为分裂标准分
裂后,每个维度属性对应的样本对象的策略效果的分布离散程度。
[0151] 步骤S206,将与各画像维度对应的策略效果输入决策树模型,以决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标,对决策树模型进行训练,得到群
体划分决策树。
[0152] 其中,画像维度组合可以是多于一个画像维度的组合,比如“年龄‑居住地”;画像维度组合也可以是多于一个维度属性的组合,比如“20岁以上‑深圳”;画像维度组合还可以
是画像维度与维度属性的组合,比如“20岁以上‑居住地”。下面以画像维度组合为画像维度
与维度属性的组合,介绍本申请实施例的方案。
[0153] 在群体划分决策树中,群体划分决策树包括根节点、子节点和叶子节点三种类型的节点,根节点是群体划分决策树的起始节点,子节点是群体划分决策树的中间节点,叶子
节点是群体划分决策树的末尾节点,叶子节点不具备分裂特性。参照图5,图5为一个实施例
中群体划分决策树的示意图,其中节点502为根节点,节点504、节点506均为子节点,节点
508、节点510均为叶子节点。
[0154] 在一个实施例中,计算机设备将与各画像维度对应的策略效果输入决策树模型,根据各画像维度对应目标策略的策略效果,确定作为根节点的画像维度。继续参照图5,可
以看到,根节点以对应的画像维度作为分裂标准,根节点的分支表示维度属性,根节点的分
支同时也作为与其它节点相连的桥梁。接着,计算机设备以决策树模型中节点所表示的画
像维度组合对应的策略效果最优化作为筛选标准,不断地从剩余的画像维度中筛选画像维
度作为子节点。继续参照图5,可以看到,子节点以对应的画像维度作为分裂标准,子节点的
分支表示维度属性,子节点的分支同时也作为与其它节点相连的桥梁。由此由上至下递归
地生成节点,最终训练好的群体划分决策树呈树形结构。
[0155] 在一个实施例中,计算机设备可根据决策树模型中各节点所构成的群体划分路径,确定各节点所表示的画像维度组合。群体划分路径包括多于一个节点以及节点之间的
分支。继续参照图5,节点502与节点506所构成的群体划分路径为:节点502‑年龄>20岁‑节
点504‑居住地为上海‑节点506。
[0156] 在一个实施例中,计算机设备可根据决策树模型中各节点所构成的群体划分路径涵盖的维度属性,以及群体划分路径的末尾节点表示的画像维度,确定各节点所表示的画
像维度组合。继续参照图5,节点502与节点506所构成的群体划分路径所涵盖的维度属性包
括:“年龄>20岁”、“居住地为上海”,节点502与节点506所构成的群体划分路径的末尾节点
表示的画像维度为“性别”,节点502与节点506所表示的画像维度组合为:“年龄>20岁‑居
住地为上海‑性别”。
[0157] 在一个实施例中,计算机设备以决策树模型中节点所表示的画像维度组合对应的策略效果最优化作为筛选标准,从剩余的画像维度中选取画像维度作为节点。关于策略效
果最优化的原理,可参照后续实施例,在此不再赘述。继续参照图5,以生成节点506为例,节
点502与节点506所表示的画像维度组合为:“年龄>20岁‑居住地为上海‑X”,X的取值可为
“注册时长”或者“性别”。计算机设备根据画像维度组合“年龄>20岁‑居住地为上海‑性别”
和“年龄>20岁‑居住地为上海‑注册时长”各自对应的策略效果,以画像维度组合对应的策
略效果最优化作为筛选标准,选取“性别”或者“注册时长”作为节点506。
[0158] 在决策树模型的训练过程中,计算机设备先生成决策树模型的根节点,接着生成与根节点相连的第一子节点,根节点与第一子节点通过根节点的分支相连接,再生成与第
一子节点相连的第二子节点,第一子节点与第二子节点通过第一子节点的分支相连接,就
这样不断地生成决策树模型的子节点,直至生成决策树模型的叶子节点。
[0159] 下面介绍根节点的生成方式:
[0160] 在一个实施例中,计算机设备将与各画像维度对应的策略效果输入决策树模型,根据各画像维度对应目标策略的策略效果,确定决策树模型的根节点。
[0161] 在一个实施例中,计算机设备以根节点所表示的画像维度对应的策略效果最优化作为筛选标准,从各画像维度中选取根节点。
[0162] 在一个实施例中,计算机设备将各画像维度对应的策略效果中,最优策略效果对应的画像维度作为根节点。本实施例中,计算机设备可采用上述第一种求解方式计算画像
维度对应的策略效果。由于在第一种求解方式中,画像维度对应的策略效果,可用于反映画
像维度对应的样本对象的整体策略效果,选取最优策略效果对应的画像维度作为根节点,
使得根节点以该画像维度作为分裂标准分裂后,各维度属性对应的样本对象的策略效果最
优,有利于快速查找策略效果较优的细分群体。
[0163] 在一个实施例中,计算机设备将各画像维度对应的策略效果中,策略效果最小值对应的画像维度作为根节点。本实施例中,计算机设备可采用上述第二种求解方式计算画
像维度对应的策略效果。由于在第二种求解方式中,画像维度对应的策略效果,可用于反映
以画像维度作为分裂标准分裂后,每个维度属性对应的样本对象的策略效果的分布离散程
度,选取策略效果最小值对应的画像维度作为根节点,使得根节点以该画像维度作为分裂
标准分裂后,对于每个维度属性来说,该维度属性对应的样本对象的策略效果的分布离散
程度最小,也即是该维度属性对应的样本对象的策略效果最为接近,分裂效果最好,有利于
快速挖掘各细分群体对应的策略效果。
[0164] 在一个实施例中,计算机设备迭代地确定当前决策树模型中从根节点到末尾子节点构成的画像维度组合,将当前确定的画像维度组合与各剩余画像维度构成的各候选画像
维度组合分别对应的对象行为数据转换为相应策略效果,并根据各策略效果从各剩余画像
维度中确定以末尾子节点为父节点的子节点后,获得更新的决策树模型;基于停止迭代时
的决策树模型,获得群体划分决策树。
[0165] 其中,末尾子节点是决策树模型训练时新生成的、当前处于决策树模型末尾的子节点,并非特指某一个子节点。在决策树模型的训练过程中,计算机设备先生成决策树模型
的根节点,接着生成与根节点相连接的第一子节点,接着生成与第一子节点相连接的第二
子节点,此时第一子节点为第二子节点的父节点,就这样不断地生成决策树模型的子节点,
直至生成决策树模型的叶子节点。末尾子节点用于指代决策树模型训练时不断生成的各个
子节点。
[0166] 在决策树模型的训练过程中,计算机设备不断生成决策树模型的子节点,每新生成一个子节点,即确定一个由根节点与新生成的子节点所构成的画像维度组合。对于当前
确定的画像维度组合,其对应的剩余画像维度,是除了由根节点与新生成的子节点所构成
的群体划分路径中包含的画像维度以外的其它画像维度。继续参照图5,以当前确定的画像
维度组合为“20岁以上‑居住地”为例,其对应的剩余画像维度为:“注册时长”和“性别”。
[0167] 可以理解,对于具有连续属性的画像维度,比如年龄、注册时长等,若选取不同的划分点,则可作为不同的画像维度参与决策树模型的训练过程,比如图5中的“年龄(>20
岁、≤20岁)”、“年龄(>10岁、≤10岁)”。
[0168] 在一个实施例中,当全部的画像维度均筛选作为决策树模型的节点时,停止迭代。在另一些实施例中,当决策树模型的每条群体划分路径均包括全部的画像维度时,停止迭
代。
[0169] 下面以生成第一子节点为例,介绍子节点的生成方式:
[0170] 在一个实施例中,计算机设备获取根节点表示的画像维度与各剩余画像维度构成的各候选画像维度组合分别对应的对象行为数据,将各候选画像维度组合分别对应的对象
行为数据转换为各候选画像维度组合对应的策略效果,根据各候选画像维度组合对应的策
略效果,从各剩余画像维度中确定与根节点相连的子节点。
[0171] 其中,根节点对应的剩余画像维度,是除了根节点表示的画像维度以外的其它画像维度。
[0172] 在一个实施例中,由于根节点可分裂为多于一个分支,对于根节点的每个分支,计算机设备获取该分支表示的维度属性与根节点对应的剩余画像维度构成的各候选画像维
度组合,根据各候选画像维度组合对应的策略效果,从剩余画像维度中确定与根节点通过
该分支相连的子节点。
[0173] 在一个实施例中,每个画像维度组合可包括多于一个维度组合属性,维度组合属性是多于一个维度属性的组合。继续参照图3,画像维度组合“20岁以上‑居住地”所包括的
维度组合属性可以是:“20岁以上‑深圳”、“20岁以上‑上海”等。由此可见,维度组合属性可
用于描述满足多于一个维度属性的细分群体。
[0174] 在一个实施例中,候选画像维度组合对应目标策略的策略效果,可由候选画像维度组合所包括的维度组合属性对应目标策略的策略效果计算得到,维度组合属性对应目标
策略的策略效果,可由满足维度组合属性的样本对象的策略效果计算得到。继续参照图3,
候选画像维度组合“20岁以上‑居住地”对应的策略效果,可由“20岁以上‑深圳”和“20岁以
上‑上海”各自对应的策略效果计算得到,“20岁以上‑深圳”对应的策略效果,可由对象1和
对象5的策略效果计算得到。
[0175] 在一个实施例中,计算机设备根据各候选画像维度组合对应的对象行为数据中属于第一命中类别的占比,将各候选画像维度组合对应的对象行为数据转换为各候选画像维
度组合对应的策略效果。
[0176] 在一个实施例中,候选画像维度组合对应的对象行为数据,可以是候选画像维度组合所包括的维度组合属性各自对应的对象行为数据,维度组合属性对应的对象行为数
据,可以是满足维度组合属性的样本对象的对象行为数据。继续参照图3,“20岁以上‑深圳”
对应的对象行为数据是对象1和对象5的点击率,“20岁以上‑上海”对应的对象行为数据是
对象3和对象4的点击率,候选画像维度组合“20岁以上‑居住地”对应的对象行为数据是对
象1、对象3、对象4和对象5的点击率。
[0177] 在一个实施例中,对于每个候选画像维度组合,确定候选画像维度组合所包括的维度组合属性;对于每个维度组合属性,确定维度组合属性对应的对象行为数据中属于第
一命中类别的占比,根据占比将维度组合属性对应的对象行为数据转换为维度组合属性对
应的策略效果;根据候选画像维度组合包括的所有维度组合属性各自对应的策略效果,计
算候选画像维度组合对应目标策略的策略效果。
[0178] 在一个实施例中,计算机设备获取候选画像维度组合包括的所有维度组合属性,根据各维度组合属性分别对应的对象行为数据中属于第一命中类别的占比,将各维度组合
属性对应的对象行为数据转换为对应目标策略的策略效果,根据候选画像维度组合包括的
所有维度组合属性分别对应目标策略的策略效果,计算候选画像维度组合对应目标策略的
策略效果。
[0179] 在一个实施例中,对于每个维度组合属性,计算机设备确定维度组合属性对应的对象行为数据中属于第一命中类别的占比,根据占比将满足维度组合属性的样本对象的对
象行为数据,转换为样本对象对应目标策略的策略效果,基于满足维度组合属性的样本对
象的策略效果,获得维度组合属性对应的策略效果。
[0180] 在一个实施例中,计算机设备根据样本对象的对象行为数据,以及样本对象所属的维度组合属性对应的对象行为数据中属于第一命中类别的占比,计算样本对象对应目标
策略的策略效果。关于样本对象的策略效果的具体计算方式,可参照后续实施例,在此不再
赘述。
[0181] 举例说明,参照图6(a),图6(a)为一个实施例中计算候选画像维度组合对应的策略效果的流程示意图。以候选画像维度组合为“20岁以上‑居住地”为例,对于20岁以上且居
住地在深圳的对象1和对象5,计算机设备根据对象1和对象5的对象行为数据中属于第一命
中类别的占比,以及对象1和对象5的对象行为数据,计算得到对象1和对象5的策略效果,根
据对象1和对象5的策略效果,计算得到“20岁以上‑深圳”对应的策略效果;同理,计算机设
备根据对象3和对象4的策略效果,计算得到“20岁以上‑上海”对应的策略效果;计算机设备
根据“20岁以上‑深圳”对应的策略效果以及“20岁以上‑上海”对应的策略效果,计算得到
“20岁以上‑居住地”对应的策略效果。
[0182] 关于候选画像维度组合对应目标策略的策略效果的计算方式,可采用以下步骤:
[0183] 在一个实施例中,计算机设备根据候选画像维度组合包括的所有维度组合属性各自对应的策略效果,计算候选画像维度组合对应的策略效果,计算方式可以是对候选画像
维度组合包括的所有维度组合属性各自对应的策略效果求和或者求均值等。在该种求解方
式中,计算机设备根据满足维度组合属性的样本对象的策略效果,计算维度组合属性对应
的策略效果,计算方式可以是对满足维度组合属性的样本对象的策略效果求和或者求均值
等。在该种求解方式中,候选画像维度组合对应的策略效果,可用于反映候选画像维度组合
对应的样本对象的整体策略效果。为了方便介绍,在后续实施例中将该种求解方式称为第
三种求解方式。
[0184] 在一个实施例中,计算机设备对归类至维度组合属性的每个样本对象的策略效果求均方误差;对候选画像维度组合包括的所有维度组合属性各自对应的均方误差求和或者
求均值等,获得候选画像维度组合对应目标策略的策略效果。在该种求解方式中,计算机设
备对满足维度组合属性的样本对象的策略效果求均值,得到维度组合属性对应的策略效
果。为了方便介绍,在后续实施例中将该种求解方式称为第四种求解方式。
[0185] 举例说明,参照图6(b),图6(b)为另一个实施例中计算候选画像维度组合对应的策略效果的流程示意图。以候选画像维度组合为“20岁以上‑居住地”为例,对于20岁以上且
居住地在深圳的对象1和对象5,计算机设备对对象1和对象5的策略效果求均值,计算得到
“20岁以上‑深圳”对应的策略效果;同理,计算机设备对对象3和对象4的策略效果求均值,
计算得到“20岁以上‑上海”对应的策略效果;计算机设备根据“20岁以上‑深圳”对应的策略
效果以及对象1和对象5的策略效果,对对象1和对象5的策略效果求均方误差,并根据“20岁
以上‑上海”对应的策略效果以及对象3和对象4的策略效果,对对象3和对象4的策略效果求
均方误差;计算机设备对“20岁以上‑深圳”和“20岁以上‑上海”各自对应的均方误差求和,
获得“20岁以上‑居住地”对应的策略效果。
[0186] 继续参照图6(b),以“20岁以上‑深圳”为例,“20岁以上‑深圳”对应的均方误差的求解方式可以是:计算机设备对对象1和对象5的策略效果求均值,根据对象1的策略效果与
均值之差、对象5的策略效果与均值之差的平方和,获得“20岁以上‑深圳”对应的均方误差。
在第四种求解方式中,候选画像维度组合对应的策略效果,可用于反映以候选画像维度组
合包含的画像维度作为分裂标准分裂后,对于每个维度组合属性来说,该维度组合属性对
应的样本对象的策略效果的分布离散程度。
[0187] 在一个实施例中,计算机设备以根节点与第一子节点所表示的画像维度组合对应的策略效果最优化作为筛选标准,从各剩余画像维度中选取第一子节点。
[0188] 在一个实施例中,计算机设备将各候选画像维度组合对应的策略效果中,最优策略效果的候选画像维度组合包含的画像维度作为第一子节点。本实施例中,计算机设备可
采用上述第三种求解方式计算候选画像维度组合对应的策略效果。由于在第三种求解方式
中,候选画像维度组合对应的策略效果,可用于反映候选画像维度组合对应的样本对象的
整体策略效果,选取最优策略效果的候选画像维度组合包含的画像维度作为第一子节点,
使得第一子节点以该画像维度作为分裂标准分裂后,各维度组合属性对应的样本对象的策
略效果最优,有利于快速查找策略效果较优的细分群体。
[0189] 在一个实施例中,计算机设备确定各候选画像维度组合对应的策略效果中,策略效果最小值对应的画像维度组合;将构成策略效果最小值对应的画像维度组合的剩余画像
维度,作为决策树模型中以末尾子节点为父节点的子节点。计算机设备将各候选画像维度
组合对应的策略效果中,策略效果最小值对应的候选画像维度组合包含的画像维度作为第
一子节点。本实施例中,计算机设备可采用上述第四种求解方式计算候选画像维度组合对
应的策略效果。由于在第四种求解方式中,候选画像维度组合对应的策略效果,可用于反映
以候选画像维度组合包含的画像维度作为分裂标准分裂后,每个维度组合属性对应的样本
对象的策略效果的分布离散程度,选取策略效果最小值对应的候选画像维度组合包含的画
像维度作为第一子节点,使得第一子节点以该画像维度作为分裂标准分裂后,每个维度组
合属性对应的样本对象的策略效果的分布离散程度最小,也即是维度组合属性对应的样本
对象的策略效果最为接近,分裂效果最好,有利于快速挖掘各细分群体对应的策略效果。
[0190] 步骤S208,基于从群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,确定对应目标策略的较优细分群体。
[0191] 其中,维度组合属性可用于描述满足多于一个维度属性的细分群体。在一个实施例中,计算机设备可根据群体划分决策树中各节点所构成的群体划分路径涵盖的维度属
性,确定各节点所表示的细分群体。继续参照图5,节点502与节点506所构成的群体划分路
径所涵盖的维度属性包括:“年龄>20岁”、“居住地为上海”,节点502与节点506所表示的细
分群体为:“上海20岁以上的对象”。
[0192] 如前所述,在决策树模型的训练过程中,计算各节点所表示的细分群体的策略效果。在一个实施例中,群体划分决策树中各节点对应有策略效果,其中,根节点对应的策略
效果,可用于描述所有样本对象的策略效果;群体划分决策树中除根节点以外的其它节点
对应的策略效果,可用于描述以该节点作为末尾节点的群体划分路径所描述的细分群体的
策略效果。继续参照图5,节点506对应的策略效果,用于表示节点502、节点504与节点506构
成的群体划分路径所描述的细分群体的策略效果,也即是“上海20岁以上的对象”的策略效
果。
[0193] 在一个实施例中,计算机设备基于停止迭代时群体划分决策树中从根节点到叶子节点所表示的各细分群体分别对应的策略效果,将大于阈值的策略效果所对应的细分群
体,作为较优细分群体。其中,阈值以及较优细分群体的数量可根据实际应用进行设定,本
申请不做具体限定。继续参照图5,可以看到,节点510对应的策略效果最优,节点502与节点
510所表示的细分群体为:“10岁及以上且20岁以下的女性对象”,也就是说,对应目标策略
的最优策略效果的细分群体为“10岁及以上且20岁以下的女性对象”。
[0194] 上述对象数据处理方法中,一方面,根据与对象画像数据的各画像维度对应的对象行为数据中属于第一命中类别的占比,将与各画像维度对应的对象行为数据转换为对应
目标策略的策略效果,解决了在A/B测试场景下无法获取样本对象的策略效果的问题,使得
本申请实施例可基于决策树算法从测试结果中挖掘细分群体的策略结果;另一方面,将与
各画像维度对应的策略效果输入决策树模型,以决策树模型中节点所表示的画像维度组合
对应的策略效果最优化为目标,对决策树模型进行训练得到群体划分决策树,基于从群体
划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,即可确定对应
目标策略的较优细分群体,由于以决策树模型中节点所表示的画像维度组合对应的策略效
果最优化为目标训练决策树模型,能够减少画像维度组合数量,且能够保证群体划分决策
树中节点所表示的画像维度组合具有局部最优的特性,从而避免传统技术中组合爆炸的问
题,提高从测试结果中挖掘细分群体策略结果的效率。
[0195] 在一个实施例中,参照图7,根据占比将维度属性对应的对象行为数据转换为维度属性对应的策略效果,包括:
[0196] 步骤S702,根据占比确定属于第一命中类别的对象行为数据的第一权重系数,按第一权重系数,将维度属性对应的对象行为数据中属于第一命中类别的样本对象对应的对
象行为数据,转换为样本对象对应的策略效果。
[0197] 发明人发现,样本对象策略效果与对象行为数据之间存在如下转换关系:
[0198]
[0199] 其中, 表示第 个样本对象的策略效果, 表示 个样本对象的平均策略效果; 表示第 个样本对象属于第一命中类别时的对象行为数据, 表示第 个样本对象
属于第二命中类别时的对象行为数据;当样本对象属于第一命中类别时, 取值为1,当样
本对象属于第二命中类别时, 取值为0; 表示画像维度, 表示画像维度的第 个维
度属性; 表示第 个维度属性对应的对象行为数据中属于第一命中类别的占比。
[0200] 在一个实施例中,属于第一命中类别的样本对象对应的策略效果通过以下公式计算得到:
[0201]
[0202] 其中, 表示属于第一命中类别的第 个样本对象对应的策略效果; 表示画像维度, 表示画像维度的第 个维度属性; 表示第 个维度属性对应的对象行为
数据中属于第一命中类别的占比; 表示属于第一命中类别的第 个样本对象的对象行
为数据;
[0203] 在一个实施例中,属于第二命中类别的样本对象对应的策略效果通过以下公式计算得到:
[0204]
[0205] 其中, 表示属于第二命中类别的第 个样本对象对应的策略效果; 表示画像维度, 表示画像维度的第 个维度属性; 表示第 个维度属性对应的对象行为数
据中属于第一命中类别的占比; 表示属于第二命中类别的第 个样本对象的对象行为数
据步骤S704,根据占比确定属于第二命中类别的对象行为数据的第二权重系数,按第二权
重系数,将维度属性对应的对象行为数据中属于第二命中类别的样本对象对应的对象行为
数据,转换为样本对象对应的策略效果。
[0206] 步骤S706,对维度属性对应的每个样本对象的策略效果求平均值,获得维度属性对应的策略效果。
[0207] 本实施例中,根据样本对象的对象行为数据,以及样本对象所属的维度属性对应的对象行为数据中属于第一命中类别的占比,计算样本对象对应目标策略的策略效果,解
决了在AB测试场景下无法获取样本对象的策略效果的问题,使得本申请实施例可基于决策
树算法从测试结果中挖掘细分群体的策略结果。
[0208] 在一个实施例中,将当前确定的画像维度组合与各剩余画像维度构成的各候选画像维度组合分别对应的对象行为数据转换为相应策略效果,包括:分别确定各候选画像维
度组合所包括的维度组合属性;对样本对象对应的对象行为数据按维度组合属性进行归
类,得到各维度组合属性分别对应的对象行为数据;根据属于相同候选画像维度组合的维
度组合属性所对应的对象行为数据,获得各候选画像维度组合对应的对象行为数据;根据
各候选画像维度组合对应的对象行为数据中属于第一命中类别的占比,将与各候选画像维
度组合对应的对象行为数据转换为对应目标策略的策略效果。
[0209] 下面以生成第二子节点为例,简要介绍子节点的生成方式:
[0210] 在一个实施例中,由于第一子节点可分裂为多于一个分支,对于第一子节点的每个分支,计算机设备获取该分支表示的维度组合属性与第一子节点对应的剩余画像维度构
成的各候选画像维度组合,根据各候选画像维度组合对应的策略效果,从剩余画像维度中
确定与第一子节点通过该分支相连的子节点。
[0211] 在一个实施例中,每个画像维度组合可包括多于一个维度组合属性,维度组合属性是多于一个维度属性的组合。继续参照图3,画像维度组合“20岁以上‑上海‑性别”所包括
的维度组合属性可以是:“20岁以上‑上海‑男性”、“20岁以上‑上海‑女性”等。
[0212] 在一个实施例中,候选画像维度组合对应目标策略的策略效果,可由候选画像维度组合所包括的维度组合属性对应目标策略的策略效果计算得到,维度组合属性对应目标
策略的策略效果,可由满足维度组合属性的样本对象的策略效果计算得到。继续参照图3,
以当前确定的画像维度组合与剩余画像维度构成的候选画像维度组合为 “20岁以上‑上
海‑性别”为例,“20岁以上‑上海‑性别”对应的策略效果,可由“20岁以上‑上海‑男性”和“20
岁以上‑上海‑女性”各自对应的策略效果计算得到,“20岁以上‑上海‑男性”对应的策略效
果,可由对象4的策略效果计算得到。
[0213] 在一个实施例中,计算机设备根据各候选画像维度组合对应的对象行为数据中属于第一命中类别的占比,将各候选画像维度组合对应的对象行为数据转换为各候选画像维
度组合对应的策略效果。
[0214] 在一个实施例中,候选画像维度组合对应的对象行为数据,可以是候选画像维度组合所包括的维度组合属性各自对应的对象行为数据,维度组合属性对应的对象行为数
据,可以是满足维度组合属性的样本对象的对象行为数据。继续参照图3,“20岁以上‑上海‑
男性”对应的对象行为数据是对象4的点击率,“20岁以上‑上海‑女性”对应的对象行为数据
是对象3的点击率,候选画像维度组合“20岁以上‑上海‑性别”对应的对象行为数据是对象3
和对象4的点击率。
[0215] 在一个实施例中,对于每个候选画像维度组合,确定候选画像维度组合所包括的维度组合属性;对于每个维度组合属性,确定维度组合属性对应的对象行为数据中属于第
一命中类别的占比,根据占比将维度组合属性对应的对象行为数据转换为维度组合属性对
应的策略效果;根据候选画像维度组合包括的所有维度组合属性各自对应的策略效果,计
算候选画像维度组合对应目标策略的策略效果。
[0216] 在一个实施例中,计算机设备获取候选画像维度组合包括的所有维度组合属性,根据各维度组合属性分别对应的对象行为数据中属于第一命中类别的占比,将各维度组合
属性对应的对象行为数据转换为对应目标策略的策略效果,根据候选画像维度组合包括的
所有维度组合属性分别对应目标策略的策略效果,计算候选画像维度组合对应目标策略的
策略效果。
[0217] 在一个实施例中,对于每个维度组合属性,计算机设备确定维度组合属性对应的对象行为数据中属于第一命中类别的占比,根据占比将满足维度组合属性的样本对象的对
象行为数据,转换为样本对象对应目标策略的策略效果,基于满足维度组合属性的样本对
象的策略效果,获得维度组合属性对应的策略效果。
[0218] 在一个实施例中,计算机设备根据样本对象的对象行为数据,以及样本对象所属的维度组合属性对应的对象行为数据中属于第一命中类别的占比,计算样本对象对应目标
策略的策略效果。
[0219] 关于候选画像维度组合对应目标策略的策略效果的计算方式,可采用上述第三种求解方式或者第四种求解方式,在此不再赘述。在采用上述第三种求解方式时,计算机设备
将各候选画像维度组合对应的策略效果中,最优策略效果的候选画像维度组合包含的画像
维度作为第二子节点。在采用上述第四种求解方式时,计算机设备确定各候选画像维度组
合对应的策略效果中,策略效果最小值对应的画像维度组合;将构成策略效果最小值对应
的画像维度组合的剩余画像维度作为第二子节点。
[0220] 在一个实施例中,根据占比将维度组合属性对应的对象行为数据转换为维度组合属性对应的策略效果,包括:根据占比确定属于第一命中类别的对象行为数据的第一权重
系数;根据占比确定属于第二命中类别的对象行为数据的第二权重系数;按第一权重系数,
将维度组合属性对应的对象行为数据中属于第一命中类别的样本对象对应的对象行为数
据,转换为样本对象对应的策略效果;按第二权重系数,将维度组合属性对应的对象行为数
据中属于第二命中类别的样本对象对应的对象行为数据,转换为样本对象对应的策略效
果;对维度组合属性对应的每个样本对象的策略效果求平均值,获得维度组合属性对应的
策略效果。
[0221] 关于将维度组合属性对应的对象行为数据转换为维度组合属性对应的策略效果的具体实施方式,可参照上述将维度属性对应的对象行为数据转换为维度属性对应的策略
效果的实施例,在此不再赘述。
[0222] 本实施例中,将各候选画像维度组合分别对应的对象行为数据转换为相应策略效果,解决了在AB测试场景下无法获取样本对象的策略效果的问题,使得本申请实施例可基
于决策树算法从测试结果中挖掘细分群体的策略结果。
[0223] 在一个实施例中,该方法还包括:在更新决策树模型时,确定决策树模型中从根节点到子节点构成的画像维度组合对应的样本对象数量;修剪样本对象数量小于预设阈值的
子节点。
[0224] 本实施例中,在决策树模型的训练过程中,计算机设备确定从根节点到子节点构成的画像维度组合对应的样本对象数量,若样本对象数量小于预设阈值,则修剪该子节点,
以消除由于样本对象数量少导致的数据不置信问题。
[0225] 在一个实施例中,该方法还包括:获得群体划分决策树后,从根节点开始遍历群体划分决策树;当从根节点到当前遍历到的节点所构成的画像维度组合所对应的样本对象数
量小于预设阈值时,从群体划分决策树修剪当前遍历到的节点。
[0226] 本实施例中,获得群体划分决策树后,计算机设备从根节点开始遍历群体划分决策树,当从根节点到当前遍历到的节点所构成的画像维度组合所对应的样本对象数量小于
预设阈值时,则修剪当前遍历到的节点,以消除由于样本对象数量少导致的数据不置信问
题。
[0227] 在一个实施例中,该方法还包括:获取与各对象标识对应的对象画像数据;根据对象画像数据确定与较优细分群体匹配的目标对象标识;对以目标对象标识登录的目标应用
程序实施目标策略。
[0228] 其中,对象标识用于唯一标识对象。
[0229] 本申请实施例可应用于互联网产品上线场景,具体是对互联网产品上线场景中所采用的A/B测试的测试结果进行细粒度分析,从测试结果中挖掘测试效果好的细分群体,以
对测试效果好的细分群体上线A/B测试的测试内容。比如,测试内容可以是针对互联网产品
提出的新方案或者优化方案,从测试结果中挖掘测试效果好的细分群体,以对测试效果好
的细分群体针对性上线新方案或者优化方案。
[0230] 具体地,计算机设备获取与各对象标识对应的对象画像数据,根据对象画像数据确定与较优细分群体匹配的目标对象标识,对以目标对象标识登录的目标应用程序实施目
标策略。
[0231] 本实施例中,从测试结果中挖掘测试效果好的细分群体,以对测试效果好的细分群体针对性上线新方案或者优化方案,提高信息转化效率。
[0232] 在一个实施例中,如图8所示,提供了一种对象数据处理方法,本实施例主要以该方法应用于计算机设备(上述图1中的终端102或服务器104)来举例说明,包括以下步骤:
[0233] 步骤S802,获取各样本对象对应的对象画像数据、对象行为数据以及对应目标策略的命中类别,命中类别包括对样本对象实施目标策略的第一命中类别和未对样本对象实
施目标策略的第二命中类别中的一种。
[0234] 步骤S804,对于每个画像维度,确定画像维度所包括的维度属性,对于每个维度属性,确定维度属性对应的对象行为数据中属于第一命中类别的占比,根据占比将维度属性
对应的对象行为数据转换为维度属性对应的策略效果。
[0235] 具体地,计算机设备根据占比确定属于第一命中类别的对象行为数据的第一权重系数;根据占比确定属于第二命中类别的对象行为数据的第二权重系数;按第一权重系数,
将维度属性对应的对象行为数据中属于第一命中类别的样本对象对应的对象行为数据,转
换为样本对象对应的策略效果;按第二权重系数,将维度属性对应的对象行为数据中属于
第二命中类别的样本对象对应的对象行为数据,转换为样本对象对应的策略效果;对维度
属性对应的每个样本对象的策略效果求平均值,获得维度属性对应的策略效果。
[0236] 步骤S806,对维度属性对应的每个样本对象的策略效果求平均值,获得维度属性对应的策略效果根据画像维度包括的各维度属性各自对应的策略效果以及各维度属性对
应的每个样本对象的策略效果,对各维度属性对应的每个样本对象的策略效果求均方误
差,对画像维度包括的所有维度属性各自对应的均方误差求和,获得画像维度对应目标策
略的策略效果。
[0237] 步骤S808,将与各画像维度对应的策略效果输入决策树模型,根据各画像维度对应目标策略的策略效果,确定决策树模型的根节点。
[0238] 步骤S810,确定根节点表示的画像维度与各剩余画像维度构成的各候选画像维度组合分别对应的对象行为数据,按照各候选画像维度组合对应的对象行为数据中属于第一
命中类别的占比,将各候选画像维度组合对应的对象行为数据转换为各候选画像维度组合
对应的策略效果,根据各候选画像维度组合对应的策略效果,从各剩余画像维度中确定与
根节点相连的子节点。
[0239] 步骤S812,迭代地确定当前决策树模型中从根节点到末尾子节点构成的画像维度组合,将当前确定的画像维度组合与各剩余画像维度构成的各候选画像维度组合分别对应
的对象行为数据转换为相应策略效果,并根据各策略效果从各剩余画像维度中确定以末尾
子节点为父节点的子节点后,获得更新的决策树模型,基于停止迭代时的决策树模型,获得
群体划分决策树。
[0240] 在决策树模型的训练过程中,计算机设备先生成决策树模型的根节点,接着生成与根节点相连的第一子节点,根节点与第一子节点通过根节点的分支相连接,再生成与第
一子节点相连的第二子节点,第一子节点与第二子节点通过第一子节点的分支相连接,就
这样不断地生成决策树模型的子节点,直至生成决策树模型的叶子节点。
[0241] 在一个实施例中,计算机设备以决策树模型中节点所表示的画像维度组合对应的策略效果最优化作为筛选标准,从剩余的画像维度中选取画像维度作为节点。
[0242] 在一个实施例中,当全部的画像维度均筛选作为决策树模型的节点时,停止迭代。在另一些实施例中,当决策树模型的每条群体划分路径均包括全部的画像维度时,停止迭
代。
[0243] 具体地,计算机设备分别确定各候选画像维度组合所包括的维度组合属性;对样本对象对应的对象行为数据按维度组合属性进行归类,得到各维度组合属性分别对应的对
象行为数据;根据属于相同候选画像维度组合的维度组合属性所对应的对象行为数据,获
得各候选画像维度组合对应的对象行为数据;根据各候选画像维度组合对应的对象行为数
据中属于第一命中类别的占比,将与各候选画像维度组合对应的对象行为数据转换为对应
目标策略的策略效果。
[0244] 具体地,对于每个候选画像维度组合,计算机设备确定候选画像维度组合所包括的维度组合属性;对于每个维度组合属性,确定维度组合属性对应的对象行为数据中属于
第一命中类别的占比,根据占比将维度组合属性对应的对象行为数据转换为维度组合属性
对应的策略效果;根据候选画像维度组合包括的所有维度组合属性各自对应的策略效果,
计算候选画像维度组合对应目标策略的策略效果。
[0245] 具体地,计算机设备根据占比确定属于第一命中类别的对象行为数据的第一权重系数;根据占比确定属于第二命中类别的对象行为数据的第二权重系数;按第一权重系数,
将维度组合属性对应的对象行为数据中属于第一命中类别的样本对象对应的对象行为数
据,转换为样本对象对应的策略效果;按第二权重系数,将维度组合属性对应的对象行为数
据中属于第二命中类别的样本对象对应的对象行为数据,转换为样本对象对应的策略效
果;对维度组合属性对应的每个样本对象的策略效果求平均值,获得维度组合属性对应的
策略效果。
[0246] 具体地,计算机设备对维度组合属性对应的每个样本对象的策略效果求平均值,获得维度组合属性对应的策略效果;对归类至维度组合属性的每个样本对象的策略效果求
均方误差;对候选画像维度组合包括的所有维度组合属性各自对应的均方误差求和,获得
候选画像维度组合对应目标策略的策略效果。
[0247] 步骤S814,基于从群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,确定对应目标策略的较优细分群体。
[0248] 上述对象数据处理方法,一方面,根据与对象画像数据的各画像维度对应的对象行为数据中属于第一命中类别的占比,将与各画像维度对应的对象行为数据转换为对应目
标策略的策略效果,解决了在A/B测试场景下无法获取样本对象的策略效果的问题,使得本
申请实施例可基于决策树算法从测试结果中挖掘细分群体的策略结果;另一方面,将与各
画像维度对应的策略效果输入决策树模型,以决策树模型中节点所表示的画像维度组合对
应的策略效果最优化为目标,对决策树模型进行训练得到群体划分决策树,基于从群体划
分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,即可确定对应目
标策略的较优细分群体,由于以决策树模型中节点所表示的画像维度组合对应的策略效果
最优化为目标训练决策树模型,能够减少画像维度组合数量,且能够保证群体划分决策树
中节点所表示的画像维度组合具有局部最优的特性,从而避免传统技术中组合爆炸的问
题,提高从测试结果中挖掘细分群体策略结果的效率。
[0249] 应该理解的是,虽然图2、图7‑8的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些
步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2、图7‑8中
的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一
时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依
次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替
地执行。
[0250] 在一个实施例中,如图9所示,提供了一种对象数据处理装置,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:获取模
块902、转换模块904、训练模块906和确定模块908,其中:
[0251] 获取模块902,用于获取各样本对象对应的对象画像数据、对象行为数据以及对应目标策略的命中类别,命中类别包括对样本对象实施目标策略的第一命中类别和未对样本
对象实施目标策略的第二命中类别中的一种;
[0252] 转换模块904,用于根据与对象画像数据的各画像维度对应的对象行为数据中属于第一命中类别的占比,将与各画像维度对应的对象行为数据转换为对应目标策略的策略
效果;
[0253] 训练模块906,用于将与各画像维度对应的策略效果输入决策树模型,以决策树模型中节点所表示的画像维度组合对应的策略效果最优化为目标,对决策树模型进行训练,
得到群体划分决策树;
[0254] 确定模块908,用于基于从群体划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,确定对应目标策略的较优细分群体。
[0255] 在一个实施例中,获取模块902,还用于:对各样本对象对应的对象画像数据进行分类,得到各画像维度及属于各画像维度的维度属性;对各样本对象对应的对象行为数据
按维度属性进行归类,得到对应各维度属性的对象行为数据;根据属于相同画像维度的维
度属性所对应的对象行为数据,获得各画像维度对应的对象行为数据。
[0256] 在一个实施例中,转换模块904,还用于:对于每个画像维度,确定画像维度所包括的维度属性;对于每个维度属性,确定维度属性对应的对象行为数据中属于第一命中类别
的占比,根据占比将维度属性对应的对象行为数据转换为维度属性对应的策略效果;根据
画像维度包括的所有维度属性各自对应的策略效果,计算画像维度对应目标策略的策略效
果。
[0257] 在一个实施例中,转换模块904,还用于:根据占比确定属于第一命中类别的对象行为数据的第一权重系数;根据占比确定属于第二命中类别的对象行为数据的第二权重系
数;按第一权重系数,将维度属性对应的对象行为数据中属于第一命中类别的样本对象对
应的对象行为数据,转换为样本对象对应的策略效果;按第二权重系数,将维度属性对应的
对象行为数据中属于第二命中类别的样本对象对应的对象行为数据,转换为样本对象对应
的策略效果;对维度属性对应的每个样本对象的策略效果求平均值,获得维度属性对应的
策略效果。
[0258] 在一个实施例中,转换模块904,还用于通过以下公式计算属于第一命中类别的样本对象对应的策略效果:
[0259]
[0260] 其中, 表示属于第一命中类别的第 个样本对象对应的策略效果; 表示画像维度, 表示画像维度的第 个维度属性; 表示第 个维度属性对应的对象行为
数据中属于第一命中类别的占比; 表示属于第一命中类别的第 个样本对象的对象行
为数据。
[0261] 转换模块904,还用于通过以下公式计算属于第二命中类别的样本对象对应的策略效果:
[0262]
[0263] 其中, 表示属于第二命中类别的第 个样本对象对应的策略效果; 表示画像维度, 表示画像维度的第 个维度属性; 表示第 个维度属性对应的对象行为数
据中属于第一命中类别的占比; 表示属于第二命中类别的第 个样本对象的对象行为数
据。
[0264] 在一个实施例中,转换模块904,还用于:根据画像维度包括的各维度属性各自对应的策略效果以及各维度属性对应的每个样本对象的策略效果,对各维度属性对应的每个
样本对象的策略效果求均方误差;对画像维度包括的所有维度属性各自对应的均方误差求
和,获得画像维度对应目标策略的策略效果。
[0265] 在一个实施例中,训练模块906,还用于:将与各画像维度对应的策略效果输入决策树模型;根据各画像维度对应目标策略的策略效果,确定决策树模型的根节点;迭代地确
定当前决策树模型中从根节点到末尾子节点构成的画像维度组合,将当前确定的画像维度
组合与各剩余画像维度构成的各候选画像维度组合分别对应的对象行为数据转换为相应
策略效果,并根据各策略效果从各剩余画像维度中确定以末尾子节点为父节点的子节点
后,获得更新的决策树模型;基于停止迭代时的决策树模型,获得群体划分决策树。
[0266] 在一个实施例中,训练模块906,还用于:确定根节点表示的画像维度与各剩余画像维度构成的各候选画像维度组合分别对应的对象行为数据;按照各候选画像维度组合对
应的对象行为数据中属于第一命中类别的占比,将各候选画像维度组合对应的对象行为数
据转换为各候选画像维度组合对应的策略效果;根据各候选画像维度组合对应的策略效
果,从各剩余画像维度中确定与根节点相连的子节点。
[0267] 在一个实施例中,训练模块906,还用于:分别确定各候选画像维度组合所包括的维度组合属性;对样本对象对应的对象行为数据按维度组合属性进行归类,得到各维度组
合属性分别对应的对象行为数据;根据属于相同候选画像维度组合的维度组合属性所对应
的对象行为数据,获得各候选画像维度组合对应的对象行为数据;根据各候选画像维度组
合对应的对象行为数据中属于第一命中类别的占比,将与各候选画像维度组合对应的对象
行为数据转换为对应目标策略的策略效果。
[0268] 在一个实施例中,训练模块906,还用于:对于每个候选画像维度组合,确定候选画像维度组合所包括的维度组合属性;对于每个维度组合属性,确定维度组合属性对应的对
象行为数据中属于第一命中类别的占比,根据占比将维度组合属性对应的对象行为数据转
换为维度组合属性对应的策略效果;根据候选画像维度组合包括的所有维度组合属性各自
对应的策略效果,计算候选画像维度组合对应目标策略的策略效果。
[0269] 在一个实施例中,训练模块906,还用于:根据占比确定属于第一命中类别的对象行为数据的第一权重系数;根据占比确定属于第二命中类别的对象行为数据的第二权重系
数;按第一权重系数,将维度组合属性对应的对象行为数据中属于第一命中类别的样本对
象对应的对象行为数据,转换为样本对象对应的策略效果;按第二权重系数,将维度组合属
性对应的对象行为数据中属于第二命中类别的样本对象对应的对象行为数据,转换为样本
对象对应的策略效果;对维度组合属性对应的每个样本对象的策略效果求平均值,获得维
度组合属性对应的策略效果。
[0270] 在一个实施例中,训练模块906,还用于:对归类至维度组合属性的每个样本对象的策略效果求均方误差;对候选画像维度组合包括的所有维度组合属性各自对应的均方误
差求和,获得候选画像维度组合对应目标策略的策略效果。
[0271] 在一个实施例中,训练模块906,还用于:确定各候选画像维度组合对应的策略效果中,策略效果最小值对应的画像维度组合;将构成策略效果最小值对应的画像维度组合
的剩余画像维度,作为决策树模型中以末尾子节点为父节点的子节点。
[0272] 在一个实施例中,训练模块906,还用于:在更新决策树模型时,确定决策树模型中从根节点到子节点构成的画像维度组合对应的样本对象数量;修剪样本对象数量小于预设
阈值的子节点。
[0273] 在一个实施例中,确定模块908,还用于:基于停止迭代时群体划分决策树中从根节点到叶子节点所表示的各细分群体分别对应的策略效果,将大于阈值的策略效果所对应
的细分群体,作为较优细分群体。
[0274] 在一个实施例中,对象数据处理装置还包括修剪模块,修剪模块,还用于:获得群体划分决策树后,从根节点开始遍历群体划分决策树;当从根节点到当前遍历到的节点所
构成的画像维度组合所对应的样本对象数量小于预设阈值时,从群体划分决策树修剪当前
遍历到的节点。
[0275] 在一个实施例中,对象数据处理装置还包括实施模块,实施模块,还用于:获取与各对象标识对应的对象画像数据;根据对象画像数据确定与较优细分群体匹配的目标对象
标识;对以目标对象标识登录的目标应用程序实施目标策略。
[0276] 关于对象数据处理装置的具体限定可以参见上文中对于对象数据处理方法的限定,在此不再赘述。上述对象数据处理装置中的各个模块可全部或部分通过软件、硬件及其
组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以
以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的
操作。
[0277] 上述对象数据处理装置中,一方面,根据与对象画像数据的各画像维度对应的对象行为数据中属于第一命中类别的占比,将与各画像维度对应的对象行为数据转换为对应
目标策略的策略效果,解决了在AB测试场景下无法获取样本对象的策略效果的问题,使得
本申请实施例可基于决策树算法从测试结果中挖掘细分群体的策略结果;另一方面,将与
各画像维度对应的策略效果输入决策树模型,以决策树模型中节点所表示的画像维度组合
对应的策略效果最优化为目标,对决策树模型进行训练得到群体划分决策树,基于从群体
划分决策树的根节点到叶子节点所表示的各细分群体分别对应的策略效果,即可确定对应
目标策略的较优细分群体,由于以决策树模型中节点所表示的画像维度组合对应的策略效
果最优化为目标训练决策树模型,能够减少画像维度组合数量,且能够保证群体划分决策
树中节点所表示的画像维度组合具有局部最优的特性,从而避免传统技术中组合爆炸的问
题,提高从测试结果中挖掘细分群体策略结果的效率。
[0278] 在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。
其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易
失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该
内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备
的数据库用于存储对象数据处理数据。该计算机设备的网络接口用于与外部的终端通过网
络连接通信。该计算机程序被处理器执行时以实现一种对象数据处理方法。
[0279] 本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设
备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0280] 在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
[0281] 在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
[0282] 在一个实施例中,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备
的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计
算机设备执行上述各方法实施例中的步骤。
[0283] 本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机
可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,
本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可
包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read‑
Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器
(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种
形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存
储器(Dynamic Random Access Memory,DRAM)等。
[0284] 以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛
盾,都应当认为是本说明书记载的范围。
[0285] 以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来
说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护
范围。因此,本申请专利的保护范围应以所附权利要求为准。