数据确定方法、装置、电子设备及存储介质转让专利

申请号 : CN202111245730.4

文献号 : CN113688295B

文献日 : 2022-03-25

本公开关于一种数据确定方法、装置、电子设备及存储介质，其中方法通过获取各排序队列中每个初始搜索结果的转化特征，并根据转化特征确定各排序队列中的候选区间，进而基于决策算法从各候选区间对应的候选搜索结果中确定目标搜索结果，得到对应的目标搜索结果队列。由于本实施例是基于决策算法从各候选区间对应的候选搜索结果中确定目标搜索结果，以得到对应的目标搜索结果队列，从而实现通过在线决策的方式来解决集成排序问题，不仅不依赖于候选搜索结果位于原队列的分数，且能够达到较好的效果。

1.一种数据确定方法，其特征在于，包括：获取各排序队列中每个初始搜索结果的转化特征，所述各排序队列是预先按照不同的业务目标分别对多个初始搜索结果进行排序后得到的与各业务目标一一对应的队列；

根据所述转化特征确定各排序队列中排序中庸的候选区间，所述候选区间包括至少一个候选搜索结果；

基于决策算法从各候选区间对应的候选搜索结果中确定目标搜索结果，得到对应的目标搜索结果队列。

2.根据权利要求1所述的方法，其特征在于，所述获取各排序队列中每个初始搜索结果的转化特征，包括：

获取各排序队列中每个初始搜索结果的历史日志数据，所述历史日志数据包括所述初始搜索结果的历史转化次数和历史展示次数；

根据每个初始搜索结果对应的历史转化次数和历史展示次数，计算得到所述初始搜索结果的转化特征。

3.根据权利要求1所述的方法，其特征在于，所述根据所述转化特征确定各排序队列中的候选区间，包括：

确定所述排序队列中所述转化特征满足设定阈值范围的至少一个候选搜索结果；

将所述至少一个候选搜索结果位于所述排序队列的区间确定为对应的候选区间。

4.根据权利要求1所述的方法，其特征在于，所述目标搜索结果队列具有对应的队列长度；所述基于决策算法从各候选区间对应的候选搜索结果中确定目标搜索结果，得到对应的目标搜索结果队列，包括：

获取所述目标搜索结果队列的队列长度；

基于决策算法从各候选区间对应的候选搜索结果中获取与所述队列长度对应的目标搜索结果，得对应的目标搜索结果队列。

5.根据权利要求4所述的方法，其特征在于，所述基于决策算法从各候选区间对应的候选搜索结果中获取与所述队列长度对应的目标搜索结果，得到对应的目标搜索结果队列，包括：

对于所述目标搜索结果队列中的每一个位置，基于决策算法从各候选区间的候选搜索结果中确定一个目标搜索结果；

将所述目标搜索结果插入所述目标搜索结果队列中的相应位置，直到所述目标搜索结果队列的最后一个位置被填满，得到填满目标搜索结果的目标搜索结果队列。

6.根据权利要求5所述的方法，其特征在于，所述基于决策算法从各候选区间的候选搜索结果中确定一个目标搜索结果，包括：基于决策算法从各候选区间确定一个目标候选区间；

从所述目标候选区间对应的候选搜索结果中获取未被选取的第一个候选搜索结果，将未被选取的第一个候选搜索结果确定为目标搜索结果。

7.根据权利要求1至6任一项所述的方法，其特征在于，所述得到对应的目标搜索结果队列之后，所述方法还包括：

获取所述目标搜索结果队列的设置信息，所述设置信息包括所述目标搜索结果队列中每个目标搜索结果所属的排序队列的队列标识、所述目标搜索结果位于所述排序队列中的位置以及各排序队列被选取的次数；

获取对所述目标搜索结果队列的反馈结果，所述反馈结果包括所述目标搜索结果队列中每一个所述目标搜索结果是否转化的结果；

根据所述目标搜索结果队列的设置信息以及对所述目标搜索结果队列的反馈结果，更新各排序队列中对应初始搜索结果的转化特征。

8.一种数据确定装置，其特征在于，包括：转化特征获取模块，被配置为执行获取各排序队列中每个初始搜索结果的转化特征，所述各排序队列是预先按照不同的业务目标分别对多个初始搜索结果进行排序后得到的与各业务目标一一对应的队列；

候选区间确定模块，被配置为执行根据所述转化特征确定各排序队列中排序中庸的候选区间，所述候选区间包括至少一个候选搜索结果；

决策模块，被配置为执行基于决策算法从各候选区间对应的候选搜索结果中确定目标搜索结果，得到对应的目标搜索结果队列。

9.根据权利要求8所述的装置，其特征在于，所述转化特征获取模块被配置为执行：获取各排序队列中每个初始搜索结果的历史日志数据，所述历史日志数据包括所述初始搜索结果的历史转化次数和历史展示次数；

根据每个初始搜索结果对应的历史转化次数和历史展示次数，计算得到所述初始搜索结果的转化特征。

10.根据权利要求8所述的装置，其特征在于，所述候选区间确定模块被配置为执行：确定所述排序队列中所述转化特征满足设定阈值范围的至少一个候选搜索结果；

将所述至少一个候选搜索结果位于所述排序队列的区间确定为对应的候选区间。

11.根据权利要求8所述的装置，其特征在于，所述目标搜索结果队列具有对应的队列长度；所述决策模块包括：

队列长度获取单元，被配置为执行获取所述目标搜索结果队列的队列长度；

决策单元，被配置为执行基于决策算法从各候选区间对应的候选搜索结果中获取与所述队列长度对应的目标搜索结果，得对应的目标搜索结果队列。

12.根据权利要求11所述的装置，其特征在于，所述决策单元包括：目标搜索结果确定子单元，被配置为执行对于所述目标搜索结果队列中的每一个位置，基于决策算法从各候选区间的候选搜索结果中确定一个目标搜索结果；

目标搜索结果插入子单元，被配置为执行将所述目标搜索结果插入所述目标搜索结果队列中的相应位置，直到所述目标搜索结果队列的最后一个位置被填满，得到填满目标搜索结果的目标搜索结果队列。

13.根据权利要求12所述的装置，其特征在于，所述目标搜索结果确定子单元被配置为执行：

基于决策算法从各候选区间确定一个目标候选区间；

从所述目标候选区间对应的候选搜索结果中获取未被选取的第一个候选搜索结果，将未被选取的第一个候选搜索结果确定为目标搜索结果。

14.根据权利要求8至13任一项所述的装置，其特征在于，所述装置还包括：设置信息获取模块，被配置为执行获取所述目标搜索结果队列的设置信息，所述设置信息包括所述目标搜索结果队列中每个目标搜索结果所属的排序队列的队列标识、所述目标搜索结果位于所述排序队列中的位置以及各排序队列被选取的次数；

反馈结果获取模块，被配置为执行获取对所述目标搜索结果队列的反馈结果，所述反馈结果包括所述目标搜索结果队列中每一个所述目标搜索结果是否转化的结果；

更新模块，被配置为执行根据所述目标搜索结果队列的设置信息以及对所述目标搜索结果队列的反馈结果，更新各排序队列中对应初始搜索结果的转化特征。

15.一种电子设备，其特征在于，包括：处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如权利要求1至7中任一项所述的数据确定方法。

16.一种计算机可读存储介质，其特征在于，当所述计算机可读存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行如权利要求1至7中任一项所述的数据确定方法。

数据确定方法、装置、电子设备及存储介质

技术领域

[0001] 本公开涉及数据处理技术领域，尤其涉及一种数据确定方法、装置、电子设备及存储介质。

背景技术

[0002] 随着数据处理技术的发展，如何从海量候选中，实时地获得与检索目标“最相关”的候选元素是当今在线搜索、推荐和在线广告中的核心技术问题之一。例如：在图像搜索领
域，面对给定的一幅查询图像，系统要从庞大的数据库里（比如包含百万、千万甚至上亿图
像）快速找出相似的图像；在新闻推荐中，计算机也需要根据用户画像，从大量的新闻中找
到最相关的新闻推荐给用户；在广告系统中，则需要根据当前用户请求的上下文，从大量可
推荐广告中选择一个最靠谱的广告推荐给用户。

[0003] 相关技术中，为了解决上述大数据时代海量候选的搜索与排序问题，在线系统常常被分解成召回、粗排、精排、后处理等系统组件与过程阶段。而在每一阶段中，往往设计多
个算法或者策略来对候选元素进行排序。例如在召回阶段，可以分别部署冷启动召回策略、
标签召回策略、热门元素召回策略、基于候选元素和用户的协同过滤召回策略以及基于GNN
（Graph Neural Network，图神经网络）的用户‑候选元素关系挖掘的召回策略等，粗排通常
也会有多个预测模型对召回选择的几千个候选进行逐一打分，形成以多个打分为依据的多
个队列，例如广告竞价分队列、下发率队列等。精排中依据精排模型，对几十最多几百个元
素进行打分，可以得到精排分数，按照系统的最终目标，通常还会在精排中部署多个基于精
排打分的辅助策略，例如依据流量质量好坏的多个动态调价策略。

[0004] 目前通常采用基于某个给定的融合函数和在线调参方法，对某一阶段中多个算法或策略分别得到的原队列的候选元素进行融合排序，从而得到该阶段的融合排序结果。然
而，由于目前的融合排序方法考虑了候选元素位于原队列的分数，从而难以有效提升排序
结果的质量。

发明内容

[0005] 本公开提供一种数据确定方法、装置、电子设备及存储介质，以至少解决相关技术中的融合排序方法难以有效提升排序结果的质量问题。本公开的技术方案如下：

[0006] 根据本公开实施例的第一方面，提供一种数据确定方法，包括：

[0007] 获取各排序队列中每个初始搜索结果的转化特征，所述各排序队列是预先按照不同的业务目标分别对多个初始搜索结果进行排序后得到的与各业务目标一一对应的队列；

[0008] 根据所述转化特征确定各排序队列中的候选区间，所述候选区间包括至少一个候选搜索结果；

[0009] 基于决策算法从各候选区间对应的候选搜索结果中确定目标搜索结果，得到对应的目标搜索结果队列。

[0010] 在其中一个实施例中，所述获取各排序队列中每个初始搜索结果的转化特征，包括：获取各排序队列中每个初始搜索结果的历史日志数据，所述历史日志数据包括所述初
始搜索结果的历史转化次数和历史展示次数；根据每个初始搜索结果对应的历史转化次数
和历史展示次数，计算得到所述初始搜索结果的转化特征。

[0011] 在其中一个实施例中，所述根据所述转化特征确定各排序队列中的候选区间，包括：确定所述排序队列中所述转化特征满足设定阈值范围的至少一个候选搜索结果；将所
述至少一个候选搜索结果位于所述排序队列的区间确定为对应的候选区间。

[0012] 在其中一个实施例中，所述目标搜索结果队列具有对应的队列长度；所述基于决策算法从各候选区间对应的候选搜索结果中确定目标搜索结果，得到对应的目标搜索结果
队列，包括：获取所述目标搜索结果队列的队列长度；基于决策算法从各候选区间对应的候
选搜索结果中获取与所述队列长度对应的目标搜索结果，得对应的目标搜索结果队列。

[0013] 在其中一个实施例中，所述基于决策算法从各候选区间对应的候选搜索结果中获取与所述队列长度对应的目标搜索结果，得到对应的目标搜索结果队列，包括：对于所述目
标搜索结果队列中的每一个位置，基于决策算法从各候选区间的候选搜索结果中确定一个
目标搜索结果；将所述目标搜索结果插入所述目标搜索结果队列中的相应位置，直到所述
目标搜索结果队列的最后一个位置被填满，得到填满目标搜索结果的目标搜索结果队列。

[0014] 在其中一个实施例中，所述基于决策算法从各候选区间的候选搜索结果中确定一个目标搜索结果，包括：基于决策算法从各候选区间确定一个目标候选区间；从所述目标候
选区间对应的候选搜索结果中获取未被选取的第一个候选搜索结果，将未被选取的第一个
候选搜索结果确定为目标搜索结果。

[0015] 在其中一个实施例中，所述得到对应的目标搜索结果队列之后，所述方法还包括：获取所述目标搜索结果队列的设置信息，所述设置信息包括所述目标搜索结果队列中每个
目标搜索结果所属的排序队列的队列标识、所述目标搜索结果位于所述排序队列中的位置
以及各排序队列被选取的次数；获取对所述目标搜索结果队列的反馈结果，所述反馈结果
包括所述目标搜索结果队列中每一个所述目标搜索结果是否转化的结果；根据所述目标搜
索结果队列的设置信息以及对所述目标搜索结果队列的反馈结果，更新各排序队列中对应
初始搜索结果的转化特征。

[0016] 根据本公开实施例的第二方面，提供一种数据确定装置，包括：

[0017] 转化特征获取模块，被配置为执行获取各排序队列中每个初始搜索结果的转化特征，所述各排序队列是预先按照不同的业务目标分别对多个初始搜索结果进行排序后得到
的与各业务目标一一对应的队列；

[0018] 候选区间确定模块，被配置为执行根据所述转化特征确定各排序队列中的候选区间，所述候选区间包括至少一个候选搜索结果；

[0019] 决策模块，被配置为执行基于决策算法从各候选区间对应的候选搜索结果中确定目标搜索结果，得到对应的目标搜索结果队列。

[0020] 在其中一个实施例中，所述转化特征获取模块被配置为执行：获取各排序队列中每个初始搜索结果的历史日志数据，所述历史日志数据包括所述初始搜索结果的历史转化
次数和历史展示次数；根据每个初始搜索结果对应的历史转化次数和历史展示次数，计算
得到所述初始搜索结果的转化特征。

[0021] 在其中一个实施例中，所述候选区间确定模块被配置为执行：确定所述排序队列中所述转化特征满足设定阈值范围的至少一个候选搜索结果；将所述至少一个候选搜索结
果位于所述排序队列的区间确定为对应的候选区间。

[0022] 在其中一个实施例中，所述目标搜索结果队列具有对应的队列长度；所述决策模块包括：队列长度获取单元，被配置为执行获取所述目标搜索结果队列的队列长度；决策单
元，被配置为执行基于决策算法从各候选区间对应的候选搜索结果中获取与所述队列长度
对应的目标搜索结果，得对应的目标搜索结果队列。

[0023] 在其中一个实施例中，所述决策单元包括：目标搜索结果确定子单元，被配置为执行对于所述目标搜索结果队列中的每一个位置，基于决策算法从各候选区间的候选搜索结
果中确定一个目标搜索结果；目标搜索结果插入子单元，被配置为执行将所述目标搜索结
果插入所述目标搜索结果队列中的相应位置，直到所述目标搜索结果队列的最后一个位置
被填满，得到填满目标搜索结果的目标搜索结果队列。

[0024] 在其中一个实施例中，所述目标搜索结果确定子单元被配置为执行：基于决策算法从各候选区间确定一个目标候选区间；从所述目标候选区间对应的候选搜索结果中获取
未被选取的第一个候选搜索结果，将未被选取的第一个候选搜索结果确定为目标搜索结
果。

[0025] 在其中一个实施例中，所述装置还包括：设置信息获取模块，被配置为执行获取所述目标搜索结果队列的设置信息，所述设置信息包括所述目标搜索结果队列中每个目标搜
索结果所属的排序队列的队列标识、所述目标搜索结果位于所述排序队列中的位置以及各
排序队列被选取的次数；反馈结果获取模块，被配置为执行获取对所述目标搜索结果队列
的反馈结果，所述反馈结果包括所述目标搜索结果队列中每一个所述目标搜索结果是否转
化的结果；更新模块，被配置为执行根据所述目标搜索结果队列的设置信息以及对所述目
标搜索结果队列的反馈结果，更新各排序队列中对应初始搜索结果的转化特征。

[0026] 根据本公开实施例的第三方面，提供一种电子设备，包括：处理器；用于存储所述处理器可执行指令的存储器；其中，所述处理器被配置为执行所述指令，以实现上述第一方
面任一项所述的数据确定方法。

[0027] 根据本公开实施例的第四方面，提供一种计算机可读存储介质，当所述计算机可读存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行上述第一方
面任一项所述的数据确定方法。

[0028] 根据本公开实施例的第五方面，提供一种计算机程序产品，所述计算机程序产品中包括指令，所述指令被电子设备的处理器执行时，使得所述电子设备能够执行上述第一
方面任一项所述的数据确定方法。

[0029] 本公开的实施例提供的技术方案至少带来以下有益效果：通过获取各排序队列中每个初始搜索结果的转化特征，并根据转化特征确定各排序队列中的候选区间，进而基于
决策算法从各候选区间对应的候选搜索结果中确定目标搜索结果，得到对应的目标搜索结
果队列。由于本实施例是基于决策算法从各候选区间对应的候选搜索结果中确定目标搜索
结果，以得到对应的目标搜索结果队列，从而实现通过在线决策的方式来解决集成排序问
题，不仅不依赖于候选搜索结果位于原队列的分数，且能够达到较好的效果。

[0030] 应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

[0031] 此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

[0032] 图1是根据一示例性实施例示出的一种数据确定方法的流程图。

[0033] 图2是根据一示例性实施例示出的获取转化特征步骤的示意图。

[0034] 图3是根据一示例性实施例示出的确定候选区间步骤的示意图。

[0035] 图4是根据一示例性实施例示出的得到目标搜索结果队列步骤的示意图。

[0036] 图5是根据又一示例性实施例示出的得到目标搜索结果队列步骤的示意图。

[0037] 图6是根据一示例性实施例示出的确定目标搜索结果步骤的示意图。

[0038] 图7是根据另一示例性实施例示出的一种数据确定方法的流程图。

[0039] 图8是根据又一示例性实施例示出的一种数据确定方法的流程图。

[0040] 图9是根据一示例性实施例示出的一种数据确定装置的框图。

[0041] 图10是根据一示例性实施例示出的一种电子设备的框图。

具体实施方式

[0042] 为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

[0043] 需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用
的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或
描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相
一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面
相一致的装置和方法的例子。

[0044] 还需要说明的是，本公开所涉及的用户信息（包括但不限于用户设备信息、用户个人信息等）和数据（包括但不限于用于展示的数据、分析的数据等），均为经用户授权或者经
过各方充分授权的信息和数据。

[0045] 在一示例性实施例中，如图1所示，提供了一种数据确定方法，本实施例以该方法应用于服务器进行举例说明，其中，服务器可以用独立的服务器或者是多个服务器组成的
服务器集群来实现。本实施例中，该方法可以包括以下步骤：

[0046] 在步骤S110中，获取各排序队列中每个初始搜索结果的转化特征。

[0047] 其中，各排序队列是预先按照不同的业务目标分别对多个初始搜索结果进行排序后得到的与各业务目标一一对应的队列。初始搜索结果则是基于搜索目标从海量候选中搜
索的相关结果，例如，在搜索领域，初始搜索结果可以是搜索引擎基于搜索关键词而返回的
与搜索关键词相关的结果，在推荐领域，初始搜索结果可以是推荐系统基于用户画像而查
到的用户感兴趣的资源，如视频资源、音频资源、文本资源等。

[0048] 业务目标则是指预期可达成的效果，其是对初始搜索结果进行排序而得到对应排序队列的依据。例如，在面向转化率的业务目标时，可以对多个初始搜索结果的转化率进行
统计或估计，进行基于统计或估计的转化率对多个初始搜索结果排序，从而得到与转化率
对应的排序队列；在面向投资回报率（Return on Investment，简称ROI）的业务目标时，可
以对多个初始搜索结果的投资回报率进行统计或估计，进行基于统计或估计的投资回报率
对多个初始搜索结果排序，从而得到与投资回报率对应的排序队列。在本实施例中，当得到
多个初始搜索结果后，可以按照不同的业务目标分别对多个初始搜索结果进行排序，从而
得到的与各业务目标一一对应的队列。

[0049] 转化特征用于表征用户行为转化为目标的具体情况，例如，目标可以是商户希望访客在网站上完成的任务，如注册、下订单、付款等，而转化指潜在客户完成一次推广商户
期望的行为。例如，若转化目标为页面注册，当用户浏览了网站上的某一页面，并进行了注
册，则完成一次转化，若用户浏览了网站上的某一页面，但并未进行注册，则没有完成转化。
转化特征则可以是该页面的转化次数与浏览次数的比值。转化特征还可以是在一个统计周
期内的转化率，如在一个统计周期内完成转化行为的次数占总行为次数的比率，如转化率=
(转化次数/浏览次数)×100%。具体地，转化特征可以基于历史数据统计得到。在本实施例
中，对于不同的业务目标分别对应的排序队列，可以基于历史数据分别统计得到各排序队
列中每个初始搜索结果的转化特征。

[0050] 在步骤S120中，根据转化特征确定各排序队列中的候选区间。

[0051] 其中，候选区间是从排序队列中确定的用于参与后续决策排序以得到目标搜索结果队列的区间范围，具体地，候选区间包括至少一个候选搜索结果。由于转化特征的高低会
影响到后续排序的效果，因此，在本实施例中，基于转化特征从各排序队列中选取可以获得
较好效果的候选区间。

[0052] 在步骤S130中，基于决策算法从各候选区间对应的候选搜索结果中确定目标搜索结果，得到对应的目标搜索结果队列。

[0053] 其中，决策算法是从各候选区间对应的候选搜索结果中确定目标搜索结果的在线决策机类算法，例如，包括随机bandit算法，如汤普森采样（Thompson Sampling，简称TS）、
置信区间上界算法（Upper Confidence Bound，简称UCB）、exp3算法、exp4算法等，上下文
bandit算法，如LinTS算法、LinUCB算法等，非静态bandit算法，以及在线学习算法（Random
Weighted Majority，简称RWM）等。目标搜索结果队列则是基于决策算法对各候选区间对应
的候选搜索结果进行融合排序而得到的最终结果。在本实施例中，对于目标搜索结果队列
中的每一个元素位置，均通过决策算法进行序列求解，即通过决策算法从各候选区间对应
的候选搜索结果中确定一个目标搜索结果作为相应位置的元素，直到目标搜索结果队列中
的元素被填满，从而得到填满目标搜索结果元素的目标搜索结果队列。

[0054] 上述数据确定方法中，通过获取各排序队列中每个初始搜索结果的转化特征，并根据转化特征确定各排序队列中的候选区间，进而基于决策算法从各候选区间对应的候选
搜索结果中确定目标搜索结果，以得到对应的目标搜索结果队列。由于本实施例是基于决
策算法从各候选区间对应的候选搜索结果中确定目标搜索结果，以得到对应的目标搜索结
果队列，从而实现通过在线决策的方式来解决集成排序问题，不仅不依赖于候选搜索结果
位于原队列的分数，且能够达到较好的效果。

[0055] 在一示例性实施例中，如图2所示，在步骤S110中，获取各排序队列中每个初始搜索结果的转化特征，具体可以通过以下步骤实现：

[0056] 在步骤S112中，获取各排序队列中每个初始搜索结果的历史日志数据。

[0057] 其中，历史日志数据包括初始搜索结果的历史转化次数和历史展示次数。例如，对于广告推荐领域来说，每个初始搜索结果即为待向用户推荐的广告，而广告的转化特征则
体现在向用户曝光后成交的转换，因此，可以基于对应的历史日志数据进行统计而得到每
个广告的成交转化次数以及曝光次数，其中，成交转化次数可以是基于广告而进行的商品
交易次数。对于搜索领域来说，每个初始搜索结果即为基于搜索关键词进行搜索得到的资
源，因此，可以基于每个资源的历史日志数据进行统计而得到每个资源的成交转化次数以
及曝光次数，其中，成交转化次数则可以是对资源的下载次数或购买次数。

[0058] 在步骤S114中，根据每个初始搜索结果对应的历史转化次数和历史展示次数，计算得到初始搜索结果的转化特征。

[0059] 由于转化特征用于表征用户行为转化为目标的具体情况，因此，对于每个初始搜索结果的转化特征，其可以是对应的历史转化次数与历史展示次数的比值。还可以是在一
个统计周期内的转化率，即计算一个统计周期内的累计转化次数占总曝光次数的比率。因
此，在本实施例中，可以根据每个初始搜索结果对应的历史转化次数和历史展示次数，通过
计算得到每个初始搜索结果的转化特征。

[0060] 上述实施例中，通过获取各排序队列中每个初始搜索结果的历史日志数据，进而根据每个初始搜索结果对应的历史转化次数和历史展示次数，计算得到初始搜索结果的转
化特征，又由于转化特征的高低会影响到后续排序的效果，因此，在本实施例中，可以基于
转化特征从各排序队列中选取可以获得较好效果的候选区间参与后续的目标决策，从而有
利于提高后续的决策效果。

[0061] 在一示例性实施例中，如图3所示，在步骤S120中，根据转化特征确定各排序队列中的候选区间，具体可以通过以下步骤实现：

[0062] 在步骤S122中，确定排序队列中转化特征满足设定阈值范围的至少一个候选搜索结果。

[0063] 其中，设定阈值范围是指设定的转化特征的阈值范围。候选搜索结果是指排序队列中转化特征满足设定阈值范围的初始搜索结果，也是参与后续目标决策的候选元素。由
于转化特征的高低会影响到后续排序的效果，因此，在本实施例中，基于转化特征从各排序
队列中选取可以获得较好效果的候选搜索结果。又由于转化特征中庸的位置一般都是排序
队列中分数置信度欠缺的位置，而这些位置的转化特征会随时间发生显著变化，因此，只有
转化特征中庸位置的元素参与目标决策，才会获得较好的效果，否则，会影响决策效果。基
于此，在本实施例中，可以通过设定转化特征中庸的阈值范围，例如，若转化特征为转化率，
则中庸的阈值范围可以是转化率为40%至70%之间，其上下边界具体可以根据实际场景的需
求而进行调整，本实施例并不对此进行限定。具体地，通过设定的阈值范围在排序队列中确
定转化特征满足该阈值范围的至少一个候选搜索结果，即排除转化特征较高的部分以及转
化特征较低的部分。

[0064] 在步骤S124中，将至少一个候选搜索结果位于排序队列的区间确定为对应的候选区间。

[0065] 其中，候选区间即为上述确定的至少一个候选搜索结果位于排序队列的区间。具体地，基于上述得到的转化特征满足阈值范围的至少一个候选搜索结果，可以确定该至少
一个候选搜索结果位于排序队列的区间，进而将该区间作为候选区间。例如，若某一排序队
列中，转化特征满足设定阈值范围的至少一个候选搜索结果为该排序队列中排在第101至
第499的初始搜索结果，则可以确定该排序队列中第101至第499的区间为对应的候选区间，
排在第101至第499的初始搜索结果则为对应的候选搜索结果。

[0066] 上述实施例中，通过确定排序队列中转化特征满足设定阈值范围的至少一个候选搜索结果，并将至少一个候选搜索结果位于排序队列的区间确定为对应的候选区间，由于
本实施例是基于决策算法从各候选区间对应的候选搜索结果中确定目标搜索结果，以得到
对应的目标搜索结果队列，而上述候选区间又是基于转化特征从各排序队列中选取的可以
获得较好效果的区间，其不依赖于原排序队列中各初始搜索结果的打分，因此，即使原排序
队列中各初始搜索结果的打分不准，只要排序位置相对可靠，则有利于提高后续的决策效
果，且鲁棒性高。

[0067] 在一示例性实施例中，如图4所示，目标搜索结果队列具有对应的队列长度；则在步骤S130中，基于决策算法从各候选区间对应的候选搜索结果中确定目标搜索结果，得到
对应的目标搜索结果队列，具体包括：

[0068] 在步骤S410中，获取目标搜索结果队列的队列长度。

[0069] 其中，队列长度是指队列能够存放元素的个数。由于目标搜索结果队列是基于决策算法对各候选区间对应的候选搜索结果进行融合排序而得到的最终结果，而本实施例中
又是基于决策算法而确定目标搜索结果队列中的每一个元素，因此，在本实施例中，在运行
决策算法之前，首先需要获取目标搜索结果队列的队列长度，从而对于队列中的每一个位
置，基于决策算法而确定对应位置的元素。本实施例中，目标搜索结果队列的队列长度，一
般是系统给定的超参，比如某一广告推荐系统，在粗排只允许300个候选元素进入到精排过
程，则对于粗排阶段输出的目标搜索结果队列，其队列长度为300。

[0070] 在步骤S420中，基于决策算法从各候选区间对应的候选搜索结果中获取与队列长度对应的目标搜索结果，得对应的目标搜索结果队列。

[0071] 其中，目标搜索结果则是目标搜索结果队列中每一个位置的元素，其是基于决策算法从各候选区间对应的候选搜索结果中选取。具体地，在本实施例中，基于决策算法从各
候选区间对应的候选搜索结果中获取与队列长度对应的目标搜索结果，从而得对应的目标
搜索结果队列。

[0072] 上述实施例中，通过获取目标搜索结果队列的队列长度，并基于决策算法从各候选区间对应的候选搜索结果中获取与队列长度对应的目标搜索结果，从而得对应的目标搜
索结果队列，又由于对于目标搜索结果队列中每一个位置的元素，是基于决策算法选取得
到，因此，相较于传统的集成排序方法，有利于提高整体效果。

[0073] 在一示例性实施例中，如图5所示，在步骤S420中，基于决策算法从各候选区间对应的候选搜索结果中获取与队列长度对应的目标搜索结果，得对应的目标搜索结果队列，
具体包括：

[0074] 在步骤S510中，对于目标搜索结果队列中的每一个位置，基于决策算法从各候选区间的候选搜索结果中确定一个目标搜索结果。

[0075] 由于本实施例中，对于目标搜索结果队列中每一个位置的元素，是基于决策算法选取得到。因此，在基于上述方法获取目标搜索结果队列的队列长度之后，即可得到具有相
应长度的空的目标搜索结果队列，进而对于队列中的每一个位置，可以运行决策算法从各
候选区间的候选搜索结果中选取一个目标搜索结果作为对应位置的元素。

[0076] 在步骤S520中，将目标搜索结果插入目标搜索结果队列中的相应位置，直到目标搜索结果队列的最后一个位置被填满，得到填满目标搜索结果的目标搜索结果队列。

[0077] 具体地，对于目标搜索结果队列中的每一个位置，基于上述决策算法从各候选区间的候选搜索结果中选取一个目标搜索结果后，则可以将该目标搜索结果插入到目标搜索
结果队列中的相应位置，直到目标搜索结果队列的最后一个位置被填满，从而得到填满目
标搜索结果的目标搜索结果队列，即得到融合排序后的最终队列。

[0078] 上述实施例中，对于目标搜索结果队列中的每一个位置，基于决策算法从各候选区间的候选搜索结果中确定一个目标搜索结果，将目标搜索结果插入目标搜索结果队列中
的相应位置，直到目标搜索结果队列的最后一个位置被填满，从而得到填满目标搜索结果
的目标搜索结果队列。由于本实施例运用决策算法动态的选取每一个元素，因此将集成排
序问题转化为动态决策过程，相比传统的集成排序方法具有较好的效果，且能够发现排序
位置相对靠后的优质元素，从而可以提升整体的业务指标。

[0079] 在一示例性实施例中，如图6所示，在步骤S510中，基于决策算法从各候选区间的候选搜索结果中确定一个目标搜索结果，具体包括：

[0080] 在步骤S512中，基于决策算法从各候选区间确定一个目标候选区间。

[0081] 其中，目标候选区间是基于决策算法从各候选区间确定的一个最优候选区间，即“最好的元素”所在的候选区间。具体地，对于优劣的评价指标可以基于选取的决策算法确
定，例如，对于置信区间上界算法，其评价指标可以是相应的回报概率，则目标候选区间可
以是能够获取最大回报概率的区间。

[0082] 在步骤S514中，从目标候选区间对应的候选搜索结果中获取未被选取的第一个候选搜索结果，将未被选取的第一个候选搜索结果确定为目标搜索结果。

[0083] 具体地，当通过上述步骤从各候选区间确定目标候选区间之后，则可以从该目标候选区间对应的候选搜索结果中选取一个候选搜索结果，又由于候选搜索结果所在的排序
队列是基于相应的业务目标进行排序的，因此，排在靠前的元素其相应的回报概率也更大。
基于此，在本实施例中，每次从目标候选区间对应的候选搜索结果中选取目标搜索结果时，
可以基于候选搜索结果位于原排序队列中的位置依次选取，即选取目标候选区间中的第一
个候选搜索结果。进而判断该候选搜索结果是否已在目标搜索结果队列中，当该候选搜索
结果已存在于目标搜索结果队列中时，则选取目标候选区间中的下一个候选搜索结果，并
进行上述判断。直到找到一个候选搜索结果不位于目标搜索结果队列中时，则将该候选搜
索结果确定为目标搜索结果，并插入到目标搜索结果队列中的相应位置。

[0084] 可以理解的是，上述步骤S512以及步骤S514，是决策目标搜索结果队列中一个位置的目标搜索结果的过程，而对于目标搜索结果队列的每一个位置，都可以基于上述步骤
S512以及步骤S514，以确定每一个位置的目标搜索结果。

[0085] 上述实施例中，基于决策算法从各候选区间确定一个目标候选区间，进而从目标候选区间对应的候选搜索结果中获取未被选取的第一个候选搜索结果，将未被选取的第一
个候选搜索结果确定为目标搜索结果，由于每一个目标搜索结果都是基于决策算法动态的
选取，因此相比传统的集成排序方法具有较好的效果。

[0086] 在一示例性实施例中，当从目标候选区间对应的候选搜索结果中确定对应的目标搜索结果之后，还可以在目标候选区间中对相应的候选搜索结果进行标记，以标识该候选
搜索结果已被选取，即标识该候选搜索结果已存在于目标搜索结果队列中，从而提高流程
的效果。

[0087] 在一示例性实施例中，如图7所示，在步骤S130中，得到对应的目标搜索结果队列之后，上述方法还可以包括：

[0088] 在步骤S710中，获取目标搜索结果队列的设置信息。

[0089] 其中，设置信息可以是对应的埋点信息，包括目标搜索结果队列中每个目标搜索结果所属的排序队列的队列标识、目标搜索结果位于所属排序队列中的位置以及各排序队
列被选取的次数。具体地，队列标识是用于区分不同队列的标记。目标搜索结果位于所属排
序队列中的位置是指该目标搜索结果位于原排序队列中的排序位置。各排序队列被选取的
次数是指目标搜索结果队列中各元素来自不同排序队列的统计，例如，若存在排序队列A和
排序队列B，目标搜索结果队列包括100个元素，其中有60个元素是从排序队列A中选取的，
有40个元素是从排序队列B中选取的，则排序队列A被选取的次数为60，排序队列B被选取的
次数为40。

[0090] 在步骤S720中，获取对目标搜索结果队列的反馈结果。

[0091] 其中，反馈结果包括目标搜索结果队列中每一个目标搜索结果是否转化的结果。具体地，反馈结果是基于目标搜索结果队列向用户曝光后，基于用户的操作行为而获得的
反馈结果，即目标搜索结果队列中每一个目标搜索结果是否被转化。

[0092] 在步骤S730中，根据目标搜索结果队列的设置信息以及目标搜索结果队列的反馈结果，更新各排序队列中对应初始搜索结果的转化特征。

[0093] 具体地，基于上述获取的目标搜索结果队列的设置信息以及目标搜索结果队列的反馈结果，从而更新各排序队列中对应初始搜索结果的转化特征。

[0094] 上述实施例中，通过获取目标搜索结果队列的设置信息，以及获取对目标搜索结果队列的反馈结果，进而根据目标搜索结果队列的设置信息以及目标搜索结果队列的反馈
结果，更新各排序队列中对应初始搜索结果的转化特征，从而随着系统的运行，能够反哺更
新原排序队列，使得整体效果稳步提升。

[0095] 在一示例性实施例中，如图8所示，以下进一步说本实施例的方法，其具体包括：

[0096] 步骤801：将在线系统中排序策略队列（即排序队列）进行分组。

[0097] 具体地，将多个在线排序策略队列Q={q_1,q_2,q_3,…,q_n}，按照所在系统的处理阶段分类，在每个处理阶段的分类中，再按照所面向的业务目标分成小类。例如将在线系
统分成，召回、粗排、精排和后处理4个主要部分，然后在每个大类里，按照业务目标，分成小
类，例如，GMV（Gross Merchandise Volume，网站成交金额）类、转化率类、ROI（Return On
Investment，投资回报率）类等多类，每个类别中有m个策略队列组成，且每个类别仅有一个
目标。

[0098] 步骤802：将已分组的策略建模成在线决策机模型。

[0099] 具体地，将步骤1中得到的每个类别，分别建模成一个在线决策机模型（Machine），其中每个策略队列（即排序队列）为一个机械臂（Arm）。由于每个类别直接是独
立的，因此将动态优选问题，转化为一个序列决策类问题，即基于决策算法求解一个最优序
列。

[0100] 步骤803：利用历史数据，针对每个类中的每个排序队列，对其转化率进行统计，从而得到每个排序队列的候选区间。即刨除头部最优转化率位置和尾部转化率非常低的部
分，确定融合初始和结束位置，即确定候选区间。

[0101] 步骤804：选择适当的在线决策算法，并确定最终队列长度，即确定目标搜索结果队列的队列长度。本实施例不限在线决策算法的选择，并可以依据不同算法做横向扩展。

[0102] 步骤805：针对每次用户请求，运行在线动态队列融合过程，以得到对应的目标搜索结果队列。即运行上述选取的在线决策算法，具体可参考如图5所示的过程，本实施例不
再赘述。

[0103] 步骤806：将决上述策过程产生的决策信息下发埋点，与目标结果链接（Join）在一起。需要下发埋点的决策信息如下：进入最终队列元素的原队列标记（tag），最终队列中，每
个原队列选取次数（pv），最终队列中每个元素在原队列中的位置（index），以及其他的上下
文信息，例如，请求发起方（系统用户）的特征，决策时所处的阶段，候选元素特征等。

[0104] 步骤807：基于实时流依据融合效果，进行后验信息统计，并基于统计信息实时更新。

[0105] 应该理解的是，虽然图1‑图8的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步
骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图1‑图8中的至
少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻
执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进
行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执
行。

[0106] 可以理解的是，本说明书中上述方法的各个实施例之间相同/相似的部分可互相参见，每个实施例重点说明的是与其他实施例的不同之处，相关之处参见其他方法实施例
的说明即可。

[0107] 图9是根据一示例性实施例示出的一种数据确定装置框图。参照图9，该装置包括转化特征获取模块902，候选区间确定模块904和决策模块906。

[0108] 转化特征获取模块，被配置为执行获取各排序队列中每个初始搜索结果的转化特征，所述各排序队列是预先按照不同的业务目标分别对多个初始搜索结果进行排序后得到
的与各业务目标一一对应的队列；

[0109] 候选区间确定模块，被配置为执行根据所述转化特征确定各排序队列中的候选区间，所述候选区间包括至少一个候选搜索结果；

[0110] 决策模块，被配置为执行基于决策算法从各候选区间对应的候选搜索结果中确定目标搜索结果，得到对应的目标搜索结果队列。

[0111] 在一示例性实施例中，所述转化特征获取模块被配置为执行：获取各排序队列中每个初始搜索结果的历史日志数据，所述历史日志数据包括所述初始搜索结果的历史转化
次数和历史展示次数；根据每个初始搜索结果对应的历史转化次数和历史展示次数，计算
得到所述初始搜索结果的转化特征。

[0112] 在一示例性实施例中，所述候选区间确定模块被配置为执行：确定所述排序队列中所述转化特征满足设定阈值范围的至少一个候选搜索结果；将所述至少一个候选搜索结
果位于所述排序队列的区间确定为对应的候选区间。

[0113] 在一示例性实施例中，所述目标搜索结果队列具有对应的队列长度；所述决策模块包括：队列长度获取单元，被配置为执行获取所述目标搜索结果队列的队列长度；决策单
元，被配置为执行基于决策算法从各候选区间对应的候选搜索结果中获取与所述队列长度
对应的目标搜索结果，得对应的目标搜索结果队列。

[0114] 在一示例性实施例中，所述决策单元包括：目标搜索结果确定子单元，被配置为执行对于所述目标搜索结果队列中的每一个位置，基于决策算法从各候选区间的候选搜索结
果中确定一个目标搜索结果；目标搜索结果插入子单元，被配置为执行将所述目标搜索结
果插入所述目标搜索结果队列中的相应位置，直到所述目标搜索结果队列的最后一个位置
被填满，得到填满目标搜索结果的目标搜索结果队列。

[0115] 在一示例性实施例中，所述目标搜索结果确定子单元被配置为执行：基于决策算法从各候选区间确定一个目标候选区间；从所述目标候选区间对应的候选搜索结果中获取
未被选取的第一个候选搜索结果，将未被选取的第一个候选搜索结果确定为目标搜索结
果。

[0116] 在一示例性实施例中，所述装置还包括：设置信息获取模块，被配置为执行获取所述目标搜索结果队列的设置信息，所述设置信息包括所述目标搜索结果队列中每个目标搜
索结果所属的排序队列的队列标识、所述目标搜索结果位于所述排序队列中的位置以及各
排序队列被选取的次数；反馈结果获取模块，被配置为执行获取对所述目标搜索结果队列
的反馈结果，所述反馈结果包括所述目标搜索结果队列中每一个所述目标搜索结果是否转
化的结果；更新模块，被配置为执行根据所述目标搜索结果队列的设置信息以及对所述目
标搜索结果队列的反馈结果，更新各排序队列中对应初始搜索结果的转化特征。

[0117] 关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

[0118] 图10是根据一示例性实施例示出的一种用于数据确定的电子设备S00的框图。例如，电子设备S00可以为服务器。参照图10，电子设备S00包括处理组件S20，其进一步包括一
个或多个处理器，以及由存储器S22所代表的存储器资源，用于存储可由处理组件S20的执
行的指令，例如应用程序。存储器S22中存储的应用程序可以包括一个或一个以上的每一个
对应于一组指令的模块。此外，处理组件S20被配置为执行指令，以执行上述方法。

[0119] 电子设备S00还可以包括：电源组件S24被配置为执行电子设备S00的电源管理，有线或无线网络接口S26被配置为将电子设备S00连接到网络，和输入输出（I/O）接口S28。电
子设备S00可以操作基于存储在存储器S22的操作系统，例如Windows Server，Mac OS X，
Unix，Linux，FreeBSD或类似。

[0120] 在示例性实施例中，还提供了一种包括指令的计算机可读存储介质，例如包括指令的存储器S22，上述指令可由电子设备S00的处理器执行以完成上述方法。存储介质可以
是计算机可读存储介质，例如，所述计算机可读存储介质可以是ROM、随机存取存储器
（RAM）、CD‑ROM、磁带、软盘和光数据存储设备等。

[0121] 在示例性实施例中，还提供一种计算机程序产品，所述计算机程序产品中包括指令，上述指令可由电子设备S00的处理器执行以完成上述方法。

[0122] 需要说明的，上述的装置、电子设备、计算机可读存储介质、计算机程序产品等根据方法实施例的描述还可以包括其他的实施方式，具体的实现方式可以参照相关方法实施
例的描述，在此不作一一赘述。

[0123] 本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或
者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识
或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由权利要
求指出。

[0124] 应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

数据确定方法、装置、电子设备及存储介质转让专利

申请号 : CN202111245730.4

文献号 : CN113688295B

文献日 : 2022-03-25

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 谢淼 , 姜峰 , 郭远 , 解浪

申请人 : 北京达佳互联信息技术有限公司

摘要 :

权利要求 :

说明书 :