数据确定方法、装置、电子设备及存储介质转让专利
申请号 : CN202111245730.4
文献号 : CN113688295B
文献日 : 2022-03-25
发明人 : 谢淼 , 姜峰 , 郭远 , 解浪
申请人 : 北京达佳互联信息技术有限公司
摘要 :
权利要求 :
1.一种数据确定方法,其特征在于,包括:获取各排序队列中每个初始搜索结果的转化特征,所述各排序队列是预先按照不同的业务目标分别对多个初始搜索结果进行排序后得到的与各业务目标一一对应的队列;
根据所述转化特征确定各排序队列中排序中庸的候选区间,所述候选区间包括至少一个候选搜索结果;
基于决策算法从各候选区间对应的候选搜索结果中确定目标搜索结果,得到对应的目标搜索结果队列。
2.根据权利要求1所述的方法,其特征在于,所述获取各排序队列中每个初始搜索结果的转化特征,包括:
获取各排序队列中每个初始搜索结果的历史日志数据,所述历史日志数据包括所述初始搜索结果的历史转化次数和历史展示次数;
根据每个初始搜索结果对应的历史转化次数和历史展示次数,计算得到所述初始搜索结果的转化特征。
3.根据权利要求1所述的方法,其特征在于,所述根据所述转化特征确定各排序队列中的候选区间,包括:
确定所述排序队列中所述转化特征满足设定阈值范围的至少一个候选搜索结果;
将所述至少一个候选搜索结果位于所述排序队列的区间确定为对应的候选区间。
4.根据权利要求1所述的方法,其特征在于,所述目标搜索结果队列具有对应的队列长度;所述基于决策算法从各候选区间对应的候选搜索结果中确定目标搜索结果,得到对应的目标搜索结果队列,包括:
获取所述目标搜索结果队列的队列长度;
基于决策算法从各候选区间对应的候选搜索结果中获取与所述队列长度对应的目标搜索结果,得对应的目标搜索结果队列。
5.根据权利要求4所述的方法,其特征在于,所述基于决策算法从各候选区间对应的候选搜索结果中获取与所述队列长度对应的目标搜索结果,得到对应的目标搜索结果队列,包括:
对于所述目标搜索结果队列中的每一个位置,基于决策算法从各候选区间的候选搜索结果中确定一个目标搜索结果;
将所述目标搜索结果插入所述目标搜索结果队列中的相应位置,直到所述目标搜索结果队列的最后一个位置被填满,得到填满目标搜索结果的目标搜索结果队列。
6.根据权利要求5所述的方法,其特征在于,所述基于决策算法从各候选区间的候选搜索结果中确定一个目标搜索结果,包括:基于决策算法从各候选区间确定一个目标候选区间;
从所述目标候选区间对应的候选搜索结果中获取未被选取的第一个候选搜索结果,将未被选取的第一个候选搜索结果确定为目标搜索结果。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述得到对应的目标搜索结果队列之后,所述方法还包括:
获取所述目标搜索结果队列的设置信息,所述设置信息包括所述目标搜索结果队列中每个目标搜索结果所属的排序队列的队列标识、所述目标搜索结果位于所述排序队列中的位置以及各排序队列被选取的次数;
获取对所述目标搜索结果队列的反馈结果,所述反馈结果包括所述目标搜索结果队列中每一个所述目标搜索结果是否转化的结果;
根据所述目标搜索结果队列的设置信息以及对所述目标搜索结果队列的反馈结果,更新各排序队列中对应初始搜索结果的转化特征。
8.一种数据确定装置,其特征在于,包括:转化特征获取模块,被配置为执行获取各排序队列中每个初始搜索结果的转化特征,所述各排序队列是预先按照不同的业务目标分别对多个初始搜索结果进行排序后得到的与各业务目标一一对应的队列;
候选区间确定模块,被配置为执行根据所述转化特征确定各排序队列中排序中庸的候选区间,所述候选区间包括至少一个候选搜索结果;
决策模块,被配置为执行基于决策算法从各候选区间对应的候选搜索结果中确定目标搜索结果,得到对应的目标搜索结果队列。
9.根据权利要求8所述的装置,其特征在于,所述转化特征获取模块被配置为执行:获取各排序队列中每个初始搜索结果的历史日志数据,所述历史日志数据包括所述初始搜索结果的历史转化次数和历史展示次数;
根据每个初始搜索结果对应的历史转化次数和历史展示次数,计算得到所述初始搜索结果的转化特征。
10.根据权利要求8所述的装置,其特征在于,所述候选区间确定模块被配置为执行:确定所述排序队列中所述转化特征满足设定阈值范围的至少一个候选搜索结果;
将所述至少一个候选搜索结果位于所述排序队列的区间确定为对应的候选区间。
11.根据权利要求8所述的装置,其特征在于,所述目标搜索结果队列具有对应的队列长度;所述决策模块包括:
队列长度获取单元,被配置为执行获取所述目标搜索结果队列的队列长度;
决策单元,被配置为执行基于决策算法从各候选区间对应的候选搜索结果中获取与所述队列长度对应的目标搜索结果,得对应的目标搜索结果队列。
12.根据权利要求11所述的装置,其特征在于,所述决策单元包括:目标搜索结果确定子单元,被配置为执行对于所述目标搜索结果队列中的每一个位置,基于决策算法从各候选区间的候选搜索结果中确定一个目标搜索结果;
目标搜索结果插入子单元,被配置为执行将所述目标搜索结果插入所述目标搜索结果队列中的相应位置,直到所述目标搜索结果队列的最后一个位置被填满,得到填满目标搜索结果的目标搜索结果队列。
13.根据权利要求12所述的装置,其特征在于,所述目标搜索结果确定子单元被配置为执行:
基于决策算法从各候选区间确定一个目标候选区间;
从所述目标候选区间对应的候选搜索结果中获取未被选取的第一个候选搜索结果,将未被选取的第一个候选搜索结果确定为目标搜索结果。
14.根据权利要求8至13任一项所述的装置,其特征在于,所述装置还包括:设置信息获取模块,被配置为执行获取所述目标搜索结果队列的设置信息,所述设置信息包括所述目标搜索结果队列中每个目标搜索结果所属的排序队列的队列标识、所述目标搜索结果位于所述排序队列中的位置以及各排序队列被选取的次数;
反馈结果获取模块,被配置为执行获取对所述目标搜索结果队列的反馈结果,所述反馈结果包括所述目标搜索结果队列中每一个所述目标搜索结果是否转化的结果;
更新模块,被配置为执行根据所述目标搜索结果队列的设置信息以及对所述目标搜索结果队列的反馈结果,更新各排序队列中对应初始搜索结果的转化特征。
15.一种电子设备,其特征在于,包括:处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至7中任一项所述的数据确定方法。
16.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1至7中任一项所述的数据确定方法。
说明书 :
数据确定方法、装置、电子设备及存储介质
技术领域
背景技术
域,面对给定的一幅查询图像,系统要从庞大的数据库里(比如包含百万、千万甚至上亿图
像)快速找出相似的图像;在新闻推荐中,计算机也需要根据用户画像,从大量的新闻中找
到最相关的新闻推荐给用户;在广告系统中,则需要根据当前用户请求的上下文,从大量可
推荐广告中选择一个最靠谱的广告推荐给用户。
个算法或者策略来对候选元素进行排序。例如在召回阶段,可以分别部署冷启动召回策略、
标签召回策略、热门元素召回策略、基于候选元素和用户的协同过滤召回策略以及基于GNN
(Graph Neural Network,图神经网络)的用户‑候选元素关系挖掘的召回策略等,粗排通常
也会有多个预测模型对召回选择的几千个候选进行逐一打分,形成以多个打分为依据的多
个队列,例如广告竞价分队列、下发率队列等。精排中依据精排模型,对几十最多几百个元
素进行打分,可以得到精排分数,按照系统的最终目标,通常还会在精排中部署多个基于精
排打分的辅助策略,例如依据流量质量好坏的多个动态调价策略。
而,由于目前的融合排序方法考虑了候选元素位于原队列的分数,从而难以有效提升排序
结果的质量。
发明内容
始搜索结果的历史转化次数和历史展示次数;根据每个初始搜索结果对应的历史转化次数
和历史展示次数,计算得到所述初始搜索结果的转化特征。
述至少一个候选搜索结果位于所述排序队列的区间确定为对应的候选区间。
队列,包括:获取所述目标搜索结果队列的队列长度;基于决策算法从各候选区间对应的候
选搜索结果中获取与所述队列长度对应的目标搜索结果,得对应的目标搜索结果队列。
标搜索结果队列中的每一个位置,基于决策算法从各候选区间的候选搜索结果中确定一个
目标搜索结果;将所述目标搜索结果插入所述目标搜索结果队列中的相应位置,直到所述
目标搜索结果队列的最后一个位置被填满,得到填满目标搜索结果的目标搜索结果队列。
选区间对应的候选搜索结果中获取未被选取的第一个候选搜索结果,将未被选取的第一个
候选搜索结果确定为目标搜索结果。
目标搜索结果所属的排序队列的队列标识、所述目标搜索结果位于所述排序队列中的位置
以及各排序队列被选取的次数;获取对所述目标搜索结果队列的反馈结果,所述反馈结果
包括所述目标搜索结果队列中每一个所述目标搜索结果是否转化的结果;根据所述目标搜
索结果队列的设置信息以及对所述目标搜索结果队列的反馈结果,更新各排序队列中对应
初始搜索结果的转化特征。
的与各业务目标一一对应的队列;
次数和历史展示次数;根据每个初始搜索结果对应的历史转化次数和历史展示次数,计算
得到所述初始搜索结果的转化特征。
果位于所述排序队列的区间确定为对应的候选区间。
元,被配置为执行基于决策算法从各候选区间对应的候选搜索结果中获取与所述队列长度
对应的目标搜索结果,得对应的目标搜索结果队列。
果中确定一个目标搜索结果;目标搜索结果插入子单元,被配置为执行将所述目标搜索结
果插入所述目标搜索结果队列中的相应位置,直到所述目标搜索结果队列的最后一个位置
被填满,得到填满目标搜索结果的目标搜索结果队列。
未被选取的第一个候选搜索结果,将未被选取的第一个候选搜索结果确定为目标搜索结
果。
索结果所属的排序队列的队列标识、所述目标搜索结果位于所述排序队列中的位置以及各
排序队列被选取的次数;反馈结果获取模块,被配置为执行获取对所述目标搜索结果队列
的反馈结果,所述反馈结果包括所述目标搜索结果队列中每一个所述目标搜索结果是否转
化的结果;更新模块,被配置为执行根据所述目标搜索结果队列的设置信息以及对所述目
标搜索结果队列的反馈结果,更新各排序队列中对应初始搜索结果的转化特征。
面任一项所述的数据确定方法。
面任一项所述的数据确定方法。
方面任一项所述的数据确定方法。
决策算法从各候选区间对应的候选搜索结果中确定目标搜索结果,得到对应的目标搜索结
果队列。由于本实施例是基于决策算法从各候选区间对应的候选搜索结果中确定目标搜索
结果,以得到对应的目标搜索结果队列,从而实现通过在线决策的方式来解决集成排序问
题,不仅不依赖于候选搜索结果位于原队列的分数,且能够达到较好的效果。
附图说明
具体实施方式
的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或
描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相
一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面
相一致的装置和方法的例子。
过各方充分授权的信息和数据。
服务器集群来实现。本实施例中,该方法可以包括以下步骤:
索的相关结果,例如,在搜索领域,初始搜索结果可以是搜索引擎基于搜索关键词而返回的
与搜索关键词相关的结果,在推荐领域,初始搜索结果可以是推荐系统基于用户画像而查
到的用户感兴趣的资源,如视频资源、音频资源、文本资源等。
统计或估计,进行基于统计或估计的转化率对多个初始搜索结果排序,从而得到与转化率
对应的排序队列;在面向投资回报率(Return on Investment,简称ROI)的业务目标时,可
以对多个初始搜索结果的投资回报率进行统计或估计,进行基于统计或估计的投资回报率
对多个初始搜索结果排序,从而得到与投资回报率对应的排序队列。在本实施例中,当得到
多个初始搜索结果后,可以按照不同的业务目标分别对多个初始搜索结果进行排序,从而
得到的与各业务目标一一对应的队列。
期望的行为。例如,若转化目标为页面注册,当用户浏览了网站上的某一页面,并进行了注
册,则完成一次转化,若用户浏览了网站上的某一页面,但并未进行注册,则没有完成转化。
转化特征则可以是该页面的转化次数与浏览次数的比值。转化特征还可以是在一个统计周
期内的转化率,如在一个统计周期内完成转化行为的次数占总行为次数的比率,如转化率=
(转化次数/浏览次数)×100%。具体地,转化特征可以基于历史数据统计得到。在本实施例
中,对于不同的业务目标分别对应的排序队列,可以基于历史数据分别统计得到各排序队
列中每个初始搜索结果的转化特征。
影响到后续排序的效果,因此,在本实施例中,基于转化特征从各排序队列中选取可以获得
较好效果的候选区间。
置信区间上界算法(Upper Confidence Bound,简称UCB)、exp3算法、exp4算法等,上下文
bandit算法,如LinTS算法、LinUCB算法等,非静态bandit算法,以及在线学习算法(Random
Weighted Majority,简称RWM)等。目标搜索结果队列则是基于决策算法对各候选区间对应
的候选搜索结果进行融合排序而得到的最终结果。在本实施例中,对于目标搜索结果队列
中的每一个元素位置,均通过决策算法进行序列求解,即通过决策算法从各候选区间对应
的候选搜索结果中确定一个目标搜索结果作为相应位置的元素,直到目标搜索结果队列中
的元素被填满,从而得到填满目标搜索结果元素的目标搜索结果队列。
搜索结果中确定目标搜索结果,以得到对应的目标搜索结果队列。由于本实施例是基于决
策算法从各候选区间对应的候选搜索结果中确定目标搜索结果,以得到对应的目标搜索结
果队列,从而实现通过在线决策的方式来解决集成排序问题,不仅不依赖于候选搜索结果
位于原队列的分数,且能够达到较好的效果。
体现在向用户曝光后成交的转换,因此,可以基于对应的历史日志数据进行统计而得到每
个广告的成交转化次数以及曝光次数,其中,成交转化次数可以是基于广告而进行的商品
交易次数。对于搜索领域来说,每个初始搜索结果即为基于搜索关键词进行搜索得到的资
源,因此,可以基于每个资源的历史日志数据进行统计而得到每个资源的成交转化次数以
及曝光次数,其中,成交转化次数则可以是对资源的下载次数或购买次数。
个统计周期内的转化率,即计算一个统计周期内的累计转化次数占总曝光次数的比率。因
此,在本实施例中,可以根据每个初始搜索结果对应的历史转化次数和历史展示次数,通过
计算得到每个初始搜索结果的转化特征。
化特征,又由于转化特征的高低会影响到后续排序的效果,因此,在本实施例中,可以基于
转化特征从各排序队列中选取可以获得较好效果的候选区间参与后续的目标决策,从而有
利于提高后续的决策效果。
于转化特征的高低会影响到后续排序的效果,因此,在本实施例中,基于转化特征从各排序
队列中选取可以获得较好效果的候选搜索结果。又由于转化特征中庸的位置一般都是排序
队列中分数置信度欠缺的位置,而这些位置的转化特征会随时间发生显著变化,因此,只有
转化特征中庸位置的元素参与目标决策,才会获得较好的效果,否则,会影响决策效果。基
于此,在本实施例中,可以通过设定转化特征中庸的阈值范围,例如,若转化特征为转化率,
则中庸的阈值范围可以是转化率为40%至70%之间,其上下边界具体可以根据实际场景的需
求而进行调整,本实施例并不对此进行限定。具体地,通过设定的阈值范围在排序队列中确
定转化特征满足该阈值范围的至少一个候选搜索结果,即排除转化特征较高的部分以及转
化特征较低的部分。
一个候选搜索结果位于排序队列的区间,进而将该区间作为候选区间。例如,若某一排序队
列中,转化特征满足设定阈值范围的至少一个候选搜索结果为该排序队列中排在第101至
第499的初始搜索结果,则可以确定该排序队列中第101至第499的区间为对应的候选区间,
排在第101至第499的初始搜索结果则为对应的候选搜索结果。
本实施例是基于决策算法从各候选区间对应的候选搜索结果中确定目标搜索结果,以得到
对应的目标搜索结果队列,而上述候选区间又是基于转化特征从各排序队列中选取的可以
获得较好效果的区间,其不依赖于原排序队列中各初始搜索结果的打分,因此,即使原排序
队列中各初始搜索结果的打分不准,只要排序位置相对可靠,则有利于提高后续的决策效
果,且鲁棒性高。
对应的目标搜索结果队列,具体包括:
又是基于决策算法而确定目标搜索结果队列中的每一个元素,因此,在本实施例中,在运行
决策算法之前,首先需要获取目标搜索结果队列的队列长度,从而对于队列中的每一个位
置,基于决策算法而确定对应位置的元素。本实施例中,目标搜索结果队列的队列长度,一
般是系统给定的超参,比如某一广告推荐系统,在粗排只允许300个候选元素进入到精排过
程,则对于粗排阶段输出的目标搜索结果队列,其队列长度为300。
候选区间对应的候选搜索结果中获取与队列长度对应的目标搜索结果,从而得对应的目标
搜索结果队列。
索结果队列,又由于对于目标搜索结果队列中每一个位置的元素,是基于决策算法选取得
到,因此,相较于传统的集成排序方法,有利于提高整体效果。
具体包括:
应长度的空的目标搜索结果队列,进而对于队列中的每一个位置,可以运行决策算法从各
候选区间的候选搜索结果中选取一个目标搜索结果作为对应位置的元素。
结果队列中的相应位置,直到目标搜索结果队列的最后一个位置被填满,从而得到填满目
标搜索结果的目标搜索结果队列,即得到融合排序后的最终队列。
的相应位置,直到目标搜索结果队列的最后一个位置被填满,从而得到填满目标搜索结果
的目标搜索结果队列。由于本实施例运用决策算法动态的选取每一个元素,因此将集成排
序问题转化为动态决策过程,相比传统的集成排序方法具有较好的效果,且能够发现排序
位置相对靠后的优质元素,从而可以提升整体的业务指标。
定,例如,对于置信区间上界算法,其评价指标可以是相应的回报概率,则目标候选区间可
以是能够获取最大回报概率的区间。
队列是基于相应的业务目标进行排序的,因此,排在靠前的元素其相应的回报概率也更大。
基于此,在本实施例中,每次从目标候选区间对应的候选搜索结果中选取目标搜索结果时,
可以基于候选搜索结果位于原排序队列中的位置依次选取,即选取目标候选区间中的第一
个候选搜索结果。进而判断该候选搜索结果是否已在目标搜索结果队列中,当该候选搜索
结果已存在于目标搜索结果队列中时,则选取目标候选区间中的下一个候选搜索结果,并
进行上述判断。直到找到一个候选搜索结果不位于目标搜索结果队列中时,则将该候选搜
索结果确定为目标搜索结果,并插入到目标搜索结果队列中的相应位置。
S512以及步骤S514,以确定每一个位置的目标搜索结果。
个候选搜索结果确定为目标搜索结果,由于每一个目标搜索结果都是基于决策算法动态的
选取,因此相比传统的集成排序方法具有较好的效果。
搜索结果已被选取,即标识该候选搜索结果已存在于目标搜索结果队列中,从而提高流程
的效果。
列被选取的次数。具体地,队列标识是用于区分不同队列的标记。目标搜索结果位于所属排
序队列中的位置是指该目标搜索结果位于原排序队列中的排序位置。各排序队列被选取的
次数是指目标搜索结果队列中各元素来自不同排序队列的统计,例如,若存在排序队列A和
排序队列B,目标搜索结果队列包括100个元素,其中有60个元素是从排序队列A中选取的,
有40个元素是从排序队列B中选取的,则排序队列A被选取的次数为60,排序队列B被选取的
次数为40。
反馈结果,即目标搜索结果队列中每一个目标搜索结果是否被转化。
结果,更新各排序队列中对应初始搜索结果的转化特征,从而随着系统的运行,能够反哺更
新原排序队列,使得整体效果稳步提升。
统分成,召回、粗排、精排和后处理4个主要部分,然后在每个大类里,按照业务目标,分成小
类,例如,GMV(Gross Merchandise Volume,网站成交金额)类、转化率类、ROI(Return On
Investment,投资回报率)类等多类,每个类别中有m个策略队列组成,且每个类别仅有一个
目标。
立的,因此将动态优选问题,转化为一个序列决策类问题,即基于决策算法求解一个最优序
列。
分,确定融合初始和结束位置,即确定候选区间。
再赘述。
个原队列选取次数(pv),最终队列中每个元素在原队列中的位置(index),以及其他的上下
文信息,例如,请求发起方(系统用户)的特征,决策时所处的阶段,候选元素特征等。
骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1‑图8中的至
少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻
执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进
行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执
行。
的说明即可。
的与各业务目标一一对应的队列;
次数和历史展示次数;根据每个初始搜索结果对应的历史转化次数和历史展示次数,计算
得到所述初始搜索结果的转化特征。
果位于所述排序队列的区间确定为对应的候选区间。
元,被配置为执行基于决策算法从各候选区间对应的候选搜索结果中获取与所述队列长度
对应的目标搜索结果,得对应的目标搜索结果队列。
果中确定一个目标搜索结果;目标搜索结果插入子单元,被配置为执行将所述目标搜索结
果插入所述目标搜索结果队列中的相应位置,直到所述目标搜索结果队列的最后一个位置
被填满,得到填满目标搜索结果的目标搜索结果队列。
未被选取的第一个候选搜索结果,将未被选取的第一个候选搜索结果确定为目标搜索结
果。
索结果所属的排序队列的队列标识、所述目标搜索结果位于所述排序队列中的位置以及各
排序队列被选取的次数;反馈结果获取模块,被配置为执行获取对所述目标搜索结果队列
的反馈结果,所述反馈结果包括所述目标搜索结果队列中每一个所述目标搜索结果是否转
化的结果;更新模块,被配置为执行根据所述目标搜索结果队列的设置信息以及对所述目
标搜索结果队列的反馈结果,更新各排序队列中对应初始搜索结果的转化特征。
个或多个处理器,以及由存储器S22所代表的存储器资源,用于存储可由处理组件S20的执
行的指令,例如应用程序。存储器S22中存储的应用程序可以包括一个或一个以上的每一个
对应于一组指令的模块。此外,处理组件S20被配置为执行指令,以执行上述方法。
子设备S00可以操作基于存储在存储器S22的操作系统,例如Windows Server,Mac OS X,
Unix,Linux,FreeBSD或类似。
是计算机可读存储介质,例如,所述计算机可读存储介质可以是ROM、随机存取存储器
(RAM)、CD‑ROM、磁带、软盘和光数据存储设备等。
例的描述,在此不作一一赘述。
者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识
或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要
求指出。