基于联邦学习的线上信息处理方法、装置、设备及介质转让专利
申请号 : CN202010135042.1
文献号 : CN111340558B
文献日 : 2021-07-27
发明人 : 刘博 , 郑文琛
申请人 : 深圳前海微众银行股份有限公司
摘要 :
权利要求 :
1.一种基于联邦学习的线上信息处理方法,其特征在于,所述基于联邦学习的线上信息处理方法包括:
在接收到资源请求时,提取所述资源请求中的资源特征数据,根据所述资源特征数据针对性地选取对应的预设转化评估模型,其中,针对每个资源方,或者是每个资源,都会预存有针对性的预测转化率的模型;
将所述资源特征数据以及预设本地用户流量数据输入至预设转化评估模型中,得到所述资源请求的预测转化率,其中,所述预设转化评估模型是基于预设流量转化数据通过执行预设联邦流程,对预设待训练预测模型进行迭代训练得到的,所述预设转化评估模型包括预设点击转换评估模型、预设前端评估模型和预设后端转换评估模型,所述预测转化率包括预测点击转化率,预测前端转化率以及预测后端转化率;
根据所述预测转化率,确定所述资源请求对应的潜在目标人群和/或实时竞价数据。
2.如权利要求1所述基于联邦学习的线上信息处理方法,其特征在于,所述预设转化评估模型包括预设后端转化评估模型,所述预设待训练预测模型包括第一预设待训练预测子模型,所述预设联邦流程包括第一预设联邦子流程;
所述将所述资源特征数据以及预设本地用户流量数据输入至预设转化评估模型中,得到所述资源请求的预测转化率,其中,所述预设转化评估模型是基于预设流量转化数据通过执行预设联邦流程,对预设待训练预测模型进行迭代训练得到的步骤包括:将所述资源特征数据以及预设本地用户流量数据输入至所述预设后端转化评估模型中,得到所述资源请求的预测后端转化率,其中,所述预设后端转化评估模型是基于所述预设流量转化数据中的预设流量后端转化数据通过执行第一预设联邦子流程,对所述第一预设待训练预测子模型进行迭代训练得到的。
3.如权利要求2所述基于联邦学习的线上信息处理方法,其特征在于,所述将所述资源特征数据以及预设本地用户流量数据输入至所述预设后端转化评估模型中,得到所述资源请求的预测后端转化率的步骤之前包括:将所述预设流量转化数据中的预设流量后端转化数据迭代发送给预设备选参与方平台,以供所述备选参与方平台基于所述预设流量后端转化数据迭代反馈多个预测参数,其中,所述预设流量后端转化数据至少包括用户的标识号以及表示用户付费与否的后端转化特征标签;
基于所述多个预测参数对所述第一预设待训练预测子模型中的模型参数进行基于所述第一预设联邦子流程的迭代训练,直至所述第一预设待训练预测子模型满足预设训练完成条件,获得所述预设后端转化评估模型。
4.如权利要求3所述基于联邦学习的线上信息处理方法,其特征在于,所述基于所述多个预测参数对所述第一预设待训练预测子模型中的模型参数进行基于所述第一预设联邦子流程的迭代训练,直至所述第一预设待训练预测子模型满足预设训练完成条件,获得所述预设后端转化评估模型的步骤包括:以每个所述备选参与方平台为单位,对所述多个预测参数分别进行加密处理,以分别得到多个加密的预测参数;
基于所述多个加密的预测参数对所述第一预设待训练预测子模型中的模型参数进行基于所述第一预设联邦子流程的迭代训练,直至所述第一预设待训练预测子模型满足预设训练完成条件,获得所述预设后端转化评估模型。
5.如权利要求3所述基于联邦学习的线上信息处理方法,其特征在于,所述将所述预设流量转化数据中的预设流量后端转化数据迭代发送给预设备选参与方平台,以供所述备选参与方平台基于所述预设流量后端转化数据迭代反馈多个预测参数的步骤之前,所述方法还包括:
获取所述资源特征数据中的初始特征导向,根据所述初始特征导向对预设流量转化数据进行初始筛选,得到剩余流量数据;
从所述剩余流量数据中提取所述预设流量后端转化数据。
6.如权利要求5所述基于联邦学习的线上信息处理方法,其特征在于,所述预设转化评估模型包括预设点击转化评估模型与预设前端转化评估模型,所述预设待训练预测模型包括第二预设待训练预测子模型与第三预设待训练预测子模型;
所述根据所述初始特征导向对预设流量转化数据进行初始筛选,得到剩余流量数据步骤之后,所述方法还包括:
从所述剩余流量数据中提取预设流量点击转化数据,根据所述预设流量点击转化数据对第二预设待训练预测子模型进行迭代训练,得到预设点击转化评估模型,将所述资源特征数据以及预设本地用户流量数据输入至所述预设点击转化评估模型中,得到预测点击转化率;
从所述剩余流量数据中提取预设流量前端转化数据,根据所述预设流量前端转化数据对第三预设待训练预测子模型进行迭代训练,得到预设前端转化评估模型,将所述资源特征数据以及预设本地用户流量数据输入至所述预设前端转化评估模型中,得到预测前端转化率;
其中,所述根据所述预测转化率,确定所述资源请求对应的潜在目标人群和/或实时竞价数据和/或实时竞价数据步骤包括:根据所述预测点击转化率,所述预测前端转化率以及所述预测后端转化率,确定所述资源请求对应的潜在目标人群和/或实时竞价数据。
7.如权利要求1‑6任一项所述基于联邦学习的线上信息处理方法,其特征在于:所述将所述资源特征数据以及预设本地用户流量数据输入至预设转化评估模型中,得到所述资源请求的预测转化率的步骤包括:将所述资源特征数据以及预设本地用户流量数据输入至预设评估模型中;
根据所述资源特征数据,从所述预设评估模型中选取所述预设转化评估模型,得到所述资源请求的预测转化率。
8.一种基于联邦学习的线上信息处理装置,其特征在于,所述基于联邦学习的线上信息处理装置包括:
提取模块,用于在接收到资源请求时,提取所述资源请求中的资源特征数据,根据所述资源特征数据针对性地选取对应的预设转化评估模型,其中,针对每个资源方,或者是每个资源,都会预存有针对性的预测转化率的模型;
第一获取模块,用于将所述资源特征数据以及预设本地用户流量数据输入至预设转化评估模型中,得到所述资源请求的预测转化率,其中,所述预设转化评估模型是基于预设流量转化数据通过执行预设联邦流程,对预设待训练预测模型进行迭代训练得到的,所述预设转化评估模型包括预设点击转换评估模型、预设前端评估模型和预设后端转换评估模型,所述预测转化率包括预测点击转化率,预测前端转化率以及预测后端转化率;
竞价模块,用于根据所述预测转化率,确定所述资源请求对应的潜在目标人群和/或实时竞价数据。
9.一种基于联邦学习的线上信息处理设备,其特征在于,所述基于联邦学习的线上信息处理设备包括:存储器、处理器以及存储在存储器上的用于实现所述基于联邦学习的线上信息处理方法的程序,
所述存储器用于存储实现基于联邦学习的线上信息处理方法的程序;
所述处理器用于执行实现所述基于联邦学习的线上信息处理方法的程序,以实现如权利要求1至7中任一项所述基于联邦学习的线上信息处理方法的步骤。
10.一种介质,其特征在于,所述介质上存储有实现基于联邦学习的线上信息处理方法的程序,所述实现基于联邦学习的线上信息处理方法的程序被处理器执行以实现如权利要求1至7中任一项所述基于联邦学习的线上信息处理方法的步骤。
说明书 :
基于联邦学习的线上信息处理方法、装置、设备及介质
技术领域
背景技术
平台”。
无法回传,使得定位潜在目标人群的定位准确性变差,资源推广效率变差。
发明内容
性变差,资源推广成功率变差的技术问题。
过执行预设联邦流程,对预设待训练预测模型进行迭代训练得到的;
据通过执行预设联邦流程,对预设待训练预测模型进行迭代训练得到的步骤包括:
述预设流量转化数据中的预设流量后端转化数据通过执行第一预设联邦子流程,对所述第
一预设待训练预测子模型进行迭代训练得到的。
数,其中,所述预设流量后端转化数据至少包括用户的标识号以及表示用户付费与否的后
端转化特征标签;
练完成条件,获得所述预设后端转化评估模型。
满足预设训练完成条件,获得所述预设后端转化评估模型的步骤包括:
件,获得所述预设后端转化评估模型。
个预测参数的步骤之前,所述方法还包括:
模型;
源特征数据以及预设本地用户流量数据输入至所述预设点击转化评估模型中,得到预测点
击转化率;
源特征数据以及预设本地用户流量数据输入至所述预设前端转化评估模型中,得到预测前
端转化率;
设流量转化数据通过执行预设联邦流程,对预设待训练预测模型进行迭代训练得到的;
训练预测模型包括第一预设待训练预测子模型,所述预设联邦流程包括第一预设联邦子流
程;
模型是基于所述预设流量转化数据中的预设流量后端转化数据通过执行第一预设联邦子
流程,对所述第一预设待训练预测子模型进行迭代训练得到的。
多个预测参数,其中,所述预设流量后端转化数据至少包括用户的标识号以及表示用户付
费与否的后端转化特征标签;
型满足预设训练完成条件,获得所述预设后端转化评估模型。
预设训练完成条件,获得所述预设后端转化评估模型。
模型;
评估模型,将所述资源特征数据以及预设本地用户流量数据输入至所述预设点击转化评估
模型中,得到预测点击转化率;
评估模型,将所述资源特征数据以及预设本地用户流量数据输入至所述预设前端转化评估
模型中,得到预测前端转化率;
及存储在所述存储器上并可在所述处理器上运行的所述基于联邦学习的线上信息处理方
法的程序,所述基于联邦学习的线上信息处理方法的程序被处理器执行时可实现如上述的
基于联邦学习的线上信息处理方法的步骤。
的基于联邦学习的线上信息处理方法的步骤。
的预测转化率,其中,所述预设转化评估模型是基于预设流量转化数据通过执行预设联邦
流程,对预设待训练预测模型进行迭代训练得到的;根据所述预测转化率,确定所述资源请
求对应的潜在目标人群和/或实时竞价数据。在本申请中,所述预设转化评估模型是基于预
设流量转化数据通过执行预设联邦流程,对预设待训练预测模型进行迭代训练得到的,也
即,通过执行预设联邦流程,综合各方数据进行预测转化率的预测,进而实现精准定位潜在
目标人群,此外,通过精准定位潜在目标人群,可以提升资源推广效果,且能够提升资源推
广平台的资源推广成功率。
附图说明
言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
具体实施方式
包括:
化数据通过执行预设联邦流程,对预设待训练预测模型进行迭代训练得到的;
信息处理系统从属于基于联邦学习的线上信息处理设备,需要说明的是,基于联邦学习的
线上信息处理方法实质上是程序化资源采买方法,其中,资源可以为广告,商品等内容,目
前,业界的程序化资源采买方式中至少包括实时竞价(Real Time Bidding、简称RTB)和实
时接口(Real Time Analyzer,简称RTA)两种方式,其中,RTB与RTA都由资源交易平台AdX
(AdExchange)发送潜在曝光流量给需求方平台DSP,其主要区别在于AdX是否智能地优化流
量,RTB模式下,AdX不对流量进行任何选择,RTA模式下,资源交易平台AdX对流量进行选择,
但是RTA模式下对流量进行选择只是涉及点击转化等选择,以便进行资源竞价,而未进行后
端或者是整个资源全链路的转化选择,即为了为资源方或者资源需求方创造真正价值,DSP
依赖于用户在资源主侧的前端表现如加入购物车,后端表现如付费等,对于许多行业,用户
后端表现,前端表现等是极其敏感的商业信息,无法回传,使得资源全链路的效果无法有效
优化。
平台在得到用户流量数据后,会以各个备选参与方平台为单位保存在本地,以进行转化率
的预测,进而确定竞价数据,例如,腾讯在汇集微信,微众银行以及小红书等应用的用户流
量数据后,会统一将用户流量数据(对于需求方平台而言,这部分用户流量数据为预设本地
用户流量数据)以各个备选参与方平台为单位发送给需求方平台,需求方平台会基于资源
交易平台AdX的请求,给各个资源商如广告商发送消息,表明当前存在资源如广告的机会或
者窗口,而各个资源商在接收到存在资源机会或者窗口的消息后,会向需求方平台发送承
接该机会或者窗口的消息,该需求方平台接收该承接的消息后,会确定该资源的转化率,基
于该资源的转化率确定竞价价格即确定实时竞价数据,并发送给资源商,以供所述资源商
或者是资源方确定是否接收该资源投放。
通俗的讲,就是资源内容的身份证,这是出厂时就分配好的,在全世界中是唯一的。通常情
况下,资源特征标签指的是该资源的属性如电影,文艺等。
窗口的。
化数据通过执行预设联邦流程,对预设待训练预测模型进行迭代训练得到的;
化评估模型是基于预设流量转化数据通过执行预设联邦流程,对预设待训练预测模型进行
迭代训练得到的,也即,由于预设转化评估模型是已经训练好的,能够准确进行转化率预测
的模型,因而,将所述资源特征数据以及预设本地用户流量数据输入至预设转化评估模型
中后,可以准确得到所述资源请求的预测转化率,另外,由于所述预设转化评估模型是基于
预设流量转化数据通过执行预设联邦流程,对预设待训练预测模型进行迭代训练得到的,
也即,通过该预设联邦流程,特别地,通过预设纵向联邦流程,参考了全面的数据,因而,能
够准确进行转化率预测,该所述资源请求的预测转化率具体可以指的是在资源发布后,基
于该资源,预测的用户购买资源中的内容的比率。
得到预测转化率的模型,该各个预测转化率的模型都存储在预设评估模型中,因而,在得到
所述资源特征数据后,根据该资源特征数据针对性地选取对应的预设转化评估模型,也即,
选取该资源请求对应的预设转化评估模型,进而,得到预设本地用户流量数据中购买该资
源请求对应的数据内容的概率。在本实施例中,设置预设评估模型,便于对全部的资源进行
预测转化率的确定,提升了资源竞价的便捷性,进而,提升了用户体验。
据通过执行预设联邦流程,对预设待训练预测模型进行迭代训练得到的步骤包括:
是基于所述预设流量转化数据中的预设流量后端转化数据通过执行第一预设联邦子流程,
对所述第一预设待训练预测子模型进行迭代训练得到的。
资源在平台曝光后,用户点击曝光的资源,前端转化为加入购物车,后端转化为付费,而后
续表现为复购行为,显然,后端转化和后续表现为资源主创造了收入,也是需求方平台优化
的目标。
模型中,得到所述资源请求的预测后端转化率,其中,所述预设后端转化评估模型是基于所
述预设流量转化数据中的预设流量后端转化数据通过执行第一预设联邦子流程,对所述第
一预设待训练预测子模型进行迭代训练得到的,也即,在本实施例中,存在专门的后端转化
预估模型,以准确得到后端转化率,在得到后端转化率后,基于后端转化率,可以为准确进
行竞价的确定奠定基础,由于在本实施例中只是通过后端转化率进行竞价,因而,在确保准
确进行竞价的同时(由于获取了竞价的关键性因素),提升定价的效率,另外,需要说明的
是,在本实施例中,由于得到所述预设后端转化评估模型过程中,执行了第一预设联邦子流
程,特别地,通过第一预设纵向联邦子流程,参考了全面的数据,因而,能够准确进行转化率
预测,避免因数据不全面造成的模型不准确的消极影响,以实现精准定位潜在目标人群,此
外,通过精准定位潜在目标人群,可以提升资源推广效果,且能够提升资源推广平台的资源
推广成功率。
测参数,其中,所述预设流量后端转化数据至少包括用户的标识号以及表示用户付费与否
的后端转化特征标签;
到预设流量转化数据(包括训练数据与测试数据)后,将所述预设流量转化数据中的预设流
量后端转化数据迭代发送给预设备选参与方平台,以供所述备选参与方平台基于所述预设
流量后端转化数据迭代反馈多个预测参数,特别地,该多个预设参数是通过加密方式发送
给需求方平台的。
预设训练完成条件,获得所述预设后端转化评估模型。
练完成条件,获得所述预设后端转化评估模型,预设训练完成条件可以是迭代达到预设次
数,或者是预设损失函数收敛,获得所述预设后端转化评估模型。
源请求的对应的潜在目标人群和/或实时竞价数据,例如,若点击转化率为百分之五十,确
定对应潜在目标人群为A类型用户,实时竞价数据为竞价价格为M,若点击转化率为百分之
七十五,确定对应潜在目标人群为B类型人,实时竞价数据为竞价价格为N,其中,N大于M。在
本实施例中,用户特征数据可以通过联邦流程间接回传,实现精准定位潜在目标人群,此
外,通过精准定位潜在目标人群,可以提升资源推广效果,且能够提升资源推广平台的资源
推广成功率。
的预测转化率,其中,所述预设转化评估模型是基于预设流量转化数据通过执行预设联邦
流程,对预设待训练预测模型进行迭代训练得到的;根据所述预测转化率,确定所述资源请
求对应的潜在目标人群和/或实时竞价数据。在本申请中,所述预设转化评估模型是基于预
设流量转化数据通过执行预设联邦流程,对预设待训练预测模型进行迭代训练得到的,也
即,通过执行预设联邦流程,综合各方数据进行预测转化率的预测,进而实现精准定位潜在
目标人群,此外,通过精准定位潜在目标人群,可以提升资源推广效果,且能够提升资源推
广平台的资源推广成功率。
数进行基于所述第一预设联邦子流程的迭代训练,直至所述第一预设待训练预测子模型满
足预设训练完成条件,获得所述预设后端转化评估模型的步骤包括:
小值的指向方向,也即,梯度的负方向为预设函数值下降最快的方向,针对每个备选参与方
平台而言,分别将该备选参与方平台中的预测参数(可以为多个)进行加密,得到加密的预
测参数,由于存在多个备选参与方平台,因而得到多个加密的预测参数(针对一个备选参与
方平台而言,也可以存在多个加密的预测参数)。
型满足预设训练完成条件,获得所述预设后端转化评估模型。
预设训练完成条件,获得所述预设后端转化评估模型,具体地,根据加密的多个预测参数对
模型参数进行更新训练,因而,确保获得所述预设后端转化评估模型过程中数据的安全性
与保密性。
络,分解机等联邦学习,由于在完全加密的空间下进行通信,同时,通信内容不仅包括所需
的梯度,因此,在安全的状态下联邦学习获得模型参数θ。
预设流量后端转化数据,在本实施例中,准确基于第一预设联邦子流程准确得到预设后端
转化评估模型,提升模型测试的准确率。
参数的步骤之前包括:
到剩余流量数据,例如,某资源主仅针对广东地区投放资源,那么非广东地区的流量就会被
过滤模块排除,得到剩余流量数据。
据,以进行对应模型的训练。
源特征数据以及预设本地用户流量数据输入至所述预设点击转化评估模型中,得到预测点
击转化率;
(点击|曝光)×P(前端转化|点击)×P(后端转化|前端转化)。在本实施例中,从所述剩余流
量数据中提取预设流量点击转化数据,根据所述预设流量点击转化数据对第二预设待训练
预测子模型进行迭代训练,得到预设点击转化评估模型,将所述资源特征数据以及预设本
地用户流量数据输入至所述预设点击转化评估模型中,得到预测点击转化率,其中,根据所
述预设流量点击转化数据基于预设第二联邦子流程对第二预设待训练预测子模型进行迭
代训练。
源特征数据以及预设本地用户流量数据输入至所述预设前端转化评估模型中,得到预测前
端转化率;
模型,将所述资源特征数据以及预设本地用户流量数据输入至所述预设点击转化评估模型
中,得到预测点击转化率,其中,根据所述预设流量前端转化数据基于预设第三联邦子流程
对第三预设待训练预测子模型进行迭代训练。
型,将所述资源特征数据以及预设本地用户流量数据输入至所述预设点击转化评估模型
中,得到预测点击转化率;从所述剩余流量数据中提取预设流量前端转化数据,根据所述预
设流量前端转化数据对第三预设待训练预测子模型进行迭代训练,得到预设前端转化评估
模型,将所述资源特征数据以及预设本地用户流量数据输入至所述预设前端转化评估模型
中,得到预测前端转化率;其中,所述根据所述预测转化率,确定所述资源请求对应的潜在
目标人群和/或实时竞价数据步骤包括:根据所述预测点击转化率,所述预测前端转化率以
及所述预测后端转化率,确定所述资源请求的实时竞价数据。在本实施例中,实现全面预测
转化率。
间的连接通信。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non‑volatile
memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设
备。
接口可以包括显示屏(Display)、输入子模块比如键盘(Keyboard),可选矩形用户接口还可
以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口
(如WI‑FI接口)。
件,或者组合某些部件,或者不同的部件布置。
上信息处理设备硬件和软件资源的程序,支持基于联邦学习的线上信息处理程序以及其它
软件和/或程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信,以及与
基于联邦学习的线上信息处理系统中其它硬件和软件之间通信。
线上信息处理方法的步骤。
设流量转化数据通过执行预设联邦流程,对预设待训练预测模型进行迭代训练得到的;
训练预测模型包括第一预设待训练预测子模型,所述预设联邦流程包括第一预设联邦子流
程;
模型是基于所述预设流量转化数据中的预设流量后端转化数据通过执行第一预设联邦子
流程,对所述第一预设待训练预测子模型进行迭代训练得到的。
多个预测参数,其中,所述预设流量后端转化数据至少包括用户的标识号以及表示用户付
费与否的后端转化特征标签;
型满足预设训练完成条件,获得所述预设后端转化评估模型。
预设训练完成条件,获得所述预设后端转化评估模型。
模型;
评估模型,将所述资源特征数据以及预设本地用户流量数据输入至所述预设点击转化评估
模型中,得到预测点击转化率;
评估模型,将所述资源特征数据以及预设本地用户流量数据输入至所述预设前端转化评估
模型中,得到预测前端转化率;
设备,所述基于联邦学习的线上信息处理装置包括:
特征表示变量进行加密;
述的基于联邦学习的线上信息处理方法的步骤。
术领域,均同理包括在本申请的专利处理范围内。