联邦模型训练、客户画像方法、装置、设备及介质转让专利

申请号 : CN202110835357.1

文献号 : CN113283185B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 黄宇翔王健宗李泽远

申请人 : 平安科技(深圳)有限公司

摘要 :

本发明涉及用户画像技术领域,提供一种联邦模型训练、客户画像方法、装置、设备及介质,方法包括:通过获取参与方清单和初始客户画像联邦模型,并按照预设筛选方案,从参与方清单中筛选出合格参与方;向各合格参与方发送初始客户画像联邦模型;接收返回的模型参数;运用MPI并行方法,通过恶意参数检测模型进行异常特征提取,根据提取的异常特征输出各模型参数的识别结果;进行恶意参数过滤处理,得到最终正常参数;进行更新及联邦学习,得到全局客户画像联邦模型。本发明实现了运用MPI并行方法,通过恶意参数检测模型进行异常特征提取,以及恶意参数过滤处理,自动去除恶意参与方提供的恶意参数,提高联邦学习建模的效率和精度。

权利要求 :

1.一种联邦模型训练方法,其特征在于,包括:获取参与方清单和初始客户画像联邦模型,并按照预设筛选方案,从所述参与方清单中筛选出合格参与方;

向各所述合格参与方发送所述初始客户画像联邦模型;

接收各所述合格参与方返回的模型参数;所述模型参数为所述合格参与方对接收的所述初始客户画像联邦模型进行本地训练完后获得;

运用MPI并行方法,通过恶意参数检测模型对各所述模型参数进行异常特征提取,根据提取的异常特征输出各所述模型参数的识别结果;

根据输出的识别结果,对各所述模型参数进行恶意参数过滤处理,得到最终正常参数;

根据所述最终正常参数,对所述初始客户画像联邦模型进行更新及联邦学习,得到全局客户画像联邦模型;

所述运用MPI并行方法,通过恶意参数检测模型对各所述模型参数进行异常特征提取,根据提取的异常特征输出各所述模型参数的识别结果,包括:运用所述MPI并行方法和决策树方法,通过所述恶意参数检测模型并行对各个所述模型参数进行所述异常特征提取,确定出所有所述模型参数中的可疑参数和第一正常参数;

对所有所述可疑参数进行二次恶意识别,识别出所有所述可疑参数中的恶意参数和第二正常参数;

根据所有所述第一正常参数、所有所述第二正常参数和所有所述恶意参数,确定出各所述模型参数的识别结果。

2.如权利要求1所述的联邦模型训练方法,其特征在于,所述根据所述最终正常参数,对所述初始客户画像联邦模型进行训练,得到全局客户画像联邦模型之后,包括:运用MPI发送方法,向各所述合格参与方发送所述全局客户画像联邦模型中的全局模型参数;

接收各所述合格参与方返回的更新模型参数;所述更新模型参数为所述合格参与方在接收完所述全局模型参数并更新初始客户画像联邦模型后训练获得;

运用所述MPI并行方法,通过所述恶意参数检测模型对各所述更新模型参数进行异常特征提取,根据提取的异常特征输出各所述更新模型参数的更新识别结果;

根据输出的更新识别结果,对各所述模型参数进行恶意参数过滤处理,得到待训练更新参数;

根据所述待训练更新参数,对所述全局客户画像联邦模型进行更新及联邦学习,得到更新后的全局客户画像联邦模型。

3.如权利要求1所述的联邦模型训练方法,其特征在于,所述运用所述MPI并行方法和决策树方法,通过所述恶意参数检测模型并行对各个所述模型参数进行所述异常特征提取,确定出所有所述模型参数中的可疑参数和第一正常参数,包括:通过所述MPI并行方法,对各所述模型参数分配进程标识,得到各所述模型参数的进程标识;

将各所述模型参数同步多线程输入与其进程标识对应的所述恶意参数检测模型中;

运用二分决策树方法,对各所述模型参数机进行异常特征的评估分类,预测出个各所述模型参数的预测结果;

根据所有所述预测结果,确定出所有所述模型参数中的可疑参数和第一正常参数。

4.如权利要求1所述的联邦模型训练方法,其特征在于,所述对所有所述可疑参数进行二次恶意识别,识别出所有所述可疑参数中的恶意参数和第二正常参数,包括:将所有所述可疑参数输入恶意参数识别模型,通过恶意参数识别模型对所有所述可疑参数进行恶意关联特征识别,得到各所述可疑参数的第一识别结果;

对所有所述可疑参数进行黑名单用户识别,得到各所述可疑参数的第二识别结果;

根据各所述可疑参数的所述第一识别结果和所述第二识别结果,确定出所有所述可疑参数中的所述恶意参数和所述第二正常参数。

5.一种客户画像方法,其特征在于,包括:接收客户的画像请求,获取所述画像请求中的客户信息;

将所述客户信息输入通过如权利要求1至4任一项所述联邦模型训练方法获得的全局客户画像联邦模型;

通过所述全局客户画像联邦模型对所述客户信息进行客户画像处理,得到所述客户信息的客户画像结果;所述客户画像结果表征了所述客户的客户类别。

6.一种联邦模型训练装置,其特征在于,包括:获取模块,用于获取参与方清单和初始客户画像联邦模型,并按照预设筛选方案,从所述参与方清单中筛选出合格参与方;

发送模块,用于向各所述合格参与方发送所述初始客户画像联邦模型;

接收模块,用于接收各所述合格参与方返回的模型参数;所述模型参数为所述合格参与方对接收的所述初始客户画像联邦模型进行本地训练完后获得;

提取模块,用于运用MPI并行方法,通过恶意参数检测模型对各所述模型参数进行异常特征提取,根据提取的异常特征输出各所述模型参数的识别结果;所述运用MPI并行方法,通过恶意参数检测模型对各所述模型参数进行异常特征提取,根据提取的异常特征输出各所述模型参数的识别结果,包括:运用所述MPI并行方法和决策树方法,通过所述恶意参数检测模型并行对各个所述模型参数进行所述异常特征提取,确定出所有所述模型参数中的可疑参数和第一正常参数;

对所有所述可疑参数进行二次恶意识别,识别出所有所述可疑参数中的恶意参数和第二正常参数;

根据所有所述第一正常参数、所有所述第二正常参数和所有所述恶意参数,确定出各所述模型参数的识别结果;

过滤模块,用于根据输出的识别结果,对各所述模型参数进行恶意参数过滤处理,得到最终正常参数;

训练模块,用于根据所述最终正常参数,对所述初始客户画像联邦模型进行更新及联邦学习,得到全局客户画像联邦模型。

7.一种客户画像装置,其特征在于,包括:请求模块,用于接收客户的画像请求,获取所述画像请求中的客户信息;

输入模块,用于将所述客户信息输入通过如权利要求1至4任一项所述联邦模型训练方法获得的全局客户画像联邦模型;

识别模块,用于通过所述全局客户画像联邦模型对所述客户信息进行客户画像处理,得到所述客户信息的客户画像结果;所述客户画像结果表征了所述客户的客户类别。

8.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至

4任一项所述联邦模型训练方法,或者所述处理器执行所述计算机程序时实现如权利要求5所述客户画像方法。

9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述联邦模型训练方法,或者所述处理器执行所述计算机程序时实现如权利要求5所述客户画像方法。

说明书 :

联邦模型训练、客户画像方法、装置、设备及介质

技术领域

[0001] 本发明涉及用户画像技术领域,尤其涉及一种联邦模型训练、客户画像方法、装置、计算机设备及存储介质。 

背景技术

[0002] 随着机器学习的日益普及,大数据驱动的智能应用将很快应用于我们日常生活的各个方面,包括智能语音,医疗,交通等等。但是,在传统的机器学习方法中,保障训练模型
的精确性的关键是收集足够数量的数据,而数据之中可能包含有关个人的私人信息,例如
个人就医信息或者个人行程信息等,这引发了公众对于个人隐私受到损害的种种担忧。最
近,联邦学习因其在隐私保护方面的显着优势受到越来越多的广泛应用,通过直接将各参
与方的模型参数进行聚合,进而将聚合获得的模型参数训练全局联邦模型,再将训练后的
全局模型参数再反馈至各参与方,以供各参与方对本地模型进行更新,但是,若各参与方中
存在恶意参与方,且恶意参与方在本地训练过程中提供虚假或者恶意的模型参数,将导致
全局模型参数的有效性变低,进而将会直接影响整体的联邦模型质量,导致整个联邦学习
过程失效,进而导致联邦学习建模的效率和精度变低。

发明内容

[0003] 本发明提供一种联邦模型训练、客户画像方法、装置、计算机设备及存储介质,实现了通过恶意参数检测模型对接收的模型参数进行异常特征提取,并恶意参数过滤处理,
得到最终正常参数,以及根据正常参数进行参数更新和训练,得到全局客户画像联邦模型,
自动去除恶意参与方提供的恶意参数,提高了联邦学习建模的效率和精度。
[0004] 一种联邦模型训练方法,包括:
[0005] 获取参与方清单和初始客户画像联邦模型,并按照预设筛选方案,从所述参与方清单中筛选出合格参与方;
[0006] 向各所述合格参与方发送所述初始客户画像联邦模型;
[0007] 接收各所述合格参与方返回的模型参数;所述模型参数为所述合格参与方对接收的所述初始客户画像联邦模型进行本地训练完后获得;
[0008] 运用MPI并行方法,通过恶意参数检测模型对各所述模型参数进行异常特征提取,根据提取的异常特征输出各所述模型参数的识别结果;
[0009] 根据输出的识别结果,对各所述模型参数进行恶意参数过滤处理,得到最终正常参数;
[0010] 根据所述最终正常参数,对所述初始客户画像联邦模型进行更新及联邦学习,得到全局客户画像联邦模型。
[0011] 一种客户画像方法,包括:
[0012] 接收画像请求,获取所述画像请求中的客户信息;
[0013] 将所述客户信息输入通过如上述联邦模型训练方法获得的全局客户画像联邦模型;
[0014] 通过所述全局客户画像联邦模型对所述客户信息进行客户画像处理,得到所述客户信息的客户画像结果;所述客户画像结果。
[0015] 一种联邦模型训练装置,包括:
[0016] 获取模块,用于获取参与方清单和初始客户画像联邦模型,并按照预设筛选方案,从所述参与方清单中筛选出合格参与方;
[0017] 发送模块,用于向各所述合格参与方发送所述初始客户画像联邦模型;
[0018] 接收模块,用于接收各所述合格参与方返回的模型参数;所述模型参数为所述合格参与方对接收的所述初始客户画像联邦模型进行本地训练完后获得;
[0019] 提取模块,用于运用MPI并行方法,通过恶意参数检测模型对各所述模型参数进行异常特征提取,根据提取的异常特征输出各所述模型参数的识别结果;
[0020] 过滤模块,用于根据输出的识别结果,对各所述模型参数进行恶意参数过滤处理,得到最终正常参数;
[0021] 训练模块,用于根据所述最终正常参数,对所述初始客户画像联邦模型进行更新及联邦学习,得到全局客户画像联邦模型。
[0022] 一种客户画像装置,包括:
[0023] 请求模块,用于接收画像请求,获取所述画像请求中的客户信息;
[0024] 输入模块,用于将所述客户信息输入通过如上述联邦模型训练方法获得的全局客户画像联邦模型;
[0025] 识别模块,用于通过所述全局客户画像联邦模型对所述客户信息进行客户画像处理,得到所述客户信息的客户画像结果;所述客户画像结果。
[0026] 一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述联邦模型训练方法的
步骤,或者所述处理器执行所述计算机程序时实现上述客户画像方法的步骤。
[0027] 一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其中,所述计算机程序被处理器执行时实现上述联邦模型训练方法的步骤,或者所述计算机程序被
处理器执行所述计算机程序时实现上述客户画像方法的步骤。
[0028] 本发明提供的联邦模型训练方法、装置、计算机设备及存储介质,通过获取参与方清单和初始客户画像联邦模型,并按照预设筛选方案,从所述参与方清单中筛选出合格参
与方;向各所述合格参与方发送所述初始客户画像联邦模型;接收各所述合格参与方返回
的模型参数;运用MPI并行方法,通过恶意参数检测模型对各所述模型参数进行异常特征提
取,根据提取的异常特征输出各所述模型参数的识别结果;根据输出的识别结果,对各所述
模型参数进行恶意参数过滤处理,得到最终正常参数;根据所述最终正常参数,对所述初始
客户画像联邦模型进行更新及联邦学习,得到全局客户画像联邦模型,如此,实现了通过预
设筛选方案筛选出合格参与方,接收各合格参与方返回的模型参数,并运用MPI并行方法,
通过恶意参数检测模型进行异常特征提取,以及恶意参数过滤处理,自动获得正常参数,能
够基于有效的正常参数进行更新及联邦学习,快速地、准确地训练得到全局客户画像联邦
模型,自动去除恶意参与方提供的恶意参数,提高了联邦学习建模的效率和精度,节省了成
本,缩短了联邦学习建模周期,能够快速地应用至场景中。
[0029] 本发明提供的客户画像方法、装置、计算机设备及存储介质,通过接收画像请求,获取所述画像请求中的客户信息;将所述客户信息输入通过上述联邦模型训练方法获得的
全局客户画像联邦模型;通过所述全局客户画像联邦模型对所述客户信息进行客户画像处
理,得到所述客户信息的客户画像结果,如此,实现了通过全局客户画像联邦模型能够快速
地对客户进行客户画像处理,自动识别出客户的客户类别,无需人工识别,减少人工识别的
工作量,提高了客户画像的效率和质量。

附图说明

[0030] 为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施
例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图
获得其他的附图。
[0031] 图1是本发明一实施例中联邦模型训练方法或客户画像方法的应用环境示意图;
[0032] 图2是本发明一实施例中联邦模型训练方法的流程图;
[0033] 图3是本发明一实施例中联邦模型训练方法的步骤S40的流程图;
[0034] 图4是本发明一实施例中客户画像方法的流程图;
[0035] 图5是本发明一实施例中联邦模型训练装置的原理框图;
[0036] 图6是本发明一实施例中客户画像装置的原理框图;
[0037] 图7是本发明一实施例中计算机设备的示意图。

具体实施方式

[0038] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发
明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施
例,都属于本发明保护的范围。
[0039] 本发明提供的联邦模型训练方法,可应用在如图1的应用环境中,其中,客户端(计算机设备)通过网络与服务器进行通信。其中,客户端(计算机设备)包括但不限于为各种个
人计算机、笔记本电脑、智能手机、平板电脑、摄像头和便携式可穿戴设备。服务器可以用独
立的服务器或者是多个服务器组成的服务器集群来实现。
[0040] 本发明通过客户端(服务中心)执行。
[0041] 在一实施例中,如图2所示,提供一种联邦模型训练方法,其技术方案主要包括以下步骤S10‑S60:
[0042] S10,获取参与方清单和初始客户画像联邦模型,并按照预设筛选方案,从所述参与方清单中筛选出合格参与方。
[0043] 可理解地,所述参与方清单为同意参与训练的终端或者客户端的全集,所述初始客户画像联邦模型为将要进行联邦学习及训练的模型,所述初始客户画像联邦模型可以为
从历史的联邦模型库中迁移的历史训练完成的神经网络模型,所述预设筛选方案可根据需
求设定,比如预设筛选方案为在所述参与方清单中去除历史黑名单中的参与方(因为历史
黑名单中的参与方发送的恶意参数的风险较高),或者依据一定的规则选取终端或客户端,
或者在所述参与方清单中选择同一以及相邻的集群下的客户端等,其中,一定的规则可以
设定为选取终端响应时长低于阈值的规则,因为某一客户端的终端响应时长大于或者等于
阈值,说明该客户端的网络信号不稳定或者带宽受限,对于联邦学习的效率存在影响,所以
选取终端响应时长低于阈值的客户端,有利于所述初始客户画像联邦模型的联邦学习,所
述合格参与方为参与所述初始客户画像联邦模型的终端或者客户端。
[0044] S20,向各所述合格参与方发送所述初始客户画像联邦模型。
[0045] 可理解地,发送的方式可以根据需求设定,比如通过Docker镜像推送技术,向各所述参与终端发送所述初始客户画像联邦模型,所述Docker镜像推送技术为将所述初始客户
画像联邦模型传输至Docker容器(为一个开源的应用容器引擎),该Docker容器将其转成镜
像文件,再将该镜像文件通过该Docker容器推送至各个合格参与方的终端,提高了传输速
度和保证了初始客户画像联邦模型的安全性、完整性及正确性。
[0046] S30,接收各所述合格参与方返回的模型参数;所述模型参数为所述合格参与方对接收的所述初始客户画像联邦模型进行本地训练完后获得。
[0047] 可理解地,所述合格参与方根据接收到的所述初始客户画像联邦模型,所述合格参与方在本地进行训练,即通过本地的与所述初始客户画像联邦模型相匹配的样本进行训
练,不断学习客户特征,训练迭代接收到的初始客户画像联邦模型中的参数,直至该初始客
户画像联邦模型达到预设收敛条件,停止训练,此时将收敛后的初始客户画像联邦模型的
权重和参数记录为所述模型参数,所述模型参数为所述合格参与方对接收的所述初始客户
画像联邦模型进行本地训练完后获得。
[0048] 在一实施例中,所述接收各所述合格参与方返回的模型参数之前,所述合格参与方在其存储数据中查找与所述初始客户画像联邦模型相匹配的样本,查找的过程可以根据
需求设定,比如人为选择,或者通过自然语言识别模型检索所有存储数据中与所述初始客
户画像联邦模型的输入描述相匹配的所述样本,例如:初始客户画像联邦模型的输入描述
为个人就医信息,则在存储数据库中运用文本相似度算法,查找“客户”“就医”“历史记录”
等相匹配内容的客户信息作为样本,通过将查找到的样本输入该初始客户画像联邦模型
中,进行训练学习,学习获得该合格参与方的所述模型参数,如此,能够自动查找出匹配的
样本进行训练,实现快速获得模型参数的效果,无需人工选取样本,减少了人工操作,提高
了效率。
[0049] S40,运用MPI并行方法,通过恶意参数检测模型对各所述模型参数进行异常特征提取,根据提取的异常特征输出各所述模型参数的识别结果。
[0050] 可理解地,所述MPI(Message Passing Interface,消息传递接口库)并行方法为一种基于消息传递的可跨语言的并行编程技术,支持点对点通信和广播通信的方法,通过
所述MPI并行方法可以并行执行多个进程,并不相互干扰,能够提高执行效率,运用MPI并行
方法,为每个所述合格参与方返回的所述模型参数增加进程标识,相应地给各个所述合格
参与方添加唯一标识,将所有增加了进程标识的所述模型参数输入进程组中,根据进程组
中的各个进程标识并行输入与各进程标识对应的客户端(服务中心)的所述恶意参数检测
模型中。
[0051] 其中,所述恶意参数检测模型为训练完成的用于识别与恶意参数相似的异常特征的检测模型,通过所述恶意参数检测模型并行对各个所述模型参数进行所述异常特征提
取,所述异常特征为具有与恶意参数相似的特征,所述恶意参数为历史收集的对训练付出
远离真实的目标结果且对训练产生不良现象的参数,例如恶意参数为参数幅度跨度大,或
者模型参数精度越来越不精确等,输出各所述模型参数的识别结果的过程为确定出所有所
述模型参数中的可疑参数,再对所有所述可疑参数进行二次恶意识别,最终识别出所有模
型参数中的恶意参数和最终正常参数的识别过程,所述识别结果表征了各个所述模型参数
中哪些是最终正常参数哪些是恶意参数的结果。
[0052] 在一实施例中,如图3所示,所述步骤S40中,即所述运用MPI并行方法,通过恶意参数检测模型对各所述模型参数进行异常特征提取,根据提取的异常特征输出各所述模型参
数的识别结果,包括:
[0053] S401,运用所述MPI并行方法和决策树方法,通过所述恶意参数检测模型并行对各个所述模型参数进行所述异常特征提取,确定出所有所述模型参数中的可疑参数和第一正
常参数。
[0054] 可理解地,所述决策树方法为是通过构成树状结构以判断其可行性的决策分析方法,是直观运用概率分析的一种图解法,在机器学习中,决策树方法构成一种预测模型,该
预测模型代表的是对象属性与对象值之间的一种映射关系,最终预测出评估值,通过评估
值可以确定出对象属性所属的类别,所述恶意参数检测模型为通过所述决策树方法构建的
预测模型,各所述模型参数输入所述恶意参数检测模型中,通过所述恶意参数检测模型对
各所述模型参数进行异常特征识别,运用决策树方法中的不断分裂所述模型参数中的属
性,最终得到评估值,从而预测出该模型参数是所述可疑参数或者所述第一正常参数,即将
大于预设阈值的所述评估值所对应的所述模型参数确定为所述可疑参数,将小于或者等于
所述预设阈值的所述评估值对应的所述模型参数确定为所述第一正常参数,所述可疑参数
为具有所述异常特征的参数,所述可疑参数属于与恶意参数十分相似的参数,所述第一正
常参数为不具有所述异常特征的参数,所述第一正常参数为初步预测出的正常参数。
[0055] 在一实例中,所述步骤S401中,即所述运用所述MPI并行方法和决策树方法,通过所述恶意参数检测模型并行对各个所述模型参数进行所述异常特征提取,确定出所有所述
模型参数中的可疑参数和第一正常参数,包括:
[0056] 通过所述MPI并行方法,对各所述模型参数分配进程标识,得到各所述模型参数的进程标识。
[0057] 可理解地,运用所述MPI并行方法,给每个所述模型参数分配一个唯一的所述进程标识,通过所述进程标识可以区分出客户端的进程组中的进程传输或者处理通道,如此,能
够在并行处理中不出现混合传输的问题,通过所述MPI并行方法可以实现将各所述模型参
数汇聚在所述进程组中,汇聚后所有添加了进程标识的所述模型参数在同一时刻输入所述
恶意参数检测模型中。
[0058] 将各所述模型参数同步多线程输入与其进程标识对应的所述恶意参数检测模型中。
[0059] 可理解地,一个所述进程标识对应一个所述恶意参数检测模型,不同进程标识所对应的所述恶意参数检测模型可以相同。
[0060] 运用二分决策树方法,对各所述模型参数机进行异常特征的评估分类,预测出个各所述模型参数的预测结果。
[0061] 可理解地,所述恶意参数检测模型为通过建立多个(例如:K个)分类与回归(Classification and Regression Trees,CART)树的机器学习模型,每个CART树运用所述
二分决策树方法不断分裂叶子节点,不断对所述异常特征进行提取及评估所述异常特征的
评估值,例如:假设一个模型参数为 , 为第 个参数的特征数据,  为判别
结果(第一正常参数、可疑参数等),CART树为每片叶子节点分类后分配分值,最后将每个
CART树的分值相加获得总得分,并通过K个加法函数进行评估,所述加法函数为:
[0062]
[0063] 其中, 表示具有叶子结点权重的独立树结构, 表示第 个参数 在第K颗树中落在叶子结点上的权重值, 为 颗树的总体空间, 为模型参数的第i个参数的评估
值,将所述模型参数下的所有参数的所述评估值汇聚成一个数组,得到该模型参数的评估
值,将其记录为该模型参数的预测结果。
[0064] 其中,所述二分决策树方法为通过样本集中的属性学习异常特征,通过“是”和“否”两分类的分裂方式不断构建(包括选取最优子树、决策剪枝等操作),生成决策树的方
法。
[0065] 根据所有所述预测结果,确定出所有所述模型参数中的可疑参数和第一正常参数。
[0066] 可理解地,将大于所述预设阈值的所述预测结果中的模型参数中的参数的所述评估值记录为所述可疑参数,将小于或者等于所述预设阈值的所述预测结果中的模型参数中
的参数的所述评估值记录为所述第一正常参数。
[0067] 本发明实现了通过所述MPI并行方法,对各所述模型参数分配进程标识,得到各所述模型参数的进程标识;将各所述模型参数同步多线程输入与其进程标识对应的所述恶意
参数检测模型中;运用二分决策树方法,对各所述模型参数机进行异常特征的评估分类,预
测出个各所述模型参数的预测结果;根据所有所述预测结果,确定出所有所述模型参数中
的可疑参数和第一正常参数,如此,能够运用MPI并行方法和二分决策树方法,自动预测出
所有模型参数中哪些为可疑参数哪些为第一正常参数,无需人工识别,直接通过异常特征
的评估分类可以评估出各模型参数中是否包含有可疑的恶意参数,提高了可疑参数识别的
准确性和可靠性,为后续的恶意参数识别提供了数据基础。
[0068] S402,对所有所述可疑参数进行二次恶意识别,识别出所有所述可疑参数中的恶意参数和第二正常参数。
[0069] 可理解地,所述二次恶意识别为对所有所述可疑参数进行恶意关联特征识别及黑名单用户识别的识别过程,所述恶意参数识别为对所有所述可疑参数中相互关联的参数进
行相互关联特征提取,根据提取的相互关联特征确定出是否为恶意参数的第一识别结果的
识别过程,所述黑名单用户识别为判断所有所述可疑参数所对应的所述合格参与方是否在
黑名单用户之列或者与黑名单用户之列的用户存在关联关系(例如:同属于一个集群,或者
定位同属一个网点位置等等)的识别过程,通过所述二次恶意识别能够确定出所有所述可
疑参数中的所述恶意参数和所述第二正常参数,所述恶意参数为对联邦模型的学习具有不
利影响的参数,所述第二正常参数为可疑参数中可用于联邦模型学习的参数,即所述可疑
参数中排除所述恶意参数就可获得所述第二正常参数。
[0070] 在一实施例中,所述步骤S402中,即所述对所有所述可疑参数进行二次恶意识别,识别出所有所述可疑参数中的恶意参数和第二正常参数,包括:
[0071] 将所有所述可疑参数输入恶意参数识别模型,通过恶意参数识别模型对所有所述可疑参数进行恶意关联特征识别,得到各所述可疑参数的第一识别结果。
[0072] 可理解地,所述恶意参数识别模型为训练完成的通过识别参数之间的恶意关联特征进行识别出恶意参数的模型,所述恶意参数识别模型可以包括多个子神经网络模型,所
述子神经网络模型的个数为根据恶意关联的组合个数相同,即一种恶意关联的组合方式训
练一个所述子神经网络模型,一个所述子神经网络可以提取输入的所述可疑参数中与其对
应的恶意关联的组合方式的参数进行恶意关联特征识别,识别出该可疑参数针对与该恶意
关联的组合方式的参数是否为恶意参数的概率值,将与该可疑参数对应的所有概率值进行
求和取均值,得到该可疑参数的所述第一识别结果。
[0073] 其中,所述恶意关联特征识别为两两参数之间的关联性具有的恶意方式的特征,例如:两两参数之间的比例关系超出了某一范围等等。
[0074] 对所有所述可疑参数进行黑名单用户识别,得到各所述可疑参数的第二识别结果。
[0075] 可理解地,所述黑名单用户识别为通过识别出所述可疑参数所对应的所述合格参与方,判断该合格参与方是否在黑名单之列或者与黑名单用户之列的用户存在关联关系
(例如:同属于一个集群,或者定位同属一个网点位置等等)的识别过程,从而得到所述可疑
参数是否为恶意参数的所述第二识别结果。
[0076] 根据各所述可疑参数的所述第一识别结果和所述第二识别结果,确定出所有所述可疑参数中的所述恶意参数和所述第二正常参数。
[0077] 可理解地,将所述第一识别结果中为恶意参数所对应的所述可疑参数或者所述第二识别结果中为恶意参数所对应的所述可疑参数,确定为所有所述可疑参数中的所述恶意
参数,去除所有恶意参数后的所有所述可疑参数记录为所述正常参数。
[0078] 本发明实现了通过将所有所述可疑参数输入恶意参数识别模型,通过恶意参数识别模型对所有所述可疑参数进行恶意关联特征识别,得到各所述可疑参数的第一识别结
果;对所有所述可疑参数进行黑名单用户识别,得到各所述可疑参数的第二识别结果;根据
各所述可疑参数的所述第一识别结果和所述第二识别结果,确定出所有所述可疑参数中的
所述恶意参数和所述第二正常参数,如此,实现了通过恶意关联特征识别和黑名单用户识
别,自动进行二次恶意识别,能够准确地识别出恶意参数,提高了识别准确性。
[0079] S403,根据所有所述第一正常参数、所有所述第二正常参数和所有所述恶意参数,确定出各所述模型参数的识别结果。
[0080] 可理解地,根据所有所述第一正常参数、所有所述第二正常参数和所有所述恶意参数,可以得到各个所述模型参数中的各个参数的识别结果,即该参数是第一正常参数、第
二正常参数还是恶意参数。
[0081] 本发明是实现了通过运用所述MPI并行方法和决策树方法,通过所述恶意参数检测模型并行对各个所述模型参数进行所述异常特征提取,确定出所有所述模型参数中的可
疑参数和第一正常参数;对所有所述可疑参数进行二次恶意识别,识别出所有所述可疑参
数中的恶意参数和第二正常参数;根据所有所述第一正常参数、所有所述第二正常参数和
所有所述恶意参数,确定出各所述模型参数的识别结果,如此,实现了自动识别出模型参数
中是否存在恶意参数的识别结果,无需人工识别,提高了识别准确性。
[0082] S50,根据输出的识别结果,对各所述模型参数进行恶意参数过滤处理,得到最终正常参数。
[0083] 可理解地,所述恶意参数过滤处理为将所有恶意参数所对应的参数从所有所述模型参数中进行去除的处理过程,最终得到所述最终正常参数,所述最终正常参数为与所述
第一正常参数所对应的参数和与所述第二正常参数所对应的参数的集合。
[0084] S60,根据所述最终正常参数,对所述初始客户画像联邦模型进行更新及联邦学习,得到全局客户画像联邦模型。
[0085] 可理解地,根据所述最终正常参数,对所有所述对所述初始客户画像联邦模型中的参数及权重进行更新,所述更新的方法可以为将所有所述最终正常参数按照进程标识进
行传输至所述初始客户画像联邦模型,再进行多进程取均值方式的更新方式的更新方法,
并运用联邦学习的方式进行对所述初始客户画像联邦模型进行训练,即通过将客户端(服
务中心)中的样本输入更新后的所述初始客户画像联邦模型进行机器学习,迭代更新训练
完后获得所述全局客户画像联邦模型,通过采用各个模型参数中的最终正常参数进行机器
学习,能够提高得到准确率高且质量高的全局客户画像联邦模型。
[0086] 本发明实现了通过获取参与方清单和初始客户画像联邦模型,并按照预设筛选方案,从所述参与方清单中筛选出合格参与方;向各所述合格参与方发送所述初始客户画像
联邦模型;接收各所述合格参与方返回的模型参数;运用MPI并行方法,通过恶意参数检测
模型对各所述模型参数进行异常特征提取,根据提取的异常特征输出各所述模型参数的识
别结果;根据输出的识别结果,对各所述模型参数进行恶意参数过滤处理,得到最终正常参
数;根据所述最终正常参数,对所述初始客户画像联邦模型进行更新及联邦学习,得到全局
客户画像联邦模型,如此,实现了通过预设筛选方案筛选出合格参与方,接收各合格参与方
返回的模型参数,并运用MPI并行方法,通过恶意参数检测模型进行异常特征提取,以及恶
意参数过滤处理,自动获得正常参数,能够基于有效的正常参数进行更新及联邦学习,快速
地、准确地训练得到全局客户画像联邦模型,自动去除恶意参与方提供的恶意参数,提高了
联邦学习建模的效率和精度,节省了成本,缩短了联邦学习建模周期,能够快速地应用至场
景中。
[0087] 在一实施例中,所述步骤S60之后,即所述根据所述最终正常参数,对所述初始客户画像联邦模型进行训练,得到全局客户画像联邦模型之后,包括:
[0088] 运用MPI发送方法,向各所述合格参与方发送所述全局客户画像联邦模型中的全局模型参数。
[0089] 可理解地,所述MPI发送方法为复制相同的含有所述全局模型参数的发送指令,按照进程标识分发给与所述进程标识所对应的所述合格参与方的方法,所述全局模型参数为
所述全局客户画像联邦模型中需要提供给各所述合格参与方进行替换原初始客户画像联
邦模型中的相关参数,通过所述MPI发送方法,可以按照已分配好的所述进程标识向与其所
对应的所述合格参与方发送所述全局模型参数。
[0090] 接收各所述合格参与方返回的更新模型参数;所述更新模型参数为所述合格参与方在接收完所述全局模型参数并更新初始客户画像联邦模型后训练获得。
[0091] 可理解地,所述合格参与方根据接收到的所述全局模型参数,替换本地的原初始客户画像联邦模型中与全局模型参数相关的参数,所述合格参与方在本地对替换后的初始
客户画像联邦模型进行训练,直至替换后的该初始客户画像联邦模型达到预设收敛条件,
停止训练,此时将收敛后的初始客户画像联邦模型的权重和参数记录为所述更新模型参
数,所述更新模型参数为所述合格参与方对接收的所述全局模型参数进行本地训练完后获
得。
[0092] 运用所述MPI并行方法,通过所述恶意参数检测模型对各所述更新模型参数进行异常特征提取,根据提取的异常特征输出各所述更新模型参数的更新识别结果。
[0093] 可理解地,运用MPI并行方法,为每个所述合格参与方返回的所述更新模型参数增加进程标识,可以继承原合格参与方已分配的进程标识,相应地给各个所述合格参与方添
加唯一标识,将所有增加了进程标识的所述更新模型参数输入进程组中,根据进程组中的
各个进程标识并行输入与各进程标识对应的客户端(服务中心)的所述恶意参数检测模型
中。
[0094] 其中,通过所述恶意参数检测模型识别出所有更新模型参数中的恶意参数和正常参数的识别过程,所述识别结果表征了各个所述更新模型参数中哪些是正常参数哪些是恶
意参数的结果。
[0095] 根据输出的更新识别结果,对各所述模型参数进行恶意参数过滤处理,得到待训练更新参数。
[0096] 可理解地,所述恶意参数过滤处理还包括将所有恶意参数所对应的参数从所有所述更新模型参数中进行去除的处理过程,最终得到所述待训练更新参数,所述待训练更新
参数为所有更新模型参数中所有正常参数的集合。
[0097] 根据所述待训练更新参数,对所述全局客户画像联邦模型进行更新及联邦学习,得到更新后的全局客户画像联邦模型。
[0098] 可理解地,根据所述待训练更新参数,对所有所述对所述全局客户画像联邦模型中的参数及权重进行更新,迭代更新训练完后全局客户画像联邦模型,得到更新后的全局
客户画像联邦模型,如此,能够通过不断更新可以实时随着合格参与方的样本量的增加不
断学习,得到精度更高的全局客户画像联邦模型,提高了全局客户画像联邦模型的准确率
高且质量高,提高了客户体验满意度。
[0099] 本发明提供的客户画像方法,可应用在如图1的应用环境中,其中,客户端(计算机设备)通过网络与服务器进行通信。其中,客户端(计算机设备)包括但不限于为各种个人计
算机、笔记本电脑、智能手机、平板电脑、摄像头和便携式可穿戴设备。服务器可以用独立的
服务器或者是多个服务器组成的服务器集群来实现。
[0100] 在一实施例中,如图4所示,提供一种客户画像方法,其技术方案主要包括以下步骤S100‑S300:
[0101] S100,接收画像请求,获取所述画像请求中的客户信息。
[0102] 可理解地,所述画像请求为客户或者代理人员输入所述客户信息之后,需要对该客户进行画像时触发的请求,所述画像请求包括所述客户信息,所述客户信息为与客户相
关的信息,例如:个人就医信息或者个人行程信息等信息。
[0103] S200,将所述客户信息输入通过如上述联邦模型训练方法获得的全局客户画像联邦模型。
[0104] 可理解地,所述全局客户画像联邦模型为通过联邦模型训练方法获得的模型,所述全局客户画像联邦模型用于对输入的客户信息进行划分客户类别的模型,将所述客户信
息输入获得的所述全局客户画像联邦模型中。
[0105] S300,通过所述全局客户画像联邦模型对所述客户信息进行客户画像处理,得到所述客户信息的客户画像结果;所述客户画像结果表征了所述客户的客户类别。
[0106] 可理解地,所述客户画像处理为对客户信息进行各个客户类别的聚类处理过程,即将所述客户信息中的各个因素进行分析,分析出各个因素所对应的信息,将各个因素所
对应的信息进行K‑mean均值聚类方法的聚类处理,得到一个聚焦点,再计算该聚焦点距离
各个客户类别的中心点的欧式距离,根据该聚焦点距离各个客户类别的中心点的欧式距
离,确定出该聚焦点属于哪个客户类别的过程,通过所述客户画像处理后,可以确定出与所
述客户信息所对应的客户的所述客户画像结果,所述客户画像结果表征了所述客户的客户
类别,例如:客户画像结果表征了客户的生活圈是否活跃的客户类别,客户类别包括生活圈
活跃用户、生活圈潜在用户和生活圈固定用户等等,生活圈活跃程度可以通过客户信息中
的个人行程信息或者个人移动定位信息的移动程度体现,如此,通过联邦模型训练方法获
得的全局客户画像联邦模型,能够更加准确地对客户进行客户类别的识别,无需大量客户
的样本就可以得到准确的客户画像结果,提高了客户画像的准确率和可靠性,并提高了客
户画像的效率。
[0107] 本发明实现了通过接收画像请求,获取所述画像请求中的客户信息;将所述客户信息输入通过上述联邦模型训练方法获得的全局客户画像联邦模型;通过所述全局客户画
像联邦模型对所述客户信息进行客户画像处理,得到所述客户信息的客户画像结果,如此,
实现了通过全局客户画像联邦模型能够快速地对客户进行客户画像处理,自动识别出客户
的客户类别,无需人工识别,减少人工识别的工作量,提高了客户画像的效率和质量。
[0108] 在一实施例中,提供一种联邦模型训练装置,该联邦模型训练装置与上述实施例中联邦模型训练方法一一对应。如图5所示,该联邦模型训练装置包括获取模块11、发送模
块12、接收模块13、提取模块14、过滤模块15和训练模块16。各功能模块详细说明如下:
[0109] 获取模块11,用于获取参与方清单和初始客户画像联邦模型,并按照预设筛选方案,从所述参与方清单中筛选出合格参与方;
[0110] 发送模块12,用于向各所述合格参与方发送所述初始客户画像联邦模型;
[0111] 接收模块13,用于接收各所述合格参与方返回的模型参数;所述模型参数为所述合格参与方对接收的所述初始客户画像联邦模型进行本地训练完后获得;
[0112] 提取模块14,用于运用MPI并行方法,通过恶意参数检测模型对各所述模型参数进行异常特征提取,根据提取的异常特征输出各所述模型参数的识别结果;
[0113] 过滤模块15,用于根据输出的识别结果,对各所述模型参数进行恶意参数过滤处理,得到最终正常参数;
[0114] 训练模块16,用于根据所述最终正常参数,对所述初始客户画像联邦模型进行更新及联邦学习,得到全局客户画像联邦模型。
[0115] 关于联邦模型训练装置的具体限定可以参见上文中对于联邦模型训练方法的限定,在此不再赘述。上述联邦模型训练装置中的各个模块可全部或部分通过软件、硬件及其
组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以
以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的
操作。
[0116] 在一实施例中,提供一种客户画像装置,该客户画像装置与上述实施例中客户画像方法一一对应。如图6所示,该客户画像装置包括请求模块101、输入模块102和识别模块
103。各功能模块详细说明如下:
[0117] 请求模块101,用于接收画像请求,获取所述画像请求中的客户信息;
[0118] 输入模块102,用于将所述客户信息输入通过如上述联邦模型训练方法获得的全局客户画像联邦模型;
[0119] 识别模块103,用于通过所述全局客户画像联邦模型对所述客户信息进行客户画像处理,得到所述客户信息的客户画像结果;所述客户画像结果。
[0120] 关于客户画像装置的具体限定可以参见上文中对于客户画像方法的限定,在此不再赘述。上述客户画像装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上
述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储
于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0121] 在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和
数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包
括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据
库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算
机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以
实现一种联邦模型训练方法,或者客户画像方法。
[0122] 在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中联邦模型
训练方法,或者处理器执行计算机程序时实现上述实施例中客户画像方法。
[0123] 在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中联邦模型训练方法,或者计算机程序被处理器执
行时实现上述实施例中客户画像方法。
[0124] 本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机
可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,
本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可
包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM
(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括
随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,
诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强
型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM
(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
[0125] 所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的
功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上
描述的全部或者部分功能。
[0126] 以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各
实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改
或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应
包含在本发明的保护范围之内。