风险识别方法和装置转让专利

申请号 : CN202110493571.3

文献号 : CN113222609B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 管楚付子圣陈红巩金慧周绪刚

申请人 : 支付宝(杭州)信息技术有限公司

摘要 :

本说明书实施例提供了一种风险识别方法和装置。根据该实施例的方法,首先获取风险图,所述风险图包括节点和节点之间的边,所述节点为实体,所述边为实体间的关联关系;然后将所述风险图输入风险识别模型,得到所述风险图中待识别节点的风险得分;其中所述风险识别模型是预先对所述风险图中已知风险得分的节点的知识进行学习后得到的,所述知识包括特征信息、路径信息和邻居信息。

权利要求 :

1.风险识别方法,包括:

获取风险图,所述风险图包括节点和节点之间的边,所述节点为实体,所述边为实体间的关联关系;

将所述风险图输入风险识别模型,得到所述风险图中待识别节点的风险得分;

其中所述风险识别模型是预先对所述风险图中已知风险得分的节点的知识进行学习后得到的,所述知识包括特征信息、路径信息和邻居信息;

该方法还包括:

确定对所述待识别节点的风险得分影响最大的特征和风险子图的组合,其中所述风险子图为所述风险图中包括所述待识别节点的子图;

其中,所述确定对所述风险得分影响最大的特征和风险子图的组合包括:变换所述待识别节点的特征和风险子图构成的组合;

分别确定各组合与风险得分之间的互信息;

确定所述互信息中满足预设条件时对应的特征和风险子图的组合。

2.根据权利要求1所述的方法,其中,所述风险识别模型利用如下方式训练得到:确定所述风险图中被标注风险得分的节点;

利用所述风险图中被标注风险得分的节点训练图神经网络GNN,得到所述风险识别模型;

其中,所述GNN在训练过程中学习所述被标注风险得分的节点的特征信息、路径信息和邻居信息的权重信息,以最小化所述GNN对所述被标注风险得分的节点输出的风险得分与标注的风险得分之间的差异。

3.根据权利要求1所述的方法,其中,所述风险识别模型从所述风险图中获取所述待识别节点的特征信息、路径信息和邻居信息,利用预先学习得到的权重信息对所述特征信息、路径信息和邻居信息进行注意力处理;将注意力处理后得到的向量映射至风险得分。

4.根据权利要求1所述的方法,其中,所述风险子图中包含的节点数量小于或等于预设数量阈值。

5.根据权利要求1至4中任一项所述的方法,其中,所述实体包括账户或账户群,所述关联关系包括资金关系、交易关系、媒介关系或通讯录关系。

6.风险识别装置,包括:

图获取单元,被配置为获取风险图,所述风险图包括节点和节点之间的边,所述节点为实体,所述边为实体间的关联关系;

风险评分单元,被配置为将所述风险图输入风险识别模型,得到所述风险图中待识别节点的风险得分;

其中所述风险识别模型是预先对所述风险图中已知风险得分的节点的知识进行学习后得到的,所述知识包括特征信息、路径信息和邻居信息;

还包括:

归因解释单元,被配置为确定对所述待识别节点的风险得分影响最大的特征和风险子图的组合,其中所述风险子图为所述风险图中包括所述待识别节点的子图;

其中,所述归因解释单元,具体被配置为变换所述待识别节点的特征和风险子图构成的组合;分别确定各组合与风险得分之间的互信息;确定所述互信息中满足预设条件时对应的特征和风险子图的组合。

7.根据权利要求6所述的装置,还包括:模型训练单元,被配置为确定所述风险图中被标注风险得分的节点;利用所述风险图中被标注风险得分的节点训练图神经网络GNN,得到所述风险识别模型;其中,所述GNN在训练过程中学习所述被标注风险得分的节点的特征信息、路径信息和邻居信息的权重信息,以最小化所述GNN对所述被标注风险得分的节点输出的风险得分与标注的风险得分之间的差异。

8.根据权利要求6所述的装置,其中,所述风险识别模型,用于从所述风险图中获取所述待识别节点的特征信息、路径信息和邻居信息,利用预先学习得到的权重信息对所述特征信息、路径信息和邻居信息进行注意力处理;将注意力处理后得到的向量映射至风险得分。

9.根据权利要求6所述的装置,其中,所述风险子图中包含的节点数量小于或等于预设数量阈值。

10.根据权利要求6至9中任一项所述的装置,其中,所述实体包括账户或账户群,所述关联关系包括资金关系、交易关系、媒介关系或通讯录关系。

11.一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1‑5中任一项所述的方法。

说明书 :

风险识别方法和装置

技术领域

[0001] 本说明书一个或多个实施例涉及计算机应用技术领域,尤其涉及一种风险识别方法和装置。

背景技术

[0002] 随着互联网技术的迅猛发展,人们越来越多地利用互联网进行通信、学习、工作,甚至通过互联网进行交易、支付、转账、投资等经济行为。一方面这些行为可能存在一定的
风险;另一方面也有一些不法分子容易利用互联网的技术缺陷、法律缺陷等进行不法行为。
这些都对网络行为的安全性带来了威胁。因此亟需一种能够自动、准确地实现风险识别的
方法。

发明内容

[0003] 本说明书一个或多个实施例描述了一种风险识别的方法,以便于自动、准确地实现对被识别对象的风险识别。
[0004] 根据第一方面,提供了一种风险识别方法,包括:
[0005] 获取风险图,所述风险图包括节点和节点之间的边,所述节点为实体,所述边为实体间的关联关系;
[0006] 将所述风险图输入风险识别模型,得到所述风险图中待识别节点的风险得分;
[0007] 其中所述风险识别模型是预先对所述风险图中已知风险得分的节点的知识进行学习后得到的,所述知识包括特征信息、路径信息和邻居信息。
[0008] 在一个实施例中,所述风险识别模型如下方式训练得到:
[0009] 确定所述风险图中被标注风险得分的节点;
[0010] 利用所述风险图中被标注风险得分的节点训练图神经网络GNN,得到所述风险识别模型;
[0011] 其中,所述GNN在训练过程中学习所述被标注风险得分的节点的特征信息、路径信息和邻居信息的权重信息,以最小化所述GNN对所述被标注风险得分的节点输出的风险得
分与标注的风险得分之间的差异。
[0012] 在另一个实施例中,所述风险识别模型从所述风险图中获取所述待识别节点的特征信息、路径信息和邻居信息,利用预先学习得到的权重信息对所述特征信息、路径信息和
邻居信息进行注意力处理;将注意力处理后得到的向量映射至风险得分。
[0013] 在一个实施例中,该方法还包括:
[0014] 确定对所述待识别节点的风险得分影响最大的特征和风险子图的组合,其中所述风险子图为所述风险图中包括所述待识别节点的子图。
[0015] 在另一个实施例中,所述确定对所述风险得分影响最大的特征和风险子图的组合包括:
[0016] 变换所述待识别节点的特征和风险子图构成的组合;
[0017] 分别确定各组合与风险得分之间的互信息;
[0018] 确定所述互信息中满足预设条件时对应的特征和风险子图的组合。
[0019] 在一个实施例中,所述风险子图中包含的节点数量小于或等于预设数量阈值。
[0020] 在另一个实施例中,所述实体包括账户或账户群,所述关联关系包括资金关系、交易关系、媒介关系或通讯录关系。
[0021] 根据第二方面,提供了一种风险识别装置,包括:
[0022] 图获取单元,被配置为获取风险图,所述风险图包括节点和节点之间的边,所述节点为实体,所述边为实体间的关联关系;
[0023] 风险评分单元,被配置为将所述风险图输入风险识别模型,得到所述风险图中待识别节点的风险得分;
[0024] 其中所述风险识别模型是预先对所述风险图中已知风险得分的节点的知识进行学习后得到的,所述知识包括特征信息、路径信息和邻居信息。
[0025] 在一个实施例中,该装置还包括:
[0026] 模型训练单元,被配置为确定所述风险图中被标注风险得分的节点;利用所述风险图中被标注风险得分的节点训练图神经网络GNN,得到所述风险识别模型;其中,所述GNN
在训练过程中学习所述被标注风险得分的节点的特征信息、路径信息和邻居信息的权重信
息,以最小化所述GNN对所述被标注风险得分的节点输出的风险得分与标注的风险得分之
间的差异。
[0027] 在另一个实施例中,所述风险识别模型,用于从所述风险图中获取所述待识别节点的特征信息、路径信息和邻居信息,利用预先学习得到的权重信息对所述特征信息、路径
信息和邻居信息进行注意力处理;将注意力处理后得到的向量映射至风险得分。
[0028] 在一个实施例中,该装置还包括:
[0029] 归因解释单元,被配置为确定对所述待识别节点的风险得分影响最大的特征和风险子图的组合,其中所述风险子图为所述风险图中包括所述待识别节点的子图。
[0030] 在另一个实施例中,所述归因解释单元,具体被配置为变换所述待识别节点的特征和风险子图构成的组合;分别确定各组合与风险得分之间的互信息;确定所述互信息中
满足预设条件时对应的特征和风险子图的组合。
[0031] 在一个实施例中,所述风险子图中包含的节点数量小于或等于预设数量阈值。
[0032] 在另一个实施例中,所述实体包括账户或账户群,所述关联关系包括资金关系、交易关系、媒介关系或通讯录关系。
[0033] 根据第三方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。
[0034] 由以上技术方案可以看出,本说明书实施例从实体间的关联关系所形成的风险图入手,基于实体的特征信息、路径信息和邻居信息三方面从已知风险得分的节点学习得到
风险识别模型,以实现对风险图中待识别实体的风险打分,从而提高风险识别的准确性。

附图说明

[0035] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明
的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据
这些附图获得其他的附图。
[0036] 图1示出了根据一个实施例的主要方法流程图;
[0037] 图2示出了根据一个实施例的详细方法流程图;
[0038] 图3示出了根据一个实施例的特征筛选方法流程图;
[0039] 图4示出了根据一个实施例的确定风险状况的示意图;
[0040] 图5示出了根据一个实施例的该风险评估装置的示意性框图。

具体实施方式

[0041] 下面结合附图,对本说明书提供的方案进行描述。
[0042] 传统的风险识别方式大多是基于对实体的属性和行为来分析实体的风险。例如,对账户的类型、使用时长、转账频率、转账金额等来分析账户的风险。然而随着风险手段不
断呈多样性和复杂性的发展,传统的风险识别方式已不能适应越来越多样和复杂的风险手
段。单纯通过对实体属性和行为来分析账户是否有风险准确性较低。
[0043] 经过对多种业务场景的分析和研究后发现,很多风险手段是与其他实体之间的一定关系实现的,这些关系甚至是间接的多跳关系。例如一个账户通过投资关系转账给另一
账户后,再由另一账户通过交易关系将钱转移至其他账户。因此本说明书实施例从实体间
的关联关系入手进行风险识别。
[0044] 下面描述以上构思的具体实现方式。
[0045] 图1示出根据本说明书实施例的一个风险识别方法的流程图。可以理解,该方法可以通过任何具有计算、处理能力的装置、设备、平台、设备集群来执行。如图1所示,该方法包
括:
[0046] 步骤101,获取风险图,风险图包括节点和节点之间的边,节点为实体,边为实体间的关联关系。
[0047] 步骤103,将风险图输入风险识别模型,得到风险图中待识别节点的风险得分;其中风险识别模型是预先对风险图中已知风险得分的节点的知识进行学习后得到的,上述知
识包括特征信息、路径信息和邻居信息。
[0048] 由上述实施例可以看出,本说明书实施例从实体间的关联关系所形成的风险图入手,基于实体的特征信息、路径信息和邻居信息三方面从已知风险得分的节点学习得到风
险识别模型,以实现对风险图中待识别实体的风险打分,从而提高风险识别的准确性。
[0049] 下面分别对上述实施例中的各步骤进行详细描述。
[0050] 首先结合实施例对上述步骤101即“获取风险图”进行详细描述。
[0051] 可以预先基于实体和实体间的关联关系构建风险图。如图2中所示,构建的风险图中节点为实体,边为实体间的关联关系。其中,实体可以根据风险识别的场景而具体确定。
例如,对于风险识别的场景下,实体可以为账户,例如银行账户、金融平台账户、交易平台账
户等。可以是诸如银行卡等实体账户,也可以是金融平台的虚拟账户,也可以是与金融平台
的虚拟账户绑定或与银行账户绑定的交易平台账户。
[0052] 边可以为实体间的关联关系,可以包括诸如资金关系、交易关系、媒介关系、通讯录关系等。其中资金关系可以是诸如投资关系、转账关系等。交易关系可以是进行商品交
易、股票交易、服务交易等等。媒介关系可以是诸如两个账户的资金关系或交易关系等发生
时是否处于同一局域网、使用同一设备、是否在同一网段、是否处于同一WIFI覆盖范围内等
等。通讯录关系可以是诸如一个实体对应的用户是否在另一个实体对应的用户的通讯录
中、两个实体对应的用户是否互为社交网络的好友等等。
[0053] 图2中的节点和边的类型、数量、方向、规模等均是示意性的,并不用以限制本申请。
[0054] 下面结合实施例对上述步骤103即“将风险图输入风险识别模型,得到风险图中待识别节点的风险得分”进行详细描述。
[0055] 在本步骤中对待识别节点的风险得分进行估计是利用风险识别模型。该风险识别模型的输入为风险图,输出为风险图中待识别节点的风险得分。其中,待识别节点可以是风
险图中的任意节点。
[0056] 本步骤的思路是在风险图中对已知风险得分的节点进行标注,从已知风险得分的节点的特征信息、路径信息和邻居信息三方面入手来对风险评分机制进行学习。从而使得
该风险评分机制能够延伸至对其他未知风险得分的节点进行风险评分。
[0057] 其中,上述学习的过程实际上就是风险识别模型的训练过程。如图3中所示,可以包括以下步骤:
[0058] 步骤301中,确定风险图中被标注风险得分的节点。
[0059] 本步骤中可以对风险图中已知风险得分的节点进行标注。这些节点的风险得分可以从一些官方信息中获得,例如比较具有公信力的机构提供的信息中来获取一些实体的风
险得分。
[0060] 例如,从官方机构提供的信息中明确获知某公民具有犯罪的行为,那么可以将该公民对应的账户标注为风险得分较高的一个值。
[0061] 再例如,从媒体提供的信息中获知某公司频繁进行违规交易,那么可以对该公司的账户标注为风险得分较高的一个值。
[0062] 再例如,从官方机构提供的信息中获知某公司连续几年被评为明星企业,那么可以对该公司的账户标注为风险得分较低的一个值。
[0063] 除此之外,也可以由金融类专业人员依据实体的一些属性、行为等信息,对其中一些实体进行人工的专业风险评分并进行标注。还可以采用其他风险得分的标注方式,在此
不做一一穷举。
[0064] 步骤303中,利用风险图中被标注风险得分的节点训练GNN(Graph Neural Networks,图神经网络),得到风险识别模型;其中,GNN在训练过程中学习被标注风险得分
的节点的特征信息、路径信息和邻居信息的权重,以最小化GNN对被标注风险得分的节点输
出的风险得分与标注的风险得分之间的差异。
[0065] 本说明书实施例中,风险识别模型可以采用GNN来实现。GNN是一类基于深度学习的处理域信息的方法。在训练过程中,GNN在对风险图中被标注风险得分的节点进行学习
时,重点学习的是以下三方面的内容:
[0066] 第一方面,节点的邻居信息的权重。
[0067] 考虑到不同邻居节点的影响,设计了一层邻居注意力机制来学习每个邻居节点的重要性,即权重。作为一种可以实现的方式,每个邻居节点的向量表示可以表示为:
[0068]
[0069] 其中, 为账户u的路径ρ上的邻居节点的向量表示, 表示该条路径ρ上的邻居ρ
节点集合, 是邻居节点j的特征向量。α(u,j)是预设的映射函数,体现了邻居节点j对于
ρ
账户u的权重。上述的映射函数α(u,j)可以采用诸如加性函数、点积函数、缩放点积函数、
双线性函数等等,也可以采用其他自定义的函数。原则是u和j越相似,权重越高。
[0070] 在本说明书实施例中,可以预先对于风险图中的路径按照类型和长度(即包含的节点数)进行预先的划分和定义。其中路径的类型可以包括诸如从金融平台账户到银行账
户的路径,从银行账户到银行账户的路径,从银行账户到金融平台账户的路径,从银行账户
到交易平台账户的路径,从交易平台账户到交易平台账户的路径,等等。考虑到不同类型路
径对于账户风险也存在一定影响,因此本说明书实施例中在对节点的邻居信息、特征信息
的权重学习中均引入了路径因素。
[0071] 第二方面,节点的特征信息的权重。
[0072] 考虑到节点的特征信息会对节点是否具有风险具有很大的决定性作用,因此,在本说明书实施例中采用了特征注意力机制,可以表示为:
[0073]
[0074] 其中, 为账户u的特征向量,该特征向量是已知的,为了区分不同路径,仅针对各ρ
路径ρ做了标记以进行上述公式的计算。B为受邻居影响后的状态转移矩阵, 为考虑邻居
影响的账户u的特征向量。
[0075] 节点的特征信息可以是诸如性别、年龄、职业、地域等账户所对应用户的个人属性,也可以是诸如近一个月、近一周等的交易数量、交易金额、交易对象数量等交易特征,还
可以是诸如所使用设备类型、网络类型等环境特征,等等。
[0076] 第三方面,节点的路径信息的权重。
[0077] 可以为每个节点计算它对路径集合P中每条元路径的注意力,可以表示为:
[0078]
[0079] 其中,zρ表示路径ρ的注意力向量,γ(u,ρ)表示的是一个标准化处理,可以看做是得到节点的各条路径ρ的向量表示。
[0080] GNN将节点各邻居的向量表示、各条路径的向量表示以及节点的特征向量进行整合后,再将整合得到的向量映射至具体的得分上,就可以得到该节点的风险得分。在训练
GNN的过程中,训练目标是由GNN对被标注风险得分的节点进行风险得分的预测,最小化预
测的风险得分与标注的风险得分的差异。可以依据该训练目标设置损失函数,在每一轮迭
ρ
代过程中利用损失函数的取值更新模型参数,包括上述公式(1)中的α(u,j)中的参数,上
ρ ρ
述公式(2)中的B ,上述公式(3)中的z ,直至满足预设的迭代停止条件。其中迭代停止条件
可以是损失函数的取值小于或等于预设的阈值,或者迭代次数达到预设的次数阈值,等等。
也就是说,在模型训练的迭代过程中,对上述三种权重进行每轮迭代的更新,最终使得模型
对每个已标注风险得分的节点预测的风险得分尽量与标注的风险得分一致。
[0081] 经过上述学习过程后,可以利用得到的风险识别模型对风险图中的节点进行风险评分。同样道理,风险识别模型从风险图中获取待识别节点的特征信息、路径信息和邻居信
息,利用预先学习到的权重信息对特征信息、路径信息和邻居信息进行注意力处理,将注意
力处理后得到的向量映射至具体的风险得分。
[0082] 在此需要说明的是,上述的待识别节点可以是风险图中尚未被标注风险得分的节点,也可以是已被标注风险得分的节点。
[0083] 经过实验验证,基于虚拟币的交易场景分析,构造了风险图。包含52万的账户,其中账户包含交易平台的账户,也包含银行卡账户。边包含交易关系和媒介关系。同时为每个
账户抽取了包括78维统计特征和128维行为特征。然后采用本说明书实施例上述实施例中
的方式进行风险识别,在2个数据集上进行测试。经过测试验证后,准确率可以达到98.6%,
在两个测试集上的覆盖率达到82.1%和95%。
[0084] 更进一步地,在对待识别节点进行上述风险识别得到风险得分后,可以进一步确定对待识别节点的风险得分影响最大的特征和风险子图的组合,用以对上述风险得分进行
解释,并增加模型的可信度和隐私性。在本说明书实施例中引入了两个可解释性的概念:核
心特征和核心子图。也就是对风险得分影响最大的特征和风险子图。其中风险子图指的是
风险图中包含待识别节点的子图。
[0085] 在此提供一种优选的实现方式,来确定对风险得分影响最大的特征和风险子图的组合。参见图4,可以包括以下步骤:
[0086] 步骤401,变换待识别节点的特征和风险子图构成的组合。
[0087] 在本步骤中可以随机变换特征和风险子图从而构成组合,也可以将所有特征和风险子图构成的组合进行穷举。
[0088] 步骤403,分别确定各组合与风险得分之间的互信息。
[0089] 本步骤中利用了互信息,互信息是信息论里一种有用的信息度量,可以看成是一个随机变量中包含的关于另一个变量的信息量,或者说是一个变量由于另一个随机变量而
减少的不确定性。在本申请中实际上是风险得分由于上述组合的减少的不确定性,互信息
可以采用如下公式:
[0090] MI(Y,(g,x))=H(Y)‑H(Y|G=g,X=x))             (4)
[0091] 其中,g表示风险子图,x表示特征,Y表示风险得分,MI(Y,(g,x))指的是Y与由g和x构成的组合的互信息。H()是求熵的函数。
[0092] 步骤405,确定互信息满足预设条件时对应的特征和风险子图的组合。
[0093] 在本步骤中,上述预设条件可以是互信息值最大,或者,互信息值大于或等于预设阈值等。以互信息值最大为例,实际上就是找出互信息值最大时对应的x和g的组合,可以表
达为:
[0094]
[0095] 另外,为了降低计算的空间复杂度,可以对使用的风险子图的规模进行限制,即风险子图包含的节点数量需要小于或等于预设的数量阈值k,即|g|≤k。该k的取值可以采用
经验值或实验值。
[0096] 其中,H(Y)为常数,因此相当于最小化条件熵H(Y|G=Gs,X=Xs)),其中,Gs为步骤401中变换组合时采样的风险子图的集合,Xs为采样的特征集合。
[0097]
[0098] Pφ表示采样策略,即采用预设的采样策略采样得到上述Gs和Xs。
[0099] 在风险识别模型给出具体的打分y∈Y后,希望找出对打分y影响最大的特征和风险子图。因此,上述思路相当于是通过采样的方式,采集不同的“特征+风险子图”组合,即变
换x、g的组合。若某些特征或邻居去除后,对打分影响不大,这种情况下该特征和风险子图
的组合与风险得分的互信息很小,说明这些特征和邻居对账户节点的影响比较小;反之,说
明这些特征和邻居是这个账户的核心特征和核心风险子图。
[0100] 可以看出,本说明书实施例进一步给出了风险识别模型给待识别节点进行风险打分的归因解释信息,从而降低了人工验证的成本,并为后续风控系统的优化调整提供基础。
[0101] 另外这种归因解释机制,能够对模型的风险评分进行印证,增加了风险识别模型的可信度。并且这种归因解释机制无需透漏风险识别模型的识别机制,从而保证了风险识
别模型的隐私性。
[0102] 另外,除了对单一账户进行风险评估和解释之外,还可以对一些账户集进行风险评估和解释,例如对风险团伙的风险评估和解释。具体的方式与上述方式类似,不同之处在
于将这些账户集作为风险图中的一个节点。
[0103] 上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来
执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺
序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可
以的或者可能是有利的。
[0104] 根据另一方面的实施例,提供了一种风险评估装置。图5示出根据一个实施例的该风险评估装置的示意性框图。可以理解,该装置可以通过任何具有计算、处理能力的装置、
设备、平台和设备集群来实现。如图5所示,该装置500包括:图获取单元501和风险评分单元
502,还可以进一步包括模型训练单元503和归因解释单元504。其中各组成单元的主要功能
如下:
[0105] 图获取单元501,被配置为获取风险图,风险图包括节点和节点之间的边,节点为实体,边为实体间的关联关系。
[0106] 风险评分单元502,被配置为将风险图输入风险识别模型,得到风险图中待识别节点的风险得分。
[0107] 其中风险识别模型是预先对风险图中已知风险得分的节点的知识进行学习后得到的,知识包括特征信息、路径信息和邻居信息。
[0108] 模型训练单元503,被配置为确定风险图中被标注风险得分的节点;利用风险图中被标注风险得分的节点训练GNN,得到风险识别模型;其中,GNN在训练过程中学习被标注风
险得分的节点的特征信息、路径信息和邻居信息的注意力权重,以最小化GNN对被标注风险
得分的节点输出的风险得分与标注的风险得分之间的差异。
[0109] 其中,风险识别模型,用于从风险图中获取待识别节点的特征信息、路径信息和邻居信息,利用预先学习得到的注意力权重信息对特征信息、路径信息和邻居信息进行注意
力处理;将注意力处理后得到的向量映射至风险得分。
[0110] 更进一步地,归因解释单元504,被配置为确定对待识别节点的风险得分影响最大的特征和风险子图的组合,其中风险子图为风险图中包括待识别节点的子图。
[0111] 作为一种优选的实施方式,归因解释单元504,具体被配置为变换待识别节点的特征和风险子图构成的组合;分别确定各组合与风险得分之间的互信息;确定互信息中满足
预设条件时对应的特征和风险子图的组合。
[0112] 为了降低计算的空间复杂度,限制上述风险子图中包含的节点数量小于或等于预设数量阈值。
[0113] 作为一种典型的应用场景,上述实体可以包括账户或账户群,关联关系包括资金关系、交易关系、媒介关系或通讯录关系。
[0114] 根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行图1、图3或图4所描述的方法。
[0115] 根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现图1、图3或图4所述的方法。
[0116] 随着时间、技术的发展,计算机可读存储介质含义越来越广泛,计算机程序的传播途径不再受限于有形介质,还可以直接从网络下载等。可以采用一个或多个计算机可读存
储介质的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红
外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体
的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随
机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便
携式紧凑磁盘只读存储器(CD‑ROM)、光存储器件、磁存储器件、或者上述的任意合适的组
合。在本说明书中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可
以被指令执行系统、装置或者器件使用或者与其结合使用。
[0117] 上述的处理器可包括一个或多个单核处理器或多核处理器。处理器可包括任何一般用途处理器或专用处理器(如图像处理器、应用处理器基带处理器等)的组合。
[0118] 本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实
施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例
的部分说明即可。
[0119] 本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能
存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
[0120] 以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明
的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应
包括在本发明的保护范围之内。