一种基于图数据的业务规则确定方法及装置转让专利

申请号 : CN202311590588.6

文献号 : CN117290554B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 周虹廷曾凤徐威迪赵培龙王经纬何建杉

申请人 : 支付宝(杭州)信息技术有限公司

摘要 :

本说明书实施例提供了一种基于图数据的业务规则确定方法及装置。图数据包括代表业务对象的节点以及节点之间的连接边,用来存储与业务数据相关的隐私数据。在该方法中,通过图神经网络确定图数据中的节点表征。将若干备选规则与匹配的实例子图进行结合,得到若干推理子图,备选规则包括推理条件和推理结果,任意一个推理子图包含推理条件数据和推理结果数据。接着,利用节点表征确定若干推理子图中各自的推理结果数据成立的概率评分,基于与任意一个备选规则匹配的若干推理子图的概率评分,确定该备选规则的置信度,基于若干备选规则的置信度对若干备选规则进行筛选,得到图数据的

权利要求 :

1.一种基于图数据的业务规则确定方法,所述图数据包括代表用户的节点以及节点之间的连接边;所述方法包括:通过图神经网络确定所述图数据中的用户节点表征;

将所述图数据的若干备选规则与匹配的实例子图进行结合,得到若干推理子图;备选规则包括推理条件和推理结果;任意一个推理子图包含:与用户相关的推理条件数据和推理结果数据;所述推理结果数据包含用户节点与用户节点之间的推理关系;

基于若干推理子图中的用户节点表征,确定若干推理子图中各自的推理结果数据成立的概率评分;

针对任意一个备选规则,基于与该备选规则匹配的若干推理子图的概率评分,确定该备选规则的置信度;

基于若干备选规则的置信度对所述若干备选规则进行筛选,得到所述图数据的业务规则,所述业务规则用于基于给定的图数据推理出不同用户之间的关系。

2.根据权利要求1所述的方法,还包括:采用以下方式挖掘所述图数据中的备选规则:采用频繁子图挖掘算法对所述图数据进行挖掘,得到若干频繁子图;

基于若干频繁子图构建若干初始的业务规则,作为备选规则。

3.根据权利要求2所述的方法,所述基于若干频繁子图构建若干初始的业务规则的步骤,包括:针对任意一个频繁子图,确定该频繁子图中的推理条件数据和推理结果数据,基于所述推理条件数据和推理结果数据中的节点信息和连接边信息,构建业务规则中的推理条件和推理结果。

4.根据权利要求1所述的方法,所述推理条件数据包含第一类节点,所述推理结果数据包含第二类节点;

所述基于若干推理子图中的用户节点表征,确定若干推理子图中各自的推理结果数据成立的概率评分的步骤,包括:基于若干推理子图中第二类节点的用户节点表征,确定所述推理结果数据的自身评分;

基于若干推理子图中第一类节点的用户节点表征,确定针对所述推理结果数据的贡献评分;

基于所述自身评分和所述贡献评分,确定对应的推理子图中推理结果数据成立的概率评分。

5.根据权利要求4所述的方法,所述确定针对所述推理结果数据的贡献评分的步骤,包括:基于任意一个推理子图中第一类节点的用户节点表征,确定所述第一类节点之间的自身评分,基于所述自身评分确定该推理子图针对其推理结果数据的贡献评分。

6.根据权利要求5所述的方法,推理子图的第一类节点中包含其他推理子图的第二类节点;所述基于所述自身评分和所述贡献评分,确定对应的推理子图中推理结果数据成立的概率评分的步骤,包括:通过若干迭代过程确定所述概率评分;其中,任意一次迭代过程包括:基于推理子图中第一类节点之间的自身评分,确定该推理子图针对其推理条件数据的贡献评分;针对任意一个推理结果数据,基于所有推理子图分别针对该推理结果数据的贡献评分,更新该推理结果数据的自身评分。

7.根据权利要求6所述的方法,所述若干迭代过程的收敛条件包括:若干推理子图中推理结果数据的自身评分不发生变化。

8.根据权利要求6所述的方法,所述基于所述自身评分和所述贡献评分,确定对应的推理子图中推理结果数据成立的概率评分的步骤,包括:当所述若干迭代过程收敛时,基于任意一个推理子图针对其推理结果数据的贡献评分,确定该推理子图中推理结果数据成立的概率评分。

9.根据权利要求1所述的方法,所述图数据还包括代表用户属性的节点;所述推理结果数据还包含用户节点与属性节点之间的推理关系。

10.根据权利要求1所述的方法,还包括:

将与若干推理子图分别对应的实例子图中的相应数据作为标签,基于所述标签和所述概率评分确定预测损失;

向减小所述预测损失的方向更新所述图神经网络。

11.一种基于图数据的图神经网络训练方法,所述图数据包括代表用户的节点以及节点之间的连接边;所述方法包括:通过图神经网络确定所述图数据中的用户节点表征;

将所述图数据的若干业务规则与匹配的实例子图进行结合,得到若干推理子图;所述业务规则用于基于给定的图数据推理出不同用户之间的关系;业务规则包括推理条件和推理结果;任意一个推理子图包含:与用户相关的推理条件数据和推理结果数据;所述推理结果数据包含用户节点与用户节点之间的推理关系;

基于若干推理子图中的用户节点表征,确定若干推理子图中各自的推理结果数据成立的概率评分;

将与若干推理子图分别对应的实例子图中的相应数据作为标签,基于所述标签和所述概率评分确定预测损失;

向减小所述预测损失的方向更新所述图神经网络。

12.一种基于图数据的业务规则确定装置,所述图数据包括代表用户的节点以及节点之间的连接边;所述装置包括:表征确定模块,配置为通过图神经网络确定所述图数据中的用户节点表征;

实例结合模块,配置为将所述图数据的若干备选规则与匹配的实例子图进行结合,得到若干推理子图;备选规则包括推理条件和推理结果;任意一个推理子图包含:与用户相关的推理条件数据和推理结果数据;所述推理结果数据包含用户节点与用户节点之间的推理关系;

评分确定模块,配置为基于若干推理子图中的用户节点表征,确定若干推理子图中各自的推理结果数据成立的概率评分;

置信度确定模块,配置为针对任意一个备选规则,基于与该备选规则匹配的若干推理子图的概率评分,确定该备选规则的置信度;

规则筛序模块,配置为基于若干备选规则的置信度对所述若干备选规则进行筛选,得到所述图数据的业务规则,所述业务规则用于基于给定的图数据推理出不同用户之间的关系。

13.一种基于图数据的图神经网络训练装置,所述图数据包括代表用户的节点以及节点之间的连接边;所述装置包括:表征确定模块,配置为通过图神经网络确定所述图数据中的用户节点表征;

规则落地模块,配置为将所述图数据的若干业务规则与匹配的实例子图进行结合,得到若干推理子图;所述业务规则用于基于给定的图数据推理出不同用户之间的关系;业务规则包括推理条件和推理结果;任意一个推理子图包含:与用户相关的推理条件数据和推理结果数据;所述推理结果数据包含用户节点与用户节点之间的推理关系;

评分确定模块,配置为基于若干推理子图中的用户节点表征,确定若干推理子图中各自的推理结果数据成立的概率评分;

损失确定模块,配置为将与若干推理子图分别对应的实例子图中的相应数据作为标签,基于所述标签和所述概率评分确定预测损失;

模型更新模块,配置为向减小所述预测损失的方向更新所述图神经网络。

14.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1‑11中任一项所述的方法。

15.一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1‑11中任一项所述的方法。

说明书 :

一种基于图数据的业务规则确定方法及装置

技术领域

[0001] 本说明书一个或多个实施例涉及图数据技术领域,尤其涉及一种基于图数据的业务规则确定方法及装置。

背景技术

[0002] 近年来,图数据在搜索推送、金融风控等多种业务下得到了广泛的应用。特别是,在电子支付平台进行交易风险评估的场景中,单个用户或单笔交易的信息往往不足以对交易风险进行准确评估。因此,常常借助于图数据所涵盖的关联信息,发现电子支付平台中的风险用户和风险交易。同时,图数据中包含的用户和交易等信息属于隐私数据,在数据处理过程中需要进行隐私保护。业务规则是从图数据包含的业务数据中得到的推理规则,能在搜索推送、风险分析等场景中作为辅助,帮助提高业务的处理效率。
[0003] 因此,希望能有改进的方案,可以从图数据中更高效地挖掘出业务规则,进而提高业务处理效率。

发明内容

[0004] 本说明书一个或多个实施例描述了一种基于图数据的业务规则确定方法及装置,以从图数据中更高效地挖掘出业务规则,进而提高业务处理效率。具体的技术方案如下。
[0005] 第一方面,实施例提供了一种基于图数据的业务规则确定方法,所述图数据包括代表业务对象的节点以及节点之间的连接边;所述方法包括:
[0006] 通过图神经网络确定所述图数据中的节点表征;
[0007] 将所述图数据的若干备选规则与匹配的实例子图进行结合,得到若干推理子图;备选规则包括推理条件和推理结果;任意一个推理子图包含:推理条件数据和推理结果数据;
[0008] 基于若干推理子图中的节点表征,确定若干推理子图中各自的推理结果数据成立的概率评分;
[0009] 针对任意一个备选规则,基于与该备选规则匹配的若干推理子图的概率评分,确定该备选规则的置信度;
[0010] 基于若干备选规则的置信度对所述若干备选规则进行筛选,得到所述图数据的业务规则,用于进行业务处理。
[0011] 在一种实施方式中,该方法还包括:采用以下方式挖掘所述图数据中的备选规则:
[0012] 采用频繁子图挖掘算法对所述图数据进行挖掘,得到若干频繁子图;
[0013] 基于若干频繁子图构建若干初始的业务规则,作为备选规则。
[0014] 在一种实施方式中,所述基于若干频繁子图构建若干初始的业务规则的步骤,包括:
[0015] 针对任意一个频繁子图,确定该频繁子图中的推理条件数据和推理结果数据,基于所述推理条件数据和推理结果数据中的节点信息和连接边信息,构建业务规则中的推理条件和推理结果。
[0016] 在一种实施方式中,推理条件数据包含第一类节点,推理结果数据包含第二类节点;
[0017] 所述基于若干推理子图中的节点表征,确定若干推理子图中各自的推理结果数据成立的概率评分的步骤,包括:
[0018] 基于若干推理子图中第二类节点的节点表征,确定所述推理结果数据的自身评分;
[0019] 基于若干推理子图中第一类节点的节点表征,确定针对所述推理结果数据的贡献评分;
[0020] 基于所述自身评分和所述贡献评分,确定对应的推理子图中推理结果数据成立的概率评分。
[0021] 在一种实施方式中,所述确定针对所述推理结果数据的贡献评分的步骤,包括:
[0022] 基于任意一个推理子图中第一类节点的节点表征,确定所述第一类节点之间的自身评分,基于所述自身评分确定该推理子图针对其推理结果数据的贡献评分。
[0023] 在一种实施方式中,推理子图的第一类节点中包含其他推理子图的第二类节点;所述基于所述自身评分和所述贡献评分,确定对应的推理子图中推理结果数据成立的概率评分的步骤,包括:
[0024] 通过若干迭代过程确定所述概率评分;其中,任意一次迭代过程包括:基于推理子图中第一类节点之间的自身评分,确定该推理子图针对其推理条件数据的贡献评分;针对任意一个推理结果数据,基于所有推理子图分别针对该推理结果数据的贡献评分,更新该推理结果数据的自身评分。
[0025] 在一种实施方式中,所述若干迭代过程的收敛条件包括:若干推理子图中推理结果数据的自身评分不发生变化。
[0026] 在一种实施方式中,所述基于所述自身评分和所述贡献评分,确定对应的推理子图中推理结果数据成立的概率评分的步骤,包括:
[0027] 当所述若干迭代过程收敛时,基于任意一个推理子图针对其推理结果数据的贡献评分,确定该推理子图中推理结果数据成立的概率评分。
[0028] 在一种实施方式中,所述图数据还包括代表业务对象属性的节点;
[0029] 所述推理结果数据包含业务对象节点与业务对象节点之间的推理关系,和/或,业务对象节点与属性节点之间的推理关系。
[0030] 在一种实施方式中,该方法还包括:
[0031] 将与若干推理子图分别对应的实例子图中的相应数据作为标签,基于所述标签和所述概率评分确定预测损失;
[0032] 向减小所述预测损失的方向更新所述图神经网络。
[0033] 第二方面,实施例提供了一种基于图数据的图神经网络训练方法,所述图数据包括代表业务对象的节点以及节点之间的连接边;所述方法包括:
[0034] 通过图神经网络确定所述图数据中的节点表征;
[0035] 将所述图数据的若干业务规则与匹配的实例子图进行结合,得到若干推理子图;业务规则包括推理条件和推理结果;任意一个推理子图包含:推理条件数据和推理结果数据;
[0036] 基于若干推理子图中的节点表征,确定若干推理子图中各自的推理结果数据成立的概率评分;
[0037] 将与若干推理子图分别对应的实例子图中的相应数据作为标签,基于所述标签和所述概率评分确定预测损失;
[0038] 向减小所述预测损失的方向更新所述图神经网络。
[0039] 第三方面,实施例提供了一种基于图数据的业务规则确定装置,所述图数据包括代表业务对象的节点以及节点之间的连接边;所述装置包括:
[0040] 表征确定模块,配置为通过图神经网络确定所述图数据中的节点表征;
[0041] 实例结合模块,配置为将所述图数据的若干备选规则与匹配的实例子图进行结合,得到若干推理子图;备选规则包括推理条件和推理结果;任意一个推理子图包含:推理条件数据和推理结果数据;
[0042] 评分确定模块,配置为基于若干推理子图中的节点表征,确定若干推理子图中各自的推理结果数据成立的概率评分;
[0043] 置信度确定模块,配置为针对任意一个备选规则,基于与该备选规则匹配的若干推理子图的概率评分,确定该备选规则的置信度;
[0044] 规则筛序模块,配置为基于若干备选规则的置信度对所述若干备选规则进行筛选,得到所述图数据的业务规则,用于进行业务处理。
[0045] 第四方面,实施例提供了一种基于图数据的图神经网络训练装置,所述图数据包括代表业务对象的节点以及节点之间的连接边;所述装置包括:
[0046] 表征确定模块,配置为通过图神经网络确定所述图数据中的节点表征;
[0047] 规则落地模块,配置为将所述图数据的若干业务规则与匹配的实例子图进行结合,得到若干推理子图;业务规则包括推理条件和推理结果;任意一个推理子图包含:推理条件数据和推理结果数据;
[0048] 评分确定模块,配置为基于若干推理子图中的节点表征,确定若干推理子图中各自的推理结果数据成立的概率评分;
[0049] 损失确定模块,配置为将与若干推理子图分别对应的实例子图中的相应数据作为标签,基于所述标签和所述概率评分确定预测损失;
[0050] 模型更新模块,配置为向减小所述预测损失的方向更新所述图神经网络。
[0051] 第五方面,实施例提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面和第二方面中任一项所述的方法。
[0052] 第六方面,实施例提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面和第二方面中任一项所述的方法。
[0053] 本说明书实施例提供的方法及装置中,通过图神经网络确定图数据中的节点表征,从而利用该节点表征能够确定推理子图中推理结果数据成立的概率评分,基于推理子图的概率评分能够确定备选规则的置信度,基于该置信度可以从大量初步挖掘的备选规则中选出置信度高的业务规则。整个规则挖掘过程能够利用程序高效地从大量备选规则中筛选出能用于业务处理的业务规则,进而能够提高业务处理效率。

附图说明

[0054] 为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0055] 图1为本说明书披露的一个实施例的实施场景示意图;
[0056] 图2实施例提供了一种基于图数据的业务规则确定方法的流程示意图;
[0057] 图3为推理子图的几种结构示意图;
[0058] 图4为实施例提供的一种基于图数据的图神经网络训练方法的流程示意图;
[0059] 图5为实施例提供的一种基于图数据的业务规则确定装置的示意性框图;
[0060] 图6为实施例提供的一种基于图数据的图神经网络训练装置的示意性框图。

具体实施方式

[0061] 下面结合附图,对本说明书提供的方案进行描述。
[0062] 图1为本说明书披露的一个实施例的实施场景示意图。对图数据进行规则挖掘,得到多个备选规则,例如备选规则1、备选规则2等等。同时,可以通过图神经网络(Graph Neural Networks,GNN)对图数据中的节点进行嵌入(embedding)操作,得到节点表征。接着,将多个备选规则与其命中的实例子图进行落地(Grounding)处理,得到多个推理子图,例如推理子图1、推理子图2和推理子图3等等。利用推理子图中的节点表征可以确定推理子图中的推理结果数据成立的概率评分,例如p1、p2和p3等,并基于概率评分确定每个备选规则的置信度,例如确定备选规则1的置信度1,备选规则2的置信度2,等等。
[0063] 图数据包含业务数据。图数据是以业务数据作为原始数据构建成的图结构数据。图数据具体可以包括代表业务对象的节点以及节点之间的连接边。业务对象例如可以包括用户、商品和交易等。业务对象的信息以及与业务对象相关的业务数据可以采用节点属性以及节点之间的连接关系体现。当业务数据中包含隐私数据时,需要对图数据中的数据进行隐私保护。业务数据中包含的与用户相关的数据,均是在得到用户授权之后使用的。本实施例中的图数据也可以称为知识图谱。图数据可以实现为属性图或者二部图。在属性图中,节点的属性也作为节点存在于图数据中。
[0064] 图数据中的规则是一种推理逻辑,通常包含推理条件和推理结果。规则中的元素包括节点类型和关系类型等。例如,一条规则如下:{用户A}[转账给]{用户B},{用户A}[风险属性为]{1}→{用户B}的[风险属性为]{1}。其中的箭头前后分别是推理条件和推理结果。{}代表节点类型,[]代表关系类型。
[0065] 规则可以基于给定的图数据推理出不同业务对象之间的关系,或者推理出业务对象的属性。在风险控制场景中,属性可以是风险标签,例如高风险标签和低风险标签。在搜索推送场景中,可以利用预测得到的不同业务对象之间的关系来进行推送。例如,基于业务规则预测用户与商品之间是否具有关联关系,如果有,则说明用户对该商品的兴趣度较大,可以将该商品推送给该用户。这样,业务规则可以包括风险规则和推送规则,风险规则可以用于进行风险预测,推送规则可以用于进行商品推送。
[0066] 为了能够高效地得到业务规则,本说明书实施例提供了一种基于图数据的业务规则确定方法。该方法包括以下步骤:步骤S210,通过图神经网络确定图数据中的节点表征,步骤S220,将图数据的若干备选规则与匹配的实例子图进行结合,得到若干推理子图,步骤S230,基于若干推理子图中的节点表征,确定若干推理子图中各自的推理结果数据成立的概率评分,步骤S240,针对任意一个备选规则,基于与该备选规则匹配的若干推理子图的概率评分,确定该备选规则的置信度,步骤S250,基于若干备选规则的置信度对若干备选规则进行筛选,得到图数据的业务规则,用于进行业务处理。
[0067] 本实施例通过前面三个步骤,能够利用节点表征确定推理子图的推理结果数据成立的概率评分,基于推理子图的概率评分确定备选规则的置信度,从而利用置信度对多个备选规则进行筛选,筛选出置信度高的备选规则作为业务规则。下面结合图2对本实施例进行详细说明。
[0068] 图2实施例提供了一种基于图数据的业务规则确定方法的流程示意图。图数据包括代表业务对象的节点以及节点之间的连接边。在执行本方法之前,可以将原始的业务数据转换为图数据。在转换时,可以使用节点代表业务对象或属性,连接边代表业务对象或属性之间的关系。该方法通过计算设备执行,计算设备可以通过任何具有计算、处理能力的装置、设备、平台、设备集群等来实现。该方法包括以下步骤。
[0069] 在步骤S210中,通过GNN确定图数据中的节点表征。
[0070] 本实施例中,GNN用于基于图数据中的多个节点之间的连接关系确定节点表征。邻接矩阵通常被用于作为包含节点之间连接关系的数据。GNN可以通过节点之间的连接关系,对节点的邻居节点进行聚合,使得节点表征携带其邻居节点信息。其中,GNN是一类专门用于处理图结构数据的神经网络。GNN能够捕捉节点之间的关系和属性,为图数据提供连续的向量表示,从而能够应用于各种图相关任务,如节点分类、链接预测等。
[0071] 本步骤在执行时,可以将图数据的邻接矩阵输入GNN中,通过GNN输出节点表征。节点表征可以采用嵌入向量表示。GNN可以采用多种类型的网络实现,例如可以是图卷积网络或图注意力网络等。
[0072] 在风险控制场景下,图数据可以包含用户和交易等业务对象,通过GNN确定的是用户和交易的节点表征;当图数据仅包含交易时,通过GNN确定的是交易的节点表征。在搜索推送场景中,图数据可以包括用户和商品等业务对象,通过GNN确定的是用户和商品的节点表征。
[0073] 在步骤S220中,将图数据的若干备选规则与匹配的实例子图进行结合,得到若干推理子图。备选规则是从图数据中得到的推理规则,是待选的规则。备选规则与其命中的实例子图是相互匹配的。实例子图是图数据中的子图,包含若干节点和若干连接边。
[0074] 备选规则包括推理条件和推理结果。将备选规则与实例子图进行结合,也可以称为是Grounding过程。与任意一个备选规则匹配的实例子图的数量可以是一个或多个。
[0075] 推理子图是采用备选规则对实例子图进行推理之后得到的子图。实例子图中包含事实数据。在风险控制场景中,推理条件数据包含与用户和/或交易等业务对象相关的推理条件数据,推理结果数据包含与用户和/或交易等业务对象相关的推理结果数据。在搜索推送场景中,推理条件数据包含与用户和商品等业务对象相关的推理条件数据,推理结果数据包含与用户和商品等业务对象相关的推理结果数据。
[0076] 将若干备选规则与图数据中的实例子图进行结合,可以得到大量的推理子图。每一条备选规则可以对应一个或多个推理子图。一个推理子图对应一条备选规则,一个推理子图是由一条备选规则得到的。
[0077] 任意一个推理子图包含:推理条件数据和推理结果数据。推理条件数据和推理子图数据可以包含节点以及节点之间的连接边,或者说包含三元组或者节点与其属性等信息。推理条件数据和推理子图数据中的节点可以有重叠。当图数据中包括代表业务对象属性的节点也就是属性节点时,推理结果数据包含业务对象节点与业务对象节点之间的推理关系,和/或,业务对象节点与属性节点之间的推理关系。
[0078] 推理子图可以是环形图结构或者非环形图结构。一个实例子图可以匹配一个或多个规则,从一个实例子图可以得到一个或多个推理子图;对于不同的推理子图来说,至少以下数据中的任意一种不同:推理条件数据,推理结果数据。
[0079] 图3为推理子图的几种结构示意图。其中,左侧图为基于环形实例子图得到的推理子图,右侧图为基于非环形实例子图得到的推理子图。A E代表用户。例如,在左侧图中,包~含A、B、C和D节点的推理子图ABCD对应于规则1,其中的推理条件数据包括:A和B之间的朋友关系(A和B之间的关系类型是朋友),B和C之间的朋友关系,C和D之间的朋友关系;推理结果数据包括:D和A是朋友关系。包含A、E和D节点的推理子图AED对应于规则2,其中的推理条件数据包括:A和E之间的朋友关系,E和D之间的朋友关系;推理结果数据包括:D和A是朋友关系。推理子图AED中的关系类型可以与推理子图ABCD中的关系类型相同或者不同。虚线与推理结果数据对应,实线与推理条件数据对应。包含节点A E的子图可以属于一个实例子图,~
基于该实例子图得到至少两个推理子图,从而该实例子图匹配了至少两个规则。在另一种情况中,包含节点A、B、C和D的子图是一个实例子图,包含节点A、E和D的子图是另一个实例子图,这样每个实例子图分别对应一个推理子图。推理条件数据中的若干连接边对应的关系类型也可以不相同。
[0080] 右侧图为属性图,G和H代表交易。其中交易G和H、高风险和低风险构成一个推理子图GH,该推理子图对应于规则3,其中的推理条件数据包括:G和H是某种关系,H属于低风险;推理结果数据包括:G属于高风险。上述规则1、2和3可以属于备选规则。右侧图和左侧图可以分别属于不同的图数据,也可以属于一个图数据。
[0081] 在步骤S220执行之前,可以进行规则挖掘(Rule Mining),得到大量备选规则。规则挖掘是数据挖掘领域的一种方法,旨在从数据中发现潜在的规律和关联关系。规则挖掘可以帮助分析和理解数据中的模式,以便进行决策支持和知识发现。
[0082] 在一种实施方式中,可以采用频繁子图挖掘算法对图数据进行挖掘,得到若干频繁子图,基于若干频繁子图构建若干初始的业务规则,作为备选规则。
[0083] 频繁子图挖掘(Frequent Subgraph Mining)算法是图挖掘领域的一种技术,用于在大规模图数据中发现出现频繁的子图结构。频繁子图挖掘算法可以揭示图中的局部结构模式,为进一步的规则挖掘和知识发现提供基础。
[0084] 针对任意一个频繁子图,在构建业务规则时,可以确定该频繁子图中的推理条件数据和推理结果数据,基于该推理条件数据和推理结果数据中的节点信息和连接边信息,构建业务规则中的推理条件和推理结果。频繁子图中的推理条件数据和推理结果数据可以基于预先定义的推理条件数据特征和推理结果数据特征确定。例如,可以预先确定指定关系类型对应的数据作为推理结果数据,在子图中的其他相关数据作为推理条件数据。
[0085] 在具体实施时,也可以采用其他已有的规则挖掘算法从图数据中挖掘出备选规则。上述步骤S210和S220的执行可以不分先后,也可以同时执行。
[0086] 在步骤S230中,基于若干推理子图中的节点表征,确定若干推理子图中各自的推理结果数据成立的概率评分,作为若干推理子图分别对应的概率评分。该概率评分用于表征推理结果数据成立的可能性。例如,有10个推理子图,分别对应3条备选规则,也就是这10个推理子图是由这3条备选规则得到的。在本步骤中,需要确定10个推理子图中每个推理子图的推理结果数据成立的概率评分。
[0087] 为了更方便说明,可以将推理条件数据包含的节点作为第一类节点,将推理结果数据包含的节点作为第二类节点。例如,在图3的左侧图中,推理子图ABCD中的节点A、B、C和D属于第一类节点,节点A、D属于第二类节点。推理子图AED中的节点A、E和D属于第一类节点,节点A、D属于第二类节点。
[0088] 推理子图ABCD中的推理结果数据包括A与D之间存在的关系,该推理结果数据的概率评分,即是A与D之间存在该关系的概率评分。在计算该推理结果数据的概率评分时,可以直接利用该推理结果数据包含的节点表征确定概率评分,例如利用节点A和节点D的节点表征的乘积确定概率评分。
[0089] 也就是说,在确定概率评分时,可以针对不同的备选规则,分别基于各自规则的推理子图,确定对应规则的推理子图的概率评分,也可以是基于若干推理子图同时确定若干规则对应的推理子图的概率评分。
[0090] 为了更准确地确定推理结果数据成立的概率评分,在执行步骤S230时可以按照以下步骤1 3执行。~
[0091] 步骤1,基于若干推理子图中第二类节点的节点表征,确定推理结果数据的自身评分。
[0092] 步骤2,基于若干推理子图中第一类节点的节点表征,确定针对推理结果数据的贡献评分。
[0093] 步骤3,基于上述自身评分和贡献评分,确定对应的推理子图中推理结果数据成立的概率评分。
[0094] 在这种实施方式中,考虑推理条件数据也会对推理结果数据的可信性产生影响,因此在确定概率评分时,也考虑推理条件数据对推理结果数据的贡献评分。采用这种方式确定的概率评分会更加准确。
[0095] 在执行步骤1和2时,针对每一个推理子图,可以利用该推理子图中第二类节点的节点表征之间的乘积,确定该推理子图中推理结果数据的自身评分;利用该推理子图中第一类节点的节点表征之间的乘积,确定该推理子图中推理结果数据的贡献评分。在执行步骤3时,可以将自身评分和对应贡献评分的和值或者加权和值,作为对应的推理子图中推理结果数据成立的概率评分。
[0096] 例如,在图3的左侧图中,利用节点A、B、C和D的节点表征的乘积确定推理子图ABCD中推理结果数据的自身评分,利用节点A和D的节点表征的乘积确定推理子图ABCD中推理结果数据的贡献评分。
[0097] 在一种实施方式中,第一类节点也可能是其他推理子图中的推理结果数据。因此,在确定贡献评分时,可以确定第一类节点的自身评分,基于该自身评分确定在本推理子图中推理结果数据的贡献评分。
[0098] 也就是说,基于任意一个推理子图G1中第一类节点的节点表征,确定该第一类节点之间的自身评分,基于该自身评分确定该推理子图G1针对该推理子图G1中推理结果数据的贡献评分。
[0099] 多个推理子图可能是相互交错的,一个推理子图的第一类节点中可能包含其他推理子图的第二类节点。其他推理子图的自身评分会对本推理子图中的贡献评分产生影响。为了更准确地确定概率评分,可以针对多个推理子图进行迭代处理,来确定多个推理子图中推理结果数据的概率评分。
[0100] 上述步骤3在执行时可以通过若干迭代过程实现。在任意一次迭代过程中,基于任意一个推理子图的第一类节点之间的自身评分,确定该推理子图针对其推理条件数据的贡献评分;接着,针对任意一个推理结果数据,基于所有推理子图分别针对该推理结果数据的贡献评分,更新该推理结果数据的自身评分。
[0101] 当该推理结果数据的自身评分更新之后,也就更新了以该推理结果数据包含的节点作为第一类节点时该第一类节点之间的自身评分,该更新后的自身评分可以用在下一次迭代中使用。
[0102] 初始时,可以基于任意一个推理子图中第一类节点的节点表征,确定该第一类节点之间的自身评分。
[0103] 上述迭代过程可以多次执行。当若干推理子图中推理结果数据的自身评分不发生变化时,或者迭代过程执行预设次数时,可以认为迭代过程达到收敛。
[0104] 当若干迭代过程收敛时,基于任意一个推理子图针对其推理结果数据的贡献评分,确定该推理子图中推理结果数据成立的概率评分。如果该推理子图针对其推理结果数据的贡献评分有多个,可以将该多个贡献评分的和值或者加权和值或者乘积,作为该推理结果数据的概率评分。迭代过程收敛并不是本实施方式的必要条件。在一种实施方式中,如果迭代过程没有达到收敛,也可以基于任意一个推理子图针对其推理结果数据的贡献评分,确定该推理子图中推理结果数据成立的概率评分。
[0105] 下面以图3中的左侧图为例对上述迭代过程进行说明。初始时,在推理子图ABCD中,利用节点A和B的节点表征乘积计算节点A和B之间的自身评分1,利用节点B和C的节点表征乘积计算节点B和C之间的自身评分2,利用节点C和D的节点表征乘积计算节点C和D之间的自身评分3,利用节点A和D的节点表征乘积计算节点A和D之间的自身评分4,作为A和D之间初始的概率评分。在推理子图AED中,利用节点A和E的节点表征乘积计算节点A和E之间的自身评分5,利用节点E和D的节点表征乘积计算节点E和D之间的自身评分6。
[0106] 利用自身评分1、2和3可以计算对A和D的贡献评分1,利用自身评分5和6可以计算对A和D的贡献评分2,将贡献评分1和贡献评分2都叠加到自身评分4,得到更新后的概率评分,也就是A和D之间更新后的自身评分4。基于更新后的自身评分4可以再去更新其他的推理结果数据。例如,A和B之间也存在推理关系,A和D之间更新后的自身评分4可以结合自身评分2和3,对A和B之间的自身评分1进行更新。按照这样的规律可以对全部的推理子图进行迭代更新。
[0107] 如前所述,图数据中可以包含属性等信息,属性可以作为节点存在于图数据中,也可以不作为节点。规则可以用于对节点代表的用户、商品或交易的属性进行预测。该属性可以是用户的风险类别,或者是交易的风险类别等。
[0108] 如果属性作为节点存在于图数据中,那么在步骤S410中也能确定属性节点的节点表征。在确定业务对象节点和属性节点的自身评分或贡献评分时,可以直接利用这些节点的节点表征进行确定。属性也可以不作为图数据中的节点,也就不存在属性节点的节点表征。那么在计算自身评分或者贡献评分时,可以从原始数据中确定业务对象节点与该属性之间是否存在连接关系,如果存在,则将其自身评分或者贡献评分确定为第一预设值;如果不存在,则将其自身评分或者贡献评分确定为第二预设值。例如,在风险控制场景下,属性可以包含高风险标签和低风险标签,第一预设值和第二预设值可以是1或0。在搜索推送场景下,属性可以包含目标用户和非目标用户,第一预设值和第二预设值可以是1或0。
[0109] 当迭代过程收敛后,对于推理子图ABCD,可以利用更新后的A和B之间的自身评分1、更新后的B和C之间的自身评分2以及更新后的C和D之间的自身评分3,确定A和D之间的概率评分。例如,可以基于该自身评分1、自身评分2和自身评分3的乘积确定。
[0110] 在本实施方式中,通过迭代的方式,基于多个推理子图中的数据对多个推理子图中的自身评分和贡献评分进行迭代更新,能够联合考虑多个推理子图中的数据,从而使得确定的概率评分更加准确和全面。
[0111] 在步骤S240中,针对任意一个备选规则,可以基于与该备选规则匹配的若干推理子图的概率评分,确定该备选规则的置信度。具体的,可以通过将概率评分相加或加权相加得到置信度。
[0112] 例如,对于规则1,与该规则1匹配的推理子图有3个,这3个推理子图中的推理结果数据的概率评分分别是0.2、0.3和0.6,可以将0.2、0.3和0.6的和值或者加权和值作为该规则1的置信度。
[0113] 在步骤S250中,基于若干备选规则的置信度对若干备选规则进行筛选,得到图数据的业务规则,用于进行业务处理。在风险控制场景下,得到的业务规则是风控规则,该风控规则用于进行对交易进行风险预测。在搜索推送场景下,得到的业务规则是推送规则,该推送规则用于对用户进行商品推送。具体的,可以将备选规则的置信度与置信度阈值进行比较,将置信度大于置信度阈值的备选规则筛选出来作为业务规则。
[0114] 上述实施例提供了一种备选规则的确定方法。在对备选规则进行筛选的过程中,还可以通过上述实施例执行过程中得到的节点之间的概率评分,对图神经网络进行训练。也就是说,在上述实施例中,可以采用训练后的图神经网络,也可以与图神经网络进行联合训练。
[0115] 在本说明书的一个实施例中,可以将与若干推理子图分别对应的实例子图中的相应数据作为标签,基于所述标签和步骤S230中得到的概率评分之间的差异确定预测损失,该差异与预测损失正相关。接着,向减小该预测损失的方向更新图神经网络。
[0116] 在本说明书的另一实施例中,可以基于图2所示实施例的发明思路,对图神经网络进行训练。具体可以参见图4所示实施例。
[0117] 图4为实施例提供的一种基于图数据的图神经网络训练方法的流程示意图。图数据包括代表业务对象的节点以及节点之间的连接边。该方法包括以下步骤S410 S450。~
[0118] 步骤S410,通过图神经网络确定图数据中的节点表征。
[0119] 步骤S420,将图数据的若干业务规则与匹配的实例子图进行结合,得到若干推理子图。业务规则包括推理条件和推理结果;任意一个推理子图包含:推理条件数据和推理结果数据。
[0120] 步骤S430,基于若干推理子图中的节点表征,确定若干推理子图中各自的推理结果数据成立的概率评分。
[0121] 步骤S440,将与若干推理子图分别对应的实例子图中的相应数据作为标签,基于该标签和概率评分确定预测损失。
[0122] 步骤S450,向减小预测损失的方向更新图神经网络。
[0123] 上述步骤S410 S430的执行过程可以参见图2所示实施例中的步骤S210 S230。其~ ~中,将步骤S420中的业务规则与步骤S220中的备选规则进行等价替换即可。步骤S420中的业务规则可以通过图2所示实施例确定。
[0124] 在本实施例中,利用业务规则和推理子图作为媒介,借助业务规则的推理能力,能够对节点之间的连接关系进行预测,从而基于原始数据中的标签对图神经网络进行训练,从而提高图神经网络在确定业务对象节点的节点表征时的准确性。
[0125] 本说明书中,第一类节点等词语中的“第一”,以及文中相应的“第二”(如果存在)等,仅仅是为了区分和描述方便,并不具有任何限定意义。
[0126] 上述内容对本说明书的特定实施例进行了描述,其他实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行,并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要按照示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的,或者可能是有利的。
[0127] 图5为实施例提供的一种基于图数据的业务规则确定装置的示意性框图。图数据包括代表业务对象的节点以及节点之间的连接边。该装置500部署在计算设备中,计算设备可以通过任何具有计算、处理能力的装置、设备、平台、设备集群等来实现。该装置实施例与图2所示方法实施例相对应。该装置500包括:
[0128] 表征确定模块510,配置为通过图神经网络确定所述图数据中的节点表征;
[0129] 实例结合模块520,配置为将所述图数据的若干备选规则与匹配的实例子图进行结合,得到若干推理子图;备选规则包括推理条件和推理结果;任意一个推理子图包含:推理条件数据和推理结果数据;
[0130] 评分确定模块530,配置为基于若干推理子图中的节点表征,确定若干推理子图中各自的推理结果数据成立的概率评分;
[0131] 置信度确定模块540,配置为针对任意一个备选规则,基于与该备选规则匹配的若干推理子图的概率评分,确定该备选规则的置信度;
[0132] 规则筛序模块550,配置为基于若干备选规则的置信度对所述若干备选规则进行筛选,得到所述图数据的业务规则,用于进行业务处理。
[0133] 在一种实施方式中,该装置500还包括规则挖掘模块(图中未示出),配置为挖掘所述图数据中的备选规则,具体包括:
[0134] 挖掘子模块(图中未示出),配置为采用频繁子图挖掘算法对所述图数据进行挖掘,得到若干频繁子图;
[0135] 构建子模块(图中未示出),配置为基于若干频繁子图构建若干初始的业务规则,作为备选规则。
[0136] 在一种实施方式中,所述构建子模块,其配置包括:
[0137] 针对任意一个频繁子图,确定该频繁子图中的推理条件数据和推理结果数据,基于所述推理条件数据和推理结果数据中的节点信息和连接边信息,构建业务规则中的推理条件和推理结果。
[0138] 在一种实施方式中,所述推理条件数据包含第一类节点,所述推理结果数据包含第二类节点;评分确定模块530包括:
[0139] 第一子模块531,配置为基于若干推理子图中第二类节点的节点表征,确定所述推理结果数据的自身评分;
[0140] 第二子模块532,配置为基于若干推理子图中第一类节点的节点表征,确定针对所述推理结果数据的贡献评分;
[0141] 第三子模块533,配置为基于所述自身评分和所述贡献评分,确定对应的推理子图中推理结果数据成立的概率评分。
[0142] 在一种实施方式中,所述第二子模块532,其配置具体包括:
[0143] 基于任意一个推理子图中第一类节点的节点表征,确定所述第一类节点之间的自身评分,基于所述自身评分确定该推理子图针对其推理结果数据的贡献评分。
[0144] 在一种实施方式中,推理子图的第一类节点中包含其他推理子图的第二类节点;所述第三子模块533,其配置具体包括:
[0145] 通过若干迭代过程确定所述概率评分;其中,任意一次迭代过程包括:基于推理子图中第一类节点之间的自身评分,确定该推理子图针对其推理条件数据的贡献评分;针对任意一个推理结果数据,基于所有推理子图分别针对该推理结果数据的贡献评分,更新该推理结果数据的自身评分。
[0146] 在一种实施方式中,所述若干迭代过程的收敛条件包括:若干推理子图中推理结果数据的自身评分不发生变化。
[0147] 在一种实施方式中,所述第三子模块533,其配置具体包括:
[0148] 当所述若干迭代过程收敛时,基于任意一个推理子图针对其推理结果数据的贡献评分,确定该推理子图中推理结果数据成立的概率评分。
[0149] 在一种实施方式中,所述图数据还包括代表业务对象属性的节点;所述推理结果数据包含业务对象节点与业务对象节点之间的推理关系,和/或,业务对象节点与属性节点之间的推理关系。
[0150] 在一种实施方式中,该装置500还包括:
[0151] 模型训练模块(图中未示出),配置为将与若干推理子图分别对应的实例子图中的相应数据作为标签,基于所述标签和所述概率评分确定预测损失;向减小所述预测损失的方向更新所述图神经网络。
[0152] 图6为实施例提供的一种基于图数据的图神经网络训练装置的示意性框图。图数据包括代表业务对象的节点以及节点之间的连接边。该装置实施例与图4所示方法实施例相对应。该装置600部署在计算设备中。该装置600包括:
[0153] 表征确定模块610,配置为通过图神经网络确定所述图数据中的节点表征;
[0154] 规则落地模块620,配置为将所述图数据的若干业务规则与匹配的实例子图进行结合,得到若干推理子图;业务规则包括推理条件和推理结果;任意一个推理子图包含:推理条件数据和推理结果数据;
[0155] 评分确定模块630,配置为基于若干推理子图中的节点表征,确定若干推理子图中各自的推理结果数据成立的概率评分;
[0156] 损失确定模块640,配置为将与若干推理子图分别对应的实例子图中的相应数据作为标签,基于所述标签和所述概率评分确定预测损失;
[0157] 模型更新模块650,配置为向减小所述预测损失的方向更新所述图神经网络。
[0158] 上述装置实施例与方法实施例相对应,具体说明可以参见方法实施例部分的描述,此处不再赘述。装置实施例是基于对应的方法实施例得到,与对应的方法实施例具有同样的技术效果,具体说明可参见对应的方法实施例。
[0159] 本说明书实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行图1至图4任一项所述的方法。
[0160] 本说明书实施例还提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现图1至图4任一项所述的方法。
[0161] 本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于存储介质和计算设备实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。
[0162] 本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
[0163] 以上所述的具体实施方式,对本发明实施例的目的、技术方案和有益效果进行了进一步的详细说明。所应理解的是,以上所述仅为本发明实施例的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。