基于多方数据的风险识别方法、装置、设备及存储介质转让专利

申请号 : CN202311041642.1

文献号 : CN116775620B

文献日 : 2023-11-10

本公开提供一种基于多方数据的风险识别方法、装置、设备及存储介质，涉及数据管理及处理、大数据等技术领域。该方法包括：首先接收第一参与方发送的风险识别请求，对目标数据进行解析，以获取目标数据中包含的至少一个目标维度的第一特征值，然后基于第一特征值，检索每个第二参与方的业务数据库，以获取关联数据，之后对关联数据进行解析，以获取关联数据中包含的第二特征值，最后利用风险识别模型，对第一特征值及第二特征值进行识别，以确定第一业务数据是否为风险业务。由此，通过利用风险识别模型，对第一业务的第一特征值以及每个第二参与方的第二特征值进行识别，来确定第一业务是否为风险业务，从而提高了风险识别结果的准确性和可靠性。

1.一种基于多方数据的风险识别方法，其特征在于，包括：接收第一接入点发送的风险识别请求，其中，所述风险识别请求中包括所述第一接入点的第一标识；

在接入点标识列表中包含所述第一标识、且所述第一标识与第一参与方的第二标识关联的情况下，确定接收到所述第一参与方发送的风险识别请求，其中，所述识别请求中包括待识别的第一业务数据；

对目标数据进行解析，以获取所述目标数据中包含的至少一个目标维度的第一特征值；

基于所述第一特征值，检索每个第二参与方的业务数据库，以获取关联数据；

对所述关联数据进行解析，以获取所述关联数据中包含的第二特征值；

获取多个参与方分别提供的业务数据集，其中，所述业务数据集中包括多个第二业务数据及对应的标注结果；

根据每个所述第二业务数据对应的资源流转信息，确定所述多个第二业务数据间的流转关系；

对具有流转关系的所述第二业务数据进行解析，以获取同一资源关联的特征值序列；

将所述特征值序列，输入初始识别模型，以获取预测结果；

基于所述预测结果与所述标注结果间的差异，对所述初始识别模型进行修正，直至获取风险识别模型；

利用风险识别模型，对所述第一特征值及所述第二特征值进行识别，以确定所述第一业务数据是否为风险业务。

2.如权利要求1所述的方法，其特征在于，在所述接收属于所述第一参与方的第一接入点发送的风险识别请求之前，还包括：接收所述第一接入点发送的接入请求，其中，所述接入请求中包括所述第一标识、所述第二标识及第一校验码；

基于所述第二标识确定所述第一参与方对应的校验码生成模式；

基于所述校验码生成模式、所述第一标识及所述第二标识，生成第二校验码；

在所述第一校验码与所述第二校验码匹配的情况下，将所述第一标识与所述第二标识关联存入所述接入点标识列表中。

3.如权利要求1所述的方法，其特征在于，在所述基于所述第一特征值，检索每个第二参与方的业务数据库之后，还包括：在每个所述业务数据库中均未包含所述关联数据的情况下，或者，在获取的关联数据的数量和/或类型小于阈值的情况下，向所述第二参与方的第二接入点发送数据查询请求，其中，所述数据查询请求中包含所述第一业务数据关联的业务方标识；

接收所述第二接入点发送的查询数据；

对所述查询数据进行解析，以获取所述查询数据中包含的第三特征值；

利用所述风险识别模型，对所述第一特征值、所述第二特征值及所述第三特征值进行识别，以确定所述第一业务数据是否为风险业务。

4.如权利要求1所述的方法，其特征在于，在所述利用风险识别模型，对所述第一特征值及所述第二特征值进行识别之后，还包括：在所述第一业务为风险业务的情况下，向所述第一参与方发送预警消息。

5.一种基于多方数据的风险识别装置，其特征在于，包括：接收模块，用于接收第一接入点发送的风险识别请求，其中，所述风险识别请求中包括所述第一接入点的第一标识；在接入点标识列表中包含所述第一标识、且所述第一标识与第一参与方的第二标识关联的情况下，确定接收到所述第一参与方发送的风险识别请求，其中，所述识别请求中包括待识别的第一业务数据；

第一解析模块，用于对目标数据进行解析，以获取所述目标数据中包含的至少一个目标维度的第一特征值；

检索模块，用于基于所述第一特征值，检索每个第二参与方的业务数据库，以获取关联数据；

第二解析模块，用于对所述关联数据进行解析，以获取所述关联数据中包含的第二特征值；

识别模块，用于利用风险识别模型，对所述第一特征值及所述第二特征值进行识别，以确定所述第一业务数据是否为风险业务；

所述装置还用于：

在所述利用风险识别模型，对所述第一特征值及所述第二特征值进行识别之前，获取多个参与方分别提供的业务数据集，其中，所述业务数据集中包括多个第二业务数据及对应的标注结果；

根据每个所述第二业务数据对应的资源流转信息，确定所述多个第二业务数据间的流转关系；

对具有流转关系的所述第二业务数据进行解析，以获取同一资源关联的特征值序列；

将所述特征值序列，输入初始识别模型，以获取预测结果；

基于所述预测结果与所述标注结果间的差异，对所述初始识别模型进行修正，直至获取所述风险识别模型。

6.一种电子设备，其特征在于，包括：

至少一个处理器；

以及，与所述至少一个处理器通信连接的存储器；

其中，所述存储器存储可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1‑4中任一项所述的方法。

7.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1‑4中任一项所述的方法。

基于多方数据的风险识别方法、装置、设备及存储介质

技术领域

[0001] 本公开涉及到数据管理、数据处理、大数据等技术领域，尤其涉及一种基于多方数据的风险识别方法、装置、设备及存储介质。

背景技术

[0002] 在传统的风险管理中，银行通常依赖自身的数据收集、分析和处理能力进行风险管理。但是由于数据的局限性，银行自身数据的不完整性和准确性可能会导致风险管理的效果不佳。

发明内容

[0003] 本公开提供了一种基于多方数据的风险识别方法、装置、设备及存储介质，用以解决如何提高银行数据的完整性和准确性，从而提升风险管理效果的问题。

[0004] 根据本公开的一方面，提供了一种基于多方数据的风险识别方法，包括：

[0005] 接收第一参与方发送的风险识别请求，其中，所述识别请求中包括待识别的第一业务数据；

[0006] 对目标数据进行解析，以获取所述目标数据中包含的至少一个目标维度的第一特征值；

[0007] 基于所述第一特征值，检索每个第二参与方的业务数据库，以获取关联数据；

[0008] 对所述关联数据进行解析，以获取所述关联数据中包含的第二特征值；

[0009] 利用风险识别模型，对所述第一特征值及所述第二特征值进行识别，以确定所述第一业务数据是否为风险业务。

[0010] 根据本公开的另一方面，提供了一种基于多方数据的风险识别方法，包括：

[0011] 接收模块，用于接收第一参与方发送的风险识别请求，其中，所述识别请求中包括待识别的第一业务数据；

[0012] 第一解析模块，用于对目标数据进行解析，以获取所述目标数据中包含的至少一个目标维度的第一特征值；

[0013] 检索模块，用于基于所述第一特征值，检索每个第二参与方的业务数据库，以获取关联数据；

[0014] 第二解析模块，用于对所述关联数据进行解析，以获取所述关联数据中包含的第二特征值；

[0015] 识别模块，用于利用风险识别模型，对所述第一特征值及所述第二特征值进行识别，以确定所述第一业务数据是否为风险业务。

[0016] 根据本公开的另一方面，提供了一种电子设备，包括：

[0017] 至少一个处理器；

[0018] 以及，与至少一个处理器通信连接的存储器；

[0019] 其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行上述实施例的方法。

[0020] 根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，计算机指令用于使计算机执行根据上述实施例的方法。

[0021] 本公开提供的一种基于多方数据的风险识别方法、装置、设备及存储介质。首先接收第一参与方发送的风险识别请求，对目标数据进行解析，以获取目标数据中包含的至少一个目标维度的第一特征值，然后基于第一特征值，检索每个第二参与方的业务数据库，以获取关联数据，之后对关联数据进行解析，以获取关联数据中包含的第二特征值，最后利用风险识别模型，对第一特征值及第二特征值进行识别，以确定第一业务数据是否为风险业务。由此，通过利用风险识别模型，对第一业务的第一特征值以及每个第二参与方的第二特征值进行识别，来确定第一业务是否为风险业务，从而提高了风险识别结果的准确性和可靠性。

附图说明

[0022] 此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。

[0023] 图1为本公开实施例提供的一种基于多方数据的风险识别方法的流程示意图；

[0024] 图2为本公开实施例提供的一种基于多方数据的风险识别方法的流程示意图；

[0025] 图3为本公开实施例提供的一种基于多方数据的风险识别方法的流程示意图；

[0026] 图4为本公开实施例提供的一种基于多方数据的风险识别方法的流程示意图；

[0027] 图5为本公开实施例提供的一种基于多方数据的风险识别装置的结构示意图；

[0028] 图6为本公开实施例提供的一种电子设备的结构示意图。

[0029] 通过上述附图，已示出本申请明确的实施例，后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围，而是通过参考特定实施例为本领域技术人员说明本申请的概念。

具体实施方式

[0030] 这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

[0031] 下面参考附图，对本公开实施例的基于多方数据的风险识别方法进行详细说明。

[0032] 需要说明的是，本公开实施的基于多方数据的风险识别方法可由多方数据处理平台执行，该多方数据处理平台，为独立于各参与方的可信的数据处理平台，其可以与各参与方进行数据交互，并为各参与方提供数据处理服务，同时保证每个参与方的数据不被其它参与方获得。该多方数据处理平台，可以由任意电子设备实现。

[0033] 需要说明的是，为了降低数据处理难度，可以设置数据传输的格式、数据结构以及数据加密的格式等规范，然后多方数据处理平台与各参与方基于该规范进行数据的传输，减少数据处理中的混乱和错误。同时多方数据处理平台，可以为每个参与方提供知识图谱模型、规则模型和数据模型等公共服务以及计量引擎，使得每个参与方能够方便地访问和传输数据，从而形成多个参与方可以实现“数据共享”，提高各参与方服务的性能。

[0034] 图1为本公开实施例提供的一种基于多方数据的风险识别方法的流程示意图。

[0035] 如图1所示，该方法包括：

[0036] 步骤101，接收第一参与方发送的风险识别请求，其中，识别请求中包括待识别的第一业务数据。

[0037] 其中，第一参与方，为接入数据处理平台的，可以与数据处理平台“共享”数据，并从数据处理平台中获取服务的任意参与方，本公开实施例中，第一参与方为需要进行业务风险识别的机构。

[0038] 其中，第一业务数据，为第一参与方需要进行风险识别的业务数据。比如，若第一参与方为银行，第一业务数据可以为交易数据，本公开对此不做限定。

[0039] 在一些可能的实现形式中，数据处理平台，可以接收第一接入点发送的风险识别请求，其中，风险识别请求中包括第一接入点的第一标识，在接入点标识列表中包含第一标识、且第一标识与第一参与方的第二标识关联的情况下，则可以确定接收到第一参与方发送的风险识别请求。

[0040] 其中，第一接入点，为数据处理平台向第一参与方授权的，可以与数据处理平台进行数据传输的节点。

[0041] 需要说明的是，为了保证数据传输的安全性，数据处理平台将会给第一参与方授权第一接入点，作为与平台自身的连接，也就是说，第一参与方向平台传输数据时，都要经过已授权的第一接入点进行传输，从而实现了平台与第一参与方之间的点对点数据传输，提高数据传输的高效性和安全性。

[0042] 其中，接入点标识列表，为存储已关联的接入点标识与参与方标识的列表。

[0043] 需要说明的是，接入点标识列表中存储的，均为数据处理平台已授权的接入点标识和关联的参与方标识，平台在接收到接入点传输的数据后，可以通过遍历接入点标识列表，查询与接入点标识关联的参与方标识，从而确定接收的数据的来源。

[0044] 其中，第一标识，为用来指示第一接入点的标识。第二标识，为用来指示第一参与方的标识。

[0045] 本公开中，第一参与方通过第一接入点向数据处理平台发送风险识别请求。平台在接收到第一接入点发送的风险识别请求后，遍历接入点标识列表，若接入点标识列表中包含第一标识、且第一标识与第一参与方的第二标识关联，就可以确定接收到第一参与方发送的风险识别请求。若接入点标识列表中不包含第一标识，则平台可以忽略此风险识别请求。

[0046] 步骤102，对目标数据进行解析，以获取目标数据中包含的至少一个目标维度的第一特征值。

[0047] 其中，目标维度，为构建一个完整的数据链所需要的信息的维度。比如，目标数据为金融业务数据时，目标维度可以包括：用户标识、业务金额、交易时间、业务地点等等，本公开对此不做限定。

[0048] 需要说明的是，平台在对目标数据进行解析时，可能解析到一个目标维度的第一特征值，或者也可能解析到多个目标维度分别对应的多个第一特征值，本公开对此不做限定。为了保证数据的准确性和完整性，通常情况下，平台解析到的第一特征值为多个。

[0049] 步骤103，基于第一特征值，检索每个第二参与方的业务数据库，以获取关联数据。

[0050] 其中，第二参与方，为除第一参与方外的，其他接入数据处理平台的机构。

[0051] 其中，业务数据库，为用于存储第二参与方的业务数据的数据库。

[0052] 需要说明的是，每个第二参与方向数据处理平台上传自身的业务数据，然后平台针对每个第二参与方上传的业务数据，分别创建对应的业务数据库，从而使得平台可以对这些业务数据库进行管理和检索。然后平台基于第一特征值，对每个第二参与方的业务数据库进行检索，来获取与第一特征值关联的数据。

[0053] 步骤104，对关联数据进行解析，以获取关联数据中包含的第二特征值。

[0054] 其中，第二特征值，为关联数据中包含的其他目标维度的特征值。

[0055] 本公开中，数据处理平台在获取到关联数据后，就可以对关联数据进行解析，来获取关联数据中包含的其他目标维度的第二特征值。

[0056] 步骤105，利用风险识别模型，对第一特征值及第二特征值进行识别，以确定第一业务数据是否为风险业务。

[0057] 其中，风险识别模型，为数据处理平台用来对第一业务数据进行风险识别的模型。

[0058] 需要说明的是，风险识别模型可以是数据处理平台基于多个参与方的业务数据进行训练得到的。从而使得风险识别模型可以对由多个参与方的业务数据得到的第一特征及第二特征进行识别，以确定业务是否为风险业务，提高了风险识别的准确性。

[0059] 本公开中，数据处理平台进行风险识别时，通过基于多个参与方的业务数据，确定业务数据对应的各个目标维度的特征值，并基于目标维度的特征值进行风险识别，由于风险识别是以闭环的业务数据的特征值为依据的，从而得到的风险识别结果更准确、更可靠。

[0060] 需要说明的是，平台在确定第一业务数据是否为风险业务后，就可以将结果通过第一接入点返回给第一参与方，以供第一参与方进一步分析。

[0061] 本公开实施例中，首先接收第一参与方发送的风险识别请求，对目标数据进行解析，以获取目标数据中包含的至少一个目标维度的第一特征值，然后基于第一特征值，检索每个第二参与方的业务数据库，以获取关联数据，之后对关联数据进行解析，以获取关联数据中包含的第二特征值，最后利用风险识别模型，对第一特征值及第二特征值进行识别，以确定第一业务数据是否为风险业务。由此，通过利用风险识别模型，对第一业务的第一特征值以及每个第二参与方的第二特征值进行识别，来确定第一业务是否为风险业务，从而提高了风险识别结果的准确性和可靠性。

[0062] 图2为本公开实施例提供的一种基于多方数据的风险识别方法的流程示意图。

[0063] 如图2所示，该方法包括：

[0064] 步骤201，接收第一接入点发送的接入请求，其中，接入请求中包括第一标识、第二标识及第一校验码。

[0065] 其中，接入请求，为第一参与方请求获得数据处理平台的授权，来通过第一接入点向平台传输数据的请求。

[0066] 其中，第一校验码，为基于第一标识以及第二标识生成的数据编码，用来检测接入请求中的第一标识以及第二标识在传输过程中是否出现错误，其可以为奇偶校验码、海明校验码、循环冗余校验码等等，本公开对此不做限定。

[0067] 步骤202，基于第二标识确定第一参与方对应的校验码生成模式。

[0068] 本公开中，数据处理平台接收到第一接入点发送的接入请求后，就可以基于接入请求中的第二标识，确定第一参与方对应的校验码生成模式。

[0069] 其中，不同的参与方对应的校验码生成模式可能相同或者不同，本公开对此不做限定。

[0070] 步骤203，基于校验码生成模式、第一标识及第二标识，生成第二校验码。

[0071] 本公开中，数据处理平台在确定第一参与方的校验码生成模式后，就可以基于校验码生成模式、以及接收的接入请求中的第一标识、第二标识，生成第二校验码。

[0072] 步骤204，在第一校验码与第二校验码匹配的情况下，将第一标识与第二标识关联存入接入点标识列表中。

[0073] 本公开中，在第一校验码与第二校验码匹配的情况下，可以认为接入请求中的第一标识以及第二标识，在数据传输的过程中没有出现错误，此时数据处理平台就可以将第一标识与第二标识关联存入接入点标识列表中。

[0074] 步骤205，接收第一接入点发送的风险识别请求，其中，风险识别请求中包括第一接入点的第一标识。

[0075] 需要说明的是，第一参与方向数据处理平台发送风险识别请求时，需要经过第一接入点进行发送，从而保证数据传输的安全性。

[0076] 步骤206，在接入点标识列表中包含第一标识、且第一标识与第一参与方的第二标识关联的情况下，确定接收到第一参与方发送的风险识别请求。

[0077] 本公开中，数据处理平台在接收到第一接入点发送的风险识别请求后，首先遍历接入点标识列表，在接入点标识列表中包含第一标识、且第一标识与第一参与方的第二标识关联的情况下，就可以确定接收到第一参与方发送的风险识别请求。

[0078] 需要说明的是，当接入点标识列表中未包含第一标识时，数据处理平台将会忽略该风险识别请求。

[0079] 步骤207，对目标数据进行解析，以获取目标数据中包含的至少一个目标维度的第一特征值。

[0080] 步骤208，基于第一特征值，检索每个第二参与方的业务数据库，以获取关联数据。

[0081] 步骤209，对关联数据进行解析，以获取关联数据中包含的第二特征值。

[0082] 步骤210，利用风险识别模型，对第一特征值及第二特征值进行识别，以确定第一业务数据是否为风险业务。

[0083] 其中，步骤207至步骤210的具体实现形式，可参照本公开中其他各实施例中的详细描述，此处不再具体赘述。

[0084] 步骤211，在第一业务为风险业务的情况下，向第一参与方发送预警消息。

[0085] 本公开中，数据处理平台在确定第一业务为风险业务的情况下，通过第一接入点将风险识别结果返回给第一参与方，同时返回预警消息，以供第一参与方进一步分析。

[0086] 本公开实施例中，首先接收第一接入点发送的接入请求，并基于第二标识确定第一参与方对应的校验码生成模式，然后基于校验码生成模式、第一标识及第二标识，生成第二校验码，在第一校验码与第二校验码匹配的情况下，将第一标识与第二标识关联存入接入点标识列表中。之后接收第一接入点发送的风险识别请求，在接入点标识列表中包含第一标识、且第一标识与第一参与方的第二标识关联的情况下，确定接收到第一参与方发送的风险识别请求，再之后对目标数据进行解析，以获取目标数据中包含的至少一个目标维度的第一特征值，且基于第一特征值，检索每个第二参与方的业务数据库，以获取关联数据，然后再对关联数据进行解析，以获取关联数据中包含的第二特征值，最后利用风险识别模型，对第一特征值及第二特征值进行识别，以确定第一业务数据是否为风险业务，在第一业务为风险业务的情况下，向第一参与方发送预警消息。由此，基于第一参与方的校验码生成模式、接入请求中的第一标识以及第二标识，生成第二校验码，在第一校验码与第二校验码匹配的情况下，将第一标识与第二标识关联存入接入点标识列表中，从而使得第一参与方与数据处理平台可以通过第一接入点进行数据传输，提高了数据传输的安全性。

[0087] 图3为本公开实施例提供的一种基于多方数据的风险识别方法的流程示意图。

[0088] 如图3所示，该方法包括：

[0089] 步骤301，接收第一参与方发送的风险识别请求，其中，识别请求中包括待识别的第一业务数据。

[0090] 步骤302，对目标数据进行解析，以获取目标数据中包含的至少一个目标维度的第一特征值。

[0091] 步骤303，基于第一特征值，检索每个第二参与方的业务数据库，以获取关联数据。

[0092] 其中，步骤301至步骤303的具体实现形式，可参照本公开中其他各实施例中的详细描述，此处不再具体赘述。

[0093] 步骤304，在每个业务数据库中均未包含关联数据的情况下，或者，在获取的关联数据的数量和/或类型小于阈值的情况下，向第二参与方的第二接入点发送数据查询请求，其中，数据查询请求中包含第一业务数据关联的业务方标识。

[0094] 其中，阈值，为数据处理平台获取的关联数据的数量和/或类型的临界值，其为数据处理平台预先设置的，本公开对此不做限定。

[0095] 其中，第二接入点，为数据处理平台向第二参与方授权的，可以与数据处理平台进行数据传输的节点。

[0096] 其中，数据查询请求，为数据处理平台用来向第二参与方查询，与第一业务关联的业务数据的请求。

[0097] 其中，业务方标识，为发起第一业务的机构的标识。

[0098] 本公开中，数据处理平台在没有在业务数据库中检索到关联数据的情况下，或者获取的关联数据的数量和/或类型小于阈值的情况下，通过第二接入点，向第二参与方发送数据查询请求，来查询与第一业务关联的业务数据。

[0099] 步骤305，接收第二接入点发送的查询数据。

[0100] 其中，查询数据，为第二参与方中，与第一业务的业务方标识关联的其他业务数据。

[0101] 本公开中，第二参与方接收到数据查询请求后，基于第一业务数据关联的业务方标识，在自己的业务数据中查询，查询到符合要求的数据后，就将查询数据通过第二接入点发送给数据处理平台。

[0102] 步骤306，对查询数据进行解析，以获取查询数据中包含的第三特征值。

[0103] 其中，第三特征值，为查询数据中包含的其他目标维度的特征值。

[0104] 本公开中，数据处理平台获得查询数据后，就可以对查询数据进行解析，来获取查询数据中包含的第三特征值。

[0105] 步骤307，利用风险识别模型，对第一特征值、第二特征值及第三特征值进行识别，以确定第一业务数据是否为风险业务。

[0106] 本公开中，数据处理平台通过利用风险识别模型，对第一特征值、第二特征值及第三特征值进行识别，以获得与第一业务关联的所有目标维度的特征值，从而形成第一业务的闭环数据，使得风险识别结果更准确。

[0107] 需要说明的是，若数据处理平台没有从数据业务库中检索到关联数据，那么第二特征值就为空，此时，数据处理平台可以只对第一特征值与第三特征值进行识别。

[0108] 步骤308，在第一业务为风险业务的情况下，向第一参与方发送预警消息。

[0109] 其中，步骤308的具体实现形式，可参照本公开中其他各实施例中的详细描述，此处不再具体赘述。

[0110] 本公开实施例中，首先接收第一参与方发送的风险识别请求，并对目标数据进行解析，以获取目标数据中包含的至少一个目标维度的第一特征值，然后基于第一特征值，检索每个第二参与方的业务数据库，以获取关联数据，在每个业务数据库中均未包含关联数据的情况下，或者，在获取的关联数据的数量和/或类型小于阈值的情况下，向第二参与方的第二接入点发送数据查询请求，在接收到第二接入点发送的查询数据后，对查询数据进行解析，以获取关联数据中包含的第三特征值，之后利用风险识别模型，对第一特征值、第二特征值及第三特征值进行识别，以确定第一业务数据是否为风险业务，最后在第一业务为风险业务的情况下，向第一参与方发送预警消息。由此，在没有从业务数据库中检索到关联数据，或者获得的关联数据数量和/或类型小于阈值的情况下，数据处理平台就向第二参与方发送数据查询请求，来获得查询数据的第三特征值，从而进一步提高了确定的风险识别结果的可靠性和准确性。

[0111] 图4为本公开实施例提供的一种基于多方数据的风险识别方法的流程示意图。

[0112] 如图4所示，该方法包括：

[0113] 步骤401，获取多个参与方分别提供的业务数据集，其中，业务数据集中包括多个第二业务数据及对应的标注结果。

[0114] 其中，标注结果，为人工对第二业务数据是否为风险数据而进行标注的结果。

[0115] 本公开中，数据处理平台获取到多个参与方分别提供的业务数据集后，可以从中获得每个参与方对应的第二业务数据以对应的标注结果。

[0116] 步骤402，根据每个第二业务数据对应的资源流转信息，确定多个第二业务数据间的流转关系。

[0117] 其中，资源流转信息，可以包括资源转入信息、资源转出信息、资源转入方标识、资源转出方标识等等任意项，本公开对此不做限定。

[0118] 本公开中，数据处理平台可以根据每个第二业务数据对应的资源流转信息，确定多个第二业务数据之间是否存在同一资源转入和/或转出的流转关系。

[0119] 步骤403，对具有流转关系的第二业务数据进行解析，以获取同一资源关联的特征值序列。

[0120] 其中，特征值序列，为在同一资源间，具有流转关系的，第二业务数据的目标维度的特征值组成的序列。

[0121] 本公开中，在多个第二业务数据具有流转关系的情况下，数据处理平台对具有流转关系的第二业务数据进行解析，分别获取对应同一资源关联的特征值序列。

[0122] 步骤404，将特征值序列，输入初始识别模型，以获取预测结果。

[0123] 其中，预测结果，为将特征值序列输入初始识别模型后，获得的对应的第二业务数据是否为风险数据的结果。

[0124] 步骤405，基于预测结果与标注结果间的差异，对初始识别模型进行修正，直至获取风险识别模型。

[0125] 本公开中，数据处理平台在获得第二业务数据的标注结果以及预测结果后，基于标注结果与预测结果间的差异，对初始识别模型进行修正，直至获取风险识别模型。

[0126] 需要说明的是，数据处理平台也可以利用多个参与方的业务数据，对任一参与方提供的模型进行训练，并将训练生成的模型发送给对应的参与方，从而提高参与方的业务数据的完整性。

[0127] 本公开实施例中，首先获取多个参与方分别提供的业务数据集，并根据每个第二业务数据对应的资源流转信息，确定多个第二业务数据间的流转关系，然后对具有流转关系的第二业务数据进行解析，以获取同一资源关联的特征值序列，之后将特征值序列，输入初始识别模型，以获取预测结果，最后基于预测结果与标注结果间的差异，对初始识别模型进行修正，直至获取风险识别模型。由此，通过对多个具有资源流转关系的第二业务数据进行解析，以获取同一资源关联的特征值序列，之后将特征值序列，输入初始识别模型，以对初始识别模型进行不断修正，直至获得风险识别模型，从而使得风险识别模型对业务数据的风险识别结果更加准确可靠。

[0128] 为了实现上述实施例，本公开实施例还提出一种基于多方数据的风险识别装置。

[0129] 图5为本公开实施例提供的一种基于多方数据的风险识别装置的结构示意图。

[0130] 如图5所示，该基于多方数据的风险识别装置500可以包括：

[0131] 接收模块501，用于接收第一参与方发送的风险识别请求，其中，识别请求中包括待识别的第一业务数据；

[0132] 第一解析模块502，用于对目标数据进行解析，以获取目标数据中包含的至少一个目标维度的第一特征值；

[0133] 检索模块503，用于基于第一特征值，检索每个第二参与方的业务数据库，以获取关联数据；

[0134] 第二解析模块504，用于对关联数据进行解析，以获取关联数据中包含的第二特征值；

[0135] 识别模块505，用于利用风险识别模型，对第一特征值及第二特征值进行识别，以确定第一业务数据是否为风险业务。

[0136] 可选地，上述接收模块501，还用于：

[0137] 接收第一接入点发送的风险识别请求，其中，风险识别请求中包括第一接入点的第一标识；

[0138] 在接入点标识列表中包含第一标识、且第一标识与第一参与方的第二标识关联的情况下，确定接收到第一参与方发送的风险识别请求。

[0139] 可选地，在接收属于第一参与方的第一接入点发送的风险识别请求之前，上述接收模块501，还用于：

[0140] 接收第一接入点发送的接入请求，其中，接入请求中包括第一标识、第二标识及第一校验码；

[0141] 基于第二标识确定第一参与方对应的校验码生成模式；

[0142] 基于校验码生成模式、第一标识及第二标识，生成第二校验码；

[0143] 在第一校验码与第二校验码匹配的情况下，将第一标识与第二标识关联存入接入点标识列表中。

[0144] 可选地，在基于第一特征值，检索每个第二参与方的业务数据库之后，上述检索模块503，还用于：

[0145] 在每个业务数据库中均未包含关联数据的情况下，或者，在获取的关联数据的数量和/或类型小于阈值的情况下，向第二参与方的第二接入点发送数据查询请求，其中，数据查询请求中包含第一业务数据关联的业务方标识；

[0146] 接收第二接入点发送的查询数据；

[0147] 对查询数据进行解析，以获取查询数据中包含的第三特征值；

[0148] 利用风险识别模型，对第一特征值、第二特征值及第三特征值进行识别，以确定第一业务数据是否为风险业务。

[0149] 可选地，在利用风险识别模型，对第一特征值及第二特征值进行识别之后，上述识别模块505，还用于：

[0150] 在第一业务为风险业务的情况下，向第一参与方发送预警消息。

[0151] 可选地，在利用风险识别模型，对第一特征值及第二特征值进行识别之前，上述识别模块505，还用于：

[0152] 获取多个参与方分别提供的业务数据集，其中，业务数据集中包括多个第二业务数据及对应的标注结果；

[0153] 根据每个第二业务数据对应的资源流转信息，确定多个第二业务数据间的流转关系；

[0154] 对具有流转关系的第二业务数据进行解析，以获取同一资源关联的特征值序列；

[0155] 将特征值序列，输入初始识别模型，以获取预测结果；

[0156] 基于预测结果与标注结果间的差异，对初始识别模型进行修正，直至获取风险识别模型。

[0157] 本公开实施例中的上述各模块的功能及具体实现原理，可参照上述各方法实施例，此处不再赘述。

[0158] 本公开中，首先接收第一参与方发送的风险识别请求，对目标数据进行解析，以获取目标数据中包含的至少一个目标维度的第一特征值，然后基于第一特征值，检索每个第二参与方的业务数据库，以获取关联数据，之后对关联数据进行解析，以获取关联数据中包含的第二特征值，最后利用风险识别模型，对第一特征值及第二特征值进行识别，以确定第一业务数据是否为风险业务。由此，通过利用风险识别模型，对第一业务的第一特征值以及每个第二参与方的第二特征值进行识别，来确定第一业务是否为风险业务，从而提高了风险识别结果的准确性和可靠性。

[0159] 根据本公开的实施例，本公开还提供了一种电子设备。

[0160] 图6为本申请实施例提供的电子设备600的结构示意图。

[0161] 如图6所示，该电子设备可以包括：收发器601、处理器602、存储器603。

[0162] 收发器601可以用于获取待运行任务和待运行任务的配置信息。

[0163] 处理器602执行存储器存储的计算机执行指令，使得处理器602执行上述实施例中的方案。处理器602可以是通用处理器，包括中央处理器（Central Processing Unit，简称CPU）、网络处理器（network processor，简称NP）等；还可以是数字信号处理器（Digital signal processor，简称DSP）、专用集成电路（Application Specific Integrated Circuit ，简称ASIC）、现场可编程门阵列（Field programmable gate array，简称FPGA）或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

[0164] 存储器603通过系统总线与处理器602连接并完成相互间的通信，存储器603用于存储计算机程序指令。

[0165] 系统总线可以是外设部件互连标准（Peripheral component interconnect，简称PCI）总线或扩展工业标准结构（Extended industry standard architecture，简称EISA）总线等。系统总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。收发器用于实现数据库访问装置与其他计算机（例如客户端、读写库和只读库）之间的通信。存储器可能包含随机存取存储器（Random access memory，简称RAM），也可能还包括非易失性存储器（Non‑volatile memory）。

[0166] 本申请实施例提供的电子设备，可以是上述实施例的终端设备。

[0167] 本申请实施例还提供一种运行指令的芯片，该芯片用于执行上述实施例中任务调度方法的技术方案。

[0168] 本申请实施例还提供一种计算机可读存储介质，该计算机可读存储介质中存储有计算机指令，当该计算机指令在计算机上运行时，使得计算机执行上述实施例任务调度方法的技术方案。

[0169] 本申请实施例还提供一种计算机程序产品，该计算机程序产品包括计算机程序，其存储在计算机可读存储介质中，至少一个处理器可以从计算机可读存储介质读取计算机程序，至少一个处理器执行计算机程序时可实现上述实施例中任务调度方法的技术方案。

[0170] 在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本公开的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

[0171] 此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本公开的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

[0172] 流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本公开的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本公开的实施例所属技术领域的技术人员所理解。

[0173] 在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备（如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统）使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例（非穷尽性列表）包括以下：具有一个或多个布线的电连接部（电子装置），便携式计算机盘盒（磁装置），随机存取存储器（RAM），只读存储器（ROM），可擦除可编辑只读存储器（EPROM或闪速存储器），光纤装置，以及便携式光盘只读存储器（CDROM）。另外，计算机可读介质甚至可以是可在其上打印程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得程序，然后将其存储在计算机存储器中。

[0174] 应当理解，本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如，如果用硬件来实现和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列（PGA），现场可编程门阵列（FPGA）等。

[0175] 本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本申请的真正范围和精神由下面的权利要求书指出。

[0176] 应当理解的是，本申请并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求书来限制。

基于多方数据的风险识别方法、装置、设备及存储介质转让专利

申请号 : CN202311041642.1

文献号 : CN116775620B

文献日 : 2023-11-10

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 郑舒啸

申请人 : 建信金融科技有限责任公司

摘要 :

权利要求 :

说明书 :