数据处理方法、装置及设备转让专利

申请号 : CN202310229786.3

文献号 : CN116070916B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 李佳霓吴垠王梦麟宋博文张天翼

申请人 : 支付宝(杭州)信息技术有限公司

摘要 :

本说明书实施例提供了一种数据处理方法、装置及设备,其中,该方法包括:获取待检测的目标数据,所述目标数据包括人机交互过程中生成的多个行为数据;基于预先训练的风险检测模型和所述目标数据,确定所述目标数据的风险类型以及目标事件组合,所述目标事件组合包含所述行为数据中具有预设关联关系的多个行为数据,所述风险检测模型为基于历史数据和所述预设关联关系对应的损失函数,对由预设深度学习算法构建的模型进行训练得到;基于所述目标数据的风险类型以及所述目标事件组合,确定针对所述目标数据的风险检测结果。

权利要求 :

1.一种数据处理方法,包括:

获取待检测的目标数据,所述目标数据包括人机交互过程中生成的多个行为数据;

基于预先训练的风险检测模型和所述目标数据,确定所述目标数据的风险类型以及目标事件组合,所述目标事件组合包含所述行为数据中具有预设关联关系的多个行为数据,所述风险检测模型为基于历史数据和所述预设关联关系对应的损失函数,对由预设深度学习算法构建的模型进行训练得到;

基于所述目标数据的风险类型以及所述目标事件组合,确定针对所述目标数据的风险检测结果;

其中,所述基于所述目标数据的风险类型以及所述目标事件组合,确定针对所述目标数据的风险检测结果,包括:基于目标风险检测策略,对所述目标事件组合的组合类型、所述行为数据对应的属性数据中与所述目标事件组合的组合类型对应的目标属性数据,以及所述目标事件组合包括的多个行为数据进行风险检测处理,得到所述针对所述目标数据的风险检测结果,所述目标风险检测策略为基于所述目标数据的风险类型以及所述目标事件组合的组合类型确定。

2.根据权利要求1所述的方法,所述基于预先训练的风险检测模型和所述目标数据,确定所述目标数据的风险类型以及目标事件组合,包括:基于所述预先训练的风险检测模型和所述目标数据,确定所述目标数据的风险类型、所述目标事件组合以及所述目标事件组合的组合类型,所述组合类型用于表征所述目标事件组合包含的行为数据的关联关系的类型;

所述基于所述目标数据的风险类型以及所述目标事件组合,确定针对所述目标数据的风险检测结果,包括:基于所述目标数据的风险类型、以及所述目标事件组合以及所述目标事件组合的组合类型,确定所述针对所述目标数据的风险检测结果。

3.根据权利要求2所述的方法,所述目标数据还包括所述行为数据对应的属性数据,所述基于所述预先训练的风险检测模型和所述目标数据,确定所述目标数据的风险类型、所述目标事件组合以及所述目标事件组合的组合类型,包括:基于所述预先训练的风险检测模型和所述目标数据,确定所述目标数据的风险类型、所述目标事件组合、所述目标事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述目标事件组合的组合类型对应的所述目标属性数据;

所述基于所述目标数据的风险类型、以及所述目标事件组合以及所述目标事件组合的组合类型,确定所述针对所述目标数据的风险检测结果,包括:基于所述目标数据的风险类型、所述目标事件组合、所述目标事件组合的组合类型,以及所述目标属性数据,确定所述针对所述目标数据的风险检测结果。

4.根据权利要求3所述的方法,所述预设关联关系包括连续关系、突变关系、积累关系和共现关系中的一个或多个。

5.根据权利要求4所述的方法,所述目标数据包括的所述行为数据为时序数据,所述预设关联关系包括所述连续关系和所述突变关系,所述风险检测模型包括嵌入层、卷积神经网络层、第一关键属性选择器、第一子序列生成层和预测网络层,所述基于所述预先训练的风险检测模型和所述目标数据,确定所述目标数据的风险类型、所述目标事件组合、所述目标事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述目标事件组合的组合类型对应的目标属性数据,包括:将所述目标数据输入所述嵌入层,得到与所述目标数据对应的嵌入向量;

将所述嵌入向量输入所述卷积神经网络层,得到与所述嵌入向量对应的第一分类向量和分割向量,所述第一分类向量用于确定所述目标事件组合的组合类型,所述分割向量用于对所述目标数据中的多个行为数据进行分割处理,以基于分割结果确定所述目标事件组合,所述卷积神经网络层包括卷积层和反卷积层;

将所述嵌入向量和所述第一分类向量输入所述第一关键属性选择器,得到第二分类向量,所述第二分类向量用于表征每个所述行为数据对应的每个所述属性数据与每个所述组合类型对应的关键度;

将所述第二分类向量和所述分割向量输入所述第一子序列生成模块,得到第一候选事件组合、所述第一候选事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述第一候选事件组合的组合类型对应的候选属性数据;

将所述目标数据、所述第一候选事件组合、所述第一候选事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述第一候选事件组合的组合类型对应的候选属性数据输入所述预测网络层,得到所述目标数据的风险类型、所述目标事件组合、所述目标事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述目标事件组合的组合类型对应的目标属性数据。

6.根据权利要求4所述的方法,所述预设关联关系包括所述积累关系和所述共现关系,所述风险检测模型包括嵌入层、事件关系提取层、第二关键属性选择器、第二子序列生成层和预测网络层,所述基于所述预先训练的风险检测模型和所述目标数据,确定所述目标数据的风险类型、所述目标事件组合、所述目标事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述目标事件组合的组合类型对应的目标属性数据,包括:将所述目标数据输入所述嵌入层,得到与所述目标数据对应的嵌入向量;

将所述嵌入向量输入所述事件关系提取层,得到所述嵌入向量对应的第三分类向量和所述目标数据对应的聚类结果,所述事件关系提取层包括聚类层和多层注意力层,所述注意力层用于提取所述目标数据中具有所述积累关系和/或所述共现关系的行为数据,所述聚类层用于对所述目标数据进行聚类处理,所述第三分类向量用于确定所述目标事件组合的组合类型;

将所述嵌入向量和所述第三分类向量输入所述第二关键属性选择器,得到第四分类向量,所述第四分类向量用于表征每个所述行为数据对应的每个所述属性数据与每个所述组合类型对应的关键度;

将所述第四分类向量和所述聚类结果输入所述第二子序列生成层,得到第二候选事件组合、所述第二候选事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述第二候选事件组合的组合类型对应的候选属性数据;

将所述目标数据、所述第二候选事件组合、所述第二候选事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述第二候选事件组合的组合类型对应的候选属性数据输入所述预测网络层,得到所述目标数据的风险类型、所述目标事件组合、所述目标事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述目标事件组合的组合类型对应的目标属性数据。

7.根据权利要求4所述的方法,所述预设关联关系包括所述连续关系、所述突变关系、所述积累关系和所述共现关系,所述风险检测模型包括嵌入层、卷积神经网络层、第一关键属性选择器、第一子序列生成层、事件关系提取层、第二关键属性选择器、第二子序列生成层和预测网络层,所述基于所述预先训练的风险检测模型和所述目标数据,确定所述目标数据的风险类型、所述目标事件组合、所述目标事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述目标事件组合的组合类型对应的目标属性数据,包括:将所述目标数据输入所述嵌入层,得到与所述目标数据对应的嵌入向量;

将所述嵌入向量输入所述卷积神经网络层,得到与所述嵌入向量对应的第一分类向量和分割向量,所述第一分类向量用于确定所述目标事件组合的组合类型,所述分割向量用于对所述目标数据中的多个行为数据进行分割处理,以基于分割结果确定所述目标事件组合,所述卷积神经网络包括多个卷积层和多个反卷积层;

将所述嵌入向量和所述第一分类向量输入所述第一关键属性选择器,得到第二分类向量,所述第二分类向量用于表征每个所述行为数据对应的每个所述属性数据与每个所述组合类型对应的关键度;

将所述第二分类向量和所述分割向量输入所述第一子序列生成模块,得到第一候选事件组合、所述第一候选事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述第一候选事件组合的组合类型对应的候选属性数据;

将所述嵌入向量输入所述事件关系提取层,得到所述嵌入向量对应的第三分类向量和所述目标数据对应的聚类结果,所述事件关系提取层包括聚类层和多层注意力层,所述注意力层用于提取所述目标数据中具有所述积累关系和/或所述共现关系的行为数据,所述聚类层用于对所述目标数据进行聚类处理,所述第三分类向量用于确定所述目标事件组合的组合类型;

将所述嵌入向量和所述第三分类向量输入所述第二关键属性选择器,得到第四分类向量,所述第四分类向量用于表征每个所述行为数据对应的每个所述属性数据与每个所述组合类型对应的关键度;

将所述第四分类向量和所述聚类结果输入所述第二子序列生成层,得到第二候选事件组合、所述第二候选事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述第二候选事件组合的组合类型对应的候选属性数据;

将所述第一候选事件组合、所述第一候选事件组合的组合类型、所述行为数据对应的属性数据中,与所述第一候选事件组合的组合类型对应的候选属性数据、所述第二候选事件组合、所述第二候选事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述第二候选事件组合的组合类型对应的候选属性数据输入所述预测网络,得到所述目标数据的风险类型、所述目标事件组合、所述目标事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述目标事件组合的组合类型对应的目标属性数据。

8.一种数据处理装置,包括:

数据获取模块,用于获取待检测的目标数据,所述目标数据包括人机交互过程中生成的多个行为数据;

组合确定模块,用于基于预先训练的风险检测模型和所述目标数据,确定所述目标数据的风险类型以及目标事件组合,所述目标事件组合包含所述行为数据中具有预设关联关系的多个行为数据,所述风险检测模型为基于历史数据和所述预设关联关系对应的损失函数,对由预设深度学习算法构建的模型进行训练得到;

结果确定模块,用于基于所述目标数据的风险类型以及所述目标事件组合,确定针对所述目标数据的风险检测结果;

其中,所述结果确定模块,用于:

基于目标风险检测策略,对所述目标事件组合的组合类型、所述行为数据对应的属性数据中与所述目标事件组合的组合类型对应的目标属性数据,以及所述目标事件组合包括的多个行为数据进行风险检测处理,得到所述针对所述目标数据的风险检测结果,所述目标风险检测策略为基于所述目标数据的风险类型以及所述目标事件组合的组合类型确定。

9.一种数据处理设备,所述数据处理设备包括:

处理器;以及

被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:

获取待检测的目标数据,所述目标数据包括人机交互过程中生成的多个行为数据;

基于预先训练的风险检测模型和所述目标数据,确定所述目标数据的风险类型以及目标事件组合,所述目标事件组合包含所述行为数据中具有预设关联关系的多个行为数据,所述风险检测模型为基于历史数据和所述预设关联关系对应的损失函数,对由预设深度学习算法构建的模型进行训练得到;

基于所述目标数据的风险类型以及所述目标事件组合,确定针对所述目标数据的风险检测结果;

其中,所述基于所述目标数据的风险类型以及所述目标事件组合,确定针对所述目标数据的风险检测结果,包括:基于目标风险检测策略,对所述目标事件组合的组合类型、所述行为数据对应的属性数据中与所述目标事件组合的组合类型对应的目标属性数据,以及所述目标事件组合包括的多个行为数据进行风险检测处理,得到所述针对所述目标数据的风险检测结果,所述目标风险检测策略为基于所述目标数据的风险类型以及所述目标事件组合的组合类型确定。

10.一种存储介质,所述存储介质用于存储计算机可执行指令,所述可执行指令在被执行时实现以下流程:获取待检测的目标数据,所述目标数据包括人机交互过程中生成的多个行为数据;

基于预先训练的风险检测模型和所述目标数据,确定所述目标数据的风险类型以及目标事件组合,所述目标事件组合包含所述行为数据中具有预设关联关系的多个行为数据,所述风险检测模型为基于历史数据和所述预设关联关系对应的损失函数,对由预设深度学习算法构建的模型进行训练得到;

基于所述目标数据的风险类型以及所述目标事件组合,确定针对所述目标数据的风险检测结果;

其中,所述基于所述目标数据的风险类型以及所述目标事件组合,确定针对所述目标数据的风险检测结果,包括:基于目标风险检测策略,对所述目标事件组合的组合类型、所述行为数据对应的属性数据中与所述目标事件组合的组合类型对应的目标属性数据,以及所述目标事件组合包括的多个行为数据进行风险检测处理,得到所述针对所述目标数据的风险检测结果,所述目标风险检测策略为基于所述目标数据的风险类型以及所述目标事件组合的组合类型确定。

说明书 :

数据处理方法、装置及设备

技术领域

[0001] 本文件涉及数据处理技术领域,尤其涉及一种数据处理方法、装置及设备。

背景技术

[0002] 随着计算机技术的快速发展,企业为用户提供的应用服务的种类和数量也越来越多,随之而来的用户数据的数据量日益增加,数据结构也日趋复杂。在进行风险检测时,可以通过风险检测模型和用户的多个行为数据,确定用户对应的风险类型。
[0003] 但是,由于行为数据的构成,以及行为数据的数据结构较为复杂,仅通过用户对应的风险类型进行风险检测,这就会导致风险检测准确性差,因此,需要一种能够提高风险检测的检测准确性的解决方案。

发明内容

[0004] 本说明书实施例的目的是提供一种数据处理方法、装置及设备,以提供一种能够提高针对用户进行风险检测的检测准确性的解决方案。
[0005] 为了实现上述技术方案,本说明书实施例是这样实现的:
[0006] 第一方面,一种数据处理方法,包括:获取待检测的目标数据,所述目标数据包括人机交互过程中生成的多个行为数据;基于预先训练的风险检测模型和所述目标数据,确定所述目标数据的风险类型以及目标事件组合,所述目标事件组合包含所述行为数据中具有预设关联关系的多个行为数据,所述风险检测模型为基于历史数据和所述预设关联关系对应的损失函数,对由预设深度学习算法构建的模型进行训练得到;基于所述目标数据的风险类型以及所述目标事件组合,确定针对所述目标数据的风险检测结果。
[0007] 第二方面,本说明书实施例提供了一种数据处理装置,所述装置包括:数据获取模块,用于获取待检测的目标数据,所述目标数据包括人机交互过程中生成的多个行为数据;组合确定模块,用于基于预先训练的风险检测模型和所述目标数据,确定所述目标数据的风险类型以及目标事件组合,所述目标事件组合包含所述行为数据中具有预设关联关系的多个行为数据,所述风险检测模型为基于历史数据和所述预设关联关系对应的损失函数,对由预设深度学习算法构建的模型进行训练得到;结果确定模块,用于基于所述目标数据的风险类型以及所述目标事件组合,确定针对所述目标数据的风险检测结果。
[0008] 第三方面,本说明书实施例提供了一种数据处理设备,所述数据处理设备包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:获取待检测的目标数据,所述目标数据包括人机交互过程中生成的多个行为数据;基于预先训练的风险检测模型和所述目标数据,确定所述目标数据的风险类型以及目标事件组合,所述目标事件组合包含所述行为数据中具有预设关联关系的多个行为数据,所述风险检测模型为基于历史数据和所述预设关联关系对应的损失函数,对由预设深度学习算法构建的模型进行训练得到;基于所述目标数据的风险类型以及所述目标事件组合,确定针对所述目标数据的风险检测结果。
[0009] 第四方面,本说明书实施例提供一种存储介质,所述存储介质用于存储计算机可执行指令,所述可执行指令在被执行时实现以下流程:获取待检测的目标数据,所述目标数据包括人机交互过程中生成的多个行为数据;基于预先训练的风险检测模型和所述目标数据,确定所述目标数据的风险类型以及目标事件组合,所述目标事件组合包含所述行为数据中具有预设关联关系的多个行为数据,所述风险检测模型为基于历史数据和所述预设关联关系对应的损失函数,对由预设深度学习算法构建的模型进行训练得到;基于所述目标数据的风险类型以及所述目标事件组合,确定针对所述目标数据的风险检测结果。

附图说明

[0010] 为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0011] 图1A为本说明书一种数据处理方法实施例的流程图;
[0012] 图1B为本说明书一种数据处理方法的处理过程示意图;
[0013] 图2为本说明书一种风险检测模型的示意图;
[0014] 图3为本说明书一种数据处理方法的处理过程示意图;
[0015] 图4为本说明书又一种风险检测模型的示意图;
[0016] 图5为本说明书又一种风险检测模型的示意图;
[0017] 图6为本说明书又一种风险检测模型的示意图;
[0018] 图7为本说明书一种数据处理装置实施例的结构示意图;
[0019] 图8为本说明书一种数据处理设备的结构示意图。

具体实施方式

[0020] 本说明书实施例提供一种数据处理方法、装置及设备。
[0021] 为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
[0022] 实施例一
[0023] 如图1A和图1B所示,本说明书实施例提供一种数据处理方法,该方法的执行主体可以为服务器,其中,该服务器可以是独立的服务器,也可以是由多个服务器组成的服务器集群。该方法具体可以包括以下步骤:
[0024] 在S102中,获取待检测的目标数据。
[0025] 其中,目标数据可以包括人机交互过程中生成的多个行为数据,目标数据可以是在预设数据获取周期内,获取的人机交互过程中生成的多个行为数据,如目标数据可以是在预设获取周期内,获取的与预设业务和/或预设用户对应的数据,预设数据获取周期可以为近一周、近半个月、每天的预设时段等,具体如,目标数据可以是在每天的10点‑14点获取的触发执行资源转移业务产生的行为数据,或者,目标数据还可以是近一天获取的预设用户在人机交互过程中生成的多个行为数据,又或者,目标数据还可以近一周获取的预设用户触发执行资源转移业务产生的多个行为数据。行为数据可以是用户在人机交互过程中的输入数据,例如,行为数据可以包括点击行为数据、滑动行为数据,此外,多个行为数据是时序性数据或非时序性数据,即目标数据可以包括预设用户在某个时段内连续输入的多个行为数据,或者,目标数据还可以包括非连续输入的多个行为户数。
[0026] 在实施中,随着计算机技术的快速发展,企业为用户提供的应用服务的种类和数量也越来越多,随之而来的用户数据的数据量日益增加,数据结构也日趋复杂。在进行风险检测时,可以通过风险检测模型和用户的多个行为数据,确定用户对应的风险类型。但是,由于行为数据的构成,以及行为数据的数据结构较为复杂,仅通过用户对应的风险类型进行风险检测,这就会导致风险检测准确性差,因此,需要一种能够提高风险检测的检测准确性的解决方案。为此,本说明书实施例提供一种可以解决上述问题的技术方案,具体可以参见下述内容。
[0027] 在实施中,以目标数据为用户触发执行预设业务产生的多个行为数据为例,终端设备在检测到用户触发预设业务的执行指令的情况下,可以获取用户在预设业务对应的数据获取周期,并基于该数据获取周期,获取用户在人机交互过程中生成的多个行为数据,并将获取到的行为数据确定为目标数据发送给服务器。
[0028] 具体如,预设业务可以为资源转移业务,与资源转移业务对应的数据获取周期可以为近三天,即终端设备在检测到用户触发执行资源转移业务的执行指令的情况下,可以获取近三天用户在人机交互过程中生成的多个行为数据。例如,终端设备可以将近三天用户的行为数据中与触发执行资源转移业务相关的行为数据确定为目标数据发送给服务器,或者,终端设备可以将近三天用户的行为数据确定为目标数据发送给服务器等。
[0029] 上述目标数据的确定方法是一种可选地、可实现的划分方法,在实际应用场景中,还可以有多种不同的确定方法,可以根据实际应用场景的不同选取不同的确定方法,本说明书实施例对此不作具体限定。
[0030] 在S104中,基于预先训练的风险检测模型和目标数据,确定目标数据的风险类型以及目标事件组合。
[0031] 其中,目标事件组合可以包含行为数据中具有预设关联关系的多个行为数据,行为数据的关联关系可以包括共现关系、突变关系等,例如,若某几个行为数据同时出现的次数大于预设次数阈值,即可以认为这几个行为数据之间存在共现关系,若某个行为数据与前一个行为数据的相似性小于预设相似性阈值,则可以认为该行为数据与前一个行为数据之间的关系为突变关系,预设关联关系可以有多种,可以根据当前应用场景的不同需求预设不同的关联关系,本说明书对行为数据之间的关联关系不作具体限定,风险检测模型可以为基于历史数据和预设关联关系对应的损失函数,对由预设深度学习算法构建的模型进行训练得到,风险类型可以基于目标数据对应的应用场景,设置不同的类型,例如,风险类型可以包括高风险型、低风险型、无风险型、隐私泄露风险型、资源转移风险型等,本说明书实施例对风险类型不过具体限定。
[0032] 在实施中,可以获取预设关联关系对应的损失函数,并基于历史数据和获取的预设关联关系对应的损失函数,对由预设深度学习算法构建的模型进行训练,得到训练后的风险检测模型。
[0033] 例如,如图2所示,可以将历史数据获取周期内获取的预设用户触发预设业务对应的行为数据作为历史数据,并获取历史数据的风险类型。然后可以基于历史数据、历史数据的风险类型、风险检测模型的损失函数、预设关系对应的损失函数和风险检测模型输出的风险类型,对由卷积神经网络构成的模型进行训练,得到训练后的风险检测模型。这样,可以通过预设关系对应的损失函数对风险检测模型进行约束,以通过训练后的风险检测模型确定目标事件组合,即针对目标事件组合的挖掘为无监督学习,针对风险检测模型为弱监督学习(即不确切监督学习)。
[0034] 得到训练后的风险检测模型后,可以将目标数据输入训练后的风险检测模型,以通过训练后的风险检测模型,得到目标数据的风险类型以及目标事件组合。例如,输出的目标数据的风险类型可以为高风险型,目标事件组合可以包括具有共现关系的行为数据2和行为数据4。
[0035] 在S106中,基于目标数据的风险类型以及目标事件组合,确定针对目标数据的风险检测结果。
[0036] 在实施中,由于目标事件组合包括具有预设关联关系的多个行为数据,因此,目标事件组合可以用于对风险检测模型的预测结果(即目标数据的风险类型)提供解释,帮助相关工作人员理解风险检测模型决策的原理和机制,使风险检测模型的结果透明化,增强模型的安全可用性和可信性。
[0037] 例如,假设目标数据的风险类型为中风险型,目标事件组合包括具有共现关系的行为数据2和行为数据4,可以将目标数据的风险类型和目标事件组合发送给相关工作人员,并接收相关工作人员基于接收到的数据确定的风险检测结果。
[0038] 上述对针对目标数据的风险检测结果的确定方法是一种可选地、可实现的确定方法,在实际应用场景中,还可以有多种不同的确定方法,可以根据实际应用场景的不同选取不同的确定方法,本说明书实施例对此不作具体限定。
[0039] 本说明书实施例提供一种数据处理方法,获取待检测的目标数据,目标数据可以包括人机交互过程中生成的多个行为数据,基于预先训练的风险检测模型和目标数据,确定目标数据的风险类型以及目标事件组合,目标事件组合可以包含行为数据中具有预设关联关系的多个行为数据,风险检测模型可以为基于历史数据和预设关联关系对应的损失函数,对由预设深度学习算法构建的模型进行训练得到,基于目标数据的风险类型以及目标事件组合,确定针对目标数据的风险检测结果。这样,由于目标事件组合包括具有预设关联关系的多个行为数据,因此,目标事件组合可以用于对风险检测模型的预测结果(即目标数据的风险类型)提供解释,增强风险检测模型的可信性,即可以通过目标数据的风险类型以及目标事件组合,提高针对目标数据的风险检测结果的检测准确性。
[0040] 实施例二
[0041] 如图3所示,本说明书实施例提供一种数据处理方法,该方法的执行主体可以为服务器,其中,服务器可以是独立的服务器,也可以是由多个服务器组成的服务器集群。该方法具体可以包括以下步骤:
[0042] 在S102中,获取待检测的目标数据。
[0043] 其中,目标数据包括人机交互过程中生成的多个行为数据。
[0044] 在S302中,基于预先训练的风险检测模型和目标数据,确定目标数据的风险类型、目标事件组合以及目标事件组合的组合类型。
[0045] 其中,组合类型可以用于表征目标事件组合包含的行为数据的关联关系的类型,预设关联关系可以包括连续关系、突变关系、积累关系和共现关系中的一个或多个,关联关系的类型可以包括连续型、突变型、积累型和共现型中的一个或多个,例如,若某几个行为数据同时出现的次数大于预设次数阈值,即可以认为这几个行为数据之间存在共现关系。若某个行为数据与前一个行为数据的相似性小于预设相似性阈值,且该行为数据与前一个行为数据为时序数据,则可以认为该行为数据与前一个行为数据之间的关系为突变关系。
若某个行为数据与前一个行为数据的相似性不小于预设相似性阈值,且该行为数据与前一个行为数据为时序数据,则可以认为该行为数据与前一个行为数据之间的关系为连续关系,具体如行为数据1、行为数据2和行为数据3为时序数据,且基于行为数据对应的属性数据(如位置信息),确定行为数据1与行为数据2的相似性不小于预设相似性阈值,行为数据2与行为数据3的相似性小于预设相似性阈值,那么,可以确定行为数据1和行为数据2之间的关联关系为连续关系,行为数据2和行为数据3之间的关联关系为突变关系。若某个行为数据与前一个行为数据的相似性不小于预设相似性阈值,且该行为数据与前一个行为数据为非时序数据(即这两个行为数据对应的时间之间的差值大于预设差值),则可以认为该行为数据与前一个行为数据之间的关系为积累关系。预设关联关系对应的损失函数可以包括连续关系对应的第一损失函数(continuity constraint)、突变关系对应的第二损失函数(variation constraint)、积累关系对应的第三损失函数(accumulation constraint)和共现关系对应的第四损失函数(co‑appearance constraint)中的一个或多个。
[0046] 在实施中,目标数据还可以包括行为数据对应的属性数据,例如,行为数据可以包括触发执行资源转移业务的相关的行为数据,具体如,行为数据可以包括用户对资源转移业务的启动控件的触发行为数据,该行为数据对应的属性数据可以包括触发的时间、触发的方式(如点击控件、双击控件或长按控件等)、终端设备当前的位置信息等。
[0047] 因此,在目标数据还包括行为数据对应的属性数据的情况下,可以基于预先训练的风险检测模型和目标数据,确定目标数据的风险类型、目标事件组合、目标事件组合的组合类型,以及行为数据对应的属性数据中,与目标事件组合的组合类型对应的目标属性数据。其中,目标属性数据可以为目标事件组合中的行为数据对应的属性数据中,与目标事件组合的组合类型的相关度大于预设相关的属性,或者,目标属性数据还可以是目标事件组合中的行为数据对应的属性数据中,用于确定目标事件组合的组合类型的属性数据。
[0048] 此外,若目标数据包括的行为数据为时序数据,那么,预设关联关系可以包括连续关系和突变关系,如图4所示,风险检测模型可以包括嵌入层、卷积神经网络层、第一关键属性选择器、第一子序列生成层和预测网络层,因此,以下提供一种可选的实现方式,具体可以参见下述步骤A1 步骤A5处理:~
[0049] 在步骤A1中,将目标数据输入嵌入层,得到与目标数据对应的嵌入向量。
[0050] 其中,目标数据包括的行为数据可以为时序数据,例如,目标数据可以包括近3小时内用户的行为数据,即行为数据依据生产时间构成目标数据,嵌入层(Embedding Layers)可以用于将目标数据转换为预设维度的嵌入向量。
[0051] 在实施中,可以将目标数据输入风险检测模型的嵌入层,嵌入层可以对目标数据进行处理,得到与目标数据对应的嵌入向量(embedding map),例如,嵌入层可以输出大小为T*F*D的嵌入向量,其中,T可以为目标数据的长度(即目标数据包含的行为数据的数量),F可以为每个行为数据对应的属性数据的数量,D可以为表征维度。
[0052] 在步骤A2中,将嵌入向量输入卷积神经网络层,得到与嵌入向量对应的第一分类向量和分割向量。
[0053] 其中,第一分类向量可以用于确定目标事件组合的组合类型,分割向量可以用于对目标数据中的多个行为数据进行分割处理,以基于分割结果确定目标事件组合,卷积神经网络层包括卷积层和反卷积层。
[0054] 在实施中,由于预设关联关系可以包括连续关系和突变关系,那么,目标事件组合的组合类型可以包括连续型、突变型或背景型,其中,背景型可以用于表征目标事件组合包含的行为数据之间无预设关联关系。可以将嵌入向量输入包含多个卷积层和多个反卷积层的卷积神经网络层,得到与嵌入向量对应的第一分类向量和分割向量(segmentation mask)。第一分类向量和分割向量的长度与嵌入向量的长度相同,分割向量可以用于标记每个行为数据作为分割点的概率。
[0055] 例如,假设目标数据包括行为数据1、行为数据2和行为数据3,第一分类向量可以为3*3向量,分割向量可以为3*1向量,假设分割向量为[0.3 0.5 0.2 ],即行为数据1作为分割点的概率为0.3,行为数据2作为分割点的概率为0.5,行为数据3作为分割点的概率为0.3,由于行为数据2作为分割点的概率大于行为数据1和行为数据3作为分割点的概率,因此,可以将行为数据2作为分割点,对目标数据进行分割处理,以便于后续计算。
[0056] 在步骤A3中,将嵌入向量和第一分类向量输入第一关键属性选择器,得到第二分类向量。
[0057] 其中,第二分类向量可以用于表征每个行为数据对应的每个属性数据与每个组合类型对应的关键度。
[0058] 在实施中,可以通过第一关键属性选择器(keyattribute selector)的相互注意力层(mutual attention),对嵌入向量和第一分类向量进行处理,得到第二分类向量(classification mask),在组合类型包括连续型、突变型或背景型这三个类型的情况下,第二分类向量的大小可以为T*F*3,即第二分类向量的长度与嵌入向量的长度相同。
[0059] 在步骤A4中,将第二分类向量和分割向量输入第一子序列生成模块,得到第一候选事件组合、第一候选事件组合的组合类型,以及行为数据对应的属性数据中,与第一候选事件组合的组合类型对应的候选属性数据。
[0060] 在实施中,可以将第二分类向量和分割向量输入第一子序列生成(proposal generator)模块,生成第一候选实例,第一候选实例即可以包括第一候选事件组合、第一候选事件组合的组合类型,以及行为数据对应的属性数据中,与第一候选事件组合的组合类型对应的候选属性数据。
[0061] 即第一候选实例可以包括{cls1,(tstart,tend),{as}s∈S},cls1可以是第一候选事件组合的组合类型,(tstart,tend)可以是第一候选事件组合对应的行为数据,由于目标数据包括的行为数据为时序数据,因此,第一候选事件组合即为对时序数据进行分割提取得到,所以,tstart可以为分割得到的时序数据中的第一个行为数据(即第一候选事件组合的第一个行为数据),tend分割得到的时序数据中的最后一个行为数据(即第一候选事件组合的最后一个行为数据),as可以为第s个候选属性数据。
[0062] 在步骤A5中,将目标数据、第一候选事件组合、第一候选事件组合的组合类型,以及行为数据对应的属性数据中,与第一候选事件组合的组合类型对应的候选属性数据输入预测网络层,得到目标数据的风险类型、目标事件组合、目标事件组合的组合类型,以及行为数据对应的属性数据中,与目标事件组合的组合类型对应的目标属性数据。
[0063] 在实施中,由于第一候选实例在嵌入向量上取到了相应的表征,因此,可以通过预设网络层对第一候选实例对应的表征进行汇总,得到目标数据的风险类型、目标事件组合、目标事件组合的组合类型,以及行为数据对应的属性数据中,与目标事件组合的组合类型对应的目标属性数据。
[0064] 此外,预设关联关系还可以包括积累关系和共现关系,如图5所示,风险检测模型可以包括嵌入层、事件关系提取层、第二关键属性选择器、第二子序列生成层和预测网络层,因此,以下提供一种可选的实现方式,具体可以参见下述步骤B1 步骤B5处理:~
[0065] 在步骤B1中,将目标数据输入所述嵌入层,得到与目标数据对应的嵌入向量。
[0066] 在步骤B2中,将嵌入向量输入事件关系提取层,得到嵌入向量对应的第三分类向量和目标数据对应的聚类结果。
[0067] 其中,事件关系提取层可以包括聚类层和多层注意力层,注意力层(non‑local layer)可以用于提取目标数据中具有积累关系和/或共现关系的行为数据,注意力层可以有多层,注意力层可以包括注意力向量(attention map),注意力向量可以用于衡量行为数据之间关系的系数矩阵,聚类层可以用于对目标数据进行聚类处理,第三分类向量可以用于确定目标事件组合的组合类型。
[0068] 在实施中,第三分类向量的长度可以与嵌入向量的长度相同,由于预设关联关系可以包括积累关系和共现关系,那么,目标事件组合的组合类型可以包括积累型、共现型或背景型,其中,背景型可以用于表征目标事件组合包含的行为数据之间无预设关联关系。
[0069] 在步骤B3中,将嵌入向量和第三分类向量输入第二关键属性选择器,得到第四分类向量。
[0070] 其中,第四分类向量可以用于表征每个行为数据对应的每个属性数据与每个组合类型对应的关键度。
[0071] 在步骤B4中,将第四分类向量和聚类结果输入第二子序列生成层,得到第二候选事件组合、第二候选事件组合的组合类型,以及行为数据对应的属性数据中,与第二候选事件组合的组合类型对应的候选属性数据。
[0072] 在实施中,可以将第四分类向量和聚类结果输入第二子序列生成(proposal generator)模块,生成第二候选实例,第二候选实例即可以包括第二候选事件组合、第二候选事件组合的组合类型,以及行为数据对应的属性数据中,与第一候选事件组合的组合类型对应的候选属性数据。
[0073] 即第二候选实例可以包括{cls,{ec}c∈C,{as}s∈S},cls可以是第二候选事件组合的组合类型,{ec}c∈C可以用于表示第c个行为数据,as可以为第s个候选属性数据。
[0074] 在步骤B5中,将目标数据、第二候选事件组合、第二候选事件组合的组合类型,以及行为数据对应的属性数据中,与第二候选事件组合的组合类型对应的候选属性数据输入预测网络层,得到目标数据的风险类型、目标事件组合、目标事件组合的组合类型,以及行为数据对应的属性数据中,与目标事件组合的组合类型对应的目标属性数据。
[0075] 在实施中,目标事件组合包括的行为数据可以是非时序数据。
[0076] 另外,预设关联关系还可以包括连续关系、突变关系、积累关系和共现关系,如图6所示,风险检测模型可以包括嵌入层、卷积神经网络层、第一关键属性选择器、第一子序列生成层、事件关系提取层、第二关键属性选择器、第二子序列生成层和预测网络层,其中,卷积神经网络层、第一关键属性选择器、第一子序列生成层可以为片段抽取器,事件关系提取层、第二关键属性选择器、第二子序列生成层可以为组合抽取器,片段抽取器可以用于抽取在时序上存在关联关系(即连续关系和/或突变关系)的行为数据,组合抽取器可以用于抽取存在关联关系积累关系和/或共现关系的行为数据,即片段抽取器生成的第一候选事件组合对应的行为数据可以是时序数据,组合抽取器生成的第二候选事件组合对应的行为数据可以是非时序数据。
[0077] 在步骤C1中,将目标数据输入嵌入层,得到与目标数据对应的嵌入向量。
[0078] 在步骤C2中,将嵌入向量输入卷积神经网络层,得到与嵌入向量对应的第一分类向量和分割向量。
[0079] 其中,第一分类向量可以用于确定目标事件组合的组合类型,分割向量可以用于对目标数据中的多个行为数据进行分割处理,以基于分割结果确定目标事件组合,卷积神经网络可以包括多个卷积层和多个反卷积层。
[0080] 在步骤C3中,将嵌入向量和第一分类向量输入第一关键属性选择器,得到第二分类向量。
[0081] 其中,第二分类向量可以用于表征每个行为数据对应的每个属性数据与每个组合类型对应的关键度。
[0082] 在步骤C4中,将第二分类向量和分割向量输入第一子序列生成模块,得到第一候选事件组合、第一候选事件组合的组合类型,以及行为数据对应的属性数据中,与第一候选事件组合的组合类型对应的候选属性数据。
[0083] 上述C2 C4的具体处理过程可以参见上述实施例二中A2 A4的相关内容,在此不再~ ~赘述。
[0084] 在步骤C5中,将嵌入向量输入事件关系提取层,得到嵌入向量对应的第三分类向量和目标数据对应的聚类结果。
[0085] 其中,事件关系提取层可以包括聚类层和多层注意力层,注意力层可以用于提取目标数据中具有积累关系和/或共现关系的行为数据,聚类层可以用于对目标数据进行聚类处理,第三分类向量可以用于确定目标事件组合的组合类型。
[0086] 在步骤C6中,将嵌入向量和第三分类向量输入第二关键属性选择器,得到第四分类向量。
[0087] 其中,第四分类向量可以用于表征每个行为数据对应的每个属性数据与每个组合类型对应的关键度。
[0088] 在步骤C7中,将第四分类向量和聚类结果输入第二子序列生成层,得到第二候选事件组合、第二候选事件组合的组合类型,以及行为数据对应的属性数据中,与第二候选事件组合的组合类型对应的候选属性数据。
[0089] 上述C5 C7的具体处理过程可以参见上述实施例二中B2 B4的相关内容,在此不再~ ~赘述。
[0090] 在步骤C8中,将第一候选事件组合、第一候选事件组合的组合类型、行为数据对应的属性数据中,与第一候选事件组合的组合类型对应的候选属性数据、第二候选事件组合、第二候选事件组合的组合类型,以及行为数据对应的属性数据中,与第二候选事件组合的组合类型对应的候选属性数据输入预测网络,得到目标数据的风险类型、目标事件组合、目标事件组合的组合类型,以及行为数据对应的属性数据中,与目标事件组合的组合类型对应的目标属性数据。
[0091] 在实施中,第一候选事件组合和第二候选事件组合可以为候选实例(proposals),通过多这多个候选实例进行池化处理,可以得到目标事件组合。由于proposals在嵌入向量上取到了相应的表征,因此,可以通过预设网络层对proposals对应的表征进行汇总,得到目标数据的风险类型、目标事件组合、目标事件组合的组合类型,以及行为数据对应的属性数据中,与目标事件组合的组合类型对应的目标属性数据。
[0092] 在S304中,基于目标数据的风险类型、以及目标事件组合以及目标事件组合的组合类型,确定针对目标数据的风险检测结果。
[0093] 在实施中,由于基于风险检测模型,不仅可以确定目标数据的风险类型,还可以确定具有特定含义的行为数据的组合(即目标事件组合),具有更强的语义信息,且还可以确定目标事件组合的组合类型,提高了风险检测结果的准确性。
[0094] 此外,还可以基于目标数据的风险类型、目标事件组合、目标事件组合的组合类型,以及目标属性数据,确定针对目标数据的风险检测结果。
[0095] 在实际应用中,上述S304的处理方式可以多种多样,以下提供一种可选的实现方式,具体可以参见下述步骤一 步骤二处理:~
[0096] 在步骤一中,基于目标数据的风险类型以及目标事件组合的组合类型,确定目标数据对应的目标风险检测策略。
[0097] 在实施中,可以基于风险类型、组合类型和风险检测策略的预设对应关系,确定风险检测策略中与目标数据的风险类型以及目标事件组合的组合类型对应的目标风险检测策略。
[0098] 在步骤二中,基于目标风险检测策略,对目标事件组合的组合类型、目标属性数据以及目标事件组合包括的多个行为数据进行风险检测处理,得到针对目标数据的风险检测结果。
[0099] 本说明书实施例提供一种数据处理方法,获取待检测的目标数据,目标数据可以包括人机交互过程中生成的多个行为数据,基于预先训练的风险检测模型和目标数据,确定目标数据的风险类型以及目标事件组合,目标事件组合可以包含行为数据中具有预设关联关系的多个行为数据,风险检测模型可以为基于历史数据和预设关联关系对应的损失函数,对由预设深度学习算法构建的模型进行训练得到,基于目标数据的风险类型以及目标事件组合,确定针对目标数据的风险检测结果。这样,由于目标事件组合包括具有预设关联关系的多个行为数据,因此,目标事件组合可以用于对风险检测模型的预测结果(即目标数据的风险类型)提供解释,增强风险检测模型的可信性,即可以通过目标数据的风险类型以及目标事件组合,提高针对目标数据的风险检测结果的检测准确性。
[0100] 实施例三
[0101] 以上为本说明书实施例提供的数据处理方法,基于同样的思路,本说明书实施例还提供一种数据处理装置,如图7所示。
[0102] 该数据处理装置包括:数据获取模块701、组合确定模块702和结果确定模块703,其中:
[0103] 数据获取模块701,用于获取待检测的目标数据,所述目标数据包括人机交互过程中生成的多个行为数据;
[0104] 组合确定模块702,用于基于预先训练的风险检测模型和所述目标数据,确定所述目标数据的风险类型以及目标事件组合,所述目标事件组合包含所述行为数据中具有预设关联关系的多个行为数据,所述风险检测模型为基于历史数据和所述预设关联关系对应的损失函数,对由预设深度学习算法构建的模型进行训练得到;
[0105] 结果确定模块703,用于基于所述目标数据的风险类型以及所述目标事件组合,确定针对所述目标数据的风险检测结果。
[0106] 本说明书实施例中,所述组合确定模块702,用于:
[0107] 基于所述预先训练的风险检测模型和所述目标数据,确定所述目标数据的风险类型、所述目标事件组合以及所述目标事件组合的组合类型,所述组合类型用于表征所述目标事件组合包含的行为数据的关联关系的类型;
[0108] 所述结果确定模块703,用于:
[0109] 基于所述目标数据的风险类型、以及所述目标事件组合以及所述目标事件组合的组合类型,确定所述针对所述目标数据的风险检测结果。
[0110] 本说明书实施例中,所述目标数据还包括所述行为数据对应的属性数据,所述组合确定模块702,用于:
[0111] 基于所述预先训练的风险检测模型和所述目标数据,确定所述目标数据的风险类型、所述目标事件组合、所述目标事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述目标事件组合的组合类型对应的目标属性数据;
[0112] 所述结果确定模块703,用于:
[0113] 基于所述目标数据的风险类型、所述目标事件组合、所述目标事件组合的组合类型,以及所述目标属性数据,确定所述针对所述目标数据的风险检测结果。
[0114] 本说明书实施例中,所述预设关联关系包括连续关系、突变关系、积累关系和共现关系中的一个或多个。
[0115] 本说明书实施例中,所述目标数据包括的所述行为数据为时序数据,所述预设关联关系包括所述连续关系和所述突变关系,所述风险检测模型包括嵌入层、卷积神经网络层、第一关键属性选择器、第一子序列生成层和预测网络层,
[0116] 所述组合确定模块702,用于:
[0117] 将所述目标数据输入所述嵌入层,得到与所述目标数据对应的嵌入向量;
[0118] 将所述嵌入向量输入所述卷积神经网络层,得到与所述嵌入向量对应的第一分类向量和分割向量,所述第一分类向量用于确定所述目标事件组合的组合类型,所述分割向量用于对所述目标数据中的多个行为数据进行分割处理,以基于分割结果确定所述目标事件组合,所述卷积神经网络层包括卷积层和反卷积层;
[0119] 将所述嵌入向量和所述第一分类向量输入所述第一关键属性选择器,得到第二分类向量,所述第二分类向量用于表征每个所述行为数据对应的每个所述属性数据与每个所述组合类型对应的关键度;
[0120] 将所述第二分类向量和所述分割向量输入所述第一子序列生成模块,得到第一候选事件组合、所述第一候选事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述第一候选事件组合的组合类型对应的候选属性数据;
[0121] 将所述目标数据、所述第一候选事件组合、所述第一候选事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述第一候选事件组合的组合类型对应的候选属性数据输入所述预测网络层,得到所述目标数据的风险类型、所述目标事件组合、所述目标事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述目标事件组合的组合类型对应的目标属性数据。
[0122] 本说明书实施例中,所述预设关联关系包括所述积累关系和所述共现关系,所述风险检测模型包括嵌入层、事件关系提取层、第二关键属性选择器、第二子序列生成层和预测网络层,
[0123] 所述组合确定模块702,用于:
[0124] 将所述目标数据输入所述嵌入层,得到与所述目标数据对应的嵌入向量;
[0125] 将所述嵌入向量输入所述事件关系提取层,得到所述嵌入向量对应的第三分类向量和所述目标数据对应的聚类结果,所述事件关系提取层包括聚类层和多层注意力层,所述注意力层用于提取所述目标数据中具有所述积累关系和/或所述共现关系的行为数据,所述聚类层用于对所述目标数据进行聚类处理,所述第三分类向量用于确定所述目标事件组合的组合类型;
[0126] 将所述嵌入向量和所述第三分类向量输入所述第二关键属性选择器,得到第四分类向量,所述第四分类向量用于表征每个所述行为数据对应的每个所述属性数据与每个所述组合类型对应的关键度;
[0127] 将所述第四分类向量和所述聚类结果输入所述第二子序列生成层,得到第二候选事件组合、所述第二候选事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述第二候选事件组合的组合类型对应的候选属性数据;
[0128] 将所述目标数据、所述第二候选事件组合、所述第二候选事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述第二候选事件组合的组合类型对应的候选属性数据输入所述预测网络层,得到所述目标数据的风险类型、所述目标事件组合、所述目标事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述目标事件组合的组合类型对应的目标属性数据。
[0129] 本说明书实施例中,所述预设关联关系包括所述连续关系、所述突变关系、所述积累关系和所述共现关系,所述风险检测模型包括嵌入层、卷积神经网络层、第一关键属性选择器、第一子序列生成层、事件关系提取层、第二关键属性选择器、第二子序列生成层和预测网络层,
[0130] 所述组合确定模块702,用于:
[0131] 将所述目标数据输入所述嵌入层,得到与所述目标数据对应的嵌入向量;
[0132] 将所述嵌入向量输入所述卷积神经网络层,得到与所述嵌入向量对应的第一分类向量和分割向量,所述第一分类向量用于确定所述目标事件组合的组合类型,所述分割向量用于对所述目标数据中的多个行为数据进行分割处理,以基于分割结果确定所述目标事件组合,所述卷积神经网络包括多个卷积层和多个反卷积层;
[0133] 将所述嵌入向量和所述第一分类向量输入所述第一关键属性选择器,得到第二分类向量,所述第二分类向量用于表征每个所述行为数据对应的每个所述属性数据与每个所述组合类型对应的关键度;
[0134] 将所述第二分类向量和所述分割向量输入所述第一子序列生成模块,得到第一候选事件组合、所述第一候选事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述第一候选事件组合的组合类型对应的候选属性数据;
[0135] 将所述嵌入向量输入所述事件关系提取层,得到所述嵌入向量对应的第三分类向量和所述目标数据对应的聚类结果,所述事件关系提取层包括聚类层和多层注意力层,所述注意力层用于提取所述目标数据中具有所述积累关系和/或所述共现关系的行为数据,所述聚类层用于对所述目标数据进行聚类处理,所述第三分类向量用于确定所述目标事件组合的组合类型;
[0136] 将所述嵌入向量和所述第三分类向量输入所述第二关键属性选择器,得到第四分类向量,所述第四分类向量用于表征每个所述行为数据对应的每个所述属性数据与每个所述组合类型对应的关键度;
[0137] 将所述第四分类向量和所述聚类结果输入所述第二子序列生成层,得到第二候选事件组合、所述第二候选事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述第二候选事件组合的组合类型对应的候选属性数据;
[0138] 将所述第一候选事件组合、所述第一候选事件组合的组合类型、所述行为数据对应的属性数据中,与所述第一候选事件组合的组合类型对应的候选属性数据、所述第二候选事件组合、所述第二候选事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述第二候选事件组合的组合类型对应的候选属性数据输入所述预测网络,得到所述目标数据的风险类型、所述目标事件组合、所述目标事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述目标事件组合的组合类型对应的目标属性数据。
[0139] 本说明书实施例中,所述结果确定模块703,用于:
[0140] 基于所述目标数据的风险类型以及所述目标事件组合的组合类型,确定所述目标数据对应的目标风险检测策略;
[0141] 基于所述目标风险检测策略,对所述目标事件组合的组合类型、所述目标属性数据以及所述目标事件组合包括的多个行为数据进行风险检测处理,得到所述针对所述目标数据的风险检测结果。
[0142] 本说明书实施例提供一种数据处理装置,获取待检测的目标数据,目标数据可以包括人机交互过程中生成的多个行为数据,基于预先训练的风险检测模型和目标数据,确定目标数据的风险类型以及目标事件组合,目标事件组合可以包含行为数据中具有预设关联关系的多个行为数据,风险检测模型可以为基于历史数据和预设关联关系对应的损失函数,对由预设深度学习算法构建的模型进行训练得到,基于目标数据的风险类型以及目标事件组合,确定针对目标数据的风险检测结果。这样,由于目标事件组合包括具有预设关联关系的多个行为数据,因此,目标事件组合可以用于对风险检测模型的预测结果(即目标数据的风险类型)提供解释,增强风险检测模型的可信性,即可以通过目标数据的风险类型以及目标事件组合,提高针对目标数据的风险检测结果的检测准确性。
[0143] 实施例四
[0144] 基于同样的思路,本说明书实施例还提供一种数据处理设备,如图8所示。
[0145] 数据处理设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器801和存储器802,存储器802中可以存储有一个或一个以上存储应用程序或数据。其中,存储器802可以是短暂存储或持久存储。存储在存储器802的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对数据处理设备中的一系列计算机可执行指令。更进一步地,处理器801可以设置为与存储器802通信,在数据处理设备上执行存储器802中的一系列计算机可执行指令。数据处理设备还可以包括一个或一个以上电源803,一个或一个以上有线或无线网络接口804,一个或一个以上输入输出接口805,一个或一个以上键盘806。
[0146] 具体在本实施例中,数据处理设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对数据处理设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
[0147] 获取待检测的目标数据,所述目标数据包括人机交互过程中生成的多个行为数据;
[0148] 基于预先训练的风险检测模型和所述目标数据,确定所述目标数据的风险类型以及目标事件组合,所述目标事件组合包含所述行为数据中具有预设关联关系的多个行为数据,所述风险检测模型为基于历史数据和所述预设关联关系对应的损失函数,对由预设深度学习算法构建的模型进行训练得到;
[0149] 基于所述目标数据的风险类型以及所述目标事件组合,确定针对所述目标数据的风险检测结果。
[0150] 可选地,所述基于预先训练的风险检测模型和所述目标数据,确定所述目标数据的风险类型以及目标事件组合,包括:
[0151] 基于所述预先训练的风险检测模型和所述目标数据,确定所述目标数据的风险类型、所述目标事件组合以及所述目标事件组合的组合类型,所述组合类型用于表征所述目标事件组合包含的行为数据的关联关系的类型;
[0152] 所述基于所述目标数据的风险类型以及所述目标事件组合,确定针对所述目标数据的风险检测结果,包括:
[0153] 基于所述目标数据的风险类型、以及所述目标事件组合以及所述目标事件组合的组合类型,确定所述针对所述目标数据的风险检测结果。
[0154] 可选地,所述目标数据还包括所述行为数据对应的属性数据,所述基于所述预先训练的风险检测模型和所述目标数据,确定所述目标数据的风险类型、所述目标事件组合以及所述目标事件组合的组合类型,包括:
[0155] 基于所述预先训练的风险检测模型和所述目标数据,确定所述目标数据的风险类型、所述目标事件组合、所述目标事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述目标事件组合的组合类型对应的目标属性数据;
[0156] 所述基于所述目标数据的风险类型、以及所述目标事件组合以及所述目标事件组合的组合类型,确定所述针对所述目标数据的风险检测结果,包括:
[0157] 基于所述目标数据的风险类型、所述目标事件组合、所述目标事件组合的组合类型,以及所述目标属性数据,确定所述针对所述目标数据的风险检测结果。
[0158] 可选地,所述预设关联关系包括连续关系、突变关系、积累关系和共现关系中的一个或多个。
[0159] 可选地,所述目标数据包括的所述行为数据为时序数据,所述预设关联关系包括所述连续关系和所述突变关系,所述风险检测模型包括嵌入层、卷积神经网络层、第一关键属性选择器、第一子序列生成层和预测网络层,
[0160] 所述基于所述预先训练的风险检测模型和所述目标数据,确定所述目标数据的风险类型、所述目标事件组合、所述目标事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述目标事件组合的组合类型对应的目标属性数据,包括:
[0161] 将所述目标数据输入所述嵌入层,得到与所述目标数据对应的嵌入向量;
[0162] 将所述嵌入向量输入所述卷积神经网络层,得到与所述嵌入向量对应的第一分类向量和分割向量,所述第一分类向量用于确定所述目标事件组合的组合类型,所述分割向量用于对所述目标数据中的多个行为数据进行分割处理,以基于分割结果确定所述目标事件组合,所述卷积神经网络层包括卷积层和反卷积层;
[0163] 将所述嵌入向量和所述第一分类向量输入所述第一关键属性选择器,得到第二分类向量,所述第二分类向量用于表征每个所述行为数据对应的每个所述属性数据与每个所述组合类型对应的关键度;
[0164] 将所述第二分类向量和所述分割向量输入所述第一子序列生成模块,得到第一候选事件组合、所述第一候选事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述第一候选事件组合的组合类型对应的候选属性数据;
[0165] 将所述目标数据、所述第一候选事件组合、所述第一候选事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述第一候选事件组合的组合类型对应的候选属性数据输入所述预测网络层,得到所述目标数据的风险类型、所述目标事件组合、所述目标事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述目标事件组合的组合类型对应的目标属性数据。
[0166] 可选地,所述预设关联关系包括所述积累关系和所述共现关系,所述风险检测模型包括嵌入层、事件关系提取层、第二关键属性选择器、第二子序列生成层和预测网络层,[0167] 所述基于所述预先训练的风险检测模型和所述目标数据,确定所述目标数据的风险类型、所述目标事件组合、所述目标事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述目标事件组合的组合类型对应的目标属性数据,包括:
[0168] 将所述目标数据输入所述嵌入层,得到与所述目标数据对应的嵌入向量;
[0169] 将所述嵌入向量输入所述事件关系提取层,得到所述嵌入向量对应的第三分类向量和所述目标数据对应的聚类结果,所述事件关系提取层包括聚类层和多层注意力层,所述注意力层用于提取所述目标数据中具有所述积累关系和/或所述共现关系的行为数据,所述聚类层用于对所述目标数据进行聚类处理,所述第三分类向量用于确定所述目标事件组合的组合类型;
[0170] 将所述嵌入向量和所述第三分类向量输入所述第二关键属性选择器,得到第四分类向量,所述第四分类向量用于表征每个所述行为数据对应的每个所述属性数据与每个所述组合类型对应的关键度;
[0171] 将所述第四分类向量和所述聚类结果输入所述第二子序列生成层,得到第二候选事件组合、所述第二候选事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述第二候选事件组合的组合类型对应的候选属性数据;
[0172] 将所述目标数据、所述第二候选事件组合、所述第二候选事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述第二候选事件组合的组合类型对应的候选属性数据输入所述预测网络层,得到所述目标数据的风险类型、所述目标事件组合、所述目标事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述目标事件组合的组合类型对应的目标属性数据。
[0173] 可选地,所述预设关联关系包括所述连续关系、所述突变关系、所述积累关系和所述共现关系,所述风险检测模型包括嵌入层、卷积神经网络层、第一关键属性选择器、第一子序列生成层、事件关系提取层、第二关键属性选择器、第二子序列生成层和预测网络层,[0174] 所述基于所述预先训练的风险检测模型和所述目标数据,确定所述目标数据的风险类型、所述目标事件组合、所述目标事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述目标事件组合的组合类型对应的目标属性数据,包括:
[0175] 将所述目标数据输入所述嵌入层,得到与所述目标数据对应的嵌入向量;
[0176] 将所述嵌入向量输入所述卷积神经网络层,得到与所述嵌入向量对应的第一分类向量和分割向量,所述第一分类向量用于确定所述目标事件组合的组合类型,所述分割向量用于对所述目标数据中的多个行为数据进行分割处理,以基于分割结果确定所述目标事件组合,所述卷积神经网络包括多个卷积层和多个反卷积层;
[0177] 将所述嵌入向量和所述第一分类向量输入所述第一关键属性选择器,得到第二分类向量,所述第二分类向量用于表征每个所述行为数据对应的每个所述属性数据与每个所述组合类型对应的关键度;
[0178] 将所述第二分类向量和所述分割向量输入所述第一子序列生成模块,得到第一候选事件组合、所述第一候选事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述第一候选事件组合的组合类型对应的候选属性数据;
[0179] 将所述嵌入向量输入所述事件关系提取层,得到所述嵌入向量对应的第三分类向量和所述目标数据对应的聚类结果,所述事件关系提取层包括聚类层和多层注意力层,所述注意力层用于提取所述目标数据中具有所述积累关系和/或所述共现关系的行为数据,所述聚类层用于对所述目标数据进行聚类处理,所述第三分类向量用于确定所述目标事件组合的组合类型;
[0180] 将所述嵌入向量和所述第三分类向量输入所述第二关键属性选择器,得到第四分类向量,所述第四分类向量用于表征每个所述行为数据对应的每个所述属性数据与每个所述组合类型对应的关键度;
[0181] 将所述第四分类向量和所述聚类结果输入所述第二子序列生成层,得到第二候选事件组合、所述第二候选事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述第二候选事件组合的组合类型对应的候选属性数据;
[0182] 将所述第一候选事件组合、所述第一候选事件组合的组合类型、所述行为数据对应的属性数据中,与所述第一候选事件组合的组合类型对应的候选属性数据、所述第二候选事件组合、所述第二候选事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述第二候选事件组合的组合类型对应的候选属性数据输入所述预测网络,得到所述目标数据的风险类型、所述目标事件组合、所述目标事件组合的组合类型,以及所述行为数据对应的属性数据中,与所述目标事件组合的组合类型对应的目标属性数据。
[0183] 可选地,所述基于所述目标数据的风险类型以及所述目标事件组合,确定针对所述目标数据的风险检测结果,包括:
[0184] 基于所述目标数据的风险类型以及所述目标事件组合的组合类型,确定所述目标数据对应的目标风险检测策略;
[0185] 基于所述目标风险检测策略,对所述目标事件组合的组合类型、所述目标属性数据以及所述目标事件组合包括的多个行为数据进行风险检测处理,得到所述针对所述目标数据的风险检测结果。
[0186] 本说明书实施例提供一种数据处理设备,获取待检测的目标数据,目标数据可以包括人机交互过程中生成的多个行为数据,基于预先训练的风险检测模型和目标数据,确定目标数据的风险类型以及目标事件组合,目标事件组合可以包含行为数据中具有预设关联关系的多个行为数据,风险检测模型可以为基于历史数据和预设关联关系对应的损失函数,对由预设深度学习算法构建的模型进行训练得到,基于目标数据的风险类型以及目标事件组合,确定针对目标数据的风险检测结果。这样,由于目标事件组合包括具有预设关联关系的多个行为数据,因此,目标事件组合可以用于对风险检测模型的预测结果(即目标数据的风险类型)提供解释,增强风险检测模型的可信性,即可以通过目标数据的风险类型以及目标事件组合,提高针对目标数据的风险检测结果的检测准确性。
[0187] 实施例五
[0188] 本说明书实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述数据处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read‑Only Memory,简称ROM)、随机存取存储器(RandomAccess Memory,简称RAM)、磁碟或者光盘等。
[0189] 本说明书实施例提供一种计算机可读存储介质,获取待检测的目标数据,目标数据可以包括人机交互过程中生成的多个行为数据,基于预先训练的风险检测模型和目标数据,确定目标数据的风险类型以及目标事件组合,目标事件组合可以包含行为数据中具有预设关联关系的多个行为数据,风险检测模型可以为基于历史数据和预设关联关系对应的损失函数,对由预设深度学习算法构建的模型进行训练得到,基于目标数据的风险类型以及目标事件组合,确定针对目标数据的风险检测结果。这样,由于目标事件组合包括具有预设关联关系的多个行为数据,因此,目标事件组合可以用于对风险检测模型的预测结果(即目标数据的风险类型)提供解释,增强风险检测模型的可信性,即可以通过目标数据的风险类型以及目标事件组合,提高针对目标数据的风险检测结果的检测准确性。
[0190] 上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0191] 在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(FieldProgrammable Gate Array,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logiccompiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(AdvancedBoolean Expression Language)、AHDL(Altera Hardware Description Language)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(Ruby HardwareDescription Language)等,目前最普遍使用的是VHDL(Very‑High‑SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
[0192] 控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、AtmelAT91SAM、Microchip PIC18F26K20 以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
[0193] 上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
[0194] 为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
[0195] 本领域内的技术人员应明白,本说明书的实施例可提供为方法、系统、或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD‑ROM、光学存储器等)上实施的计算机程序产品的形式。
[0196] 本说明书的实施例是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0197] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0198] 这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0199] 在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
[0200] 内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM)。内存是计算机可读介质的示例。
[0201] 计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD‑ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
[0202] 还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0203] 本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD‑ROM、光学存储器等)上实施的计算机程序产品的形式。
[0204] 本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书一个或多个实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
[0205] 本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0206] 以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。