基于交易模式识别的异常交易检测方法及其系统转让专利

申请号 : CN202211402727.3

文献号 : CN115456789B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 徐行陈宏陈定吴卫东张玲丹牟立强

申请人 : 杭州衡泰技术股份有限公司

摘要 :

公开了一种基于交易模式识别的异常交易检测方法及其系统,其采用基于深度学习的人工智能检测算法来分别提取出待检测交易数据和正常交易数据的长依赖关联特征以及短和中距离依赖关联特征,并分别将所述待检测交易数据和所述正常交易数据的长中短依赖特征进行融合以得到包含不同距离依赖的多尺度交易特征信息,进一步再计算所述待检测交易数据和所述正常交易数据的多尺度交易特征之间的转移矩阵来表示两者的特征差异,以此来进行待检测交易数据的交易异常判断。这样,能够在对于庞大的交易数据进行异常检测时保证异常检测的准确性和有效性。

权利要求 :

1.一种基于交易模式识别的异常交易检测方法,其特征在于,包括:获取被标注为正常交易的多次交易数据;

基于所述被标注为正常交易的多次交易数据,生成正常交易特征向量;

获取待检测交易数据;

将所述待检测交易数据中的多个数据项通过包含嵌入层的上下文编码器以得到多个交易上下文语义特征向量;

将所述多个交易上下文语义特征向量进行级联以得到第一尺度交易语义特征向量;

将所述多个交易上下文语义特征向量进行二维排列为交易上下文语义特征矩阵后通过包含多个混合卷积层的卷积神经网络模型以得到第二尺度交易语义特征向量;

融合所述第一尺度交易语义特征向量和所述第二尺度交易语义特征向量以得到待检测交易特征向量;

计算所述待检测交易特征向量与所述正常交易特征向量之间的转移矩阵作为分类特征矩阵;以及将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示待检测交易数据是否属于交易异常;

其中,所述将所述待检测交易数据中的多个数据项通过包含嵌入层的上下文编码器以得到多个交易上下文语义特征向量,包括:将所述待检测交易数据中的多个数据项通过所述上下文编码器的嵌入层以得到多个数据项嵌入向量;以及将所述多个数据项嵌入向量输入所述上下文编码器以得到所述多个交易上下文语义特征向量;

其中,所述将所述待检测交易数据中的多个数据项通过所述上下文编码器的嵌入层以得到多个数据项嵌入向量,包括:通过所述上下文编码器的嵌入层分别将所述各个数据项中的文本数据映射为词嵌入向量;以及将所述各个数据项中的数值数据添加到所述各个数据项的词嵌入向量的尾部以得到所述数据项嵌入向量;

其中,所述将所述多个数据项嵌入向量输入所述上下文编码器以得到所述多个交易上下文语义特征向量,包括:将所述多个数据项嵌入向量排列为输入向量;

将所述输入向量分别通过可学习嵌入矩阵转化为查询向量和关键向量;

计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;

对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;

将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及将所述自注意力特征矩阵与以所述多个数据项嵌入向量中各个数据项嵌入向量作为值向量分别进行相乘以得到所述多个交易上下文语义特征向量;

其中,所述计算所述待检测交易特征向量与所述正常交易特征向量之间的转移矩阵作为分类特征矩阵,包括:以如下公式计算所述待检测交易特征向量与所述正常交易特征向量之间的所述转移矩阵作为所述分类特征矩阵;

其中,所述公式为:

=

其中 表示所述待检测交易特征向量,表示所述正常交易特征向量,表示所述转移矩阵, 表示矩阵与向量相乘。

2.根据权利要求1所述的基于交易模式识别的异常交易检测方法,其特征在于,所述将所述多个交易上下文语义特征向量进行二维排列为交易上下文语义特征矩阵后通过包含多个混合卷积层的卷积神经网络模型以得到第二尺度交易语义特征向量,包括:使用所述卷积神经网络模型的各个混合卷积层在层的正向传递中分别对输入数据进行:对输入数据进行多尺度卷积编码以得到多尺度卷积特征图;

将所述多尺度卷积特征图进行池化处理以得到池化特征图;以及对所述池化特征图进行激活处理以得到激活特征图;

其中,所述卷积神经网络模型的最后一个混合卷积层的输出为所述第二尺度交易语义特征向量。

3.根据权利要求2所述的基于交易模式识别的异常交易检测方法,其特征在于,所述将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示待检测交易数据是否属于交易异常,包括:使用所述分类器以如下公式对所述分类特征矩阵进行处理以得到所述分类结果;

其中,所述公式为: ,其中 表示将所

述分类特征矩阵投影为向量, 至 为各层全连接层的权重矩阵, 至 表示各层全连接层的偏置向量。

4.根据权利要求1所述的基于交易模式识别的异常交易检测方法,其特征在于,还包括训练步骤:对所述包含嵌入层的上下文编码器、所述包含多个混合卷积层的卷积神经网络模型和所述分类器进行训练;

所述训练步骤,包括:

获取训练数据,所述训练数据包括被标注为正常交易的多次训练交易数据、训练待检测交易数据,以及,所述训练待检测交易数据是否属于交易异常的真实值;

基于所述被标注为正常交易的多次训练交易数据,生成训练正常交易特征向量;

将所述训练待检测交易数据中的多个数据项通过所述包含嵌入层的上下文编码器以得到多个训练交易上下文语义特征向量;

将所述多个训练交易上下文语义特征向量进行级联以得到训练第一尺度交易语义特征向量;

将所述多个训练交易上下文语义特征向量进行二维排列为训练交易上下文语义特征矩阵后通过所述包含多个混合卷积层的卷积神经网络模型以得到训练第二尺度交易语义特征向量;

融合所述训练第一尺度交易语义特征向量和所述训练第二尺度交易语义特征向量以得到训练待检测交易特征向量;

计算所述训练待检测交易特征向量与所述训练正常交易特征向量之间的转移矩阵作为训练分类特征矩阵;

将所述训练分类特征矩阵通过所述分类器以得到分类损失函数值;以及基于所述分类损失函数值并通过梯度下降的方向传播来对所述包含嵌入层的上下文编码器、所述包含多个混合卷积层的卷积神经网络模型和所述分类器进行训练,其中,在所述训练的每一轮迭代中,基于远程迁移矩阵和惩罚向量对所述训练分类特征矩阵展开后得到的训练分类特征向量进行迭代。

5.根据权利要求4所述的基于交易模式识别的异常交易检测方法,其特征在于,在所述训练的每一轮迭代中,基于所述远程迁移矩阵和所述惩罚向量以如下公式对所述训练分类特征矩阵展开后得到的训练分类特征向量进行迭代;

其中,所述公式为:

其中 表示所述训练分类特征矩阵展开后得到的训练分类特征向量, 表示具有可学习的参数的所述远程迁移矩阵, 表示每次迭代时所述分类器的初始全连接权重矩阵,且为所述惩罚向量, 表示 激活函数, 表示按位置加法, 表示按位置减法,表示矩阵相乘, 表示向量的指数运算,所述向量的指数运算表示计算以向量中各个位置的特征值为幂的自然指数函数值。

6.一种基于交易模式识别的异常交易检测系统,其特征在于,包括:正常交易数据获取单元,用于获取被标注为正常交易的多次交易数据;

向量构造单元,用于基于所述被标注为正常交易的多次交易数据,生成正常交易特征向量;

待检测交易数据获取单元,用于获取待检测交易数据;

全局语义理解单元,用于将所述待检测交易数据中的多个数据项通过包含嵌入层的上下文编码器以得到多个交易上下文语义特征向量;

级联单元,用于将所述多个交易上下文语义特征向量进行级联以得到第一尺度交易语义特征向量;

混合卷积单元,用于将所述多个交易上下文语义特征向量进行二维排列为交易上下文语义特征矩阵后通过包含多个混合卷积层的卷积神经网络模型以得到第二尺度交易语义特征向量;

融合单元,用于融合所述第一尺度交易语义特征向量和所述第二尺度交易语义特征向量以得到待检测交易特征向量;

关联单元,用于计算所述待检测交易特征向量与所述正常交易特征向量之间的转移矩阵作为分类特征矩阵;以及检测结果生成单元,用于将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示待检测交易数据是否属于交易异常;

其中,所述全局语义理解单元,进一步用于:

将所述待检测交易数据中的多个数据项通过所述上下文编码器的嵌入层以得到多个数据项嵌入向量;以及将所述多个数据项嵌入向量输入所述上下文编码器以得到所述多个交易上下文语义特征向量;

其中,所述将所述待检测交易数据中的多个数据项通过所述上下文编码器的嵌入层以得到多个数据项嵌入向量,包括:通过所述上下文编码器的嵌入层分别将所述各个数据项中的文本数据映射为词嵌入向量;以及将所述各个数据项中的数值数据添加到所述各个数据项的词嵌入向量的尾部以得到所述数据项嵌入向量;

其中,所述将所述多个数据项嵌入向量输入所述上下文编码器以得到所述多个交易上下文语义特征向量,包括:将所述多个数据项嵌入向量排列为输入向量;

将所述输入向量分别通过可学习嵌入矩阵转化为查询向量和关键向量;

计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;

对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;

将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及将所述自注意力特征矩阵与以所述多个数据项嵌入向量中各个数据项嵌入向量作为值向量分别进行相乘以得到所述多个交易上下文语义特征向量;

其中,所述关联单元,进一步用于:

以如下公式计算所述待检测交易特征向量与所述正常交易特征向量之间的所述转移矩阵作为所述分类特征矩阵;

其中,所述公式为:

=

其中 表示所述待检测交易特征向量,表示所述正常交易特征向量,表示所述转移矩阵, 表示矩阵与向量相乘。

说明书 :

基于交易模式识别的异常交易检测方法及其系统

技术领域

[0001] 本申请涉及交易检测领域,且更为具体地,涉及一种基于交易模式识别的异常交易检测方法及其系统。

背景技术

[0002] 中国的电子商务的崛起与网上交易的普及等现状,这使我国的银行交易量级业务迎来大数据的时代。现如今,我国的金融业正在“互联网+”的新时代,在互联网的时代,银行业在一段时间内发生了巨大变化。随着经济的发展,银行交易的数据量越来越庞大,近年来,电子商务的崛起,P2P交易方式等使得交易数据量进一步扩大。同时,异常交易也在提升,怎样能够在庞大的数据面前有效的检测出异常交易,变成了一项巨大的挑战。
[0003] 现如今异常交易检测技术主要有:
[0004] 1.在交易系统的软件测试阶段:软件测试人员与开发人员,通过软件的强壮性测试,对交易系统软件输入大量的不规则数据,交易软件系统使用条件判断,对交易软件系统的输入值进行过滤,而如今的交易数据具有多变性和复杂性,这种僵硬的条件判断,不能满足异常交易检测的要求,此种方法是异常交易检测最初级的方法。
[0005] 2.交易系统的管理人员和运维人员,定期的对一定量的交易数据进行统计检测,依据人员的工作经验,主观的将异常的交易检测出来,此种方法灵活性最大,但是,效率低下,只能对重要交易数据进行重点检测,不能对全部的交易数据进行异常检测,且此方法主观因素大,不能对检测结果进行有效的保证,此种方法是异常交易检测的辅助方法。
[0006] 因此,期待一种优化的异常交易检测方案。

发明内容

[0007] 为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于交易模式识别的异常交易检测方法及其系统,其采用基于深度学习的人工智能检测算法来分别提取出待检测交易数据和正常交易数据的长依赖关联特征以及短和中距离依赖关联特征,并分别将所述待检测交易数据和所述正常交易数据的长中短依赖特征进行融合以得到包含不同距离依赖的多尺度交易特征信息,进一步再计算所述待检测交易数据和所述正常交易数据的多尺度交易特征之间的转移矩阵来表示两者的特征差异,以此来进行待检测交易数据的交易异常判断。这样,能够在对于庞大的交易数据进行异常检测时保证异常检测的准确性和有效性。
[0008] 根据本申请的一个方面,提供了一种基于交易模式识别的异常交易检测方法,其包括:
[0009] 获取被标注为正常交易的多次交易数据;
[0010] 基于所述被标注为正常交易的多次交易数据,生成正常交易特征向量;
[0011] 获取待检测交易数据;
[0012] 将所述待检测交易数据中的多个数据项通过包含嵌入层的上下文编码器以得到多个交易上下文语义特征向量;
[0013] 将所述多个交易上下文语义特征向量进行级联以得到第一尺度交易语义特征向量;
[0014] 将所述多个交易上下文语义特征向量进行二维排列为交易上下文语义特征矩阵后通过包含多个混合卷积层的卷积神经网络模型以得到第二尺度交易语义特征向量;
[0015] 融合所述第一尺度交易语义特征向量和所述第二尺度交易语义特征向量以得到待检测交易特征向量;
[0016] 计算所述待检测交易特征向量与所述正常交易特征向量之间的转移矩阵作为分类特征矩阵;以及
[0017] 将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示待检测交易数据是否属于交易异常。
[0018] 在上述基于交易模式识别的异常交易检测方法中,所述将所述待检测交易数据中的多个数据项通过包含嵌入层的上下文编码器以得到多个交易上下文语义特征向量,包括:将所述待检测交易数据中的多个数据项通过所述上下文编码器的嵌入层以得到多个数据项嵌入向量;以及,将所述多个数据项嵌入向量输入所述上下文编码器以得到所述多个交易上下文语义特征向量。
[0019] 在上述基于交易模式识别的异常交易检测方法中,所述将所述待检测交易数据中的多个数据项通过所述上下文编码器的嵌入层以得到多个数据项嵌入向量,包括:通过所述上下文编码器的嵌入层分别将所述各个数据项中的文本数据映射为词嵌入向量;以及,将所述各个数据项中的数值数据添加到所述各个数据项的词嵌入向量的尾部以得到所述数据项嵌入向量。
[0020] 在上述基于交易模式识别的异常交易检测方法中,所述将所述多个数据项嵌入向量输入所述上下文编码器以得到所述多个交易上下文语义特征向量,包括:将所述多个数据项嵌入向量排列为输入向量;将所述输入向量分别通过可学习嵌入矩阵转化为查询向量和关键向量;计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及,将所述自注意力特征矩阵与以所述多个数据项嵌入向量中各个数据项嵌入向量作为值向量分别进行相乘以得到所述多个交易上下文语义特征向量。
[0021] 在上述基于交易模式识别的异常交易检测方法中,所述将所述多个交易上下文语义特征向量进行二维排列为交易上下文语义特征矩阵后通过包含多个混合卷积层的卷积神经网络模型以得到第二尺度交易语义特征向量,包括:使用所述卷积神经网络模型的各个混合卷积层在层的正向传递中分别对输入数据进行:对输入数据进行多尺度卷积编码以得到多尺度卷积特征图;将所述多尺度卷积特征图进行池化处理以得到池化特征图;以及,对所述池化特征图进行激活处理以得到激活特征图;其中,所述卷积神经网络模型的最后一个混合卷积层的输出为所述第二尺度交易语义特征向量。
[0022] 在上述基于交易模式识别的异常交易检测方法中,所述计算所述待检测交易特征向量与所述正常交易特征向量之间的转移矩阵作为分类特征矩阵,包括:以如下公式计算所述待检测交易特征向量与所述正常交易特征向量之间的所述转移矩阵作为所述分类特征矩阵;其中,所述公式为:
[0023]
[0024] 其中 表示所述待检测交易特征向量, 表示所述正常交易特征向量,表示所述转移矩阵, 表示矩阵与向量相乘。
[0025] 在上述基于交易模式识别的异常交易检测方法中,所述将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示待检测交易数据是否属于交易异常,包括:使用所述分类器以如下公式对所述分类特征矩阵进行处理以得到所述分类结果;其中,所述公式为:
[0026]
[0027] 其中 表示将所述分类特征矩阵投影为向量, 至 为各层全连接层的权重矩阵, 至 表示各层全连接层的偏置向量。
[0028] 在上述基于交易模式识别的异常交易检测方法中,还包括训练步骤:对所述包含嵌入层的上下文编码器、所述包含多个混合卷积层的卷积神经网络模型和所述分类器进行训练;所述训练步骤,包括:获取训练数据,所述训练数据包括被标注为正常交易的多次训练交易数据、训练待检测交易数据,以及,所述训练待检测交易数据是否属于交易异常的真实值;基于所述被标注为正常交易的多次训练交易数据,生成训练正常交易特征向量;将所述训练待检测交易数据中的多个数据项通过所述包含嵌入层的上下文编码器以得到多个训练交易上下文语义特征向量;将所述多个训练交易上下文语义特征向量进行级联以得到训练第一尺度交易语义特征向量;将所述多个训练交易上下文语义特征向量进行二维排列为训练交易上下文语义特征矩阵后通过所述包含多个混合卷积层的卷积神经网络模型以得到训练第二尺度交易语义特征向量;融合所述训练第一尺度交易语义特征向量和所述训练第二尺度交易语义特征向量以得到训练待检测交易特征向量;计算所述训练待检测交易特征向量与所述训练正常交易特征向量之间的转移矩阵作为训练分类特征矩阵;将所述训练分类特征矩阵通过所述分类器以得到分类损失函数值;以及,基于所述分类损失函数值并通过梯度下降的方向传播来对所述包含嵌入层的上下文编码器、所述包含多个混合卷积层的卷积神经网络模型和所述分类器进行训练,其中,在所述训练的每一轮迭代中,基于远程迁移矩阵和惩罚向量对所述训练分类特征矩阵展开后得到的训练分类特征向量进行迭代。
[0029] 在上述基于交易模式识别的异常交易检测方法中,在所述训练的每一轮迭代中,基于所述远程迁移矩阵和所述惩罚向量以如下公式对所述训练分类特征矩阵展开后得到的训练分类特征向量进行迭代;其中,所述公式为:
[0030]
[0031] 其中 表示所述训练分类特征矩阵展开后得到的训练分类特征向量, 表示具有可学习的参数的所述远程迁移矩阵, 表示每次迭代时所述分类器的初始全连接权重矩阵,且 为所述惩罚向量, 表示 激活函数, 表示按位置加法, 表示按位置减法, 表示矩阵相乘, 表示向量的指数运算,所述向量的指数运算表示计算以向量中各个位置的特征值为幂的自然指数函数值。
[0032] 根据本申请的另一方面,提供了一种基于交易模式识别的异常交易检测系统,包括:
[0033] 正常交易数据获取单元,用于获取被标注为正常交易的多次交易数据;
[0034] 向量构造单元,用于基于所述被标注为正常交易的多次交易数据,生成正常交易特征向量;
[0035] 待检测交易数据获取单元,用于获取待检测交易数据;
[0036] 全局语义理解单元,用于将所述待检测交易数据中的多个数据项通过包含嵌入层的上下文编码器以得到多个交易上下文语义特征向量;
[0037] 级联单元,用于将所述多个交易上下文语义特征向量进行级联以得到第一尺度交易语义特征向量;
[0038] 混合卷积单元,用于将所述多个交易上下文语义特征向量进行二维排列为交易上下文语义特征矩阵后通过包含多个混合卷积层的卷积神经网络模型以得到第二尺度交易语义特征向量;
[0039] 融合单元,用于融合所述第一尺度交易语义特征向量和所述第二尺度交易语义特征向量以得到待检测交易特征向量;
[0040] 关联单元,用于计算所述待检测交易特征向量与所述正常交易特征向量之间的转移矩阵作为分类特征矩阵;以及
[0041] 检测结果生成单元,用于将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示待检测交易数据是否属于交易异常。
[0042] 在上述基于交易模式识别的异常交易检测系统中,还包括对所述包含嵌入层的上下文编码器、所述包含多个混合卷积层的卷积神经网络模型和所述分类器进行训练的训练模块;其中,所述训练模块,包括:训练数据获取单元,用于获取训练数据,所述训练数据包括被标注为正常交易的多次训练交易数据、训练待检测交易数据,以及,所述训练待检测交易数据是否属于交易异常的真实值;训练向量构造单元,用于基于所述被标注为正常交易的多次训练交易数据,生成训练正常交易特征向量;训练全局语义理解单元,用于将所述训练待检测交易数据中的多个数据项通过所述包含嵌入层的上下文编码器以得到多个训练交易上下文语义特征向量;训练级联单元,用于将所述多个训练交易上下文语义特征向量进行级联以得到训练第一尺度交易语义特征向量;训练混合卷积单元,用于将所述多个训练交易上下文语义特征向量进行二维排列为训练交易上下文语义特征矩阵后通过所述包含多个混合卷积层的卷积神经网络模型以得到训练第二尺度交易语义特征向量;训练融合单元,用于融合所述训练第一尺度交易语义特征向量和所述训练第二尺度交易语义特征向量以得到训练待检测交易特征向量;训练关联单元,用于计算所述训练待检测交易特征向量与所述训练正常交易特征向量之间的转移矩阵作为训练分类特征矩阵;分类损失函数值生成单元,用于将所述训练分类特征矩阵通过所述分类器以得到分类损失函数值;以及,训练单元,用于基于所述分类损失函数值并通过梯度下降的方向传播来对所述包含嵌入层的上下文编码器、所述包含多个混合卷积层的卷积神经网络模型和所述分类器进行训练,其中,在所述训练的每一轮迭代中,基于远程迁移矩阵和惩罚向量对所述训练分类特征矩阵展开后得到的训练分类特征向量进行迭代。
[0043] 与现有技术相比,本申请提供的基于交易模式识别的异常交易检测方法及其系统,其采用基于深度学习的人工智能检测算法来分别提取出待检测交易数据和正常交易数据的长依赖关联特征以及短和中距离依赖关联特征,并分别将所述待检测交易数据和所述正常交易数据的长中短依赖特征进行融合以得到包含不同距离依赖的多尺度交易特征信息,进一步再计算所述待检测交易数据和所述正常交易数据的多尺度交易特征之间的转移矩阵来表示两者的特征差异,以此来进行待检测交易数据的交易异常判断。这样,能够在对于庞大的交易数据进行异常检测时保证异常检测的准确性和有效性。

附图说明

[0044] 通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
[0045] 图1为根据本申请实施例的基于交易模式识别的异常交易检测方法的流程图。
[0046] 图2为根据本申请实施例的基于交易模式识别的异常交易检测方法的架构示意图。
[0047] 图3为根据本申请实施例的基于交易模式识别的异常交易检测方法中将所述多个数据项嵌入向量输入所述上下文编码器以得到所述多个交易上下文语义特征向量的流程图。
[0048] 图4为根据本申请实施例的基于交易模式识别的异常交易检测方法中对所述包含嵌入层的上下文编码器、所述包含多个混合卷积层的卷积神经网络模型和所述分类器进行训练的流程图。
[0049] 图5为根据本申请实施例的基于交易模式识别的异常交易检测系统的框图。
[0050] 图6为根据本申请实施例的基于交易模式识别的异常交易检测系统中训练模块的框图。

具体实施方式

[0051] 下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
[0052] 申请概述
[0053] 如上所述,期待一种优化的异常交易检测方案。目前,深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、语音信号处理等领域。此外,深度学习以及神经网络在图像分类、物体检测、语义分割、文本翻译等领域,也展现出了接近甚至超越人类的水平。
[0054] 近年来,深度学习以及神经网络的发展为异常交易的智能检测提供了新的解决思路和方案。
[0055] 相应地,考虑到在对于异常交易进行检测判断时,为了兼顾准确性和有效性,可以通过待检测交易数据隐含特征和正常交易数据隐含特征在高维空间中的特征差异来进行。也就是,具体地,在本申请的技术方案中,采用基于深度学习的人工智能检测算法来分别提取出待检测交易数据和正常交易数据的长依赖关联特征以及短和中距离依赖关联特征,并分别将所述待检测交易数据和所述正常交易数据的长中短依赖特征进行融合以得到包含不同距离依赖的多尺度交易特征信息,进一步再计算所述待检测交易数据和所述正常交易数据的多尺度交易特征之间的转移矩阵来表示两者的特征差异,以此来进行待检测交易数据的交易异常判断。这样,能够在对于庞大的交易数据进行异常检测时保证异常检测的准确性和有效性。
[0056] 具体地,在本申请的技术方案中,首先,获取待检测交易数据。接着,考虑到在所述待检测交易数据中,各个数据项之间具有着关联性关系,为了能够准确地提取出所述检测交易数据中的隐含特征信息以对于交易数据的异常性进行准确地判断,需要对于交易数据的各个数据项之间的长依赖关联特征和中短距离依赖关联特征进行提取融合来表征不同距离依赖的多尺度交易特征。
[0057] 也就是,具体地,将所述待检测交易数据中的多个数据项通过包含嵌入层的上下文编码器中进行编码,以提取所述交易数据的基于全局的长依赖关联特征,从而得到多个交易上下文语义特征向量。具体地,首先,通过所述上下文编码器的嵌入层来分别对于所述各个数据项中的文本数据映射为词嵌入向量,并把各个数据项中的数值数据添加到所述各个数据项的词嵌入向量的尾部以得到所述数据项嵌入向量。这样,能够对于所述待检测交易数据中的各个数据项进行向量化,以融合所述各个数据项中的文本信息和数据信息。然后,再将所述多个数据项嵌入向量输入所述上下文编码器中进行编码,以提取出所述多个数据项中各个数据项的基于全局的高维语义关联特征,即长依赖关联特征,从而得到所述多个交易上下文语义特征向量。接着,再将所述多个交易上下文语义特征向量进行级联以聚合所述各个数据项的基于全局的长依赖关联特征信息,从而得到具有所述待检测交易数据整体的长依赖关联特征的第一尺度交易语义特征向量。
[0058] 然后,考虑到在得到所述待检测交易数据的长距离全局语义关联特征后,还需要对于所述待检测交易数据的中短距离依赖关联特征进行深度挖掘。因此,在本申请的技术方案中,进一步将所述多个交易上下文语义特征向量进行二维排列为交易上下文语义特征矩阵后通过包含多个混合卷积层的卷积神经网络模型中进行处理,以分别提取出所述交易数据中的各个数据项的短和中距离依赖关联特征,从而得到第二尺度交易语义特征向量。相应地,在本申请的一个具体示例中,在所述混合卷积层中,此模块的设计包括并联的四个分支,由一个卷积核大小为3×3的普通卷积层以及三个卷积核大小为3×3的空洞卷积层构成,分别对所述交易上下文语义特征矩阵进行操作,将空洞卷积三个分支的扩张率分别设置为2、3、4,通过不同扩张率的设置可获得不同感受域的图像信息,即可得到不同尺度的特征图,在扩大感受野的同时,又避免了下采样损失信息,接着将 4 个分支特征图进行融合,使得采样更为密集,既拥有了高层特征,也没有增加额外的参数量。
[0059] 进一步地,融合所述第一尺度交易语义特征向量和所述第二尺度交易语义特征向量以得到待检测交易特征向量。也就是,在一个具体示例中,以级联的方式融合具有所述待检测交易数据的各个数据项的长依赖关联特征的所述第一尺度交易语义特征向量和具有所述各个数据项的短和中依赖关联特征的所述第二尺度交易语义特征向量,就能够得到包含不同距离依赖的多尺度交易特征的所述待检测交易特征向量。这样,能够通过长依赖关联和中短依赖关联来充分地提取出所述待检测交易数据的各个数据项中的多尺度关联特征,以提高对于交易异常判断的精准度。
[0060] 同样地,对于所述正常交易数据的特征挖掘,首先,获取被标注为正常交易的多次交易数据,进一步地,也将其按照与所述待检测交易数据的编码过程相一致的编码方法进行编码处理。也就是,基于所述被标注为正常交易的多次交易数据,生成具有各个数据项之间长依赖关联特征和中短依赖关联特征的融合特征的正常交易特征向量。
[0061] 然后,计算所述待检测交易特征向量与所述正常交易特征向量之间的转移矩阵来表示所述待检测交易数据的多尺度交易特征和所述正常交易数据的多尺度交易特征的差异性特征,以此作为分类特征矩阵来通过分类器中进行分类处理,就能够得到用于表示待检测交易数据是否属于交易异常的分类结果。
[0062] 特别地,在本申请的技术方案中,这里,通过计算所述待检测交易特征向量与所述正常交易特征向量之间的转移矩阵作为分类特征矩阵,可以更为关注所述待检测交易特征向量的特征分布相对于所述正常交易特征向量的特征分布的差异性分布,从而增强所述分类特征矩阵的分类效果。但是,另一方面,由于所述差异性分布可能其本身会削弱对于交易数据的多尺度交易特征的表达,其对于交易数据的多尺度交易特征的支持性表达会被削弱,从而在通过分类器进行分类时导致跨分类器的远程分布偏差,这会影响分类器的训练速度,并在一定程度上影响分类特征向量的分类结果的准确性。
[0063] 因此,在本申请的技术方案中,在模型的训练过程中,使用跨分类器的远程分布描述性增强来优化所述分类特征矩阵的分类过程,具体地,在分类过程中,在每次分类器的权重矩阵的迭代过程中,通过下式来计算分类器的输入:
[0064]
[0065] 是所述分类特征矩阵展开后得到的分类特征向量, 为远程迁移矩阵, 为分类器的初始全连接权重矩阵,且 为惩罚向量,其中所述远程迁移矩阵 初始可设置为所述初始全连接权重矩阵 的全局均值构成的矩阵,且所述惩罚向量 可设置为所述分类特征向量 的全局均值构成的向量。
[0066] 这里,通过以具有可学习的参数的矩阵 来对跨分类器的分布迁移进行特征分布的支持性描述,来支持优化后的分类特征向量 跨分类器的全连接权重矩阵 的远程分布对预定分类的类概率的描述性,其中惩罚向量 作为偏置并以 激活函数进行激活,来保留具有正向作用的分布描述依赖的增强,这样,就提升了分类器的训练速度和分类特征向量的分类结果的准确性。这样,能够在对于庞大的交易数据进行异常检测时保证异常检测的准确性和有效性。
[0067] 基于此,本申请提出了一种基于交易模式识别的异常交易检测方法,其包括:获取被标注为正常交易的多次交易数据;基于所述被标注为正常交易的多次交易数据,生成正常交易特征向量;获取待检测交易数据;将所述待检测交易数据中的多个数据项通过包含嵌入层的上下文编码器以得到多个交易上下文语义特征向量;将所述多个交易上下文语义特征向量进行级联以得到第一尺度交易语义特征向量;将所述多个交易上下文语义特征向量进行二维排列为交易上下文语义特征矩阵后通过包含多个混合卷积层的卷积神经网络模型以得到第二尺度交易语义特征向量;融合所述第一尺度交易语义特征向量和所述第二尺度交易语义特征向量以得到待检测交易特征向量;计算所述待检测交易特征向量与所述正常交易特征向量之间的转移矩阵作为分类特征矩阵;以及,将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示待检测交易数据是否属于交易异常。
[0068] 在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。
[0069] 示例性方法
[0070] 图1为根据本申请实施例的基于交易模式识别的异常交易检测方法的流程图。如图1所示,根据本申请实施例的基于交易模式识别的异常交易检测方法,包括:S110,获取被标注为正常交易的多次交易数据;S120,基于所述被标注为正常交易的多次交易数据,生成正常交易特征向量;S130,获取待检测交易数据;S140,将所述待检测交易数据中的多个数据项通过包含嵌入层的上下文编码器以得到多个交易上下文语义特征向量;S150,将所述多个交易上下文语义特征向量进行级联以得到第一尺度交易语义特征向量;S160,将所述多个交易上下文语义特征向量进行二维排列为交易上下文语义特征矩阵后通过包含多个混合卷积层的卷积神经网络模型以得到第二尺度交易语义特征向量;S170,融合所述第一尺度交易语义特征向量和所述第二尺度交易语义特征向量以得到待检测交易特征向量;S180,计算所述待检测交易特征向量与所述正常交易特征向量之间的转移矩阵作为分类特征矩阵;以及,S190,将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示待检测交易数据是否属于交易异常。
[0071] 图2为根据本申请实施例的基于交易模式识别的异常交易检测方法的架构示意图。如图2所示,在该网络架构中,首先获取被标注为正常交易的多次交易数据,并基于所述被标注为正常交易的多次交易数据,生成正常交易特征向量。接着,获取待检测交易数据,并将所述待检测交易数据中的多个数据项通过包含嵌入层的上下文编码器以得到多个交易上下文语义特征向量。然后,将所述多个交易上下文语义特征向量进行级联以得到第一尺度交易语义特征向量。进而,将所述多个交易上下文语义特征向量进行二维排列为交易上下文语义特征矩阵后通过包含多个混合卷积层的卷积神经网络模型以得到第二尺度交易语义特征向量。接着,融合所述第一尺度交易语义特征向量和所述第二尺度交易语义特征向量以得到待检测交易特征向量。然后,计算所述待检测交易特征向量与所述正常交易特征向量之间的转移矩阵作为分类特征矩阵。进而,将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示待检测交易数据是否属于交易异常。
[0072] 在步骤S110中,获取被标注为正常交易的多次交易数据。如上所述,现如今异常交易检测技术主要有:1.在交易系统的软件测试阶段:软件测试人员与开发人员,通过软件的强壮性测试,对交易系统软件输入大量的不规则数据,交易软件系统使用条件判断,对交易软件系统的输入值进行过滤,而如今的交易数据具有多变性和复杂性,这种僵硬的条件判断,不能满足异常交易检测的要求,此种方法是异常交易检测最初级的方法。2.交易系统的管理人员和运维人员,定期的对一定量的交易数据进行统计检测,依据人员的工作经验,主观的将异常的交易检测出来,此种方法灵活性最大,但是,效率低下,只能对重要交易数据进行重点检测,不能对全部的交易数据进行异常检测,且此方法主观因素大,不能对检测结果进行有效的保证,此种方法是异常交易检测的辅助方法。因此,期待一种优化的异常交易检测方案。
[0073] 目前,深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、语音信号处理等领域。此外,深度学习以及神经网络在图像分类、物体检测、语义分割、文本翻译等领域,也展现出了接近甚至超越人类的水平。近年来,深度学习以及神经网络的发展为异常交易的智能检测提供了新的解决思路和方案。
[0074] 相应地,考虑到在对于异常交易进行检测判断时,为了兼顾准确性和有效性,可以通过待检测交易数据隐含特征和正常交易数据隐含特征在高维空间中的特征差异来进行。也就是,具体地,在本申请的技术方案中,采用基于深度学习的人工智能检测算法来分别提取出待检测交易数据和正常交易数据的长依赖关联特征以及短和中距离依赖关联特征,并分别将所述待检测交易数据和所述正常交易数据的长中短依赖特征进行融合以得到包含不同距离依赖的多尺度交易特征信息,进一步再计算所述待检测交易数据和所述正常交易数据的多尺度交易特征之间的转移矩阵来表示两者的特征差异,以此来进行待检测交易数据的交易异常判断。这样,能够在对于庞大的交易数据进行异常检测时保证异常检测的准确性和有效性。
[0075] 因此,在本申请的技术方案中,首先,对所述被标注为正常交易的多次交易数据进行特征挖掘,也就是先获取被标注为正常交易的多次交易数据。
[0076] 在步骤S120中,基于所述被标注为正常交易的多次交易数据,生成正常交易特征向量。其中,所述生成正常交易特征向量的编码过程与所述待检测交易数据的编码过程相一致。也就是,基于所述被标注为正常交易的多次交易数据,生成具有各个数据项之间长依赖关联特征和中短依赖关联特征的融合特征的正常交易特征向量。更具体地,将所述被标注为正常交易的多次交易数据中的多个数据项通过包含嵌入层的上下文编码器以得到多个正常交易上下文语义特征向量。接着,将所述多个正常交易上下文语义特征向量进行级联以得到第一尺度正常交易语义特征向量,并将所述多个正常交易上下文语义特征向量进行二维排列为正常交易上下文语义特征矩阵后通过包含多个混合卷积层的卷积神经网络模型以得到第二尺度正常交易语义特征向量。然后,融合所述第一尺度正常交易语义特征向量和所述第二尺度正常交易语义特征向量以得到所述正常交易特征向量。
[0077] 在步骤S130中,获取待检测交易数据。同样地,对于待检测交易数据,首先获取所述待交易数据以便于后续的计算。
[0078] 在步骤S140中,将所述待检测交易数据中的多个数据项通过包含嵌入层的上下文编码器以得到多个交易上下文语义特征向量。考虑到在所述待检测交易数据中,各个数据项之间具有着关联性关系,为了能够准确地提取出所述检测交易数据中的隐含特征信息以对于交易数据的异常性进行准确地判断,需要对于交易数据的各个数据项之间的长依赖关联特征和中短距离依赖关联特征进行提取融合来表征不同距离依赖的多尺度交易特征。也就是,具体地,将所述待检测交易数据中的多个数据项通过包含嵌入层的上下文编码器中进行编码,以提取所述交易数据的基于全局的长依赖关联特征,从而得到多个交易上下文语义特征向量。
[0079] 具体地,在本申请实施例中,所述将所述待检测交易数据中的多个数据项通过包含嵌入层的上下文编码器以得到多个交易上下文语义特征向量,包括:将所述待检测交易数据中的多个数据项通过所述上下文编码器的嵌入层以得到多个数据项嵌入向量;以及,将所述多个数据项嵌入向量输入所述上下文编码器以得到所述多个交易上下文语义特征向量。
[0080] 更具体地,在本申请实施例中,所述将所述待检测交易数据中的多个数据项通过所述上下文编码器的嵌入层以得到多个数据项嵌入向量,包括:通过所述上下文编码器的嵌入层分别将所述各个数据项中的文本数据映射为词嵌入向量;以及,将所述各个数据项中的数值数据添加到所述各个数据项的词嵌入向量的尾部以得到所述数据项嵌入向量。这样,能够对于所述待检测交易数据中的各个数据项进行向量化,以融合所述各个数据项中的文本信息和数据信息。
[0081] 图3为根据本申请实施例的基于交易模式识别的异常交易检测方法中将所述多个数据项嵌入向量输入所述上下文编码器以得到所述多个交易上下文语义特征向量的流程图。如图3所示,所述将所述多个数据项嵌入向量输入所述上下文编码器以得到所述多个交易上下文语义特征向量,包括:S210,将所述多个数据项嵌入向量排列为输入向量;S220,将所述输入向量分别通过可学习嵌入矩阵转化为查询向量和关键向量;S230,计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;S240,对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;S250,将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及,S260,将所述自注意力特征矩阵与以所述多个数据项嵌入向量中各个数据项嵌入向量作为值向量分别进行相乘以得到所述多个交易上下文语义特征向量。通过这样的方式将所述多个数据项嵌入向量输入所述上下文编码器中进行编码,以提取出所述多个数据项中各个数据项的基于全局的高维语义关联特征,即长依赖关联特征,从而得到所述多个交易上下文语义特征向量。
[0082] 在步骤S150中,将所述多个交易上下文语义特征向量进行级联以得到第一尺度交易语义特征向量。也就是,将所述多个交易上下文语义特征向量进行级联以聚合所述各个数据项的基于全局的长依赖关联特征信息,从而得到具有所述待检测交易数据整体的长依赖关联特征的第一尺度交易语义特征向量。
[0083] 在步骤S160中,将所述多个交易上下文语义特征向量进行二维排列为交易上下文语义特征矩阵后通过包含多个混合卷积层的卷积神经网络模型以得到第二尺度交易语义特征向量。考虑到在得到所述待检测交易数据的长距离全局语义关联特征后,还需要对于所述待检测交易数据的中短距离依赖关联特征进行深度挖掘。
[0084] 因此,在本申请的技术方案中,进一步将所述多个交易上下文语义特征向量进行二维排列为交易上下文语义特征矩阵后通过包含多个混合卷积层的卷积神经网络模型中进行处理,以分别提取出所述交易数据中的各个数据项的短和中距离依赖关联特征,从而得到第二尺度交易语义特征向量。
[0085] 相应地,在本申请的一个具体示例中,在所述混合卷积层中,此模块的设计包括并联的四个分支,由一个卷积核大小为3×3的普通卷积层以及三个卷积核大小为3×3的空洞卷积层构成,分别对所述交易上下文语义特征矩阵进行操作,将空洞卷积三个分支的扩张率分别设置为2、3、4,通过不同扩张率的设置可获得不同感受域的图像信息,即可得到不同尺度的特征图,在扩大感受野的同时,又避免了下采样损失信息,接着将 4 个分支特征图进行融合,使得采样更为密集,既拥有了高层特征,也没有增加额外的参数量。
[0086] 具体地,在本申请实施例中,所述将所述多个交易上下文语义特征向量进行二维排列为交易上下文语义特征矩阵后通过包含多个混合卷积层的卷积神经网络模型以得到第二尺度交易语义特征向量,包括:使用所述卷积神经网络模型的各个混合卷积层在层的正向传递中分别对输入数据进行:对输入数据进行多尺度卷积编码以得到多尺度卷积特征图;将所述多尺度卷积特征图进行池化处理以得到池化特征图;以及,对所述池化特征图进行激活处理以得到激活特征图;其中,所述卷积神经网络模型的最后一个混合卷积层的输出为所述第二尺度交易语义特征向量。
[0087] 在步骤S170中,融合所述第一尺度交易语义特征向量和所述第二尺度交易语义特征向量以得到待检测交易特征向量。也就是,在一个具体示例中,以级联的方式融合具有所述待检测交易数据的各个数据项的长依赖关联特征的所述第一尺度交易语义特征向量和具有所述各个数据项的短和中依赖关联特征的所述第二尺度交易语义特征向量,就能够得到包含不同距离依赖的多尺度交易特征的所述待检测交易特征向量。这样,能够通过长依赖关联和中短依赖关联来充分地提取出所述待检测交易数据的各个数据项中的多尺度关联特征,以提高对于交易异常判断的精准度。
[0088] 在步骤S180中,计算所述待检测交易特征向量与所述正常交易特征向量之间的转移矩阵作为分类特征矩阵。也就是,计算所述待检测交易特征向量与所述正常交易特征向量之间的转移矩阵来表示所述待检测交易数据的多尺度交易特征和所述正常交易数据的多尺度交易特征的差异性特征,以此作为分类特征矩阵。
[0089] 具体地,在本申请实施例中,所述计算所述待检测交易特征向量与所述正常交易特征向量之间的转移矩阵作为分类特征矩阵,包括:以如下公式计算所述待检测交易特征向量与所述正常交易特征向量之间的所述转移矩阵作为所述分类特征矩阵;其中,所述公式为:
[0090]
[0091] 其中 表示所述待检测交易特征向量, 表示所述正常交易特征向量,表示所述转移矩阵, 表示矩阵与向量相乘。
[0092] 在步骤S190中,将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示待检测交易数据是否属于交易异常。这样,能够在对于庞大的交易数据进行异常检测时保证异常检测的准确性和有效性。
[0093] 具体地,在本申请实施例中,所述将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示待检测交易数据是否属于交易异常,包括:使用所述分类器以如下公式对所述分类特征矩阵进行处理以得到所述分类结果;其中,所述公式为:
[0094]
[0095] 其中 表示将所述分类特征矩阵投影为向量, 至 为各层全连接层的权重矩阵, 至 表示各层全连接层的偏置向量。
[0096] 在上述基于交易模式识别的异常交易检测方法中,还包括训练步骤:对所述包含嵌入层的上下文编码器、所述包含多个混合卷积层的卷积神经网络模型和所述分类器进行训练。
[0097] 图4为根据本申请实施例的基于交易模式识别的异常交易检测方法中对所述包含嵌入层的上下文编码器、所述包含多个混合卷积层的卷积神经网络模型和所述分类器进行训练的流程图。如图4所示,所述训练步骤,包括:S310,获取训练数据,所述训练数据包括被标注为正常交易的多次训练交易数据、训练待检测交易数据,以及,所述训练待检测交易数据是否属于交易异常的真实值;S320,基于所述被标注为正常交易的多次训练交易数据,生成训练正常交易特征向量;S330,将所述训练待检测交易数据中的多个数据项通过所述包含嵌入层的上下文编码器以得到多个训练交易上下文语义特征向量;S340,将所述多个训练交易上下文语义特征向量进行级联以得到训练第一尺度交易语义特征向量;S350,将所述多个训练交易上下文语义特征向量进行二维排列为训练交易上下文语义特征矩阵后通过所述包含多个混合卷积层的卷积神经网络模型以得到训练第二尺度交易语义特征向量;S360,融合所述训练第一尺度交易语义特征向量和所述训练第二尺度交易语义特征向量以得到训练待检测交易特征向量;S370,计算所述训练待检测交易特征向量与所述训练正常交易特征向量之间的转移矩阵作为训练分类特征矩阵;S380,将所述训练分类特征矩阵通过所述分类器以得到分类损失函数值;以及,S390,基于所述分类损失函数值并通过梯度下降的方向传播来对所述包含嵌入层的上下文编码器、所述包含多个混合卷积层的卷积神经网络模型和所述分类器进行训练,其中,在所述训练的每一轮迭代中,基于远程迁移矩阵和惩罚向量对所述训练分类特征矩阵展开后得到的训练分类特征向量进行迭代。
[0098] 特别地,在本申请的技术方案中,这里,通过计算所述待检测交易特征向量与所述正常交易特征向量之间的转移矩阵作为分类特征矩阵,可以更为关注所述待检测交易特征向量的特征分布相对于所述正常交易特征向量的特征分布的差异性分布,从而增强所述分类特征矩阵的分类效果。但是,另一方面,由于所述差异性分布可能其本身会削弱对于交易数据的多尺度交易特征的表达,其对于交易数据的多尺度交易特征的支持性表达会被削弱,从而在通过分类器进行分类时导致跨分类器的远程分布偏差,这会影响分类器的训练速度,并在一定程度上影响分类特征向量的分类结果的准确性。
[0099] 因此,在本申请的技术方案中,在模型的训练过程中,使用跨分类器的远程分布描述性增强来优化所述分类特征矩阵的分类过程。
[0100] 具体地,在本申请实施例中,在所述训练的每一轮迭代中,基于所述远程迁移矩阵和所述惩罚向量以如下公式对所述训练分类特征矩阵展开后得到的训练分类特征向量进行迭代;其中,所述公式为:
[0101]
[0102] 其中 表示所述训练分类特征矩阵展开后得到的训练分类特征向量, 表示具有可学习的参数的所述远程迁移矩阵, 表示每次迭代时所述分类器的初始全连接权重矩阵,且 为所述惩罚向量, 表示 激活函数, 表示按位置加法, 表示按位置减法, 表示矩阵相乘, 表示向量的指数运算,所述向量的指数运算表示计算以向量中各个位置的特征值为幂的自然指数函数值。其中,所述远程迁移矩阵 初始可设置为所述初始全连接权重矩阵 的全局均值构成的矩阵,且所述惩罚向量 可设置为所述分类特征向量 的全局均值构成的向量。
[0103] 这里,通过以具有可学习的参数的矩阵 来对跨分类器的分布迁移进行特征分布的支持性描述,来支持优化后的分类特征向量 跨分类器的全连接权重矩阵 的远程分布对预定分类的类概率的描述性,其中惩罚向量 作为偏置并以 激活函数进行激活,来保留具有正向作用的分布描述依赖的增强,这样,就提升了分类器的训练速度和分类特征向量的分类结果的准确性。
[0104] 综上,基于本申请实施例的基于交易模式识别的异常交易检测方法被阐明,其采用基于深度学习的人工智能检测算法来分别提取出待检测交易数据和正常交易数据的长依赖关联特征以及短和中距离依赖关联特征,并分别将所述待检测交易数据和所述正常交易数据的长中短依赖特征进行融合以得到包含不同距离依赖的多尺度交易特征信息,进一步再计算所述待检测交易数据和所述正常交易数据的多尺度交易特征之间的转移矩阵来表示两者的特征差异,以此来进行待检测交易数据的交易异常判断。这样,能够在对于庞大的交易数据进行异常检测时保证异常检测的准确性和有效性。
[0105] 示例性系统
[0106] 图5为根据本申请实施例的基于交易模式识别的异常交易检测系统的框图。如图5所示,根据本申请实施例的基于交易模式识别的异常交易检测系统100,包括:正常交易数据获取单元110,用于获取被标注为正常交易的多次交易数据;向量构造单元120,用于基于所述被标注为正常交易的多次交易数据,生成正常交易特征向量;待检测交易数据获取单元130,用于获取待检测交易数据;全局语义理解单元140,用于将所述待检测交易数据中的多个数据项通过包含嵌入层的上下文编码器以得到多个交易上下文语义特征向量;级联单元150,用于将所述多个交易上下文语义特征向量进行级联以得到第一尺度交易语义特征向量;混合卷积单元160,用于将所述多个交易上下文语义特征向量进行二维排列为交易上下文语义特征矩阵后通过包含多个混合卷积层的卷积神经网络模型以得到第二尺度交易语义特征向量;融合单元170,用于融合所述第一尺度交易语义特征向量和所述第二尺度交易语义特征向量以得到待检测交易特征向量;关联单元180,用于计算所述待检测交易特征向量与所述正常交易特征向量之间的转移矩阵作为分类特征矩阵;以及,检测结果生成单元190,用于将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示待检测交易数据是否属于交易异常。
[0107] 在上述基于交易模式识别的异常交易检测系统100中,还包括对所述包含嵌入层的上下文编码器、所述包含多个混合卷积层的卷积神经网络模型和所述分类器进行训练的训练模块200。
[0108] 图6为根据本申请实施例的基于交易模式识别的异常交易检测系统中训练模块的框图。如图6所示,所述训练模块200,包括:训练数据获取单元210,用于获取训练数据,所述训练数据包括被标注为正常交易的多次训练交易数据、训练待检测交易数据,以及,所述训练待检测交易数据是否属于交易异常的真实值;训练向量构造单元220,用于基于所述被标注为正常交易的多次训练交易数据,生成训练正常交易特征向量;训练全局语义理解单元230,用于将所述训练待检测交易数据中的多个数据项通过所述包含嵌入层的上下文编码器以得到多个训练交易上下文语义特征向量;训练级联单元240,用于将所述多个训练交易上下文语义特征向量进行级联以得到训练第一尺度交易语义特征向量;训练混合卷积单元
250,用于将所述多个训练交易上下文语义特征向量进行二维排列为训练交易上下文语义特征矩阵后通过所述包含多个混合卷积层的卷积神经网络模型以得到训练第二尺度交易语义特征向量;训练融合单元260,用于融合所述训练第一尺度交易语义特征向量和所述训练第二尺度交易语义特征向量以得到训练待检测交易特征向量;训练关联单元270,用于计算所述训练待检测交易特征向量与所述训练正常交易特征向量之间的转移矩阵作为训练分类特征矩阵;分类损失函数值生成单元280,用于将所述训练分类特征矩阵通过所述分类器以得到分类损失函数值;以及,训练单元290,用于基于所述分类损失函数值并通过梯度下降的方向传播来对所述包含嵌入层的上下文编码器、所述包含多个混合卷积层的卷积神经网络模型和所述分类器进行训练,其中,在所述训练的每一轮迭代中,基于远程迁移矩阵和惩罚向量对所述训练分类特征矩阵展开后得到的训练分类特征向量进行迭代。
[0109] 这里,本领域技术人员可以理解,上述基于交易模式识别的异常交易检测系统100中的各个单元和模块的具体功能和操作已经在上面参考图1到图4的基于交易模式识别的异常交易检测方法的描述中得到了详细介绍,并因此,将省略其重复描述。
[0110] 如上所述,根据本申请实施例的基于交易模式识别的异常交易检测系统 100可以实现在各种终端设备中,例如用于基于交易模式识别的异常交易检测的服务器等。在一个示例中,根据本申请实施例的基于交易模式识别的异常交易检测系统 100可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该基于交易模式识别的异常交易检测系统100可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该基于交易模式识别的异常交易检测系统 100同样可以是该终端设备的众多硬件模块之一。
[0111] 替换地,在另一示例中,该基于交易模式识别的异常交易检测系统 100与该终端设备也可以是分立的设备,并且该基于交易模式识别的异常交易检测系统 100可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。