会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利库 / 加密货币地址 / 跨链交易异常账户检测方法、装置、电子设备及存储介质

跨链交易异常账户检测方法、装置、电子设备及存储介质

申请号 CN202311340198.3 申请日 2023-10-16 公开(公告)号 CN117541252A 公开(公告)日 2024-02-09
申请人 北京理工大学; 发明人 蒋芃; 林勇; 祝烈煌;
摘要 本申请提供一种跨链交易异常账户检测方法、装置、电子设备及存储介质,所述方法包括:获取跨链交易数据,并对跨链交易数据进行汇总,得到跨链交易数据的正常样本和异常样本;提取跨链交易数据的跨链特征,确定不同跨链特征的相关性,响应于任意两个跨链特征的相关性大于第一阈值,则剔除其中任意一个跨链特征,得到修正正常样本和修正异常样本;根据修正正常样本和修正异常样本,得到跨链异常检测模型;利用跨链异常检测模型,对跨链交易进行异常账户检测。通过对正常样本和异常样本中跨链特征相关性分析,剔除其中相关性较高的任一跨链特征,避免对跨链异常检测模型的训练中过拟合,确保跨链异常检测模型在真实的跨链交易环境中的有效性。
权利要求

1.一种跨链交易异常账户检测方法,其特征在于,包括:获取跨链交易数据,并对所述跨链交易数据进行汇总,得到所述跨链交易数据的正常样本和异常样本;

提取所述跨链交易数据的跨链特征,确定不同所述跨链特征的相关性,响应于任意两个所述跨链特征的相关性大于第一阈值,则剔除其中任意一个所述跨链特征,得到修正正常样本和修正异常样本;

根据所述修正正常样本和所述修正异常样本,得到跨链异常检测模型;

利用所述跨链异常检测模型,对跨链交易进行异常账户检测。

2.根据权利要求1所述的方法,其特征在于,所述确定不同所述跨链特征的相关性,响应于任意两个所述跨链特征的相关性大第一阈值,则剔除其中任意一个所述跨链特征,之后,还包括:响应于当前跨链特征涉及交易金额,则将所述跨链交易的加密货币统一转换成目标货币价值;

剔除所述跨链特征的值为0的跨链特征。

3.根据权利要求1所述的方法,其特征在于,所述跨链交易数据的跨链特征,包括以下中的至少一项:所述跨链交易所有源链账户与目的链账户的跨链交易时间规律;

同一时间内,所述源链账户同时向相同和/或不同的所述目的链账户发起的跨链交易次数;

同一时间内,所述源链账户同时向相同和/或不同目的链账户发起的跨链交易涉及的交易金额总数;

在一定时间周期内,所述源链账户向相同和/或不同的所述目的链账户发起的跨链交易次数;

在一定时间周期内,所述源链账户向相同和/或不同的所述目的链账户发起的跨链交易涉及的交易金额总数;

所述源链账户向所述目的链账户发起的跨链交易的跨链数量。

4.根据权利要求1所述的方法,其特征在于,所述相关性通过以下公式得到:r=Cov(X,Y)/(σX×σY),

其中,r表示所述相关性,X和Y表示任意两个所述跨链特征,Cov(X,Y)表示跨链特征X和跨链特征Y的协方差,σX和σY分别表示跨链特征X和跨链特征Y的标准差。

5.根据权利要求1所述的方法,其特征在于,根据所述修正正常样本和所述修正异常样本,得到跨链异常检测模型,包括:对所述修正异常样本进行过采样,得到扩充的修正异常样本;

基于神经网络,将所述修正正常样本和所述扩充的修正异常样本输入神经网络进行训练,得到所述跨链异常检测模型。

6.根据权利要求1所述的方法,其特征在于,所述正常样本包括第二正常样本,异常样本包括第二异常样本;

所述得到跨链异常检测模型之后,包括:

利用所述第二正常样本和所述第二异常样本输入所述跨链异常检测模型,得到所述跨链异常检测检测模型的精准率和召回率;

根据所述精准率和所述召回率,确定所述跨链异常检测模型的评价值;

根据所述评价值,确定所述跨链异常检测模型的性能;

其中,所述精准率表示为:

所述召回率表示为:

所述TP表示为正样本被正确识别的数量,FP表示为误报的负样本数量,FN表示为漏报的正样本数量;

所述评价值表示为:

7.根据权利要求1所述的方法,其特征在于,利用所述跨链异常检测模型,对跨链交易进行异常账户检测,包括:读取每个所述跨链交易的属性,响应于任一所述跨链交易的任一属性为空,则判定该跨链交易失败;

响应于在一定时间周期内,该跨链交易的源链账户多次跨链交易,且多次跨链交易的任意属性为空,则判定该跨链交易的源链账户异常;

其中,跨链交易的属性至少包括以下任意一项:源链哈希、目的链哈希、源链、目的链、源链地址、目的链地址、交易时间、货币类型、发送数量、接收数量和交易状态。

8.一种跨链交易异常账户检测装置,其特征在于,包括:获取模块,用于获取跨链交易数据,并对所述跨链交易数据进行汇总,得到所述跨链交易数据的正常样本和异常样本;

跨链特征模块,用于提取所述跨链交易数据的跨链特征,确定不同所述跨链特征的相关性,响应于任意两个所述跨链特征的相关性大于第一阈值,则剔除其中任意一个所述跨链特征,得到修正正常样本和修正异常样本;

模型训练模块,用于根据所述修正正常样本和所述修正异常样本,得到跨链异常检测模型;

检测模块,用于利用所述跨链异常检测模型,对跨链交易进行异常账户检测。

9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任意一项所述的方法。

10.一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,其特征在于,所述计算机指令用于使计算机执行如权利要求1至7任意一项所述的方法。

说明书全文

跨链交易异常账户检测方法、装置、电子设备及存储介质

技术领域

[0001] 本申请涉及区块链交易异常检测技术领域,尤其涉及一种跨链交易异常账户检测方法、装置、电子设备及存储介质。

背景技术

[0002] 随着区块链与数字经济、新基建、工业4.0等的不断融合发展,这项重塑生产关系和建立信任机制的技术已经革新了各个行业。区块链技术通过提供一个去中心化和透明的平台来执行安全交易,其广泛使用导致了大量区块链网络的出现,每个网络都有其独特的功能。这些网络独立运行,但缺乏互操作性,对资产转移和信息共享构成了挑战。由于技术、生态和竞争等原因,大多数区块链无法相互连接。这导致了数据、资产、应用程序和用户的碎片化,从而形成了数据孤岛。
[0003] 为了追求更广阔的区块链价值网络体系,跨链技术打破了各链孤岛的壁垒,实现了区块链向外拓展的桥梁和纽带,能够让价值跨过区块链之间的障碍进行直接交互,从而实现不同区块链之间资产传递和价值转移。跨链技术实现了异构区块链之间资产互操作性,实现了异构链之间的互联互通问题,然而,在提供高效、灵活的跨链资产传递和价值转移的同时,跨链交易也引发了新的安全问题,例如利用跨链技术,借助加密货币进行非法资产转移,以及针对跨链技术的攻击,造成资产损失等等,监管的缺乏和资金在网络间转移的便利导致了非法利用跨链技术的问题。
[0004] 然而针对于跨链交易,并没有相关技术手段对其中的异常账户进行监管,从而保护跨链交易安全。

发明内容

[0005] 有鉴于此,本申请的目的在于提出一种克服上述问题或者至少部分地解决上述问题的跨链交易异常账户检测方法、装置、电子设备及存储介质。
[0006] 基于上述目的,本申请的第一方面,提供了一种跨链交易异常账户检测方法,包括:
[0007] 获取跨链交易数据,并对所述跨链交易数据进行汇总,得到所述跨链交易数据的正常样本和异常样本;
[0008] 提取所述跨链交易数据的跨链特征,确定不同所述跨链特征的相关性,响应于任意两个所述跨链特征的相关性大于第一阈值,则剔除其中任意一个所述跨链特征,得到修正正常样本和修正异常样本;
[0009] 根据所述修正正常样本和所述修正异常样本,得到跨链异常检测模型;
[0010] 利用所述跨链异常检测模型,对跨链交易进行异常账户检测。
[0011] 可选的,所述确定不同所述跨链特征的相关性,响应于任意两个所述跨链特征的相关性大第一阈值,则剔除其中任意一个所述跨链特征,之后,还包括:
[0012] 响应于当前跨链特征涉及交易金额,则将所述跨链交易的加密货币统一转换成目标货币价值;
[0013] 剔除所述跨链特征的值为0的跨链特征。
[0014] 可选的,所述跨链交易数据的跨链特征,包括以下中的至少一项:
[0015] 所述跨链交易所有源链账户与目的链账户的跨链交易时间规律;
[0016] 同一时间内,所述源链账户同时向相同和/或不同的所述目的链账户发起的跨链交易次数;
[0017] 同一时间内,所述源链账户同时向相同和/或不同目的链账户发起的跨链交易涉及的交易金额总数;
[0018] 在一定时间周期内,所述源链账户向相同和/或不同的所述目的链账户发起的跨链交易次数;
[0019] 在一定时间周期内,所述源链账户向相同和/或不同的所述目的链账户发起的跨链交易涉及的交易金额总数;
[0020] 所述源链账户向所述目的链账户发起的跨链交易的跨链数量。
[0021] 可选的,所述相关性通过以下公式得到:
[0022] r=Cov(X,Y)/(σX×σY),
[0023] 其中,r表示所述相关性,X和Y表示任意两个所述跨链特征,Cov(X,Y)表示跨链特征X和跨链特征Y的协方差,σX和σY分别表示跨链特征X和跨链特征Y的标准差。
[0024] 可选的,根据所述修正正常样本和所述修正异常样本,得到跨链异常检测模型,包括:
[0025] 对所述修正异常样本进行过采样,得到扩充的修正异常样本;
[0026] 基于神经网络,将所述修正正常样本和所述扩充的修正异常样本输入神经网络进行训练,得到所述跨链异常检测模型。
[0027] 可选的,所述正常样本包括第二正常样本,异常样本包括第二异常样本;
[0028] 所述得到跨链异常检测模型之后,包括:
[0029] 利用所述第二正常样本和所述第二异常样本输入所述跨链异常检测模型,得到所述跨链异常检测检测模型的精准率和召回率;
[0030] 根据所述精准率和所述召回率,确定所述跨链异常检测模型的评价值;
[0031] 根据所述评价值,确定所述跨链异常检测模型的性能;
[0032] 其中,所述精准率表示为:
[0033]
[0034] 所述召回率表示为:
[0035]
[0036] 所述TP表示为正样本被正确识别的数量,FP表示为误报的负样本数量,FN表示为漏报的正样本数量;
[0037] 所述评价值表示为:
[0038]
[0039] 可选的,利用所述跨链异常检测模型,对跨链交易进行异常账户检测,包括:
[0040] 读取每个所述跨链交易的属性,响应于任一所述跨链交易的任一属性为空,则判定该跨链交易失败;
[0041] 响应于在一定时间周期内,该跨链交易的源链账户多次跨链交易,且多次跨链交易的任意属性为空,则判定该跨链交易的源链账户异常;
[0042] 其中,跨链交易的属性至少包括以下任意一项:源链哈希、目的链哈希、源链、目的链、源链地址、目的链地址、交易时间、货币类型、发送数量、接收数量和交易状态。
[0043] 本申请的第二方面,提供了一种跨链交易异常账户检测装置,包括:
[0044] 获取模块,用于获取跨链交易数据,并对所述跨链交易数据进行汇总,得到所述跨链交易数据的正常样本和异常样本;
[0045] 跨链特征模块,用于提取所述跨链交易数据的跨链特征,确定不同所述跨链特征的相关性,响应于任意两个所述跨链特征的相关性大于第一阈值,则剔除其中任意一个所述跨链特征,得到修正正常样本和修正异常样本;
[0046] 模型训练模块,用于根据所述修正正常样本和所述修正异常样本,得到跨链异常检测模型;
[0047] 检测模块,用于利用所述跨链异常检测模型,对跨链交易进行异常账户检测。
[0048] 本申请的第三方面,提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如第一方面所述的方法。
[0049] 本申请的第四方面,提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,其特征在于,所述计算机指令用于使计算机执行如第一方面所述的方法。
[0050] 从上面所述可以看出,本申请提供的跨链交易异常账户检测方法、装置、电子设备及存储介质,通过获取真实环境中的跨链交易数据并对跨链交易数据进行汇总处理,同时对跨链交易数据的跨链特征的相关性进行分析,剔除其中相关性较高的任一跨链特征,避免对跨链异常检测模型的训练中过拟合,导致跨链异常检测模型受到多重共线性的影响,对跨链异常检测模型造成冗余,误导或歪曲跨链异常检测模型的检测结果。最后对跨链异常检测模型进行评价,确保其在真实的跨链交易环境中的有效性,实现对跨链交易的异常账户进行检测。
[0051] 上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

[0052] 为了更清楚地说明本申请或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0053] 图1为本申请实施例的跨链异常账户检测方法流程图;
[0054] 图2为本申请实施例的一段时间内异常地址分布情况示意图;
[0055] 图3为本申请实施例的跨链异常检测模型对第二正常样本检测结果示意图;
[0056] 图4为本申请实施例的跨链异常检测模型检测结果的混淆矩阵示意图;
[0057] 图5为本申请实施例的跨链异常检测模型检测结果的ROC曲线示意图;
[0058] 图6为本申请实施例的跨链异常账户检测装置示意图;
[0059] 图7为本申请实施例的电子设备硬件结构示意图。

具体实施方式

[0060] 为使本申请的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本申请进一步详细说明。
[0061] 需要说明的是,除非另外定义,本申请实施例使用的技术术语或者科学术语应当为本申请所属领域内具有一般技能的人士所理解的通常意义。本申请实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
[0062] 结合上述背景技术部分所述,传统的区块链技术在不同应用场景所用的系统不同,具有不同的运行机制,但是由于区块链的孤立性和封闭性,以及链与链之间的高度异构化,区块链之间的数据流通、价值转移已经成为阻碍区块链技术广泛落地应用的技术瓶颈。为了解决不同链间资产与数据等的跨链操作问题,实现区块链互联互通,跨链技术应运而生。
[0063] 在相关技术中,针对于跨链技术的安全问题,首先需要捕捉足够的条件来描述跨链技术的漏洞和检测真实世界的攻击,之后通过统一的接口将链上的跨链交易或者数据流通事件和链外操作转换为逻辑表示,并将它们提供给分析器,确定是否为跨链交易或数据流通的攻击行为。
[0064] 也就是说,在针对于跨链交易的安全问题中,基本上是针对于对跨链交易的攻击行为进行检测,但是对于非攻击行为的恶意交易,并不具有检测作用,同样也就不具备异常账户的检测功能,那么就无法实现对异常账户的监管,同样有可能造成非法的跨链交易。而同样的,在针对于异常账户的检测,更多的是依靠完成交易之后的举报以及专门针对跨链交易进行调查,无法实现实时对跨链交易的异常账户进行检测的目的。
[0065] 基于此,参考图1所示,本申请提供一种跨链交易异常账户检测方法,包括:
[0066] S101、获取跨链交易数据,并对跨链交易数据进行汇总,得到跨链交易数据的正常样本和异常样本。
[0067] 可以理解的是,在训练本申请的跨链异常检测模型之前,需要得到真实的跨链交易数据,而在对跨链交易数据的获取中,均是通过公开的渠道进行获取,其中并不会涉及用户个人信息的公开。
[0068] 在一些实施例中,通过爬虫或官方API接口,获取跨链交易数据。
[0069] 示例性的,本申请通过爬虫从专门从事跨链桥或多链资产交换平台中公开的跨链交易日志进行爬取,并得到时间跨度从2020年8月17日至2023年4月28日超过550万个交易记录。
[0070] 之后对跨链交易记录进行分析,过滤出总计1310888个跨链交易记录,涉及37万个地址。根据跨链桥或多链资产交换平台公开的报告,其涉及跨链交易的第一场地址包括14个漏洞利用地址和2789个有风险的地址,公开的报告于爬取的跨链交易记录对比,发现抓取的跨链交易记录中有2413个异常地址,接着对每个时间段内存在的异常地址数量进行统计,从而获得异常地址的分布情况,如图2所示,通过分析,选取2021年10月至2022年1月4个月的异常地址作为异常样本,这四个月数据包含了2322个可能存在风险的异常地址和总计425889个跨链交易。同时按照大约1:3的比例选取了6000个随机选取的正常地址作为正常样本。
[0071] 需要说明的是,以上数据仅是为了充分说明实施例,并不对本实施例起到任何限制。
[0072] S102、提取跨链交易数据的跨链特征,确定不同跨链特征的相关性,响应于任意两个跨链特征的相关性大于第一阈值,则剔除其中任意一个跨链特征,得到修正正常样本和修正异常样本。
[0073] 可以理解的是,跨链交易的跨链特征不止一个,针对于正常样本和异常样本之间的跨链特征数量是相同的,但是同一个跨链特征的值相对于正常样本和异常样本来说属于变量,即同一个跨链特征的值在正常样本和异常样本中不一定相同,而跨链特征是用来决定跨链交易是正常交易或是异常交易的重要特征,因此跨链特征作为变量需要进行相关性分析。对于相关性来说,它的取值范围在‑1到1之间,可以反映出两个变量之间的相关程度。如果相关性接近1,表明两个跨链特征之间存在接近完全正向的线性关系;如果接近‑1,则说明存在完全负向的线性关系;如果接近0,则表示两个跨链特征之间没有线性关系。
[0074] 通过对跨链交易数据的统计分析,在正常样本和异常样本中,均包括相应的跨链特征,其中包括时间、金额、跨链数量和交易出入度等跨链特征。在后续进行建模的过程中,如果直接利用正常样本和异常样本输入神经网络模型训练跨链异常检测模型,无论是正常样本还是异常样本,其中的任意两个跨链特征之间的相关性较高,那么这两个跨链特征可能出现过拟合的现象,训练得到的跨链异常检测模型会受到多重共线性的影响。即高度相关的跨链特征可能提供相同的信息,造成冗余,最后训练出来的跨链异常检测模型可能会产生误导的结果。基于此,需要对正常样本和异常样本的跨链特征的相关性进行分析,确定不同跨链特征的相关性,去除两个跨链特征中相关性较高的任意一个跨链特征,得到修正正常样本和修正异常样本。
[0075] 可以理解的是,利用修正正常样本和修正异常样本作为训练集输入神经网络模型进行跨链异常检测模型的训练,去除了相关性比较高的跨链特征,训练得到的跨链异常检测模型消除多重共线性的影响,在进行异常账户的检测过程中,得到的结果准确率更高。
[0076] 可选的,第一阈值可以为0.8。
[0077] S103、根据修正正常样本和修正异常样本,得到跨链异常检测模型。
[0078] 通过修正正常样本和修正异常样本输入到初始模型中,训练得到的跨链异常检测模型,得到的异常检测模型消除了特征相关性高带来的多重线性影响,对于检测结果的输出准确率更高。
[0079] 在此,对初始模型的类型不作具体限定,凡是能够通过输入修正正常样本和修正异常样本训练得到跨链异常检测模型的均可以,例如BERT、XGboost、GPT等,在此不作具体限定。
[0080] 完成对跨链异常检测模型的训练之后,同样需要测试集对其进行测试,以对跨链异常检测模型的性能进行评价,确保跨链异常检测模型的性能满足对于跨链交易中异常账户检测的要求。
[0081] 需要说明的是,跨链异常检测模型是通过预训练得到的。
[0082] S104、利用跨链异常检测模型,对跨链交易进行异常账户检测。
[0083] 在跨链异常检测模型的性能满足对于跨链交易中异常账户的检测要求,将预训练的跨链异常检测模型设置在跨链交易平台中,对跨链交易进行异常账户检测。
[0084] 在一些实施例中,可以将预训练的跨链异常检测模型设置在跨链交易传输的节点上,以实现对跨链交易的检测,也可以将预训练的跨链异常检测模型加载在区块链中注册的每一个交易账户中,在此不对预训练的跨链异常检测模型的设置位置作具体限制。
[0085] 在一些实施例中,步骤S102之后,还包括:
[0086] 响应于当前跨链特征涉及交易金额,则将跨链交易的加密货币统一转换成目标货币价值;
[0087] 剔除跨链特征的值为0的跨链特征。
[0088] 可以理解的是,不同的跨链交易在不同的平台上,或者不同类型的跨链交易使用的加密货币并不相同,而交易金额作为跨链特征中比较重要的特征,针对于不同类型的加密货币转化为目标货币价值,可以有效对跨链交易过程中涉及的交易金额进行计算并评估,进一步确定该跨链交易是否涉及到非法转账交易等。
[0089] 在一些实施例中,目标货币可以是任意一种已知的加密货币,例如以太币等。同样也可以是其他类型的等价数值转化,只要能够明确反映交易金额即可,在此不作具体限定。
[0090] 同时剔除跨链特征的值为0的跨链特征,可以理解的是,同一个跨链特征在正常样本和异常样本中作为变量存在,而正常样本和异常样本均为现实中存在的跨链交易数据,因此,在正常样本和异常样本的跨链特征的值均为0的情况下,可以说明该跨链特征并不是决定跨链交易是否为正常交易的因素,因此,对正常样本和异常样本中跨链特征的值均为0的跨链特征进行剔除。
[0091] 在一些实施例中,跨链交易数据的跨链特征,包括以下中的至少一项:
[0092] 跨链交易所有源链账户与目的链账户的跨链交易时间规律。
[0093] 同一时间内,源链账户同时向相同和/或不同的目的链账户发起的跨链交易次数;
[0094] 同一时间内,源链账户同时向相同和/或不同目的链账户发起的跨链交易涉及的交易金额总数;
[0095] 在一定时间周期内,源链账户向相同和/或不同的目的链账户发起的跨链交易次数;
[0096] 在一定时间周期内,源链账户向相同和/或不同的目的链账户发起的跨链交易涉及的交易金额总数;
[0097] 所述源链账户向所述目的链账户发起的跨链交易的跨链数量。
[0098] 可选的,针对于异常样本中,跨链交易数据的跨链特征可以是:
[0099] 跨链交易所有源链账户与目的链账户长时间无跨链交易,短期之内大量的跨链交易次数或者大额资金跨链交易。
[0100] 同一时间内,源链账户同时向相同和/或不同的目的链账户发起的跨链交易次数达五次以上。
[0101] 同一时间内,源链账户同时向相同和/或不同的目的链账户发起的跨链交易金额达到50000以上。
[0102] 在一个小时内,源链账户向相同和/或不同的目的链账户发起的跨链交易次数达十次以上。
[0103] 在一个小时内,源链账户向相同和/或不同的目的链账户发起的跨链交易涉及的跨链交易金额达到100000以上。
[0104] 源链账户向目的链账户发起的跨链交易的跨链数量不少于五条。
[0105] 在一些实施例中,跨链特征的相关性通过以下公式得到:
[0106] 通过以下公式得到:
[0107] r=Cov(X,Y)/(σX×σY),
[0108] 其中,r表示所述相关性,X和Y表示任意两个所述跨链特征,Cov(X,Y)表示跨链特征X和跨链特征Y的协方差,σX和σY分别表示跨链特征X和跨链特征Y的标准差。
[0109] 通过计算协方差和标准差,我们可以得到任意两个跨链特征作为变量之间的相关系数。对跨链特征进行两两相关性分析时,若是同一个跨链特征的值不止一个,首先计算该跨链特征的平均值作为跨链特征的值,然后在两两对比的过程中,计算两个跨链特征的值的协方差和标准差,以此来计算得到相关性。
[0110] 例如:任意两个跨链特征X和跨链特征Y的相关性,其中X=[80,85,90,75,95],而Y=[70,75,85,60,90]。
[0111] 则跨链特征X的值为meanX=(80+85+90+75+95)/5=85,跨连特征Y的值为meanY=(70+75+85+60+90)/5=76。
[0112] COv(X,Y)=[(80‑85)×(70‑76)+(85‑85)×(75‑76)+(90‑85)×(85‑76)+(75‑85)×(60‑76)+(95‑85)×(90‑76)]/5=75,
[0113] σX≈7.07,
[0114] σY≈10.68,
[0115] r=Cov(X,Y)/(σX×σY)=75/(7.07×10.68)≈1.06。
[0116] 根据上述计算结果,相关性略高于1,这表示数学成绩和物理成绩之间存在较强的正向线性关系,则剔除跨链特征X或跨链特征Y任意一个,保留剩下的一个跨链特征。
[0117] 在一些实施例中,步骤S103包括:
[0118] 对修正异常样本进行过采样,得到扩充的修正异常样本;
[0119] 基于神经网络,将修正正常样本和扩充的修正异常样本输入神经网络进行训练,得到跨链异常检测模型。
[0120] 在上述实施例中,按照大约1:3的比例选取异常样本和正常样本得到修正正常样本和修正异常样本,而以修正正常样本和修正异常样本作为训练集训练得到跨链异常检测模型,本申请实施例在实际训练的过程中,修正异常样本数量少,而修正异常样本的跨链特征更加符合本申请中对于异常账户检测的特征覆盖,其中修正异常样本的跨链特征占比少,利用过采样得到可扩充的修正异常样本,以使修正异常样本的跨链特征与修正正常样本的跨链特征差距减小,实现修正异常样本和修正正常样本的均衡,避免数据不平衡的问题。
[0121] 在一些实施例中,正常样本包括第二正常样本,异常样本包括第二异常样本。可以理解的是,获取得到正常样本和异常样本,通过对正常样本和异常样本的跨链特征的提取,以及所有的跨链特征两两之间的相关性分析,剔除相关性较高的任一跨链特征,得到修正的正常样本和修正的异常样本训练跨链异常检测模型,同样需要对跨链异常检测模型进行评价,以使该跨链异常检测模型在真实跨链交易环境中是有效的。
[0122] 可选的,正常样本可以包括第一正常样本和第二正常样本,对第一正常样本进行上述跨链特征提取,以及跨链特征两两之间的相关性分析,剔除相关性较高的任一跨链特征得到修正正常样本。同理,异常样本可以包括第一异常样本和第二异常样本,对第一异常样本进行上述跨链特征提取,以及跨链特征两两之间的相关性分析,剔除相关性较高的任一跨链特征得到修正异常样本。而第二正常样本和第二异常样本属于真实跨链交易环境中获取的,利用第二正常样本和第二异常样本作为测试集对跨链异常检测模型进行测试,得到评价结果。
[0123] 得到跨链异常检测模型之后,对跨链异常检测模型进行评价,包括:
[0124] 利用第二正常样本和第二异常样本输入跨链异常检测模型,得到跨链异常检测检测模型的精准率和召回率;
[0125] 根据精准率和召回率,确定跨链异常检测模型的评价值;
[0126] 根据评价值,确定跨链异常检测模型的性能;
[0127] 其中,精准率表示为:
[0128]
[0129] 召回率表示为:
[0130]
[0131] TP表示为正样本被正确识别的数量,FP表示为误报的负样本数量,FN表示为漏报的正样本数量;
[0132] 评价值表示为:
[0133]
[0134] 在本申请实施例中,对利用验证集对跨链异常检测模型进行仿真验证。首先了解响应的基础概念包括:
[0135] TP:True Positive,分类器预测结果为正样本,实际也为正样本,即正样本被正确识别的数量。
[0136] FP:False Positive,分类器预测结果为正样本,实际为负样本,即误报的负样本数量。
[0137] TN:True Negative,分类器预测结果为负样本,实际为负样本,即负样本被正确识别的数量。
[0138] FN:False Negative,分类器预测结果为负样本,实际为正样本,即漏报的正样本数量。
[0139] 精确率代表所有被预测为正的样本中实际为正的样本的概率,公式如下:
[0140]
[0141] 召回率代表实际为正的样本中被预测为正样本的概率,公式如下:
[0142]
[0143] 精准率和召回率是此消彼长的关系,即精准率高,则召回率就低,为了精确评价本申请跨链异常检测模型,同事兼顾精准率和召回率,利用评价值作为新的指标,让二者同时达到最高,取一个平衡。评价值表示为:
[0144]
[0145] 可选的,本申请实施例将试验部署在Colab虚拟机上,具体参数配置如下表1所示:
[0146] 配置 详细信息CPU 2Intel(R)Xeon(R)2.2GHz
RAM 12.68GB
存储空间 107.72GB
操作系统 Ubuntu 20.04.5LTS
学习框架 Sklearn
[0147] 表1
[0148] 比较在不同初始模型下训练得到的跨链异常检测模型对于异常账户检测结果,如下表2所示:
[0149]
[0150]
[0151] 表2
[0152] 分析上表所示的实验结果可以看出,本申请实施例在使用XGBoost模型精准率为71%,召回率为87%,评价值为78%,取得了最好的检测结果。
[0153] 可选的,参考图3所示,本申请单独对第二正常样本的分类结果进行检测,图3中,LR为逻辑回归模型,RF为随机森林模型。在精准率、召回率以及评价值三个指标中,同样XGBoost对第二正常样本中的正常账户检测精准率为95%,召回率为87%,评价值为90%。
[0154] 可选的,参考图4所示,本申请通过XGBoost模型的混淆矩阵将最终结果可视化。在混淆矩阵中,每一列表示数据的真实类别,每一行表示XGBoost模型预测的类别。
[0155] 可选的,参考图5所示,本申请由于第二异常样本的数量不均匀,为了避免样本分布对结果产生影响,同样通过ROC曲线对四种模型进行综合比较,ROC曲线是一种图形工具,同样用于表示模型的性能,其中水平表示假阳率,垂直表示真阳率来描述四种在不同阈值下的性能,AUC是ROC曲线下的面积,用来衡量模型的性能。即对四种模型进行评价。AUC值越接近1,分类器性能越好,此外,AUC越高,模型对0~0和1~1的预测效果越好。通过图5可知,本申请实施例采用的XGBoost模型的AUC得分为0.87,性能在所有模型中最好。
[0156] 可以理解的是,图5中LR AUC表示逻辑回归模型AUC,RF AUC表示随机森林模型AUC,XGB AUC表示本申请实施例用的XGBoost模型AUC,SVM AUC表示SVM模型AUC。
[0157] 可选的,本申请实施例中,模型对第二正常样本和第二异常样本的时间测试结果如下表3所示,
[0158]模型 运行时间(秒)
逻辑回归 0.12
随机森林 3.13
XGBoost 1.83
SVM 4.62
[0159] 表3
[0160] 其中,本申请所用的基础模型XGBoost的运算时间为1.83秒,同样在效率上也足够快速。
[0161] 可选的,参考下表4所示,进一步探索跨链特征的在不同维度下的检测结果,通过表4可知,所有的跨链特征都具备,精准率为71%,召回率为87%,评价值为78%,各项指标更佳。
[0162] 需要说明的是,度特征包括出度特征和入度特征,出度特征表示从源链账户发起的多少跨链交易,入度特征表示有多少跨链交易进入目的链账户。
[0163]特征选择 精准率 召回率 评价值
时间+度特征 0.43 0.72 0.54
仅金额相关特征 0.69 0.86 0.76
所有特征 0.71 0.87 0.78
[0164] 表4
[0165] 以上数据仅代表本申请实施例中公开利用XGBoost模型作为初始模型训练得到的跨链异常检测模型的各项检测指标(包括评价值),并不作为对本申请实施例的限制。
[0166] 在一些实施例中,步骤S104,包括:
[0167] 读取每个跨链交易的属性,响应于任一跨链交易的任一属性为空,则判定该跨链交易失败;
[0168] 响应于在一定时间周期内,该跨链交易的源链账户多次发起跨链交易,且多次跨链交易的任意属性为空,则判定该跨链交易的源链账户异常;
[0169] 其中,跨链交易的属性至少包括以下任意一项:源链哈希、目的链哈希、源链、目的链、源链地址、目的链地址、交易时间、货币类型、发送数量、接收数量和交易状态。
[0170] 可以理解的是,针对于跨链交易中的任一属性为空,例如源链哈希值为空,或者交易时间为空,判定跨链交易失败,在一个小时内,跨链交易的源链账户多次跨链交易,且多次跨链交易由于其中某一属性为空导致交易失败,则判定该跨链交易的源链账户异常。
[0171] 跨链交易属性如下表5所示:
[0172]
[0173]
[0174] 表5
[0175] 在一些实施例中,完成对异常账户的检测之后,将检测到的异常账户进行上报,后台根据上报数据对异常账户进行警报标注或者响应的提示标注。
[0176] 需要说明的是,本申请实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本申请实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成所述的方法。
[0177] 需要说明的是,上述对本申请的一些实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于上述实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0178] 基于同一技术构思,与上述任意实施例方法相对应的,本申请还提供了一种跨链交易异常账户检测装置。
[0179] 参考图6,所述跨链交易异常账户检测装置,包括:
[0180] 获取模块601,获取跨链交易数据,跨链交易数据包括正常样本和异常样本;
[0181] 跨链特征模块602,用于提取跨链交易数据的跨链特征,确定不同跨链特征的相关性,响应于任意两个跨链特征的相关性大于第一阈值,则剔除其中任意一个跨链特征;
[0182] 模型训练模块603,用于构建神经网络模型,以正常样本、异常样本以及跨链特征为输入,训练跨链异常检测模型,并对跨链异常检测模型进行评价;
[0183] 检测模块604,用于利用预训练的跨链异常检测模型,对跨链交易进行异常账户检测。
[0184] 为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本申请时可以把各模块的功能在同一个或多个软件和/或硬件中实现。
[0185] 上述实施例的装置用于实现前述任一实施例中相应的跨链交易异常账户检测方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
[0186] 基于同一技术构思,与上述任意实施例方法相对应的,本申请还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上任意一实施例所述的跨链交易异常账户检测方法。
[0187] 图7示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
[0188] 处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
[0189] 存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random Access Memory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
[0190] 输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
[0191] 通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
[0192] 总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
[0193] 需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
[0194] 上述实施例的电子设备用于实现前述任一实施例中相应的跨链交易异常账户检测方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
[0195] 基于同一技术构思,与上述任意实施例方法相对应的,本申请还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行如上任一实施例所述的跨链交易异常账户检测方法。
[0196] 本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD‑ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
[0197] 上述实施例的存储介质存储的计算机指令用于使所述计算机执行如上任一实施例所述的跨链交易异常账户检测方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
[0198] 基于同一发明构思,与上述任意实施例所述的跨链交易异常账户检测方法相对应的,本公开还提供了一种计算机程序产品,其包括计算机程序指令。在一些实施例中,所述计算机程序指令可以由计算机的一个或多个处理器执行以使得所述计算机和/或所述处理器执行所述的跨链交易异常账户检测方法。对应于所述的跨链交易异常账户检测方法各实施例中各步骤对应的执行主体,执行相应步骤的处理器可以是属于相应执行主体的。
[0199] 上述实施例的计算机程序产品用于使所述计算机和/或所述处理器执行如上任一实施例所述的跨链交易异常账户检测方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
[0200] 所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本申请的范围(包括权利要求)被限于这些例子;在本申请的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本申请实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。
[0201] 另外,为简化说明和讨论,并且为了不会使本申请实施例难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本申请实施例难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本申请实施例的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本申请的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本申请实施例。因此,这些描述应被认为是说明性的而不是限制性的。
[0202] 尽管已经结合了本申请的具体实施例对本申请进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
[0203] 本申请实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本申请实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本申请的保护范围之内。