会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利库 / 加密货币地址 / 加密货币交易分析方法和系统

加密货币交易分析方法和系统

申请号 CN202080010561.3 申请日 2020-01-20 公开(公告)号 CN113544727A 公开(公告)日 2021-10-22
申请人 艾斯图文莱博有限公司; 发明人 徐尚德; 尹昶勋; 李承炫;
摘要 本发明涉及一种分析加密货币交易的方法和系统,并且更特别地,涉及一种使用加密货币的属性来分析在过去难以掌握的加密货币的交易流的分析和处理加密货币数据的方法和系统。本发明是一种通过电子装置来分析加密货币交易的方法并且特征在于包括:区块链管理步骤,收集对应于特定加密货币的区块链的分布式分类账信息,并且标准化从分布式分类账信息提取的区块链数据;多类型数据管理步骤,收集与网络上的加密货币交易相关的多类型数据并且使其标准化;图生成步骤,使用标准化的区块链数据构建加密货币网络图,使用标准化的多类型数据构建知识图,并且映射加密货币网络图和知识图以生成基于多层的交易分析知识图;以及图分析步骤,在交易分析知识图中使用待跟踪资金流的第一加密货币地址作为输入地址来搜索交易信息,生成具有作为节点的输入地址和输出地址的资金流图以跟踪资金流,并且使用知识图识别资金流图中包括的每个节点的属性。根据本发明,可以分析加密货币的交易流并且识别交易主题。
权利要求

1.一种通过电子装置分析加密货币交易的方法,所述方法包括:区块链管理步骤,收集对应于特定加密货币的区块链的分布式分类账信息,并且标准化从所述分布式分类账信息提取的区块链数据;

多类型数据管理步骤,收集与网络上的所述加密货币交易相关的多类型数据并且使其标准化;

图生成步骤,使用标准化的区块链数据构建加密货币网络图,使用标准化的多类型数据构建知识图,并且映射所述加密货币网络图和所述知识图以生成基于多层的交易分析知识图;以及

图分析步骤,在所述交易分析知识图中使用待跟踪资金流的加密货币地址作为输入地址来搜索交易信息,并且生成具有作为节点的输入地址和输出地址的资金流图以跟踪资金流。

2.根据权利要求1所述的方法,其中所述区块链管理步骤包括:区块链数据收集步骤,通过运行一个或多个加密货币客户端来收集区块链的分布式分类账信息,

区块链数据分析步骤,使用所述分布式分类账信息对被估计为同一所有者的地址进行分组,以及

区块链数据标准化步骤,根据预设标准标准化包括所述分布式分类账信息的区块链数据和由数据分析模块分析的组信息。

3.根据权利要求2所述的方法,其中所述区块链数据分析步骤包括以下步骤中的至少一项:多输入启发式步骤,使用是否拥有与加密货币地址相对应的私钥,对交易中包括的多个输入地址进行分组,或者将包括同一地址的多个组分组为一组,以及地址改变启发式步骤,通过使用在汇款之后余额返回的地址,对假定为同一所有者的多个地址进行分组。

4.根据权利要求1所述的方法,其中所述多类型数据管理步骤包括:多类型数据收集步骤,收集与所述网络上的所述加密货币交易相关的多类型数据,多类型数据分类步骤,根据交易属性对所述多类型数据进行分类,多类型数据分析步骤,从所述多类型数据中提取加密货币地址、交易信息和用户信息中的至少一个,以及

多类型数据标准化步骤,根据预设标准使提取的信息标准化。

5.根据权利要求1所述的方法,其中所述图生成步骤包括:

通过生成具有从所述标准化的区块链数据提取的第一对象或第一属性的第一节点来构建加密货币网络图的步骤,

通过生成具有从所述标准化的多类型数据提取的第二对象或第二属性的第二节点来构建知识图的步骤,以及

通过映射彼此相对应的所述第一节点和所述第二节点来生成交易分析知识图的步骤。

6.根据权利要求1所述的方法,其中所述图分析步骤包括:

步骤a,在所述交易分析知识图中将待跟踪输出资金流的第一加密货币地址指定为输入节点,并且使用所述输入节点的地址作为输入地址来搜索一条或多条第一交易信息,步骤b,使用所述第一交易信息为每笔交易生成交易节点(Tx)并且将所述输入节点和所述交易节点连接到输入边(TxIn),步骤c,生成与所述第一交易信息中包括的输出地址相对应的输出节点(Addr),并且将所述交易节点和所述输出节点连接到输出边(TxOut),步骤d,标记针对所述输入边和所述输出边转移的数量,并且在对应于输出未消费的交易的所述输出边上标记UTXO标签,以及通过以下方式重复执行步骤a至步骤d的步骤:将所述输出节点指定为输入节点,直到识别出标记有所述UTXO标签的输出边,或者所述第一交易信息中包括的输出地址被确定为先前识别出的地址,从而生成输出资金流图。

7.根据权利要求6所述的方法,其中所述图分析步骤包括以下步骤:计算在第一输出边上标记的数量与在连接到所述第一交易节点的所有输出边上标记的数量之和的比率,作为所述第一输出边的污染率,通过使用连接到所述第一交易节点和输入边的第一输入节点的污染值和所述第一输出边的污染率,计算连接到所述第一输出边的第一输出节点的污染值,以及通过将所述第一输出节点的所述污染值确定为从所述第一加密货币地址接收的资金的百分比的步骤,跟踪输出资金流。

8.根据权利要求1所述的方法,其中所述图分析步骤包括:

步骤a',在所述交易分析知识图中指定待跟踪输入资金流的第二加密货币地址,并且使用所述输出节点的地址作为输出地址来搜索一条或多条第二交易信息,步骤b',使用所述第二交易信息为每笔交易生成交易节点(Tx)并且将所述输出节点和所述交易节点连接到输出边(TxOut),步骤c',生成对应于所述第二交易信息中包括的输入地址的输入节点(Addr'),并且将所述交易节点(Tx)和所述输入节点连接到输入边(TxIn),步骤d',标记针对所述输入边和所述输出边转移的数量,以及通过以下方式重复执行步骤a'至步骤d'的步骤:将所述输入节点指定为输出节点,直到确定所述第二交易信息中包括的所述输入地址为先前识别出的地址,从而生成输入资金流图。

9.根据权利要求8所述的方法,其中所述图分析步骤通过以下步骤跟踪输入资金流:计算在第二输入边上标记的数量与在连接到第二交易节点的所有输入边上标记的数量之和的比率,作为所述第二输入边的污染率,通过使用连接到所述第二交易节点和输出边的第二输出节点的污染值和所述第二输入边的污染率,计算连接到所述第二输入边的第二输入节点的污染值,以及将所述第二输入节点的所述污染值确定为流入所述第二加密货币地址的资金的比率。

10.根据权利要求6所述的方法,其中所述图分析步骤进一步包括以下步骤:当生成任何第二输出节点时,查询所述第二输出节点的所有权信息以识别所述第二输出节点的地址的所有者,并且在所述第二输出节点上标记地址所有者,并且当所述地址所有者为预存储服务列表中包括的服务中的一个时,暂停交易信息搜索。

11.一种加密货币交易分析系统,所述系统包括:区块链管理单元,用于收集对应于特定加密货币的区块链的分布式分类账信息,并且标准化从所述分布式分类账信息提取的区块链数据;

多类型数据管理单元,用于收集与网络上的所述加密货币交易相关的多类型数据并且使其标准化;

图生成单元,用于使用标准化的区块链数据构建加密货币网络图,使用标准化的多类型数据构建知识图,并且映射所述加密货币网络图和所述知识图以生成基于多层的交易分析知识图;以及

图分析单元,用于在所述交易分析知识图中使用待跟踪资金流的加密货币地址作为输入地址来搜索交易信息,生成具有作为节点的输入地址和输出地址的资金流图以跟踪资金流,并且使用所述知识图来识别所述资金流图中包括的每个节点的属性。

12.根据权利要求11所述的系统,其中所述区块链管理单元包括:区块链数据收集模块,用于通过运行一个或多个加密货币客户端来收集区块链的分布式分类账信息,

区块链数据分析模块,用于对所述分布式分类账信息中包括的加密货币地址进行分组,以估计所述加密货币地址的所有者,以及区块链数据标准化模块,用于根据预设标准而标准化包括所述分布式分类账信息的区块链数据和由所述数据分析模块分析的加密货币地址组信息。

13.根据权利要求12所述的系统,其中所述区块链数据标准化模块使用多输入启发式算法和地址改变启发式算法中的至少一种对所述加密货币地址进行分组,所述多输入启发式算法使用是否拥有对应于加密货币地址的私钥而对一笔交易中包括的多个输入地址进行分组或将包括同一地址的多个组分组为一组,所述地址改变启发式算法通过使用在汇款之后余额返回的地址来对假定为同一所有者的多个地址进行分组。

14.根据权利要求11所述的系统,其中所述多类型数据管理单元包括:多类型数据收集模块,用于收集与所述网络上的所述加密货币交易相关的多类型数据,

多类型数据分类模块,用于根据交易属性或数据源对所述多类型数据进行分类,多类型数据分析模块,用于从所述多类型数据提取加密货币地址、交易信息、内容类型和用户信息中的至少一个,以及多类型数据标准化模块,用于根据预设标准来使提取的信息标准化。

15.根据权利要求11所述的系统,其中所述图生成单元包括:

用于通过生成具有从标准化的区块链数据提取的第一对象或第一属性的第一节点来构建加密货币网络图的模块,

用于通过生成具有从标准化的多类型数据提取的第二对象或第二属性的第二节点来构建知识图的模块,以及

用于通过映射彼此相对应的所述第一节点和所述第二节点来生成交易分析知识图的模块。

16.一种加密货币交易分析应用程序,存储在计算机可读介质中,用于运行根据权利要求1至10所述的方法中的任何一种。

说明书全文

加密货币交易分析方法和系统

技术领域

[0001] 本发明涉及一种用于分析加密货币交易的方法和系统,更具体地,涉及一种使用加密货币的属性来分析和处理加密货币数据的方法和系统,以允许分析在过去难以掌握的
加密货币的交易流。

背景技术

[0002] 加密货币是一种旨在充当交换手段的数字资产,并且是指通过区块链技术加密、分发和发行并可以在某个网络中用作货币的电子信息。加密货币不由中央银行发行,是货
币价值基于区块链技术而数字化显示的电子信息,在互联网上以P2P方式分发和存储,并且
被操作和管理。发行和管理加密货币的核心技术是区块链技术。区块链是一连串不断增加
的记录(区块),并且区块使用加密方式连接以确保安全性。每个区块一般包括前一个区块
的加密哈希(cryptographic hash)、时间戳和交易数据。区块链是一种开放的去中心化分
类账,其从一开始就拒绝修改数据,并且可以有效且永久地证明双方之间的交易。因此,加
密货币实现基于防篡改保护的透明操作。
[0003] 另外,与现有货币不同,加密货币具有匿名性,因此除了提供方和接收方之外的第三方根本无法知道交易细节。由于账户的匿名性,因此难以跟踪交易流(不可跟踪),并且尽
管诸如汇款记录、收款记录的所有记录都是公开的,但是交易的主题是未知的(假名性)。
[0004] 由于上述自由和透明度,加密货币被视为现有关键货币的替代,并且预计将以相较于现有货币更低的费用和简单的汇款程序有效地用于国际交易。然而,由于匿名性,加密
货币有时作为犯罪手段被滥用,例如用于非法交易。
[0005] 因此,当加密货币用作犯罪手段时,或者当必需识别交易的主题时,需要一种用于抓取和分析的方法。

发明内容

[0006] 技术问题
[0007] 本发明的目标是解决上述问题,并且本发明的目标是提供一种用于分析加密货币交易并且识别交易主题的方法。
[0008] 另外,本发明的另一个目标是通过检测使用加密货币的非法交易和学习交易模式而最小化加密货币作为支持非法活动的工具的使用。
[0009] 问题的解决方案
[0010] 为了实现这样的目标,本发明涉及一种通过电子装置来分析加密货币交易的方法,该方法的特征在于包括:区块链管理步骤,收集与特定加密货币相对应的区块链的分布
式分类账信息,并且使从分布式分类账信息提取的区块链数据标准化;多类型数据管理步
骤,收集与网络上的加密货币交易相关的多类型数据并且使其标准化;图生成步骤,使用经
标准化的区块链数据构建加密货币网络图,使用标准化的多类型数据构建知识图,并且映
射加密货币网络图和知识图以生成基于多层的交易分析知识图;以及图分析步骤,在交易
分析知识图中使用待跟踪资金流的第一加密货币地址作为输入地址来搜索交易信息,生成
具有作为节点的输入地址和输出地址的资金流图以跟踪资金流,并且使用知识图识别资金
流图中包括的每个节点的属性。根据本发明,可以分析加密货币的交易流并且识别交易主
题。
[0011] 另外,本发明是一种加密货币交易分析系统,该系统的特征在于包括:区块链管理单元,用于收集与特定加密货币相对应的区块链的分布式分类账信息,并且使从分布式分
类账信息中提取的区块链数据标准化;多类型数据管理单元,用于收集与网络上的加密货
币交易相关的多类型数据并且使其标准化;图生成单元,用于使用标准化的区块链数据构
建加密货币网络图,使用标准化的多类型数据构建知识图,并且映射加密货币网络图和知
识图以生成基于多层的交易分析知识图;以及图分析单元,用于在所述交易分析知识图中
使用待跟踪资金流的第一加密货币地址作为输入地址来搜索交易信息,生成具有作为节点
的输入地址和输出地址的资金流图以跟踪资金流,并且使用知识图识别资金流图中包括的
每个节点的属性。
[0012] 发明的有利效果
[0013] 根据上述发明,可以分析加密货币交易并且识别交易主题。
[0014] 另外,可以通过检测使用加密货币的非法交易和学习交易模式而最小化加密货币作为支持非法活动的工具使用。

附图说明

[0015] 图1是根据本发明的实施例的描述加密货币交易分析系统的示图。
[0016] 图2是根据本发明的实施例的描述加密货币交易分析方法的流程图。
[0017] 图3是根据本发明的实施例的描述区块链管理方法的流程图。
[0018] 图4是根据本发明的实施例的描述多类型数据管理方法的流程图。
[0019] 图5是根据本发明的实施例的描述图生成方法的流程图。
[0020] 图6是根据本发明的实施例的描述输出资金流图生成方法的流程图。
[0021] 图7是根据本发明的实施例的描述输入资金流图生成方法的流程图。
[0022] 图8是根据本发明的实施例的描述输出资金流分析方法的流程图。
[0023] 图9是根据本发明的实施例的描述输入资金流分析方法的流程图。
[0024] 图10是根据本发明的实施例的描述交易分析知识图的示图。
[0025] 图11是根据本发明的实施例的描述资金流图的示图。
[0026] 图12是根据本发明的实施例的描述资金流分析方法的示图。

具体实施方式

[0027] 稍后将参照附图详细描述上述目标、特征和优点,因此,本发明所属技术领域的普通技术人员将能够容易地实现本发明的技术构思。在描述本发明时,当确定与本发明相关
的已知技术的详细描述可能不必要地模糊本发明的主题时,将省略详细描述。在下文中,将
参照附图详细描述本发明的优选实施例。在附图中,相同的附图标记用于标示相同或相似
的元件,并且说明书和权利要求书中描述的所有组合都可以以任何方式组合。进一步,除非
另有说明,将要理解的是,对单数的引用可以包括一个或多个,并且对单数表达的引用可以
包括复数表达。
[0028] 在本说明书中,“知识图”可以理解为使用图实现的知识库。知识库是一种通过将人脑转换为数据库而从大规模数据中获得有意义信息的技术。知识可以使用规则、语义网
络和框架来表达,并且可以使用逻辑或图来表达。在使用图实现知识库的情况下,图包括节
点和边,节点限定具有关于各种主题的信息的“对象”,而边限定对象之间的相关性。通过构
建基于图的知识库,可以将人类难以记忆的大规模数据转换为数据库,从而允许通过机器
来发现隐藏的含义。
[0029] 在本说明书中,“多类型数据”是指从暗网、服务网、SNS等收集的数据,并且是指可以在网络页面上收集到的所有类型的内容,并且方法包括网络爬取(web crawling)、网络
抓取(web scraping)等,但不受特定方法限制。在本说明书中,多类型数据可以理解为是指
与上述对象(其可以是人或产品)相关的所有各种类型的数据。例如,在对象是特定的人A的
情况下,当从网页或应用程序中收集了关于A的用户信息,在多类型数据中可以包括以下信
息:诸如A的性别、年龄、ID、姓名、爱好,A喜欢的文本或对象的类型,A所属的组,A的好友列
表,A的位置,A的地址,A的住处、最喜欢的区域,A最喜欢的商店或产品信息,在特定网站或
社交媒体上注册会员的日期,最近的活动历史和写作时间时,或者写了A交易B项目的条款
时,交易对象B的类型、数量和细节,A想要交易B的时间,交易方式,B的名称,图片,交易的价
格(报价),可议付可用性,账户信息(包括加密货币地址),关于用户查询交易信息的信息。
多类型数据用于构建知识图,并且可以是区别于本发明中的用于构建加密货币网络图的
“区块链数据”(从区块链的分布式分类账信息中提取的数据)的概念。换言之,多类型数据
包括仅利用分布式分类账或交换记录难以抓取的信息。
[0030] 本说明书的区块链数据是可以识别加密货币交易的数据,并且可以包括交易特征,诸如分布式分类账中记录的前一个区块的信息、注册时间戳和前一次交易的哈希值
(hash value)。根据本发明,可以使用区块链数据创建加密货币网络图,并且当使用加密货
币网络图时,可以跟踪加密货币交易的路径。
[0031] 使用多类型数据创建的知识图和使用区块链数据创建的加密货币网络图可以构成不同的层,并且在多个层中常见的对象(节点)可以垂直连接(映射)以生成基于多层的交
易分析知识图。当使用根据本发明的基于多层的交易分析知识图时,可以更快地识别交易
主题并且快速识别关于交易主题所属组织的信息。另外,本发明与现有技术的区别效果在
于,可以快速抓取与交易主题和对象相关的信息而无需基于交易信息来搜索、查询、分析或
检查额外的信息。
[0032] 图1是根据本发明的实施例的示出加密货币交易分析系统的示图。参照图1,根据本发明的实施例的加密货币交易分析系统100可以包括用户接口单元105、区块链管理单元
110、多类型数据管理单元130、图生成单元150、图分析单元170和存储单元190。
[0033] 用户接口单元105可以包括图形用户接口(GUI)、用户定义的应用编程接口(API),它们提供对加密货币网络图和基于多类型数据的知识图的搜索和分析结果。从区块链数据
和多类型数据中提取的对象具有一个或多个特性,并且基于图的GUI提供对象之间的关系
和特性并且可以为每个对象提供额外的分析选择单和分析方法。
[0034] 用户接口单元105可以向用户定义的应用程序提供用于系统环境设置、图构建和增强、图搜索、图分析和图动态报警设置的API,通过API从用户30接收设置信息和查询,将
接收到的设置信息和查询应用于交易分析,并且提供交易分析结果。
[0035] 关于系统环境设置,用户接口单元105可以向应用程序提供API,用于接收待由数据收集模块113、131收集或排除以构建图的诸如列表和/或范围的收集数据范围设置信息,
诸如动态数据分析模块115、135的实时数据分析设置信息的数据分析激活设置信息,用于
存储库的全局环境设置,用于构建知识图的关系定义模式,以及系统操作所必需的其他配
置信息。
[0036] 关于知识图的构建和增强,用户接口单元105可以向应用程序提供API,用于从用户30接收诸如域名的用于数据收集的种子信息、用于分析结果的标签信息、诸如改变知识
图配置请求的分析信息输入、以及可以增强知识图的其它信息。
[0037] 关于知识图搜索,用户接口单元105可以向应用程序提供诸如全文搜索、基于相似性的搜索和子集搜索的用于搜索知识图对象和特性的API。
[0038] 关于知识图分析,用户接口单元105可以向应用程序提供如下的API:基于图算法和内部算法而提供关于知识图分析的信息,诸如资金流跟踪和子图相似度分析。
[0039] 关于知识图动态报警设置,用户接口单元105可以向应用程序提供用于知识图的特定情况设置和报警设置API。
[0040] 区块链管理单元110是收集与特定加密货币相对应的区块链的分布式分类账信息并且使从分布式分类账信息提取的区块链数据标准化的配置,并且可以包括区块链数据收
集模块113、区块链数据分析模块115以及区块链数据标准化模块117。
[0041] 区块链数据收集模块113可以运行一个或多个加密货币客户端50以收集关于区块链的分布式分类账的信息。可以根据用户请求决定是否运行加密货币客户端50。当加密货
币客户端50提供API时,区块链数据收集模块113可以从加密货币客户端50的API请求交易
信息,以收集对应于请求的分布式分类账信息。当加密货币客户端50不提供外部API时,区
块链数据收集模块113可以解析由加密货币客户端50管理的区块数据以收集分布式分类账
信息。
[0042] 区块链数据分析模块115是分析分布式分类账信息以获得分布式分类账中未包括的额外信息的模块,并且可以对加密货币地址进行分组以估计分布式分类账信息中包括的
加密货币地址的所有者。
[0043] 在加密货币地址的分组中,可以使用以下算法中的至少一种:多输入启发式算法,基于拥有与用作交易的发送地址的公钥相对应的私钥而对一组发送地址进行分组;以及地
址改变启发式算法,用于通过使用汇款之后余额返回到的地址对被估计为同一所有者的多
个地址进行分组。另外,可以使用用户定义的启发式算法,并且可以通过用户命令来执行地
址过滤和/或地址分组。
[0044] 多输入启发式算法使用可以在一次交易中使用多个输入地址和多个输出地址(或目标地址)的加密货币的交易属性。当单次交易中包括公共地址a、b、c时,a、b和c很可能是
同一所有者的帐户。因此,区块链数据分析模块115可以通过所有者X的地址对a、b和c进行
分组。
[0045] 另外,如果使用多输入启发式算法,当存在包括输入地址a、b、c的交易1和包括输入地址c、d、e的交易2时,可以假设a、b、c、d、e的所有者相同。另外,区块链数据分析模块115
可以将地址a、b、c、d、e分组为所有者X的地址。
[0046] 地址改变启发式算法使用每次进行加密货币交易时新创建地址以取回余额的特点。例如,当在地址a中拥有包括10个比特币的UTXO(unspent transaction output(没有用
完的交易输出))的X将8个比特币转到Y时,为X创建新地址a',并且可以通过a'存放2个比特
币的余额。因此,区块链数据分析模块115可以确定a和a'为同一所有者,并且a和a'可以通
过所有者X的地址进行分组。
[0047] 区块链数据标准化模块117可以根据预设标准而标准化包括分布式分类账信息的区块链数据和由数据分析模块分析的加密货币地址组信息。分布式分类账信息可以包括诸
如区块创建时间、输入/输出量、交易费用的区块内交易信息,诸如前一个块和下一个块、交
易量、费用和输入/输出加密货币地址的加密货币区块数据。因此,标准化的区块链数据可
以包括各种加密货币的分布式分类账信息中包括的加密货币区块数据和区块内交易信息,
并且可以包括加密货币类型和由区块链数据分析模块115分析的加密货币地址组信息。
[0048] 区块链数据标准化模块117可以管理存储单元190中的标准化的区块链数据,并且当接收到外部请求时可以执行传递标准化的区块链数据的功能。另外,可以根据用户请求
来更新区块链数据。
[0049] 多类型数据管理单元130可以包括多类型数据收集模块131、多类型数据分类模块133、多类型数据分析模块135和多类型数据标准化模块137,作为收集与网络上的加密货币
交易相关的多类型数据并且使其标准化的配置。
[0050] 多类型数据收集模块131可以收集与网络上的加密货币交易相关的多类型数据。当需要跟踪非法资金流时,多类型数据收集模块131可以从暗网(dark web)或表层网
(Surface Web)收集数据。暗网是使用匿名路由技术(Tor)隐藏用户身份的网络,并且用于
传播有害广告、诸如毒品交易的非法交易以及各种金融犯罪。由于加密货币被主动用于非
法交易,因此收集进行非法交易的暗网数据以跟踪非法资金流并且识别资金的所有者具有
重要意义。此外,多类型数据收集模块131可以从诸如论坛或社交网络服务(SNS)的深层网
(DeepWeb)收集数据。多类型数据收集模块131可以收集从用户输入的数据作为用于生成知
识图的多类型数据。例如,当用户输入信息“比特币地址A是查尔斯(Charlse)的”时,比特币
地址A和查尔斯(Charlse)可以用于以加密货币地址‑所有者的关系生成知识数据。
[0051] 多类型数据收集模块131可以使用爬虫(crawler)爬取网页。当爬取的网页中存在超链接时,可以通过额外地爬取通过超链接而链接的网页来收集多类型数据。当用户提供
种子信息时,多类型数据收集模块131可以爬取对应于种子信息的网页。种子信息可以包括
域名、URL、标签(hashtag)、关键字等。例如,当用户提供预计使用非法资金的暗网的特定地
址作为种子信息时,多类型数据收集模块131可以通过爬取与上述地址相对应的网页并且
从爬取的数据中提取另一网站的链接来扩展数据语料库。
[0052] 多类型数据分类模块133可以根据交易属性或数据源(域名、URL)对多类型数据进行分类。
[0053] 例如,当所收集的网页包括诸如捐赠请求、知识共享、托管确认、用户标识、产品广告、法律服务提供等内容时,网页中包括的数据可以被分类为合法数据。再例如,多类型数
据分类模块133可以通过经由机器学习来学习网页结构而执行分类。例如,多类型数据分类
模块133可以使用HTML表或者XML结构来学习网页的结构信息,并且可以通过比较新网页的
结构信息来对相似的页面进行分类。
[0054] 多类型数据分析模块135是用于提取网页中存在的加密货币交易信息的模块,并且可以从多类型数据提取加密货币地址、交易信息、内容类型或用户信息中的至少一种。用
户信息可以包括用户ID、用户姓名、写入时间、好友列表、会员注册日期和最近的活动细节。
另外,当用户定义特定数据时,多类型数据分析模块135可以从多类型数据中提取用户定义
的数据。
[0055] 多类型数据标准化模块137可以根据预设标准来标准化从多类型数据分析模块135提取的信息。由于从多类型数据分析模块135提取的信息具有不同的域名、URL、内容等,
因此多类型数据标准化模块137可以执行使所提取的数据标准化的任务,从而可以使用数
据而不管所提取的数据的类别。例如,可以插入从分析模块135提取的信息和额外的元信
息,以按照[数据源、加密货币类型、类别]的顺序执行标准化。
[0056] 图生成单元150具有使用标准化的区块链数据构建加密货币网络图、使用标准化的多模型数据构建知识图、将加密货币网络图映射到知识图以生成基于多层的交易分析知
识图的配置,并且可以包括加密货币网络图生成模块151、知识图生成模块153和交易分析
知识图生成模块155。
[0057] 加密货币网络图生成模块151可以创建具有从标准化的区块链数据提取的第一对象或第一属性的第一节点,并且使用每个节点边构建加密货币网络图。例如,可以创建诸如
加密货币输入地址(对象节点)‑转移数量(边)>交易节点‑转移数量(边)>加密货币输出地
址(对象节点)的网络图,或者诸如反映组信息的所有者X(对象节点)‑转移数量(边)>交易
节点‑转移数量(边)>勒索软件(财产节点)的网络图。在上述描述中,“>”指示方向,并且根
据本发明的实施例的边可以具有方向。
[0058] 根据分类的类别,加密货币网络图可以显示在一层或多层上。参照图10,当根据加密货币的类型对层进行分类时,比特币(bitcoin)数据可以显示在层#1(210a)中并且以太
坊(Ethereum)数据可以显示在层#n(210b)中。另外,根据用户定义的分类标准,加密货币网
络图可以显示在多层上。
[0059] 知识图生成模块153可以生成具有从标准化的多类型数据提取的第二对象或第二属性的第二节点,并且使用每个节点边构建知识图。例如,知识图生成模块153可以使用从
网页提取的配置文件数据生成诸如用户ID(对象节点)‑拥有的(边)>加密货币地址(对象节
点)的节点和边,并且使用从网页提取的销售数据来构建诸如加密货币地址(对象节点)‑存
放(边)>产品(对象节点)的节点和边,以构建知识图。知识图可以如加密货币网络图一样显
示在一层或多层(230a和230b)上,因此可以具有多层结构。每层的知识图可以属于不同的
类别。
[0060] 交易分析知识图生成模块155可以通过映射彼此相对应的第一节点和第二节点来生成交易分析知识图。例如,假设加密货币网络图210的层#1(210a)中包括的节点(A)对应
于地址a,节点(B)对应于地址b,这两个地址属于同一组,并且知识图的层#1(230a)中包括
的节点(C)是加密货币地址b。由于节点(B)和节点(C)包括相同的信息,因此节点可以彼此
映射(见图8)。也就是说,交易分析知识图200可以具有加密货币网络图210和知识图230的
节点彼此映射的多层结构。因此,当使用交易分析知识图200时,可以通过知识图230的成分
来解释加密货币网络图210的成分。例如,当节点(C)通过所有者边而连接到指示用户ID的
节点(D)时,可以确定地址a、b的所有者是具有对应于节点(D)的用户ID的人。
[0061] 图分析单元170可以包括分析交易分析知识图的图分析模块171和分析资金交易相似度的相似度分析模块173。
[0062] 图分析模块171可以分析用于加密货币交易分析的交易分析知识图200。例如,搜索作为输入地址的在交易分析知识图中使用加密货币地址以跟踪资金流的交易信息,生成
以输入地址和输出地址作为节点的资金流图以跟踪资金流,可以使用知识图识别资金流图
中包括的每个节点的属性。
[0063] 此外,图分析模块171可以基于图算法而在交易分析知识图中跟踪加密货币交易的主要节点。例如,通过中心性分析,可以提取资金流的中心节点,或者可以提取与特定产
品的资金流的细节相关的节点。可选地,可以通过路径分析来分析对象之间的资金交易的
相关性。
[0064] 另外,图分析模块171可以基于污染分析技术来跟踪加密货币的资金流,稍后将参照图6至图7以及图9至图10对此进行描述。
[0065] 相似性分析模块173可以基于知识图来获得资金交易模式。例如,当特定用户A在加密货币交易站点B上频繁执行毒品交易时,由于知识图中将会存在多个特定用户‑毒品交
易‑加密货币交易站点的节点和边,因此相似度分析模块173可以将上述内容定义为知识图
中的一个模式。
[0066] 相似度分析模块173可以使用机器学习来学习资金交易模式,并且可以获得相似的模式。例如,可以通过学习节点的输入/输出级别(等级)、边的序列、数量以及相应对象的
其他对象和属性来执行模式学习。另外,相似度分析模块173可以动态地获得模式,从而当
出现可疑的资金交易模式时生成警报并且向用户提供警报。
[0067] 存储单元190可以存储标准化的区块链数据、标准化的多类型数据、由图生成单元150生成的加密货币网络图、知识图、交易分析知识图等。加密货币交易分析系统100中可以
包括存储单元190,或者存储单元190可以是构建在加密货币交易分析系统100外部的数据
库。
[0068] 在下文中,将参照图2至图10描述根据本发明的实施例的分析加密货币交易的方法。
[0069] 图2是示出根据本发明的实施例的分析加密货币交易的方法的流程图。参照图2,电子装置可以以收集对应于特定加密货币的区块链的分布式分类账信息并且标准化从分
布式分类账信息提取的区块链数据的方式管理区块链数据(S100)。随后,电子装置可以通
过收集与网络上的加密货币交易相关的多类型数据并且使其标准化来管理多类型数据
(S300)。电子装置使用标准化的区块链数据构建加密货币网络图,使用标准化的多类型数
据构建知识图,并且映射加密货币网络图和知识图以生成基于多层的交易分析知识图
(S500)。另外,电子装置在交易分析知识图中使用待跟踪的第一加密货币地址作为输入地
址来搜索交易信息,创建以输入地址和输出地址作为节点的资金流图以跟踪资金流,并且
通过使用上述知识图识别资金流图中包括的每个节点的属性而执行图分析(S700)。执行加
密货币交易分析方法的电子装置是包括计算机处理器和有线/无线通信模块的装置,并且
可以通过从用户终端接收设置信息、种子信息和查询并且从加密货币客户端和网络收集必
要的信息来执行加密货币交易分析方法的每个步骤。
[0070] 参照图3,在步骤100中,电子装置运行一个或多个加密货币客户端来收集区块链的分布式分类账信息以收集区块链数据(S130),并且分析区块链数据(例如,使用分布式分
类账信息对被估计为同一所有者的地址进行分类)(S150)。在步骤150中,电子装置可以通
过使用多输入启发式算法对交易中包括的多个输入地址进行分组或将包括同一地址的多
个组分组为一个组,该多输入启发式算法使用该地址是否拥有与用作交易的传输地址的加
密货币地址相对应的私钥而对一组传输地址进行分组。此外,使用地址改变启发式算法,可
以使用在汇款之后接收余额的地址对假定为同一所有者的多个地址进行分组。
[0071] 随后,电子装置可以根据预设标准而标准化包括分布式分类账信息的区块链数据和由数据分析模块分析的组信息(S170)。
[0072] 参照图4,在步骤300中,电子装置可以在网上收集与加密货币交易相关的多类型数据(S310),根据交易属性将多类型数据分类(S330),并且通过从多类型数据提取加密货
币地址、交易信息或用户信息中的至少一个来分析多类型数据(S350)。另外,可以根据预设
标准来使提取的信息标准化(S370)。
[0073] 参照图5,在步骤500中,电子装置可以创建具有从标准化的区块链数据提取的第一对象或第一属性的第一节点,通过连接节点与边之间的关系来构建加密货币网络图
(S530),生成具有从标准化的多类型数据提取的第二对象或第二属性的第二节点,并且通
过连接节点与边之间的关系来构建知识图(S550)。电子装置可以通过映射在加密货币网络
图和知识图中彼此相对应的第一节点和第二节点来生成交易分析知识图(S570)。
[0074] 将参照图6至图8更详细地描述步骤700。图6是用于更详细地描述步骤700中的生成资金流图的步骤的流程图。当电子装置需要跟踪从第一加密货币地址流出的资金流时,
电子装置以如下方式生成输出资金流图。
[0075] 参照图6,在步骤a中,电子装置首先将在交易分析知识图中待跟踪资金的第一加密货币地址指定为输入节点,并且将输入节点的地址用作输入地址来搜索一条或多条第一
交易信息(S713)。随后,电子装置生成交易节点、输出节点和边(S715)。步骤715包括步骤b
和步骤c。步骤b是使用第一交易信息为每笔交易生成交易节点(TX)并且将输入节点和交易
节点连接到输入边(TxIn)的步骤,而步骤c是生成对应于第一交易信息中包括的输出地址
的输出节点(Addr)并且将交易节点和输出节点连接到输出边(TxOut)的步骤。随后,在步骤
d中,电子装置可以标记针对输入边和输出边传输的数量,并且在对应于没有消费输出的交
易的输出边上标记UTXO标签(S717)。当完成传输数量和标签的标记时,电子装置验证UTXO
标签是否标记在输出边上,并且将输出节点指定为未标记UTXO标签的输出边的输入节点,
从而重复执行步骤713至步骤717。当确定UTXO标签标记在输出边上,或者第一交易信息中
包括的输出地址是先前识别的地址时,电子装置可以终止连接到相应边的输出节点的图生
成。
[0076] 图11中示出了生成资金流图的方法的示例。图11为用于跟踪来自非法比特币地址500的资金流的图,并且根据本发明的实施例的资金流图是待跟踪资金流的第一加密货币
地址是根节点的面向根的图。当试图跟踪从非法比特币地址流出的资金流时,首先将非法
比特币地址指定为输入节点(根节点),并且搜索根节点500的地址用为输入地址的一条或
多条交易信息。然后,电子装置为每笔交易生成交易节点(TX),并且将根节点处的交易节点
(TX)连接到输入边(TxIn)。随后,生成输出地址的输出节点(Addr),并且使用指向输出节点
的输出边(TxOut)连接交易节点(TX)和输出节点(Addr)。使用以对应于生成的输出节点中
的每一个的输出地址作为输入地址的后续交易,生成资金流图。后续交易是指将当前交易
的输出(TxOut)作为下一笔交易的输入(TxIn)消费的交易。如图11所示,即使当存在以addr 
k作为输入的两笔交易(TX E和TX F)时,图分析模块171也跟踪TX E作为下一笔交易,从而
分析出从输出边TxOut(b)仅消费了输入边TxIn(e)。交易TX F中处理的比特币来自TxOut
(c),而不是来自非法比特币地址,因此在该资金流跟踪中丢弃该比特币。电子装置的图分
析模块171从非法地址(根节点)开始并且通过不断地将资金接收地址添加到图中来扩展
图。图分析模块171迭代地将交易节点和输出节点添加到图中,直到最后一个输出节点被标
识为具有UTXO标签的TXOut边。另外,当添加新的地址节点到图时,图分析模块171可以找出
加密货币服务公司的加密货币地址并且将该信息标记到相应的地址组(簇)中。当地址为知
名服务提供商所有时,图分析模块171可以将服务名称标记在节点上并且停止搜索下一笔
交易信息。
[0077] 根据本发明的实施例的成为非法资金跟踪的最终目的地的服务提供商的示例包括执行加密货币交换的交易所、钱包服务提供商、诸如扑克和赌场的在线赌博网站、可以出
售或购买非法产品的商店以及清洗加密货币以提高匿名性的公司。
[0078] 在步骤700中,当完成资金流图的生成时,电子装置或图分析模块171可以通过量化资金流来跟踪资金流。资金流跟踪可以通过量化从一个地址转移到另一个地址的加密货
币数量的方法来完成。
[0079] 为了跟踪输出的资金流,电子装置计算在第一输出边上标记的数量与在连接到第一交易节点的所有输出边上标记的数量之和的比率,作为第一输出边的污染率(S731),并
且使用连接到第一交易节点和输入边的第一输入节点的污染值和第一输出边的污染率来
计算连接到第一输出边的第一输出节点的污染值(S733)。根节点的污染值为1。电子装置可
以通过将第一输出节点的污染值确定为从第一加密货币地址接收的资金的比率来识别资
金流(S735)。
[0080] 在跟踪输出的资金流时,污染值是指从待跟踪资金流的第一加密货币地址(初始输入地址)传输到每个目的地地址(输出地址)的加密货币的比率。
[0081] 下面的等式1至3表示根据本发明的实施例的用于量化资金流的方法。
[0082] [等式1]
[0083]
[0084] 等式1示出输入节点的污染值taintb,t。在等式1中, 是包括一组提款交易t和到达目的地加密货币地址b的下一笔交易的第j组交易,交易pt是属于组 的交易中的一个。
另外,outputpt,i是交易pt的输出边i的数量,而outputpt,next是与属于 的下一笔交易中
消费的后续输出边相对应的数量。换言之,将它乘以通过将属于当前交易中的输出的值除
以属于当前交易的所有输出值而获得的比率。另外,它持续跟踪在当前交易中消费的输出
的下一笔交易,并且乘以在属于 的所有交易中计算出的所有输出数量的比率。最后,通
过对每个交易组j的所有乘积值求和,计算从交易t开始的从输入节点a到输出节点b的污染
值。
[0085] [等式2]
[0086]
[0087] 等式2将污染率(ratiot)定义为表示通过将交易t中的输入资金中的一部分除以输入资金的总和而获得的值的归一化函数,以反映从输入地址a到每笔资金提款交易的资
金流比率。对于输入边的地址与输入节点的地址a相同的所有输入边,inputt,i是交易t中输
入边i的数量,并且inputk,i表示针对所有提款交易的交易k的输入边i的数量。为了计算该
比率,将与交易t的输入边相对应的数量总和除以属于所有输出交易T的输入边数量的总
和。
[0088] [等式3]
[0089]
[0090] 等式3是最终污染值taintb的等式。通过将每笔交易t的污染率乘以输入节点的污染值并且增加属于所有输出交易T的交易t的计算值来计算最终污染值taintb。
[0091] 在图12中,公开了待跟踪资金流的非法比特币地址500是根节点的资金流图,以描述计算污染值的方法。当非法资金的数量为10BTC时,资金通过交易节点TX1转移到两个不
同的比特币地址BTC1、BTC2。这里,将20%的非法资金转移到BTC1并且将80%的非法资金转
移到BTC2。由于交易节点TX1的输出边上标记了UTXO标签,因此计算出BTC1的最终污染值,
BTC1的最终污染值为20%。当基于经过交易节点TX2发送到每个输出地址的输出总数量的
比率来计算每个输出节点的最终污染值时,BTC3的最终污染值为16%(0.8*0.2=0.16),而
BTC4和BTC5的最终污染值分别为24%(0.8*0.3=0.24)和40%(0.8*0.5=0.4)。由于针对
BTC1和BTC3的TX1和TX2的输出仍未使用,而BTC4和BTC5由知名比特币服务提供商(即交换
服务)拥有,因此图分析模块171可能不会对下一笔交易进行额外的跟踪。在图10的实施例
中,可以估算出10个非法比特币当中的36%的比特币仍未使用,而64%的比特币已经汇款
到诸如交易所的交换类别中的地址。如此,根据本发明,尽管加密货币是匿名的,但可以确
定非法资金的数量和非法资金流向的地方。
[0092] 作为步骤700的另一示例,参照图7,电子装置可以生成用于跟踪输入资金流的输入资金流图,并且跟踪输入资金流。可以通过颠倒上述输出资金流图生成和输出资金流跟
踪而实现对输入资金流的跟踪。例如,可以通过执行如下步骤而生成输入资金流图:将待跟
踪输入资金流的第二加密货币地址指定为交易分析知识图中的输出节点并且使用输出节
点的地址作为输出地址搜索一条或多条第二交易信息的步骤a'(S723),使用第二交易信息
为每笔交易生成交易节点(Tx)并且将输出节点和交易节点连接到输出边(TxOut)的步骤
b',生成对应于第二交易信息中包括的输入地址的输入节点(Addr')并且将交易节点(Tx)
和输入节点连接到输入边(TxIn)的步骤c'(S725),标记针对输入边和输出边转移的数量的
步骤d'(S727),并且通过将输入节点指定为输出节点来重复执行步骤a'到d'(S729),直到
确定第二交易信息中包括的输入地址为先前识别出的地址。也就是说,输入资金流图的生
成可以被理解为,以待跟踪的节点作为最下层节点地搜索已经将加密货币传输到相应节点
的上层节点的过程。
[0093] 在步骤719和步骤729的情况下,可以设置特定条件以生成资金流图直到满足相应条件。然而,用户可以设置节点创建的深度以生成所需深度的图。
[0094] 在跟踪输入资金流时,参照图9,电子装置可以计算在第二输入边上标记的数量与在连接到第二交易节点的所有输入边上标记的数量之和的比率,作为第二输入边的污染率
(S751),通过使用连接到第二交易节点和输出边的第二输出节点的污染值和第二输入边的
污染率来计算连接到第二输入边的第二输入节点的污染值(S753),并且将第二输入节点的
污染值确定为流入第二加密货币地址的资金的比率(S755)。
[0095] 根据本发明的实施例的设备和方法可以以可以由各种计算机工具运行并且记录在计算机可读介质中的程序指令的形式来实施。计算机可读介质可以包括程序指令、数据
文件、数据结构等中单独的一个或其组合。计算机可读介质上记录的程序指令可以是为本
发明专门设计和配置的,或者可以是计算机软件领域的技术人员已知和可用的。计算机可
读记录介质的示例包括诸如硬盘、软盘和磁带的磁介质,诸如CD‑ROM和DVD的光学介质,诸
如软盘的磁光介质,以及专门配置为存储和运行程序指令的诸如ROM、RAM、闪速存储器等的
硬件装置。另外,上述介质可以是诸如用于传输指定程序命令、数据结构等的信号的光纤或
金属线或包括载波的波导的传输介质。程序指令的示例不仅包括诸如由编译器产生的机器
语言代码,还包括可以由计算机使用解释器运行的高级语言代码等。上述硬件装置可以是
被配置为作为一个或多个软件模块操作以执行本发明的操作,反之亦然。
[0096] 当实施主题相同时,本说明书中省略的一些实施例同样适用。另外,由于对于本发明所属领域的普通技术人员而言,在不脱离本发明的技术构思的情况下,上述本发明能够
进行范围内的各种替换、修改和改变,因此不受上述实施例和附图的限制。