基于区块链的数据自修复方法、装置、介质及电子设备转让专利

申请号 : CN202010104317.5

文献号 : CN111338574B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 曹斌

申请人 : 平安科技(深圳)有限公司

摘要 :

本申请是关于一种基于区块链的数据自修复方法、装置、介质及电子设备,属于区块链技术领域,该方法包括:当发现目标节点的存储数据与账本记录不一致,向其它节点发送数据更新的投票请求;接收其他节点根据所述投票请求返回的投票结果;当返回的投票结果中反对票的比例超过预定阈值,发送数据恢复请求;接收反对票的节点返回的第一数据区别特征,及除反对票的节点之外的节点返回第二数据区别特征;基于节点的预设可靠度、第一数据区别特征及第二数据区别特征确定存储有可更新数据的节点;向存储有可更新数据的节点发送数据同步请求,以同步存储有更新数据的节点的存储数据修复所述目标节点的数据。本申请有效提升分布式系统数据修复的可靠性。

权利要求 :

1.一种基于区块链的数据自修复方法,其特征在于,所述区块链包括记账节点的子网络以及与所述记账节点的子网络连接的扫描修复节点,所述方法由扫描修复节点执行,所述方法包括:当发现目标节点的存储数据与账本记录不一致,向其它节点发送数据更新的投票请求;

接收其它节点根据所述投票请求返回的投票结果,其中,当所述其它节点相应的账本记录与所述目标节点的账本记录一致时,确定所述投票结果为反对票;

当返回的投票结果中反对票的比例超过预定阈值,向所述其它节点发送数据恢复请求,所述数据恢复请求中携带有所述目标节点的存储数据的数据特征;

接收反对票的节点返回的根据所述数据特征计算的第一数据区别特征,及除所述反对票的节点之外的节点返回根据所述数据特征计算的第二数据区别特征;

基于所述反对票的节点的预设可靠度、所述第一数据区别特征及所述第二数据区别特征确定存储有可更新数据的节点;

向所述存储有可更新数据的节点发送数据同步请求,以同步所述存储有可更新数据的节点的存储数据至所述目标节点,修复所述目标节点的数据。

2.根据权利要求1所述的方法,其特征在于,所述基于所述反对票的节点的预设可靠度、所述第一数据区别特征及所述第二数据区别特征确定存储有可更新数据的节点,包括:确定所述反对票的节点中预设可靠度高于第二预定阈值的第一节点;

计算每个所述第二数据区别特征与任一所述第一节点对应的第一数据区别特征的相似度;

将低于预定相似度阈值的所述相似度对应的除所述反对票的节点之外的节点确定为存储有可更新数据的节点。

3.根据权利要求1所述的方法,其特征在于,所述基于所述反对票的节点的预设可靠度、所述第一数据区别特征及所述第二数据区别特征确定存储有可更新数据的节点,包括:确定所述反对票的节点中预设可靠度高于第二预定阈值的第一节点;

计算每个所述第二数据区别特征与所有所述第一节点对应的第一数据区别特征的相似度,得到对应于每个所述第二数据区别特征的多个相似度;

计算对应于每个所述第二数据区别特征的多个相似度的平均值;

将低于预定均值阈值的所述平均值对应的除所述反对票的节点之外的节点确定为存储有可更新数据的节点。

4.根据权利要求1所述的方法,其特征在于,所述目标节点的存储数据的数据特征,包括:根据所述目标节点的账本记录中的数据摘要信息,从所述目标节点的存储数据中提取的关键数据特征。

5.根据权利要求4所述的方法,其特征在于,所述根据所述目标节点的账本记录中的数据摘要信息,从所述目标节点的存储数据中提取的关键数据特征,包括:从所述数据摘要信息中获取预定时间段的摘要信息;

基于所述预定时间段的摘要信息,从所述目标节点的存储数据中提取的关键数据特征。

6.根据权利要求1所述的方法,其特征在于,所述第一数据区别特征,包括:获取所述目标节点的数据特征中每个属性的子特征与所述反对票的节点上的数据特征中相应属性的子特征的差值,得到第一差值集合作为所述第一数据区别特征。

7.根据权利要求1所述的方法,其特征在于,所述第二数据区别特征,包括:获取所述目标节点的数据特征中每个属性的子特征与除所述反对票的节点之外的节点上的数据特征中相应属性的子特征的差值,得到第二差值集合作为所述第二数据区别特征。

8.一种基于区块链的数据自修复装置,其特征在于,所述区块链包括记账节点的子网络以及与所述记账节点的子网络连接的扫描修复节点,所述装置运行在扫描修复节点,所述装置包括:扫描模块,用于当发现目标节点的存储数据与账本记录不一致,向其它节点发送数据更新的投票请求;

第一接收模块,用于接收其它节点根据所述投票请求返回的投票结果,其中,当所述其它节点相应的账本记录与所述目标节点的账本记录一致时,确定所述投票结果为反对票;

请求模块,用于当返回的投票结果中反对票的比例超过预定阈值,向所述其它节点发送数据恢复请求,所述数据恢复请求中携带有所述目标节点的存储数据的数据特征;

第二接收模块,用于接收反对票的节点返回的根据所述数据特征计算的第一数据区别特征,及除所述反对票的节点之外的节点返回根据所述数据特征计算的第二数据区别特征;

确定模块,用于基于所述反对票的节点的预设可靠度、所述第一数据区别特征及所述第二数据区别特征确定存储有可更新数据的节点;

恢复模块,用于向所述存储有可更新数据的节点发送数据同步请求,以同步所述存储有可更新数据的节点的存储数据至所述目标节点,修复所述目标节点的数据。

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1‑7任一项所述的方法。

10.一种电子设备,其特征在于,包括:

处理器;以及

存储器,用于存储所述处理器的计算机程序;其中,所述处理器配置为经由执行所述计算机程序来执行权利要求1‑7任一项所述的方法。

说明书 :

基于区块链的数据自修复方法、装置、介质及电子设备

技术领域

[0001] 本申请涉及区块链技术领域,具体而言,涉及一种基于区块链的数据自修复方法、装置、介质及电子设备。

背景技术

[0002] 在分布式存储中,数据审计一直是个难题,这里的数据审计是指数据的一致性检查。现有技术情景下,数据异常检测和修复有两种方法,一种是主动式,系统对已存储的数据按照一定的顺序(比如先存储或者先扫描等),进行数据扫描核对。在三副本的场景下,会读取三份数据,然后进行比对,若出现数据不一致的情形,会从主节点上拷贝数据到其他节点。主动式的缺点很明显,没有考虑到主节点数据异常的情形,主节点默认是永远正确的(因为数据存储过程是先向主节点写入数据,写入完成后拷贝数据到2个备份节点上,所以一般情况下主节点的数据永远是最新且正确的),但是若主节点所在的硬盘发生了异常,导致某些比特位被改变,那么主节点的数据就是错误的,主动式在这种情景下依然会拷贝数据到副节点,从而导致数据错误。因此,现有技术中,在数据进行修复时,存在数据修复可靠性低的问题。
[0003] 需要说明的是,在上述背景技术部分公开的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

[0004] 本申请的目的在于提供一种基于区块链的数据自修复方案,进而至少在一定程度上有效提升分布式存储中数据的修复可靠性。
[0005] 根据本申请的一个方面,提供一种基于区块链的数据自修复方法,所述区块链包括记账节点的子网络以及与所述记账节点的子网络连接的扫描修复节点,所述方法由扫描修复节点执行,所述方法包括:
[0006] 当发现目标节点的存储数据与账本记录不一致,向其它节点发送数据更新的投票请求;
[0007] 接收其他节点根据所述投票请求返回的投票结果,其中,当所述其它节点相应的账本记录与所述目标节点的账本记录一致时,确定所述投票结果为反对票;
[0008] 当返回的投票结果中反对票的比例超过预定阈值,向所述其他节点发送数据恢复请求,所述数据恢复请求中携带有所述目标节点的存储数据的数据特征;
[0009] 接收反对票的节点返回的根据所述数据特征计算的第一数据区别特征,及除所述反对票的节点之外的节点返回根据所述数据特征计算的第二数据区别特征;
[0010] 基于节点的预设可靠度、所述第一数据区别特征及所述第二数据区别特征确定存储有可更新数据的节点;
[0011] 向所述存储有可更新数据的节点发送数据同步请求,以同步所述存储有更新数据的节点的存储数据修复所述目标节点的数据。
[0012] 在本申请的一种示例性实施例中,所述基于节点的预设可靠度、所述第一数据区别特征及所述第二数据区别特征确定存储有可更新数据的节点,包括:
[0013] 确定所述反对票的节点中预设可靠度高于第二预定阈值的第一节点;
[0014] 计算每个所述第二数据区别特征与任一所述第一节点对应的第一数据区别特征的相似度;
[0015] 将低于预定相似度阈值的所述相似度对应的除所述反对票的节点之外的节点确定为存储有可更新数据的节点。
[0016] 在本申请的一种示例性实施例中,所述基于节点的预设可靠度、所述第一数据区别特征及所述第二数据区别特征确定存储有可更新数据的节点,包括:
[0017] 确定所述反对票的节点中预设可靠度高于第二预定阈值的第一节点;
[0018] 计算每个所述第二数据区别特征与所有所述第一节点对应的第一数据区别特征的相似度,得到对应于每个所述第二数据区别特征的多个相似度;
[0019] 计算对应于每个所述第二数据区别特征的多个相似度的平均值;
[0020] 将低于预定均值阈值的所述平均值对应的除所述反对票的节点之外的节点确定为存储有可更新数据的节点。
[0021] 在本申请的一种示例性实施例中,所述目标节点的存储数据的数据特征,包括:
[0022] 根据所述目标节点的账本记录中的数据摘要信息,从所述目标节点的存储数据中提取的关键数据特征。
[0023] 在本申请的一种示例性实施例中,所述根据所述目标节点的账本记录中的数据摘要信息,从所述目标节点的存储数据中提取的关键数据特征,包括:
[0024] 从所述数据摘要信息中获取预定时间段的摘要信息;
[0025] 基于所述预定时间段的摘要信息,从所述目标节点的存储数据中提取的关键数据特征。
[0026] 在本申请的一种示例性实施例中,所述第一数据区别特征,包括:
[0027] 获取所述目标节点的数据特征中每个属性的子特征与所述反对票的节点上的数据特征中相应属性的子特征的差值,得到第一差值集合作为所述第一数据区别特征。
[0028] 在本申请的一种示例性实施例中,所述第二数据区别特征,包括:
[0029] 获取所述目标节点的数据特征中每个属性的子特征与所述除反对票的节点之外的节点上的数据特征中相应属性的子特征的差值,得到第二差值集合作为所述第二数据区别特征。
[0030] 根据本申请的一个方面,提供一种基于区块链的数据自修复装置,所述区块链包括记账节点的子网络以及与所述记账节点的子网络连接的扫描修复节点,所述装置运行在扫描修复节点,所述装置包括:
[0031] 扫描模块,用于当发现目标节点的存储数据与账本记录不一致,向其它节点发送数据更新的投票请求;
[0032] 第一接收模块,用于接收其他节点根据所述投票请求返回的投票结果,其中,当所述其它节点相应的账本记录与所述目标节点的账本记录一致时,确定所述投票结果为反对票;
[0033] 请求模块,用于当返回的投票结果中反对票的比例超过预定阈值,向所述其他节点发送数据恢复请求,所述数据恢复请求中携带有所述目标节点的存储数据的数据特征;
[0034] 第二接收模块,用于接收反对票的节点返回的根据所述数据特征计算的第一数据区别特征,及除所述反对票的节点之外的节点返回根据所述数据特征计算的第二数据区别特征;
[0035] 确定模块,用于基于节点的预设可靠度、所述第一数据区别特征及所述第二数据区别特征确定存储有可更新数据的节点;
[0036] 恢复模块,用于向所述存储有可更新数据的节点发送数据同步请求,以同步所述存储有更新数据的节点的存储数据修复所述目标节点的数据。
[0037] 根据本申请的一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法。
[0038] 根据本申请的一个方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的计算机程序;其中,所述处理器配置为经由执行所述计算机程序来执行上述任一项所述的方法。
[0039] 本申请一种基于区块链的数据自修复方法及装置,通过应用区块链式分布式存储系统,在扫描到数据异常情况时,通过自动数据更新请求向所有节点进行校验后,确定存储有可更新数据的节点,进行数据自动修复,有效提高了数据修复的可靠性。
[0040] 应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。

附图说明

[0041] 此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0042] 图1示意性示出一种基于区块链的数据自修复方法的流程图。
[0043] 图2示意性示出一种基于区块链的数据自修复方法的应用场景示例图。
[0044] 图3示意性示出一种确定存储有可更新数据的节点的方法流程图。
[0045] 图4示意性示出一种基于区块链的数据自修复装置的方框图。
[0046] 图5示意性示出一种用于实现上述方法的电子设备示例框图。
[0047] 图6示意性示出一种用于实现上述方法的计算机可读存储介质。

具体实施方式

[0048] 现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本申请将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本申请的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本申请的各方面变得模糊。
[0049] 此外,附图仅为本申请的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
[0050] 本示例实施方式中首先提供了基于区块链的数据自修复方法,该基于区块链的数据自修复方法可以运行于服务器,也可以运行于服务器集群或云服务器等,当然,本领域技术人员也可以根据需求在其他平台运行本发明的方法,本示例性实施例中对此不做特殊限定。本示例实施方式中区块链包括记账节点的子网络以及与记账节点的子网络连接的扫描修复节点,该方法由扫描修复节点执行,参考图1所示,该基于区块链的数据自修复方法可以包括以下步骤:
[0051] 步骤S110,当发现目标节点的存储数据与账本记录不一致,向其它节点发送数据更新的投票请求;
[0052] 步骤S120,接收其他节点根据所述投票请求返回的投票结果,其中,当所述其它节点相应的账本记录与所述目标节点的账本记录一致时,确定所述投票结果为反对票;
[0053] 步骤S130,当返回的投票结果中反对票的比例超过预定阈值,向所述其他节点发送数据恢复请求,所述数据恢复请求中携带有所述目标节点的存储数据的数据特征;
[0054] 步骤S140,接收反对票的节点返回的根据所述数据特征计算的第一数据区别特征,及除所述反对票的节点之外的节点返回根据所述数据特征计算的第二数据区别特征;
[0055] 步骤S150,基于节点的预设可靠度、所述第一数据区别特征及所述第二数据区别特征确定存储有可更新数据的节点;
[0056] 步骤S160,向所述存储有可更新数据的节点发送数据同步请求,以同步所述存储有更新数据的节点的存储数据修复所述目标节点的数据。
[0057] 下面,将结合附图对本示例实施方式中上述基于区块链的数据自修复方法中的各步骤进行详细的解释以及说明。
[0058] 在步骤S110中,当发现目标节点的存储数据与账本记录不一致,向其它节点发送数据更新的投票请求。
[0059] 本示例的实施方式中,参考图2所示,扫描修复节点的服务器201定期扫描记账节点的子网络中的记账节点的服务器202上的存储数据,以检测节点的存储数据与账本记录是否一致。这样可以由服务器201主动扫描进行修复各个记账节点的数据。其中,服务器201可以是任何具有处理能力的设备,例如,电脑、微处理器等,在此不做特殊限定。
[0060] 扫描修复节点随机或者一次扫描记账节点子网络中的节点的存储数据的数据摘要信息与账本记录进行比对,当发现其中某个节点的存储数据与账本记录不一致,说明该记账节点,也就是目标节点的数据可能是需要同步到其他节点的数据;但同样可能是目标节点出现异常,导致存储的数据可能存在异常,例如,节点所在的硬盘发生了异常,导致某些比特位被改变,那么主节点的数据就是错误的。此时,向其它节点通过发起数据更新请求,触发其它节点自动验证各自的数据。
[0061] 在步骤S120中,接收其他节点根据所述投票请求返回的投票结果,其中,当所述其它节点相应的账本记录与所述目标节点的账本记录一致时,确定所述投票结果为反对票。
[0062] 本示例的实施方式中,其它节点相应的账本记录与目标节点的账本记录一致时,说明其它节点相应的账本中没有外部变更记录,说明其它节点没有进行过数据更改,进一步证明目标节点的存储数据可能出现异常,此时针对数据更新请求投出反对票,以避免全网络数据更新后出现异常。
[0063] 在步骤S130中,当返回的投票结果中反对票的比例超过预定阈值,向所述其他节点发送数据恢复请求,所述数据恢复请求中携带有所述目标节点的存储数据的数据特征。
[0064] 本示例的实施方式中,反对票的比例超过预定阈值,即投反对票的节点的比例超过预定阈值,说明网络中超过预定阈值的节点没有进行过数据更改,数据更新具有很大的潜在威胁,此时直接确定目标节点的存储数据异常,有效保证全网数据可靠性。预定阈值可以根据存储数据的重要程度设定,越重要该预定阈值越低。然后,向其它节点发送修复目标节点数据的数据恢复请求,可以请求其它节点中的正常数据,自动修复目标节点的存储数据。其中,数据恢复请求中携带有目标节点的存储数据的数据特征,可以使得其它节点自动高效验证两个数据之间的是否具有区别,以及计算区别特征。该数据特征可以是对存储数据进行降维后得到的数据,假设有x1、x2、x3…xn维数据,把数据降到m维,可以根据这n维的历史数据,算出一个与x1…xn相关m维数据,使得这个m维数据对历史数据的关联比达到最大。这样可以保证后续步骤区别特征计算比较的效率。
[0065] 一种实施例中,目标节点的存储数据的数据特征,包括:
[0066] 根据目标节点的账本记录中的数据摘要信息,从目标节点的存储数据中提取的关键数据特征。
[0067] 数据摘要信息是每次存储数据是记录的关键数据属性信息。根据数据摘要信息,可以从目标节点的存储数据中提取到每个属性的特征数据,例如,可以通过对应于不同属性的数据特征提取模型提取数据特征,或者通过关键字爬取的方式爬取关键数据。
[0068] 一种实施例中,根据目标节点的账本记录中的数据摘要信息,从目标节点的存储数据中提取的关键数据特征,包括:
[0069] 从所述数据摘要信息中获取预定时间段的摘要信息;
[0070] 基于预定时间段的摘要信息,从目标节点的存储数据中提取的关键数据特征。
[0071] 预定时间段例如,最近的一段时间。每个节点可能存储了大量的数据,这样可以减少计算量。
[0072] 在步骤S140中,接收反对票的节点返回的根据所述数据特征计算的第一数据区别特征,及除所述反对票的节点之外的节点返回根据所述数据特征计算的第二数据区别特征。
[0073] 本示例的实施方式中,根据目标节点的数据特征计算的第一数据区别特征,是反对票的节点根据自身节点上的数据的数据特征与目标节点的数据特征计算的两者的区别特征(如特征差值或者不同的数据特征),可以表示两者是否具有区别以及区别所在。同理,第二数据区别特征是除所反对票的节点之外的节点根据自身节点上的数据的数据特征与目标节点的数据特征计算的两者的区别特征。
[0074] 这样通过第一数据区别特征和第二数据区别特征可以表示出目标节点的存储数据与其它节点中每个节点的区别,进而基于此判断全网节点的数据情况。
[0075] 一种实施方式中,第一数据区别特征,包括:
[0076] 获取所述目标节点的数据特征中每个属性的子特征与所述反对票的节点上的数据特征中相应属性的子特征的差值,得到第一差值集合作为所述第一数据区别特征。
[0077] 每个属性的子特征可以对应于每个区块,这样可以基于区块链中数据存储特点,得到所有区块的数据特征。通过分别计算每个子特征相应的差值可以有效保证第一数据区别特征的对于数据区别判断的准确性。
[0078] 一种实施方式中,第二数据区别特征,包括:
[0079] 获取所述目标节点的数据特征中每个属性的子特征与所述除反对票的节点之外的节点上的数据特征中相应属性的子特征的差值,得到第二差值集合作为所述第二数据区别特征。
[0080] 每个属性的子特征可以对应于每个区块,这样可以基于区块链中数据存储特点,得到所有区块的数据特征。通过分别计算每个子特征相应的差值可以有效保证第二数据区别特征的对于数据区别判断的准确性。
[0081] 在步骤S150中,基于节点的预设可靠度、所述第一数据区别特征及所述第二数据区别特征确定存储有可更新数据的节点。
[0082] 本示例的实施方式中,节点的预设可靠度是根据每个节点存储数据的稳定程度预先设定的分数,例如,节点磁盘可靠性越高,可靠度越高。可靠度对应于每个节点存储数据的稳定程度。例如,若节点所在的硬盘发生了异常,导致某些比特位被改变,那么主节点的数据就是错误的,主动式在这种情景下依然会拷贝数据到其他节点,从而导致数据错误。通过预设可靠度可以确定其他节点存储数据的可信任程度。例如,当目标节点的预设可靠度高于一可靠度阈值,该阈值最够高,可以直接说明目标节点的数据就是可更新的数据(外部写入的,或者自动写入的数据)。可更新数据就是可以通过更新到区块链网络,实现区块链数据更新至最新的数据,同时保证区块链数据不会出现异常。
[0083] 第一数据区别特征描述每个反对票的节点的数据与目标节点的数据的区别;第二数据区别特征描述除反对票的节点之外节点的数据与目标节点的数据的区别。同时反对票的节点的账本记录与目标节点的账本记录一致,反对票的节点之外的节点的账本记录与目标节点的账本记录不一致。
[0084] 进而,例如,一种实施例中,可以通过第一数据区别特征与第二数据区别特征比较,确定反对票节点与反对票节点之外的节点的相对于目标节点的存储数据是否具有区别。当第一数据区别特征与第二数据区别特征不同,说明反对票节点与反对票节点之外的节点的数据都与目标节点不同,同时,若第二数据区别特征少于预定量时(由于数据特征提取时不同节点的环境带来的影响),且预设可靠度高于第二分数时,说明目标节点的数据为可更新数据。
[0085] 本示例的一种实施方式中,参考图3,基于节点的预设可靠度、所述第一数据区别特征及所述第二数据区别特征确定存储有可更新数据的节点,包括:
[0086] 步骤S310,用于确定所述反对票的节点中预设可靠度高于第二预定阈值的第一节点;
[0087] 步骤S320,用于计算每个所述第二数据区别特征与任一所述第一节点对应的第一数据区别特征的相似度;
[0088] 步骤S330,用于将低于预定相似度阈值的所述相似度对应的除所述反对票的节点之外的节点确定为存储有可更新数据的节点。
[0089] 第二预定阈值是预先设定的可以保证节点存储数据的可靠度足够高的阈值。预定相似度阈值是预先设定的可以避免数据特征提取误差的阈值,例如,避免提取数据特征具有的少许误差,使得相同的数据的数据特征的相似度不是百分之百,而是百分之九十九。
[0090] 计算每个第二数据区别特征与任一第一节点对应的第一数据区别特征的相似度,可以得到每个没有投反对票的节点的数据与大部分账本记录与目标节点一致的反对票节点的数据,相对于目标节点的存储数据的相似度。进而,可以确定出没有投反对票的节点中低于预定相似度阈值的相似度对应的节点,这些节点,存储有需要同步到区块链所有节点的新的数据,例如,某个节点新增了数据,所有账本记录由更新,导致与目标节点的记录不一致,所以没有投反对票。将低于预定相似度阈值的相似度对应的除反对票的节点之外的节点确定为存储有可更新数据的节点,可以在后续步骤中直接将该存储有可更新数据的节点的所有数据一次性同步到目标节点,实现数据修复的同时,完成数据更新。
[0091] 本示例的一种实施方式中,基于节点的预设可靠度、所述第一数据区别特征及所述第二数据区别特征确定存储有可更新数据的节点,包括:
[0092] 确定所述反对票的节点中预设可靠度高于第二预定阈值的第一节点;
[0093] 计算每个所述第二数据区别特征与所有所述第一节点对应的第一数据区别特征的相似度,得到对应于每个所述第二数据区别特征的多个相似度;
[0094] 计算对应于每个所述第二数据区别特征的多个相似度的平均值;
[0095] 将低于预定均值阈值的所述平均值对应的除所述反对票的节点之外的节点确定为存储有可更新数据的节点。
[0096] 计算每个第二数据区别特征与所有第一节点对应的第一数据区别特征的相似度,得到对应于每个第二数据区别特征的多个相似度,然后计算对应于每个第二数据区别特征的多个相似度的平均值,可以避免上述步骤中选取的任一第一节点存在存储的数据也存在异常时,判断不准确的问题。
[0097] 在步骤S160中,向所述存储有可更新数据的节点发送数据同步请求,以同步所述存储有更新数据的节点的存储数据修复所述目标节点的数据。
[0098] 可更新数据就是可以通过更新到区块链网络,实现区块链数据更新至最新的数据,同时保证区块链数据不会出现异常。
[0099] 本申请还提供了一种基于区块链的数据自修复装置。区块链包括记账节点的子网络以及与记账节点的子网络连接的扫描修复节点,该装置运行在扫描修复节点,参考图4所示,该基于区块链的数据自修复装置可以包括扫描模块410、第一接收模块420、请求模块430、第二接收模块440、确定模块450及恢复模块460。其中:
[0100] 扫描模块410,用于当发现目标节点的存储数据与账本记录不一致,向其它节点发送数据更新的投票请求;
[0101] 第一接收模块420,用于接收其他节点根据所述投票请求返回的投票结果,其中,当所述其它节点相应的账本记录与所述目标节点的账本记录一致时,确定所述投票结果为反对票;
[0102] 请求模块430,用于当返回的投票结果中反对票的比例超过预定阈值,向所述其他节点发送数据恢复请求,所述数据恢复请求中携带有所述目标节点的存储数据的数据特征;
[0103] 第二接收模块440,用于接收反对票的节点返回的根据所述数据特征计算的第一数据区别特征,及除所述反对票的节点之外的节点返回根据所述数据特征计算的第二数据区别特征;
[0104] 确定模块440,用于基于节点的预设可靠度、所述第一数据区别特征及所述第二数据区别特征确定存储有可更新数据的节点;
[0105] 恢复模块450,用于向所述存储有可更新数据的节点发送数据同步请求,以同步所述存储有更新数据的节点的存储数据修复所述目标节点的数据。
[0106] 上述基于区块链的数据自修复装置中各模块的具体细节已经在对应的基于区块链的数据自修复方法中进行了详细的描述,因此此处不再赘述。
[0107] 应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
[0108] 此外,尽管在附图中以特定顺序描述了本申请中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
[0109] 通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD‑ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本申请实施方式的方法。
[0110] 在本申请的示例性实施例中,还提供了一种能够实现上述方法的电子设备。
[0111] 所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
[0112] 下面参照图5来描述根据本发明的这种实施方式的电子设备500。图5显示的电子设备500仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
[0113] 如图5所示,电子设备500以通用计算设备的形式表现。电子设备500的组件可以包括但不限于:上述至少一个处理单元510、上述至少一个存储单元520、连接不同系统组件(包括存储单元520和处理单元510)的总线530。
[0114] 其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元510执行,使得所述处理单元510执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元510可以执行如图1中所示的步骤S110:当发现目标节点的存储数据与账本记录不一致,向其它节点发送数据更新的投票请求;S120:接收其他节点根据所述投票请求返回的投票结果,其中,当所述其它节点相应的账本记录与所述目标节点的账本记录一致时,确定所述投票结果为反对票;步骤S130:当返回的投票结果中反对票的比例超过预定阈值,向所述其他节点发送数据恢复请求,所述数据恢复请求中携带有所述目标节点的存储数据的数据特征;步骤S140:接收反对票的节点返回的根据所述数据特征计算的第一数据区别特征,及除所述反对票的节点之外的节点返回根据所述数据特征计算的第二数据区别特征;步骤S150:基于节点的预设可靠度、所述第一数据区别特征及所述第二数据区别特征确定存储有可更新数据的节点;步骤S160:向所述存储有可更新数据的节点发送数据同步请求,以同步所述存储有更新数据的节点的存储数据修复所述目标节点的数据。
[0115] 存储单元520可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)5201和/或高速缓存存储单元5202,还可以进一步包括只读存储单元(ROM)5203。
[0116] 存储单元520还可以包括具有一组(至少一个)程序模块5205的程序/实用工具5204,这样的程序模块5205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
[0117] 总线530可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
[0118] 电子设备500也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得客户能与该电子设备500交互的设备通信,和/或与使得该电子设备500能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口550进行。并且,电子设备500还可以通过网络适配器560与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器560通过总线530与电子设备500的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备500使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
[0119] 通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD‑ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本申请实施方式的方法。
[0120] 在本申请的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。
[0121] 参考图6所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品600,其可以采用便携式紧凑盘只读存储器(CD‑ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0122] 所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD‑ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
[0123] 计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
[0124] 可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
[0125] 可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在客户计算设备上执行、部分地在客户设备上执行、作为一个独立的软件包执行、部分在客户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到客户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
[0126] 此外,上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
[0127] 本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其他实施例。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由权利要求指出。