一种基于自动演练的系统自动修复方法和装置转让专利

申请号 : CN201510671371.7

文献号 : CN105373446B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 李德豪陈伟康邓俊安区灿彬刘开杰李家昆武梦洁

申请人 : 佛山市云端容灾信息技术有限公司

摘要 :

本发明公开了一种基于自动演练的系统自动修复方法和装置,包括以下步骤:A、启动数据备份自动演练,出现报错,获取该错误的特征信息;B、根据获取到的错误的特征信息,查询数据库,寻找解决该错误的解决方法;C、执行解决方法,修复错误,继续执行数据备份自动演练。本发明提供一种基于自动演练技术的系统自动修复方法和装置,该方法和装置智能高效,根据工作人员的系统修复经验,定义成智能的数据库,构建成自动修复机制,使数据容灾演练系统更加智能可靠。

权利要求 :

1.一种基于自动演练的系统自动修复方法,其特征在于,包括以下步骤:A、启动数据备份自动演练,出现报错,获取该错误的特征信息;

B、根据获取到的错误的特征信息,查询数据库,寻找解决该错误的解决方法;

C、执行解决方法,修复错误,继续执行数据备份自动演练;

所述步骤B中,数据库内部存储有与各错误一一对应的方法数据组,所述方法数据组包括错误的特征信息和解决该错误的方法程序信息;所述特征信息包括该错误的号码信息和该错误的情境信息;

所述步骤B和C中,获取到的错误的特征信息与存储在数据库内部的某一方法数据组所包含的错误的特征信息匹配后,执行该方法数据组所包含的方法程序信息,自动修复错误;

所述情境信息中设置多个必然情境信息,在匹配时,需要所有必然情境信息均一一对应;

所述情境信息还包括至少一个偶然情境信息。

2.一种基于自动演练的系统自动修复装置,其特征在于,包括自动演练模块,用于进行数据备份的自动模拟演练;

错误检测模块,与自动演练模块连接,用于时刻检测自动演练模块在自动演练过程中是否发生错误,同时获取该错误的特征信息;

存储模块,用于存储错误的特征信息和解决该错误的方法程序信息;

查询模块,分别与错误检测模块和存储模块连接,用于根据错误检测模块获取到的错误的特征信息,在存储模块中查询,获取解决该错误的方法程序信息;

修复模块,分别与查询模块和存储模块连接,用于运行查询模块查询得到的方法程序信息,解决错误;所述错误的特征信息包括该错误的号码信息和该错误的情境信息;所述错误的情境信息具有多个在匹配时一一对应的必然情境信息以及至少一个偶然情境信息。

说明书 :

一种基于自动演练的系统自动修复方法和装置

技术领域

[0001] 本发明涉及数据系统修复技术,尤其涉及的是一种基于自动演练的系统自动修复方法和装置。

背景技术

[0002] 科技发达,依靠IT(Information Technology)的情况越来越多,特别是大数据流行,重温、重现或参考历史环境数据的需求不断增加,冷备份的演练变得越加重要。在实际应用中,每天演练中遇到问题,绝大部分都是重复的,传统的方法需要人手处理这些重复的问题,耗时费力,工作效率低。
[0003] 专利号为2009101698683的发明专利公开了一种集中管理式备份容灾系统,该专利公开了一种利用实体转虚拟技术,构建虚拟平台并进行数据备份自动演练的方法,基于该方法,本发明提出一种智能高效的系统自动修复方法。

发明内容

[0004] 本发明的目的在于提供一种基于自动演练的系统自动修复方法和装置,在遇到重复的问题时,系统可以自动的进行修复,智能高效。
[0005] 本发明的技术方案如下:一种基于自动演练的系统自动修复方法,其中,包括以下步骤:
[0006] A、启动数据备份自动演练,出现报错,获取该错误的特征信息;
[0007] B、根据获取到的错误的特征信息,查询数据库,寻找解决该错误的解决方法;
[0008] C、执行解决方法,修复错误,继续执行数据备份自动演练;
[0009] 所述步骤B中,数据库内部存储有与各错误一一对应的方法数据组,所述方法数据组包括错误的特征信息和解决该错误的方法程序信息;所述特征信息包括该错误的号码信息和该错误的情境信息;
[0010] 所述步骤B和C中,获取到的错误的特征信息与存储在数据库内部的某一方法数据组所包含的错误的特征信息匹配后,执行该方法数据组所包含的方法程序信息,自动修复错误。
[0011] 所述的基于自动演练的系统自动修复方法,其中,所述情境信息包括至少一个必然情境信息。
[0012] 所述的基于自动演练的系统自动修复方法,其中,所述情境信息还包括至少一个偶然情境信息。
[0013] 一种基于自动演练的系统自动修复装置,其中,包括自动演练模块,用于进行数据备份的自动模拟演练;
[0014] 错误检测模块,与自动演练模块连接,用于时刻检测自动演练模块在自动演练过程中是否发生错误,同时获取该错误的特征信息;
[0015] 存储模块,用于存储错误的特征信息和解决该错误的方法程序信息;
[0016] 查询模块,分别与错误检测模块和存储模块连接,用于根据错误检测模块获取到的错误的特征信息,在存储模块中查询,获取解决该错误的方法程序信息;
[0017] 修复模块,分别与查询模块和存储模块连接,用于运行查询模块查询得到的方法程序信息,解决错误。
[0018] 所述的基于自动演练的系统自动修复装置,其中,所述错误的特征信息包括该错误的号码信息和该错误的情境信息。
[0019] 所述的基于自动演练的系统自动修复装置,其中,所述错误的情境信息包括至少一个必然情境信息。
[0020] 所述的基于自动演练的系统自动修复装置,其中,所述错误的情境信息还包括至少一个偶然情境信息。
[0021] 本发明的有益效果:本发明提供一种基于自动演练技术的系统自动修复方法和装置,该方法和装置智能高效,根据工作人员的系统修复经验,定义成智能的数据库,构建成自动修复机制,使数据容灾演练系统更加智能可靠。

附图说明

[0022] 图1是本发明中基于自动演练的系统自动修复方法的流程图。
[0023] 图2是本发明中基于自动演练的系统自动修复装置的模块框图。

具体实施方式

[0024] 为使本发明的目的、技术方案及优点更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。
[0025] 实际应用中,自动演练模块经常会出现一些小错误,例如在自动演练(drill)过程中没有看到数据盘,这时就需要手动将磁盘连接上线(online);又如,在自动演练过程中某些服务没有响应(hayco),这时候需要重新对该时间的节点进行自动演练(drill);又如,在自动演练过程有时会出现mail获取不到,这时候会显示密码错误(tesco oversea),此时需要先备份(backup)后再进行自动演练(drill);又如,管理员(server manager)在获取备份报告时有时候会显示没有变量(增量)(0delta),此时需要在备份报告上面说明备份还没有完成(backup not finish)。
[0026] 由于在自动演练过程中常常出现以上问题,甚至还会出现其他常见问题,每一个报错均需要工作人员手动去查询数据,获取解决办法,十分耗时费力。本发明通过对常见错误的收集、分析,提出一种可以自动解决这些常见问题的系统自能修复方法,不但提高了自动演练系统的可靠性,同时解放了技术人员的劳动力,极大的提高了工作效率。
[0027] 本发明公开了一种基于自动演练的系统自动修复方法,如图1所示,包括以下步骤:
[0028] A、启动数据备份自动演练,出现报错,获取该错误的特征信息;
[0029] B、根据获取到的错误的特征信息,查询数据库,寻找解决该错误的解决方法;如果查询不到,则上报给工作人员进行手动处理,同时对这种错误进行备份。
[0030] C、执行解决方法,修复错误,继续执行数据备份自动演练。
[0031] 所述步骤B中,数据库内部存储有与各错误一一对应的方法数据组,所述方法数据组包括错误的特征信息和解决该错误的方法程序信息;所述特征信息包括该错误的号码信息和该错误的情境信息。实际应用中,在初期构建数据库时,需要根据工作人员的经验进行定义,每一个方法数据组定义完毕后,需要反复测试以保证其准确性。
[0032] 所述步骤B中,获取到的错误的特征信息与存储在数据库内部的某一方法数据组所包含的错误的特征信息匹配后,执行该方法数据组所包含的方法程序信息,自动修复错误。在实际应用中,获取到的错误的特征信息必须要求与存储在数据库内部的某一方法数据组所包含的错误的特征信息完全对应,才可以调用该方法数据组所包含的方法程序信息,进行修复问题,这种方法保证了整个系统运行的准确性。
[0033] 实际应用中,情境信息包括至少一个必然情境信息,必然情境信息即为发生该错误时所必然出现的现象信息、或必然导致的结果信息。为了提高系统的准确性,可以在情境信息中设置多个必然情境信息,在匹配时,需要所有必然情境信息均一一对应。
[0034] 实际应用中,情境信息还包括至少一个偶然情境信息,偶然情境信息即为发生该错误时可能出现的现象信息、或偶然导致的结果信息。
[0035] 本发明同时提出了与该基于自动演练的系统自动修复方法对应的装置,参见图2,包括自动演练模块100,用于进行数据备份的自动模拟演练;错误检测模块200,与自动演练模块100连接,用于时刻检测自动演练模块100在自动演练过程中是否发生错误,同时获取该错误的特征信息;存储模块400,用于存储错误的特征信息和解决该错误的方法程序信息;查询模块300,分别与错误检测模块200和存储模块400连接,用于根据错误检测模块200获取到的错误的特征信息,在存储模块400中查询,获取解决该错误的方法程序信息;修复模块500,分别与查询模块300和存储模块400连接,用于运行查询模块300查询得到的方法程序信息,解决错误。
[0036] 实际应用中,错误的特征信息包括该错误的号码信息和该错误的情境信息。具体的,错误的情境信息包括至少一个必然情境信息或至少一个偶然情境信息。
[0037] 应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。