会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利库 / 按使用付费 / 云产品故障处理方法、装置、设备及计算机可读存储介质

云产品故障处理方法、装置、设备及计算机可读存储介质

申请号 CN201711294099.0 申请日 2017-12-08 公开(公告)号 CN107888706A 公开(公告)日 2018-04-06
申请人 平安科技(深圳)有限公司; 发明人 易仁杰;
摘要 本发明提供一种云产品故障处理方法、装置、设备及计算机可读存储介质,该方法包括:每隔预设周期获取用户的云产品的运行数据;分析所述运行数据以确定云产品的运行状态;根据所述运行状态获取对应的故障类型以及所述故障类型对应的故障处理方案;根据所述故障处理方案获取处理故障的需用资源以及用户在所述云平台所拥有的可用于处理故障的可用资源;根据所述需用资源和可用资源购买补充资源;使用所述可用资源和购买的补充资源按照所述故障处理方案处理故障。本发明根据用户的可用资源与实际需用资源合理地使用云平台上的付费资源来处理故障的云产品,帮助用户按需申请资源,按需使用开销,避免用户避免浪费资源,从而节约成本。
权利要求

1.一种云产品故障处理方法,其特征在于,包括:每隔预设周期获取用户的云产品的运行数据;

分析所述运行数据以确定云产品的运行状态;

根据所述运行状态获取对应的故障类型以及所述故障类型对应的故障处理方案;

根据所述故障处理方案获取处理故障的需用资源以及用户在所述云平台所拥有的可用于处理故障的可用资源;

根据所述需用资源和可用资源购买补充资源;

使用所述可用资源和购买的补充资源按照所述故障处理方案处理故障。

2.根据权利要求1所述的方法,其特征在于,所述云产品包括云网络;

所述分析所述运行数据以确定云产品的运行状态,包括:在所述云网络的运行数据中对来自公网且离散的、无意义的客户端IP地址进行筛选;

若筛选出的客户端IP地址达到预设数量,则确定所述运行状态为云网络接收到来自公网的大量无意义的TCP连接访问;

所述根据所述运行状态获取对应的故障类型以及所述故障类型对应的故障处理方案,包括:根据所述运行状态获取对应的故障类型为DDoS攻击以及对应的故障处理方案为将云网络的应用业务切换到抗DDoS资源池中进行清洗;

所述根据所述故障处理方案获取处理故障的需用资源以及用户在所述云平台所拥有的可用于处理故障的可用资源,包括:根据所述故障处理方案获取用户在所述云平台的抗DDoS资源池的已有可使用流量,以及计算使用所述抗DDoS资源池清洗所述云网络的应用业务的需用流量;

所述根据所述需用资源和可用资源购买补充资源,包括:若所述已有可使用流量小于所述需用流量,为所述用户购买使用所述抗DDoS资源池清洗所述应用业务的剩余所需流量,所述剩余所需流量为需用流量与所述已有可使用流量之间的差值;

所述使用所述可用资源和购买的补充资源按照所述故障处理方案处理故障,包括:将云网络的应用业务切换到抗DDoS资源池中,使用所述已有可使用流量和购买的剩余所需流量清洗所述应用业务。

3.根据权利要求1所述的方法,其特征在于,所述云产品包括云磁盘;

所述分析所述运行数据以确定云产品的运行状态,包括:搜索所述云磁盘的运行数据是否存在木马文件或所述运行数据中使用http协议的javascript语法数据是否存在非法命令;

若是,则确定所述运行状态为云磁盘被注入病毒;

所述根据所述运行状态获取对应的故障类型以及所述故障类型对应的故障处理方案,包括:根据所述运行状态获取对应的故障类型为网络攻击以及对应的故障处理方法为部署云防火墙;

所述根据所述故障处理方案获取处理故障的需用资源以及用户在所述云平台所拥有的可用于处理故障的可用资源,包括:根据所述故障处理方案获取防御所述网络攻击的资源为云防火墙;

分析注入的病毒的类型,判断用户在所述云平台上是否拥有能够防御该类型病毒的云防火墙,若否,则无可用资源;

所述根据所述需用资源和可用资源购买补充资源,包括:若用户在所述云平台上未拥有能够防御所述类型病毒的云防火墙,则为所述用户购买防御所述类型病毒的云防火墙;

所述使用所述可用资源和购买的补充资源按照所述故障处理方案处理故障,包括:在所述云平台上部署购买的云防火墙防御所述网络攻击,并当所述网络攻击停止时释放所述云防火墙。

4.根据权利要求1所述的方法,其特征在于,所述分析所述运行数据以确定云产品的运行状态之后,还包括:根据所述运行状态确定用户对所述云产品的资源量需求;

按照所述资源量需求对所述云产品的资源量进行调整。

5.根据权利要求4所述的方法,其特征在于,所述云产品包括云CPU;

所述分析所述运行数据以确定云产品的运行状态,包括:从所述运行数据中获取云CPU的使用率,判断所述云CPU的使用率是否大于或等于预置比例;

若所述云CPU的使用率大于或等于预置比例,则确定所述运行状态为云CPU使用率高;

所述根据所述运行状态确定用户对所述云产品的资源量需求,包括:根据所述运行状态确定用户对所述云产品的资源量需求为对云CPU资源池进行扩充;

所述按照所述资源量需求对所述云产品的资源量进行调整,包括:获取云CPU的使用率对应的云CPU资源池的扩充比例,根据所述扩充比例对云CPU资源池进行扩充。

6.根据权利要求4所述的方法,其特征在于,所述云产品包括云磁盘;

所述分析所述运行数据以确定云产品的运行状态,包括:从所述运行数据中获取云磁盘的剩余内存,判断所述云磁盘的剩余内存是否大于或等于第一阈值;

若所述云磁盘的剩余内存大于或等于第一阈值,则确定所述运行状态为云磁盘存储资源过剩;

所述根据所述运行状态确定用户对所述云产品的资源量需求,包括:根据所述运行状态确定用户对所述云产品的资源量需求为缩小云磁盘内存;

所述按照所述资源量需求对所述云产品的资源量进行调整,包括:获取云磁盘的剩余内存比例以及该剩余内存比例对应的云磁盘内存收缩比例,根据所述云磁盘内存收缩比例降低所述云磁盘的内存。

7.根据权利要求6所述的方法,其特征在于,所述判断所述云磁盘的剩余内存是否大于或等于第一阈值之后,还包括:判断所述云磁盘的剩余内存是否大于或等于第一阈值小于或等于第二阈值;

若所述云磁盘的剩余内存小于或等于第二阈值,则确定所述运行状态为云磁盘存储资源不足;

所述根据所述运行状态确定用户对所述云产品的资源量需求,包括:根据所述运行状态确定用户对所述云产品的资源量需求为扩充云磁盘内存;

所述按照所述资源量需求对所述云产品的资源量进行调整,包括:获取云磁盘的剩余内存比例以及该剩余内存比例对应的云磁盘内存扩大比例,根据所述云磁盘内存扩大比例扩充所述云磁盘的内存。

8.一种云产品故障处理装置,其特征在于,包括用于执行如权利要求1-7任一项所述的云产品故障处理方法的单元。

9.一种云产品故障处理设备,其特征在于,所述设备包括存储器,以及与所述存储器相连的处理器;

所述存储器,用于存储云产品故障处理程序数据;

所述处理器,用于运行所述存储器中存储的程序数据,以执行如权利要求1-7任一项所述的方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者一个以上程序数据,所述一个或者一个以上程序数据可被一个或者一个以上的处理器执行,以实现如权利要求1至7任一项所述的方法。

说明书全文

云产品故障处理方法、装置、设备及计算机可读存储介质

技术领域

[0001] 本发明涉及计算机技术领域,尤其涉及一种云产品故障处理方法、装置、设备及计算机可读存储介质。

背景技术

[0002] 目前,大部分公有云平台提供的云产品服务主要是购买云产品后监控云产品来保证产品的稳定运行,一旦发生故障及时提醒用户排查故障。每种云平台各自提供高可用性功能的产品,需要用户对每个云产品都有足够的认知,自助地进行云产品的运维,如果对云产品的认知不足,一旦云产品运行发生故障,用户自己难以操作修复,并且用户使用的云平台提供的云产品都是计费的,修复故障需要使用的资源也是计费的,若用户对云产品的认知不够,很容易造成资源浪费,导致用户使用成本增高。

发明内容

[0003] 本发明实施例提供了一种云产品故障处理方法、装置、设备及计算机可读存储介质,能够合理结合云平台的资源以及用户自身的可用资源来处理故障,为用户节约成本。
[0004] 第一方面,本发明实施例提供了一种云产品故障处理方法,该方法包括:
[0005] 每隔预设周期获取用户的云产品的运行数据;
[0006] 分析所述运行数据以确定云产品的运行状态;
[0007] 根据所述运行状态获取对应的故障类型以及所述故障类型对应的故障处理方案;
[0008] 根据所述故障处理方案获取处理故障的需用资源以及用户在所述云平台所拥有的可用于处理故障的可用资源;
[0009] 根据所述需用资源和可用资源购买补充资源;
[0010] 使用所述可用资源和购买的补充资源按照所述故障处理方案处理故障。
[0011] 第二方面,本发明实施例还提供了一种云产品故障处理装置,该装置包括用于执行上述的云产品故障处理方法的单元。
[0012] 第三方面,本发明实施例还提供了一种云产品故障处理设备,所述设备包括存储器,以及与所述存储器相连的处理器;
[0013] 所述存储器,用于存储实现云产品故障处理方法的程序数据;
[0014] 所述处理器,用于运行所述存储器中存储的程序数据,以执行如上述第一方面所述的方法。
[0015] 第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者一个以上程序数据,所述一个或者一个以上程序数据可被一个或者一个以上的处理器执行,以实现上述第一方面所述的方法。
[0016] 本发明实施例提供了云产品故障处理方法、装置、设备及计算机可读存储介质,所述方法包括:每隔预设周期获取用户的云产品的运行数据;分析所述运行数据以确定云产品的运行状态;根据所述运行状态获取对应的故障类型以及所述故障类型对应的故障处理方案;根据所述故障处理方案获取处理故障的需用资源以及用户在所述云平台所拥有的可用于处理故障的可用资源;根据所述需用资源和可用资源购买补充资源;使用所述可用资源和购买的补充资源按照所述故障处理方案处理故障。本发明根据用户的可用资源与实际需用资源合理地使用云平台上的付费资源来处理故障的云产品,帮助用户按需申请资源,按需使用开销,避免用户避免浪费资源,从而节约成本。

附图说明

[0017] 为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0018] 图1是本发明实施例提供的一种云产品故障处理方法的流程示意图;
[0019] 图2是本发明实施例提供的一种云产品故障处理方法的另一流程示意图;
[0020] 图3是本发明实施例提供的一种云产品故障处理装置的单元结构示意框图;
[0021] 图4是本发明实施例提供的一种云产品故障处理装置的另一单元结构示意框图;
[0022] 图5是本发明实施例提供的一种云产品故障处理装置的子单元结构示意框图;
[0023] 图6是本发明实施例提供的一种云产品故障处理装置的另一子单元结构示意框图;
[0024] 图7是本发明实施例提供的一种云产品故障处理设备的示意性框图。

具体实施方式

[0025] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0026] 应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
[0027] 还应当理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
[0028] 也应当理解,尽管术语第一、第二等可以在此用来描述各种元素,但这些元素不应该受限于这些术语,这些术语仅用来将这些元素彼此区分开。
[0029] 图1为本发明实施例提供的一种云产品故障处理方法的流程示意图。该方法可以运行在智能手机(如Android手机、IOS手机等)、平板电脑、笔记本电脑以及智能设备等终端中。如图1所示,该方法的步骤包括S101~S106。
[0030] S101,每隔预设周期获取用户的云产品的运行数据。
[0031] 云平台上具有各种云产品以及运维云产品安全运行的运维系统,运维系统包括监控系统、巡检系统、故障处理系统和智能编排系统等。云产品的种类包括云CPU,云GPU、云磁盘、云网络、云防火墙等,这些云产品可被云平台上的用户购买使用,在云产品使用运行期间,监控系统实时监控云产品的运行,巡检系统每隔预设周期获取一次云产品的运行数据。在本发明实施例中,预设周期为2小时。
[0032] 云产品的运行数据包括各类云产品的运行数据,例如:云CPU的使用情况,一般为云CPU资源池的使用情况,如哪些正在运行计算,哪些正在空闲等;云磁盘的使用情况,使用内存和剩余内存多少,保存有哪些数据等;云网络的业务情况,如访问数据和业务处理数据等;云防火墙的类型,其使用数据和配置数据等。从各类云产品各自的运行数据中可以看出对应的云产品当前的运行状态。
[0033] S102,分析所述运行数据以确定云产品的运行状态。
[0034] 巡检系统定时巡检,获取云产品的运行数据,并分析该运行数据来确定云产品的运行状态,根据运行状态去触发故障处理系统和智能编排系统的工作。
[0035] 在本发明实施例中,步骤S102具体包括:
[0036] 在所述云网络的运行数据中对来自公网且离散的、无意义的客户端IP地址进行筛选,若筛选出的客户端IP地址达到预设数量,则确定所述运行状态为云网络接收到来自公网的大量无意义的TCP连接访问;和/或
[0037] 搜索所述云磁盘的运行数据是否存在木马文件或所述运行数据中使用http协议的javascript语法数据是否存在非法命令,若是,则确定所述运行状态为云磁盘被注入病毒。
[0038] 离散的指的是客户端IP地址的分布是离散的,不具有特定规则的,无意义指的是客户端IP地址只发起访问,发起访问后这些客户端IP地址不产生其他网络行为。
[0039] 木马文件和非法命令是病毒的具体体现,当在云磁盘发现木马文件或非法命令时,基本均为中病毒的体现。
[0040] S103,根据所述运行状态获取对应的故障类型以及所述故障类型对应的故障处理方案。
[0041] 故障处理系统是根据云产品的运行状态去分析云产品故障的特征,找到这些特征对应的故障类型以及相应的故障处理方案去处理故障。
[0042] 例如,DDoS攻击的一般包括访问数量巨大、访问无意义等特征,网络(病毒)攻击多体现有木马、恶意命令、非法命令等特征。
[0043] 在本发明实施例中,步骤S103具体包括:
[0044] 根据所述运行状态获取对应的故障类型为DDoS攻击以及对应的故障处理方案为将云网络的应用业务切换到抗DDoS资源池中进行清洗;和/或
[0045] 根据所述运行状态获取对应的故障类型为网络攻击以及对应的故障处理方法为部署云防火墙。
[0046] 当接收大量离散的无意义的访问基本可以断定为DDoS(Distributed Denial of Service,分布式拒绝服务)攻击,DDoS攻击是利用合理的服务请求来占用过多的服务资源,使服务器超载负荷,从而使合法用户无法得到服务器响应,即通过使网络过载来干扰甚至阻断正常的网络通讯,DDoS攻击的特征是服务请求量大、且服务请求无意义。处理DDoS攻击的手段为将云网络的应用业务切换到抗DDoS资源池中进行清洗,清除那些无意义的访问请求,释放服务器资源以恢复网络正常。
[0047] 注入病毒为网络攻击的一种常用手段,而防御病毒入侵的最好的方法就是部署防火墙。
[0048] S104,根据所述故障处理方案获取处理故障的需用资源以及用户在所述云平台所拥有的可用于处理故障的可用资源。
[0049] S105,根据所述需用资源和可用资源购买补充资源。
[0050] 云平台所提供的云产品以及其对应的一些衍生品都是用户在该云平台可使用的资源,这些资源是计费的,例如:云网络以及处理云网络故障的资源(如抗DDos清洗池)、云防火墙、云CPU以及云CPU资源池等。云产品及其衍生品种类繁多,此处不一一列举。
[0051] 智能编排系统根据故障处理方案得到处理故障需要用到的资源,即需用资源,以及该用户在云平台上现已拥有的可用于处理该故障的可用资源,根据可用资源与需用资源之间的关系判断是否需要购买额外的资源,即补充资源。用户预先在云平台上设置好云平台运营方自动管理该用户在该云平台的云产品的运行和修复的权限,将其银行账户绑定其云平台的账号,或是提前在账号里充值,智能编排系统购买补充资源时自动扣款。
[0052] 智能编排系统根据用户需用资源和在平云台的可用资源购买需要的补充资源,能够帮助合理地使用资源来处理发生故障的云产品,按需申请资源,按需使用开销,避免浪费资源,从而给用户节约成本。
[0053] 在本发明实施例中,步骤S104具体包括:
[0054] 根据所述故障处理方案获取用户在所述云平台的抗DDoS资源池的已有可使用流量,以及计算使用所述抗DDoS资源池清洗所述云网络的应用业务的需用流量;和/或[0055] 根据所述故障处理方案获取防御所述网络攻击的资源为云防火墙,分析注入的病毒的类型,判断用户在所述云平台上是否拥有能够防御该类型病毒的云防火墙,若否,则无可用资源。
[0056] 步骤S105具体包括:
[0057] 若所述已有可使用流量小于所述需用流量,为所述用户购买使用所述抗DDoS资源池清洗所述应用业务的剩余所需流量,所述剩余所需流量为需用流量与所述已有可使用流量之间的差值;和/或
[0058] 若用户在所述云平台上未拥有能够防御所述类型病毒的云防火墙,则为所述用户购买能够防御所述类型病毒的云防火墙。
[0059] 使用抗DDoS资源池清洗所述云网络的应用业务需要花费流量,若用户本身的使用抗DDoS资源池的可用流量不足以用来处理本次DDOS攻击,则需要购买剩余不足的流量,即补充资源,以便能够完成使用抗DDoS资源池清洗所述云网络的应用业务的故障修复。
[0060] 针对病毒的攻击,最有效的办法为部署防火墙来拦截病毒,抵御病毒入侵。
[0061] S106,使用所述可用资源和购买的补充资源按照所述故障处理方案处理故障。
[0062] 在本发明实施例中,步骤S106具体包括:
[0063] 将云网络的应用业务切换到抗DDoS资源池中,使用所述已有可使用流量和购买的剩余所需流量清洗所述应用业务;和/或
[0064] 在所述云平台上部署购买的云防火墙防御所述网络攻击,并当所述网络攻击停止时释放所述云防火墙。
[0065] 将云网络的应用业务切换到抗DDoS资源池中进行清洗,清除那些无意义的访问请求,释放服务器资源以恢复网络正常。
[0066] 部署云防火墙能够防御网络攻击,当所述网络攻击停止时释放所述云防火墙即释放资源,停止计费,不过多占用资源,避免成本过高。
[0067] 智能编排系统帮助用户购买到补充资源后,故障处理系统使用用户已有的可用资源和购买的补充资源来处理故障,保障云产品的安全运行。
[0068] 本发明实施例的云产品故障处理方法,定时获取云产品的运行数据,分析运行状态,当云产品发生故障时,根据用户的可用资源与实际需用资源合理地使用云平台上的付费资源来处理故障,帮助用户按需申请资源,按需使用开销,避免浪费资源,从而节约成本。
[0069] 图2是本发明实施例提供的一种云产品故障处理方法的另一流程示意图。该方法包括上述实施例的步骤S101-S106,且在步骤S102后增加步骤S107和步骤S108,为了简洁性,步骤S103-S106不重复描述;另外,步骤S107-S108与步骤S103-S106解决的问题不同,步骤S107-S108的流程与步骤S103-S106的流程在时间上无必然先后顺序。
[0070] 如图2所示,该云产品故障处理方法包括:
[0071] S101,每隔预设周期获取用户的云产品的运行数据。
[0072] S102,分析所述运行数据得到云产品的运行状态。
[0073] 例如,从所述运行数据中获取云CPU的使用率,判断所述云CPU的使用率是否大于或等于预置比例;若所述云CPU的使用率大于或等于预置比例,则确定所述运行状态为云CPU使用率高。
[0074] 在本发明实施例中,设置预置比例为60%,当云CPU的使用率大于或等于60%,云CPU使用率高,即计算能力不足。
[0075] 再如,从所述运行数据中获取云磁盘的剩余内存,判断所述云磁盘的剩余内存是否大于或等于第一阈值;若是,则确定所述运行状态为云磁盘存储资源过剩,若否,判断所述云磁盘的剩余内存是否大于或等于第一阈值小于或等于第二阈值;若所述云磁盘的剩余内存小于或等于第二阈值,则确定所述运行状态为云磁盘存储资源不足。
[0076] 在本发明实施例中,第一阈值可选为50%,即当云磁盘的剩余内存大于或等于50%,说明存储资源过剩;第二阈值可选为10%,即当云磁盘的剩余内存小于10%,说明存储资源不足。
[0077] S103,根据所述运行状态获取对应的故障类型以及所述故障类型对应的故障处理方案。
[0078] S104,根据所述故障处理方案获取处理故障的需用资源以及用户在所述云平台所拥有的可用于处理故障的可用资源。
[0079] S105,根据所述需用资源和可用资源购买补充资源。
[0080] S106,使用所述可用资源和购买的补充资源按照所述故障处理方案处理故障。
[0081] S107,根据所述运行状态确定用户对所述云产品的资源量需求。
[0082] 在不同的时间用户对云产品资源的需求不完全一致,如果一味的固定资源,在资源充足的情况下容易造成资源浪费,则增加的用户的成本,在资源不足的情况下容易导致用户资源紧缺,从而导致用户使用云产品处理时间的效率低下。用户对资源量的需求可直接通过巡检系统分析云产品的运行状态来确定。
[0083] 例如,若所述运行状态为云CPU使用率高,则确定用户对云产品的资源量需求为对云CPU资源池进行扩充。
[0084] 在本实施例中,当CPU的使用率达到60%或以上,需要对云CPU资源池进行扩充,对即扩充云CPU的计算资源,提高云CPU的处理能力。该云CPU资源池为VM(VMware vSphere,是一种虚拟化平台)资源池。
[0085] 再如,若所述运行状态为云磁盘存储资源过剩,则确定用户对所述云产品的资源量需求为缩小云磁盘内存。
[0086] 在本实施例中,当云磁盘的剩余内存大于或等于60%,即存储资源过剩,可以适当地释放云磁盘的内存,用户占有的云磁盘内存减小,成本降低。
[0087] 又如,若所述运行状态为云磁盘存储资源不足,则确定用户对所述云产品的资源量需求为扩充云磁盘内存。
[0088] 在本实施例中,当云磁盘的剩余内存小于10%,即存储资源不足,存储资源不足会导致处理事件的效率降低,因此可以适当地扩充云磁盘的内存,不过多地占用资源的同时提高处理效率。
[0089] S108,按照所述资源量需求对所述云产品的资源量进行调整。
[0090] 巡检系统得到用户对所述云产品的资源量需求后,触发智能编排系统对云产品的资源量进行扩缩以满足用户的需求。
[0091] 步骤S108具体包括:
[0092] 若用户对所述云产品的资源量需求为对云CPU资源池进行扩充,则获取云CPU的使用率对应的云CPU资源池的扩充比例,根据所述扩充比例对云CPU资源池进行扩充。
[0093] 若用户对所述云产品的资源量需求为缩小云磁盘内存,则获取云磁盘的剩余内存比例以及该剩余内存比例对应的云磁盘内存收缩比例,根据所述云磁盘内存收缩比例降低所述云磁盘的内存。
[0094] 若用户对所述云产品的资源量需求为扩充云磁盘内存,则获取云磁盘的剩余内存比例以及该剩余内存比例对应的云磁盘内存扩大比例,根据所述云磁盘内存扩大比例扩充所述云磁盘的内存。
[0095] 例如,当云CPU的使用率大于60%但小于80%,则云CPU资源池对应的扩充比例为1.5,即将云CPU资源池的内存扩充为原来的1.5倍,当云CPU的使用率达到80%或以上,则云CPU资源池对应的扩充比例为2倍。
[0096] 再如,当云磁盘的剩余内存60-80%,对应的云磁盘内存收缩比例为0.3,即将云磁盘的内存收缩为原来的0.3倍,当云磁盘的剩余内存81-100%,对应的云磁盘内存收缩比例为0.5。
[0097] 又如,当云磁盘的剩余内存0-10%,对应的云磁盘内存扩大比例为2,即将云磁盘的内存扩充为原来的2倍,当云磁盘的剩余内存11-40%,对应的云磁盘内存扩大比例为1.5。
[0098] 此外,云CPU资源池的扩充比例、云磁盘内存收缩比例和云磁盘内存扩大比例均可被用户自行设置为其他值。
[0099] 本发明实施例的云产品故障处理方法,在云产品资源当前状态不满足用户的需求时,可以智能地根据用户的需求进行资源调整,最大限度地满足客户的需求,同时避免成本过高而又不影响运行效率。
[0100] 图3为本发明实施例提供的一种云产品故障处理装置100的示意性框图。该云产品故障处理装置100包括第一获取单元101、分析单元102、第二获取单元103、第三获取单元104、购买单元105和处理单元106。
[0101] 第一获取单元101用于每隔预设周期获取用户的云产品的运行数据。
[0102] 分析单元102用于分析所述运行数据以确定云产品的运行状态。
[0103] 第一获取单元101定时获取云产品的运行数据,分析单元102分析该运行数据得到云产品的运行状态,根据运行状态发现故障。
[0104] 所述分析单元102具体用于:
[0105] 在所述云网络的运行数据中对来自公网且离散的、无意义的客户端IP地址进行筛选;若筛选出的客户端IP地址达到预设数量,则确定所述运行状态为云网络接收到来自公网的大量无意义的TCP连接访问;和/或
[0106] 搜索所述云磁盘的运行数据是否存在木马文件或所述运行数据中使用http协议的javascript语法数据是否存在非法命令,若是,则确定所述运行状态为云磁盘被注入病毒。
[0107] 第二获取单元103用于根据所述运行状态获取对应的故障类型以及所述故障类型对应的故障处理方案。
[0108] 故障处理系统是根据云产品的运行状态去分析云产品的故障特征,找到该故障特征对应的故障类型以及相应的故障处理方案去处理故障。
[0109] 例如,所述第二获取单元103具体用于:
[0110] 根据所述运行状态获取对应的故障类型为DDoS攻击以及对应的故障处理方案为将云网络的应用业务切换到抗DDoS资源池中进行清洗;和/或
[0111] 根据所述运行状态获取对应的故障类型为网络攻击以及对应的故障处理方法为部署云防火墙。
[0112] 第三获取单元104用于根据所述故障处理方案取处理故障的需用资源以及用户在所述云平台所拥有的可用于处理故障的可用资源。
[0113] 购买单元105用于根据所述需用资源和可用资源购买补充资源。
[0114] 第三获取单元104分析云产品的故障的程度,根据故障处理方案得到处理故障需要用到的资源,即需用资源,以及该用户在云平台上现已拥有的可用于处理该故障的可用资源,购买单元105根据可用资源与需用资源之间的关系判断是否需要购买额外的资源,即补充资源,帮助用户合理地使用资源来处理发生故障的云产品,按需申请资源,按需使用开销。
[0115] 所述第三获取单元104具体用于:
[0116] 根据所述故障处理方案获取用户在所述云平台的抗DDoS资源池的已有可使用流量,以及计算使用所述抗DDoS资源池清洗所述云网络的应用业务的需用流量;和/或[0117] 根据所述故障处理方案获取防御所述网络攻击的资源为云防火墙,分析注入的病毒的类型,判断用户在所述云平台上是否拥有能够防御该类型病毒的云防火墙,若否,则无可用资源。
[0118] 所述购买单元105具体用于:
[0119] 若所述已有可使用流量小于所述需用流量,为所述用户购买使用所述抗DDoS资源池清洗所述应用业务的剩余所需流量,所述剩余所需流量为需用流量与所述已有可使用流量之间的差值;和/或
[0120] 若用户在所述云平台上未拥有能够防御所述类型病毒的云防火墙,则为所述用户购买能够防御所述类型病毒的云防火墙。
[0121] 处理单元106用于使用所述可用资源和购买的补充资源按照所述故障处理方案处理故障。
[0122] 购买到补充资源后,使用用户已有的可用资源和购买的补充资源来处理故障,保障云产品的安全运行。
[0123] 处理单元106具体用于:
[0124] 将云网络的应用业务切换到抗DDoS资源池中,使用所述已有可使用流量和购买的剩余所需流量清洗所述应用业务;和/或
[0125] 在所述云平台上部署购买的云防火墙防御所述网络攻击,并当所述网络攻击停止时释放所述云防火墙。
[0126] 上述云产品故障处理装置100的各个单元的具体描述可参考方法第一实施例,本实施例不做赘述。
[0127] 上述云产品故障处理装置100可以实现为一种计算机程序的形式,计算机程序可以在如图7所示的计算机设备上运行。
[0128] 图4为本发明实施例提供的一种云产品故障处理装置100的示意性框图。该云产品故障处理装置100包括第一获取单元101、分析单元102、第二获取单元103、第三获取单元104、购买单元105、处理单元106、确定单元107和调整单元108。
[0129] 第一获取单元101用于每隔预设周期获取用户的云产品的运行数据。
[0130] 分析单元102用于分析所述运行数据以确定云产品的运行状态。
[0131] 例如,所述分析单元102具体用于:
[0132] 从所述运行数据中获取云CPU的使用率;判断所述云CPU的使用率是否大于或等于预置比例;若所述云CPU的使用率大于或等于预置比例,则确定所述运行状态为云CPU使用率高。
[0133] 再如,所述分析单元102具体还可用于:
[0134] 从所述运行数据中获取云磁盘的剩余内存,判断所述云磁盘的剩余内存是否大于或等于第一阈值;若是,则确定所述运行状态为云磁盘存储资源过剩,若否,判断所述云磁盘的剩余内存是否大于或等于第一阈值小于或等于第二阈值;若所述云磁盘的剩余内存小于或等于第二阈值,则确定所述运行状态为云磁盘存储资源不足。
[0135] 第二获取单元103用于根据所述运行状态获取对应的故障类型以及所述故障类型对应的故障处理方案。
[0136] 第三获取单元104用于根据所述故障处理方案获取处理故障的需用资源以及用户在所述云平台所拥有的可用于处理故障的可用资源。
[0137] 购买单元105用于根据所述需用资源和可用资源购买补充资源。
[0138] 处理单元106用于使用所述可用资源和购买的补充资源按照所述故障处理方案处理故障。
[0139] 确定单元107用于根据所述运行状态确定用户对所述云产品的资源量需求。
[0140] 在不同的时间用户对云产品资源的需求不完全一致,如果一味的固定资源,在资源充足的情况下容易造成资源浪费,则增加的用户的成本,在资源不足的情况下容易导致用户资源紧缺,从而导致用户使用云产品处理时间的效率低下。用户对资源量的需求可直接通过巡检系统分析云产品的运行状态得到。
[0141] 如图5所示,确定单元107包括:
[0142] 第一确定子单元1071,用于若所述运行状态为云CPU使用率高,则确定用户对云产品的资源量需求为对云CPU资源池进行扩充。
[0143] 第二确定子单元1072,用于若所述运行状态为云磁盘存储资源过剩,则确定用户对所述云产品的资源量需求为缩小云磁盘内存。
[0144] 第三确定子单元1073,用于若所述运行状态为云磁盘存储资源不足,则确定用户对所述云产品的资源量需求为扩充云磁盘内存。
[0145] 调整单元108用于按照所述资源量需求对所述云产品的资源量进行扩缩。
[0146] 在云产品资源当前状态不满足用户的需求时,可以智能地根据用户的需求进行资源调整,最大限度地满足客户的需求,同时避免成本过高而又不影响运行效率。
[0147] 例如,如图6所示,所述调整单元108包括:
[0148] 第一获取子单元1081,用于若用户对所述云产品的资源量需求为对云CPU资源池进行扩充,则获取云CPU的使用率对应的云CPU资源池的扩充比例。
[0149] 第一扩充子单元1082,用于根据所述扩充比例对云CPU资源池进行扩充。
[0150] 第二获取子单元1083,用于若用户对所述云产品的资源量需求为缩小云磁盘内存,则获取云磁盘的剩余内存比例以及该剩余内存比例对应的云磁盘内存收缩比例。
[0151] 收缩子单元1084,用于根据所述云磁盘内存收缩比例降低所述云磁盘的内存。
[0152] 第三获取子单元1085,用于若用户对所述云产品的资源量需求为扩充云磁盘内存,则获取云磁盘的剩余内存比例以及该剩余内存比例对应的云磁盘内存扩大比例。
[0153] 第二扩充子单元1086,用于根据所述云磁盘内存扩大比例扩充所述云磁盘的内存。
[0154] 上述云产品故障处理装置100的各个单元的具体描述可参考方法第二实施例,本实施例不做赘述。
[0155] 上述云产品故障处理装置100可以实现为一种计算机程序的形式,计算机程序可以在如图7所示的计算机设备上运行。
[0156] 图7为本发明实施例提供的一种云产品故障处理设备的示意性框图。该设备可以是终端,也可以是服务器,其中,终端可以是智能手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等具有通信功能的电子设备。服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
[0157] 该设备为一种计算机设备200,包括通过系统总线201连接的处理器202、非易失性存储介质203、内存储器204和网络接口205。其中,该计算机设备200的非易失性存储介质203可存储操作系统2031和计算机程序2032,该计算机程序2032被执行时,可使得处理器
202执行一种云产品故障处理方法。该计算机设备200的处理器202用于提供计算和控制能力,支撑整个计算机设备200的运行。该内存储器204为非易失性存储介质203中的计算机程序2032的运行提供环境,该计算机程序2032被处理器202执行时,可使得处理器202执行一种云产品故障处理方法。计算机设备200的网络接口205用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0158] 处理器202运行非易失性存储介质203中的计算机程序2032,执行如下操作:
[0159] 每隔预设周期获取用户的云产品的运行数据;分析所述运行数据以确定云产品的运行状态;根据所述运行状态获取对应的故障类型以及所述故障类型对应的故障处理方案;根据所述故障处理方案获取处理故障的需用资源以及用户在所述云平台所拥有的可用于处理故障的可用资源;根据所述需用资源和可用资源购买补充资源;使用所述可用资源和购买的补充资源按照所述故障处理方案处理故障。
[0160] 所述云产品包括云网络,处理器202还执行如下操作:
[0161] 在所述云网络的运行数据中对来自公网且离散的、无意义的客户端IP地址进行筛选;若筛选出的客户端IP地址达到预设数量,则确定所述运行状态为云网络接收到来自公网的大量无意义的TCP连接访问;根据所述运行状态获取对应的故障类型为DDoS攻击以及对应的故障处理方案为将云网络的应用业务切换到抗DDoS资源池中进行清洗;根据所述故障处理方案获取用户在所述云平台的抗DDoS资源池的已有可使用流量,以及计算使用所述抗DDoS资源池清洗所述云网络的应用业务的需用流量;若所述已有可使用流量小于所述需用流量,为所述用户购买使用所述抗DDoS资源池清洗所述应用业务的剩余所需流量,所述剩余所需流量为需用流量与所述已有可使用流量之间的差值;将云网络的应用业务切换到抗DDoS资源池中,使用所述已有可使用流量和购买的剩余所需流量清洗所述应用业务。
[0162] 所述云产品包括云磁盘,处理器202还执行如下操作:
[0163] 搜索所述云磁盘的运行数据是否存在木马文件或所述运行数据中使用http协议的javascript语法数据是否存在非法命令;若是,则确定所述运行状态为云磁盘被注入病毒;根据所述运行状态获取对应的故障类型为网络攻击以及对应的故障处理方法为部署云防火墙;根据所述故障处理方案获取防御所述网络攻击的资源为云防火墙;分析注入的病毒的类型,判断用户在所述云平台上是否拥有能够防御该类型病毒的云防火墙,若否,则无可用资源;若用户在所述云平台上未拥有能够防御所述类型病毒的云防火墙,则为所述用户购买防御所述类型病毒的云防火墙;在所述云平台上部署购买的云防火墙防御所述网络攻击,并当所述网络攻击停止时释放所述云防火墙。
[0164] 处理器202还执行如下操作:
[0165] 根据所述运行状态确定用户对所述云产品的资源量需求;按照所述资源量需求对所述云产品的资源量进行调整。
[0166] 处理器202还执行如下操作:
[0167] 从所述运行数据中获取云CPU的使用率,判断所述云CPU的使用率是否大于或等于预置比例;若所述云CPU的使用率大于或等于预置比例,则确定所述运行状态为云CPU使用率高;根据所述运行状态确定用户对所述云产品的资源量需求为对云CPU资源池进行扩充;获取云CPU的使用率对应的云CPU资源池的扩充比例,根据所述扩充比例对云CPU资源池进行扩充。
[0168] 处理器202还执行如下操作:
[0169] 从所述运行数据中获取云磁盘的剩余内存,判断所述云磁盘的剩余内存是否大于或等于第一阈值;若所述云磁盘的剩余内存大于或等于第一阈值,则确定所述运行状态为云磁盘存储资源过剩;根据所述运行状态确定用户对所述云产品的资源量需求为缩小云磁盘内存;获取云磁盘的剩余内存比例以及该剩余内存比例对应的云磁盘内存收缩比例,根据所述云磁盘内存收缩比例降低所述云磁盘的内存。
[0170] 处理器202还执行如下操作:
[0171] 判断所述云磁盘的剩余内存是否大于或等于第一阈值小于或等于第二阈值;若所述云磁盘的剩余内存小于或等于第二阈值,则确定所述运行状态为云磁盘存储资源不足;根据所述运行状态确定用户对所述云产品的资源量需求为扩充云磁盘内存;获取云磁盘的剩余内存比例以及该剩余内存比例对应的云磁盘内存扩大比例,根据所述云磁盘内存扩大比例扩充所述云磁盘的内存。
[0172] 本领域技术人员可以理解,图7中示出的云产品故障处理设备的实施例并不构成对云产品故障处理设备具体构成的限定,在其他实施例中,云产品故障处理设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,云产品故障处理设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图7所示实施例一致,在此不再赘述。
[0173] 本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序可被一个或者一个以上的处理器执行,以实现以下步骤:
[0174] 每隔预设周期获取用户的云产品的运行数据;分析所述运行数据以确定云产品的运行状态;根据所述运行状态获取对应的故障类型以及所述故障类型对应的故障处理方案;根据所述故障处理方案获取处理故障的需用资源以及用户在所述云平台所拥有的可用于处理故障的可用资源;根据所述需用资源和可用资源购买补充资源;使用所述可用资源和购买的补充资源按照所述故障处理方案处理故障。
[0175] 在本实施例中,所述云产品包括云网络,还实现以下步骤:
[0176] 在所述云网络的运行数据中对来自公网且离散的、无意义的客户端IP地址进行筛选;若筛选出的客户端IP地址达到预设数量,则确定所述运行状态为云网络接收到来自公网的大量无意义的TCP连接访问;根据所述运行状态获取对应的故障类型为DDoS攻击以及对应的故障处理方案为将云网络的应用业务切换到抗DDoS资源池中进行清洗;根据所述故障处理方案获取用户在所述云平台的抗DDoS资源池的已有可使用流量,以及计算使用所述抗DDoS资源池清洗所述云网络的应用业务的需用流量;若所述已有可使用流量小于所述需用流量,为所述用户购买使用所述抗DDoS资源池清洗所述应用业务的剩余所需流量,所述剩余所需流量为需用流量与所述已有可使用流量之间的差值;将云网络的应用业务切换到抗DDoS资源池中,使用所述已有可使用流量和购买的剩余所需流量清洗所述应用业务。
[0177] 在本实施例中,所述云产品包括云磁盘,还实现以下步骤:
[0178] 搜索所述云磁盘的运行数据是否存在木马文件或所述运行数据中使用http协议的javascript语法数据是否存在非法命令;若是,则确定所述运行状态为云磁盘被注入病毒;根据所述运行状态获取对应的故障类型为网络攻击以及对应的故障处理方法为部署云防火墙;根据所述故障处理方案获取防御所述网络攻击的资源为云防火墙;分析注入的病毒的类型,判断用户在所述云平台上是否拥有能够防御该类型病毒的云防火墙,若否,则无可用资源;若用户在所述云平台上未拥有能够防御所述类型病毒的云防火墙,则为所述用户购买防御所述类型病毒的云防火墙;在所述云平台上部署购买的云防火墙防御所述网络攻击,并当所述网络攻击停止时释放所述云防火墙。在本实施例中,还实现以下步骤:
[0179] 根据所述运行状态确定用户对所述云产品的资源量需求;按照所述资源量需求对所述云产品的资源量进行调整。
[0180] 在本实施例中,还实现以下步骤:
[0181] 从所述运行数据中获取云CPU的使用率,判断所述云CPU的使用率是否大于或等于预置比例;若所述云CPU的使用率大于或等于预置比例,则确定所述运行状态为云CPU使用率高;根据所述运行状态确定用户对所述云产品的资源量需求为对云CPU资源池进行扩充;获取云CPU的使用率对应的云CPU资源池的扩充比例,根据所述扩充比例对云CPU资源池进行扩充。
[0182] 在本实施例中,还实现以下步骤:
[0183] 从所述运行数据中获取云磁盘的剩余内存,判断所述云磁盘的剩余内存是否大于或等于第一阈值;若所述云磁盘的剩余内存大于或等于第一阈值,则确定所述运行状态为云磁盘存储资源过剩;根据所述运行状态确定用户对所述云产品的资源量需求为缩小云磁盘内存;获取云磁盘的剩余内存比例以及该剩余内存比例对应的云磁盘内存收缩比例,根据所述云磁盘内存收缩比例降低所述云磁盘的内存。
[0184] 在本实施例中,还实现以下步骤:
[0185] 判断所述云磁盘的剩余内存是否大于或等于第一阈值小于或等于第二阈值;若所述云磁盘的剩余内存小于或等于第二阈值,则确定所述运行状态为云磁盘存储资源不足;根据所述运行状态确定用户对所述云产品的资源量需求为扩充云磁盘内存;获取云磁盘的剩余内存比例以及该剩余内存比例对应的云磁盘内存扩大比例,根据所述云磁盘内存扩大比例扩充所述云磁盘的内存。
[0186] 所述计算机可读存储介质可以是前述设备的内部存储单元,例如设备的硬盘或内存。所述计算机可读存储介质也可以是所述设备的外部存储设备,例如所述设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述计算机可读存储介质还可以既包括所述设备的内部存储单元也包括外部存储设备。
[0187] 所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0188] 在本申请所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
[0189] 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
[0190] 另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元106中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0191] 所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0192] 以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。