信息处理方法、装置、电子设备和介质转让专利

申请号 : CN202010526056.6

文献号 : CN111698131B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 宋童瑶成理嘉张严诺王亚军

申请人 : 中国工商银行股份有限公司

摘要 :

本公开提供了信息处理方法,包括:每隔第一预设时间段向虚拟服务器发送探测请求;在来自所述虚拟服务器的应答响应指示所述虚拟服务器异常的情况下,获取所述虚拟服务器的运行信息,其中,所述应答响应为所述虚拟服务器响应于所述探测请求而生成的;基于所述运行信息,确定导致所述虚拟服务器异常的异常原因;以及基于所述异常原因,对所述虚拟服务器进行处理,以降低所述虚拟服务器的异常程度。本公开还提供了一种信息处理装置、电子设备和介质。

权利要求 :

1.一种信息处理方法,包括:每隔第一预设时间段向虚拟服务器发送探测请求;

在来自所述虚拟服务器的应答响应指示所述虚拟服务器异常的情况下,获取所述虚拟服务器的运行信息,其中,所述应答响应为所述虚拟服务器响应于所述探测请求而生成的;

基于所述运行信息,确定导致所述虚拟服务器异常的异常原因;以及基于所述异常原因,对所述虚拟服务器进行处理,以降低所述虚拟服务器的异常程度;

其中,所述基于所述异常原因,对所述虚拟服务器进行处理包括:确定所述虚拟服务器所在的预定区域中无法提供服务的其他虚拟服务器的总数量;

在所述总数量大于预设阈值的情况下,将所述预定区域的负载均衡地址删除。

2.根据权利要求1所述的方法,其中,所述获取所述虚拟服务器的运行信息包括以下至少一种:

调用所述虚拟服务器的日志下载接口,以获取所述虚拟服务器的日志;

从所述虚拟服务器获取所述虚拟服务器运行计算机程序过程中所生成的系统文件;

调用所述虚拟服务器的监控接口和管理接口,以从所述监控接口和管理接口获取所述虚拟服务器的当前运行状态。

3.根据权利要求2所述的方法,其中,所述基于所述运行信息,确定导致所述虚拟服务器异常的异常原因包括以下至少一种:根据所述日志中记录的关键字符来确定异常原因;

分析所述系统文件中线程的执行栈和Java虚拟机的栈中对象使用情况来确定异常原因;

将所述当前运行状态与历史运行状态进行比对来确定异常原因。

4.根据权利要求1所述的方法,其中,所述基于所述异常原因,对所述虚拟服务器进行处理还包括:

获取所述虚拟服务器的当前访问量和访问等待时间;

在所述当前访问量大于预设数量并且所述访问等待时间大于预设时间的情况下,生成对所述虚拟服务器的服务水平进行降级的降级请求,并且向电子设备发送所述降级请求;

以及

响应于接收到所述电子设备针对所述降级请求的确定信息,对所述虚拟服务器的服务水平进行降级。

5.根据权利要求4所述的方法,还包括:在对所述虚拟服务器进行降级操作之后,每隔第二预设时间段,重新获取所述虚拟服务器的运行信息;以及

在确定重新获取到的所述虚拟服务器的运行信息不满足降级条件的情况下,恢复所述虚拟服务器的服务水平。

6.一种信息处理装置,包括:第一发送模块,用于每隔第一预设时间段向虚拟服务器发送探测请求;

第一获取模块,用于在来自所述虚拟服务器的应答响应指示所述虚拟服务器异常的情况下,获取所述虚拟服务器的运行信息,其中,所述应答响应为所述虚拟服务器响应于所述探测请求而生成的;

第一确定模块,用于基于所述运行信息,确定导致所述虚拟服务器异常的异常原因;以及

处理模块,用于基于所述异常原因,对所述虚拟服务器进行处理,以降低所述虚拟服务器的异常程度;

其中,所述基于所述异常原因,对所述虚拟服务器进行处理包括:确定所述虚拟服务器所在的预定区域中无法提供服务的其他虚拟服务器的总数量;

在所述总数量大于预设阈值的情况下,将所述预定区域的负载均衡地址删除。

7.根据权利要求6所述的装置,其中,所述第一获取模块用于执行以下至少一种操作:调用所述虚拟服务器的日志下载接口,以获取所述虚拟服务器的日志;

从所述虚拟服务器获取所述虚拟服务器运行计算机程序过程中所生成的系统文件;

调用所述虚拟服务器的监控接口和管理接口,以从所述监控接口和管理接口获取所述虚拟服务器的当前运行状态。

8.一种电子设备,包括:

一个或多个处理器;

存储装置,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求1~5任意一项所述的方法。

9.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行如权利要求1~5任意一项所述的方法。

说明书 :

信息处理方法、装置、电子设备和介质

技术领域

[0001] 本公开涉及计算机技术领域,更具体地,涉及一种信息处理方法、装置、电子设备和介质。

背景技术

[0002] 在云计算时代,管理者面对的是成千甚至上万个虚拟服务器。然而,当虚拟服务器异常程度达到一定阈值时,该虚拟服务器往往会被自动销毁,其运行信息也随之消失。管理
者很难提前发现虚拟服务器异常,更难以确定虚拟服务器的异常原因,更不可能及时地对
异常虚拟服务器进行处理,以降低虚拟服务异常程度。

发明内容

[0003] 有鉴于此,本公开提供了一种信息处理方法、装置、电子设备和介质。
[0004] 本公开的一个方面提供了一种信息处理方法,包括:每隔第一预设时间段向虚拟服务器发送探测请求;在来自所述虚拟服务器的应答响应指示所述虚拟服务器异常的情况
下,获取所述虚拟服务器的运行信息,其中,所述应答响应为所述虚拟服务器响应于所述探
测请求而生成的;基于所述运行信息,确定导致所述虚拟服务器异常的异常原因;以及基于
所述异常原因,对所述虚拟服务器进行处理,以降低所述虚拟服务器的异常程度。
[0005] 根据本公开的实施例,获取所述虚拟服务器的运行信息包括以下至少一种:调用所述虚拟服务器的日志下载接口,以获取所述虚拟服务器的日志;从所述虚拟服务器获取
所述虚拟服务器运行计算机程序过程中所生成的系统文件;调用所述虚拟服务器的监控接
口和管理接口,以从所述监控接口和管理接口获取所述虚拟服务器的当前运行状态。
[0006] 根据本公开的实施例,基于所述运行信息,确定导致所述虚拟服务器异常的异常原因包括以下至少一种:根据所述日志中记录的关键字符来确定异常原因;分析所述系统
文件中线程的执行栈和Java虚拟机的栈中对象使用情况来确定异常原因;将所述当前运行
状态与历史运行状态进行比对来确定异常原因。
[0007] 根据本公开的实施例,基于所述异常原因,对所述虚拟服务器进行处理包括:确定所述虚拟服务器所在的预定区域中无法提供服务的其他虚拟服务器的总数量;在所述总数
量大于预设阈值的情况下,将所述所述预定区域的负载均衡地址删除。
[0008] 根据本公开的实施例,基于所述异常原因,对所述虚拟服务器进行处理包括:获取所述虚拟服务器的当前访问量和访问等待时间;在所述当前防问量大于预设数量并且所述
访问等待时间大于预设时间的情况下,生成对所述虚拟服务器的服务水平进行降级的降级
请求,并且向电子设备发送所述降级请求;以及响应于接收到所述电子设备针对所述降级
请求的确定信息,对所述虚拟服务器的服务水平进行降级。
[0009] 根据本公开的实施例,该方法还包括:在对所述虚拟服务器进行降级操作之后,每隔第二预设时间段,重新获取所述虚拟服务器的运行信息;以及在确定重新获取到的所述
虚拟服务器的运行信息不满足降级条件的情况下,恢复所述虚拟服务器的服务水平。
[0010] 本公开的另一个方面提供了一种信息处理装置,包括:第一发送模块,用于每隔第一预设时间段向虚拟服务器发送探测请求;第一获取模块,用于在来自所述虚拟服务器的
应答响应指示所述虚拟服务器异常的情况下,获取所述虚拟服务器的运行信息,其中,所述
应答响应为所述虚拟服务器响应于所述探测请求而生成的;第一确定模块,用于基于所述
运行信息,确定导致所述虚拟服务器异常的异常原因;以及处理模块,用于基于所述异常原
因,对所述虚拟服务器进行处理,以降低所述虚拟服务器的异常程度。
[0011] 根据本公开的实施例,第一获取模块用于执行以下至少一种操作:调用所述虚拟服务器的日志下载接口,以获取所述虚拟服务器的日志;从所述虚拟服务器获取所述虚拟
服务器运行计算机程序过程中所生成的系统文件;调用所述虚拟服务器的监控接口和管理
接口,以从所述监控接口和管理接口获取所述虚拟服务器的当前运行状态。
[0012] 本公开的另一个方面提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,
使得所述一个或多个处理器执行上述的方法。
[0013] 本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
[0014] 本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。

附图说明

[0015] 通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
[0016] 图1示意性示出了根据本公开实施例的适用于实现信息处理方法的系统架构;
[0017] 图2示意性示出了根据本公开实施例的信息处理方法的流程图;
[0018] 图3示意性示出了根据本公开实施例的基于异常原因对虚拟服务器进行处理的方法流程图;
[0019] 图4示意性示出了根据本公开另一实施例的基于异常原因对虚拟服务器进行处理的方法流程图;
[0020] 图5示意性示出了根据本公开另一实施例的基于异常原因对虚拟服务器进行处理的方法流程图;
[0021] 图6示意性示出了根据本公开另一实施例的信息处理方法流程图;
[0022] 图7示意性示出了根据本公开实施例的信息处理装置的方框图;以及
[0023] 图8示意性示出了根据本公开实施例的电子设备的方框图。

具体实施方式

[0024] 以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细
节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细
节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免
不必要地混淆本公开的概念。
[0025] 在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在
或添加一个或多个其他特征、步骤、操作或部件。
[0026] 在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的
含义,而不应以理想化或过于刻板的方式来解释。
[0027] 在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”
应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或
具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来
说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少
一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有
B和C、和/或具有A、B、C的系统等)。
[0028] 本公开的实施例提供了一种信息处理方法,包括:每隔第一预设时间段向虚拟服务器发送探测请求;在来自所述虚拟服务器的应答响应指示所述虚拟服务器异常的情况
下,获取所述虚拟服务器的运行信息,其中,所述应答响应为所述虚拟服务器响应于所述探
测请求而生成的;基于所述运行信息,确定导致所述虚拟服务器异常的异常原因;以及基于
所述异常原因,对所述虚拟服务器进行处理,以降低所述虚拟服务器的异常程度。
[0029] 图1示意性示出了根据本公开实施例的适用于实现信息处理方法的系统架构100。需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术
人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境
或场景。
[0030] 如图1所示,该系统架构中包括云平台110和堡垒机120。
[0031] 云平台110可以包括多个虚拟服务器,堡垒机120例如可以执行根据本公开实施例的信息处理方法,以对该云平台110中的多个虚拟服务器进行监控,以及时发生多个虚拟服
务器中的异常虚拟服务器,以便对异常虚拟服务器进行处理。
[0032] 下面结合图2~图6说明根据本公开实施例的信息处理方法。
[0033] 图2示意性示出了根据本公开实施例的信息处理方法的流程图。
[0034] 如图2所示,该信息处理方法可以包括操作S201~S204。
[0035] 在操作S201,每隔第一预设时间段向虚拟服务器发送探测请求。
[0036] 根据本公开的实施例,例如在Unix或者Linux操作系统中,可以使用crontab命令设置周期性发送探测请求的任务。第一预设时间段,例如可以是本领域技术人员在编写包
括crontab命令的任务脚本时设定的发送探测请求的一个时间周期。
[0037] 根据本公开的实施例,虚拟服务器例如可以是容器。
[0038] 在操作S202,在来自所述虚拟服务器的应答响应指示所述虚拟服务器异常的情况下,获取所述虚拟服务器的运行信息,其中,所述应答响应为所述虚拟服务器响应于所述探
测请求而生成的。
[0039] 根据本公开的实施例,例如可以是在容器接收到探测请求后,可以对自身的运行情况进行探测而获得针对探测请求的应答响应,并且可以向堡垒机发送该应答响应。
[0040] 在来自容器的应答响应指示该容器异常的情况下,堡垒机例如可以获取该容器的运行信息。
[0041] 根据本公开的实施例,获取虚拟服务器的运行信息例如可以包括通过调用虚拟服务器的日志下载接口,从日志下载接口获取虚拟服务器的日志。调用日志下载接口可以获
取应用日志、系统日志和相关core文件,并且可以将该些日志下载到堡垒机本地。或者,获
取虚拟服务器的运行信息例如可以包括从虚拟服务器获取虚拟服务器运行计算机程序过
程中所生成的系统文件。系统文件,例如可以包括javacore文件和heapdump文件等。例如堡
垒机可以模拟登陆云平台来捕获容器的javacore文件和heapdump文件。或者,获取虚拟服
务器的运行信息例如可以包括通过调用虚拟服务器的监控接口和管理接口,从监控接口和
管理接口获取虚拟服务器的当前运行状态。例如可以调用云平台集群监控接口查看容器详
情中CPU使用量、内存使用量,调用中间件详情接口查看实时数据源链接池使用率、线程池、
JVMCPU、JVM内存、JVM堆大小、JVM GcCount、JVM GcTime、JVM UpTime信息。调用ETCD管理接
口对当前服务数量、服务提供方数量进行记录。
[0042] 根据本公开的实施例,在来自容器的应答响应指示该容器异常的情况下,堡垒机还可以向该容器发送http请求,以验证该容器是否可以响应http请求,以确定该容器是否
可以向用户提供服务。
[0043] 根据本公开的实施例,在来自容器的应答响应指示该容器异常的情况下,堡垒机还可以再次向容器发送探测请求,以再次确定该容器是否异常,至少部分地避免由于网络
抖动等偶然事件而导致的错误应答响应。
[0044] 在操作S203,基于所述运行信息,确定导致所述虚拟服务器异常的异常原因。
[0045] 根据本公开的实施例,例如可以是根据日志中记录的关键字符来确定异常原因。例如可以对堡垒机本地存储的应用日志、系统日志和相关core文件进行关键字符搜索,当
上述日志中搜索到关键字符的情况下,可以根据日志记录来确定异常原因。例如可以搜索
日志中是否包括404、403、error等表示容器异常的关键字符,并且可以根据404、403与异常
原因的对应关系来确定异常原因。或者可以根据日志中error字符对应的说明来确定异常
原因。
[0046] 根据本公开的实施例,例如可以是分析系统文件中线程的执行栈和Java虚拟机的栈中对象使用情况来确定异常原因。例如可以通过javacore文件、heapdump文件中线程的
执行栈和java虚拟机的栈中对象使用情况等信息分析出是否存在数据库查询但长期得不
到响应而导致的系统崩溃问题,以及判断是否存在内存地址错误、非法指令、总线错误、进
程异常等系统错误。
[0047] 根据本公开的实施例,例如可以是将当前运行状态与历史运行状态进行比对来确定异常原因例如将容器的当前CPU和内存的使用情况与该容器的历史CPU和内存的使用情
况进行比对,确定CPU和内存的使用量是否有突增的问题。为了使得比对结果更加准确,可
以确定容器异常时刻所处的时间段,确定历史数据中该时间段的CPU和内存的使用情况。例
如还可以将当前分布式服务数量、服务提供方数量分别与同时段历史分布式服务数量、服
务提供方数量进行比对,确定当前分布式服务数量、服务提供方数量是否有锐减的问题。其
中,分布式服务数量可以是指向外提供服务的不同接口的接口数量,服务方提供数量可以
是指向外提供服务的容器的数量。
[0048] 根据本公开的实施例,例如还可以调用配置管理接口读取配置中心的环境变量、存储挂载、资源设置、端口设置、负载均衡设置是有误,判断与历史配置相比是否有修改。
[0049] 根据本公开的实施例,例如还可以是当监控到连接超时、服务响应时间过长、网络长时间未响应等情况时,结合应用日志判断是否有访问量激增的问题。
[0050] 根据本公开的实施例,例如可以通过对运行信息进行分析来定位容器异常原因是操作系统的问题、运行程序的问题、网络抖动还是访问量突增。
[0051] 在操作S204,基于异常原因,对虚拟服务器进行处理,以降低虚拟服务器的异常程度。
[0052] 根据本公开的实施例,在确定异常原因后,可以对异常的虚拟服务器进行隔离操作,使得其他设备不在访问该异常的虚拟服务器。然后在根据异常原因,对异常的虚拟服务
器进行处理,以降低虚拟服务器的异常程度。
[0053] 根据本公开的实施例,该信息处理方法能够定时地向虚拟服务器发送探测请求,在针对该探测请求的应答响应指示虚拟服务器异常的情况下,能够及时地获取运行信息,
从而可以确定异常原因,以便及时地对异常虚拟服务器进行处理。该信息处理方法至少部
分地解决了依赖手工,应急时效过长且不易定位原因的问题,该信息处理方法实现了一种
针对异常虚拟服务器的日志文件自动下载装置,自主监控并且精准定位问题是操作系统、
程序问题还是网络抖动等,并且减少了应急时效,可以第一时间将问题容器进行隔离,并根
据实际情况对异常虚拟服务器进行处理,大幅提升运维工作效率,有效降低运维成本。
[0054] 图3示意性示出了根据本公开实施例的基于异常原因对虚拟服务器进行处理的方法流程图。
[0055] 如图3所示,该方法可以包括操作在前述实施例的基础上还可以包括操作S214~S224。
[0056] 在操作S214,确定虚拟服务器所在的预定区域中无法提供服务的其他虚拟服务器的总数量。
[0057] 例如可以确定虚拟服务器所在的园区中无法提供服务的虚拟服务器的总数量。例如存在异常的虚拟服务器所在的预定区域为北京园区,确定北京园区中无法提供服务的虚
拟服务器的总数量。
[0058] 根据本公开的实施例,总数量可以是本领域技术人员根据实际情况而设定的,总数量例如可以是该园区虚拟服务器数量的1/3。
[0059] 在操作S224,在总数量大于预设阈值的情况下,将预定区域的负载均衡地址删除。
[0060] 根据本公开的实施例,将预定区域的负载均衡地址删除,使得对预定区域中虚拟服务器的访问切换为对其他区域中虚拟服务器的访问。
[0061] 例如可以是在北京园区中有1/3的虚拟服务器数量都存在异常的情况下,可以将北京园区的负载均衡地址删除,使得对北京园区虚拟服务器的访问切换为由上海园区、天
津园区等其他园区处理。
[0062] 图4示意性示出了根据本公开另一实施例的基于异常原因对虚拟服务器进行处理的方法流程图。
[0063] 如图4所示,该方法可以包括操作S234~S254。
[0064] 在操作S234,获取所述虚拟服务器的当前访问量和访问等待时间。
[0065] 根据本公开的实施例,当前访问量例如可以是堡垒机检测到虚拟服务器异常的时刻所在的一个计算周期内外部设备对虚拟服务器的访问量。计算周期可以是本领域技术人
员设置的用来计算访问量的时间周期,例如可以是一分钟。
[0066] 访问等待时间可以是访问虚拟服务器的访问请求等待虚拟服务器响应的等待时间。
[0067] 根据本公开的实施例,例如可以在堡垒机中设置降级器,每个降级器可以维护M(M为大于0的整数)个的功能包,每个功能包里面可以记录N(N为大于0的整数)个功能接口中
每个功能接口的功能接口信息。即,功能包可以记录功能接口响应请求的结果(例如,响应
成功、响应失败、超时、拒绝访问)。降级器可以访问该M个功能包来获取每个功能接口响应
请求的结果,从而可以根据响应请求的结果来确定当前访问量和访问等待时间。
[0068] 在操作S244,在当前访问量大于预设数量并且所述访问等待时间大于预设时间的情况下,生成对虚拟服务器的服务水平进行降级的降级请求,并且向电子设备发送所述降
级请求。
[0069] 根据本公开的实施例,预设数量和预设时间可以是本领域技术人员根据经验设置的。
[0070] 例如可以是在堡垒机确定当前访问量大于预设数量并且访问等待时间大于预设时间的情况下,堡垒机可以生成对虚拟服务器的服务水平的进行降级的降级请求,并且堡
垒机可以向管理者的终端设备发送该降级请求,以便管理者决定是否对该虚拟服务器的服
务水平进行降级操作。
[0071] 在操作S254,响应于接收到电子设备针对降级请求的确定信息,对虚拟服务器的服务水平进行降级。
[0072] 根据本公开的实施例,例如可以是响应于接收到来自管理者的终端设备的确定信息,对虚拟服务器的服务水平进行降级。
[0073] 根据本公开的实施例,对虚拟服务器的服务水平进行降级例如可以是关闭虚拟服务器提供的某些功能。例如该虚拟服务器可以为应用程序提供交互页面,该交互页面至少
可以包括搜索控件和推荐窗口。用户可以利用搜索控件搜索符合需求的产品,推荐窗口可
以向用户推荐产品。对虚拟服务器的服务水平进行降级例如可以是关闭推荐窗口向用户推
荐产品的功能。
[0074] 图5示意性示出了根据本公开另一实施例的基于异常原因对虚拟服务器进行处理的方法流程图。
[0075] 如图5所示,该方法可以在前述实施例的基础上还可以包括操作S501~S502。
[0076] 在操作S501,在对虚拟服务器进行降级操作之后,每隔第二预设时间段,重新获取虚拟服务器的运行信息。
[0077] 例如可以获取虚拟服务器的当前访问量和所述虚拟服务器未响应的访问的等待时间。
[0078] 第二预设时间段可以是本领域技术人员自行设置的,例如可以是10秒。
[0079] 例如可以是重新确定当前访问量是否大于预设数量,等待时间是否大于预设时间。
[0080] 在操作S502,在确定重新获取到的所述虚拟服务器的运行信息不满足降级条件的情况下,恢复虚拟服务器的服务水平。
[0081] 降级条件例如可以是当前访问量大于预设数量,访问等待时间大于预设时间。
[0082] 恢复虚拟服务器的服务水平,例如可以是提高虚拟服务器的当前服务水平,使得虚拟服务器的服务水平与降级前的水平一致。例如可以通过增加虚拟服务器所提供的功能
来提高虚拟服务的服务水平。
[0083] 根据本公开的实施例,分布式服务架构的系统中,一个调用链路上,由各个服务组成一个整体,牵一发而动全身。当某个服务提供者(即,虚拟服务器)因各种原因不可用,由
于大量的超时等待,继而导致服务调用者不可用,并且在整个链路上传导,继而可能会引起
系统的整体瘫痪。因此,根据本公开的实施例,可以在大部分服务提供者都不能提供正常服
务的情况下,向管理者发送告警信息,以便管理者能够及时告知该调用链路上的该服务提
供者的上下游。该服务提供者的上游可以是调用该服务提供者的虚拟服务器,该服务提供
者的下游可以是被该服务提供者调用的虚拟服务器。
[0084] 图6示意性示出了根据本公开另一实施例的信息处理方法流程图。
[0085] 如图6所示,该信息处理方法可以包括操作S601~S612。
[0086] 在操作S601,堡垒机根据计划任务实时对云平台监控。例如可以是执行上文参考图2描述的操作S201,每隔第一预设时间段向虚拟服务器发送探测请求。
[0087] 在操作S602,根据容器对探测请求的应答响应,确定是否有容器异常。若确定存在容器异常,则可以执行操作S603。若不存在容器异常,则可以执行操作S601,即,继续对云平
台进行监控。
[0088] 在操作S603,堡垒机的日志收集模块主动获取javacore、heapdump文件。
[0089] 在操作S604,下载应用日志、系统日志和相关core文件到堡垒机本地。
[0090] 在操作S605,堡垒机可以调用监控接口和管理接口,查看容器的运行状态。
[0091] 在操作S606,堡垒机的分析决策模块结合应用日志、系统日志和相关core文件和运行状态定位问题原因。
[0092] 在操作S607,堡垒机的应急处理模块调用云平台接口对异常容器自动隔离。
[0093] 在操作S608,确定异常容器所在的园区是否有1/3的容器无法对外服务。例如可以执行上传参考图3描述的操作S214。若确定异常容器所在的园区有1/3的容器无法对外服
务,则可以执行操作S609,若确定异常容器所在的园区多余2/3的容器可以对外服务,则可
以执行操作S612。
[0094] 在操作S609,应急处理模块调用云平台接口进行流量切换。例如可以执行上传参考图3描述的操作S224。
[0095] 在操作S610,确定是否存在访问量激增,且有服务长时间未响应或者网络超时等现象。例如可以执行上传参考图4描述的操作S234。若确定存在访问量激增,且有服务长时
间未响应或者网络超时等现象,则可以执行操作S611,若确定不存在访问量激增,且有服务
长时间未响应或者网络超时等现象,则可以执行操作S612。
[0096] 在操作S611,应急处理模块调用云平台接口进行服务降级。例如可以执行上传参考图4描述的操作S244和S254。
[0097] 在操作S612,完成应急操作后,堡垒机可以通过邮件或者短信通知管理人员。
[0098] 图7示意性示出了根据本公开实施例的信息处理装置700的方框图。
[0099] 如图7所示,信息处理装置700可以包括第一发送模块710、第一获取模块720、第一确定模块730和处理模块740。
[0100] 第一发送模块710,例如可以执行上传参考图2描述的操作S201,用于每隔第一预设时间段向虚拟服务器发送探测请求。
[0101] 第一获取模块720,例如可以执行上传参考图2描述的操作S202,用于在来自所述虚拟服务器的应答响应指示所述虚拟服务器异常的情况下,获取所述虚拟服务器的运行信
息,其中,所述应答响应为所述虚拟服务器响应于所述探测请求而生成的。
[0102] 第一确定模块730,例如可以执行上传参考图2描述的操作S203,用于基于所述运行信息,确定导致所述虚拟服务器异常的异常原因。
[0103] 处理模块740,例如可以执行上传参考图2描述的操作S204,用于基于所述异常原因,对所述虚拟服务器进行处理,以降低所述虚拟服务器的异常程度。
[0104] 根据本公开的实施例,第一获取模块720用于执行以下至少一种操作:调用所述虚拟服务器的日志下载接口,以获取所述虚拟服务器的日志;从所述虚拟服务器获取所述虚
拟服务器运行计算机程序过程中所生成的系统文件;调用所述虚拟服务器的可调用接口,
以从所述可调用接口获取所述虚拟服务器的当前运行状态。
[0105] 根据本公开的实施例,第一确定模块730用于执行以下至少一种:根据所述日志中记录的关键字符来确定异常原因;分析所述系统文件中线程的执行栈和Java虚拟机的栈中
对象使用情况来确定异常原因;将所述当前运行状态与历史运行状态进行比对来确定异常
原因。
[0106] 根据本公开的实施例,处理模块740可以执行:确定所述虚拟服务器所在的预定区域中无法提供服务的其他虚拟服务器的总数量;在所述总数量大于预设阈值的情况下,将
所述区域的负载均衡地址删除。
[0107] 根据本公开的实施例,处理模块740可以执行:获取所述虚拟服务器的当前访问量和访问等待时间;在所述当前访问量大于预设数量并且所述防问等待时间大于预设时间的
情况下,生成对所述虚拟服务器的服务水平进行降级的降级请求,并且向电子设备发送所
述降级请求;以及响应于接收到电子设备针对所述降级请求的确定信息,对所述虚拟服务
器的服务水平进行降级。
[0108] 根据本公开的实施例,信息处理装置700还可以包括第二获取模块,用于在对所述虚拟服务器进行降级操作之后,每隔第二预设时间段,重新获取所述虚拟服务器的运行信
息;以及第二确定模块,用于在确定重新获取到的所述虚拟服务器的运行信息不满足降级
条件的情况下,恢复所述虚拟服务器的服务水平。
[0109] 根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单
元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、
单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门
阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电
路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实
现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实
现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分
地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
[0110] 例如,第一发送模块710、第一获取模块720、第一确定模块730和处理模块740中的任意多个可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。
或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结
合,并在一个模块中实现。根据本公开的实施例,第一发送模块710、第一获取模块720、第一
确定模块730和处理模块740中的至少一个可以至少被部分地实现为硬件电路,例如现场可
编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用
集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件
来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合
来实现。或者,第一发送模块710、第一获取模块720、第一确定模块730和处理模块740中的
至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以
执行相应的功能。
[0111] 图8示意性示出了根据本公开实施例的电子设备的方框图。图8示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
[0112] 如图8所示,根据本公开实施例的计算机电子设备800包括处理器801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分808加载到随机访问存储器(RAM)803
中的程序而执行各种适当的动作和处理。处理器801例如可以包括通用微处理器(例如
CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等
等。处理器801还可以包括用于缓存用途的板载存储器。处理器801可以包括用于执行根据
本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
[0113] 在RAM 803中,存储有电子设备800操作所需的各种程序和数据。处理器801、ROM 802以及RAM 803通过总线804彼此相连。处理器801通过执行ROM 802和/或RAM 803中的程
序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除
ROM 802和RAM 803以外的一个或多个存储器中。处理器801也可以通过执行存储在所述一
个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
[0114] 根据本公开的实施例,电子设备800还可以包括输入/输出(I/O)接口805,输入/输出(I/O)接口805也连接至总线804。电子设备800还可以包括连接至I/O接口805的以下部件
中的一项或多项:包括键盘、鼠标等的输入部分807;包括诸如阴极射线管(CRT)、液晶显示
器(LCD)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如LAN卡、
调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信
处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、
半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需
要被安装入存储部分808。
[0115] 根据本公开的实施例,根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上
的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施
例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811
被安装。在该计算机程序被处理器801执行时,执行本公开实施例的系统中限定的上述功
能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序
模块来实现。
[0116] 本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/
系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被
执行时,实现根据本公开实施例的方法。
[0117] 根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器
(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD‑ROM)、光
存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可
以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或
者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的
ROM 802和/或RAM 803和/或ROM 802和RAM 803以外的一个或多个存储器。
[0118] 附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代
表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个
用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所
标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际
上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要
注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规
定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组
合来实现。
[0119] 本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在
不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可
以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
[0120] 以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实
施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱
离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本
公开的范围之内。