信息处理方法、装置、电子设备和介质转让专利
申请号 : CN202010526056.6
文献号 : CN111698131B
文献日 : 2021-10-08
发明人 : 宋童瑶 , 成理嘉 , 张严诺 , 王亚军
申请人 : 中国工商银行股份有限公司
摘要 :
权利要求 :
1.一种信息处理方法,包括:每隔第一预设时间段向虚拟服务器发送探测请求;
在来自所述虚拟服务器的应答响应指示所述虚拟服务器异常的情况下,获取所述虚拟服务器的运行信息,其中,所述应答响应为所述虚拟服务器响应于所述探测请求而生成的;
基于所述运行信息,确定导致所述虚拟服务器异常的异常原因;以及基于所述异常原因,对所述虚拟服务器进行处理,以降低所述虚拟服务器的异常程度;
其中,所述基于所述异常原因,对所述虚拟服务器进行处理包括:确定所述虚拟服务器所在的预定区域中无法提供服务的其他虚拟服务器的总数量;
在所述总数量大于预设阈值的情况下,将所述预定区域的负载均衡地址删除。
2.根据权利要求1所述的方法,其中,所述获取所述虚拟服务器的运行信息包括以下至少一种:
调用所述虚拟服务器的日志下载接口,以获取所述虚拟服务器的日志;
从所述虚拟服务器获取所述虚拟服务器运行计算机程序过程中所生成的系统文件;
调用所述虚拟服务器的监控接口和管理接口,以从所述监控接口和管理接口获取所述虚拟服务器的当前运行状态。
3.根据权利要求2所述的方法,其中,所述基于所述运行信息,确定导致所述虚拟服务器异常的异常原因包括以下至少一种:根据所述日志中记录的关键字符来确定异常原因;
分析所述系统文件中线程的执行栈和Java虚拟机的栈中对象使用情况来确定异常原因;
将所述当前运行状态与历史运行状态进行比对来确定异常原因。
4.根据权利要求1所述的方法,其中,所述基于所述异常原因,对所述虚拟服务器进行处理还包括:
获取所述虚拟服务器的当前访问量和访问等待时间;
在所述当前访问量大于预设数量并且所述访问等待时间大于预设时间的情况下,生成对所述虚拟服务器的服务水平进行降级的降级请求,并且向电子设备发送所述降级请求;
以及
响应于接收到所述电子设备针对所述降级请求的确定信息,对所述虚拟服务器的服务水平进行降级。
5.根据权利要求4所述的方法,还包括:在对所述虚拟服务器进行降级操作之后,每隔第二预设时间段,重新获取所述虚拟服务器的运行信息;以及
在确定重新获取到的所述虚拟服务器的运行信息不满足降级条件的情况下,恢复所述虚拟服务器的服务水平。
6.一种信息处理装置,包括:第一发送模块,用于每隔第一预设时间段向虚拟服务器发送探测请求;
第一获取模块,用于在来自所述虚拟服务器的应答响应指示所述虚拟服务器异常的情况下,获取所述虚拟服务器的运行信息,其中,所述应答响应为所述虚拟服务器响应于所述探测请求而生成的;
第一确定模块,用于基于所述运行信息,确定导致所述虚拟服务器异常的异常原因;以及
处理模块,用于基于所述异常原因,对所述虚拟服务器进行处理,以降低所述虚拟服务器的异常程度;
其中,所述基于所述异常原因,对所述虚拟服务器进行处理包括:确定所述虚拟服务器所在的预定区域中无法提供服务的其他虚拟服务器的总数量;
在所述总数量大于预设阈值的情况下,将所述预定区域的负载均衡地址删除。
7.根据权利要求6所述的装置,其中,所述第一获取模块用于执行以下至少一种操作:调用所述虚拟服务器的日志下载接口,以获取所述虚拟服务器的日志;
从所述虚拟服务器获取所述虚拟服务器运行计算机程序过程中所生成的系统文件;
调用所述虚拟服务器的监控接口和管理接口,以从所述监控接口和管理接口获取所述虚拟服务器的当前运行状态。
8.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求1~5任意一项所述的方法。
9.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行如权利要求1~5任意一项所述的方法。
说明书 :
信息处理方法、装置、电子设备和介质
技术领域
背景技术
者很难提前发现虚拟服务器异常,更难以确定虚拟服务器的异常原因,更不可能及时地对
异常虚拟服务器进行处理,以降低虚拟服务异常程度。
发明内容
下,获取所述虚拟服务器的运行信息,其中,所述应答响应为所述虚拟服务器响应于所述探
测请求而生成的;基于所述运行信息,确定导致所述虚拟服务器异常的异常原因;以及基于
所述异常原因,对所述虚拟服务器进行处理,以降低所述虚拟服务器的异常程度。
所述虚拟服务器运行计算机程序过程中所生成的系统文件;调用所述虚拟服务器的监控接
口和管理接口,以从所述监控接口和管理接口获取所述虚拟服务器的当前运行状态。
文件中线程的执行栈和Java虚拟机的栈中对象使用情况来确定异常原因;将所述当前运行
状态与历史运行状态进行比对来确定异常原因。
量大于预设阈值的情况下,将所述所述预定区域的负载均衡地址删除。
访问等待时间大于预设时间的情况下,生成对所述虚拟服务器的服务水平进行降级的降级
请求,并且向电子设备发送所述降级请求;以及响应于接收到所述电子设备针对所述降级
请求的确定信息,对所述虚拟服务器的服务水平进行降级。
虚拟服务器的运行信息不满足降级条件的情况下,恢复所述虚拟服务器的服务水平。
应答响应指示所述虚拟服务器异常的情况下,获取所述虚拟服务器的运行信息,其中,所述
应答响应为所述虚拟服务器响应于所述探测请求而生成的;第一确定模块,用于基于所述
运行信息,确定导致所述虚拟服务器异常的异常原因;以及处理模块,用于基于所述异常原
因,对所述虚拟服务器进行处理,以降低所述虚拟服务器的异常程度。
服务器运行计算机程序过程中所生成的系统文件;调用所述虚拟服务器的监控接口和管理
接口,以从所述监控接口和管理接口获取所述虚拟服务器的当前运行状态。
使得所述一个或多个处理器执行上述的方法。
附图说明
具体实施方式
节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细
节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免
不必要地混淆本公开的概念。
或添加一个或多个其他特征、步骤、操作或部件。
含义,而不应以理想化或过于刻板的方式来解释。
应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或
具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来
说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少
一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有
B和C、和/或具有A、B、C的系统等)。
下,获取所述虚拟服务器的运行信息,其中,所述应答响应为所述虚拟服务器响应于所述探
测请求而生成的;基于所述运行信息,确定导致所述虚拟服务器异常的异常原因;以及基于
所述异常原因,对所述虚拟服务器进行处理,以降低所述虚拟服务器的异常程度。
人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境
或场景。
务器中的异常虚拟服务器,以便对异常虚拟服务器进行处理。
括crontab命令的任务脚本时设定的发送探测请求的一个时间周期。
测请求而生成的。
取应用日志、系统日志和相关core文件,并且可以将该些日志下载到堡垒机本地。或者,获
取虚拟服务器的运行信息例如可以包括从虚拟服务器获取虚拟服务器运行计算机程序过
程中所生成的系统文件。系统文件,例如可以包括javacore文件和heapdump文件等。例如堡
垒机可以模拟登陆云平台来捕获容器的javacore文件和heapdump文件。或者,获取虚拟服
务器的运行信息例如可以包括通过调用虚拟服务器的监控接口和管理接口,从监控接口和
管理接口获取虚拟服务器的当前运行状态。例如可以调用云平台集群监控接口查看容器详
情中CPU使用量、内存使用量,调用中间件详情接口查看实时数据源链接池使用率、线程池、
JVMCPU、JVM内存、JVM堆大小、JVM GcCount、JVM GcTime、JVM UpTime信息。调用ETCD管理接
口对当前服务数量、服务提供方数量进行记录。
可以向用户提供服务。
抖动等偶然事件而导致的错误应答响应。
上述日志中搜索到关键字符的情况下,可以根据日志记录来确定异常原因。例如可以搜索
日志中是否包括404、403、error等表示容器异常的关键字符,并且可以根据404、403与异常
原因的对应关系来确定异常原因。或者可以根据日志中error字符对应的说明来确定异常
原因。
执行栈和java虚拟机的栈中对象使用情况等信息分析出是否存在数据库查询但长期得不
到响应而导致的系统崩溃问题,以及判断是否存在内存地址错误、非法指令、总线错误、进
程异常等系统错误。
况进行比对,确定CPU和内存的使用量是否有突增的问题。为了使得比对结果更加准确,可
以确定容器异常时刻所处的时间段,确定历史数据中该时间段的CPU和内存的使用情况。例
如还可以将当前分布式服务数量、服务提供方数量分别与同时段历史分布式服务数量、服
务提供方数量进行比对,确定当前分布式服务数量、服务提供方数量是否有锐减的问题。其
中,分布式服务数量可以是指向外提供服务的不同接口的接口数量,服务方提供数量可以
是指向外提供服务的容器的数量。
器进行处理,以降低虚拟服务器的异常程度。
从而可以确定异常原因,以便及时地对异常虚拟服务器进行处理。该信息处理方法至少部
分地解决了依赖手工,应急时效过长且不易定位原因的问题,该信息处理方法实现了一种
针对异常虚拟服务器的日志文件自动下载装置,自主监控并且精准定位问题是操作系统、
程序问题还是网络抖动等,并且减少了应急时效,可以第一时间将问题容器进行隔离,并根
据实际情况对异常虚拟服务器进行处理,大幅提升运维工作效率,有效降低运维成本。
拟服务器的总数量。
津园区等其他园区处理。
员设置的用来计算访问量的时间周期,例如可以是一分钟。
每个功能接口的功能接口信息。即,功能包可以记录功能接口响应请求的结果(例如,响应
成功、响应失败、超时、拒绝访问)。降级器可以访问该M个功能包来获取每个功能接口响应
请求的结果,从而可以根据响应请求的结果来确定当前访问量和访问等待时间。
级请求。
垒机可以向管理者的终端设备发送该降级请求,以便管理者决定是否对该虚拟服务器的服
务水平进行降级操作。
可以包括搜索控件和推荐窗口。用户可以利用搜索控件搜索符合需求的产品,推荐窗口可
以向用户推荐产品。对虚拟服务器的服务水平进行降级例如可以是关闭推荐窗口向用户推
荐产品的功能。
来提高虚拟服务的服务水平。
于大量的超时等待,继而导致服务调用者不可用,并且在整个链路上传导,继而可能会引起
系统的整体瘫痪。因此,根据本公开的实施例,可以在大部分服务提供者都不能提供正常服
务的情况下,向管理者发送告警信息,以便管理者能够及时告知该调用链路上的该服务提
供者的上下游。该服务提供者的上游可以是调用该服务提供者的虚拟服务器,该服务提供
者的下游可以是被该服务提供者调用的虚拟服务器。
台进行监控。
务,则可以执行操作S609,若确定异常容器所在的园区多余2/3的容器可以对外服务,则可
以执行操作S612。
间未响应或者网络超时等现象,则可以执行操作S611,若确定不存在访问量激增,且有服务
长时间未响应或者网络超时等现象,则可以执行操作S612。
息,其中,所述应答响应为所述虚拟服务器响应于所述探测请求而生成的。
拟服务器运行计算机程序过程中所生成的系统文件;调用所述虚拟服务器的可调用接口,
以从所述可调用接口获取所述虚拟服务器的当前运行状态。
对象使用情况来确定异常原因;将所述当前运行状态与历史运行状态进行比对来确定异常
原因。
所述区域的负载均衡地址删除。
情况下,生成对所述虚拟服务器的服务水平进行降级的降级请求,并且向电子设备发送所
述降级请求;以及响应于接收到电子设备针对所述降级请求的确定信息,对所述虚拟服务
器的服务水平进行降级。
息;以及第二确定模块,用于在确定重新获取到的所述虚拟服务器的运行信息不满足降级
条件的情况下,恢复所述虚拟服务器的服务水平。
元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、
单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门
阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电
路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实
现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实
现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分
地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结
合,并在一个模块中实现。根据本公开的实施例,第一发送模块710、第一获取模块720、第一
确定模块730和处理模块740中的至少一个可以至少被部分地实现为硬件电路,例如现场可
编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用
集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件
来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合
来实现。或者,第一发送模块710、第一获取模块720、第一确定模块730和处理模块740中的
至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以
执行相应的功能。
中的程序而执行各种适当的动作和处理。处理器801例如可以包括通用微处理器(例如
CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等
等。处理器801还可以包括用于缓存用途的板载存储器。处理器801可以包括用于执行根据
本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除
ROM 802和RAM 803以外的一个或多个存储器中。处理器801也可以通过执行存储在所述一
个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
中的一项或多项:包括键盘、鼠标等的输入部分807;包括诸如阴极射线管(CRT)、液晶显示
器(LCD)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如LAN卡、
调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信
处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、
半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需
要被安装入存储部分808。
的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施
例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811
被安装。在该计算机程序被处理器801执行时,执行本公开实施例的系统中限定的上述功
能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序
模块来实现。
系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被
执行时,实现根据本公开实施例的方法。
(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD‑ROM)、光
存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可
以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或
者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的
ROM 802和/或RAM 803和/或ROM 802和RAM 803以外的一个或多个存储器。
表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个
用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所
标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际
上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要
注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规
定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组
合来实现。
不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可
以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱
离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本
公开的范围之内。