一种面向电网业务的应用性能获取方法及装置转让专利

申请号 : CN201711434493.X

文献号 : CN108183821B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王玮苏琦刘荫于展鹏殷齐林郭爽爽徐浩穆林倪金超张宾崔晓东赵茜王晓峰刘学郑海杰马领秦垒垒邹静戚文淼何文娟

申请人 : 国网山东省电力公司信息通信公司国家电网公司

摘要 :

本发明公开了一种面向电网业务的应用性能获取方法,包括以下步骤:对镜像数据进行汇总,获取异常数据对应的URL,构建web事务与URL的对应关系;爬取测试环境的业务系统网页业务模块对应的URL,构建业务模块与web事务的对应关系;获取web事务分别对应的URL和业务模块,汇总URL与业务模块对应关系。本发明还公开了一种面向电网业务的应用性能获取装置,本发明不仅能直接给出导致系统问题的业务模块,将电网业务系统出现的问题及时进行排查和定位;同时,它也将极大提升系统的运行效率,降低应用系统运维成本,提升用户体验。

权利要求 :

1.一种面向电网业务的应用性能获取方法,其特征是,包括以下步骤:对镜像数据进行汇总,获取异常数据对应的URL,构建web事务与URL的对应关系,爬取测试环境的业务系统网页业务模块对应的URL,构建业务模块与web事务的对应关系,

获取web事务分别对应的URL和业务模块,汇总URL与业务模块对应关系;

所述获取异常数据对应的URL,构建web事务与URL的对应关系,包括,排查核心参数数值与基线数据存在较大偏差的异常数据,获取异常数据对应的URL,使用正则表达式抽取异常数据URL对应的web事务,构建异常数据对应的web事务与URL的哈希表;

所述获取web事务分别对应的URL和业务模块,汇总URL与业务模块对应关系,包括:从异常数据哈希表中取出一个web事务,找出测试环境中与所述web事务对应的业务模块,直至异常数据哈希表中的所有web事务遍历完成。

2.如权利要求1所述的一种面向电网业务的应用性能获取方法,其特征是,所述排查核心参数数值与基线数据存在较大偏差的异常数据,获取异常数据对应的URL步骤之前,还包括:在业务系统交换机和/或路由器处设置镜像端口,截取交换机和/或路由器端口数据发送到镜像端口。

3.如权利要求1所述的一种面向电网业务的应用性能获取方法,其特征是,所述爬取测试环境的业务系统网页业务模块对应的URL,构建业务模块与web事务的对应关系,包括,从测试环境的业务系统登录网页URL开始,爬取当前网页中所有业务模块对应的URL,直到完成全部网页的URL爬取;

使用正则表达式抽取已获取的URL对应的web事务,将web事务与业务模块名称之间的对应关系插入倒排索引表中。

4.如权利要求3所述的一种面向电网业务的应用性能获取方法,其特征是,所述从测试环境的业务系统登录网页URL开始,爬取当前网页中所有业务模块对应的URL,直到完成全部网页的URL爬取,包括:

使用网络爬虫技术,从业务系统的登录页URL开始,将此URL放入待抓取URL队列;

从待抓取队列中取出一个URL,将该URL对应的网页下载,存储到网页库中;

将已处理的URL放入到已处理URL队列中,分析已抓取URL对应网页中的其他URL,并将这些URL放入到待抓取URL队列中,进入下一轮循环,直至所有网页中的所有URL已被处理。

5.一种面向电网业务的应用性能获取装置,其特征是,包括,异常数据汇总模块,排查核心参数数值与基线数据存在较大偏差的异常数据,获取异常数据对应的URL,使用正则表达式抽取异常数据URL对应的web事务,构建构建web事务与URL的对应关系,构建异常数据对应的web事务与URL的哈希表;

业务系统数据爬取模块,爬取测试环境的业务系统网页业务模块对应的URL,构建业务模块与web事务的对应关系;

性能问题定位模块,从异常数据哈希表中取出一个web事务,获取web事务分别对应的URL和业务模块,直至异常数据哈希表中的所有web事务遍历完成,汇总URL与业务模块对应关系。

6.如权利要求5所述的一种面向电网业务的应用性能获取装置,其特征是,所述异常数据汇总模块,包括,

镜像数据获取单元,截取交换机和/或路由器端口数据发送到镜像端口,汇总镜像数据;

异常数据URL获取单元,排查核心参数数值与基线数据存在较大偏差的异常数据,获取异常数据对应的URL;

异常数据哈希表构建单元,使用正则表达式抽取异常数据URL对应的web事务,构建异常数据对应的web事务与URL的哈希表。

7.如权利要求5所述的一种面向电网业务的应用性能获取装置,其特征是,所述业务系统数据爬取模块,包括,

网页URL获取单元,将业务系统登录页URL作为种子URL,将该URL对应网页下载存储到网页库中,抓取该网页中其他URL,直至完成全部网页的全部URL抓取工作;

业务系统哈希表构建单元,使用正则表达式抽取已获取的URL对应的web事务,将web事务与业务模块名称之间的对应关系插入倒排索引表中。

说明书 :

一种面向电网业务的应用性能获取方法及装置

技术领域

[0001] 本发明涉及电力技术领域,尤其是一种在电网业务系统生产环境中,当系统运行出现异常及系统卡顿情况时,自动排查、定位导致问题的应用性能获取方法及装置。

背景技术

[0002] 电网业务系统具有明显的时段性特性,分别会出现上午和下午用户使用高峰期,往往在这两个时段,会出现网页响应慢、系统卡顿、异常等情况,用户会明显感觉出系统体
验差,对业务系统性能不满意的情况。
[0003] 随着业务系统规模的不断扩大,系统业务模块的增多,及业务系统间相互调用情况的不断涌现,都将会对当前业务系统的性能提出极大的挑战。
[0004] 当前,市面上的确出现了几种应用性能分析工具,要么是在业务系统中嵌入探针,在代码层面分析问题;要么是通过分析业务系统流量,从而判断和分析系统问题。但是,它
们均不能直接给出引起系统出现异常问题的业务模块定位,而是需要业务系统开发人员的
辅助。

发明内容

[0005] 本发明的目的是提供一种面向电网业务的应用性能获取方法及装置,自动定位和排查系统异常原因,给出导致这些原因的业务模块,增强用户体验,提升业务系统运维效
率。
[0006] 为实现上述目的,本发明采用下述技术方案:
[0007] 本发明第一发明提供了一种面向电网业务的应用性能获取方法,包括以下步骤:
[0008] 对镜像数据进行汇总,获取异常数据对应的URL,构建web事务与URL的对应关系;
[0009] 爬取测试环境的业务系统网页业务模块对应的URL,构建业务模块与web事务的对应关系;
[0010] 获取web事务分别对应的URL和业务模块,汇总URL与业务模块对应关系。
[0011] 结合第一方面,在第一方面第一种可能的实现方式中,所述对镜像数据进行汇总,获取异常数据对应的URL,构建web事务与URL的对应关系,包括,
[0012] 排查核心参数数值与基线数据存在较大偏差的异常数据,获取异常数据对应的URL;
[0013] 使用正则表达式抽取异常数据URL对应的web事务,构建异常数据对应的web事务与URL的哈希表。
[0014] 进一步地,所述排查核心参数数值与基线数据存在较大偏差的异常数据,获取异常数据对应的URL步骤之前,还包括:在业务系统交换机和/或路由器处设置镜像端口,截取
交换机和/或路由器端口数据发送到镜像端口。
[0015] 结合第一方面,在第一方面的第二种可能的实现方式中,所述爬取测试环境的业务系统网页业务模块对应的URL,构建业务模块与web事务的对应关系,包括,
[0016] 从测试环境的业务系统登录网页URL开始,爬取当前网页中所有业务模块对应的URL,直到完成全部网页的URL爬取;
[0017] 使用正则表达式抽取已获取的URL对应的web事务,将web事务与业务模块名称之间的对应关系插入倒排索引表中。
[0018] 进一步地,所述从测试环境的业务系统登录网页URL开始,爬取当前网页中所有业务模块对应的URL,直到完成全部网页的URL爬取,包括:
[0019] 使用网络爬虫技术,从业务系统的登录页URL开始,将此URL放入待抓取URL队列;
[0020] 从待抓取队列中取出一个URL,将该URL对应的网页下载,存储到网页库中;
[0021] 将已处理的URL放入到已处理URL队列中,分析已抓取URL对应网页中的其他URL,并将这些URL放入到待抓取URL队列中,进入下一轮循环,直至所有网页中的所有URL已被处
理。
[0022] 本发明第二方面提供了一种面向电网业务的应用性能获取装置,该装置包括:
[0023] 异常数据汇总模块,获取异常数据对应的URL,构建构建web事务与URL的对应关系;
[0024] 业务系统数据爬取模块,爬取测试环境的业务系统网页业务模块对应的URL,构建业务模块与web事务的对应关系;
[0025] 性能问题定位模块,获取web事务分别对应的URL和业务模块,汇总URL与业务模块对应关系。
[0026] 结合第二方面,在第二方面的第一种可能的实现方式中,所述异常数据汇总模块,包括,
[0027] 镜像数据获取单元,截取交换机和/或路由器端口数据发送到镜像端口,汇总镜像数据;
[0028] 异常数据URL获取单元,排查核心参数数值与基线数据存在较大偏差的异常数据,获取异常数据对应的URL;
[0029] 异常数据哈希表构建单元,使用正则表达式抽取异常数据URL对应的web事务,构建异常数据对应的web事务与URL的哈希表。
[0030] 结合第二方面,在第二方面的第二种可能的实现方式中,所述业务系统数据爬取模块,包括,
[0031] 网页URL获取单元,将业务系统登录页URL作为种子URL,将该URL对应网页下载存储到网页库中,抓取该网页中其他URL,直至完成全部网页的全部URL抓取工作;
[0032] 业务系统哈希表构建单元,使用正则表达式抽取已获取的URL对应的web事务,将web事务与业务模块名称之间的对应关系插入倒排索引表中。
[0033] 本发明第二方面的所述面向电网业务的应用性能获取装置能够实现第一方面及第一方面的各实现方式中的方法,并取得相同的效果。
[0034] 本发明的有益效果是,
[0035] 1、增强用户体验
[0036] 本发明提出的应用性能获取方法,将会直接给出问题的原因,无需依赖开发人员,这将大幅提升效率,保证系统用户反映的问题,能够及时定位、解决,进一步增强业务系统
用户满意度。
[0037] 2、提升运维效率
[0038] 当前电网业务系统业务规模庞大,业务逻辑日益复杂,这都对业务人员的运维水平和业务能力提出了极大的要求。在运维人员人数有限,能力有限的情况下,本方案的提
出,会进一步提升运维人员工作效率,帮助他们尽早地发现问题,解决问题,提升运维人员
绩效考核水平。
[0039] 3、保证业务正常访问
[0040] 通过对电网业务系统问题的自动定位,辅助运维人员快速解决问题,可以保证用户正常地访问业务系统,缓解了业务系统异常与其他业务问题的交叉,在业务保障层面,为
电网信息化水平的提升做出贡献。

附图说明

[0041] 图1是本发明面向电网业务的应用性能获取方法流程图;
[0042] 图2是爬取测试环境网页业务模块对应的URL原理示意图;
[0043] 图3是构建业务模块与web事务的对应关系示意图;
[0044] 图4是本发明面向电网业务的应用性能获取装置结构示意图。

具体实施方式

[0045] 如图1所示,一种面向电网业务的应用性能获取方法,包括以下步骤:
[0046] S1、对镜像数据进行汇总,获取异常数据对应的URL,构建web事务与URL的对应关系;
[0047] S2、爬取测试环境的业务系统网页业务模块对应的URL,构建业务模块与web事务的对应关系;
[0048] S3、获取web事务分别对应的URL和业务模块,汇总URL与业务模块对应关系。
[0049] 步骤S1中,所述对镜像数据进行汇总,获取异常数据对应的URL,构建web事务与URL的对应关系,包括,
[0050] S11、在业务系统交换机和/或路由器处设置镜像端口,截取交换机和/或路由器端口数据发送到镜像端口。
[0051] S12、排查核心参数数值与基线数据存在较大偏差的异常数据,获取异常数据对应的URL;
[0052] S13、使用正则表达式抽取异常数据URL对应的web事务,构建异常数据对应的web事务与URL的哈希表,如表1所示。
[0053]Web事务 URL
事务1 U1
事务2 U2
…… ……
事务n Un
[0054] 表1
[0055] 步骤S12中,如果各个核心参数数值与基线数据(系统正常运行时的数据)偏差较大,则表明当前网络可能存在异常数据。核心参数包括:总流量,平均每秒流量,平均利用
率,数据包个数,平均每秒包数,数据包大小分布,平均包长,TCP会话数,UDP会话数,MAC地
址个数等。点击本地监控界面中的按钮,促使开发的浏览器插件运行工作,该插件将会抓取
用户在业务系统界面(如PMS2.0)操作的URL,发送到监控端。将抓取的URL和镜像流量发生
的异常对照比较,确定一段窗口时间内(如[‑10s,+10s])响应时间长的URL。
[0056] 步骤S13中,通过正则表达式抽取出URL对应的web事务,以此种方式,将一段时间(可设置为1天)内的异常流量的URL和对应的web事务构建一张哈希表(以web事务为key,对
应的URL为value)。
[0057] 步骤S2中,所述爬取测试环境的业务系统网页业务模块对应的URL,构建业务模块与web事务的对应关系具体实现中,如图2所示,选取测试环境的业务系统登录页面为种子
URL;将此URL放入待抓取URL队列;从待抓取URL队列中取出一个待抓取URL,将URL对应的网
页下载下来,存储进网页库,并将已经处理的待抓取URL放入已抓取URL队列中;分析已抓取
URL队列中的URL的网页中存在的其他URL,并将URL放入待抓取URL队列,从而进入下一轮抓
取循环,直至没有发现新的URL为止;从网页库中取出一个网页,使用正则表达式,截取该网
页中业务模块URL的web事务,将web事务与业务模块名称之间的对应关系插入到倒排索引
表中,继续处理网页库中的下一个网页;直至网页库中的网页被处理完成为止,倒排索引表
构建完成,如图3所示。
[0058] 步骤S3中,从异常流量哈希表中取出一个key,并从步骤1构建的倒排索引表中找出与之相对应的业务模块名称;将获取到的业务模块名称及web事务一起存放于数据库中;
不断地从哈希表中取出key,重复步骤(1)、(2),直至当前哈希表中的所有key已被遍历完
成;从数据库中取出异常流量对应的业务模块名称,以图形化方式展示给系统管理相关人
员。
[0059] 如图4所示,一种面向电网业务的应用性能获取装置,该装置包括:
[0060] 异常数据汇总模块11,获取异常数据对应的URL,构建构建web事务与URL的对应关系;
[0061] 业务系统数据爬取模块12,爬取测试环境的业务系统网页业务模块对应的URL,构建业务模块与web事务的对应关系;
[0062] 性能问题定位模块13,获取web事务分别对应的URL和业务模块,汇总URL与业务模块对应关系。
[0063] 异常数据汇总模块11,包括,镜像数据获取单元111,截取交换机和/或路由器端口数据发送到镜像端口,汇总镜像数据;
[0064] 异常数据URL获取单元112,排查核心参数数值与基线数据存在较大偏差的异常数据,获取异常数据对应的URL;
[0065] 异常数据哈希表构建单元113,使用正则表达式抽取异常数据URL对应的web事务,构建异常数据对应的web事务与URL的哈希表。
[0066] 业务系统数据爬取模块12,包括,网页URL获取单元121,将业务系统登录页URL作为种子URL,将该URL对应网页下载存储到网页库中,抓取该网页中其他URL,直至完成全部
网页的全部URL抓取工作;
[0067] 业务系统哈希表构建单元122,使用正则表达式抽取已获取的URL对应的web事务,将web事务与业务模块名称之间的对应关系插入倒排索引表中。
[0068] 上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不
需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。