一种主机批量作业数据监控方法及装置转让专利

申请号 : CN201110156199.3

文献号 : CN102226890B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 蒋国强毛宇星刘辰何宏烨王卓张琰璘吴晓慧王立

申请人 : 中国工商银行股份有限公司

摘要 :

本发明提供了一种主机批量作业数据监控方法及装置,该方法包括:捕捉主机批量作业的作业信息,生成数据采集触发指令;根据数据采集触发指令在预定时间内收集作业执行数据,并存储作业执行数据;将作业执行数据与预先定义的作业及批量监控阀值数据进行对比,判断作业执行状态,产生并存储预警信息及报表信息;将预警信息以预先定义的通知策略通过展示界面或邮件发送或短信通知的方式发出;根据报表信息进行报表处理及生成,通过展示界面提供给用户。以解决计算机主机批量数据处理的自动监控问题。

权利要求 :

1.一种主机批量作业数据监控方法,其特征是,所述的方法包括:捕捉主机批量作业的作业信息,生成数据采集触发指令;

根据所述的数据采集触发指令在预定时间内收集作业执行数据,并存储所述的作业执行数据;

将所述的作业执行数据与预先定义的作业及批量监控阀值数据进行对比,判断作业执行状态,产生并存储预警信息及报表信息;

将所述的预警信息以预先定义的通知策略通过展示界面或邮件发送或短信通知的方式发出;

根据所述的报表信息进行报表处理及生成,通过展示界面提供给用户;其中,所述的预先定义的作业及批量监控阀值数据包括:作业返回码最大值、作业执行时间阀值、批量运行时间阀值和批量关键路径;

所述的将所述的作业执行数据与预先定义的作业及批量监控阀值数据进行对比包括:将所述的作业执行数据与预先定义的作业返回码最大值进行对比、将所述的作业执行数据与预先定义的作业执行时间阀值进行对比、将所述的作业执行数据与预先定义的批量运行时间阀值进行对比和将所述的作业执行数据与预先定义的批量关键路径进行对比。

2.根据权利要求1所述的方法,其特征是,所述的捕捉主机批量作业的作业信息包括作业开始信息和作业结束信息。

3.根据权利要求1所述的方法,其特征是,所述的捕捉主机批量作业的作业信息包括:监听主机批量作业的所有作业信息;

如果监听到的作业信息与预先记录的需要捕获的作业信息相匹配时,输出数据采集触发指令。

4.一种主机批量作业数据监控装置,其特征是,所述的装置包括:信息捕获单元,用于捕捉主机批量作业的作业信息,生成数据采集触发指令;

数据采集单元,用于根据所述的数据采集触发指令在预定时间内收集作业执行数据,并存储所述的作业执行数据;

集中处理单元,用于将所述的作业执行数据与预先定义的作业及批量监控阀值数据进行对比,判断作业执行状态,产生并存储预警信息及报表信息;

预警输出单元,用于将所述的预警信息以预先定义的通知策略通过展示界面或邮件发送或短信通知的方式发出;

报表输出单元,用于根据所述的报表信息进行报表处理及生成,通过展示界面提供给用户;其中,所述的集中处理单元,用于将所述的作业执行数据与预先定义的作业返回码最大值进行对比,判断作业执行状态,产生并存储预警信息及报表信息;并用于将所述的作业执行数据与预先定义的作业执行时间阀值进行对比,判断作业执行状态,产生并存储预警信息及报表信息;并用于将所述的作业执行数据与预先定义的批量运行时间阀值进行对比,判断作业执行状态,产生并存储预警信息及报表信息;并用于将所述的作业执行数据与预先定义的批量关键路径进行对比,判断作业执行状态,产生并存储预警信息及报表信息。

5.根据权利要求4所述的装置,其特征是,所述的信息捕获单元包括:信息监听模块,用于监听主机批量作业的所有作业信息;

信息匹配模块,如果监听到的作业信息与预先记录的需要捕获的作业信息相匹配时,输出数据采集触发指令。

6.根据权利要求4所述的装置,其特征是,所述的装置包括:作业执行数据存储单元,用于存储所述的作业执行数据;

阀值数据存储单元,用于存储预先定义的作业及批量监控阀值数据;

报警信息存储单元,用于存储所述的预警信息及报表信息。

说明书 :

一种主机批量作业数据监控方法及装置

技术领域

[0001] 本发明关于计算机系统的批量数据处理技术,具体地讲是一种主机批量作业数据监控方法及装置。

背景技术

[0002] 在当前计算机主机的应用处理模式中,批量处理作为一种事后数据处理方式,一直是一种简单而又非常重要的处理方式,尤其是对于海量的数据处理,批量方式就更显示了其高效的处理效果。
[0003] 随着应用业务的快速增长,数据规模迅猛发展以及近几年来数据集中的快速兴起,批量处理变的越来越复杂,每日的批量处理可以包含数千甚至上万个作业。同时,对于批量处理时效性的要求也日益显现,批量处理的延迟将可能直接影响到应用业务的可用性,因此需要对个体作业及整体批量进行全面有效的监控。
[0004] 现有的主机系统上还没有成型的系统和产品来监控主机批量处理,因此迫切需要有一种有效的、快速的批量作业数据监控方案,以实现对主机批量处理的自动监控。

发明内容

[0005] 本发明提供了一种主机批量作业数据监控方法及装置,以解决计算机主机批量数据处理的自动监控问题。
[0006] 本发明的目的之一是,提供一种主机批量作业数据监控方法,该方法包括:捕捉主机批量作业的作业信息,生成数据采集触发指令;根据数据采集触发指令在预定时间内收集作业执行数据,并存储作业执行数据;将作业执行数据与预先定义的作业及批量监控阀值数据进行对比,判断作业执行状态,产生并存储预警信息及报表信息;将预警信息以预先定义的通知策略通过展示界面或邮件发送或短信通知的方式发出;根据报表信息进行报表处理及生成,通过展示界面提供给用户;其中,预先定义的作业及批量监控阀值数据包括:作业返回码最大值、作业执行时间阀值、批量运行时间阀值和批量关键路径;将作业执行数据与预先定义的作业及批量监控阀值数据进行对比包括:将作业执行数据与预先定义的作业返回码最大值进行对比、将作业执行数据与预先定义的作业执行时间阀值进行对比、将作业执行数据与预先定义的批量运行时间阀值进行对比、和将作业执行数据与预先定义的批量关键路径进行对比。
[0007] 本发明的目的之一是,提供一种主机批量作业数据监控装置,该装置包括:信息捕获单元,用于捕捉主机批量作业的作业信息,生成数据采集触发指令;数据采集单元,用于根据数据采集触发指令在预定时间内收集作业执行数据,并存储作业执行数据;集中处理单元,用于将作业执行数据与预先定义的作业及批量监控阀值数据进行对比,判断作业执行状态,产生并存储预警信息及报表信息;预警输出单元,用于将预警信息以预先定义的通知策略通过展示界面或邮件发送或短信通知的方式发出;报表输出单元,用于根据报表信息进行报表处理及生成,通过展示界面提供给用户;其中,集中处理单元,用于将作业执行数据与预先定义的作业返回码最大值进行对比,判断作业执行状态,产生并存储预警信息及报表信息;并用于将作业执行数据与预先定义的作业执行时间阀值进行对比,判断作业执行状态,产生并存储预警信息及报表信息;并用于将作业执行数据与预先定义的批量运行时间阀值进行对比,判断作业执行状态,产生并存储预警信息及报表信息;并用于将作业执行数据与预先定义的批量关键路径进行对比,判断作业执行状态,产生并存储预警信息及报表信息。
[0008] 本发明的有益效果在于:通过对主机作业及批量执行时间、执行结果进行分析,实现了对主机个体作业及整体批量处理的自动化监控,克服了目前对大规模的主机批量处理作业缺乏有效的监控手段问题,帮助及时发现作业及批量处理过程中的问题,有效提升对主机作业及批量处理的掌控,保障企业的生产稳定与安全。本发明可及时发现批量处理过程中的瓶颈,并以短信、电子邮件等多种通信方式报警,为批量处理调优提供依据。

附图说明

[0009] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0010] 图1为本发明实施例的主机批量作业数据监控方法流程图;
[0011] 图2为本发明实施例的主机批量作业数据监控装置的结构框图;
[0012] 图3为本发明实施例的信息捕获单元的电路原理图;
[0013] 图4为本发明实施例的预警输出单元的GSM芯片示意图;
[0014] 图5为本发明实施例的主机批量作业数据监控系统连接示意图;
[0015] 图6为本发明实施例的信息捕获单元的结构框图;
[0016] 图7为本发明实施例的数据采集单元的结构框图;
[0017] 图8为本发明实施例的集中处理单元的结构框图;
[0018] 图9为本发明实施例的预警单元的结构框图;
[0019] 图10为本发明实施例的报表单元的结构框图;
[0020] 图11为本发明实施例的作业执行结果监控工作流程图;
[0021] 图12为本发明实施例的作业执行时间监控工作流程图;
[0022] 图13为本发明实施例的批量处理时间监控工作流程图;
[0023] 图14为本发明实施例的批量关键路径监控工作流程图。

具体实施方式

[0024] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0025] 如图1所示,本实施例的主机批量作业数据监控方法包括:捕捉主机批量作业的作业信息,生成数据采集触发指令(步骤S101);根据数据采集触发指令在预定时间内收集作业执行数据,并存储作业执行数据(步骤S102);将作业执行数据与预先定义的作业及批量监控阀值数据进行对比,判断作业执行状态,产生并存储预警信息及报表信息(步骤S103);将预警信息以预先定义的通知策略通过展示界面或邮件发送或短信通知的方式发出(步骤S104);根据报表信息进行报表处理及生成,通过展示界面提供给用户(步骤S105)。
[0026] 如图2所示,本实施例的主机批量作业数据监控装置包括:信息捕获单元001,用于捕捉主机批量作业的作业信息,生成数据采集触发指令;数据采集单元002,用于根据数据采集触发指令在预定时间内收集作业执行数据,并存储作业执行数据;集中处理单元003,用于将作业执行数据与预先定义的作业及批量监控阀值数据进行对比,判断作业执行状态,产生并存储预警信息及报表信息;预警输出单元004,用于将预警信息以预先定义的通知策略通过展示界面或邮件发送或短信通知的方式发出;报表输出单元005,用于根据报表信息进行报表处理及生成,通过展示界面提供给用户。
[0027] 本实施例的监控方法通过捕获主机作业及批量的执行信息,自动收集主机作业及批量的执行数据并与配置表中的监控阀值进行比对,当执行结果超过阀值时自动发出预警并进行记录。
[0028] 本实施例的监控装置包括:一个信息捕获单元、一个数据采集单元、一个集中处理单元、一个预警输出单元和一个报表输出单元。信息捕获单元负责捕捉作业开始、结束信息。数据采集单元负责在预定时间触发执行预先定义的数据采集任务。集中处理单元由输入模块、分析模块、配置模块、输出模块组成,负责接收作业执行数据、对比配置信息、分析作业运行状态、生成预警及报表信息。预警输出单元负责通过界面展示、邮件发送、短信通知等方式进行预警。报表输出单元负责记录作业执行信息、分析结果、预警信息,并提供展示界面给用户。
[0029] 如图3所示,信息捕获单元包括:批量数据监听电路,该批量数据监听电路包括:CAN232MB转换器。CAN232MB转换器内置看门狗,保障长期工作的可靠性;同时,转换器内置非易失性存储器,用于保存用户上次配置运行的参数。CAN232MB转换器在正常工作时,实时对CAN总线和RS 232/RS 485总线进行监听,一旦检测到某一侧总线上有数据接收到,立即对其进行解析,并装入各自的缓冲区,然后按设定的工作方式处理并转换发送到另一侧的总线,实现数据格式的转换。
[0030] 如图4所示,预警输出单元包括:短信报警电路,该短信报警电路包括:GSM手机模块或GPRS手机模块或CDMA手机模块。
[0031] 如图5所示,本实施例的监控装置100与银行主机200相连接,监控装置100通过捕获主机200作业及批量的执行信息,自动收集主机200作业及批量的执行数据并与配置表中的监控阀值进行比对,当执行结果超过阀值时自动发出预警并进行记录。
[0032] 本实施例的监控装置100的工作流程为:信息捕获单元捕捉到作业开始及结束信息后通知数据采集单元在预定时间触发执行数据采集任务,收集作业执行数据存储到集中处理单元的输入模块中,集中处理单元的分析模块对比集中处理单元的输入模块及集中处理单元的配置模块中的信息,判断作业执行状态,产生预警及报表信息存储到集中处理单元输出模块中。预警输出单元接收到集中处理单元输出模块中的预警信息根据预先定义的通知策略通过展示界面、邮件发送、短信通知等方式发出预警。报表输出单元接收到集中处理单元输出模块中数据进行报表处理及生成,通过展示界面提供给用户。该系统主要包括如下四个子系统:
[0033] 一、作业执行结果监控子系统。通过获取作业结束信息,与配置表中参数进行比对,监控作业执行结果是否符合预期。
[0034] 二、作业执行时间监控子系统。通过获取当前执行作业信息,与配置表中参数进行比对,监控作业执行时间是否超时。
[0035] 三、批量处理时间监控子系统。通过对批量进行划分,指定批量开始及结束标志,获取批量运行信息,监控批量处理时间是否符合预期。
[0036] 四、批量关键路径监控子系统。通过获取批量作业间逻辑关系及执行时间,计算得到批量关键路径,监控关键路径是否发生变化。
[0037] 在图2中,信息捕获单元001,负责捕捉作业开始、结束信息,并通知数据采集单元002在预定时间触发执行数据采集任务。数据采集单元002,负责执行预先定义的任务,收集作业执行数据。集中处理单元003,负责接收作业执行数据、对比配置信息、分析作业运行状态、生成预警及报表信息。集中处理单元输入模块310,存储数据采集单元002收集的作业执行数据。集中处理单元配置模块320,储存预先定义的作业及批量监控阀值数据。集中处理单元分析模块330,对输入模块310与配置模块320中的数据进行分析,判断作业及批量执行状态。集中处理单元输出模块340,储存分析模块330生成的预警及报表数据。预警输出单元004,负责接收输出模块340中的预警信息并根据预先定义的通知策略通过展示界面、邮件发送、短信通知等方式发出预警。报表输出单元005,负责接收输出模块340中数据并进行报表处理及生成,通过展示界面提供给用户。
[0038] 信息捕获单元001通过将捕获到的信息传播给数据采集单元002,实现与数据采集单元002的交互。数据采集单元002通过执行数据收集任务,将收集的数据储存至集中处理单元003输入模块310,实现与集中处理单元003的交互。集中处理单元003的分析模块330通过分析输入模块310及配置模块320中的数据来判断批量执行情况,并将结果存储至输出模块340。预警模块004通过接收集中处理单元输出模块340中的数据进行预警通知,从而实现与集中处理单元003的交互。报表输出单元005与集中处理单元003的交互主要是报表输出单元005接收集中处理单元输出模块340中的数据进行报表生成及展示。
[0039] 如图6所示,信息捕获单元001主要用于捕捉作业开始、结束信息,其包括两部分:信息监听模块101和信息匹配模块102。信息监听模块101用于监听主机系统所有信息。
信息匹配模块102中记录了需要捕获的信息,当与信息监听模块101监听到的信息相匹配时,会将信息传播给数据采集单元。
[0040] 如图7所示,数据采集单元002主要用于管理数据收集任务,包括任务管理模块201和计时器模块202。管理模块201根据信息匹配模块102提供的信息触发相应的任务进行数据收集,并将收集结果保存至集中处理单元003的输入模块310。计时器模块202用于控制数据收集任务的执行时间及频度。
[0041] 如图8所示,集中分析装置003主要用于分析作业及批量运行状态。集中分析装置003作为整个系统的核心装置,主要包括4大模块:输入模块310、配置模块320、分析模块
330、输出模块340。输入模块310中存储了数据采集单元002收集的数据。配置模块320中定义了批量及作业的配置及监控阀值信息,其包含四个子模块:作业返回码最大值配置模块321、作业执行时间阀值配置模块322、批量运行时间阀值配置模块323、批量关键路径配置模块324。分析模块330主要用于对比输入模块310及配置模块320中数据,评估批量及作业执行情况。分析模块330由四个子模块组成:作业执行结果分析模块331、作业执行时间分析模块332、批量处理时间分析模块333、批量关键路径分析模块334,分别用于不同的监控分析功能。分析模块330将分析结果保存至输出模块340,根据数据不同分别储存在预警数据存储模块341和报表数据储存模块342中。
[0042] 如图9所示,预警输出单元004主要用于发送预警通知,其包括两部分:预警信息生成模块401和预警通知模块402。预警信息生成模块401接收预警数据存储模块341中数据,生成预警信息。预警通知模块402中定义了各种通知策略,根据预警信息生成模块401生成的信息类型,分类通知相应人员。
[0043] 如图10所示,报表输出单元005主要用于生成及展示报表,其包括两部分:报表生成模块501和报表展示模块502。报表生成模块501接收报表数据储存模块342中数据,生成相应的报表。报表展示模块502提供界面展示报表生成模块501生成的报表。
[0044] 如图11所示,作业执行结果监控子系统工作流程包括:
[0045] 主机作业开始及结束时都会产生相应的信息来进行标识,作业结束时会生成一个返回码,用来反映作业执行结果,其取值范围为0-4095。当返回码小于等于最大允许值时则认为作业正常完成,否则作业就是异常中断。作业中断就要进行相应处理,通常需要再次重新执行。不同的作业其返回码最大允许值也不尽相同,取决于作业的属性及用途,一般由作业开发人员指定。作业执行结果监控子系统通过获取作业结束信息,与配置模块中参数进行比对来监控作业执行结果是否符合预期,其工作流程如下:
[0046] 步骤S201:信息捕获单元捕捉到作业结束信息,通知数据采集单元执行数据收集任务。
[0047] 步骤S202:数据采集单元执行预定义的数据收集任务,将收集的数据储存至集中处理单元的输入模块中。收集的数据包括作业名、作业返回码。数据格式如表1:
[0048] 表1
[0049]作业名 返回码
AAA 8
…… ……
[0050] 步骤S203:集中处理单元分析模块读取配置模块中的作业返回码最大允许值参数,并与输入模块中作业返回码进行比较。
[0051] 返回码最大允许值参数为预先定义的,通常由作业开发人员提供,参数表数据格式如表2:
[0052] 表2
[0053]作业名 返回码最大允许值
AAA 4
…… ……
[0054] 步骤S204:作业返回码小于等于最大允许值,则作业完成。将作业完成信息,包括作业名、作业开始时间、作业完成时间、作业执行时间存储至输出模块。
[0055] 步骤S205:将输出模块中作业完成信息记录至报表输出单元,进行报表处理及生成,并通过展示界面提供给用户。
[0056] 步骤S206:作业返回码大于最大允许值,则作业中断。生成预警信息存储至输出模块,预警信息包含作业名、中断时间、作业返回码。
[0057] 步骤S207:预警输出单元接收输出模块中的预警信息,根据预先定义的通知策略通过展示界面、邮件发送、短信通知等方式发出预警。
[0058] 步骤S208:输出模块中作业完成信息及预警信息记录至报表输出单元,进行报表处理及生成,并通过展示界面提供给用户。
[0059] 步骤S209:相关人员接收到预警后对中断作业进行处理,通常需要重新执行该作业。
[0060] 如图12所示,作业执行时间监控子系统工作流程包括:
[0061] 通常,当作业的处理对象未发生变化时,其执行时间波动很小,因此从作业执行时间历史数据中可以得到固定的执行时间阀值。作业执行时间监控子系统通过获取当前执行作业运行时间信息,与配置表中作业执行时间阀值进行比对,监控作业执行时间是否超时。其工作流程如下:
[0062] 步骤S301:数据采集单元执行预定义的数据收集任务,检收集当前正在执行的作业信息。收集的数据包括作业名、作业开始时间、作业执行时间。数据格式如表3:
[0063] 表3
[0064]开始时间 作业名 执行时间(分钟)
8月1日10:00 AAA 30
…… …… ……
[0065] 步骤S302:数据采集单元将收集的数据储存至集中处理单元的输入模块中。
[0066] 步骤S303:集中处理单元分析模块读取配置模块中的作业执行时间阀值参数,并与输入模块中数据进行比较。
[0067] 作业执行时间阀值参数为预先定义的,从作业执行时间历史数据中提取。由于当作业处理对象未发生变化时,其执行时间是比较稳定的,因此可选取一段时间作业的平均执行时间加上调整值作为作业执行时间阀值。调整值需要根据监控预期来进行调整,如选取最近30天作业的平均执行时间,可接受的作业最大执行时间为正常时间的1.2倍,则调整值为最近30天作业的平均执行时间乘以0.2。即:作业执行时间阀值=最近30天作业的平均执行时间+最近30天作业的平均执行时间×0.2。通常对于同一个作业,在特殊情况下其执行时间会发生变化,如工作日、双休日、月初、月末、年末处理等,这和作业的属性及用途相关,因此在制定作业执行时间阀值时需要对这些情况进行区分。当作业处理对象发生变化时,需要重新制定执行时间阀值,从发生变化后作业执行时间历史数据中提取。
[0068] 当作业执行时间阀值参数制定规则确定后,我们可以通过编写脚本,由数据采集单元定期执行任务,从报表输出单元中读取数据经过处理后存储至集中处理单元配置模块中,实现作业执行时间阀值参数的自动更新。作业执行时间阀值参数表数据格式如表4:
[0069] 表4
[0070]日期 作业名 执行时间阀值(分钟)
月初 AAA 30
…… …… ……
[0071] 步骤S304:作业执行时间未超过阀值,监控过程结束。
[0072] 步骤S305:作业执行时间超过阀值,生成预警信息存储至输出模块,预警信息包含作业名、执行时间、超过执行阀值时间。
[0073] 步骤S306:预警输出单元接收输出模块中的预警信息,根据预先定义的通知策略通过展示界面、邮件发送、短信通知等方式发出预警。
[0074] 步骤S307:输出模块中预警信息记录至报表输出单元,进行报表处理及生成,并通过展示界面提供给用户。
[0075] 步骤S308:相关人员接收到预警后对作业进行相应处理。
[0076] 如图13所示,批量处理时间监控子系统工作流程包括:
[0077] 目前,由于批量处理越来越复杂,作业规模越来越庞大,为了便于管理,通常我们将批量进行拆分,按照应用类型及功能划分为不同的子批量。同时,对批量及子批量指定起始及结束作业,用以标示批量及子批量处理的开始及结束。批量处理时间监控子系统通过获取批量起始及结束作业运行信息,监控批量处理时间是否符合预期。其工作流程如下:
[0078] 步骤S401:批量及子批量处理开始。
[0079] 步骤S402:信息捕获单元捕捉到批量及子批量起始作业开始执行信息,通知数据采集单元执行数据收集任务。
[0080] 步骤S403:数据采集单元执行预定义的数据收集任务,将收集的数据储存至集中处理单元的输入模块中。收集的数据包括批量及子批量起始作业名、作业开始时间。数据格式如表5:
[0081] 表5
[0082]开始时间 作业名
8月1日10:00 AAA
…… ……
[0083] 步骤S404:集中处理单元分析模块读取配置模块中的批量及子批量运行时间阀值参数,并在数据采集单元中添加任务,在到达运行时间阀值时收集批量及子批量结束作业执行信息。
[0084] 批量运行时间阀值参数需要预先定义,其制定方法等同于作业执行时间阀值参数,从历史数据中选取再加上调整值,并需要区分特殊情况下的参数值。同样可以通过编写脚本,由数据采集单元定期执行任务,从报表输出单元中读取数据经过处理后存储至集中处理单元配置模块中,实现批量运行时间阀值参数的自动更新。批量运行时间阀值参数表数据格式如表6:
[0085] 表6
[0086]日期 应用子批量名 起始作业名 结束作业名 运行时间阀值(分钟)
月初 X1 AAA BBB 120
…… …… …… …… ……
[0087] 即当信息捕获单元捕捉到AAA开始执行时,会通知数据采集单元执行数据收集任务,数据采集单元收集AAA的开始执行时间数据储存至集中处理单元的输入模块中。集中处理单元分析模块读取配置模块中应用子批量X1运行时间阀值参数,在数据采集单元中添加任务,于120分钟后收集作业BBB的执行信息。
[0088] 步骤S405:到达运行时间阀值时,数据采集单元执行任务收集批量及子批量结束作业执行信息,并储存至集中处理单元的输入模块中。
[0089] 步骤S406:集中处理单元分析模块读取输入模块中数据,判断批量及子批量结束作业是否已完成。
[0090] 步骤S407:批量及子批量结束作业已完成,监控过程结束。
[0091] 步骤S408:批量及子批量结束作业未完成,生成预警信息存储至输出模块,预警信息包含批量及子批量名、执行时间、超过执行阀值时间。
[0092] 步骤S409:预警输出单元接收输出模块中的预警信息,根据预先定义的通知策略通过展示界面、邮件发送、短信通知等方式发出预警。
[0093] 步骤S410:输出模块中预警信息记录至报表输出单元,进行报表处理及生成,并通过展示界面提供给用户。
[0094] 步骤S411:相关人员接收到预警后对批量及作业进行相应处理。
[0095] 步骤S412:批量及子批量完成后将处理信息,包括批量及子批量处理开始时间、结束时间、执行时间数据记录至报表输出单元,进行报表处理及生成,并通过展示界面提供给用户。
[0096] 如图14所示,批量关键路径监控子系统工作流程包括:
[0097] 主机批量处理过程中,作业执行是有顺序的,某些作业只有等其它作业完成后才能执行,我们分别将其称为后项作业、前项作业。后项作业必须在其前项作业正常完成后才能执行。通常每个作业都有前项作业及后项作业。如果作业只有后项作业无前项作业,则该作业是批量的起始作业。如果作业只有前项作业无后项作业,则该作业是批量的结束作业。从批量起始作业开始会有很多条路径到达批量结束作业,其中路径上的作业运行时间总和最大的路径即为关键路径。批量关键路径监控子系统通过获取批量作业间执行关系及执行时间,计算得到批量关键路径,监控关键路径是否发生变化。其工作流程如下:
[0098] 步骤S501:批量结束作业完成标示批量处理完成。
[0099] 步骤S502:信息捕获单元捕捉到批量结束作业完成信息,通知数据采集单元执行数据收集任务。
[0100] 步骤S503:数据采集单元执行预定义的数据收集任务,将收集的数据储存至集中处理单元的输入模块中。收集的数据包括作业名、作业开始时间、作业结束时间、作业执行时间、作业的前项作业。数据格式如表7:
[0101] 表7
[0102]
[0103] 步骤S504:集中处理单元分析模块读取输入模块中数据,计算得到批量最长路径即为关键路径,并将数据保存至输出模块记录至报表输出单元,进行报表处理及生成,并通过展示界面提供给用户。
[0104] 关键路径的计算方法为:从批量结束作业查找批量结束作业的前项作业中执行时间最晚的作业,再查找该作业的前项作业中执行时间最晚的作业,以此类推,直到选取的作业无前项作业,这些作业即为关键路径作业,其执行时间总和即为关键路径长度,作业个数即为路径深度。如步骤803中数据,假设FFF为批量结束作业,则DDD为其前项作业中执行时间最晚的作业,CCC为DDD前项作业中执行时间最晚的作业,AAA为CCC前项作业中执行时间最晚的作业,AAA无前项作业,关键路径即为AAA,CCC,DDD,FFF,深度为4,批量处理时间为65分钟。
[0105] 步骤S505:集中处理单元分析模块读取配置模块中的批量关键路径参数及关键路径上作业执行时间阀值参数,并与计算得到的数据进行比较。
[0106] 通常在处理对象未发生变化的情况下,批量关键路径是不变的,关键路径上作业的执行时间是稳定的。因此批量关键路径参数可以从一段时间的历史数据中提取,关键路径上作业执行时间阀值从历史数据中选取再加上调整值,同时需要区分特殊情况下的参数值。同样可以实现批量关键路径参数及关键路径上作业执行时间阀值参数的自动更新。参数表数据格式如表8:
[0107] 表8
[0108]
[0109] 步骤S506:关键路径发生变化,生成预警信息存储至输出模块,预警信息包含关键路径作业名、作业执行时间。
[0110] 步骤S507:关键路径发生变化,比较关键路径上的作业执行时间是否发生变化。
[0111] 步骤S508:关键路径上的作业执行时间未超过正常值,监控过程结束。
[0112] 步骤S509:关键路径上的作业执行时间超过正常值,生成预警信息存储至输出模块,预警信息包含关键路径作业名、执行时间、超过正常执行时间值。
[0113] 步骤S510:预警输出单元接收输出模块中的预警信息,根据预先定义的通知策略通过展示界面、邮件发送、短信通知等方式发出预警。
[0114] 步骤S511:输出模块中预警信息记录至报表输出单元,进行报表处理及生成,并通过展示界面提供给用户。
[0115] 步骤S512:相关人员接收到预警后进行相应处理。本发明系统通过对主机作业及批量执行时间、执行结果进行分析,实现了对主机个体作业及整体批量处理的自动化监控,克服了目前对大规模的主机批量处理作业缺乏有效的监控手段问题,帮助及时发现作业及批量处理过程中的问题,有效提升对主机作业及批量处理的掌控,保障企业的生产稳定与安全。本发明可及时发现批量处理过程中的瓶颈,并以短信、电子邮件等多种通信方式报警,为批量处理调优提供依据。
[0116] 本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。