监控平台以及对服务器上应用的监控方法转让专利

申请号 : CN201210227118.9

文献号 : CN103516558B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 袁庆

申请人 : 北京新媒传信科技有限公司

摘要 :

本发明公开了一种监控平台以及对服务器上应用的监控方法,能够实时采集监控数据,提高了对应用的监控效果,快速实现故障排查。本发明实施例提供的一种监控平台包括:调试帮助服务中心、调试帮助服务工作器和调试帮助服务控制台。调试帮助服务工作器,设置在各被监控服务器上,用于收集被监控服务器上的第一信息并将第一信息发送至调试帮助服务中心;调试帮助服务中心,与多个调试帮助服务工作器相连接,用于接收第一信息,并根据所配置的观测对象参数收集被监控服务器上各应用的观测对象数据;调试帮助服务控制台,与调试帮助服务中心相连接,用于提供交互控制界面,在交互控制界面上展示调试帮助服务中心获取到的第一信息和观测对象数据。

权利要求 :

1.一种监控平台,其特征在于,包括:调试帮助服务中心、调试帮助服务工作器和调试帮助服务控制台,所述调试帮助服务工作器,设置在各被监控服务器上,用于收集被监控服务器上的第一信息并将所述第一信息发送至调试帮助服务中心,所述第一信息包括服务器上应用的计数器信息;

所述调试帮助服务中心,与多个所述调试帮助服务工作器相连接,用于接收所述第一信息,并根据所配置的观测对象参数收集被监控服务器上各应用的观测对象数据;

所述调试帮助服务控制台,与所述调试帮助服务中心相连接,用于提供交互控制界面,在交互控制界面上展示所述调试帮助服务中心获取到的第一信息和观测对象数据;

所述调试帮助服务工作器,每隔预定时间向所述调试帮助服务中心发送注册信息,所述注册信息中包括调试帮助服务工作器的运行状态信息;

所述调试帮助服务中心,根据所述注册信息确认所述调试帮助服务工作器工作正常。

2.根据权利要求1所述的监控平台,其特征在于,

在首次发送所述注册信息时,所述调试帮助服务工作器根据预先获知的调试帮助服务中心的地址向所述调试帮助服务中心发送注册信息,所述注册信息中携带调试帮助服务工作器的地址;

所述调试帮助服务中心,从所述注册信息中提取出所述调试帮助服务工作器的地址,并利用该调试帮助服务工作器的地址访问相应的调试帮助服务工作器。

3.根据权利要求1所述的监控平台,其特征在于,还包括与所述调试帮助服务中心相连接的调试帮助服务中心数据库,所述调试帮助服务中心,将获取到的所述第一信息和观测对象数据存储在所述调试帮助服务中心数据库中;

所述调试帮助服务控制台,从所述调试帮助服务中心数据库中提取所述第一信息和观测对象数据并展示在交互控制界面上。

4.根据权利要求1至3任一项所述的监控平台,其特征在于,所述观测对象参数包括用于指示所采集的观测对象数据的内容的内容参数,用于指示所采集的观测对象数据的格式的格式参数,以及采集观测对象数据的时间间隔。

5.根据权利要求1至3任一项所述的监控平台,其特征在于,还包括与所述调试帮助服务控制台相连接的调试帮助服务控制台数据库;

所述调试帮助服务控制台数据库,存储控制台登录数据、资源设置数据和使用者设置数据;

所述调试帮助服务控制台,还用于利用所述登录数据控制使用者登录调试帮助服务控制台,利用所述资源设置数据控制资源页面的显示,以及利用所述使用者设置数据控制使用者的权限和使用者的信息。

6.根据权利要求1至3任一项所述的监控平台,其特征在于,

所述调试帮助服务控制台,还用于从网络服务器中获取跟踪数据,将该跟踪数据显示在所述交互控制界面上。

7.根据权利要求1至3任一项所述的监控平台,其特征在于,所述观测对象数据中包括用户登录被监控服务器上应用的登录时间和/或在线信息,所述调试帮助服务控制台还包括用户行为分析模块,用于根据所述登录时间和/或在线信息对用户行为进行分析。

8.一种对服务器上应用的监控方法,其特征在于,所述方法包括:利用设置在各被监控服务器上的调试帮助服务工作器收集被监控服务器上的第一信息,并将所述第一信息发送至调试帮助服务中心,所述第一信息包括服务器上应用的计数器信息;

利用所述调试帮助服务中心根据所配置的观测对象参数收集被监控服务器上各应用的观测对象数据;

从所述调试帮助服务中心获取所述第一信息和观测对象数据,并将获取到的第一信息和观测对象数据展示在调试帮助服务控制台的交互控制界面上;

通过所述调试帮助服务工作器每隔预定时间向所述调试帮助服务中心发送注册信息,使所述调试帮助服务中心确认所述调试帮助服务工作器工作正常,其中,所述注册信息中包括调试帮助服务工作器的运行状态信息。

说明书 :

监控平台以及对服务器上应用的监控方法

技术领域

[0001] 本发明涉及网络监控技术领域,特别涉及一种监控平台以及对服务器上应用的监控方法。

背景技术

[0002] 在网络中大量服务器上部署了应用之后,对应用进行及时监控和有效管理来获知应用的运行情况和更新情况,更好的掌握应用的运行状态,无论是对应用的实时情况的监控,还是对应用的运行的改进,甚至是应用未来的发展,都有重要的作用。
[0003] 现有对服务器上应用的监控方案,通过只能由第三方软件提取各服务器上应用的相关数据并保存在局域网或其自身的数据库中,监控服务需要从该数据库中查询数据并将查询到的数据展示出来。
[0004] 现有的监控方案至少存在如下缺陷:
[0005] 现有的监控方案过于依赖第三方软件,由第三方软件作为数据的提供方,则数据的格式、内容和获取时间间隔等都受到第三方软件的限制,一方面无法及时获取到所需的数据,对应用的监控效果较差,另一方面现有监控服务所能实现的监控功能也比较简单,不利于根据监控结果快速执行故障排查。

发明内容

[0006] 本发明提供了一种监控平台以及对服务器上应用的监控方法,以解决现有方案依赖第三方软件对应用进行监控、监控效果较差、不能及时进行故障排查的问题。
[0007] 为达到上述目的,本发明实施例采用了如下技术方案:
[0008] 本发明实施例提供了一种监控平台,包括:调试帮助服务中心、调试帮助服务工作器和调试帮助服务控制台,
[0009] 所述调试帮助服务工作器,设置在各被监控服务器上,用于收集被监控服务器上的第一信息并将所述第一信息发送至调试帮助服务中心,所述第一信息包括服务器上应用的计数器信息;
[0010] 所述调试帮助服务中心,与多个所述调试帮助服务工作器相连接,用于接收所述第一信息,并根据所配置的观测对象参数收集被监控服务器上各应用的观测对象数据;
[0011] 所述调试帮助服务控制台,与所述调试帮助服务中心相连接,用于提供交互控制界面,在交互控制界面上展示所述调试帮助服务中心获取到的第一信息和观测对象数据。
[0012] 本发明实施例还提供了一种对服务器上应用的监控方法,所述方法包括:
[0013] 利用设置在各被监控服务器上的调试帮助服务工作器收集被监控服务器上的第一信息,并将所述第一信息发送至调试帮助服务中心,所述第一信息包括服务器上应用的计数器信息;
[0014] 利用所述调试帮助服务中心根据所配置的观测对象参数收集被监控服务器上各应用的观测对象数据;
[0015] 从所述调试帮助服务中心获取所述第一信息和观测对象数据,并将获取到的第一信息和观测对象数据展示在调试帮助服务控制台的交互控制界面上。
[0016] 本发明实施例的有益效果是:
[0017] 本发明实施例提供了一种新型的监控平台,通过在监控平台中设置调试帮助服务中心、调试帮助服务工作器和调试帮助服务控制台,由调试帮助服务中心和调试帮助服务工作器来收集被监控服务器的信息和数据、由调试帮助服务控制台对信息和数据进行展示的技术手段,使对应用监控不依赖第三方软件所提供的数据,能够实时采集监控数据,提高了对应用的监控效果;
[0018] 进一步的,本发明实施例能够通过调试帮助服务工作器采集到计数器信息,并能够通过观测对象参数的设置灵活控制所采集的观测对象数据,从而提高了监控方式的灵活性,丰富了监控平台的功能,能够根据监控结果快速实现故障排查。

附图说明

[0019] 图1为本发明实施例一提供的一种监控平台的结构示意图;
[0020] 图2为本发明实施例二提供的一种包括本实施例的监控平台的网络结构示意图;
[0021] 图3为本发明实施例三提供的一种对服务器上应用的监控方法流程图。

具体实施方式

[0022] 为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
[0023] 参见图1,为本发明实施例一提供的一种监控平台,包括:DHSCenter(Debug Helper Service Center,调试帮助服务中心)12、DHSWorker(Debug Helper Service Worker,调试帮助服务工作器)11和DHSConsole(Debug Helper Service Console,调试帮助服务控制台)13,
[0024] 所述调试帮助服务工作器11,设置在各被监控服务器上,用于收集被监控服务器上的第一信息并将所述第一信息发送至调试帮助服务中心12,所述第一信息包括服务器上应用的计数器信息;
[0025] 所述调试帮助服务中心12,与多个所述调试帮助服务工作器11相连接,用于接收所述第一信息,并根据所配置的Observer(观测对象)参数收集被监控服务器上各应用的观测对象数据;
[0026] 所述调试帮助服务控制台13,与所述调试帮助服务中心12相连接,用于提供交互控制界面,在交互控制界面上展示所述调试帮助服务中心12获取到的第一信息和观测对象数据。
[0027] 在此,不对本实施例中提供的监控平台的具体命名进行限制,例如,监控平台也可以称为巡检平台。
[0028] 本实施例的监控平台通过DHSWorker和DHSCenter能够使监控平台自行进行数据的扫描、提取、存储等操作,实时提取应用的运行状态。
[0029] 本发明实施例提供了一种新型的监控平台,通过在监控平台中设置调试帮助服务中心、调试帮助服务工作器和调试帮助服务控制台,由调试帮助服务中心和调试帮助服务工作器来收集被监控服务器的信息和数据、由调试帮助服务控制台对信息和数据进行展示的技术手段,使对应用监控不依赖第三方软件所提供的数据,能够实时采集监控数据,提高了对应用的监控效果;
[0030] 进一步的,本发明实施例能够通过调试帮助服务工作器采集到计数器信息,并能够通过观测对象参数的设置灵活控制所采集的观测对象数据,从而提高了监控方式的灵活性,丰富了监控平台的功能,能够根据监控结果快速实现故障排查。
[0031] 在图1所示实施例的基础上,进一步的,本实施例中所述调试帮助服务工作器每隔预定时间向所述调试帮助服务中心发送注册信息,所述注册信息中包括调试帮助服务工作器的运行状态信息。所述调试帮助服务中心,根据所述注册信息确认所述调试帮助服务工作器工作正常。
[0032] 进一步的,在首次发送所述注册信息时,所述调试帮助服务工作器根据预先获知的调试帮助服务中心的地址向所述调试帮助服务中心发送注册信息,所述注册信息中携带调试帮助服务工作器的地址;
[0033] 所述调试帮助服务中心,从所述注册信息中提取出所述调试帮助服务工作器的地址,并利用该调试帮助服务工作器的地址访问相应的调试帮助服务工作器。
[0034] 进一步的,本监控平台还包括与所述调试帮助服务中心相连接的DHServiceDB(调试帮助服务中心数据库),
[0035] 所述调试帮助服务中心,将获取到的所述第一信息和观测对象数据存储在所述调试帮助服务中心数据库中;
[0036] 所述调试帮助服务控制台,从所述调试帮助服务中心数据库中提取所述第一信息和观测对象数据并展示在交互控制界面上。
[0037] 进一步的,所述观测对象参数包括用于指示所采集的观测对象数据的内容的内容参数,用于指示所采集的观测对象数据的格式的格式参数,以及采集观测对象数据的时间间隔。
[0038] 进一步的,本监控平台还包括与所述调试帮助服务控制台相连接的DHSConsoleDB(调试帮助服务控制台数据库);
[0039] 所述调试帮助服务控制台数据库,存储控制台登录数据、资源设置数据和使用者设置数据;
[0040] 所述调试帮助服务控制台,还用于利用所述登录数据控制使用者登录调试帮助服务控制台,利用所述资源设置数据控制资源页面的显示,以及利用所述使用者设置数据控制使用者的权限和使用者的信息。
[0041] 进一步的,所述调试帮助服务控制台,还用于从网络服务器中获取跟踪数据,将该跟踪数据显示在所述交互控制界面上。
[0042] 进一步的,所述观测对象数据中包括用户登录被监控服务器上应用的登录时间和/或在线信息,
[0043] 所述调试帮助服务控制台还包括用户行为分析模块,用于根据所述登录时间和/或在线信息对用户行为进行统计。
[0044] 下面对本发明实施例二提供的一种监控平台进行说明,参见图2,示出了一种应用本实施例的监控平台的网络结构示意图。
[0045] 本实施例的监控平台包括:DHSWorker11、DHSCenter12和DHSConsole13。
[0046] 其中,DHSCenter负责记录数据,并完成一些周期性执行的任务,例如,获取Observer数据,并记录到数据库中;
[0047] DHSWorker为每台被监控服务器部署一个,收集每台被监控服务器上的第一信息,并上传到DHSCenter记录,该第一信息包括计数器信息;
[0048] DHSConsole则作为一个展示平台,展示DHSCenter记录的数据。
[0049] 各部分的功能具体如下:
[0050] DHSCenter部分
[0051] 本实施例为DHSCenter配置专有的数据库DHServiceDB16,DHSCenter有如下功能:
[0052] 1:能够接收并记录DHSWorker向自己上传的注册信息;
[0053] 2:能够接收并记录DHSWorker上传的计数器信息;
[0054] 3:定时获取被监控服务器上应用的Observer数据并保存。
[0055] DHSCenter可以将所获取到的上述注册信息、计数器信息和Observer数据存储在DHServiceDB16,DHServiceDB中还可以存储有DHSCenter自身运行所需的信令数据等。
[0056] DHSWorker部分
[0057] 由于DHSWorker一般没有存储数据的需求,本实施例不为DHSWorker设置专有的数据库。DHSWorker负责对其所在的被监控服务器上的某些信息进行读取,并上传到DHSCenter,主要功能如下:
[0058] 1:定时(如每隔预定时间)向DHSCenter发送注册信息,该注册信息指示DHSWorker自身的运行状态。通过注册信息,DHSCenter及时获知DHSWorker的工作状态,例如,当DHSCenter在预定时间间隔后未收到DHSWorker1的注册信息时,则表明DHSWorker1出现了故障,及时执行故障排查。
[0059] 2:读取被监控服务器上的计数器数据并上传到DHSCenter。
[0060] 本实施例采用DHSCenter而不采用DHSWorker来采集Observer数据的主要原因在于:DHSCenter设置了Observer参数,若由DHSWorker来收集Observer参数的话,DHSWorker预先与DHSCenter连接获知Observer参数,根据该Observer参数执行采集,且在每次Observer参数发生变化时都需要执行上述相同的操作,既占用的服务器的CPU,又占用了网络带宽资源;并且,由DHSWorker采集Observer数据时,也会增加了被监控服务器的负担,当被监控服务器上运行的应用较多,所需采集的Observer数据数量较大时,可能会影响被监控服务器的运行。所以本实施例采用由DHSCenter采集Observer数据,而由DHSWorker采集计数器信息等。
[0061] DHSConsole部分
[0062] DHSConsole是作为DHSCenter记录的数据的展现的一个平台,除了提供交互控制界面用于数据显示之外,本实施例还为DHSConsole设置了登录认证、数据统计和界面管理等功能。本实施例可以设置一个与DHSConsole相连接的DHSConsoleDB14。DHSConsoleDB14中存储控制台登录数据、资源设置数据和使用者设置数据等以支持DHSConsole的各种功能。
[0063] 如DHSConsole主要的功能如下:
[0064] 1、登录认证功能。登录认证功能能够利用登录数据控制使用者登录DHSConsole,以保证监控平台的安全性。
[0065] 2、系统设置功能。
[0066] 系统设置功能能够利用资源设置数据控制资源页面的显示,具体设置包括资源功能设置和角色人员设置,其中:
[0067] 资源功能设置,如资源设置、资源页面的进入权限、资源页面的功能设置、资源页面的功能的权限范围数据来源设置。上述资源包括DHSConsole从DHSCenter中获取到的信息和数据,还可以包括从网络中其他DB获取到的数据,如从TraceDB(跟踪数据库)15中获取到的数据等。上述资源页面包括向使用者提供的资源的显示页面和控制页面。本实施例利用资源功能设置对所监控的数据进行控制。
[0068] 角色人员设置,如人员列表查询添加删除等、人员所属角色、角色下的人员、角色列表查询/添加/删除、角色的权限设置。本实施例利用角色人员设置对使用者的权限以及使用者的信息进行管理,控制使用者的增删和权限等。
[0069] 3、数据处理功能。主要包括数据查询功能、数据收集功能和用户行为分析功能。
[0070] 1)数据查询功能。数据查询功能能够从网络中的其它数据查询数据,如从TraceDB查询数据
[0071] 2)数据收集功能。
[0072] 从DHSCenter收集计数器信息和Observer数据,需要时还可以收集信令查看数据等。
[0073] 上述计数器信息主要为被监控服务器所记录的该服务器上应用的运行状态的信息。
[0074] 上述Observer数据为根据所设置的Observer参数所监测到的被监控服务器上各应用的数据。观测对象参数可以包括用于指示所采集的Observer数据的内容的内容参数,用于指示所采集的Observer数据的格式的格式参数,以及采集Observer数据的时间间隔。所设置的Observer参数不同时所监测得到的Observer数据也不同,从而大大增加了监控方式的灵活性。例如,Observer数据中可以包括指示是否发生Trace事件的跟踪(Tracing)指示数据、RpcClient(Remote Procedure Call Protocol Client,远程过程调用协议客户端)的数据、RpcServer(Remote Procedure Call Protocol Server,远程过程调用协议服务器)的数据、DbAccess(数据库访问)的数据等等。
[0075] 上述信令查看数据可以包括对观测对象数据的统计数据(如Sipc统计观测对象数据SipcStatisticsObserver)和网络中应用路由器的观测对象数据(如Sipc应用路由观测对象数据SipcAppRouterObserver)等。
[0076] 3)用户行为分析功能。
[0077] 本实施例调试帮助服务控制台还包括用户行为分析模块,能够执行用户行为分析和用户行为分析数据的配置。
[0078] 如图2中所示,DHSWorker和DHSCenter进行通信,DHSWorker将收集到的信息进行上传到DHSCenter,DHSCenter收到数据后,进行处理并存储至DHServiceDB,以备DHSConsole进行查询展示。本实施例采用这样的部署方式有利于业务扩展和监控效率的提升。
[0079] 与传统方案相比,本实施例至少具有如下优点:
[0080] 1:现有方案中的Observer数据是由第三方软件提供的,第三方软件将采集到的Observer数据记录到自己的数据库中,原有监控平台只能够去第三方软件的数据库中查询数据,且数据的格式和数据变化均不可控。
[0081] 本实施例提供的新监控平台的Observer数据的采集是由DHSCenter完成的,且将采集后的Observer数据记录到监控平台中的DHServiceDB中,监控平台对该DHServiceDB有完全的控制权,而且,DHSCenter对所需要的Observer数据是可以配置的,可以选取需要执行Observer数据采集的服务器,控制是否需要记录采集到的Observer数据以及采集Observer的时间间隔等,灵活性大大增加。
[0082] 2:计数器信息
[0083] 原监控平台没有计数器信息,在应用出现问题后,使用者(如开发人员)只能去安装该应用的服务器上去查看该应用当时的计数器信息,且不能查看历史信息,对排查问题的帮助程度有限。
[0084] 本实施例提供的监控平台由DHSWorker采集计数器信息,DHSWorker会按照配置的要求每隔一段时间或实时,采集其所在的被监控服务器上的计数器信息,并上传到DHSCenter存入DHServiceDB。DHSConsole读取这些数据之后,形成一张图表,在该图表中展示包括历史计数器信息和当前计数器信息的曲线,通过分析该曲线的激增/激减,可以对应用的运行状态做出判断。而且在某个应用出现问题时,也不必像以前那样,必须登录到安装应用的服务器上去查看计数器,只需在DHSConsole上查看即可。
[0085] DHSWorker采集计数器信息的具体方式是可以配置的,根据配置DHSWorker可以排除或添加需要的计数器信息,采集计数器信息的时间间隔也是可以配置的,可以灵活的控制所需要的计数器信息。
[0086] 3:用户行为分析
[0087] 本实施例的监控平台设置用户行为分析模块,通过该模块对在一段时间内,用户所使用的客户端登录被监控服务器上应用的登录时间长短和/或在线信息以及业务信息(如用户的订购信息等),对用户行为进行分析。
[0088] DHSConsole通过交互控制界面接收使用者输入的手机号或者Sid(Security Identifiers,安全标识符),根据该手机号或者Sid调用用户行为分析模块的分析结果,以有助于排查用户的登录和在线状态等问题。
[0089] 本发明实施例三还提供了一种对服务器上应用的监控方法,参见图3,所述方法包括:
[0090] 31:利用设置在各被监控服务器上的调试帮助服务工作器收集被监控服务器上的第一信息,并将所述第一信息发送至调试帮助服务中心,所述第一信息包括服务器上应用的计数器信息;
[0091] 32:利用所述调试帮助服务中心根据所配置的观测对象参数收集被监控服务器上各应用的观测对象数据;
[0092] 33:从所述调试帮助服务中心获取所述第一信息和观测对象数据,并将获取到的第一信息和观测对象数据展示在调试帮助服务控制台的交互控制界面上。
[0093] 进一步的,所述方法还包括:通过所述调试帮助服务工作器每隔预定时间向所述调试帮助服务中心发送注册信息,使所述调试帮助服务中心确认所述调试帮助服务工作器工作正常,其中,所述注册信息中包括调试帮助服务工作器的运行状态信息。
[0094] 进一步的,在首次发送所述注册信息时,所述调试帮助服务工作器根据预先获知的调试帮助服务中心的地址向所述调试帮助服务中心发送注册信息,所述注册信息中携带调试帮助服务工作器的地址;
[0095] 所述调试帮助服务中心,从所述注册信息中提取出所述调试帮助服务工作器的地址,并利用该调试帮助服务工作器的地址访问相应的调试帮助服务工作器。
[0096] 进一步的,所述观测对象参数包括用于指示所采集的观测对象数据的内容的内容参数,用于指示所采集的观测对象数据的格式的格式参数,以及采集观测对象数据的时间间隔。
[0097] 本发明方法实施例中的具体步骤可以参见本发明的产品实施例,在此不再赘述。
[0098] 本发明实施例提供了一种新型的监控平台,通过在监控平台中设置调试帮助服务中心、调试帮助服务工作器和调试帮助服务控制台,由调试帮助服务中心和调试帮助服务工作器来收集被监控服务器的信息和数据、由调试帮助服务控制台对信息和数据进行展示的技术手段,使对应用监控不依赖第三方软件所提供的数据,能够实时采集监控数据,提高了对应用的监控效果;
[0099] 进一步的,本发明实施例能够通过调试帮助服务工作器采集到计数器信息,并能够通过观测对象参数的设置灵活控制所采集的观测对象数据,从而提高了监控方式的灵活性,丰富了监控平台的功能,能够根据监控结果快速实现故障排查。
[0100] 以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。