一种用于监控网站访客地理位置和访问状态的系统及方法转让专利

申请号 : CN200710101333.3

文献号 : CN101291259B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 冯亮王志雷王建勋

申请人 : 阿里巴巴集团控股有限公司

摘要 :

本发明揭示了一种用于监控网站访客的地理位置和访问状态的系统,它包括:网站Web服务器集群、数据处理服务器、数据库服务器、监控数据处理服务器和可视化地球模型展示服务器。本发明还揭示了一种用于监控网站访客的方法,它主要包括:网站Web服务器集群产生操作日志;数据字段经数据处理服务器解析得出并存储至数据库;监控数据处理服务器实时读取一条最新的日志记录并转化生成数据包;消息驱动地理定位插件接收数据包并驱动可视化地球模型实时定位更新。采用本发明的系统和方法,可实时监控并展示网站访客的详细数据信息,也能够有效地定位网站中的异常流量、恶意访问源IP地址的地理位置与Internet注册信息。

权利要求 :

1.一种用于监控网络访客的定位系统,其特征在于,它包含:网站Web服务器集群,用于产生所述网络访客的操作日志;

搜索服务器集群,用于集中处理在大规模数据中的搜索关键词;

数据处理服务器,用于运行自动化脚本并读取所述操作日志,并依据系统预定义的规则对所述操作日志进行自动解析;

数据库服务器,用于运行数据库管理系统,接收所述数据处理服务器的解析结果并存储;

监控数据处理服务器,用于运行自动化脚本,实时获取所述数据库服务器中的所述解析结果,并向NASA World Wind可视化地球模型平台中的消息驱动地理定位插件发送基于用户数据报协议的数据包;以及NASA World Wind展示服务器,用于接收所述基于用户数据报协议的数据包,运行NASA World Wind可视化地球模型以定位所述网络访客的地理位置。

2.如权利要求1所述的系统,其特征在于,所述搜索服务器集群的搜索功能取决于其存储容量和处理速度。

3.如权利要求1所述的系统,其特征在于,所述数据库服务器以数据表的形式存储所述解析结果。

4.如权利要求3所述的系统,其特征在于,所述解析结果包括所述网络访客的IP地址和搜索关键词。

5.如权利要求1所述的系统,其特征在于,所述数据包包括与所述网络访客相关的经度和纬度、地理位置名称和搜索关键词。

6.如权利要求5所述的系统,其特征在于,经度和纬度、地理位置名称和搜索关键词是所述解析结果中的IP地址经过GeoIP转化而产生的。

7.如权利要求1所述的系统,其特征在于,所述消息驱动地理定位插件兼容基于用户数据报协议输入的接口。

8.如权利要求1所述的系统,其特征在于,所述消息驱动地理定位插件在NASA World Wind可视化地球模型平台上自定制源码,接收所述数据包并实时更新NASA World Wind可视化地球化模型。

9.一种在系统中用于监控网络访客的定位方法,该系统包括网站Web服务器集群、数据处理服务器、数据库服务器、监控数据处理服务器和NASA World Wind展示服务器,其特征在于,该方法通过以下的步骤实现:(1)所述网络访客在网站上输入搜索关键词的请求步骤;

(2)所述网站Web服务器集群接受所述请求并生成相关日志的产生步骤;

(3)所述网站Web服务器集群将所述日志实时输出至本地存储介质的访问日志文件的输出步骤;

(4)所述数据处理服务器读取所述日志并解析出数据字段的解析步骤;

(5)所述数据库服务器接收日志的解析结果并存储至数据库的存储步骤;

(6)所述监控数据处理服务器运行自动化脚本并从所述数据库服务器中实时读取一条所述日志的记录的读取步骤;

(7)将所述解析结果中的IP地址转化为基于用户数据报协议的数据包的转化步骤;

(8)将所述数据包发送至NASA World Wind可视化地球模型平台中的消息驱动地理定位插件的发送步骤;以及(9)所述消息驱动地理定位插件接收所述数据包,并驱动NASA World Wind可视化地球模型实时更新至所述网络访客的地理位置的定位步骤。

10.如权利要求9所述的方法,其特征在于,所述数据库服务器以数据表的形式存储所述解析结果。

11.如权利要求10所述的方法,其特征在于,所述解析结果包括所述网络访客的IP地址和搜索关键词。

12.如权利要求9所述的方法,其特征在于,所述转化步骤是基于GeoIP实现的,GeoIP将IP地址映射转化为地理数据的开发库和地理信息的数据库。

13.如权利要求9所述的方法,其特征在于,所述数据包包括与所述网络访客相关的经度和纬度、地理位置名称和搜索关键词。

14.如权利要求9所述的方法,其特征在于,所述消息驱动地理定位插件兼容基于用户数据报协议输入的接口。

15.如权利要求9所述的方法,其特征在于,所述消息驱动地理定位插件在NASA World Wind可视化地球模型平台上自定制源码,接收所述数据包并实时更新NASA WorId Wind可视化地球化模型。

说明书 :

一种用于监控网站访客地理位置和访问状态的系统及方法

技术领域

[0001] 本发明涉及网络通信技术,尤其涉及网络的远程监控技术。

背景技术

[0002] 在现有技术中,Google Earth三维地球浏览器将Google强大的搜索功能和卫星图片相结合,通过访问Keyhole的航天和卫星图片扩展数据库,并利用KML(Keyhole Markup Language:基于XML语法和文件格式的文件,用于描述和保存地理信息,如点、线、图片、折线并在Google Earth三维地球浏览器的客户端之中显示)文件动态抓取本地或远端的数据文件,并在地球模型上予以更新。
[0003] 但是,Google Earth可视化地球模型只支持KML格式且功能比较单一,它并没有开放接口供用户使用其他的高级程序语言进行插件的自行开发。此外,Google Earth可视化地球模型中只能周期性地抓取来自本地或远端地数据,而无法接收推送而来的消息数据,因而对于实时更新可视化地球模型和监控访客的详细资料变得无能为力。

发明内容

[0004] 针对可视化地球模型在更新用户数据时所存在的上述缺陷,本发明提供了一种用于实时监控网站访客的地理位置和访问状态的系统。
[0005] 按照本发明的一个方面,提供了一种用于监控网站访客地理位置和访问状态的定位系统。该系统将GeoIP强大的转化功能和基于用户自定制源码进行插件开发的NASA World Wind可视化地球模型平台相结合,通过消息驱动地理定位插件接收基于UDP(User Datagram Protocol:用户数据报协议)的数据包并实时更新NASA World Wind可视化地球模型。该监控系统主要包括:网络Web服务器集群、搜索服务器集群、数据处理服务器、数据库服务器、监控数据处理服务器和NASA World Wind展示服务器。更具体地,[0006] 网站Web服务器集群,是网络访客能访问阿里巴巴国际网站所依托的服务器集群,也是本系统所需用户操作日志的数据来源,当网络访客通过浏览器欲访问阿里巴巴国际网站时,该访问请求被送至网站Web服务器集群,并经过其中的程序运行处理和回传数据,将阿里巴巴国际网站的页面呈现给网络访客;
[0007] 搜索服务器集群,用于集中处理在大规模数据中的搜索关键词,由于网站Web服务器集群仅仅处理普通的访问请求,而对大规模数据中进行关键词搜索的处理比较困难,从而将搜索服务器集群独立成为系统架构中的一个组成部分,更具体地,其搜索功能取决于搜索服务器集群的存储容量和处理速度;
[0008] 数据处理服务器,用于运行自动化脚本并读取来自搜索服务器集群的该网络访客的操作日志,并依据系统预定义的规则对操作日志进行自动解析;
[0009] 数据库服务器,用于运行数据库管理系统,接收数据处理服务器的解析结果并以数据表的形式存储;
[0010] 监控数据处理服务器,用于运行自动化脚本,实时获取数据库服务器中的解析结果,并向NASA World Wind可视化地球模型平台中的消息驱动地理定位插件发送基于UDP协议的数据包;以及
[0011] NASA World Wind展示服务器,用于接收基于UDP协议的数据包,运行NASAWorld Wind可视化地球模型以定位该网络访客的地理位置和监控其访问状态。
[0012] 按照本发明的又一个方面,提供了一种用于监控网站访客地理位置和访问状态的定位方法。其中,该方法可以通过如下的流程予以实现:
[0013] (1)网络访客在网站上输入搜索关键词的请求步骤;
[0014] (2)网站Web服务器集群接受该搜索请求并生成相关日志的产生步骤;
[0015] (3)网站Web服务器集群将日志实时输出至本地存储介质的访问日志文件的输出步骤;
[0016] (4)数据处理服务器读取来自搜索服务器集群的操作日志并解析出数据字段的解析步骤;
[0017] (5)数据库服务器接收对于日志的解析结果并存储至数据库的存储步骤;
[0018] (6)监控数据处理服务器运行自动化脚本并从数据库服务器中实时读取一条日志记录的读取步骤;
[0019] (7)将解析结果中的IP地址转化为基于用户数据报协议的数据包的转化步骤;
[0020] (8)将基于UDP协议的数据包发送至NASA World Wind可视化地球模型平台中的消息驱动地理定位插件的发送步骤;以及
[0021] (9)该消息驱动地理定位插件接收UDP数据包,并驱动NASA World Wind可视化地球模型实时更新至该网络访客的地理位置的定位步骤。
[0022] 其中,在上述解析步骤中,数据字段包括该网络访客的I P地址和搜索关键词;
[0023] 其中,在上述转化步骤中,网络访客的I P地址通过GeoI P映射转化为地理数据的开发库和地理信息的数据库;
[0024] 其中,在上述发送步骤中,基于UDP协议的数据包格式为{经纬度,地理位置名称,搜索关键词},如,{“-33.9°,151.05°”,“Ch ullora,Australia”,“red_apple”};
[0025] 其中,在上述发送步骤中,消息驱动地理定位插件兼容基于UDP协议的数据包的输入接口。
[0026] 采用本发明的系统和方法,可实时监控并展示网站访客的详细数据信息,也能够有效地定位网站中的异常流量、恶意访问源IP地址的地理位置与Internet注册信息。

附图说明

[0027] 读者在参照附图阅读了本发明的具体实施方式以后,将会更清楚地了解本发明的各个方面。其中,
[0028] 图1示出了本发明监控网站访客的地理位置和访问状态的系统架构图;
[0029] 图2示出了本发明监控网站访客的地理位置和访问状态的流程示意图;
[0030] 图3示出了本发明中搜索服务器集群响应搜索请求后生成的日志代码段;
[0031] 图4示出了本发明基于GeoIP和WHOIS协议显示访客信息的界面示意图;而[0032] 图5示出了本发明基于NASA World Wind可视化地球模型实时更新和定位访客位置的示意图。

具体实施方式

[0033] 下面参照附图,对本发明的具体实施方式作进一步的详细描述。
[0034] 图1示出了本发明监控网站访客的地理位置和访问状态的系统架构图。参考图1,该监控系统包括网站Web服务器集群100、搜索服务器集群102、数据处理服务器104、数据库服务器106、监控数据处理服务器108和NASA World Wind展示服务器110。其中,[0035] 网站Web服务器集群100,用于产生系统所需日志的数据,是客户能访问到的阿里巴巴国际网站所依托的服务器集群;
[0036] 搜索服务器集群102,用于专门处理大规模数据中的搜索关键词,并返回搜索结果的服务器集群,其搜索功能取决于服务器的存储容量和处理性能;
[0037] 数据处理服务器104,用于运行自动化脚本并抓取日志,依据预定义规则自动解析日志文本,以获取所需的客户访问数据;
[0038] 数据库服务器106,用于运行数据库管理系统,以数据表的形式存储日志解析所得的结果数据;
[0039] 监控数据处理服务器108,用于运行自动化脚本,抓取数据库中最新的日志解析结果,向消息驱动地理定位插件发送UDP数据包,发起可视化地球模型定位该更新请求;
[0040] NASA World Wind展示服务器110,用于运行NASA World Wind可视化地球模型软件,其中装载了消息驱动地理定位插件,接收基于UDP数据协议的消息输入,并通过显卡连接到大屏幕上输出图像。
[0041] 如图1所示,在该监控系统中,当网站访客浏览基于网站Web服务器集群100所依托的阿里巴巴国际网站并输入搜索关键词时,该网站Web服务器集群100接收搜索关键词并将该搜索请求提交至搜索服务器集群102,当搜索服务器集群102在大规模数据中对该搜索关键词进行处理后将搜索结果返回至网站Web服务器集群100,而网站Web服务器集群100又将该搜索结果在阿里巴巴网站的页面上显示出来并呈现给网站访客;数据处理服务器104运行自动化脚本从搜索服务器集群102中抓取最新日志,并依据预定义规则自动解析日志文本中的数据字段,利用数据库服务器106将日志的解析结果存入数据库;监控数据处理服务器108运行自动化脚本,从数据库服务器106中抓取最新日志的解析结果,并基于UDP数据协议向消息驱动地理定位插件发送数据包以请求定位更新;随后,NASA World Wind展示服务器110接收UDP数据包并响应进行定位更新的请求,驱动地理定位插件和运行NASA World Wind可视化地球模型。
[0042] 图2示出了本发明监控网站访客的地理位置和访问状态的流程示意图。如图2所示,该监控系统可采用如下的操作步骤来实时更新访客的地理位置和访问状态:
[0043] (1)步骤200:访客在阿里巴巴国际网站搜索关键词;
[0044] (2)步骤202:网站Web服务器集群100接受该搜索请求,并产生相关日志;
[0045] (3)步骤204:网站Web服务器集群100将该日志即时输出至本地存储介质上相应的访问日志文件;
[0046] (4)步骤206:后台进程读取搜索查询日志,解析出数据字段并插入数据表。在该步骤中,数据处理服务器104抓取该日志文件,选择产生的搜索关键词中最新的相关日志条目,并解析出数据字段中的访客IP地址和搜索关键词;
[0047] (5)步骤208:存储数据至数据库,数据库服务器106将来自数据处理服务器104的日志解析结果存入数据库,操作完成后返回步骤206继续读取最新的查询日志;
[0048] (6)步骤210:后台进程读取数据表,监控数据处理服务器108运行自动化脚本并从数据库服务器106中抓取最新的一条搜索日志记录;
[0049] (7)步骤212:基于GeoIP将访客IP地址转化为可视化地球模型中的经纬度和地理位置名称;
[0050] (8)步骤214:通过UDP协议将转化后的数据发送至NASA World Wind插件--消息驱动地理定位插件,发送完成后返回步骤210实时读取数据表;以及
[0051] (9)步骤216:NASA World Wind转动可视化地球模型至指定经纬度,并显示访客的相关信息。
[0052] 图3示出了本发明中搜索服务器集群响应搜索请求后生成的日志代码段。需要指出的是,网站Web服务器集群仅仅用于处理普通的访问请求,而在大规模数据中搜索关键词是一种相对较为特殊的应用,并且搜索功能对服务器的存储容量和处理性能都有很高的要求。结合图2,当一位访客在阿里巴巴国际网站的搜索框中输入搜索关键词red_apple时,网站Web服务器集群100响应该搜索请求,并生成如图3所示的日志文件。数据处理服务器104解析出数据字段:访客IP地址为202.7.166.164,搜索关键词为red_apple。基于GeoIP将该访客IP地址和搜索关键词转化为可视化地球模型上的经纬度和地理位置名称,即查询地理信息数据库得到:
[0053] Country(国家):AU AUS Australia
[0054] Region(地区):02
[0055] City(城市):Chullora
[0056] Longitude(经度):151.05°
[0057] Latitude(纬度):-33.9°
[0058] 将转化后的数据整合为格式{经纬度,地理位置名称,搜索关键词},本实施例中即为{“-33.9°,151.05°”,“Chullora,Australia”,“red_apple”},发送到NASA World Wind展示服务器110,再利用包含在其内的消息驱动地理定位插件向该可视化地球模型发送转动指令,地球模型将迅速从原有位置转动到访客所在地的经度和纬度,并且在屏幕中间显示该访客输入的搜索关键词。
[0059] 图4示出了本发明基于GeoIP和WHOIS协议显示访客信息的界面示意图。首先简要介绍一下WHOIS协议和GeoIP。WHOIS是一种非常简单的Internet信息查询协议,该协议首先与服务器的TCP端口建立连接,发送查询关键字并加上回车换行,然后接收服务器的查询结果。基于地理信息的插件GeoIP,是免费的国家/IP映射表,将I P地址映射转化为地理数据的开发库及其地理信息数据库,该GeoIP插件比通过DNS反相解析域名得到的统计更加准确,速度更快。结合上述图2和图3所给出的实施例,访客在阿里巴巴国际网站的搜索框中输入搜索关键词red_apple时,从产生的日志文件中可解析出访客的IP地址和搜索关键词。通过GeoIP输入IP地址202.7.166.164时,关于该访客信息的界面显示如图4所示。
[0060] 图5示出了本发明基于NASA World Wind可视化地球模型实时更新和定位访客位置的示意图。在开放源码并可由用户自定制的NASA World Wind可视化地球模型平台中,消息驱动地理定位插件接收UDP数据包,并向可视化地球模型发出实时更新的请求,如图5所示,在屏幕中间显示访客搜索关键词的信息:”Visitor from Chullora,Australia is searching for red_apple”,并在屏幕的右上角示出访客所在位置的经纬度和其它相关的数据信息。
[0061] 上文中,参照附图描述了本发明的具体实施方式。但是,本领域中的普通技术人员能够理解,在不偏离本发明的精神和范围的情况下,还可以对本发明的具体实施方式作各种变更和替换。这些变更和替换都落在本发明权利要求书所限定的范围内。