一种基于互联网IP地址定位数据的IP地址定位系统和方法转让专利

申请号 : CN201510057358.2

文献号 : CN105991780B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 李晗叶建伟何跃鹰晏杨郭承青许俊峰云晓春

申请人 : 国家计算机网络与信息安全管理中心

摘要 :

本发明提供一种基于互联网IP地址定位数据的IP地址定位系统和方法,系统包括数据提取层、数据处理层、数据存储层和验证融合层;方法包括初始化配置参数,并对采集到的互联网IP地址定位数据进行归一化处理;对互联网IP地址定位数据进行反向验证;互联网IP地址定位数据进行融合。本发明融合多个互联网IP地址定位数据库,使它们相互补充和完善,提高了数据覆盖面;使用了内存镜像进行数据的录入,极大的提高了效率;使用反向验证及基于信任的数据融合技术,提高了数据准确度。

权利要求 :

1.一种基于互联网IP地址定位数据的IP地址定位方法,其特征在于:所述方法通过基于互联网IP地址定位数据的IP地址定位系统实现;所述系统包括数据提取层、数据处理层、数据存储层和验证融合层;

所述数据提取层采集互联网IP地址定位数据,所述数据处理层将采集到的互联网IP地址定位数据进行归一化处理,所述数据存储层内存镜像优化归一化处理后的互联网IP地址定位数据,所述验证融合层对互联网IP地址定位数据进行验证和融合;

所述数据提取层的采集插件包括IP2LOCATION插件、新浪插件、淘宝插件、纯真插件和IP138插件;

所述方法包括:

初始化配置参数,并对采集到的互联网IP地址定位数据进行归一化处理;

对互联网IP地址定位数据进行反向验证;

互联网IP地址定位数据进行融合;

反向验证互联网IP地址定位数据,包括:

使用内存镜像存储IP地址编码,将存储的IP地址编码与数据提取层采集的互联网IP地址定位数据进行比对,挑选出位置有变化的互联网IP地址定位数据并记录到互联网IP地址定位数据库中,同时将内存镜像中的数据更新为数据提取层采集的IP地址编码;

使用traceroute方法探取IP地址的路由信息,并通过验证路由器IP地址数据和被验证的互联网IP地址定位数据是否匹配,进而判断互联网IP地址定位数据库的准确性;

互联网IP地址定位数据融合包括:

建立信任模型;

采用奖励策略提高互联网IP地址定位数据库权重;

所述信任模型包括主观信任和直接信任;

信任实体和被信任实体之间的信任关系决定于信任实体的主观观察,按照信任实体的意图、状态和行为因素对被信任实体的取值进行评估,得到主观信任;

信任实体利用交互时间,对被信任实体的历史行为、当前行为进行信任的动态评估,形成直接信任;

设主观信任和直接信任分别用Tsub和Tdir表示,则由主观信任和直接信任共同决定的信任值用T表示,有:T=αTsub+βTdir                             (1)其中,α和β分别表示主观信任和直接信任的重要程度,即主观信任权值和客观信任权值,且满足α+β=1;

设观察时间、当前时间分别用tref、t0表示;设用户对互联网IP地址定位数据库提供的互联网IP地址定位数据满意的总次数记为N,互联网IP地址定位数据库持续提供满意服务的次数Nsuc,满意阈值为Thsuc,修正式(1),得到修正后的评分信任值T′,T′大于Thsuc的服务为满意服务;T′表示为:T′=αTsub+βTdir+RW                           (2)其中,RW表示奖励值,由用户持续好评、反向验证准确度、互联网IP地址定位数据欢迎度确定;

观察时间tref内,奖励值RW控制在0.5以下,同时随时间衰减;RW表示为:其中, 表示衰减函数;s为衰减速率,0<s≤1,s=0时表示无衰减;tk为对应于上次评价的时间点;L(tk)表示tk相对于当前时间t0的时间距离。

2.根据权利要求1所述的基于互联网IP地址定位数据的IP地址定位方法,其特征在于:所述配置参数包括互联网IP地址定位库名称、接口、采集线程数、采集周期和采集速率。

3.根据权利要求1所述的基于互联网IP地址定位数据的IP地址定位方法,其特征在于:对采集到的互联网IP地址定位数据进行归一化处理,通过使用分词和人工审核统一互联网IP地址定位数据的格式,并对互联网IP地址定位数据进行编码,形成IP地址编码表。

说明书 :

一种基于互联网IP地址定位数据的IP地址定位系统和方法

技术领域

[0001] 本发明涉及IP地址位置定位领域,具体涉及一种基于互联网IP地址定位数据的IP地址定位系统和方法。

背景技术

[0002] IP地址定位指根据网络设备的IP地址来确定其地理位置,即确定IP地址的行政区信息。近年来,基于IP地址地理位置的网络应用层出不穷,主要包括定向广告、社交网络、网络安全、网络服务性能优化等。IP地址定位库的建立及其定位精度、准确度的提高已成为当今互联网上一个亟待解决的问题。
[0003] 目前在互联网上存在的主流IP地址定位库有IP2LOCATION、纯真、IP138、新浪、淘宝等。这些定位库呈现出数据获取接口不一、数据呈现形式不同、定位精度有所差异的特点,同时其准确程度也因IP地址所处国家及地区的不同而有所差异。
[0004] 互联网上存在的这些数据库主要是利用ICANN(Internet Corporation for Assigned Names and Numbers,互联网名称与数字地址分配机构)分配信息、运营商IP地址部署分配情况、用户主动反馈提交、通过应用程序获取、参考其他IP地址定位库等方式构建,存在着更新速度慢、库间定位冲突较多等缺点。

发明内容

[0005] 为解决IP地址定位不准确、覆盖不全面的问题,本发明提供一种基于互联网IP地址定位数据的IP地址定位系统和方法,采用数据归一化、反向验证、数据融合等技术来提高IP地址定位的准确度。
[0006] 为了实现上述发明目的,本发明采取如下技术方案:
[0007] 本发明提供一种基于互联网IP地址定位数据的IP地址定位系统,所述系统包括数据提取层、数据处理层、数据存储层和验证融合层;
[0008] 所述数据提取层采集互联网IP地址定位数据,所述数据处理层将采集到的互联网IP地址定位数据进行归一化处理,所述数据存储层内存镜像优化归一化处理后的互联网IP地址定位数据,所述验证融合层对互联网IP地址定位数据进行验证和融合。
[0009] 所述数据提取层的采集插件包括IP2LOCATION插件、新浪插件、淘宝插件、纯真插件和IP138插件。
[0010] 本发明还提供一种基于互联网IP地址定位数据的IP地址定位方法,所述方法包括:
[0011] 初始化配置参数,并对采集到的互联网IP地址定位数据进行归一化处理;
[0012] 对互联网IP地址定位数据进行反向验证;
[0013] 互联网IP地址定位数据进行融合。
[0014] 所述配置参数包括互联网IP地址定位库名称、接口、采集线程数、采集周期和采集速率。
[0015] 对采集到的互联网IP地址定位数据进行归一化处理,通过使用分词和人工审核统一互联网IP地址定位数据的格式,并对互联网IP地址定位数据进行编码,形成IP地址编码表。
[0016] 反向验证互联网IP地址定位数据,包括:
[0017] 使用内存镜像存储IP地址编码,将存储的IP地址编码与数据提取层采集的互联网IP地址定位数据进行比对,挑选出位置有变化的互联网IP地址定位数据并记录到互联网IP地址定位数据库中,同时将内存镜像中的数据更新为数据提取层采集的IP地址编码;
[0018] 使用traceroute方法探取IP地址的路由信息,并通过验证路由器IP地址数据和被验证的互联网IP地址定位数据是否匹配,进而判断互联网IP地址定位数据库的准确性。
[0019] 互联网IP地址定位数据融合包括:
[0020] 建立信任模型;
[0021] 采用奖励策略提高互联网IP地址定位数据库权重。
[0022] 所述信任模型包括主观信任和直接信任;
[0023] 信任实体和被信任实体之间的信任关系决定于信任实体的主观观察,按照信任实体的意图、状态和行为因素对被信任实体的取值进行评估,得到主观信任;
[0024] 信任实体利用交互时间,对被信任实体的历史行为、当前行为进行信任的动态评估,形成直接信任。
[0025] 设主观信任和直接信任分别用Tsub和Tdir表示,则由主观信任和直接信任共同决定的信任值用T表示,有:
[0026] T=αTsub+βTdir   (1)
[0027] 其中,α和β分别表示主观信任和直接信任的重要程度,即主观信任权值和客观信任权值,且满足α+β=1。
[0028] 设观察时间、当前时间分别用tref、t0表示;设用户对互联网IP地址定位数据库提供的互联网IP地址定位数据满意的总次数记为N,互联网IP地址定位数据库持续提供满意服务的次数Nsuc,满意阈值为Thsuc,修正式(1),得到修正后的评分信任值T′,T′大于Thsuc的服务为满意服务;T′表示为:
[0029] T′=αTsub+βTdir+RW   (2)
[0030] 其中,RW表示奖励值,由用户持续好评、反向验证准确度、互联网IP地址定位数据欢迎度确定;
[0031] 观察时间tref内,奖励值RW控制在0.5以下,同时随时间衰减;RW表示为:
[0032]
[0033] 其中, 表示衰减函数;s为衰减速率,0<s≤1,s=0时表示无衰减;tk为对应于上次评价的时间点;L(tk)表示tk相对于当前时间t0的时间距离。
[0034] 与现有技术相比,本发明的有益效果在于:
[0035] A.本发明融合多个互联网IP地址定位数据库,使它们相互补充和完善,提高了数据覆盖面;
[0036] B.使用了内存镜像进行数据的录入,极大的提高了效率;
[0037] C.使用反向验证及基于信任的数据融合技术,提高了数据准确度。

附图说明

[0038] 图1是本发明实施例中基于互联网IP地址定位数据的IP地址定位系统结构示意图;
[0039] 图2是本发明实施例中IP地址定位数据库库中数据更新优化逻辑流程图。

具体实施方式

[0040] 下面结合附图对本发明作进一步详细说明。
[0041] 本发明涉及IP地址位置定位领域,即通过IP地址值确定该IP地址的具体位置。本发明通过采集现今互联网上多种主流IP地址定位库数据,利用数据融合技术以提高IP地址定位精度的方法,并最终形成相应的IP地址定位库。其采用了互联网IP地址定位库数据采集技术、数据归一化技术、反向验证技术、数据融合技术等方法来实现和提高系统性能。
[0042] 如图1,本发明提供一种基于互联网IP地址定位数据的IP地址定位系统,所述系统包括数据提取层、数据处理层、数据存储层和验证融合层;
[0043] 所述数据提取层采集互联网IP地址定位数据,所述数据处理层将采集到的互联网IP地址定位数据进行归一化处理,所述数据存储层内存镜像优化归一化处理后的互联网IP地址定位数据(如图2),所述验证融合层对互联网IP地址定位数据进行验证和融合。
[0044] 所述数据提取层的采集插件包括IP2LOCATION插件、新浪插件、淘宝插件、纯真插件和IP138插件。
[0045] 本发明还提供一种基于互联网IP地址定位数据的IP地址定位方法,所述方法包括:
[0046] 初始化配置参数,并对采集到的互联网IP地址定位数据进行归一化处理;
[0047] 对互联网IP地址定位数据进行反向验证;
[0048] 互联网IP地址定位数据进行融合。
[0049] 所述配置参数包括互联网IP地址定位库名称、接口、采集线程数、采集周期和采集速率。
[0050] 由于几个主流互联网IP地址定位数据库(IP2LOCATION、纯真、淘宝、新浪、IP138)存在对外提供数据的方式不同、数据格式不一、数据精度不同、数据内容存在别名等差异,因此本发明通过加载采集插件的方式采集互联网IP地址定位数据,并进行归一化处理,通过使用分词和人工审核统一互联网IP地址定位数据的格式,并对互联网IP地址定位数据进行编码,形成IP地址编码表。
[0051] IP地址位置信息具有频繁变动的特征,互联网各IP地址数据也因此存在数据变更不及时、位置信息定位错误的情况。因此本发明通过互联网IP地址定位数据进行反向验证,包括:
[0052] 使用内存镜像存储IP地址编码,将存储的IP地址编码与数据提取层采集的互联网IP地址定位数据进行比对,挑选出位置有变化的互联网IP地址定位数据并记录到互联网IP地址定位数据库中,同时将内存镜像中的数据更新为数据提取层采集的IP地址编码;
[0053] 使用traceroute方法探取IP地址的路由信息,并通过验证路由器IP地址数据和被验证的互联网IP地址定位数据是否匹配,进而判断互联网IP地址定位数据库的准确性。
[0054] 由于IP地址位置信息采集自互联网上的多个IP地址定位库,并不能给出统一IP地址位置结果,即可能存在数据有冲突的情况。因此本发明需要完成互联网IP地址定位数据融合;包括:
[0055] 建立信任模型;
[0056] 采用奖励策略提高互联网IP地址定位数据库权重。
[0057] 所述信任模型包括主观信任和直接信任;
[0058] 信任实体和被信任实体之间的信任关系决定于信任实体的主观观察,按照信任实体的意图、状态和行为因素对被信任实体的取值进行评估,得到主观信任;另外,仅仅通过用户的主观信任并不能取得最好的效果,得到的信任值并不精确,于是信任实体利用交互时间,对被信任实体的历史行为、当前行为进行信任的动态评估,形成直接信任。
[0059] 设主观信任和直接信任分别用Tsub和Tdir表示,则由主观信任和直接信任共同决定的信任值用T表示,有:
[0060] T=αTsub+βTdir   (1)
[0061] 其中,α和β分别表示主观信任和直接信任的重要程度,即主观信任权值和客观信任权值,且满足α+β=1,它表示依赖于IP地址位置信息实体的具体要求,如果信任实体更相信自己的直接经验,那么就选择较大的直接信任值权值。
[0062] 设观察时间、当前时间分别用tref、t0表示;设用户对互联网IP地址定位数据库提供的互联网IP地址定位数据满意的总次数记为N,互联网IP地址定位数据库持续提供满意服务的次数Nsuc,满意阈值为Thsuc,修正式(1),得到修正后的评分信任值T′,T′大于Thsuc的服务为满意服务;T′表示为:
[0063] T′=αTsub+βTdir+RW   (2)
[0064] 其中,RW表示奖励值,由用户持续好评、反向验证准确度、互联网IP地址定位数据欢迎度确定;
[0065] 观察时间tref内,奖励值RW控制在0.5以下,同时随时间衰减;RW表示为:
[0066]
[0067] 其中, 表示衰减函数;s为衰减速率,0<s≤1,s=0时表示无衰减;tk为对应于上次评价的时间点;L(tk)表示tk相对于当前时间t0的时间距离。对于来自不同互联网IP地址定位数据库的互联网IP地址定位数据,s的初始值可以设置为定值,也可以通过用户的反馈信息来动态的调整其s值。
[0068] 本发明提供一种基于互联网IP地址定位数据库,并结合反向验证、基于信任模型的数据融合方法进行验证、完善工作,最终形成准确度相对较高的互联网IP地址定位方法。具有如下优点:(1)融合多个互联网IP地址定位数据库,使它们相互补充和完善,提高了数据覆盖面;(2)使用了内存镜像进行数据的录入,极大的提高了效率;(3)使用反向验证及基于信任的数据融合技术,提高了数据准确度。
[0069] 最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,所属领域的普通技术人员参照上述实施例依然可以对本发明的具体实施方式进行修改或者等同替换,这些未脱离本发明精神和范围的任何修改或者等同替换,均在申请待批的本发明的权利要求保护范围之内。