一种IP数据的处理方法及装置转让专利

申请号 : CN200910107580.3

文献号 : CN101572629B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 程宇陈川凌国惠李郁韬

申请人 : 腾讯科技(深圳)有限公司

摘要 :

本发明适用于数据处理领域,提供了一种IP数据的处理方法和装置,所述方法包括下述步骤:A、采集登录用户的行为日志信息;B、从所述行为日志信息中分离出用户行为属性;C、根据业务需求,统计每个IP地址上与所述业务需求对应的用户行为属性的统计值,根据用户行为属性的统计值与预设的阈值之间的关系,对IP地址进行聚合处理,得到满足所述业务需求的IP地址集合。本发明实施例中通过采集海量用户的行为日志信息,从行为日志信息中分离出用户行为属性,再根据用户行为属性的统计值与预设阈值之间的关系,将IP地址进行聚合,得到满足不同业务需求的IP地址集合,从而为不同业务需求提供满足业务需求的基础的平台数据支持。

权利要求 :

1.一种IP数据的处理方法,其特征在于,所述方法包括下述步骤:A、采集登录用户的行为日志信息;

B、从所述行为日志信息中分离出用户行为属性;

C、根据业务需求,统计每个IP地址上与所述业务需求对应的用户行为属性的统计值,根据用户行为属性的统计值之和与预设的阈值之间的关系,对IP地址进行聚合处理,得到满足所述业务需求的IP地址集合。

2.如权利要求1所述的方法,其特征在于,所述步骤B具体为:通过对登录用户的行为日志信息进行聚类分析,从登录用户的行为日志信息中分离出用户行为属性。

3.如权利要求1所述的方法,其特征在于,所述行为日志信息包括登录IP地址、登录时间、登录时长、登录网址;用户行为属性包括上网时间段、同一IP地址在单位时间段内的登录用户数、登录网址、登录地理位置。

4.如权利要求1所述的方法,其特征在于,所述步骤C具体为:根据业务需求,预先为每个IP地址上与所述业务需求对应的用户行为属性设置对应的权值;

统计每个IP地址上的用户行为属性的统计值,并根据用户行为属性的统计值和对应的权值的乘积和与预设的阈值之间的关系,对IP地址进行聚合处理,得到满足所述业务需求的IP地址集合。

5.如权利要求1至4任一权利要求所述的方法,其特征在于,在所述步骤C之后,所述方法还包括下述步骤:向满足所述业务需求的IP地址集合中的IP地址推送对应的业务。

6.一种IP数据的处理装置,其特征在于,所述装置包括:日志信息采集单元,用于采集登录用户的行为日志信息;

用户行为属性分离单元,用于从所述日志信息采集单元采集的行为日志信息中分离出用户行为属性;

IP地址聚集单元,用于根据业务需求,统计每个IP地址上与所述业务需求对应的用户行为属性的统计值,根据用户行为属性的统计值之和与预设的阈值之间的关系,对IP地址进行聚合处理,得到满足所述业务需求的IP地址集合。

7.如权利要求6所述的装置,其特征在于,所述用户行为属性分离单元通过对登录用户的行为日志信息进行聚类分析,从登录用户的行为日志信息中分离出用户行为属性。

8.如权利要求6所述的装置,其特征在于,所述行为日志信息包括登录IP地址、登录时间、登录时长、登录网址;用户行为属性包括上网时间段、同一IP地址在单位时间段内的登录用户数、登录网址、登录地理位置。

9.如权利要求6所述的装置,其特征在于,所述装置还包括:权值设置单元,用于根据业务需求,为每个IP地址上与所述业务需求对应的用户行为属性设置对应的权值;此时,所述IP地址聚集单元统计每个IP地址上的用户行为属性的统计值,并根据用户行为属性的统计值和对应的权值的乘积和与预设的阈值之间的关系,对IP地址进行聚合处理,得到满足所述业务需求的IP地址集合。

10.如权利要求6至9任一权利要求所述的装置,其特征在于,所述装置还包括:业务推送单元,用于向所述IP地址聚集单元得到的满足所述业务需求的IP地址集合中的IP地址推送对应的业务。

说明书 :

一种IP数据的处理方法及装置

技术领域

[0001] 本发明属于数据处理领域,尤其涉及一种IP数据处理方法及装置。

背景技术

[0002] 随着网络的普及,互联网已成为人们生活的重要部分,网络在给人们的生活带来便利的同时,也创造了无限商机,如网上购物、信息获取等。IP数据是获取信息的重要来源。IP数据包括IP地址以及与IP地址相关的信息,IP数据是现有的许多业务的数据基础。以IP数据为基础的业务不仅可以为用户提供商机,同时也可以节约网络资源、降低网络负荷。
用于存储IP数据的数据库成为IP数据库,因此,有效的利用和管理IP数据库已成为许多公司有待解决的问题。
[0003] 现有的IP数据库中,IP数据的主要属性相对固定,如包括物理位置信息、供应商信息、注册信息等。这种信息能有效的按照地域将用户进行区分,从而为不同的业务提供一些基础的数据支持,如在网络上投放时,可以对某一特定地理位置的用户进行投放,但是这种IP数据处理方法得到的IP数据难以满足不同业务需求,且难以为不同的业务提供真正的数据支持,同时这种IP数据处理方法难以寻找到真正的目标用户,从而不但使得用户受到骚扰,同时也浪费了网络资源、增加了网络负担。

发明内容

[0004] 本发明实施例的目的在于提供一种IP数据的处理方法,旨在解决现有的IP数据处理方法得到的IP数据难以满足不同业务需求,且难以为不同的业务提供真正的数据支持的问题。
[0005] 本发明实施例是这样实现的,一种IP数据的处理方法,所述方法包括下述步骤:
[0006] A、采集登录用户的行为日志信息;
[0007] B、从所述行为日志信息中分离出用户行为属性;
[0008] C、根据业务需求,统计每个IP地址上与所述业务需求对应的用户行为属性的统计值,根据用户行为属性的统计值之和与预设的阈值之间的关系,对IP地址进行聚合处理,得到满足所述业务需求的IP地址集合。
[0009] 优选地,所述步骤B具体为:
[0010] 通过对登录用户的行为日志信息进行聚类分析,从登录用户的行为日志信息中分离出用户行为属性。
[0011] 优选地,所述行为日志信息包括登录IP地址、登录时间、登录时长、登录网址;用户行为属性包括上网时间段、同一IP地址在单位时间段内的登录用户数、登录网址、登录地理位置。
[0012] 优选地,所述步骤C具体为:
[0013] 根据业务需求,预先为每个IP地址上与所述业务需求对应的用户行为属性设置对应的权值;
[0014] 统计每个IP地址上的用户行为属性的统计值,并根据用户行为属性的统计值和对应的权值的乘积和与预设的阈值之间的关系,对IP地址进行聚合处理,得到满足所述业务需求的IP地址集合。
[0015] 优选地,在所述步骤C之后,所述方法还包括下述步骤:
[0016] 向满足所述业务需求的IP地址集合中的IP地址推送对应的业务,从而可以节约网络资源、降低网络负担,同时为用户提供更好的服务。
[0017] 本发明实施例的另一目的在于提供一种IP数据的处理装置,所述装置包括:
[0018] 日志信息采集单元,用于采集登录用户的行为日志信息;
[0019] 用户行为属性分离单元,用于从所述日志信息采集单元采集的行为日志信息中分离出用户行为属性;
[0020] IP地址聚集单元,用于根据业务需求,统计每个IP地址上与所述业务需求对应的用户行为属性的统计值,根据用户行为属性的统计值之和与预设的阈值之间的关系,对IP地址进行聚合处理,得到满足所述业务需求的IP地址集合。
[0021] 优选地,所述用户行为属性分离单元通过对登录用户的行为日志信息进行聚类分析,从登录用户的行为日志信息中分离出用户行为属性。
[0022] 优选地,所述行为日志信息包括登录IP地址、登录时间、登录时长、登录网址;用户行为属性包括上网时间段、同一IP地址在单位时间段内的登录用户数、登录网址、登录地理位置。
[0023] 优选地,所述装置还包括:
[0024] 权值设置单元,用于根据业务需求,为每个IP地址上与所述业务需求对应的用户行为属性设置对应的权值;此时,
[0025] 所述IP地址聚集单元统计每个IP地址上的用户行为属性的统计值,并根据用户行为属性的统计值和对应的权值的乘积和与预设的阈值之间的关系,对IP地址进行聚合处理,得到满足所述业务需求的IP地址集合。
[0026] 优选地,所述装置还包括:
[0027] 业务推送单元,用于向所述IP地址聚集单元得到的满足所述业务需求的IP地址集合中的IP地址推送对应的业务,从而可以节约网络资源、降低网络负担,同时为用户提供更好的服务。
[0028] 在本发明实施例中通过采集海量用户的行为日志信息,从行为日志信息中分离出用户行为属性,再根据用户行为属性的统计值与预设阈值之间的关系,将IP地址进行聚合,得到满足不同业务需求的IP地址集合,从而为不同业务需求提供满足业务需求的基础的平台数据支持。

附图说明

[0029] 图1是本发明实施例提供的IP数据的处理方法的实现流程图;
[0030] 图2是本发明另一实施例提供的IP数据的处理方法的实现路程图;
[0031] 图3是本发明实施例提供的IP数据的处理装置的结构框图。

具体实施方式

[0032] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0033] 在本发明实施例中,通过获取登录用户的行为日志信息,从登录用户的行为日志信息中分离出用户行为属性,根据业务需求,统计每个IP地址上与该业务需求对应的用户行为属性的统计值,并根据用户行为属性的统计值与预设的阈值之间的关系,将满足该业务需求的IP数据聚集,以为该业务提供基础的平台数据支持。
[0034] 图1示出了本发明实施例提供的IP数据的处理方法的实现流程,详述如下:
[0035] 在步骤S101中,采集登录用户的行为日志信息。
[0036] 其中登录用户的行为日志信息包括但不限于登录IP地址、登录时间、登录时长、登录网址等。
[0037] 在步骤S102中,从登录用户的行为日志信息中分离出用户行为属性。
[0038] 在本发明实施例中,通过对登录用户的行为日志信息进行聚类分析,从登录用户的行为日志信息中分离出用户行为属性。其中用户行为属性包括但不限于上网时间段、同一IP地址在单位时间段内的登录用户数、登录网址、登录地理位置等。在本发明实施例中,上述用户行为属性的值可以根据具体业务的需要进行设置。
[0039] 如对于上网时间段,可以设置其包括工作日和非工作日两个值,根据登录用户的行为日志信息中的登录时间以及登录时长,即可确定该登录用户的上网时间段为工作日还是非工作日,当然也可以设置上网时间段包括上午(从5:00到13:00)、下午(从13:00到21:00)和晚上(从21:00到5:00)三个值,根据登录用户的行为日志信息中的登录时间和登录时长,即可确定该登录用户的上网时间段为上午、下午或者晚上。同理,还可以设置上网时间段的值为其他值。
[0040] 对于登录地理位置,由于登录IP中一般均包括地址位置,因此,可以根据登录用户的行为日志信息中的登录IP获取用户的登录地址位置,如可以为北京、上海、深圳、广州等。当登录IP中还包括运营商信息、注册信息时,则进一步地,可以根据登录IP获取该用户地运营商信息、注册信息等。
[0041] 对于登录网址,可以设置其值为具体的登录网址,如www.sina.com等,也可以设置其值包括商业网站、生活网站、娱乐网站、技术网站等。根据登录用户的登录日志信息中的登录网址即可确定该用户的登录网址的值。
[0042] 请参阅表1.1,为本发明实施例提供的从登录用户的登录日志信息中分离出的用户行为属性表的一示例,但不以此表为限。
[0043]
[0044] 其中登录用户数是指同一IP地址的登录用户数。典型的,对于家庭IP地址来说,登录用户数一般较少,而对于网吧IP地址、学校IP地址等公共场合的IP地址,则登录用户数一般较多。通过对登录用户的登录网址进行分析,可以粗略的确定用户的相关信息,如年龄、工作性质等。而这些信息均可以为不同的业务提供基础的平台数据支持。
[0045] 在步骤S103中,根据业务需求,统计每个IP地址上与该业务需求对应的用户行为属性的统计值,根据用户行为属性的统计值与预设的阈值之间的关系,对IP地址进行聚合处理,得到满足该业务需求的IP地址集合。
[0046] 在本发明实施例中,由于不同的用户行为属性对业务的影响不同,甚至有的用户行为属性对某些业务基本没有影响,因此,在统计每个IP地址上与该业务需求对应的用户行为属性的统计值时,可以只统计对业务有影响的用户行为属性的统计值。如在广告业务中,对广告业务有影响的用户行为属性包括登录网址、登录地理位置、登录用户数,此时,仅需要对每个IP地址上的登录网址、登录地址位置、登录用户数进行统计,得到对应的统计值,分别为P1、P2、P3。而对于其他业务需求,需要统计的用户行为属性可能不一致。举例说明如下:
[0047] 对于某广告业务需求,仅需要统计登录地理位置为北京、登录网址为商业网站,即可为该广告业务需求提供基础数据支持,则此时,统计每个IP地址上登录地理位置为北京的统计值P1(如登录地理位置为北京的用户数,或者用户所占比例),以及登录网址为商业网站的统计值P2(如登录网址为商业网站的统计值的用户数,或者用户所占比例),根据登录地理位置为北京的统计值P1以及登录网址为商业网站的统计值P2与预设的阈值之间的关系,对IP地址进行聚合处理,得到满足该广告业务需求的IP地址集合,通过该IP地址集合为该广告业务提供基础的平台数据支持。
[0048] 在本发明实施例中,需要预先根据业务的需求设置与该业务需求对应的阈值,通过将用户行为属性的统计值与预设的阈值进行比较,将满足该业务需求的IP地址进行聚合,即可得到满足业务需求的IP地址集合。其中预先根据业务的需求设置的与该业务需求对应的阈值可以为单值,如V,也可以为范围值,如[A,B],且A≤B等。
[0049] 如假设某业务需求需要统计的用户行为属性包括登录网址、登录地理位置和登录用户数,某IP地址上的登录网址、登录地址位置、登录用户数的统计值分别为P1、P2、P3,预设的与该业务需求对应的阈值为V,则将满足P1+P2+P3≥V的IP地址进行聚合,得到满足该业务需求的IP地址集合。
[0050] 由于不同的用户行为属性对业务的影响不同,为了体现用户行为属性对业务的影响,以为业务需求提供更好的数据支持,在本发明另一实施例中,根据业务需求,预先为每个IP地址上与该业务需求对应的用户行为属性设置对应的权值,此时步骤S103具体包括下述步骤:
[0051] 统计每个IP地址上的用户行为属性的统计值,并根据用户行为属性的统计值与对应的权值的乘积和与预设的阈值之间的关系,对IP地址进行聚合处理,得到满足该业务需求的IP地址集合。
[0052] 在本发明实施例中,预先为每个IP地址上与业务需求对应的用户行为属性设置对应的权值时,各个权值的和等于1,且每个权值均大于0,并且小于1。
[0053] 在本发明实施例中,对于不同的业务需求,需要统计的用户行为属性的统计值不一致,且预设的与用户行为属性对应的权值也可能不一致,同时预设的与业务需求对应的阈值也可能不一致。
[0054] 如假设某业务需求需要统计的用户行为属性包括登录网址、登录地理位置和登录用户数,某IP地址上的登录网址、登录地址位置、登录用户数的统计值分别为P1、P2、P3,预先为登录网址、登录地址位置、登录用户数预设的权值分别为k1、k2和k3,且k1+k2+k3=1,k1、k2、k3均大于0,小于1,预设的与该业务需求对应的阈值为V,则将满足P1*k1+P2*k2+P3*k3≥V的IP地址进行聚合,得到满足该业务需求的IP地址集合。
[0055] 如上所述,对于不同的业务需求,可以统计每个IP地址上的与每个业务需求对应的用户行为属性的统计值,根据用户行为属性的统计值与预设的阈值之间的关系,对IP地址进行聚合处理,得到满足该业务需求的IP地址集合,该IP地址集合即可为对应的业务需求提供基础的平台数据支持。
[0056] 为了节约网络资源、降低网络负担,同时为用户提供更好的服务,请参阅图2,是本发明另一实施例提供的IP数据的处理方法的实现流程,其中步骤S201、S202、S203与图1中的步骤S101、S102、S103相同,其与图1所示的IP数据的处理方法的不同之处仅在于,其还包括下述步骤:
[0057] 在步骤S204中,向满足该业务需求的IP地址集合中的IP地址推送该业务。
[0058] 如对于广告业务的推广,有些产品有其特定的消费群体,如汽车、电脑等适合办公人群;奶粉、厨具等适合家庭人群。通过本发明实施例提供的上述方法即可将满足办公人群的IP地址进行集合,将满足家庭人群的IP地址进行集合,从而可以快速定位到具有相应人群特性的IP集合,再通过向该IP集合中的IP地址推出相应的广告,不仅提高广告的效率和针对性,而且节省了网络资源,提高了网络的效率。
[0059] 图3示出了本发明实施例提供的IP数据的处理装置的结构,为了便于说明,仅示出了与本发明实施例相关的部分。其中:
[0060] 日志信息采集单元21采集登录用户的行为日志信息。其中登录用户的行为日志信息包括但不限于登录IP地址、登录时间、登录时长、登录网址等。
[0061] 用户行为属性分离单元22从日志信息采集单元21采集的登录用户的行为日志信息中分离出用户行为属性。在本发明实施例中,通过对登录用户的行为日志信息进行聚类分析,即可从登录用户的行为日志信息中分离出用户行为属性。其中用户行为属性包括但不限于上网时间段、同一IP地址在单位时间段内的登录用户数、登录网址、登录地理位置等。在本发明实施例中,上述用户行为属性的值可以根据具体业务的需要进行设置。
[0062] IP地址聚集单元23根据业务需求,统计每个IP地址上与该业务需求对应的用户行为属性的统计值,根据用户行为属性的统计值与预设的阈值之间的关系,对IP地址进行聚合处理,得到满足该业务需求的IP地址集合。
[0063] 在本发明实施例中,需要预先根据业务的需求设置与该业务需求对应的阈值,通过将用户行为属性的统计值与预设的阈值进行比较,将满足该业务需求的IP地址进行聚合,即可得到满足业务需求的IP地址集合。其中预先根据业务的需求设置的与该业务需求对应的阈值可以为单值,如V,也可以为范围值,如[A,B],且A≤B等。
[0064] 在本发明实施例中,由于不同的用户行为属性对业务的影响不同,甚至有的用户行为属性对某些业务基本没有影响,因此,在统计每个IP地址上与该业务需求对应的用户行为属性的统计值时,可以只统计对业务有影响的用户行为属性的统计值。
[0065] 由于不同的用户行为属性对业务的影响不同,为了体现用户行为属性对业务的影响,以为业务需求提供更好的数据支持,在本发明另一实施例中,该装置还包括权值设置单元24,该权值设置单元24根据业务需求,预先为每个IP地址上与该业务需求对应的用户行为属性设置对应的权值,此时,IP地址聚集单元23统计每个IP地址上的用户行为属性的统计值,并根据用户行为属性的统计值与对应的权值的乘积和与预设的阈值之间的关系,对IP地址进行聚合处理,得到满足该业务需求的IP地址集合。
[0066] 在本发明实施例中,权值设置单元24预先为每个IP地址上与业务需求对应的用户行为属性设置对应的权值时,各个权值的和等于1,且每个权值均大于0,并且小于1。
[0067] 在本发明实施例中,对于不同的业务需求,需要统计的用户行为属性的统计值不一致,且预设的与用户行为属性对应的权值也可能不一致,同时预设的与业务需求对应的阈值也可能不一致。
[0068] 为了节约网络资源、降低网络负担,同时为用户提供更好的服务,在本发明另一实施例中,该装置还包括业务推送单元25。该业务推送单元25向IP地址聚集单元24得到的满足该业务需求的IP地址集合中的IP地址推送该业务。
[0069] 在本发明实施例中,通过采集海量用户的行为日志信息,从行为日志信息中分离出用户行为属性,再根据用户行为属性的统计值与预设阈值之间的关系,将IP地址进行聚合,得到满足不同业务需求的IP地址集合,从而为不同业务需求提供满足业务需求的基础的平台数据支持。通过根据业务需求,为对应的用户行为属性设置权值,再根据用户行为属性的统计值和对应权值的乘积和与预设阈值之间的关系,将IP地址进行聚合,得到满足不同业务需求的IP地址集合,从而为不同业务需求提供更准确的基础平台数据支持。通过向满足不同业务需求的IP地址集合中的IP地址推送对应的业务,从而可以节约网络资源、降低网络负担,同时为用户提供更好的服务。
[0070] 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。