一种数据处理方法、装置、存储介质和网络设备转让专利

申请号 : CN201811408631.1

文献号 : CN111221924B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 陈毅臻陈哲吴汉杰戴云峰

申请人 : 腾讯科技(深圳)有限公司

摘要 :

本发明实施例公开了一种数据处理方法、装置、存储介质和网络设备;本发明实施例可以获取数据,并确定待划分区域;对待划分区域进行划分,并获取划分后区域的区域标识;对划分后区域中数据的数据值进行聚合,得到划分后区域对应的聚合数据值;根据聚合数据值从划分后区域中确定需要进一步划分的目标区域;当不满足预设区域划分终止条件时,将目标区域更新为待划分区域;返回执行对待划分区域进行划分的步骤;当满足预设区域划分终止条件时,输出所有区域的区域信息,并基于区域信息进行数据处理。该方案可以提升数据在区域中分布的均匀性。

权利要求 :

1.一种数据处理方法,其特征在于,包括:

获取数据,并确定待划分区域,所述数据为地理空间上分布不均的多个数据;

在所述待划分区域中确定划分点;根据所述划分点对所述待划分区域进行划分,并获取划分后区域的区域标识;所述在所述待划分区域中确定划分点,包括:根据所述待划分区域内数据的地理位置信息确定划分点;

针对每个划分后区域,对每个划分后区域中数据的数据值进行聚合,得到每个划分后区域对应的聚合数据值,每个划分后区域中数据是根据数据的地理位置信息和每个划分后区域的地理位置信息确定的;

根据所述聚合数据值从划分后区域中确定需要进一步划分的目标区域;

当不满足预设区域划分终止条件时,将所述目标区域更新为所述待划分区域;并且,返回执行对所述待划分区域进行划分的步骤;

当满足预设区域划分终止条件时,输出所有区域的区域信息,所述区域信息包括区域标识,并基于所述区域信息进行数据处理。

2.如权利要求1所述的数据处理方法,其特征在于,获取划分后区域的区域标识,包括:获取所述划分后区域在所述待划分区域中的相对位置信息;

根据所述相对位置信息和所述待划分区域的区域标识,获取划分后区域的区域标识。

3.如权利要求2所述的数据处理方法,其特征在于,获取所述划分后区域在所述待划分区域中的相对位置信息,包括:获取所述划分后区域的位置信息、以及所述待划分区域的参考点位置信息;

将所述划分后区域的位置信息与所述参考点位置信息进行比较,得到比较结果;

根据所述比较结果获取所述划分后区域在所述待划分区域中的相对位置信息。

4.如权利要求1所述的数据处理方法,其特征在于,确定待划分区域,包括:将原始区域划分成若干初始区域,所述初始区域对应的聚合数据值大于预设阈值;

将所述初始区域确定为待划分区域。

5.如权利要求1所述的数据处理方法,其特征在于,在所述待划分区域中确定划分点,还包括:将所述待划分区域的中心点作为划分点。

6.如权利要求1所述的数据处理方法,其特征在于,根据所述待划分区域内数据的地理位置信息确定划分点,包括:获取所述待划分区域内数据的地理位置的加权平均值;

将所述待划分区域中所述加权平均值对应的位置作为划分点。

7.如权利要求1‑6任一项所述的数据处理方法,其特征在于,所述区域信息还包括:区域的地理位置信息;

基于所述区域信息进行数据处理,包括:

从所述数据中确定待编码数据;

根据所述待编码数据的地理位置信息和区域的地理位置信息确定所述待编码数据所属的归属区域;

对所述归属区域的区域标识进行编码,得到所述待编码数据的编码后区域标识。

8.如权利要求7所述的数据处理方法,其特征在于,所述区域标识包括二进制串;

对所述归属区域的区域标识进行编码,得到编码后区域标识,包括:将所述二进制串的长度作为一个字节,并将所述二进制串划分成若干字节,得到字节组;

将所述字节组编码成相应的字符串,得到所述待编码数据的编码后区域标识。

9.如权利要求7所述的数据处理方法,其特征在于,基于所述区域信息进行数据处理,包括:对数据的编码后区域标识进行解码,得到解码后二进制串及其长度;

根据所述长度对所述解码后二进制串进行数据舍弃处理,得到原始二进制串;

从当前区域中确定所述原始二进制串对应的区域,并获取所述原始二进制串对应的区域的地理位置信息,得到数据的地理位置信息。

10.如权利要求1‑6任一项所述的数据处理方法,其特征在于,所述区域信息还包括:区域的地理位置信息;

基于所述区域信息进行数据处理,包括:

获取给定区域的地理位置信息;

根据所述给定区域的地理位置信息获取外接区域的地理位置信息,所述外接区域为所述给定区域的外接矩形区域;

将所述外接区域的地理位置信息、与区域的地理位置信息进行比较,得到位置比较结果;

根据所述位置比较结果从所述当前区域中确定与所述外接区域重叠的重叠区域;

对所有重叠区域内的数据进行聚合,得到所述给定区域的数据聚合结果。

11.一种数据处理装置,其特征在于,包括:

获取单元,用于获取数据,并确定待划分区域,所述数据为地理空间上分布不均的多个数据;

划分单元,用于在所述待划分区域中确定划分点;根据所述划分点对所述待划分区域进行划分,并获取划分后区域的区域标识;所述在所述待划分区域中确定划分点,包括:根据所述待划分区域内数据的地理位置信息确定划分点;

聚合单元,用于针对每个划分后区域,对每个划分后区域中数据的数据值进行聚合,得到每个划分后区域对应的聚合数据值,每个划分后区域中数据是根据数据的地理位置信息和每个划分后区域的地理位置信息确定的;

确定单元,用于根据所述聚合数据值从划分后区域中确定需要进一步划分的目标区域;

更新单元,用于当不满足预设区域划分终止条件时,将所述目标区域更新为所述待划分区域;并且,触发所述划分单元对所述待划分区域进行划分;

输出处理单元,用于当满足预设区域划分终止条件时,输出所有区域的区域信息,所述区域信息包括区域标识,并基于所述区域信息进行数据处理。

12.一种存储介质,其特征在于,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至10任一项所述的数据处理方法中的步骤。

13.一种网络设备,其特征在于,包括处理器和存储器,所述存储器储存有计算机程序,其特征在于,所述处理器通过调用所述计算机程序,用于执行如权利要求1至10任一项所述的数据处理方法。

说明书 :

一种数据处理方法、装置、存储介质和网络设备

技术领域

[0001] 本发明涉及通信技术领域,具体涉及一种数据处理方法、装置、存储介质和网络设备。

背景技术

[0002] 目前在数据处理中,需要将数据的地理位置进行编码,比如,可以将地理位置如经纬度数据编码成一个字符串,即地址编码。
[0003] 具体地,目前对地理位置编码的方式主要包括:首先将给定的地理位置区间如经纬度范围划分成多个大小相同的地理位置区间,也即相等于将某个地理区域划分成多个大小相同(如面积相同)的矩形区域;然后,当需要对数据的地理位置编码时,确定地理位置所位于的所有矩形区域(即地理位置区域),然后,获取所有矩形区域对应的二进码(如0或1),得到一个二进制串,最后将编码成一个字符串。
[0004] 然而,由于一般数据如用户数据大多聚集于少数城市、住宅区、商圈的区域,在地理分布上天然不均匀。如果将数据按照地理位置如经纬度划分到各个区块中,那么按面积等分的且大小相同的矩形区域中的数据将会很不均匀,例如在少量区块中会包含大量数据,而大量位于偏远郊区的区块则缺乏或没有数据,这样不利于数据的实际应用。

发明内容

[0005] 本发明实施例提供一种数据处理方法、装置、存储介质和网络设备,可以提升数据在区域中分布的均匀性。
[0006] 本发明实施例提供一种数据处理方法,包括:
[0007] 获取数据,并确定待划分区域;
[0008] 对所述待划分区域进行划分,并获取划分后区域的区域标识;
[0009] 对划分后区域中数据的数据值进行聚合,得到所述划分后区域对应的聚合数据值;
[0010] 根据所述聚合数据值从划分后区域中确定需要进一步划分的目标区域;
[0011] 当不满足预设区域划分终止条件时,将所述目标区域更新为所述待划分区域;并且,对所述待划分区域进行划分的步骤;
[0012] 当满足预设区域划分终止条件时,输出所有区域的区域信息,所述区域信息包括区域标识,并基于所述区域信息进行数据处理。
[0013] 本发明实施例还提供了一种数据处理装置,包括:
[0014] 获取单元,用于获取数据,并确定待划分区域;
[0015] 划分单元,用于对所述待划分区域进行划分,并获取划分后区域的区域标识;
[0016] 聚合单元,用于对划分后区域中数据的数据值进行聚合,得到所述划分后区域对应的聚合数据值;
[0017] 确定单元,用于根据所述聚合数据值从划分后区域中确定需要进一步划分的目标区域;
[0018] 更新单元,用于当不满足预设区域划分终止条件时,将所述目标区域更新为所述待划分区域;并且,触发所述划分单元对所述待划分区域进行划分;
[0019] 输出处理单元,用于当满足预设区域划分终止条件时,输出所有区域的区域信息,所述区域信息包括区域标识,并基于所述区域信息进行数据处理。
[0020] 本发明实施例还提供一种存储介质,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行本发明实施例所提供的任一种数据处理方法中的步骤。
[0021] 此外,本发明实施例还提供了一种网络设备,包括处理器和存储器,所述存储器储存有计算机程序,其特征在于,所述处理器通过调用所述计算机程序,用于执行本发明实施例所提供的数据处理方法。
[0022] 本发明实施例可以获取数据,并确定待划分区域;对所述待划分区域进行划分,并获取划分后区域的区域标识;对划分后区域中数据的数据值进行聚合,得到所述划分后区域对应的聚合数据值;根据所述聚合数据值从划分后区域中确定需要进一步划分的目标区域;当不满足预设区域划分终止条件时,将所述目标区域更新为所述待划分区域;并且,返回执行对所述待划分区域进行划分的步骤;当满足预设区域划分终止条件时,输出所有区域的区域信息,所述区域信息包括区域标识,并基于所述区域信息进行数据处理。该方案可以基于区域内数据的聚合数据值对区域进行划分,也即可以基于数据的密集程度对区域划分,采用该方案可以将某个划分成大小不一的区域,并且每个划分区域的数据聚合值相对均匀,可以提升数据在区域中分布的均匀性。

附图说明

[0023] 为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0024] 图1a是本发明实施例提供的数据处理方法的场景示意图;
[0025] 图1b是本发明实施例提供的数据处理方法的流程示意图;
[0026] 图1c是本发明实施例提供的区块划分示意图;
[0027] 图1d是本发明实施例提供的另一区块划分示意图;
[0028] 图1e是本发明实施例提供的编解码示意图;
[0029] 图2a是本发明实施例提供的大数据处理方法的另一流程示意图;
[0030] 图2b是本发明实施例提供的区块划分的流程示意图;
[0031] 图2c是本发明实施例提供的区块划分功能示意图;
[0032] 图2d是本发明实施例提供的编码示意图;
[0033] 图2e是本发明实施例提供的解码示意图;
[0034] 图3a是本发明实施例提供的数据处理装置的第一种结构示意图;
[0035] 图3b是本发明实施例提供的数据处理装置的第二种结构示意图;
[0036] 图3c是本发明实施例提供的数据处理装置的第三种结构示意图;
[0037] 图4是本发明实施例提供的网络设备的结构示意图。

具体实施方式

[0038] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0039] 本发明实施例提供一种数据处理方法、装置和存储介质。
[0040] 其中,该数据处理装置具体可以集成在网络设备,如终端或服务器等设备中,例如,参考图1a,网络设备可以获取数据,并确定待划分区域;对待划分区域进行划分,并获取划分后区域的区域标识;对划分后区域中数据的数据值进行聚合,得到划分后区域对应的聚合数据值;根据聚合数据值从划分后区域中确定需要进一步划分的目标区域;当不满足预设区域划分终止条件时,将目标区域更新为待划分区域;并且,返回执行对待划分区域进行划分的步骤;当满足预设区域划分终止条件时,输出所有区域的区域信息,该区域信息包括区域标识,并基于区域信息进行数据处理。
[0041] 其中,预设区域划分终止条件可以根据实际需求设定,比如,预设区域划分终止条件包括:划分后区域的聚合数据值小于预设阈值,和/或当前累计的划分次数大于预设次数。
[0042] 其中,数据处理可以包括数据编码、数据解码、数据聚合、数据分类等等处理,可以根据实际需求设定。
[0043] 以下分别进行详细说明。需说明的是,以下实施例的序号不作为对实施例优选顺序的限定。
[0044] 在本发明实施例中,将数据处理装置的角度进行描述,该数据处理装置具体可以集成在网络设备如终端或服务器等设备中。
[0045] 在一实施例中,提供了一种数据处理方法,该方法可以由网络设备的处理器执行,如图1b所示,该数据处理方法的具体流程可以如下:
[0046] 101、获取数据,并确定待划分区域。
[0047] 其中,数据为用于划分区域的数据,也即采用这些数据实现对区域划分。
[0048] 具体地,可以获取多个用于划分区域的数据,比如,可以获取地理空间上分布不均的多个数据。其中,数据的类型可以有多种,比如,可以为用户数据(如用户的WIF数据)、应用数据、系统数据等等。
[0049] 其中,数据可以包括数据的数据值、数据的地理位置信息如数据的经纬度信息。本发明实施例中,数据的结构可以有多种,比如,可以包括地理位置字段(用于保存地理位置)、数据值字段(用于保存数据值)。例如,用于划分区域的数据的结构可以如下:
[0050] {
[0051] "longitude":经度
[0052] "latitude":纬度
[0053] "value":数据值,例如在wifi应用中可以是每个wifi的日均连接数等等}[0054] 其中,待划分区域为当前需要划分的区域,待划分区域的数量可以为一个或者多个,也即,当前需要对一个或者多个待划分区域进行划分。
[0055] 本发明实施例中,区域可以称为区块,以下区块与区域是相同的意思。
[0056] 在一实施例中,可以对某个区域如全国区域、全球区域进行初步划分后,将初步划分后的区域作为待划分区域。具体地,步骤“确定待划分区域”,可以包括:
[0057] 将原始区域划分成若干初始区域,初始区域对应的聚合数据值大于预设阈值;
[0058] 将初始区域确定为待划分区域。
[0059] 其中,本发明实施例中,为了能使得可以进一步对区域划分,提升数据分布的均匀性,可以在原始区域划分时,遵循划分后区域的聚合数据值大于预设阈值的区域划分规则。在一实施例中,在划分初始区域之后、或者划分初始区域的同时等时机获取初始区域的区域标识。其中,区域标识的获取方式可以参考下述区域标识的介绍。
[0060] 其中,将初始区域确定待划分区域的方式有多种,比如,可以默认初始区域即为待划分区域,又比如,还对初始区域内数据的数据值进行聚合,根据初始区域的聚合数据值确定初始区域为待划分区域,具体可以参考下述数据值聚合和基于聚合数据值更新待划分区域的介绍。
[0061] 其中,原始区域可以根据实际需求设定,比如,全国区域、全球区域、北半球区域等等。其中,对原始区域的划分方式可以有多种,只要遵循预设的划分规则即可。
[0062] 比如,在一实施例中,为了便于区域划分,提升效率,可以将原始区域划分成大小相等的若干初始区域,比如,可以采用统GeoHash编码的分块方法将原始区域划分为大小相等的若干块(即区域)。
[0063] 比如,在一实施例中,还可以根据预设地理位置范围如经纬度范围将原始区域划分成若干初始区域(可以称为初始区块或初始块);例如,当原始区域为全球区域时,可以将东全球划分为初始区块,东半球的经纬范围为:{经度范围(0,180),纬度范围(‑90,90)},也可以将西半球划分为初始区块,西半球的经纬度范围为:{(经度范围(‑180,0),纬度范围(‑90,90)}。
[0064] 102、对待划分区域进行划分,并获取划分后区域的区域标识。
[0065] 其中,对待划分区域进行划分的方式有多种,比如,在一实施例中,可以对待划分区域进行随机划分,比如,可以随机将待分区域划分成一定数量的子区域,或者随机将待分区域划分成若干形状相同或不一的子区域,等等。
[0066] 又比如,可以先在区域内确定一个划分点,然后,基于该划分点对区域进行划分。也即,步骤“对待划分区域进行划分”,可以包括:
[0067] 在待划分区域中确定划分点;
[0068] 根据划分点对待划分区域进行划分。
[0069] 其中,划分点的确定方式可以有多种方式,比如,在一实施例中,可以在待划分区域随机选择一个点作为划分点。
[0070] 又比如,在一实施例中,还可以将待划分区域中某个特定点作为划分点,譬如,可以将待划分区域的中心点作为划分点。例如,参考图1c,可以以待区块的中心点为划分点,将区块划分为4块区域。
[0071] 又比如,在一实施例中,还可以根据待划分区域内数据的地理位置信息确定划分点,也即,步骤“在待划分区域中确定划分点”,可以包括:根据待划分区域内数据的地理位置信息确定划分点。比如,可以根据待划分区域内数据的经纬度确定划分点。
[0072] 其中,基于数据的地理位置确定划分点的方式可以有多种,比如,在一实施例中,可以计算待划分区域内数据的平均地理位置如平均经纬度(包括平均经度、平均纬度),然后,将平均地理位置如平均经纬度对应的位置点作为划分点。例如,参考图1d中左图(即第一个图),可以计算区块内数据点的平均经纬度,将平均经纬度对应的位置点作为划分点,然后,基于该划分点将区块划分成4个子区块。
[0073] 在一实施例中,可以计算区域内数据的地理位置(如经纬度)的加权平均值,然后,基于加权平均值确定划分点。具体地,步骤“根据待划分区域内数据的地理位置信息确定划分点”,可以包括:
[0074] 获取待划分区域内数据的地理位置的加权平均值;
[0075] 将待划分区域中加权平均值对应的位置作为划分点。
[0076] 比如,参考图1d的右图(即第二个图),可以计算待划分区域内数据点的经纬度的加权平均值,将加权平均值对应的位置点作为划分点,基于该划分点将区块划分成4个子区块。
[0077] 本发明实施例中,在计算加权平均值时,可以获取每个数据的地理位置对应的权重,该权重可以预先设定,也可以基于数据的数据值确定。比如,可以根据待划分区域内数据的数据值,为数据的地理位置设置相应的权重,然后,基于数据的地理位置、权重计算出地理位置的加权平均值。
[0078] 在一实施例中,还可以计算待划分区域中两个半区(左右、或者上下)内数据的地理位置加权平均值如经纬度加权平均值,然后,根据两个半区的加权平均值确定划分点。例如,可以计算左半区内数据点的经度加权平均值、计算右半区内数据点的纬度加权平均值,将经纬度加权平均值对应的位置作为划分点。
[0079] 本发明实施例中区域划分数量,即将某个区域划分成子区域的数量,可以根据实际需求设定,比如,划分成2个区域、划分成3个区域、划分成4个区域,等等。实际应用中,通过设置区域或区块划分数量可以控制总区域数量,并且可以降低区域划分数量调整的颗粒度。
[0080] 其中,区域标识为用于唯一标识区域的信息,比如可以为用于唯一标识区域位置的信息(此时,区域标识即为区域位置标识)。该区域标识的形式可以有多种,比如,区域标识可以包括标识区域的二进制串、或字符串标识等等。例如,某个区域的区域标识为0101111100的二进制串。二进程串可以表征区域的地理位置,如可以表征区域的经纬度范围等等。
[0081] 划分后区域的区域标识获取方式可以有多种,比如,可以随机给划分后区域设置相应的区域标识,又比如,根据划分后区域大小设置区域标识等等。
[0082] 比如,在一实施例中,为使得区域标识可以标识划分后区域的地理位置如经纬度、经纬度范围等,以及划分后区域与原区域之间的位置关系等等,还可以根据划分后区域在待划分区域的相对位置信息来获取划分后区域的区域标识。
[0083] 具体地,步骤“获取划分后区域的区域标识”,可以包括:
[0084] 获取划分后区域在待划分区域中的相对位置信息;
[0085] 根据相对位置信息和待划分区域的区域标识,获取划分后区域的区域标识。
[0086] 其中,相对位置信息可以包括划分后区域相对于待划分区域的位置,可以根据实际需求定义,比如,可以基于待划分区域的相对位置参考点如中心点来定义,譬如,相对位置信息可以包括待划分区域的左边、右边、上方、下方、右上方、右下方、左上方、左下方等等。例如,划分后区域a1位于待划分区域a的左上方。
[0087] 在一实施例中,相对位置信息可以基于划分后区域与待划分区域的相对位置参考点(如中心点等)之间的位置关系得到,具体地,步骤“获取划分后区域在待划分区域中的相对位置信息”,可以包括:
[0088] 获取划分后区域的位置信息、以及待划分区域的参考点位置信息;
[0089] 将划分后区域的位置信息与参考点位置信息进行比较,得到比较结果;
[0090] 根据比较结果获取划分后区域在待划分区域中的相对位置信息。
[0091] 其中,参考点位置信息可以为待划分区域中相对位置参考点的地理位置信息如经纬度,该参考点可以用于定义划分后区域与原区域之间的相对位置关系,可以根据实际需求设定,比如,在一实施例中,该参考点可以为中心点,又比如,在一实施例中,该参考点可以为区域划分点。实际应用中,当区域划分点为区域的中心点时,该参考点可以为中心点。
[0092] 其中,划分后区域的位置信息可以包括划分后区域的地理位置信息,如划分后区域的经纬度等等。在一实施例中,为便于计算提升处理速度,区域的位置信息可以由区域的定位点的地理位置信息表示,该定位点可以根据实际需求设定,比如,可以为区域的顶点,譬如,某个区域的位置信息可以由该区域的对角线上的两个顶点(如左下角顶点、右上角顶点)的地理位置信息表示。
[0093] 因此,划分后区域的位置可以包括划分后区域中区域定位点的地理信息如经纬度。此时,可以将划分后区域中区域定位点的地理信息与参考点的地理位置信息进行比较,得到比较结果;然后,根据比较结果得到相对位置信息。
[0094] 比如,划分后区域的经度小于(大于)参考点的经度,那么确定划分后区域位于待划分区域的左边(右边),划分区域的纬度小于(大于)参考点的维度,那么确定划分区域位于待划分区域的下方(上方)。
[0095] 本发明实施例可以通过上述方式获取划分后区域在待划分区域中的相对位置信息,然后,根据相对位置信息和待划分区域的区域标识,获取划分后区域的区域标识。
[0096] 比如,在一实施例中,可以根据相对位置信息获取相应的新增标识,然后,根据新增标识和待划分区域的区域标识获取划分后区域的区域标识;例如,可以对新增标识和待划分区域的区域标识进行合并,将合并后的标识作为划分后区域的区域标识;或者,可以将新增标识叠加在待划分区域的区域标识之后,将叠加后的标识作为划分后区域的区域标识。
[0097] 其中,新增标识可以由二进制码构成,例如,可以为01等。
[0098] 其中,新增标识的获取方式可以有多种,比如,在一实施例中,可以计算相对位置信息的值如哈希值,将哈希值作为新增标识;又比如,采用其他算法对相对位置信息进行数据处理,将数据处理结果作为新增标识;又比如,预先设置新增标识与相对位置之间的映射关系,然后,根据该映射关系和相对位置信息获取相应的新增标识。
[0099] 比如,实际应用中,当划分后区域位于待划分区域的左边(右边)时,可以确定新增标识为0(1);比如,当划分后区域位于待划分区域的右上方时,可以确定新增标识为11,当划分后区域位于左下方时,可以确定新增标识为00,等等。
[0100] 在得到新增标识,本发明可以将新增标识与待划分区域的区别标识进行叠加处理,例如,以标识为二进制码为例,假设待划分区域a的区域标识为0010,如果当划分后区域a1位于待划分区域a的右上方时,可以确定新增标识为11,此时,划分后区域a1的区别标识即为001011。
[0101] 通过上述接收的方式可以对待划分区域进行划分,并获取划分后区域的区域标识,然后,可以执行步骤103。
[0102] 103、对划分后区域中数据的数据值进行聚合,得到划分后区域对应的聚合数据值。
[0103] 具体地,针对每个划分后区域,可以对每个划分后区域中数据的数据值进行聚合,得到每个划分后区域的聚合数据值。
[0104] 比如,可以先根据数据的地理位置信息和划分后区域的的地理位置信息如经纬度,确定位于划分后区域中的数据即确定哪些数据位于划分后区域内;然后,对划分后区域中数据的数据值进行聚合。实际应用中,可以将数据表示为数据点,此时,可以根据对划分后区域中数据点的数据值进行聚合。
[0105] 其中,数据值的聚合可以包括多种,比如,数据值求和(sum)、求最大数据值(max)、求最小数据值(min)、求数据值平均值、等等。
[0106] 例如,可以将待划分区域a划分成四个区块即a1、a2、a3、a4;然后,分别对划分区域a1、a2、a3、a4中数据的数据值求和,得到划分后区域a1、a2、a3、a4对应的数据和值。
[0107] 104、根据聚合数据值从划分后区域中确定需要进一步划分的目标区域。
[0108] 在得到每个划分后区域对应的聚合数据值后,可以基于聚合数据值从划分后区域中确定需要进一步划分的区域。
[0109] 其中,基于聚合数据值确定目标区域的方式可以包括多种,比如,可以确定聚合数据值大于预设阈值(或者超过预设阈值范围)的划分后区域为目标区域;又比如,可以计算划分后区域之间的聚合数据值的差值,基于差值来确定目标区域;譬如,确定差值大于预设差值的划分后区域,然后,从确定的区域中选择需要进一步划分的区域,等等。
[0110] 105、当不满足预设区域划分终止条件时,将目标区域更新为待划分区域;并且,返回执行步骤102。
[0111] 其中,预设区域划分终止条件为区域划分停止的条件,当满足该条件时,将不再进行区域划分;该预设区域划分终止条件可以根据实际需求设定,比如,可以基于划分后区域的聚合数据值、或者区域划分次数设定;比如,预设区域划分终止条件包括:划分后区域的聚合数据值小于预设阈值,和/或当前累计的划分次数大于预设次数。
[0112] 本发明实施例可以通过条件预设阈值、最大划分次数,可以调整区块的最小面积、以及总区块个数,提升了区块划分的灵活性,以及便于控制区块划分。
[0113] 实际应用中,在不满足预设区域划分终止条件时,可以将目标区域加入待划分列表中,实现将目标区域更新为待划分区域,以便后续对该目标区域进行再次划分。
[0114] 106、当满足预设区域划分终止条件时,输出所有区域的区域信息,区域信息包括区域标识,并基于区域信息进行数据处理。
[0115] 其中,区域信息包括区域标识,如区域的二进制串;此外,区域信息还可以包括区域的地理位置信息,比如,在采用区域的定位点的地理位置信息表示区域的地理位置信息情况下,区域信息还可以包括区域的定位点(左下顶点、右上顶点等)的地理位置如经纬度。此外,区域信息还可以包括其他区域的信息,可以根据实际需求选择,比如,还可以包括区域的尺寸、面积等信息。
[0116] 本发明实施例,当满足预设区域划分终止条件时,停止对区域进行划分,并输出当前所有区域(可以包括划分后区域、原始区域)的区域信息,以便基于输出的信息进行数据处理。
[0117] 在一实施例中,还在得到划分后区域的区域标识之后,比如,在输出区域的区域信息之后,还可以对区域标识进行编码,比如,采用GeoHash编码等编码方式对区域标识进行编码,此时,区域信息中的区域标识即为编码后的区域标识;在区域标识为二进制串形式,编码后的区域标识可以为字符串形式。
[0118] 比如,当满足预设区域划分终止条件时,可以输出区块表,该区块表可以包括:区块的地理位置如区块左下角顶点的坐标(如经纬度)、区块右上角顶点的坐标(如经纬度),以及编码后区域标识如编码字符串。
[0119] 譬如,区块表的结构可以为:
[0120] {
[0121] “GeoHash”:编码的字符串
[0122] “left_bottom_vertex”:区块左下角顶点的坐标
[0123] “right_top_vertex”:区块右上角顶点的坐标}。
[0124] 本发明实施例中,基于区域信息进行数据处理,其中,数据处理可以包括数据编码、数据解码、数据聚合、数据分类等等处理,可以根据实际需求设定。
[0125] 以下将介绍几种数据处理:
[0126] (1)、数据编码
[0127] 比如,可以基于区域信息对数据的地理位置如经纬度进行编码,具体地,当区域的区域信息还包括区域的地理位置信息(如区域的定位点地理位置信息)时,可以从之前获取的数据中确定需要编码的待编码数据;根据待编码数据的地理位置信息和区域的地理位置信息确定待编码数据所属的归属区域;对归属区域的区域标识进行编码,得到待编码数据的编码后区域标识。其中,待编码数据可以为用于划分区域的数据,也可以为其他数据。
[0128] 例如,以区域标识为二进制串为例,参考图1d,可以根据区域的地理位置信息(如区域的定位点经纬度)和待编码数据的经纬度确定待编码数据的归属区域,然后,获取归属区域的二进制串111001001001;采用预设编码方式对二进制串111001001001进行编码,得到相应的字符串。
[0129] 其中,预设编码方式可以根据实际需求设定,比如,可以包括GeoHash编码等等。又比如,在一实施例中,考虑到采用本发明实施例方法得到的每个区块的大小不一样,各个区块对应的区域标识如二进制串长短不一,因此,为了能够将不同长度的区域标识如二进制串,提升编码效率,可以采用字节编码方式对二进制串的区域标识进行编码。
[0130] 具体地,步骤“对归属区域的区域标识进行编码,得到编码后区域标识”,可以包括:
[0131] 将二进制串的长度作为一个字节,并将二进制串划分成若干字节,得到字节组;
[0132] 将字节组编码成相应的字符串,得到待编码数据的编码后区域标识。
[0133] 比如,将二进制串的长度写入头字节(即第一个字节),然后,按照每8位划分成一个字节的方式将二进制串划分成若干字节,最后,对字节组进行编码得到字符串。
[0134] 上述字节编码方式是对传统GeoHash编码方式改进得到,可以称为改进后GeoHash编码方式等等。改进后的GeoHash编码方式具体为:将二进制的长度作为第一个byte写入,然后将二进制串每8位写入一个byte,若最后不足8位则用0补齐,最后将这个字节(byte)数组用base64编码成字符串。
[0135] 例如,参考图1d,在得到归属区域的二进制串111001001001之后,可以采用改进后GeoHash编码方式将二进制串111001001001编码成字符串“EOSb”。
[0136] 本法实施例的编码方式与传统Geohash编码方法不同的是,不提前指定编码后字符串的长度,而是根据二进制串的长度动态地确定编码后长度。
[0137] (2)、数据解码
[0138] 其中,可以基于区域信息对数据的编码后区域标识如字符串进行解码;该解码过程与上述编码的过程相反,具体地,步骤“基于区域信息进行数据处理”,可以包括:
[0139] 对数据的编码后区域标识进行解码,得到解码后二进制串及其长度;
[0140] 根据长度对解码后二进制串进行数据舍弃处理,得到原始二进制串;
[0141] 从当前区域中确定原始二进制串对应的区域,并获取原始二进制串对应的区域的地理位置信息,得到数据的地理位置信息。
[0142] 比如,以编码后区域标识包括字符串为例,参考图1e,可以对字符串“EOSb”进行解码如base64解码得到一个二进制串和长度,然后读取第一个byte的数据为二进制串长度,对长度以后的数据舍弃,得到原始二进制串111001001001,根据0、1的对应关系可以确定其经纬度范围,或者直接查询出原始二进制串111001001001对应的区块,提取该区块的地理位置信息如区块定位点经纬度信息。由于在实际应用中划分后的区块表中会保存顶点坐标,也可以直接查表得到经纬度范围。
[0143] (3)给定区域的数据聚合
[0144] 在输出所有区域的区域信息之后,如果给定一个区域,那么可以基于输出的区域信息对给定区域进行数据聚合,得到给定区域的数据聚合结果,大大提升了数据聚合的效率。
[0145] 比如,当区域信息还包括区域的地理位置信息如区域的定位点经纬度时,步骤“基于区域信息进行数据处理”,可以包括:
[0146] 获取给定区域的地理位置信息;
[0147] 根据给定区域的地理位置信息获取外接区域的地理位置信息;
[0148] 将外接区域的地理位置信息、与区域的地理位置信息进行比较,得到位置比较结果;
[0149] 根据位置比较结果从当前区域中确定与外接区域重叠的重叠区域;
[0150] 对所有重叠区域内的数据进行聚合,得到给定区域的数据聚合结果。
[0151] 其中,外接区域的形状可以根据实际设定,比如,可以为给定区域的外接矩形等。
[0152] 外接区域的地理位置信息可以包括外接区域的定位点如左下、右上顶点的地理位置信息;比如,外接区域左下、右上顶点的经纬度。
[0153] 本发明实施例可以将划分后区域的地理位置信息与外接区域的地理位置进行比较,以确定重叠区域,然后,对重叠区域内的数据进行聚合。
[0154] 其中,对所有重叠区域内的数据进行聚合的方式包括各种数据统计方式,如求和、求差等等,因此,数据聚合结果可以包括数据统计结果。
[0155] 例如,以给定区域的地理位置信息为区域顶点的经纬度,输出的区块的地理位置为左下顶点、右下顶点的经纬度为例,对于给定的区域,首先对其各顶点的经纬度取最大最小值,得到其外接矩形的顶点坐标。然后在区块表中遍历各块,若某一块的左下顶点经度<区域外接矩形的右上顶点经度,且块的左下顶点纬度<区域外接矩形的右上顶点纬度,且块的右上顶点经度>区域外接矩形的左下顶点经度,且块的右上顶点纬度>区域外接矩形的左下顶点纬度,说明它们有重叠区域,则该区块为相关区块。对所有相关区块进行聚合,得到指定区域的相关统计数据。
[0156] 其中,聚合后数据的结构,可以如下:
[0157] {
[0158] “GeoHash”:用改进后GeoHash编码的字符串
[0159] “value”:聚合后的统计值,可以是原表中数据值的sum、count、max、min等}[0160] 由上可知,本发明实施例可以基于区域内数据的聚合数据值对区域进行划分,也即可以基于数据的密集程度对区域划分,采用该方案可以将某个划分成大小不一的区域,并且每个划分区域的数据聚合值相对均匀,可以提升数据在区域中分布的均匀性,提升了数据的实用性。
[0161] 此外,由于目前地理位置编码方式只能通过指定编码后字符串的长度,确定划分区块的大小和数量。具体地,每增加一个字符串的长度相当于对原来的一个区块中再进行五次划分,每一块新区块的面积是划分前的1/2^5=1/32,划分后的区块数量会变为原来的32倍,因此,会导致编码长度调整的颗粒度过大。然而,采用本发明实施例提供的方案可以灵活对编码长度、划分区块总数量等进行灵活控制,可以降低编码长度调整的颗粒度。
[0162] 另外,目前地理位置编码方式对于区块都进行5次划分(即划分为5个区块),其会将长方形区块分成正方形,或将正方形区块分成长方形,不利于确定区块形状。然而,本发明实施例方案中每一次的划分均可以将原区块按照中心点划为大小相同的4块,这样可以保证所有的区块均为正方形,有利于区块形状的确定,便于管理。
[0163] 根据上述实施例所描述的方法,以下将举例作进一步详细说明。
[0164] 在本实施例中,将以该数据处理装置具体集成在网络设备中为例进行说明。
[0165] 网络设备的数据处理的流程,如图2a所示,如下:
[0166] 201、网络设备获取数据,并确定原始区域为待划分区域。
[0167] 其中,数据为用于划分区域的数据,也即采用这些数据实现对区域划分。
[0168] 具体地,可以获取多个用户划分区域的数据,比如,可以获取地理空间上分布不均的多个数据。其中,数据的类型可以有多种,比如,可以为用户数据(如用户的WIF数据)、应用数据、系统数据等等。
[0169] 其中,数据可以包括数据的数据值、数据的地理位置信息如数据的经纬度信息。
[0170] 例如,参考图2b和图2c,网络设备可以获取数据的经纬度和数据值,并将用于分块的数据输入至区域划分区块算法模块,其中,区域划分区块算法模块可以采用下述的划分方法对区域进行分块。
[0171] 其中,原始区域可以根据实际需求设定,比如,全国区域、全球区域、北半球区域等等。
[0172] 202、网络设备对待划分区域进行划分,并获取划分后区域的区域标识。
[0173] 其中,在初始阶段,对区域如原始区域的划分方式可以有多种,只要遵循预设的划分规则即可。
[0174] 本发明实施例中,为了能使得可以进一步对区域划分,提升数据分布的均匀性,可在出原始区域划分时,遵循划分后区域的聚合数据值大于预设阈值的划分规则。
[0175] 比如,在一实施例中,为了便于区域划分,提升效率,可以将原始区域划分成大小相等的若干初始区域,比如,可以采用GeoHash编码的分块方法将原始区域划分为大小相等的若干块(即区域)。
[0176] 其中,初始区域的区域标识获取方式可以参考上述实施例介绍的区域标识获取方式。
[0177] 例如,参考图2b,可以对原始区域进行初始平均划分,比如,将原始区域划分成若干大小相等的初始区块,并计算初始区块的区块标识即区域标识。
[0178] 在一实施例中,网络设备可以在待划分区域中确定划分点;根据划分点对待划分区域进行划分。比如,在非初始阶段对区域划分时,可以先确定划分点然后基于划分点划分。
[0179] 其中,划分点的确定方式可以有多种方式,可以参考上述关于划分点的介绍。
[0180] 例如,网络设备可以确定待划分区域的中心点为划分点,然后,在该中心点将待划分区域划分成若干区域,比如,可以将待划分区域划分成大小相等的4个区域。这样,可以大致保证每个区域的形状为正方形。
[0181] 其中,区域标识为用于唯一标识区域的信息,比如可以为用于唯一标识区域位置的信息(此时,区域标识即为区域位置标识)。该区域标识的形式可以有多种,比如,区域标识可以包括标识区域的二进制串、或字符串标识等等。例如,某个区域的区域标识为0101111100的二进制串。二进程串可以表征区域的地理位置,如可以表征区域的经纬度范围等等。
[0182] 具体地,区域标识获取方式可以参考上述实施例的介绍。
[0183] 203、网络设备对划分后区域中数据的数据值进行聚合,得到划分后区域对应的聚合数据值。
[0184] 具体地,针对每个划分后区域,可以对每个划分后区域中数据的数据值进行聚合,得到每个划分后区域的聚合数据值。
[0185] 其中,数据值的聚合可以包括多种,比如,数据值求和(sum)、求最大数据值(max)、求最小数据值(min)、求数据值平均值、等等。
[0186] 204、网络设备将聚合数据值大于预设阈值的划分后区域确定为目标区域。
[0187] 其中,预设阈值可以根据实际需求设定。
[0188] 在一实施例中,在划分得到初始区域后,网络设备可以将初始区域确定为待划分区域,然后,对初始区域作进一步划分。
[0189] 其中,将初始区域确定待划分区域的方式有多种,比如,可以默认初始区域为待划分区域,又比如,还对初始区域内数据的数据值进行聚合,根据初始区域的聚合数据值确定初始区域为待划分区域,具体可以参考上述数据值聚合和基于聚合数据值更新待划分区域的介绍。
[0190] 例如,参考图2b,在得到初始区块之后,可以对每个块中数据的数据值进行聚合,得到每个块的聚合数据值;然后,将聚合数据值大于预设阈值的区块作为待划分区块,并添加到待划分列表中。
[0191] 205、网络设备判断当前是否满足预设区域划分终止条件,若否,则执行步骤206,若否是,则执行步骤207。
[0192] 其中,预设区域划分终止条件为区域划分停止的条件,当满足该条件时,将不再进行区域划分;该预设区域划分终止条件可以根据实际需求设定,比如,可以基于划分后区域的聚合数据值、或者区域划分次数设定;比如,预设区域划分终止条件包括:划分后区域的聚合数据值小于预设阈值,和/或当前累计的划分次数大于预设次数。
[0193] 例如,参考图2b,预设区域划分终止条件包括待划分列表是否为空、或者区域的累计划分次数是否超过预设次数。在将聚合值超过阈值的区域添加到待划分列表之后,当待划分列表不为空、以及区域的累计划分次数未超过预设次数,判定不满足预设区域划分终止条件。
[0194] 206、网络设备将目标区域更新为待划分区域,并返回执行步骤202。
[0195] 当不满足预设区域划分终止条件时,可以对待划分区域进行再次划分,也即返回执行步骤202再次执行划分操作等前述相同操作。
[0196] 在一实施例中,参考图2b,当待划分列表不为空、以及区域的累计划分次数未超过预设次数时,可以对列表中的区块进行划分,并计算划分后区块标识,以更新区块标识。
[0197] 207、网络设备输出所有区域的区域信息,区域信息包括区域标识、区域的地理位置信息。
[0198] 其中,区域信息包括区域标识,如区域的二进制串;此外,区域信息还可以包括区域的地理位置信息,比如,在采用区域的定位点的地理位置信息表示区域的地理位置信息情况下,区域信息还可以包括区域的定位点(左下顶点、右上顶点等)的地理位置如经纬度。此外,区域信息还可以其他区域的信息,可以根据实际需求选择,比如,还可以包括区域的尺寸、面积等信息。
[0199] 在一实施例中,还在得到划分后区域的区域标识之后,比如,在输出区域的区域信息之后,还可以对区域标识进行编码,比如,采用GeoHash编码等编码方式对区域标识进行编码,此时,区域信息中的区域标识即为编码后的区域标识;在区域标识为二进制串形式,编码后的区域标识可以为字符串形式。
[0200] 例如,参考图2b,当满足预设区域划分终止条件时,可以输出区块列表,区块列表可以包括:区块的地理位置如区块左下角顶点的坐标(如经纬度)、区块右上角顶点的坐标(如经纬度),以及编码后区域标识如编码字符串。
[0201] 在一实施例中,在输出区域信息之后,还可以对区域信息中区域标识进行编码如GeoHash编码、上述介绍的字节编码等编码方式对区域标识进行编码,此时,可以输出所有区域的编码后区域信息。编码后区域信息可以包括编码后区域标识、区域地理位置等。
[0202] 譬如,参考图2b和图2c,在输出区块表之后,可以对表中每个区块的区块标识进行GeoHash编码,然后,输出GeoHash编码后区块表,该编码后区块表的结构可以为:
[0203] {
[0204] “GeoHash”:编码的字符串
[0205] “left_bottom_vertex”:区块左下角顶点的坐标
[0206] “right_top_vertex”:区块右上角顶点的坐标}。
[0207] 经过上述步骤可以将某个区域划分成若干区域,比如,可以将中国区域划分成多个大小不一的区块。
[0208] 208、网络设备基于区域信息进行数据处理。
[0209] 其中,数据处理可以包括数据编码、数据解码、数据聚合、数据分类等等处理,可以根据实际需求设定。
[0210] 比如,在一实施例中,网络设备可以基于区域信息对数据的地理位置如经纬度进行编码;具体地,可以根据待编码数据的地理位置信息和区域的地理位置信息确定待编码数据所属的归属区域;对归属区域的区域标识进行编码,得到待编码数据的编码后区域标识。具体地的编码方式可以参考上述实施例的介绍。
[0211] 例如,参考图2c和图2d,可以基于输出的区域信息对用于划分区域的数据进行编码。具体地,可以根据数据的经纬度查询输出的区块表(如可以采用二叉树查询),确定数据落入的对应分块即目标区块,然后,对目标区块的区块标识(如二进制串)进行编码如采用改进后GeoHash进行编码,输出编码后数据(包括经纬度、数据值、编码后区块标识)。
[0212] 又比如,在一实施例中,网络设备可以基于区域信息对数据的编码后区域标识如字符串进行解码;该解码过程与上述编码的过程相反。具体地,对数据的编码后区域标识进行解码,得到解码后二进制串及其长度;根据长度对解码后二进制串进行数据舍弃处理,得到原始二进制串;从当前区域中确定原始二进制串对应的区域,并获取原始二进制串对应的区域的地理位置信息,得到数据的地理位置信息。
[0213] 例如,参考图2e和图1d,获取GeoHash编码后的区域标识如字符串,然后,对GeoHash编码后的区域标识进行解码,得到原始区域标识如原始二进制串;根据原始区域标识如原始二进制串直接查询出原始二进制串对应的区块,提取该区块的地理位置信息如区块定位点经纬度信息、区块的经纬度范围等。由于在实际应用中划分后的区块表中会保存顶点坐标,也可以直接查表得到经纬度范围。
[0214] 又比如,在一实施例中,还可以给定一个区域,基于输出的区域信息对给定区域进行数据聚合,得到给定区域的数据聚合结果。
[0215] 例如,参考图2c,在对区块标识编码后,如果给定一个区域,可以以给定区域的地理位置信息为区域顶点的经纬度,输出的区块的地理位置为左下顶点、右下顶点的经纬度为例,对于给定的区域,首先对其各顶点的经纬度取最大最小值,得到其外接矩形的顶点坐标。然后在区块表中遍历各块,若某一块的左下顶点经度<区域外接矩形的右上顶点经度,且块的左下顶点纬度<区域外接矩形的右上顶点纬度,且块的右上顶点经度>区域外接矩形的左下顶点经度,且块的右上顶点纬度>区域外接矩形的左下顶点纬度,说明它们有重叠区域,则该区块为相关区块。对所有相关区块内数据值进行聚合,得到给定区域的相关统计数据(如统计值)、以及相关区块的编码后区块标识(如GeoHash编码后的字符串)。
[0216] 由上可知,本发明实施例可以基于区域内数据的聚合数据值对区域进行划分,也即可以基于数据的密集程度对区域划分,采用该方案可以将某个划分成大小不一的区域,并且每个划分区域的数据聚合值相对均匀,可以提升数据在区域中分布的均匀性,提升了数据的实用性。
[0217] 此外,采用本发明实施例提供的方案可以灵活对编码长度、划分区块总数量等进行灵活控制,可以降低编码长度调整的颗粒度。
[0218] 另外,目前地理位置编码方式对于区块都进行5次划分(即划分为5个区块),会将长方形区块分成正方形,或将正方形区块分成长方形,不利于确定区块形状。然而,本发明实施例方案中每一次的划分均可以将原区块按照中心点划为大小相同的4块,这样可以保证所有的区块均为正方形,有利于区块形状的确定,便于管理。
[0219] 为了更好地实施以上方法,本发明实施例还提供一种数据处理装置,该数据处理装置具体可以集成在网络设备如终端或服务器等设备中,该终端可以包括手机、平板电脑、笔记本电脑或PC等设备。
[0220] 例如,如图3a所示,该数据处理装置可以包括获取单元301、划分单元302、聚合单元303、确定单元304、更新单元305以及输出处理单元306,如下:
[0221] 获取单元301,用于获取数据,并确定待划分区域;
[0222] 划分单元302,用于对所述待划分区域进行划分,并获取划分后区域的区域标识;
[0223] 聚合单元303,用于对划分后区域中数据的数据值进行聚合,得到所述划分后区域对应的聚合数据值;
[0224] 确定单元304,用于根据所述聚合数据值从划分后区域中确定需要进一步划分的目标区域;
[0225] 更新单元305,用于当不满足预设区域划分终止条件时,将所述目标区域更新为所述待划分区域;并且,触发所述划分单元302对所述待划分区域进行划分的步骤;
[0226] 输出处理单元305,用于当满足预设区域划分终止条件时,输出所有区域的区域信息,所述区域信息包括区域标识,并基于所述区域信息进行数据处理。
[0227] 在一实施例中,参考图3b,所述划分单元302,包括:
[0228] 划分子单元3021,用于对所述待划分区域进行划分;
[0229] 标识获取子单元3022,用于获取所述划分后区域在所述待划分区域中的相对位置信息;根据所述相对位置信息和所述待划分区域的区域标识,获取划分后区域的区域标识。
[0230] 在一实施例中,所述标识获取子单元3022,可以具体用于:
[0231] 获取所述划分后区域的位置信息、以及所述待划分区域的参考点位置信息;
[0232] 将所述划分后区域的位置信息与所述参考点位置信息进行比较,得到比较结果;
[0233] 根据所述比较结果获取所述划分后区域在所述待划分区域中的相对位置信息。
[0234] 在一实施例中,所述获取单元301,可以具体用于:获取用于划分区域的数据;以及将原始区域划分成若干初始区域,所述初始区域对应的聚合数据值大于所述预设阈值;将所述初始区域确定为待划分区域。
[0235] 在一实施例中,考图3b,所述划分单元302,包括:
[0236] 划分子单元3021,用于对所述待划分区域进行划分;
[0237] 标识获取子单元3022,用于在所述待划分区域中确定划分点;根据所述划分点对所述待划分区域进行划分,获取划分后区域的区域标识。
[0238] 其中,标识获取子单元3022,可以具有用于:将所述待划分区域的中心点作为划分点。
[0239] 标识获取子单元3022,可以具有用于:根据所述待划分区域内数据的地理位置信息确定划分点。
[0240] 在一实施例中,标识获取子单元3022,可以具有用于:获取所述待划分区域内数据的地理位置的加权平均值;将所述待划分区域中所述加权平均值对应的位置作为划分点。
[0241] 在一实施例中,所述区域信息还包括:区域的地理位置信息;参考图3c,所述输出处理单元306,可以包括:
[0242] 输出子单元3061,用于当满足预设区域划分终止条件时,输出所有区域的区域信息;
[0243] 数据处理子单元3062,用于从所述数据中确定待编码数据;根据所述待编码数据的地理位置信息和区域的地理位置信息确定所述待编码数据所属的归属区域;对所述归属区域的区域标识进行编码,得到所述待编码数据的编码后区域标识。
[0244] 在一实施例中,所述区域标识包括二进制串;数据处理子单元3062,可以具体用于:
[0245] 对所述归属区域的区域标识进行编码,得到编码后区域标识,包括:
[0246] 将所述二进制串的长度作为一个字节,并将所述二进制串划分成若干字节,得到字节组;
[0247] 将所述字节组编码成相应的字符串,得到所述待编码数据的编码后区域标识。
[0248] 在一实施例中,考图3c,所述输出处理单元306,可以包括:
[0249] 输出子单元3061,用于当满足预设区域划分终止条件时,输出所有区域的区域信息;
[0250] 数据处理子单元3062,用于对数据的编码后区域标识进行解码,得到解码后二进制串及其长度;根据所述长度对所述解码后二进制串进行数据舍弃处理,得到原始二进制串;从当前区域中确定所述原始二进制串对应的区域,并获取所述原始二进制串对应的区域的地理位置信息,得到数据的地理位置信息。
[0251] 在一实施例中,所述区域信息还包括:区域的地理位置信息;所述输出处理单元306,可以包括:
[0252] 输出子单元3061,用于当满足预设区域划分终止条件时,输出所有区域的区域信息;
[0253] 数据处理子单元3062,用于:
[0254] 获取给定区域的地理位置信息;
[0255] 根据所述给定区域的地理位置信息获取外接区域的地理位置信息;
[0256] 将所述外接区域的地理位置信息、与区域的地理位置信息进行比较,得到位置比较结果;
[0257] 根据所述位置比较结果从所述当前区域中确定与所述外接区域重叠的重叠区域;
[0258] 对所有重叠区域内的数据进行聚合,得到所述给定区域的数据聚合结果。具体实施时,以上各个单元可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元的具体实施可参见前面的方法实施例,在此不再赘述。
[0259] 由上可知,本实施例的数据处理装置通过获取单元301=获取用于划分区域的数据,并确定待划分区域;由划分单元302对所述待划分区域进行划分,并获取划分后区域的区域标识;由聚合单元303对划分后区域中数据的数据值进行聚合,得到所述划分后区域对应的聚合数据值;由确定单元304根据所述聚合数据值从划分后区域中确定需要进一步划分的目标区域;由更新单元305当不满足预设区域划分终止条件时,将所述目标区域更新为所述待划分区域;并且,触发所述划分单元302对所述待划分区域进行划分;由输出处理单元305,用于当满足预设区域划分终止条件时,输出所有区域的区域信息,并基于所述区域信息进行数据处理。
[0260] 该方案可以基于区域内数据的聚合数据值对区域进行划分,也即可以基于数据的密集程度对区域划分,采用该方案可以将某个划分成大小不一的区域,并且每个划分区域的数据聚合值相对均匀,可以提升数据在区域中分布的均匀性。
[0261] 本发明实施例还提供一种网络设备,该网络设备可以为服务器或终端等设备。如图4所示,其示出了本发明实施例所涉及的网络设备的结构示意图,具体来讲:
[0262] 该网络设备可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解,图4中示出的网络设备结构并不构成对网络设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
[0263] 处理器401是该网络设备的控制中心,利用各种接口和线路连接整个网络设备的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行网络设备的各种功能和处理数据,从而对网络设备进行整体监控。可选的,处理器401可包括一个或多个处理核心;优选的,处理器401可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器401中。
[0264] 存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据网络设备的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器401对存储器402的访问。
[0265] 网络设备还包括给各个部件供电的电源403,优选的,电源403可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
[0266] 该网络设备还可包括输入单元404,该输入单元404可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
[0267] 尽管未示出,网络设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,网络设备中的处理器401会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现各种功能,如下:
[0268] 获取数据,并确定待划分区域;对所述待划分区域进行划分,并获取划分后区域的区域标识;对划分后区域中数据的数据值进行聚合,得到所述划分后区域对应的聚合数据值;根据所述聚合数据值从划分后区域中确定需要进一步划分的目标区域;当不满足预设区域划分终止条件时,将所述目标区域更新为所述待划分区域;并且,返回执行对所述待划分区域进行划分的步骤;当满足预设区域划分终止条件时,输出所有区域的区域信息,所述区域信息包括区域标识,并基于所述区域信息进行数据处理。
[0269] 比如,具体可以获取所述划分后区域在所述待划分区域中的相对位置信息;根据所述相对位置信息和所述待划分区域的区域标识,获取划分后区域的区域标识。
[0270] 例如,具体可以获取所述划分后区域的位置信息、以及所述待划分区域的参考点位置信息;将所述划分后区域的位置信息与所述参考点位置信息进行比较,得到比较结果;根据所述比较结果获取所述划分后区域在所述待划分区域中的相对位置信息。
[0271] 又比如,具体可以在所述待划分区域中确定划分点;根据所述划分点对所述待划分区域进行划分。例如,将所述待划分区域的中心点作为划分点,或者根据所述待划分区域内数据的地理位置信息确定划分点,等等。
[0272] 以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
[0273] 由上可知,本实施例的网络设备可以获取用于划分区域的数据,并确定待划分区域;对所述待划分区域进行划分,并获取划分后区域的区域标识;对划分后区域中数据的数据值进行聚合,得到所述划分后区域对应的聚合数据值;根据所述聚合数据值从划分后区域中确定需要进一步划分的目标区域;当不满足预设区域划分终止条件时,将所述目标区域更新为所述待划分区域;并且,返回执行对所述待划分区域进行划分的步骤;当满足预设区域划分终止条件时,输出所有区域的区域信息,所述区域信息包括区域标识,并基于所述区域信息进行数据处理。该方案可以基于区域内数据的聚合数据值对区域进行划分,也即可以基于数据的密集程度对区域划分,采用该方案可以将某个划分成大小不一的区域,并且每个划分区域的数据聚合值相对均匀,可以提升数据在区域中分布的均匀性,从而提升数据的实用性。
[0274] 本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
[0275] 为此,本发明实施例提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本发明实施例所提供的任一种数据处理方法中的步骤。例如,该指令可以执行如下步骤:
[0276] 获取数据,并确定待划分区域;对所述待划分区域进行划分,并获取划分后区域的区域标识;对划分后区域中数据的数据值进行聚合,得到所述划分后区域对应的聚合数据值;根据所述聚合数据值从划分后区域中确定需要进一步划分的目标区域;当不满足预设区域划分终止条件时,将所述目标区域更新为所述待划分区域;并且,返回执行对所述待划分区域进行划分的步骤;当满足预设区域划分终止条件时,输出所有区域的区域信息,所述区域信息包括区域标识,并基于所述区域信息进行数据处理
[0277] 其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
[0278] 由于该存储介质中所存储的指令,可以执行本发明实施例所提供的任一种数据处理方法中的步骤,因此,可以实现本发明实施例所提供的任一种数据处理方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
[0279] 以上对本发明实施例所提供的一种数据处理方法、装置、存储介质和网络设备进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。