基于LBS的数据处理系统转让专利

申请号 : CN202110401152.2

文献号 : CN113115231B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 董霖陈津来尹雅露段永康周程方毅

申请人 : 每日互动股份有限公司杭州西湖数据智能研究院

摘要 :

本发明涉及一种基于LBS的数据处理系统,包括预先构建的第一数据库、第二数据库、处理器和存储有计算及程序的处理器,其中,所述第一数据库中存储有路网信息,所述路网信息包括预设区域内所有的位置点信息和任意两个位置点之间存在的所有可能的第一路线信息,所述第一路线信息为多个位置点信息按照到达的先后顺序组成的位置点序列;所述第二数据库用于实时存储每一样本设备上报的轨迹信息和所述轨迹信息中的每一位置点对应的上报时间信息,所述轨迹信息为多个位置点信息按照样本设备上报时间的先后排序组成的位置点序列。本发明能够提高基于位置数据来预测目标数量的准确性。

权利要求 :

1.一种基于LBS的数据处理系统,其特征在于,

包括预先构建的第一数据库、第二数据库、处理器和存储有计算机程序的存储器,其中,所述第一数据库中存储有路网信息,所述路网信息包括预设区域内所有的位置点信息和任意两个位置点之间存在的所有可能的第一路线信息,所述第一路线信息为多个位置点信息按照到达的先后顺序组成的位置点序列;所述第二数据库用于实时存储每一样本设备上报的轨迹信息和所述轨迹信息中的每一位置点对应的上报时间信息,所述轨迹信息为多个位置点信息按照样本设备上报时间的先后排序组成的位置点序列,所述处理器执行所述计算机程序实现以下步骤:步骤S1、获取预设第一时间段内样本设备(id1,id2...idN)上报的轨迹信息(L1,L2...LN),idn表示第n个样本设备,Ln表示idn在所述第一时间段内上报的轨迹信息,n的取值为1到N,判断Ln是否包含预设目标位置点,若包含,则将idn对应的目标数据Cn确定为1,否则,执行步骤S2;

步骤S2、获取idn在所述第一时间段内对应的起始位置点信息,从所述第一数据库中获取idn对应的起始位置点和目标位置点之间的所有第一路线信息,构建idn对应的第一路线集,并从中选择idn对应的预测路线信息;

步骤S3、基于idn对应的预测路线信息和所述第二数据库中的idn在预设第二时间段内上报的轨迹信息,确定idn在所述第一时间段内在目标位置点出现的概率并作为对应的目标数据Cn,所述第二时间段长于所述第一时间段;

步骤S4、获取所有Cn的总和作为目标预测值C:

步骤S5、获取目标比例参数E,基于目标预测值C和目标比例参数E确定目标实际值;

所述步骤S5中,获取目标比例参数E,包括:

步骤S51、接收预设参考位置点基于预设的辅助监测设备上报的预设第一时间段内监测实际值A;

步骤S52、将所述参考位置点作为所述目标位置点,执行步骤S1‑步骤S4,获取所述参考位置点对应的目标预测值B;

步骤S53、基于所述参考位置点对应的监测实际值和目标预测值获取目标比例参数E:E=B/A。

2.根据权利要求1所述的系统,其特征在于,

还包括样本设备集合,(id1,id2...idN)从所述样本设备集合中获取,所述处理器执行所述计算机程序还实现以下步骤:步骤S10、从所述第二数据库获取具备预设标签的设备IDi在连续W个预设第三时段内的轨迹信息(Li1,Li2...LiW),Lij表示设备IDi在第j第三时段内的轨迹信息;

步骤S20、基于Lij获取设备IDi在每一第三时段内出现目标位置的次数,若设备IDi在每一第三时段内出现目标位置的次数均大于预设的次数阈值,则基于设备IDi在每一第三时段内出现目标位置的次数获取设备IDi在连续W个第三时段内出现目标位置的次数的均差值,若所述均差值小于预设的均差阈值,则将IDi存储至所述样本设备集合中。

3.根据权利要求1所述的系统,其特征在于,

所述系统还包括导航设备,所述步骤S2中,从idn对应的第一路线集中选择预设M条作为idn对应的预测路线信息,包括:步骤S21、判断idn对应的第一路线集中的第一路线信息数量是否小于等于预设的第一路线数量阈值M,若是,则将idn对应的第一路线集中的所有第一路线信息确定为对应的预测路线信息,否则,执行步骤S22;

步骤S22、idn对应的起始位置点和目标位置点输入所述导航设备,生成按照路线合理性由大到小排序的多条路线信息,选择前M条作为idn对应的预测路线信息。

4.根据权利要求3所述的系统,其特征在于,

所述步骤S3包括:

步骤S31、获取第m条预测路线信息中目标位置点的上一位置点信息作为第m预测位置点,m的取值为1到M;

步骤S32、基于所述第二数据库中的idn在预设第二时间段内上报的轨迹信息,确定idn在所述第一时间段内从第m预测位置点到达目标位点的概率Cnm;

步骤S33、确定idn在所述第一时间段内在目标位置点出现的概率Cn:

5.根据权利要求1所述的系统,其特征在于,

步骤S32包括:

步骤S321、判断所述第二数据库中的idn在预设第二时间段内上报的轨迹信息出现idn对应的预测路线信息的数量是否大于预设的第二路线数量阈值,若大于,则基于idn在预设第二时间段内上报的轨迹信息出现idn计算idn在所述第一时间段内从第m预测位置点到达目标位点的概率Cnm,否则,执行步骤S322;

步骤S322、将预设的从第m预测位置点到达目标位点的默认概率值作为idn在所述第一时间段内从第m预测位置点到达目标位点的概率Cnm。

6.根据权利要求1所述的系统,其特征在于,

所述第二时间段大于10倍的第一时间段。

说明书 :

基于LBS的数据处理系统

技术领域

[0001] 本发明涉及数据处理技术领域,尤其涉及一种基于LBS的数据处理系统。

背景技术

[0002] 现有的很多应用场景下需要预测一个位置区域内的目标数量,例如,获取某一港口一段时间内进出车辆的数量,再如某一店铺一段时间内的人流量等等。随着移动设备和信息技术的快速发展,移动设备的时间信息、位置点信息等数据较易获取到,通过获取移动设备相关位置数据能够对很多上述目标数量、目标人流量等进行预测。但由于某些移动设备出现网络故障、设备故障、电量耗尽等情况时,无法正常上报位置数据,出现漏报位置数据的情况。因此,直接基于移动设备上报为位置数据来预测目标数量的准确度低,与实际目标数量的差距较大。由此可知,如何提高基于位置数据来预测目标数据的准确性,使得预测数据更加接近实际目标数据成为亟待解决的技术问题。

发明内容

[0003] 本发明目的在于,提供一种基于LBS的数据处理系统,能够提高基于位置数据来预测目标数量的准确性。
[0004] 根据本发明第一方面,提供了一种基于LBS的数据处理系统,包括预先构建的第一数据库、第二数据库、处理器和存储有计算及程序的处理器,其中,所述第一数据库中存储有路网信息,所述路网信息包括预设区域内所有的位置点信息和任意两个位置点之间存在的所有可能的第一路线信息,所述第一路线信息为多个位置点信息按照到达的先后顺序组成的位置点序列;所述第二数据库用于实时存储每一样本设备上报的轨迹信息和所述轨迹信息中的每一位置点对应的上报时间信息,所述轨迹信息为多个位置点信息按照样本设备上报时间的先后排序组成的位置点序列,所述处理器执行所述计算机程序实现以下步骤:
[0005] 步骤S1、获取预设第一时间段内样本设备(id1,id2...idN)上报的轨迹信息(L1,L2...LN),idn表示第n个样本设备,Ln表示idn在所述第一时间段内上报的轨迹信息,n的取值为1到N,判断Ln是否包含预设目标位置点,若包含,则将idn对应的目标数据Cn确定为1,否则,执行步骤S2;
[0006] 步骤S2、获取idn在所述第一时间段内对应的起始位置点信息,从所述第一数据库中获取idn对应的起始位置点和目标位置点之间的所有第一路线信息,构建idn对应的第一路线集,并从中选择idn对应的预测路线信息;
[0007] 步骤S3、基于idn对应的预测路线信息和所述第二数据库中的idn在预设第二时间段内上报的轨迹信息,确定idn在所述第一时间段内在目标位置点出现的概率并作为对应的目标数据Cn,所述第二时间段长于所述第一时间段;
[0008] 步骤S4、获取所有Cn的总和作为目标预测值C:
[0009]
[0010] 本发明与现有技术相比具有明显的优点和有益效果。借由上述技术方案,本发明提供的一种基于LBS的数据处理系统可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有下列优点:
[0011] 本发明所述系统能够基于预设时段内的位置数据结合历史位置数据来预测目标预测值,提高了基于位置数据来预测目标数量的准确性。
[0012] 上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。

附图说明

[0013] 图1为本发明实施例提供的基于LBS的数据处理系统示意图。

具体实施方式

[0014] 为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于LBS的数据处理系统的具体实施方式及其功效,详细说明如后。
[0015] 本发明实施例提供了一种基于LBS(基于位置的服务)的数据处理系统,如图1所示,包括预先构建的第一数据库、第二数据库、处理器和存储有计算及程序的处理器,其中,所述第一数据库中存储有路网信息,所述路网信息包括预设区域内所有的位置点信息和任意两个位置点之间存在的所有可能的第一路线信息,所述第一路线信息为多个位置点信息按照到达的先后顺序组成的位置点序列;所述第二数据库用于实时存储每一样本设备上报的轨迹信息和所述轨迹信息中的每一位置点对应的上报时间信息,所述轨迹信息为多个位置点信息按照样本设备上报时间的先后排序组成的位置点序列,可以理解的是,路网信息是相对稳定的,第二数据库的内容时根据样本设备上报的信息实时更新的,从而使得样本设备的历史路线信息也都对应存储。所述处理器执行所述计算机程序实现以下步骤:
[0016] 步骤S1、获取预设第一时间段内样本设备(id1,id2...idN)上报的轨迹信息(L1,L2...LN),idn表示第n个样本设备,Ln表示idn在所述第一时间段内上报的轨迹信息,n的取值为1到N,判断Ln是否包含预设目标位置点,若包含,则将idn对应的目标数据Cn确定为1,否则,执行步骤S2;
[0017] 可以理解的是,样本设备指的是预设第一时间段内上报目标位置点的设备。预设第一时间段预设的目标位置点根据具体的应用需求来设定,例如,以预测某一港口一天内出现的货车数量,则第一时间段为1天,目标位置点为该港口。需要说明的是,本发明实施例所述的位置点并非必须限定为一个具体的点,也可能为所限定的一个较小地理区域范围,例如上述的港口,或者高速公路收费站等等。
[0018] 步骤S2、获取idn在所述第一时间段内对应的起始位置点信息,从所述第一数据库中获取idn对应的起始位置点和目标位置点之间的所有第一路线信息,构建idn对应的第一路线集,并从中选择idn对应的预测路线信息;
[0019] 步骤S3、基于idn对应的预测路线信息和所述第二数据库中的idn在预设第二时间段内上报的轨迹信息,确定idn在所述第一时间段内在目标位置点出现的概率并作为对应的目标数据Cn,所述第二时间段长于所述第一时间段;
[0020] 可以理解的是,当Ln包含了预设目标位置点时,说明第一时间段内,样本设备idn必然到过目标位置点,因此将idn对应的目标数据Cn。由于某些样本设备可能出现网络故障、设备故障、电量耗尽等情况时,无法正常上报位置数据,因此Ln中是可能出现漏报位置数据的情况,因此,对于Ln不包含预设目标位置点的样本设备,可采用idn在预设第二时间段内上报的历史第二路线数据来预测样本设备在第一时段内到达目标位置点的概率。第二时间段的选择根据具体计算量要求和计算精度来设定,优选的,所述第二时间段大于10倍的第一时间段,例如,第一时间段设置为1,第二时间段设置为30天。
[0021] 步骤S4、获取所有Cn的总和作为目标预测值C:
[0022]
[0023] 本发明实施例所述系统能够基于预设时段内的位置数据结合历史位置数据来预测目标预测值,提高了基于位置数据来预测目标数量的准确性。
[0024] 在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时处理可以被终止,但是还可以具有未包括在附图中的附加步骤。处理可以对应于方法、函数、规程、子例程、子程序等等。
[0025] 作为一种实施例,所述系统还包括样本设备集合,为了保证位置数据采用的稳定性,提高目标数据预测的准确性,可以选择一段时间内能够以稳定的规律出现在目标位置点的设备,来构建样本集合,(id1,id2...idN)从所述样本设备集合中获取,所述处理器执行所述计算机程序还实现以下步骤:
[0026] 步骤S10、从所述第二数据库获取具备预设标签的设备IDi在连续W个预设第三时段内的轨迹信息(Li1,Li2...LiW),Lij表示设备IDi在第j第三时段内的轨迹信息;
[0027] 步骤S20、基于Lij获取设备IDi在每一第三时段内出现目标位置的次数,若设备IDi在每一第三时段内出现目标位置的次数均大于预设的次数阈值,则基于设备IDi在每一第三时段内出现目标位置的次数获取设备IDi在连续W个第三时段内出现目标位置的次数的均差值,若所述均差值小于预设的均差阈值,则将IDi存储至所述样本设备集合中。
[0028] 为了进一步提高目标数据预测的准确性,可以进一步修正Ln,作为一种实施例,所述第一数据库中还包括校正路线信息表,用于存储校正路线信息记录,所述第二信息记录包括第一位置点和第三位置点信息对字段和第三位置点信息字段,当一条轨迹信息中先出现第一位置点信息后又出现第三位置点信息时,该条轨迹中必然出现第二位置点信息,所述步骤S1中当判断Ln不包含预设目标位置点,还包括:
[0029] 步骤S11、检索所述校正路线信息表,获取以目标位置点作为第三位置点信息所对应的所有的第一位置点和第三位置点信息对,并构建目标位置信息对集合;
[0030] 步骤S12、判断Ln中任意两个连续的位置点组成的信息对是否存在与所述目标位置信息对集合中,若存在,则在Ln中补入目标位置信息,并将idn对应的目标数据Cn确定为1,若不存在,则执行步骤S2。
[0031] 所述步骤S2中,idn对应的预测路线信息的选取对目标数据预测结果的正确性也有很大影响,且基于两个位置点的第一路线信息的数量可能很大,因此,需要从idn对应的起始位置点和目标位置点之间的所有第一路线信息合理选择idn对应的预测路线信息,提高数据处理效率和目标数据预测准确性,作为一种实施例,所述系统还包括导航设备,所述步骤S2中,从idn对应的第一路线集中选择预设M条作为idn对应的预测路线信息,包括:
[0032] 步骤S21、判断idn对应的第一路线集中的第一路线信息数量是否小于等于预设的第一路线数量阈值M,若是,则将idn对应的第一路线集中的所有第一路线信息确定为对应的预测路线信息,否则,执行步骤S22;
[0033] 步骤S22、idn对应的起始位置点和目标位置点输入所述导航设备,生成按照路线合理性由大到小排序的多条路线信息,选择前M条作为idn对应的预测路线信息。
[0034] 可以理解的是,M的值根据计算量的要求和预测结果的准确度等因此综合设定,作为一种示例,M的值可以设置为3。
[0035] 作为一种实施例,所述步骤S3可包括:
[0036] 步骤S31、获取第m条预测路线信息中目标位置点的上一位置点信息作为第m预测位置点,m的取值为1到M;
[0037] 步骤S32、基于所述第二数据库中的idn在预设第二时间段内上报的轨迹信息,确定idn在所述第一时间段内从第m预测位置点到达目标位点的概率Cnm;
[0038] 步骤S33、确定idn在所述第一时间段内在目标位置点出现的概率Cn:
[0039]
[0040] 通过多条预测路线信息来预测样本设备上报目标位置点的概率,再将所有概率来的总合作为该样本设备在所述第一时间段内在目标位置点出现的概率,提高了目标数据预测的准确性。
[0041] 但可以理解的是,有些样本设备在预设第二时间段内的位置数据较少,这样的情况下,预测的出现概率阈值的准确性较低,这样的情况下,则需要设置默认的概率值,以提高数据预测的准确性,从第m预测位置点到达目标位点的默认概率值是基于多个样本设备的多条历史数据所推算出来的默认的概率值,具有较高的可靠性和准确定。具体的,作为一种实施例,步骤S32可包括:
[0042] 步骤S321、判断所述第二数据库中的idn在预设第二时间段内上报的轨迹信息出现idn对应的预测路线信息的数量是否大于预设的第二路线数量阈值,若大于,则基于idn在预设第二时间段内上报的轨迹信息出现idn计算idn在所述第一时间段内从第m预测位置点到达目标位点的概率Cnm,否则,执行步骤S322;
[0043] 步骤S322、将预设的从第m预测位置点到达目标位点的默认概率值作为idn在所述第一时间段内从第m预测位置点到达目标位点的概率Cnm。
[0044] 需要说明的是,本发明实施例通过筛选能够实现数据稳定采样的样本设备,保证数据采样稳定性,再基于修正填补Ln,筛选预测路线等方式来尽可能提高目标预测值的准确性。但可以理解的是,由于实际情况中确实存在移动设备出现网络故障、设备故障、电量耗尽等情况时,无法正常上报位置数据,出现漏报位置数据的情况,因此,通过本发明实施例上述实施方式所得到的目标预测值仅仅能保证所得预测值的稳定性,但和真实数据是有差距的,但由于事先了稳定采用,因此,对于每个位置点来说,目标预测值和真实数据之间会有个相对稳定的比例系数。通常需要预测的目标位置点是难以直接通过一些辅助设备来直接获取目标数据的位置点,但相关路线中会存在能够通过一些辅助设备获取真实数据的位置点,因此可以基于该位置点的位置数据获取相关的比例系数,从而使得目标位置点也能够获取到接近于真实的目标数据。具体的,作为一种实施例,所述处理器执行所述计算机程序还可实现以下步骤:
[0045] 步骤S5、获取目标比例参数E,基于目标预测值C和目标比例参数E确定目标实际值。
[0046] 具体的,所述步骤S5中,获取目标比例参数E,可包括:
[0047] 步骤S51、接收预设参考位置点基于预设的辅助监测设备上报的预设第一时间段内监测实际值A;
[0048] 步骤S52、将所述参考位置点作为所述目标位置点,执行步骤S1‑步骤S4,获取所述参考位置点对应的目标预测值B;
[0049] 步骤S53、基于所述参考位置点对应的监测实际值和目标预测值获取目标比例参数E:
[0050] E=B/A。
[0051] 本发明实施例所述系统能够基于预设时段内的位置数据结合历史位置数据来预测目标预测值,并可通过对位置数据的修正,选择预测路线等过程,提高了数据采样的稳定性,从而提高基于位置数据来预测目标数量的准确性。此外,还能选择参考位置点获取目标比例系数,从而基于目标比例系数和目标预测值来获取目标位置点的接近于真实值的目标数据。基于多个时段的目标数据可以获取数据变化的趋势,从而应用到多种数据分析场景中。
[0052] 以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。