基于大数据的分布式数据处理系统转让专利

申请号 : CN202310294841.7

文献号 : CN116012036B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 程瑶潘卫东

申请人 : 中科云策(深圳)科技成果转化信息技术有限公司

摘要 :

本发明公开了基于大数据的分布式数据处理系统,涉及互联网数据处理技术领域,解决了现有技术中,无法设置分布式终端对用户进行安全性管控、推送商品准确性监控以及推送时间段合理性监控的技术问题;本发明是将用户进行文本数据采集并挖掘,并通过文本数据采集监测对用户的信息安全进行实时监管,提高用户购物数据的安全性,防止数据安全性不合格导致用户数据挖掘的方向出现偏差,对用户行为数据进行采集并对其进行控制,提高用户浏览的效率,防止用户浏览完成后无法再次寻找对应链接;还对用户的网购时间数据进行采集,网购时间数据采集后并根据分析后进行合理时间段推送,防止推送时间段不合理导致用户接收推送效率低。

权利要求 :

1.基于大数据的分布式数据处理系统,其特征在于,包括处理端与数据集,且处理端与数据集中间设置有数据展示控制模块、数据挖掘端、数据监测端以及数据控制端;

处理端生成数据挖掘信号并将数据挖掘信号发送至数据挖掘端,数据挖掘端接收到数据挖掘信号后,将用户进行文本数据采集并挖掘,通过文本数据采集监测对用户的信息安全进行实时监管,并在完成文本数据采集后将其发送至数据集;并对文本数据进行分析;文本数据表示为分析主体的会话ID、会话号、授权设备信息;

处理端生成数据监测信号并将数据监测信号发送至数据监测端,数据监测端接收到数据监测信号后,对分析主体的行为数据进行采集并对其进行控制,并在完成行为数据采集后将其发送至数据集;将分析主体划分进行类型划分,并将对应类型进行首选推送对象获取;行为数据表示为分析主体反复浏览同一商品后购买概率、添加购物车概率以及退出浏览概率;

处理端生成数据监测信号并将数据监测信号发送至数据监测端,数据监测端接收到数据监测信号后,将分析主体进行时间数据采集,并在完成时间数据采集后将其发送至数据集;根据时间数据进行分析通过分析将对应分析主体进行推送管控;时间数据表示为分析主体的浏览时间段、购买时间段。

2.根据权利要求1所述的基于大数据的分布式数据处理系统,其特征在于,数据集进行实时数据存储时与处理端建立通讯连接,且通讯连接经过数据展示控制模块,数据展示控制模块用于将数据集内存储数据进行分析,将数据集内文本数据、行为数据以及时间数据统一标记为组成数据,并将组成数据进行分析;并在数据单一展示和数据合并展示两种场景进行展示类型设定。

3.根据权利要求1所述的基于大数据的分布式数据处理系统,其特征在于,数据监测端运行过程如下:

采集到分析主体的文本数据中会话ID的登录终端为非授权设备的频率以及非授权设备完成当前登录后二次登录为非当前会话ID的连续登录次数,并将其分别与非授权登录频率阈值以及连续登录次数阈值进行比较。

4.根据权利要求3所述的基于大数据的分布式数据处理系统,其特征在于,比较过程如下:

若分析主体的文本数据中会话ID的登录终端为非授权设备的频率超过非授权登录频率阈值,且非授权设备完成当前登录后二次登录为非当前会话ID的连续登录次数未超过连续登录次数阈值,则判定分析主体存在临时非授权设备登录,生成登录预警提醒信号并将登录预警提醒信号发送至处理端;处理端发送临时登录限制指令至授权设备;

若分析主体的文本数据中会话ID的登录终端为非授权设备的频率超过非授权登录频率阈值,且非授权设备完成当前登录后二次登录为非当前会话ID的连续登录次数超过连续登录次数阈值,则判定分析主体非授权设备登录,生成登录报警信号并将登录报警信号发送至处理端;处理端发送非授权设备登录禁止指令至授权设备;

若分析主体的文本数据中会话ID的登录终端为非授权设备的频率未超过非授权登录频率阈值,或者非授权设备完成当前登录后二次登录为非当前会话ID的连续登录次数未超过连续登录次数阈值,则判定分析主体登录风险正常,生成登录安全信号并将登录安全信号发送至处理端;处理端发送当前设备登录指令至授权设备。

5.根据权利要求1所述的基于大数据的分布式数据处理系统,其特征在于,数据监测端的运行过程如下:

在分析主体进行商品筛选时间段内,分析主体对应商品浏览频率达到浏览频率阈值时,将其设置为纠结购买类型,若对应分析主体的添加购物车概率未超过添加概率阈值,或者分析主体的退出浏览概率超过退出浏览概率阈值,则在分析主体的商品浏览频率与浏览频率阈值一致时,将对应商品链接作为当前分析主体的首选推送对象;

若对应分析主体的添加购物车概率超过添加概率阈值,且分析主体的退出浏览概率未超过退出浏览概率阈值,则在分析主体的商品浏览频率与浏览频率阈值一致时,将对应未加入购物车的同类型商品链接作为当前分析主体的首选推送对象组,并在首选推送对象组内根据浏览频率排序进行依次推送。

6.根据权利要求5所述的基于大数据的分布式数据处理系统,其特征在于,分析主体对应商品浏览频率未达到浏览频率阈值时,将其设置为直接购买类型,则在分析主体完成当前商品浏览后将对应商品链接作为当前分析主体的首选不推送对象,并将当前商品的同相似度商品对应商品链接作为当前分析主体的首选推送对象。

7.根据权利要求1所述的基于大数据的分布式数据处理系统,其特征在于,数据监测端的运行过程如下:

采集到分析主体的时间数据内浏览时间段对应浏览频率以及购买时间段内购买执行频率,并将分析主体的时间数据内浏览时间段对应浏览频率以及购买时间段内购买执行频率分别与浏览频率阈值和购买执行频率阈值进行比较。

8.根据权利要求7所述的基于大数据的分布式数据处理系统,其特征在于,比较过程如下:

若分析主体的时间数据内浏览时间段对应浏览频率超过浏览频率阈值,或者购买时间段内购买执行频率超过购买执行频率阈值,则将对应时间段统一标记为高频访问时间段;

若分析主体的时间数据内浏览时间段对应浏览频率未超过浏览频率阈值,且购买时间段内购买执行频率未超过购买执行频率阈值,则将对应时间段统一标记为低频访问时间段;

将高频访问时间段和低频访问时间段一同发送至处理端,处理端进行推送时间段设置,若当前时间段不为高频访问时间段或者低频访问时间段,则对分析主体的授权终端不进行推送;若当前时间段为低频访问时间段,则对分析主体的授权终端进行推送提示但不进行提示弹窗;若当前时间段为高频访问时间段,则对分析主体的授权终端进行推送提示且进行提示弹窗。

9.根据权利要求2所述的基于大数据的分布式数据处理系统,其特征在于,数据展示控制模块的运行过程如下:采集到数据集内组成数据公开展示后数据本身变动概率以及组成数据公开展示前数据浏览访问的权限终端数量增加量,并将其分别与变动概率阈值和数量增加量阈值进行比较:若数据集内组成数据公开展示后数据本身变动概率超过变动概率阈值,且组成数据公开展示前数据浏览访问的权限终端数量增加量超过数量增加量阈值,则将对应组成数据的展示类型设置为公开且除敏展示;

若数据集内组成数据公开展示后数据本身变动概率超过变动概率阈值,且组成数据公开展示前数据浏览访问的权限终端数量增加量未超过数量增加量阈值,则将对应组成数据的展示类型设置为公开且设限展示;

若数据集内组成数据公开展示后数据本身变动概率未超过变动概率阈值,且组成数据公开展示前数据浏览访问的权限终端数量增加量未超过数量增加量阈值,则将对应组成数据的展示类型设置为非公开展示;

若数据集内组成数据公开展示后数据本身变动概率未超过变动概率阈值,且组成数据公开展示前数据浏览访问的权限终端数量增加量超过数量增加量阈值,则将对应组成数据的展示类型设置为公开展示;

进行数据合并展示时,根据分析主体内组成数据的展示类型进行针对性加密。

说明书 :

基于大数据的分布式数据处理系统

技术领域

[0001] 本发明涉及互联网数据处理技术领域,具体为基于大数据的分布式数据处理系统。

背景技术

[0002] 网上购物是通过互联网检索商品信息,并通过电子订购单发出购物请求,然后填上私人支票账号或信用卡的号码,厂商通过邮购的方式发货,或是通过快递公司送货上门,在互联网时代下,互联网数据进行分布式数据处理尤其重要;
[0003] 但是在现有技术中的互联网网购领域内,无法设置分布式终端对用户进行安全性管控、推送商品准确性监控以及推送时间段合理性监控,以至于用户的互联网购物效率低,且使用质量无法满足用户需求,同时不能够对用户的数据进行展示类型确定,无法对同需求用户提供参考;
[0004] 针对上述的技术缺陷,现提出一种解决方案。

发明内容

[0005] 本发明的目的就在于为了解决上述提出的问题,而提出基于大数据的分布式数据处理系统,是将数据集内存储数据进行分析,判断存储数据在单一展示或者合并展示时是否需要加密,从而保证互联网数据的流通效率同时确保数据所属用户的数据私密性,提高网购数据展示的合理性便于同需求用户进行参考,促进网购商品成交率减少网购商品浏览等产生的数据处理工作量。
[0006] 本发明的目的可以通过以下技术方案实现:
[0007] 基于大数据的分布式数据处理系统,包括处理端与数据集,且处理端与数据集中间设置有数据展示控制模块、数据挖掘端、数据监测端以及数据控制端;
[0008] 处理端生成数据挖掘信号并将数据挖掘信号发送至数据挖掘端,数据挖掘端接收到数据挖掘信号后,将用户进行文本数据采集并挖掘,通过文本数据采集监测对用户的信息安全进行实时监管,并在完成文本数据采集后将其发送至数据集;并对文本数据进行分析;
[0009] 处理端生成数据监测信号并将数据监测信号发送至数据监测端,数据监测端接收到数据监测信号后,对分析主体的行为数据进行采集并对其进行控制,并在完成行为数据采集后将其发送至数据集;将分析主体划分进行类型划分,并将对应类型进行首选推送对象获取;
[0010] 处理端生成数据监测信号并将数据监测信号发送至数据监测端,数据监测端接收到数据监测信号后,将分析主体进行时间数据采集,并在完成时间数据采集后将其发送至数据集;根据时间数据进行分析通过分析将对应分析主体进行推送管控。
[0011] 作为本发明的一种优选实施方式,数据集进行实时数据存储时与处理端建立通讯连接,且通讯连接经过数据展示控制模块,数据展示控制模块用于将数据集内存储数据进行分析,将数据集内文本数据、行为数据以及时间数据统一标记为组成数据,并将组成数据进行分析;并在数据单一展示和数据合并展示两种场景进行展示类型设定。
[0012] 作为本发明的一种优选实施方式,数据监测端运行过程如下:
[0013] 采集到分析主体的文本数据中会话ID的登录终端为非授权设备的频率以及非授权设备完成当前登录后二次登录为非当前会话ID的连续登录次数,并将其分别与非授权登录频率阈值以及连续登录次数阈值进行比较。
[0014] 作为本发明的一种优选实施方式,比较过程如下:
[0015] 若分析主体的文本数据中会话ID的登录终端为非授权设备的频率超过非授权登录频率阈值,且非授权设备完成当前登录后二次登录为非当前会话ID的连续登录次数未超过连续登录次数阈值,则判定分析主体存在临时非授权设备登录,生成登录预警提醒信号并将登录预警提醒信号发送至处理端;处理端发送临时登录限制指令至授权设备;
[0016] 若分析主体的文本数据中会话ID的登录终端为非授权设备的频率超过非授权登录频率阈值,且非授权设备完成当前登录后二次登录为非当前会话ID的连续登录次数超过连续登录次数阈值,则判定分析主体非授权设备登录,生成登录报警信号并将登录报警信号发送至处理端;处理端发送非授权设备登录禁止指令至授权设备;
[0017] 若分析主体的文本数据中会话ID的登录终端为非授权设备的频率未超过非授权登录频率阈值,或者非授权设备完成当前登录后二次登录为非当前会话ID的连续登录次数未超过连续登录次数阈值,则判定分析主体登录风险正常,生成登录安全信号并将登录安全信号发送至处理端;处理端发送当前设备登录指令至授权设备。
[0018] 作为本发明的一种优选实施方式,数据监测端的运行过程如下:
[0019] 在分析主体进行商品筛选时间段内,分析主体对应商品浏览频率达到浏览频率阈值时,将其设置为纠结购买类型,若对应分析主体的添加购物车概率未超过添加概率阈值,或者分析主体的退出浏览概率超过退出浏览概率阈值,则在分析主体的商品浏览频率与浏览频率阈值一致时,将对应商品链接作为当前分析主体的首选推送对象;
[0020] 若对应分析主体的添加购物车概率超过添加概率阈值,且分析主体的退出浏览概率未超过退出浏览概率阈值,则在分析主体的商品浏览频率与浏览频率阈值一致时,将对应未加入购物车的同类型商品链接作为当前分析主体的首选推送对象组,并在首选推送对象组内根据浏览频率排序进行依次推送。
[0021] 作为本发明的一种优选实施方式,分析主体对应商品浏览频率未达到浏览频率阈值时,将其设置为直接购买类型,则在分析主体完成当前商品浏览后将对应商品链接作为当前分析主体的首选不推送对象,并将当前商品的同相似度商品对应商品链接作为当前分析主体的首选推送对象。
[0022] 作为本发明的一种优选实施方式,数据监测端的运行过程如下:
[0023] 采集到分析主体的时间数据内浏览时间段对应浏览频率以及购买时间段内购买执行频率,并将分析主体的时间数据内浏览时间段对应浏览频率以及购买时间段内购买执行频率分别与浏览频率阈值和购买执行频率阈值进行比较。
[0024] 作为本发明的一种优选实施方式,比较过程如下:
[0025] 若分析主体的时间数据内浏览时间段对应浏览频率超过浏览频率阈值,或者购买时间段内购买执行频率超过购买执行频率阈值,则将对应时间段统一标记为高频访问时间段;
[0026] 若分析主体的时间数据内浏览时间段对应浏览频率未超过浏览频率阈值,且购买时间段内购买执行频率未超过购买执行频率阈值,则将对应时间段统一标记为低频访问时间段。
[0027] 作为本发明的一种优选实施方式,将高频访问时间段和低频访问时间段一同发送至处理端,处理端进行推送时间段设置,若当前时间段不为高频访问时间段或者低频访问时间段,则对分析主体的授权终端不进行推送;若当前时间段为低频访问时间段,则对分析主体的授权终端进行推送提示但不进行提示弹窗;若当前时间段为高频访问时间段,则对分析主体的授权终端进行推送提示且进行提示弹窗。
[0028] 作为本发明的一种优选实施方式,数据展示控制模块的运行过程如下:
[0029] 采集到数据集内组成数据公开展示后数据本身变动概率以及组成数据公开展示前数据浏览访问的权限终端数量增加量,并将其分别与变动概率阈值和数量增加量阈值进行比较:
[0030] 若数据集内组成数据公开展示后数据本身变动概率超过变动概率阈值,且组成数据公开展示前数据浏览访问的权限终端数量增加量超过数量增加量阈值,则将对应组成数据的展示类型设置为公开且除敏展示;
[0031] 若数据集内组成数据公开展示后数据本身变动概率超过变动概率阈值,且组成数据公开展示前数据浏览访问的权限终端数量增加量未超过数量增加量阈值,则将对应组成数据的展示类型设置为公开且设限展示;
[0032] 若数据集内组成数据公开展示后数据本身变动概率未超过变动概率阈值,且组成数据公开展示前数据浏览访问的权限终端数量增加量未超过数量增加量阈值,则将对应组成数据的展示类型设置为非公开展示,如时间数据内用户的购买时间段,则不进行公开展示;
[0033] 若数据集内组成数据公开展示后数据本身变动概率未超过变动概率阈值,且组成数据公开展示前数据浏览访问的权限终端数量增加量超过数量增加量阈值,则将对应组成数据的展示类型设置为公开展示;
[0034] 进行数据合并展示时,根据分析主体内组成数据的展示类型进行针对性加密,如时间数据中购买时间段与文本数据中会话号进行合并展示。
[0035] 作为本发明的一种优选实施方式,文本数据表示为分析主体的会话ID、会话号、授权设备信息;行为数据表示为分析主体反复浏览同一商品后购买概率、添加购物车概率以及退出浏览概率;时间数据表示为分析主体的浏览时间段、购买时间段。
[0036] 基于大数据的分布式数据处理方法,具体数据处理方法步骤如下:
[0037] 步骤一、将用户进行文本数据采集并挖掘,通过文本数据采集监测对用户的信息安全进行实时监管,并在完成文本数据采集后将其发送至数据集;并对文本数据进行分析;
[0038] 步骤二、对分析主体的行为数据进行采集并对其进行控制,并在完成行为数据采集后将其发送至数据集;将分析主体划分进行类型划分,并将对应类型进行首选推送对象获取;
[0039] 步骤三、将分析主体进行时间数据采集,并在完成时间数据采集后将其发送至数据集;根据时间数据进行分析通过分析将对应分析主体进行推送管控;
[0040] 步骤四、数据集进行实时数据存储时与处理端建立通讯连接,且通讯连接经过数据展示控制模块,数据展示控制模块将数据集内存储数据进行分析,将数据集内文本数据、行为数据以及时间数据统一标记为组成数据,并将组成数据进行分析;并在数据单一展示和数据合并展示两种场景进行展示类型设定。
[0041] 与现有技术相比,本发明的有益效果是:
[0042] 1、本发明中,将用户进行文本数据采集并挖掘,通过文本数据采集监测对用户的信息安全进行实时监管,提高用户购物数据的安全性,防止数据安全性不合格导致用户数据挖掘的方向出现偏差,引起用户的使用质量降低,同时用户的实时购物质量降低;对用户行为数据进行采集并对其进行控制,提高用户浏览的效率,防止用户浏览完成后无法再次寻找对应链接,同时不能够根据行为数据挖掘准确进行物品推送,导致用户的产品推送合格率降低,影响用户购物效率降低了网购的使用质量;对用户的网购时间数据进行采集,网购时间数据采集后并根据分析后进行合理时间段推送,防止推送时间段不合理导致用户接收推送效率低,增加了用户关闭推送的风险,以至于降低了用户的购物质量同时影响了商品的销售稳定性,不利于电子商务平台的运营;
[0043] 2、本发明中,在分析主体网购过程中,通过分布式数据处理进行分析主体安全性监控、推送商品准确性监控以及推送时间段合理性监控,同时将分析主体的采集数据一同发送至数据集,在各个终端数据处理高强度时可进行数据集跨终端访问,即非上传终端可进行上传终端的上传数据访问;大大降低了互联网数据的同步处理压力同时保证了数据处理的及时性;
[0044] 3、本发明中,将数据集内存储数据进行分析,判断存储数据在单一展示或者合并展示时是否需要加密,从而保证互联网数据的流通效率同时确保数据所属用户的数据私密性,提高网购数据展示的合理性便于同需求用户进行参考,促进网购商品成交率减少网购商品浏览等产生的数据处理工作量。

附图说明

[0045] 为了便于本领域技术人员理解,下面结合附图对本发明作进一步的说明。
[0046] 图1为本发明基于大数据的分布式数据处理系统的原理框图。

具体实施方式

[0047] 为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0048] 在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
[0049] 请参阅图1所示,基于大数据的分布式数据处理系统,包括处理端与数据集,且处理端与数据集中间设置有数据展示控制模块、数据挖掘端、数据监测端以及数据控制端;
[0050] 在互联网电子商务平台内存在海量数据,因此通过分布式数据处理则能够保证用户在网购过程中的安全性和购物便捷性,本系统从用户购物的多个阶段进行数据采集并将处理。
[0051] 实施例一
[0052] 处理端生成数据挖掘信号并将数据挖掘信号发送至数据挖掘端,数据挖掘端接收到数据挖掘信号后,将用户进行文本数据采集并挖掘,通过文本数据采集监测对用户的信息安全进行实时监管,提高用户购物数据的安全性,防止数据安全性不合格导致用户数据挖掘的方向出现偏差,引起用户的使用质量降低,同时用户的实时购物质量降低;
[0053] 将用户标记为分析主体,并将分析主体设置标号i,i为大于1的自然数,对分析主体进行文本数据采集,其文本数据表示为分析主体的会话ID、会话号、授权设备信息等数据,即文本数据则为分析主体的身份信息;并在完成文本数据采集后将其发送至数据集;同时采集到分析主体的文本数据中会话ID的登录终端为非授权设备的频率以及非授权设备完成当前登录后二次登录为非当前会话ID的连续登录次数,并将分析主体的文本数据中会话ID的登录终端为非授权设备的频率以及非授权设备完成当前登录后二次登录为非当前会话ID的连续登录次数分别与非授权登录频率阈值以及连续登录次数阈值进行比较:
[0054] 若分析主体的文本数据中会话ID的登录终端为非授权设备的频率超过非授权登录频率阈值,且非授权设备完成当前登录后二次登录为非当前会话ID的连续登录次数未超过连续登录次数阈值,则判定分析主体存在临时非授权设备登录,生成登录预警提醒信号并将登录预警提醒信号发送至处理端;处理端发送临时登录限制指令至授权设备;
[0055] 若分析主体的文本数据中会话ID的登录终端为非授权设备的频率超过非授权登录频率阈值,且非授权设备完成当前登录后二次登录为非当前会话ID的连续登录次数超过连续登录次数阈值,则判定分析主体非授权设备登录,生成登录报警信号并将登录报警信号发送至处理端;处理端发送非授权设备登录禁止指令至授权设备;
[0056] 若分析主体的文本数据中会话ID的登录终端为非授权设备的频率未超过非授权登录频率阈值,或者非授权设备完成当前登录后二次登录为非当前会话ID的连续登录次数未超过连续登录次数阈值,则判定分析主体登录风险正常,生成登录安全信号并将登录安全信号发送至处理端;处理端发送当前设备登录指令至授权设备;
[0057] 处理端生成数据监测信号并将数据监测信号发送至数据监测端,数据监测端接收到数据监测信号后,对用户行为数据进行采集并对其进行控制,提高用户浏览的效率,防止用户浏览完成后无法再次寻找对应链接,同时不能够根据行为数据挖掘准确进行物品推送,导致用户的产品推送合格率降低,影响用户购物效率降低了网购的使用质量;
[0058] 将分析主体进行行为数据采集,行为数据表示为分析主体反复浏览同一商品后购买概率、添加购物车概率以及退出浏览概率等数据,并将行为数据发送至数据集进行存储;同时对分析主体进行行为数据分析,根据分析主体的行为数据中反复浏览同一商品后购买概率将分析主体划分为纠结购买类型和直接购买类型两种,在分析主体进行商品筛选时间段内,分析主体对应商品浏览频率达到浏览频率阈值时,将其设置为纠结购买类型,若对应分析主体的添加购物车概率未超过添加概率阈值,或者分析主体的退出浏览概率超过退出浏览概率阈值,则在分析主体的商品浏览频率与浏览频率阈值一致时,将对应商品链接作为当前分析主体的首选推送对象;若对应分析主体的添加购物车概率超过添加概率阈值,且分析主体的退出浏览概率未超过退出浏览概率阈值,则在分析主体的商品浏览频率与浏览频率阈值一致时,将对应未加入购物车的同类型商品链接作为当前分析主体的首选推送对象组,并在首选推送对象组内根据浏览频率排序进行依次推送;反之,分析主体对应商品浏览频率未达到浏览频率阈值时,将其设置为直接购买类型,则在分析主体完成当前商品浏览后将对应商品链接作为当前分析主体的首选不推送对象,并将当前商品的同相似度商品对应商品链接作为当前分析主体的首选推送对象,其中,同相似度商品表示为两种商品为同类型商品,且商品销量偏差以及对应商品所属商铺评分偏差均未超过对应阈值;
[0059] 处理端生成数据监测信号并将数据监测信号发送至数据监测端,数据监测端接收到数据监测信号后,对用户的网购时间数据进行采集,网购时间数据采集后并根据分析后进行合理时间段推送,防止推送时间段不合理导致用户接收推送效率低,增加了用户关闭推送的风险,以至于降低了用户的购物质量同时影响了商品的销售稳定性,不利于电子商务平台的运营;
[0060] 将分析主体进行时间数据采集,时间数据表示为分析主体的浏览时间段、购买时间段;并将时间数据发送至数据集同时对分析主体的时间数据进行分析,采集到分析主体的时间数据内浏览时间段对应浏览频率以及购买时间段内购买执行频率,并将分析主体的时间数据内浏览时间段对应浏览频率以及购买时间段内购买执行频率分别与浏览频率阈值和购买执行频率阈值进行比较:
[0061] 若分析主体的时间数据内浏览时间段对应浏览频率超过浏览频率阈值,或者购买时间段内购买执行频率超过购买执行频率阈值,则将对应时间段统一标记为高频访问时间段;若分析主体的时间数据内浏览时间段对应浏览频率未超过浏览频率阈值,且购买时间段内购买执行频率未超过购买执行频率阈值,则将对应时间段统一标记为低频访问时间段;
[0062] 将高频访问时间段和低频访问时间段一同发送至处理端,处理端进行推送时间段设置,若当前时间段不为高频访问时间段或者低频访问时间段,则对分析主体的授权终端不进行推送;若当前时间段为低频访问时间段,则对分析主体的授权终端进行推送提示但不进行提示弹窗;若当前时间段为高频访问时间段,则对分析主体的授权终端进行推送提示且进行提示弹窗;
[0063] 在分析主体网购过程中,通过分布式数据处理进行分析主体安全性监控、推送商品准确性监控以及推送时间段合理性监控,同时将分析主体的采集数据一同发送至数据集,在各个终端数据处理高强度时可进行数据集跨终端访问,即非上传终端可进行上传终端的上传数据访问;大大降低了互联网数据的同步处理压力同时保证了数据处理的及时性;
[0064] 实施例二
[0065] 数据集进行实时数据存储时与处理端建立通讯连接,且通讯连接经过数据展示控制模块,数据展示控制模块用于将数据集内存储数据进行分析,判断存储数据在单一展示或者合并展示时是否需要加密,从而保证互联网数据的流通效率同时确保数据所属用户的数据私密性,提高网购数据展示的合理性便于同需求用户进行参考,促进网购商品成交率减少网购商品浏览等产生的数据处理工作量;
[0066] 将数据集内文本数据、行为数据以及时间数据统一标记为组成数据,并将组成数据进行分析;进行数据单一展示时,采集到数据集内组成数据公开展示后数据本身变动概率以及组成数据公开展示前数据浏览访问的权限终端数量增加量,并将数据集内组成数据公开展示后数据本身变动概率以及组成数据公开展示前数据浏览访问的权限终端数量增加量分别与变动概率阈值和数量增加量阈值进行比较:
[0067] 若数据集内组成数据公开展示后数据本身变动概率超过变动概率阈值,且组成数据公开展示前数据浏览访问的权限终端数量增加量超过数量增加量阈值,则将对应组成数据的展示类型设置为公开且除敏展示;如行为数据中用户浏览商品添加购物车的概率,则对添加购物车对应商品以及对应添加概率进行展示并商品添加时间或者次数进行展示;若数据集内组成数据公开展示后数据本身变动概率超过变动概率阈值,且组成数据公开展示前数据浏览访问的权限终端数量增加量未超过数量增加量阈值,则将对应组成数据的展示类型设置为公开且设限展示;如文本数据中用户授权设备,可将用户授权设备种类或者对应设备型号进行展示,但对设备型号的具体编号进行设限,仅用户或者用户授权的终端可访问;若数据集内组成数据公开展示后数据本身变动概率未超过变动概率阈值,且组成数据公开展示前数据浏览访问的权限终端数量增加量未超过数量增加量阈值,则将对应组成数据的展示类型设置为非公开展示,如时间数据内用户的购买时间段,则不进行公开展示;若数据集内组成数据公开展示后数据本身变动概率未超过变动概率阈值,且组成数据公开展示前数据浏览访问的权限终端数量增加量超过数量增加量阈值,则将对应组成数据的展示类型设置为公开展示,如文本数据中的会话号;本申请中数据公开展示均在电商平台内通过安全认证的终端进行公开展示,未通过安全认证均为私密展示,且该私密展示的授权途径即为电商平台安全认证,如实名认证等;
[0068] 进行数据合并展示时,根据分析主体内组成数据的展示类型进行针对性加密,如时间数据中购买时间段与文本数据中会话号进行合并展示,即展示为xx时间段内对应会话号进行购买,而不是对应会话号的购买时间段为xx时间段;
[0069] 基于大数据的分布式数据处理方法,具体数据处理方法步骤如下:
[0070] 步骤一、将用户进行文本数据采集并挖掘,通过文本数据采集监测对用户的信息安全进行实时监管,并在完成文本数据采集后将其发送至数据集;并对文本数据进行分析;
[0071] 步骤二、对分析主体的行为数据进行采集并对其进行控制,并在完成行为数据采集后将其发送至数据集;将分析主体划分进行类型划分,并将对应类型进行首选推送对象获取;
[0072] 步骤三、将分析主体进行时间数据采集,并在完成时间数据采集后将其发送至数据集;根据时间数据进行分析通过分析将对应分析主体进行推送管控;
[0073] 步骤四、数据集进行实时数据存储时与处理端建立通讯连接,且通讯连接经过数据展示控制模块,数据展示控制模块将数据集内存储数据进行分析,将数据集内文本数据、行为数据以及时间数据统一标记为组成数据,并将组成数据进行分析;并在数据单一展示和数据合并展示两种场景进行展示类型设定。
[0074] 本发明在使用时,通过数据挖掘端将用户进行文本数据采集并挖掘,通过文本数据采集监测对用户的信息安全进行实时监管,并在完成文本数据采集后将其发送至数据集;并对文本数据进行分析;通过数据监测端接收到数据监测信号后,对分析主体的行为数据进行采集并对其进行控制,并在完成行为数据采集后将其发送至数据集;将分析主体划分进行类型划分,并将对应类型进行首选推送对象获取;通过数据监测端将分析主体进行时间数据采集,并在完成时间数据采集后将其发送至数据集;根据时间数据进行分析通过分析将对应分析主体进行推送管控;数据集进行实时数据存储时与处理端建立通讯连接,且通讯连接经过数据展示控制模块,数据展示控制模块将数据集内存储数据进行分析,将数据集内文本数据、行为数据以及时间数据统一标记为组成数据,并将组成数据进行分析;并在数据单一展示和数据合并展示两种场景进行展示类型设定。
[0075] 以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。