基于大数据和云计算的数据处理方法及大数据服务器转让专利

申请号 : CN202011388984.7

文献号 : CN112487495B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 李孔雀

申请人 : 厦门立马耀网络科技有限公司

摘要 :

本发明的基于大数据和云计算的数据处理方法及大数据服务器,会首先考虑存在业务认证签名的非共享型业务数据以及存在修改权限标识的共享型业务数据,这样能够确定出不同业务交互数据之间对应的目标业务数据集,进而实现对目标业务数据集的权限更新处理。在对当前共享型业务数据进行汇总时能够考虑数据修改权限的调整,从而实现对当前共享型业务数据的目标权限标识的实时更新。通过更新目标权限标识能够建立针对当前共享型业务数据的共享保护机制,能够在共享待使用业务数据时,确保待使用业务数据不会被随意地篡改,从而确保正常的共享业务处理进程,避免处于数据共享状态的用户终端的数据信息泄露,进而确保数据共享的安全性。

权利要求 :

1.一种基于大数据和云计算的数据处理方法,其特征在于,包括:获取对目标用户终端进行业务数据采集后所得到的第一业务交互数据和第二业务交互数据,其中,所述第一业务交互数据为存在业务认证签名的非共享型业务数据,所述第二业务交互数据为存在修改权限标识的共享型业务数据;

确定所述第一业务交互数据和所述第二业务交互数据中对应业务数据集的业务相似度信息,并基于所述对应业务数据集的业务相似度信息确定出所述第一业务交互数据和所述第二业务交互数据之间对应的且满足预设指标条件的目标业务数据集;

基于所述第一业务交互数据中的所述目标业务数据集对所述第二业务交互数据中的所述目标业务数据集进行权限更新处理;对权限更新处理后的所述第二业务交互数据中的存在目标权限标识的当前共享型业务数据进行汇总以得到待使用业务数据;

其中,确定所述第一业务交互数据和所述第二业务交互数据中对应业务数据集的业务相似度信息包括:

确定所述第一业务交互数据中各业务数据集的业务数据特征的特征相似度以及所述第二业务交互数据中各业务数据集的业务数据特征的特征相似度;

基于所述第一业务交互数据中各业务数据集的业务数据特征的特征相似度以及所述第二业务交互数据中各业务数据集的业务数据特征的特征相似度,确定所述第一业务交互数据和所述第二业务交互数据中所述对应业务数据集的相似度融合权重值,其中,所述业务相似度信息包括所述相似度融合权重值;

其中,确定所述第一业务交互数据和所述第二业务交互数据中所述对应业务数据集的相似度融合权重值包括以下至少之一:基于所述第一业务交互数据中各业务数据集的业务数据特征的特征相似度以及所述第二业务交互数据中各业务数据集的业务数据特征的特征相似度,计算所述第一业务交互数据和所述第二业务交互数据中所述对应业务数据集的业务数据时序相似度以确定所述相似度融合权重值;

基于所述第一业务交互数据中各业务数据集的业务数据特征的特征相似度以及所述第二业务交互数据中各业务数据集的业务数据特征的特征相似度,计算所述第一业务交互数据和所述第二业务交互数据中所述对应业务数据集的业务数据特征的相似度融合系数以确定所述相似度融合权重值;

确定所述第一业务交互数据和所述第二业务交互数据中所述对应业务数据集的业务事件标签,基于确定出的业务事件标签以及所述第一业务交互数据和所述第二业务交互数据中所述对应业务数据集的业务数据特征的特征相似度确定所述相似度融合权重值;

其中,基于所述第一业务交互数据中的所述目标业务数据集对所述第二业务交互数据中的所述目标业务数据集进行权限更新处理包括:使用数据列表清单表示所述第一业务交互数据中的所述目标业务数据集中包括的每一个业务数据集,将数据列表清单表示的各业务数据集组成第一数据列表特征矩阵,对所述第一数据列表特征矩阵进行矩阵元素修正处理及矩阵结构变换处理,以得到第一目标矩阵;

使用数据列表清单表示所述第二业务交互数据中的所述目标业务数据集中包括的每一个业务数据集,将数据列表清单表示的各业务数据集组成第二数据列表特征矩阵,对所述第二数据列表特征矩阵进行矩阵元素修正处理及矩阵结构变换处理,以得到第二目标矩阵;

基于所述第一目标矩阵对所述第一业务交互数据中的所述目标业务数据集进行数据使用权限更新,以得到第一已更新业务数据;基于所述第二目标矩阵以及所述第一已更新业务数据对所述第二业务交互数据中的所述目标业务数据集进行数据使用权限更新;

其中,基于所述第一目标矩阵对所述第一业务交互数据中的所述目标业务数据集进行数据使用权限更新,以得到第一已更新业务数据包括:判断所述第一业务交互数据中的各所述目标业务数据集对应的第一目标矩阵的矩阵特征描述值是否处于第一权限更新描述值阈值范围内;

将第一目标矩阵处于所述第一权限更新描述值阈值范围内的目标业务数据集的第一目标矩阵的矩阵特征描述值设为选定数值,维持其他目标业务数据集的第一目标矩阵的矩阵特征描述值不变,以得到所述第一已更新业务数据;

其中,基于所述第二目标矩阵以及所述第一已更新业务数据对所述第二业务交互数据中的所述目标业务数据集进行数据使用权限更新包括:判断所述第二业务交互数据中的各所述目标业务数据集对应的第二目标矩阵的矩阵特征描述值与第一设定描述值的和是否处于第二权限更新描述值阈值范围内,其中,所述第一设定描述值为所述第一业务交互数据中对应的目标业务数据集所对应的第一目标矩阵的矩阵特征描述指与设定权限安全指数的乘积;将第二目标矩阵与所述第一设定描述值的和处于所述第二权限更新描述值阈值范围内的目标业务数据集的第二目标矩阵设为选定数值,维持其他目标业务数据集的第二目标矩阵的矩阵特征描述值不变,以得到第二已更新业务数据;

或,

将所述第二业务交互数据中的各所述目标业务数据集对应的第二目标矩阵的矩阵特征描述值与第二设定描述值的乘积作为所述目标业务数据集的第二目标矩阵,以得到第二已更新业务数据,其中,所述第二设定描述值为所述第一业务交互数据中对应的目标业务数据集所对应业务数据时序相似度和历史时序相似度均值的差与所述第一业务交互数据中对应的目标业务数据集所对应业务数据时序相似度的比值。

2.根据权利要求1所述的方法,其特征在于,基于所述对应业务数据集的业务相似度信息确定出所述第一业务交互数据和所述第二业务交互数据之间对应的且满足预设指标条件的目标业务数据集包括:对所述第一业务交互数据和所述第二业务交互数据中所述对应业务数据集按照业务相似度信息的相似度评价值的由大到小的顺序进行排序;

通过如下方式之一从排序后的所述对应业务数据集中确定出所述目标业务数据集:按顺序选取设定数量的所述对应业务数据集作为所述目标业务数据集;

按顺序选取设定比例的所述对应业务数据集作为所述目标业务数据集;

将业务相似度信息对应的相似度融合权重值小于第一预定权重值的所述对应业务数据集确定为所述目标业务数据集;

按顺序将业务相似度信息对应的相似度融合权重值小于第二预定权重值的所述对应业务数据集中包括的各对应业务数据集按照预设迭代次数进行迭代更新,基于迭代更新结果确定所述目标业务数据集;

基于所述对应业务数据集的累计业务数据时序相似度的变化曲线选取所述目标业务数据集。

3.根据权利要求2所述的方法,其特征在于,按顺序将业务相似度信息对应的相似度融合权重值小于第二预定权重值的所述对应业务数据集中包括的各对应业务数据集按照预设迭代次数进行迭代更新,基于迭代更新结果确定所述目标业务数据集包括:确定与业务相似度信息对应的相似度融合权重值小于第二预定权重值的所述对应业务数据集中包括的各对应业务数据集的业务相似度信息对应的迭代更新次数,其中,业务相似度信息对应的相似度融合权重值对应的相似度融合权重值越小,对应的迭代更新次数越大;

按照确定的迭代更新次数对业务相似度信息对应的相似度融合权重值小于第二预定权重值的所述对应业务数据集中包括的各对应业务数据集进行迭代更新;

对迭代更新后的所述对应业务数据集按照数据集时效性权重由小到大的顺序进行排序,以得到所述目标业务数据集;

其中,基于所述对应业务数据集的累计业务数据时序相似度的变化曲线选取所述目标业务数据集包括:

按顺序选取设定数量的所述对应业务数据集,并计算所述设定数量的所述对应业务数据集的第一业务数据时序相似度,其中,所述设定数量为预先确定的最小匹配数;

按顺序选取设定数量加一的所述对应业务数据集,并计算所述设定数量加一的所述对应业务数据集的第二业务数据时序相似度;

在确定所述第一业务数据时序相似度和所述第二业务数据时序相似度的相似度差值大于或等于预定相似度差值时,将所述设定数量的所述对应业务数据集确定为所述目标业务数据集;

在确定所述第一业务数据时序相似度和所述第二业务数据时序相似度的相似度差值小于所述预定相似度差值时,重复执行选取比前一次选取数量多一个的所述对应业务数据集,直到后选取出的所述对应业务数据集的业务数据时序相似度与前一次选取出的所述对应业务数据集的业务数据时序相似度的差值大于或等于所述预定相似度差值,并将前一次选取出的所述对应业务数据集确定为所述目标业务数据集。

4.根据权利要求1‑3任一项所述的方法,其特征在于,对权限更新处理后的所述第二业务交互数据中的存在目标权限标识的当前共享型业务数据进行汇总以得到待使用业务数据包括以下之一:

采用确定业务数据时序相似度的方式对所述存在目标权限标识的当前共享型业务数据进行汇总以得到所述待使用业务数据;

采用确定相似度融合系数的方式对所述存在目标权限标识的当前共享型业务数据进行汇总以得到所述待使用业务数据;

采用共享数据安全校验模型所述存在目标权限标识的当前共享型业务数据进行汇总以得到所述待使用业务数据;

将所述存在目标权限标识的当前共享型业务数据中包括的进行了所述权限更新处理后的业务数据集的矩阵特征描述值与未进行所述权限更新处理前的业务数据集的矩阵特征描述值进行比较,通过对选取进行了所述权限更新处理后的业务数据集的矩阵特征描述值与未进行所述权限更新处理前的业务数据集的矩阵特征描述值相似度差值最小的矩阵特征描述值与未进行所述权限更新处理前的业务数据集的矩阵特征描述值求平均来确定所述存在目标权限标识的当前共享型业务数据的矩阵特征描述值,以得到所述待使用业务数据。

5.根据权利要求4所述的方法,其特征在于,采用共享数据安全校验模型所述存在目标权限标识的当前共享型业务数据进行汇总以得到所述待使用业务数据,包括:通过所述共享数据安全校验模型将当前共享型业务数据划分为若干个业务数据段集合;其中,每个业务数据段集合包含多个业务数据段;

基于所述当前共享型业务数据的第一共享校验指标,得到所述业务数据段的第二共享校验指标;其中,所述第一共享校验指标是利用历史异常共享记录得到的;

针对至少一个所述业务数据段集合:分别以至少一个业务数据段的第二共享校验指标为参考指标,利用预设指标提取算法获取所述至少一个业务数据段的最佳校验指标;并利用所述至少一个业务数据段的最佳校验指标,确定得到所述业务数据段集合内其他所述业务数据段的最佳校验指标;

基于所述业务数据段的所述第二共享校验指标和所述最佳校验指标,确定对应所述业务数据段的目标共享校验指标;

通过所述目标共享校验指标对应的校验指标聚类结果将所述业务数据段进行拼接,得到所述待使用业务数据;其中,所述待使用业务数据由多个用户终端共享;

其中,所述利用所述至少一个业务数据段的最佳校验指标,确定得到所述业务数据段集合内其他所述业务数据段的最佳校验指标,包括:基于所述至少一个业务数据段的业务数据段数量和在所述业务数据段集合中的相对序列位置,选择对应的校验指标确定方式;

利用所述校验指标确定方式对所述至少一个业务数据段的最佳校验指标进行确定,得到所述业务数据段集合内其他所述业务数据段的最佳校验指标。

6.根据权利要求1所述的方法,其特征在于,在获取对目标用户终端进行业务数据采集后所得到的第一业务交互数据和第二业务交互数据之前,所述方法还包括:获取对目标用户终端进行业务数据采集后所得到的第三业务交互数据,其中,所述第三业务交互数据为包括至少两种数据共享持续时长的共享型业务数据;

将所述第三业务交互数据转换成至少两个所述第二业务交互数据,其中,不同的所述第二业务交互数据中包括有不同的数据共享持续时长;

确定所述第一业务交互数据和所述第二业务交互数据中对应业务数据集的业务相似度信息,并基于所述对应业务数据集的业务相似度信息确定出所述第一业务交互数据和所述第二业务交互数据之间对应的且满足预设指标条件的目标业务数据集包括:对于所述第一业务交互数据和任一个所述第二业务交互数据均执行以下操作:确定所述第一业务交互数据和所述第二业务交互数据中所述对应业务数据集的业务相似度信息,并基于所述对应业务数据集的业务相似度信息确定出所述第一业务交互数据和所述第二业务交互数据之间对应的且满足预设指标条件的目标业务数据集;

基于所述第一业务交互数据中的所述目标业务数据集对所述第二业务交互数据中的所述目标业务数据集进行权限更新处理包括:对于所述第一业务交互数据和任一个所述第二业务交互数据均执行以下操作:基于所述第一业务交互数据中的所述目标业务数据集对所述第二业务交互数据中的所述目标业务数据集进行权限更新处理;

对权限更新处理后的所述第二业务交互数据中的存在目标权限标识的当前共享型业务数据进行汇总以得到待使用业务数据包括:对于所述第一业务交互数据和任一个所述第二业务交互数据均执行以下操作:对权限更新处理后的所述第二业务交互数据中的存在目标权限标识的当前共享型业务数据进行汇总以得到待使用业务数据;

在得到所述待使用业务数据之后,所述方法还包括:将得到的至少两个待使用业务数据进行汇总,以得到与所述第三业务交互数据对应的待使用业务数据。

7.一种大数据服务器,其特征在于,包括处理引擎、网络模块和存储器;所述处理引擎和所述存储器通过所述网络模块通信,所述处理引擎从所述存储器中读取计算机程序并运行,以执行权利要求1‑6任一项所述的方法。

说明书 :

基于大数据和云计算的数据处理方法及大数据服务器

技术领域

[0001] 本申请涉及大数据和云计算技术领域,具体而言,涉及一种基于大数据和云计算的数据处理方法及大数据服务器。

背景技术

[0002] 随着大数据的发展,现目前的业务处理几乎都可以在云端进行,极大地提高了各行各业的业务处理效率。智能终端功能的不断完善使得用户能够在云上进行业务数据的交
互。在一些业务场景下,不可避免地需要进行业务数据共享,然而在业务数据共享时,如何
确保数据共享的安全性是需要注意的一个技术问题。

发明内容

[0003] 本申请的第一个方面公开了一种基于大数据和云计算的数据处理方法,包括:
[0004] 获取对目标用户终端进行业务数据采集后所得到的第一业务交互数据和第二业务交互数据,其中,所述第一业务交互数据为存在业务认证签名的非共享型业务数据,所述
第二业务交互数据为存在修改权限标识的共享型业务数据;
[0005] 确定所述第一业务交互数据和所述第二业务交互数据中对应业务数据集的业务相似度信息,并基于所述对应业务数据集的业务相似度信息确定出所述第一业务交互数据
和所述第二业务交互数据之间对应的且满足预设指标条件的目标业务数据集;
[0006] 基于所述第一业务交互数据中的所述目标业务数据集对所述第二业务交互数据中的所述目标业务数据集进行权限更新处理;对权限更新处理后的所述第二业务交互数据
中的存在目标权限标识的当前共享型业务数据进行汇总以得到待使用业务数据。
[0007] 优选的实施方式中,确定所述第一业务交互数据和所述第二业务交互数据中对应业务数据集的业务相似度信息包括:
[0008] 确定所述第一业务交互数据中各业务数据集的业务数据特征的特征相似度以及所述第二业务交互数据中各业务数据集的业务数据特征的特征相似度;
[0009] 基于所述第一业务交互数据中各业务数据集的业务数据特征的特征相似度以及所述第二业务交互数据中各业务数据集的业务数据特征的特征相似度,确定所述第一业务
交互数据和所述第二业务交互数据中所述对应业务数据集的相似度融合权重值,其中,所
述业务相似度信息包括所述相似度融合权重值;
[0010] 其中,确定所述第一业务交互数据和所述第二业务交互数据中所述对应业务数据集的相似度融合权重值包括以下至少之一:
[0011] 基于所述第一业务交互数据中各业务数据集的业务数据特征的特征相似度以及所述第二业务交互数据中各业务数据集的业务数据特征的特征相似度,计算所述第一业务
交互数据和所述第二业务交互数据中所述对应业务数据集的业务数据时序相似度以确定
所述相似度融合权重值;
[0012] 基于所述第一业务交互数据中各业务数据集的业务数据特征的特征相似度以及所述第二业务交互数据中各业务数据集的业务数据特征的特征相似度,计算所述第一业务
交互数据和所述第二业务交互数据中所述对应业务数据集的业务数据特征的相似度融合
系数以确定所述相似度融合权重值;
[0013] 确定所述第一业务交互数据和所述第二业务交互数据中所述对应业务数据集的业务事件标签,基于确定出的业务事件标签以及所述第一业务交互数据和所述第二业务交
互数据中所述对应业务数据集的业务数据特征的特征相似度确定所述相似度融合权重值。
[0014] 优选的实施方式中,基于所述对应业务数据集的业务相似度信息确定出所述第一业务交互数据和所述第二业务交互数据之间对应的且满足预设指标条件的目标业务数据
集包括:对所述第一业务交互数据和所述第二业务交互数据中所述对应业务数据集按照业
务相似度信息的相似度评价值的由大到小的顺序进行排序;
[0015] 通过如下方式之一从排序后的所述对应业务数据集中确定出所述目标业务数据集:
[0016] 按顺序选取设定数量的所述对应业务数据集作为所述目标业务数据集;
[0017] 按顺序选取设定比例的所述对应业务数据集作为所述目标业务数据集;
[0018] 将业务相似度信息对应的相似度融合权重值小于第一预定权重值的所述对应业务数据集确定为所述目标业务数据集;
[0019] 按顺序将业务相似度信息对应的相似度融合权重值小于第二预定权重值的所述对应业务数据集中包括的各对应业务数据集按照预设迭代次数进行迭代更新,基于迭代更
新结果确定所述目标业务数据集;
[0020] 基于所述对应业务数据集的累计业务数据时序相似度的变化曲线选取所述目标业务数据集。
[0021] 优选的实施方式中,按顺序将业务相似度信息对应的相似度融合权重值小于第二预定权重值的所述对应业务数据集中包括的各对应业务数据集按照预设迭代次数进行迭
代更新,基于迭代更新结果确定所述目标业务数据集包括:
[0022] 确定与业务相似度信息对应的相似度融合权重值小于第二预定权重值的所述对应业务数据集中包括的各对应业务数据集的业务相似度信息对应的迭代更新次数,其中,
业务相似度信息对应的相似度融合权重值对应的相似度融合权重值越小,对应的迭代更新
次数越大;
[0023] 按照确定的迭代更新次数对业务相似度信息对应的相似度融合权重值小于第二预定权重值的所述对应业务数据集中包括的各对应业务数据集进行迭代更新;
[0024] 对迭代更新后的所述对应业务数据集按照数据集时效性权重由小到大的顺序进行排序,以得到所述目标业务数据集;
[0025] 其中,基于所述对应业务数据集的累计业务数据时序相似度的变化曲线选取所述目标业务数据集包括:
[0026] 按顺序选取设定数量的所述对应业务数据集,并计算所述设定数量的所述对应业务数据集的第一业务数据时序相似度,其中,所述设定数量为预先确定的最小匹配数;
[0027] 按顺序选取设定数量加一的所述对应业务数据集,并计算所述设定数量加一的所述对应业务数据集的第二业务数据时序相似度;
[0028] 在确定所述第一业务数据时序相似度和所述第二业务数据时序相似度的相似度差值大于或等于预定相似度差值时,将所述设定数量的所述对应业务数据集确定为所述目
标业务数据集;
[0029] 在确定所述第一业务数据时序相似度和所述第二业务数据时序相似度的相似度差值小于所述预定相似度差值时,重复执行选取比前一次选取数量多一个的所述对应业务
数据集,直到后选取出的所述对应业务数据集的业务数据时序相似度与前一次选取出的所
述对应业务数据集的业务数据时序相似度的差值大于或等于所述预定相似度差值,并将前
一次选取出的所述对应业务数据集确定为所述目标业务数据集。
[0030] 优选的实施方式中,基于所述第一业务交互数据中的所述目标业务数据集对所述第二业务交互数据中的所述目标业务数据集进行权限更新处理包括:
[0031] 使用数据列表清单表示所述第一业务交互数据中的所述目标业务数据集中包括的每一个业务数据集,将数据列表清单表示的各业务数据集组成第一数据列表特征矩阵,
对所述第一数据列表特征矩阵进行矩阵元素修正处理及矩阵结构变换处理,以得到第一目
标矩阵;
[0032] 使用数据列表清单表示所述第二业务交互数据中的所述目标业务数据集中包括的每一个业务数据集,将数据列表清单表示的各业务数据集组成第二数据列表特征矩阵,
对所述第二数据列表特征矩阵进行矩阵元素修正处理及矩阵结构变换处理,以得到第二目
标矩阵;
[0033] 基于所述第一目标矩阵对所述第一业务交互数据中的所述目标业务数据集进行数据使用权限更新,以得到第一已更新业务数据;基于所述第二目标矩阵以及所述第一已
更新业务数据对所述第二业务交互数据中的所述目标业务数据集进行数据使用权限更新。
[0034] 优选的实施方式中,基于所述第一目标矩阵对所述第一业务交互数据中的所述目标业务数据集进行数据使用权限更新,以得到第一已更新业务数据包括:
[0035] 判断所述第一业务交互数据中的各所述目标业务数据集对应的第一目标矩阵的矩阵特征描述值是否处于第一权限更新描述值阈值范围内;
[0036] 将第一目标矩阵处于所述第一权限更新描述值阈值范围内的目标业务数据集的第一目标矩阵的矩阵特征描述值设为选定数值,维持其他目标业务数据集的第一目标矩阵
的矩阵特征描述值不变,以得到所述第一已更新业务数据;
[0037] 其中,基于所述第二目标矩阵以及所述第一已更新业务数据对所述第二业务交互数据中的所述目标业务数据集进行数据使用权限更新包括:
[0038] 判断所述第二业务交互数据中的各所述目标业务数据集对应的第二目标矩阵的矩阵特征描述值与第一设定描述值的和是否处于第二权限更新描述值阈值范围内,其中,
所述第一设定描述值为所述第一业务交互数据中对应的目标业务数据集所对应的第一目
标矩阵的矩阵特征描述指与设定权限安全指数的乘积;将第二目标矩阵与所述第一设定描
述值的和处于所述第二权限更新描述值阈值范围内的目标业务数据集的第二目标矩阵设
为选定数值,维持其他目标业务数据集的第二目标矩阵的矩阵特征描述值不变,以得到第
二已更新业务数据;
[0039] 或,
[0040] 将所述第二业务交互数据中的各所述目标业务数据集对应的第二目标矩阵的矩阵特征描述值与第二设定描述值的乘积作为所述目标业务数据集的第二目标矩阵,以得到
第二已更新业务数据,其中,所述第二设定描述值为所述第一业务交互数据中对应的目标
业务数据集所对应业务数据时序相似度和历史时序相似度均值的差与所述第一业务交互
数据中对应的目标业务数据集所对应业务数据时序相似度的比值。
[0041] 优选的实施方式中,对权限更新处理后的所述第二业务交互数据中的存在目标权限标识的当前共享型业务数据进行汇总以得到待使用业务数据包括以下之一:
[0042] 采用确定业务数据时序相似度的方式对所述存在目标权限标识的当前共享型业务数据进行汇总以得到所述待使用业务数据;
[0043] 采用确定相似度融合系数的方式对所述存在目标权限标识的当前共享型业务数据进行汇总以得到所述待使用业务数据;
[0044] 采用共享数据安全校验模型所述存在目标权限标识的当前共享型业务数据进行汇总以得到所述待使用业务数据;
[0045] 将所述存在目标权限标识的当前共享型业务数据中包括的进行了所述权限更新处理后的业务数据集的矩阵特征描述值与未进行所述权限更新处理前的业务数据集的矩
阵特征描述值进行比较,通过对选取进行了所述权限更新处理后的业务数据集的矩阵特征
描述值与未进行所述权限更新处理前的业务数据集的矩阵特征描述值相似度差值最小的
矩阵特征描述值与未进行所述权限更新处理前的业务数据集的矩阵特征描述值求平均来
确定所述存在目标权限标识的当前共享型业务数据的矩阵特征描述值,以得到所述待使用
业务数据。
[0046] 优选的实施方式中,采用共享数据安全校验模型所述存在目标权限标识的当前共享型业务数据进行汇总以得到所述待使用业务数据,包括:
[0047] 通过所述共享数据安全校验模型将当前共享型业务数据划分为若干个业务数据段集合;其中,每个业务数据段集合包含多个业务数据段;
[0048] 基于所述当前共享型业务数据的第一共享校验指标,得到所述业务数据段的第二共享校验指标;其中,所述第一共享校验指标是利用历史异常共享记录得到的;
[0049] 针对至少一个所述业务数据段集合:分别以至少一个业务数据段的第二共享校验指标为参考指标,利用预设指标提取算法获取所述至少一个业务数据段的最佳校验指标;
并利用所述至少一个业务数据段的最佳校验指标,确定得到所述业务数据段集合内其他所
述业务数据段的最佳校验指标;
[0050] 基于所述业务数据段的所述第二共享校验指标和所述最佳校验指标,确定对应所述业务数据段的目标共享校验指标;
[0051] 通过所述目标共享校验指标对应的校验指标聚类结果将所述业务数据段进行拼接,得到所述待使用业务数据;其中,所述待使用业务数据由多个用户终端共享;
[0052] 其中,所述利用所述至少一个业务数据段的最佳校验指标,确定得到所述业务数据段集合内其他所述业务数据段的最佳校验指标,包括:基于所述至少一个业务数据段的
业务数据段数量和在所述业务数据段集合中的相对序列位置,选择对应的校验指标确定方
式;利用所述校验指标确定方式对所述至少一个业务数据段的最佳校验指标进行确定,得
到所述业务数据段集合内其他所述业务数据段的最佳校验指标。
[0053] 优选的实施方式中,在获取对目标用户终端进行业务数据采集后所得到的第一业务交互数据和第二业务交互数据之前,所述方法还包括:
[0054] 获取对目标用户终端进行业务数据采集后所得到的第三业务交互数据,其中,所述第三业务交互数据为包括至少两种数据共享持续时长的共享型业务数据;
[0055] 将所述第三业务交互数据转换成至少两个所述第二业务交互数据,其中,不同的所述第二业务交互数据中包括有不同的数据共享持续时长;
[0056] 确定所述第一业务交互数据和所述第二业务交互数据中对应业务数据集的业务相似度信息,并基于所述对应业务数据集的业务相似度信息确定出所述第一业务交互数据
和所述第二业务交互数据之间对应的且满足预设指标条件的目标业务数据集包括:对于所
述第一业务交互数据和任一个所述第二业务交互数据均执行以下操作:确定所述第一业务
交互数据和所述第二业务交互数据中所述对应业务数据集的业务相似度信息,并基于所述
对应业务数据集的业务相似度信息确定出所述第一业务交互数据和所述第二业务交互数
据之间对应的且满足预设指标条件的目标业务数据集;
[0057] 基于所述第一业务交互数据中的所述目标业务数据集对所述第二业务交互数据中的所述目标业务数据集进行权限更新处理包括:对于所述第一业务交互数据和任一个所
述第二业务交互数据均执行以下操作:基于所述第一业务交互数据中的所述目标业务数据
集对所述第二业务交互数据中的所述目标业务数据集进行权限更新处理;
[0058] 对权限更新处理后的所述第二业务交互数据中的存在目标权限标识的当前共享型业务数据进行汇总以得到待使用业务数据包括:对于所述第一业务交互数据和任一个所
述第二业务交互数据均执行以下操作:对权限更新处理后的所述第二业务交互数据中的存
在目标权限标识的当前共享型业务数据进行汇总以得到待使用业务数据;
[0059] 在得到所述待使用业务数据之后,所述方法还包括:将得到的至少两个待使用业务数据进行汇总,以得到与所述第三业务交互数据对应的待使用业务数据。
[0060] 本申请的第二个方面公开了一种大数据服务器,包括处理引擎、网络模块和存储器;所述处理引擎和所述存储器通过所述网络模块通信,所述处理引擎从所述存储器中读
取计算机程序并运行,以执行第一个方面所述的方法。
[0061] 相较于现有技术,本发明实施例提供的基于大数据和云计算的数据处理方法及大数据服务器具有以下技术效果:在确定待使用业务数据之前,会首先考虑存在业务认证签
名的非共享型业务数据以及存在修改权限标识的共享型业务数据,这样能够确定出第一业
务交互数据和第二业务交互数据之间对应的且满足预设指标条件的目标业务数据集,进而
实现对第二业务交互数据中的目标业务数据集的权限更新处理。如此,在对当前共享型业
务数据进行汇总时,能够考虑数据修改权限的调整,从而实现对当前共享型业务数据的目
标权限标识的实时更新。这样一来,通过更新目标权限标识能够建立针对当前共享型业务
数据的共享保护机制,能够在共享待使用业务数据时,确保待使用业务数据不会被随意地
篡改,从而确保正常的共享业务处理进程,避免处于数据共享状态的用户终端的数据信息
泄露,进而确保数据共享的安全性。
[0062] 在后面的描述中,将部分地陈述其他的特征。在检查后面内容和附图时,本领域的技术人员将部分地发现这些特征,或者可以通过生产或运用了解到这些特征。通过实践或
使用后面所述详细示例中列出的方法、工具和组合的各个方面,当前申请中的特征可以被
实现和获得。

附图说明

[0063] 为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对
范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这
些附图获得其他相关的附图。
[0064] 附图中的方法、系统和/或程序将根据示例性实施例进一步描述。这些示例性实施例将参照图纸进行详细描述。这些示例性实施例是非限制的示例性实施例,其中参考数字
在附图的各个视图中代表相似的机构。
[0065] 图1是根据本发明的一些实施例所示的一种示例性基于大数据和云计算的数据处理系统的框图。
[0066] 图2是根据本发明的一些实施例所示的一种示例性大数据服务器中硬件和软件组成的示意图。
[0067] 图3是根据本发明的一些实施例所示的一种示例性基于大数据和云计算的数据处理方法和/或过程的流程图。
[0068] 图4是根据本发明的一些实施例所示的一种示例性基于大数据和云计算的数据处理装置的框图。

具体实施方式

[0069] 在前述背景技术的基础上,发明人对常见的业务数据共享技术进行研究和分析后发现,常见的业务数据共享技术在进行数据共享时不会考虑共享业务数据的修改权限,这
会导致共享业务数据可能被恶意篡改,从而影响共享业务处理进程,还可能造成处于数据
共享状态的用户终端的数据信息泄露。
[0070] 为改善或解决上述问题,本发明实施例提供了基于大数据和云计算的数据处理方法及大数据服务器,通过采集到的不同业务交互数据进行分析和挖掘,从而整理出携带目
标权限标识的待使用业务数据,这样能够在共享待使用业务数据时,确保待使用业务数据
不会被随意地篡改,从而确保正常的共享业务处理进程,避免处于数据共享状态的用户终
端的数据信息泄露,进而确保数据共享的安全性。
[0071] 为了更好的理解上述技术方案,下面通过附图以及具体实施例对本发明技术方案做详细的说明,应当理解本发明实施例以及实施例中的具体特征是对本发明技术方案的详
细的说明,而不是对本发明技术方案的限定,在不冲突的情况下,本发明实施例以及实施例
中的技术特征可以相互组合。
[0072] 在下面的详细描述中,通过实例阐述了许多具体细节,以便提供对相关指导的全面了解。然而,对于本领域的技术人员来说,显然可以在没有这些细节的情况下实施本发
明。在其他情况下,公知的方法、程序、系统、组成和/或电路已经在一个相对较高水平上被
描述,没有细节,以避免不必要的模糊本发明的方面。
[0073] 这些和其他特性、当前申请披露的功能、执行的方法、结构中相关元素的功能和部件的组合和生产经济性,在参照附图进行以下描述的考虑中可能会变得更加明显,所有这
些形成本申请的一部分。然而,需要理解清楚的是,附图仅仅是为了说明和描述的目的,并
不旨在限制本申请的范围。应当了解的是,这些图纸不是按比例绘制的。然而,应当明确理
解的是,附图仅用于说明和描述的目的,并不意图限制本发明的范围。应当知晓的是,这些
附图并不依照比例。
[0074] 本申请中使用流程图说明根据本申请的实施例的系统所执行的执行过程。应当明确理解的是,流程图的执行过程可以不按顺序执行。相反,这些执行过程可以以相反的顺序
或同时执行。另外,可以将至少一个其他执行过程添加到流程图。一个或多个执行过程可以
从流程图中删除。
[0075] 图1是根据本发明的一些实施例所示的一种示例性基于大数据和云计算的数据处理系统300的框图,基于大数据和云计算的数据处理系统300可以包括大数据服务器100和
多个用户终端200。
[0076] 在一些实施例中,如图2所示,大数据服务器100可以包括处理引擎110、网络模块120和存储器130,处理引擎110和存储器130通过网络模块120通信。
[0077] 处理引擎110可以处理相关的信息和/或数据以执行本申请中描述的一个或多个功能。例如,在一些实施例中,处理引擎110可以包括至少一个处理引擎(例如,单核处理引
擎或多核处理器)。仅作为示例,处理引擎110可以包括中央处理单元(Central Processing 
Unit,CPU)、专用集成电路(Application‑Specific Integrated Circuit,ASIC)、专用指令
集处理器(Application‑Specific Instruction‑set Processor,ASIP)、图形处理单元
(Graphics Processing Unit,GPU)、物理处理单元(Physics Processing Unit,PPU)、数字
信号处理器(Digital Signal Processor,DSP)、现场可编程门阵列(Field Programmable 
Gate Array,FPGA)、可编程逻辑器件(Programmable Logic Device,PLD)、控制器、微控制
器单元、精简指令集计算机(Reduced Instruction‑Set Computer,RISC)、微处理器等或其
任意组合。
[0078] 网络模块120可以促进信息和/或数据的交换。在一些实施例中,网络模块120可以是任何类型的有线或无线网络或其组合。仅作为示例,网络模块120可以包括缆线网络、有
线网络、光纤网络、电信网络、内部网络、互联网、局域网络(Local Area Network,LAN)、广
域网(Wide Area Network,WAN)、无线局域网络(Wireless Local Area Network,WLAN)、城
域网(Metropolitan Area Network,MAN)、公用电话交换网(Public Telephone Switched 
Network,PSTN)、蓝牙网络、无线个域网络、近场通讯(Near Field Communication,NFC)网
络等或上述举例的任意组合。在一些实施例中,网络模块120可以包括至少一个网络接入
点。例如,网络模块120可以包括有线或无线网路接入点,如基站和/或网路接入点。
[0079] 存储器130可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read‑Only 
Memory,PROM),可擦除只读存储器(Erasable Programmable Read‑Only Memory,EPROM),
电可擦除只读存储器(Electric Erasable Programmable Read‑Only Memory,EEPROM)等。
其中,存储器130用于存储程序,所述处理引擎110在接收到执行指令后,执行所述程序。
[0080] 可以理解,图2所示的结构仅为示意,大数据服务器100还可包括比图2中所示更多或者更少的组件,或者具有与图2所示不同的配置。图2中所示的各组件可以采用硬件、软件
或其组合实现。
[0081] 图3是根据本发明的一些实施例所示的一种示例性基于大数据和云计算的数据处理方法和/或过程的流程图,基于大数据和云计算的数据处理方法应用于图1和/或图2中的
大数据服务器100,具体可以包括以下步骤S11‑步骤S13所描述的内容。
[0082] 步骤S11,获取对目标用户终端进行业务数据采集后所得到的第一业务交互数据和第二业务交互数据。
[0083] 例如,所述第一业务交互数据为存在业务认证签名的非共享型业务数据,所述第二业务交互数据为存在修改权限标识的共享型业务数据。进一步地,目标用户终端可以是
涉及到多个领域的业务终端,目标用户终端可以是手机、平板电脑、笔记本电脑以及可穿戴
智能设备等,在此不作限定。业务认证签名可以是不同的用户终端在进行业务交互或者处
理时添加的用于进行后期的数据溯源或身份信息溯源的签名,该签名可以是数字签名。第
一业务交互数据不用于共享。第二交互业务数据可以用于共享,进一步地,修改权限标识用
于表征共享型业务数据在共享时能够被允许修改哪些数据。例如,修改权限标识XX可以用
于表征共享型业务数据Data在共享时,共享型业务数据Data中的业务数据Data1可以被修
改。
[0084] 步骤S12,确定所述第一业务交互数据和所述第二业务交互数据中对应业务数据集的业务相似度信息,并基于所述对应业务数据集的业务相似度信息确定出所述第一业务
交互数据和所述第二业务交互数据之间对应的且满足预设指标条件的目标业务数据集。
[0085] 例如,第一业务交互数据和第二业务交互数据中的业务数据集可以是一一对应关系。业务相似度信息用于表征不同业务数据集在业务类型、业务需求、业务处理形式等层面
的相似信息,业务相似度信息可以从多个维度实现不同业务数据集之间的综合比较。预设
指标条件可以根据实际业务情况进行灵活选择,在后续进行说明,因此在此不作赘述。
[0086] 步骤S13,基于所述第一业务交互数据中的所述目标业务数据集对所述第二业务交互数据中的所述目标业务数据集进行权限更新处理;对权限更新处理后的所述第二业务
交互数据中的存在目标权限标识的当前共享型业务数据进行汇总以得到待使用业务数据。
[0087] 可以理解,第一业务交互数据和第二业务交互数据中的业务数据集可以是一一对应关系,那么第一业务交互数据和第二业务交互数据中的目标业务数据集也可以是一一对
应关系。这里的权限更新处理可以是对所述第二业务交互数据中的所述目标业务数据集的
数据修改权限进行调整。例如,共享型业务数据在数据修改权限调整之前对应修改权限标
识,共享型业务数据在数据修改权限调整之后对应目标权限标识,目标权限标识和修改权
限标识之间是存在差异的。当前共享性业务数据可以是用于进行后续共享的数据,待使用
业务数据是当前共享型业务数据的汇总数据,待使用业务数据可以在大数据服务器对应的
数据共享平台上发布,从而供多个用户终端共享使用或者修改。
[0088] 可以理解,通过上述步骤S11‑步骤S13,在确定待使用业务数据之前,会首先考虑存在业务认证签名的非共享型业务数据以及存在修改权限标识的共享型业务数据,这样能
够确定出第一业务交互数据和第二业务交互数据之间对应的且满足预设指标条件的目标
业务数据集,进而实现对第二业务交互数据中的目标业务数据集的权限更新处理。如此,在
对当前共享型业务数据进行汇总时,能够考虑数据修改权限的调整,从而实现对当前共享
型业务数据的目标权限标识的实时更新。这样一来,通过更新目标权限标识能够建立针对
当前共享型业务数据的共享保护机制,能够在共享待使用业务数据时,确保待使用业务数
据不会被随意地篡改,从而确保正常的共享业务处理进程,避免处于数据共享状态的用户
终端的数据信息泄露,进而确保数据共享的安全性。
[0089] 接下来将对一些可选实施例进行说明,这些实施例应当理解为示例,不应理解为实现本方案所必不可少的技术特征。
[0090] 在一个可能的实施例中,为了确保业务相似度信息能够准确反应不同业务交互数据之间在业务层面的相似情况,同时避免业务相似度信息占据大数据服务器较多的存储空
间,步骤S12所描述的确定所述第一业务交互数据和所述第二业务交互数据中对应业务数
据集的业务相似度信息,可以步骤S121和步骤S122。
[0091] 步骤S121,确定所述第一业务交互数据中各业务数据集的业务数据特征的特征相似度以及所述第二业务交互数据中各业务数据集的业务数据特征的特征相似度。
[0092] 例如,业务数据特征可以通过预设的特征提取模型进行提取得到,预设的特征提取模型可以是卷积神经网络(卷积神经网络对应的训练过程为现有技术)。业务数据特征可
以通过向量形式进行表示。
[0093] 步骤S122,基于所述第一业务交互数据中各业务数据集的业务数据特征的特征相似度以及所述第二业务交互数据中各业务数据集的业务数据特征的特征相似度,确定所述
第一业务交互数据和所述第二业务交互数据中所述对应业务数据集的相似度融合权重值。
[0094] 例如,相似度融合权重值可以是不同特征相似度对应的融合权重值,所述业务相似度信息包括所述相似度融合权重值。
[0095] 如此设计,通过应用上述步骤S121和步骤S122,能够基于业务数据特征之间的特征相似度确定相似度融合权重值,从基于相似度融合权重值确保业务相似度信息能够准确
反应不同业务交互数据之间在业务层面的相似情况,同时,由于相似度融合权重值是精简
之后的,因而能够避免业务相似度信息占据大数据服务器较多的存储空间。
[0096] 进一步地,步骤S122所描述的确定所述第一业务交互数据和所述第二业务交互数据中所述对应业务数据集的相似度融合权重值可以包括以下至少之一的实施方式。
[0097] 第一种实施方式,基于所述第一业务交互数据中各业务数据集的业务数据特征的特征相似度以及所述第二业务交互数据中各业务数据集的业务数据特征的特征相似度,计
算所述第一业务交互数据和所述第二业务交互数据中所述对应业务数据集的业务数据时
序相似度以确定所述相似度融合权重值。例如,业务数据时序相似度用于表征业务数据集
在时序层面上的相似度。
[0098] 第二种实施方式,基于所述第一业务交互数据中各业务数据集的业务数据特征的特征相似度以及所述第二业务交互数据中各业务数据集的业务数据特征的特征相似度,计
算所述第一业务交互数据和所述第二业务交互数据中所述对应业务数据集的业务数据特
征的相似度融合系数以确定所述相似度融合权重值。例如,相似度融合系数可以根据预设
的特征提取模型中的模型参数确定。
[0099] 第三种实施方式,确定所述第一业务交互数据和所述第二业务交互数据中所述对应业务数据集的业务事件标签,基于确定出的业务事件标签以及所述第一业务交互数据和
所述第二业务交互数据中所述对应业务数据集的业务数据特征的特征相似度确定所述相
似度融合权重值。例如,业务事件标签用于表征不同业务数据集的不同业务事件信息。
[0100] 在实际应用时,在应用上述三种确定相似度融合权重值的方式时,可以择一应用,也可以同时选择多个进行应用,在同时选择多个进行应用时,可以对确定出的相似度融合
权重值进行均值计算以确定出最终的相似度融合权重值。这样能够灵活地确定相似度融合
权重值,从而确保上述实施方式能够在不同的业务场景下使用。
[0101] 在一些示例中,步骤S12所描述的基于所述对应业务数据集的业务相似度信息确定出所述第一业务交互数据和所述第二业务交互数据之间对应的且满足预设指标条件的
目标业务数据集,可以包括步骤S120:对所述第一业务交互数据和所述第二业务交互数据
中所述对应业务数据集按照业务相似度信息的相似度评价值的由大到小的顺序进行排序。
例如,相似度评价值可以根据确定业务相似度信息所参考的相关数据和信息进行确定,相
似度评价值可以用于表征业务相似度信息的可信度或者置信度。
[0102] 进一步地,可以通过如下方式之一从排序后的所述对应业务数据集中确定出所述目标业务数据集。
[0103] (1)按顺序选取设定数量的所述对应业务数据集作为所述目标业务数据集。例如,设定数量可以预先设置,在此不作限定。
[0104] (2)按顺序选取设定比例的所述对应业务数据集作为所述目标业务数据集。例如,设定比例可以预先设置,在此不作限定。
[0105] (3)将业务相似度信息对应的相似度融合权重值小于第一预定权重值的所述对应业务数据集确定为所述目标业务数据集。
[0106] 例如,第一预定权重值可以预先设置,在此不作限定。第一预定权重值可以是动态权重值。
[0107] (4)按顺序将业务相似度信息对应的相似度融合权重值小于第二预定权重值的所述对应业务数据集中包括的各对应业务数据集按照预设迭代次数进行迭代更新,基于迭代
更新结果确定所述目标业务数据集。
[0108] 例如,第二预定权重值可以预先设置,在此不作限定。第二预定权重值可以是静态权重值。迭代更新可以是对业务数据集进行数据扩充。预设迭代次数根据实际业务需求进
行选择,在此不作限定。
[0109] (5)基于所述对应业务数据集的累计业务数据时序相似度的变化曲线选取所述目标业务数据集。
[0110] 例如,变化曲线可以将累计的业务数据时序相似度按照时序先后顺序进行拟合得到。
[0111] 可以理解的是,基于上述五种确定目标业务数据集,能够确保目标业务数据集的灵活确定,从而保证在不同的业务场景下可以选择合适的方式来确定目标业务数据集,进
而实现后续的业务数据共享。
[0112] 以上五种方式可以根据实际应用情况进行进一步改进或者优化,下面仅针对上述的第四种方式、第五种方式进行进一步说明,对于其他方式,本领域技术人员可以基于上述
内容进行毫无疑义的推导。
[0113] 进一步地,在上述的第四种方式中,按顺序将业务相似度信息对应的相似度融合权重值小于第二预定权重值的所述对应业务数据集中包括的各对应业务数据集按照预设
迭代次数进行迭代更新,基于迭代更新结果确定所述目标业务数据集,可以包括以下步骤
(41)‑步骤(43)。
[0114] (41)确定与业务相似度信息对应的相似度融合权重值小于第二预定权重值的所述对应业务数据集中包括的各对应业务数据集的业务相似度信息对应的迭代更新次数,其
中,业务相似度信息对应的相似度融合权重值对应的相似度融合权重值越小,对应的迭代
更新次数越大。
[0115] (42)按照确定的迭代更新次数对业务相似度信息对应的相似度融合权重值小于第二预定权重值的所述对应业务数据集中包括的各对应业务数据集进行迭代更新。
[0116] (43)对迭代更新后的所述对应业务数据集按照数据集时效性权重由小到大的顺序进行排序,以得到所述目标业务数据集。
[0117] 例如,数据集时效性权重用于表征业务数据集在时序上的准确性,数据集时效性权重越大,表明业务数据集的数据准确性的持续时间越长,能够适用于更多业务场景。
[0118] 进一步地,在上述的第五种方式中,基于所述对应业务数据集的累计业务数据时序相似度的变化曲线选取所述目标业务数据集,可以包括步骤(51)‑步骤(54)。
[0119] (51)按顺序选取设定数量的所述对应业务数据集,并计算所述设定数量的所述对应业务数据集的第一业务数据时序相似度,其中,所述设定数量为预先确定的最小匹配数。
[0120] (52)按顺序选取设定数量加一的所述对应业务数据集,并计算所述设定数量加一的所述对应业务数据集的第二业务数据时序相似度。
[0121] (53)在确定所述第一业务数据时序相似度和所述第二业务数据时序相似度的相似度差值大于或等于预定相似度差值时,将所述设定数量的所述对应业务数据集确定为所
述目标业务数据集。
[0122] (54)在确定所述第一业务数据时序相似度和所述第二业务数据时序相似度的相似度差值小于所述预定相似度差值时,重复执行选取比前一次选取数量多一个的所述对应
业务数据集,直到后选取出的所述对应业务数据集的业务数据时序相似度与前一次选取出
的所述对应业务数据集的业务数据时序相似度的差值大于或等于所述预定相似度差值,并
将前一次选取出的所述对应业务数据集确定为所述目标业务数据集。
[0123] 在实际实施时,发明人发现,为了确保权限更新能够适配后续可能出现的多种业务需求和多种业务场景,需要对业务交互数据进行深度分析,为此,步骤S13所描述的基于
所述第一业务交互数据中的所述目标业务数据集对所述第二业务交互数据中的所述目标
业务数据集进行权限更新处理的步骤,可以包括步骤S131‑步骤S133。
[0124] 步骤S131,使用数据列表清单表示所述第一业务交互数据中的所述目标业务数据集中包括的每一个业务数据集,将数据列表清单表示的各业务数据集组成第一数据列表特
征矩阵,对所述第一数据列表特征矩阵进行矩阵元素修正处理及矩阵结构变换处理,以得
到第一目标矩阵。
[0125] 例如,数据列表清单可以是预先配置的一种用于进行业务数据集表示的列表清单,数据列表清单能够实现对业务数据集的精简化表示,从而在确保业务数据集的数据保
真度的前提下尽可能减少对大数据服务器的存储空间的占用。数据列表特征矩阵可以通过
对数据列表清单进行特征提取得到。矩阵元素修正处理可以是对数据列表特征矩阵中的矩
阵元素进行冗余数据的剔除以确保数据列表特征矩阵的精简性。矩阵结构变换处理可以确
保目标矩阵能够直接被大数据服务器使用。
[0126] 步骤S132,使用数据列表清单表示所述第二业务交互数据中的所述目标业务数据集中包括的每一个业务数据集,将数据列表清单表示的各业务数据集组成第二数据列表特
征矩阵,对所述第二数据列表特征矩阵进行矩阵元素修正处理及矩阵结构变换处理,以得
到第二目标矩阵。
[0127] 步骤S133,基于所述第一目标矩阵对所述第一业务交互数据中的所述目标业务数据集进行数据使用权限更新,以得到第一已更新业务数据;基于所述第二目标矩阵以及所
述第一已更新业务数据对所述第二业务交互数据中的所述目标业务数据集进行数据使用
权限更新。
[0128] 例如,数据使用权限更新可以根据目标业务数据集的使用记录进行。
[0129] 可以理解,通过执行上述步骤S131‑步骤S133,能够对业务交互数据进行深度分析,进而通过数据列表清单实现对业务数据集的精简化表示,并实现数据列表特征矩阵的
处理,这样可以基于目标矩阵实现目标业务数据集的数据使用权限更新,如此,能够确保权
限更新适配后续可能出现的多种业务需求和多种业务场景。
[0130] 进一步地,步骤S133所描述的基于所述第一目标矩阵对所述第一业务交互数据中的所述目标业务数据集进行数据使用权限更新,以得到第一已更新业务数据,进一步包括:
判断所述第一业务交互数据中的各所述目标业务数据集对应的第一目标矩阵的矩阵特征
描述值是否处于第一权限更新描述值阈值范围内;将第一目标矩阵处于所述第一权限更新
描述值阈值范围内的目标业务数据集的第一目标矩阵的矩阵特征描述值设为选定数值,维
持其他目标业务数据集的第一目标矩阵的矩阵特征描述值不变,以得到所述第一已更新业
务数据。例如,矩阵特征描述值用于对不同的目标矩阵以及不同的矩阵特征进行区分。第一
权限更新描述值阈值范围、选定数值可以根据实际情况进行配置,在此不作更多说明。
[0131] 更进一步地,基于所述第二目标矩阵以及所述第一已更新业务数据对所述第二业务交互数据中的所述目标业务数据集进行数据使用权限更新,可以通过以下实施方式a或
实施方式b实现。
[0132] 实施方式a,判断所述第二业务交互数据中的各所述目标业务数据集对应的第二目标矩阵的矩阵特征描述值与第一设定描述值的和是否处于第二权限更新描述值阈值范
围内,其中,所述第一设定描述值为所述第一业务交互数据中对应的目标业务数据集所对
应的第一目标矩阵的矩阵特征描述指与设定权限安全指数的乘积;将第二目标矩阵与所述
第一设定描述值的和处于所述第二权限更新描述值阈值范围内的目标业务数据集的第二
目标矩阵设为选定数值,维持其他目标业务数据集的第二目标矩阵的矩阵特征描述值不
变,以得到第二已更新业务数据。
[0133] 实施方式b,将所述第二业务交互数据中的各所述目标业务数据集对应的第二目标矩阵的矩阵特征描述值与第二设定描述值的乘积作为所述目标业务数据集的第二目标
矩阵,以得到第二已更新业务数据,其中,所述第二设定描述值为所述第一业务交互数据中
对应的目标业务数据集所对应业务数据时序相似度和历史时序相似度均值的差与所述第
一业务交互数据中对应的目标业务数据集所对应业务数据时序相似度的比值。
[0134] 如此,可以通过不同的实施方式实现对目标业务数据集的数据使用权限更新,从而确保数据使用权限的更新能够与后续的共享业务高度匹配。
[0135] 在实际实施过程中,步骤S13所描述的对权限更新处理后的所述第二业务交互数据中的存在目标权限标识的当前共享型业务数据进行汇总以得到待使用业务数据,可以通
过包括以下之一的汇总方式实现。当然,在具体实施时,并不限于以下的业务数据汇总方
式。
[0136] 第一种业务数据汇总方式,采用确定业务数据时序相似度的方式对所述存在目标权限标识的当前共享型业务数据进行汇总以得到所述待使用业务数据。
[0137] 第二种业务数据汇总方式,采用确定相似度融合系数的方式对所述存在目标权限标识的当前共享型业务数据进行汇总以得到所述待使用业务数据。
[0138] 第三种业务数据汇总方式,采用共享数据安全校验模型所述存在目标权限标识的当前共享型业务数据进行汇总以得到所述待使用业务数据。
[0139] 例如,共享数据安全校验模型可以是分类器或者其他机器学习模型,在此不作限定。
[0140] 第四种业务数据汇总方式,将所述存在目标权限标识的当前共享型业务数据中包括的进行了所述权限更新处理后的业务数据集的矩阵特征描述值与未进行所述权限更新
处理前的业务数据集的矩阵特征描述值进行比较,通过对选取进行了所述权限更新处理后
的业务数据集的矩阵特征描述值与未进行所述权限更新处理前的业务数据集的矩阵特征
描述值相似度差值最小的矩阵特征描述值与未进行所述权限更新处理前的业务数据集的
矩阵特征描述值求平均来确定所述存在目标权限标识的当前共享型业务数据的矩阵特征
描述值,以得到所述待使用业务数据。
[0141] 这样一来,在实际应用时,可以采用上述的任一一种业务数据汇总方式实现当前共享型业务数据的汇总,如此,增加了本方案的易用性,削弱了业务数据的汇总对某种业务
处理场景或者某种业务处理方式的依赖性。
[0142] 在上述基础上,在第三种业务数据汇总方式中,采用共享数据安全校验模型所述存在目标权限标识的当前共享型业务数据进行汇总以得到所述待使用业务数据,可以包括
以下步骤S21‑步骤S25。
[0143] 步骤S21,通过所述共享数据安全校验模型将当前共享型业务数据划分为若干个业务数据段集合;其中,每个业务数据段集合包含多个业务数据段。
[0144] 步骤S22,基于所述当前共享型业务数据的第一共享校验指标,得到所述业务数据段的第二共享校验指标;其中,所述第一共享校验指标是利用历史异常共享记录得到的。
[0145] 步骤S23,针对至少一个所述业务数据段集合:分别以至少一个业务数据段的第二共享校验指标为参考指标,利用预设指标提取算法获取所述至少一个业务数据段的最佳校
验指标;并利用所述至少一个业务数据段的最佳校验指标,确定得到所述业务数据段集合
内其他所述业务数据段的最佳校验指标。
[0146] 步骤S24,基于所述业务数据段的所述第二共享校验指标和所述最佳校验指标,确定对应所述业务数据段的目标共享校验指标。
[0147] 步骤S25,通过所述目标共享校验指标对应的校验指标聚类结果将所述业务数据段进行拼接,得到所述待使用业务数据;其中,所述待使用业务数据由多个用户终端共享。
[0148] 可以理解,通过上述步骤S21‑步骤S25,能够在汇总当前共享型业务数据时对共享校验指标进行分析,从而确保在后续对待使用业务数据进行使用时不会出现数据安全性问
题。
[0149] 更进一步地,步骤S23所描述的利用所述至少一个业务数据段的最佳校验指标,确定得到所述业务数据段集合内其他所述业务数据段的最佳校验指标,可以包括:基于所述
至少一个业务数据段的业务数据段数量和在所述业务数据段集合中的相对序列位置,选择
对应的校验指标确定方式;利用所述校验指标确定方式对所述至少一个业务数据段的最佳
校验指标进行确定,得到所述业务数据段集合内其他所述业务数据段的最佳校验指标。
[0150] 在实际应用过程中,在实施步骤S11所描述的获取对目标用户终端进行业务数据采集后所得到的第一业务交互数据和第二业务交互数据的步骤之前,该方法还可以包括以
下内容。
[0151] 获取对目标用户终端进行业务数据采集后所得到的第三业务交互数据,其中,所述第三业务交互数据为包括至少两种数据共享持续时长的共享型业务数据。
[0152] 将所述第三业务交互数据转换成至少两个所述第二业务交互数据,其中,不同的所述第二业务交互数据中包括有不同的数据共享持续时长。
[0153] 确定所述第一业务交互数据和所述第二业务交互数据中对应业务数据集的业务相似度信息,并基于所述对应业务数据集的业务相似度信息确定出所述第一业务交互数据
和所述第二业务交互数据之间对应的且满足预设指标条件的目标业务数据集包括:对于所
述第一业务交互数据和任一个所述第二业务交互数据均执行以下操作:确定所述第一业务
交互数据和所述第二业务交互数据中所述对应业务数据集的业务相似度信息,并基于所述
对应业务数据集的业务相似度信息确定出所述第一业务交互数据和所述第二业务交互数
据之间对应的且满足预设指标条件的目标业务数据集。
[0154] 基于所述第一业务交互数据中的所述目标业务数据集对所述第二业务交互数据中的所述目标业务数据集进行权限更新处理包括:对于所述第一业务交互数据和任一个所
述第二业务交互数据均执行以下操作:基于所述第一业务交互数据中的所述目标业务数据
集对所述第二业务交互数据中的所述目标业务数据集进行权限更新处理。
[0155] 对权限更新处理后的所述第二业务交互数据中的存在目标权限标识的当前共享型业务数据进行汇总以得到待使用业务数据包括:对于所述第一业务交互数据和任一个所
述第二业务交互数据均执行以下操作:对权限更新处理后的所述第二业务交互数据中的存
在目标权限标识的当前共享型业务数据进行汇总以得到待使用业务数据。
[0156] 在得到所述待使用业务数据之后,所述方法还包括:将得到的至少两个待使用业务数据进行汇总,以得到与所述第三业务交互数据对应的待使用业务数据。
[0157] 如此设计,基于上述步骤所描述的内容,能够将包括至少两种数据共享持续时长的共享型业务数据考虑在内,从而实现对待使用业务数据的多样化处理,以满足后续不同
的业务需求。
[0158] 在一个可替换的实施例中,在步骤S11‑步骤S13的基础上,还可以包括以下步骤S14:对所述待使用业务数据进行备份。如此设计,在待使用业务数据处于共享状态时,若由
于某些用户终端的操作失误导致待使用业务数据出现部分丢失或者被篡改,能够基于备份
的待使用业务数据继续进行共享,避免后续的共享业务的停滞。
[0159] 在一个可替换的实施例中,在步骤S25中,通过所述目标共享校验指标对应的校验指标聚类结果将所述业务数据段进行拼接,得到所述待使用业务数据,进一步可以包括以
下步骤a‑步骤d所描述的内容。
[0160] 步骤a,基于所述目标共享校验指标对应的校验指标聚类结果确定所述业务数据段的数据段拼接列表以及各数据段拼接指示标签。
[0161] 步骤b,在基于所述数据段拼接列表确定出所述业务数据段中包含有动态拼接标签目录的情况下,根据所述业务数据段的动态拼接标签目录下的数据段拼接指示标签以及
所述业务数据段的动态拼接标签目录下的数据段拼接指示标签的标签关联系数,确定所述
业务数据段的与所述动态拼接标签目录对应的静态拼接标签目录下的各数据段拼接指示
标签与所述业务数据段的动态拼接标签目录下的各数据段拼接指示标签之间的数据段拼
接权重。
[0162] 步骤c,基于所述数据段拼接权重将所述业务数据段的与所述动态拼接标签目录对应的静态拼接标签目录下的与动态拼接标签目录下的数据段拼接指示标签之间满足拼
接条件的数据段拼接指示标签调整到相应的动态拼接标签目录下;其中,在所述业务数据
段的当前与所述动态拼接标签目录对应的静态拼接标签目录下包含有多个数据段拼接指
示标签的情况下,根据所述业务数据段的动态拼接标签目录下的数据段拼接指示标签以及
所述业务数据段的动态拼接标签目录下的数据段拼接指示标签的标签关联系数,确定所述
业务数据段的当前与所述动态拼接标签目录对应的静态拼接标签目录下的各数据段拼接
指示标签之间的数据段拼接权重,并根据所述各数据段拼接指示标签之间的数据段拼接权
重对当前与所述动态拼接标签目录对应的静态拼接标签目录下的各数据段拼接指示标签
进行聚类;根据所述业务数据段的动态拼接标签目录下的数据段拼接指示标签以及所述业
务数据段的动态拼接标签目录下的数据段拼接指示标签的标签关联系数为上述聚类获得
的每一类数据段拼接指示标签设置标签调整等级,并将所述每一类数据段拼接指示标签调
整到所述标签调整等级所对应的动态拼接标签目录下。
[0163] 步骤d,基于所述动态拼接标签目录下所对应的数据段拼接指示标签筛选出待拼接的业务数据段,将所述待拼接的业务数据段按照时序先后顺序进行拼接,得到所述待使
用业务数据。
[0164] 如此设计,通过上述步骤a‑步骤d,能够将业务数据段的数据段拼接列表以及各数据段拼接指示标签考虑在内,从而实现对数据段拼接指示标签的二次分配和调整,从而确
保动态拼接标签目录中的数据段拼接指示标签能够与实际的共享业务场景相匹配,这样一
来,基于动态拼接标签目录下所对应的数据段拼接指示标签所筛选出的待拼接的业务数据
段能够与后续的共享业务场景相匹配,从而确保拼接得到的待使用业务数据能够被共享业
务场景下的所有用户终端所使用。
[0165] 图4是根据本发明的一些实施例所示的一种示例性基于大数据和云计算的数据处理装置140的框图,所述基于大数据和云计算的数据处理装置140可以包括以下功能模块。
[0166] 数据获取模块141,用于获取对目标用户终端进行业务数据采集后所得到的第一业务交互数据和第二业务交互数据,其中,所述第一业务交互数据为存在业务认证签名的
非共享型业务数据,所述第二业务交互数据为存在修改权限标识的共享型业务数据。
[0167] 数据确定模块142,用于确定所述第一业务交互数据和所述第二业务交互数据中对应业务数据集的业务相似度信息,并基于所述对应业务数据集的业务相似度信息确定出
所述第一业务交互数据和所述第二业务交互数据之间对应的且满足预设指标条件的目标
业务数据集。
[0168] 数据汇总模块143,用于基于所述第一业务交互数据中的所述目标业务数据集对所述第二业务交互数据中的所述目标业务数据集进行权限更新处理;对权限更新处理后的
所述第二业务交互数据中的存在目标权限标识的当前共享型业务数据进行汇总以得到待
使用业务数据。
[0169] 可以理解,上述装置实施例的描述可以参阅图3所示的方法实施例的描述。
[0170] 基于上述同样的发明构思,还提供了一种系统实施例,进一步描述如下。
[0171] A1.一种基于大数据和云计算的数据处理系统,包括互相之间通信的大数据服务器和用户终端;其中,所述大数据服务器用于:
[0172] 获取对目标用户终端进行业务数据采集后所得到的第一业务交互数据和第二业务交互数据,其中,所述第一业务交互数据为存在业务认证签名的非共享型业务数据,所述
第二业务交互数据为存在修改权限标识的共享型业务数据;
[0173] 确定所述第一业务交互数据和所述第二业务交互数据中对应业务数据集的业务相似度信息,并基于所述对应业务数据集的业务相似度信息确定出所述第一业务交互数据
和所述第二业务交互数据之间对应的且满足预设指标条件的目标业务数据集;
[0174] 基于所述第一业务交互数据中的所述目标业务数据集对所述第二业务交互数据中的所述目标业务数据集进行权限更新处理;对权限更新处理后的所述第二业务交互数据
中的存在目标权限标识的当前共享型业务数据进行汇总以得到待使用业务数据。
[0175] 可以理解,上述系统实施例的描述可以参阅图3所示的方法实施例的描述。
[0176] 需要理解的是,针对上述内容没有进行名词解释的技术术语,本领域技术人员可以根据上述所公开的内容进行前后推导毫无疑义地确定其所指代的含义,例如针对一些
值、系数、权重等术语,本领域技术人员可以根据前后的逻辑关系进行推导和确定,这些数
值的取值范围可以根据实际情况进行选取,例如0 1,又例如1 10,再例如50 100,在此均不
~ ~ ~
作限定,本领域技术人员可以根据上述已公开的内容毫无意义对一些预设的、基准的、预定
的、设定的以及目标的技术特征/技术术语进行确定。对于一些未作解释的技术特征术语和
前后限定的术语(例如上一个、前一个、后一个、下一个),本领域技术人员完全能够基于前
后文的逻辑关系进行合理地、毫无疑义地推导,从而清楚、完整地实施上述技术方案。因此
上述内容对于本领域技术人员而言是清楚完整的。应当理解,本领域技术人员基于上述公
开的内容对未作解释的技术术语进行推导和分析的过程是基于本申请所记载的内容进行
的,因此上述内容并不是对整体方案的创造性的评判。
[0177] 上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅作为示例,而并不构成对本申请的限定。虽然此处并没有明确说明,本领域技术人员可以对本
申请进行各种修改、改进和修正。该类修改、改进和修正在本申请中被建议,所以该类修改、
改进、修正仍属于本申请示范实施例的精神和范围。
[0178] 同时,本申请使用了特定术语来描述本申请的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本申请至少一个实施例相关的某一特征、结构或特点。因
此,应强调并注意的是,本说明书中在不同部分两次或多次提到的“一实施例”或“一个实施
例”或“一替代性实施例”并不一定是指同一实施例。此外,本申请的至少一个实施例中的某
些特征、结构或特点可以进行适当的组合。
[0179] 另外,本领域普通技术人员可以理解的是,本申请的各个方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的
组合,或对他们任何新的和有用的改进。相应地,本申请的各个方面可以完全由硬件执行、
可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上
硬件或软件均可以被称为“单元”、“组件”或“系统”。此外,本申请的各方面可以表现为位于
至少一个计算机可读介质中的计算机产品,所述产品包括计算机可读程序编码。
[0180] 计算机可读信号介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等
等、或合适的组合形式。计算机可读信号介质可以是除计算机可读存储介质之外的任何计
算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或
传输供使用的程序。位于计算机可读信号介质上的程序编码可以通过任何合适的介质进行
传播,包括无线电、电缆、光纤缆线、RF、或类似介质、或任何上述介质的组合。
[0181] 本申请各方面执行所需的计算机程序码可以用一种或多种程序语言的任意组合编写,包括面向对象程序设计,如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、
VB.NET,Python等,或类似的常规程序编程语言,如"C"编程语言,Visual Basic,Fortran 
2003,Perl,COBOL 2002,PHP,ABAP,动态编程语言如Python,Ruby和Groovy或其它编程语
言。所述程式设计编码可以完全在用户计算机上执行、或作为独立的软体包在用户计算机
上执行、或部分在用户计算机上执行部分在远程计算机执行、或完全在远程计算机或服务
器上执行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域
网络(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或
作为服务使用如软件即服务(SaaS)。
[0182] 此外,除非申请专利范围中明确说明,本申请所述处理元件和序列的顺序、数位字母的使用、或其他名称的使用,并非用于限定本申请流程和方法的顺序。尽管上述披露中通
过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说
明的目的,附加的申请专利范围并不仅限于披露的实施例,相反,申请专利范围旨在覆盖所
有符合本申请实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可
以通过硬件装置实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或
行动装置上安装所描述的系统。
[0183] 同样应当理解的是,为了简化本申请揭示的表述,从而帮助对至少一个发明实施例的理解,前文对本申请实施例的描述中,有时会将多种特征归并至一个实施例、附图或对
其的描述中。但是,这种披露方法幷不意味着本申请对象所需要的特征比权利要求中提及
的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。