跨DIKW模态类型化隐私信息资源差分保护方法与系统转让专利

申请号 : CN202110075080.7

文献号 : CN112818386B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 段玉聪樊珂

申请人 : 海南大学

摘要 :

本发明提供了一种跨DIKW模态类型化隐私信息资源差分保护方法与系统,该方法包括:当接收到资源查询请求时,确定待保护的隐私信息资源;在该隐私信息资源对应的信息轨迹图中选取各个候选资源路径;确定每个候选资源路径中的每个信息资源的支持度,以获得每个候选资源路径中的路径支持度;依据每个候选资源路径中的路径支持度在候选资源路径中确定目标资源路径;基于目标资源路径中的各个信息资源获得资源查询请求对应的目标信息资源;将目标信息资源发送至资源请求用户,以实现对隐私信息资源的保护。应用本发明提供的跨DIKW模态类型化隐私信息资源差分保护方法,能够对隐私信息资源进行有效的保护,提高了资源的安全性。

权利要求 :

1.一种跨DIKW模态类型化隐私信息资源差分保护方法,其特征在于,包括:当接收到资源查询请求时,确定所述资源查询请求对应的隐私信息资源;

在所述隐私信息资源对应的信息轨迹图中选取出各个候选资源路径;每个所述候选资源路径包含至少一个信息模态的信息资源;每个所述候选资源路径中的各个所述信息资源的频繁度满足预先设置的差分保护条件;

确定每个所述候选资源路径中的每个所述信息资源的支持度;其中,每个所述信息资源的支持度表征该信息资源包含与所述隐私信息资源相关联的隐私信息的信息量;

基于每个所述候选资源路径中的每个所述信息资源的支持度,获得每个所述候选资源路径中的路径支持度;

依据每个所述候选资源路径中的路径支持度在各个所述候选资源路径中确定出目标资源路径;

基于所述目标资源路径中的各个信息资源,获得所述资源查询请求对应的目标信息资源;

将所述目标信息资源发送至所述资源查询请求对应的资源请求用户,以实现对所述隐私信息资源的保护。

2.根据权利要求1所述的方法,其特征在于,所述在所述隐私信息资源对应的信息轨迹图中选取出各个候选资源路径,包括:获取所述隐私信息资源对应的信息轨迹图;

确定所述信息轨迹图中的各个信息路径;

获取每个所述信息路径中的每个信息资源的频繁度;

对于每个所述信息路径,若该信息路径中的各个所述信息资源的频繁度满足预先设置的差分保护条件,则将该信息路径作为候选资源路径。

3.根据权利要求1所述的方法,其特征在于,所述确定每个所述候选资源路径中的每个所述信息资源的支持度,包括:确定每个所述信息资源的类型;该类型为关联融合型或非关联融合型;

基于每个所述信息资源的类型确定每个所述信息资源对应的支持度计算方式;

按每个所述信息资源的类型对应的支持度计算方式计算得到每个所述信息资源的支持度。

4.根据权利要求1所述的方法,其特征在于,所述依据每个所述候选资源路径中的路径支持度在各个所述候选资源路径中确定出目标资源路径,包括:确定所述资源查询请求对应的资源请求用户;

响应于所述资源请求用户满足预先设置的隐私保护条件,将各个所述候选资源路径中路径支持度最小的候选资源路径确定为目标资源路径。

5.根据权利要求1所述的方法,其特征在于,基于所述目标资源路径中的各个信息资源,获得所述资源查询请求对应的目标信息资源,包括:获取所述目标资源路径中的各个信息资源;

按所述目标资源路径对应的融合方式对各个所述信息资源进行融合,获得所述资源查询请求对应的目标信息资源。

6.一种跨DIKW模态类型化隐私信息资源差分保护系统,其特征在于,包括:接收单元,用于当接收到资源查询请求时,确定所述资源查询请求对应的隐私信息资源;

选取单元,用于在所述隐私信息资源对应的信息轨迹图中选取出各个候选资源路径;

每个所述候选资源路径包含至少一个信息模态的信息资源;每个所述候选资源路径中的各个所述信息资源的频繁度满足预先设置的差分保护条件;

第一确定单元,用于确定每个所述候选资源路径中的每个所述信息资源的支持度;其中,每个所述信息资源的支持度表征该信息资源包含与所述隐私信息资源相关联的隐私信息的信息量;

第一执行单元,用于基于每个所述候选资源路径中的每个所述信息资源的支持度,获得每个所述候选资源路径中的路径支持度;

第二确定单元,用于依据每个所述候选资源路径中的路径支持度在各个所述候选资源路径中确定出目标资源路径;

第二执行单元,用于基于所述目标资源路径中的各个信息资源,获得所述资源查询请求对应的目标信息资源;

发送单元,用于将所述目标信息资源发送至所述资源查询请求对应的资源请求用户,以实现对所述隐私信息资源的保护。

7.根据权利要求6所述的系统,其特征在于,所述选取单元,包括:第一获取子单元,用于获取所述隐私信息资源对应的信息轨迹图;

第一确定子单元,用于确定所述信息轨迹图中的各个信息路径;

第二获取子单元,用于获取每个所述信息路径中的每个信息资源的频繁度;

执行子单元,用于对于每个所述信息路径,若该信息路径中的各个所述信息资源的频繁度满足预先设置的差分保护条件,则将该信息路径作为候选资源路径。

8.根据权利要求6所述的系统,其特征在于,所述第一确定单元,包括:第二确定子单元,用于确定每个所述信息资源的类型;该类型为关联融合型或非关联融合型;

第三确定子单元,用于基于每个所述信息资源的类型确定每个所述信息资源对应的支持度计算方式;

计算子单元,用于按每个所述信息资源的类型对应的支持度计算方式计算得到每个所述信息资源的支持度。

9.根据权利要求6所述的系统,其特征在于,所述第二确定单元,包括:第四确定子单元,用于确定所述资源查询请求对应的资源请求用户;

第五确定子单元,用于响应于所述资源请求用户满足预先设置的隐私保护条件,将各个所述候选资源路径中路径支持度最小的候选资源路径确定为目标资源路径。

10.根据权利要求6所述的系统,其特征在于,所述第二执行单元,包括:第三获取子单元,用于获取所述目标资源路径中的各个信息资源;

融合子单元,用于按所述目标资源路径对应的融合方式对各个所述信息资源进行融合,获得所述资源查询请求对应的目标信息资源。

说明书 :

跨DIKW模态类型化隐私信息资源差分保护方法与系统

技术领域

[0001] 本发明涉及数据处理技术领域,特别涉及一种跨DIKW模态类型化隐私信息资源差分保护方法与系统。

背景技术

[0002] 随着科学技术的发展,互联网技术也得到了长足发展,由此也产生了大量的内容资源,人们可以利用内容资源实现各种学习任务或生产任务,然而,由于资源量的不断增
加,人们难以从海量的资源中提取出有效信息。
[0003] 目前,为了能够从海量的资源中提取出有效信息,通常会采用DIKW体系对资源进行梳理,即采用DIKW体系将资源划分为数据资源、信息资源和知识资源,从而提高了资源的
利用效率。
[0004] 然而,一些资源往往包含着用户敏感的隐私数据,在利用DIKW体系处理资源以实现各种任务时,包含隐私数据的资源经过处理后变得隐蔽,使得难以对处理后的资源进行
有效的隐私保护,容易导致隐私数据泄漏。

发明内容

[0005] 本发明所要解决的技术问题是提供一种跨DIKW模态类型化隐私信息资源差分保护方法,能够保障隐私数据的安全性。
[0006] 本发明还提供了一种跨DIKW模态类型化隐私信息资源差分保护系统,用以保证上述方法在实际中的实现及应用。
[0007] 一种跨DIKW模态类型化隐私信息资源差分保护方法,包括:
[0008] 当接收到资源查询请求时,确定所述资源查询请求对应的隐私信息资源;
[0009] 在所述隐私信息资源对应的信息轨迹图中选取出各个候选资源路径;每个所述候选资源路径包含至少一个信息模态的信息资源;每个所述候选资源路径中的各个所述信息
资源的频繁度满足预先设置的差分保护条件;
[0010] 确定每个所述候选资源路径中的每个所述信息资源的支持度;其中,每个所述信息资源的支持度表征该信息资源包含与所述隐私信息资源相关联的隐私信息的信息量;
[0011] 基于每个所述候选资源路径中的每个所述信息资源的支持度,获得每个所述候选资源路径中的路径支持度;
[0012] 依据每个所述候选资源路径中的路径支持度在各个所述候选资源路径中确定出目标资源路径;
[0013] 基于所述目标资源路径中的各个信息资源,获得所述资源查询请求对应的目标信息资源;
[0014] 将所述目标信息资源发送至所述资源查询请求对应的资源请求用户,以实现对所述隐私信息资源的保护。
[0015] 上述的方法,可选的,所述在所述隐私信息资源对应的信息轨迹图中选取出各个候选资源路径,包括:
[0016] 获取所述隐私信息资源对应的信息轨迹图;
[0017] 确定所述信息轨迹图中的各个信息路径;
[0018] 获取每个所述信息路径中的每个信息资源的频繁度;
[0019] 对于每个所述信息路径,若该信息路径中的各个所述信息资源的频繁度满足预先设置的差分保护条件,则将该信息路径作为候选资源路径。
[0020] 上述的方法,可选的,所述确定每个所述候选资源路径中的每个所述信息资源的支持度,包括:
[0021] 确定每个所述信息资源的类型;该类型为关联融合型或非关联融合型;
[0022] 基于每个所述信息资源的类型确定每个所述信息资源对应的支持度计算方式;
[0023] 按每个所述信息资源的类型对应的支持度计算方式计算得到每个所述信息资源的支持度。
[0024] 上述的方法,可选的,所述依据每个所述候选资源路径中的路径支持度在各个所述候选资源路径中确定出目标资源路径,包括:
[0025] 确定所述资源查询请求对应的资源请求用户;
[0026] 响应于所述资源请求用户满足预先设置的隐私保护条件,将各个所述候选资源路径中路径支持度最小的候选资源路径确定为目标资源路径。
[0027] 上述的方法,可选的,基于所述目标资源路径中的各个信息资源,获得所述资源查询请求对应的目标信息资源,包括:
[0028] 获取所述目标资源路径中的各个信息资源;
[0029] 按所述目标资源路径对应的融合方式对各个所述信息资源进行融合,获得所述资源查询请求对应的目标信息资源。
[0030] 一种跨DIKW模态类型化隐私信息资源差分保护系统,包括:
[0031] 接收单元,用于当接收到资源查询请求时,确定所述资源查询请求对应的隐私信息资源;
[0032] 选取单元,用于在所述隐私信息资源对应的信息轨迹图中选取出各个候选资源路径;每个所述候选资源路径包含至少一个信息模态的信息资源;每个所述候选资源路径中
的各个所述信息资源的频繁度满足预先设置的差分保护条件;
[0033] 第一确定单元,用于确定每个所述候选资源路径中的每个所述信息资源的支持度;其中,每个所述信息资源的支持度表征该信息资源包含与所述隐私信息资源相关联的
隐私信息的信息量;
[0034] 第一执行单元,用于基于每个所述候选资源路径中的每个所述信息资源的支持度,获得每个所述候选资源路径中的路径支持度;
[0035] 第二确定单元,用于依据每个所述候选资源路径中的路径支持度在各个所述候选资源路径中确定出目标资源路径;
[0036] 第二执行单元,用于基于所述目标资源路径中的各个信息资源,获得所述资源查询请求对应的目标信息资源;
[0037] 发送单元,用于将所述目标信息资源发送至所述资源查询请求对应的资源请求用户,以实现对所述隐私信息资源的保护。
[0038] 上述的系统,可选的,所述选取单元,包括:
[0039] 第一获取子单元,用于获取所述隐私信息资源对应的信息轨迹图;
[0040] 第一确定子单元,用于确定所述信息轨迹图中的各个信息路径;
[0041] 第二获取子单元,用于获取每个所述信息路径中的每个信息资源的频繁度;
[0042] 执行子单元,用于对于每个所述信息路径,若该信息路径中的各个所述信息资源的频繁度满足预先设置的差分保护条件,则将该信息路径作为候选资源路径。
[0043] 上述的系统,可选的,所述第一确定单元,包括:
[0044] 第二确定子单元,用于确定每个所述信息资源的类型;该类型为关联融合型或非关联融合型;
[0045] 第三确定子单元,用于基于每个所述信息资源的类型确定每个所述信息资源对应的支持度计算方式;
[0046] 计算子单元,用于按每个所述信息资源的类型对应的支持度计算方式计算得到每个所述信息资源的支持度。
[0047] 上述的系统,可选的,所述第二确定单元,包括:
[0048] 第四确定子单元,用于确定所述资源查询请求对应的资源请求用户;
[0049] 第五确定子单元,用于响应于所述资源请求用户满足预先设置的隐私保护条件,将各个所述候选资源路径中路径支持度最小的候选资源路径确定为目标资源路径。
[0050] 上述的系统,可选的,所述第二执行单元,包括:
[0051] 第三获取子单元,用于获取所述目标资源路径中的各个信息资源;
[0052] 融合子单元,用于按所述目标资源路径对应的融合方式对各个所述信息资源进行融合,获得所述资源查询请求对应的目标信息资源。
[0053] 与现有技术相比,本发明包括以下优点:
[0054] 本发明提供了一种跨DIKW模态类型化隐私信息资源差分保护方法及系统,该方法包括:当接收到资源查询请求时,确定所述资源查询请求对应的隐私信息资源;在所述隐私
信息资源对应的信息轨迹图中选取出各个候选资源路径;每个所述候选资源路径包含至少
一个信息模态的信息资源;每个所述候选资源路径中的各个所述信息资源的频繁度满足预
先设置的差分保护条件;确定每个所述候选资源路径中的每个所述信息资源的支持度;其
中,每个所述信息资源的支持度表征该信息资源包含与所述隐私信息资源相关联的隐私信
息的信息量;基于每个所述候选资源路径中的每个所述信息资源的支持度,获得每个所述
候选资源路径中的路径支持度;依据每个所述候选资源路径中的路径支持度在各个所述候
选资源路径中确定出目标资源路径;基于所述目标资源路径中的各个信息资源,获得所述
资源查询请求对应的目标信息资源;将所述目标信息资源发送至所述资源查询请求对应的
资源请求用户,以实现对所述隐私信息资源的保护。应用本发明提供的跨DIKW模态类型化
隐私信息资源差分保护方法,能够在隐私信息资源对应的信息轨迹图中选取出频繁度满足
预先设置的差分保护条件的候选资源路径,进而依据各个候选资源路径的路径支持度确定
出目标资源路径,基于目标资源路径确定目标信息资源,能够对隐私信息资源进行有效的
保护,提高了数据的安全性。

附图说明

[0055] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本
发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据
提供的附图获得其他的附图。
[0056] 图1为本发明提供的一种跨DIKW模态类型化隐私信息资源差分保护方法的方法流程图;
[0057] 图2为本发明提供的一种选取出各个候选资源路径的过程的流程图;
[0058] 图3为本发明提供的一种示例性的信息轨迹图;
[0059] 图4为本发明提供的一种确定信息资源的支持度的过程的流程图;
[0060] 图5为本发明提供的一种跨DIKW模态类型化隐私信息资源差分保护系统的结构示意图。

具体实施方式

[0061] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于
本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他
实施例,都属于本发明保护的范围。
[0062] 在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有
明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没
有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过
程、方法、物品或者设备中还存在另外的相同要素。
[0063] 本发明可用于众多通用或专用的计算装置环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器装置、包括以上任何装置或设备
的分布式计算环境等等。
[0064] 本发明实施例提供了一种跨DIKW模态类型化隐私信息资源差分保护方法,可以应用于电子设备,所述方法的方法流程图如图1所示,具体包括:
[0065] S101:当接收到资源查询请求时,确定所述资源查询请求对应的隐私信息资源。
[0066] 本发明实施例提供的方法中,该隐私信息资源可以为待保护的隐私资源。
[0067] S102:在所述隐私信息资源对应的信息轨迹图中选取出各个候选资源路径;每个所述候选资源路径包含至少一个信息模态的信息资源;每个所述候选资源路径中的各个所
述信息资源的频繁度满足预先设置的差分保护条件。
[0068] 本发明实施例提供的方法中,信息资源可以记录人类的行为,用于挖掘、分析、表达两个实体之间的交互关系,实体既可以是另一个人,也可以是客观存在的事物。信息资源
与人类的某个特定目的相关,透过目的去推断两个实体之间的关系,信息资源最简单的表
达形式为“has_a”,用R(E1,E2)表示实体E1和E2之间的关系。
[0069] 具体的,该信息轨迹图可以为预先构建的,也可以为在确定该资源查询请求对应的隐私信息资源之后构建的。
[0070] 其中,每个信息资源由至少一个数据模态的数据资源构成。
[0071] 可选的,依据每条信息路径中的各个信息资源的支持度、频繁度以及数量等参数,在各个信息路径中确定出候选资源路径。
[0072] 其中,该差分保护条件可以为该路径的每个信息资源的频繁度中的最大频繁度和最小频繁度的差值小于预先设置的阈值,频繁度可以为信息资源的出现次数或展示次数。
[0073] 可选的,信息轨迹图中包含多条信息路径,对于每条信息路径,该信息路径中的每个信息资源的维度各不相同,每个信息路径中的信息资源的数量可以相同或不同。
[0074] S103:确定每个所述候选资源路径中的每个所述信息资源的支持度;其中,每个所述信息资源的支持度表征该信息资源包含与所述隐私信息资源相关联的隐私信息的信息
量。
[0075] 本发明实施例提供的方法中,信息资源的支持度越大,则说明该信息资源中包含与隐私信息资源相关联的隐私信息的信息量越大,即,若资源请求用户获得该信息资源,则
隐私信息资源的隐私暴露可能性和隐私暴露程度越高。
[0076] 其中,可以确定每个信息资源的类型,该类型为关联融合型或非关联融合型;可以依据每个信息资源的类型确定相应的支持度计算方式,以计算得到该信息资源的支持度。
[0077] S104:基于每个所述候选资源路径中的每个所述信息资源的支持度,获得每个所述候选资源路径中的路径支持度。
[0078] 本发明实施例提供的方法中,可以将每个候选资源路径中的每个信息资源的支持度进行求和,获得该候选资源路径的路径支持度,即,候选资源路径中的路径支持度可以为
该候选资源路径中的各个信息资源的支持度的总和。
[0079] 也就是说,可以根据已有的信息轨迹图,以及计算得到的所有不同信息资源的支持度,计算不同路径上包含的信息资源的总提供支持度:
[0080]
[0081] 其中,AllDegreeSupport(Infoi)可以为候选信息路径的路径支持度,DegreeSupport(Infoi)可以为该候选信息路径中的每个信息资源的支持度。
[0082] S105:依据每个所述候选资源路径中的路径支持度在各个所述候选资源路径中确定出目标资源路径。
[0083] 本发明实施例提供的方法中,可以先确定资源查询请求对应的资源请求用户的隐私权限信息,基于该隐私权限信息在各个候选资源路径中的支持度在各个资源路径中确定
出目标资源路径,该目标资源路径可以为路径支持度最小的资源路径。
[0084] 可选的,该目标资源路径也可以为各个候选资源路径中资源数量满足预设的标准数量的资源路径。
[0085] 可以对比不同信息路径的路径支持度,对各个路径支持度进行排序,路径支持度最大的路径说明通过关联其所包含的信息资源,能更加轻易地识别出隐私信息资源,但与
此同时有更大的可能泄露隐私,若已确定隐私遭到泄露,这些信息资源关联起来能泄露最
多的隐私,隐私暴露程度最高;同理,最小的路径支持度对应信息路径最难推理得到隐私信
息资源,同时也意味着隐私暴露程度最小,因此,可以确定资源请求用户的隐私权限信息,
在各个候选资源路径中选取与该隐私权限信息相对应的目标资源路径。
[0086] S106:基于所述目标资源路径中的各个信息资源,获得所述资源查询请求对应的目标信息资源。
[0087] 本发明实施例提供的方法中,可以将该目标资源路径中的各个信息资源进行融合,得到隐私信息资源对应的目标信息信息资源。
[0088] S107:将所述目标信息资源发送至所述资源查询请求对应的资源请求用户,以实现对所述隐私信息资源的保护。
[0089] 本发明提供了一种跨DIKW模态类型化隐私信息资源差分保护方法,该方法包括:当接收到资源查询请求时,确定所述资源查询请求对应的隐私信息资源;在所述隐私信息
资源对应的信息轨迹图中选取出各个候选资源路径;每个所述候选资源路径包含至少一个
信息模态的信息资源;每个所述候选资源路径中的各个所述信息资源的频繁度满足预先设
置的差分保护条件;确定每个所述候选资源路径中的每个所述信息资源的支持度;其中,每
个所述信息资源的支持度表征该信息资源包含与所述隐私信息资源相关联的隐私信息的
信息量;基于每个所述候选资源路径中的每个所述信息资源的支持度,获得每个所述候选
资源路径中的路径支持度;依据每个所述候选资源路径中的路径支持度在各个所述候选资
源路径中确定出目标资源路径;基于所述目标资源路径中的各个信息资源,获得所述资源
查询请求对应的目标信息资源;将所述目标信息资源发送至所述资源查询请求对应的资源
请求用户,以实现对所述隐私信息资源的保护。应用本发明提供的跨DIKW模态类型化隐私
信息资源差分保护方法,能够在隐私信息资源对应的信息轨迹图中选取出频繁度满足预先
设置的差分保护条件的候选资源路径,进而依据各个候选资源路径的路径支持度确定出目
标资源路径,基于目标资源路径确定目标信息资源,能够对隐私信息资源进行有效的保护,
提高了数据的安全性。
[0090] 本发明实施例提供的方法中,基于上述的实施过程,具体的,S102提及的在隐私信息资源对应的信息轨迹图中选取出各个候选资源路径的过程,如图2所示,具体包括:
[0091] S201:获取所述隐私信息资源对应的信息轨迹图。
[0092] 本发明实施例提供的方法中,该信息轨迹图可以为预先构建的,也可以为在确定该资源查询请求对应的隐私信息资源之后构建的。
[0093] 其中,可以获取与该隐私信息资源相关联的信息资源集合,依据该信息资源集合中的每个信息资源的支持度由小至大的顺序选取多个信息资源,基于已选取的多个信息资
源构建信息轨迹图;也可以获取与该隐私信息资源相关联信息资源集合,依据该信息资源
集合中的各个信息资源构建信息轨迹图。
[0094] 在构建信息轨迹图之后,还可以根据已经计算得到的所有不同信息资源的支持度进行从大到小排序,选择提供支持度排前列的若干个信息资源进行关联融合,并重新画出
对应关联的信息轨迹图;此时若已设定选取不同信息资源进行关联融合的个数为n(n≥1),
选择排序靠前的n个信息资源构成对应信息路径,是能达到识别隐私信息资源的最优解,即
在已设定信息资源个数的前提下,选择排序靠前、提供支持度大的信息资源能更迅速准确
地识别出隐私信息资源,可根据这个方法进行信息轨迹图的重新规划,完成识别目标的最
优路径选择,但此种关联方法可能会暴露隐私;为减少隐私暴露的可能性或减少隐私暴露
度,可以选择排序靠后的n个信息资源构成对应信息路径,此时该路径所含资源的提供支持
度小,较难识别出隐私信息资源。
[0095] 具体的,下面对构建信息轨迹图的过程进行介绍:
[0096] 信息资源集合中包含多个不同维度的信息资源,每个信息资源由至少一个数据资源组成,其中,可以将信息资源用InformationDIK进行表示,可以将数据资源用DataDIK表示,
可以将隐私信息资源用InfoPurpose表示。
[0097] 若干个不同维度的信息资源联系起来可以描述一个隐私信息资源,单个信息资源通常有着比单个数据资源更长的篇幅,并且与单个数据资源相比能够为描述隐私信息资源
提供更多的支持。
[0098] 假设单个信息资源是由(Data1,Data2,...,DataN)关联得到的信息资源之一,且数据和信息资源表现形式相同,InformationDIK≥Datai(i=1,2,...,N),为描述隐私信息资
源提供的支持DegreeSupport(InformationDIK)≥DegreeSupport(Datai);其中,DegreeSupport为
支持度,若该条信息资源与隐私信息资源有关,则有:
[0099]
[0100] 若该条信息资源与隐私信息资源无关,则有:
[0101]
[0102] 其中,整个关联联系得到隐私信息资源的过程可通过构建信息轨迹图进行表达,将一条信息资源看作一个轨迹点,多个不同信息资源即多个轨迹点,轨迹点之间通过“与”
关系和“或”关系进行关联连接,最终成功表达隐私信息资源。
[0103] 可选的,可以对频繁出现的相同信息资源进行出现频数统计,频数统计值可作为识别隐私信息资源的重要依据,将统计结果添加进对应的信息资源,使得所有频繁出现的
信息资源都含有频数统计值。
[0104] 为了更加清晰、准确地描述识别出隐私信息资源,默认分析时存在的信息资源都是对隐私信息资源InfoPurpose不同维度的解释或相同维度的不同解释,相同的信息资源只
在信息轨迹图中出现一次。
[0105] 假如不同信息资源信息资源:是从若干个不同维度来描述该隐私信息资源的,对它们进行关联融合以达到隐私信息资源识别的过程就是对(IA,IB,...)施加
“与”关系,或关联方式中明确提出某些维度之间是“与”关系,“与”关系也表示这些若干个
不同维度的信息资源是同时出现的。
[0106] 若在某个维度上有不同的解释,例如IA维度上有多个解释,IA:,或关联方式中明确提出某些维度之间是“或”关系,若对它们进行关联融合以达到隐私信
息资源识别的过程就是对这些信息资源施加“或”关系,并在最终达到隐私信息资源识别的
关联融合中选择存在“或”关系的特定一条或多条信息资源与其他维度的资源进行关联。
[0107] 在信息轨迹图中表示“与”关系的方法是,轨迹点表示不同维度信息资源(IA,IB,...),它们作为不同层级的节点直接进行相连,即假如(IA,IB,IC)是不同维度信息资
源,且这些维度无偏序关系,即明显的、不可改变的前后关系,则将它们关联的方法是IA与
IB相连,IB与IC相连,或者改变次序,将IA与IC相连,IC与IB相连,有多种连接方式,但关联
结果并无差异,此时关联得到的信息轨迹图也可看作是一种无方向图,即不同轨迹点之间
的连线无方向;若这些不同的维度本身存在偏序关系,即某些维度的前后关系已经确定,则
连接方式基本固定,关系在前的维度必然只能出现在关系在后的维度之前,例如存在偏序
关系IB→IC(→表示先后关系,箭头指出方向在前,箭头指向方向在后),则(IA,IB,IC)进行
关联融合的可能方式有:IA→IB→IC,IB→IC→IA,或IB→IA→IC,三种关联结果可能并无
差异,此时关联得到的信息轨迹图也可看作是一种有方向图,即不同轨迹点之间的连线有
方向;若关联方式中明确提出某些维度之间是“与”关系,例如关联方式明确指出相同维度
的不同解释之间是“与”关系,可将这些不同解释作为新的维度加入具体信息轨迹图进行连
接,也可将这些同一维度的不同解释直接融合,将融合后的结果作为一个维度为达到描述
特殊目标进行具体关联,该目标指的是融合得到的信息资源。
[0108] 不同维度信息资源存在偏序关系的可能情形有:(1)存在规则说明某些维度具有偏序关系;(2)对维度进行逻辑理解,发现某些维度之间本身具有偏序关系,将这些维度按
某些具体逻辑进行排序,相关逻辑包括由大到小、从全面到细节、从开始到结尾等,例如为
达到描述一个具体事件的目的,存在事件起因、经过、结果三个维度,逻辑理解后将三个维
度进行偏序关系处理,即事件起因→经过→结果,处理后再进行相关关联融合,可更好、更
准确地进行关联融合,防止产生因果倒置、表述不清造成关联结果错误等不良后果。
[0109] 在信息轨迹图中表示“或”关系的方法是,轨迹点表示相同维度的不同信息资源(IA1,IA2,...),它们作为信息轨迹图中相同层级的不同可能节点,关联融合的方式是与其
他不同层级的节点进行连接,同一层级的节点互不相连,表示该维度上只选取一个解释;相
同维度的不同信息资源不存在先后关系,可随意排列;若关联方式中明确提出某些维度之
间是“或”关系,例如关联方式明确指出某些不同维度之间是“或”关系,可将这些不同维度
的解释作为一个同级的“或”关系整体,按照如上“或”关系关联方法进行具体实践。
[0110] 若在关联融合过程中不同维度的信息资源同时存在“与”关系和“或”关系,可将存在“或”关系的维度资源看作一个整体与其他维度资源进行“与”关系的连接,连接完成后再
对“或”关系中同一层级的不同解释与其他层级的维度解释进行分别连接,即若存在不同信
息资源信息资源:,括号内表示同属于IB维度的三种不同解释,不
同解释之间存在“或”关系,不同维度之间存在“与”关系,且并无设定的偏序关系,则构成的
一种信息轨迹图,如图3所示,节点表示信息资源,节点间的连线表示不同信息资源之间产
生关联,遍历所有维度的信息资源后将它们关联融合可得到不同的结果result,本例中共
有三种可能路径,代表三种可能融合结果或描述目标,这三种融合结果均与最终隐私信息
资源有关,但相关度可能存在差异,即准确推理出隐私信息资源的可能性不同;由于无设定
的偏序关系,形成的信息轨迹图无方向,且不同维度的解释之间的连接方式也无顺序设定,
关联结果与连接顺序无关,只与关联融合的具体信息资源有关。
[0111] S202:确定所述信息轨迹图中的各个信息路径。
[0112] 其中,信息轨迹图中包含多个信息路径,将已有的不同信息资源按照以上方法完成相应信息轨迹图后,可清晰地观察出不同路径所代表的信息资源和最终的关联结果。
[0113] S203:获取每个所述信息路径中的每个信息资源的频繁度。
[0114] 其中,信息资源的频繁度可以为该信息资源的出现次数或该信息资源相关联的第二信息资源的出现次数。
[0115] 可选的,信息资源的频繁度可以通过几个方面进行确定,第一方面,该信息资源的频繁度可以为该信息资源的出现次数;另一方面,不同信息资源同时出现且互相关联的频
繁度frequency(IA,IB,...),进一步表现了不同信息资源之间的关联程度,假如信息资源
IA和IB的关联频繁度frequency(IA,IB)很高,分析关联时出现IA,则有很大可能同时出现
IB,且信息资源IA和IB连接关联的可能性很高,可通过这种方法在具体关联融合过程中补
充并不完整的信息资源,并且使关联融合结果更加准确,有更高的可能推理出隐私信息资
源。
[0116] 在具体关联融合得到隐私信息资源过程中,有着“与”关系的不同维度信息资源往往同时出现且互相关联,而有着“或”关系的信息资源与其他资源进行关联融合、同时出现
的次数却经常不同,在此基础上进行的不同资源间关联频繁度统计主要关注“或”关系的信
息资源与其他资源关联融合情况,此时不同信息资源同时出现且互相关联的频繁度
frequency(IA,IB,...)可以直接统计不同关联情形的出现次数,作为能够更加准确地推理
出隐私信息资源的重要影响因素。
[0117] S204:对于每个所述信息路径,若该信息路径中的各个所述信息资源的频繁度满足预先设置的差分保护条件,则将该信息路径作为候选资源路径。
[0118] 本发明实施例提供的方法中,该差分保护条件可以为:其中,该差分保护条件可以为该路径的每个信息资源的频繁度中的最大频繁度和最小频繁度的差值小于预先设置的
阈值,频繁度可以为信息资源的出现次数或展示次数,也就是说,候选资源路径中的各个信
息资源的频繁度比较均匀,从而能够有效的掩藏差异信息资源的具体内容,进而能够保护
隐私信息资源。
[0119] 本发明实施例提供的方法中,基于上述的实施过程,具体的,所述确定每个所述候选资源路径中的每个所述信息资源的支持度,如图4所示,包括:
[0120] S401:确定每个所述信息资源的类型;该类型为关联融合型或非关联融合型。
[0121] 信息资源方面可将与隐私信息资源有关的信息资源信息资源分为内涵信息资源InfoCon和外延信息资源InfoEx,用符号表示为隐私信息资源InfoPurpose:
[0122] 其中,内涵信息资源和外延信息资源均不重复,进行划分后每一个信息资源都可作为一个描述维度;对内涵信息资源和外延资源进行关联融合,可唯一确定隐私信息资源;
接下来介绍内涵信息资源InfoCon和外延信息资源InfoEx划分过程:
[0123] 由于信息可由数据关联得出,因此可将信息资源分为两大类,一类是由已有的内涵数据资源和外延数据资源互相关联融合得到信息资源,可称为关联融合型信息资源
InfoFusion;另一类信息资源不是由已有的内涵数据资源和外延数据资源互相关联融合得到
的,可称为非关联融合型信息资源InfoNoFusion;具体的,信息资源InformationDIK:<
InfoFusion,InfoNoFusion>。
[0124] 其中,关联融合型信息资源可以由三种类型组成,关联融合型信息资源可以表示为:InfoFusion:,可以包括以下三种:
[0125] (1)纯内涵信息资源InfoFPureCon,是指完全由已有的不同内涵数据资源DataCon关联融合得到的信息资源,是说明解释不同内涵数据资源所代表的属性的含义及其对应属性值
的相关信息资源,属性包括稳定的、不容易改变的静态属性,以及属性值可能会随着时间等
因素改变而发生改变的动态属性;或是信息资源中直接存在内涵数据资源的信息资源。
[0126] (2)纯外延信息资源InfoFPureEx,是指完全由不同外延数据资源DataEx关联融合得到的信息资源,或是能反映、说明解释外延数据资源具体含义的信息资源;或是信息资源中
直接存在外延数据资源的信息资源。
[0127] (3)复合内涵外延信息资源InfoFMix,是指由内涵数据资源DataCon和外延数据资源DataEx混合关联融合得到的信息资源,或是同时解释说明内涵数据资源和外延数据资源具
体含义的信息资源;或是信息资源中直接同时存在内涵数据资源和外延数据资源的信息资
源;可选的,此类信息资源可认为同时是内涵和外延信息资源。
[0128] 本发明实施例中提供的方法中,确定某个信息资源属于关联融合型信息资源InfoFusion的可行的方式包括:
[0129] 1、遍历并初步理解信息资源的具体内容,与已有的内涵数据资源和外延数据资源进行匹配对应,若存在对应匹配,则该信息资源属于关联融合型信息资源InfoFusion,进一步
确认匹配对应得到的信息片段即数据资源的内涵外延分类情况:若从同一个信息资源中匹
配得到的数据资源数量为1,则该数据资源属于内涵数据资源或外延数据资源,原信息资源
便属于纯内涵信息资源或纯外延信息资源;若从同一个信息资源中匹配得到的数据资源数
量大于或等于2,则当所有数据资源均属于内涵资源时,原信息资源才属于纯内涵信息资
源,同理当所有数据资源均属于外延资源时,原信息资源才属于纯外延信息资源,当一部分
数据资源属于内涵资源,另一部分属于外延资源时,原信息资源属于复合内涵外延信息资
源;对信息资源进行初步理解的目的是减少匹配失误,去除因为信息资源的记录存在对应
内容,但该对应记录并不代表对应的内涵外延数据资源等情形,使信息资源的分类匹配更
加准确,能够更好、更准确地推理出隐私信息资源。
[0130] 2、对信息资源的具体内容进行深层次理解,主要针对信息资源的记录无法明显、直接地与内涵数据资源和外延数据资源产生匹配对应的情形,即该信息资源无片段与内涵
数据资源或外延数据资源相同。在此情形下对信息资源的具体内容进行深层次理解,分析
出该信息资源是否是对内涵数据资源或外延数据资源的内容进行具体解释说明,或是否与
内涵数据资源或外延数据资源的内容有关,若以上有一个问题的答案为“是”,则该信息资
源被分类到关联融合型信息资源InfoFusion的具体对应类中;若两个问题的答案都为“否”,
则该信息资源被分类到非关联融合型信息资源InfoNoFusion中,等待进一步分类。
[0131] 其中,对于被分类到非关联融合型信息资源InfoNoFusion中的信息资源,也可将信息资源分成两类:非关联的内涵信息资源InfoNCon、非关联的外延信息资源InfoNEx;非关联融
合型信息资源可以表示为:InfoNoFusion:
[0132] 本发明实施例中提供的方法中,确定信息资源属于非关联的内涵信息资源InfoNCon的可行的方式包括:
[0133] A、对信息资源进行理解分析,发现其中某个信息片段含有对隐私信息资源属性的说明,例如,信息资源=“隐私信息资源InfoPurpose的一种属性是Attribute1”,则该信息资源
可被分类为非关联的内涵信息资源InfoNCon;与此同时,由于该信息资源属于非关联融合型
信息资源,即信息片段中不与任何已有的内涵数据资源和外延数据资源对应匹配,此时可
将信息资源中的属性片段提出,即上例出现的Attribute1,补充到内涵数据资源中,使描述
隐私信息资源的数据资源和信息资源更加完善,形成良性循环。
[0134] B、将介绍解释该隐私信息资源的非关联融合型信息资源中频繁出现的某些InfoNoFusion,即频繁项作为属性或属性解释,划分为非关联的内涵信息资源InfoNCon;例如在
介绍隐私信息资源=“小明的年龄”时,分析统计已有的非关联融合型信息资源,发现发现
频繁出现非关联融合型信息资源InfoNoFusion=“小明已经毕业了”,可将其作为隐私信息资
源的属性,划分进非关联的内涵信息资源InfoNCon;并且由于信息资源本身被记录可被当做
数据资源,因此划分进非关联的内涵信息资源的信息资源可作为新的内涵数据资源进行补
充和关联融合。
[0135] 其中,确定信息资源属于非关联的外延信息资源InfoNEx的具体方法如下:
[0136] 对非关联融合型信息资源进行理解,若该非关联融合型信息资源为:①具有非关联的内涵信息资源InfoNCon所提及的、隐私信息资源InfoPurpose的特有属性的其他目标实体
相关信息资源;②能回答、解释非关联的内涵信息资源InfoNCon所提及的,或与隐私信息资
源本身、属性或其适用范围的相关非关联融合型信息资源;③与非关联的内涵信息资源
InfoNCon所提及的,或与隐私信息资源本身有关的,或隐私信息资源所反映的特有属性的相
关统计信息资源,如出现总数、出现占比等,则该非关联融合型信息资源InfoNoFusion属于
InfoNEx;例如隐私信息资源=“小明的年龄”的外延,就包括:④与小明同龄的人相关信息资
源;⑤对InfoNoFusion=“小明已经毕业了”的进一步解释,如“高中毕业”;⑥与隐私信息资源
本身有关的统计信息资源,如“与小明同届毕业的总人数为230人”。
[0137] 针对那些无法被分类为非关联的内涵信息资源InfoNCon及其对应InfoNEx的非关联融合型信息资源来说,不含有作为属性和对应属性值的说明,也不是频繁出现的频繁项,因
此无法被分类进非关联的内涵信息资源InfoNCon类别,同时也不是与非关联的内涵信息资
源InfoNCon有关、对应的解释说明,但该非关联融合型信息资源是与隐私信息资源InfoPurpose
有关的信息资源,可为识别出隐私信息资源提供一定的支持,因此可将这部分非关联融合
型信息资源归类为InfoNEx;也即,InfoNEx包括两部分,一部分是对应、解释非关联的内涵信
息资源InfoNCon的非关联融合型信息资源,一部分是与已有的非关联的内涵信息资源
InfoNCon无关,但与隐私信息资源有关的InfoNEx。
[0138] 综上,已有的信息资源可大致分为内涵信息资源InfoCon和外延信息资源InfoEx两类;其中,内涵信息资源和外延信息资源可以分别表示为:InfoCon:InfoNCon>;InfoEx:
[0139] 若在不知隐私信息资源的前提下将已有的一个或多个不同的内涵信息资源关联起来,有很大可能将隐私信息资源InfoPurpose推理出来,同理将外延信息资源关联起来进行
比对,找出共同点,通过共同点可进行对隐私信息资源的大致猜测,若已有的信息资源个数
足量、相同点也足够清晰具体,则有很大可能将该隐私信息资源和其他隐私信息资源区分
开来,最终识别、确认出该隐私信息资源。
[0140] 若同时已知关于某个隐私信息资源的内涵和外延信息资源,则两类资源关联融合起来,可以更加准确、快速地识别出隐私信息资源,比单单依靠内涵或外延信息资源进行识
别的效率更高,因为外延资源本身就是在内涵资源的概括基础上进行的一种延展,若仅仅
依靠单类资源进行推理识别,所花费的时间、精力等代价很高,效率较低。
[0141] S402:基于每个所述信息资源的类型确定每个所述信息资源对应的支持度计算方式。
[0142] 以下提供计算多个不同的信息资源关联融合为识别出隐私信息资源InfoPurpose,提供的总支持度AllDegreeSupport的大致方法,以及不同种类信息资源的提供支持度
DegreeSupport计算方法,作为一种参考。
[0143] 具体的,不同的信息资源关联融合提供的总支持度AllDegreeSupport计算方法可以为:
[0144] 输入所有与隐私信息资源InfoPurpose有关的不同信息资源以及可能的信息轨迹图,则可以获得同时出现的、用以关联推理出隐私信息资源的多个不同信息资源提供的总
支持度AllDegreeSupport。
[0145] 可以将所有的信息资源进行分类,分为关联融合型信息资源InfoFusion和非关联融合型信息资源InfoNoFusion,再根据具体分类方法进一步分类为具体的内涵和外延资源,将分
类依据和结果进行标记;对于归属于关联融合型信息资源中不同类型的信息资源,可以根
据关联融合型信息资源中信息资源提供支持度计算方法进行计算,得到不同关联融合型信
息资源的支持度;对于归属于非关联融合型信息资源中不同类型的信息资源,可以根据非
关联融合型信息资源中信息资源提供支持度计算方法进行计算,得到不同关联融合型信息
资源的支持度。
[0146] 将不同信息资源关联融合有很大可能推理出隐私信息资源InfoPurpose,若信息轨迹图已确定,但不同路径的具体资源存在差异,此时进行路径的选择目的是找到能较为准
确、快速地识别出隐私信息资源的一系列具体资源,这些具体资源的关联方式已被信息轨
迹图确定。
[0147] S403:按每个所述信息资源的类型对应的支持度计算方式计算得到每个所述信息资源的支持度。
[0148] 本发明实施例提供的方法中,对于类型为关联融合型的信息资源,该信息资源的支持度DegreeSupport(Infoi)的计算方式如下:
[0149] 隐私信息资源的主体与隐私数据资源相同,归属于关联融合型信息资源中的不同信息资源都是由已有的内涵数据资源和外延数据资源互相关联融合得到的,因此首先确定
关联融合型信息资源是由哪些数据资源关联融合得到的,可以将DIKW中数据图和信息图进
行连接,标注出所有的具体数据资源、数据资源的所属类别,以及该数据资源对应的提供支
持度,不同数据资源的具体提供支持度可由数据资源的提供支持度计算方法得到,数据资
源所属类型可以为内涵数据资源或外延数据资源。
[0150] 对关联融合型信息资源中的不同信息资源Infoi(i=1,...,n,n为关联融合型信息资源中信息资源总数)进行资源匹配来源分析,来源有两种,第一种来源为,信息资源
Infoi与数据资源DataDIK存在直接的字面匹配,将此种来源记做R1;第二种来源为:对Infoi
进行深层次理解,存在对内涵数据资源或外延数据资源的内容进行具体解释说明的内容,
或与内涵数据资源DataCon或外延数据资源DataEx的内容有关,将此种来源记做R2;R1和R2可
同时出现,可以用1表示该匹配情况属于此种来源,用0表示该匹配情况不属于此种来源。
[0151] 可以将关联融合型信息资源InfoFusion的记录为:
[0152] Infoi:
[0153] Data2:Concrete Content,DataClassification,DegreeSupport,Resource;
[0154] ...
[0155] Dataq:Concrete Content,DataClassification,DegreeSupport,Resource>。
[0156] 其中,数据资源Data1,Data2,...,Dataq是信息资源Infoi所有的对应匹配数据资源,即信息资源Infoi是由数据资源Data1,Data2,...,Dataq进行关联融合得到的,数据资源
个数为q,Concrete Content是具体数据资源的内容;Data Classification是数据资源的
分类,有两种可能结果,分别是内涵数据资源或外延数据资源;DegreeSupport是该数据资源
的提供支持度;Resource表示分配来源分析,可能结果为R1=0或1,R2=0或1;可以将所有
关联融合型信息资源InfoFusion的格式按此方式进行记录。
[0157] 对关联融合型信息资源InfoFusion中的不同信息资源Infoi进行提供支持度计算,计算公式如下:
[0158]
[0159] F(Datai)=R(Datai)×C(Datai)×DegreeSupport(Datai)   (2)
[0160]
[0161]
[0162] 其中,公式(1)中F(Datai)表示不同来源的对应匹配Datai所能提供的支持度,符号表示不同数据资源关联融合形成信息资源提供的支持度之间的特殊相加,与直接相加符
号“+”存在区别,需要根据实际的关联融合效果进行判定,例如,当关联融合效果好,融合后
的信息资源能够为识别隐私信息资源InfoPurpose提供的支持度DegreeSupport比不同的、未
进行 融 合的 数 据 资源 所能 提 供的 总支 持 度D eg r e eS u pp o r t高 ,即
可由预先设定一个参数值λ,表示融
合后DegreeSupport是原资源提供DegreeSupport的倍数,即:
[0163]
[0164] 当λ≥1时,表示融合效果优异,提供支持度值比单独资源DegreeSupport的总和大;当λ≤1时,表示融合效果一般,提供支持度值比单独资源DegreeSupport的总和小,该参数值λ
可以为预先训练得到。
[0165] 具体的,来源参数R(Datai)是影响支持度的另一个重要因素,表示不同来源对支持度的影响,结果值0≤a,b≤1,且a+b=1,通常情况下认为a≥b,即认为来源中直接字面匹
配比较深层次蕴含可以为识别隐私信息资源InfoPurpose提供更高的支持度;a与b的具体取
值可由人为确定,也可预先经过训练后得到。
[0166] 数据资源参数C(Datai)表示匹配对应数据资源的分类对支持度的影响,结果值0≤α,β≤1,且α+β=1,通常情况下认为α≥β,即认为融合内涵数据资源能够为识别隐私信息
资源提供更高的支持度,α和β的取值与计算数据资源提供支持度中公式所取的值相同,可
由人为确定,也可经过训练后得到。
[0167] 最后,由关联融合型信息资源InfoFusion提供支持度计算公式进行相关计算,得到不同关联融合型信息资源为识别隐私信息资源提供的支持度。
[0168] 本发明实施例提供的方法中,对于类型为关联融合型的信息资源,该信息资源的支持度DegreeSupport(Infoi)的计算方式如下:
[0169] 非关联融合型信息资源InfoNoFusion不是由已有的内涵数据资源和外延数据资源互相关联融合得到的,将非关联融合型信息资源按规则分类为非关联的内涵信息资源
InfoNCon和非关联的外延信息资源InfoNEx。
[0170] 具体的,可以对分类为非关联的内涵信息资源InfoNCon的不同信息资源InfoNConi(i=1,...,m,m为分类为InfoNCon的信息资源总数)进行来源分析,来源有两种,第一种来源
为:某个信息片段直接含有对隐私信息资源属性的说明,将此种来源记做R1;第二种来源
为:频繁出现的某些非关联融合型信息资源,即频繁项,将此种来源记做R2。R1和R2可同时
出现,可以用1表示该匹配情况属于此种来源,用0表示该匹配情况不属于此种来源。
[0171] 对非关联融合型信息资源中的不同非关联的内涵信息资源InfoNConi进行提供支持度计算,计算公式如下:
[0172] DegreeSupport(InfoNConi)=c·f(InfoNConi)+d·g(InfoNConi)
[0173]
[0174]
[0175] 其中,frequency(InfoNConi)表示DataConi作为频繁项出现的频数。
[0176] 其中,c+d=1,c、d分别对应表示来源为R1、R2对描述隐私信息资源所能提供的支持权重,通常情况下来源为R1的InfoNConi对描述隐私信息资源所能提供的支持大于来源为
R2的属性提供支持,因此c>d,在此基础上根据实际设定权重。
[0177] 对分类为非关联的外延信息资源InfoNEx的不同信息资源InfoNExj(j=1,...,p,p为分类为InfoNEx的信息资源总数)进行来源分析,来源有两种,第一种来源为,与InfoNCon、
隐私信息资源InfoPurpose的特有属性相关的非关联融合型信息资源,用于解释说明InfoNCon
等,将此种来源记做R1,并将对应的InfoNCon进行记录;第二种来源为,与InfoNCon,即隐私信
息资源的特有属性无关的非关联融合型信息资源,不含有作为属性和对应属性值的说明,
也不是频繁出现的频繁项,但该非关联融合型信息资源是与隐私信息资源有关的信息资
源,可为识别出隐私信息资源提供一定的支持,将此种来源记做R2;R1和R2不可同时出现,
可以用1表示该匹配情况属于此种来源,用0表示该匹配情况不属于此种来源。
[0178] 对非关联融合型信息资源InfoNoFusion中的不同信息资源InfoNExi进行提供支持度计算,计算公式如下:
[0179] DegreeSupport(InfoNExi)=R1·h(InfoNExi)+R2·k(InfoNExi);
[0180] h(InfoNExi)=ω·DegreeSupport(InfoNConi)。
[0181] 其中,h(InfoNExi)表示来源为R1的信息资源InfoNExi所能提供的支持度,其中ω通常小于1,表示InfoNExi所能提供的支持度与其对应的InfoNConi所能提供的支持度成比例。
[0182] 若来源为R1的信息资源InfoNExi总个数为m,将这m个InfoNExi进行提供支持度进行计算总和操作,总和记为AllDegreeSupport(InfoR1),则有:
[0183]
[0184] 具体的,由非关联融合型信息资源InfoNoFusion提供支持度计算公式进行相关计算,得到不同非关联融合型信息资源为识别隐私信息资源提供的支持度。
[0185] 本发明实施例提供的方法中,基于上述的实施过程,具体的,所述依据每个所述候选资源路径中的路径支持度在各个所述候选资源路径中确定出目标资源路径,包括:
[0186] 确定所述资源查询请求对应的资源请求用户;
[0187] 响应于所述资源请求用户满足预先设置的隐私保护条件,将各个所述候选资源路径中路径支持度最小的候选资源路径确定为目标资源路径。
[0188] 本发明实施例提供的方法中,可以判断该资源请求用户是否满足预先设置的隐私保护条件,该隐私保护条件可以为该资源请求用户的权限信息不满足隐私信息资源的权限
要求,或者资源请求用户不具备该隐私信息资源的权限信息。
[0189] 可选的,在资源请求用户满足隐私保护条件的情况下,可以将各个候选资源路径中路径支持度最小的候选资源路径确定为目标资源路径;在该资源请求用户不满足该隐私
保护条件的情况下,可以将各个候选资源路径中路径支持度最大的候选资源路径确定为目
标资源路径。
[0190] 本发明实施例提供的方法中,基于上述的实施过程,具体的,基于所述目标资源路径中的各个信息资源,获得所述资源查询请求对应的目标信息资源的一种可行的方式,包
括:
[0191] 获取所述目标资源路径中的各个信息资源;
[0192] 按所述目标资源路径对应的融合方式对各个所述信息资源进行融合,获得所述资源查询请求对应的目标信息资源。
[0193] 本发明实施例提供的方法中,基于目标资源路径中的各个信息资源,获得资源查询请求对应的目标信息资源的另一种可行的方式,包括:
[0194] 在该目标资源路径的各个信息资源中按各个信息资源的支持度由小至大的顺序选取预设数目的信息资源;
[0195] 按所述目标资源路径对应的融合方式对已选取的各个信息资源进行融合,得到目标信息资源。
[0196] 在本发明提供的一实施例中,提供了一示例性应用,可以将一些资源关联起来能推理出某些隐私信息,具体如下:
[0197] 存在信息资源Info1=“张三平日里让司机开专车来买油条”,Info2=“张三今日步行来买油条”,Info3=“张三愁眉不展,比不能回家还伤心”,Info4=“让张三比不能回家
还伤心的事是工作不顺利”,将已有的四个信息资源关联融合,可识别得到的隐私信息资源
InfoPurpose=“张三工作不顺利”。
[0198] 在以上例子中,四个信息资源都可为识别隐私信息资源提供一定的支持,但提供支持度存在差别,例如Info1、Info2、Info3所能提供的支持度就比Info4小,若严格按照信
息资源的提供支持度计算方法进行计算,过程如下:
[0199] 若存在DataCon1=“让司机开专车买油条”,DataCon2=“工作不顺利让张三比不能回家还伤心”,对已有资源进行提供支持度计算:
[0200] 步骤一:将所有的信息资源进行分类,则Info1属于关联融合型信息资源InfoFusion中的InfoFPureCon,Info2属于InfoNoFusion中的非关联的外延信息资源
InfoNEx,Info3属于InfoNoFusion中的非关联的外延信息资源InfoNEx,Info4属于关联融
合型信息资源InfoFusion中的InfoFPureCon。
[0201] 步骤二:对归属于关联融合型信息资源InfoFusion中不同类型的信息资源进行提供支持度计算。关联融合型信息资源InfoFusion按记录规则记录为Info1:开专车买油条”,DataCon,10,R1=1,R2=0>;
[0202] Info4:
[0203] 设定a=0.6,b=0.4,α=0.6,β=0.4,根据公式计算得到的提供支持度为DegreeSupport(Info1)=aα*20=0.6*0.6*10=3.6,DegreeSupport(Info4)=aα*20=
0.6*0.6*30=10.8。
[0204] 步骤三:对归属于InfoNoFusion中不同类型的信息资源进行提供支持度计算;已知来源为R1的其他信息资源InfoNExi总个数为5,支持度总和AllDegreeSupport(InfoR1)
=40;Info2和Info3的来源为R2,根据公式计算得到的提供支持度为DegreeSupport
(Info2)=1/5*40=8,DegreeSupport(Info3)=1/5*100=8。
[0205] 步骤四:若已有的路径为Info1→Info2→Info3→Info4,则该路径总提供支持度为AllDegreeSupport=3.6+8+8+10.8=30.4。
[0206] 步骤五:将不同信息资源的提供支持度进行大小排序,结果为Info4>Info2=Info3>Info1,此时若已设定选取不同信息资源进行关联融合的个数为3,选择排序前3的信
息资源构成对应信息路径Info4→Info2→Info3,是在已设定信息资源个数的前提下更迅
速准确地识别出隐私信息资源InfoPurpose的最优路径选择,但此种关联方法可能会暴露
隐私。
[0207] 为减少隐私暴露的可能性或减少隐私暴露度,可以选择排序靠后的3个信息资源构成对应信息路径Info1→Info3→Info2,此时该路径所含资源的提供支持度小,较难识别
出隐私信息资源。
[0208] 本发明实施例提供的方法中,信息层面的差分隐私问题主要产生于资源请求者对信息资源的不同掌握情况,通过对这些具体掌握情况进行细致的分析,可以推理出隐私信
息资源InfoPurpose,或猜测推理出差异信息资源。但不同资源掌握情况在信息层面与数据层
面存在不同,信息层面差分不仅包括增添或缺少单条或多条信息资源直接导致资源掌握情
况不同,此种情况主要存在于不同维度信息资源之间;还由于信息资源篇幅较长,常由不同
数据资源关联融合形成,因此信息差分存在改变、增添或缺少单条信息资源内部不同信息
片段导致的资源掌握差异,此种情况主要存在于相同维度信息资源之间。
[0209] 若对于资源请求者对同一个隐私信息资源的相关信息资源掌握情况不同,通过分析处理差异内容,希望能够达成以下两个目标:第一、识别确认出该特定隐私信息资源;第
二、猜测推理出该差异信息资源;具体掌握情况差异方式如下:
[0210] 在不同维度信息资源之间存在一条信息资源的差异的情况下,可分别计算存在一条信息资源的差异情况下的两种关联方案对应的总支持度,将包含该条差异信息资源所对
应关联方案的总支持度记为AllDegreeSupport1,将缺少该条差异信息资源所对应关联方案的
总支持度记为AllDegreeSupport2,两结果进行相差计算,得到的结果即为该条差异信息资源
为识别出隐私信息资源提供的支持度DegreeSupport(InformationDIK),即AllDegreeSupport1‑
AllDegreeSupport3=DegreeSupport(InformationDIK)。
[0211] 或者将DegreeSupport(InformationDIK)与AllDegreeSupport1之比记为支持度占比Proportion(InformationDIK),表示该差异信息资源所提供的的支持度占关联方案总支持
度的比率。若关联方案中存在的不同信息资源个数为N,当Proportion(InformationDIK)>1/
N时,说明该差异信息资源可以为识别隐私信息资源提供较大的支撑,缺少这一条差异信息
资源对识别隐私信息资源影响较大,同时推理出该差异信息资源的难度也增加,若该条信
息资源被泄露,则隐私暴露程度严重;当Proportion(InformationDIK)≤1/N时,说明该差异
信息资源可以为识别隐私信息资源提供支撑较少,缺少这一条差异信息资源对识别隐私信
息资源影响不是很大,同时推理出该差异信息资源的难度增加程度较小,若该条信息资源
被泄露,则隐私暴露程度较不严重。
[0212] 在不同维度信息资源之间存在两条及其以上的差异信息资源的情况下,同样进行以上提到的总支持度差值计算,差值结果DegreeSupport(InformationDIK)说明多条差异
信息资源进行关联后一共可以为识别隐私信息资源提供的支撑,此时多条差异信息资源被
视为一个整体,无法具体区分各个不同的信息资源的具体内容和提供支持度。
[0213] 在差异信息资源为多条的情况下,可以记差异信息资源的总条数为m,其中,支持度占比为:
[0214] Proportion(InformationDIK)=DegreeSupport(InformationDIK)/AllDegree Support1。
[0215] 在此情况下,当Proportion(InformationDIK)>m/N时,说明多条差异信息资源可以为识别隐私信息资源提供较大的支撑,缺少这些差异信息资源对识别隐私信息资源影响
较大,同时推理出差异信息资源的难度也增加,若这些差异信息资源被泄露,则隐私暴露程
度严重;当Proportion(InformationDIK)≤m/N时,说明这些差异信息资源可以为识别隐私
信息资源提供支撑较少,缺少这些差异信息资源对识别隐私信息资源影响不是很大,同时
推理出该差异信息资源的难度较小,若该条信息资源被泄露,则隐私暴露程度较不严重。
[0216] 在相同维度信息资源之间存在一条信息片段差异的情况下,即对一条完整的信息资源中某一片段内容掌握程度不同,当这条完整的信息资源属于关联融合型信息资源
InfoFusion,且存在差异的信息片段是已有的DataCon和DataEx,或说明解释DataCon和
DataEx的内容时,需要对去除信息片段后的信息资源重新进行提供支持度计算,得到
NewDegreeSupport(InformationDIK),进行支持度差值计算:
[0217] DegreeSupport(InformationDIK)‑NewDegreeSupport(InformationDIK)=DegreeSupport(Part)。
[0218] 其中,得到的结果即为该信息片段为识别出隐私信息资源提供的支持度,进一步计算该信息片段与原信息资源的提供支持度比值Proportion(Part):
[0219] DegreeSupport(Part)/DegreeSupport(InformationDIK)=Proportion(Part)。
[0220] 具体的,若Proportion(Part)<34%,认为该信息片段对识别隐私信息资源提供支撑较少,缺少这些信息片段对识别隐私信息资源影响不是很大,若该信息片段被泄露,则
隐私暴露程度较不严重;若Proportion(Part)>67%,认为该信息片段对识别隐私信息资
源提供支撑较大,缺少这些信息片段对识别隐私信息资源影响较大,若该信息片段被泄露,
则隐私暴露程度较严重;34%≤Proportion(Part)≤67%,认为该信息片段对识别隐私信
息资源提供支撑处于中等水平,但也会对识别隐私信息资源造成较为明显的影响,若该信
息片段被泄露,则需要对隐私暴露进行关注。
[0221] 保护信息资源不会被通过差分等方法造成泄露可以通过随机是控制信息资源在单个路径上出现的概率。
[0222] 为获得隐私信息资源,需要关联不同的信息资源,可以通过不同的路径最终达成目的,不同路径中出现的信息资源个数、长短、内容均可能不同,因此信息层面的随机需要
考虑更多因素;资源请求者获取信息资源的主要因素是信息资源本身的出现频数,频繁出
现的资源更易被请求者获取。
[0223] 若获得隐私信息资源只有一条路径,且资源请求者拥有最大背景知识,即掌握除差异信息资源之外的所有信息资源,此时采用随机法保护隐私,需要控制该条路径上信息
资源的出现频数,使不同信息资源出现的次数平均,以此来掩藏差异信息资源的具体内容。
[0224] 若获得隐私信息资源有多条路径,且资源请求者拥有最大背景知识,掌握除差异信息资源之外的所有信息资源,包括差异信息资源所在路径上的其他信息资源,以及该路
径之外的其他路径具体内容,此时该信息资源可能同时出现在其他路径中,也可能未在其
他路径出现;各个路径除资源内容和资源出现频数存在差异外,路径长度即所含信息资源
个数也存在差异,此时采用随机法保护隐私需要考虑两个方面,分别是路径长度和信息资
源出现频数,保护目标是:(a)、影响不同长度的路径被资源请求者得知的概率,使概率相
等;(b)、影响出现次数不同的信息资源被资源请求者得知的概率,使概率相等;(c)、结合以
上两个目标,使相同资源在不同长度路径上的出现概率受到随机化影响;最简单的随机化
方法是使概率均等,若某个资源出现频数高,则人为控制该资源的出现次数,使该资源出现
次数降低,减少隐私暴露风险。
[0225] 与图1所述的方法相对应,本发明实施例还提供了一种跨DIKW模态类型化隐私信息资源差分保护系统,用于对图1中方法的具体实现,本发明实施例提供的跨DIKW模态类型
化隐私信息资源差分保护系统可以应用于服务器中,其结构示意图如图5所示,具体包括:
[0226] 接收单元501,用于当接收到资源查询请求时,确定所述资源查询请求对应的隐私信息资源;
[0227] 选取单元502,用于在所述隐私信息资源对应的信息轨迹图中选取出各个候选资源路径;每个所述候选资源路径包含至少一个信息模态的信息资源;每个所述候选资源路
径中的各个所述信息资源的频繁度满足预先设置的差分保护条件;
[0228] 第一确定单元503,用于确定每个所述候选资源路径中的每个所述信息资源的支持度;其中,每个所述信息资源的支持度表征该信息资源包含与所述隐私信息资源相关联
的隐私信息的信息量;
[0229] 第一执行单元504,用于基于每个所述候选资源路径中的每个所述信息资源的支持度,获得每个所述候选资源路径中的路径支持度;
[0230] 第二确定单元505,用于依据每个所述候选资源路径中的路径支持度在各个所述候选资源路径中确定出目标资源路径;
[0231] 第二执行单元506,用于基于所述目标资源路径中的各个信息资源,获得所述资源查询请求对应的目标信息资源。
[0232] 发送单元507,用于将所述目标信息资源发送至所述资源查询请求对应的资源请求用户,以实现对所述隐私信息资源的保护。
[0233] 在本发明提供的一实施例中,基于上述的方案,可选的,所述选取单元502,包括:
[0234] 第一获取子单元,用于获取所述隐私信息资源对应的信息轨迹图;
[0235] 第一确定子单元,用于确定所述信息轨迹图中的各个信息路径;
[0236] 第二获取子单元,用于获取每个所述信息路径中的每个信息资源的频繁度;
[0237] 执行子单元,用于对于每个所述信息路径,若该信息路径中的各个所述信息资源的频繁度满足预先设置的差分保护条件,则将该信息路径作为候选资源路径。
[0238] 在本发明提供的一实施例中,基于上述的方案,可选的,所述第一确定单元503,包括:
[0239] 第二确定子单元,用于确定每个所述信息资源的类型;该类型为关联融合型或非关联融合型;
[0240] 第三确定子单元,用于基于每个所述信息资源的类型确定每个所述信息资源对应的支持度计算方式;
[0241] 计算子单元,用于按每个所述信息资源的类型对应的支持度计算方式计算得到每个所述信息资源的支持度。
[0242] 在本发明提供的一实施例中,基于上述的方案,可选的,所述第二确定单元505,包括:
[0243] 第四确定子单元,用于确定所述资源查询请求对应的资源请求用户;
[0244] 第五确定子单元,用于响应于所述资源请求用户满足预先设置的隐私保护条件,将各个所述候选资源路径中路径支持度最小的候选资源路径确定为目标资源路径。
[0245] 在本发明提供的一实施例中,基于上述的方案,可选的,所述第二执行单元506,包括:
[0246] 第三获取子单元,用于获取所述目标资源路径中的各个信息资源;
[0247] 融合子单元,用于按所述目标资源路径对应的融合方式对各个所述信息资源进行融合,获得所述资源查询请求对应的目标信息资源。
[0248] 上述本发明实施例公开的跨DIKW模态类型化隐私信息资源差分保护系统中的各个单元和模块具体的原理和执行过程,与上述本发明实施例公开的跨DIKW模态类型化隐私
信息资源差分保护方法相同,可参见上述本发明实施例提供的跨DIKW模态类型化隐私信息
资源差分保护方法中相应的部分,这里不再进行赘述。
[0249] 需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
对于系统类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参
见方法实施例的部分说明即可。
[0250] 最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作
之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意
在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那
些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者
设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排
除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0251] 为了描述的方便,描述以上系统时以功能分为各种单元分别描述。当然,在实施本发明时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
[0252] 通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质
上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品
可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备
(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些
部分所述的方法。
[0253] 以上对本发明所提供的一种跨DIKW模态类型化隐私信息资源差分保护方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例
的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,
依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内
容不应理解为对本发明的限制。