一种基于敏感数据库的自学习管理系统转让专利
申请号 : CN202110672561.6
文献号 : CN113392111B
文献日 : 2022-04-29
发明人 : 林德威 , 高董英 , 方志坚 , 黄芳芳 , 潘建笠 , 刘积娟 , 黄鹏 , 陈强 , 谢妙红 , 李建平 , 曾驰
申请人 : 国网福建省电力有限公司信息通信分公司 , 国网信通亿力科技有限责任公司 , 国网信息通信产业集团有限公司
摘要 :
权利要求 :
1.一种基于敏感数据库的自学习管理系统,其特征在于,包括数据库更新模块(13)、存储模块(14)、自学习模块(11)以及处理模块(12),所述存储模块(14)内存储有初始敏感数据库,所述自学习模块(11)用于根据初始敏感数据库进行敏感数据特征的构建,所述处理模块(12)用于将接收到的数据进行归类处理,所述数据库更新模块(13)用于将归类处理后的敏感数据存储至存储模块(14)中;
所述自学习模块(11)包括第一学习单元(111)以及第二学习单元(112);所述第一学习单元(111)用于根据初始敏感数据库进行敏感数据特征的构建,所述第二学习单元(112)用于根据更新后的敏感数据库进行敏感数据特征的构建;
所述第一学习单元(111)包括敏感数据分类子单元(1111)以及第一特征构建子单元(1112);所述敏感数据分类子单元(1111)配置有敏感数据分类策略,所述敏感数据分类策略包括:将初始敏感数据库中的敏感数据进行分类,分类级别为高度敏感数据、中度敏感数据以及轻度敏感数据;
再将高度敏感数据、中度敏感数据以及轻度敏感数据进行数据标签分类,数据标签分为数据来源区域、数字数据、组合数据、体征数据、支付记录数据以及登录记录数据;
所述第一特征构建子单元(1112)包括第一特征构建策略,所述第一特征构建策略包括:将高度敏感数据中的数据来源区域进行提取,并标记为高度区域特征;
将高度敏感数据中的数字数据和支付记录数据进行提取,并将同时标记支付记录数据和数字数据的组合标记为高度支付密码特征;
将高度敏感数据中的组合数据和登录记录数据进行提取,并将同时标记组合数据和登录记录数据的组合标记为高度登录密码特征;
将高度敏感数据中的数字数据和登录记录数据进行提取,并将同时标记数字数据和登录记录数据的组合标记为高度登录账号特征;
将高度敏感数据中的体征数据和支付记录数据进行提取,并将同时标记体征数据和支付记录数据的组合标记为高度支付体征特征;
将高度敏感数据中的体征数据和登录记录数据进行提取,并将同时标记体征数据和登录记录数据的组合标记为高度登录体征特征;
所述处理模块(12)包括敏感数据划分单元(121),所述敏感数据划分单元(121)配置有比对策略,所述比对策略包括:将接收到的数据进行数据标签分类,然后将接收到的数据分别与高度区域特征、高度支付密码特征、高度登录密码特征、高度登录账号特征、高度支付体征特征以及高度登录体征特征进行比对,比对符合上述特征时,将数据归为一级高度敏感数据,并将比对相符的特征的标签添加到该数据中进行归类;
所述数据库更新模块(13)包括缓存单元(131),所述缓存单元(131)用于存储第一时间内新归类的一级高度敏感数据;
所述存储模块(14)包括高度敏感数据存储单元(141),所述高度敏感数据存储单元(141)配置有移存策略,所述移存策略包括:每隔第一时间将缓存单元(131)中的存储数据移存进高度敏感数据存储单元(141)内。
2.根据权利要求1所述的一种基于敏感数据库的自学习管理系统,其特征在于,所述第二学习单元(112)包括第二特征构建子单元(1121),所述第二特征构建子单元(1121)配置有第二特征构建策略,所述第二特征构建策略包括:将具有高度区域特征和高度支付密码特征的数据进行提取,并将同时具备高度区域特征和高度支付密码特征的数据标记为高度集中支付区域特征。
3.根据权利要求2所述的一种基于敏感数据库的自学习管理系统,其特征在于,所述第二特征构建策略还包括:将具有高度登录账号特征和高度区域特征的数据进行提取,并将同时具备高度登录账号特征和高度区域特征的数据标记为高度集中登录区域特征。
4.根据权利要求3所述的一种基于敏感数据库的自学习管理系统,其特征在于,所述第二特征构建策略还包括:将具有高度支付密码特征的数据和高度登录密码特征的数据进行提取,并将同时具备高度支付密码特征和高度登录密码特征的数据标记为高度密码使用特征。
5.根据权利要求4所述的一种基于敏感数据库的自学习管理系统,其特征在于,所述第二特征构建策略还包括:将具有高度支付体征特征和高度登录体征特征的数据进行提取,并将同时具备高度支付体征特征和高度登录体征特征的数据标记为高度体征特征。
6.根据权利要求5所述的一种基于敏感数据库的自学习管理系统,其特征在于,所述比对策略还包括:将接收到的数据进行数据标签分类,然后将接收到的数据分别与高度集中支付区域特征、高度集中登录区域特征、高度密码使用特征以及高度体征特征进行比对,比对符合上述特征时,将数据归为二级高度敏感数据,并将比对相符的特征的标签添加到该数据中进行归类。
7.根据权利要求6所述的一种基于敏感数据库的自学习管理系统,其特征在于,所述第二学习单元(112)还包括特征细分子单元(1122),所述特征细分子单元(1122)配置有特征细分策略,所述特征细分策略包括:将高度密码使用特征进行拆分,记录高度密码使用特征的位数以及使用组合符号的类型数,并将不同位数对应的组合符号的类型数进行归类,并选取不同位数下组合符号类型数出现次数最多的为相互匹配的组合,并标记为位数对应类型数特征。
8.根据权利要求7所述的一种基于敏感数据库的自学习管理系统,其特征在于,所述比对策略还包括:将接收到的数据进行数据标签分类,然后将接收到的数据与位数对应类型数特征进行比对,比对符合上述特征时,将数据归为细分敏感数据,并将比对相符的特征的标签添加到该数据中进行归类。
9.根据权利要求8所述的一种基于敏感数据库的自学习管理系统,其特征在于,所述数据标签还包括视频数据、图片数据以及手机拍摄来源数据;
所述第一特征构建策略还包括:将高度敏感数据中的视频数据和手机拍摄来源数据进行提取,并将同时标记视频数据和手机拍摄来源数据的组合标记为高度视频特征;
将高度敏感数据中的图片数据和手机拍摄来源数据进行提取,并将同时标记图片数据和手机拍摄来源数据的组合标记为高度图片特征。
10.根据权利要求9所述的一种基于敏感数据库的自学习管理系统,其特征在于,所述比对策略还包括:将接收到的数据进行数据标签分类,然后将接收到的数据与高度视频特征和高度图片特征进行比对,比对符合上述特征时,将数据归为高度敏感数据,并将比对相符的特征的标签添加到该数据中进行归类。
说明书 :
一种基于敏感数据库的自学习管理系统
技术领域
背景技术
企业或社会机构不适合公布的数据,如企业的经营情况,企业的网络结构、IP地址列表等。
特别是目前智能电网系统的普及,对信息收集的粒度提高,同时也就提高了用电信息的泄
漏风险。
数据泛滥的时代,现在的数据处理领域,数据的更新速度快,不同数据的组合类型也在发生
变化,使用原有的敏感数据管理系统已经不能满足现有的识别场景,很容易对一些新型的
敏感数据漏判,导致数据处理过程的安全性和效率降低。
发明内容
感数据归类的准确性,以解决现有的敏感数据的处理过程较为死板,处理效率和安全性较
低的问题。
模块内存储有初始敏感数据库,所述自学习模块用于根据初始敏感数据库进行敏感数据特
征的构建,所述处理模块用于将接收到的数据进行归类处理,所述数据库更新模块用于将
归类处理后的敏感数据存储至存储模块中;
据库进行敏感数据特征的构建;
库中的敏感数据进行分类,分类级别为高度敏感数据、中度敏感数据以及轻度敏感数据;
区域特征、高度支付密码特征、高度登录密码特征、高度登录账号特征、高度支付体征特征
以及高度登录体征特征进行比对,比对符合上述特征时,将数据归为一级高度敏感数据,并
将比对相符的特征的标签添加到该数据中进行归类;
存储单元内。
付密码特征的数据进行提取,并将同时具备高度区域特征和高度支付密码特征的数据标记
为高度集中支付区域特征。
集中登录区域特征。
数据标记为高度密码使用特征。
记为高度体征特征。
高度体征特征进行比对,比对符合上述特征时,将数据归为二级高度敏感数据,并将比对相
符的特征的标签添加到该数据中进行归类。
用特征的位数以及使用组合符号的类型数,并将不同位数对应的组合符号的类型数进行归
类,并选取不同位数下组合符号类型数出现次数最多的为相互匹配的组合,并标记为位数
对应类型数特征。
据,并将比对相符的特征的标签添加到该数据中进行归类。
度敏感数据,并将比对相符的特征的标签添加到该数据中进行归类。
敏感数据、中度敏感数据以及轻度敏感数据进行数据标签分类,数据标签分为数据来源区
域、数字数据、组合数据、体征数据、支付记录数据以及登录记录数据,根据这些特征进行学
习,并第一特征构建策略能够构建出高度区域特征、高度支付密码特征、高度登录密码特
征、高度登录账号特征、高度支付体征特征以及高度登录体征特征,从而能够快速对接收的
数据进行敏感数据的分类,提高敏感数据的自学习处理效率。
征、高度密码使用特征以及高度体征特征,实现对敏感数据的敏感度的升级,提高对高度敏
感数据的分类准确性;同时增加了特征细分策略,能够针对高度密码使用特征的位数以及
使用组合符号的类型数进行特征细分,提高了对密码数据的识别准确性;数据标签中增加
视频数据、图片数据以及手机拍摄来源数据,能够得出高度视频特征以及高度图片特征,提
高敏感数据分类的全面性。
附图说明
1122、特征细分子单元;12、处理模块;121、敏感数据划分单元;13、数据库更新模块;131、缓
存单元;14、存储模块;141、存储单元。
具体实施方式
据库,所述自学习模块11用于根据初始敏感数据库进行敏感数据特征的构建,所述处理模
块12用于将接收到的数据进行归类处理,所述数据库更新模块13用于将归类处理后的敏感
数据存储至存储模块14中。
更新后的敏感数据库进行敏感数据特征的构建。
括:将初始敏感数据库中的敏感数据进行分类,分类级别为高度敏感数据、中度敏感数据以
及轻度敏感数据;
分为国家级研究院、科研所、银行等需要保证数据安全的区域,从该区域输出的数据需要划
定为高度敏感数据。
的情况下,此数字数据大概率为支付密码,因此需要划定为高度敏感数据。
的情况下,此组合数据大概率为登录密码数据,因此需要划定为高度敏感数据。
情况下,此数字数据大概率为登录账号或手机号,因此需要划定为高度敏感数据。
情况下,此体征数据大概率为支付时的体征密码,如指纹密码。
情况下,此体征数据大概率为登录时的体征密码,如指纹密码。
与高度区域特征、高度支付密码特征、高度登录密码特征、高度登录账号特征、高度支付体
征特征以及高度登录体征特征进行比对,比对符合上述特征时,将数据归为一级高度敏感
数据,并将比对相符的特征的标签添加到该数据中进行归类。
据,并将比对相符的特征的标签添加到该数据中进行归类。
度敏感数据存储单元141内。
感数据的细分程度,提高对敏感数据分类的准确性。所述第二学习单元112包括第二特征构
建子单元1121,所述第二特征构建子单元1121配置有第二特征构建策略,所述第二特征构
建策略包括:将具有高度区域特征和高度支付密码特征的数据进行提取,并将同时具备高
度区域特征和高度支付密码特征的数据标记为高度集中支付区域特征,这一特征比较常见
于银行或者商场等集中出现支付行为的领域中,因此对这一区域的数据处理的安全优先级
也较高。
域特征,这一特征比较常见于网吧等用户终端较多的娱乐场所,用户会频繁的登录账号。
高度密码使用特征。提取这一特征,能够对密码相关的数据进行识别,从而对密码进行着重
加密处理。
征特征。人体体征的数据包含很多种,如果是用于支付和登录时,那么此体征的特征大概率
用于体征密码,如指纹密码和人脸识别密码。
特征进行比对,比对符合上述特征时,将数据归为二级高度敏感数据,并将比对相符的特征
的标签添加到该数据中进行归类。
使用特征的位数以及使用组合符号的类型数,并将不同位数对应的组合符号的类型数进行
归类,并选取不同位数下组合符号类型数出现次数最多的为相互匹配的组合,并标记为位
数对应类型数特征。
对相符的特征的标签添加到该数据中进行归类。
块12能够对新接收的数据进行高度敏感数据的分类,从而提高对敏感数据的自学习分类效
率,标记后的高度敏感数据先缓存在数据库更新模块13中,在一定时间后,统一集中存储在
存储模块14中,并且通过在自学习模块11中增加第二学习单元112,能够对存储模块14中新
增加的敏感数据进行再学习分类,从而进一步提高敏感数据分类的准确性和细致性,提高
对敏感数据的整体的自学习管理效率。
明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员
在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻
易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使
相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护
范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。