一种保密存储介质粉碎筛选方法转让专利

申请号 : CN202110777355.1

文献号 : CN113469444B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 罗远哲刘瑞景张艺腾刘洁孟小钰陈思杰王晶任光远张建武

申请人 : 北京中超伟业信息安全技术股份有限公司

摘要 :

本发明涉及一种保密存储介质粉碎筛选方法,包括:采集样本数据,样本数据包括风扇的功率、各存储介质颗粒的属性数据和是否进行二次粉碎的标签数据;以风扇的功率及各存储介质的属性数据为输入,是否进行二次粉碎的标签数据为输出训练神经网络模型,得到介质筛选模型;实时采集待筛选的存储介质对应的风扇的功率及各存储介质颗粒的属性数据;将待筛选的存储介质对应的风扇的功率及各存储介质颗粒的属性数据输入介质筛选模型中,输出是否进行二次粉碎的结果;根据是否进行二次粉碎的结果,判断是否对待筛选的存储介质进行二次粉碎。本发明通过样本数据训练神经网络模型得到介质筛选模型,通过介质筛选模型提高了筛选效率,降低了人工成本。

权利要求 :

1.一种保密存储介质粉碎筛选方法,其特征在于,包括:在多种存储介质颗粒下落的过程中,通过风扇提供的水平风力吹在各所述存储介质颗粒上;

采集样本数据,所述样本数据包括所述风扇的功率、各所述存储介质颗粒的属性数据和是否进行二次粉碎的标签数据,所述属性数据包括密度、重量、体积、下落的高度和掉落的位置;

以所述风扇的功率及各所述存储介质的属性数据为输入,是否进行二次粉碎的标签数据为输出训练神经网络模型,得到介质筛选模型;

在待筛选的存储介质对应的各存储介质颗粒下落的过程中,通过风扇提供的水平风力吹在各存储介质颗粒上;

实时采集所述待筛选的存储介质对应的风扇的功率及各存储介质颗粒的属性数据;

将所述待筛选的存储介质对应的风扇的功率及各存储介质颗粒的属性数据输入所述介质筛选模型中,输出是否进行二次粉碎的结果;

根据所述是否进行二次粉碎的结果,判断是否对所述待筛选的存储介质进行二次粉碎;

所述以所述风扇的功率及各所述存储介质的属性数据为输入,是否进行二次粉碎的标签数据为输出训练神经网络模型,得到介质筛选模型,具体包括:基于全连接神经网络算法创建神经网络模型;

按照7∶3的比例将所述样本数据划分训练集和验证集;

利用梯度下降的优化算法和交叉熵损失函数,通过所述训练集中数据训练所述神经网络模型,确定所述神经网络模型的权值和阈值;

根据所述验证集得到的所述神经网络模型的预测结果的最小交叉熵损失,确定所述介质筛选模型。

2.根据权利要求1所述的保密存储介质粉碎筛选方法,其特征在于,所述以所述风扇的功率及各所述存储介质的属性数据为输入,是否进行二次粉碎为输出训练神经网络模型,得到介质筛选模型,具体包括:

对所述风扇的功率及各所述存储介质颗粒的属性数据进行归一化;

以归一化后的数据为输入,是否进行二次粉碎为输出训练神经网络模型,得到介质筛选模型。

3.根据权利要求2 所述的保密存储介质粉碎筛选方法,其特征在于,所述对所述风扇的功率及各所述存储介质颗粒的属性数据进行归一化,具体包括:采用线性函数归一化对特征向量x0=[d,m,v,p,h,axis1,axis2]进行预处理,线性函数归一化表示为:

其中,xnorm为归一化后的特征向量,x0为原始的特征向量,xmin为原始的特征向量中各个特征的最小值组成的向量,xmax为原始的特征向量中各个特征的最大值组成的向量,d表示所述样本数据中所有的密度数据组成的列向量,m表示所述样本数据中所有的重量数据组成的列向量,v表示所述样本数据中所有体积数据组成的列向量,p表示所述样本数据中所有风扇功率组成的列向量,h表示所述样本数据中所有下落的高度组成的列向量,axis1表示所述样本数据中所有掉落的位置的x轴坐标组成的列向量,axis2表示所述样本数据中所有掉落的位置的y轴坐标组成的列向量。

4.根据权利要求1所述的保密存储介质粉碎筛选方法,其特征在于,所述神经网络模型为反向传播神经网络。

5.根据权利要求1所述的保密存储介质粉碎筛选方法,其特征在于,所述神经网络模型为4层神经网络模型,输入层节点数为s,输出层节点数为1,隐藏层节点数为

6.根据权利要求1所述的保密存储介质粉碎筛选方法,其特征在于,所述神经网络模型中隐藏层与输出层的神经元的值满足公式:其中,x表示输入层的数据,H表示隐藏层单元的值, 为输出层的预测值,WL表示第L层的神经网络的权重,bL表示第L层的神经网络的阈值,ReLU函数表示隐藏层的激活函数,sigmoid函数表示输出层激活函数。

7.根据权利要求1所述的保密存储介质粉碎筛选方法,其特征在于,所述确定所述神经网络模型的权值和阈值的目标函数表示为:(i)

其中,y 表示第i个样本的标签, 表示第i个样本的预测值,m表示样本数据量,w表示所述神经网络模型的权重,b表示所述神经网络模型的阈值。

说明书 :

一种保密存储介质粉碎筛选方法

技术领域

[0001] 本发明涉及存储介质粉碎技术领域,特别是涉及一种保密存储介质粉碎筛选方法。

背景技术

[0002] 目前传统的保密介质粉碎系统在进行粉碎时,无法对粉碎的程度进行智能判断,一般在粉碎完之后只能通过人工的方式利用不同的过滤网对不同的保密存储介质按照不
同的尺寸要求,将不满足要求的颗粒筛选并进行再次粉碎,或者直接进行重复多次粉碎,这
会出现达到粉碎要求但继续粉碎的情况,导致用电浪费,同时也会降低设备的使用寿命。

发明内容

[0003] 本发明的目的是提供一种保密存储介质粉碎筛选方法,提高了筛选效率,降低了人工成本。
[0004] 为实现上述目的,本发明提供了如下方案:
[0005] 一种保密存储介质粉碎筛选方法,包括:
[0006] 在多种存储介质颗粒下落的过程中,通过风扇提供的水平风力吹在各所述存储介质颗粒上;
[0007] 采集样本数据,所述样本数据包括所述风扇的功率、各所述存储介质颗粒的属性数据和是否进行二次粉碎的标签数据,所述属性数据包括密度、重量、体积、下落的高度和
掉落的位置;
[0008] 以所述风扇的功率及各所述存储介质的属性数据为输入,是否进行二次粉碎的标签数据为输出训练神经网络模型,得到介质筛选模型;
[0009] 在待筛选的存储介质对应的各存储介质颗粒下落的过程中,通过风扇提供的水平风力吹在各存储介质颗粒上;
[0010] 实时采集所述待筛选的存储介质对应的风扇的功率及各存储介质颗粒的属性数据;
[0011] 将所述待筛选的存储介质对应的风扇的功率及各存储介质颗粒的属性数据输入所述介质筛选模型中,输出是否进行二次粉碎的结果;
[0012] 根据所述是否进行二次粉碎的结果,判断是否对所述待筛选的存储介质进行二次粉碎。
[0013] 可选地,所述以所述风扇的功率及各所述存储介质的属性数据为输入,是否进行二次粉碎为输出训练神经网络模型,得到介质筛选模型,具体包括:
[0014] 对所述风扇的功率及各所述存储介质颗粒的属性数据进行归一化;
[0015] 以归一化后的数据为输入,是否进行二次粉碎为输出训练神经网络模型,得到介质筛选模型。
[0016] 可选地,所述对所述风扇的功率及各所述存储介质颗粒的属性数据进行归一化,具体包括:
[0017] 采用线性函数归一化对特征向量 进行预处理,线性函数归一化表示为:
[0018] ;
[0019] 其中,xnorm为归一化后的特征向量,x0为原始的特征向量,xmin为原始的特征向量中各个特征的最小值组成的向量,xmax为原始的特征向量中各个特征的最大值组成的向量,d
表示所述样本数据中所有的密度数据组成的列向量,m表示所述样本数据中所有的重量数
据组成的列向量,v表示所述样本数据中所有体积数据组成的列向量,p表示所述样本数据
中所有风扇功率组成的列向量,h表示所述样本数据中所有下落的高度组成的列向量,
axis1表示所述样本数据中所有掉落的位置的x轴坐标组成的列向量,axis2表示所述样本
数据中所有掉落的位置的y轴坐标组成的列向量。
[0020] 可选地,所述神经网络模型为反向传播神经网络。
[0021] 可选地,所述以所述风扇的功率及各所述存储介质的属性数据为输入,是否进行二次粉碎的标签数据为输出训练神经网络模型,得到介质筛选模型,具体包括:
[0022] 基于全连接神经网络算法创建神经网络模型;
[0023] 按照7:3的比例将所述样本数据划分训练集和验证集;
[0024] 利用梯度下降的优化算法和交叉熵损失函数,通过所述训练集中数据训练所述神经网络模型,确定所述神经网络模型的权值和阈值;
[0025] 根据所述验证集得到的所述神经网络模型的预测结果的最小交叉熵损失,确定所述介质筛选模型。
[0026] 可选地,所述神经网络模型为4层神经网络模型,输入层节点数为s,输出层节点数为1,隐藏层节点数为 。
[0027] 可选地,所述神经网络模型中隐藏层与输出层的神经元的值满足公式:
[0028] ;
[0029] 其中,x表示输入层的数据,H表示隐藏层单元的值, 为输出层的预测值, 表示第L层的神经网络的权重, 表示第L层的神经网络的阈值,ReLU函数表示隐藏层的激
活函数,sigmoid函数表示输出层激活函数。
[0030] 可选地,所述确定所述神经网络模型的权值和阈值的目标函数表示为:
[0031] ;
[0032] 其中, 表示第i个样本的标签, 表示第i个样本的预测值,m表示样本数据量,w表示所述神经网络模型的权重,b表示所述神经网络模型的阈值。
[0033] 根据本发明提供的具体实施例,本发明公开了以下技术效果:
[0034] 本发明采用训练好的介质筛选模型对保密存储介质进行自动筛选,能够满足不同材质不同尺寸的存储介质颗粒的筛选,提高了筛选效率,降低了人工成本。

附图说明

[0035] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施
例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图
获得其他的附图。
[0036] 图1为本发明一种保密存储介质粉碎筛选方法流程示意图;
[0037] 图2为本发明全连接神经网络的介质筛选模型结构示意图;
[0038] 图3为本发明介质筛选模型应用流程示意图;
[0039] 图4为本发明一种保密存储介质粉碎筛选系统结构示意图。

具体实施方式

[0040] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于
本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他
实施例,都属于本发明保护的范围。
[0041] 本发明的目的是提供一种保密存储介质粉碎筛选方法,提高了筛选效率,降低了人工成本。
[0042] 为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
[0043] 图1为本发明一种保密存储介质粉碎筛选方法流程示意图,如图1所示,一种保密存储介质粉碎筛选方法,包括:
[0044] 步骤101:在多种存储介质颗粒下落的过程中,通过风扇提供的水平风力吹在各存储介质颗粒上。
[0045] 步骤102:采集样本数据,样本数据包括风扇的功率、各存储介质颗粒的属性数据和是否进行二次粉碎的标签数据,属性数据包括密度、重量、体积、下落的高度和掉落的位
置。风扇的功率、各存储介质颗粒的属性数据为特征。掉落的位置具体是指掉落的位置区域
的坐标。
[0046] 步骤103:以风扇的功率及各存储介质的属性数据为输入,是否进行二次粉碎的标签数据为输出训练神经网络模型,得到介质筛选模型。
[0047] 步骤104:在待筛选的存储介质对应的各存储介质颗粒下落的过程中,通过风扇提供的水平风力吹在各存储介质颗粒上。
[0048] 步骤105:实时采集待筛选的存储介质对应的风扇的功率及各存储介质颗粒的属性数据。
[0049] 步骤106:将待筛选的存储介质对应的风扇的功率及各存储介质颗粒的属性数据输入介质筛选模型中,输出是否进行二次粉碎的结果。
[0050] 步骤107:根据是否进行二次粉碎的结果,判断是否对待筛选的存储介质进行二次粉碎。
[0051] 其中,步骤103具体包括:
[0052] 对风扇的功率及各存储介质颗粒的属性数据进行归一化,以使所有特征处于同一数量级。
[0053] 以归一化后的数据为输入,是否进行二次粉碎为输出训练神经网络模型,得到介质筛选模型。
[0054] 对风扇的功率及各存储介质颗粒的属性数据进行归一化,具体包括:
[0055] 采用线性函数归一化对特征向量 进行预处理,线性函数归一化表示为:
[0056] ;
[0057] 其中,xnorm为归一化后的特征向量,x0为原始的特征向量,xmin为原始的特征向量中各个特征的最小值组成的向量,xmax为原始的特征向量中各个特征的最大值组成的向量,d
表示样本数据中所有的密度数据组成的列向量,m表示样本数据中所有的重量数据组成的
列向量,v表示样本数据中所有体积数据组成的列向量,p表示样本数据中所有风扇功率组
成的列向量,h表示样本数据中所有下落的高度组成的列向量,axis1表示样本数据中所有
掉落的位置的x轴坐标组成的列向量,axis2表示样本数据中所有掉落的位置的y轴坐标组
成的列向量。x0中各列向量中数据均为一个特征。
[0058] 神经网络模型为反向传播神经网络。
[0059] 其中,步骤103具体包括:
[0060] 基于全连接神经网络算法创建神经网络模型;
[0061] 按照7:3的比例将样本数据划分训练集和验证集;
[0062] 利用梯度下降的优化算法和交叉熵损失函数,通过训练集中数据训练神经网络模型,确定神经网络模型的权值和阈值;
[0063] 根据验证集得到的神经网络模型的预测结果的最小交叉熵损失,确定介质筛选模型。
[0064] 神经网络模型为4层神经网络模型,输入层节点数为s,输出层节点数为1,隐藏层节点数为 。
[0065] 神经网络模型中隐藏层与输出层的神经元的值满足公式:
[0066] ;
[0067] 其中,x表示输入层的数据,H表示隐藏层单元的值, 为输出层的预测值, 表示第L层的神经网络的权重, 表示第L层的神经网络的阈值,ReLU函数表示隐藏层的激
活函数,sigmoid函数表示输出层激活函数。
[0068] 确定神经网络模型的权值和阈值的目标函数表示为:
[0069] ;
[0070] 其中, 表示第i个样本的标签, 表示第i个样本的预测值,m表示样本数据量,w表示所述神经网络模型的权重,b表示所述神经网络模型的阈值。
[0071] 下面以具体实施例说明本发明一种保密存储介质粉碎筛选方法。
[0072] (1)采集不同介质对应的属性数据(包括:密度、重量和体积)、风扇的功率、下落的高度、掉落的位置区域坐标,将上述数据作为特征,将是否需要进行二次粉碎的结果作为标
签,将特征与标签组成的向量作为样本数据,样本数据表示为 ,
其中d表示样本中所有的密度数据组成的列向量,m表示样本中所有的重量数据组成的列向
量,v表示样本中所有体积数据组成的列向量,p表示样本中所有风扇功率组成的列向量,h
表示样本中所有下落的高度组成的列向量,axis1表示样本中所有掉落水平面位置区域的x
轴坐标组成的列向量,axis2表示样本中所有掉落水平面位置区域的y轴坐标组成的列向
量,y表示样本的所有标签组成的列向量,其中0表示不需要进行二次粉碎,1表示需要进行
二次粉碎。
[0073] 采用线性函数归一化对特征向量 进行预处理,线性函数归一化方法可以表示为:
[0074] ;
[0075] 其中xnorm为归一化后的特征向量,x0为原始的特征向量,xmin为原始的特征向量中各个特征的最小值组成的向量,xmax为原始的特征向量中各个特征的最大值组成的向量。
[0076] (2)基于全连接神经网络算法的模型表示创建介质筛选模型,选择4层神经网络模型,对于隐藏层节点的个数根据经验公式 设置,其中k表示输入层节点数,l表示输出
层节点数,对于介质筛选模型,输入层节点数为s,输出层节点数为1,故隐藏层节点数为
,对于隐藏层的激活函数选择线性整流函数(Rectified Linear Unit,ReLU),输出层
的激活函数选择sigmoid激活函数,损失函数选择交叉熵损失。
[0077] 其中构建的全连接神经网络的介质筛选模型如图2所示。
[0078] 图2中的 为预测值(当输出的预测值 大于0.5时,表示需要进行二次粉碎,否则表示不需要进行二次粉碎), 为特征值, 表示第L层的第n个神经元的值,输入层
的L值表示为0。
[0079] 隐藏层与输出层的神经元的值满足如下公式:
[0080]
[0081] 其中x表示输入层的数据,H表示隐藏层单元的值, 为输出层的预测值, 和表示第L层的神经网络的权重和阈值。隐藏层的激活函数ReLU函数的公式如下:
[0082] ;
[0083] 输出层激活函数的sigmoid函数的公式为:
[0084] ;
[0085] 交叉熵损失函数如下:
[0086] ;
[0087] 其中 表示第i个样本的标签, 表示第i个样本的预测值,m表示样本数据量,w和b表示模型的权重和阈值。
[0088] (3)将采集的样本数据,按照7:3的比例划分训练集和验证集。
[0089] (4)利用梯度下降的优化算法以最小化交叉熵损失在训练集上训练基于神经网络的介质筛选模型,以寻找最优的权重和阈值,优化权重和阈值的目标公式为:
[0090] ;
[0091] 采用梯度下降的优化算法优化权重和阈值的更新公式为:
[0092] 。
[0093] 其中α表示学习率。
[0094] 通过调整神经网络算法的超参数如:学习率、迭代次数,在验证集上评估此时的介质筛选模型。
[0095] (5)以验证集上的介质筛选结果的交叉熵损失作为评估标准,最终得到交叉熵损失最小所对应的介质筛选模型。
[0096] (6)在进行实时介质筛选时,通过将预处理后的实时特征数据输入介质筛选模型,得到介质的筛选结果,即是否需要进行二次粉碎。
[0097] 本发明还公开了一种保密存储介质粉碎筛选系统,如图4所示,一种保密存储介质粉碎筛选系统包括:数据采集模块1、介质筛选建模模块2、实时介质筛选模块3。
[0098] 数据采集模块1,用于采集粉碎介质的密度、重量、体积,风扇的功率、下落的高度以及掉落的位置区域坐标,并将采集到的信息进行预处理后,发送介质筛选建模模块2或者
实时介质筛选模块3。
[0099] 向介质筛选建模模块2发送数据时还需要采集人工判断的是否需要进行二次粉碎的结果。
[0100] 介质筛选建模模块2,用于对数据采集模块1得到的信息利用神经网络算法进行训练和建模,得到介质筛选模型,并将得到的模型发送给实时介质筛选模块3。
[0101] 实时介质筛选模块3,用于将数据采集模块1实时采集并预处理后的粉碎介质的密度、重量、体积,风扇的功率、下落的高度以及掉落的位置区域坐标信息代入介质筛选模型,
从而确定是否需要进行二次粉碎。
[0102] 在介质筛选模型的训练过程中,首先将所需要粉碎的各种保密存储介质材料取一定的样本进行粉碎,通过对不同的粉碎介质调整不同大小的风力,利用数据采集模块1采集
粉碎的介质的密度、重量、体积、风扇的功率、下落的高度、掉落的位置区域坐标数据,然后
进行预处理后传入到介质筛选建模模块2以及实时介质筛选模块3,传入介质筛选建模模块
2时,需要结合人工判断的是否需要二次粉碎的结果构成样本集合,然后利用样本数据训练
并评估创建的基于神经网络的介质筛选分类模型,最终得到筛选效果最好的介质筛选模
型,然后将介质筛选模型传入到实时介质筛选模块3。
[0103] 图3为介质筛选模型应用流程示意图,如图3所示,介质筛选模型应用流程包括:
[0104] Step31:将数据采集模块实时采集的未知是否要进行二次粉碎结果的存储介质颗粒的密度、重量、体积信息、下落的高度、掉落的位置区域坐标以及风扇的功率组成特征数
据集。
[0105] Step32:对特征数据集进行预处理。
[0106] Step33:预处理后的数据输入介质筛选模型。
[0107] Step34:根据介质筛选模型的输出得到介质筛选分类预测结果,即是否需要进行二次粉碎。
[0108] 在介质筛选模型实际生产应用时,数据采集模块首先实时采集粉碎的介质的密度、重量、体积、风扇的功率、下落的高度、掉落的位置区域坐标数据,数据预处理后传入实
时介质筛选模块,实时介质筛选模块将数据代入到介质筛选模型,然后得到介质筛选的结
果,进而对介质进行分离。
[0109] 本发明通过数据采集模块获取的样本数据,采用基于机器学习的方法对保密存储介质自动筛选,与人工通过不同的滤网过滤方法相比,本发明可以同时满足对不同材质的
不同尺寸要求,一次性实现自动筛选的过程,提高了速度,也降低了人工的成本。
[0110] 由于本发明筛选分离保密存储介质的实时性特点,因此在一定程度上可以避免过度粉碎导致的用电浪费,同时也会延长设备的使用寿命。
[0111] 另外,与直接通过风力分离相比,本发明利用机器学习的方法对介质筛选分离的准确性更高。
[0112] 本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
[0113] 本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据
本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不
应理解为对本发明的限制。