一种基于数据分析的机器打分系统及方法转让专利
申请号 : CN202010058365.5
文献号 : CN111274234B
文献日 : 2021-07-30
发明人 : 陈红光 , 张福秋
申请人 : 温州市中鼎网络科技有限公司
摘要 :
权利要求 :
1.一种基于数据分析的机器打分系统,包括:数据录入装置,用于录入学生的成绩数据;所述数据录入装置具有若干个,分配给不同的教师,教师分别通过专属的数据录入装置,录入学生的成绩信息;数据分析装置,用于对录入的成绩信息进行数据分析,得出学生的综合成绩,以及对录入的成绩信息进行加密;其特征在于,
所述数据分析装置,对录入的成绩信息进行数据分析,得出学生的综合成绩的方法执行以下步骤:对采集的原始数据进行清洗和集成;对经预处理后的数据利用熵进行离散化处理,以得到为标称型数据的样本集;构建用于训练的逻辑回归模型,从经数据转换的样本集中随机抽取一份数据集作为训练集,并基于该训练集对构建的逻辑回归模型的参数进行求解,以得到最终的分析模型;将样本集中的另一份数据集作为测试集,利用得到的最终的分析模型进行测试,以得到分析结果;采用多种评估度量对分析结果的准确性进行评估;
所述构建用于训练的逻辑回归模型,从经数据转换的样本集中随机抽取一份数据集作为训练集,并基于该训练集对构建的逻辑回归模型的参数进行求解,以得到最终的分析模型的方法执行以下步骤:基于训练集使用如下的转换函数,对数据进行线性变换,进行逻辑回归模型的参数进行求解:
* ′
其中,x为求解得到的参数;x为训练集;min为进行数据中的最小值计算;max为进行数据中的最大值计算;进行数据建模,得到分析模型;进行效果分析,包括:当模型训练结束后,采用如下公式,计算分析模型的分析结果与预测结果进行2
精准度计算,即得到R得分,得分越高,表示分析准确率越高;
其中y代表预测结果;
代表分析结果;
nsamples代表进入模型的样本量大小;
所述数据分析装置,对录入的成绩信息进行数据分析,得出学生的综合成绩,以及对录入的成绩信息进行加密的方法执行以下步骤:步骤1:设定第一加密密钥函数,用Si表示,将每个输入变量与相对应的权重函数进行卷积运算,得到第一加密密钥的中间结果;
步骤2:设定第二加密密钥函数,所述第二加密密钥函数为明函数:设定随机判定阈值为:P;将第一加密密钥函数和第二加密密钥函数以及随机判定阈值进行卷积运算,得到加密的结果为:步骤3:分析计算前向加密结果的误差;设定训练的输出变量EI为实际值,但模型训练后会产生一个预测值为Oi,故得出误差函数为: 其中m代表输入本次建模样本的数量,i表示第i个变量;
步骤4:反向传播更新权重w直到误差函数算出的值在设定的阈值范围内,将得到的最终结果作为加密后的结果进行存储。
2.如权利要求1所述的系统,其特征在于,所述数据分析装置,对录入的成绩信息进行数据分析,得出学生的综合成绩的方法执行以下步骤:对采集的原始数据进行清洗和集成;
对经预处理后的数据利用熵进行离散化处理,以得到为标称型数据的样本集;构建用于训练的逻辑回归模型,从经数据转换的样本集中随机抽取一份数据集作为训练集,并基于该训练集对构建的逻辑回归模型的参数进行求解,以得到最终的分析模型;将样本集中的另一份数据集作为测试集,利用得到的最终的分析模型进行测试,以得到分析结果;采用多种评估度量对分析结果的准确性进行评估。
3.如权利要求2所述的系统,其特征在于,所述数据分析装置,对采集的成绩信息进行清洗和集成的方法执行以下步骤:在坐标轴中设置四个象限的数据过滤集合分别采用如下公式进行表示:
其中,β为成绩信息, 为实数集合,p为第一参数,取值范围为:1~10;q为第二参数,取值范围为:11~100;将成绩信息落入数据过滤集合以外的数据进行剔除,完成数据的清洗和集成。
4.如权利要求3所述的系统,其特征在于,所述对经预处理后的数据利用熵进行离散化处理,以得到为标称型数据的样本集的方法执行以下步骤:将数据清理和集成后的数据通过范式矩阵进行分离,将连续的数据进行离散化,简化后续计算的运算量;所述通过范式矩阵进行分离的方法使用如下公式进行分离:其中,||||2为进行范数运算,X为系数矩阵,其行列数与进行离散化的数据的种类一致,A为进行离散化的数据排列成的矩阵,G为调整系数,设置的范围为:0.2~0.7。
5.一种基于权利要求1至4之一所述系统的基于数据分析的机器打分方法,其特征在于,所述方法执行以下步骤:
首先,通过数据录入装置录入学生的成绩数据;
然后,通过数据分析装置对录入的成绩信息进行数据分析,得出学生的综合成绩,以及对录入的成绩信息进行加密。
6.如权利要求5所述的方法,其特征在于,所述通过数据分析装置对录入的成绩信息进行数据分析,得出学生的综合成绩,以及对录入的成绩信息进行加密的方法执行以下步骤:步骤1:设定第一加密密钥函数,用Si表示,将每个输入变量与相对应的权重函数进行卷积运算,得到第一加密密钥的中间结果;
步骤2:设定第二加密密钥函数,所述第二加密密钥函数为明函数:设定随机判定阈值为:P;将第一加密密钥函数和第二加密密钥函数以及随机判定阈值进行卷积运算,得到加密的结果为:步骤3:分析计算前向加密结果的误差;设定训练的输出变量EI为实际值,但模型训练后会产生一个预测值为Oi,故得出误差函数为: 其中m代表输入本次建模样本的数量,i表示第i个变量;
步骤4:反向传播更新权重w直到误差函数算出的值在设定的阈值范围内,将得到的最终结果作为加密后的结果进行存储。
7.如权利要求6所述的方法,其特征在于,所述通过数据分析装置对录入的成绩信息进行数据分析,得出学生的综合成绩的方法执行以下步骤:对采集的原始数据进行清洗和集成;对经预处理后的数据利用熵进行离散化处理,以得到为标称型数据的样本集;构建用于训练的逻辑回归模型,从经数据转换的样本集中随机抽取一份数据集作为训练集,并基于该训练集对构建的逻辑回归模型的参数进行求解,以得到最终的分析模型;将样本集中的另一份数据集作为测试集,利用得到的最终的分析模型进行测试,以得到分析结果;采用多种评估度量对分析结果的准确性进行评估。
8.如权利要求7所述的方法,其特征在于,所述通过数据分析装置对采集的成绩信息进行清洗和集成的方法执行以下步骤:在坐标轴中设置四个象限的数据过滤集合分别采用如下公式进行表示:
其中,β为成绩信息, 为实数集合,p为第一参数,取值范围为:1~10;q为第二参数,取值范围为:11~100;将成绩信息落入数据过滤集合以外的数据进行剔除,完成数据的清洗和集成。
9.如权利要求6所述的方法,其特征在于,所述对经预处理后的数据利用熵进行离散化处理,以得到为标称型数据的样本集的方法执行以下步骤:将数据清理和集成后的数据通过范式矩阵进行分离,将连续的数据进行离散化,简化后续计算的运算量;所述通过范式矩阵进行分离的方法使用如下公式进行分离:其中,||||2为进行范数运算,X为系数矩阵,其行列数与进行离散化的数据的种类一致,A为进行离散化的数据排列成的矩阵,G为调整系数,设置的范围为:0.2~0.7。
说明书 :
一种基于数据分析的机器打分系统及方法
技术领域
背景技术
有用信息和形成结论而对数据加以详细研究和概括总结的过程。
更改和泄露。由此计算机网络的安全可以理解为:通过采用各种技术和管理措施,使网络系
统正常运行,从而确保网络数据的可用性、完整性和保密性。所以,建立网络安全保护措施
的目的是确保经过网络传输和交换的数据不会发生增加、修改、丢失和泄露等。
数据防护的安全,主要是采用现代信息存储手段对数据进行主动防护,如通过磁盘阵列、数
据备份、异地容灾等手段保证数据的安全,数据安全是一种主动的包含措施,数据本身的安
全必须基于可靠的加密算法与安全体系,主要是有对称算法与公开密钥密码体系两种。
象,某些敏感或保密的数据可能不具备资格的人员或操作员阅读,而造成数据泄密等后果。
发明内容
更加准确分析出学生成绩,更为客观展现学生成绩。
置,录入学生的成绩信息;数据分析装置,用于对录入的成绩信息进行数据分析,得出学生
的综合成绩,以及对录入的成绩信息进行加密;其特征在于,所述数据分析装置,对录入的
成绩信息进行数据分析,得出学生的综合成绩,以及对录入的成绩信息进行加密的方法执
行以下步骤:步骤1:设定第一加密密钥函数,用Si表示,将每个输入变量与相对应的权重函
数进行卷积运算,得到第一加密密钥的中间结果;步骤2:设定第二加密密钥函数,所述函数
为明函数: 设定随机判定阈值为:P;将第一加密密钥函数和第
二加密密钥函数以及随机判定阈值进行卷积运算,得到加密的结果为:
其中m代表输入本次建模样本的数量,i表示
第i个变量;步骤4:反向传播更新权重w直到误差函数算出的值再设定的阈值范围内,将得
到的最终结果作为加密后的结果进行存储。
熵进行离散化处理,以得到为标称型数据的样本集;构建用于训练的逻辑回归模型,从经数
据转换的样本集中随机抽取一份数据集作为训练集,并基于该训练集对构建的逻辑回归模
型的参数进行求解,以得到最终的分析模型;将样本集中的另一份数据集作为测试集,利用
得到的最终的分析模型进行测试,以得到分析结果;采用多种评估度量对分析结果的准确
性进行评估。
其中,x为成绩信息, 为实数集合,p为第一参
数,取值范围为:(1~10);q为第一参数,取值范围为:(11~100);将成绩信息落入数据过滤
集合以外的数据进行剔除,完成数据的清洗和集成。
连续的数据进行离散化,简化后续计算的运算量;所述通过范式矩阵进行分离的方法使用
如下公式进行分离:
为调整系数,设置的范围为:(0.2~0.7)。
到最终的分析模型的方法执行以下步骤:基于训练集使用如下的转换函数,对数据进行线
*
性变换,进行逻辑回归模型的的参数进行求解: 其中,x为求
解得到的参数;x为训练集;min为进行数据中的最小值计算;max为进行数据中的最大值计
算;进行数据建模,得到分析模型;进行效果分析,包括:当模型训练结束后,采用如下公式,
2
计算分析模型的分析结果与预测结果进行精准度计算,即得到R得分,得分越高,表示分析
准确率越高;
以及对录入的成绩信息进行加密。
数,用Si表示,将每个输入变量与相对应的权重函数进行卷积运算,得到第一加密密钥的中
间结果;步骤2:设定第二加密密钥函数,所述函数为明函数:
设定随机判定阈值为:P;将第一加密密钥函数和第二加密密钥函数以及随机判定阈值进行
卷积运算,得到加密的结果为:
其中m代表输入本次建模样本的数量,i表示
第i个变量;步骤4:反向传播更新权重w直到误差函数算出的值再设定的阈值范围内,将得
到的最终结果作为加密后的结果进行存储。
熵进行离散化处理,以得到为标称型数据的样本集;构建用于训练的逻辑回归模型,从经数
据转换的样本集中随机抽取一份数据集作为训练集,并基于该训练集对构建的逻辑回归模
型的参数进行求解,以得到最终的分析模型;将样本集中的另一份数据集作为测试集,利用
得到的最终的分析模型进行测试,以得到分析结果;采用多种评估度量对分析结果的准确
性进行评估。
其中,x为成绩信息, 为实数集合,p为第一参
数,取值范围为:(1~10);q为第一参数,取值范围为:(11~100);将成绩信息落入数据过滤
集合以外的数据进行剔除,完成数据的清洗和集成。
连续的数据进行离散化,简化后续计算的运算量;所述通过范式矩阵进行分离的方法使用
如下公式进行分离:
为调整系数,设置的范围为:(0.2~0.7)。
这种方式加密的数据,破解难度比常规加密方式更难,且其加密结果能够预测,也就是说加
密结果可以提前被解密方知道,不需要进行密钥的传输,进一步增强了数据的安全性;另
外,通过对数据采用四象限数据集合进行数据清洗和数据集成,其数据清洗的效率高、数据
过滤的结果更加准确,不会删除有效数据;进行数据离散化也能加速后期的数据分析过程;
同时,本发明使用模型分析,能够对分析结果进行预测,智能化程度高更高,具有学习能力,
分析效率也会逐步提升,从远期看,其数据分析的效率大大高于普通的数据分析方法。
附图说明
实验图;
具体实施方式
过专属的数据录入装置,录入学生的成绩信息;数据分析装置,用于对录入的成绩信息进行
数据分析,得出学生的综合成绩,以及对录入的成绩信息进行加密;其特征在于,所述数据
分析装置,对录入的成绩信息进行数据分析,得出学生的综合成绩,以及对录入的成绩信息
进行加密的方法执行以下步骤:步骤1:设定第一加密密钥函数,用Si表示,将每个输入变量
与相对应的权重函数进行卷积运算,得到第一加密密钥的中间结果;步骤2:设定第二加密
密钥函数,所述函数为明函数:
步骤3:分析计算前向加密结果的误差;设定训练的输出变量EI
为实际值,但模型训练后会产生一个预测值为Oi,故得出误差函数为:
其中m代表输入本次建模样本的数量,i表示
第i个变量;步骤4:反向传播更新权重w直到误差函数算出的值再设定的阈值范围内,将得
到的最终结果作为加密后的结果进行存储。
其加密结果能够预测,也就是说加密结果可以提前被解密方知道,不需要进行密钥的传输,
进一步增强了数据的安全性;另外,通过对数据采用四象限数据集合进行数据清洗和数据
集成,其数据清洗的效率高、数据过滤的结果更加准确,不会删除有效数据;进行数据离散
化也能加速后期的数据分析过程;同时,本发明使用模型分析,能够对分析结果进行预测,
智能化程度高更高,具有学习能力,分析效率也会逐步提升,从远期看,其数据分析的效率
大大高于普通的数据分析方法。
后的数据利用熵进行离散化处理,以得到为标称型数据的样本集;构建用于训练的逻辑回
归模型,从经数据转换的样本集中随机抽取一份数据集作为训练集,并基于该训练集对构
建的逻辑回归模型的参数进行求解,以得到最终的分析模型;将样本集中的另一份数据集
作为测试集,利用得到的最终的分析模型进行测试,以得到分析结果;采用多种评估度量对
分析结果的准确性进行评估。
低效的算法,甚至实现根本不可能实现的算法。要掌握这个思想,必须从大量的题目中理解
此方法的特点。例如,在建造线段树空间不够的情况下,可以考虑离散化。
示:
根本意义上讲,数字计算机所进行的数值计算仅仅是“数字”计算,它表示数值的精度受限
于字长,这将引入舍入误差;另一方面,这种计算是按指令一步一步进行的,因而,还必须将
时间离散化,这样就只能得到离散时间点上系统性能。用数字仿真的方法对微分方程的数
值积分是通过某种数值计算方法来实现的。任何一种计算方法都只能是原积分的一种近
似。因此,连续系统仿真,从本质上是对原连续系统从时间、数值两个方面对原系统进行离
散化,并选择合适的数值计算方法来近似积分运算,由此得到的离散模型来近似原连续模
型。如何保证离散模型的计算结果从原理上确能代表原系统的行为,这是连续系统数字仿
真首先必须解决的问题。
进行分离,将连续的数据进行离散化,简化后续计算的运算量;所述通过范式矩阵进行分离
的方法使用如下公式进行分离: 其中,||
为进行范数运算,X为系数矩阵,其行列数与进行离散化的数据的种类一致,A为进行离散化
的数据排列成的矩阵,G为调整系数,设置的范围为:(0.2~0.7)。
的分类体系有有监督的和无监督的、动态的和静态的、全局的和局部的、分裂式的(从上至
下)和合并式的(从下至上)、单变量的和多变量的以及直接的和增量式的。
过程当中无需使用类别信息,这类方法的典型代表是分箱方法,包括等宽度分箱和等频率
分箱。分箱方法使用箱均值或箱中位数替换箱中的每一个值来将数据离散化。实际应用中,
分箱方法效果不佳,特别是当数值数据分布不均匀的时候。有监督的离散化方法在离散化
过程当中需要使用类别信息。以前的研究表明,有监督的方法比无监督的方法效果要好。
化处理。
行求解,以得到最终的分析模型的方法执行以下步骤:基于训练集使用如下的转换函数,对
数据进行线性变换,进行逻辑回归模型的的参数进行求解:
*
其中,x为求解得到的参数;x为训练集;min为进行数据中的最小值计算;max为进行数据中
的最大值计算;进行数据建模,得到分析模型;进行效果分析,包括:当模型训练结束后,采
2
用如下公式,计算分析模型的分析结果与预测结果进行精准度计算,即得到R得分,得分越
高,表示分析准确率越高;
式识别、智能控制、组合优化、预测等领域得到成功应用。人工神经网络与其它传统方法相
结合,将推动人工智能和信息处理技术不断发展。近年来,人工神经网络正向模拟人类认知
的道路上更加深入发展,与模糊系统、遗传算法、进化机制等结合,形成计算智能,成为人工
智能的一个重要方向,将在实际应用中得到发展。将信息几何应用于人工神经网络的研究,
为人工神经网络的理论研究开辟了新的途径。神经计算机的研究发展很快,已有产品进入
市场。光电结合的神经计算机为人工神经网络的发展提供了良好条件。
合以及由此而来的混合方法和混合系统,已经成为一大研究热点。由于其他方法也有它们
各自的优点,所以将神经网络与其他方法相结合,取长补短,继而可以获得更好的应用效
果。目前这方面工作有神经网络与模糊逻辑、专家系统、遗传算法、小波分析、混沌、粗集理
论、分形理论、证据理论和灰色系统等的融合。
有技术的分析效率更高。
的综合成绩,以及对录入的成绩信息进行加密。
一加密密钥函数,用Si表示,将每个输入变量与相对应的权重函数进行卷积运算,得到第一
加密密钥的中间结果;步骤2:设定第二加密密钥函数,所述函数为明函数:
步骤3:分析计算前向加密结果的误差;设定训练的输出变量EI
为实际值,但模型训练后会产生一个预测值为Oi,故得出误差函数为:
其中m代表输入本次建模样本的数量,i表示
第i个变量;步骤4:反向传播更新权重w直到误差函数算出的值再设定的阈值范围内,将得
到的最终结果作为加密后的结果进行存储。
后的数据利用熵进行离散化处理,以得到为标称型数据的样本集;构建用于训练的逻辑回
归模型,从经数据转换的样本集中随机抽取一份数据集作为训练集,并基于该训练集对构
建的逻辑回归模型的参数进行求解,以得到最终的分析模型;将样本集中的另一份数据集
作为测试集,利用得到的最终的分析模型进行测试,以得到分析结果;采用多种评估度量对
分析结果的准确性进行评估。
示:
进行分离,将连续的数据进行离散化,简化后续计算的运算量;所述通过范式矩阵进行分离
的方法使用如下公式进行分离: 其中,||
为进行范数运算,X为系数矩阵,其行列数与进行离散化的数据的种类一致,A为进行离散化
的数据排列成的矩阵,G为调整系数,设置的范围为:(0.2~0.7)。
内受到制约。
实施例中的模块或者步骤再分解或者组合,例如,上述实施例的模块可以合并为一个模块,
也可以进一步拆分成多个子模块,以完成以上描述的全部或者部分功能。对于本发明实施
例中涉及的模块、步骤的名称,仅仅是为了区分各个模块或者步骤,不视为对本发明的不当
限定。
在此不再赘述。
应的程序可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编
程ROM、寄存器、硬盘、可移动磁盘、CD‑ROM、或技术领域内所公知的任意其它形式的存储介
质中。为了清楚地说明电子硬件和软件的可互换性,在上述说明中已经按照功能一般性地
描述了各示例的组成及步骤。这些功能究竟以电子硬件还是软件方式来执行,取决于技术
方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法
来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
其它要素,或者还包括这些过程、方法、物品或者设备/装置所固有的要素。
发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些
更改或替换之后的技术方案都将落入本发明的保护范围之内。