一种基于边缘计算的智能扫描管理系统及方法转让专利

申请号 : CN202211679176.5

文献号 : CN115661183B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 杨兴中黄利周雨桐张彦伟杨胜陈恩占储晨

申请人 : 南京功夫豆信息科技有限公司

摘要 :

本发明涉及文字管理技术领域,具体为一种基于边缘计算的智能扫描管理系统及方法,包括以下步骤:S1:采集试卷扫描的图像信息;S2:存储所有采集到的数据;S3:利用边缘检测算法提取试卷的图像特征;S4:区分手写字迹和印刷字迹,并判断印刷字迹是否需要修改;S5:对分析的结果进行处理;S6:显示空白试卷内容并做打印处理;通过将扫描的页面数据分割成多个区块,将文字用区块限制,大大提高了数据分析的准确性;通过设计一个可以区分手写字迹和印刷字迹的同时能够替换需要修改的印刷字迹的系统,极大地优化了试卷翻新功能。

权利要求 :

1.一种基于边缘计算的智能扫描管理方法,其特征在于:包括以下步骤:S1:采集试卷扫描的图像信息;

S2:存储所有采集到的数据;

S3:利用边缘检测算法提取试卷的图像特征;

S4:获取步骤S3中的图像特征,根据图像特征区分手写字迹和印刷字迹,并判断印刷字迹是否需要修改;

S5:对分析的结果进行处理;

S6:显示空白试卷内容并做打印处理;

在步骤S3中:利用边缘检测算法将图像信息进行边缘模糊:建立二维平面坐标,则得到图像信息的像素点集合  ;根据公式:,进一步得到边缘模糊后的图像信息集合 ;其中, 表示像素点 对应的像素值,z表示滤波器大小, 表示高斯滤波,表示常数;

在步骤S4中:系统从图像信息集合 中获取试卷文字数据为 ;

同时,利用DFS搜索算法将扫描的页面数据分割成 个区块,则任意区块内的文字数据为,其中, ,表示区块j的文字总个数;

区分手写字迹和印刷字迹,并判断印刷字迹是否需要修改,具体包括以下步骤:S401:在区块内区分手写字迹和印刷字迹,步骤如下:K1:将文字数据 与字体库 进行对比:通过遍历 区块,提取文字数据,根据对比公式:

,得到区块j的文字相似度集合

;其中,表示区块j内每一个文字与字体库的相似度值;

K2:比较相似度 大小,区分手写字迹和印刷字迹:通过遍历相似度集合,若 ,则表示区块j内的文字 为印刷字迹,反之,若 ,则表示区块j内的文字 为手写字迹,其中,为所设阈值;

S402:判断区块内的印刷字迹是否需要修改,并确认修改数据,步骤如下:U1:比较相似度集合 与 的关系:若存在 ,则表示区块 内的印刷字迹存在需要修改的可能性,此时,进入步骤U2;反之,若存在 ,则表示区块内的印刷字迹不需要修改,此时,进入步骤S503;

U2:由步骤U1确定区块内同时存在印刷字迹和手写字迹,表示印刷字迹可能存在修改,则遍历区块j的文字数据为 ,将 和 的数据进行筛选分类,分别得到印刷字迹集 和手写字迹集 ;其中,表示区块j的印刷字迹总个数, 表示区块j的手写字迹总个数;

U3:计算印刷字迹和手写字迹的文字笔画相似度:将区块j内的印刷字迹集 和手写字迹集 利用Word Embedding算法分别映射到向量空间中,同时,将两个字迹集中的每一个文字 进行拆解,则得到文字笔画向量集 , ;通过遍历 和 中的每一个文字,根据公式: ,得到相似度集合;其中,和 分别表示字迹笔画数,表示 中每一个文字与中每一个文字的相似度值;

U4:通过比较文字相似度判断区块内的印刷字迹是否需要修改:遍历相似度集合 ,若存在 ,则表示印刷字迹集 中存在需要修改的文字 ,此时,提取手写字迹集 中相应的文字 ,确认修改数据为 ,进入步骤S501;反之,则表示区块j内的印刷字迹集 不需要修改,此时,进入步骤S503;

在步骤S5中:对分析的结果进行处理,具体包括以下步骤:S501:由步骤U4确认需要修改的印刷字迹,将需要修改的印刷字迹 替换为与之对应的手写字迹 ;

S502:利用手写字迹模拟算法将手写字迹 转换成印刷字体;

S503:当步骤U1和步骤U4确认区块内的印刷字迹不需要修改时,消除试卷页面的所有手写字迹,保留修改后的印刷字迹。

2.一种实现权利要求1所述的一种基于边缘计算的智能扫描管理方法的智能扫描管理系统,其特征在于:所述系统包括:数据采集模块、数据库、数据分析模块、数据处理模块和数据反馈模块;

所述数据采集模块的输出端连接所述数据库的输入端,所述数据库的输出端连接所述数据分析模块的输入端,所述数据分析模块的输出端连接所述数据处理模块的输入端,所述数据处理模块的输出端连接所述数据反馈模块的输入端;

通过所述数据采集模块采集试卷扫描的图像信息;

通过所述数据库存储所有采集到的数据;

通过所述数据分析模块区分手写字迹和印刷字迹,并判断印刷字迹是否需要修改;

通过所述数据处理模块对所述数据分析模块分析的结果进行处理;

通过所述数据反馈模块显示空白试卷内容并做打印处理。

3.根据权利要求2所述的智能扫描管理系统,其特征在于:所述数据分析模块包括方格划分单元、字迹识别单元和关联性分析单元;

所述方格划分单元用于利用DFS搜索算法将试卷扫描页面划分为多个区块;所述字迹识别单元用于识别区块内是否同时存在手写字迹和印刷字迹,若存在,则进入所述关联性分析单元,反之,则进入所述数据处理模块;所述关联性分析单元用于利用相似性算法分析区块内手写字迹与印刷字迹的关联性,进一步判断印刷字迹是否需要修改。

4.根据权利要求3所述的智能扫描管理系统,其特征在于:所述数据处理模块包括替换单元、字迹转换单元和选择单元;

所述替换单元用于将需要修改的印刷字迹替换为与之对应的手写字迹,并将替换的数据发送至所述字迹转换单元;所述字迹转换单元用于将替换后的手写字迹转换为印刷字迹;所述选择单元用于消除手写字迹,保留修改后的印刷字迹,并将数据发送至所述数据反馈模块。

5.根据权利要求4所述的智能扫描管理系统,其特征在于:所述数据反馈模块包括显示单元和打印控制单元;

所述显示单元用于显示修改后的空白试卷;所述打印控制单元用于将试卷进行打印处理。

说明书 :

一种基于边缘计算的智能扫描管理系统及方法

技术领域

[0001] 本发明涉及文字管理技术领域,具体为一种基于边缘计算的智能扫描管理系统及方法。

背景技术

[0002] 许多学生在做试卷时都会进行改错,而在原来的试卷上进行改错非常麻烦,不仅要使用不同颜色的笔,而且试卷的面积有限,大大制约了改错题的效果;因此,随着打印技术的不断更新与发展,产生了试卷翻新的功能,它可以实现字迹擦除功能,大大减少了学生在学习时改错题的时间,提高学习效率。
[0003] 然而,在现有技术中,存在需要修改试卷题目等印刷字迹的现象,此时,若使用试卷翻新的功能时,修改题目的字迹也会消失,从而影响学生对试卷的二次使用率。
[0004] 所以,人们需要一种基于边缘计算的智能扫描管理系统及方法来解决上述问题,通过设计一个可以区分手写字迹和印刷字迹的同时能够替换需要修改的印刷字迹的系统,极大地优化了试卷翻新功能,提高了学生对试卷的二次使用率。

发明内容

[0005] 本发明的目的在于提供一种基于边缘计算的智能扫描管理系统及方法,以解决上述背景技术中提出的问题。
[0006] 为了解决上述技术问题,本发明提供如下技术方案:一种基于边缘计算的智能扫描管理方法,包括以下步骤:
[0007] S1:采集试卷扫描的图像信息;
[0008] S2:存储所有采集到的数据;
[0009] S3:利用边缘检测算法提取试卷的图像特征;
[0010] S4:区分手写字迹和印刷字迹,并判断印刷字迹是否需要修改;
[0011] S5:对分析的结果进行处理;
[0012] S6:显示空白试卷内容并做打印处理。
[0013] 进一步的,在步骤S1中:采集试卷扫描的图像信息,得到图像信息的像素点集合。
[0014] 进一步的,在步骤S2中:存储所有采集到的数据,同时存储字体库。
[0015] 进一步的,在步骤S3中:利用边缘检测算法将图像信息进行边缘模糊,简化图像所带的信息作为后续其它的图像处理,便于确认文字范围,有利于后续对图像中文字的识别:建立二维平面坐标,则得到图像信息的像素点集合 ;根据公式:
,进一步得到边缘模糊后的图像信息集合 ;其中,
表示像素点 对应的像素值,z表示滤波器大小, 表示高斯滤波,表示
常数。
[0016] 进一步的,在步骤S4中:系统从图像信息集合 中获取试卷文字数据为;同时,利用DFS搜索算法将扫描的页面数据分割成 个区块,将文字用区块限制,使区块内的文字数量很少,相当于一两个词汇,便于对后续印刷字迹和手写字迹的分析,大大提高了数据分析的准确性;则任意区块内的文字数据为
,其中, ,表示区块j的文字总个数;所述DFS搜索算法
属于本领域技术人员的常规技术手段,因此,并未做出过多的赘述;
[0017] 区分手写字迹和印刷字迹,并判断印刷字迹是否需要修改,具体包括以下步骤:
[0018] S401:在区块内区分手写字迹和印刷字迹,步骤如下:
[0019] K1:将文字数据 与字体库 进行对比:通过遍历 区块,提取文字数据,根据对比公式:,得到区块j的文字相似度集合
;其中,表示区块j内每一个文字与字体库的相似度值;
[0020] K2:比较相似度 大小,区分手写字迹和印刷字迹:通过遍历相似度集合,若 ,则表示区块j内的文字 为印刷字迹,反之,若 ,则表示区块j内的文字 为手写字迹;
[0021] S402:判断区块内的印刷字迹是否需要修改,并确认修改数据,步骤如下:
[0022] U1:比较相似度集合 与 的关系:若存在 ,说明相似度集合 中存在大于阈值 和小于阈值 的子集,则表示区块j内同时存在印刷字迹和手写字迹,说明区块 内的印刷字迹存在需要修改的可能性,此时,进入步骤U2;反之,若存在,则表示区块 内的印刷字迹不需要修改;
[0023] U2:由步骤U1确定区块内同时存在印刷字迹和手写字迹,表示印刷字迹可能存在修改,则遍历区块j的文字数据为 ,将 和 进行筛选分类,分别得到印刷字迹集 和手写字迹集 ;其中,表示区块j
的印刷字迹总个数, 表示区块j的手写字迹总个数;
[0024] U3:计算印刷字迹和手写字迹的文字笔画相似度:将区块j内的印刷字迹集 和手写字迹集 利用Word Embedding算法分别映射到向量空间中,同时,将两个字迹集中的每一个文字 进行拆解,则得到文字笔画向量集 , ;通过遍历 和 中的每一个文字,根据公式: ,得到相似度
集合 ;其中,和 分别表示字迹笔画数,表示 中每一个文字
与 中每一个文字的相似度值;其中,所述Word Embedding算法属于本领域技术人员的常规技术手段,因此,并未做出过多的赘述;
[0025] U4:通过比较文字相似度判断区块内的印刷字迹是否需要修改:通过遍历相似度集合 ,若存在 ,其中,为所设阈值,则表示印刷字迹集 中存在需要修改的文字 ,此时,提取手写字迹集 中相应的文字 ,确认修改数据为 ;反之,则表示区块j内的印刷字迹集 不需要修改。
[0026] 进一步的,在步骤S5中:对分析的结果进行处理,具体包括以下步骤:
[0027] S501:由步骤U4确认需要修改的印刷字迹,将需要修改的印刷字迹 替换为与之对应的手写字迹 ;
[0028] S502:利用手写字迹模拟算法将手写字迹 转换成印刷字体;其中,所述手写字迹模拟算法属于本领域技术人员的常规技术手段,因此,并未做出过多的赘述;
[0029] S503:当步骤U1和步骤U4确认区块内的印刷字迹不需要修改时,消除试卷页面的所有手写字迹,保留修改后的印刷字迹。
[0030] 进一步的,在步骤S6中:显示修改数据后的空白试卷内容并做打印处理,通过对试卷翻新,便于后续用户学习更加高效率,更加方便的整理错题;
[0031] 一种实现一种基于边缘计算的智能扫描管理方法的智能扫描管理系统,所述系统包括:数据采集模块、数据库、数据分析模块、数据处理模块和数据反馈模块;
[0032] 所述数据采集模块的输出端连接所述数据库的输入端,所述数据库的输出端连接所述数据分析模块的输入端,所述数据分析模块的输出端连接所述数据处理模块的输入端,所述数据处理模块的输出端连接所述数据反馈模块的输入端;
[0033] 通过所述数据采集模块采集试卷扫描的图像信息;
[0034] 通过所述数据库存储所有采集到的数据;
[0035] 通过所述数据分析模块区分手写字迹和印刷字迹,并判断印刷字迹是否需要修改;
[0036] 通过所述数据处理模块对所述数据分析模块分析的结果进行处理;
[0037] 通过所述数据反馈模块显示空白试卷内容并做打印处理。
[0038] 进一步的,所述数据分析模块包括方格划分单元、字迹识别单元和关联性分析单元;
[0039] 所述方格划分单元用于利用DFS搜索算法将试卷扫描页面划分为多个区块,便于后续对印刷字迹是否需要修改的判断;所述字迹识别单元用于识别区块内是否同时存在手写字迹和印刷字迹,若存在,则进入所述关联性分析单元,反之,则进入所述数据处理模块;所述关联性分析单元用于利用相似性算法分析区块内手写字迹与印刷字迹的关联性,进一步判断印刷字迹是否需要修改。
[0040] 进一步的,所述数据处理模块包括替换单元、字迹转换单元和选择单元;
[0041] 所述替换单元用于将需要修改的印刷字迹替换为与之对应的手写字迹,并将替换的数据发送至所述字迹转换单元;所述字迹转换单元用于将替换后的手写字迹转换为印刷字迹;所述选择单元用于消除手写字迹,保留修改后的印刷字迹,并将数据发送至所述数据反馈模块。
[0042] 进一步的,所述数据反馈模块包括显示单元和打印控制单元;
[0043] 所述显示单元用于显示修改后的空白试卷;所述打印控制单元用于将试卷进行打印处理;对试卷翻新,便于后续用户学习更加高效率,更加方便的整理错题。
[0044] 与现有技术相比,本发明所达到的有益效果是:
[0045] 本发明通过利用边缘检测算法简化图像所带的信息作为后续其它的图像处理,便于确认文字范围,更有利于后续对图像中文字的识别;通过将扫描的页面数据分割成个区块,将文字用区块限制,便于对后续印刷字迹和手写字迹的分析,大大提高了数据分析的准确性;通过利用对比公式比较区块内字体相似度来区分手写字迹和印刷字迹,更有利于提高对字迹识别的准确性;通过比较相似度集合与阈值的关系并将数据进行筛选分类,更有利于后续对区块内的印刷字迹是否需要修改的判断;通过比较印刷字迹和手写字迹的文字笔画相似度,进一步确认区块内的印刷字迹是否需要修改,极大地提高的数据判断的准确性和严谨性;利用手写字迹模拟算法将手写字迹转换成印刷字体,避免后续对修改后的字迹进行清理,提高了学生对试卷的二次使用率;解决了使用“试卷翻新”的功能时,修改题目的字迹也会消失的问题,优化了数据,使功能更加完善。

附图说明

[0046] 附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
[0047] 图1是本发明一种基于边缘计算的智能扫描管理系统的结构图;
[0048] 图2是本发明一种基于边缘计算的智能扫描管理方法的流程图。

具体实施方式

[0049] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0050] 请参阅图1‑图2,本发明提供技术方案:一种基于边缘计算的智能扫描管理方法,包括以下步骤:
[0051] S1:采集试卷扫描的图像信息;
[0052] 在步骤S1中:采集试卷扫描的图像信息,得到图像信息的像素点集合。
[0053] S2:存储所有采集到的数据;
[0054] 在步骤S2中:存储所有采集到的数据,同时存储字体库作为训练样本集。
[0055] S3:利用边缘检测算法提取试卷的图像特征;
[0056] 在步骤S3中:利用边缘检测算法将图像信息进行边缘模糊,简化图像所带的信息作为后续其它的图像处理,便于确认文字范围,有利于后续对图像中文字的识别:建立二维平面坐标,则得到图像信息的像素点集合 ;根据公式:,进一步得到边缘模糊后的图像信息集合 ;其中,
表示像素点 对应的像素值,z表示滤波器大小, 表示高斯滤波,表示
常数。
[0057] S4:区分手写字迹和印刷字迹,并判断印刷字迹是否需要修改;
[0058] 在步骤S4中:系统从图像信息集合 中获取试卷文字数据为;同时,利用DFS搜索算法将扫描的页面数据分割成 个区块,将文字
用区块限制,使区块内的文字数量很少,相当于一两个词汇,便于对后续印刷字迹和手写字迹的分析,大大提高了数据分析的准确性;则任意区块内的文字数据为
,其中, ,表示区块j的文字总个数;所述DFS搜索算法
属于本领域技术人员的常规技术手段,因此,并未做出过多的赘述;
[0059] 区分手写字迹和印刷字迹,并判断印刷字迹是否需要修改,具体包括以下步骤:
[0060] S401:在区块内区分手写字迹和印刷字迹,步骤如下:
[0061] K1:将文字数据 与字体库P进行对比:通过遍历 区块,提取文字数据,根据对比公式:,得到区块j的文字相似度集合
;其中,表示区块j内每一个文字与字体库的相似度值;
[0062] K2:比较相似度 大小,区分手写字迹和印刷字迹:通过遍历相似度集合,若 ,则表示区块j内的文字 为印刷字迹,反之,若 ,则表示区块j内的文字 为手写字迹,其中,表示所设阈值;
[0063] S402:判断区块内的印刷字迹是否需要修改,并确认修改数据,步骤如下:
[0064] U1:比较相似度集合 与 的关系:若存在 ,说明相似度集合 中存在大于阈值 和小于阈值 的子集,则表示区块j内同时存在印刷字迹和手写字迹,说明区块 内的印刷字迹存在需要修改的可能性,此时,进入步骤U2;反之,若存在,则表示区块内的印刷字迹不需要修改;
[0065] U2:由步骤U1确定区块内同时存在印刷字迹和手写字迹,表示印刷字迹可能存在修改,则遍历区块j的文字数据为 ,将 和 进行筛选分类,分别得到印刷字迹集 和手写字迹集 ;其中,表示区块j
的印刷字迹总个数, 表示区块j的手写字迹总个数;
[0066] U3:计算印刷字迹和手写字迹的文字笔画相似度:将区块j内的印刷字迹集 和手写字迹集 利用Word Embedding算法分别映射到向量空间中,同时,将两个字迹集中的每一个文字 进行拆解,则得到文字笔画向量集 , ;通过遍历 和 中的每一个文字,根据公式: ,得到相似度
集合 ;其中,和 分别表示字迹笔画数,表示 中每一个文字
与 中每一个文字的相似度值;其中,所述Word Embedding算法属于本领域技术人员的常规技术手段,因此,并未做出过多的赘述;
[0067] U4:通过比较文字相似度判断区块内的印刷字迹是否需要修改:通过遍历相似度集合 ,若存在 ,其中,为所设阈值,则表示印刷字迹集 中存在需要修改的文字 ,此时,提取手写字迹集 中相应的文字 ,确认修改数据为 ;反之,则表示区块j内的印刷字迹集 不需要修改。
[0068] S5:对分析的结果进行处理;
[0069] 在步骤S5中:对分析的结果进行处理,具体包括以下步骤:
[0070] S501:由步骤U4确认需要修改的印刷字迹,将需要修改的印刷字迹 替换为与之对应的手写字迹 ;
[0071] S502:利用手写字迹模拟算法将手写字迹 转换成印刷字体;其中,所述手写字迹模拟算法属于本领域技术人员的常规技术手段,因此,并未做出过多的赘述;
[0072] S503:当步骤U1和步骤U4确认区块内的印刷字迹不需要修改时,消除试卷页面的所有手写字迹,保留修改后的印刷字迹。
[0073] S6:显示空白试卷内容并做打印处理。
[0074] 在步骤S6中:显示修改数据后的空白试卷内容并做打印处理,通过对试卷翻新,便于后续用户学习更加高效率,更加方便的整理错题。
[0075] 一种实现一种基于边缘计算的智能扫描管理方法的智能扫描管理系统,所述系统包括:数据采集模块、数据库、数据分析模块、数据处理模块和数据反馈模块;
[0076] 所述数据采集模块的输出端连接所述数据库的输入端,所述数据库的输出端连接所述数据分析模块的输入端,所述数据分析模块的输出端连接所述数据处理模块的输入端,所述数据处理模块的输出端连接所述数据反馈模块的输入端;
[0077] 通过所述数据采集模块采集试卷扫描的图像信息;
[0078] 所述数据采集模块通过扫描试卷页面,采集试卷的图像信息,并将采集到的信息发送至所述数据库。
[0079] 通过所述数据库存储所有采集到的数据;
[0080] 所述数据库用于存储所有采集到的数据,同时存储字体库作为训练样本集。
[0081] 通过所述数据分析模块区分手写字迹和印刷字迹,并判断印刷字迹是否需要修改;
[0082] 所述数据分析模块包括方格划分单元、字迹识别单元和关联性分析单元;
[0083] 所述方格划分单元用于利用DFS搜索算法将试卷扫描页面划分为多个区块,便于后续对印刷字迹是否需要修改的判断;所述字迹识别单元用于识别区块内是否同时存在手写字迹和印刷字迹,若存在,则进入所述关联性分析单元,反之,则进入所述数据处理模块;所述关联性分析单元用于利用相似性算法分析区块内手写字迹与印刷字迹的关联性,进一步判断印刷字迹是否需要修改。
[0084] 通过所述数据处理模块对所述数据分析模块分析的结果进行处理;
[0085] 所述数据处理模块包括替换单元、字迹转换单元和选择单元;
[0086] 所述替换单元用于将需要修改的印刷字迹替换为与之对应的手写字迹,并将替换的数据发送至所述字迹转换单元;所述字迹转换单元用于将替换后的手写字迹转换为印刷字迹;所述选择单元用于消除手写字迹,保留修改后的印刷字迹,并将数据发送至所述数据反馈模块。
[0087] 通过所述数据反馈模块显示空白试卷内容并做打印处理。
[0088] 所述数据反馈模块包括显示单元和打印控制单元;
[0089] 所述显示单元用于显示修改后的空白试卷;所述打印控制单元用于将试卷进行打印处理;对试卷翻新,便于后续用户学习更加高效率,更加方便的整理错题。
[0090] 实施例一:
[0091] 在步骤S1中:采集试卷扫描的图像信息,得到图像信息的像素点集合。
[0092] 在步骤S2中:存储所有采集到的数据,同时存储字体库作为训练样本集。
[0093] 在步骤S3中:利用边缘检测算法将图像信息进行边缘模糊,简化图像所带的信息作为后续其它的图像处理:建立二维平面坐标,则得到图像信息的像素点集合;根据公式: ,进一步得到边缘模糊后的图像信息集合 ;其中, 表示像素点 对应的像素值,z表示滤波器大
小, 表示高斯滤波,表示常数。
[0094] 在步骤S4中:系统从图像信息集合 中获取试卷文字数据为;同时,利用DFS搜索算法将扫描的页面数据分割成 个区块,则每
一个区块内的文字数据为 ,其中, ;
[0095] 区分手写字迹和印刷字迹,并判断印刷字迹是否需要修改,具体包括以下步骤:
[0096] S401:在区块内区分手写字迹和印刷字迹,步骤如下:
[0097] K1:将文字数据 与字体库P进行对比:通过遍历 区块,提取某一区块j内文字数据,其中包含4个文字, ,根据对比公式:,得到区块j的文字相似度集合

[0098] K2:比较相似度 大小,区分手写字迹和印刷字迹:通过遍历相似度集合,若 ,则表示区块j内的文字 为印刷字迹,反之,若 ,则表示区块j内的文字 为手写字迹;
[0099] S402:判断区块内的印刷字迹是否需要修改,并确认修改数据,步骤如下:
[0100] U1:比较相似度集合 与 的关系:由于 ,则表示区块 内的印刷字迹存在需要修改的可能性,此时,进入步骤U2;
[0101] U2:遍历区块j的文字数据 ,将和 进行筛选分类,分别得到印刷字迹集 和手写字迹集

[0102] U3:计算印刷字迹和手写字迹的文字笔画相似度:将印刷字迹集 和手写字迹集利用Word Embedding算法分别映射到向量空间中,同时,将两个字迹集中的每一个文字进行拆解,则得到文字笔画向量集 , ;通过遍历和 中的每一个文字,根据公式: ,得到相似度集合

[0103] U4:通过比较文字相似度判断区块内的印刷字迹是否需要修改:遍历相似度集合,由于存在 ,则表示印刷字迹集 中存在需要修改的文字 ,此时,提取手写字迹集 中相应的文字 ,确认修改数据为 。
[0104] 在步骤S5中:对分析的结果进行处理,具体包括以下步骤:
[0105] S501:将需要修改的印刷字迹 替换为与之对应的手写字迹 ;
[0106] S502:利用手写字迹模拟算法将手写字迹 转换成印刷字体;
[0107] S503:消除试卷页面的所有手写字迹,保留修改后的印刷字迹。
[0108] 在步骤S6中:显示修改数据后的空白试卷内容并做打印处理,通过对试卷翻新,便于后续用户学习更加高效率,更加方便的整理错题。
[0109] 最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。