一种书写整洁度的评价方法及系统转让专利

申请号 : CN201610423085.3

文献号 : CN107507161B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 吴爱红戴文娟竺博魏思胡郁刘庆峰

申请人 : 科大讯飞股份有限公司

摘要 :

本发明公开了一种书写整洁度的评价方法及系统,该方法包括:预先构建基于书写整洁度特征进行书写整洁度评价的整洁度评价模型;获取待评价书写图像;获取待评价书写图像中各书写区域的灰度图;从各灰度图中提取书写整洁度特征;将所述书写整洁度特征输入所述整洁度评价模型,得到书写整洁度得分。本发明提供的方法由于该书写整洁度特征能反映书写的整洁度信息,并且可以由计算机自动提取,使得本发明可以自动获取书写整洁度得分,且该书写整洁度得分客观公正。

权利要求 :

1.一种书写整洁度的评价方法,其特征在于,包括:预先构建基于书写整洁度特征进行书写整洁度评价的整洁度评价模型;所述书写整洁度特征包括以下任意一种或多种:插入行特征、涂抹特征和粘连特征;其中,所述插入行特征表征补写内容,所述涂抹特征表征涂改内容,所述粘连特征表征相邻行的粘连内容;

获取待评价书写图像;

获取待评价书写图像中各书写区域的灰度图;

从各灰度图中提取书写整洁度特征;

将所述书写整洁度特征输入所述整洁度评价模型,得到书写整洁度得分。

2.根据权利要求1所述的方法,其特征在于,所述插入行特征包括:插入行行数比例特征和/或插入行面积比例特征;

所述插入行行数比例特征为:对于每一个灰度图,所有插入行的行数与所有行的行数的比值;

所述插入行面积比例特征为:对于每一个灰度图,所有插入行所占的面积与所有行所占面积的比值。

3.根据权利要求1所述的方法,其特征在于,所述涂抹特征包括:涂抹行数比例特征和/或涂抹面积比例特征;

所述涂抹行数比例特征为:对于每一个灰度图,所有涂抹所占的行数与所有行的行数的比值;

所述涂抹面积比例特征为:对于每一个灰度图,所有涂抹所占的面积与所有行所占的面积的比值。

4.根据权利要求3所述的方法,其特征在于,所述涂抹特征还包括:多涂画比例特征;

所述多涂画比例特征为:对于每一个灰度图,所有多线涂抹和严实涂抹所占的行数与所有行的行数的比值。

5.根据权利要求1所述的方法,其特征在于,所述粘连特征包括:粘连行数比例特征和/或粘连数比例特征;

所述粘连行数比例特征为:对于每一个灰度图,所有粘连联通体所占的行数与所有行的行数的比值;

所述粘连数比例特征为:对于每一个灰度图,所有单词和/或字中粘连联通体的数目与所有单词和/或字的总数的比值。

6.根据权利要求1至5任一项所述的方法,其特征在于,所述预先构建基于书写整洁度特征进行书写整洁度评价的整洁度评价模型包括:收集训练数据,所述训练数据为具有整洁度得分标注信息的书写图像;

提取所述训练数据各书写区域的灰度图的书写整洁度特征;

根据所述训练数据各书写区域的灰度图的书写整洁度特征以及所述训练数据的整洁度得分训练得到整洁度评价模型。

7.根据权利要求1至5任一项所述的方法,其特征在于,所述方法还包括:当所述待评价书写图像为考试内容,利用所述书写整洁度得分对试卷考试得分进行调整。

8.一种书写整洁度的评价系统,其特征在于,包括:模型构建模块,用于预先构建基于书写整洁度特征进行书写整洁度评价的整洁度评价模型;所述书写整洁度特征包括以下任意一种或多种:插入行特征、涂抹特征和粘连特征;

其中,所述插入行特征表征补写内容,所述涂抹特征表征涂改内容,所述粘连特征表征相邻行的粘连内容;

图像获取模块,用于获取待评价书写图像;

灰度图获取模块,用于获取待评价书写图像中各书写区域的灰度图;

特征提取模块,用于从各灰度图中提取书写整洁度特征;

评价模块,用于将所述书写整洁度特征输入所述整洁度评价模型,得到书写整洁度得分。

9.根据权利要求8所述的系统,其特征在于,所述插入行特征包括:插入行行数比例特征和/或插入行面积比例特征;

所述插入行行数比例特征为:对于每一个灰度图,所有插入行的行数与所有行的行数的比值;

所述插入行面积比例特征为:对于每一个灰度图,所有插入行所占的面积与所有行所占面积的比值。

10.根据权利要求8所述的系统,其特征在于,所述涂抹特征包括:涂抹行数比例特征和/或涂抹面积比例特征;

所述涂抹行数比例特征为:对于每一个灰度图,所有涂抹所占的行数与所有行的行数的比值;

所述涂抹面积比例特征为:对于每一个灰度图,所有涂抹所占的面积与所有行所占的面积的比值。

11.根据权利要求10所述的系统,其特征在于,所述涂抹特征还包括:多涂画比例特征;

所述多涂画比例特征为:对于每一个灰度图,所有多线涂抹和严实涂抹所占的行数与所有行的行数的比值。

12.根据权利要求8所述的系统,其特征在于,所述粘连特征包括:粘连行数比例特征和/或粘连数比例特征;

所述粘连行数比例特征为:对于每一个灰度图,所有粘连联通体所占的行数与所有行的行数的比值;

所述粘连数比例特征为:对于每一个灰度图,所有单词和/或字中粘连联通体的数目与所有单词和/或字的总数的比值。

13.根据权利要求8至12任一项所述的系统,其特征在于,所述模型构建模块包括:数据收集单元,用于收集训练数据,所述训练数据为具有整洁度得分标注信息的书写图像;

特征提取单元,用于提取所述训练数据各书写区域的灰度图的书写整洁度特征;

模型训练单元,用于根据所述训练数据各书写区域的灰度图的书写整洁度特征以及所述训练数据的整洁度得分训练得到整洁度评价模型。

14.根据权利要求8至12任一项所述的系统,其特征在于,当所述待评价书写图像为考试内容,所述系统还包括:得分调整模块,用于利用所述书写整洁度得分对试卷考试得分进行调整。

说明书 :

一种书写整洁度的评价方法及系统

技术领域

[0001] 本发明涉及图像处理和教育信息化领域,具体涉及一种书写整洁度的评价方法及系统。

背景技术

[0002] 随着计算机科学与技术的发展,自动化信息处理能力和水平也得到了显著的提高。教育模式也一步步向信息自动化方向发展,自动阅卷系统的出现将人从繁重的机械劳动中解放出来。机器阅卷不仅有利于对学生的成绩做出客观公正的评价,而且阅卷的结果容易保存、统计和查询。机器阅卷是智能化时代的必然趋势,但同时也存在一些不足,例如机器阅卷抹去了书写整洁度的因素:不同整洁程度的书写统一转写成文本格式,再根据文本进行批阅打分。然而,通过对书写整洁度的考核来提高学生的书写整洁度,也是对教育的一种要求。现有技术中,书写整洁度的评价是由人工进行评价,例如,人工阅卷给出的得分通常综合考虑了书写整洁度的影响,但是,人工评价过程中主观性较强、效率较低;此外,人工进行书写整洁度评价的准确性、公平性、稳定性等也有待提升。

发明内容

[0003] 本发明实施例提供一种书写整洁度的评价方法及系统,以解决现有技术中机器阅卷忽略了书写整洁度影响因素的问题。
[0004] 为此,本发明实施例提供如下技术方案:
[0005] 一种书写整洁度的评价方法,包括:
[0006] 预先构建基于书写整洁度特征进行书写整洁度评价的整洁度评价模型;
[0007] 获取待评价书写图像;
[0008] 获取待评价书写图像中各书写区域的灰度图;
[0009] 从各灰度图中提取书写整洁度特征;
[0010] 将所述书写整洁度特征输入所述整洁度评价模型,得到书写整洁度得分。
[0011] 优选地,所述书写整洁度特征包括以下任意一种或多种:插入行特征、涂抹特征和粘连特征。
[0012] 优选地,所述插入行特征包括:插入行行数比例特征和/或插入行面积比例特征;
[0013] 所述插入行行数比例特征为:对于每一个灰度图,所有插入行的行数与所有行的行数的比值;
[0014] 所述插入行面积比例特征为:对于每一个灰度图,所有插入行所占的面积与所有行所占面积的比值。
[0015] 优选地,所述涂抹特征包括:涂抹行数比例特征和/或涂抹面积比例特征;
[0016] 所述涂抹行数比例特征为:对于每一个灰度图,所有涂抹所占的行数与所有行的行数的比值;
[0017] 所述涂抹面积比例特征为:对于每一个灰度图,所有涂抹所占的面积与所有行所占的面积的比值。
[0018] 优选地,所述涂抹特征还包括:多涂画比例特征;
[0019] 所述多涂画比例特征为:对于每一个灰度图,所有多线涂抹和严实涂抹所占的行数与所有行的行数的比值。
[0020] 优选地,所述粘连特征包括:粘连行数比例特征和/或粘连数比例特征;
[0021] 所述粘连行数比例特征为:对于每一个灰度图,所有粘连联通体所占的行数与所有行的行数的比值;
[0022] 所述粘连数比例特征为:对于每一个灰度图,所有单词和/或字中粘连联通体的数目与所有单词和/或字的总数的比值。
[0023] 优选地,所述预先构建基于书写整洁度特征进行书写整洁度评价的整洁度评价模型包括:
[0024] 收集训练数据,所述训练数据为具有整洁度得分标注信息的书写图像;
[0025] 提取所述训练数据各书写区域的灰度图的书写整洁度特征;
[0026] 根据所述训练数据各书写区域的灰度图的书写整洁度特征以及所述训练数据的整洁度得分训练得到整洁度评价模型。
[0027] 优选地,所述方法还包括:
[0028] 当所述待评价书写图像为考试内容,利用所述书写整洁度得分对试卷考试得分进行调整。
[0029] 一种书写整洁度的评价系统,包括:
[0030] 模型构建模块,用于预先构建基于书写整洁度特征进行书写整洁度评价的整洁度评价模型;
[0031] 图像获取模块,用于获取待评价书写图像;
[0032] 灰度图获取模块,用于获取待评价书写图像中各书写区域的灰度图;
[0033] 特征提取模块,用于从各灰度图中提取书写整洁度特征;
[0034] 评价模块,用于将所述书写整洁度特征输入所述整洁度评价模型,得到书写整洁度得分。
[0035] 优选地,所述书写整洁度特征包括以下任意一种或多种:插入行特征、涂抹特征和粘连特征。
[0036] 优选地,所述插入行特征包括:插入行行数比例特征和/或插入行面积比例特征;
[0037] 所述插入行行数比例特征为:对于每一个灰度图,所有插入行的行数与所有行的行数的比值;
[0038] 所述插入行面积比例特征为:对于每一个灰度图,所有插入行所占的面积与所有行所占面积的比值。
[0039] 优选地,所述涂抹特征包括:涂抹行数比例特征和/或涂抹面积比例特征;
[0040] 所述涂抹行数比例特征为:对于每一个灰度图,所有涂抹所占的行数与所有行的行数的比值;
[0041] 所述涂抹面积比例特征为:对于每一个灰度图,所有涂抹所占的面积与所有行所占的面积的比值。
[0042] 优选地,所述涂抹特征还包括:多涂画比例特征;
[0043] 所述多涂画比例特征为:对于每一个灰度图,所有多线涂抹和严实涂抹所占的行数与所有行的行数的比值。
[0044] 优选地,所述粘连特征包括:粘连行数比例特征和/或粘连数比例特征;
[0045] 所述粘连行数比例特征为:对于每一个灰度图,所有粘连联通体所占的行数与所有行的行数的比值;
[0046] 所述粘连数比例特征为:对于每一个灰度图,所有单词和/或字中粘连联通体的数目与所有单词和/或字的总数的比值。
[0047] 优选地,所述模型构建模块包括:
[0048] 数据收集单元,用于收集训练数据,所述训练数据为具有整洁度得分标注信息的书写图像;
[0049] 特征提取单元,用于提取所述训练数据各书写区域的灰度图的书写整洁度特征;
[0050] 模型训练单元,用于根据所述训练数据各书写区域的灰度图的书写整洁度特征以及所述训练数据的整洁度得分训练得到整洁度评价模型。
[0051] 优选地,当所述待评价书写图像为考试内容,所述系统还包括:
[0052] 得分调整模块,用于利用所述书写整洁度得分对试卷考试得分进行调整。
[0053] 本发明实施例提供的书写整洁度的评价方法及系统,从待评价书写图像中各书写区域的灰度图中提取出书写整洁度特征,然后利用预先构建的整洁度评价模型得到书写整洁度得分。由于该书写整洁度特征能反映书写的整洁度情况,并且可以由计算机自动提取,最终将所述书写整洁度特征输入所述整洁度评价模型,自动得到书写整洁度得分,且该书写整洁度得分客观公正。
[0054] 进一步地,所述书写整洁度特征包括以下任意一种或多种:插入行特征、涂抹特征和粘连特征。上述特征能从多角度有效的反映书写整洁度,从而保证了最终获取的书写整洁度得分的客观准确度。
[0055] 进一步地,本发明还提供了插入行特征、涂抹特征和粘连特征的子特征,并且给出了各子特征的定义,以便于计算机自动提取上述子特征,最终由计算机自动获取书写整洁度得分。
[0056] 进一步地,本发明还提供了整洁度评价模型的构建方法,通过该方法可以构建基于书写整洁度特征进行书写整洁度评价的整洁度评价模型,以便于计算机利用该模型自动获取书写整洁度得分。
[0057] 进一步地,本发明还提供了获取待评价书写图像中各书写区域的灰度图的方法,根据预先获取的书写位置信息,能准确有效的获取待评价书写图像中各书写区域子图像,以便于准确获取各书写区域子图像的灰度图。
[0058] 进一步地,本发明还可以利用所述书写整洁度得分对试卷考试得分进行调整。解决了现有技术中机器阅卷忽略了书写整洁度影响因素的问题,使得机器阅卷给出的试卷考试得分能综合考虑书写整洁度影响因素。

附图说明

[0059] 为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
[0060] 图1是本发明实施例提供的书写整洁度的评价方法的一种流程图;
[0061] 图2(a)是现有技术中具有插入行的待评价书写图像的示意图;
[0062] 图2(b)是现有技术中具有涂抹的待评价书写图像的示意图;
[0063] 图2(c)是现有技术中具有粘连联通体的待评价书写图像的示意图;
[0064] 图3(a)至图3(b)是本发明实施例提供的提取插入行的过程示意图;
[0065] 图4(a)至图4(b)是本发明实施例提供的检测涂抹的过程示意图;
[0066] 图5(a)至图5(b)是本发明实施例提供的从英语书写区域内提取粘连联通体的过程示意图;
[0067] 图6(a)至图6(b)是现有技术中单线涂抹的示意图;
[0068] 图6(c)至图6(d)是现有技术中多线涂抹的示意图;
[0069] 图6(e)至图6(f)是现有技术中严实涂抹的示意图;
[0070] 图7(a)至图7(b)是本发明实施例提供的中文书写区域内提取涂抹的过程示意图;
[0071] 图8是本发明实施例提供的构建整洁度评价模型的方法的一种流程图;
[0072] 图9是本发明实施例提供的书写整洁度的评价系统的一种结构示意图;
[0073] 图10是本发明实施例提供的模型构建模块的一种结构示意图。
[0074] 图11是本发明实施例提供的书写整洁度的评价系统的另一种结构示意图。

具体实施方式

[0075] 为了使本技术领域的人员更好地理解本发明实施例的方案,下面结合附图和实施方式对本发明作进一步的详细说明。以下实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
[0076] 本发明提供的书写整洁度的评价方法及系统,获取待评价书写图像中各书写区域的灰度图,然后从各灰度图中提取书写整洁度特征,最后将提取的书写整洁度特征输入预先构建的整洁度评价模型,得到书写整洁度得分。由于灰度图即各灰度图的整洁度特征可以由计算机自动获取,然后将所述书写整洁度特征输入所述整洁度评价模型,即可自动得到书写整洁度得分。
[0077] 为了更好的理解本发明的技术方案和技术效果,以下将结合流程图和具体的实施例进行详细的描述。
[0078] 如图1所示,是本发明实施例提供的书写整洁度的评价方法的流程图,包括以下步骤:
[0079] 步骤S01,预先构建基于书写整洁度特征进行书写整洁度评价的整洁度评价模型。
[0080] 在本实施例中,所述整洁度评价模型可以为一种或多种模型的线性组合,其中,线性组合可以指:多个模型构成该整洁度评价模型,一些模型的输出作为另一些模型的输入,即至少部分模型为串联;此外,线性组合也可以指:多个模型构成该整洁度评价模型,至少部分模型的输出根据预设的权重等进行综合考虑,并给出一个输出结果,即至少部分模型为并联,例如,用循环神经网络(Recurrent Neural Networks,RNN)和深度神经网络(Deep Neural Networks,DNN)两种模型,分别得到各自书写整洁度的评价分值,然后将这两个分值进行加权求和,最后得到书写整洁度的评分;当然,线性组合还可以为部分模型之间为串联,部分模型之间为并联,并最终获取一个输出结果,在此不做限定。具体地,该整洁度评价模型可以包括以下任意一种或多种:支持向量机(Support Vector Machine,SVM),决策树(Decision Tree),DNN,RNN,高斯混合模型(Gaussian Mixture Model,GMM)。
[0081] 具体训练时,将具有整洁度标注信息的训练数据的书写整洁度特征输入所述整洁度评价模型,通过调整整洁度评价模型的各参数,例如权重系数等,使得整洁度评价模型的输出结果趋近于训练数据的整洁度标注信息,当满足一定条件时,例如输出结果与标注信息的差值小于一定阈值,则认为整洁度评价模型构建完成。其中,训练数据的书写整洁度特征的提取过程可以与从待评价书写图像的灰度图中提取书写整洁度特征的过程相同,在说明书的其他部分进行详述。
[0082] 步骤S02,获取待评价书写图像。
[0083] 在本实施例中,待评价书写图像可以为手写的答案、作文、评论、信件、日记等的图片。需要强调的是,本发明尤其适用于以手写形式作答的考试的主观题部分的整洁度评价。通过对书写整洁度的考核来提高学生的书写整洁度,也是对教育的一种要求,同时,卷面整洁也从侧面表明学生的预先构思能力和逻辑性的强弱。
[0084] 在实际应用中,待评价书写图像的获取多采用扫描仪、高拍仪、数码相机等设备来获取,当待评价书写图像为考试答案的图像时,该答案可以是作答在答题卡上,也可以是在试卷上,对此本案不作限定。当待评价书写图像中的书写区域仅为获取的整个图像的一部分时,可以通过图像处理等技术从待评价书写图像中将书写区域的图像提取出来,具体同现有技术,在此不再详述。
[0085] 步骤S03,获取待评价书写图像中各书写区域的灰度图。
[0086] 在本实施例中,待评价书写图像中书写区域可以是连成一个整体的区域,例如作文;也可以是分散位于书写图像的各分散区域,例如试卷上的问答题、答题卡上的作答等,各书写区域是一块、一块的,此时,可以根据已知的书写位置信息,从待评价书写图像中获取各书写区域子图像。其中,所述书写位置信息包括以下任意一种或多种信息:试卷布局信息、答题卡布局信息、版面设计信息、页面设计信息和通过图像识别获取的书写位置信息等。
[0087] 需要说明的是,当待评价书写图像中包含多个书写区域子图像时,以每一个子图像为单位,获取各子图像的灰度图。
[0088] 优选地,获取待评价书写图像中各书写区域的灰度图之前,对待评价书写图像进行定位及校准处理;当待评价书写图像中包含多个书写区域子图像时,获取各子图像的灰度图之后,对各书写区域各子图像进行降噪处理,然后再获取降噪后各书写区域子图像的灰度图。
[0089] 在一个具体实施例中,首先对待评价书写图像进行定位及校准处理,接着根据已知的书写位置信息判断是否存在多个书写区域,如果是,则从待评价书写图像中获取各书写区域子图像,如果否,则以当前待评价书写图像为单位进行处理,然后,对书写图像中各书写区域的图像进行降噪,并进行灰度化处理,得到待评价书写图像中各书写区域的灰度图。其中,图像降噪及灰度化处理可以同现有技术,在此不再详述。
[0090] 步骤S04,从各灰度图中提取书写整洁度特征。
[0091] 在本实施例中,以书写图像中各书写区域的灰度图为对象进行书写整洁度特征提取,该特征用于表征书写整洁度,例如是否存在插入行及插入行数、是否存在涂抹及涂抹的数量、是否存在行与行之间的粘连及粘连的个数。如图2(a)所示为具有插入行的待评价书写图像的示意图,如图2(b)所示为具有涂抹的待评价书写图像的示意图,如图2(c)所示为具有粘连联通体的待评价书写图像的示意图。
[0092] 优选地,所述书写整洁度特征包括以下任意一种或多种:插入行特征、涂抹特征和粘连特征。其中,插入行特征用来表征书写区域中是否存在漏写后的补写内容、写错在其他区域后进行补写等导致书面结构不美观的特征,具体可以包括以下任意一个或多个:插入的行数、插入行所占所有行的面积比例、插入行导致的书面空白比例等,该特征可以为一个多维向量;涂抹特征用来表征写错后涂抹导致书写不整洁的特征,具体可以包括以下任意一个或多个:存在涂抹行数所占所有行的比例、存在涂抹的行数、所有涂抹所占面积与所有行面积的比值等,该特征也可以为一个多维向量,其中涂抹的识别可以同现有技术;粘连特征用来表征相邻行的书写大小过大使得相邻行粘连,导致书写整体不美观的特征,具体可以包括以下任意一个或多个:存在粘连行数所占所有行的比例、存在粘连的行数、所有粘连联通体所占所有联通体的比例等,该特征也可以为一个多维向量。需要说明的是,所有行面积也可以为所有行中所有联通体所占的面积,具体可以为所有联通体包括的面积或所有联通体的前景所占的面积等,涂抹所占面积具体可以为:涂抹联通体所占面积或涂抹字符所占面积等,在此不做限定,以下相同。
[0093] 在实际应用中,所述书写整洁度特征可以为一个多维向量,例如书写整洁度特征可以包括插入行特征、涂抹特征和粘连特征,其中插入行特征包括插入行行数比例特征和插入行面积比例特征,涂抹特征包括涂抹行数比例特征、涂抹面积比例特征和多涂画比例特征,粘连特征包括粘连行数比例特征和粘连数比例特征,则此时书写整洁度特征是一个7维的向量,根据各特征的自身特点获取各特征向量。例如插入行特征的提取过程可以包括:对各书写区域的图像进行行切分,提取出插入行,如图3(a)至图3(b)所示,并计算相关维度特征向量;涂抹特征的提取过程可以包括:对行切分后的每行图像进行涂抹检测,如图4(a)至图4(b)所示,然后计算相关维度特征向量;粘连特征的提取过程可以包括:对各书写区域的图像进行行切分,提取出粘连联通体,如图5(a)至图5(b)所示,并计算相关维度特征向量。当然,上述特征提取过程仅为示例性举例,现有技术中可以获取上述特征的方法都适用。
[0094] 步骤S05,将所述书写整洁度特征输入所述整洁度评价模型,得到书写整洁度得分。
[0095] 在本实施例中,基于统计模型的方法对书写整洁程度进行评分,得到书写整洁程度得分g。以SVM为例,整洁度得分g的计算如式(1):
[0096] g=WX+b   (1)
[0097] 其中,W是权重系数向量,b是偏移向量,W和b为模型训练时获取的模型参数,具体可以通过离线收集大量数据进行训练得到,X为书写整洁度特征向量,X={x1,x2,x3,x4,x5,x6,x7…}。
[0098] 在实际应用中,还可以对整洁度得分进行归一化处理,例如,可以根据预先设定的书写整洁度总分对整洁度得分进行归一化处理,得到归一化的整洁度得分T1,计算公式如式(2)所示:
[0099] T1=F(g)=S*g   (2)
[0100] 其中,S为书写整洁度总分。当然也可以采用其他归一化方法进行处理,在此不做限定。
[0101] 进一步地,本发明还包括:当所述待评价书写图像为考试内容,利用所述书写整洁度得分对试卷考试得分进行调整,以实现通过对书写整洁度的考核来提高学生的书写整洁度。具体地,当待评价书写图像中仅包含一个书写区域时,利用整洁度得分g或归一化的整洁度得分T1对该书写区域的考试内容得分进行调整;当待评价书写图像中包含至少两个书写区域时,分别获取各书写区域的整洁度得分g或归一化的整洁度得分T1,分别对各书写区域的考试内容的得分进行调整,当然,也可以在分别获取各书写区域的整洁度得分g或归一化的整洁度得分T1之后,根据预先设定的各区域的权重等得到各书写区域的整洁度得分g或归一化的整洁度得分T1的综合整洁度得分,然后利用该综合整洁度得分对各书写区域的内容的总得分进行调整。
[0102] 本发明实施例提供的书写整洁度的评价方法,通过从待评价书写图像中各书写区域的灰度图中提取书写整洁度特征,然后将所述书写整洁度特征输入预先构建的整洁度评价模型,得到书写整洁度得分。由于各书写整洁度特征可以由计算机自动提取,然后将各书写整洁度特征输入预先构建的整洁度评价模型,计算机即可自动给出书写整洁度得分。
[0103] 在其它实施例中,对所述插入行特征、涂抹特征和粘连特征进行细化,以从更多角度表征书写整洁度,使得最终获取的整洁度评分更加客观公正。
[0104] 优选地,所述插入行特征包括:插入行行数比例特征和/或插入行面积比例特征;所述插入行行数比例特征为:对于每一个灰度图,所有插入行的行数与所有行的行数的比值;所述插入行面积比例特征为:对于每一个灰度图,所有插入行所占的面积与所有行所占面积的比值。
[0105] 具体地,对于插入行行数比例特征,该特征体现的是插入行数所占所有行数的比例对整体书写整洁度的影响,首先统计行切分后所有行数lineN,然后计算插入行(所述插入行一般为行切分后长度小于一定阈值的行,也可以为行高度小于预设阈值的行)的行数N1,则插入行行数比例特征值x1的计算公式如式(3)所示:
[0106]
[0107] 对于插入行面积比例特征,该特征体现的是插入行面积所占所有行面积的比例对整体书写整洁度的影响,首先计算所有插入行的前景像素(黑色像素)数N2,然后计算所有行的前景点数foreN,则插入行面积比例特征值x2的计算公式如式(4)所示:
[0108]
[0109] 优选地,所述涂抹特征包括:涂抹行数比例特征和/或涂抹面积比例特征;所述涂抹行数比例特征为:对于每一个灰度图,所有涂抹所占的行数与所有行的行数的比值;所述涂抹面积比例特征为:对于每一个灰度图,所有涂抹所占的面积与所有行所占的面积的比值。
[0110] 具体地,对于涂抹行数比例特征,该特征体现的是存在涂抹的行数所占所有行数的比例对整体书写整洁度的影响,如图4(a)至图4(b)所示,为检测涂抹过程示意图。具体可以根据以下任意一种或多种特征:线条特征、交叉点特征、孔洞特征以及密度特征提取出书写区域中的涂抹,然后再统计出存在涂抹的行数N3,则涂抹行数比例特征值x3的计算公式如式(5)所示:
[0111]
[0112] 对于涂抹面积比例特征,该特征体现的是涂抹的面积所占所有行面积的比例对整体书写整洁度的影响,计算涂抹所占的前景数N4,则涂抹面积比例特征x4的计算公式如式(6)所示:
[0113]
[0114] 进一步地,考虑到不同涂抹类别带来的主观感觉不同,即不同涂抹对书写整洁度的影响程度不同,将涂抹进行分类:单线涂抹、多线涂抹和严实涂,如图6(a)至6(b)所示为单线涂抹,如图6(c)至6(d)所示为多线涂抹,如图6(e)至6(f)所示为严实涂抹。其中单线涂抹对整体书写整洁度影响较小,多线涂抹和严实涂对整体书写整洁度影响较大,故所述涂抹特征还可以包括:多涂画比例特征,所述多涂画比例特征为:对于每一个灰度图,所有多线涂抹和严实涂抹所占的行数与所有行的行数的比值。
[0115] 对于多涂画比例特征,该特征体现的是多线涂抹和严实涂抹所占行数与所有行数的比例对整体书写整洁度的影响,计算多线涂抹和严实涂画所占行数N5,则多涂画比例特征x5的计算公式如式(7)所示:
[0116]
[0117] 在实际使用中,涂抹的检测可以采用现有技术,在此不再详述。
[0118] 优选地,所述粘连特征包括:粘连行数比例特征和/或粘连数比例特征;所述粘连行数比例特征为:对于每一个灰度图,所有粘连联通体所占的行数与所有行的行数的比值;所述粘连数比例特征为:对于每一个灰度图,所有单词和/或字中粘连联通体的数目与所有单词和/或字的总数的比值。如图5(a)至图5(b)所示,为英语书写区域内的粘连联通体提取过程示意图,如图7(a)至图7(b)所示,为中文书写区域内的粘连联通体提取过程示意图。
[0119] 对于粘连行数比例特征,该特征体现的是存在粘连联通体的行数所占所有行数的比例对整体书写整洁度的影响,首先计算每个联通体所占的行数,然后滤除所占行数小于2的联通体,最后统计存在粘连联通体的行数N6,则粘连行数比例特征x6的计算公式如式(8)所示:
[0120]
[0121] 对于粘连行数比例特征,该特征体现的是存在粘连联通体的单词和/或字的总数所占所有单词和/或字的总数的比例对整体书写整洁度的影响,首先统计所有单词和/或字的总数wordN,然后统计每个单词和/或字中属于粘连联通体数N7,则粘连数比例特征x7的计算公式如式(9)所示:
[0122]
[0123] 在本发明实施例中,提供了插入行特征、涂抹特征和粘连特征的子特征,并且给出了各子特征的定义,以便于计算机从多角度自动提取上述子特征,使得最终由计算机自动给出的书写整洁度得分更加客观公正。
[0124] 如图8所示,为根据本发明实施例提供的构建整洁度评价模型的方法的一种流程图,包括:
[0125] 步骤S81,收集训练数据,所述训练数据为具有整洁度得分标注信息的书写图像。
[0126] 在本实施例中,该训练数据可以是具有整洁度得分标注信息的书写图像,当然,也可以是具有手写内容的书写图像,然后由人工进行整洁度得分标注,在此不做限定。
[0127] 步骤S82,提取所述训练数据各书写区域的灰度图的书写整洁度特征。
[0128] 同步骤S04,在此不再详述。
[0129] 步骤S83,根据所述训练数据各书写区域的灰度图的书写整洁度特征以及所述训练数据的整洁度得分训练得到整洁度评价模型。
[0130] 在本实施例中,具体训练时,输入为每个书写区域的卷面整洁度特征,输出为当前书写区域的书写整洁程度得分g或归一化后的书写整洁程度得分T1,通过调整模型参数使得计算机给出的书写整洁程度得分g或归一化后的书写整洁程度得分T1趋近于该训练数据的整洁度得分标注信息。
[0131] 相应地,本发明还提供了书写整洁度的评价系统的一种结构示意图,如图9所示,该系统包括:
[0132] 模型构建模块901,用于预先构建基于书写整洁度特征进行书写整洁度评价的整洁度评价模型;
[0133] 图像获取模块902,用于获取待评价书写图像;
[0134] 灰度图获取模块903,用于获取待评价书写图像中各书写区域的灰度图;
[0135] 特征提取模块904,用于从各灰度图中提取书写整洁度特征;
[0136] 评价模块905,用于将所述书写整洁度特征输入所述整洁度评价模型,得到书写整洁度得分。
[0137] 其中,所述书写整洁度特征包括以下任意一种或多种:插入行特征、涂抹特征和粘连特征。
[0138] 进一步地,所述插入行特征、涂抹特征和粘连特征还可细化为相应的子特征,在本实施例中,所述插入行特征包括:插入行行数比例特征和/或插入行面积比例特征;
[0139] 所述插入行行数比例特征为:对于每一个灰度图,所有插入行的行数与所有行的行数的比值;
[0140] 所述插入行面积比例特征为:对于每一个灰度图,所有插入行所占的面积与所有行所占面积的比值。
[0141] 所述涂抹特征包括:涂抹行数比例特征和/或涂抹面积比例特征;
[0142] 所述涂抹行数比例特征为:对于每一个灰度图,所有涂抹所占的行数与所有行的行数的比值;
[0143] 所述涂抹面积比例特征为:对于每一个灰度图,所有涂抹所占的面积与所有行所占的面积的比值。
[0144] 所述粘连特征包括:粘连行数比例特征和/或粘连数比例特征;
[0145] 所述粘连行数比例特征为:对于每一个灰度图,所有粘连联通体所占的行数与所有行的行数的比值;
[0146] 所述粘连数比例特征为:对于每一个灰度图,所有单词和/或字中粘连联通体的数目与所有单词和/或字的总数的比值。
[0147] 此外,为了更体现多涂画对书写整洁度的影响,所述涂抹特征还包括:多涂画比例特征;
[0148] 所述多涂画比例特征为:对于每一个灰度图,所有多线涂抹和严实涂抹所占的行数与所有行的行数的比值。
[0149] 如图10所示,为根据本发明实施例提供的模型构建模块101的一种结构示意图,可以包括:
[0150] 数据收集单元9011,用于收集训练数据,所述训练数据为具有整洁度得分标注信息的书写图像;
[0151] 特征提取单元9012,用于提取所述训练数据各书写区域的灰度图的书写整洁度特征;
[0152] 模型训练单元9013,用于根据所述训练数据各书写区域的灰度图的书写整洁度特征以及所述训练数据的整洁度得分训练得到整洁度评价模型。
[0153] 进一步地,如图11所示,当所述待评价书写图像为考试内容,所述系统还包括:
[0154] 得分调整模块116,用于利用所述书写整洁度得分对试卷考试得分进行调整。这样,可以通过得分调整模块116对试卷考试得分进行调整,能通过对书写整洁度的考核来提高学生的书写整洁度。
[0155] 此外,该系统还可以进一步包括存储模块(未图示),用于保存模型参数、特征向量等相关信息。这样,以方便对待评价书写图像进行计算机自动处理。并存储书写整洁度得分。
[0156] 本发明实施例提供的书写整洁度的评价系统,通过模型构建模块901预先构建基于书写整洁度特征进行书写整洁度评价的整洁度评价模型,在实际使用中,通过图像获取模块902获取待评价书写图像,然后由灰度图获取模块903获取待评价书写图像中各书写区域的灰度图,接着通过特征提取模块904从各灰度图中提取书写整洁度特征,最终由评价模块905将所述书写整洁度特征输入所述整洁度评价模型,得到书写整洁度得分。由于该书写整洁度特征能反映书写的整洁度信息,并且可以由计算机自动提取,最终由评价模块905自动给出书写整洁度得分,该书写整洁度得分的客观性及稳定性能得到有效保障。
[0157] 本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
[0158] 以上对本发明实施例进行了详细介绍,本文中应用了具体实施方式对本发明进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及系统;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。