一种题目智能识别、批改的方法和系统转让专利
申请号 : CN201810916955.X
文献号 : CN108932508B
文献日 : 2022-03-18
发明人 : 何涛 , 罗欢 , 陈明权
申请人 : 杭州大拿科技股份有限公司
摘要 :
权利要求 :
1.一种题目智能识别方法,其特征在于,包括:步骤1:基于试卷的影像和预先训练的第一模型,识别所述试卷上的各个题目的区域,其中,所述第一模型是基于神经网络的模型;
步骤2:通过第一模型分别对所述各个题目的区域进行题目类型的识别,并对识别到的各个类型的题目分别进行标注,标注出各个题目的区域中的对应类型题目的各个组成部分,所述组成部分包括题干、答题和/或图片,其中题目类型包括填空题、计算题、选择题或应用题;
步骤3:基于所述试卷上的各个题目的区域的单独影像、所述题目的区域对应的题目类型、所述题目的区域对应的所述组成部分、以及第二模型,识别出所述各个题目的区域中的字符,从而确定所述试卷上记载的信息,其中,所述第二模型是基于神经网络的模型,其中步骤3中的所述第二模型包括针对题干的识别模型和针对答题的识别模型,其中所述题干由打印字体组成,所述答题由手写字体组成,所述针对题干的识别模型和所述针对答题的识别模型分别经过各自独立的训练而成,其中步骤3进一步包括采用空洞卷积分别对题干、答题和/或图片类型对应的标注框进行特征提取,以及通过注意力模型将提取到的特征解码成字符;
其中所述第一模型通过以下步骤训练得到:对第一试卷影像样本训练集中的每个试卷影像样本进行标注处理,以标注出每个所述试卷影像样本中的一个或多个区域中的每个区域、与每个区域对应的题目类型、与每个区域对应的题目类型包含的组成部分,所述组成部分包括题干、答题和/或图片;以及通过经过所述标注处理的所述第一试卷影像样本训练集,对第一神经网络进行训练,以得到所述第一模型,其中所述第一神经网络是基于深度卷积神经网络建立的;
其中所述第二模型通过以下步骤训练得到:对第二试卷影像样本训练集中的每个试卷影像样本进行标注处理,标注出每个所述试卷影像样本中的一个或多个区域中的每个区域以及每个区域中的字符;以及通过经过所述标注处理的所述第二试卷影像样本训练集,对第二神经网络进行训练,以得到所述第二模型,其中所述第二神经网络是基于空洞卷积和注意力模型建立的;
其中先基于第一模型识别出各个题目对应位置的区域,各个题目对应的类型以及各类型中的题干、答题、图形等组成部分,再基于第二模型分别对题干中的打印字体和答题的手写字体进行字体信息的识别。
2.根据权利要求1所述的题目智能识别方法,其特征在于,步骤1进一步包括:利用第一模型从所述试卷的影像中提取二维特征向量;
在二维特征向量的每一个网格生成不同形状的锚点,使用标注框将识别出的区域进行标注。
3.根据权利要求2所述的题目智能识别方法,其特征在于,在步骤1的使用标注框将识别出的区域进行标注的处理之后还包括:将标注框与生成的锚点做回归处理,以使标注框贴近题目实际位置。
4.根据权利要求1所述的题目智能识别方法,其特征在于,对神经网络进行训练还包括:
基于试卷影像样本测试集对经过训练的所述神经网络的准确率进行测试;
若输出准确率小于预定的阈值,则增加试卷影像样本训练集中的试卷影像样本的数量,所增加的试卷影像样本中的每个试卷影像样本均经过所述标注处理;以及通过增加了试卷影像样本的数量之后的试卷影像样本训练集,重新对所述神经网络进行训练。
5.一种题目智能批改方法,其特征在于,包括:如权利要求1所述的题目智能识别方法;以及基于解码出的题干在题库中搜索,若存在搜索结果则获取搜索结果对应的标注题型,将每一道题目切割开分别进行批改,其中针对不同类型的题目的批改方式包括:如果题目类型为计算题,则由计算引擎计算出结果,进行比对;
如果题目类型为选择填空判断题,则直接判断输入的答题与标注的答案是否一致;
如果题目类型为主观题,则直接显示标准答案。
6.根据权利要求5所述的题目智能批改方法,其特征在于,对于计算题的批改,对具有多个计算步骤的计算题,将不同行的答题过程进行切割并通过计算引擎根据上下行的内容判断是否计算正确。
7.根据权利要求5所述的题目智能批改方法,其特征在于,对于计算题的批改,将填写计算符号、大于小于号、以及单位换算的题目识别为计算题,通过计算引擎判断两侧内容进行批改。
8.一种题目智能识别系统,其特征在于,包括:第一模型,所述第一模型是基于神经网络的模型,所述第一模型是基于深度卷积神经网络训练而成;
第二模型,所述第二模型是基于神经网络的模型,所述第二模型是基于空洞卷积和注意力模型训练而成;
第一装置,第一装置被配置为:
基于试卷的影像和预先训练的第一模型,识别所述试卷上的各个题目的区域;
通过第一模型分别对所述各个题目的区域进行题目类型的识别,并对识别到的各个类型的题目分别进行标注,标注出各个题目的区域中的对应类型题目的各个组成部分,所述组成部分包括题干、答题和/或图片,其中题目类型包括填空题、计算题、选择题或应用题;
基于所述试卷上的各个题目的区域的单独影像、所述题目的区域对应的题目类型、所述题目的区域对应的组成部分、以及所述第二模型,识别出一个或多个区域中的每个区域中的字符,从而确定所述试卷上记载的信息,其中所述第二模型包括针对题干的识别模型和针对答题的识别模型,其中所述题干由打印字体组成,所述答题由手写字体组成,所述针对题干的识别模型和所述针对答题的识别模型分别经过各自独立的训练而成;
其中先基于第一模型识别出各个题目对应位置的区域,各个题目对应的类型以及各类型中的题干、答题、图形等组成部分,再基于第二模型分别对题干中的打印字体和答题的手写字体进行字体信息的识别。
9.一种题目智能批改系统,其特征在于,包括:如权利要求8所述的题目智能识别系统;
第二装置,第二装置被配置为:
基于解码出的题干在题库中搜索,若存在搜索结果则获取搜索结果对应的标注题型,将每一道题目切割开分别进行批改;
其中第二装置针对不同类型的题目进行批改:如果题目类型为计算题,则由计算引擎计算出结果,进行比对;
如果题目类型为选择填空判断题,则直接判断输入的答题与标注的答案是否一致;
如果题目类型为主观题,则直接显示标准答案。
10.一种题目智能识别系统,其特征在于,包括:处理器;以及
存储器,所述存储器被配置为存储一系列计算机可执行的指令以及与所述一系列计算机可执行的指令相关联的计算机可访问的数据,其中,当所述一系列计算机可执行的指令被所述处理器执行时,使得所述处理器进行如权利要求1至4中任一项所述的方法。
11.一种非临时性计算机可读存储介质,其特征在于,所述非临时性计算机可读存储介质上存储有一系列计算机可执行的指令,当所述一系列可执行的指令被计算装置执行时,使得计算装置进行如权利要求1至4中任一项所述的方法。
12.一种题目智能批改系统,其特征在于,包括:处理器;以及
存储器,所述存储器被配置为存储一系列计算机可执行的指令以及与所述一系列计算机可执行的指令相关联的计算机可访问的数据,其中,当所述一系列计算机可执行的指令被所述处理器执行时,使得所述处理器进行如权利要求5至7中任一项所述的方法。
13.一种非临时性计算机可读存储介质,其特征在于,所述非临时性计算机可读存储介质上存储有一系列计算机可执行的指令,当所述一系列可执行的指令被计算装置执行时,使得计算装置进行如权利要求5至7中任一项所述的方法。
说明书 :
一种题目智能识别、批改的方法和系统
技术领域
背景技术
学习状况的主要考察形式仍是各种类型的考试或测试,在此状况下,教师背负着很大的批
改作业和试卷的工作压力。针对这种现象,在大中型或重要性高的考试或测试中已经逐渐
推广和采用了各类自动阅卷系统,这类系统能够一定程度上减轻教师阅卷的工作量。
虽然有效提高了批阅速度,但是需要学生作答时使用2B铅笔进行客观题的作答,不仅多有
不便,还容易出现误涂、漏涂等情况。此外,学生手写作答的打印试卷在批改时则严重依赖
老师或家长的手动检查和批改,特别是填空题或主观题这类题目,答案的位置和具体内容
无法有效通过现有的阅卷系统进行自动识别,或者识别效果差效率低。而且在人工阅卷时
因不同教师风格、情绪、心理状态等主观性因素可能会造成判卷结果出现不公平不公正的
现象。
是评分的准确性和客观性,是目前业界亟待解决的问题。
发明内容
试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一
些概念以为稍后给出的更加详细的描述之序。
内容进行自动批改。
部分,所述组成部分包括题干、答题和/或图片;
中的字符,从而确定所述试卷上记载的信息,其中,所述第二模型是基于神经网络的模型。
字体组成,所述针对题干的识别模型和所述针对答题的识别模型分别经过各自独立的训练
而成。
个区域对应的题目类型所包含的组成部分,所述组成部分包括题干、答题和/或图片;以及
否计算正确。
改。
所述组成部分包括题干、答题和/或图片;
每个区域中的字符,从而确定所述试卷上记载的信息。
述针对题干的识别模型和所述针对答题的识别模型分别经过各自独立的训练而成。
算装置执行时,使得计算装置进行如前所述的方法。
得计算装置进行如前所述的方法。
卷中的各个题目的位置、题目对应的类型、题目中的不同组成部分(题干、答题、图片),再分
别基于识别模型识别出题干的打印体字符信息和答题部分的手写体字符信息,最后基于识
别出的字符信息进行自动批改,还可以同时对解题步骤进行批改分析,标注出错误点并进
行解析。相较于现有技术,本发明能够对包含了各种题型的试卷进行自动识别和批改,而不
仅仅局限于单一题型(例如仅局限于口算题),从而扩大了应用范围,提高了作业批改效率。
附图说明
的组件可能具有相同或相近的附图标记。
具体实施方式
个区域对应的题目类型包含的组成部分,组成部分包括题干、答题和/或图片。
3所示的训练。
目具有不同形状的标注框。
特征是整张影像图片的,还未做题干、答题、图片等组成部分的区分。
进行分类标注题目所属类别。
域中的字符,从而确定试卷上记载的信息,其中,第二模型是基于神经网络的模型。
干的识别模型和针对答题的识别模型分别经过各自独立的训练而成。
组成部分包括题干、答题和/或图片。
中的字符,从而确定试卷上记载的信息,其中,第二模型是基于神经网络的模型。
下行的内容判断是否计算正确。此外,将填写计算符号、大于小于号、以及单位换算的题目
识别为计算题,通过计算引擎判断两侧内容进行批改。
部分图形题中还有打印的图形等。
和答题的手写字体进行字体信息的识别。待识别出试卷中全部字符信息后,可以基于数据
库和计算引擎进行自自动批改。
(包括测试过程)在前述实施例中均已详述,在此不再赘述。
精确,针对题干的识别模型和针对答题的识别模型分别经过各自独立的训练而成。
部分包括题干、答题和/或图片;
确定试卷上记载的信息。
中搜索,若存在搜索结果则获取搜索结果对应的标注题型,将每一道题目切割开分别进行
批改。
于小于号、以及单位换算的题目识别为计算题,通过计算引擎判断两侧内容进行批改。
的数据,当这一系列计算机可执行的指令被处理器执行时,使得处理器进行如前述图1所示
实施例的方法。
施例的方法。
据,当这一系列计算机可执行的指令被处理器执行时,使得处理器进行如前述图2所示实施
例的方法。
施例的方法。
和/或与来自本文中图示和描述或本文中未图示和描述但本领域技术人员可以理解的其他
动作并发地发生。
楚地解说硬件与软件的这一可互换性,各种解说性组件、框、模块、电路、和步骤在上面是以
其功能性的形式作一般化描述的。此类功能性是被实现为硬件还是软件取决于具体应用和
施加于整体系统的设计约束。技术人员对于每种特定应用可用不同的方式来实现所描述的
功能性,但这样的实现决策不应被解读成导致脱离了本发明的范围。
程逻辑器件、分立的门或晶体管逻辑、分立的硬件组件、或其设计成执行本文所描述功能的
任何组合来实现或执行。通用处理器可以是微处理器,但在替换方案中,该处理器可以是任
何常规的处理器、控制器、微控制器、或状态机。处理器还可以被实现为计算设备的组合,例
如DSP与微处理器的组合、多个微处理器、与DSP核心协作的一个或多个微处理器、或任何其
他此类配置。
储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动盘、CD‑ROM、或本领域中所知的任
何其他形式的存储介质中。示例性存储介质耦合到处理器以使得该处理器能从/向该存储
介质读取和写入信息。在替换方案中,存储介质可以被整合到处理器。处理器和存储介质可
驻留在ASIC中。ASIC可驻留在用户终端中。在替换方案中,处理器和存储介质可作为分立组
件驻留在用户终端中。
码存储在计算机可读介质上或藉其进行传送。计算机可读介质包括计算机存储介质和通信
介质两者,其包括促成计算机程序从一地向另一地转移的任何介质。存储介质可以是能被
计算机访问的任何可用介质。作为示例而非限定,这样的计算机可读介质可包括RAM、ROM、
EEPROM、CD‑ROM或其它光盘存储、磁盘存储或其它磁存储设备、或能被用来携带或存储指令
或数据结构形式的合意程序代码且能被计算机访问的任何其它介质。任何连接也被正当地
称为计算机可读介质。例如,如果软件是使用同轴电缆、光纤电缆、双绞线、数字订户线
(DSL)、或诸如红外、无线电、以及微波之类的无线技术从web网站、服务器、或其它远程源传
送而来,则该同轴电缆、光纤电缆、双绞线、DSL、或诸如红外、无线电、以及微波之类的无线
技术就被包括在介质的定义之中。如本文中所使用的盘(disk)和碟(disc)包括压缩碟
(CD)、激光碟、光碟、数字多用碟(DVD)、软盘和蓝光碟,其中盘(disk)往往以磁的方式再现
数据,而碟(disc)用激光以光学方式再现数据。上述的组合也应被包括在计算机可读介质
的范围内。
适原理可被应用到其他变体而不会脱离本公开的精神或范围。由此,本公开并非旨在被限
定于本文中所描述的示例和设计,而是应被授予与本文中所公开的原理和新颖性特征相一
致的最广范围。