一种基于教学思维的物理知识点智能识别方法及装置转让专利

申请号 : CN202111046337.2

文献号 : CN113486196B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 高玉伟

申请人 : 江西风向标教育科技有限公司

摘要 :

本发明提供一种基于教学思维的物理知识点智能识别方法及装置,涉及教育技术领域,该方法包括:基于物理学科的关键词与元知识点构建知识元素图谱,并基于物理学科的考点逻辑体系梳理出知识点与考点关联的考点知识图谱,根据知识元素图谱与考点知识图谱提炼图谱逻辑关系;对物理题目进行结构化处理,分别提取每一部分内容的物理元素,通过预训练的语言模型对物理元素进行语意组合;构建考点识别算法模型,对物理题目的结构化分析和物理语意进行组合,识别出题目相关性强的考点区间,以对考点区间的物理考点进行标注。本发明能够解决现有技术中考点自动标注方法普遍存在对知识点标注效率低、标注准确性低的技术问题。

权利要求 :

1.一种基于教学思维的物理知识点智能识别方法,其特征在于,所述方法包括:基于物理学科的关键词与元知识点构建知识元素图谱,并基于物理学科的考点逻辑体系梳理出知识点与考点关联的考点知识图谱,根据所述知识元素图谱与所述考点知识图谱提炼图谱逻辑关系;

对物理题目进行结构化处理,分别提取每一部分内容的物理元素,通过预训练的语言模型对所述物理元素进行语意组合,形成具有物理意义的物理元素组合;

对所述物理元素组合进行模型训练与分类,识别所述物理元素组合背后的物理场景、物理规律的应用以及重点考查物理量的学科关键信息;

构建考点识别算法模型,对物理题目的结构化分析和物理语意进行组合,识别出题目相关性强的考点区间,以对考点区间的物理考点进行标注;

其中,对物理题目的结构化分析和物理语意进行组合,识别出题目相关性强的考点区间的步骤,具体包括:

将物理题目的结构化分析结果和物理语意进行组合,识别出题目相关性较强的考点区间;

将基于识别出的考点区间内的考点与所述物理元素组合,结合所述图谱逻辑关系,对考点识别算法模型的反馈学习机制进行算法逻辑的推演。

2.根据权利要求1所述的基于教学思维的物理知识点智能识别方法,其特征在于,对物理题目进行结构化处理,分别提取每一部分内容的物理元素的步骤,具体包括:将物理题目分解为物理场景条件、题干考查内容、选项文本内容与解析内容的题目内容;

分别提取每一部分题目内容的物理关键词、物理知识点与考查物理量的物理元素。

3.根据权利要求1所述的基于教学思维的物理知识点智能识别方法,其特征在于,对考点识别算法模型的反馈学习机制进行算法逻辑的推演的步骤之后,所述方法包括:将算法逻辑的推演结果与真实结果进行对比验证,以生成反馈信息;

将所述反馈信息反馈至所述考点识别算法模型,进行所述考点识别算法模型和所述图谱逻辑关系的反向学习优化。

4.根据权利要求3所述的基于教学思维的物理知识点智能识别方法,其特征在于,所述方法还包括:

根据所述考点识别算法模型和所述图谱逻辑关系的反向学习结果,对所述考点识别算法模型和图谱逻辑关系进行若干次迭代优化。

5.一种基于教学思维的物理知识点智能识别装置,其特征在于,所述装置包括:逻辑构建模块,基于物理学科的关键词与元知识点构建知识元素图谱,并基于物理学科的考点逻辑体系梳理出知识点与考点关联的考点知识图谱,根据所述知识元素图谱与所述考点知识图谱提炼图谱逻辑关系;

题目处理模块,对物理题目进行结构化处理,分别提取每一部分内容的物理元素,通过预训练的语言模型对所述物理元素进行语意组合,形成具有物理意义的物理元素组合,对所述物理元素组合进行模型训练与分类,识别所述物理元素组合背后的物理场景、物理规律的应用以及重点考查物理量的学科关键信息;

标注学习模块,构建考点识别算法模型,对物理题目的结构化分析和物理语意进行组合,识别出题目相关性强的考点区间,以对考点区间的物理考点进行标注;

所述标注学习模块具体用于:

将物理题目的结构化分析结果和物理语意进行组合,识别出题目相关性较强的考点区间;

将基于识别出的考点区间内的考点与所述物理元素组合,结合所述图谱逻辑关系,对考点识别算法模型的反馈学习机制进行算法逻辑的推演。

6.根据权利要求5所述的基于教学思维的物理知识点智能识别装置,其特征在于,所述题目处理模块还用于:

将物理题目分解为物理场景条件、题干考查内容、选项文本内容与解析内容的题目内容;

分别提取每一部分题目内容的物理关键词、物理知识点与考查物理量的物理元素。

说明书 :

一种基于教学思维的物理知识点智能识别方法及装置

技术领域

[0001] 本发明涉及教育技术领域,特别涉及一种基于教学思维的物理知识点智能识别方法及装置。

背景技术

[0002] 为了学生能够更好的掌握知识点,通常由教师对教材上的知识点进行人工标注。然而,人工标注有以下不足:人力成本投入过大,标注效率低,难以适用于大批量题库的知
识点标注;人工标准随意性太大,容易受到个人主观因素和知识水平限制。针对人工标注的
不足,有部分企业在探索对知识点的自动标注,以解决现有人工标注形式存在的问题。
[0003] 现有的自动标注通常有相似度对比标注算法、机器学习+深度学习模型标注与特征模型。其中,相似度比对标注算法具有以下不足:一般题目没有充足的已标注题目作为相
似性比对的标准;题干的相似性并不能准确反应题目的考察重点和知识点指向。机器学习+
深度学习模型标注具有以下不足:该类模型依靠大量的已标注题目数据,且当前的此类模
型尚不能精准学习到题目的核心特征,尚无有效的模型可以商用。特征模型具有以下不足:
学科的知识特征专业性很强,市场中也没有通用的学科特征模型可以使用。
[0004] 因此,现有技术中存在的考点自动标注方法普遍存在对知识点标注效率低、标注准确性低的技术问题。

发明内容

[0005] 基于此,本发明的目的是提供一种基于教学思维的物理知识点智能识别方法及装置,旨在解决现有技术中考点自动标注方法普遍存在对知识点标注效率低、标注准确性低
的技术问题。
[0006] 本发明的第一方面在于提供一种基于教学思维的物理知识点智能识别方法,所述方法包括:
[0007] 基于物理学科的关键词与元知识点构建知识元素图谱,并基于物理学科的考点逻辑体系梳理出知识点与考点关联的考点知识图谱,根据所述知识元素图谱与所述考点知识
图谱提炼图谱逻辑关系;
[0008] 对物理题目进行结构化处理,分别提取每一部分内容的物理元素,通过预训练的语言模型对所述物理元素进行语意组合;
[0009] 构建考点识别算法模型,对物理题目的结构化分析和物理语意进行组合,识别出题目相关性强的考点区间,以对考点区间的物理考点进行标注。
[0010] 根据上述技术方案的一方面,对物理题目进行结构化处理,分别提取每一部分内容的物理元素的步骤,具体包括:
[0011] 将物理题目分解为物理场景条件、题干考查内容、选项文本内容与解析内容的题目内容;
[0012] 分别提取每一部分题目内容的物理关键词、物理知识点与考查物理量的物理元素。
[0013] 根据上述技术方案的一方面,分别提取每一部分题目内容的物理关键词、物理知识点、考查物理量的物理元素的步骤之后,所述方法还包括:
[0014] 通过预训练的语言模型对所述物理元素进行语意组合,形成具有物理意义的物理元素组合;
[0015] 对所述物理元素组合进行模型训练与分类,识别所述物理元素组合背后的物理场景、物理规律的应用以及重点考查物理量的学科关键信息。
[0016] 根据上述技术方案的一方面,对物理题目的结构化分析和物理语意进行组合,识别出题目相关性强的考点区间的步骤,具体包括:
[0017] 将物理题目的结构化分析结果和物理语意进行组合,识别出题目相关性较强的考点区间;
[0018] 将基于识别出的考点区间内的考点与所述物理元素组合,结合所述图谱逻辑关系,对考点识别算法模型的反馈学习机制进行算法逻辑的推演。
[0019] 根据上述技术方案的一方面,对考点识别算法模型的反馈学习机制进行算法逻辑的推演的步骤之后,所述方法包括:
[0020] 将算法逻辑的推演结果与真实结果进行对比验证,以生成反馈信息;
[0021] 将所述反馈信息反馈至所述考点识别算法模型,进行所述考点识别算法模型和所述图谱逻辑关系的反向学习优化。
[0022] 根据上述技术方案的一方面,所述方法还包括:
[0023] 根据所述考点识别算法模型和所述图谱逻辑关系的反向学习结果,对所述考点识别算法模型和图谱逻辑关系进行若干次迭代优化。
[0024] 本发明的第二方面在于提供一种基于教学思维的物理知识点智能识别装置,所述装置包括:
[0025] 逻辑构建模块,基于物理学科的关键词与元知识点构建知识元素图谱,并基于物理学科的考点逻辑体系梳理出知识点与考点关联的考点知识图谱,根据所述知识元素图谱
与所述考点知识图谱提炼图谱逻辑关系;
[0026] 题目处理模块,对物理题目进行结构化处理,分别提取每一部分内容的物理元素,通过预训练的语言模型对所述物理元素进行语意组合;
[0027] 标注学习模块,构建考点识别算法模型,对物理题目的结构化分析和物理语意进行组合,识别出题目相关性强的考点区间,以对考点区间的物理考点进行标注。
[0028] 根据上述技术方案的一方面,所述题目处理模块还用于:
[0029] 将物理题目分解为物理场景条件、题干考查内容、选项文本内容与解析内容的题目内容;
[0030] 分别提取每一部分题目内容的物理关键词、物理知识点与考查物理量的物理元素。
[0031] 根据上述技术方案的一方面,所述标注学习模块还用于:
[0032] 将物理题目的结构化分析结果和物理语意进行组合,识别出题目相关性较强的考点区间;
[0033] 将基于识别出的考点区间内的考点与所述物理元素组合,结合所述图谱逻辑关系,对考点识别算法模型的反馈学习机制进行算法逻辑的推演。
[0034] 与现有技术相比,采用本发明所示的基于教学思维的物理知识点智能识别方法及装置,通过构建知识元素图谱与考点知识图谱,根据知识元素图谱与考点知识图谱提炼图
谱逻辑关系,将物理题目结构化处理后提取每部分的物理元素,通过考点识别算法模型对
物理题目的结构化分析和物理语意进行组合,识别出题目相关性强的考点区间,以对考点
区间的物理考点进行标注。基本上可以覆盖到绝大多数的中学学科题目,特征组合的可解
释性强,因此对于考点标注的精准度可控,远超当前的通用识别模型,达到了替代人工标注
的目标,在效率和标准化方面远超过人工标注。

附图说明

[0035] 图1为本发明第一实施例基于教学思维的物理知识点智能识别方法的流程图;
[0036] 图2为本发明第二实施例基于教学思维的物理知识点智能识别方法中对物理题目结构化处理、提取物理元素及对物理元素语意组合的流程图;
[0037] 图3为本发明第二实施例基于教学思维的物理知识点智能识别方法中对通过算法模型识别考点区间、对考点区间内的物理考点进行标注的流程图;
[0038] 图4为本发明第三实施例基于教学思维的物理知识点智能识别装置的结构框图;
[0039] 以下具体实施方式将结合上述附图进一步说明本发明。

具体实施方式

[0040] 为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的若干实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所
描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容更加透彻全面。
[0041] 除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具
体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相
关的所列项目的任意的和所有的组合。
[0042] 请参阅图1,本发明的第一实施例在于提供一种基于教学思维的物理知识点智能识别方法,该方法包括步骤S10‑S30:
[0043] 步骤S10,基于物理学科的关键词与元知识点构建知识元素图谱,并基于物理学科的考点逻辑体系梳理出知识点与考点关联的考点知识图谱,根据知识元素图谱与考点知识
图谱提炼图谱逻辑关系;
[0044] 容易理解的,每个学科均有自己的学科特点,因此,学科题目中通常具有较强的学科题目特点;例如语文学科有较多汉字及语法使用,整体上是比较抽象的,英语学科由单词
以及语法构成,而物理学科则有物理公式及实际应用场景。
[0045] 在本实施例中,物理公式与实际应用场景相当于是物理学科的关键词与元知识点,基于物理学科的关键词与元知识点构建物理元素图谱,从而获取物理学科的物理元素。
[0046] 其中,基于物理学科的考点逻辑体系梳理出知识点与考点关联的考点知识图谱,物理学科中有较多知识点,如牛顿第三定律等等。根据教育大纲、往年考试规律以及教师经
验梳理出考点逻辑体系,当上述牛顿第三定律为物理考试的重点考查方向,则认为牛顿第
三定律与考点关联,与其它考点同时构建考点知识图谱。
[0047] 步骤S20,对物理题目进行结构化处理,分别提取每一部分内容的物理元素,通过预训练的语言模型对物理元素进行语意组合;
[0048] 如物理选择题,可以将物理选择题分成题干部分、选项部分与答案解析部分,以及该物理选择题实际的考查场景等题目内容,以分别提取每部分题目内容的物理元素。
[0049] 示例而非限定,题干部分的关键词如“求力的大小”为题干部分的物理元素,选项部分的关键词如“牛米”为选项部分的物理元素,答案解析的关键词如“根据XX定律、根据XX
公式”为答案解析部分的物理元素。
[0050] 步骤S30,构建考点识别算法模型,对物理题目的结构化分析和物理语意进行组合,识别出题目相关性强的考点区间,以对考点区间的物理考点进行标注。
[0051] 采用本实施例所示的基于教学思维的物理知识点智能识别方法,通过构建知识元素图谱与考点知识图谱,根据知识元素图谱与考点知识图谱提炼图谱逻辑关系,将物理题
目结构化处理后提取每部分的物理元素,通过考点识别算法模型对物理题目的结构化分析
和物理语意进行组合,识别出题目相关性强的考点区间,以对考点区间的物理考点进行标
注。本发明所示的基于教学思维的物理知识点智能识别方法,基本上可以覆盖到绝大多数
的中学学科题目,特征组合的可解释性强,因此对于考点标注的精准度可控,远超当前的通
用识别模型,达到了替代人工标注的目标,在效率和标准化方面远超过人工标注。
[0052] 请参阅图2与图3,本发明的第二实施例提供了一种基于教学思维的物理知识点智能识别方法,本实施例所示的基于教学思维的物理知识点智能识别方法与第一实施例所示
的基于教学思维的物理知识点智能识别方法的区别在于:
[0053] 在本实施例中,步骤S20具体包括步骤S201‑S204:
[0054] 步骤S201,将物理题目分解为物理场景条件、题干考查内容、选项文本内容与解析内容的题目内容;
[0055] 步骤S202,分别提取每一部分题目内容的物理关键词、物理知识点与考查物理量的物理元素;
[0056] 如物理选择题,可以将物理选择题分成题干部分、选项部分与答案解析部分,以及该物理选择题实际的考查场景等题目内容,以分别提取每部分题目内容的物理元素。
[0057] 示例而非限定,题干部分的关键词如“求力的大小”为题干部分的物理元素,选项部分的关键词如“牛米”为选项部分的物理元素,答案解析的关键词如“根据XX定律、根据XX
公式”为答案解析部分的物理元素。
[0058] 步骤S203,通过预训练的语言模型对物理元素进行语意组合,形成具有物理意义的物理元素组合;
[0059] 步骤S204,对物理元素组合进行模型训练与分类,识别物理元素组合背后的物理场景、物理规律的应用以及重点考查物理量的学科关键信息。
[0060] 在本实施例中,步骤S30具体包括步骤S301‑S305:
[0061] 步骤S301,将物理题目的结构化分析结果和物理语意进行组合,识别出题目相关性较强的考点区间;
[0062] 步骤S302,将基于识别出的考点区间内的考点与物理元素组合,结合图谱逻辑关系,对考点识别算法模型的反馈学习机制进行算法逻辑的推演;
[0063] 步骤S303,将算法逻辑的推演结果与真实结果进行对比验证,以生成反馈信息;
[0064] 步骤S304,将反馈信息反馈至考点识别算法模型,进行考点识别算法模型和图谱逻辑关系的反向学习优化。
[0065] 步骤S305,根据考点识别算法模型和图谱逻辑关系的反向学习结果,对考点识别算法模型和图谱逻辑关系进行若干次迭代优化。
[0066] 在本实施例中,通过对考点识别算法模型和图谱逻辑关系进行若干次迭代优化,从而使模型的精准度和效率不断提升,最终达到替代人工标注的目的。
[0067] 采用本实施例所示的基于教学思维的物理知识点智能识别方法,通过构建知识元素图谱与考点知识图谱,根据知识元素图谱与考点知识图谱提炼图谱逻辑关系,将物理题
目结构化处理后提取每部分的物理元素,通过考点识别算法模型对物理题目的结构化分析
和物理语意进行组合,识别出题目相关性强的考点区间,以对考点区间的物理考点进行标
注。本实施例所示的基于教学思维的物理知识点智能识别方法,基本上可以覆盖到绝大多
数的中学学科题目,特征组合的可解释性强,因此对于考点标注的精准度可控,远超当前的
通用识别模型,达到了替代人工标注的目标,在效率和标准化方面远超过人工标注。并且在
后期的实践过程中,能够根据标注结果的反馈对考点算法模型持续优化,以进一步提升考
点标注的精准度。
[0068] 请参阅图4,本发明的第三实施例提供了一种基于教学思维的物理知识点智能识别装置,该基于教学思维的物理知识点智能识别装置包括:
[0069] 逻辑构建模块10,用于基于物理学科的关键词与元知识点构建知识元素图谱,并基于物理学科的考点逻辑体系梳理出知识点与考点关联的考点知识图谱,根据知识元素图
谱与考点知识图谱提炼图谱逻辑关系;
[0070] 容易理解的,每个学科均有自己的学科特点,因此,学科题目中通常具有较强的学科题目特点;例如语文学科有较多汉字及语法使用,整体上是比较抽象的,英语学科由单词
以及语法构成,而物理学科则有物理公式及实际应用场景。
[0071] 在本实施例中,物理公式与实际应用场景相当于是物理学科的关键词与元知识点,基于物理学科的关键词与元知识点构建物理元素图谱,从而获取物理学科的物理元素。
[0072] 其中,基于物理学科的考点逻辑体系梳理出知识点与考点关联的考点知识图谱,物理学科中有较多知识点,如牛顿第三定律等等。根据教育大纲、往年考试规律以及教师经
验梳理出考点逻辑体系,当上述牛顿第三定律为物理考试的重点考查方向,则认为牛顿第
三定律与考点关联,与其它考点同时构建考点知识图谱。
[0073] 题目处理模块20,用于对物理题目进行结构化处理,分别提取每一部分内容的物理元素,通过预训练的语言模型对物理元素进行语意组合;
[0074] 如物理选择题,可以将物理选择题分成题干部分、选项部分与答案解析部分,以及该物理选择题实际的考查场景等题目内容,以分别提取每部分题目内容的物理元素。
[0075] 示例而非限定,题干部分的关键词如“求力的大小”为题干部分的物理元素,选项部分的关键词如“牛米”为选项部分的物理元素,答案解析的关键词如“根据XX定律、根据XX
公式”为答案解析部分的物理元素。
[0076] 标注学习模块30,用于构建考点识别算法模型,对物理题目的结构化分析和物理语意进行组合,识别出题目相关性强的考点区间,以对考点区间的物理考点进行标注。
[0077] 在本实施例中,题目处理模块20具体用于:
[0078] 将物理题目分解为物理场景条件、题干考查内容、选项文本内容与解析内容的题目内容;
[0079] 分别提取每一部分题目内容的物理关键词、物理知识点与考查物理量的物理元素;
[0080] 通过预训练的语言模型对物理元素进行语意组合,形成具有物理意义的物理元素组合;
[0081] 对物理元素组合进行模型训练与分类,识别物理元素组合背后的物理场景、物理规律的应用以及重点考查物理量的学科关键信息。
[0082] 在本实施例中,标注学习模块30具体用于:
[0083] 将物理题目的结构化分析结果和物理语意进行组合,识别出题目相关性较强的考点区间;
[0084] 将基于识别出的考点区间内的考点与物理元素组合,结合图谱逻辑关系,对考点识别算法模型的反馈学习机制进行算法逻辑的推演;
[0085] 将算法逻辑的推演结果与真实结果进行对比验证,以生成反馈信息;
[0086] 将反馈信息反馈至考点识别算法模型,进行考点识别算法模型和图谱逻辑关系的反向学习优化;
[0087] 根据考点识别算法模型和图谱逻辑关系的反向学习结果,对考点识别算法模型和图谱逻辑关系进行若干次迭代优化。
[0088] 采用本实施例所示的基于教学思维的物理知识点智能识别装置,通过构建知识元素图谱与考点知识图谱,根据知识元素图谱与考点知识图谱提炼图谱逻辑关系,将物理题
目结构化处理后提取每部分的物理元素,通过考点识别算法模型对物理题目的结构化分析
和物理语意进行组合,识别出题目相关性强的考点区间,以对考点区间的物理考点进行标
注。本实施例所示的基于教学思维的物理知识点智能识别装置,基本上可以覆盖到绝大多
数的中学学科题目,特征组合的可解释性强,因此对于考点标注的精准度可控,远超当前的
通用识别模型,达到了替代人工标注的目标,在效率和标准化方面远超过人工标注。
[0089] 应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件
或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下
列技术中的任一项或它们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路
的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场
可编程门阵列(FPGA)等。
[0090] 在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特
点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不
一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何
的一个或多个实施例或示例中以合适的方式结合。
[0091] 以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员
来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保
护范围。因此,本发明专利的保护范围应以所附权利要求为准。