一种基于预训练的慕课自适应学习系统构建方法和装置转让专利

申请号 : CN202210068224.0

文献号 : CN114567815B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 钟清扬于济凡王禹权侯磊许斌李涓子唐杰

申请人 : 清华大学

摘要 :

本发明公开了一种基于预训练的慕课自适应学习系统构建方法和装置,其中,该方法包括:获取第一预设时间内慕课平台记录的学生学习行为数据,以及预设条件下的辅助信息,辅助信息至少包括课程结构元信息和视频字幕文本;基于学生学习行为数据,以预设的粒度对学习行为日志进行聚合与处理,得到学生学习行为序列;基于辅助信息进行知识挖掘,获取课程结构元信息与视频的初始表示;基于学生学习行为序列和初始表示构建学习行为预训练模型,并采用掩码预测任务训练模型;将学习行为预训练模型应用于学习资源推荐和学习资源评估两个核心下游任务。本发明能够对慕课场景的学习行为、学习资源进行统一建模,构建出性能更强、更通用的自适应学习系统。

权利要求 :

1.一种基于预训练的慕课自适应学习系统构建方法,其特征在于,包括以下步骤:S1,获取第一预设时间内慕课平台记录的学生学习行为数据,以及预设条件下的辅助信息,所述辅助信息至少包括课程结构元信息和视频字幕文本;

S2,基于所述学生学习行为数据,以预设的粒度对学习行为日志进行聚合与处理,得到学生学习行为序列;

S3,基于所述辅助信息进行知识挖掘,获取所述课程结构元信息与视频的初始表示;

S4,基于所述学生学习行为序列和所述初始表示构建学习行为预训练模型,并采用掩码预测任务训练模型;

S5,将所述学习行为预训练模型应用于学习资源推荐和学习资源评估两个核心下游任务;

所述S4,包括:

S41,将视频集合作为语言建模中的词表,将学生与视频的交互作为语言建模中的单词,将所述学生学习行为序列作为句子,执行预训练任务以构建学习行为预训练模型;

S42,执行掩码预测任务进行模型的自监督预训练;

所述学习资源评估,包括:

使用所述预训练模型中的视频嵌入以及元信息嵌入作为特征,使用分类器对视频评论率与课程完课率做预测,以实现对学习资源质量的评估;

所述使用分类器对视频评论率与课程完课率做预测,包括:选取视频评论率介于第一预设数值与第二预设数值之间的视频,以及课程完课率介于第三预设数值与第四预设数值之间的视频,分别对所述视频评论率和所述课程完课率取对数,将视频按照对数评论率从高到低排序,按照预设百分比排名将视频的质量分类;

分别将数据集随机打乱后按预设比例划分为训练集、验证集和测试集,使用XGBoost作分类器并使用贝叶斯优化对超参数进行调优。

2.根据权利要求1所述方法,其特征在于,所述S2,包括:S21,在第二预设时间打点记录学生当前观看的视频以及视频中的位置;

S22,对于每个学生,按照时间戳对其全部的打点记录进行排序,合并相邻的同视频的连续学习记录,得到所述学生学习行为序列。

3.根据权利要求1所述方法,其特征在于,所述S3,包括:S31,将视频所属的课程作为所述课程结构元信息;

S32,将所有视频字幕作为文本语料库,使用命名实体识别微调语言模型提取视频中包含的概念,获取视频的概念嵌入或文本嵌入作为视频的初始表示。

4.根据权利要求1所述的方法,其特征在于,所述学习资源推荐,包括:选取观看的最后一个视频作为测试集、倒数第二个视频作为验证集,其余视频作为训练集对所述预训练模型进行微调;

从未看过的视频集合中,按照交互热度从高到低的次序,抽取预设数量的不重复视频作为负样本,使用模型对所述负样本与真值的混合集合进行排序;

实时记录视频观看行为和更新历史学习记录,将最新的历史学习记录输入微调后的模型中,输出预测值分布并将预测概率值最大的视频进行推荐。

5.根据权利要求3所述的方法,其特征在于,所述S32,包括:将视频中提取出的所有概念拼接成长文本、或使用视频字幕文本,输入微调后的RoBERTa模型,获取最后一层输出层的向量并作归一化处理,得到该视频的概念嵌入或文本嵌入,以分别作为视频的初始表示。

6.根据权利要求1所述的方法,其特征在于:所述视频评论率为视频对应讨论区评论数与观看该视频的总学生数的比值;所述课程完课率为看完任一课程全部视频的学生数占该课程选课总人数的比例。

7.一种基于预训练的慕课自适应学习系统构建装置,其特征在于,包括:获取模块,用于获取第一预设时间内慕课平台记录的学生学习行为数据,以及预设条件下的辅助信息,所述辅助信息至少包括课程结构元信息和视频字幕文本;

处理模块,用于基于所述学生学习行为数据,以预设的粒度对学习行为日志进行聚合与处理,得到学生学习行为序列;

挖掘模块,用于基于所述辅助信息进行知识挖掘,获取所述课程结构元信息与视频的初始表示;

构建模块,用于基于所述学生学习行为序列和所述初始表示构建学习行为预训练模型,并采用掩码预测任务训练模型;

应用模块,用于将所述学习行为预训练模型应用于学习资源推荐和学习资源评估两个核心下游任务;

所述构建模块,还用于:

将视频集合作为语言建模中的词表,将学生与视频的交互作为语言建模中的单词,将所述学生学习行为序列作为句子,执行预训练任务以构建学习行为预训练模型;

执行掩码预测任务进行模型的自监督预训练;

所述学习资源评估,包括:

使用所述预训练模型中的视频嵌入以及元信息嵌入作为特征,使用分类器对视频评论率与课程完课率做预测,以实现对学习资源质量的评估;

所述使用分类器对视频评论率与课程完课率做预测,包括:选取视频评论率介于第一预设数值与第二预设数值之间的视频,以及课程完课率介于第三预设数值与第四预设数值之间的视频,分别对所述视频评论率和所述课程完课率取对数,将视频按照对数评论率从高到低排序,按照预设百分比排名将视频的质量分类;

分别将数据集随机打乱后按预设比例划分为训练集、验证集和测试集,使用XGBoost作分类器并使用贝叶斯优化对超参数进行调优。

说明书 :

一种基于预训练的慕课自适应学习系统构建方法和装置

技术领域

[0001] 本发明涉及网络信息技术领域,尤其涉及一种基于预训练的慕课自适应学习系统构建方法和装置。

背景技术

[0002] 自适应学习又称自适应教学,旨在向学生提供个性化的学习体验。传统的课堂学习向所有学习者提供一刀切式的教学场景,学习体验高度同质化;自适应学习则强调通过资源、反馈与路径规划,满足每个学习者的独特需求。自适应学习主要包含三个重要的方向:通过数据挖掘与自然语言处理技术,组织、建模学习材料,获取自适应学习的资源;通过认知诊断与知识追踪技术,实时反馈学生的知识技能掌握程度;通过序列推荐或知识结构获取技术,综合学生的历史表现、当前知识状态与候选对象,为学习者推荐适合的学习资源、规划学习路径,实现自适应学习系统指导学习的核心功能。
[0003] 尽管深度学习技术已经在自适应学习领域得到广泛应用并取得了优于统计方法的效果,但现有的自适应学习系统构建方法存在两个明显的局限:
[0004] 一方面,教育学认知框架理论指出,自适应学习子任务间是相互关联、协调统一的,自适应学习系统应该具有任务间信息共享能力与泛化迁移能力;然而现有的方法往往针对每个特定的自适应学习任务设计独立的模型,各模型只考虑与任务相关的部分特征、未充分融合全学习过程的丰富信息,导致自适应学习系统仅是各独立子任务的组合,模型泛化性较差、且系统难以从任务协同中获益。另一方面,大规模在线开放课程(MOOC,以下简称为慕课)能够记录学生在真实场景中的大量细粒度学习行为,为自适应学习系统提供大规模无标签数据;然而面向特定自适应学习任务的数据集仍严重依赖昂贵的专家标注,通常规模较小且难以获得,导致模型无法充分发挥潜能、且造成大量原始信息浪费。
[0005] 预训练技术源自于自然语言处理领域的语言建模:首先在大规模语料库上对模型进行自监督训练,获取通用的、具有泛化能力的语言表示;再将预训练表示作为下游任务的特征、或在下游任务训练过程中微调模型参数,最终在多种下游任务上达到顶尖效果。类比至自适应学习领域,使用预训练技术对学习过程进行建模,可以促进多种类型的自适应学习下游任务,提高模型在缺乏标注数据时的表现能力。预训练模型能够充分利用学习过程中的多源信息、整合多层次的学习特征,因而可以成为通用的构建自适应学习系统的基础。

发明内容

[0006] 本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
[0007] 为此,本发明的目的在于实现对慕课场景的学习行为、学习资源等进行统一建模,提高学习资源推荐、学习资源评估等多种自适应学习核心任务的效果,提出了一种基于预训练的慕课自适应学习系统构建方法。
[0008] 本发明的另一个目的在于提出一种基于预训练的慕课自适应学习系统构建装置。
[0009] 为达上述目的,本发明一方面提出了基于预训练的慕课自适应学习系统构建方法,包括以下步骤:
[0010] S1,获取第一预设时间内慕课平台记录的学生学习行为数据,以及预设条件下的辅助信息,所述辅助信息至少包括课程结构元信息和视频字幕文本;
[0011] S2,基于所述学生学习行为数据,以预设的粒度对学习行为日志进行聚合与处理,得到学生学习行为序列;
[0012] S3,基于所述辅助信息进行知识挖掘,获取所述课程结构元信息与视频的初始表示;
[0013] S4,基于所述学生学习行为序列和所述初始表示构建学习行为预训练模型,并采用掩码预测任务训练模型;
[0014] S5,将所述学习行为预训练模型应用于学习资源推荐和学习资源评估两个核心下游任务。
[0015] 根据本发明实施例的基于预训练的慕课自适应学习系统构建方法,针对学生学习行为序列构建预训练模型,利用课程结构元信息和视频字幕文本作为辅助信息,采用掩码预测任务对模型进行预训练,最终应用于学习资源推荐和学习资源评估下游任务。本发明能够对慕课场景的学习行为、学习资源进行统一建模,构建出性能更强、更通用的自适应学习系统。
[0016] 另外,根据本发明上述实施例的基于预训练的慕课自适应学习系统构建方法还可以具有以下附加的技术特征:
[0017] 进一步地,所述S2,包括:
[0018] S21,在第二预设时间打点记录学生当前观看的视频以及视频中的位置;
[0019] S22,对于每个学生,按照时间戳对其全部的打点记录进行排序,合并相邻的同视频的连续学习记录,得到所述学生学习行为序列。
[0020] 进一步地,所述S3,包括:
[0021] S31,将视频所属的课程作为所述课程结构元信息;
[0022] S32,将所有视频字幕作为文本语料库,使用命名实体识别微调语言模型提取视频中包含的概念,获取视频的概念嵌入或文本嵌入作为视频的初始表示。
[0023] 进一步地,所述S4,包括:
[0024] S41,将视频集合作为语言建模中的词表,将学生与视频的交互作为语言建模中的单词,将所述学生学习行为序列作为句子,执行预训练任务以构建学习行为预训练模型;
[0025] S42,执行掩码预测任务进行模型的自监督预训练。
[0026] 进一步地,所述学习资源推荐,包括:
[0027] 选取观看的最后一个视频作为测试集、倒数第二个视频作为验证集,其余视频作为训练集对所述预训练模型进行微调;
[0028] 从未看过的视频集合中,按照交互热度从高到低的次序,抽取预设数量的不重复视频作为负样本,使用模型对所述负样本与真值的混合集合进行排序;
[0029] 实时记录视频观看行为和更新历史学习记录,将最新的历史学习记录输入微调后的模型中,输出预测值分布并将预测概率值最大的视频进行推荐。
[0030] 进一步地,所述学习资源评估,包括:
[0031] 使用所述预训练模型中的视频嵌入以及元信息嵌入作为特征,使用分类器对视频评论率与课程完课率做预测,以实现对学习资源质量的评估。
[0032] 进一步地,所述使用分类器对视频评论率与课程完课率做预测,包括:
[0033] 选取视频评论率介于第一预设数值与第二预设数值之间的视频,以及课程完课率介于第三预设数值与第四预设数值之间的视频,分别所述对视频评论率和所述课程完课率取对数,将视频按照对数评论率从高到低排序,按照预设百分比排名将视频的质量分类;
[0034] 分别将数据集随机打乱后按预设比例划分为训练集、验证集和测试集,使用XGBoost作分类器并使用贝叶斯优化对超参数进行调优。
[0035] 进一步地,所述S32,包括:
[0036] 将视频中提取出的所有概念拼接成长文本、或使用视频字幕文本,输入微调后的RoBERTa模型,获取最后一层输出层的向量并作归一化处理,得到该视频的概念嵌入或文本嵌入,以分别作为视频的初始表示。
[0037] 进一步地,所述视频评论率为视频对应讨论区评论数与观看该视频的总学生数的比值;所述课程完课率为看完任一课程全部视频的学生数占该课程选课总人数的比例。
[0038] 为达到上述目的,本发明另一方面提出了一种基于预训练的慕课自适应学习系统构建装置,包括:
[0039] 获取模块,用于获取第一预设时间内慕课平台记录的学生学习行为数据,以及预设条件下的辅助信息,所述辅助信息至少包括课程结构元信息和视频字幕文本;
[0040] 处理模块,用于基于所述学生学习行为数据,以预设的粒度对学习行为日志进行聚合与处理,得到学生学习行为序列;
[0041] 挖掘模块,用于基于所述辅助信息进行知识挖掘,获取所述课程结构元信息与视频的初始表示;
[0042] 构建模块,用于基于所述学生学习行为序列和所述初始表示构建学习行为预训练模型,并采用掩码预测任务训练模型;
[0043] 应用模块,用于将所述学习行为预训练模型应用于学习资源推荐和学习资源评估两个核心下游任务。
[0044] 根据本发明实施例的基于预训练的慕课自适应学习系统构建装置,针对学生学习行为序列构建预训练模型,利用课程结构元信息和视频字幕文本作为辅助信息,采用掩码预测任务对模型进行预训练,最终应用于学习资源推荐和学习资源评估下游任务。本发明能够对慕课场景的学习行为、学习资源进行统一建模,构建出性能更强、更通用的自适应学习系统。
[0045] 本发明的有益效果:
[0046] 本发明能够对慕课场景的学习行为、学习资源进行统一建模,构建出性能更强、更通用的自适应学习系统。
[0047] 本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

[0048] 本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0049] 图1为根据本发明实施例的基于预训练的慕课自适应学习系统构建方法的流程图;
[0050] 图2为根据本发明实施例的学生学习行为序列训练过程的示意图;
[0051] 图3为根据本发明实施例的基于预训练的慕课自适应学习系统构建方法的另一流程图;
[0052] 图4为根据本发明实施例的基于预训练的慕课自适应学习系统构建装置的结构示意图。

具体实施方式

[0053] 需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
[0054] 为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
[0055] 下面参照附图描述根据本发明实施例提出的基于预训练的慕课自适应学习系统构建方法及装置,首先将参照附图描述根据本发明实施例提出的基于预训练的慕课自适应学习系统构建方法。
[0056] 图1是本发明一个实施例的基于预训练的慕课自适应学习系统构建方法的流程图。
[0057] 如图1所示,该基于预训练的慕课自适应学习系统构建方法包括以下步骤:
[0058] 步骤S1,获取第一预设时间内慕课平台记录的学生学习行为数据,以及预设条件下的辅助信息,辅助信息至少包括课程结构元信息和视频字幕文本。
[0059] 应当理解的是,本发明旨在对慕课场景的学习行为、学习资源等进行统一建模,构建自适应学习系统,因此,需要事先指定某慕课平台作为研究对象。
[0060] 具体地,观看课程视频是学生学习慕课时最核心的学习行为,因此需要收集一段时间内,该慕课平台产生的全部的视频观看行为记录。条件允许时,收集课程结构元信息、视频字幕文本等数据作为辅助信息,有助于自适应学习系统提高性能。
[0061] 课程结构元信息指慕课平台展示学习资源时,借助课程、章节等信息将视频组织成的树状层次结构,用于体现视频间的显式联系。
[0062] 步骤S2,基于学生学习行为数据,以预设的粒度对学习行为日志进行聚合与处理,得到学生学习行为序列。
[0063] 需要说明的是,慕课平台原始记录不能直接用于模型预训练,需要以合适的粒度对学习行为日志进行聚合与处理,最终得到学生学习行为序列。
[0064] 具体地,视频观看行为的原始记录通常是学生观看视频时产生的打点日志,假设每5秒系统打点记录一次学生当前观看的视频以及视频中的位置。对于每个学生,按照时间戳对其全部的打点记录进行排序,合并相邻的同视频的连续学习记录,最终可以得到总长度合适且相邻不重复的、与学生观看行为相对应的视频序列(以下简称为学习行为序列)。保留打点日志中的细粒度信息,可以获悉学生观看每段视频的时长与观看的内容。
[0065] 步骤S3,基于辅助信息进行知识挖掘,获取课程结构元信息与视频的初始表示。
[0066] 可以理解的是,除学生的学习行为序列外,很多有价值的其他信息可以辅助自适应学习系统的构建。
[0067] 具体地,本发明的一个实施例选用慕课平台最常见的课程结构元信息和视频字幕文本作为辅助信息。视频是慕课课程的最小学习单元,每门课程通常包含多个章节,每个章节中包含多段视频。利用课程、章节信息可以将视频组织成树状层次结构,获得视频间的显式联系。本发明的一个实施例设计预训练模型时使用视频所属的课程作为课程结构元信息。此外,慕课视频通常提供字幕方便学生学习。视频字幕将视频内容保存为文本形式,可以进一步用于知识挖掘。视频中教授的知识概念(以下简称概念,例如“监督学习”),包含视频内容的先验信息。将全部视频的所有字幕作为语料库、使用命名实体识别(NER)的方法对语言模型RoBERTa进行微调,可以提取视频文本中包含的概念。对于每个视频,将视频中提取出的所有概念拼接成长文本、或直接使用字幕文本,输入微调后的RoBERTa模型,获取最后一层输出层的向量、并作归一化处理,可以得到该视频的概念嵌入或文本嵌入;二者分别可以作为视频的初始表示。下表展示了某位学生的学习行为序列,以及搭建预训练模型所需要的其他对应信息。
[0068] 表1:学生U112展现学习行为序列示例
[0069]
[0070] 如表1所示,U112依次观看了不同课程中的视频V59645和V99152;同时,表中还列出了每个视频的课程结构元信息、字幕文本和概念。
[0071] 步骤S4,基于学生学习行为序列和初始表示构建学习行为预训练模型,并采用掩码预测任务训练模型。
[0072] 具体地,针对学习过程构建基于多层双向Transformer结构的预训练模型,将视频集合看作语言建模中的“词表”,将学生与视频的交互看作语言建模中的“标记”(“单词”),将学生学习行为序列看作“句子”,执行“掩码预测”任务进行模型的自监督预训练。模型结构和预训练任务的符号化表示如下:
[0073] 以U表示学生集合,V表示视频集合,C表示课程集合,M表示概念集合。vi∈V表示一个视频,对应字幕文本γi,属于课程Ci∈C。 是vi中提取出的概念。给定学生u,其按照时间顺序的学习行为序列是 是表示学生u所观看的第t个视频,nu是序列长度。
[0074] 选取多层双向Transformer作为预训练模型的基础结构,整体模型分为三层:嵌入层、自注意力层和输出层。嵌入层获取输入自注意力层的嵌入表示,是视频嵌入、元信息嵌入与位置嵌入的加和。 是视频 的d维嵌入表示,pi是序列第i位的d维位置嵌入。根据步骤S3获取视频初始表示的方法,使用该视频的概念嵌入或文本嵌入作为 的初始化表示:
[0075]
[0076] 课程结构元信息可以提供观察学生学习行为的宏观视角,模型训练中额外学习元信息嵌入有助于增强视频表示。根据步骤S3,使用视频所属的课程作为元信息, 是课程的d维嵌入表示。则输入自注意力层的序列中标记的最终嵌入表示为
[0077]
[0078] 在嵌入层的基础上,自注意力层使用多个自注意力块叠加对整个学习行为序列进行编码,L表示自注意力层中的自注意力块数,表示自注意力头的数目。每个自注意力块由l多头自注意力子层和前馈子层组成,H是第l个自注意力块的隐层表示, 对于每个l
自注意力块而言,多头自注意力子层首先通过不同的可学习线性映射,将H映射到A个不同的子空间;然后该块的各个自注意力头并行计算注意力分数(计算方法与Transformer相同),每个自注意力头输出d/A维向量;将自注意力头的输出向量合并后,通过再次投影并经过前馈子层,最终得到第l个自注意力块的输出:
[0079]
[0080]
[0081] Hl+1=FFN(MultiHead(Hl))
[0082] 映射矩阵 WO∈Rd×d都是可学习参数。FFN(·)是两层前馈神经网络。第L个自注意力块的输出就是自注意力层最终输出。
[0083] 本发明的一个实施例采用“掩码预测”任务用于模型的自监督预训练。与自然语言处理中的“掩码语言建模”类似,每步训练时,从输入序列中随机选取比例为τ的视频进行“遮盖”,替换为特殊标记“[mask]”(以下简称为掩码),然后根据上下文预测掩码所对应的原始视频。假设第t步训练时随机遮盖的视频是 需要将其对应的自注意力层输出 喂入输出层,预测掩码对应的目标项。输出层采用两层前馈网络结构,使用GELU做激活函数,生成视频集合上的输出分布。最终每个经过随机遮盖的输入序列S′u的损失函数是所有掩码项的负对数似然:
[0084]
[0085]
[0086] WP是可学习的映射矩阵,bP和bO是偏置项,E∈R|V|×d是视频集合V的嵌入矩阵。输入层与输出层共享视频嵌入表示,以缓解过拟合问题且缩减模型大小。S′u是学生学习序列Su经过随机遮盖后的序列, 是其中的随机掩码项, 是掩码项vm对应的真值。
[0087] 上述模型结构和预训练任务中主要参数的缺省值设置如下:自注意力块数L=2,自注意力头的数目A=4,嵌入表示的维度d=256,学生学习序列长度nu的最大值为100。参数设置可以根据实验效果进行调整。
[0088] 图2展示了某位学生的学习行为序列训练过程示例。假设该学生共依次观看5个视频v_1,v_2,v_3,v_4,v_5,为方便和小写字母区分,以E表示嵌入。根据步骤S3和S4,可以得到序列中每个标记对应的文本/向量嵌入、元信息嵌入和位置嵌入;加和后输入自注意力层对序列进行编码,最终在输出层对掩码项进行预测,计算出损失函数;根据损失函数可以使用随机梯度下降法对模型参数进行优化,完成预训练过程。图中的“[CLS]”标记是固定的句首标记符,便于根据下游任务需要,灵活获取整个序列表示。
[0089] 如果条件不允许,难以收集课程结构元信息、视频字幕文本等辅助信息,可以直接在嵌入层中省略相应嵌入,不需要更改模型结构。
[0090] 步骤S5,将学习行为预训练模型应用于学习资源推荐和学习资源评估两个核心下游任务。
[0091] 具体地,学习行为预训练模型实现了对慕课场景学习行为、学习资源等的统一建模。构建自适应学习系统,需要将预训练模型的泛化能力应用于自适应学习的具体任务。本发明的一个实施例给出学习行为预训练模型应用于学习资源推荐和学习资源评估这两个核心下游任务的方法。
[0092] 首先是学习资源推荐。慕课场景中,学习资源推荐的目标是根据学生的历史学习记录为其推荐接下来将要学习的视频。选取学生观看的最后一个视频作为测试集、倒数第二个视频作为验证集,其余视频作为训练集,在学习资源推荐任务上对预训练模型进行微调。为测试模型在下游任务上的表现,需要从该学生未看过的视频集合中,按照交互热度从高到低的次序,抽取100个不重复视频作为负样本,使用模型对负样本与真值的混合集合进行排序,观察模型能否将学生接下来真实学到的视频准确地排序在前。
[0093] 微调后的模型可以直接部署至慕课平台,作为自适应学习系统的一部分与学生进行交互。对于参与慕课学习的每位学生,平台将实时记录他的视频观看行为,及时更新他的历史学习记录。将学生最新的历史学习记录输入微调后的模型中,模型将在视频全集上输出预测值分布,并将预测概率值最大的视频推荐给学生进一步学习。
[0094] 其次是学习资源评估。学习资源评估任务的目的是验证预训练模型“阅读”大量学生学习行为序列后“学到”的视频嵌入及元信息嵌入,能融合更通用的隐层知识,迁移到不同的自适应学习子任务中。对于视频而言,学生的观看完成率、复习率、评论率都是视频质量的间接体现,内容详实、讲解清晰的视频往往更受学生欢迎、有更高的观看完成率、复习率和评论率;对于课程而言,完课率等指标同样可以体现课程质量。本发明的一个实施例使用预训练模型中的视频嵌入及元信息嵌入作为特征,使用常见分类器对视频评论率与课程完课率做预测,实现对学习资源质量的评估。
[0095] 视频评论率指某视频对应讨论区评论数与观看该视频的总学生数的比值,可以反映出学生学习该视频时的积极性与参与度。对视频评论率做预测时,首先选取评论率介于0~2之间的视频,以减少异常值对预测结果的影响;再对视频评论率取对数,可以发现视频的对数评论率基本呈正态分布。将视频按照对数评论率从高到低排序,按照排名位于前25%、25%~50%、50%~75%和75%后,将视频分为质量“优秀”、“良好”、“及格”和“不理想”四类,从而将视频评论率预测转化为四分类任务。将数据集随机打乱后按8:1:1划分为训练集、验证集和测试集,使用XGBoost作分类器并使用贝叶斯优化对超参数进行调优,可以发现预训练模型中的视频嵌入能够较好地完成视频评论率预测任务,准确地对视频质量进行评估。
[0096] 课程完课率指看完某课程全部视频的学生数占该课程选课总人数的比例。较高的课程完课率对应着较低的中途退课率,反映出学生对该课程的持续兴趣。对课程完课率做预测时,除课程完课率都介于0~1之间外,其余处理方式与视频评论率预测保持一致,最终同样转化为四分类任务。由于预训练时使用视频所属的课程作为课程结构元信息,因此预训练模型中的元信息嵌入就是课程嵌入、可以作为预测课程完课率的特征。
[0097] 作为一种示例,图3是本发明一种实施例的另一流程图,对上述步骤进行了具体描述。本发明的一个实施例获得的实验效果描述如下:
[0098] (1)学习资源推荐
[0099] 学习资源推荐的任务是评估自适应学习系统性能的主要下游任务。本实施例选取4个现有的最先进的基准方法进行对比,并对针对预训练模型使用的辅助信息进行消融实验。评估时选取是归一化累积折扣增益NDCG@k和召回率Recall@k作为指标,k可以取1、5、
10,表示关注排序结果前k位的表现。对于这两个指标而言,值越大说明模型性能越好。
[0100] 基准方法中,POP指根据学生与视频交互的热度对候选集合排序;KSS指根据课程编排时的教学顺序对候选集合排序,默认严格按照教学序列的下个视频是学生接下来要学习的项;GRU4Rec是基于门控循环神经网络的会话层级推荐模型,常用于序列推荐任务;CASER使用卷积神经网络对高阶信息进行建模,用于序列推荐。模型排序准确度的比较如表
2所示(表中的数值都是百分数,省略百分号),说明本发明提出的方法在学习资源推荐任务上,效果远优于现有方法。
[0101] 表2:学习资源推荐任务的模型准确度比较
[0102]
[0103] 在学习资源推荐任务上对预训练模型使用的辅助信息进行消融实验,可以分析各辅助信息对自适应学习系统的作用,证明构建自适应学习系统时,对学习行为、学习资源等多源信息进行统一建模的必要性。将不使用任何额外辅助信息的预训练模型称为基础模型,依次添加各种辅助信息及其组合,得到消融实验结果如表3(表中的数值都是百分数,省略百分号):
[0104] 表3:消融实验结果
[0105]
[0106] 需要说明的是文本嵌入和概念嵌入都可同于视频表示初始化,二者属于替代关系,不能同时使用。表2中汇报的结果是本实施例中同时使用文本嵌入和元信息嵌入的情况。
[0107] (2)学习资源评估
[0108] 学习资源评估任务选取准确率(Accuracy)、精确率(Precision)、召回率(Recall)和F1分数(F1‑score)作为分类指标。精确率指正确预测的正样本占所有预测为正的样本的比例,召回率指正确预测的正样本占所有正样本的比例,F1分数可以由2×(Precision×Recall)/(Precision+Recall)计算获得。计算多分类问题的指标时,可以将原问题看作多个二分类问题计算平均值。对于这四个指标而言,值越大说明分类效果越好,实验结果如下表所示(数值均保留四位小数):
[0109] 表4:学习资源评估实验结果
[0110]
[0111] 从表4中可以看出,使用预训练模型中的嵌入作为特征时,使用常见分类器对视频评论率和课程完课率作四分类预测就能取得具有较强竞争力的结果。视频评论率的预测结果更准确,侧面印证了由于预训练时的“掩码预测”任务主要针对视频层次,因此模型对视频的表示能力更强。此外,对视频评论率的准确预测结果说明,虽然预训练时没有使用任何有关评论的信息,但预训练模型确实从学习行为序列中学到了更通用的隐层知识,对学生的学习模式进行了合理的建模。学习资源评估任务证明了预训练模型的迁移泛化能力。实验说明基于预训练技术能够构建更通用、性能更强的自适应学习系统。
[0112] 通过上述步骤,针对学生学习行为序列构建预训练模型,利用课程结构元信息和视频字幕文本作为辅助信息,采用掩码预测任务对模型进行预训练,最终应用于学习资源推荐和学习资源评估下游任务。本发明与传统基于教研的课程学习不同,预训练模型事先“阅读”了大量学生的学习行为序列,“学到”了有关视频表示和学习行为模式的隐层知识,存储于模型参数中。基于预训练模型构建自适应学习系统,在学习资源推荐任务上的效果远优于基于规则和基于深度学习的现有方法。微调后模型的推荐结果,考虑了跨课程视频、逆序视频等之间的联系,可以有效减少学生在线学习时多次搜索、反复跳转以寻求知识补充的行为,能有效提高学生的学习效率。预训练模型同时具有对课程的表示能力和对课程质量进行评估的能力。
[0113] 需要说明的是,基于预训练的慕课自适应学习系统构建方法实现方式有多种,但无论具体的实现方法如何,只要方法实现了对慕课场景的学习行为、学习资源等进行统一建模,提高学习资源推荐、学习资源评估等多种自适应学习核心任务的效果,都是针对现有技术问题的解决,并具有相应的效果。
[0114] 为了实现上述实施例,如图4所示,本实施例中还提供了一种基于预训练的慕课自适应学习系统构建装置10,该装置10包括:获取模块100,处理模块200,挖掘模块300,构建模块400,应用模块500。
[0115] 获取模块100,用于获取第一预设时间内慕课平台记录的学生学习行为数据,以及预设条件下的辅助信息,辅助信息至少包括课程结构元信息和视频字幕文本;
[0116] 处理模块200,用于基于学生学习行为数据,以预设的粒度对学习行为日志进行聚合与处理,得到学生学习行为序列;
[0117] 挖掘模块300,用于基于辅助信息进行知识挖掘,获取课程结构元信息与视频的初始表示;
[0118] 构建模块400,用于基于学生学习行为序列和初始表示构建学习行为预训练模型,并采用掩码预测任务训练模型;
[0119] 应用模块500,用于将学习行为预训练模型应用于学习资源推荐和学习资源评估两个核心下游任务。
[0120] 根据本发明实施例的基于预训练的慕课自适应学习系统构建装置,针对学生学习行为序列构建预训练模型,利用课程结构元信息和视频字幕文本作为辅助信息,采用掩码预测任务对模型进行预训练,最终应用于学习资源推荐和学习资源评估下游任务。本发明与传统基于教研的课程学习不同,预训练模型事先“阅读”了大量学生的学习行为序列,“学到”了有关视频表示和学习行为模式的隐层知识,存储于模型参数中。基于预训练模型构建自适应学习系统,在学习资源推荐任务上的效果远优于基于规则和基于深度学习的现有方法。微调后模型的推荐结果,考虑了跨课程视频、逆序视频等之间的联系,可以有效减少学生在线学习时多次搜索、反复跳转以寻求知识补充的行为,能有效提高学生的学习效率。预训练模型同时具有对课程的表示能力和对课程质量进行评估的能力。
[0121] 需要说明的是,前述对基于预训练的慕课自适应学习系统构建方法实施例的解释说明也适用于该实施例的基于预训练的慕课自适应学习系统构建装置,此处不再赘述。
[0122] 此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
[0123] 在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0124] 尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。