一种记录讲授过程的系统及方法转让专利
申请号 : CN201910550283.X
文献号 : CN110275860A
文献日 : 2019-09-24
发明人 : 方光宇 , 秦伟 , 齐嵩 , 徐志向
申请人 : 深圳市理约云信息管理有限公司
摘要 :
权利要求 :
1.一种记录讲授过程的系统,其特征在于,包括:至少两个客户端和至少三个服务器,两个所述客户端分别为讲师客户端和学习者客户端,三个所述服务器分别为:转档服务器、文档处理服务器以及音频转译服务器;
所述讲师客户端用于上传授课相关的图片、文档及视频数据,还用于采集授课过程的音频信息及文档页面展示信息;
所述转档服务器用于将上传至所述讲师客户端的文档数据进行转档,生成相应的文档图片数据;
所述音频转译服务器用于将所述讲师客户端采集到的音频信息进行音频转译,得到对应的译文句子;
所述文档处理服务器用于对所述音频转译服务器得到的译文句子进行分段处理,对文档页面展示信息进行冗余清理处理,并将处理后得到的文字段落、处理后的文档页面展示信息与所述转档服务器生成的文档图片数据以及上传至所述讲师客户端的图片和视频数据进行整合处理,得到组合文档,并将所述组合文档进行存储和二维码分享;
所述学习者客户端用于根据二维码信息链接至所述文档处理服务器,并将所述组合文档内容进行播放展示。
2.根据权利要求1所述的一种记录讲授过程的系统,其特征在于,所述文档处理服务器包括:接收模块,用于接收所述讲师客户端上传的授课相关的图片、文档及视频数据,并接收所述讲师客户端采集的授课过程的音频信息及文档页面展示信息;
文档处理模块,用于将所述文档数据上传至所述转档服务器,并接收所述转档服务器回传的文档图片数据;
音频处理模块,用于将所述音频信息上传至所述音频转译服务器,并接收所述音频转译服务器回传的译文句子;
分段模块,用于对所述音频转译服务器得到的译文句子进行分段;
冗余清理模块,根据文档页面停留时间以及文档页面展示期间有意义文字数量,剔除冗余文档页面;
文档组合模块,用于将文字段落、处理后的文档页面展示信息与所述转档服务器生成的文档图片数据以及上传至所述讲师客户端的图片和视频数据进行整合处理,得到组合文档;
数据库,用于对所述组合文档进行存储;
分享模块,用于生成所述组合文档对应的二维码,并将所述二维码图片分享至所述学习者客户端;
链接模块,用于在接收到所述学习者客户端发出的二维码信息获取请求时,链接至所述数据库,为所述学习者客户端提供组合文档展示服务。
3.根据权利要求2所述的一种记录讲授过程的系统,其特征在于,所述文档处理服务器还包括编辑模块,所述编辑模块用于对所述音频处理模块接收到的译文句子进行自定义编辑。
4.一种记录讲授过程的方法,其特征在于,包括以下步骤:上传授课相关的图片、文档及视频数据,并采集授课过程的音频信息及文档页面展示信息;
将上传的文档数据进行转档,生成相应的文档图片数据;
将所述讲师客户端采集到的音频信息进行音频转译,得到对应的译文句子;
对所述译文句子进行分段处理;
对文档页面展示信息进行冗余清理处理;
将处理后得到的文字段落、处理后的文档页面展示信息与文档图片数据以及上传的图片和视频数据进行整合处理,得到组合文档,并将所述组合文档进行存储和二维码分享。
5.根据权利要求4所述的一种记录讲授过程的方法,其特征在于,对所述译文句子进行分段处理,具体包括以下步骤:对译文句子中各个句子逐一进行分析,判定译文句子中存在的拆分句;
根据拆分句所在位置,对译文句子进行分段。
6.根据权利要求5所述的一种记录讲授过程的方法,其特征在于,判定译文句子中存在的拆分句,具体包括以下步骤:标定译文句子中的完结句;
逐一判断标定出的完结句与上句的间隔时长是否大于句子平均间隔时长的预设倍数,提取出满足时间间隔条件的句子;
判断满足时间间隔条件的句子起始过程中是否存在文档页面展示动作,提取出存在文档页面展示动作的句子;
判断存在文档页面展示动作的句子与上一个拆分句间间隔的句数是否大于预设句数阈值,若大于预设句数阈值,则判定其为拆分句,否则,则判定其为普通句。
7.根据权利要求6所述的一种记录讲授过程的方法,其特征在于,标定译文句子中的完结句过程中,所述完结句的判定依据为:句子以句号、感叹号或疑问号结尾。
8.根据权利要求4所述的一种记录讲授过程的方法,其特征在于,对文档页面展示信息进行冗余清理处理,具体包括以下步骤:将文档页面展示过程中各个文档页面的展示时间与预设的时间阈值进行逐一比对,找出展示时间小于时间阈值的文档页面并将其剔除;
判别各个文档页面展示期间对应的译文句子中是否存在有意义文字,若不存在有意义的文字,则将对应的文档页面剔除。
9.根据权利要求8所述的一种记录讲授过程的方法,其特征在于,所述有意义的文字为句子中的主语或名词。
10.根据权利要求4所述的一种记录讲授过程的方法,其特征在于,获得组合文档的过程,具体包括以下步骤:循环每个文档页面展示,从文字段落中找出各个文档页面停留时间内对应的段落,并将文档页面以新段落的形式插入对应段落后面;
将音频按照文字段落中各个段落进行拆分,并与对应的段落进行关联。
说明书 :
一种记录讲授过程的系统及方法
技术领域
背景技术
发明内容
一方面,本发明提供了一种记录讲授过程的系统,该系统包括:至少两个客户端和至少三个服务器,两个所述客户端分别为讲师客户端和学习者客户端,三个所述服务器分别为:
转档服务器、文档处理服务器以及音频转译服务器;
所述讲师客户端用于上传授课相关的图片、文档及视频数据,还用于采集授课过程的音频信息及文档页面展示信息;
所述转档服务器用于将上传至所述讲师客户端的文档数据进行转档,生成相应的文档图片数据;
所述音频转译服务器用于将所述讲师客户端采集到的音频信息进行音频转译,得到对应的译文句子;
所述文档处理服务器用于对所述音频转译服务器得到的译文句子进行分段处理,对文档页面展示信息进行冗余清理处理,并将处理后得到的文字段落、处理后的文档页面展示信息与所述转档服务器生成的文档图片数据以及上传至所述讲师客户端的图片和视频数据进行整合处理,得到组合文档,并将所述组合文档进行存储和二维码分享;
所述学习者客户端用于根据二维码信息链接至所述文档处理服务器,并将所述组合文档内容进行播放展示。
文档处理模块,用于将所述文档数据上传至所述转档服务器,并接收所述转档服务器回传的文档图片数据;
音频处理模块,用于将所述音频信息上传至所述音频转译服务器,并接收所述音频转译服务器回传的译文句子;
分段模块,用于对所述音频转译服务器得到的译文句子进行分段;
冗余清理模块,根据文档页面停留时间以及文档页面展示期间有意义文字数量,剔除冗余文档页面;
文档组合模块,用于将文字段落、处理后的文档页面展示信息与所述转档服务器生成的文档图片数据以及上传至所述讲师客户端的图片和视频数据进行整合处理,得到组合文档;
数据库,用于对所述组合文档进行存储;
分享模块,用于生成所述组合文档对应的二维码,并将所述二维码图片分享至所述学习者客户端;
链接模块,用于在接收到所述学习者客户端发出的二维码信息获取请求时,链接至所述数据库,为所述学习者客户端提供组合文档展示服务。
将上传的文档数据进行转档,生成相应的文档图片数据;
将所述讲师客户端采集到的音频信息进行音频转译,得到对应的译文句子;
对所述译文句子进行分段处理,;
对文档页面展示信息进行冗余清理处理;
将处理后得到的文字段落、处理后的文档页面展示信息与文档图片数据以及上传的图片和视频数据进行整合处理,得到组合文档,并将所述组合文档进行存储和二维码分享。
根据拆分句所在位置,对译文句子进行分段。
逐一判断标定出的完结句与上句的间隔时长是否大于的句子平均间隔时长的预设倍数,提取出满足时间间隔条件的句子;
判断满足时间间隔条件的句子起始过程中是否存在文档页面展示动作,提取出存在文档页面展示动作的句子;
判断存在文档页面展示动作的句子与上一个拆分句间间隔的句数是否大于预设句数阈值,若大于预设句数阈值,则判定其为拆分句,否则,则判定其为普通句。
判别各个文档页面展示期间对应的译文句子中是否存在有意义文字,若不存在有意义的文字,则将对应的文档页面剔除。
将音频按照文字段落中各个段落进行拆分,并与对应的段落进行关联。
附图说明
图3附图为本发明提供的一种记录讲授过程的方法的流程示意图;
图4附图为本发明实施例中分段过程的流程示意图;
图5附图为本发明实施例中拆分句判定的流程示意图;
图6附图为本发明实施例中对文档页面进行冗余清理的流程示意图;
图7附图为本发明实施例中获得组合文档过程的流程示意图。
具体实施方式
讲师客户端1用于上传授课相关的图片、文档及视频数据,还用于采集授课过程的音频信息及文档页面展示信息;
转档服务器3用于将上传至讲师客户端1的文档数据进行转档,生成相应的文档图片数据;
音频转译服务器4用于将讲师客户端1采集到的音频信息进行音频转译,得到对应的译文句子;
文档处理服务器2用于对音频转译服务器4得到的译文句子进行分段处理,对文档页面展示信息进行冗余清理处理,并将处理后得到的文字段落、处理后的文档页面展示信息与转档服务器3生成的文档图片数据以及上传至讲师客户端1的图片和视频数据进行整合处理,得到组合文档,并将组合文档进行存储和二维码分享;
学习者客户端5用于根据二维码信息链接至文档处理服务器2,并将组合文档内容进行播放展示。
文档处理模块22,用于将文档数据上传至转档服务器3,并接收转档服务器3回传的文档图片数据;
音频处理模块23,用于将音频信息上传至音频转译服务器4,并接收音频转译服务器4回传的译文句子;
分段模块24,用于对音频转译服务器4得到的译文句子进行分段;
冗余清理模块25,根据文档页面停留时间以及文档页面展示期间有意义文字数量,剔除冗余文档页面;
文档组合模块26,用于将文字段落、处理后的文档页面展示信息与转档服务器生成的文档图片数据以及上传至讲师客户端1的图片和视频数据进行整合处理,得到组合文档;
数据库27,用于对组合文档进行存储;
分享模块28,用于生成组合文档对应的二维码,并将二维码图片分享至学习者客户端
5;
链接模块29,用于在接收到学习者客户端5发出的二维码信息获取请求时,链接至数据库27,为学习者客户端5提供组合文档展示服务。
S2:将上传的文档数据进行转档,生成相应的文档图片数据;
S3:将讲师客户端采集到的音频信息进行音频转译,得到对应的译文句子;
S4:对译文句子进行分段处理;
S5:对文档页面展示信息进行冗余清理处理;
S6:将处理后得到的文字段落、处理后的文档页面展示信息与文档图片数据以及上传的图片和视频数据进行整合处理,得到组合文档,并将组合文档进行存储和二维码分享。
S42:根据拆分句所在位置,对译文句子进行分段。
S412:逐一判断标定出的完结句与上句的间隔时长是否大于预设的句子平均间隔时长的2倍,提取出满足时间间隔条件的句子;
S413:判断满足时间间隔条件的句子起始过程中是否存在文档页面展示动作,提取出存在文档页面展示动作的句子;
S414:判断存在文档页面展示动作的句子与上一个拆分句间间隔的句数是否大于6句,若大于6句,则判定其为拆分句,否则,则判定其为普通句。此处设置的句数阈值为经验阈值,是经过多次测试得到的最优值。
S52:判别各个文档页面展示期间对应的译文句子中是否存在有意义文字,若不存在有意义的文字,则将对应的文档页面剔除。
S62:将音频按照文字段落中各个段落进行拆分,并与对应的段落进行关联。
2.讲师使用移动设备(如手机),进行讲授,一边讲,一边将文档页面投到大屏(如电视、拼接屏或电脑屏等),而移动设备(手机)则收集文档页面展示信息和音频;
3.讲师完成讲授后,移动设备(手机)将收集到的文档页面展示信息和音频上传到文档处理服务器;
4.文档处理服务器接受到处理数据后,先将音频交由音频转译服务器转译为文字;
5.对从音频转译服务器传回的文字进行分段:
a)判断句子期间是否有文档页面展示,如果有,则标志为“拆分句”
b)计算本句的和下句的间隔和平均间隔时长的倍数,首句此值为0,如倍数超过2,则标志为“拆分句”;
c)判断句子是否是完结句,如果不是,则取消其“拆分句”的标志。如果此句有文档页面展示,则将下一个完结句标志为“拆分句”;
d)判断句子和上个拆分句间隔超过6句话,如是完结句,则标志为拆分句;
e)根据句子中被标志为“拆分句”的名子将所有句子分段落,其中“拆分句”句子作为段落的最后一句;
6.对文档页面展示进行去除冗余:
a)通过和上下页面时间对比,计算每个文档页面展示计算其停留时间;
b)从文字句子中,计算出每个文档页面期间的有意义文字(保留主语,名词);
c)判断每个文档页面展示,如果停留时间少于1.5秒,或无有意义文字,则删除;
7.将文档页面展示插入段落中:
a)循环每个文档页面展示,找出其停留时间内的每一个段落,插入此段落后面作为一个新段落;
8.将音频按段落拆分,并和对应的段落关联上;
9.将文档页面展示、文字段落、音频以固定格式存储至数据库;
最后将此种文档以二维码方式交回给讲师。