基于区块链的智慧教育学术成果讨论防剽窃方法及系统转让专利

申请号 : CN202210881154.0

文献号 : CN115114588B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 吴昊别荣芳王耀飞

申请人 : 北京师范大学

摘要 :

本发明公开了一种基于区块链的智慧教育学术成果讨论防剽窃方法及系统,涉及数据处理技术领域。该方法包括:将目标用户的学术成果图像作为基准成果图像;进行图像超分辨率重建,并对重建后的图像进行文字识别;将信息上链存储;获取待检测成果图像;计算任意一幅基准成果示意图和任意一幅待检测成果示意图之间的相似度;若大于预置的相似度阈值,则认定对应的新发布的学术成果存在剽窃风险;若小于,则对待检测成果图像进行图像超分辨率重建,并进行文字识别;将目标文字识别结果与目标基准文字识别结果进行比对,生成并根据比对结果确定是否存在剽窃风险。本发明提高了数据识别精度,并结合区块链对数据进行上链存证,保证数据安全性。

权利要求 :

1.一种基于区块链的智慧教育学术成果讨论防剽窃方法,其特征在于,包括以下步骤:获取并将目标用户的学术成果图像上传至对应的学校网络系统中,并记录上传时间;

获取用户对目标用户的学术成果讨论结束信号后,将目标用户的学术成果图像作为基准成果图像;所述基准成果图像包括多个基准成果示意图;

利用目标检测方法对基准成果图像中的文字进行检测,生成检测结果;

对基准成果图像进行图像超分辨率重建,并根据检测结果采用基础OCR识别技术或基于多图像增强方法互验的OCR技术对重建后的基准成果图像进行文字识别,以得到目标基准文字识别结果;

将基准成果示意图、目标基准文字识别结果、上传时间以及对应的目标用户的身份信息上传至区块链中进行存储;

获取并将网络中新发布的学术成果图像作为待检测成果图像;所述待检测成果图像包括多 个待检测成果示意图;

利用基于多空洞率卷积核的自编码相似度计算方法计算任意一幅基准成果示意图和任意一幅待检测成果示意图之间的相似度,得到相似度结果;

若相似度结果大于预置的相似度阈值,则认定对应的新发布的学术成果存在剽窃风险,生成并发送风险提示信息给对应的审查人员;提取并展示区块链中对应的基准成果示意图、目标基准文字识别结果、上传时间以及对应的目标用户的身份信息;

若相似度结果小于预置的相似度阈值,则利用目标检测方法对待检测成果图像的文字进行检测,生成初始文字检测结果;

对待检测成果图像进行图像超分辨率重建,并根据初始文字检测结果采用基础OCR识别技术或基于多图像增强方法互验的OCR技术对重建后的待检测成果图像进行文字识别,以得到目标文字识别结果;

将目标文字识别结果与目标基准文字识别结果进行比对,生成并根据比对结果确定对应的新发布的学术成果是否存在剽窃风险,若存在,则生成并发送风险提示信息给对应的审查人员;提取并展示区块链中对应的基准成果示意图、目标基准文字识别结果、上传时间以及对应的目标用户的身份信息;若不存在,则结束。

2.根据权利要求1所述的一种基于区块链的智慧教育学术成果讨论防剽窃方法,其特征在于,所述根据检测结果采用基础OCR识别技术或基于多图像增强方法互验的OCR技术对重建后的基准成果图像进行文字识别的方法包括以下步骤:若检测结果中的文字字数大于预置的字数阈值,则采用基础OCR识别技术对重建后的基准成果图像进行文字识别;反之,则采用基于多图像增强方法互验的OCR技术对重建后的基准成果图像进行文字识别。

3.根据权利要求1所述的一种基于区块链的智慧教育学术成果讨论防剽窃方法,其特征在于,所述基于多图像增强方法互验的OCR技术对重建后的基准成果图像进行文字识别的方法包括以下步骤:利用多种图像增强方法分别对重建后的基准成果图像进行增强处理,以得到对应的多个基准增强图像;

利用OCR技术分别对各个基准增强图像进行文字识别,生成对应的多个基准文字识别结果。

4.根据权利要求3所述的一种基于区块链的智慧教育学术成果讨论防剽窃方法,其特征在于,还包括以下步骤:统计并根据各个基准文字识别结果确定目标基准文字识别结果。

5.根据权利要求1所述的一种基于区块链的智慧教育学术成果讨论防剽窃方法,其特征在于,所述利用基于多空洞率卷积核的自编码相似度计算方法计算任意一幅基准成果示意图和任意一幅待检测成果示意图之间的相似度的方法包括以下步骤:利用空洞率为N的卷积核分别对任意一幅基准成果示意图和任意一幅待检测成果示意图进行过滤,对过滤后的结果分别进行自编码,并利用欧式距离计算 对应的基准成果示意图和待检测成果示意图之间的相似度,得到第一相似度结果;N为大于等于1的自然数;

利用空洞率为N+1的卷积核分别对任意一幅基准成果示意图和任意一幅待检测成果示意图进行过滤,对过滤后的结果分别进行自编码,并利用欧式距离计算 对应的基准成果示意图和待检测成果示意图之间的相似度得到第二相似度结果;

利用空洞率为N+2的卷积核分别对任意一幅基准成果示意图和任意一幅待检测成果示意图进行过滤,对过滤后的结果分别进行自编码,并利用欧式距离计算 对应的基准成果示意图和待检测成果示意图之间的相似度得到第三相似度结果。

6.根据权利要求5所述的一种基于区块链的智慧教育学术成果讨论防剽窃方法,其特征在于,还包括以下步骤:若第一相似度结果、第二相似度结果和第三相似度结果中至少存在两个结果大于预置的相似度阈值,则认定对应的新发布的学术成果存在剽窃风险。

7.根据权利要求1所述的一种基于区块链的智慧教育学术成果讨论防剽窃方法,其特征在于,还包括以下步骤:若对应的新发布的学术成果不存在剽窃风险,则将对应的新发布的学术成果图像的示意图、目标文字识别结果以及对应的发布者信息上传至区块链中进行存储。

8.一种基于区块链的智慧教育学术成果讨论防剽窃系统,其特征在于,包括:目标基准成果模块、第一目标检测模块、基准文字识别模块、上链存储模块、图像获取模块、相似度计算模块、审核模块、第二目标检测模块、待检测识别模块以及文字比对模块,其中:目标基准成果模块,用于获取并将目标用户的学术成果图像上传至对应的学校网络系统中,并记录上传时间;获取用户对目标用户的学术成果讨论结束信号后,将目标用户的学术成果图像作为基准成果图像;所述基准成果图像包括多个基准成果示意图;

第一目标检测模块,用于利用目标检测方法对基准成果图像中的文字进行检测,生成检测结果;

基准文字识别模块,用于对基准成果图像进行图像超分辨率重建,并根据检测结果采用基础OCR识别技术或基于多图像增强方法互验的OCR技术对重建后的基准成果图像进行文字识别,以得到目标基准文字识别结果;

上链存储模块,用于将基准成果示意图、目标基准文字识别结果、上传时间以及对应的目标用户的身份信息上传至区块链中进行存储;

图像获取模块,用于获取并将网络中新发布的学术成果图像作为待检测成果图像;所述待检测成果图像包括多 个待检测成果示意图;

相似度计算模块,用于利用基于多空洞率卷积核的自编码相似度计算方法计算任意一幅基准成果示意图和任意一幅待检测成果示意图之间的相似度,得到相似度结果;

审核模块,用于若相似度结果大于预置的相似度阈值,则认定对应的新发布的学术成果存在剽窃风险,生成并发送风险提示信息给对应的审查人员;提取并展示区块链中对应的基准成果示意图、目标基准文字识别结果、上传时间以及对应的目标用户的身份信息;

第二目标检测模块,用于若相似度结果小于预置的相似度阈值,则利用目标检测方法对待检测成果图像的文字进行检测,生成初始文字检测结果;

待检测识别模块,用于对待检测成果图像进行图像超分辨率重建,并根据初始文字检测结果采用基础OCR识别技术或基于多图像增强方法互验的OCR技术对重建后的待检测成果图像进行文字识别,以得到目标文字识别结果;

文字比对模块,用于将目标文字识别结果与目标基准文字识别结果进行比对,生成并根据比对结果确定对应的新发布的学术成果是否存在剽窃风险,若存在,则生成并发送风险提示信息给对应的审查人员;提取并展示区块链中对应的基准成果示意图、目标基准文字识别结果、上传时间以及对应的目标用户的身份信息;若不存在,则结束。

9.一种电子设备,其特征在于,包括:

存储器,用于存储一个或多个程序;

处理器;

当所述一个或多个程序被所述处理器执行时,实现如权利要求1‑7中任一项所述的方法。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1‑7中任一项所述的方法。

说明书 :

基于区块链的智慧教育学术成果讨论防剽窃方法及系统

技术领域

[0001] 本发明涉及数据处理技术领域,具体而言,涉及一种基于区块链的智慧教育学术成果讨论防剽窃方法及系统。

背景技术

[0002] 随着国家对教育事业的大力投入和科技的巨大进步,智慧教育越来越发挥出重要的作用。学术成果讨论作为教育领域中的重要组成部分,可以有效地帮助学生们交流学术观点、学术思想等;然而,在学术成果讨论的过程中,往往会存在学术成果被剽窃的情况,严重损害了学术成果拥有者的合法权益。
[0003] 现有技术中,尽管已将部分目标检测方法、文字识别比对方法应用于学术成果的保护,但是其无法精准、全面地对学术成果剽窃行为进行检测。区块链作为近年来的新兴技术,在防剽窃领域发挥了重要的作用,可以为线上讨论的学术成果保护提供直接的支持。因此,如何充分利用现代信息技术并有效结合区块链技术对智慧教育学术成果线上讨论进行全面精准有效的防剽窃成为一个亟需解决的问题。

发明内容

[0004] 为了克服上述问题或者至少部分地解决上述问题,本发明实施例提供一种基于区块链的智慧教育学术成果讨论防剽窃方法及系统,采用多种智能算法相结合大大提高了数据识别的精度,并结合区块链技术对数据进行上链存证,保证数据的安全性,进而实现对智慧教育学术成果讨论过程全面精准有效的防剽窃。
[0005] 本发明的实施例是这样实现的:
[0006] 第一方面,本发明实施例提供一种基于区块链的智慧教育学术成果讨论防剽窃方法,包括以下步骤:
[0007] 获取并将目标用户的学术成果图像上传至对应的学校网络系统中,并记录上传时间;获取用户对目标用户的学术成果讨论结束信号后,将目标用户的学术成果图像作为基准成果图像;上述基准成果图像包括多个基准成果示意图;
[0008] 利用目标检测方法对基准成果图像中的文字进行检测,生成检测结果;
[0009] 对基准成果图像进行图像超分辨率重建,并根据检测结果采用基础OCR识别技术或基于多图像增强方法互验的OCR技术对重建后的基准成果图像进行文字识别,以得到目标基准文字识别结果;
[0010] 将基准成果示意图、目标基准文字识别结果、上传时间以及对应的目标用户的身份信息上传至区块链中进行存储;
[0011] 获取并将网络中新发布的学术成果图像作为待检测成果图像;上述待检测成果图像包括对个待检测成果示意图;
[0012] 利用基于多空洞率卷积核的自编码相似度计算方法计算任意一幅基准成果示意图和任意一幅待检测成果示意图之间的相似度,得到相似度结果;
[0013] 若相似度结果大于预置的相似度阈值,则认定对应的新发布的学术成果存在剽窃风险,生成并发送风险提示信息给对应的审查人员;提取并展示区块链中对应的基准成果示意图、目标基准文字识别结果、上传时间以及对应的目标用户的身份信息;
[0014] 若相似度结果小于预置的相似度阈值,则利用目标检测方法对待检测成果图像的文字进行检测,生成初始文字检测结果;
[0015] 对待检测成果图像进行图像超分辨率重建,并根据初始文字检测结果采用基础OCR识别技术或基于多图像增强方法互验的OCR技术对重建后的待检测成果图像进行文字识别,以得到目标文字识别结果;
[0016] 将目标文字识别结果与目标基准文字识别结果进行比对,生成并根据比对结果确定对应的新发布的学术成果是否存在剽窃风险,若存在,则生成并发送风险提示信息给对应的审查人员;提取并展示区块链中对应的基准成果示意图、目标基准文字识别结果、上传时间以及对应的目标用户的身份信息;若不存在,则结束。
[0017] 为了解决现有技术中无法精准、全面地对学术成果剽窃行为进行检测的技术问题,本发明对于基准成果的任意一幅示意图和待检测成果的任意一幅示意图,利用基于多空洞率卷积核的自编码相似度计算方法,来计算它们之间的相似度,显著地提升了相似度计算的精度;并利用单行文字目标检测方法对字体大小进行检测,并对尺寸较小的文字进行了更加有针对性的识别。具体地,在图像超分辨率重建的基础上,利用基于多图像增强方法互验的OCR技术来识别尺寸较小的文字,显著地提升了尺寸较小文字的识别精度。同时,本发明引入了区块链的思想和技术,实现了学术成果相关核心信息的上链存证,显著地提升了方法和系统的可靠性。本发明采用多种智能算法相结合大大提高了数据识别的精度,并结合区块链技术对数据进行上链存证,保证数据的安全性,进而实现对智慧教育学术成果讨论过程全面精准有效的防剽窃。
[0018] 基于第一方面,在本发明的一些实施例中,上述根据检测结果采用基础OCR识别技术或基于多图像增强方法互验的OCR技术对重建后的基准成果图像进行文字识别的方法包括以下步骤:
[0019] 若检测结果中的文字字数大于预置的字数阈值,则采用基础OCR识别技术对重建后的基准成果图像进行文字识别;反之,则采用基于多图像增强方法互验的OCR技术对重建后的基准成果图像进行文字识别。
[0020] 基于第一方面,在本发明的一些实施例中,上述基于多图像增强方法互验的OCR技术对重建后的基准成果图像进行文字识别的方法包括以下步骤:
[0021] 利用多种图像增强方法分别对重建后的基准成果图像进行增强处理,以得到对应的多个基准增强图像;
[0022] 利用OCR技术分别对各个基准增强图像进行文字识别,生成对应的多个基准文字识别结果。
[0023] 基于第一方面,在本发明的一些实施例中,该基于区块链的智慧教育学术成果讨论防剽窃方法还包括以下步骤:
[0024] 统计并根据各个基准文字识别结果确定目标基准文字识别结果。
[0025] 基于第一方面,在本发明的一些实施例中,上述利用基于多空洞率卷积核的自编码相似度计算方法计算任意一幅基准成果示意图和任意一幅待检测成果示意图之间的相似度的方法包括以下步骤:
[0026] 利用空洞率为N的卷积核分别对任意一幅基准成果示意图和任意一幅待检测成果示意图进行过滤,对过滤后的结果分别进行自编码,并利用欧式距离对应的基准成果示意图和待检测成果示意图之间的相似度得到第一相似度结果;N为大于等于1的自然数;
[0027] 利用空洞率为N+1的卷积核分别对任意一幅基准成果示意图和任意一幅待检测成果示意图进行过滤,对过滤后的结果分别进行自编码,并利用欧式距离对应的基准成果示意图和待检测成果示意图之间的相似度得到第二相似度结果;
[0028] 利用空洞率为N+2的卷积核分别对任意一幅基准成果示意图和任意一幅待检测成果示意图进行过滤,对过滤后的结果分别进行自编码,并利用欧式距离对应的基准成果示意图和待检测成果示意图之间的相似度得到第三相似度结果。
[0029] 基于第一方面,在本发明的一些实施例中,该基于区块链的智慧教育学术成果讨论防剽窃方法还包括以下步骤:
[0030] 若第一相似度结果、第二相似度结果和第三相似度结果中至少存在两个结果大于预置的相似度阈值,则认定对应的新发布的学术成果存在剽窃风险。
[0031] 基于第一方面,在本发明的一些实施例中,该基于区块链的智慧教育学术成果讨论防剽窃方法还包括以下步骤:
[0032] 若对应的新发布的学术成果不存在剽窃风险,则将对应的新发布的学术成果图像的示意图、目标文字识别结果以及对应的发布者信息上传至区块链中进行存储。
[0033] 第二方面,本发明实施例提供一种基于区块链的智慧教育学术成果讨论防剽窃系统,包括:目标基准成果模块、第一目标检测模块、基准文字识别模块、上链存储模块、图像获取模块、相似度计算模块、审核模块、第二目标检测模块、待检测识别模块以及文字比对模块,其中:
[0034] 目标基准成果模块,用于获取并将目标用户的学术成果图像上传至对应的学校网络系统中,并记录上传时间;获取用户对目标用户的学术成果讨论结束信号后,将目标用户的学术成果图像作为基准成果图像;上述基准成果图像包括多个基准成果示意图;
[0035] 第一目标检测模块,用于利用目标检测方法对基准成果图像中的文字进行检测,生成检测结果;
[0036] 基准文字识别模块,用于对基准成果图像进行图像超分辨率重建,并根据检测结果采用基础OCR识别技术或基于多图像增强方法互验的OCR技术对重建后的基准成果图像进行文字识别,以得到目标基准文字识别结果;
[0037] 上链存储模块,用于将基准成果示意图、目标基准文字识别结果、上传时间以及对应的目标用户的身份信息上传至区块链中进行存储;
[0038] 图像获取模块,用于获取并将网络中新发布的学术成果图像作为待检测成果图像;上述待检测成果图像包括对个待检测成果示意图;
[0039] 相似度计算模块,用于利用基于多空洞率卷积核的自编码相似度计算方法计算任意一幅基准成果示意图和任意一幅待检测成果示意图之间的相似度,得到相似度结果;
[0040] 审核模块,用于若相似度结果大于预置的相似度阈值,则认定对应的新发布的学术成果存在剽窃风险,生成并发送风险提示信息给对应的审查人员;提取并展示区块链中对应的基准成果示意图、目标基准文字识别结果、上传时间以及对应的目标用户的身份信息;
[0041] 第二目标检测模块,用于若相似度结果小于预置的相似度阈值,则利用目标检测方法对待检测成果图像的文字进行检测,生成初始文字检测结果;
[0042] 待检测识别模块,用于对待检测成果图像进行图像超分辨率重建,并根据初始文字检测结果采用基础OCR识别技术或基于多图像增强方法互验的OCR技术对重建后的待检测成果图像进行文字识别,以得到目标文字识别结果;
[0043] 文字比对模块,用于将目标文字识别结果与目标基准文字识别结果进行比对,生成并根据比对结果确定对应的新发布的学术成果是否存在剽窃风险,若存在,则生成并发送风险提示信息给对应的审查人员;提取并展示区块链中对应的基准成果示意图、目标基准文字识别结果、上传时间以及对应的目标用户的身份信息;若不存在,则结束。
[0044] 为了解决现有技术中无法精准、全面地对学术成果剽窃行为进行检测的技术问题,本系统通过目标基准成果模块、第一目标检测模块、基准文字识别模块、上链存储模块、图像获取模块、相似度计算模块、审核模块、第二目标检测模块、待检测识别模块以及文字比对模块等多个模块的相互配合,对于基准成果的任意一幅示意图和待检测成果的任意一幅示意图,利用基于多空洞率卷积核的自编码相似度计算方法,来计算它们之间的相似度,显著地提升了相似度计算的精度;并利用单行文字目标检测方法对字体大小进行检测,并对尺寸较小的文字进行了更加有针对性的识别。具体地,在图像超分辨率重建的基础上,利用基于多图像增强方法互验的OCR技术来识别尺寸较小的文字,显著地提升了尺寸较小文字的识别精度。同时,本发明引入了区块链的思想和技术,实现了学术成果相关核心信息的上链存证,显著地提升了方法和系统的可靠性。本发明采用多种智能算法相结合大大提高了数据识别的精度,并结合区块链技术对数据进行上链存证,保证数据的安全性,进而实现对智慧教育学术成果讨论过程全面精准有效的防剽窃。
[0045] 第三方面,本申请实施例提供一种电子设备,其包括存储器,用于存储一个或多个程序;处理器。当一个或多个程序被处理器执行时,实现如上述第一方面中任一项的方法。
[0046] 第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第一方面中任一项的方法。
[0047] 本发明实施例至少具有如下优点或有益效果:
[0048] 本发明实施例提供一种基于区块链的智慧教育学术成果讨论防剽窃方法及系统,解决了现有技术中无法精准、全面地对学术成果剽窃行为进行检测的技术问题,本发明对于基准成果的任意一幅示意图和待检测成果的任意一幅示意图,利用基于多空洞率卷积核的自编码相似度计算方法,来计算它们之间的相似度,显著地提升了相似度计算的精度;并利用单行文字目标检测方法对字体大小进行检测,并对尺寸较小的文字进行了更加有针对性的识别。同时,本发明引入了区块链的思想和技术,实现了学术成果相关核心信息的上链存证,显著地提升了方法和系统的可靠性。本发明采用多种智能算法相结合大大提高了数据识别的精度,并结合区块链技术对数据进行上链存证,保证数据的安全性,进而实现对智慧教育学术成果讨论过程全面精准有效的防剽窃。

附图说明

[0049] 为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0050] 图1为本发明实施例一种基于区块链的智慧教育学术成果讨论防剽窃方法的流程图;
[0051] 图2为本发明实施例一种基于区块链的智慧教育学术成果讨论防剽窃方法中基于多图像增强方法互验的OCR技术对重建后的基准成果图像进行文字识别的流程图;
[0052] 图3为本发明实施例一种基于区块链的智慧教育学术成果讨论防剽窃方法中利用基于多空洞率卷积核的自编码相似度计算方法的流程图;
[0053] 图4为本发明实施例一种基于区块链的智慧教育学术成果讨论防剽窃系统的原理框图;
[0054] 图5为本发明实施例提供的一种电子设备的结构框图。
[0055] 附图标记说明:100、目标基准成果模块;200、第一目标检测模块;300、基准文字识别模块;400、上链存储模块;500、图像获取模块;600、相似度计算模块;700、审核模块;800、第二目标检测模块;900、待检测识别模块;1000、文字比对模块;101、存储器;102、处理器;103、通信接口。

具体实施方式

[0056] 为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
[0057] 因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0058] 应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
[0059] 需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0060] 实施例:
[0061] 如图1‑图3所示,第一方面,本发明实施例提供一种基于区块链的智慧教育学术成果讨论防剽窃方法,包括以下步骤:
[0062] S1、获取并将目标用户的学术成果图像上传至对应的学校网络系统中,并记录上传时间;获取用户对目标用户的学术成果讨论结束信号后,将目标用户的学术成果图像作为基准成果图像。在特定时间某一同学完成了学术成果(以小明为例),将学术成果的PDF格式或扫描图像上传到学校网络系统中。(例如,小明在2022年3月20日晚上8时完成了学术成果的上传);相关教师、同学在阅读了小明的学术成果并对他的学术成果进行讨论之后,将该学术成果图像作为基准成果图像;该基准成果图像包括多个基准成果示意图。
[0063] S2、利用目标检测方法对基准成果图像中的文字进行检测,生成检测结果;对于基准成果的文字部分,利用目标检测方法对每行的文字进行检测。具体地,如果每行检测出较多的文字(大于预置的字数阈值),说明文字尺寸较大;如果每行检测出较少的文字,说明文字尺寸较小。上述目标检测方法为常规算法,在此不做赘述。
[0064] S3、对基准成果图像进行图像超分辨率重建,并根据检测结果采用基础OCR识别技术或基于多图像增强方法互验的OCR技术对重建后的基准成果图像进行文字识别,以得到目标基准文字识别结果;
[0065] 进一步地,若检测结果中的文字字数大于预置的字数阈值,则采用基础OCR识别技术对重建后的基准成果图像进行文字识别;反之,则采用基于多图像增强方法互验的OCR技术对重建后的基准成果图像进行文字识别。
[0066] 进一步地,如图2所示,上述采用基于多图像增强方法互验的OCR技术对重建后的基准成果图像进行文字识别的方法包括:
[0067] S31、利用多种图像增强方法分别对重建后的基准成果图像进行增强处理,以得到对应的多个基准增强图像;
[0068] S32、利用OCR技术分别对各个基准增强图像进行文字识别,生成对应的多个基准文字识别结果。
[0069] 进一步地,统计并根据各个基准文字识别结果确定目标基准文字识别结果。
[0070] 在本发明的一些实施例中,对于尺寸较大的文字,进行图像超分辨率重建,在此基础上利用普通OCR技术进行文字识别即可;对于尺寸较小的文字,进行图像超分辨率重建,然后再利用基于多图像增强方法互验的OCR技术进行文字识别,得到最终的文字识别结果。
[0071] 基于多图像增强方法互验的OCR技术包括:利用多种图像增强方法分别对图像进行增强处理,在不同的图像增强方法基础上,分别利用OCR技术对文字进行识别。如果多个识别结果不一致,利用少数服从多数的原则。例如,在绝大多数图像增强方法对图像增强之后,将某一文字识别为‘治’;在少数图像增强方法对图像增强之后,将某一文字识别为‘冶’,最后将该文字识别为‘治’。
[0072] S4、将基准成果示意图、目标基准文字识别结果、上传时间以及对应的目标用户的身份信息上传至区块链中进行存储;将基准成果拥有人、基准成果上传时间、基准成果文字内容、基准成果示意图内容(一般学术成果会含有部分示意图)等信息都记录到区块链系统中,实现核心信息的上链存证。基准成果图像中包含很多示意图和文字区域,文字识别出来直接存文字即可,多个示意图区域直接存示意图即可,无需再存储基准成果图像,大大节约了存储资源。
[0073] S5、获取并将网络中新发布的学术成果图像作为待检测成果图像;在上述步骤之后,当其它科研工作者发表任意新的学术新成果之后,在网络中(可以是外网,不一定局限于学校内部)获取该成果的PDF格式或扫描图像,将其作为待检测成果图像;该待检测成果图像包括对个待检测成果示意图。
[0074] S6、利用基于多空洞率卷积核的自编码相似度计算方法计算任意一幅基准成果示意图和任意一幅待检测成果示意图之间的相似度,得到相似度结果;
[0075] 进一步地,如图3所示,上述利用基于多空洞率卷积核的自编码相似度计算方法计算任意一幅基准成果示意图和任意一幅待检测成果示意图之间的相似度的方法包括:
[0076] S61、利用空洞率为N的卷积核分别对任意一幅基准成果示意图和任意一幅待检测成果示意图进行过滤,对过滤后的结果分别进行自编码,并利用欧式距离对应的基准成果示意图和待检测成果示意图之间的相似度得到第一相似度结果;N为大于等于1的自然数;
[0077] S62、利用空洞率为N+1的卷积核分别对任意一幅基准成果示意图和任意一幅待检测成果示意图进行过滤,对过滤后的结果分别进行自编码,并利用欧式距离对应的基准成果示意图和待检测成果示意图之间的相似度得到第二相似度结果;
[0078] S63、利用空洞率为N+2的卷积核分别对任意一幅基准成果示意图和任意一幅待检测成果示意图进行过滤,对过滤后的结果分别进行自编码,并利用欧式距离对应的基准成果示意图和待检测成果示意图之间的相似度得到第三相似度结果。
[0079] 进一步地,若第一相似度结果、第二相似度结果和第三相似度结果中至少存在两个结果大于预置的相似度阈值,则认定对应的新发布的学术成果存在剽窃风险。
[0080] 在本发明的一些实施例中,对于基准成果的任意一幅示意图和待检测成果的任意一幅示意图,利用基于多空洞率卷积核的自编码相似度计算方法,计算它们之间的相似度。如果出现了基准成果的任意一幅示意图和待检测成果的任意一幅示意图相似度较高,认定为存在疑似剽窃的情况。
[0081] 基于多空洞率卷积核的自编码相似度计算方法步骤如下:
[0082] (a)对于基准成果的某一幅示意图和待检测成果的某一幅示意图,分别利用空洞率为1的卷积核对它们进行过滤,对过滤后的结果分别进行自编码,并利用欧式距离计算它们的相似度;
[0083] (b)对于基准成果的某一幅示意图和待检测成果的某一幅示意图,分别利用空洞率为2的卷积核对它们进行过滤,对过滤后的结果分别进行自编码,并利用欧式距离计算它们的相似度;
[0084] (c)对于基准成果的某一幅示意图和待检测成果的某一幅示意图,分别利用空洞率为3的卷积核对它们进行过滤,对过滤后的结果分别进行自编码,并利用欧式距离计算它们的相似度;
[0085] 步骤(a)(b)(c)中如果有不低于2个相似度较高,认定基准成果的某一幅示意图和待检测成果的某一幅示意图相似度较高。
[0086] S7、若相似度结果大于预置的相似度阈值,则认定对应的新发布的学术成果存在剽窃风险,生成并发送风险提示信息给对应的审查人员;提取并展示区块链中对应的基准成果示意图、目标基准文字识别结果、上传时间以及对应的目标用户的身份信息;
[0087] S8、若相似度结果小于预置的相似度阈值,则利用目标检测方法对待检测成果图像的文字进行检测,生成初始文字检测结果;
[0088] S9、对待检测成果图像进行图像超分辨率重建,并根据初始文字检测结果采用基础OCR识别技术或基于多图像增强方法互验的OCR技术对重建后的待检测成果图像进行文字识别,以得到目标文字识别结果;
[0089] 采用上述相同的对于待检测成果图像的文字部分,利用目标检测方法对每行的文字进行检测。具体地,如果每行检测出较多的文字,说明文字尺寸较大;如果每行检测出较少的文字,说明文字尺寸较小。对于尺寸较大的文字,进行图像超分辨率重建,在此基础上利用普通OCR技术进行文字识别即可;对于尺寸较小的文字,进行图像超分辨率重建,然后再利用基于多图像增强方法互验的OCR技术进行文字识别,得到最终的文字识别结果。上述利用基于多图像增强方法互验的OCR技术进行文字识别与上述步骤中对基准图像进行文字识别的方法相同。
[0090] S10、将目标文字识别结果与目标基准文字识别结果进行比对,生成并根据比对结果确定对应的新发布的学术成果是否存在剽窃风险,若存在,则生成并发送风险提示信息给对应的审查人员;提取并展示区块链中对应的基准成果示意图、目标基准文字识别结果、上传时间以及对应的目标用户的身份信息;若不存在,则结束。
[0091] 对基准成果图像的文字识别结果和待检测成果图像的文字识别结果进行比对,如果相似度较高,认定为存在疑似剽窃的情况;如果步骤S7和S10有任意一个步骤认定存在疑似剽窃的情况后,直接发给审查员核查。如果审查员也认定为存在剽窃的情况,则最终认定为剽窃。同时提取并展示区块链中对应的基准成果示意图、目标基准文字识别结果、上传时间以及对应的目标用户的身份信息,基于区块链中存储的数据信息进一步为进行追责认定提供有利的支撑,由于学术成果的相关核心信息已经上链存证,链上信息能够证明小明优先提出并展示了该学术成果,可以追究剽窃人的相关责任。
[0092] 利用上述方法,可以检测到在用户在上传学术成果用于讨论之后,是否存在学术成果被剽窃的情况。如果存在被剽窃的情况,可以基于区块链存储的数据对剽窃人进行相应的追责。
[0093] 为了解决现有技术中无法精准、全面地对学术成果剽窃行为进行检测的技术问题,本发明对于基准成果的任意一幅示意图和待检测成果的任意一幅示意图,利用基于多空洞率卷积核的自编码相似度计算方法,来计算它们之间的相似度,显著地提升了相似度计算的精度;并利用单行文字目标检测方法对字体大小进行检测,并对尺寸较小的文字进行了更加有针对性的识别。具体地,在图像超分辨率重建的基础上,利用基于多图像增强方法互验的OCR技术来识别尺寸较小的文字,显著地提升了尺寸较小文字的识别精度。同时,本发明引入了区块链的思想和技术,实现了学术成果相关核心信息的上链存证,显著地提升了方法和系统的可靠性。本发明采用多种智能算法相结合大大提高了数据识别的精度,并结合区块链技术对数据进行上链存证,保证数据的安全性,进而实现对智慧教育学术成果讨论过程全面精准有效的防剽窃。
[0094] 基于第一方面,在本发明的一些实施例中,该基于区块链的智慧教育学术成果讨论防剽窃方法还包括以下步骤:
[0095] 若对应的新发布的学术成果不存在剽窃风险,则将对应的新发布的学术成果图像的示意图、目标文字识别结果以及对应的发布者信息上传至区块链中进行存储。
[0096] 为了保证对原创作者的学术成果的保护,当网络上新发布的学术成果不存在剽窃风险,属于原创时,及时的将新发布的学术成果图像、目标文字识别结果以及对应的发布者信息上传至区块链中进行存储,以便丰富基准数据库,为后续的剽窃判定提供更为全面的数据。
[0097] 如图4所示,第二方面,本发明实施例提供一种基于区块链的智慧教育学术成果讨论防剽窃系统,包括:目标基准成果模块100、第一目标检测模块200、基准文字识别模块300、上链存储模块400、图像获取模块500、相似度计算模块600、审核模块700、第二目标检测模块800、待检测识别模块900以及文字比对模块1000,其中:
[0098] 目标基准成果模块100,用于获取并将目标用户的学术成果图像上传至对应的学校网络系统中,并记录上传时间;获取用户对目标用户的学术成果讨论结束信号后,将目标用户的学术成果图像作为基准成果图像;
[0099] 第一目标检测模块200,用于利用目标检测方法对基准成果图像中的文字进行检测,生成检测结果;
[0100] 基准文字识别模块300,用于对基准成果图像进行图像超分辨率重建,并根据检测结果采用基础OCR识别技术或基于多图像增强方法互验的OCR技术对重建后的基准成果图像进行文字识别,以得到目标基准文字识别结果;
[0101] 上链存储模块400,用于将基准成果示意图、目标基准文字识别结果、上传时间以及对应的目标用户的身份信息上传至区块链中进行存储;
[0102] 图像获取模块500,用于获取并将网络中新发布的学术成果图像作为待检测成果图像;
[0103] 相似度计算模块600,用于利用基于多空洞率卷积核的自编码相似度计算方法计算任意一幅基准成果示意图和任意一幅待检测成果示意图之间的相似度,得到相似度结果;
[0104] 审核模块700,用于若相似度结果大于预置的相似度阈值,则认定对应的新发布的学术成果存在剽窃风险,生成并发送风险提示信息给对应的审查人员;提取并展示区块链中对应的基准成果示意图、目标基准文字识别结果、上传时间以及对应的目标用户的身份信息;
[0105] 第二目标检测模块800,用于若相似度结果小于预置的相似度阈值,则利用目标检测方法对待检测成果图像的文字进行检测,生成初始文字检测结果;
[0106] 待检测识别模块900,用于对待检测成果图像进行图像超分辨率重建,并根据初始文字检测结果采用基础OCR识别技术或基于多图像增强方法互验的OCR技术对重建后的待检测成果图像进行文字识别,以得到目标文字识别结果;
[0107] 文字比对模块1000,用于将目标文字识别结果与目标基准文字识别结果进行比对,生成并根据比对结果确定对应的新发布的学术成果是否存在剽窃风险,若存在,则生成并发送风险提示信息给对应的审查人员;提取并展示区块链中对应的基准成果示意图、目标基准文字识别结果、上传时间以及对应的目标用户的身份信息;若不存在,则结束。
[0108] 为了解决现有技术中无法精准、全面地对学术成果剽窃行为进行检测的技术问题,本系统通过目标基准成果模块100、第一目标检测模块200、基准文字识别模块300、上链存储模块400、图像获取模块500、相似度计算模块600、审核模块700、第二目标检测模块800、待检测识别模块900以及文字比对模块1000等多个模块的相互配合,对于基准成果的任意一幅示意图和待检测成果的任意一幅示意图,利用基于多空洞率卷积核的自编码相似度计算方法,来计算它们之间的相似度,显著地提升了相似度计算的精度;并利用单行文字目标检测方法对字体大小进行检测,并对尺寸较小的文字进行了更加有针对性的识别。具体地,在图像超分辨率重建的基础上,利用基于多图像增强方法互验的OCR技术来识别尺寸较小的文字,显著地提升了尺寸较小文字的识别精度。同时,本发明引入了区块链的思想和技术,实现了学术成果相关核心信息的上链存证,显著地提升了方法和系统的可靠性。本发明采用多种智能算法相结合大大提高了数据识别的精度,并结合区块链技术对数据进行上链存证,保证数据的安全性,进而实现对智慧教育学术成果讨论过程全面精准有效的防剽窃。
[0109] 如图5所示,第三方面,本申请实施例提供一种电子设备,其包括存储器101,用于存储一个或多个程序;处理器102。当一个或多个程序被处理器102执行时,实现如上述第一方面中任一项的方法。
[0110] 还包括通信接口103,该存储器101、处理器102和通信接口103相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。存储器101可用于存储软件程序及模块,处理器102通过执行存储在存储器101内的软件程序及模块,从而执行各种功能应用以及数据处理。该通信接口103可用于与其他节点设备进行信令或数据的通信。
[0111] 其中,存储器101可以是但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read‑Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read‑Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read‑Only Memory,EEPROM)等。
[0112] 处理器102可以是一种集成电路芯片,具有信号处理能力。该处理器102可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
[0113] 在本申请所提供的实施例中,应该理解到,所揭露的方法及系统和方法,也可以通过其它的方式实现。以上所描述的方法及系统实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的方法及系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0114] 另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
[0115] 第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器102执行时实现如上述第一方面中任一项的方法。所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read‑Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0116] 以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
[0117] 对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其它的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。