会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利库 / 人工智能 / 数据挖掘 / 一种基于CNN和LSTM的深度学习数据挖掘方法

一种基于CNN和LSTM的深度学习数据挖掘方法

阅读:561发布:2021-02-26

IPRDB可以提供一种基于CNN和LSTM的深度学习数据挖掘方法专利检索,专利查询,专利分析的服务。并且一种基于CNN和LSTM的深度学习数据挖掘方法,包括以下步骤:依次收集每个目标对象的特征向量,得到原始数据包;对数据预处理,建立字符信息库;构建CNN-LSTM算法模型;对CNN-LSTM算法模型进行训练,并测试;采用CNN-LSTM算法模型进行数据挖掘;得到数据反馈,进行学习。本发明中,通过构建LSTM-CNN算法模型在学习时完成数据挖掘,大大提高了信息获取的效率,解决传统信息调取困难的问题,帮助学习者提高学习效果;其中CNN对关键词对应的字符信息进行快速识别,LSTM采用重复模块链的形式对关键词的相关信息快速延展、补充,使得信息调取速度快,信息调取准确性高。,下面是一种基于CNN和LSTM的深度学习数据挖掘方法专利的具体信息内容。

1.一种基于CNN和LSTM的深度学习数据挖掘方法,其特征在于,包括以下步骤:S1、依次收集每个目标对象的特征向量,得到原始数据包;

S2、对数据预处理,建立字符信息库;

S3、构建CNN-LSTM算法模型;

S4、对CNN-LSTM算法模型进行训练,并测试;

S5、采用CNN-LSTM算法模型进行数据挖掘;

S6、得到数据反馈,进行学习。

2.根据权利要求1所述的一种基于CNN和LSTM的深度学习数据挖掘方法,其特征在于,在S1中,特征向量为目标对象的多个属性数据,包括党员姓名、身份证信息、党籍、入党时间、入党年限、职务、工作所在地。

3.根据权利要求1所述的一种基于CNN和LSTM的深度学习数据挖掘方法,其特征在于,在S2中,数据预处理的方式为:以姓名、身份证和党员信息为主要关键词,对原始数据包中的数据进行分类,并将数据格式转换为预设格式,得到字符信息库。

4.根据权利要求1所述的一种基于CNN和LSTM的深度学习数据挖掘方法,其特征在于,在S3中,CNN神经网络系统和LSTM神经网络系统为串联建模。

5.根据权利要求1所述的一种基于CNN和LSTM的深度学习数据挖掘方法,其特征在于,在S4中,构造的CNN模型包括输入层、卷积层、全连接层和输出层;其中输入层输入的一维数据序列的长度为2k+1;卷积层中卷积核为一维结构,其大小为2k+1;全连接层搭建在CNN模型的最后部分;输出层设置在全连接层的下游。

6.根据权利要求1所述的一种基于CNN和LSTM的深度学习数据挖掘方法,其特征在于,在S4中,LSTM包含长短记忆层和至少一个全连接层。

7.根据权利要求1所述的一种基于CNN和LSTM的深度学习数据挖掘方法,其特征在于,在S5中进行数据挖掘时,首先输入关键词,CNN对关键词对应的字符信息进行快速识别,LSTM采用重复模块链的形式对关键词的相关信息快速延展、补充。

8.根据权利要求1所述的一种基于CNN和LSTM的深度学习数据挖掘方法,其特征在于,还包括校正系统;在S6中,学习者得到反馈的数据,再根据数据的准确性进行校正,不断完善模型。

9.根据权利要求1所述的一种基于CNN和LSTM的深度学习数据挖掘方法,其特征在于,还包括记录系统;记录系统对挖掘的数据内容、时间、频率进行记录,根据统计情况对学习者进行优先推送,减小数据挖掘的时间。

说明书全文

一种基于CNN和LSTM的深度学习数据挖掘方法

技术领域

[0001] 本发明涉及学习领域,尤其涉及一种基于CNN和LSTM的深度学习数据挖掘方法。

背景技术

[0002] 目前,各地区各部门的工作已经基本实现电子化。由于实现电子化的时间不长,信息量过于庞大,使得信息挖掘的准确性低,速度慢,耽误了各单位和个人的学习。
[0003] 为解决上述问题,本申请中提出一种基于CNN和LSTM的深度学习数据挖掘方法。

发明内容

[0004] (一)发明目的
[0005] 为解决背景技术中存在的技术问题,本发明提出一种基于CNN和LSTM的深度学习数据挖掘方法,本发明通过构建LSTM-CNN算法模型在学习时完成数据挖掘,大大提高了信息获取的效率,解决传统信息调取困难的问题,帮助学习者提高学习效果;其中CNN对关键词对应的字符信息进行快速识别,LSTM采用重复模块链的形式对关键词的相关信息快速延展、补充,使得信息调取速度快,信息调取准确性高。
[0006] (二)技术方案
[0007] 为解决上述问题,本发明提供了一种基于CNN和LSTM的深度学习数据挖掘方法,包括以下步骤:
[0008] S1、依次收集每个目标对象的特征向量,得到原始数据包;
[0009] S2、对数据预处理,建立字符信息库;
[0010] S3、构建CNN-LSTM算法模型;
[0011] S4、对CNN-LSTM算法模型进行训练,并测试;
[0012] S5、采用CNN-LSTM算法模型进行数据挖掘;
[0013] S6、得到数据反馈,进行学习。
[0014] 优选的,在S1中,特征向量为目标对象的多个属性数据,包括党员姓名、身份证信息、党籍、入党时间、入党年限、职务、工作所在地。
[0015] 优选的,在S2中,数据预处理的方式为:以姓名、身份证和党员信息为主要关键词,对原始数据包中的数据进行分类,并将数据格式转换为预设格式,得到字符信息库。
[0016] 优选的,在S3中,CNN神经网络系统和LSTM神经网络系统为串联建模。
[0017] 优选的,在S4中,构造的CNN模型包括输入层、卷积层、全连接层和输出层;其中输入层输入的一维数据序列的长度为2k+1;卷积层中卷积核为一维结构,其大小为2k+1;全连接层搭建在CNN模型的最后部分;输出层设置在全连接层的下游。
[0018] 优选的,在S4中,LSTM包含长短记忆层和至少一个全连接层。
[0019] 优选的,在S5中进行数据挖掘时,首先输入关键词,CNN对关键词对应的字符信息进行快速识别,LSTM采用重复模块链的形式对关键词的相关信息快速延展、补充。
[0020] 优选的,还包括校正系统;在S6中,学习者得到反馈的数据,再根据数据的准确性进行校正,不断完善模型。
[0021] 优选的,还包括记录系统;记录系统对挖掘的数据内容、时间、频率进行记录,根据统计情况对学习者进行优先推送,减小数据挖掘的时间。
[0022] 本发明的上述技术方案具有如下有益的技术效果:
[0023] 一、本发明中,通过构建LSTM-CNN算法模型在学习时完成数据挖掘,大大提高了信息获取的效率,解决传统信息调取困难的问题,帮助学习者提高学习效果;其中CNN对关键词对应的字符信息进行快速识别,LSTM采用重复模块链的形式对关键词的相关信息快速延展、补充,使得信息调取速度快,信息调取准确性高。
[0024] 二、本发明中,设置的校正系统和记录系统,提高了数据挖掘的准确性和便捷性,进一步完善方法系统,促进学习效果。

附图说明

[0025] 图1为本发明提出的一种基于CNN和LSTM的深度学习数据挖掘方法的流程图。

具体实施方式

[0026] 为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
[0027] 如图所示,本发明提出的一种基于CNN和LSTM的深度学习数据挖掘方法,包括以下步骤:
[0028] S1、依次收集每个目标对象的特征向量,得到原始数据包;
[0029] S2、对数据预处理,建立字符信息库;
[0030] S3、构建CNN-LSTM算法模型;
[0031] S4、对CNN-LSTM算法模型进行训练,并测试;
[0032] S5、采用CNN-LSTM算法模型进行数据挖掘;
[0033] S6、得到数据反馈,进行学习。
[0034] 在一个可选的实施例中,在S1中,特征向量为目标对象的多个属性数据,包括党员姓名、身份证信息、党籍、入党时间、入党年限、职务、工作所在地。
[0035] 在一个可选的实施例中,在S2中,数据预处理的方式为:以姓名、身份证和党员信息为主要关键词,对原始数据包中的数据进行分类,并将数据格式转换为预设格式,得到字符信息库。
[0036] 在一个可选的实施例中,在S3中,CNN神经网络系统和LSTM神经网络系统为串联建模。
[0037] 在一个可选的实施例中,在S4中,构造的CNN模型包括输入层、卷积层、全连接层和输出层;其中输入层输入的一维数据序列的长度为2k+1;卷积层中卷积核为一维结构,其大小为2k+1;全连接层搭建在CNN模型的最后部分;输出层设置在全连接层的下游。
[0038] 在一个可选的实施例中,在S4中,LSTM包含长短记忆层和至少一个全连接层。
[0039] 在一个可选的实施例中,在S5中进行数据挖掘时,首先输入关键词,CNN 对关键词对应的字符信息进行快速识别,LSTM采用重复模块链的形式对关键词的相关信息快速延展、补充。
[0040] 在一个可选的实施例中,还包括校正系统;在S6中,学习者得到反馈的数据,再根据数据的准确性进行校正,不断完善模型。
[0041] 在一个可选的实施例中,还包括记录系统;记录系统对挖掘的数据内容、时间、频率进行记录,根据统计情况对学习者进行优先推送,减小数据挖掘的时间。
[0042] 本发明中,通过构建LSTM-CNN算法模型在学习时完成数据挖掘,大大提高了信息获取的效率,解决传统信息调取困难的问题,帮助学习者提高学习效果;其中CNN对关键词对应的字符信息进行快速识别,LSTM采用重复模块链的形式对关键词的相关信息快速延展、补充,使得信息调取速度快,信息调取准确性高;设置的校正系统和记录系统,提高了数据挖掘的准确性和便捷性,进一步完善方法系统,促进学习效果。
[0043] 应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。
高效检索全球专利

IPRDB是专利检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,专利查询、专利分析

电话:13651749426

侵权分析

IPRDB的侵权分析产品是IPRDB结合多位一线专利维权律师和专利侵权分析师的智慧,开发出来的一款特色产品,也是市面上唯一一款帮助企业研发人员、科研工作者、专利律师、专利分析师快速定位侵权分析的产品,极大的减少了用户重复工作量,提升工作效率,降低无效或侵权分析的准入门槛。

立即试用