基于人工智能的简历信息处理方法、装置、设备及介质转让专利

申请号 : CN202010910784.7

文献号 : CN112036647B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 郑志忠

申请人 : 中国平安人寿保险股份有限公司

摘要 :

本发明涉及人工智能领域,尤其涉及一种基于人工智能的简历信息处理方法、装置、设备及介质。该获取应聘者的简历信息和所述简历信息对应的简历类型;采用与所述简历类型对应的提取方式,提取所述简历信息中的多个实体信息;对所述多个实体信息进行数值转换,获取向量化表示的待识别样本数据;将所述待识别样本数据输入至预先训练好的智能增员模型中进行处理,预测所述应聘者在未来的第一目标周期内的第一员工评分值;若所述第一员工评分值大于预设评分阈值,则将所述应聘者作为新增员工。该方法可在企业增员过程中,不再依靠招聘人员的经验评价应聘者,保证对应聘者评价的客观性的目的。

权利要求 :

1.一种基于人工智能的简历信息处理方法,其特征在于,包括:获取应聘者的简历信息和所述简历信息对应的简历类型;

采用与所述简历类型对应的提取方式,提取所述简历信息中的多个实体信息;

对所述多个实体信息进行数值转换,获取向量化表示的待识别样本数据;

将所述待识别样本数据输入至预先训练好的智能增员模型中进行处理,预测所述应聘者在未来的第一目标周期内的第一员工评分值,其中,企业内所有员工为第一员工,企业内部的高质量员工为第二员工;

若所述第一员工评分值大于预设评分阈值,则将所述应聘者作为新增员工;

在所述将所述应聘者作为新增员工之后,所述基于人工智能的简历信息处理方法还包括:获取所述新增员工的基本信息和第一预设周期内的行为信息;

将所述基本信息和所述行为信息输入至预先训练好的员工评分预测模型中进行处理,预测所述新增员工在未来的第二目标周期内的第二员工评分值;

在所述获取应聘者的简历信息和所述简历信息对应的简历类型的步骤之前,所述基于人工智能的简历信息处理方法还包括:采集所述第一员工的训练样本数据,所述训练样本数据包括基本信息、第二预设周期内的行为信息以及员工评分标签;其中,所述第一预设周期、所述第二预设周期、所述第一目标周期和所述第二目标周期所指示的时间长度保持一致;

对所述基本信息、所述行为信息以及所述员工评分标签进行数值转换,获取向量化表示的训练样本数据;

对所述训练样本数据进行数据分割,得到所述第一员工对应的第一训练样本数据和所述第二员工对应的第二训练样本数据;其中,所述第一训练样本数据包括第一员工基本信息以及第一员工评分标签;所述第二训练样本数据包括第二员工基本信息、所述行为信息以及第二员工评分标签;

采用所述第一训练样本数据对第一多层神经网络模型进行训练,得到所述智能增员模型;所述智能增员模型对应最终模型参数;

根据所述最终模型参数,采用所述第二训练样本数据对第二多层神经网络模型进行训练,得到所述员工评分预测模型;

将所述第二员工评分值映射至预先创建好的报表模板中,获取员工评分预测报表。

2.如权利要求1所述基于人工智能的简历信息处理方法,其特征在于,所述采用所述第一训练样本数据对第一多层神经网络模型进行训练,得到所述智能增员模型,包括:采用前向传播算法对所述第一训练样本数据进行处理,获取模型预测输出;

基于所述模型预测输出,对所述第一多层神经网络模型进行更新优化,得到所述智能增员模型。

3.如权利要求1所述基于人工智能的简历信息处理方法,其特征在于,在所述对所述基本信息、所述行为信息以及所述员工评分标签进行数值转换,获取向量化表示的训练样本数据之后,且在所述对所述训练样本数据进行数据分割,得到所述第一员工对应的第一训练样本数据和第二员工对应的第二训练样本数据的之前,所述基于人工智能的简历信息处理方法还包括:对所述训练样本数据进行缺失值填充处理,得到中间样本数据;

对所述中间样本数据进行异常值检测,得到至少一个异常值,将所述异常值标记为空;

对所述标记为空的异常值进行缺失值填充,得到处理后的训练样本数据。

4.如权利要求1所述基于人工智能的简历信息处理方法,其特征在于,所述根据所述最终模型参数,采用所述第二训练样本数据对第二多层神经网络模型进行训练,得到所述员工评分预测模型,包括:采用所述最终模型参数初始化所述第二多层神经网络模型;

采用所述第二训练样本数据对所述第二多层神经网络模型进行训练,得到所述员工评分预测模型。

5.如权利要求4所述基于人工智能的简历信息处理方法,其特征在于,所述智能增员模型还对应一初始模型参数;

所述采用所述最终模型参数初始化所述第二多层神经网络模型,包括:计算所述最终模型参数与所述初始模型参数的相关系数;

选取最小的所述相关系数对应的最终模型参数作为目标模型参数;

采用所述目标模型参数初始化所述第二多层神经网络模型。

6.一种基于人工智能的简历信息处理装置,其特征在于,包括:简历信息获取模块,用于获取应聘者的简历信息和所述简历信息对应的简历类型;

实体信息提取模块,用于采用与所述简历类型对应的提取方式,提取所述简历信息中的多个实体信息;

数值转换模块,用于对所述多个实体信息进行数值转换,获取向量化表示的待识别样本数据;

模型预测模块,用于将所述待识别样本数据输入至预先训练好的智能增员模型中进行处理,预测所述应聘者在未来的第一目标周期内的第一员工评分值,其中,企业内所有员工为第一员工,企业内部的高质量员工为第二员工;

新增员工确定模块,用于若所述第一员工评分值大于预设评分阈值,则将所述应聘者作为新增员工;获取所述新增员工的基本信息和第一预设周期内的行为信息;将所述基本信息和所述行为信息输入至预先训练好的员工评分预测模型中进行处理,预测所述新增员工在未来的第二目标周期内的第二员工评分值;

所述简历信息处理装置还包括:

样本数据采集模块,用于采集所述第一员工的训练样本数据,训练样本数据包括基本信息、 第二预设周期内的行为信息以及员工评分标签;其中,第一预设周期、第二预设周期、第一目标周期和第二目标周期所指示的时间长度保持一致;

数据转换模块,用于对基本信息、行为信息以及员工评分标签进行数值转换,获取向量化表示的训练样本数据;

数据分割模块,用于对训练样本数据进行数据分割,得到所述第一员工对应的第一训练样本数据和所述第二员工对应的第二训练样本数据;其中,第一训练样本数据包括第一员工基本信息以及第一员工评分标签;第二训练样本数据包括第二员工基本信息、行为信息以及第二员工评分标签;

模型训练模块,用于采用第一训练样本数据对第一多层神经网络模型进行训练,得到智能增员模型;智能增员模型对应最终模型参数;

员工评分预测模型获取模块,用于根据最终模型参数,采用第二训练样本数据对第二多层神经网络模型进行训练,得到员工评分预测模型。

7.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至

5任一项所述基于人工智能的简历信息处理方法的步骤。

8.一种计算机存储介质,所述计算机存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述基于人工智能的简历信息处理方法的步骤。

说明书 :

基于人工智能的简历信息处理方法、装置、设备及介质

技术领域

[0001] 本发明涉及人工智能技术领域,尤其涉及一种基于人工智能的简历信息处理方法、装置、设备及介质。

背景技术

[0002] 目前,保险行业传统的销售渠道主要是通过代理人展业,拜访客户、介绍产品来达成签约。随着企业的不断发展,对代理人的规模以及质量的重视程度也逐渐加大。
[0003] 传统的增员通常是基于招聘人员的个人经验进行的,而不同的招聘人员的招聘经验不同,故基于招聘人员个人经验评价应聘者的客观性不强,准确率较低。

发明内容

[0004] 本发明实施例提供一种基于人工智能的简历信息处理方法、装置、设备及介质,以解决目前企业增员过程中,根据个人经验评价应聘者的客观性不强,准确率较低的问题。
[0005] 一种基于人工智能的简历信息处理方法,包括:
[0006] 获取应聘者的简历信息和所述简历信息对应的简历类型;
[0007] 采用与所述简历类型对应的提取方式,提取所述简历信息中的多个实体信息;
[0008] 对所述多个实体信息进行数值转换,获取向量化表示的待识别样本数据;
[0009] 将所述待识别样本数据输入至预先训练好的智能增员模型中进行处理,预测所述应聘者在未来的第一目标周期内的第一员工评分值;
[0010] 若所述第一员工评分值大于预设评分阈值,则将所述应聘者作为新增员工。
[0011] 一种基于人工智能的简历信息处理装置,包括:
[0012] 简历信息获取模块,用于获取应聘者的简历信息和所述简历信息对应的简历类型;
[0013] 实体信息提取模块,用于采用与所述简历类型对应的提取方式,提取所述简历信息中的多个实体信息;;
[0014] 数值转换模块,用于对所述多个实体信息进行数值转换,获取向量化表示的待识别样本数据;
[0015] 模型预测模块,用于将所述待识别样本数据输入至预先训练好的智能增员模型中进行处理,预测所述应聘者在未来的第一目标周期内的第一员工评分值;
[0016] 新增员工确定模块,用于若所述第一员工评分值大于预设评分阈值,则将所述应聘者作为新增员工。
[0017] 一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于人工智能的简历信息处理方法的步骤。
[0018] 一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于人工智能的简历信息处理方法的步骤。
[0019] 上述基于人工智能的简历信息处理方法、装置、设备及介质中,通过获取应聘者的简历信息,以针对不同类型不同渠道的简历信息进行提取,提取多个实体信息,无需人工提取简历信息中模型所需的输入数据,在简历信息的数量较大时,可有效提高招聘人员的工作效率。再对多个实体信息进行数值转换,获取向量表示的待识别样本数据,以便将该待识别样本数据作为模型输入,输入至智能增员模型中进行处理,获取反映员工在未来的第一目标周期内的工作表现的第一员工评分值,从而在企业增员过程中,不再依靠招聘人员的经验评价应聘者,保证对应聘者进行评价的客观性和真实性。

附图说明

[0020] 为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0021] 图1是本发明一实施例中基于人工智能的简历信息处理方法的一应用环境示意图;
[0022] 图2是本发明一实施例中基于人工智能的简历信息处理方法的一流程图;
[0023] 图3是本发明一实施例中基于人工智能的简历信息处理方法的一流程图;
[0024] 图4是本发明一实施例中基于人工智能的简历信息处理方法的一流程图;
[0025] 图5是图4中步骤S404的一具体流程图;
[0026] 图6是本发明一实施例中基于人工智能的简历信息处理方法的一流程图;
[0027] 图7是图4中步骤S405的一具体流程图;
[0028] 图8是图7中步骤S701的一具体流程图;
[0029] 图9是本发明一实施例中基于人工智能的简历信息处理装置的一示意图;
[0030] 图10是本发明一实施例中计算机设备的一示意图。

具体实施方式

[0031] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0032] 本发明实施例提供的基于人工智能的简历信息处理方法可应用在如图1的应用环境中,其中,计算机设备通过网络与服务器进行通信。计算机设备可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器来实现。
[0033] 在一实施例中,如图2所示,提供一种基于人工智能的简历信息处理方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤:
[0034] S201:获取应聘者的简历信息和简历信息对应的简历类型。
[0035] 其中,本方法可应用在一种人力资源管理平台中,该平台集成了员工招聘以及上岗员工的考核等功能,以保证员工招聘以及员工综合评价的客观性和真实性。具体地,应聘者可通过该智能平台提供的简历模板在线编辑简历或者上传线下简历,此处不做限定。该简历类型包括但不限于在线简历或线下简历等类型。
[0036] S202:采用与简历类型对应的提取方式,提取简历信息中的多个实体信息。
[0037] 其中,实体信息包括但不限于性别、年龄、籍贯、毕业院校、工作年限、学历、从事过的行业、个人专业技能(例如,英语6级、熟练使用office工具)等。
[0038] 可以理解地,若应聘者上传的简历信息是根据简历模板在线编辑所生成的,即在线简历(默认在线简历为文本类型),则认为该简历信息为标准结构化信息,可直接从结构化信息中通过结构化数据提取函数(如JsonPath提取)提取多个实体信息,无需通过自然语言处理技术(NLP)进行提取。
[0039] 若应聘者上传的简历信息为线下简历,由于线下简历是由应聘者线下编辑的简历,属于非标准结构化信息,故可采用自然语言处理技术(NLP)进行语义分析,以提取该简历信息中的多个实体信息。其中,NLP(Natural Language Processing,自然语言处理)是计算机以一种聪明而有用的方式分析、理解和从人类语言中获取意义的一种方式,通过NLP技术可实现文本的结构化提取。本实施例中通过预先创建多个实体类型,以基于NLP技术,采用多条标注好的语料数据训练模型,使模型具备实体识别能力,进而实现从简历信息中提取多个实体信息的目的。
[0040] 进一步地,若该线下简历为非文本类型,如图像类型,则可采用OCR识别技术提取该图像中的文本,以便根据该文本提取多个实体信息。
[0041] S203:对多个实体信息进行数值转换,获取向量化表示的待识别样本数据。
[0042] 具体地,该待识别样本数据是指可供模型输入的样本数据,即将每一多个实体信息转换为数值表示,以获取特征向量表示的待识别样本数据。示例性地,将每一维度数据可按照如下方式转换为数值:性别:1‑男、0‑女;年龄:20‑40之间的整数;工作年限:每6个月算作0.5,不足6个月的取0。学历:可按照预设的学历分类数值转换表将其转换为数值表示,例如,博士‑101、研究生‑102等。籍贯:可按照预设的城市分类数值转换表将其转换为数值表示。对于从事过的行业部分,可按照行业分类数值转换表将其转换为数值表示。对于个人专业技能部分,可根据岗位的不同,动态调整每一技能项的比重,基于应聘者的真实数据,输出该维度对应的预估分值,以将该维度转换为数值表示。可以理解地,向量表示的待识别样本数据即包括多个以数值形式表示的信息维度。
[0043] S204:将待识别样本数据输入至预先训练好的智能增员模型中进行处理,预测应聘者在未来的第一目标周期内的第一员工评分值。
[0044] 其中,智能增员模型为预先训练好的用于预测应聘者在未来的第一目标周期内的工作表现的模型。第一目标周期是指智能增员模型的模型输出结果所反映的预测时长,如未来两个月。第一员工评分值用于反映员工在未来的第一目标周期内的工作表现。
[0045] 需要说明的是,在训练智能增员模型时,是需要采集现有的企业内部高质量员工的基本信息和对应的员工评分作为模型输入进行训练,而该员工评分是结合员工过去一段时间(即第二预设周期)的行为信息进行评价得到,故该采集行为信息的时间长度与模型预测的时间长度保持一致。其中,第二预设周期指在模型训练时所采集的行为信息的采集周期,如三个月、六个月。
[0046] 可以理解地,若采集行为信息的时间长度为两个月,则模型预测的第一目标周期即为两个月,即预测该应聘者在未来两个月的工作表现。
[0047] 具体地,通过将待识别样本数据输入至智能增员模型,即可获取模型输出的预测分值,该预测分值用于反映应聘者在未来一段时间的工作表现,以此作为企业增员的评价维度,以达到在企业增员过程中,不再依靠招聘人员的经验评价应聘者,保证对应聘者进行评价的客观性的目的。
[0048] S205:若第一员工评分值大于预设评分阈值,则将应聘者作为新增员工。
[0049] 其中,预设评分阈值是预先设定的用于评价应聘者质量的评价指标。具体地,若第一员工评分值大于预设评分阈值,则认为该应聘者在未来的第一目标周期内的工作表现满足要求,则可将应聘者作为新增员工,后续可以邮件方式给该新增员工发送通知,提醒应聘者作为新增员工入职。
[0050] 进一步地,也可将第一员工评分值大于预设评分阈值的应聘者可发送至招聘人员对应的审核平台进行审核,审核通过后将该应聘者作为新增员工,避免由于智能增员模型的识别结果出现误差导致增员评价出现误差的问题,进一步保证新增员工的质量。
[0051] 本实施例中,通过获取应聘者的简历信息,以针对不同类型不同渠道的简历信息进行提取,提取多个实体信息,无需人工提取简历信息中模型所需的输入数据,在简历信息的数量较大时,可有效提高招聘人员的工作效率。再对所述多个实体信息进行数值转换,获取向量表示的待识别样本数据,以便将该待识别样本数据作为模型输入,输入至智能增员模型中进行处理,获取反映员工在未来的第一目标周期内的工作表现的第一员工评分值,从而在企业增员过程中,不再依靠招聘人员的经验评价应聘者,保证对应聘者进行评价的客观性和真实性。
[0052] 在一实施例中,如图3所示,该基于人工智能的简历信息处理方法还包括如下步骤:
[0053] S301:获取新增员工的基本信息和第一预设周期内的行为信息。
[0054] 其中,第一预设周期是指在使用员工评分预测模型进行预测时,模型输入数据中,新增员工的行为信息的采集周期(如两个月)。基本信息包括但不限于性别、年龄、学历、毕业院校、工作年限、工作经历、个人专业技能等。需要说明的是,该基本信息所包含的信息维度与上述实体信息中所包含的信息维度保持一致。
[0055] 行为信息包括但不限于出单情况、客户回访情况、参加活动情况、系统使用情况等。而出单情况可包括保单金额、出单数量、出单类型、提成比例等。客户回访情况可包括客户回访频率、客户回访评价等。参加活动情况可包括续保回访、业务培训活动等。系统使用情况可包括业务系统的使用次数、不同业务模块(例如续保追踪模块)的使用频率等,以反映该员工在某一业务方面的关注度。
[0056] S302:将基本信息和行为信息输入至预先训练好的员工评分预测模型中进行处理,预测新增员工在未来的第二目标周期的第二员工评分值。
[0057] 其中,第二员工评分值用于反映该员工在结合过去的第一预设周期内的行为信息特征后所预测的未来的第二目标周期内的工作表现。第二目标周期是指员工评分预测模型的模型输出结果所反映的预测时长,如未来两个月。
[0058] 具体地,将基本信息和行为信息作为模型输入,输入至预先训练好的员工评分预测模型中进行预测,获取模型输出结果即新增员工的第二员工评分值,以在智能增员模型的基础上通过结合该行为信息特征的影响,进一步预测该员工在未来的第二目标周期的工作表现,辅助上级对员工个人进行考评。
[0059] 需要说明的是,由于模型输入的行为信息是采集员工在过去的第一预设周期内的历史数据,故模型输出结果应保持与输入数据的时间维度一致,即第一预设周期与第二目标周期所指示的时间长度保持一致,即第一预设周期所指示的时间长度为三个月,第二目标周期所指示的时间长度也为三个月。
[0060] S303:将第二员工评分值映射至预先创建好的报表模板中,获取员工评分预测报表。
[0061] 具体地,基于第二员工评分值与报表中存储的新增员之间的映射关系,以输出员工评分预测报表,该员工评分预测报表可直观反映每一员工在未来第二目标周期内的工作表现,辅助上级对员工个人进行考评。
[0062] 可以理解地,系统会预先创建好一员工评分预测报表模板,该模板中存储有企业所有新增员工,根据模型输出的每一新增员工与第二员工评分值的映射关系,可将第二员工评分值映射到员工评分预测报表中,与新增员工关联,即可获取员工评分预测报表。该员工评分预测报表可将每一新增员工和对应的第二员工评分值对应显示,可直接从表中的数据直观看出每一新增员工在未来的第二目标周期内的工作表现。
[0063] 本实施例中,通过将新增员工的基本信息和过去一段时间(即过去的第二预设周期内)的行为信息输入至员工评分预测模型中进行处理,以获取反映新增员工在未来一段时间(即未来第二目标周期)的工作表现的第二员工评分值,并生成员工评分预测报表,可有效辅助考评人员根据员工在未来一段时间的预测工作表现对员工个人进行考评。
[0064] 在一实施例中,如图4所示,步骤S201之前,该基于人工智能的简历信息处理方法还包括如下步骤:
[0065] S401:采集第一员工的训练样本数据,训练样本数据包括基本信息、第二预设周期内的行为信息以及员工评分标签;其中,第一预设周期、第二预设周期、第一目标周期和第二目标周期所指示的时间长度保持一致。
[0066] 其中,第一员工指企业内所有员工。使用第一员工的数据对第二多层神经网络模型进行训练以得到员工评分预测模型,可结合新增员工在入职后的第二预设周期内的行为信息,预测新增员工在未来的第二目标周期内的工作表现。员工评分标签是指预先对企业所有员工的工作表现进行评分所得到的评分值,在后续模型训练中用作样本数据的真实标签(即真实值)。需要说明的是,第一预设周期、第二预设周期、第一目标周期和第二目标周期所指示的时间长度保持一致,以统一时间维度,排除时间因素的干扰。
[0067] S402:对基本信息、行为信息以及员工评分标签进行数值转换,获取向量化表示的训练样本数据。
[0068] 具体地,步骤S402与步骤S203保持一致,为避免重复,此处不再赘述。
[0069] S403:对训练样本数据进行数据分割,得到第一员工对应的第一训练样本数据和第二员工对应的第二训练样本数据;其中,第一训练样本数据包括基本信息以及员工评分标签;第二训练样本数据包括基本信息、行为信息以及员工评分标签。
[0070] 其中,第二员工指企业内部的高质量员工,使用第二员工的数据对第一多层神经网络模型进行训练以得到智能增员模型,可预测新增员工在未来的工作表现,从而初步提升员工质量。
[0071] 具体地,由于后续训练的智能增员模型和员工评分预测模型所采用的训练数据不同,因此需要对当前的训练样本数据进行分割,以进行不同预测模型的训练。
[0072] 可以理解地,该智能增员模型所采用的训练样本数据为第一训练样本数据,第一训练样本数据包括第二员工的基本信息和对应的员工评分标签;员工评分预测模型所采用的训练样本数据为第二训练样本数据,第二训练样本数据包括第一员工的基本信息、行为信息和对应的员工评分标签。
[0073] 具体地,由于新入职员工并不包含有行为信息数据,故此处数据缺失,而同时为了吸收高质量员工入职,因此该智能增员模型可采用企业内高质量员工的数据,即第二员工的基本信息和对应的员工评分标签进行训练,该第二员工可通过员工评分标签确定,将员工评分标签高于平均水平或预设阈值的员工作为第二员工。
[0074] 进一步地,在将训练样本数据输入模型进行训练之前,还可对训练样本数据进行预处理,以统一数据量纲。本实施例中,对训练样本数据进行预处理包括中心化处理和标准化处理。其中,中心化处理是指将训练样本数据中的每一维度都减去每一维度数据对应的均值,以获取零均值数据。标准化,在使得数据都变成零均值之后,除以标准差,使得新数据的分布接近标准高斯分布,通过对训练样本数据进行中心化和标注化处理以消除由于量纲不同、自身变异或者数值相差较大所引起的误差,提高模型训练效率。
[0075] S404:采用第一训练样本数据对第一多层神经网络模型进行训练,得到智能增员模型;智能增员模型对应一最终模型参数。
[0076] 其中,最终模型参数是指对第一多层神经网络模型进行训练优化后所得到的智能增员模型的模型参数。第一多层神经网络模型包括输入层、至少一个隐藏层和输出层,而模型参数即为神经网络模型中层与层之间的连接权值矩阵(即输入层至隐藏层权值矩阵(U)、隐藏层权值矩阵(V)以及隐藏层至输出层权值矩阵(W)),通过不断优化更新该模型参数使模型达到收敛,即获取智能增员模型,此时该智能增员模型对应的模型参数即为最终模型参数。
[0077] S405:根据最终模型参数,采用第二训练样本数据对第二多层神经网络模型进行训练,得到员工评分预测模型。
[0078] 其中,第一多层神经网络模型与第二多层神经网络模型采用相同深度学习算法。该深度学习算法可采用包括但不限于LSTM、BP、transformer、CRF、CNN等单个网络模型进行训练,也可将一个或多个深度学习算法结合进行训练,此处不做限定。
[0079] 具体地,由于训练智能增员模型时,采用的第一训练样本数据为基本信息和员工评分标签,而在训练员工评分预测模型时,所采用的第二训练样本数据也包括基本信息和员工评分标签,故可采用智能增员模型的最终模型参数,用于初始化第二多层神经网络模型,使员工评分预测模型在训练好的智能增员模型的模型参数的基础上进行训练,提高员工评分预测模型的训练效率。
[0080] 可以理解地,第二多层神经网络模型可在智能增员模型的基础上进行扩展,例如智能增员模型中的输入层为X个输入神经元(用于输入基本信息中的X个信息维度),由于第二多层神经网络模型中的模型输入维度相比智能增员模型增加了行为信息中的Y个信息维度,故可在智能增员模型中的输入层的X个输入神经元的基础上增加Y个输入神经元,以重构智能增员模型,获取待训练的第二多层神经网络模型。对于第二多层神经网络模型中的隐藏层和输入层的神经元个数可按照需要进行扩展或增加,此时第二多层神经网络模型可直接复用智能增员模型的最终模型参数,使员工评分预测模型在智能增员模型的模型参数的基础上进行训练,提高员工评分预测模型的训练效率。
[0081] 本实施例中,通过在训练智能增员模型和员工评分预测模型时,即在训练员工评分预测模型时通过复用智能增员模型的最终模型参数初始化第二多层神经网络模型进行训练,以在最终模型参数的基础上训练员工评分预测模型,实现联合训练的目的,有效提升模型训练的效率。
[0082] 在一实施例中,如图5所示,步骤S404中,即采用第一训练样本数据对第一多层神经网络模型进行训练,得到智能增员模型,具体包括如下步骤:
[0083] S501:采用前向传播算法对第一训练样本数据进行处理,获取模型预测输出。
[0084] 其中,前向传播算法是将当前时刻的输入(即第一训练样本数据,在训练第二多层神经网络模型时,该参数即表示第二训练样本数据)以及上一时刻的隐藏层的输出作为作为当前时刻隐藏层的输入,之后通过激活函数f(p)的变换得到隐藏层当前时刻的输出,再将当前时刻隐藏层的输出输入至输出层,通过输出层激活函数计算,得到模型预测输出。
[0085] S502:基于模型预测输出,对第一多层神经网络模型进行更新优化,得到智能增员模型。
[0086] 本实施例中,采用后向传播(Back Propagation)算法对模型预测输出进行误差计算,并按照时间反向的顺序对第一多层神经网络模型的模型参数进行更新优化,即优化U、V和W这三个权重参数。误差计算采用公式 进行计算,其中,yt即为员工评分标签。最后根据链式求导法计算出每一层的偏导即计算出 和 基于这三个变化
率来不断更新优化U、V和W这三个权值参数,当模型达到收敛条件时(预测准确率达到预设准确率),即获取智能增员模型。其中, 然后对每一时刻
的误差计算偏导数再相加即可得到上述三个变化率从而更新模型参数。
[0087] 在一实施例中,如图6所示,步骤S402之后且在步骤S403之前,该基于人工智能的简历信息处理方法还包括如下步骤:
[0088] S601:对训练样本数据进行缺失值填充处理,得到中间样本数据。
[0089] 其中,缺失值填充方法包括但不限于均值填充、众数填充、中位数填充、期望值最大化方法、多重填补以及k‑means聚类方法等。具体地,以k‑means聚类方法进行填充为例,将缺失值所在的画像数据(即列数据)进行聚类,并将缺失值以所聚类类簇的均值进行填充。
[0090] S602:对中间样本数据进行异常值检测,得到至少一个异常值,将异常值标记为空。
[0091] 具体地,异常值检测包括但不限于采用统计变量分析(如箱型图分析、平均值、最大最小值分析以及3σ法则)、基于距离的方法、基于密度的离群点检测、基于密度的离群点检测和孤立森林(Isolation Forest)等。本实施例中,以3σ法则为例,若训练样本数据服从正态分布,在3σ原则下,异常值被定义为一组测定值中与平均值的偏差超3倍标准差的值,因为在正态分布的假设下,距离平均值3σ之外的值出现的概率小于0.003),即超过的数据以及不超过的数据作为异常值。
[0092] S603:对标记为空的异常值进行缺失值填充,得到处理后的训练样本数据。
[0093] 具体地,由于异常值对应的训练样本数据不一定是不必要的,若直接将该异常值对应的样本数据删除,会导致样本数据中的特征缺失,影响训练样本数据的质量,进而影响模型预测的准确率,故本实施例中会将异常值删除并标记为空值,再对标记为空值的异常值再次进行缺失值填充,得到训练样本数据。本实施例中,通过对标记为空值的异常值进行缺失值填充,得到处理后的训练样本数据,以避免直接将异常值对应的样本数据去除,导致训练样本数据缺少该部分特征,影响模型预测的准确率的问题。
[0094] 本实施例中,通过对训练样本数据进行缺失值填充,得到中间样本数据,再对对中间样本数据进行异常值检测,得到至少一个异常值,以通对样本数据中的异常值和缺失值进行处理,达到数据清洗的目的,保证样本数据的质量。然后,将得到的异常值标记为空,以便对标记为空的异常值再次进行缺失值填充,得到待处理样本,以通过对训练样本数据进行两次缺失值填充,保证样本数据的质量和规范性,提升模型预测的准确率
[0095] 在一实施例中,如图7所示,步骤S405中,即根据最终模型参数,采用第二训练样本数据对第二多层神经网络模型进行训练,得到员工评分预测模型,具体包括如下步骤:
[0096] S701:采用最终模型参数初始化第二多层神经网络模型。
[0097] 其中,第二多层神经网络模型包括输入层、至少一个隐藏层和输出层,通过不断优化更新第二多层神经网络中的模型参数即可使模型达到收敛,得到员工评分预测模型。该模型参数即为神经网络模型中层与层之间的连接权值矩阵(即U’、V’、W’)。
[0098] 可以理解地,由于神经网络模型的训练是指不断更新优化模型参数,使模型预测输出接近真实输出(即员工评分标签)的过程。因此,在模型训练时,需要先对模型参数进行初始化,即初始化输入层至隐藏层权值矩阵、隐藏层权值矩阵以及隐藏层至输出层权值矩阵,以便模型训练时对上述模型参数进行更新优化。
[0099] 本实施例中,可将智能增员模型对应的最终模型参数即U、V和W直接赋值给第二多层神经网络模型中的模型参数即U’、V’、W’,以实现采用最终模型参数初始化第二多层神经网络模型的目的。
[0100] S702:采用第二训练样本数据对第二多层神经网络模型进行训练,得到员工评分预测模型。
[0101] 可以理解地,采用第二训练样本数据对第二多层神经网络模型进行训练,即对第一员工的基本信息和行为信息中的多个信息维度进行非线性处理,深度挖掘各信息维度对未来员工工作表现的影响程度,得到员工评分预测模型,以便后续针对员工的基本信息和过去的第一预设周期内的行为信息,预测员工在未来的第二目标周期内的工作表现。
[0102] 进一步地,采用第二训练样本数据对第二多层神经网络模型进行训练的训练过程与智能增员模型训练过程保持一致,为避免重复,此处不再赘述。
[0103] 本实施例中,通过采用最终模型参数初始化第二多层神经网络模型,然后采用第二训练样本数据对第二多层神经网络模型进行训练,得到员工评分预测模型,以使第二多层神经网络模型的模型参数复用智能增员模型的最终模型参数,实现联合训练。
[0104] 在一实施例中,智能增员模型还对应一初始模型参数;如图8所示,步骤S701中,即采用最终模型参数初始化第二多层神经网络模型,具体包括如下步骤:
[0105] S801:计算最终模型参数与初始模型参数的相关系数。
[0106] 其中,相关系数用于反映最终模型参数与初始模型参数之间的差异程度。初始模型参数可为网络模型初始化的模型参数或网络训练过程中的第一轮训练的模型参数。
[0107] 可以理解地,该最终模型参数包括输入层至隐藏层权值矩阵(W)、隐藏层权值矩阵(U)以及隐藏层至输出层权值矩阵(V),而在模型开始训练时会初始化每一权值矩阵(即初始模型参数),即该初始模型参数包括输入层至隐藏层权值矩阵(W’)、隐藏层权值矩阵(U’)以及隐藏层至输出层权值矩阵(V’),通过判断矩阵U与U’、V与V’以及W与W’之间的相关性,可确定差异较大的权值矩阵,将相关性较低的权值矩阵作为目标模型参数,并采用该目标模型参数初始化第二多层神经网络模型,以使第二多层神经网络模型的模型参数复用智能增员模型的模型参数,实现联合训练。
[0108] 具体地,矩阵的相关性可通过corrcoef(n,m)函数进行计算,其中,n表示最终模型参数,m表示初始模型参数。
[0109] S802:选取最小的相关系数对应的最终模型参数作为目标模型参数。
[0110] 具体地,若函数corrcoef计算输出的值越接近1,证明两个矩阵的差异性越小,反之越接近于0,则差异性越大,故可将最小的相关系数作为目标模型参数。
[0111] S803:采用目标模型参数初始化第二多层神经网络模型。
[0112] 示例性地,若步骤S801中判断出的差异最大的最终模型参数,即目标模型参数为隐藏层权值矩阵(U),则采用隐藏层权值矩阵(U)初始化第二多层神经网络模型中的隐藏层权值矩阵,而第二多层神经网络模型中的输入层至隐藏层权值矩阵(W)和隐藏层至输出层权值矩阵(V)的初始量可根据人为经验设定。
[0113] 本实施例中,为进一步提高模型训练的准确率和效率,本方法还增加了模型参数的选取机制,即将最终模型参数中,相对于初始模型参数的差异较大的最终模型参数作为目标模型参数,以对第二多层神经网络模型进行初始化,以使第二多层神经网络模型的模型参数复用智能增员模型的模型参数,实现联合训练。
[0114] 应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
[0115] 在一实施例中,提供一种基于人工智能的简历信息处理装置,该基于人工智能的简历信息处理装置与上述实施例中基于人工智能的简历信息处理方法一一对应。如图9所示,该基于人工智能的简历信息处理装置包括简历信息获取模块10、实体信息提取模块20、数值转换模块30、模型预测模块40和新增员工确定模块50。各功能模块详细说明如下:
[0116] 简历信息获取模块10,用于获取应聘者的简历信息和简历信息对应的简历类型。
[0117] 实体信息提取模块20,用于采用与简历类型对应的提取方式,提取简历信息中的多个实体信息。
[0118] 数值转换模块30,用于对多个实体信息进行数值转换,获取向量化表示的待识别样本数据。
[0119] 模型预测模块40,用于将待识别样本数据输入至预先训练好的智能增员模型中进行处理,预测应聘者在未来的第一目标周期内的第一员工评分值。
[0120] 新增员工确定模块50,用于若第一员工评分值大于预设评分阈值,则将应聘者作为新增员工。
[0121] 具体地,该基于人工智能的简历信息处理装置还包括信息获取模块、模型预测模块和员工评分预测报表获取模块。
[0122] 信息获取模块,用于获取新增员工的基本信息和第一预设周期内的行为信息。
[0123] 模型预测模块,用于将基本信息和行为信息输入至预先训练好的员工评分预测模型中进行处理,预测新增员工在未来的第二目标周期的第二员工评分值。
[0124] 员工评分预测报表获取模块,用于将第二员工评分值映射至预先创建好的报表模板中,获取员工评分预测报表。
[0125] 具体地,该基于人工智能的简历信息处理装置还包括样本数据采集模块、数据转换模块、数据分割模块、模型训练模块以及员工评分预测模型获取模块。
[0126] 样本数据采集模块,用于采集第一员工的训练样本数据,训练样本数据包括基本信息、第二预设周期内的行为信息以及员工评分标签;其中,第一预设周期、第二预设周期、第一目标周期和第二目标周期所指示的时间长度保持一致。
[0127] 数据转换模块,用于对基本信息、行为信息以及员工评分标签进行数值转换,获取向量化表示的训练样本数据。
[0128] 数据分割模块,用于对训练样本数据进行数据分割,得到第一员工对应的第一训练样本数据和第二员工对应的第二训练样本数据;其中,第一训练样本数据包括基本信息以及员工评分标签;第二训练样本数据包括基本信息、行为信息以及员工评分标签。
[0129] 模型训练模块,用于采用第一训练样本数据对第一多层神经网络模型进行训练,得到智能增员模型;智能增员模型对应一最终模型参数。
[0130] 员工评分预测模型获取模块,用于根据最终模型参数,采用第二训练样本数据对第二多层神经网络模型进行训练,得到员工评分预测模型。
[0131] 具体地,模型训练模块包括预测输出获取单元和智能增员模型获取单元。
[0132] 预测输出获取单元,用于采用前向传播算法对第一训练样本数据进行处理,获取模型预测输出。
[0133] 智能增员模型获取单元,用于基于模型预测输出,对第一多层神经网络模型进行更新优化,得到智能增员模型。
[0134] 具体地,该基于人工智能的简历信息处理装置还包括缺失填充模块、异常检测模块和异常值填充模块。
[0135] 缺失填充模块,用于对训练样本数据进行缺失值填充处理,得到中间样本数据。
[0136] 异常检测模块,用于对中间样本数据进行异常值检测,得到至少一个异常值,将异常值标记为空。
[0137] 异常值填充模块,用于对标记为空的异常值进行缺失值填充,得到处理后的训练样本数据。
[0138] 具体地,员工评分预测模型获取模块包括初始化单元和模型训练单元。
[0139] 初始化单元,用于采用最终模型参数初始化第二多层神经网络模型。
[0140] 模型训练单元,用于采用第二训练样本数据对第二多层神经网络模型进行训练,得到员工评分预测模型。
[0141] 具体地,智能增员模型还对应一初始模型参数;初始化单元包括相关系数计算子单元、目标模型参数确定子单元和初始化子单元。
[0142] 相关系数计算子单元,用于计算最终模型参数与初始模型参数的相关系数。
[0143] 目标模型参数确定子单元,用于选取最小的相关系数对应的最终模型参数作为目标模型参数。
[0144] 初始化子单元,用于采用目标模型参数初始化第二多层神经网络模型。
[0145] 关于基于人工智能的简历信息处理装置的具体限定可以参见上文中对于基于人工智能的简历信息处理方法的限定,在此不再赘述。上述基于人工智能的简历信息处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0146] 在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括计算机存储介质、内存储器。该计算机存储介质存储有操作系统、计算机程序和数据库。该内存储器为计算机存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储执行基于人工智能的简历信息处理方法过程中生成或获取的数据,如需求文档。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于人工智能的简历信息处理方法。
[0147] 在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中的基于人工智能的简历信息处理方法的步骤,例如图2所示的步骤S201‑S205,或者图3至图8中所示的步骤。或者,处理器执行计算机程序时实现基于人工智能的简历信息处理装置这一实施例中的各模块/单元的功能,例如图9所示的各模块/单元的功能,为避免重复,这里不再赘述。
[0148] 在一实施例中,提供一计算机存储介质,该计算机存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中用户帐号解锁方法的步骤,例如图2所示的步骤S201‑S205,或者图3至图8中所示的步骤,为避免重复,这里不再赘述。或者,该计算机程序被处理器执行时实现上述基于人工智能的简历信息处理装置这一实施例中的各模块/单元的功能,例如图9所示的各模块/单元的功能,为避免重复,这里不再赘述。
[0149] 本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
[0150] 所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
[0151] 以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。