一种基于用户行为序列的在线招聘互惠推荐系统和方法转让专利

申请号 : CN202311478255.4

文献号 : CN117216410B

文献日 : 2024-03-12

本发明公开了一种基于用户行为序列的在线招聘互惠推荐系统，该系统包括序列行为表达模组、发起方动态偏好模组、响应方动态偏好模组和多阶段行为预测模组，通过分别对两个目标用户的行为序列进行合理表达，采用注意力机制对主动行为和被动行为进行动态建模，生成两个目标用户的动态偏好表达，并利用多阶段行为的数据标签，得到两个目标用户之间主动申请与主动达成的概率，最终计算出两个目标用户之间匹配的概率。本发明还公开了一种基于用户行为序列的在线招聘互惠推荐方法。本发明的有益效果为：能够同时满足在线招聘市场中双向性、多阶段性和主动‑被动行为的考量需求，实现了两个目标用户之间互惠匹配的高准度预测。

1.一种基于用户行为序列的在线招聘互惠推荐系统，其特征在于，该推荐系统包括：序列行为表达模组、发起方动态偏好模组、响应方动态偏好模组和多阶段行为预测模组；

所述序列行为表达模组包括行为关联用户嵌入层、行为种类信息层和行为位置信息层，所述序列行为表达模组通过所述关联用户嵌入层、所述行为种类信息层和所述行为位置信息层将所述发起方行为序列和所述响应方行为序列中的每个行为的关联用户、行为种类和行为位置进行融合；

所述序列行为表达模组对发起方行为序列和响应方行为序列分别进行处理，生成发起方行为序列表达和响应方行为序列表达，并将所述发起方行为序列表达输入到所述发起方动态偏好模组，将所述响应方行为序列表达输入到所述响应方动态偏好模组；所述发起方行为序列和所述响应方行为序列中的行为均包括主动行为或被动行为；

所述发起方动态偏好模组采用注意力机制对所述发起方行为序列表达进行编码与聚合，获得发起方动态偏好；所述响应方动态偏好模组采用注意力机制对所述响应方行为序列表达进行编码与聚合，获得响应方动态偏好；所述发起方动态偏好模组和所述响应方动态偏好模组分别以向量的形式表达所述发起方动态偏好和所述响应方动态偏好，并将所述发起方动态偏好和所述响应方动态偏好输入到所述多阶段行为预测模组；

所述多阶段行为预测模组接受所述发起方动态偏好，并结合响应方嵌入信息得到发起方主动申请响应方的概率P1；所述多阶段行为预测模组接受所述响应方动态偏好，并结合发起方嵌入信息得到响应方主动接受的概率P2；根据所述概率P1和所述概率P2计算发起方与响应方的匹配概率。

2.根据权利要求1所述的推荐系统，其特征在于，所述发起方动态偏好模组和所述响应方动态偏好模组各自独立运行且结构相同，均包括注意力层，所述注意力层包括主动‑被动感知注意力机制和多头机制；

对于主动行为的注意力，所述主动‑被动感知注意力机制对主动行为的注意力矩阵进行编码，以屏蔽未来发生的主动行为或被动行为对过去发生的主动行为的影响；

对于被动行为的注意力，所述主动‑被动感知注意力机制对被动行为的注意力矩阵进行编码，以屏蔽发起方或响应方的主动行为或被动行为对其任何被动行为的影响；

所述发起方动态偏好模组的多头机制聚合发起方的主动行为的注意力和被动行为的注意力，并以向量的形式输出发起方动态偏好；所述响应方动态偏好模组的多头机制同时聚合响应方的主动行为的注意力和被动行为的注意力，并以向量的形式输出响应方动态偏好。

3.根据权利要求1所述的推荐系统，其特征在于，所述多阶段行为预测模组包括多阶段预测层，在所述多阶段预测层，所述发起方动态偏好和所述响应方嵌入信息通过向量内积的形式表达相关性，并通过Sigmoid激活函数得到所述发起方主动申请响应方的概率P1；

所述响应方动态偏好和所述发起方嵌入信息通过向量内积的形式表达相关性，并通过Sigmoid激活函数得到所述响应方主动接受的概率P2；

将所述概率P1和所述概率P2通过条件概率公式进行乘法运算，并输入到各行为对应的损失函数种进行计算，同时得到发起方与响应方的匹配概率。

4.根据权利要求1所述的推荐系统，其特征在于，所述关联用户嵌入层将行为序列中的每一个行为赋予与其关联用户的用户ID，所述用户ID为类别型特征，所述序列行为表达模组构建用户ID字典，并分配每一个所述用户ID一个独立的可学习的嵌入表达；

所述行为种类信息层为行为序列中的每一个行为赋予一种行为种类信息，所述行为种类信息包括：主动申请、被动申请、主动接受和被动接受，所述序列行为表达模组构通过四个行为种类的投影矩阵分别对应主动申请、被动申请、主动接受和被动接受四种行为；

所述行为位置信息层将行为序列中的行为按时间顺序进行排序，得到行为先后位置信息，所述序列行为表达模组构建行为位置信息字典，并将得到的行为先后位置信息赋予到行为序列表达中。

5.一种基于用户行为序列的在线招聘互惠推荐方法，其特征在于，该推荐方法包括：

行为序列表达生成，包括分别对发起方行为序列和响应方行为序列进行处理，生成发起方行为序列表达和响应方行为序列表达，所述发起方行为序列和所述响应方行为序列中的行为均包括主动行为或被动行为；所述分别对发起方行为序列和响应方行为序列进行处理包括：对所述发起方行为序列和所述响应方行为序列中的每一个行为分别赋予关联用户信息、行为种类信息和行为位置信息；

动态偏好建模，包括发起方动态偏好建模和响应方动态偏好建模，所述发起方动态偏好建模包括采用注意力机制对所述发起方行为序列表达进行编码与聚合，获得发起方动态偏好；所述响应方动态偏好建模包括采用注意力机制对所述响应方行为序列表达进行编码与聚合，获得响应方动态偏好；

多阶段行为预测，包括根据发起方动态偏好和响应方嵌入信息得到发起方主动申请响应方的概率P1，根据响应方动态偏好和发起方嵌入信息得到响应方主动接受的概率P2；并根据所述概率P1和所述概率P2计算发起方与响应方的匹配概率。

6.根据权利要求5所述的推荐方法，其特征在于，所述关联用户信息为行为关联的用户ID，行为序列中的每一个行为都由关联用户的用户ID组成，所述用户ID为类别型特征，并基于用户ID字典分配每一个所述用户ID一个独立的可学习的嵌入表达；

所述行为种类信息包括：主动申请、被动申请、主动接受和被动接受，并通过四个行为种类的投影矩阵分别对应主动申请、被动申请、主动接受和被动接受四种行为；

所述行为位置信息为将行为序列中的行为按时间顺序进行排序，得到行为先后位置信息，并基于行为位置信息字典将得到的行为先后位置信息赋予到行为序列表达中。

7.根据权利要求5所述的推荐方法，其特征在于，所述发起方动态偏好建模和所述响应方动态偏好建模均包括主动‑被动感知注意力机制和多头机制；

所述多头机制聚合主动行为的注意力和被动行为的注意力，并以向量的形式输出发起方动态偏好和响应方动态偏好。

8.根据权利要求5所述的推荐方法，其特征在于，所述根据发起方动态偏好和响应方嵌入信息得到发起方主动申请响应方的概率P1包括：所述发起方动态偏好和所述响应方嵌入信息通过向量内积的形式表达相关性，并通过Sigmoid激活函数得到所述发起方主动申请响应方的概率P1；

所述根据响应方动态偏好和发起方嵌入信息得到响应方主动接受的概率P2包括：所述响应方动态偏好和所述发起方嵌入信息通过向量内积的形式表达相关性，并通过Sigmoid激活函数得到所述响应方主动接受的概率P2；

所述根据所述概率P1和所述概率P2计算发起方与响应方的匹配概率包括：将所述概率P1和所述概率P2通过条件概率公式进行乘法运算，并输入到各行为对应的损失函数种进行计算，同时得到发起方与响应方的匹配概率。

一种基于用户行为序列的在线招聘互惠推荐系统和方法

技术领域

[0001] 本发明涉及互联网信息推荐系统技术领域，具体而言，涉及一种基于用户行为序列的在线招聘互惠推荐系统和方法。

背景技术

[0002] 在线招聘市场作为一种重要的在线市场，促进求职者和招聘者之间进行互惠的人力岗位匹配。在线招聘市场中的匹配过程有两个重要的特征：其一是在匹配过程上具有多阶段性，即求职者与招聘者的匹配需要至少存在一个发起方的申请阶段和一个响应方的接收阶段；其二是在匹配方向上具有双向性，即存在求职者作为匹配发起方与招聘者作为匹配发起方两种不同方向上的匹配。

[0003] 现有的推荐系统仅支持单向的匹配，而且不能同时满足双方用户的多阶段动态偏好，导致在线招聘市场中招聘者和求职者匹配预测的准确度和满意度低。

发明内容

[0004] 为解决上述问题，本发明的目的在于提供一种同时满足求职者和招聘者双方的动态偏好，实现高准度匹配预测的在线招聘互惠推荐系统和方法。

[0005] 本发明提供了一种基于用户行为序列的在线招聘互惠推荐系统，该推荐系统包括：序列行为表达模组、发起方动态偏好模组、响应方动态偏好模组和多阶段行为预测模组；

[0006] 所述序列行为表达模组对发起方行为序列和响应方行为序列分别进行处理，生成发起方行为序列表达和响应方行为序列表达，并将所述发起方行为序列表达输入到所述发起方动态偏好模组，将所述响应方行为序列表达输入到所述响应方动态偏好模组；所述发起方行为序列和所述响应方行为序列中的行为均包括主动行为或被动行为；

[0007] 所述发起方动态偏好模组采用注意力机制对所述发起方行为序列表达进行编码与聚合，获得发起方动态偏好；所述响应方动态偏好模组采用注意力机制对所述响应方行为序列表达进行编码与聚合，获得响应方动态偏好；所述发起方动态偏好模组和所述响应方动态偏好模组分别以向量的形式表达所述发起方动态偏好和所述响应方动态偏好，并将所述发起方动态偏好和所述响应方动态偏好输入到所述多阶段行为预测模组；

[0008] 所述多阶段行为预测模组接受所述发起方动态偏好，并结合响应方嵌入信息得到发起方主动申请响应方的概率P1；所述多阶段行为预测模组接受所述响应方动态偏好，并结合发起方嵌入信息得到响应方主动接受的概率P2；根据所述概率P1和所述概率P2计算发起方与响应方的匹配概率。

[0009] 作为本发明进一步的改进，所述序列行为表达模组包括行为关联用户嵌入层、行为种类信息层和行为位置信息层，所述序列行为表达模组通过所述关联用户嵌入层、所述行为种类信息层和所述行为位置信息层将所述发起方行为序列和所述响应方行为序列中的每个行为的关联用户、行为种类和行为位置进行融合，得到所述发起方行为序列表达和所述响应方行为序列表达。

[0010] 作为本发明进一步的改进，所述发起方动态偏好模组和所述响应方动态偏好模组各自独立运行且结构相同，均包括注意力层，所述注意力层包括主动‑被动感知注意力机制和多头机制；

[0011] 对于主动行为的注意力，所述主动‑被动感知注意力机制对主动行为的注意力矩阵进行编码，以屏蔽未来发生的主动行为或被动行为对过去发生的主动行为的影响；

[0012] 对于被动行为的注意力，所述主动‑被动感知注意力机制对被动行为的注意力矩阵进行编码，以屏蔽发起方或响应方的主动行为或被动行为对其任何被动行为的影响；

[0013] 所述发起方动态偏好模组的多头机制聚合发起方的主动行为的注意力和被动行为的注意力，并以向量的形式输出发起方动态偏好；所述响应方动态偏好模组的多头机制同时聚合响应方的主动行为的注意力和被动行为的注意力，并以向量的形式输出响应方动态偏好。

[0014] 作为本发明进一步的改进，所述多阶段行为预测模组包括多阶段预测层，在所述多阶段预测层，

[0015] 所述发起方动态偏好和所述响应方嵌入信息通过向量内积的形式表达相关性，并通过Sigmoid激活函数得到所述发起方主动申请响应方的概率P1；

[0016] 所述响应方动态偏好和所述发起方嵌入信息通过向量内积的形式表达相关性，并通过Sigmoid激活函数得到所述响应方主动接受的概率P2；

[0017] 将所述概率P1和所述概率P2通过条件概率公式进行乘法运算，并输入到各行为对应的损失函数种进行计算，同时得到发起方与响应方的匹配概率。

[0018] 作为本发明进一步的改进，所述关联用户嵌入层将行为序列中的每一个行为赋予与其关联用户的用户ID，所述用户ID为类别型特征，所述序列行为表达模组构建用户ID字典，并分配每一个所述用户ID一个独立的可学习的嵌入表达；

[0019] 所述行为种类信息层为行为序列中的每一个行为赋予一种行为种类信息，所述行为种类信息包括：主动申请、被动申请、主动接受和被动接受，所述序列行为表达模组构通过四个行为种类的投影矩阵分别对应主动申请、被动申请、主动接受和被动接受四种行为；

[0020] 所述行为位置信息层将行为序列中的行为按时间顺序进行排序，得到行为先后位置信息，所述序列行为表达模组构建行为位置信息字典，并将得到的行为先后位置信息赋予到行为序列表达中。

[0021] 本发明还提供了一种基于用户行为序列的在线招聘互惠推荐方法，该推荐方法包括：

[0022] 行为序列表达生成，包括分别对发起方行为序列和响应方行为序列进行处理，生成发起方行为序列表达和响应方行为序列表达，所述发起方行为序列和所述响应方行为序列中的行为均包括主动行为或被动行为；

[0023] 动态偏好建模，包括发起方动态偏好建模和响应方动态偏好建模，所述发起方动态偏好建模包括采用注意力机制对所述发起方行为序列表达进行编码与聚合，获得发起方动态偏好；所述响应方动态偏好建模包括采用注意力机制对所述响应方行为序列表达进行编码与聚合，获得响应方动态偏好；

[0024] 多阶段行为预测，包括根据发起方动态偏好和响应方嵌入信息得到发起方主动申请响应方的概率P1，根据响应方动态偏好和发起方嵌入信息得到响应方主动接受的概率P2；并根据所述概率P1和所述概率P2计算发起方与响应方的匹配概率。

[0025] 作为本发明进一步的改进，所述分别对发起方行为序列和响应方行为序列进行处理包括：对所述发起方行为序列和所述响应方行为序列中的每一个行为分别赋予关联用户信息、行为种类信息和行为位置信息。

[0026] 作为本发明进一步的改进，所述关联用户信息为行为关联的用户ID，行为序列中的每一个行为都由关联用户的用户ID组成，所述用户ID为类别型特征，并基于用户ID字典分配每一个所述用户ID一个独立的可学习的嵌入表达；

[0027] 所述行为种类信息包括：主动申请、被动申请、主动接受和被动接受，并通过四个行为种类的投影矩阵分别对应主动申请、被动申请、主动接受和被动接受四种行为；

[0028] 所述行为位置信息为将行为序列中的行为按时间顺序进行排序，得到行为先后位置信息，并基于行为位置信息字典将得到的行为先后位置信息赋予到行为序列表达中。

[0029] 作为本发明进一步的改进，所述发起方动态偏好建模和所述响应方动态偏好建模均包括主动‑被动感知注意力机制和多头机制；

[0030] 对于主动行为的注意力，所述主动‑被动感知注意力机制对主动行为的注意力矩阵进行编码，以屏蔽未来发生的主动行为或被动行为对过去发生的主动行为的影响；

[0031] 对于被动行为的注意力，所述主动‑被动感知注意力机制对被动行为的注意力矩阵进行编码，以屏蔽发起方或响应方的主动行为或被动行为对其任何被动行为的影响；

[0032] 所述多头机制聚合主动行为的注意力和被动行为的注意力，并以向量的形式输出发起方动态偏好和响应方动态偏好。

[0033] 作为本发明进一步的改进，所述根据发起方动态偏好和响应方嵌入信息得到发起方主动申请响应方的概率P1包括：所述发起方动态偏好和所述响应方嵌入信息通过向量内积的形式表达相关性，并通过Sigmoid激活函数得到所述发起方主动申请响应方的概率P1；

[0034] 所述根据响应方动态偏好和发起方嵌入信息得到响应方主动接受的概率P2包括：所述响应方动态偏好和所述发起方嵌入信息通过向量内积的形式表达相关性，并通过Sigmoid激活函数得到所述响应方主动接受的概率P2；

[0035] 所述根据所述概率P1和所述概率P2计算发起方与响应方的匹配概率包括：将所述概率P1和所述概率P2通过条件概率公式进行乘法运算，并输入到各行为对应的损失函数种进行计算，同时得到发起方与响应方的匹配概率。

[0036] 本发明的有益效果为：通过分别对发起方和响应方两个目标用户的行为序列进行合理表达，采用注意力机制对主动行为和被动行为进行动态建模，生成发起方和响应方的两个目标的用户动态偏好表达，并利用多阶段行为的数据标签，得到发起方和响应方两个目标用户之间主动申请与主动达成的概率，最终计算出两个目标用户之间匹配的概率。在在线招聘市场，用户的动态偏好可以被主动行为反映，又可以被被动行为影响，本发明能够适应求职者与招聘者匹配的多阶段性和双向性，满足通过求职者、招聘者的行为序列进行用户的动态偏好建模，满足对互惠招聘场景中的主动‑被动行为的合理利用，以及对求职者、招聘者双方独立偏好同时考量的需求，实现了求职者和招聘者之间互惠匹配的高准度预测。同时，本发明能合理利用主被动行为的推荐系统来模拟预测用户随时间推移而有规律地演化的动态偏好，获取能够最大化匹配效率的有限推荐结果。

附图说明

[0037] 图1为本发明实施例所述的一种基于用户行为序列的在线招聘互惠推荐系统的系统示意图；

[0038] 图2为本发明实施例所述的一种基于用户行为序列的在线招聘互惠推荐系统的结构示意图；

[0039] 图3为本发明实施例所述的一种基于用户行为序列的在线招聘互惠推荐系统的运用流程示意图。

具体实施方式

[0040] 下面将结合本发明实施例中的附图，对发明开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

[0041] 需要说明，若本发明实施例中有涉及方向性指示(诸如上、下、左、右、前、后……)，则该方向性指示仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等，如果该特定姿态发生改变时，则该方向性指示也相应地随之改变。

[0042] 另外，在本发明的描述中，所用术语仅用于说明目的，并非旨在限制本公开的范围。术语“包括”和/或“包含”用于指定元件、步骤、操作和/或组件的存在，但并不排除存在或添加一个或多个其他元件、步骤、操作和/或组件的情况。术语“第一”、“第二”等可能用于描述各种元件，不代表顺序，且不对这些元件起限定作用。此外，在本发明的描述中，除非另有说明，“多个”的含义是两个及两个以上。这些术语仅用于区分一个元素和另一个元素。结合以下附图，这些和/或其他方面变得显而易见，并且，本领域普通技术人员更容易理解关于本发明实施例的说明。附图仅出于说明的目的用来描绘本公开实施例。本领域技术人员将很容易地从以下说明中认识到，在不背离本公开原理的情况下，可以采用本发明所示结构和方法的替代实施例。

[0043] 如图3所示，在线招聘中，用户包括发起方和响应方，发起方/响应方的配置可以是求职者/招聘者，也可以是招聘者/求职者，即发起方可以是求职者或是招聘者，相应的响应者是招聘者或是求职者。这体现了在线招聘中匹配方向具有双向性，即存在求职者作为匹配发起方与招聘者作为匹配发起方两种不同方向的匹配。而且求职者与招聘者之间的匹配需要发起方申请与响应方接受两个阶段，即具有多阶段性。用户的行为可以被分类为主动行为和被动行为，其中，主动行为包括主动申请对方和主动接受对方，被动行为包括被对方申请和被对方接受；发起方主动申请的同时，响应方会收到被动申请；响应方主动接受的同时，发起方会收到被动接受。发起方和响应方的这些行为信息可通过用户行为记录仪记录，并以行为序列的方式存储在数据库中。

[0044] 本发明实施例所述的一种基于用户行为序列的在线招聘互惠推荐系统，如图1所示，该推荐系统包括序列行为表达模组、发起方动态偏好模组、响应方动态偏好模组和多阶段行为预测模组，其中，

[0045] 序列行为表达模组负责处理系统的输入信息，输入信息分为两组，分别是发起方行为序列和响应方行为序列，序列行为表达模组对发起方行为序列和响应方行为序列分别进行处理，生成发起方行为序列表达和响应方行为序列表达，发起方行为序列表达输入到发起方动态偏好模组，响应方行为序列表达输入到所述响应方动态偏好模组。所述发起方行为序列和所述响应方行为序列中的行为均包括主动行为或被动行为。

[0046] 发起方动态偏好模组采用注意力机制对序列行为表达模组处理后的发起方行为序列表达进行编码与聚合，获得发起方动态偏好；响应方动态偏好模组采用注意力机制对序列行为表达模组处理后响应方行为序列表达进行编码与聚合，获得响应方动态偏好；发起方动态偏好模组和响应方动态偏好模组分别以向量的形式表达发起方动态偏好和响应方动态偏好，并将发起方动态偏好和响应方动态偏好输入到多阶段行为预测模组。

[0047] 多阶段行为预测模组接受所述发起方动态偏好，并结合响应方嵌入信息得到发起方主动申请响应方的概率P1；多阶段行为预测模组接受响应方动态偏好，并结合发起方嵌入信息得到响应方主动接受的概率P2；根据概率P1和概率P2计算发起方与响应方的匹配概率。响应方嵌入信息即为关联的用户ID的嵌入表达，发起方嵌入信息即为关联的用户ID的嵌入表达。

[0048] 在线招聘中，用户的动态偏好可以被主动行为反映，又可以被被动行为影响。本发明实施例的推荐系统能够适应目标用户（求职者、招聘者）匹配的多阶段性和双向性，并能合理预测用户随时间推移而有规律地演化的动态偏好，对目标用户双方独立偏好的同时考量需求，获取能够最大化匹配效率的有限推荐结果，实现了目标用户之间互惠匹配的高准度预测。使用本发明实施例的推荐系统可以为发起方或响应方生成推荐列表，进一步的，可在生成的推荐列表之后加入排序（粗排，精排）系统以进一步提高推荐效率。

[0049] 一种可选的实施方式，如图2所示，序列行为表达模组包括行为关联用户嵌入层、行为种类信息层和行为位置信息层，序列行为表达模组依次通过关联用户嵌入层、行为种类信息层和行为位置信息层将发起方行为序列和响应方行为序列中的每个行为的关联用户、行为种类和行为位置进行融合，具体流程可以为：首先对于目标用户的行为序列中的每个行为根据其关联用户的ID采集嵌入信息；其次，根据行为的种类赋予每个行为其行为种类信息；最后，对于行为按照时间排序后，给予每个行为其先后位置信息，赋予行为位置信息，从而得到由多个行为组成的发起方行为序列表达和响应方行为序列表达。通过本发明实施例的序列行为表达模组采用的行为序列信息加工方案，对用户的行为序列进行合理表达。

[0050] 一种可选的实施方式，关联用户嵌入层将行为序列中的每一个行为赋予与其关联用户的用户ID，用户ID为类别型特征，序列行为表达模组构建用户ID字典，并分配每一个所述用户ID一个独立的可学习的嵌入表达。

[0051] 行为种类信息层为行为序列中的每一个行为赋予一种行为种类信息，行为种类信息包括：主动申请、被动申请、主动接受和被动接受，序列行为表达模组构通过四个行为种类的投影矩阵（、、、）分别对应主动申请、主动接受、被动申请和被动接受四种行为。

[0052] 行为位置信息层将行为序列中的行为按时间顺序进行排序，得到行为先后位置信息，序列行为表达模组构建行为位置信息字典，并将得到的行为先后位置信息赋予到行为序列表达中。

[0053] 对于目标用户的行为序列信息，依次通过关联用户嵌入层、种类信息层与位置信息层，将每个行为的关联用户、行为种类（主动申请、被动申请、主动接受或被动接受）和行为位置信息进行融合。使得在线招聘中多种类多阶段行为得以有效表达，例如，发起方（initiator）的行为序列表达的具体表达方式例如采用如下方式：

[0054]

[0055] 其中，L为行为序列长度，E为行为的关联用户嵌入信息，表示发起方第L个历史行为，表示发起方第L个历史行为的关联用户嵌入信息，T为行为种类的投影矩阵，表示发起方第L个历史行为的行为种类，表示发起方第L个历史行为的行为种类的投影矩阵，P为行为位置信息，表示第L个历史行为的位置信息，表示发起方的行为序列表达。本发明实施例中共包含四个行为种类的投影矩阵为T，分别对应主动申请、被动申请、主动接受和被动接受四种行为；在为具体某一个行为赋予行为种类信息时，可根据这个行为的行为种类，选择对应的行为种类的投影矩阵T，并通过矩阵乘法实现种类信息输入。

[0056] 相应的，响应方（responder）的行为序列表达的具体表达方式例如采用如下方式：

[0057]

[0058] 其中，L为行为序列长度，表示响应方第L个历史行为的关联用户嵌入信息，表示响应方第L个历史行为的行为种类，表示响应方第L个历史行为的行为种类的投影矩阵，P为行为位置信息，表示第L个历史行为的位置信息，表示响应方的行为序列表达。

[0059] 一种可选的实施方式，发起方动态偏好模组和响应方动态偏好模组各自独立运行且结构相同，发起方动态偏好模组和响应方动态偏好模组可由基于注意力机制的两层Transformer神经网络组成。对于一个历史行为列表，按照行为发生时间进行排序，从左向右时间依次增加，即最右边的行为距离当前时刻越近，最左边的行为距离当前时刻越远。注意力机制本质上是一个双向信息流都存在的机制，即一个列表中任何一个元素，无论它在列表的什么位置，都可以吸收左边或者右边的其他元素输送过来注意力加权后的信息。如图2所示，本发明实施例的发起方动态偏好模组和响应方动态偏好模组均包括注意力层，注意力层包括主动‑被动感知注意力机制和多头机制；在该主动‑被动感知注意力机制中，包括向左信息流和向右信息流，从左至右表示行为序列中的行为发生的前后顺序。向左信息流即从右边的行为向左边的行为输送的左向信息，本实施例中可以理解为注意力加权后的信息。向右信息流即从左边的行为向右边的行为输送的右向信息。

[0060] 对于主动行为的注意力，主动‑被动感知注意力机制对主动行为的注意力矩阵进行编码，包括发起方或响应方主动申请或主动接受在注意力中，通过掩码，切断了所有向左信息流，可以使得右边的行为无法向左边的行为输送信息，即仅拥有对自己和自己之前的主动行为的items的注意力，对自身之后的主动行为的items的注意力恒定为0，如此可以防止未来的任何行为会对当前主动行为的建模产生影响，即屏蔽未来发生的主动行为或被动行为对过去发生的主动行为的影响，符合现实中未来事件无法影响过去时间的自然规律。

[0061] 对于被动行为的注意力，主动‑被动感知注意力机制对被动行为的注意力矩阵进行编码，包括发起方或响应方被动申请或被动接受在注意力中，通过掩码，完全切断向左信息流和向右信息流，使得某一个行为无法吸收任何列表中的其他行为输送的信息，以此屏蔽所有交叉注意力，仅保留自身对自身的注意力权重，等同于注意力失效，但是与其他主动申请或主动接受的items共享QKV线性变换矩阵和下游的前馈神经网络，即被动行为的向量仅会被前馈神经网络影响，而注意力矩阵仅能对自身向量进行整体权重的改变，避免任何目标用户的主动‑被动行为会影响被动行为建模，即屏蔽发起方或响应方的主动行为或被动行为对其任何被动行为的影响，符合发生在某一个用户身上的被动行为并非该用户自身可改变，理应不受到该用户的其他行为的影响的自然规律。

[0062] 发起方动态偏好模组和响应方动态偏好模组均采用多头机制，本发明实施例中，由于发起方动态偏好或响应方动态偏好会同时收到主动行为与被动行为这两个因素的影响，因此多头机制的注意力头数量为2时，发起方动态偏好模组或响应方动态偏好模组能够从“主动行为反映动态偏好”与“被动行为影响动态偏好”两个角度进行考虑，使得该注意力机制的预测效果更优。

[0063] 发起方动态偏好模组和响应方动态偏好模组在预测下一时刻的偏好时，可在两个目标用户的行为序列尾端加入一个统一的预测向量，并在模型输出处取该预测向量对应的向量作为下一时刻用户的动态偏好。预测向量即图2所示的注意力层中行为序列表达最右边的一个空的向量，这个空的向量参考了Bert的CLS通用字符，是一个启动预测使用的字符，对于所有样本，该字符都共享一个embedding。最后发起方动态偏好模组与响应方动态偏好模组会分别以向量的形式表达发起方动态偏好与响应方动态偏好，并同时输入到多阶段行为预测模组。

[0064] 一种可选的实施方式，如图2所示，多阶段行为预测模组包括多阶段预测层，提取到两个目标用户的动态偏好后，在该多阶段预测层中，两个目标用户的嵌入信息，并分别通过内积的形式获得两个相关度，即发起方动态偏好和响应方嵌入信息通过向量内积的形式表达相关性，响应方动态偏好和发起方嵌入信息通过向量内积的形式表达相关性。并且通过Sigmoid激活函数得到“发起方主动申请响应方”与“响应方在发起方主动申请响应方后，主动接受发起方”的概率，即通过Sigmoid激活函数得到所述发起方主动申请响应方的概率P1，通过Sigmoid激活函数得到所述响应方主动接受的概率P2。并根据概率P1和概率P2计算发起方与响应方的匹配概率。本发明实施例通过条件概率公式，以乘积的方式，有效利用了多行为阶段的数据标签，从而实现了互惠推荐中互惠性质的表达。

[0065] 此外，基于条件概率相关的理解，将概率P1和概率P2通过条件概率公式进行乘法运算，并输入到各行为对应的损失函数种进行计算，得到发起方与响应方的匹配概率，以此提供能够诠释发起方与响应方匹配概率的主要任务输出。

[0066] 本发明实施例所述的一种基于用户行为序列的在线招聘互惠推荐方法，该推荐方法包括：

[0067] 行为序列表达生成，包括分别对发起方行为序列和响应方行为序列进行处理，生成发起方行为序列表达和响应方行为序列表达，其中，发起方行为序列和响应方行为序列中的行为均包括主动行为或被动行为。

[0068] 动态偏好建模，包括发起方动态偏好建模和响应方动态偏好建模，发起方动态偏好建模包括采用注意力机制对发起方行为序列表达进行编码与聚合，获得发起方动态偏好；响应方动态偏好建模包括采用注意力机制对响应方行为序列表达进行编码与聚合，获得响应方动态偏好。

[0069] 多阶段行为预测，包括根据发起方动态偏好和响应方嵌入信息得到发起方主动申请响应方的概率P1，根据响应方动态偏好和发起方嵌入信息得到响应方主动接受的概率P2；并根据所述概率P1和所述概率P2计算发起方与响应方的匹配概率。

[0070] 一种可选的实施方式，分别对发起方行为序列和响应方行为序列进行处理包括：对所述发起方行为序列和所述响应方行为序列中的每一个行为分别赋予关联用户信息、行为种类信息和行为位置信息。其中，关联用户信息为行为关联的用户ID，行为序列中的每一个行为都由关联用户的用户ID组成，所述用户ID为类别型特征，并基于用户ID字典分配每一个所述用户ID一个独立的可学习的嵌入表达；行为种类信息包括主动申请、被动申请、主动接受和被动接受，并通过四个行为种类的投影矩阵分别对应主动申请、被动申请、主动接受和被动接受四种行为。行为位置信息为将行为序列中的行为按时间顺序进行排序，得到行为先后位置信息，并基于行为位置信息字典将得到的行为先后位置信息赋予到行为序列表达中。

[0071] 对于目标用户的行为序列信息，依次通过关联用户嵌入层、种类信息层与位置信息层，将每个行为的关联用户、行为种类（主动申请、被动申请、主动接受或被动接受）和行为位置信息进行融合。使得在线招聘中多种类多阶段行为得以有效表达，例如，发起方（initiator）的行为序列表达的具体表达方式例如采用如下方式：

[0072]

[0073] 其中， L为行为序列长度，E为行为的关联用户嵌入信息，表示发起方第L个历史行为，表示发起方第L个历史行为的关联用户嵌入信息，T为行为种类的投影矩阵，表示发起方第L个历史行为的行为种类，表示发起方第L个历史行为的行为种类的投影矩阵，P为行为位置信息，表示第L个历史行为的位置信息，表示发起方的行为序列表达。。本发明实施例中共包含四个行为种类的投影矩阵为T，分别对应主动申请、被动申请、主动接受和被动接受四种行为；在为具体某一个行为赋予行为种类信息时，可根据这个行为的行为种类，选择对应的行为种类的投影矩阵T，并通过矩阵乘法实现种类信息输入。

[0074] 相应的，响应方（responder）的行为序列表达的具体表达方式例如采用如下方式：

[0075]

[0076] 其中，L为行为序列长度，表示响应方第L个历史行为的关联用户嵌入信息，表示响应方第L个历史行为的行为种类，表示响应方第L个历史行为的行为种类的投影矩阵，P为行为位置信息，表示第L个历史行为的位置信息，表示响应方的行为序列表达。

[0077] 一种可选的实施方式，发起方动态偏好建模和响应方动态偏好建模均包括主动‑被动感知注意力机制和多头机制；在该主动‑被动感知注意力机制中，包括向左信息流和向右信息流，从左至右表示行为序列的前后顺序。

[0078] 对于主动行为的注意力，主动‑被动感知注意力机制对主动行为的注意力矩阵进行编码，切断了所有向左信息流，如此可以防止未来的任何行为会对当前主动行为的建模产生影响，以屏蔽未来发生的主动行为或被动行为对过去发生的主动行为的影响。对于被动行为的注意力，主动‑被动感知注意力机制对被动行为的注意力矩阵进行编码，完全切断向左信息流和向右信息流，屏蔽了所有交叉注意力，仅保留自身对自身的注意力权重，等同于被动行为的向量仅会被前馈神经网络影响，而注意力矩阵仅能对自身向量进行整体权重的改变，避免任何目标用户的主动‑被动行为会影响被动行为建模，以屏蔽发起方或响应方的主动行为或被动行为对其任何被动行为的影响。

[0079] 由于发起方动态偏好或响应方动态偏好会同时收到主动行为与被动行为这两个因素的影响，多头机制聚合主动行为的注意力和被动行为的注意力，动态偏好建模时能从“主动行为反映动态偏好”与“被动行为影响动态偏好”两个角度进行考虑。动态偏好建模在预测下一时刻的偏好时，在两个目标用户的行为序列尾端加入一个统一的预测向量，并在模型输出处取该预测向量对应的向量作为下一时刻用户的动态偏好。最后模型分别以向量的形式表达发起方动态偏好与响应方动态偏好。

[0080] 一种可选的实施方式，在多阶段行为预测中，两个目标用户的嵌入信息，并分别通过内积的形式获得两个相关度，即发起方动态偏好和响应方嵌入信息通过向量内积的形式表达相关性，响应方动态偏好和发起方嵌入信息通过向量内积的形式表达相关性。并且通过Sigmoid激活函数得到“发起方主动申请响应方”与“响应方在发起方主动申请响应方后，主动接受发起方”的概率。具体为：发起方动态偏好和响应方嵌入信息通过向量内积的形式表达相关性，并通过Sigmoid激活函数得到所述发起方主动申请响应方的概率P1。响应方动态偏好和所述发起方嵌入信息通过向量内积的形式表达相关性，并通过Sigmoid激活函数得到所述响应方主动接受的概率P2。本发明实施例通过条件概率公式，以乘积的方式，有效利用了多行为阶段的数据标签，从而实现了互惠推荐中互惠性质的表达。

[0081] 此外，基于条件概率相关的理解，将概率P1和概率P2通过条件概率公式进行乘法运算，并输入到各行为对应的损失函数种进行计算，得到发起方与响应方的匹配概率，以此提供能够诠释发起方与响应方匹配概率的主要任务输出。通过两个损失函数进行分别计算后，得到的两个值，它们分别表达了模型预测的发起方和响应方是否存在“发起方对响应方发送主动申请”和“响应方主动接受发起方的申请”，与实际样本中的ground truth的吻合程度。

[0082] 即，本领域技术人员可以理解，实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序存储在一个存储介质中，包括若干指令用以使得一个设备（可以是单片机，芯片等）或处理器（processor）执行本申请各实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（ROM，Read‑Only Memory）、随机存取存储器（RAM，Random Access Memory）、磁碟或者光盘等各种可以存储程序代码的介质。

[0083] 在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

[0084] 此外，本领域普通技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

[0085] 本领域技术人员应理解，尽管已经参考示例性实施例描述了本发明，但是在不脱离本发明的范围的情况下，可进行各种改变并可用等同物替换其元件。另外，在不脱离本发明的实质范围的情况下，可进行许多修改以使特定情况或材料适应本发明的教导。因此，本发明不限于所公开的特定实施例，而是本发明将包括落入所附权利要求范围内的所有实施例。

一种基于用户行为序列的在线招聘互惠推荐系统和方法转让专利

申请号 : CN202311478255.4

文献号 : CN117216410B

文献日 : 2024-03-12

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 胡骁 , 程远 , 朱琛 , 祝恒书 , 赵鹏

申请人 : 北京华品博睿网络技术有限公司

摘要 :

权利要求 :

说明书 :