基于混合3D卷积融合评级与评论的景点推荐方法及装置转让专利

申请号 : CN202310186607.2

文献号 : CN115905717B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 金佳丽张红宇

申请人 : 中南大学

摘要 :

本发明提供一种基于混合3D卷积融合评级与评论的景点推荐方法及装置,方法包括:获得景点的在线评论信息并构建评级交互矩阵;分解该矩阵得到第一用户偏好矩阵及第一景点特征矩阵;对评论信息进行提取得到特征词表;基于特征词表分别计算对应用户偏好的情感强度矩阵、关注度矩阵,以及对应景点特征的情感强度矩阵、关注度矩阵;基于上述矩阵计算得到反映用户偏好的第二用户偏好矩阵及第二景点特征矩阵;将上述偏好矩阵及特征矩阵分别处理得到用户偏好、景点特征交互编码矩阵;处理两个交互编码矩阵得到高阶用户偏好、景点特征矩阵;计算两个高阶矩阵的余弦相似度,基于余弦相似度为用户推荐景点,本发明可以快速高效且准确的进行景点推荐。

权利要求 :

1.一种基于混合3D卷积融合评级与评论的景点推荐方法,其特征在于,包括:获得用户对景点的评级信息和所述景点的在线评论信息,所述在线评论信息包括第一类信息及第二类信息,所述第一类信息为用户在平台上提交的关于景点的在线评论信息,所述第二类信息为景点基于所述平台获得的在线评论信息;

基于所述评级信息构建用户‑景点的评级交互矩阵;

对所述用户‑景点的评级交互矩阵至少进行填充处理,并输入至深度矩阵分解模型中,以得到用于反映所述评级信息的第一用户偏好矩阵以及第一景点特征矩阵;

对所述在线评论信息进行关于用户偏好及景点特征的特征提取操作,得到特征词表,所述特征词表记录有所述在线评论信息中的多个不同类别的特征词、短句的情感强度值;

至少基于所述特征词表和知网情感词典分别计算对应用户偏好的第一情感强度矩阵、第一关注度矩阵,以及对应景点特征的第二情感强度矩阵、第二关注度矩阵;

将所述第一情感强度矩阵与第一关注度矩阵相乘得到第二用户偏好矩阵;

将所述第二情感强度矩阵与第二关注度矩阵相乘得到第二景点特征矩阵;

将所述第一用户偏好矩阵与第二用户偏好矩阵、第一景点特征矩阵与第二景点特征矩阵进行横向拼接、注意力池化、外积、特征堆叠处理以得到用户偏好交互编码矩阵和景点特征交互编码矩阵;

将所述用户偏好交互编码矩阵和景点特征交互编码矩阵输入至3D卷积神经网络中进行处理,得到高阶用户偏好矩阵和高阶景点特征矩阵;

计算所述高阶用户偏好矩阵和高阶景点特征矩阵的余弦相似度,所述余弦相似度用于表征景点特征与用户偏好的匹配程度;

基于所述余弦相似度为用户进行景点推荐;

其中,所述对所述用户‑景点的评级交互矩阵至少进行填充处理,包括:遍历全部用户是否对每个所述景点均进行评级,若是,则对应保留原评级,若否,则对应以0填充,以得到所述用户‑景点的评级交互矩阵:,

其中, 表示任意所述用户 对任意所述景点 的评级, 表示

评级不存在, 的取值为 ;

所述至少基于所述特征词表和知网情感词典分别计算对应用户偏好的第一情感强度矩阵、第一关注度矩阵,以及对应景点特征的第二情感强度矩阵、第二关注度矩阵,包括:基于所述特征词表记录的多个不同类别的所述特征词、以及结合知网情感词典获得的短句的情感强度值计算确定每条所述在线评论信息中包含同一类特征词的所有短句的情感强度值之和,并将所述情感强度值之和定义为该类特征词的情感强度值;

基于每条所述在线评论信息的类别、每条所述在线评论信息中各类特征词出现的次数占该条在线评论信息中所有特征词的数量的比例分别确定对应用户的特征关注度及对应景点的特征关注度;

基于各类特征词的情感强度值、对应用户的特征关注度及对应景点的特征关注度分别计算确定对应用户偏好的第一情感强度矩阵、第一关注度矩阵,以及对应景点特征的第二情感强度矩阵、第二关注度矩阵。

2.根据权利要求1所述的景点推荐方法,其特征在于,将所述用户‑景点的评级交互矩阵输入至深度矩阵分解模型中,以得到用于反映所述评级信息的第一用户偏好矩阵以及第一景点特征矩阵,包括:将所述用户‑景点的评级交互矩阵拆解形成具有矩阵转置关系的用户评级矩阵和景点评级矩阵,所述用户评级矩阵包含任意所述用户对所有所述景点的评级集合,所述景点评级矩阵包含任意所述景点对所有所述用户的评级集合;

将所述用户评级矩阵与景点评级矩阵分别输入至深度矩阵分解模型中的两个双层神经网络中,以得到所述第一用户偏好矩阵以及第一景点特征矩阵。

3.根据权利要求1所述的景点推荐方法,其特征在于,所述对所述在线评论信息进行关于用户偏好及景点特征的特征提取操作,得到特征词表,包括:对所述在线评论信息进行过滤,得到满足预设要求的目标在线评论集合,所述过滤的方式包括字数过滤、去停用词;

基于所述目标在线评论集合进行特征词的提取,并计算所述特征词的词频;

基于词频满足阈值要求的所述特征词形成初始特征词表;

计算所述初始特征词表中的特征词与基于所述目标在线评论集合提取出的词频未满足所述阈值要求的特征词间的语义相似度;

基于计算确定的所述语义相似度确定出满足相似度阈值的特征词,并将该特征词补充至所述初始特征词表中,形成所述特征词表。

4.根据权利要求1所述的景点推荐方法,其特征在于,还包括:将所述在线评论信息根据指定分隔符划分为多个短句;

确定每个所述短句中的情感词及其在所述短句中的位置,所述情感词包括正面情感词与负面情感词,不同的所述情感词配置有不同的情感值;

基于所述情感词在短句中的位置确定每个所述短句中位于所述情感词前的程度词,不同的所述程度词配置有不同的权值;

基于所述情感词在短句中的位置确定每个所述短句中位于所述情感词前的否定词及其数量,不同数量的所述否定词配置有不同的权值;

确定每个所述短句的结尾处是否具有目标符号,不同的所述目标符号配置有不同的权值;

确定每个所述短句中是否具有目标转折词,所述目标转折词配置有对应的权值;

基于每个所述短句中的所述情感词的情感值、程度词的权值、不同数量的否定词的权值、不同目标符号的权值以及目标转折词的权值分别计算确定对应所述短句的正面情感值及负面情感值;

计算所述正面情感值及负面情感值的绝对值差值;

基于所述差值确定绝对值大的正面情感值或负面情感值为对应所述短句的情感强度值。

5.根据权利要求1所述的景点推荐方法,其特征在于,所述将所述第一用户偏好矩阵与第二用户偏好矩阵、第一景点特征矩阵与第二景点特征矩阵至少进行横向拼接、注意力池化、外积、特征堆叠处理以得到用户偏好交互编码矩阵和景点特征交互编码矩阵,包括:将所述第一用户偏好矩阵与第二用户偏好矩阵、第一景点特征矩阵与第二景点特征矩阵分别进行横向维度的矩阵拼接,以得到用户偏好拼接矩阵及景点特征拼接矩阵;

将所述用户偏好拼接矩阵与景点特征拼接矩阵通过嵌入层投影到一个 维密集向量中,分别得到对应的嵌入表示;

将所述用户偏好拼接矩阵与景点特征拼接矩阵分别输入相同结构的注意力机制中并进行池化,以分别得到对应的池化后表示;

基于所述用户偏好拼接矩阵与景点特征拼接矩阵的池化后表示进行外积和特征堆叠得到所述用户偏好交互编码矩阵和景点特征交互编码矩阵。

6.根据权利要求1所述的景点推荐方法,其特征在于,所述计算所述高阶用户偏好矩阵和高阶景点特征矩阵的余弦相似度,包括:基于下述公式计算所述高阶用户偏好矩阵和高阶景点特征矩阵的余弦相似度:,

其中, 表示第 位用户在所述高阶用户偏好矩阵中的表示, 表示第 个景点在所述高阶景点特征矩阵中的表示, 表示矩阵的模。

7.一种基于混合3D卷积融合评级与评论的景点推荐装置,其特征在于,包括:获得模块,用于获得用户对景点的评级信息和所述景点的在线评论信息,所述在线评论信息包括第一类信息及第二类信息,所述第一类信息为用户在平台上提交的关于景点的在线评论信息,所述第二类信息为景点基于所述平台获得的在线评论信息;

构建模块,用于根据所述评级信息构建用户‑景点的评级交互矩阵;

第一处理模块,用于对所述用户‑景点的评级交互矩阵至少进行填充处理,并输入至深度矩阵分解模型中,以得到用于反映所述评级信息的第一用户偏好矩阵以及第一景点特征矩阵;

提取模块,用于对所述在线评论信息进行关于用户偏好及景点特征的特征提取操作,得到特征词表,所述特征词表记录有所述在线评论信息中的多个不同类别的特征词、短句的情感强度值;

第一计算模块,用于至少根据所述特征词表和知网情感词典分别计算对应用户偏好的第一情感强度矩阵、第一关注度矩阵,以及对应景点特征的第二情感强度矩阵、第二关注度矩阵;

第二计算模块,用于将所述第一情感强度矩阵与第一关注度矩阵相乘得到第二用户偏好矩阵,以及将所述第二情感强度矩阵与第二关注度矩阵相乘得到第二景点特征矩阵;

第三计算模块,用于将所述第一用户偏好矩阵与第二用户偏好矩阵、第一景点特征矩阵与第二景点特征矩阵至少进行横向拼接、注意力池化、外积、特征堆叠处理以得到用户偏好交互编码矩阵和景点特征交互编码矩阵;

第二处理模块,用于将所述用户偏好交互编码矩阵和景点特征交互编码矩阵输入至3D卷积神经网络中进行处理,得到高阶用户偏好矩阵和高阶景点特征矩阵;

第四计算模块,用于计算所述高阶用户偏好矩阵和高阶景点特征矩阵的余弦相似度,所述余弦相似度用于表征景点特征与用户偏好的匹配程度;

推荐模块,用于根据所述余弦相似度为用户进行景点推荐;

其中,所述对所述用户‑景点的评级交互矩阵至少进行填充处理,包括:遍历全部用户是否对每个所述景点均进行评级,若是,则对应保留原评级,若否,则对应以0填充,以得到所述用户‑景点的评级交互矩阵:,

其中, 表示任意所述用户 对任意所述景点 的评级, 表示

评级不存在, 的取值为 ;

所述至少基于所述特征词表分别计算对应用户偏好的第一情感强度矩阵、第一关注度矩阵,以及对应景点特征的第二情感强度矩阵、第二关注度矩阵,包括:基于所述特征词表记录的多个不同类别的所述特征词、以及结合知网情感词典获得的短句的情感强度值计算确定每条所述在线评论信息中包含同一类特征词的所有短句的情感强度值之和,并将所述情感强度值之和定义为该类特征词的情感强度值;

基于每条所述在线评论信息的类别、每条所述在线评论信息中各类特征词出现的次数占该条在线评论信息中所有特征词的数量的比例分别确定对应用户的特征关注度及对应景点的特征关注度;

基于各类特征词的情感强度值、对应用户的特征关注度及对应景点的特征关注度分别计算确定对应用户偏好的第一情感强度矩阵、第一关注度矩阵,以及对应景点特征的第二情感强度矩阵、第二关注度矩阵。

说明书 :

基于混合3D卷积融合评级与评论的景点推荐方法及装置

技术领域

[0001] 本发明实施例涉及计算机技术领域,特别涉及一种基于混合3D卷积融合评级与评论的景点推荐方法及装置。

背景技术

[0002] 近年来,在线旅游平台、游客旅游消费、用户习惯内容化正处于激烈发展态势。计划旅行的游客常利用在线旅游网站中的用户生成信息,如评级、在线评论、图片等作为其决策的重要参考。然而,对游客来说,筛选海量信息是一项艰巨的挑战。因此,学者们提出旅游景点推荐方法来解决“信息过载”问题。借助于机器学习、深度学习、数据挖掘等技术挖掘用户和景点特征,景点推荐方法的推荐质量不断提高。
[0003] 景点推荐的目的是解决游客的“信息过载”问题,为其提供符合其偏好的景点推荐。基于评级的景点推荐和基于在线评论的景点推荐是推荐算法中应用较为广泛的两种途径。但基于评级的景点推荐方法往往受到数据稀疏性的问题困扰,基于在线评论的景点推荐方法也常会忽视评级中也包含大量的潜在信息的问题。
[0004] 为解决上述问题,融合评级与在线评论信息是一种值得研究的方向。近年来融合评级和在线评论的推荐方法大多利用深度学习技术直接提取用户和项目特征,而忽视了在线评论中的情感因素对推荐的作用。并且在进行特征融合时,使用线性内积计算的方式组合编码向量,无法充分捕捉高阶非线性特征。以上问题都对景点推荐方法的发展产生了制约。

发明内容

[0005] 本发明提供了一种用于为用户提供融合评级和在线评论的,快速高效且准确地进行景点推荐的基于混合3D卷积融合评级与评论的景点推荐方法及装置。
[0006] 为了解决上述技术问题,本发明实施例提供了一种基于混合3D卷积融合评级与评论的景点推荐方法,包括:
[0007] 获得用户对景点的评级信息和所述景点的在线评论信息;
[0008] 基于所述评级信息构建用户‑景点的评级交互矩阵;
[0009] 对所述用户‑景点的评级交互矩阵至少进行填充处理,并输入至深度矩阵分解模型中,以得到用于反映所述评级信息的第一用户偏好矩阵以及第一景点特征矩阵;
[0010] 对所述在线评论信息进行关于用户偏好及景点特征的特征提取操作,得到特征词表;
[0011] 至少基于所述特征词表分别计算对应用户偏好的第一情感强度矩阵、第一关注度矩阵,以及对应景点特征的第二情感强度矩阵、第二关注度矩阵;
[0012] 基于所述第一情感强度矩阵与第一关注度矩阵、所述第二情感强度矩阵与第二关注度矩阵分别计算得到反映用户偏好的第二用户偏好矩阵及第二景点特征矩阵;
[0013] 将所述第一用户偏好矩阵与第二用户偏好矩阵、第一景点特征矩阵与第二景点特征矩阵至少进行横向拼接、注意力池化、外积、特征堆叠处理以得到用户偏好交互编码矩阵和景点特征交互编码矩阵;
[0014] 将所述用户偏好交互编码矩阵和景点特征交互编码矩阵输入至3D卷积神经网络中进行处理,得到高阶用户偏好矩阵和高阶景点特征矩阵;
[0015] 计算所述高阶用户偏好矩阵和高阶景点特征矩阵的余弦相似度,所述余弦相似度用于表征景点特征与用户偏好的匹配程度;
[0016] 基于所述余弦相似度为用户进行景点推荐。
[0017] 作为一可选实施例,所述对所述用户‑景点的评级交互矩阵至少进行填充处理,包括:
[0018] 遍历全部用户是否对每个所述景点均进行评级,若是,则对应保留原评级,若否,则对应以0填充,以得到所述用户‑景点的评级交互矩阵:
[0019]
[0020] 其中, 表示任意所述用户 对任意所述景点 的评级, 的取值为。
[0021] 作为一可选实施例,将所述用户‑景点的评级交互矩阵输入至深度矩阵分解模型中,以得到用于反映所述评级信息的第一用户偏好矩阵以及第一景点特征矩阵,包括:
[0022] 将所述用户‑景点的评级交互矩阵拆解形成具有矩阵转置关系的用户评级矩阵和景点评级矩阵,所述用户评级矩阵包含任意所述用户对所有所述景点的评级集合,所述景点评级矩阵包含任意所述景点对所有所述用户的评级集合;
[0023] 将所述用户评级矩阵与景点评级矩阵分别输入至深度矩阵分解模型中的两个双层神经网络中,以得到所述第一用户偏好矩阵以及第一景点特征矩阵。
[0024] 作为一可选实施例,所述对所述在线评论信息进行关于用户偏好及景点特征的特征提取操作,得到特征词表,包括:
[0025] 对所述在线评论信息进行过滤,得到满足预设要求的目标在线评论集合,所述过滤的方式包括字数过滤、去停用词;
[0026] 基于所述目标在线评论集合进行特征词的提取,并计算所述特征词的词频;
[0027] 基于词频满足阈值要求的所述特征词形成初始特征词表;
[0028] 计算所述初始特征词表中的特征词与基于所述目标在线评论集合提取出的词频未满足所述阈值要求的特征词间的语义相似度;
[0029] 基于计算确定的所述语义相似度确定出满足相似度阈值的特征词,并将该特征词补充至所述初始特征词表中,形成所述特征词表。
[0030] 作为一可选实施例,还包括:
[0031] 将所述在线评论信息根据指定分隔符划分为多个短句;
[0032] 确定每个所述短句中的情感词及其在所述短句中的位置,所述情感词包括正面情感词与负面情感词,不同的所述情感词配置有不同的情感值;
[0033] 基于所述情感词在短句中的位置确定每个所述短句中位于所述情感词前的程度词,不同的所述程度词配置有不同的权值;
[0034] 基于所述情感词在短句中的位置确定每个所述短句中位于所述情感词前的否定词及其数量,不同数量的所述否定词配置有不同的权值;
[0035] 确定每个所述短句的结尾处是否具有目标符号,不同的所述目标符号配置有不同的权值;
[0036] 确定每个所述短句中是否具有目标转折词,所述目标转折词配置有对应的权值;
[0037] 基于每个所述短句中的所述情感词的情感值、程度词的权值、不同数量的否定词的权值、不同目标符号的权值以及目标转折词的权值分别计算确定对应所述短句的正面情感值及负面情感值;
[0038] 计算所述正面情感值及负面情感值的绝对值差值;
[0039] 基于所述差值确定绝对值较大的正面情感值或负面情感值为对应所述短句的情感强度值。
[0040] 作为一可选实施例,所述在线评论信息包括第一类信息及第二类信息,所述第一类信息为用户在平台上提交的关于景点的在线评论信息,所述第二类信息为景点基于所述平台获得的在线评论信息;
[0041] 所述至少基于所述特征词表分别计算对应用户偏好的第一情感强度矩阵、第一关注度矩阵,以及对应景点特征的第二情感强度矩阵、第二关注度矩阵,包括:
[0042] 基于所述特征词表记录的多个不同类别的所述特征词、短句的情感强度值计算确定每条所述在线评论信息中包含同一类特征词的所有短句的情感强度值之和,并将所述情感强度值之和定义为该类特征词的情感强度值;
[0043] 基于每条所述在线评论信息的类别、每条所述在线评论信息中各类特征词出现的次数占该条在线评论信息中所有特征词的数量的比例分别确定对应用户的特征关注度及对应景点的特征关注度;
[0044] 基于各类特征词的情感强度值、对应用户的特征关注度及对应景点的特征关注度分别计算确定对应用户偏好的第一情感强度矩阵、第一关注度矩阵,以及对应景点特征的第二情感强度矩阵、第二关注度矩阵。
[0045] 作为一可选实施例,所述基于所述第一情感强度矩阵与第一关注度矩阵、所述第二情感强度矩阵与第二关注度矩阵分别计算得到反映用户偏好的第二用户偏好矩阵及第二景点特征矩阵,包括:
[0046] 将所述第一情感强度矩阵与第一关注度矩阵相乘得到所述第二用户偏好矩阵;
[0047] 将所述第二情感强度矩阵与第二关注度矩阵相乘得到所述第二景点特征矩阵。
[0048] 作为一可选实施例,所述将所述第一用户偏好矩阵与第二用户偏好矩阵、第一景点特征矩阵与第二景点特征矩阵至少进行横向拼接、注意力池化、外积、特征堆叠处理以得到用户偏好交互编码矩阵和景点特征交互编码矩阵,包括:
[0049] 将所述第一用户偏好矩阵与第二用户偏好矩阵、第一景点特征矩阵与第二景点特征矩阵分别进行横向维度的矩阵拼接,以得到用户偏好拼接矩阵及景点特征拼接矩阵;
[0050] 将所述用户偏好拼接矩阵与景点特征拼接矩阵通过嵌入层投影到一个 维密集向量中,分别得到对应的嵌入表示;
[0051] 将所述用户偏好拼接矩阵与景点特征拼接矩阵分别输入相同结构的注意力机制中并进行池化,以分别得到对应的池化后的表示;
[0052] 基于所述用户偏好拼接矩阵与景点特征拼接矩阵的池化后表示进行外积和特征堆叠得到所述用户偏好交互编码矩阵和景点特征交互编码矩阵。
[0053] 作为一可选实施例,所述计算所述高阶用户偏好矩阵和高阶景点特征矩阵的余弦相似度,包括:
[0054] 基于下述公式计算所述高阶用户偏好矩阵和高阶景点特征矩阵的余弦相似度:
[0055]
[0056] 其中, 表示第 位用户在所述高阶用户偏好矩阵中的表示, 表示第个景点在所述高阶景点特征矩阵中的表示, 表示矩阵的模。
[0057] 本发明另一实施例同时提供一种景点推荐装置,包括:
[0058] 获得模块,用于获得用户对景点的评级信息和所述景点的在线评论信息;
[0059] 构建模块,用于根据所述评级信息构建用户‑景点的评级交互矩阵;
[0060] 第一处理模块,用于对所述用户‑景点的评级交互矩阵进行填充处理,并输入至深度矩阵分解模型中,以得到用于反映所述评级信息的第一用户偏好矩阵以及第一景点特征矩阵;
[0061] 提取模块,用于对所述在线评论信息进行关于用户偏好及景点特征的特征提取操作,得到特征词表;
[0062] 第一计算模块,用于至少根据所述特征词表分别计算对应用户偏好的第一情感强度矩阵、第一关注度矩阵,以及对应景点特征的第二情感强度矩阵、第二关注度矩阵;
[0063] 第二计算模块,用于根据所述第一情感强度矩阵与第一关注度矩阵、所述第二情感强度矩阵与第二关注度矩阵分别计算得到反映用户偏好的第二用户偏好矩阵及第二景点特征矩阵;
[0064] 第三计算模块,用于将所述第一用户偏好矩阵与第二用户偏好矩阵、第一景点特征矩阵与第二景点特征矩阵至少进行横向拼接、注意力池化、外积、特征堆叠处理以得到用户偏好交互编码矩阵和景点特征交互编码矩阵;
[0065] 第二处理模块,用于将所述用户偏好交互编码矩阵和景点特征交互编码矩阵输入至3D卷积神经网络中进行处理,得到高阶用户偏好矩阵和高阶景点特征矩阵;
[0066] 第四计算模块,用于计算所述高阶用户偏好矩阵和高阶景点特征矩阵的余弦相似度,所述余弦相似度用于表征景点特征与用户偏好的匹配程度;
[0067] 推荐模块,用于根据所述余弦相似度为用户进行景点推荐。
[0068] 基于上述实施例的公开可以获知,本发明实施例具备如下的有益效果包括在进行景点推荐时融合用户偏好与景点特征,通过匹配用户偏好与景点特征实现大幅提升景点推荐的效率及准确度,增强预测信息的参考价值。
[0069] 本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
[0070] 下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

附图说明

[0071] 图1为本发明实施例中的基于混合3D卷积融合评级与评论的景点推荐方法的流程图。
[0072] 图2为本发明另一实施例中的基于混合3D卷积融合评级与评论的景点推荐方法的流程图。
[0073] 图3为本发明实施例中的基于混合3D卷积融合评级与评论的景点推荐方法的应用框架图。
[0074] 图4为本发明实施例中的景点推荐装置的结构框图。

具体实施方式

[0075] 下面,结合附图对本发明的具体实施例进行详细的描述,但不作为本发明的限定。
[0076] 应理解的是,可以对此处公开的实施例做出各种修改。因此,下述说明书不应该视为限制,而仅是作为实施例的范例。本领域的技术人员将想到在本公开的范围和精神内的其他修改。
[0077] 包含在说明书中并构成说明书的一部分的附图示出了本公开的实施例,并且与上面给出的对本公开的大致描述以及下面给出的对实施例的详细描述一起用于解释本公开的原理。
[0078] 通过下面参照附图对给定为非限制性实例的实施例的优选形式的描述,本发明的这些和其它特性将会变得显而易见。
[0079] 还应当理解,尽管已经参照一些具体实例对本发明进行了描述,但本领域技术人员能够确定地实现本发明的很多其它等效形式,它们具有如上文所述的特征并因此都位于借此所限定的保护范围内。
[0080] 当结合附图时,鉴于以下详细说明,本公开的上述和其他方面、特征和优势将变得更为显而易见。
[0081] 此后参照附图描述本公开的具体实施例;然而,应当理解,所公开的实施例仅仅是本公开的实例,其可采用多种方式实施。熟知和/或重复的功能和结构并未详细描述以避免不必要或多余的细节使得本公开模糊不清。因此,本文所公开的具体的结构性和功能性细节并非意在限定,而是仅仅作为权利要求的基础和代表性基础用于教导本领域技术人员以实质上任意合适的详细结构多样地使用本公开。
[0082] 本说明书可使用词组“在一种实施例中”、“在另一个实施例中”、“在又一实施例中”或“在其他实施例中”,其均可指代根据本公开的相同或不同实施例中的一个或多个。
[0083] 下面,结合附图详细的说明本发明实施例。
[0084] 如图1所示,本发明实施例提供一种基于混合3D卷积融合评级与评论的景点推荐方法,包括:
[0085] S101:获得用户对景点的评级信息和景点的在线评论信息;
[0086] S102:基于评级信息构建用户‑景点的评级交互矩阵;
[0087] S103:对用户‑景点的评级交互矩阵至少进行填充处理,并输入至深度矩阵分解模型中,以得到用于反映评级信息的第一用户偏好矩阵以及第一景点特征矩阵;
[0088] S104:对在线评论信息进行关于用户偏好及景点特征的特征提取操作,得到特征词表;
[0089] S105:至少基于特征词表分别计算对应用户偏好的第一情感强度矩阵、第一关注度矩阵,以及对应景点特征的第二情感强度矩阵、第二关注度矩阵;
[0090] S106:基于第一情感强度矩阵与第一关注度矩阵、第二情感强度矩阵与第二关注度矩阵分别计算得到反映用户偏好的第二用户偏好矩阵及第二景点特征矩阵;
[0091] S107:将第一用户偏好矩阵与第二用户偏好矩阵、第一景点特征矩阵与第二景点特征矩阵至少进行横向拼接、注意力池化、外积、特征堆叠处理以得到用户偏好交互编码矩阵和景点特征交互编码矩阵;
[0092] S108:将用户偏好交互编码矩阵和景点特征交互编码矩阵输入至3D卷积神经网络中进行处理,得到高阶用户偏好矩阵和高阶景点特征矩阵;
[0093] S109:计算高阶用户偏好矩阵和高阶景点特征矩阵的余弦相似度,余弦相似度用于表征景点特征与用户偏好的匹配程度;
[0094] S110:基于余弦相似度为用户进行景点推荐。
[0095] 上述实施例中的基于混合3D卷积融合评级与评论的景点推荐方法,具体是利用注意力机制和3D卷积神经网络的优点,充分挖掘评级与在线评论特征的交互信息,有效地对多种信息进行融合处理,进而解决评级数据稀疏性问题。另外在提取在线评论特征时考虑了特征对应的情感强度,使其能够更准确的表达用户偏好和景点特征,为后续进行景点推荐奠定了基础,也为融合信息提供高质量信息来源。通过大量实际验证,相较于传统和常用的特征融合方式,本实施例中的方法能够充分融合用户对景点的评级与在线评论中用户的情感,充分挖掘两者之间的交互信息,进而使得推荐方法具有更佳的推荐效果,推荐的更为准确,更符合用户需求。当然,本实施例的方法也适用于其他多种信息的融合,以实现充分挖掘不同信息源的特点,获得高质量的高阶非线性特征表示。在实际应用中,旅游推荐服务提供商可以通过本实施例中的方法而综合分析用户对景点的评级与在线评论的影响,基于分析结果决定是否向用户推荐某类景点,如此大大提高了推荐有效性,为旅游推荐服务商获取更高的用户黏性和用户忠诚度。
[0096] 具体地,在对用户‑景点的评级交互矩阵至少进行填充处理时,包括:
[0097] S111:遍历全部用户是否对每个景点均进行评级,若是,则对应保留原评级,若否,则对应以0填充,以得到用户‑景点的评级交互矩阵:
[0098]
[0099] 其中, 表示任意所述用户 对任意所述景点 的评级, 的取值为。
[0100] 将用户‑景点的评级交互矩阵输入至深度矩阵分解模型中,以得到用于反映评级信息的第一用户偏好矩阵以及第一景点特征矩阵,包括:
[0101] S112:将用户‑景点的评级交互矩阵拆解形成具有矩阵转置关系的用户评级矩阵和景点评级矩阵,用户评级矩阵包含任意用户对所有景点的评级集合,景点评级矩阵包含任意景点对所有用户的评级集合;
[0102] S113:将用户评级矩阵与景点评级矩阵分别输入至深度矩阵分解模型中的两个双层神经网络中,以得到第一用户偏好矩阵以及第一景点特征矩阵。
[0103] 例如,用 表示用户评级矩阵,指任意用户 对所有景点的评级集合。用表示景点评级矩阵,指任意景点 对所有用户的评级集合,用户评级矩阵 和景点评级矩阵 为矩阵转置关系。将用户评级矩阵 和景点评级矩阵 分别输入至深度矩阵分解模型中的两个双层神经网络中,将用户和景点映射到潜在空间中的隐因子表示为和 , 和 即为第一用户偏好矩阵和第一景点特征矩阵,对应的神经网络编码过程如下:
[0104]
[0105] 上式中, 表示基于用户的多层神经网络中第 层的权重, 表示基于用户多层神经网络中第2层的偏置项, 表示ReLU激活函数。同理,基于景点的多层神经网络中的参数具有相同表示。
[0106] 如图2所示,对在线评论信息进行关于用户偏好及景点特征的特征提取操作,得到特征词表,包括:
[0107] S114:对在线评论信息进行过滤,得到满足预设要求的目标在线评论集合,过滤的方式包括字数过滤、去停用词;
[0108] S115:基于目标在线评论集合进行特征词的提取,并计算特征词的词频;
[0109] S116:基于词频满足阈值要求的特征词形成初始特征词表;
[0110] S117:计算初始特征词表中的特征词与基于目标在线评论集合提取出的词频未满足阈值要求的特征词间的语义相似度;
[0111] S118:基于计算确定的语义相似度确定出满足相似度阈值的特征词,并将该特征词补充至初始特征词表中,形成特征词表。
[0112] 例如,本实施例中的在线评论信息包括第一类信息及第二类信息,第一类信息为用户在平台上提交的关于景点的在线评论信息,第二类信息为景点基于平台获得的在线评论信息。假设将 表示所有用户在在线旅游网站中提交的所有在线评论集合,即 ,其中, 表示第 个用户提交的在线评论
集合。 表示所有景点在在线旅游网站中获得的所有在线评论集合,即
,其中, 表示第 个景点获得的所有在线
评论集合。特征集合表示为 ,其中, 表示
第 个特征的表示, 表示特征集合中特征的数量。
[0113] 接着,如图3所示,对用户在线评论集合和景点在线评论集合中的每条在线评论进行字数过滤,舍弃评论字数小于50字的在线评论,并在过滤后进行中文分词、词性标注,之后可以结合哈工大去停用词词库、百度停用词表、四川大学机器学习智能实验室停用词库进行去停用词,得到预处理后的用户在线评论集合和景点在线评论集合,即目标在线评论集合。继续结合图3所示,对用户在线评论集合和景点在线评论集合分别利用TF‑IDF(词频‑逆文本频率指数)计算名词词频,根据词频排序从中筛选出前50个符合特征描述性质的名词(即特征词),并对其基于语义进行分类,基于分类后的该50个名词构成初始特征词表。其中上述的名词的类别包含服务、天气、交通、价格、购物、文化特色、时间、周边餐饮、住宿、风景等。在得到了初始特征词表的基础上,可以选择通过Word2vec(词向量)计算初始特征词表中的名词与用户在线评论集合和景点在线评论集合提取出的剩余名词的语义相似度,从语义相似度高于0.7的名词中挑选出属于不同特征的名词作为初始特征词表中各类别名词下的补充,进而得到最终的特征词表。
[0114] 进一步地,本实施例中的方法还包括:
[0115] S119:将在线评论信息根据指定分隔符划分为多个短句;
[0116] S120:确定每个短句中的情感词及其在短句中的位置,情感词包括正面情感词与负面情感词,不同的情感词配置有不同的情感值;
[0117] S121:基于情感词在短句中的位置确定每个短句中位于情感词前的程度词,不同的程度词配置有不同的权值;
[0118] S122:基于情感词在短句中的位置确定每个短句中位于情感词前的否定词及其数量,不同数量的否定词配置有不同的权值;
[0119] S123:确定每个短句的结尾处是否具有目标符号,不同的目标符号配置有不同的权值;
[0120] S124:确定每个短句中是否具有目标转折词,目标转折词配置有对应的权值;
[0121] S125:基于每个短句中的情感词的情感值、程度词的权值、不同数量的否定词的权值、不同目标符号的权值以及目标转折词的权值分别计算确定对应短句的正面情感值及负面情感值;
[0122] S126:计算正面情感值及负面情感值的绝对值差值;
[0123] S127:基于差值确定绝对值较大的正面情感值或负面情感值为对应短句的情感强度值。
[0124] 例如,根据指定分隔符(例如!。;?等),将所有在线评论划分为多个短句,然后利用HOWNET(知网情感词典)计算不同特征短句的情感强度。具体地,首先查找每个短句包含的表达情感的名词/特征词,也即情感词,并确定各个情感词为正面情感词还是负面情感词,以及各个情感词在短句中的位置。然后在各短句中的各情感词前查找用于表达情感强度的程度词,并为不同程度词设置对应的权值。同时,查找各短句中各个情感词前的否定词的个数,单个否定词的权值为‑1,偶数个否定词或零个否定词的权值为0,因此若否定词数量为奇数,则对应的情感词的情感值乘以权值‑1,若否定词数量为偶数或0,则对应的情感词的情感值乘以权值1。进一步地,判断各短句结尾是否有感叹号或问号,若有,则该短句的整体情感值同向增加2。例如,原始短句正向情感值为1,则变为1+2=3,原始负向情感值为‑2,则变为‑2‑2=‑4。另外,若是短句中存在但是等转折词,则但是后面的情感词的情感值乘以5。基于上述内容综合计算短句的情感值,计算公式如下:
[0125]
[0126] 上式中, 表示包含特征 的在线评论中第 个情感词对应的情感值,表示HOWNET中不同程度词、感叹号“!”、问号“?”的权值,具体可以为
, 表示否定词的权值。
[0127] 基于上述公式,每一个短句均能计算得到一个正面情感值和一个负面情感值。当得到各短句的正面情感值与负面情感值后,对比各短句中正面情感值与负面情感值的绝对值大小,将绝对值较大的情感值作为该短句所包含的特征的情感强度,也即该短句的情感强度值。
[0128] 如前文所述,本实施例中的在线评论信息包括第一类信息及第二类信息,在至少基于特征词表分别计算对应用户偏好的第一情感强度矩阵、第一关注度矩阵,以及对应景点特征的第二情感强度矩阵、第二关注度矩阵时,包括:
[0129] S128:基于特征词表记录的多个不同类别的特征词、短句的情感强度值计算确定每条在线评论信息中包含同一类特征词的所有短句的情感强度值之和,并将情感强度值之和定义为该类特征词的情感强度值;
[0130] S129:基于每条在线评论信息的类别、每条在线评论信息中各类特征词出现的次数占该条在线评论信息中所有特征词的数量的比例分别确定对应用户的特征关注度及对应景点的特征关注度;
[0131] S130:基于各类特征词的情感强度值、对应用户的特征关注度及对应景点的特征关注度分别计算确定对应用户偏好的第一情感强度矩阵、第一关注度矩阵,以及对应景点特征的第二情感强度矩阵、第二关注度矩阵。
[0132] 例如,根据在先构建的特征词表,将每一类信息中的每一条在线评论中包含同一类特征词的所有短句的情感强度值相加,以得到某一类特征词的情感强度。最后,对每一类特征词的情感强度进行归一化,以分别得到第一情感强度矩阵 和第二情感强度矩阵。接着,对于用户和景点,分别以特征词表中的特征词的类别为基础,计算同一类别中的所有特征词在一条在线评论中出现的次数 占整条在线评论中所有特征名词数量的比例,并将该比例作为特征关注度,具体如下:
[0133] 对于用户:
[0134] 对于景点:
[0135] 上式中, 表示特征集合中特征的数量, 表示第 个用户对特征 的关注度, 表示第 个景点在特征 上获得的关注度, 表示第 位用户的评论中特征出现的次数, 表示第 个景点的评论中特征 出现的次数。
[0136] 基于上述计算的 组成第一关注度矩阵 ,基于上述 计算的组成第二关注度矩阵 。
[0137] 进一步地,基于第一情感强度矩阵与第一关注度矩阵、第二情感强度矩阵与第二关注度矩阵分别计算得到反映用户偏好的第二用户偏好矩阵及第二景点特征矩阵,包括:
[0138] S131:将第一情感强度矩阵与第一关注度矩阵相乘得到第二用户偏好矩阵;
[0139] S132:将第二情感强度矩阵与第二关注度矩阵相乘得到第二景点特征矩阵。
[0140] 也即,基于上文所述内容可得到, , 。其中 为第二用户偏好矩阵, 为第二景点特征矩阵。
[0141] 继续结合图3所示,将第一用户偏好矩阵与第二用户偏好矩阵、第一景点特征矩阵与第二景点特征矩阵至少进行横向拼接、注意力池化、外积、特征堆叠处理以得到用户偏好交互编码矩阵和景点特征交互编码矩阵,包括:
[0142] S133:将第一用户偏好矩阵与第二用户偏好矩阵、第一景点特征矩阵与第二景点特征矩阵分别进行横向维度的矩阵拼接,以得到用户偏好拼接矩阵及景点特征拼接矩阵;
[0143] S134:将用户偏好拼接矩阵与景点特征拼接矩阵通过嵌入层投影到一个 维密集向量中,分别得到对应的嵌入表示;
[0144] S135:将用户偏好拼接矩阵与景点特征拼接矩阵分别输入相同结构的注意力机制中并进行池化,以分别得到对应的池化后的表示;
[0145] S136:基于用户偏好拼接矩阵与景点特征拼接矩阵的池化后表示进行外积和特征堆叠得到用户偏好交互编码矩阵和景点特征交互编码矩阵。
[0146] 例如,将基于评级和在线评论得到的用户偏好矩阵 、 和景点特征矩阵、 分别进行横向维度的矩阵拼接:
[0147] 用户偏好拼接矩阵,拼接过程为 ;
[0148] 景点特征拼接矩阵,拼接过程为 ;
[0149] 接着,将用户偏好拼接矩阵 和景点特征拼接矩阵 通过嵌入层投影到一个维密集向量表示 中,分别得到对应的嵌入表示,例如 表示第 个特征对应的嵌入表示。再将用户偏好拼接矩阵 和景点特征拼接矩阵 分别输入相同结构的注意力机制并进行池化,具体池化结构如下:
[0150] ,
[0151] ,
[0152] ,
[0153] 其中, 和 表示输入矩阵投影到隐藏状态的对应权重矩阵和偏执矩阵。表示将隐藏状态投影到注意力得分的矩阵, 为特征 的特征向量表示, 为特征的注意力得分, 表示 所属的特征矩阵(用户偏好拼接矩阵 和景点特征拼接矩阵 ), 表示特征 注意力得分, 表示归一化后的注意力得分, 表示注意力池化后的特征表示, 表示注意力机制中的非线性激活函数即双正切函数,
表示注意力机制中的非线性激活函数,即归一化指数函数;
[0154] 基于用户偏好拼接矩阵与景点特征拼接矩阵的池化后表示进行外积和特征堆叠,例如使用外积实现 和 之间的交互,并将所有交互结果堆叠形成一个3D张量,作为3D卷积的输入,外积及堆叠过程如下:
[0155]
[0156]
[0157] 进而得到用户偏好交互编码矩阵和景点特征交互编码矩阵。
[0158] 之后将用户偏好交互编码矩阵和景点特征交互编码矩阵分别输入3D卷积神经网络中,经过6层卷积层后得到最终的高阶用户偏好矩阵和高阶景点特征矩阵。例如,针对堆叠后的用户偏好交互矩阵和景点特征交互矩阵,利用3D卷积神经网络生成高阶用户偏好矩阵和高阶景点特征矩阵,其中3D卷积神经网络包含6个卷积层,经该卷积层处理后输出大小为1×1×32的初始高阶用户偏好矩阵和初始高阶景点特征矩阵,之后对得到的该初始高阶矩阵均合并1维的象限,以得到最终的高阶用户偏好矩阵和高阶景点特征矩阵。
[0159] 进一步地,计算高阶用户偏好矩阵和高阶景点特征矩阵的余弦相似度,包括:
[0160] S137:基于下述公式计算高阶用户偏好矩阵和高阶景点特征矩阵的余弦相似度:
[0161]
[0162] 其中, 表示第 位用户在所述高阶用户偏好矩阵中的表示, 表示第 个景点在所述高阶景点特征矩阵中的表示, 表示矩阵的模。
[0163] 基于得到的余弦相似度可作为预测用的评级矩阵,以基于该矩阵针对不同用户来对不同景点进行评级,基于评级的数值确定与用户偏好匹配的景点,并为用户推荐该景点。
[0164] 为了证明本实施例中的方法的有效性,以下结合不同实验进行有效性的验证:
[0165] 本实施例中所设计的数据包括评级数据集,在线评论数据集。数据集均利用爬虫技术爬取某一旅游网站的数据。在本实施例的验证实验所使用的数据集包含15733位用户和418个景点的信息。其中,含有6594条评级数据,评级范围为 ,267574条在线评论数据。评级数据集包含用户id、景区id、评级分值和评级时间。在线评论数据集包含用户id、景区id、在线评论内容、评论时间。
[0166] 基于上述的数据,可以选择使用以下七种基准方法,与实施例提出的混合3D卷积融合评级和在线评论的基于混合3D卷积融合评级与评论的景点推荐方法进行对比实验。其中基准方法包括:
[0167] (1)深度矩阵分解:该方法采用深度矩阵分解进行推荐,仅使用评级而未考虑在线评论。
[0168] (2)基于在线评论的三维卷积:该方法仅利用细粒度情感分析提取的用户偏好和景点特征数据进行推荐。
[0169] (3)矩阵加法:该方法采用特征对应维度值相加实现评级与在线评论特征融合后进行推荐。
[0170] (4)矩阵拼接:该方法采用水平拼接实现评级与在线评论特征融合后进行推荐。
[0171] (5)矩阵乘法:该方法采用特征对应维度值相乘实现评级与在线评论特征融合后进行推荐。
[0172] (6)因子分解机(Factorization Machines,FM):该方法将用户和景点对应的评级特征和在线评论特征拼接后输入FM模型进行特征融合,然后根据融合后的用户偏好和景点特征进行匹配。
[0173] (7)深度因子分解机(Deep Factorization Machines,DeepFM):该方法将用户和景点对应的评级特征和在线评论特征拼接后输入深度因子分解机模型进行特征融合,然后利用融合后的用户偏好和景点特征进行匹配。
[0174] 实验时,将处理后的数据集按照8:2的比例分成训练集与测试集。首先在训练集上训练模型,然后在测试集上测试模型性能,并且每个方法实验执行5次取平均值。
[0175] 实验采用Top‑N推荐算法的命中率(HR)和归一化折扣累积增益(NDCG)作为评价指标。实验对比结果如表1和表2所示,表1和表2分别包含了当Top‑N=5、10、15时,本发明方法与其他七种基准方法的命中率和归一化折扣累积增益的对比结果。
[0176] 表1 旅游网站数据集HR指标实验结果
[0177]
[0178] 表2 旅游网站数据集NDCG指标实验结果
[0179]
[0180] 从表1和表2可以看出,当Top‑N=5、10、15时,本实施例所述方法在两个性能指标上均取得最佳的性能,这说明本实施例的基于混合3D卷积融合评级与评论的景点推荐方法比现有方法具有更好景点推荐效果。
[0181] 综上可知,本实施例通过混合3D卷积神经网络融合评级与在线评论,构建了用户及景点特征提取及融合模型,设计实现了混合3D卷积融合评级与在线评论的基于混合3D卷积融合评级与评论的景点推荐方法,其实验结果表明将评级与在线评论提取的特征通过混合3D卷积神经网络进行特征融合的方法在上述旅游网站数据集上取得了良好的性能表现。
[0182] 如图4所示,本发明另一实施例同时提供一种景点推荐装置100,包括:
[0183] 获得模块,用于获得用户对景点的评级信息和景点的在线评论信息;
[0184] 构建模块,用于根据评级信息构建用户‑景点的评级交互矩阵;
[0185] 第一处理模块,用于对用户‑景点的评级交互矩阵至少进行填充处理,并输入至深度矩阵分解模型中,以得到用于反映评级信息的第一用户偏好矩阵以及第一景点特征矩阵;
[0186] 提取模块,用于对在线评论信息进行关于用户偏好及景点特征的特征提取操作,得到特征词表;
[0187] 第一计算模块,用于至少根据特征词表分别计算对应用户偏好的第一情感强度矩阵、第一关注度矩阵,以及对应景点特征的第二情感强度矩阵、第二关注度矩阵;
[0188] 第二计算模块,用于根据第一情感强度矩阵与第一关注度矩阵、第二情感强度矩阵与第二关注度矩阵分别计算得到反映用户偏好的第二用户偏好矩阵及第二景点特征矩阵;
[0189] 第三计算模块,用于将第一用户偏好矩阵与第二用户偏好矩阵、第一景点特征矩阵与第二景点特征矩阵至少进行横向拼接、注意力池化、外积、特征堆叠处理以得到用户偏好交互编码矩阵和景点特征交互编码矩阵;
[0190] 第二处理模块,用于将用户偏好交互编码矩阵和景点特征交互编码矩阵输入至3D卷积神经网络中进行处理,得到高阶用户偏好矩阵和高阶景点特征矩阵;
[0191] 第四计算模块,用于计算高阶用户偏好矩阵和高阶景点特征矩阵的余弦相似度,余弦相似度用于表征景点特征与用户偏好的匹配程度;
[0192] 推荐模块,用于根据余弦相似度为用户进行景点推荐。
[0193] 作为一可选实施例,对用户‑景点的评级交互矩阵至少进行填充处理,包括:
[0194] 遍历全部用户是否对每个景点均进行评级,若是,则对应保留原评级,若否,则对应以0填充,以得到用户‑景点的评级交互矩阵:
[0195]
[0196] 其中, 表示任意所述用户 对任意所述景点 的评级, 的取值为。
[0197] 作为一可选实施例,将用户‑景点的评级交互矩阵输入至深度矩阵分解模型中,以得到用于反映评级信息的第一用户偏好矩阵以及第一景点特征矩阵,包括:
[0198] 将用户‑景点的评级交互矩阵拆解形成具有矩阵转置关系的用户评级矩阵和景点评级矩阵,用户评级矩阵包含任意用户对所有景点的评级集合,景点评级矩阵包含任意景点对所有用户的评级集合;
[0199] 将用户评级矩阵与景点评级矩阵分别输入至深度矩阵分解模型中的两个双层神经网络中,以得到第一用户偏好矩阵以及第一景点特征矩阵。
[0200] 作为一可选实施例,对在线评论信息进行关于用户偏好及景点特征的特征提取操作,得到特征词表,包括:
[0201] 对在线评论信息进行过滤,得到满足预设要求的目标在线评论集合,过滤的方式包括字数过滤、去停用词;
[0202] 基于目标在线评论集合进行特征词的提取,并计算特征词的词频;
[0203] 基于词频满足阈值要求的特征词形成初始特征词表;
[0204] 计算初始特征词表中的特征词与基于目标在线评论集合提取出的词频未满足阈值要求的特征词间的语义相似度;
[0205] 基于计算确定的语义相似度确定出满足相似度阈值的特征词,并将该特征词补充至初始特征词表中,形成特征词表。
[0206] 作为一可选实施例,还包括:
[0207] 将在线评论信息根据指定分隔符划分为多个短句;
[0208] 确定每个短句中的情感词及其在短句中的位置,情感词包括正面情感词与负面情感词,不同的情感词配置有不同的情感值;
[0209] 基于情感词在短句中的位置确定每个短句中位于情感词前的程度词,不同的程度词配置有不同的权值;
[0210] 基于情感词在短句中的位置确定每个短句中位于情感词前的否定词及其数量,不同数量的否定词配置有不同的权值;
[0211] 确定每个短句的结尾处是否具有目标符号,不同的目标符号配置有不同的权值;
[0212] 确定每个短句中是否具有目标转折词,目标转折词配置有对应的权值;
[0213] 基于每个短句中的情感词的情感值、程度词的权值、不同数量的否定词的权值、不同目标符号的权值以及目标转折词的权值分别计算确定对应短句的正面情感值及负面情感值;
[0214] 计算正面情感值及负面情感值的绝对值差值;
[0215] 基于差值确定绝对值较大的正面情感值或负面情感值为对应短句的情感强度值。
[0216] 作为一可选实施例,在线评论信息包括第一类信息及第二类信息,第一类信息为用户在平台上提交的关于景点的在线评论信息,第二类信息为景点基于平台获得的在线评论信息;
[0217] 至少基于特征词表分别计算对应用户偏好的第一情感强度矩阵、第一关注度矩阵,以及对应景点特征的第二情感强度矩阵、第二关注度矩阵,包括:
[0218] 基于特征词表记录的多个不同类别的特征词、短句的情感强度值计算确定每条在线评论信息中包含同一类特征词的所有短句的情感强度值之和,并将情感强度值之和定义为该类特征词的情感强度值;
[0219] 基于每条在线评论信息的类别、每条在线评论信息中各类特征词出现的次数占该条在线评论信息中所有特征词的数量的比例分别确定对应用户的特征关注度及对应景点的特征关注度;
[0220] 基于各类特征词的情感强度值、对应用户的特征关注度及对应景点的特征关注度分别计算确定对应用户偏好的第一情感强度矩阵、第一关注度矩阵,以及对应景点特征的第二情感强度矩阵、第二关注度矩阵。
[0221] 作为一可选实施例,基于第一情感强度矩阵与第一关注度矩阵、第二情感强度矩阵与第二关注度矩阵分别计算得到反映用户偏好的第二用户偏好矩阵及第二景点特征矩阵,包括:
[0222] 将第一情感强度矩阵与第一关注度矩阵相乘得到第二用户偏好矩阵;
[0223] 将第二情感强度矩阵与第二关注度矩阵相乘得到第二景点特征矩阵。
[0224] 作为一可选实施例,将第一用户偏好矩阵与第二用户偏好矩阵、第一景点特征矩阵与第二景点特征矩阵至少进行横向拼接、注意力池化、外积、特征堆叠处理以得到用户偏好交互编码矩阵和景点特征交互编码矩阵,包括:
[0225] 将第一用户偏好矩阵与第二用户偏好矩阵、第一景点特征矩阵与第二景点特征矩阵分别进行横向维度的矩阵拼接,以得到用户偏好拼接矩阵及景点特征拼接矩阵;
[0226] 将用户偏好拼接矩阵与景点特征拼接矩阵通过嵌入层投影到一个 维密集向量中,分别得到对应的嵌入表示;
[0227] 将用户偏好拼接矩阵与景点特征拼接矩阵分别输入相同结构的注意力机制中并进行池化,以分别得到对应的池化后表示;
[0228] 基于用户偏好拼接矩阵与景点特征拼接矩阵的池化后表示进行外积和特征堆叠得到用户偏好交互编码矩阵和景点特征交互编码矩阵。
[0229] 作为一可选实施例,计算高阶用户偏好矩阵和高阶景点特征矩阵的余弦相似度,包括:
[0230] 基于下述公式计算高阶用户偏好矩阵和高阶景点特征矩阵的余弦相似度:
[0231]
[0232] 其中, 表示第 位用户在所述高阶用户偏好矩阵中的表示, 表示第个景点在所述高阶景点特征矩阵中的表示, 表示矩阵的模。
[0233] 进一步地,本发明另一实施例还提供一种电子设备,包括:
[0234] 一个或多个处理器;
[0235] 存储器,配置为存储一个或多个程序;
[0236] 当该一个或多个程序被该一个或多个处理器执行时,使得该一个或多个处理器实现上述基于混合3D卷积融合评级与评论的景点推荐方法。
[0237] 进一步地,本发明一实施例还提供一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的基于混合3D卷积融合评级与评论的景点推荐方法。应理解,本实施例中的各个方案具有上述方法实施例中对应的技术效果,此处不再赘述。
[0238] 进一步地,本发明实施例还提供了一种计算机程序产品,所述计算机程序产品被有形地存储在计算机可读介质上并且包括计算机可读指令,所述计算机可执行指令在被执行时使至少一个处理器执行诸如上文所述实施例中的基于混合3D卷积融合评级与评论的景点推荐方法。
[0239] 应理解,本实施例中的各个方案具有上述方法实施例中对应的技术效果,此处不再赘述。
[0240] 需要说明的是,本申请的计算机存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读介质例如可以但不限于是电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储介质(RAM)、只读存储介质(ROM)、可擦式可编程只读存储介质(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储介质(CD‑ROM)、光存储介质件、磁存储介质件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输配置为由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、天线、光缆、RF等等,或者上述的任意合适的组合。
[0241] 应当理解,虽然本申请是按照各个实施例描述的,但并非每个实施例仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
[0242] 以上实施例仅为本发明的示例性实施例,不用于限制本发明,本发明的保护范围由权利要求书限定。本领域技术人员可以在本发明的实质和保护范围内,对本发明做出各种修改或等同替换,这种修改或等同替换也应视为落在本发明的保护范围内。