会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利库 / 人工智能 / 特征向量 / 关键词推荐方法及设备

关键词推荐方法及设备

阅读:538发布:2021-02-28

IPRDB可以提供关键词推荐方法及设备专利检索,专利查询,专利分析的服务。并且本发明的目的是提供一种商品的关键词推荐方法及设备,本发明通过根据第一和第二统计次数得到每个拆分词对应的第一权重,根据每个拆分词对应的第一权重对每个第一原始特征向量进行调整,得到每个对应于第一原始特征向量的第一修正特征向量;将各个第一修正特征向量输入一关键词推荐贝叶斯模型,所述贝叶斯模型存储有各个推荐关键词及其对应的关键词特征向量,获取所述关键词推荐贝叶斯模型基于各个第一修正特征向量与关键词特征向量的相似度比较结果,输出的与所述待推荐关键词的商品描述信息的相似度大于预设阈值的推荐关键词,可以实现商品描述信息对应的关键词的精确推荐。,下面是关键词推荐方法及设备专利的具体信息内容。

1.一种商品的关键词推荐方法,其中,该方法包括:

获取待推荐关键词的商品描述信息;

将所述待推荐关键词的商品描述信息进行拆分得到对应拆分词;

根据所述待推荐关键词的商品描述信息所包含的拆分词,将所述待推荐关键词的商品描述信息转化为对应的第一原始特征向量;

计算每个拆分词在所述待推荐关键词的商品描述信息中的出现的次数作为第一统计次数,计算每个拆分词在所有的商品描述信息中出现的次数作为第二统计次数;

根据所述第一和第二统计次数得到每个拆分词对应的第一权重,根据每个拆分词对应的第一权重对每个第一原始特征向量进行调整,得到每个对应于第一原始特征向量的第一修正特征向量;

将各个第一修正特征向量输入一关键词推荐贝叶斯模型,所述贝叶斯模型存储有各个推荐关键词及其对应的关键词特征向量,获取所述关键词推荐贝叶斯模型基于各个第一修正特征向量与关键词特征向量的相似度比较结果,输出的与所述待推荐关键词的商品描述信息的相似度大于预设阈值的推荐关键词。

2.根据权利要求1所述的方法,其中,将各个第一修正特征向量输入一关键词推荐贝叶斯模型之前,还包括:从词库中获取各个推荐关键词;

获取对应于各个推荐关键词的商品描述信息;

依次将每个商品描述信息作当前商品描述信息后,重复如下步骤:将当前商品描述信息进行拆分,得到对应拆分词;根据当前商品描述信息所包含的拆分词,将当前商品描述信息转化为对应的第二原始特征向量;根据每个拆分词在当前商品描述信息中的出现的次数计算第三统计次数,根据每个拆分词在所有的商品描述信息中出现的次数计算第四统计次数;根据所述第三和第四统计次数得到每个拆分词对应的第二权重,根据每个拆分词对应的第二权重对所述第二原始特征向量进行调整,得到每个对应于所述第二原始特征向量的第二修正特征向量;将所述第二修正特征向量,作为当前商品描述信息所对应的推荐关键词的关键词特征向量;

将所有推荐关键词及其对应的关键词特征向量作为输入训练贝叶斯模型,以得到所述关键词推荐贝叶斯模型。

3.根据权利要求2所述的方法,其中,根据所述第三和第四统计次数得到每个拆分词对应的第二权重,包括:根据所述第二权重的大小与所述第三统计次数成正比,且与所述第四统计次数成反比,得到每个拆分词对应的第二权重。

4.根据权利要求2所述的方法,其中,根据每个拆分词在当前商品描述信息中的出现的次数计算第三统计次数,根据每个拆分词在所有的商品描述信息中出现的次数计算第四统计次数,包括:计算词频TF作为第三统计次数,其中,TF=该拆分词在当前商品描述信息中出现的次数/当前商品描述信息中的拆分词总数;

计算逆文档频率IDF作为第四统计次数,IDF=log(商品描述信息总数/包含该拆分词的商品描述信息数)。

5.根据权利要求1所述的方法,其中,输出的与所述待推荐关键词的商品描述信息的相似度大于预设阈值的推荐关键词,包括:输出的与所述待推荐关键词的商品描述信息的相似度大于预设阈值的推荐关键词,及所述推荐关键词与所述待推荐关键词的商品描述信息的相似度。

6.根据权利要求1所述的方法,其中,根据所述第一和第二统计次数得到每个拆分词对应的第一权重,包括:根据所述第一权重的大小与所述第一统计次数成正比,且与所述第二统计次数成反比,得到每个拆分词对应的第一权重。

7.根据权利要求1所述的方法,其中,计算每个拆分词在所述待推荐关键词的商品描述信息中的出现的次数作为第一统计次数,计算每个拆分词在所有的商品描述信息中出现的次数作为第二统计次数,包括:计算词频TF作为所述第一统计次数,其中,TF=该拆分词在当前商品描述信息中出现的次数/当前商品描述信息中的拆分词总数;

计算逆文档频率IDF作为第二统计次数,其中,IDF=log(商品描述信息总数/包含该拆分词的商品描述信息数)。

8.一种商品的关键词推荐设备,其中,该设备包括:

第一获取模块,用于获取待推荐关键词的商品描述信息;

第一拆分模块,用于将所述待推荐关键词的商品描述信息进行拆分得到对应拆分词;

第一转化模块,用于根据所述待推荐关键词的商品描述信息所包含的拆分词,将所述待推荐关键词的商品描述信息转化为对应的第一原始特征向量;

第一计算模块,用于计算每个拆分词在所述待推荐关键词的商品描述信息中的出现的次数作为第一统计次数,计算每个拆分词在所有的商品描述信息中出现的次数作为第二统计次数;

第一调整模块,用于根据所述第一和第二统计次数得到每个拆分词对应的第一权重,根据每个拆分词对应的第一权重对每个第一原始特征向量进行调整,得到每个对应于第一原始特征向量的第一修正特征向量;

推荐模块,用于将各个第一修正特征向量输入一关键词推荐贝叶斯模型,所述贝叶斯模型存储有各个推荐关键词及其对应的关键词特征向量,获取所述关键词推荐贝叶斯模型基于各个第一修正特征向量与关键词特征向量的相似度比较结果,输出的与所述待推荐关键词的商品描述信息的相似度大于预设阈值的推荐关键词。

9.根据权利要求8所述的设备,其中,还包括:

第二获取模块,用于从词库中获取各个推荐关键词,获取对应于各个推荐关键词的商品描述信息;

处理模块,用于依次将每个商品描述信息作当前商品描述信息后,重复如下处理:将当前商品描述信息进行拆分,得到对应拆分词;根据当前商品描述信息所包含的拆分词,将当前商品描述信息转化为对应的第二原始特征向量;根据每个拆分词在当前商品描述信息中的出现的次数计算第三统计次数,根据每个拆分词在所有的商品描述信息中出现的次数计算第四统计次数;根据所述第三和第四统计次数得到每个拆分词对应的第二权重,根据每个拆分词对应的第二权重对所述第二原始特征向量进行调整,得到每个对应于所述第二原始特征向量的第二修正特征向量;将所述第二修正特征向量,作为当前商品描述信息所对应的推荐关键词的关键词特征向量;

训练模块,用于将所有推荐关键词及其对应的关键词特征向量作为输入训练贝叶斯模型,以得到所述关键词推荐贝叶斯模型。

10.根据权利要求9所述的设备,其中,所述处理模块,用于根据所述第二权重的大小与所述第三统计次数成正比,且与所述第四统计次数成反比,得到每个拆分词对应的第二权重。

11.根据权利要求9所述的设备,其中,所述处理模块,用于计算词频TF作为第三统计次数,其中,TF=该拆分词在当前商品描述信息中出现的次数/当前商品描述信息中的拆分词总数;计算逆文档频率IDF作为第四统计次数,IDF=log(商品描述信息总数/包含该拆分词的商品描述信息数)。

12.根据权利要求8所述的设备,其中,所述推荐模块,用于输出的与所述待推荐关键词的商品描述信息的相似度大于预设阈值的推荐关键词,及所述推荐关键词与所述待推荐关键词的商品描述信息的相似度。

13.根据权利要求8所述的设备,其中,所述第一调整模块,用于根据所述第一权重的大小与所述第一统计次数成正比,且与所述第二统计次数成反比,得到每个拆分词对应的第一权重。

14.根据权利要求8所述的设备,其中,所述计算模块,用于计算词频TF作为所述第一统计次数,其中,TF=该拆分词在当前商品描述信息中出现的次数/当前商品描述信息中的拆分词总数;计算逆文档频率IDF作为第二统计次数,其中,IDF=log(商品描述信息总数/包含该拆分词的商品描述信息数)。

15.一种计算机可读存储介质,其上存储有计算机可执行指令,其中,该计算机可执行指令被处理器执行时使得该处理器:获取待推荐关键词的商品描述信息;

将所述待推荐关键词的商品描述信息进行拆分得到对应拆分词;

根据所述待推荐关键词的商品描述信息所包含的拆分词,将所述待推荐关键词的商品描述信息转化为对应的第一原始特征向量;

计算每个拆分词在所述待推荐关键词的商品描述信息中的出现的次数作为第一统计次数,计算每个拆分词在所有的商品描述信息中出现的次数作为第二统计次数;

根据所述第一和第二统计次数得到每个拆分词对应的第一权重,根据每个拆分词对应的第一权重对每个第一原始特征向量进行调整,得到每个对应于第一原始特征向量的第一修正特征向量;

将各个第一修正特征向量输入一关键词推荐贝叶斯模型,所述贝叶斯模型存储有各个推荐关键词及其对应的关键词特征向量,获取所述关键词推荐贝叶斯模型基于各个第一修正特征向量与关键词特征向量的相似度比较结果,输出的与所述待推荐关键词的商品描述信息的相似度大于预设阈值的推荐关键词。

16.一种计算器设备,其中,包括:

处理器;以及

被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:获取待推荐关键词的商品描述信息;

将所述待推荐关键词的商品描述信息进行拆分得到对应拆分词;

根据所述待推荐关键词的商品描述信息所包含的拆分词,将所述待推荐关键词的商品描述信息转化为对应的第一原始特征向量;

计算每个拆分词在所述待推荐关键词的商品描述信息中的出现的次数作为第一统计次数,计算每个拆分词在所有的商品描述信息中出现的次数作为第二统计次数;

根据所述第一和第二统计次数得到每个拆分词对应的第一权重,根据每个拆分词对应的第一权重对每个第一原始特征向量进行调整,得到每个对应于第一原始特征向量的第一修正特征向量;

将各个第一修正特征向量输入一关键词推荐贝叶斯模型,所述贝叶斯模型存储有各个推荐关键词及其对应的关键词特征向量,获取所述关键词推荐贝叶斯模型基于各个第一修正特征向量与关键词特征向量的相似度比较结果,输出的与所述待推荐关键词的商品描述信息的相似度大于预设阈值的推荐关键词。

说明书全文

关键词推荐方法及设备

技术领域

[0001] 本发明涉及计算机领域,尤其涉及一种关键词推荐方法及设备。

背景技术

[0002] 现有的商品关键词的推荐方案存在不准确的问题。

发明内容

[0003] 本发明的一个目的是提供一种关键词推荐方法及设备,能够解决现有的商品关键词的推荐方案存在不准确的问题。
[0004] 根据本发明的一个方面,提供了一种商品的关键词推荐方法,该方法包括:
[0005] 获取待推荐关键词的商品描述信息;
[0006] 将所述待推荐关键词的商品描述信息进行拆分得到对应拆分词;
[0007] 根据所述待推荐关键词的商品描述信息所包含的拆分词,将所述待推荐关键词的商品描述信息转化为对应的第一原始特征向量;
[0008] 计算每个拆分词在所述待推荐关键词的商品描述信息中的出现的次数作为第一统计次数,计算每个拆分词在所有的商品描述信息中出现的次数作为第二统计次数;
[0009] 根据所述第一和第二统计次数得到每个拆分词对应的第一权重,根据每个拆分词对应的第一权重对每个第一原始特征向量进行调整,得到每个对应于第一原始特征向量的第一修正特征向量;
[0010] 将各个第一修正特征向量输入一关键词推荐贝叶斯模型,所述贝叶斯模型存储有各个推荐关键词及其对应的关键词特征向量,获取所述关键词推荐贝叶斯模型基于各个第一修正特征向量与关键词特征向量的相似度比较结果,输出的与所述待推荐关键词的商品描述信息的相似度大于预设阈值的推荐关键词。
[0011] 进一步的,上述方法中,将各个第一修正特征向量输入一关键词推荐贝叶斯模型之前,还包括:
[0012] 从词库中获取各个推荐关键词;
[0013] 获取对应于各个推荐关键词的商品描述信息;
[0014] 依次将每个商品描述信息作当前商品描述信息后,重复如下步骤:将当前商品描述信息进行拆分,得到对应拆分词;根据当前商品描述信息所包含的拆分词,将当前商品描述信息转化为对应的第二原始特征向量;根据每个拆分词在当前商品描述信息中的出现的次数计算第三统计次数,根据每个拆分词在所有的商品描述信息中出现的次数计算第四统计次数;根据所述第三和第四统计次数得到每个拆分词对应的第二权重,根据每个拆分词对应的第二权重对所述第二原始特征向量进行调整,得到每个对应于所述第二原始特征向量的第二修正特征向量;将所述第二修正特征向量,作为当前商品描述信息所对应的推荐关键词的关键词特征向量;
[0015] 将所有推荐关键词及其对应的关键词特征向量作为输入训练贝叶斯模型,以得到所述关键词推荐贝叶斯模型。
[0016] 进一步的,上述方法中,根据所述第三和第四统计次数得到每个拆分词对应的第二权重,包括:
[0017] 根据所述第二权重的大小与所述第三统计次数成正比,且与所述第四统计次数成反比,得到每个拆分词对应的第二权重。
[0018] 进一步的,上述方法中,根据每个拆分词在当前商品描述信息中的出现的次数计算第三统计次数,根据每个拆分词在所有的商品描述信息中出现的次数计算第四统计次数,包括:
[0019] 计算词频TF作为第三统计次数,其中,TF=该拆分词在当前商品描述信息中出现的次数/当前商品描述信息中的拆分词总数;
[0020] 计算逆文档频率IDF作为第四统计次数,IDF=log(商品描述信息总数/包含该拆分词的商品描述信息数)。
[0021] 进一步的,上述方法中,输出的与所述待推荐关键词的商品描述信息的相似度大于预设阈值的推荐关键词,包括:
[0022] 输出的与所述待推荐关键词的商品描述信息的相似度大于预设阈值的推荐关键词,及所述推荐关键词与所述待推荐关键词的商品描述信息的相似度。
[0023] 进一步的,上述方法中,根据所述第一和第二统计次数得到每个拆分词对应的第一权重,包括:
[0024] 根据所述第一权重的大小与所述第一统计次数成正比,且与所述第二统计次数成反比,得到每个拆分词对应的第一权重。
[0025] 进一步的,上述方法中,计算每个拆分词在所述待推荐关键词的商品描述信息中的出现的次数作为第一统计次数,计算每个拆分词在所有的商品描述信息中出现的次数作为第二统计次数,包括:
[0026] 计算词频TF作为所述第一统计次数,其中,TF=该拆分词在当前商品描述信息中出现的次数/当前商品描述信息中的拆分词总数;
[0027] 计算逆文档频率IDF作为第二统计次数,其中,IDF=log(商品描述信息总数/包含该拆分词的商品描述信息数)。
[0028] 根据本发明的另一方面,还提供了一种商品的关键词推荐设备,该设备包括:
[0029] 第一获取模块,用于获取待推荐关键词的商品描述信息;
[0030] 第一拆分模块,用于将所述待推荐关键词的商品描述信息进行拆分得到对应拆分词;
[0031] 第一转化模块,用于根据所述待推荐关键词的商品描述信息所包含的拆分词,将所述待推荐关键词的商品描述信息转化为对应的第一原始特征向量;
[0032] 第一计算模块,用于计算每个拆分词在所述待推荐关键词的商品描述信息中的出现的次数作为第一统计次数,计算每个拆分词在所有的商品描述信息中出现的次数作为第二统计次数;
[0033] 第一调整模块,用于根据所述第一和第二统计次数得到每个拆分词对应的第一权重,根据每个拆分词对应的第一权重对每个第一原始特征向量进行调整,得到每个对应于第一原始特征向量的第一修正特征向量;
[0034] 推荐模块,用于将各个第一修正特征向量输入一关键词推荐贝叶斯模型,所述贝叶斯模型存储有各个推荐关键词及其对应的关键词特征向量,获取所述关键词推荐贝叶斯模型基于各个第一修正特征向量与关键词特征向量的相似度比较结果,输出的与所述待推荐关键词的商品描述信息的相似度大于预设阈值的推荐关键词。
[0035] 进一步的,上述设备中,还包括:
[0036] 第二获取模块,用于从词库中获取各个推荐关键词,获取对应于各个推荐关键词的商品描述信息;
[0037] 处理模块,用于依次将每个商品描述信息作当前商品描述信息后,重复如下处理:将当前商品描述信息进行拆分,得到对应拆分词;根据当前商品描述信息所包含的拆分词,将当前商品描述信息转化为对应的第二原始特征向量;根据每个拆分词在当前商品描述信息中的出现的次数计算第三统计次数,根据每个拆分词在所有的商品描述信息中出现的次数计算第四统计次数;根据所述第三和第四统计次数得到每个拆分词对应的第二权重,根据每个拆分词对应的第二权重对所述第二原始特征向量进行调整,得到每个对应于所述第二原始特征向量的第二修正特征向量;将所述第二修正特征向量,作为当前商品描述信息所对应的推荐关键词的关键词特征向量;
[0038] 训练模块,用于将所有推荐关键词及其对应的关键词特征向量作为输入训练贝叶斯模型,以得到所述关键词推荐贝叶斯模型。
[0039] 进一步的,上述设备中,所述处理模块,用于根据所述第二权重的大小与所述第三统计次数成正比,且与所述第四统计次数成反比,得到每个拆分词对应的第二权重。
[0040] 进一步的,上述设备中,所述处理模块,用于计算词频TF作为第三统计次数,其中,TF=该拆分词在当前商品描述信息中出现的次数/当前商品描述信息中的拆分词总数;计算逆文档频率IDF作为第四统计次数,IDF=log(商品描述信息总数/包含该拆分词的商品描述信息数)。
[0041] 进一步的,上述设备中,所述推荐模块,用于输出的与所述待推荐关键词的商品描述信息的相似度大于预设阈值的推荐关键词,及所述推荐关键词与所述待推荐关键词的商品描述信息的相似度。
[0042] 进一步的,上述设备中,所述第一调整模块,用于根据所述第一权重的大小与所述第一统计次数成正比,且与所述第二统计次数成反比,得到每个拆分词对应的第一权重。
[0043] 进一步的,上述设备中,所述计算模块,用于计算词频TF作为所述第一统计次数,其中,TF=该拆分词在当前商品描述信息中出现的次数/当前商品描述信息中的拆分词总数;计算逆文档频率IDF作为第二统计次数,其中,IDF=log(商品描述信息总数/包含该拆分词的商品描述信息数)。
[0044] 根据本发明的另一面,还提供一种计算机可读存储介质,其上存储有计算机可执行指令,其中,该计算机可执行指令被处理器执行时使得该处理器:
[0045] 获取待推荐关键词的商品描述信息;
[0046] 将所述待推荐关键词的商品描述信息进行拆分得到对应拆分词;
[0047] 根据所述待推荐关键词的商品描述信息所包含的拆分词,将所述待推荐关键词的商品描述信息转化为对应的第一原始特征向量;
[0048] 计算每个拆分词在所述待推荐关键词的商品描述信息中的出现的次数作为第一统计次数,计算每个拆分词在所有的商品描述信息中出现的次数作为第二统计次数;
[0049] 根据所述第一和第二统计次数得到每个拆分词对应的第一权重,根据每个拆分词对应的第一权重对每个第一原始特征向量进行调整,得到每个对应于第一原始特征向量的第一修正特征向量;
[0050] 将各个第一修正特征向量输入一关键词推荐贝叶斯模型,所述贝叶斯模型存储有各个推荐关键词及其对应的关键词特征向量,获取所述关键词推荐贝叶斯模型基于各个第一修正特征向量与关键词特征向量的相似度比较结果,输出的与所述待推荐关键词的商品描述信息的相似度大于预设阈值的推荐关键词。
[0051] 根据本发明的另一面,还提供一种计算器设备,其中,包括:
[0052] 处理器;以及
[0053] 被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:
[0054] 获取待推荐关键词的商品描述信息;
[0055] 将所述待推荐关键词的商品描述信息进行拆分得到对应拆分词;
[0056] 根据所述待推荐关键词的商品描述信息所包含的拆分词,将所述待推荐关键词的商品描述信息转化为对应的第一原始特征向量;
[0057] 计算每个拆分词在所述待推荐关键词的商品描述信息中的出现的次数作为第一统计次数,计算每个拆分词在所有的商品描述信息中出现的次数作为第二统计次数;
[0058] 根据所述第一和第二统计次数得到每个拆分词对应的第一权重,根据每个拆分词对应的第一权重对每个第一原始特征向量进行调整,得到每个对应于第一原始特征向量的第一修正特征向量;
[0059] 将各个第一修正特征向量输入一关键词推荐贝叶斯模型,所述贝叶斯模型存储有各个推荐关键词及其对应的关键词特征向量,获取所述关键词推荐贝叶斯模型基于各个第一修正特征向量与关键词特征向量的相似度比较结果,输出的与所述待推荐关键词的商品描述信息的相似度大于预设阈值的推荐关键词。
[0060] 与现有技术相比,本发明通过获取待推荐关键词的商品描述信息;将所述待推荐关键词的商品描述信息进行拆分得到对应拆分词;根据所述待推荐关键词的商品描述信息所包含的拆分词,将所述待推荐关键词的商品描述信息转化为对应的第一原始特征向量;计算每个拆分词在所述待推荐关键词的商品描述信息中的出现的次数作为第一统计次数,计算每个拆分词在所有的商品描述信息中出现的次数作为第二统计次数;根据所述第一和第二统计次数得到每个拆分词对应的第一权重,根据每个拆分词对应的第一权重对每个第一原始特征向量进行调整,得到每个对应于第一原始特征向量的第一修正特征向量;将各个第一修正特征向量输入一关键词推荐贝叶斯模型,所述贝叶斯模型存储有各个推荐关键词及其对应的关键词特征向量,获取所述关键词推荐贝叶斯模型基于各个第一修正特征向量与关键词特征向量的相似度比较结果,输出的与所述待推荐关键词的商品描述信息的相似度大于预设阈值的推荐关键词,可以实现商品描述信息对应的关键词的精确推荐。

附图说明

[0061] 通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
[0062] 图1示出本发明一实施例的关键词推荐方法的流程图;
[0063] 图2示出本发明另一实施例的关键词推荐方法的流程图。
[0064] 附图中相同或相似的附图标记代表相同或相似的部件。

具体实施方式

[0065] 下面结合附图对本发明作进一步详细描述。
[0066] 在本申请一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
[0067] 内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM)。内存是计算机可读介质的示例。
[0068] 计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
[0069] 本发明的一具体应用实施中,包括如下步骤:
[0070] 一、准备训练数据
[0071] (1)根据词库中的推荐关键词,搜索商品描述信息,例如得到:
[0072] 推荐关键词为连衣裙的商品描述信息为:2017春新款显瘦连衣裙、2017春大码连衣裙
[0073] 推荐关键词为风衣的的商品描述信息为:2017中长款风衣、2017春秋欧美风衣[0074] (2)对上述商品描述信息分词分别得到对应的拆分词如下:
[0075] ["2017","春","新款","显瘦","连衣裙"]
[0076] ["2017","春","大码","连衣裙"]
[0077] ["2017","中长款","风衣"]
[0078] ["2017","春","秋","欧美","风衣"]
[0079] (3)根据当前商品描述信息所包含的拆分词,将当前商品描述信息转化为对应的第二原始特征向量
[0080] 首先设置上述拆分词在第二原始特征向量中对应的维度如下:
[0081] 2017=0,春=1,新款=2,显瘦=3,连衣裙=4,大码=5,中长款=6,风衣=7,秋=8,欧美=9
[0082] 则得到各个对应的第二原始特征向量如下:
[0083] [1,1,1,1,1,0,0,0,0,0]
[0084] [1,1,0,0,1,1,0,0,0,0]
[0085] [1,0,0,0,0,0,1,1,0,0]
[0086] [1,1,0,0,0,0,0,1,1,1]
[0087] (4)得到推荐关键词与第二原始特征向量的对应关系,即第二原始特征向量带上标签,如下
[0088] ["连衣裙",[1,1,1,1,1,0,0,0,0,0]]
[0089] ["连衣裙",[1,1,0,0,1,1,0,0,0,0]]
[0090] ["风衣",[1,0,0,0,0,0,1,1,0,0]]
[0091] ["风衣",[1,1,0,0,0,0,0,1,1,1]]
[0092] (5)调整权重
[0093] 以商品描述信息"2017春新款显瘦连衣裙"为例:
[0094] 计算词频(term frequency,TF)作为第三统计次数
[0095] TF=该拆分词在当前商品描述信息中出现的次数/当前商品描述信息中的拆分词总数
[0096] TF(春)=1/5=0.2
[0097] 计算逆文档频率(inverse document frequency,IDF)作为第四统计次数[0098] IDF=log(商品描述信息总数/包含该拆分词的商品描述信息数)
[0099] IDF(春)=log(4/3)=0.12
[0100] TF-IDF(春)=0.2*0.12=0.02
[0101] 其他的词:
[0102] TF-IDF(2017)=0,
[0103] TF-IDF(新款)=(1/5)*log(4/1)=0.12
[0104] TF-IDF(显瘦)=0.12
[0105] TF-IDF(连衣裙)=(1/5)*log(4/2)=0.06
[0106] 则,可以得到调整后的第二修正特征向量如下:
[0107] ["连衣裙",[0,0.02,0.12,0.12,0.06,0,0,0,0,0]]
[0108] 二、训练关键词推荐贝叶斯模型
[0109] 将推荐关键词及对应的第二修正特征向量即调整后的标签及第二修正特征向输入,训练贝叶斯模型即可;
[0110] 三、使用贝叶斯模型做预测
[0111] 例如用户输入为:2017新款韩版连衣裙
[0112] (1)分词:["2017","新款","韩版","连衣裙"]
[0113] (2)转换为第一原始特征向量:[1,0,1,0,1,0,0,0,0,0]
[0114] (3)调整权重得到第一修正特征向量:[0,0,0.15,0,0.08,0,0,0,0,0][0115] (4)将第一修正特征向量输入先前训练的关键词推荐贝叶斯模型
[0116] (5)得到对于每个推荐关键词的相似度预测,例如
[0117] (6)推荐关键词连衣裙与第一修正特征向量[0,0,0.15,0,0.08,0,0,0,0,0]的相似度为:0.8
[0118] (7)推荐关键词风衣与第一修正特征向量[0,0,0.15,0,0.08,0,0,0,0,0]的相似度为:0.2
[0119] (8)可以输出推荐关键词连衣裙相似度高的推荐关键词连衣裙。
[0120] 如图1所示,本发明一实施例的一种商品的关键词推荐方法,包括:
[0121] 步骤S1,获取待推荐关键词的商品描述信息;
[0122] 步骤S2,将所述待推荐关键词的商品描述信息进行拆分得到对应拆分词;
[0123] 例如,用户输入为:2017新款韩版连衣裙,得到“2017新款韩版连衣裙”所包含的拆分词为["2017","新款","韩版","连衣裙"]
[0124] 步骤S3,根据所述待推荐关键词的商品描述信息所包含的拆分词,将所述待推荐关键词的商品描述信息转化为对应的第一原始特征向量;
[0125] 例如,根据2017新款韩版连衣裙”所包含的拆分词为["2017","新款","韩版","连衣裙"],将所述待推荐关键词的商品描述信息转化为对应的第一原始特征向量:[1,0,1,0,1,0,0,0,0,0];
[0126] 步骤S4,计算每个拆分词在所述待推荐关键词的商品描述信息中的出现的次数作为第一统计次数,计算每个拆分词在所有的商品描述信息中出现的次数作为第二统计次数;
[0127] 例如,可以计算词频(term frequency,TF)作为第以统计次数,TF=该拆分词在当前商品描述信息中出现的次数/当前商品描述信息中的拆分词总数;
[0128] 可以计算逆文档频率(inverse document frequency,IDF)作为第二统计次数,IDF=log(商品描述信息总数/包含该拆分词的商品描述信息数);
[0129] 步骤S5,根据所述第一和第二统计次数得到每个拆分词对应的第一权重,根据每个拆分词对应的第一权重对每个第一原始特征向量进行调整,得到每个对应于第一原始特征向量的第一修正特征向量;
[0130] 例如,上述第一原始特征向量:[1,0,1,0,1,0,0,0,0,0]进行调整后,得到的第一修正特征向量为:[0,0,0.15,0,0.08,0,0,0,0,0];
[0131] 步骤S6,将各个第一修正特征向量输入一关键词推荐贝叶斯模型,所述贝叶斯模型存储有各个推荐关键词及其对应的关键词特征向量,获取所述关键词推荐贝叶斯模型基于各个第一修正特征向量与关键词特征向量的相似度比较结果,输出的与所述待推荐关键词的商品描述信息的相似度大于预设阈值的推荐关键词。
[0132] 例如,推荐关键词连衣裙与第一修正特征向量[0,0,0.15,0,0.08,0,0,0,0,0]的相似度为:0.8;
[0133] 推荐关键词风衣与第一修正特征向量[0,0,0.15,0,0.08,0,0,0,0,0]的相似度为:0.2;
[0134] 则可以输出推荐关键词连衣裙相似度高的推荐关键词连衣裙。
[0135] 在此,本实施例可以实现商品描述信息对应的关键词的精确推荐。
[0136] 如图2所示,本发明的商品的关键词推荐方法一实施例中,步骤S7,将各个第一修正特征向量输入一关键词推荐贝叶斯模型之前,还包括:
[0137] 步骤S61,从词库中获取各个推荐关键词;例如,词库中的推荐关键词为连衣裙、风衣;
[0138] 步骤S62,获取对应于各个推荐关键词的商品描述信息;例如,根据词库中的推荐关键词,搜索商品描述信息,得到推荐关键词为连衣裙的商品描述信息为:2017春新款显瘦连衣裙、2017春大码连衣裙;推荐关键词为风衣的商品描述信息为2017中长款风衣、2017春秋欧美风衣;
[0139] 步骤S63,依次将每个商品描述信息作当前商品描述信息后,进行如下步骤S631~步骤S634操作:
[0140] 步骤S631,将当前商品描述信息进行拆分,得到对应拆分词;
[0141] 例如,商品描述信息“2017春新款显瘦连衣裙”对应拆分为["2017","春","新款","显瘦","连衣裙"];
[0142] 商品描述信息“2017春大码连衣裙”对应拆分为["2017","春","大码","连衣裙"];
[0143] 商品描述信息“2017中长款风衣”对应拆分为["2017","中长款","风衣"];
[0144] 商品描述信息“2017春秋欧美风衣”对应拆分为["2017","春","秋","欧美","风衣"];
[0145] 步骤S632,根据当前商品描述信息所包含的拆分词,将当前商品描述信息转化为对应的第二原始特征向量;
[0146] 例如,预设有10维的第二原始特征向量,上述拆分词在第二原始特征向量中对应的维度如下:
[0147] 2017=0,春=1,新款=2,显瘦=3,连衣裙=4,大码=5,中长款=6,风衣=7,秋=8,欧美=9;
[0148] 那么,商品描述信息“2017春新款显瘦连衣裙”所包含的拆分词为["2017","春","新款","显瘦","连衣裙"],则对应的第二原始特征向量为[1,1,1,1,1,0,0,0,0,0],对应可生成推荐关键词的第二原始特征向量为["连衣裙",[1,1,1,1,1,0,0,0,0,0]];
[0149] 商品描述信息“2017春大码连衣裙”所包含的拆分词为["2017","春","大码","连衣裙"],则对应的第二原始特征向量为[1,1,0,0,1,1,0,0,0,0],对应可生成推荐关键词的第二原始特征向量为["连衣裙",[1,1,0,0,1,1,0,0,0,0]];
[0150] 商品描述信息“2017中长款风衣”所包含的拆分词为["2017","中长款","风衣"],则对应的第二原始特征向量为[1,0,0,0,0,0,1,1,0,0],对应可生成推荐关键词的第二原始特征向量为["风衣",[1,0,0,0,0,0,1,1,0,0]];
[0151] 商品描述信息“2017春秋欧美风衣”所包含的拆分词为["2017","春","秋","欧美","风衣"],则对应的第二原始特征向量为[1,1,0,0,0,0,0,1,1,1],对应可生成推荐关键词的第二原始特征向量为["风衣",[1,1,0,0,0,0,0,1,1,1]];
[0152] 步骤S633,根据每个拆分词在当前商品描述信息中的出现的次数计算第三统计次数,根据每个拆分词在所有的商品描述信息中出现的次数计算第四统计次数;
[0153] 例如,以上述商品描述信息"2017春新款显瘦连衣裙"为例:
[0154] 计算词频(term frequency,TF)作为第三统计次数,TF=该拆分词在当前商品描述信息中出现的次数/当前商品描述信息中的拆分词总数,如计算得到TF(春)=1/5=0.2;
[0155] 计算逆文档频率(inverse document frequency,IDF)作为第四统计次数,IDF=log(商品描述信息总数/包含该拆分词的商品描述信息数),如计算得到IDF(春)=log(4/3)=0.12;
[0156] 步骤S634,根据所述第三和第四统计次数得到每个拆分词对应的第二权重,根据每个拆分词对应的第二权重对所述第二原始特征向量进行调整,得到每个对应于所述第二原始特征向量的第二修正特征向量;
[0157] 例如,根据所述第三和第四统计次数TF-IDF,得到每个拆分词对应的第二权重如下:
[0158] TF-IDF(春)=0.2*0.12=0.02;
[0159] TF-IDF(2017)=0;
[0160] TF-IDF(新款)=(1/5)*log(4/1)=0.12;
[0161] TF-IDF(显瘦)=0.12;
[0162] TF-IDF(连衣裙)=(1/5)*log(4/2)=0.06;
[0163] 则,商品描述信息"2017春新款显瘦连衣裙"的调整好的第二修正特征向量为["连衣裙",[0,0.02,0.12,0.12,0.06,0,0,0,0,0]];
[0164] 步骤S635,将所述第二修正特征向量,作为当前商品描述信息所对应的推荐关键词的关键词特征向量;
[0165] 步骤S64,将所有推荐关键词及其对应的关键词特征向量作为输入训练贝叶斯模型,以得到所述关键词推荐贝叶斯模型。
[0166] 在此,可将推荐关键词及对应的第二修正特征向量即调整后的标签及特征值输入,训练贝叶斯模型即可。
[0167] 本实施例可以实现得到可靠的关键词推荐贝叶斯模型,进而,进一步保证商品描述信息对应的关键词的精确推荐。
[0168] 本发明的商品的关键词推荐方法一实施例中,步骤S7,输出的与所述待推荐关键词的商品描述信息的相似度大于预设阈值的推荐关键词,包括:
[0169] 输出的与所述待推荐关键词的商品描述信息的相似度大于预设阈值的推荐关键词,及所述推荐关键词与所述待推荐关键词的商品描述信息的相似度,以便于用户更清晰的了解推荐关键词相似度情况。
[0170] 本发明的商品的关键词推荐方法一实施例中,步骤S5,根据所述第一和第二统计次数得到每个拆分词对应的第一权重中,
[0171] 所述第一权重的大小与所述第一统计次数成正比,且与所述第二统计次数成反比。
[0172] 在此,若一个拆分词在一个商品描述信息中出现的次数越多,说明这个拆分词能够很好代表这个商品描述信息的特征,而且该拆分词在其他商品描述信息中很少出现,则认为拆分词具有很好的区分其它商品描述信息的能力。
[0173] 本发明的商品的关键词推荐方法一实施例中步骤S634,根据所述第三和第四统计次数得到每个拆分词对应的第二权重中,
[0174] 所述第二权重的大小与所述第三统计次数成正比,且与所述第四统计次数成反比。
[0175] 在此,若一个拆分词在一个商品描述信息中出现的次数越多,说明这个拆分词能够很好代表这个商品描述信息的特征,而且该拆分词在其他商品描述信息中很少出现,则认为拆分词具有很好的区分其它商品描述信息的能力。
[0176] 根据本发明的另一面,还提供一种商品的关键词推荐设备,其中,该设备包括:
[0177] 第一获取模块,用于获取待推荐关键词的商品描述信息;
[0178] 第一拆分模块,用于将所述待推荐关键词的商品描述信息进行拆分得到对应拆分词;
[0179] 第一转化模块,用于根据所述待推荐关键词的商品描述信息所包含的拆分词,将所述待推荐关键词的商品描述信息转化为对应的第一原始特征向量;
[0180] 第一计算模块,用于计算每个拆分词在所述待推荐关键词的商品描述信息中的出现的次数作为第一统计次数,计算每个拆分词在所有的商品描述信息中出现的次数作为第二统计次数;
[0181] 第一调整模块,用于根据所述第一和第二统计次数得到每个拆分词对应的第一权重,根据每个拆分词对应的第一权重对每个第一原始特征向量进行调整,得到每个对应于第一原始特征向量的第一修正特征向量;
[0182] 推荐模块,用于将各个第一修正特征向量输入一关键词推荐贝叶斯模型,所述贝叶斯模型存储有各个推荐关键词及其对应的关键词特征向量,获取所述关键词推荐贝叶斯模型基于各个第一修正特征向量与关键词特征向量的相似度比较结果,输出的与所述待推荐关键词的商品描述信息的相似度大于预设阈值的推荐关键词。
[0183] 本发明的关键词推荐设备一实施例中,还包括:
[0184] 第二获取模块,用于从词库中获取各个推荐关键词,获取对应于各个推荐关键词的商品描述信息;
[0185] 处理模块,用于依次将每个商品描述信息作当前商品描述信息后,重复如下处理:将当前商品描述信息进行拆分,得到对应拆分词;根据当前商品描述信息所包含的拆分词,将当前商品描述信息转化为对应的第二原始特征向量;根据每个拆分词在当前商品描述信息中的出现的次数计算第三统计次数,根据每个拆分词在所有的商品描述信息中出现的次数计算第四统计次数;根据所述第三和第四统计次数得到每个拆分词对应的第二权重,根据每个拆分词对应的第二权重对所述第二原始特征向量进行调整,得到每个对应于所述第二原始特征向量的第二修正特征向量;将所述第二修正特征向量,作为当前商品描述信息所对应的推荐关键词的关键词特征向量;
[0186] 训练模块,用于将所有推荐关键词及其对应的关键词特征向量作为输入训练贝叶斯模型,以得到所述关键词推荐贝叶斯模型。
[0187] 本发明的关键词推荐设备一实施例中,所述处理模块,用于根据所述第二权重的大小与所述第三统计次数成正比,且与所述第四统计次数成反比,得到每个拆分词对应的第二权重。
[0188] 本发明的关键词推荐设备一实施例中,所述处理模块,用于计算词频TF作为第三统计次数,其中,TF=该拆分词在当前商品描述信息中出现的次数/当前商品描述信息中的拆分词总数;计算逆文档频率IDF作为第四统计次数,IDF=log(商品描述信息总数/包含该拆分词的商品描述信息数)。
[0189] 本发明的关键词推荐设备一实施例中,所述推荐模块,用于输出的与所述待推荐关键词的商品描述信息的相似度大于预设阈值的推荐关键词,及所述推荐关键词与所述待推荐关键词的商品描述信息的相似度。
[0190] 本发明的关键词推荐设备一实施例中,所述第一调整模块,用于根据所述第一权重的大小与所述第一统计次数成正比,且与所述第二统计次数成反比,得到每个拆分词对应的第一权重。
[0191] 本发明的关键词推荐设备一实施例中,所述计算模块,用于计算词频TF作为所述第一统计次数,其中,TF=该拆分词在当前商品描述信息中出现的次数/当前商品描述信息中的拆分词总数;计算逆文档频率IDF作为第二统计次数,其中,IDF=log(商品描述信息总数/包含该拆分词的商品描述信息数)。
[0192] 根据本发明的另一面,还提供一种计算机可读存储介质,其上存储有计算机可执行指令,其中,该计算机可执行指令被处理器执行时使得该处理器:
[0193] 获取待推荐关键词的商品描述信息;
[0194] 将所述待推荐关键词的商品描述信息进行拆分得到对应拆分词;
[0195] 根据所述待推荐关键词的商品描述信息所包含的拆分词,将所述待推荐关键词的商品描述信息转化为对应的第一原始特征向量;
[0196] 计算每个拆分词在所述待推荐关键词的商品描述信息中的出现的次数作为第一统计次数,计算每个拆分词在所有的商品描述信息中出现的次数作为第二统计次数;
[0197] 根据所述第一和第二统计次数得到每个拆分词对应的第一权重,根据每个拆分词对应的第一权重对每个第一原始特征向量进行调整,得到每个对应于第一原始特征向量的第一修正特征向量;
[0198] 将各个第一修正特征向量输入一关键词推荐贝叶斯模型,所述贝叶斯模型存储有各个推荐关键词及其对应的关键词特征向量,获取所述关键词推荐贝叶斯模型基于各个第一修正特征向量与关键词特征向量的相似度比较结果,输出的与所述待推荐关键词的商品描述信息的相似度大于预设阈值的推荐关键词。
[0199] 根据本发明的另一面,还提供一种计算器设备,其中,包括:
[0200] 处理器;以及
[0201] 被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:
[0202] 获取待推荐关键词的商品描述信息;
[0203] 将所述待推荐关键词的商品描述信息进行拆分得到对应拆分词;
[0204] 根据所述待推荐关键词的商品描述信息所包含的拆分词,将所述待推荐关键词的商品描述信息转化为对应的第一原始特征向量;
[0205] 计算每个拆分词在所述待推荐关键词的商品描述信息中的出现的次数作为第一统计次数,计算每个拆分词在所有的商品描述信息中出现的次数作为第二统计次数;
[0206] 根据所述第一和第二统计次数得到每个拆分词对应的第一权重,根据每个拆分词对应的第一权重对每个第一原始特征向量进行调整,得到每个对应于第一原始特征向量的第一修正特征向量;
[0207] 将各个第一修正特征向量输入一关键词推荐贝叶斯模型,所述贝叶斯模型存储有各个推荐关键词及其对应的关键词特征向量,获取所述关键词推荐贝叶斯模型基于各个第一修正特征向量与关键词特征向量的相似度比较结果,输出的与所述待推荐关键词的商品描述信息的相似度大于预设阈值的推荐关键词。
[0208] 本发明的计算机可读存储介质及设备各实施例的详细内容,具体可参见各方法实施例的对应部分,在此不再赘述。
[0209] 显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
[0210] 需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
[0211] 另外,本发明的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本发明的方法和/或技术方案。而调用本发明的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本发明的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本发明的多个实施例的方法和/或技术方案。
[0212] 对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
高效检索全球专利

IPRDB是专利检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,专利查询、专利分析

电话:13651749426

侵权分析

IPRDB的侵权分析产品是IPRDB结合多位一线专利维权律师和专利侵权分析师的智慧,开发出来的一款特色产品,也是市面上唯一一款帮助企业研发人员、科研工作者、专利律师、专利分析师快速定位侵权分析的产品,极大的减少了用户重复工作量,提升工作效率,降低无效或侵权分析的准入门槛。

立即试用