一种基于图嵌入模型的上下文感知音乐推荐方法转让专利

申请号 : CN201610902186.9

文献号 : CN106528653B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 邓水光王东京向正哲李莹吴健尹建伟吴朝晖

申请人 : 浙江大学

摘要 :

本发明公开了一种基于图嵌入模型的上下文感知音乐推荐方法,包括:S1.基于图嵌入模型的音乐特征的提取;S2.用户全局音乐兴趣和上下文音乐兴趣的提取和建模;S3.上下文感知的音乐推荐。本发明利用图嵌入模型从用户的播放数据和音乐的元数据中提取音乐的特征,再从用户的完整播放记录和近期播放记录中获取用户的全局音乐兴趣和上下文音乐兴趣,最后在推荐的时候综合考虑用户的全局兴趣和当前上下文兴趣,从而能够让推荐的音乐符合用户的实时需求和偏好,从而减少用户的搜索成本并提高用户的满意度。

权利要求 :

1.一种基于图嵌入模型的上下文感知音乐推荐方法,包括如下步骤:

(1)收集用户的完整音乐收听序列以及所有音乐的标签信息;所述完整音乐收听序列包含用户历史对于音乐的每条收听记录,所述标签信息包括音乐的演唱者、所属专辑和曲风类型;

(2)根据所有用户的完整音乐收听序列以及所有音乐的元数据,建立包含用户-音乐交互图、音乐-音乐转移图和音乐-标签知识图的异构信息模型;

所述用户-音乐交互图中用户与音乐之间通过边线连接,其中用户u与音乐mj之间边线的权重 tu,mj为用户u收听音乐mj的次数,u∈U,U表示由所有用户组成的用户集群;

所述音乐-音乐转移图中音乐与音乐之间通过边线连接,其中音乐mi与音乐mj之间边线的权重 tmi,mj为音乐mi和音乐mj被一起收听的次数,即在同一完整音乐收听序列中若音乐mi与音乐mj对应的收听记录在一定间隔范围内,则判定音乐mi和音乐mj被同时收听;

所述音乐-标签知识图中音乐与标签之间通过边线连接,其中音乐mj与标签d之间边线的权重 td,mj为音乐mj被赋予标签d的次数,d∈D,D表示由所有标签组成的标签库;

(3)根据所述异构信息模型建立以下目标函数L:

其中: 表示音乐-音乐转移图中音乐mi与音乐mj之间边线的权重, 表示音乐mi与音乐mj的间接关系权重,p(mi,mj)表示音乐mi和音乐mj被一起收听的概率,M表示由所有音乐组成的乐库;

所述间接关系权重 的表达式如下:

其中: 为用户-音乐交互图中音乐mi的所有边线权重组成的向量, 为用户-音乐交互图中音乐mj的所有边线权重组成的向量, 为音乐-标签知识图中音乐mi的所有边线权重组成的向量, 为音乐-标签知识图中音乐mj的所有边线权重组成的向量,cos(A,B)表示向量A和向量B的余弦相似度, 表示两个向量的拼接操作;

所述概率p(mi,mj)的表达式如下:

其中: 和 分别为音乐mi和音乐mj的特征向量,T表示向量转置;

(4)对上述目标函数L进行最小化求解,以求得乐库M中每首音乐的特征向量;

(5)对用户完整音乐收听序列中所有收听记录对应的音乐特征向量求平均,得到用户的全局音乐兴趣向量;

(6)从用户完整音乐收听序列中提取当前时刻之前一段时间内的收听记录组成近期音乐收听序列;进而对近期音乐收听序列中所有收听记录对应的音乐特征向量求平均,得到用户的上下文音乐兴趣向量;

(7)根据每首音乐的特征向量以及用户的全局音乐兴趣向量和上下文音乐兴趣向量,通过以下公式计算出用户对于每首音乐的兴趣值;进而根据兴趣值对乐库中的所有音乐从大到小排序,并提取兴趣值最大的若干首音乐推荐给用户;

其中:xu,i为用户u对于音乐mi的兴趣值, 和 分别为音乐mi和音乐mj的特征向量,vu为用户u的全局音乐兴趣向量,zu为用户u的上下文音乐兴趣向量,T表示向量转置,u∈U,U表示由所有用户组成的用户集群。

说明书 :

一种基于图嵌入模型的上下文感知音乐推荐方法

技术领域

[0001] 本发明属于数据挖掘及推荐技术领域,具体涉及一种基于图嵌入模型的上下文感知音乐推荐方法。

背景技术

[0002] 随着数字音乐产业的发展,出现了越来越多的在线数字音乐提供商,允许用户可以随时随地收听喜欢的音乐,例如苹果在线音乐商店提供了超过3000万首数字音乐。同时,海量的音乐数据增加了用户寻找其感兴趣的音乐的难度。此外,用户的听歌喜好通常会随着时间、空间、天气、身体状况不同而变化,传统的音乐推荐系统已不适用于个性化移动网络服务领域。近年来,基于上下文感知的混合音乐推荐系统通过将上下文信息和辅助信息引入推荐系统,成为一个新兴的研究领域。在研究中发现,把上下文信息和辅助信息融入推荐系统,相当于把传统的“用户-项目”二维评分效用模型扩展为包含多种上下文信息和辅助信息的多维评分效用模型,有利于提高推荐精确度。因此基于上下文感知的混合音乐推荐系统具有重要的研究意义。
[0003] 目前,上下文感知的音乐混合推荐方法通常采用了“多维推荐”转化为“二维推荐”的设计思路,在推荐结果生成之前、生成之后或者生成的过程中,利用当前上下文信息过滤掉与当前上下文信息不匹配的数据,同时采用传统二维推荐技术(包含协同过滤、基于内容的过滤、基于知识的过滤、混合式过滤等)生成推荐结果。因为利用了传统推荐系统的成熟技术,此类方法成为目前应用最广的上下文感知推荐方法。
[0004] 然而,现有技术在音乐与用户的匹配过程只考虑了用户的上下文信息和部分辅助,缺乏对音乐内容的深层解析,认为所有音乐都是同质的,音乐的不同属性来自用户在不同情境下对音乐具有的不同喜好程度,即由音乐的用户属性对不同音乐进行差异化区分,从而忽略了音乐作为一类多媒体文件,其自身具有的上下文属性。这种推荐方法过于主观,降低了用户与音乐的耦合性,而且没有结合音乐的辅助信息,例如音乐的播放序列和元数据,从而对推荐系统的精度有所影响。在很多场景下,用户的收听上下文往往会主导用户的需求,例如用户的全局偏好包括摇滚乐和纯音乐,但是用户在晚上休息的时候,会更喜欢后者。

发明内容

[0005] 针对现有技术所存在的上述技术问题,本发明提供了一种基于图嵌入模型的上下文感知音乐推荐方法,能够让推荐的音乐符合用户的实时需求和偏好。
[0006] 一种基于图嵌入模型的上下文感知音乐推荐方法,包括如下步骤:
[0007] (1)收集用户的完整音乐收听序列以及所有音乐的标签信息;所述完整音乐收听序列包含用户历史对于音乐的每条收听记录,所述标签信息包括音乐的演唱者(或演奏者)、所属专辑和曲风类型;
[0008] (2)根据所有用户的完整音乐收听序列以及所有音乐的元数据,建立包含用户-音乐交互图、音乐-音乐转移图和音乐-标签知识图的异构信息模型;
[0009] (3)根据所述异构信息模型建立以下目标函数L:
[0010]
[0011] 其中: 表示音乐-音乐转移图中音乐mi与音乐mj之间边线的权重, 表示音乐mi与音乐mj的间接关系权重,p(mi,mj)表示音乐mi和音乐mj被一起收听的概率,M表示由所有音乐组成的乐库;
[0012] (4)对上述目标函数L进行最小化求解,以求得乐库M中每首音乐的特征向量;
[0013] (5)对用户完整音乐收听序列中所有收听记录对应的音乐特征向量求平均,得到用户的全局音乐兴趣向量;
[0014] (6)从用户完整音乐收听序列中提取当前时刻之前一段时间内的收听记录组成近期音乐收听序列;进而对近期音乐收听序列中所有收听记录对应的音乐特征向量求平均,得到用户的上下文音乐兴趣向量;
[0015] (7)根据每首音乐的特征向量以及用户的全局音乐兴趣向量和上下文音乐兴趣向量,计算出用户对于每首音乐的兴趣值;进而根据兴趣值对乐库中的所有音乐从大到小排序,并提取兴趣值最大的若干首音乐推荐给用户。
[0016] 所述用户-音乐交互图中用户与音乐之间通过边线连接,其中用户u与音乐mj之间边线的权重 tu,mj为用户u收听音乐mj的次数,u∈U,U表示由所有用户组成的用户集群。
[0017] 所述音乐-音乐转移图中音乐与音乐之间通过边线连接,其中音乐mi与音乐mj之间边线的权重 tmi,mj为音乐mi和音乐mj被一起收听的次数,即在同一完整音乐收听序列中若音乐mi与音乐mj对应的收听记录在一定间隔范围内,则判定音乐mi和音乐mj被同时收听。
[0018] 所述音乐-标签知识图中音乐与标签之间通过边线连接,其中音乐mj与标签d之间边线的权重 td,mj为音乐mj被赋予标签d的次数,d∈D,D表示由所有标签组成的标签库。
[0019] 所述间接关系权重 的表达式如下:
[0020]
[0021] 其中: 为用户-音乐交互图中音乐mi的所有边线权重组成的向量, 为用户-音乐交互图中音乐mj的所有边线权重组成的向量, 为音乐-标签知识图中音乐mi的所有边线权重组成的向量, 为音乐-标签知识图中音乐mj的所有边线权重组成的向量,cos(A,B)表示向量A和向量B的余弦相似度, 表示两个向量的拼接操作。
[0022] 所述概率p(mi,mj)的表达式如下:
[0023]
[0024] 其中: 和 分别为音乐mi和音乐mj的特征向量,T表示向量转置。
[0025] 所述步骤(7)中通过以下公式计算用户对于每首音乐的兴趣值:
[0026]
[0027] 其中:xu,i为用户u对于音乐mi的兴趣值, 和 分别为音乐mi和音乐mj的特征向量,vu为用户u的全局音乐兴趣向量,zu为用户u的上下文音乐兴趣向量,T表示向量转置,u∈U,U表示由所有用户组成的用户集群。
[0028] 本发明首次利用图嵌入模型从用户的播放数据和音乐的元数据中获取音乐的特征向量和用户的全局兴趣特征向量,为音乐特征提取困难提供了一种可靠的解决方法;本发明根据用户的播放记录中的音乐的特征向量获取用户的全局音乐兴趣和上下文音乐兴趣,为用户的兴趣的提取和建模困难的问题提供了一种可行的思路;综合考虑用户全局兴趣和上下文兴趣的推荐方法,本发明能够使得推荐的音乐更符合目标用户当前的偏好,从而减少用户的搜索成本并提高用户的满意度。

附图说明

[0029] 图1为本发明音乐推荐方法的系统架构示意图。
[0030] 图2为本发明音乐推荐方法中用户音乐偏好预测的流程示意图。
[0031] 图3为本发明音乐推荐方法中利用用户播放数据和音乐的元数据构建信息异构模型的示意图。

具体实施方式

[0032] 为了更为具体地描述本发明,下面结合附图及具体实施方式对本发明的技术方案进行详细说明。
[0033] 本发明基于图嵌入模型的上下文感知的音乐推荐方法,包括以下步骤:
[0034] (1)收集用户的完整音乐播放数据和所有音乐的元数据,完整音乐播放数据包含用户历史对于音乐的每条播放记录,音乐的元数据包括歌手信息、专辑信息和标签信息。
[0035] (2)根据所有用户的完整音乐播放数据和所有音乐的元数据构建异构信息模型,如图3所示,异构信息模型包括用户-音乐交互图、音乐-音乐转移图和音乐-元数据知识图。
[0036] 用户-音乐交互图中,用户ui和音乐mj之间的边权重为 其中t是用户ui播放音乐mj的次数;音乐-音乐转移图中,音乐mi和mj之间的边的权重为 其中t是音乐mi和mj一起播放的次数;音乐-元数据知识图中,音乐mi和元数据dj之间的边的权重为 其中t是音乐mi被赋予元数据dj的次数。
[0037] (3)利用图嵌入模型处理异构信息图,将每首音乐表示为特征向量,该图嵌入模型的目标函数公式为:
[0038]
[0039] 其中,Em,m表示音乐-音乐转移图中的所有边, 表示Em,m中音乐mi和mj之间的边的权重,p(mi,mj)表示音乐mi和mj被一起播放的概率,定义为:
[0040]
[0041] 其中,其中: 和 分别表示音乐mi和mj的特征向量,T表示转置。
[0042] 表示音乐mi和mj在音乐-用户交互图和音乐-元数据知识图中的间接关系权重,定义为:
[0043]
[0044] 其中: 表示mi在用户-音乐交互图中的相邻节点权重向量, 表示mi在音乐-元数据知识图中的相邻节点权重向量,cos
(·,·)是两个向量的余弦相似度, 表示两个向量的拼接操作。
[0045] (4)通过最小化目标函数O即可得到每首音乐m的特征向量 其中,具有相似播放上下文(在播放序列中m前面及后面的音乐)的音乐具有相似的特征向量,具有相似收听用户或者相似元数据的音乐具有相似的特征向量。此处可根据对效率和准确度的要求指定向量的维度,从而获得合适的特征向量(利用高维度特征向量的推荐结果更准确,而低维度特征向量的计算效率更高)。
[0046] (5)对用户的完整音乐播放数据中各条记录所对应的音乐的特征向量求平均,得到用户的全局音乐兴趣向量;从用户完整音乐播放数据中提取当前时刻之前一段时间内的播放记录组成近期音乐播放序列,进而对近期音乐播放序列中各条播放记录所对应音乐的特征向量求平均,得到用户的上下文音乐兴趣向量。
[0047] (6)根据用户的全局兴趣向量和上下文兴趣向量,计算目标用户u对音乐mi的兴趣,计算公式如下:
[0048]
[0049] 其中:u表示目标用户,mi是音乐库中的某首音乐; 是用户的全局兴趣向量,是用户的上下文兴趣向量; 是音乐mi的特征向量,M是音乐库。
[0050] (7)利用上步的计算结果对所有音乐进行排序,把前N个推荐给目标用户u,排序的计算公式如下:
[0051]
[0052] 其中:u表示目标用户;mi和mj是音乐库中的音乐; 是用户的全局兴趣向量,是用户的上下文兴趣向量。
[0053] 图1所示了本实施方式基于图嵌入模型的上下文感知的音乐推荐方法的架构。该推荐方法分为两个主要模块:预处理模块和预测模块。预处理模块中,首先获取用户的所有播放数据和元数据并构建异构信息图;再利用图嵌入模型从异构信息图中提取音乐的特征向量。在预测模块中,首先从目标用户完整播放记录和近期播放记录中获取用户的全局音乐兴趣和上下文音乐兴趣;然后根据用户的全局兴趣和上下文兴趣给用户推荐推荐合适的音乐。
[0054] 图2展示了用户偏好预测的详细步骤,其首先获取用户的完整播放记录和近期播放记录,并从中提取用户的全局音乐兴趣和上下文音乐兴趣,然后利用用户的全局兴趣和上下文兴趣,计算目标用户u对音乐mi的兴趣。
[0055] 上述对实施例的描述是为便于本技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对上述实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于上述实施例,本领域技术人员根据本发明的揭示,对于本发明做出的改进和修改都应该在本发明的保护范围之内。