会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利库 / 电脑零配件 / 向量处理 / 信息处理设备、信息处理方法、记录介质和计算机程序

信息处理设备、信息处理方法、记录介质和计算机程序

阅读:408发布:2021-02-22

IPRDB可以提供信息处理设备、信息处理方法、记录介质和计算机程序专利检索,专利查询,专利分析的服务。并且本发明提供一种信息处理设备、信息处理方法、记录介质和计算机程序,产生代表节目的属性的节目向量。在步骤S11,接收EPG数据。在步骤S12,从EPG数据抽取产生节目向量PP所必需的元数据。在步骤S13,对包括在元数据中的内容标题进行词法分析,从而把内容和标题分解成单词。在步骤S14,对包括在元数据中的项目进行向量产生处理,从而产生节目向量PP。在步骤S15,根据与元数据相关的节目的类型,抽取效应向量。在步骤S16,使抽取的效应向量与产生的节目向量PP相关联,并结束处理。本发明可被应用于分发内容的分发服务器。,下面是信息处理设备、信息处理方法、记录介质和计算机程序专利的具体信息内容。

1、一种进行处理从而选择与用户的喜好相符的内容的信息处理 设备,包括:获得所述内容的属性信息的获取装置;和

根据表示所述用户的所述喜好的第一信息和表示一般喜好的第 二信息,产生揭示所述用户的所述喜好相对于所述一般喜好的偏差的 第三信息的偏差信息产生装置。

2、按照权利要求1所述的信息处理设备,其中:

所述属性信息、所述第一信息和所述第三信息均包括多个项目; 和另外设置在所述信息处理设备中的选择装置通过利用所述第三 信息,针对每个所述项目计算所述属性信息与所述第一信息之间的相 似度,来选择与所述用户的所述喜好相符的内容。

3、按照权利要求1所述的信息处理设备,其中:

所述第一信息和所述第二信息均包括多个项目;和

所述偏差信息产生装置产生揭示所述第一信息和所述第二信息 之间的相似度低的所述项目的信息作为所述第三信息。

4、按照权利要求1所述的信息处理设备,还包括:获得所述用户进行的操作的历史的操作历史获取装置;和根据作为所述用户进行的操作的所述历史的所述操作历史获取 装置获得的历史,产生所述第一信息的喜好信息产生装置。

5、按照权利要求1所述的信息处理设备,其中所述偏差信息产 生装置通过下述操作产生所述第三信息:针对每个预定项目,对所述用户从属于预定的内容组中选择并观 看的内容的数目计数,从而得到第一值,并把所述第一值用作所述第 一信息;

针对每个所述预定项目,对属于所述预定的内容组的所有内容的 数目计数,从而得到第二值,并把所述第二值用作所述第二信息;和使用所述第二值使所述第一值归一化,从而得到所述第三信息。

6、按照权利要求5所述的信息处理设备,其中所述预定的内容 组是在预定的一段时间内广播或分发的内容的集合。

7、按照权利要求5所述的信息处理设备,其中所述偏差信息产 生装置通过下述操作产生所述第三信息:把在多个不同的一段时间内广播或分发的内容的集合分别作为 多个所述预定的内容组;

计算多个所述预定的内容组的多个所述第一值和所述第二值;

使用对应于所述第一值针对与所述第一值相同的内容组计算的 所述第二值,使每个所述第一值归一化,从而得到所述第三信息。

8、按照权利要求5所述的信息处理设备,其中每个所述预定的 内容组是在预定的一段时间内广播或分发的内容的集合。

9、按照权利要求1所述的信息处理设备,其中所述第一信息是 与所述内容相关的所述属性信息,作为揭示指示所述内容是所述用户 喜欢的内容的项目的信息。

10、按照权利要求1所述的信息处理设备,其中所述第一信息是 与所述内容相关的所述属性信息,作为揭示指示所述内容是所述用户 不喜欢的内容的项目的信息。

11、一种信息处理设备的信息处理方法,进行处理从而选择与用 户的喜好相符的内容,所述信息处理方法包括:获得表示所述用户的所述喜好的第一信息的第一获取步骤;

获得表示一般喜好的第二信息的第二获取步骤;和

根据在所述第一获取步骤进行的处理中获得的所述第一信息和 在所述第二获取步骤进行的处理中获得的所述第二信息,产生揭示所 述用户的所述喜好相对于所述一般喜好的偏差的第三信息的偏差信息 产生步骤。

12、一种保存由计算机执行的、选择与用户的喜好相符的内容的 计算机程序的记录介质,所述计算机程序包括:获得表示所述用户的所述喜好的第一信息的第一获取步骤;

获得表示一般喜好的第二信息的第二获取步骤;和

根据在所述第一获取步骤进行的处理中获得的所述第一信息和 在所述第二获取步骤进行的处理中获得的所述第二信息,产生揭示所 述用户的所述喜好相对于所述一般喜好的偏差的第三信息的偏差信息 产生步骤。

13、一种由计算机执行的、选择与用户的喜好相符的内容的计算 机程序,所述计算机程序包括:获得表示所述用户的所述喜好的第一信息的第一获取步骤;

获得表示一般喜好的第二信息的第二获取步骤;和

根据在所述第一获取步骤进行的处理中获得的所述第一信息和 在所述第二获取步骤进行的处理中获得的所述第二信息,产生揭示所 述用户的所述喜好相对于所述一般喜好的偏差的第三信息的偏差信息 产生步骤。

说明书全文

技术领域

本发明涉及信息处理设备,信息处理方法,信息处理系统,记录 介质和计算机程序。更具体地说,本发明涉及作为适合于诸如自动记 录和节目的推荐之类的应用的设备,为通常观看节目和电视广播和无 线电广播的流式数据的用户而提供的信息处理设备,还涉及所述设备 采用的信息处理方法,采用该设备的信息处理系统,实现所述方法的 计算机程序,以及用于记录计算机程序的记录介质。

背景技术

按照惯例,为了向用户推荐电视和无线电广播中的节目,通过使 用诸如EPG(电子节目指南)之类的节目信息(或者节目元数据)选择和 用户喜欢的信息匹配的节目。向用户推荐节目的方法随着获得用户喜 欢的数据的方法而变化。向用户推荐节目的方法的一个例子是初始兴 趣编目方法,在该方法中,和用户的兴趣相关的信息首先被预先编目 (catalog),并被用作向用户推荐节目的基础。向用户推荐节目的方 法的另一例子是观看历史利用方法,该方法通过利用用户过去观看的 节目的历史,向用户推荐节目。向用户推荐节目的方法的另一例子是 通过使用其它用户的观看历史,向用户推荐节目的协同过滤方法。
在初始兴趣编目方法中,首先要求用户事先对诸如喜欢的节目的 种类,喜爱的类型和喜欢的演员(talent)的姓名之类的信息编目。喜欢 的节目的种类的例子是戏剧和综艺节目。喜爱的类型的例子是神秘剧 和喜剧。随后,编目信息被用作识别和用户的兴趣相符的节目元数据 的关键字。最后,获得将向用户推荐的节目的名称。
在观看历史利用方法中,每次用户观看节目时,所观看的节目的 元数据被保存,当过去的元数据被保存到一定程度时,分析保存的元 数据,从而获得诸如喜欢的节目的种类,喜爱的类型和喜欢的演员的 姓名之类的信息。随后,获得的信息被用作识别和用户的喜爱相符的 节目元数据的关键字。最后,获得将向用户推荐的节目的名称。
在诸如采用HDD(硬盘驱动器)的记录设备之类的设备中,不仅根 据观看历史,而且在一些情况下还根据记录预约的历史或者诸如记录 操作之类的用户操作的历史,获得和用户喜好相关的信息。这种情况 下,能够把用户偶然观看的节目和用户感兴趣而有意观看的节目区分 开,从而能够获得更好地反映用户的喜好的信息。用户偶然观看的节 目不是因为用户对节目特别感兴趣和观看该节目而由用户设置的节 目,而是由处于打开状态的电视接收器(或收音机)呈现的用户观看的 节目。
在协同过滤方法中,第一用户首先搜索具有和第一用户的观看/ 操作历史相符的观看/操作历史的第二用户,获得第二用户的观看/操 作历史。随后,在第二用户观看过的节目中选择第一用户还没有观看 的节目,并推荐给第一用户。
另外,日本专利特许公开No.2001-160955提出了一种技术,从 而,n维属性向量作为节目的属性被预先加入到广播节目中。随后比 较选择向量和属性向量,从而选择要记录的节目或者要再现的节目。 选择向量是根据用户最初记录的数据,以及由用户再现的节目或者预 约记录的节目的属性向量表示的属性的平均值产生的向量。
但是,如果采用初始兴趣编目方法选择节目,那么选择的节目只 代表用户最初对信息编目时,该用户具有的特定兴趣。另外,为了记 录信息的细节,用户需要进行复杂的信息编目操作。从而,为了简化 初始设置过程中,对要记录的信息编目的操作,需要减少要记录的信 息的件数。从而,只能够推荐根据用户记录的粗略信息选择的节目。 从而,选择和用户的喜好相符的节目的准确度较低。
另一方面,在诸如观看历史利用方法之类的其它方法中,仅仅利 用根据用户的观看历史收集的多条元数据的总和或平均值,来选择推 荐的节目。从而这种情况下,如果历史未被保存到一定的程度,那么 不可能正确地推荐和用户的喜好相符的节目。另外,就观看历史利用 方法来说,多条元数据之间的相关性并不敏感,导致不可能实现充分 的个人化。除此之外,如果历史被积累,那么在一些情况下,由于历 史项易于相互重叠,以及历史项均具有容易扩展为历史的元素,因 此可能在加权值上形成偏差。容易相互重叠的历史项是容易被检测 为用户的喜好的项目。容易相互重叠的历史项的一个例子是类型。 另一方面,具有容易扩展为历史的元素的历史项是难以被检测为用 户的喜好的项目。具有容易扩展为历史的元素的历史项的一个例子是 表演者。
更具体地说,假定用户是实况广播员A的崇拜者。从而,该用户 喜爱观看实况广播员A解说的球队B的棒球比赛的实况报道。这种情 况下,信息“棒球比赛的实况报道”(它是类型)作为历史容易相互重叠。 即,信息“棒球比赛的实况报道”容易被检测为用户的喜好。但是,信 息“实况广播员A”(它是表演者)难以相互重叠。即,信息“实况广播员 A”难以被检测为用户的喜好。从而,存在由另一实况广播员解说的球 队B的棒球比赛的实况报道被推荐,而实况广播员A表演的综艺节目 不被推荐的情况。
另外,如日本专利特许公开No.2001-160955公开的那样,属性 向量被预先加入到广播节目中。随后比较选择向量和属性向量,从而 选择要记录的节目或者要再现的节目。选择向量是根据用户最初记录 的数据,以及由用户再现的节目或者预约记录的节目的属性向量表示 的属性的平均值产生的向量。另外在这种情况下,由于使用用户的操 作历史,因此在一些情况下,由于历史项易于相互重叠,以及历史项 均具有容易扩展为历史的元素,比如表演者,因此可能在加权值上形 成偏差。
例如假定用户喜爱戏剧,并且只喜爱不表演戏剧的喜剧演员A的 综艺节目。另外,假定用户观看这样的综艺节目和戏剧的比例为2∶8。 在关于这样的用户产生的选择向量中,经常表演戏剧的“表演者B”的 信息作为历史相互重叠,而不是几乎不表演戏剧的喜剧演员A,尽管 表演者B不是用户特别喜好的明星。从而,经常表演戏剧的“表演者B” 参加演出的记录片节目优先于喜剧演员A作为表演者的综艺节目被推 荐。
另外,对节目的选择来说重要的项目因用户而异。例如,对某一 用户来说,重要的是表演者,而对另一用户来说,重要的是节目的内 容。然而,由于按照相同的方式操作所有项目,因此在一些情况下, 在推荐的节目中不能反映只有用户才有的喜好。
除此之外,由于协同过滤方法中利用的是另一用户的喜好,因此 难以抽取详细表示每个用户的喜好的信息。

发明内容

为了解决上述问题,本发明的发明人考虑了选择与用户的喜好相 符的节目的能力。
为了解决上述问题,本发明提供一种进行处理从而选择与用户的 喜好相符的内容的信息处理设备,包括:获得所述内容的属性信息的 获取装置;和根据表示所述用户的所述喜好的第一信息和表示一般喜 好的第二信息,产生揭示所述用户的所述喜好相对于所述一般喜好的 偏差的第三信息的偏差信息产生装置。
本发明还提供一种信息处理设备的信息处理方法,进行处理从而 选择与用户的喜好相符的内容,所述信息处理方法包括:获得表示所 述用户的所述喜好的第一信息的第一获取步骤;获得表示一般喜好的 第二信息的第二获取步骤;和根据在所述第一获取步骤进行的处理中 获得的所述第一信息和在所述第二获取步骤进行的处理中获得的所述 第二信息,产生揭示所述用户的所述喜好相对于所述一般喜好的偏差 的第三信息的偏差信息产生步骤。
本发明还提供一种保存由计算机执行的、选择与用户的喜好相符 的内容的计算机程序的记录介质,所述计算机程序包括:获得表示所 述用户的所述喜好的第一信息的第一获取步骤;获得表示一般喜好的 第二信息的第二获取步骤;和根据在所述第一获取步骤进行的处理中 获得的所述第一信息和在所述第二获取步骤进行的处理中获得的所述 第二信息,产生揭示所述用户的所述喜好相对于所述一般喜好的偏差 的第三信息的偏差信息产生步骤。
本发明还提供一种由计算机执行的、选择与用户的喜好相符的内 容的计算机程序,所述计算机程序包括:获得表示所述用户的所述喜 好的第一信息的第一获取步骤;获得表示一般喜好的第二信息的第二 获取步骤;和根据在所述第一获取步骤进行的处理中获得的所述第一 信息和在所述第二获取步骤进行的处理中获得的所述第二信息,产生 揭示所述用户的所述喜好相对于所述一般喜好的偏差的第三信息的偏 差信息产生步骤。
为了解决上述问题,根据本发明,提供一种根据关于内容的信息, 产生内容的属性信息的第一信息处理设备,包括:
获得关于内容的信息的获取装置;
根据获取装置获得的关于内容的信息,产生包括多个项目的属性 信息的属性信息产生装置;和
保存属性信息产生装置产生的属性信息的各个项目的第一加权 值信息的第一存储装置,
其中第一加权值信息规定所述多个项目中的每一个对属性信息 与用户的预定喜好信息之间的相似度的计算的贡献程度。
最好,信息处理设备还包括传送属性信息产生装置产生的属性信 息的传输装置。
最好,传输装置从保存在第一存储装置中的多条第一加权值信息 中抽取和内容的条件相符的一条第一加权值信息,并通过使抽取的一 条第一加权值信息与属性信息产生装置产生的属性信息相关联,传送 抽取的一条第一加权值信息。
最好,内容的条件是内容的类型。
最好,信息处理设备还包括从获取装置获得的关于内容的信息中 抽取预定信息的抽取装置,其中属性信息产生装置把抽取装置抽取的 预定信息转换成多个项目的每一个的向量,以便产生属性信息。
最好,属性信息产生装置从关于内容的信息中选择用单词表示的 信息作为分析对象,并根据分析的结果产生属性信息。
最好,信息处理设备还包括:把包括多个项目的信息保存为用户 的预定喜好信息的第二存储装置;和通过关于每个项目,计算保存在 第二存储装置中的喜好信息与属性信息产生装置产生的属性信息之间 的相似度,产生揭示与用户的喜好相符的内容的推荐信息的推荐信息 产生装置。
最好,推荐信息产生装置通过使用保存在第一存储装置中的第一 加权值信息,经由属性信息与喜好信息的比较,产生推荐信息。
最好,信息处理设备还包括:
获得用户进行的操作的历史的操作历史获取装置;
根据操作历史获取装置获得的用户所进行的操作的历史,产生用 户的喜好信息的喜好信息产生装置;和
根据喜好信息产生装置产生的喜好信息,产生第二加权值信息的 加权值信息产生装置,其中:
第二加权值信息指示多个项目中的每一个对属性信息与用户的 喜好信息之间的相似度的计算的贡献程度;
推荐信息产生装置通过使用加权值信息产生装置产生的第二加 权值信息,经由属性信息与喜好信息的比较,产生推荐信息。
根据本发明,提供一种根据关于内容的信息,产生内容的属性信 息的信息处理设备用第一信息处理方法,所述信息处理方法包括:
获得关于内容的信息的获取步骤;
根据在获取步骤进行的处理中获得的关于内容的信息,产生包括 多个项目的属性信息的属性信息产生步骤;
根据在获取步骤进行的处理中获得的关于内容的信息,以及根据 内容拥有的条件,抽取规定多个项目中的每一个对属性信息与用户的 预定喜好信息之间的相似度的计算的贡献程度的加权值信息的抽取步 骤;和
使在抽取步骤进行的处理中抽取的加权值信息与在属性信息产 生步骤进行的处理中产生的属性信息相关联的关联步骤。
根据本发明,提供一种用于存储由计算机执行的,以便进行根据 关于内容的信息产生内容的属性信息的处理的计算机程序的第一记录 介质,所述计算机程序包括:
获得关于内容的信息的获取步骤;
根据在获取步骤进行的处理中获得的关于内容的信息,产生包括 多个项目的属性信息的属性信息产生步骤;
根据在获取步骤进行的处理中获得的关于内容的信息,以及根据 内容拥有的条件,抽取规定多个项目中的每一个对属性信息与用户的 预定喜好信息之间的相似度的计算的贡献程度的加权值信息的抽取步 骤;和
使在抽取步骤进行的处理中抽取的加权值信息与在属性信息产 生步骤进行的处理中产生的属性信息相关联的关联步骤。
根据本发明,提供一种由计算机执行的,以便进行根据关于内容 的信息产生内容的属性信息的处理的第一计算机程序,所述计算机程 序包括:
获得关于内容的信息的获取步骤;
根据在获取步骤进行的处理中获得的关于内容的信息,产生包括 多个项目的属性信息的属性信息产生步骤;
根据在获取步骤进行的处理中获得的关于内容的信息,以及根据 内容拥有的条件,抽取规定多个项目中的每一个对属性信息与用户的 预定喜好信息之间的相似度的计算的贡献程度的加权值信息的抽取步 骤;和
使在抽取步骤进行的处理中抽取的加权值信息与在属性信息产 生步骤进行的处理中产生的属性信息相关联的关联步骤。
如上所述,获得关于内容的信息,并根据获得的关于内容的信息, 产生包括多个项目的属性信息。随后,根据关于内容的信息,以及根 据内容拥有的条件,使属性信息与规定多个前述项目中的每一个对属 性信息与用户的预定喜好信息之间的相似度的计算的贡献程度的加权 值信息相关联。
根据本发明,提供进行选择与用户的喜好相符的内容的处理的第 二信息处理设备,包括:
获得用作内容的属性信息的包括多个项目的信息的获取装置;
保存用作用户的喜好信息的包括多个项目的信息的存储装置;
通过应用预定的加权值信息,计算作为用户的喜好信息保存在存 储装置中的信息和获取装置获得的属性信息之间的相似度,产生揭示 与用户的喜好相符的内容的推荐信息的推荐信息产生装置,
其中加权值信息规定多个项目中的每一个对属性信息与用户的 喜好信息之间的相似度的计算的贡献程度。
最好,除了内容的属性信息之外,获取装置还获得加权值信息, 推荐信息产生装置通过利用加权值信息,比较内容的属性信息与所述 喜好信息,产生推荐信息。
最好,信息处理设备还包括:
获得用户进行的操作的历史的操作历史获取装置;
根据操作历史获取装置获得的用户所进行的操作的历史,产生用 户的喜好信息的喜好信息产生装置;和
根据喜好信息产生装置产生的喜好信息,产生加权值信息的加权 值信息产生装置,
其中推荐信息产生装置通过利用加权值信息产生装置产生的加 权值信息,比较喜好信息与属性信息,产生推荐信息。
最好,加权值信息是揭示用户首选的特有喜好,而不是一般喜好 的信息,所述特有喜好被用于选择内容的多条属性信息中的特定一条 属性信息。
最好,加权值信息是揭示构成内容的属性信息的项目中对用户重 要的一个项目的信息。
最好,加权值信息是揭示构成内容的属性信息的项目中,指示用 户喜欢的内容的项目的信息。
最好,加权值信息是揭示构成内容的属性信息的项目中,指示用 户不喜欢的内容的项目的信息。
最好,信息处理设备还包括接收来自用户的操作输入的操作输入 装置,其中根据用户输入操作输入装置的操作输入,设置加权值信息。
根据本发明,提供一种进行选择与用户的喜好相符的内容的处理 的信息处理设备用第二信息处理方法,所述信息处理方法包括:
获得设置加权值信息的信息的获取步骤,所述加权值信息规定对 由多个项目构成的,用作与内容相关的属性信息的信息和由多个项目 构成的,用作与用户相关的预定喜好信息的信息之间的相似度的计算 的贡献程度,这里所述贡献是由多个项目中的每个项目引起的贡献;
根据在获取步骤进行的处理中获得的设置加权值信息的信息,计 算属性信息和喜好信息之间的相似度的计算步骤;和
通过在计算步骤进行的处理中获得的计算结果的使用,产生揭示 与用户的喜好相符的内容的推荐信息的推荐信息产生步骤。
根据本发明,提供一种保存将由计算机执行的,进行选择与用户 的喜好相符的内容的处理的计算机程序的第二记录介质,所述计算机 程序包括:
获得设置加权值信息的信息的获取步骤,所述加权值信息规定对 由多个项目构成的,用作与内容相关的属性信息的信息和由多个项目 构成的,用作与用户相关的预定喜好信息的信息之间的相似度的计算 的贡献程度,这里所述贡献是由多个项目中的每个项目引起的贡献;
根据在获取步骤进行的处理中获得的设置加权值信息的信息,计 算属性信息和喜好信息之间的相似度的计算步骤;和
通过在计算步骤进行的处理中获得的计算结果的使用,产生揭示 与用户的喜好相符的内容的推荐信息的推荐信息产生步骤。
根据本发明,提供一种将由计算机执行的,进行选择与用户的喜 好相符的内容的处理的计算机程序,所述计算机程序包括:
获得设置加权值信息的信息的获取步骤,所述加权值信息规定对 由多个项目构成的,用作与内容相关的属性信息的信息和由多个项目 构成的,用作与用户相关的预定喜好信息的信息之间的相似度的计算 的贡献程度,这里所述贡献是由多个项目中的每个项目引起的贡献;
根据在获取步骤进行的处理中获得的设置加权值信息的信息,计 算属性信息和喜好信息之间的相似度的计算步骤;和
通过在计算步骤进行的处理中获得的计算结果的使用,产生揭示 与用户的喜好相符的内容的推荐信息的推荐信息产生步骤。
如上所述,为了产生揭示和用户的喜好相符的内容的推荐信息, 通过使用规定多个下述项目中的每一个对计算的贡献程度的加权值信 息,计算包括多个项目的用作内容的属性信息的信息与包括多个项目 的用作用户的预定喜好信息的信息之间的相似度。
根据本发明,提供一种信息处理系统,所述信息处理系统包括根 据关于内容的信息产生内容的属性信息的第一信息处理设备,和根据 从第一信息处理设备接收的内容的属性信息,进行选择和用户的喜好 相符的内容的处理的第二信息处理设备,
第一信息处理设备包括:
获得关于内容的信息的第一获取装置;
根据第一获取装置获得的关于内容的信息,产生包括多个项目的 属性信息的属性信息产生装置;
保存属性信息产生装置产生的属性信息的各个项目的第一加权 值信息的第一存储装置;和
从保存在第一存储装置中的多条第一加权值信息中抽取和内容 拥有的条件相符的一条第一加权值信息,使抽取的第一加权值信息与 属性信息产生装置产生的属性信息相关联,和传送第一加权值信息及 属性信息的传输装置,
第二信息处理设备包括:
获得包括多个项目的内容的属性信息及第一加权值信息的第二 获取装置;
保存用作用户的喜好信息的包括多个项目的信息的第二存储装 置;和
通过至少应用第一加权值信息或不同于第一加权值信息的第二 加权值信息,计算作为用户的喜好信息保存在第二存储装置中的信息 和第二获取装置获得的属性信息之间的相似度,产生揭示与用户的喜 好相符的内容的推荐信息的推荐信息产生装置,
其中第一加权值信息和第二加权值信息均规定多个项目中的每 一个对属性信息与用户的喜好信息之间的相似度的计算的贡献程度。
如上所述,在第一信息处理设备中,获得关于内容的信息,并根 据获得的关于内容的信息,产生包括多个项目的属性信息。随后,保 存属性信息的各个项目的第一加权值信息。之后,从保存的多条第一 加权值信息中抽取与内容拥有的条件相符的一条第一加权值信息,并 使之与属性信息相关联。最后,相互关联的第一加权值信息和属性信 息被传送给第二信息处理设备。另一方面,在第二信息处理设备中, 用作内容的属性信息的包括多个项目的信息和第一加权值信息接收自 第一信息处理设备,而用作用户的喜好信息的包括多个上述项目的信 息被保存。随后,通过至少应用第一加权值信息或不同于第一加权值 信息的第二加权值信息,计算保存的用户的喜好信息和属性信息之间 的相似度,产生揭示与用户的喜好相符的内容的推荐信息。另外,第 一加权值信息和第二加权值信息均规定多个上述项目中的每一个对属 性信息与用户的喜好信息之间的相似度的计算的贡献程度。
根据本发明,提供进行处理,从而选择与用户的喜好相符的内容 的第三信息处理设备,包括:
获得内容的属性信息的获取装置;和
根据表示用户的喜好的第一信息和表示一般喜好的第二信息,产 生揭示用户的喜好相对于一般的喜好的偏差的第三信息的偏差信息产 生装置。
最好,属性信息,第一信息和第三信息均包括多个项目;另外设 置在信息处理设备中的选择装置通过利用第三信息,关于每个项目, 计算属性信息与第一信息之间的相似度,选择与用户的喜好相符的内 容。
最好,第一信息和第二信息均包括多个项目;偏差信息产生装置 产生揭示具有第一信息和第二信息之间的低相似度的项目的信息作为 第三信息。
最好,信息处理设备还包括:获得用户进行的操作的历史的操作 历史获取装置;和根据操作历史获取装置获得的用户进行的操作的历 史,产生第一信息的喜好信息产生装置。
最好,偏差信息产生装置通过下述操作产生第三信息:
关于每个预定的项目,对用户从属于预定组的内容中选择并观看 的内容的数目计数,从而得到第一值,并把第一值用作第一信息;
关于每个预定的项目,对属于预定组的所有内容的数目计数,从 而得到第二值,并把第二值用作第二信息;和
使用第二值使第一值归一化,从而得到第三信息。
最好,预定的一组内容是在预定的一段时间内广播或分发的一组 内容。
最好,偏差信息产生装置通过下述操作产生第三信息:
把均由内容构成的每组作为预定的多组内容之一,所述多组内容 是在不同的一段时间内广播或分发的多组内容;
计算预定的多组内容的第一值和第二值;
使用对应于第一值的,和第一值一样关于相同的一组内容计算的 第二值,使每个第一值归一化,从而得到第三信息。
最好,每个预定的多组内容是在预定的一段时间内广播或分发的 一组内容。
最好,第一信息是与内容相关的,揭示指示该内容是用户所喜欢 的内容的项目的属性信息。
最好,第一信息是与内容相关的,揭示指示该内容是用户不喜欢 的内容的项目的属性信息。
根据本发明,为进行处理,从而选择与用户的喜好相符的内容的 信息处理设备提供第三信息处理方法,所述信息处理方法包括:
获得表示用户的喜好的第一信息的第一获取步骤;
获得表示一般喜好的第二信息的第二获取步骤;和
根据在第一获取步骤进行的处理中获得的第一信息和在第二获 取步骤进行的处理中获得的第二信息,产生揭示用户的喜好相对于一 般的喜好的偏差的第三信息的偏差信息产生步骤。
根据本发明,提供保存由计算机执行的,进行选择与用户的喜好 相符的内容的处理的计算机程序的第三存储介质,所述计算机程序包 括:
获得表示用户的喜好的第一信息的第一获取步骤;
获得表示一般喜好的第二信息的第二获取步骤;和
根据在第一获取步骤进行的处理中获得的第一信息和在第二获 取步骤进行的处理中获得的第二信息,产生揭示用户的喜好相对于一 般的喜好的偏差的第三信息的偏差信息产生步骤。
根据本发明,提供由计算机执行的,进行选择与用户的喜好相符 的内容的处理的计算机程序,所述计算机程序包括:
获得表示用户的喜好的第一信息的第一获取步骤;
获得表示一般喜好的第二信息的第二获取步骤;和
根据在第一获取步骤进行的处理中获得的第一信息和在第二获 取步骤进行的处理中获得的第二信息,产生揭示用户的喜好相对于一 般的喜好的偏差的第三信息的偏差信息产生步骤。
如上所述,根据代表用户的喜好的第一信息和代表一般喜好的第 二信息,产生揭示用户的喜好相对于一般喜好的偏差的第三信息。

附图说明

图1是说明电视节目广播和流式数据的分发的说明图;
图2是表示图1中所示的分发服务器的结构的方框图;
图3是说明节目向量产生处理1的流程图;
图4是说明EPG数据的说明图;
图5是说明节目向量的说明图;
图6是说明节目向量产生处理2的流程图;
图7是说明分组处理1的流程图;
图8是说明分组处理2的流程图;
图9是说明标题分组处理1的流程图;
图10是说明标题分组处理2的流程图;
图11是说明标题分组处理3的流程图;
图12是说明标题分组处理4的流程图;
图13是表示图1中所示的节目推荐处理设备的结构的方框图;
图14是说明正历史向量和负历史向量产生处理1的流程图;
图15是说明正历史向量的说明图;
图16是说明正历史向量和负历史向量产生处理2的流程图;
图17是说明匹配处理1的流程图;
图18是说明匹配处理2的流程图;
图19是说明匹配处理3的流程图;
图20是说明匹配处理4的流程图;
图21是说明匹配处理5的流程图;
图22是说明用户方效应(effect)向量产生处理1的流程图;
图23是说明用户方效应向量产生处理2的流程图;
图24是说明用户方效应向量产生处理3的流程图;
图25是说明用户方效应向量产生处理4的流程图;
图26是说明用户方负效应向量产生处理1的流程图;
图27是说明用户方负效应向量产生处理2的流程图;
图28是说明包括组推荐的匹配处理的流程图;
图29是说明利用用户模型的匹配处理的流程图;
图30是说明异常推荐处理的流程图;
图31是表示图1中所示的电视接收设备的结构的方框图;
图32是表示图1中所示的电视显示设备的结构的方框图;
图33是说明推荐信息显示处理的流程图;
图34是说明自动频道设置处理的流程图;
图35是表示图1中所示的记录/再现设备的结构的方框图;
图36是说明自动记录处理的流程图;
图37是表示分发服务器的另一典型结构的方框图;
图38是表示节目推荐处理设备的另一典型结构的方框图;
图39是说明分发电视节目广播和流式数据的另一典型网络的说 明图;
图40是表示分发服务器的另一典型结构的方框图。

具体实施方式

下面参考附图说明本发明的一个实施例。
首先,参考图1说明电视节目广播和流式数据(streaming data) 的分发。
广播站1以地波的形式发射节目广播,或者通过卫星2以卫星波 的形式发射节目广播。图1只表示了一个广播站1。但是不必说,可 存在多个广播站。电视(TV)接收设备4中采用的天线3接收以地波或 卫星波的形式发射的节目广播。如果需要,广播信号可包括EPG(电 子节目指南)。
分发服务器5从流式数据数据库6读取流式数据,并通过包括因 特网和其它子网在内的网络8把流式数据传送给TV接收设备4。分 发服务器5还读出EPG或者从元数据数据库7读出包括比EPG更详 细的信息的元数据。EPG是和从广播站1广播的节目相关的信息。分 发服务器5随后为每个节目产生一个节目向量PP,并通过网络8,把 节目向量PP连同EPG数据一起传送给EPG接收设备9。
如果包括在叠加于节目的一般广播信号上的EPG中的信息的数 量对于后面将说明的处理来说足够大,那么和叠加在一般广播信号上 的EPG相同的数据可被用于所述处理。另一方面,如果包括在叠加于 一般广播信号上的EPG中的信息的数量并未大到足以进行后面说明 的处理,那么除了叠加在一般广播信号上的EPG之外,元数据可被用 于所述处理,或者被用作独立数据。由于包括在叠加于一般广播信号 上的EPG中的信息的数量没有大到足以进行后面说明的处理,因此在 本实施例中,包括元数据的信息被用于所述处理,这样的信息被称为 EPG数据。
EPG接收设备9把从分发服务器5接收的EPG数据提供给TV 接收设备4。另外,EPG接收设备9把和EPG数据一起接收的节目向 量PP提供给节目推荐处理设备10。
具有调谐器的TV接收设备4根据从具有操作部分的TV显示设 备11或者同样具有操作部分的记录/再现设备12接收的指示用户选择 的频道的控制信号,选择天线3以地波或卫星波的形式接收的广播信 号,并接收选择的广播信号。TV接收设备4还通过网络8接收从分 发服务器5传送的流式数据。另外,TV接收设备4从EPG接收设备 9接收EPG数据,并把该数据提供给TV显示设备11或者记录/再现 设备12。要注意的是,如果接收波包括EPG,那么TV接收设备4把 EPG和包括在接收波中的节目信号分开,把EPG和节目信号提供给 TV显示设备11或者记录/再现设备12。
节目推荐处理设备10从EPG接收设备9获得节目向量PP,并 从TV显示设备11以及记录/再现设备12获得操作日志。节目推荐处 理设备10随后根据节目向量PP和操作日志,或者根据用户进行的输 入操作,产生推荐和用户的喜好相符的节目的推荐信息,并把推荐信 息提供给TV显示设备11和记录/再现设备12。
根据用户输入的操作输入,TV显示设备11显示从TV接收设备 4接收的广播信号或者从记录/再现设备12接收的再现信号。另外,根 据从节目推荐处理设备10接收的推荐信息,TV显示设备11自动设 置频道,并显示关于推荐节目的信息。TV显示设备11还把用作用户 进行的操作的历史的操作日志提供给节目推荐处理设备10。
根据用户输入的操作输入,记录/再现设备12把从TV接收设备 4接收的广播信号记录在安装的记录介质或者嵌入的记录介质,例如 硬盘上。另外,根据从节目推荐处理设备10接收的推荐信息,记录/ 再现设备12自动把从TV接收设备4接收的广播信号记录到安装的记 录介质或者嵌入的记录介质上。另一方面,记录/再现设备12还从安 装的记录介质或者嵌入的记录介质再现节目,并把再现的节目提供给 TV显示设备11以便显示该节目。除此之外,记录/再现设备12还把 用作用户进行的操作的历史的操作日志提供给节目推荐处理设备10。
在上面的说明中,EPG接收设备9,TV接收设备4,节目推荐 处理设备10,TV显示设备11和记录/再现设备12被说明成不同的设 备。但是,这些设备不必被单独设计。例如,不必说,EPG接收设备 9,TV接收设备4和TV显示设备11可被集成到具有嵌入式调谐器功 能的TV接收器15-1的单一结构中。另外,记录/再现设备12可与TV 接收器15-1集成,从而形成具有记录功能的TV接收器15-2。不必说, 记录/再现设备12可以是包括具有大存储容量的硬盘的所谓硬盘记录 器。此外,节目推荐处理设备10可与具有嵌入式调谐器功能的TV接 收器15-1集成,从而形成TV接收器15-3,或者节目推荐处理设备10 可与具有记录功能的TV接收器15-2集成,从而形成TV接收器15-4。
图2是表示分发服务器5的结构的方框图。
数据获取部分21从元数据数据库7或者流式数据数据库6获得 数据,并把获得的数据提供给数据传输部分25。另外,数据获取部分 21把EPG数据提供给元数据抽取部分22。此外,数据获取部分21 进行处理,从而根据EPG数据的内容,把保存在元数据数据库7中的 EPG数据集合成组。
元数据抽取部分22从接收自数据获取部分21的EPG数据中抽 取产生节目向量PP所必需的元数据,并把抽取的数据提供给节目向 量产生部分23。节目向量产生部分23根据元数据产生节目向量PP, 并且如果需要的话,在把节目向量PP和保存在数据存储部分24中的 节目方效应(effect)向量EfPP提供给数据传输部分25之前,使节目 向量PP与节目方效应向量EfPP相关联。
如果需要的话,数据存储部分24被用于保存节目方效应向量 EfPP,节目方效应向量EfPP都是产生节目向量PP所必需的信息数 据。
从想出如何提高收视率的措施的制作方和广播方的观点来看,一 般文艺节目配有强调强类型或内容要素的特性,综艺节目等配有强调 强表演者要素的特性,戏剧节目配有强调强表演者和编剧要素的特性。 为了正确地掌握节目的特征,必须利用这些特性。即,节目的类型确 定在所进行的匹配过程中,构成节目的节目向量PP的哪些分量是重 要的,以便推荐和用户的喜好相符的节目。换句话说,这样的重要分 量因类型而异。
即,如果节目的类型是“一般文艺/记录片”,那么重要的项目 (item)不是表演者,而是节目的内容和标题。另一方面,如果节目 的类型是“综艺”,那么重要的项目是表演者。如果节目的类型是“戏 剧”,那么重要的项目是表演者和编剧。当所述重要的项目被用于产生 节目向量PP时,节目效应向量被设置成规定在每种类型的匹配过程 中,每个项目的贡献程度,并被保存在数据存储部分24中。
数据传输部分25通过网络8把信息传送给EPG接收设备9或者 TV接收设备4。传送的信息包括由数据获取部分21提供的EPG数据 和流式数据,以及由节目向量产生部分23提供的节目效应向量EfPP。
如果需要,驱动器26与节目向量产生部分23连接。如果需要, 磁盘31、光盘32、磁光盘33或半导体存储器34被安装在驱动器26 上,使得数据可在驱动器26和磁盘31、光盘32、磁光盘33或半导体 存储器34之间交换。
下面参考图3中所示的流程图,说明分发服务器5进行的节目向 量产生处理1。
首先,在步骤S1,数据获取部分21获得包括来自元数据数据库 7的元数据的EPG数据。
随后在步骤S2,元数据抽取部分22接收来自数据获取部分21 的EPG数据,并从EPG数据抽取产生节目向量PP所需的元数据。 随后,元数据抽取部分22把抽取的元数据提供给节目向量产生部分 23。
图4表示了典型的元数据。元数据包括作为节目的类型的“Movie: Japnese film”和作为电影的名称的“Toukaidou Mitsuya Ghost-story”。 元数据还包括已播日期,发行者,播出日期,广播电台的名称和广播 时间。另外,除了描述节目内容的电影解说之外,元数据还包括导演 的姓名,编剧的姓名,摄像师的姓名,负责音乐的人员的姓名和表演 者的姓名。
随后,在步骤S3,如果需要,节目向量产生部分23对包括在元 数据中的信息,例如名称和内容进行词法(morphological)分析,并 把它们分解成单词。更具体地说,节目向量产生单元23把作为名称包 括在元数据中的电影名分解成3个单词,即“Toukaidou”,“Mitsuya” 和“ghost-story”。如图4中所示,元数据包括表述“59 production of Seihou,Masterpiece of horror show of Japanese film,depicting the world of the famous Mitsuya ghost-story to fullness of formal beauty.” 的信息。这种情况下,节目向量产生部分23抽取作为和内容有关的信 息包括在该解说中的单词。抽取的单词是“Seihou”,“formal”, “beauty”,“fullness”,“famous”,“Mitsuya”,“ghost-story”,“world”, “depicting”,“Japanese film”,“horror”和“Masterpiece”。
随后,在下一步骤S4,节目向量产生部分23把包括在元数据中 的项目转换成称为节目向量PP的向量。最后,结束处理的执行。产 生的节目向量PP被提供给数据传输部分25,数据传输部分25随后通 过网络8把节目向量PP传送给EPG接收设备9。具有所述项目的节 目向量PP可具有包括被排列成1个数组的所有详细项目分量的格式。 作为一种备选方案,项目被归入大项目中,所述大项目随后被转换成 节目向量PP。
图5表示了对7个大项,即标题、类型、时间段、广播电台、表 演者、编剧/作者/制片人和内容应用向量变换而获得的节目向量 PP={Tm,Gm,Pm,Am,Km}。每个大项的内容被描述成:标题Tm={标 题1,标题2,…},类型Gm={戏剧,综艺,体育,电影,音乐,儿 童节目/教育,一般文艺/记录片,新闻/报告,其它},时间段(小 时)Hm={早晨,白天,晚间,黄金时段,深夜},广播电台(电视 台)Sm={NNK General,NNK Educational,Asian Television,TTS,Buji,Telenichi,Touto,First NNK Satellite,Second NNK Satellite,WOWO},表演者(人员)Pm={A,B,…},编剧/作者/制片人 Am={a,b,…},内容(关键字)Km={kw1,kw2,…}。
由于这7个大项中的类型,广播电台和时间段均具有可明确识别 的类别,这些每个这些大项的详细项目可由数字向量表示。以广播电 台为例。如上所述,广播电台是Sm={NNK General,NNK Educational,Asian Television,TTS,Buji,Telenichi,Touto,First NNK Satellite,Second NNK Satellite,WOWO}。例如,如果节目的广播电台 是WOWO,那么广播电台向量可由广播电台Sm={0,0,0,0,0,0,0,0,0,1} 表示。就类型来说,大项是Gm={戏剧,综艺,体育,电影,音乐, 儿童节目/教育,一般文艺/记录片,新闻/报告,其它}。如果节目的类 型是一般文艺/记录片,那么类型向量可由类型Gm={0,0,0,0,0,0,1,0,0} 表示。
另一方面,标题、表演者、编剧/作者/制片人和内容的大项都不 能由数字向量表示。这种情况下,每个大项由包括作为向量分量的出 现频率的向量表示。与由向量表示的句子中的单词相关的出现频率是 该单词在句子中出现的频率。例如,标题的大项是标题={Toukaidou-1, Mitsuya-1,ghost-story-1},其中每个分量是一对单词和代表该单词的 频率的数字。在本例中,分量Toukaidou-1意味着单词Toukaidou在 由该向量表示的句子中出现一次。
节目向量PP如上所述被产生,随后被传送给EPG接收设备9。 更具体地说,由前面参考图4说明的节目元数据产生的节目向量PP 是节目向量PP={标题Tm={Toukaidou-1,Mitsuya-1,ghost-story-1}, 类型Gm={0,0,0,1,0,0,0,0,0},时间段Hm={0,0,0,0,1},广播电台 Sm={0,0,0,0,0,0,0,0,0,1},表演者Pm={Katsumi Wakasugi-1,Shigeru Amami-1,Toshihiko Emi-1,Ryuujirou Nakamura-1和Noriko Nishizawa-1},编剧/作者/制片人Am={Nobuo Nakagawa-1,Shochi Ohnuki-1,Yoshihiro Ishida-1,Shoji Nishimoto-1,Chuta Watanabe-1}, 内容Km={Seihou-1,formal-1,beauty-1,fullness-1, famous-1,Mitsuya-1,ghost-story-1,world-1,depicting-1,Japanese-1,hor ror-1和masterpiece-1}}。
节目向量PP被传送给EPG接收设备9。
在如上所述产生的节目向量PP中,表演者向量Pm的主要分量 可被特别加权。出于同样的原因,编剧/作者/制片人向量Am的导演 可被特别加权。例如,表演者向量可由Pm={Katsumi Wakasugi-3,Shigeru Amami-2,Toshihiko Emi-1,Ryuujirou Nakamura-1和Noriko Nishizawa-1}表示,编剧/作者/制片人向量可由 Am={Nobuo Nakagawa-3,Shochi Ohnuki-1,Yoshihiro Ishida-1,Shoji Nishimoto-1,Chuta Watanabe-1}表示。
另外,如上所述,节目的类型确定为了推荐与用户的喜好相符的 节目而进行的匹配过程中,构成节目的节目向量PP的分量中哪些是 重要的,换句话说,这样的重要分量因类型而异。节目方效应向量EfPP 显示对每种类型来说,哪些分量是重要的。如果节目方效应向量EfPP 被保存在数据存储部分24中,那么也可通过与节目向量PP相关联, 传送节目方效应向量EfPP。对由节目向量PP代表的一组大项设置节 目方效应向量EfPP。
假定节目向量PP={标题Tm,类型Gm,时间段Hm,广播电台 Sm,表演者Pm,编剧/作者/制片人Am,内容Km}中的节目的类型 是一般文艺/记录片。这种情况下,重要的项目是标题和内容。从而, 节目方效应向量EfPP被设置成值{3,1,1,1,1,1,3},其中数字3是加权值。 另一方面,如果节目的类型是综艺,那么重要的项目是表演者。这种 情况下,节目方效应向量EfPP被设置成值{1,1,1,1,5,1,1},其中数字5 是加权值。如果节目的类型是戏剧,那么重要的项目是表演者和编剧。 这种情况下,节目方效应向量EfPP被设置成值{1,1,1,1,2,3,1},其中数 字2是用于表演者的加权值,数字3是用于编剧的加权值。
通过参考图6中所示的流程图,下面的说明解释其中通过与节目 向量PP相关联,传送节目方效应向量EfPP的情况的节目向量产生处 理2。
在步骤S11-S14进行的处理与分别在参考图3说明的流程图的步 骤S1-S4进行的处理相同。在这些步骤,如前所述,从元数据数据库 7获得EPG数据,并从EPG数据抽取产生节目向量PP所必需的元数 据。随后,如果需要,对包括在元数据中的信息进行词法分析,以便 把信息分解成单词。包括在元数据中的信息的例子是标题和内容。随 后,包括在元数据中的项目被转换成节目向量PP。
随后,在下一步骤S15,节目向量产生部分23根据与接收的元 数据相关的节目的类型,从保存在数据存储部分24中的效应向量信息 中抽取效应向量。如果节目的类型是综艺,那么从数据存储部分24 抽取对表演者设置加权值5的效应向量EfPP={1,1,1,1,5,1,1}。
随后,在下一步骤S16,节目向量产生部分23使在步骤S15进 行的处理中抽取的效应向量EfPP与在步骤S14进行的处理中产生的 节目向量PP相关联。最后,结束处理的执行。
通过进行上述处理,节目向量PP被产生,并与根据节目的类型 获得的对节目向量PP的重要项目设置加权值的节目方效应向量EfPP 相关联。随后,通过网络8,节目向量PP和节目方效应向量EfPP被 传送给EPG接收设备9。
节目向量PP如上所述产生。但是,通过根据节目的属性对节目 分组,可用较少的处理,但是准确度较高地产生节目向量PP。
一般为了产生由具有相同类型的节目,例如在同一周内广播的连 续剧组成的组,或者由在节目安排单元,例如13周中介绍相同表演者 的节目组成的组,进行分组节目的处理。作为分组节目的处理的一个 具体例子,通过参考图7的流程图,下面的说明解释连续剧的分组节 目的分组处理1。
首先,在步骤S31,数据获取单元21从保存在元数据数据库7 中的EPG数据中抽取和预定的分组条件相符的节目。作为预定分组条 件的一个例子,该条件要求要被抽取的节目具有相同的标题,相同的 广播电台,在所有工作日的相同广播时间或者在各周的相同日子的相 同广播时间。
随后,在下一步骤S32,数据获取单元21把抽取的节目放入组 中,并向节目的EPG数据附加组ID。
随后,在下一步骤S33,元数据抽取部分22抽取为了产生代表 被识别为连续剧的一部分的节目,即第一节目或者由相同组ID识别 的节目的第一广播的节目向量PP而需要的元数据。
随后,在下一步骤S34,进行前面参考图3或6中所示的流程图 说明的节目向量产生处理。
随后,在下一步骤S35,节目向量产生部分23把第一广播的产 生的节目向量PP固定并设置成由组ID识别的节目向量PP。最后, 结束处理的执行。
通过进行上述处理,连续剧的节目被放入具有相同节目向量PP 的组中。另外,可使组的ID和节目向量PP相互关联,并保存在数据 存储部分24中。
特别地,在连续剧的EPG数据中,在许多情况下,第一内容是 所有节目的描述,后续内容都只是相关节目的描述,而不是所有节目 的描述。另外,对于每个节目来说,除了节目描述之外的元数据部分 相同。从而,通过利用第一节目的EPG数据产生节目向量PP,不仅 能够减少进行节目向量产生处理的次数,而且还能够产生高度准确地 与节目的特性相符的节目向量PP。
图7是说明把公共ID加入连续剧的EPG数据中的处理的流程 图。如果EPG数据已包括识别连续剧的信息,那么在步骤S31进行 的处理可被消除。这种情况下,通过参考已包括在EPG数据中的用于 识别连续剧的信息,公共ID被加入到连续剧的EPG数据中。
通过参考图8,下面的说明还关于不同于连续剧的元素,解释能 够对节目进行分组的分组处理2。基于类型和表演者的分组如下所示。
首先,在步骤S51,数据获取部分21参考保存在元数据数据库7 中的EPG数据,并把对应于节目的元数据的群集代码加入到节目的 EPG数据中。
例如假定和连续剧的条件相符的节目被抽取。一般来说,连续剧 的条件要求要被抽取的节目具有相同标题,相同广播电台,在所有工 作日的相同广播时间或者在各周的相同日子的相同广播时间。对于识 别成连续剧的节目的一组抽取节目,对应于连续剧的第一群集代码具 有一般如下所述根据连续剧的广播时间确定的最低有效数位。如果构 成连续剧的节目的广播时间是在所有工作日的相同时间,那么第一群 集代码的最低有效数位是为1的代码。另一方面,如果构成连续剧的 节目的广播时间是在各周的相同日子的相同广播时间,那么第一群集 代码的最低有效数位是为2的代码。如果构成连续剧的节目的广播时 间是除对应于代码1和2的时间之外的时间,例如在交替的星期或者 日子,那么第一群集代码的最低有效数位是例如为3的代码。对于除 连续剧之外的节目,第一群集代码的最低有效数位是例如为0的代码。
随后,参考记录在元数据数据库7中的元数据中的类型数据,以 便确定对应于类型的第二群集代码中的最低有效数位中的第二数位。 根据类型,第二群集代码中的最低有效数位中的第二数位被设置成例 如为20的代码,为30的代码等等。第二群集代码中的最低有效数位 中的第二数位是所谓的十位。
最后,参考记录在元数据数据库7中的元数据中的表演者数据, 以便确定对应于表演者的第三群集代码中的最低有效数位中的第三数 位,以及位序高于第三数位的其它数位。根据表演者,第三群集代码 中的最低有效数位中的第三数位和位序高于第三数位的其它数位被设 置成例如为2300的代码,为800的代码或者其它代码。第三群集代码 中的最低有效数位中的第三数位是所谓的百位,位序高于第三数位的 其它数位从而是位序高于百位的其它数位。
加入节目的EPG中的群集代码是上面描述的第一到第三群集代 码的总和。
从而,在下一步骤S52,数据获取部分21通过检查分配给EPG 的群集代码的第一数位是否为0,确定EPG是否是连续剧的EPG。
如果在步骤S52进行的处理中产生的确定结果指示节目是连续 剧的节目,那么处理流程进入步骤S53和S54,执行分别和前面参考 图7说明的流程图的步骤S33和S34相同的处理。即,第一广播的EPG 被抽取,并进行前面参考图3或6中所示的流程图说明的节目向量产 生处理。
随后,在下一步骤S55,节目向量产生部分23把第一广播的节 目向量PP固定为连续剧的节目向量PP,并使产生的群集代码与节目 向量PP相关联。最后,结束处理的执行。
另一方面,如果在步骤S52进行的处理中产生的确定结果指示节 目不是连续剧的节目,那么处理流程进入步骤S56,执行前面参考图3 或6中所示的流程图说明的节目向量产生处理。
随后,在下一步骤S57,节目向量产生部分23使产生的群集代 码与节目向量PP相关联。最后,结束处理的执行。
通过进行上述处理,不仅可依据连续剧对节目向量PP分组,而 且可依据类型和表演者对节目向量PP分组。另外,可使识别组的群 集代码与该组的节目向量PP相关联。
在前面参考图2说明的分发服务器5中,如上参考图3-8所述那 样产生节目向量PP。从而,总是能够以对应于新术语,新类型等的向 量的形式,产生节目向量PP。产生的节目向量PP及其EPG数据通 过网络8被传送给EPG接收设备,并被提供给节目推荐处理设备10。
另外,分组处理可包括将对标题进行的词法分析,以便把标题分 解成单词,并向单词分配一个组ID。
下面参考图9中所示的流程图说明标题分组处理1。
首先,在步骤S61,数据获取部分21从通过参考保存在元数据 数据库7中的EPG数据得到的编目元数据中抽取标题,并把标题提交 给节目向量产生部分23。
随后,在下一步骤S62,节目向量产生部分23对标题进行词法 分析,并把标题分解成单词。更具体地说,假定包括在元数据中的电 影标题是“Toukaidou Mitsuya Ghost-story”。这种情况下,该标题被 分解成下述3个单词/短语:“Toukaidou”,“Mitsuya”和“Ghost-story”。
随后,在下一步骤S63,节目向量产生部分23从作为分析的结 果而获得的单词(或短语)中抽取一个单词(或者包括多个单词的短语), 并从数据存储部分24抽取所抽取单词(或短语)的组ID。
包括多个单词的短语是一组单词。通过组合作为语法分析的结果 而获得的单词产生该组单词。假定作为词法分析的结果获得的3个单 词/短语是“Toukaidou”,“Mitsuya”和“Ghost-story”。这种情况下,该 组单词可以是“Toukaidou Mitsuya”,“Toukaidou Ghost-story”或者 “Mitsuya Ghost-story”。
随后,在下一步骤S64,节目向量产生部分23确定对应的组ID 是否已从数据存储部分24被抽取。
如果在步骤S64进行的处理中产生的确定结果指示未从数据存 储部分24抽取对应的组ID,那么处理流程进入步骤S65,节目向量 产生部分23使新的组ID与抽取的单词(或者包括多个单词的抽取短语 /单词组)相关联。这是因为没有对应的组ID已被保存在数据存储部分 24中,并且与抽取的单词(或者包括多个单词的抽取短语/单词组)相关 联。随后,节目向量产生部分23把该单词(或者包括多个单词的抽取 短语/单词组)连同相关的组ID一起保存在数据存储部分24中。
另一方面,如果在步骤S64进行的处理中产生的确定结果指示已 从数据存储部分24抽取了对应的组ID,那么处理流程进入步骤S66。 在完成在步骤S65进行的处理之后,处理流程也进入步骤S66。在步 骤S66,节目向量产生部分23确定是否已对构成标题的每个单词(或 者每个单词组)抽取了一个组ID。
如果在步骤S66进行的处理中产生的确定结果指示还未对构成 标题的每个单词(或者每个单词组)抽取一个组ID,那么处理流程返回 步骤S63,再次执行步骤S63及后续步骤的处理。
另一方面,如果在步骤S66进行的处理中产生的确定结果指示已 为构成标题的每个单词(或者每个单词组)抽取了一个组ID,那么处理 流程进入步骤S67,节目向量产生部分23使抽取的组ID与节目向量 PP相关联。最后,结束处理的执行。
通过进行上述处理,使构成标题的单词(或者单词组)的组ID与 对应于该标题的节目向量PP相关联。数据传输部分25随后通过网络 8把组ID和标题传送给TV接收设备4或者EPG接收设备9。
另外,具有类似标题的节目可被包括在相同组内。例如,通过比 较作为对构成节目标题的单词进行的词法分析的结果而获得的节目标 题单词,计算在预定的周期,例如2周、1个月或半年中出现的节目 标题之间的相似度,标题为“Ginpachi,Second-Grade A Class Teacher” 的连续剧可被放入和标题为“Ginpachi Special,Second-Grade A Class Teacher”的特别节目相同的组中。只有当计算的相似度至少等于预定 值时,连续剧和特别节目才被放入相同的组中。
通过参考图10中所示的流程图,下面的说明解释根据构成标题 之一的单词和构成另一标题的单词之间的匹配度,对标题分组的标题 分组处理2。
在步骤S401和S402进行的处理与分别在前面参考图9说明的流 程图的步骤S61和S62进行的处理相同。即,数据获取部分21从通 过参考保存在元数据数据库7中的EPG数据得到的编目元数据中抽取 标题,并把标题提交给节目向量产生部分23。随后,节目向量产生部 分23对每个标题进行词法分析,把每个标题分解成单词。
随后,在下一步骤S403,节目向量产生部分23计算从词法分析 获得的标题的单词之间的匹配度。即,节目向量产生部分23找出代表 标题之一的单词匹配另一标题的单词的匹配率。
更具体地说,我们以标题“Ginpachi,Second-Grade A Class Teacher”和标题“Ginpachi Special,Second-Grade A Class Teacher”为 例子。标题“Ginpachi,Second-Grade A Class Teacher”被分解成下述单 词:“Ginpachi”,“Second”,“Grade”,“A”,“Class”和“Teacher”。 另一方面,标题“Ginpachi Special,Second-Grade A Class Teacher”被 分解成下述单词:“Ginpachi”,“Special”“Second”,“Grade”,“A”, “Class”和“Teacher”。随后,对单词“Ginpachi”,“Second”,“Grade”, “A”,“Class”和“Teacher”以及单词“Ginpachi”,“Special”“Second”, “Grade”,“A”,“Class”和“Teacher”进行词法分析,从而产生为6/7 或者85.7%的匹配率。
随后,在下一步骤S404,节目向量产生部分23确定单词的匹配 率是否至少等于预定值,例如70%。不必说,匹配率的阈值可以是不 同于70%的值。
如果在步骤S404进行的处理中产生的确定结果指示单词的匹配 率至少等于预定值,例如70%,那么处理流程进入步骤S405,节目向 量产生部分23使相同的组ID与这些节目相关联。随后,节目向量产 生部分23把匹配单词或者匹配单词组以及组ID一起保存在数据存储 部分24中。
另一方面,如果在步骤S404进行的处理中产生的确定结果指示 单词的匹配率小于预定值,例如70%,那么处理流程进入步骤S406。 在步骤S405进行的处理结束之后,处理流程也进入步骤S406。在步 骤S406,节目向量产生部分23确定标题之一的所有单词是否已与另 一标题的所有单词进行比较。
如果在步骤S406进行的处理中产生的确定结果指示标题之一的 所有单词还没有与另一标题的所有单词进行比较,那么处理流程返回 步骤S403,再次进行步骤S403的处理以及后续步骤的处理。
另一方面,如果在步骤S406进行的处理中产生的确定结果指示 标题之一的所有单词已与另一标题的所有单词进行了比较,那么结束 处理的执行。
通过进行上述处理,使基于构成标题的单词的匹配率的组ID与 具有该标题的节目的节目向量PP相关联。随后,数据传输部分25通 过网络8,把组ID和标题传送给TV接收设备4或者EPG接收设备9。 从而,具有类似标题的节目可被归入相同组中。具有类似标题的节目 的例子是如上所述的连续剧和特别节目。
另外,通过根据构成标题的单词的匹配率产生组,具有相同标题 的节目可被检测为同一组的节目,尽管EPG或元数据包括由半尺寸和 全尺寸数字,半尺寸和全尺寸字符或小写字符和大写字符造成的符号 外观差异。
此外,除了单词的匹配率之外,广播电台,节目类型或广播开始 时间可被加入到分组条件中。我们以具有标题“News”的新闻节目为 例。由于该标题只具有包括“News”在内的很少单词,因此在上面参考 图10中所示的流程图解释的处理中,不同广播电台和不同形式的新闻 节目可能会被检测为属于相同组的节目。从而,为了解决这个问题, 只有相同广播电台广播的满足单词的匹配率的节目才被归入相同组 中。
通过参考图11中所示的流程图,下面的说明解释除了根据构成 标题之一的单词和构成另一标题的单词之间的匹配度之外,还根据要 求相同广播电台的附加条件对标题分组的标题分组处理3。
在步骤S421到S424进行的处理与分别在前面参考图10说明的 流程图的步骤S401到S404进行的处理相同。即,数据获取部分21 从通过参考保存在元数据数据库7中的EPG数据得到的编目元数据中 抽取标题,并把标题提交给节目向量产生部分23。随后,节目向量产 生部分23对每个标题进行词法分析,把每个标题分解成单词。随后, 节目向量产生部分23计算从词法分析获得的标题的单词之间的匹配 度。即,节目向量产生部分23找出代表标题之一的单词匹配另一标题 的单词的匹配率。随后,节目向量产生部分23确定单词的匹配率是否 至少等于预定值,例如70%。
如果在步骤S424进行的处理中产生的确定结果指示单词的匹配 率至少等于预定值,例如70%,那么处理流程进入步骤S425,节目向 量产生部分23确定具有所述标题的节目是否由相同的广播电台广播。
如果在步骤S425进行的处理中产生的确定结果指示具有所述标 题的节目由相同的广播电台广播,那么处理流程进行步骤S426,节目 向量产生部分23使节目与相同的组ID相关联。随后,节目向量产生 部分23把匹配单词或者匹配单词组以及组ID和广播电台一起保存在 数据存储部分24中。
另一方面,如果在步骤S424进行的处理中产生的确定结果指示 单词的匹配率小于预定值,例如70%,或者在步骤S425进行的处理 中产生的确定结果指示具有所述标题的节目不是由相同的广播电台广 播,那么处理流程进入步骤S427。在步骤S426进行的处理结束之后, 处理流程也进入步骤S427。在步骤S427,节目向量产生部分23确定 标题之一的所有单词是否已与另一标题的所有单词进行比较。
如果在步骤S427进行的处理中产生的确定结果指示标题之一的 所有单词还没有与另一标题的所有单词进行比较,那么处理流程返回 步骤S423,再次进行步骤S423的处理以及后续步骤的处理。
另一方面,如果在步骤S427进行的处理中产生的确定结果指示 标题之一的所有单词已与另一标题的所有单词进行了比较,那么结束 处理的执行。
通过进行上述处理,使基于构成标题的单词的匹配率,以及基于 具有所述标题的节目由相同的广播电台广播的事实的组ID与具有所 述标题的节目的节目向量相关联。随后,数据传输部分25通过网络8, 把组ID和标题传送给TV接收设备4或者EPG接收设备9。从而, 在把具有类似标题的节目归入相同组的处理中,防止由不同广播电台 广播的节目被归入相同组中。具有类似标题,但是由不同广播电台广 播的节目的例子是如上所述的新闻节目。
在上面参考图11中所示的流程图说明的处理中,除了要求构成 标题的单词的匹配率至少应等于预定值的条件之外,附加条件要求节 目应是由相同的广播电台广播的节目。但是,要注意的是,除了广播 电台之外,广播时间段和类型当然也可被包括为除了要求构成标题的 单词的匹配率至少应等于预定值的条件之外的对节目的标题分组的条 件。
另外,即使由于体育实况报道或特别节目的缘故,连续剧或在固 定时间内播放的节目的广播开始时间被延迟,作为除了要求构成标题 的单词的匹配率至少应等于预定值的条件之外的把节目归入相同组的 条件,通过确定节目的广播开始时间是否在预定的时间范围,例如1 小时内,可对节目分组。
通过参考图12中所示的流程图,下面的说明解释除了根据构成 节目的标题之一的单词和构成另一标题的单词之间的匹配度之外,还 根据关于节目的广播开始时间是否在预定时间范围内的确定结果,对 节目的标题分组的标题分组处理4。
在步骤S441到S444进行的处理与分别在前面参考图10说明的 流程图的步骤S401到S404进行的处理相同。即,数据获取部分21 从通过参考保存在元数据数据库7中的EPG数据得到的编目元数据中 抽取标题,并把标题提交给节目向量产生部分23。随后,节目向量产 生部分23对每个标题进行词法分析,把每个标题分解成单词。随后, 节目向量产生部分23计算从词法分析获得的标题的单词之间的匹配 度。即,节目向量产生部分23找出代表标题之一的单词匹配另一标题 的单词的匹配率。随后,节目向量产生部分23确定单词的匹配率是否 至少等于预定值,例如70%。
如果在步骤S444进行的处理中产生的确定结果指示单词的匹配 率至少等于预定值,例如70%,那么处理流程进入步骤S445,节目向 量产生部分23确定具有所述标题的节目的广播开始时间是否在预定 的时间范围,例如1小时内被相互移动。
如果在步骤S445进行的处理中产生的确定结果指示具有所述标 题的节目的广播开始时间在预定的时间范围内被相互移动,那么处理 流程进行步骤S446,节目向量产生部分23使节目与相同的组ID相关 联。随后,节目向量产生部分23把匹配单词或者匹配单词组以及组 ID和广播开始时间的范围一起保存在数据存储部分24中。
另一方面,如果在步骤S444进行的处理中产生的确定结果指示 单词的匹配率小于预定值,例如70%,或者在步骤S445进行的处理 中产生的确定结果指示具有所述标题的节目的广播开始时间未在预定 的时间范围内被相互移动,那么处理流程进入步骤S447。在步骤S446 进行的处理结束之后,处理流程也进入步骤S447。在步骤S447,节 目向量产生部分23确定标题之一的所有单词是否已与另一标题的所 有单词进行比较。
如果在步骤S447进行的处理中产生的确定结果指示标题之一的 所有单词还没有与另一标题的所有单词进行比较,那么处理流程返回 步骤S443,再次进行步骤S443的处理以及后续步骤的处理。
另一方面,如果在步骤S447进行的处理中产生的确定结果指示 标题之一的所有单词已与另一标题的所有单词进行了比较,那么结束 处理的执行。
通过进行上述处理,使基于构成标题的单词的匹配率,以及基于 具有所述标题的节目的广播开始时间在预定的时间范围内被相互移动 的事实的组ID与具有所述标题的节目的节目向量相关联。随后,数 据传输部分25通过网络8,把组ID和标题传送给TV接收设备4或 者EPG接收设备9。从而,在除了根据构成节目的标题之一的单词和 构成另一标题的单词之间的匹配度之外,还根据关于节目的广播开始 时间是否在预定的时间范围内的确定结果,把具有类似标题的节目归 入相同组的处理中,广播开始时间在预定的时间范围内被相互移动的 节目被检测为属于相同的节目。从而能够防止在预定的时间范围内, 广播开始时间被特别节目等相互移动的节目不被检测为属于相同组的 节目。
图13是表示节目推荐处理设备10的结构的方框图。
数据获取部分41是从分发服务器5接收节目向量PP,以及和节 目向量PP一起传送的节目方效应向量EfPP的组件。节目向量抽取部 分42是从分发服务器5接收的节目向量PP抽取匹配处理所必需的, 或者产生用户模型所必需的节目向量PP的组件。如果需要,节目向 量抽取部分42把抽取的节目连同对应于抽取的节目向量PP的节目方 效应向量EfPP一起传送给匹配处理部分43。
操作输入部分44一般包括诸如键盘、触摸垫和鼠标之类的输入 装置。操作输入部分44是接收用户输入的初始编目信息以及用于产生 用户模型的输入主题,并把所述信息和输入主题提供给初始目录存储 部分45的组件。初始目录存储部分45是对从操作输入部分44接收的 初始编目信息和同样从操作输入部分44接收的用于产生用户模型的 主题编目的组件。如果需要,初始目录存储部分45把初始编目信息和 主题提供给操作日志获取部分46或者匹配处理部分43。根据用户通 过操作输入部分44输入的操作,不时更新保存在初始目录存储部分 45中的数据。初始编目信息一般包括揭示用户不喜欢的节目的信息, 以及揭示用户喜欢的节目的信息。揭示用户不喜欢的节目的信息的例 子是不喜欢的类型,不喜欢的关键字和不喜欢的表演者。另一方面, 揭示用户更喜欢的节目的信息的例子是喜欢的类型,喜欢的关键字和 喜欢的表演者。
操作日志获取部分46是从TV显示设备11或记录/再现设备12 获得操作日志,并把操作日志的信息分成正历史和负历史的组件。如 果需要,操作日志获取部分46参考保存在初始目录存储部分45中的 信息,从数据获取部分41获得的节目向量PP抽取对应于正负历史的 节目向量PP,把对应于抽取的节目向量PP的正负历史分别提供给正 历史存储部分47和负历史存储部分48。正历史存储部分47保存供给 其的正历史的事件,并产生正历史向量UP。出于同样原因,负历史 存储部分48保存供给其的负历史的事件,并产生负历史向量MUP。 产生的正历史向量UP和产生的负历史向量MUP被提供给匹配处理 部分43。
上面引用的正历史是用于抽取用户急切想要观看的节目,或者换 句话说,被认为是特别喜欢的一个节目的信息。当用户观看并记录节 目时,或者更具体地说,当用户接受在后面说明的处理中,从推荐节 目列表中向用户建议的节目,并观看和记录接受的节目时,该节目的 元数据被保存在正历史存储部分47中作为给人深刻印象的元数据。正 历史存储部分47得到每个详细项目或者每个大项的正历史的总和,从 而产生正历史向量UP。
另一方面,上面引用的负历史是用于从推荐节目中排除不合需要 的节目的信息。不合需要的节目是用户几乎不想观看的节目。当用户 不观看和记录不合需要的节目时,该节目的元数据被保存在负历史存 储部分48中作为印象淡薄的元数据。不合需要的节目的例子是和在最 初记录的信息中规定的不喜欢的项目对应的节目,记录之后未被观看 即被删除的节目,和在后面说明的处理中,从推荐节目列表中向用户 建议的,但是未被用户接受的节目。假定用户在最初记录的信息中把 体育规定为不喜欢的项目。这种情况下,包括用于作为负印象的体育 的加权值5的类型Gmup={0,0,5,0,0,0,0,0,0}作为附加信息被保存在负 历史存储部分48中。出于相同的原因,负历史存储部分48得到每个 详细项目或者每个大项的负历史的总和,从而产生负历史向量MUP。
匹配处理部分43验证从节目向量抽取部分42抽取的节目向量 PP和从正历史存储部分47接收的正历史向量UP之间的,或者节目 向量PP和从负历史存储部分48接收的负历史向量MUP之间的匹配。
节目向量PP,正历史向量UP和负历史向量MUP都可以是具有 包括被排列成1个数组的所有详细项目分量的格式的向量。这种情况 下,由于诸如标题或关键字之类的信息具有多个单词,因此在向量中, 每个单词具有和诸如类型之类的项目相等的加权值。为了解决这种问 题,在匹配处理部分43中采用的归一化处理部分61通过把每个单词 的频率除以构成每个节目的标题的单词的数目,使用作由单词构成的 项目的标题和构成所述标题的单词归一化。我们以标题 Tm={Toukaidou-1,Mitsuya-1,ghost-story-1}为例。这种情况下,该标 题被归一化为Tm={Toukaidou:0.33,Mitsuya:0.33,ghost-story: 0.33}。这样,对于用作由单词构成的项目的标题和构成所述标题的单 词,构成所述标题的单词的归一化频率的总和被用作加权值,并且由 于总和为1,因此在匹配过程中不会出现任何问题。
向量运算部分62是进行用于确定节目向量PP和正历史向量UP 之间的,以及节目向量PP和负历史向量MUP之间的匹配的匹配处理 的组件。
如果节目向量PP,正历史向量UP和负历史向量MUP都是具有 包括被排列成1个数组的所有详细项目分量的格式的向量,那么向量 运算部分62得到节目向量PP和正历史向量UP之间的相似度SimUP, 以及节目向量PP和负历史向量MUP之间的相似度SimMUP。相似 度SimUP和相似度SimMUP都用余弦距离cosθ来表示。根据下面给 出的等式(1)计算代表相似度SimUP的cosθu,而根据同样在下面给出 的等式(2)计算代表相似度SimMUP的cosθm。从等式(1)和(2)可看出, 通过把两个向量的内积除以这两个向量的绝对值的乘积,计算余弦距 离。
SimUP=cosθu=UP·PP/|UP|×|PP|     (1)
SimMUP=cosθm=MUP·PP/|MUP|×|PP|  (2)
在上面的等式(1)和(2)中,符号PP、UP和MUP分别表示节目向 量PP,正历史向量UP和负历史向量MUP。另外,符号“·”表示一个 运算符,用于得到在该运算符两侧的向量的内积。另一方面,符号“×” 表示一个运算符,用于得到在该运算符两侧的向量的绝对值的标积。
另外,如果节目向量PP,正历史向量UP和负历史向量MUP都 是作为对每个大项进行的向量化处理的结果而获得的向量,那么向量 运算部分62可得到对于每个大项,节目向量PP和正历史向量UP之 间的相似度,以及节目向量PP和负历史向量MUP之间的相似度,并 把关于所有大项得到的相似度的总和计算为每个相似度SimUP和相 似度SimMUP。
例如假定对于被分解成单词,并被用作大项的标题,提供的正历 史向量UP代表标题Tup={school-1,ghost-story-1,toilet-1},而提供的 节目向量PP代表标题Tm={Toukaidou-1,Mitsuya-1,ghost-story-1}。 另外我们假定单位向量的长度为1。这种情况下,向量的长度(绝对值) 是分量的平方和的平方根,根据下面的等式(3)计算代表两个标题之间 的相似度的正余弦距离:
cosθt=1·1/×=1/3   (3)
在等式(3)中,符号“·”表示一个运算符,用于得到在该运算符两 侧的向量的内积,而符号“×”表示一个运算符,用于得到在该运算符 两侧的向量的绝对值的标积。
出于相同的原因,按照类似于等式(3)的方式,对于分别用作大项 的标题,可得到表示由节目向量PP和负历史向量MUP代表的两个标 题之间的相似度的负余弦距离。
现在,例如假定正历史向量UP是复合正历史向量UP={标题 Tup,类型Gup,表演者Pup,编剧/作者/制片人Aup,内容(关键 字)Kup},负历史向量MUP是复合负历史向量MUP={标题Tmup, 类型Gmup,表演者Pmup,编剧/作者/制片人Amup,内容(关键 字)Kmup}。这种情况下,对于用作大项的标题,类型,表演者,编剧 /作者/制片人和内容中的每一个,根据等式(3)按照相同的方式得以正 余弦距离和负余弦距离。由于对每个大项得到正余弦距离和负余弦距 离,因此均根据如下所示的等式(4)计算相似度SimUP和相似度 SimMUP:
Sim=cosθt+cosθg+cosθp+cosθa+cosθk    (4)
在上面的等式中,cosθt是关于标题大项,节目向量PP和正历史 向量UP之间的,或者节目向量PP和负历史向量MUP之间的余弦距 离。cosθg是关于类型大项,节目向量PP和正历史向量UP之间的, 或者节目向量PP和负历史向量MUP之间的余弦距离。cosθp是关于 表演者大项,节目向量PP和正历史向量UP之间的,或者节目向量 PP和负历史向量MUP之间的余弦距离。cosθa是关于编剧/作者/制片 人大项,节目向量PP和正历史向量UP之间的,或者节目向量PP和 负历史向量MUP之间的余弦距离。cosθk是关于内容(关键字)大项, 节目向量PP和正历史向量UP之间的,或者节目向量PP和负历史向 量MUP之间的余弦距离。
如果如上面的等式中所示,相似度SimUP和相似度SimMUP都 被计算成关于所有大项得到的余弦距离的总和,那么项目之间的加权 值方面的偏差被消除。从而,上面的计算采用和前面说明的归一化相 同的原理。从而,不同于节目向量PP,正历史向量UP和负历史向量 MUP都具有包括排列成1个数组的所有详细项目分量的格式,由归一 化处理部分61进行的归一化处理可被省略。
即,如果在不进行归一化处理的情况下使用均具有包括排列成1 个数组的所有详细项目分量的格式的节目向量PP,正历史向量UP和 负历史向量MUP,那么在诸如标题和内容之类的项目中,随着历史事 件的数目的增大,不同的单词的数目增大,但是和具有易于重叠的分 量的项目相比,每个不同单词的频率几乎不增大。具有易于重叠的分 量的项目的例子是广播电台和类型。
为此,如果相似度SimUP和相似度SimMUP都被计算成关于所 有分量得到的余弦距离的总和,那么均具有易于重叠的分量的每个项 目的效应变得更大。具有易于重叠的分量的项目的例子是如上所述的 广播电台和类型项目。我们假定用户是实况广播员A的崇拜者,从而 用户喜欢观看“由实况广播员A解说的球队B的棒球比赛的实况报 道”。这种情况下,用作类型项目的信息“棒球比赛的实况报道”易于重 叠为历史。另一方面,用作表演者项目的信息“实况广播员A”难以重 叠为历史。从而,在一些情况下,另一实况广播员B解说的球队B的 棒球比赛的实况报道被推荐,而不是推荐介绍实况广播员A的综艺节 目。
如果进行归一化处理,或者相似度SimUP和相似度SimMUP都 被计算成关于所有大项得到的余弦距离的总和,那么实况广播员A参 与的综艺节目可被推荐,而不受历史频率的量值影响。从而能够高度 准确地在推荐的节目中反映用户的喜好。
另外,向量运算部分62还能够根据和节目向量PP一起传送的节 目方效应向量EfPP和保存在初始目录存储部分45中的用户初始编目 的信息,或者根据后面说明的产生的并在用户信息编目部分63中编目 的用户方效应向量EfUP或者后面说明的用户方负效应向量EfMUP 应用加权值,计算相似度SimUP和相似度SimMUP。
随后,根据通过采用上述方法计算的相似度SimUP,向量运算部 分62还从具有最高相似度的节目开始,计算预定数目的节目的对负历 史向量MUP的相似度SimMUP,所述预定数目的节目均具有对正历 史向量UP的较高相似度SimUP。一般来说,这样的节目的预定数目 被设置为10。随后,向量运算部分62得到差值(SimUP-SimMUP), 并从具有最大差值(SimUP-SimMUP)的节目开始,确定均具有较大差 值(SimUP-SimMUP)的预定数目的节目。最后,向量运算部分62把每 个确定的节目提供给推荐信息输出部分49作为推荐节目。一般来说, 均被确定为推荐节目的节目的预定数目被设置为3。
另外,如果节目向量PP已被分组,那么向量运算部分62根据关 于推荐节目的信息,在用户信息编目部分63中对以第一优先级推荐的 一组编目,并把以第一优先级推荐的一组的每个节目推荐为以第一优 先级推荐的节目组。
除此之外,向量运算部分62能够通过使用保存在初始目录存储 部分45中的主题,对节目向量PP进行过滤处理,从而产生用户模型 向量,并在用户信息编目部分63中对产生的用户模型向量编目,以便 进行匹配处理。用户模型将在后面详细说明。
根据作为初始目录存储部分45中用户初始编目的信息,从初始 目录存储部分45接收的信息,从正历史存储部分47接收的正历史向 量UP或者从负历史存储部分48接收的负历史向量MUP,用户信息 编目部分63产生用户方效应向量EfUP和用户方负效应向量EfMUP, 保存用户方效应向量EfUP和用户方负效应向量EfMUP。节目向量 PP的用户方效应向量EfUP是对节目向量PP的分量设置加权值的向 量。节目向量PP的加权分量都是对将向用户推荐的节目的选择重要 的大项。在节目的选择中只使用节目向量PP的加权项目。作为一种 备选方案,用户方效应向量EfUP是揭示用户对每个项目的喜好的向 量。另一方面,节目向量PP的用户方负效应向量EfMUP是对节目向 量PP的分量设置加权值的向量。但是,节目向量PP的加权分量都是 对将向用户推荐的节目的选择不重要的大项。在节目的选择中只使用 节目向量PP的非加权项目。作为一种备选方案,用户方负效应向量 EfMUP是揭示用户对每个项目的不喜欢的向量。
换句话说,节目向量PP的用户方效应向量EfUP是指示用户方 效应向量EfUP的每个项目对节目向量PP和正历史向量UP之间的匹 配处理中的匹配的影响有多大的向量。另一方面,节目向量PP的用 户方负效应向量EfMUP是指示用户方负效应向量EfMUP的每个项目 对节目向量PP和负历史向量MUP之间的匹配处理中的失配的影响有 多大的向量。
用户方效应向量EfUP和用户方负效应向量EfMUP都可由用户 设置,或者被设置成事先确定的某一值。作为一种备选方案,也可根 据初始目录存储部分45中的用户初始编目的信息,产生用户方效应向 量EfUP和用户方负效应向量EfMUP。
更具体地说,假定节目向量PP的用户方效应向量EfUP是表示 关于节目向量PP的分量的加权值,并且节目向量PP的加权分量都是 对将向用户推荐的节目的选择重要的大项。这种情况下,如果类型是 对用户重要的分量,那么对于节目向量PP={标题Tm,类型Gm,时间段 Hm,广播电台Sm,表演者Pm,编剧/作者/制片人Am,内容Km}, 用户方效应向量EfUP被设置成典型值{1,5,1,1,1,1,1}。另一方面,如 果表演者和类型都是对用户重要的分量,那么用户方效应向量EfUP 被设置成典型值{1,3,1,1,5,1,1}。
假定用户方效应向量EfUP是揭示用户对每个项目的喜好的向 量,并且类型大项是Gm={戏剧,综艺,体育,电影,音乐,儿童节 目/教育,一般文艺/记录片,新闻/报道,其它}。这种情况下,如果一 般文艺/记录片是用户更喜欢的节目类型,那么用户方效应向量EfUP 被设置成典型值{0,0,0,0,0,0,5,0,0}。
另外,可根据正历史向量UP或负历史向量MUP,或者通过对 用户在固定时期内观看的节目计数,可产生用户方效应向量EfUP和 用户方负效应向量EfMUP。除此之外,也可对每种类型产生用户方效 应向量EfUP和用户方负效应向量EfMUP。通过参考图22-27中所示 的流程图,说明产生用户方效应向量EfUP和用户方负效应向量 EfMUP的方法。
此外,如果需要,用户信息编目部分63保存在向量运算部分2 进行的处理中产生的信息。在向量运算部分2进行的处理中产生的信 息包括以第一优先级推荐的一组和用户模型向量。
上面说明的匹配处理部分43还能够在不进行排除节目(该节目被 认为是用户不喜欢的节目)的处理的情况下,通过从均具有对正历史向 量UP的较高相似度的节目向量PP的那些节目中选择推荐节目,只根 据例如正历史确定推荐节目。均具有对正历史向量UP的较高相似度 的节目向量PP的节目都是用户急切想要观看的节目。另一方面,被 认为是用户不喜欢的节目的节目都是用户不愿意观看的节目。
推荐信息输出部分49对推荐节目列表50上匹配处理部分43提 供的推荐节目的信息编目,并把该信息提供给TV显示设备11或者记 录/再现设备12。推荐节目列表50具有可从节目推荐处理设备10中除 去的结构,并被用于保存由推荐信息输出部分49提供的推荐节目的信 息。通过把推荐节目的信息保存在推荐节目列表50中,根据迄今保存 的历史信息,即使例如使用不同的TV接收设备4,不同的TV显示设 备11或者不同的记录/再现设备12,也能够进行诸如推荐节目的处理 和自动记录处理之类的处理。
另外,如果需要,匹配处理部分43也与驱动器51连接。磁盘71、 光盘72、磁光盘73或半导体存储器74安装在驱动器51上。如果需 要,驱动器51与磁盘71、光盘72、磁光盘73或半导体存储器74交 换数据。
下面参考图14中所示的流程图,说明由节目推荐处理设备10进 行的产生正历史向量和负历史向量的正历史向量和负历史向量产生处 理1。
首先在步骤S71,操作日志获取部分46把从初始目录存储部分 45读出的初始编目数据提供给负历史存储部分48,负历史存储部分 48随后通过参考初始编目数据,产生负历史向量MUP。
随后,在下一步骤S72,操作日志获取部分46确定保存在初始 目录存储部分45中的初始编目数据是否已被改变。如果在步骤S72 进行的处理中产生的确定结果指示初始编目数据已被改变,那么处理 流程返回步骤S71,操作日志获取部分46再次进行步骤S71和S72的 处理。
另一方面,如果在步骤S72进行的处理中产生的确定结果指示初 始编目数据未被改变,那么处理流程进入步骤S73,操作日志获取部 分46确定是否已从TV显示设备11或记录/再现设备12供给了操作 日志。如果在步骤S73进行的处理中产生的确定结果指示还未从TV 显示设备11或记录/再现设备12供给操作日志,那么处理流程返回步 骤S72,操作日志获取部分46再次进行步骤S72和S73的处理。
另一方面,如果在步骤S73进行的处理中产生的确定结果指示已 从TV显示设备11或记录/再现设备12供给了操作日志,那么处理流 程进入步骤S74,操作日志获取部分46确定供给的操作日志是否是正 历史。如果操作日志是例如记录操作,那么该操作中所涉及的节目的 节目向量PP是正历史节目向量。另一方面,如果操作日志是擦除还 未被再现的记录数据,那么该操作中所涉及的节目的节目向量PP是 负历史节目向量。
如果在步骤S74进行的处理中产生的确定结果指示供给的操作 日志是正历史,那么处理流程进入步骤S75,操作日志获取部分46从 数据获取部分41抽取被确定为正历史的操作日志中所涉及的节目的 节目向量PP,并把该节目向量PP提供给正历史存储部分47。正历史 存储部分47把该节目向量PP保存为附加正历史。
随后,在下一步骤S76,正历史存储部分47得到详细项目或大 项的正历史节目向量PP的总和,从而产生正历史向量UP。在步骤 S76进行的处理结束之后,处理流程返回步骤S72,重复步骤S72和 后续步骤的处理。
另一方面,如果步骤S74进行的处理中产生的确定结果指示供给 的操作日志不是正历史,即,如果步骤S74进行的处理中产生的确定 结果指示供给的操作日志是负历史,那么处理流程进入步骤S77,操 作日志获取部分46从数据获取部分41抽取被确定为负历史的操作日 志中所涉及的节目的节目向量PP,并把该节目向量PP提供给负历史 存储部分48。负历史存储部分48把该节目向量PP保存为附加负历史。
随后,在下一步骤S78,负历史存储部分48得到详细项目或大 项的负历史节目向量PP的总和,从而产生负历史向量MUP。在步骤 S78进行的处理结束之后,处理流程返回步骤S72,重复步骤S72和 后续步骤的处理。
一般来说,大项由复合正历史向量UP={标题Tup,类型Gup, 表演者Pup,编剧/作者/制作人Aup,内容(关键字)Kup}表示,并且在 每个大项中规定详细的项目。这种情况下,在表示大项的每个正历史 向量UP中,表示向量和的数字被附加到构成大项的每个详细项目上。 例如,如图15中所示,表示类型大项的正历史向量UP是类型 Gup={(戏剧-25),(综艺-34),(体育-42),(电影-37),(音乐-73),(儿童 节目/教育-120),(一般文艺/记录片-3),(新闻/报道-5),(其它-23)},其 中代表正历史的总和的数字被附加到构成该大项的每个详细项目上。
代表诸如标题大项之类的大项的向量可用单词来表示。例如,表 示标题大项的正历史向量UP是标题Tup={(标题1-12),(标题 2-3),…},其中代表正历史的总和的数字被附加到构成该大项的每个 单词上。类似于正历史向量UP,在负历史向量MUP中,代表总和的 数字被附加到每个项目上。
在图15中所示的每个复合正历史向量UP(当然还有图15中未示 出的复合负历史向量MUP)中,用作向量的分量的大项是标题,类型, 表演者,编剧/作者/制作人和内容(关键字)。这种情况下,大项的数目 小于前面参考图5说明的构成节目向量PP的大项的数目。但是不必 说,复合正历史向量UP和复合负历史向量MUP可具有和节目向量 PP相同的大项。
在前面参考图14中所示的流程图说明的处理中,根据在输入操 作日志之前的初始编目数据,产生负历史向量MUP。不过,在数据被 初始编目时,用于选择用户的喜欢节目的信息也可被编目,使得也可 在输入操作日志之前产生正历史向量UP。另外,可以不根据初始编 目数据,而是只根据操作日志产生正历史向量UP或负历史向量MUP。
这样,正历史向量UP和负历史向量MUP可被独立产生和保存, 从而,能够进行高度准确地识别用户的喜好的匹配处理。
要注意的是,此时能够以更高的准确度找到正历史和负历史。在 前面参考图14中所示的流程图说明的处理中,以对应于所有项目的正 历史的节目向量PP的总和的形式产生正历史向量UP。出于同样原因, 以对应于所有项目的负历史的节目向量PP的总和的形式产生负历史 向量MUP。不过,也可以对应于类型的正历史的节目向量PP的总和 的形式产生类型的正历史向量UP。出于同样原因,也可以对应于类 型的负历史的节目向量PP的总和的形式产生类型的负历史向量 MUP。
依赖于广播节目的类型,存在其中只有用户不是特别喜欢的某一 表演者出现在节目中,使得在推荐的节目中不能正确反映用户的喜好 的常见情况。更具体地说,我们假定用户喜爱戏剧,并且只喜爱介绍 并不表演戏剧,而是作为综艺节目表演者的喜剧演员A的综艺节目。 对于这样的用户,我们还假定观看综艺节目的次数与观看戏剧的次数 的比例例如为2∶8。这种情况下,如果在不考虑类型的情况下累积表 演者的正历史,那么在一些情况下,和喜剧演员A相比,频繁出现在 戏剧中的表演者B在正历史向量UP中具有高分,尽管表演者B不是 用户喜欢的演员。对于这样的情况,介绍频繁出现在戏剧中的表演者 B的记录节目被推荐,而不是介绍喜剧演员A的综艺节目被推荐。为 了解决该问题,对每种类型累积正历史,并根据累积的正历史为每种 类型产生正历史向量UP。出于同样原因,对每种类型累积负历史, 并根据累积的负历史为每种类型产生负历史向量MUP。
例如假定用户是实况广播员A的崇拜者,从而用户喜欢观看“实 况广播员A解说的球队B的棒球比赛的实况报道”。这种情况下,作 为类型项目的体育的信息易于重叠为历史。另一方面,作为表演者项 目的“实况广播员A”的信息难以重叠为历史。从而,在一些情况下, 由另一实况广播员解说的球队B的棒球比赛的实况报道被推荐,而不 是介绍实况广播员A的综艺节目。为了解决这种问题,对每个表演者 累积正历史,并根据累积的正历史为每个表演者产生正历史向量UP。 出于同样原因,对每个表演者累积负历史,并根据累积的负历史为每 个表演者产生负历史向量MUP。
通过如上所述对每个特定元素累积历史,能够以更高的准确度在 推荐的节目中反映用户的喜好,而不会失去用户真正喜欢的事物。
从而,匹配处理部分43能够验证正历史向量UP和提供的节目 向量PP之间的匹配,以及负历史向量MUP和供给的节目向量PP之 间的匹配,从而,能够产生正确反映用户的喜好的推荐节目信息。
参考图16中所示的流程图,下面的说明解释所进行的根据对每 种类型累积的历史,产生正历史向量UP和负历史向量MUP的正历 史向量和负历史向量产生处理2。
在步骤S81-S84进行的处理与分别在上面参考图14说明的流程 图的步骤S71-S74进行的处理相同。即,操作日志获取部分46把初始 编目数据提供给负历史存储部分48,负历史存储部分48随后通过参 考初始编目数据,产生负历史向量MUP。之后,操作日志获取部分 46确定初始编目数据是否已被改变。
如果初始编目数据未被改变,那么操作日志获取部分46确定操 作日志是否已被提供。
如果操作日志已被提供,那么处理流程进入步骤S84,确定操作 日志是否是正历史。如果操作日志是正历史,那么处理流程进入步骤 S85,操作日志获取部分46从数据获取部分41抽取和被确定为正历史 的操作日志中所涉及的节目对应的节目向量PP,并把获得的节目向量 PP提供给正历史存储部分47。正历史存储部分47随后抽取该节目向 量PP的类型。
随后,在下一步骤S86,正历史存储部分47把从数据获取部分 41获得的节目向量PP保存为所抽取类型的附加正历史。
随后,在下一步骤S87,正历史存储部分47得到关于与额外保 存的节目向量PP相关的类型的所有详细项目或所有大项的正历史节 目向量PP的总和,以便产生该类型的正历史向量UP。在步骤S87进 行的处理结束之后,处理流程返回步骤S82,再次进行步骤S82和后 续步骤的处理。
另一方面,如果在步骤S84进行的处理中产生的确定结果指示操 作日志是负历史,那么处理流程进入步骤S88,操作日志获取部分46 从数据获取部分41抽取和被确定为负历史的操作日志中所涉及的节 目对应的节目向量PP,并把获得的节目向量PP提供给负历史存储部 分48。负历史存储部分48随后抽取该节目向量PP的类型。
随后,在下一步骤S89,负历史存储部分48把从数据获取部分 41获得的节目向量PP保存为所抽取类型的附加负历史。
随后,在下一步骤S90,负历史存储部分48得到关于与额外保 存的节目向量PP相关的类型的所有详细项目或所有大项的负历史节 目向量PP的总和,以便产生该类型的负历史向量MUP。在步骤S90 进行的处理结束之后,处理流程返回步骤S82,再次进行步骤S82和 后续步骤的处理。
通过进行上述处理,为每种类型产生正历史向量UP和负历史向 量MUP。从而,能够以更高的准确度在正历史向量UP和负历史向量 MUP反映用户的喜好,而不会失去用户真正喜欢的事物。从而,能 够产生关于正确反映用户的喜好的推荐节目的信息。
参考图17中所示的流程图,下面的说明解释对于其中节目向量 PP,正历史向量UP和负历史向量MUP都具有包括排列成1个数组 的所有详细项目分量的格式的情况,所进行的识别匹配节目的匹配处 理1。
首先在步骤S101,节目向量抽取部分42从数据获取部分41获 得多个节目,例如在预定时间段中广播的节目的节目向量PP,并把节 目向量PP提供给在匹配处理部分43中采用的归一化处理部分61。归 一化处理部分61对作为均代表构成标题和内容的一个单词的分量,包 括在每个接收的节目向量PP中的分量和包括在从正历史存储部分47 获得的正历史向量UP中的分量进行归一化。随后,归一化处理部分 61把归一化结果提供给向量运算部分62。
更具体地说,我们假定接收的节目向量PP代表例如标题 Tm={Toukaidou-1,Mitsuya-1,ghost-story-1}。这种情况下,归一化处 理部分61把节目向量PP归一化为标题Tm={Toukaidou:0.33, Mitsuya:0.33,ghost-story:0.33}。通过这样进行归一化处理,对于 每个节目,可使应用于用作构成节目标题的项目的单词的加权值的总 和等于1。
随后,在下一步骤S102,在匹配处理部分43中采用的向量运算 部分62通过利用前面给出的等式(1),以每个节目向量PP和正历史向 量UP之间的余弦距离的形式计算相似度SimUP。
随后,在下一步骤S103,向量运算部分62通过相互比较相似度 SimUP,从具有对正历史向量UP的最高相似度SimUP的向量开始, 抽取预定数目的短距离节目向量PP,检查相似度SimUP,相似度 SimUP均已在步骤S102进行的处理中被计算为每个节目向量PP和正 历史向量UP之间的余弦距离。例如,向量运算部分62抽取10个节 目向量PP。
随后,在下一步骤S104,向量运算部分62通过利用前面给出的 等式(2),以在步骤S103进行的处理中抽取的每个节目向量PP和从负 历史存储部分48获得的负历史向量MUP之间的余弦距离的形式计算 相似度SimMUP。
随后,在下一步骤S105,向量运算部分62计算相似度SimUP 和对应相似度SimMUP之间的差值,抽取从具有最大差值的节目开始 的预定数目的最相似节目的节目向量PP(或EPG数据)作为推荐信息, 并把推荐信息提供给推荐信息输出部分49。如前所述,相似度SimUP 是节目向量PP和正历史向量UP之间的余弦距离。出于同样原因,相 似度SimMUP是节目向量PP和负历史向量MUP之间的余弦距离。 例如,向量运算部分62抽取具有最大差值的节目的节目向量PP(或者 EPG数据)。推荐信息随后在推荐信息列表50中被编目,并被输出给 电视显示设备11和记录/再现设备12。最后,结束该流程图表示的处 理的执行。
通过进行上述处理,在节目向量PP,正历史向量UP和负历史 向量MUP均具有包括排列成1个数组的所有详细项目分量的格式的 情况下,能够根据节目向量PP和正历史向量UP之间的相似度 SimUP,以及节目向量PP和负历史向量MUP之间的相似度SimMUP, 确定和用户的喜好相符的推荐节目。
通过参考图18中所示的流程图,下面的说明解释匹配处理2,其 中不是对用作向量的分量的每个单词进行归一化,而是对每个大项计 算余弦距离,并得到计算的余弦距离的总和,作为将被用于确定推荐 节目的相似度SimUP或相似度SimMUP。
首先在步骤S111,节目向量抽取部分42从数据获取部分41抽 取多个节目的节目向量PP,并把节目向量PP提供给在匹配处理部分 43中采用的向量运算部分62。节目的一个例子是在预定的一段时间内 广播的节目。随后,对于构成前面引用的复合(compound)正历史向 量UP的每个大项,向量运算部分62计算每个节目向量PP和从正历 史存储部分47读出的正历史向量UP之间的余弦距离。
随后在步骤S112,根据前面给出的等式(4),向量运算部分62对 每个项目计算在步骤S111进行的处理中计算的每个余弦距离的总和, 从而得到相似度SimUP。
随后,在下一步骤S113,通过相互比较相似度SimUP,向量运 算部分62检查在步骤S112进行的处理中得到的相似度SimUP。每个 相似度SimUP代表节目向量PP和正历史向量UP之间的余弦距离的 总和。向量运算部分62随后从具有最高相似度SimUP的向量开始, 抽取预定数目的短距离节目向量PP。抽取的节目向量PP的预定数目 一般为10。
随后,在下一步骤S114,向量运算部分62对构成前面引用的复 合负历史向量MUP的每个大项,计算在步骤S113进行的处理中抽取 的每个节目向量PP和从负历史存储部分48读出的负历史向量MUP 之间的余弦距离。
随后,在下一步骤S115,根据前面给出的等式(4),向量运算部 分62对每个项目计算在步骤S114进行的处理中计算的每个余弦距离 的总和,从而得到相似度SimMUP。
随后,在下一步骤S116,向量运算部分62计算相似度SimUP 和对应相似度SimMUP之间的差值,抽取从具有最大差值的节目开始 的预定数目的最相似节目的节目向量PP(或EPG数据)作为推荐信息, 并把推荐信息提供给推荐信息输出部分49。如前所述,相似度SimUP 是节目向量PP和正历史向量UP之间的余弦距离。出于同样原因,相 似度SimMUP是节目向量PP和负历史向量MUP之间的余弦距离。 例如,向量运算部分62抽取具有最大差值的3个节目的节目向量 PP(或者EPG数据)。推荐信息随后在推荐信息列表50中被编目,并 被输出给电视显示设备11和记录/再现设备12。最后,结束该流程图 表示的处理的执行。
通过进行上述匹配处理,不是对用作向量的分量的每个单词进行 归一化,而是对每个大项计算余弦距离,得到计算的余弦距离的总和, 作为将被用于确定推荐节目的相似度SimUP或相似度SimMUP。从 而能够根据节目向量PP和正历史向量UP之间的相似度,以及节目向 量PP和负历史向量MUP之间的相似度,确定和用户的喜好相符的推 荐节目,而不受由属于不同大项的详细元素之间的历史重叠引起的偏 差的影响。
在前面参考图17中所示的流程图说明的匹配处理1和前面参考 图18中所示的流程图说明的匹配处理2中,从由对正历史向量UP的 最高相似度指示的用户最喜欢节目中排除由负历史指示的用户最不喜 欢的节目。但是,通过例如只利用正历史,也能够确定推荐节目。
另外,在选择节目的处理中,在一些情况下,用户可能已依据更 喜欢新闻和报道节目,喜欢类型胜过表演者,或者认为内容重要而不 关心表演者,确定了被加权和不被加权的项目。换句话说,用户具有 用于选择节目的一些重要项目和不重要项目。
从而,匹配处理1和匹配处理2可使用前面已说明的节目方效应 向量EfPP,用户方效应向量EfUP和用户方负向量EfMUP。另外, 可允许用户确定是否使用节目方效应向量EfPP,用户方效应向量 EfUP和用户方负向量EfMUP。
通过参考图19中所示的流程图,下面的说明解释允许用户确定 是否使用对其来说,节目向量PP,正历史向量UP和负历史向量MUP 都是具有包括排列成1个数组的所有详细项目分量的格式的向量的节 目方效应向量EfPP,用户方效应向量EfUP的匹配处理3。
首先,在步骤S121,向量运算部分62从初始目录存储部分45 获得节目方效应向量EfPP,用户方效应向量EfUP或用户方负向量 EfMUP的利用设置数据。用户已通过操纵操作输入部分44,把利用 设置数据输入了初始编目存储部分45。利用设置数据是指示在匹配处 理中是否通过利用节目方效应向量EfPP,用户方效应向量EfUP或用 户方负向量EfMUP,应用加权值的信息。
随后,在下一步骤S122,如果需要,向量运算部分62从用户信 息编目部分63读出用户方效应向量EfUP,并根据下面给出的等式(5) 计算每个节目向量PP和正历史向量UP之间的余弦距离,从而得到相 似度SimUP。
SimUP = epd 1 · eud 1 · p 1 · u 1 + epd 2 · eud 2 · p 2 · u 2 + . . . | PP | | UP | - - - ( 5 )
注意在等式(5)中,节目向量PP=(p1,p2,…),正历史向量 UP=(u1,u2,…),节目方效应向量EfPP=(epd1,epd2,…)和用户方效应向 量EfUP=(eud1,eud2,…)被认为分别代表节目向量PP,正历史向量UP, 节目方效应向量EfPP和用户方效应向量EfUP。另外,在等式(5)中, 还假定节目方效应向量EfPP和用户方效应向量EfUP被使用。但是, 节目方效应向量EfPP和用户方效应向量EfUP任意之一可不被使用。 这种情况下,值1代替了不被使用的节目方效应向量EfPP或用户方 效应向量EfUP。
除此之外,用户方效应向量EfUP可以是可由用户设置的向量, 一个根据用户给出的初始设置设定的向量,或者在用户信息编目部分 63中产生的向量。后面将参考图22-25中所示的流程图,详细说明用 户方效应向量EfUP的产生。
随后,在下一步骤S123,向量运算部分62通过相互比较相似度 SimUP,检查在步骤S122进行的处理中得到的相似度SimUP。每个 相似度SimUP代表节目向量PP和正历史向量UP之间的余弦距离。 向量运算部分62随后从具有最高相似度SimUP的向量开始,抽取预 定数目的短距离节目向量PP。抽取的节目向量PP的预定数目一般为 10。
随后,在下一步骤S124,如果需要,向量运算部分62从用户信 息编目部分63读出用户方负效应向量EfMUP,并根据下面给出的等 式(6)计算在步骤S123进行的处理中抽取的每个节目向量PP和负历史 向量MUP之间的余弦距离,从而得到相似度SimMUP。
SimMUP = epd 1 · emd 1 · p 1 · m 1 + epd 2 · emd 2 · p 2 · m 2 + . . . | PP | | MP | - - - ( 6 )
注意在等式(6)中,节目向量PP=(p1,p2,…),负历史向量 MUP=(m1,m2,…),节目方效应向量EfPP=(epd1,epd2,…)和用户方负效 应向量EfMUP=(emd1,emd2,…)被认为分别代表节目向量PP,负历史 向量MUP,节目方效应向量EfPP和用户方负效应向量EfMUP。另 外,在等式(6)中,还假定节目方效应向量EfPP和用户方负效应向量 EfMUP被使用。但是,节目方效应向量EfPP和用户方负效应向量 EfMUP任意之一可不被使用。这种情况下,值1代替了不被使用的节 目方效应向量EfPP或用户方负效应向量EfMUP。
除此之外,用户方负效应向量EfMUP可以是可由用户设置的向 量,一个根据用户给出的初始设置设定的向量,或者在用户信息编目 部分63中产生的向量。后面将参考图26或27中所示的流程图,详细 说明用户方负效应向量EfMUP的产生。
随后,在下一步骤S125,向量运算部分62计算相似度SimUP 和对应相似度SimMUP之间的差值,抽取从具有最大差值的节目开始 的预定数目的最相似节目的节目向量PP(或EPG数据)作为推荐信息, 并把推荐信息提供给推荐信息输出部分49。如前所述,相似度SimUP 是节目向量PP和正历史向量UP之间的余弦距离。出于同样原因,相 似度SimMUP是节目向量PP和负历史向量MUP之间的余弦距离。 例如,向量运算部分62抽取具有最大差值的3个节目的节目向量 PP(或者EPG数据)。推荐信息随后在推荐信息列表50中被编目,并 被输出给电视显示设备11和记录/再现设备12。最后,结束该流程图 表示的处理的执行。
通过进行上述匹配处理,根据设置数据,节目方效应向量EfPP, 用户方效应向量EfUP或用户方负效应向量EfMUP被用于抽取推荐信 息。从而,能够推荐正确反映用户的喜好的信息。
在上面参考图19中所示的流程图说明的处理中,节目向量PP, 正历史向量UP和负历史向量MUP都是具有包括排列成1个数组的 所有详细项目分量的格式的向量。不过,可对每个大项处理节目向量 PP,正历史向量UP和负历史向量MUP。
通过参考图20中所示的流程图,下面的说明解释允许在对于每 个大项的匹配过程中,反映节目方效应向量EfPP,用户方效应向量 EfUP或用户方负效应向量EfMUP。
首先,在步骤S131,进行和图19中所示的流程图的步骤S121 相同的处理,从而获得节目方和用户方的效应向量的利用设置数据。
随后,在下一步骤S132,对于构成复合正历史向量UP的每个大 项,向量运算部分62计算每个输入的节目向量PP和从正历史存储部 分47读出的正历史向量UP之间的余弦距离。在该计算中,没有使用 效应向量。
随后,在下一步骤S133,根据下面给出的等式(7),向量运算部 分62把关于每个项目计算的余弦距离乘以效应向量(需要的话),并计 算每个项目的余弦距离或者所得到的乘积的总和,从而得到相似度 SimUP。
SimUP=epdt·eudt·cosθut+epdg·eudg·cosθug
+epdp·eudp·cosθup+epda·euda·cosθua
+epdk·eudk·cosθuk                          (7)
注意在上面的等式(7)中,节目向量PP=(pt,pg,pp,pa,pk)和正历史向 量UP=(ut,ug,up,ua,uk)之间的余弦距离由 (cosθut,cosθug,cosθup,cosθua,cosθuk)表示,节目方效应向量EfPP由 EfPP=(epdt,epdg,epdp,epda,epdk)表示,而用户方效应向量EfUP由 EfUP=(eudt,eudg,eudp,euda,eudk)表示。另外在等式(7)中,节目方效应 向量EfPP和用户方效应向量EfUP都被使用。但是,节目方效应向量 EfPP和用户方效应向量EfUP任意之一可以不被使用。这种情况下, 值1代替未使用的节目方效应向量EfPP或用户方效应向量EfUP。
随后,在下一步骤S134,向量运算部分62通过相互比较相似度 SimUP,检查以节目向量PP和正历史向量UP之间的余弦距离的总和 的形式,在步骤S133进行的处理中得到的相似度SimUP。向量运算 部分62随后从具有最高相似度SimUP的向量开始,抽取预定数目的 短距离节目向量PP。抽取的节目向量PP的预定数目一般为10。
随后,在下一步骤S135,向量运算部分62关于每个大项,计算 在步骤S134进行的处理中抽取的每个节目向量PP和从负历史存储部 分48读出的负历史向量MUP之间的余弦距离。这种情况下,不使用 效应向量。
随后,在下一步骤S136,根据下面给出的等式(8),向量运算部 分62把关于每个项目计算的余弦距离乘以效应向量(需要的话),并计 算余弦距离或者所得到的乘积的总和,从而得到相似度SimMUP。
SimMUP=epdt·emdt·cosθmt+epdg·emdg·cosθmg
+epdp·emdp·cosθmp+epda·emda·cosθma
+epdk·emdk·cosθmk                            (8)
注意在上面的等式(8)中,节目向量PP=(pt,pg,pp,pa,pk)和负历史向 量MUP=(mt,mg,mp,ma,mk)之间的余弦距离由 (cosθmt,cosθmg,cosθmp,cosθma,cosθmk)表示,节目方效应向量EfPP由 EfPP=(epdt,epdg,epdp,epda,epdk)表示,而用户方负效应向量EfMUP 由EfMUP=(emdt,emdg,emdp,emda,emdk)表示。另外在等式(8)中,节 目方效应向量EfPP和用户方负效应向量EfMUP都被使用。但是,节 目方效应向量EfPP和用户方负效应向量EfMUP任意之一可以不被使 用。这种情况下,值1代替未使用的节目方效应向量EfPP或用户方 负效应向量EfMUP。
随后,在下一步骤S137,向量运算部分62计算相似度SimUP 和对应相似度SimMUP之间的差值,抽取从具有最大差值的节目开始 的预定数目的最相似节目的节目向量PP(或EPG数据)作为推荐信息, 并把推荐信息提供给推荐信息输出部分49。如前所述,相似度SimUP 是节目向量PP和正历史向量UP之间的余弦距离。出于同样原因,相 似度SimMUP是节目向量PP和负历史向量MUP之间的余弦距离。 例如,向量运算部分62抽取具有最大差值的3个最类似节目的节目向 量PP(或者EPG数据)。推荐信息随后在推荐信息列表50中被编目, 并被输出给电视显示设备11和记录/再现设备12。最后,结束该流程 图表示的处理的执行。
在上述处理中,对于每个大项,效应向量都被用作加权值。从而, 能够产生和用户的喜好的细节相符的推荐信息。
通过参考图21中所示的流程图,下面的说明解释所进行的通过 使用由前面参考图16中所示的流程图说明的正历史向量和负历史向 量产生处理2关于每种类型产生的正历史向量UP和负历史向量 MUP,以及使用为每种类型提供的用户方效应向量EfUP和用户方负 效应向量EfMUP来识别匹配节目的匹配处理5。
首先,在步骤S141,进行和图19中所示的流程图的步骤S121 相同的处理,从而获得效应向量的设置数据。
随后,在下一步骤S142,向量运算部分62抽取输入节目向量PP 的类型。在下面的说明中,输入节目向量PP的类型例如是戏剧。
随后,在下一步骤S143,向量运算部分62从正历史存储部分47 读出基于戏剧类型的正历史向量UP,并关于构成复合正历史向量UP 的每个大项,计算每个输入节目向量PP和正历史向量UP之间的余弦 距离。这种情况下,没有使用效应向量。
随后,在下一步骤S144,根据下面给出的等式(9),向量运算部 分62把关于每个项目计算的余弦距离乘以戏剧类型的用户方效应向 量(需要的话),并计算每个项目的余弦距离或者所得到的乘积的总和, 从而得到相似度SimUP。
SimUP=epdt·eudtd·cosθutd+epdg·eudgd·cosθugd
+epdp·eudpd·cosθupd+epda·eudad·cosθuad
+epdk·eudkd·cosθukd                            (9)
注意在上面的等式(9)中,节目向量PP=(pt,pg,pp,pa,pk)和正历史向 量UP=(ut,ug,up,ua,uk)之间的余弦距离由 (cosθutd,cosθugd,cosθupd,cosθuad,cosθukd)表示,节目方效应向量EfPP 由EfPP=(epdt,epdg,epdp,epda,epdk)表示,而用户方效应向量EfUP由 EfUP=(eudtd,eudgd,eudpd,eudad,eudkd)表示。另外在等式(9)中,节目方 效应向量EfPP和用户方效应向量EfUP都被使用。但是,节目方效 应向量EfPP和用户方效应向量EfUP任意之一可以不被使用。这种 情况下,值1代替未使用的节目方效应向量EfPP或用户方效应向量 EfUP。
随后,在下一步骤S145,向量运算部分62通过相互比较相似度 SimUP,检查以节目向量PP和正历史向量UP之间的余弦距离的总和 的形式,在步骤S144进行的处理中得到的相似度SimUP。向量运算 部分62随后从具有最高相似度SimUP的向量开始,抽取预定数目的 短距离节目向量PP。抽取的节目向量PP的预定数目一般为10。
随后,在下一步骤S146,向量运算部分62关于每个大项,计算 在步骤S145进行的处理中抽取的每个节目向量PP和关于戏剧类型从 负历史存储部分48读出的负历史向量MUP之间的余弦距离。这种情 况下,不使用效应向量。
随后,在下一步骤S147,通过使用下面给出的等式(10),向量运 算部分62把关于每个项目计算的余弦距离乘以戏剧类型的效应向量 (需要的话),并计算余弦距离或者所得到的乘积的总和,从而得到相 似度SimMUP。
SimMUP=epdt·emdtd·cosθmtd+epdg·emdgd·cosθmgd
+epdp·emdpd·cosθmpd+epda·emdad·cosθmad
+epdk·emdkd·cosθmkd                    (10)
注意在上面的等式(10)中,节目向量PP=(pt,pg,pp,pa,pk)和负历史 向量MUP=(mt,mg,mp,ma,mk)之间的余弦距离由 (cosθmtd,cosθmgd,cosθmpd,cosθmad,cosθmkd)表示,节目方效应向量 EfPP由EfPP=(epdt,epdg,epdp,epda,epdk)表示,而用户方负效应向量 EfMUP由EfMUP=(emdtd,emdad,emdpd,emdad,emdkd)表示。另外,在 等式(10)中,节目方效应向量EfPP和用户方负效应向量EfMUP都被 使用。但是,节目方效应向量EfPP和用户方负效应向量EfMUP任意 之一可以不被使用。这种情况下,值1代替未使用的节目方效应向量 EfPP或用户方负效应向量EfMUP。
随后,在下一步骤S148,向量运算部分62计算相似度SimUP 和对应相似度SimMUP之间的差值,抽取从具有最大差值的节目开始 的预定数目的最相似节目的节目向量PP(或EPG数据)作为推荐信息, 并把推荐信息提供给推荐信息输出部分49。如前所述,相似度SimUP 是节目向量PP和正历史向量UP之间的余弦距离。出于同样原因,相 似度SimMUP是节目向量PP和负历史向量MUP之间的余弦距离。 例如,向量运算部分62抽取具有最大差值的3个节目的节目向量 PP(或者EPG数据)。推荐信息随后在推荐信息列表50中被编目,并 被输出给电视显示设备11和记录/再现设备12。最后,结束该流程图 表示的处理的执行。
在上述处理中,对于每个大项,计算每个节目向量PP和类型的 正历史向量UP之间的余弦距离,以及每个节目向量PP和类型的负历 史向量MUP之间的余弦距离,通过把类型的效应向量用作加权值, 得到相似度。从而,能够产生和用户的喜好的细节相符的推荐信息。
另外,根据初始目录存储部分45中用户最初编目的数据,产生 用户方效应向量EfUP和用户方负效应向量EfMUP。作为一种备选方 案,根据正历史向量UP或负历史向量MUP,或者通过对用户在预定 时间内观看的节目计数,产生用户独有的用户方效应向量EfUP和用 户方负效应向量EfMUP。
通过参考图22中所示的流程图,下面的说明解释所进行的通过 对用户在固定时间内观看的节目计数,产生用户方效应向量EfUP的 用户方效应向量产生处理1。
首先,在步骤S151,在匹配处理部分43中采用的用户信息编目 部分63选择未处理的大项。
随后,在下一步骤S152,用户信息编目部分63通过参考保存在 正历史存储部分47中的正历史,检测用户在预定时间,例如1周,1 月或3月内观看的节目,请求节目向量抽取部分42从数据获取部分 41抽取用户在预定时间内观看的节目的节目向量PP,并关于构成在 步骤S151进行的处理中选择的大项的每个详细项目对节目的数目计 数。
更具体地说,例如假定在步骤S151进行的处理中选择的大项是 类型Gm={戏剧,综艺,体育,电影,音乐,儿童节目/教育,一般文 艺/记录片,新闻/报道,其它}。这种情况下,通过把对应于节目的节 目向量PP的分量归入构成该大项的项目中,用户信息编目部分63对 用户在预定时间内观看的节目的数目计数。例如假定用户在预定时间 内观看的节目的数目为50。这种情况下,对用户在预定时间内观看的 节目的数目计数的结果是例如Gm={10,18,5,2,8,1,0,1,5}。
随后,在下一步骤S153,用户信息编目部分63请求节目向量抽 取部分42从数据获取部分41抽取在相同的预定时间内广播的所有节 目的节目向量PP,并关于构成在步骤S151进行的处理中选择的大项 的每个详细项目对节目的数目计数。
更具体地说,例如假定在步骤S151进行的处理中选择的大项是 类型Gm={戏剧,综艺,体育,电影,音乐,儿童节目/教育,一般文 艺/记录片,新闻/报道,其它}。这种情况下,通过把对应于节目的节 目向量PP的分量归入构成该大项的项目中,用户信息编目部分63对 在相同的预定时间内广播的所有节目的数目计数。例如假定在相同的 预定时间内广播的所有节目的数目为1000。这种情况下,对在相同的 预定时间内广播的所有节目的数目计数的结果是例如 Gm={104,239,68,25,78,91,60,254,81}。
随后,在下一步骤S154,用户信息编目部分63计算用户实际观 看的节目的数目与所有节目的数目的比值。如上所述,用户实际观看 的节目的数目与所有节目的数目已分别在步骤S152和S153进行的处 理中获得。
收视率竞争的影响使节目安排被看作反映一般公众的喜好的安 排。即,计算用户实际观看的节目的数目与所有节目的数目的比值的 处理换句话说等同于通过把所有节目的数目用作标准模型,使用户实 际观看的节目的数目归一化的处理。在步骤S154进行的处理中得到的 归一化向量被称为归一化向量D。
例如假定在步骤S151进行的处理中选择的大项是类型Gm={戏 剧,综艺,体育,电影,音乐,儿童节目/教育,一般文艺/记录片, 新闻/报道,其它}。例如还假定1周内广播的所有节目的数目为 (8,12,3,7,6,4,2,8,10),用户实际观看的节目的数目为(4,0,1,2,3,4,5,5,2)。 这种情况下,归一化向量 D=(4/8,0/12,1/3,2/7,3/6,4/4,1/2,2/8,2/10)=(0.5,0, 0.33,0.28,0.5,1.0,0.5,0.13,0.2)。从而,等于1.0的归一化向量D的分量 意味着关于该分量在预定时间内广播的所有节目用户都观看了。另一 方面,等于0的归一化向量D的分量意味着关于该分量在预定时间内 广播的所有节目用户都没有观看。
随后,在下一步骤S155,用户信息编目部分63根据在步骤S154 进行的处理中获得的计算结果,产生大项的效应向量。
为了产生效应向量,大项类型Gm={戏剧,综艺,体育,电影, 音乐,儿童节目/教育,一般文艺/记录片,新闻/报道,其它}的一个项 目被用于设置标准值。例如假定普通用户大约观看一周内广播的戏剧 节目的20%。这种情况下,标准值被设置成0.2。由于该大项的效应 向量被计算成相对值,效应向量可具有在0-1范围中的值。从而用户 方效应向量具有从作为在步骤S154进行的处理的结果而获得的归一 化向量D和用作基准的设置值计算得到的相对值。
从而,表示用户的喜欢类型的大项类型Gm的效应向量E被计算 成E=(0.3,-0.2,0.13,0.08,0.3,0.8,0.3,-0.07,0.0),这得到指示用户喜欢儿 童节目/教育类型,但是不喜欢综艺类型的确定结果。
随后,在下一步骤S156,用户信息编目部分63确定是否已产生 所有大项的效应向量。如果在步骤S156进行的处理中产生的确定结果 指示还没有产生所有大项的效应向量,那么处理流程返回步骤S151, 再次执行步骤S151和后续步骤的处理。
另一方面,如果在步骤S156进行的处理中产生的确定结果指示 已产生所有大项的效应向量,那么处理流程进入步骤S157,用户信息 编目部分63保存所有大项的效应向量。最后,结束由该流程图表示的 处理的执行。
通过进行上述处理,能够得到一般公众的喜好和用户独有的喜好 之间的差别。另外,通过关于每个预定的一段时间,例如3月或半年, 重新计算用户方效应向量EfUP,能够实时地推荐反映用户的喜好的 节目。
另外,在上面参考图22中所示的流程图说明的处理中,根据用 户在预定的时间,例如1周,1月或3月内观看的节目,得到用户方 效应向量EfUP。用作计算用户方效应向量EfUP的节目可以是在多个 时段,例如较短时段,中等时段和较长时段内观看的节目。这种情况 下,根据用户在每个时段内观看的节目得到用户方效应向量EfUP, 用户方效应向量EfUP被用于确定推荐信息。
在上述处理中,用户独有的喜好被用作用户方效应向量EfUP。 但是,用户独有的喜好也可被用作匹配处理的正历史向量UP。
除此之外,代替所有广播的节目,只对用户主要观看节目的特定 预定时段内广播的节目的数目计数。这种特定时段的一个例子是从 18:00到22:00的所谓黄金时段。通过设置这样的特定预定时段, 能够显著减少找出一般公众的喜好的计算处理的数量。
参考图23中所示的流程图,下面的说明解释所进行的通过计算 余弦距离,得到将被用来在匹配处理中使用用户独有的喜好和一般公 众的喜好之间的差异的用户方效应向量EfUP的用户方效应向量产生 处理2,所述余弦距离表示正历史向量UP和一般公众的喜好之间的 相似度。
首先,在步骤S161,在匹配处理部分43中采用的用户信息编目 部分63获得保存在正历史存储部分47中的正历史向量UP。
随后,在下一步骤S162,用户信息编目部分63获得表示一般公 众的喜好的标准喜好向量APP。
标准喜好向量APP可以是从分发服务器5接收的向量,或者由 于收视率竞争的效果使节目的安排被看作反映一般公众的喜好的安 排,按照上面参考图22中所示的流程图说明的用户方效应向量产生处 理1相同的方式,在预定时段内广播的所有节目的数目可被计数,并 且如果需要,可进行归一化处理,以便得到标准喜好向量APP。
在分发服务器5中,通过利用一般收视率的调查结果,或者采用 另一方法,可产生标准喜好向量APP。
随后,在下一步骤S163,用户信息编目部分63对每个大项,计 算正历史向量UP和标准喜好向量APP之间的余弦距离。余弦距离越 长,那么正历史向量UP和标准喜好向量APP之间的相似度越高。
随后,在下一步骤S164,用户信息编目部分63通过得到在步骤 S163进行的处理中计算的余弦距离的倒数,产生每个大项的用户方效 应向量EfUP。最后,结束由该流程图代表的处理的执行。余弦距离 的倒数越大,那么正历史向量UP和标准喜好向量APP之间的相似度 越低。
通过进行上述处理,能够得到反映一般公众的喜好和用户独有的 喜好之间的差异的用户方效应向量EfUP。通过利用该用户方效应向 量EfUP进行节目推荐处理,能够确定强调一般公众的喜好和用户独 有的喜好之间的差异的推荐节目。
在上面的说明中,节目向量PP和正历史向量UP都是为每个大 项提供的向量。但是要注意节目向量PP和正历史向量UP也可以都是 具有包括排列成1个数组的所有详细项目分量的格式的向量。另外在 这种情况下,不必说也可进行相同的处理。
另外,正历史向量UP和标准喜好向量APP之间的相似度不仅用 于计算效应向量,而且是表示用户的独特性的指示符,这样的指示符 可直接用于节目的推荐。例如,对于正历史向量UP和标准喜好向量 APP之间的较高相似度来说,可首先推荐风格迎合公众的新节目。
如上参考图22和23中所示的流程图所述,如果根据学习过程中, 用户进行的操作的历史,恰当地得到用户方效应向量EfUP。但是, 用户方效应向量EfUP也可事先被初始编目。作为另一种备选方案, 根据经验得到的值也可被事先设置成用户方效应向量EfUP。
要注意的是通过不仅注意大项,而且注意构成每个大项的详细项 目,能够产生用户方效应向量EfUP。例如假定构成大项的表演者Pm 被分成主角表演者和配角表演者。和戏剧或电影中主角表演者的角色 分配相比,优先考虑配角表演者的角色分配的用户可设置用户方效应 向量EfUP,以增大配角表演者的加权值。在另一情况下,假定构成 用作大项的编剧/作者/制作人元素的人员,例如导演、制片人、作者 和摄影师被相互区分。这种情况下,和导演及制片人相比,更欣赏摄 影师的用户可设置用户方效应向量EfUP,以便增大摄影师的加权值。
另外,可为每种类型产生用户方效应向量EfUP,并用在匹配处 理中,对比为其产生用户方效应向量EfUP的类型的正历史向量UP 与节目向量PP,如同上面参考图21中所示的流程图说明的匹配处理 5的情况一样。
参考图24中所示的流程图,下面的说明解释所进行的通过关于 每种类型,对用户在预定时段中观看的节目计数,产生用户方效应向 量EfUP的用户方效应向量产生处理3。
首先,在步骤S171,在匹配处理部分43中采用的用户信息编目 部分63选择将关于其对用户在预定时段内观看的节目计数的类型。
随后,在下一步骤S172,用户信息编目部分63选择所选类型的 未处理大项。
随后,在下一步骤S173,通过参考保存在正历史存储部分47中 的正历史,用户信息编目部分63在用户在预定时段,例如1周,1月 或3月内观看的那些节目中检测所选类型的节目。随后,用户信息编 目部分63请求节目向量抽取部分42从数据获取部分41抽取检测到的 节目的节目向量PP,并关于构成在步骤S172进行的处理中选择的类 型大项的每个详细项目,对检测到的节目计数。
随后,在下一步骤S174,用户信息编目部分63请求节目向量抽 取部分42从数据获取部分41抽取作为属于所选类型的节目,用户在 预定时段内观看的所有节目的节目向量PP,并关于构成在步骤S172 进行的处理中选择的类型大项的每个详细项目,对这样的节目计数。
随后,在下一步骤S175,用户信息编目部分63通过把在步骤S173 进行的处理中获得的计数结果除以在步骤S174进行的处理中获得的 计数结果,计算用户实际观看的节目的数目与所选类型的所有节目的 数目的比值。
如上所述,收视率竞争的影响使节目的安排被看作反映公众喜好 的安排。即,计算用户实际观看的节目的数目与所选类型的所有节目 的数目的比值的处理换句话说等同于通过把所有节目的数目用作标准 模型,使用户实际观看的节目的数目归一化的处理。在步骤S175进行 的处理中得到的归一化向量被称为归一化向量D′。
例如假定从大项类型Gm={戏剧,综艺,体育,电影,音乐,儿 童节目/教育,一般文艺/记录片,新闻/报道,其它}中选择戏剧类型。 例如还假定对于与选择的戏剧类型对应的节目向量PP的大项时间段 Tm={早晨,白天,傍晚,黄金时段,深夜},1周内广播的所有节目 的数目为(10,35,7,53,17),用户实际观看的节目的数目为(5,0,0,8,4)。 这种情况下,归一化向量为D′=(5/10,0/35,0/7,8/53,4/17)=(0.5,0,0,0.28, 0.15,0.24)。从而,等于1.0的归一化向量D′的分量意味着关于该分量 在预定时间内广播的所有节目用户都观看了。另一方面,等于0的归 一化向量D′的分量意味着关于该分量在预定时间内广播的所有节目 用户都没有观看。
随后,在下一步骤S176,用户信息编目部分63根据在步骤S175 进行的处理中获得的计算结果,产生所选类型的大项的效应向量。
为了产生效应向量,大项时间段Tm={早晨,白天,傍晚,黄金 时段,深夜}的一个项目被用于设置标准值。例如假定普通用户大约观 看一周内在黄金时段广播的戏剧节目的20%。这种情况下,标准值被 设置成0.2。由于该大项的效应向量被计算成相对值,效应向量可具有 在0-1范围中的值。从而用户方效应向量具有从作为在步骤S175进行 的处理的结果而获得的归一化向量D′和用作基准的设置值计算得到 的相对值。
从而,表示用户的喜欢类型的大项类型Gm的效应向量E′被计 算成E′=(0.3,-0.2,-0.2,-0.05,0.04),这得到指示用户喜欢早间时段的戏 剧,但是不喜欢白天和傍晚时段的戏剧的确定结果。
随后,在下一步骤S177,用户信息编目部分63确定是否已关于 所选类型,产生所有大项的效应向量。如果在步骤S177进行的处理中 产生的确定结果指示还没有关于所选类型产生所有大项的效应向量, 那么处理流程返回步骤S172,再次执行步骤S172和后续步骤的处理。
另一方面,如果在步骤S177进行的处理中产生的确定结果指示 已关于所选类型产生了所有大项的效应向量,那么处理流程进入步骤 S178,用户信息编目部分63确定是否已处理了所有类型。如果在步骤 S178进行的处理中产生的确定结果指示还没有处理所有类型,那么处 理流程返回步骤S171,再次执行步骤S171和后续步骤的处理。
另一方面,如果在步骤S178进行的处理中产生的确定结果指示 已处理了所有类型,那么处理流程进入步骤S179,用户信息编目部分 63保存所有大项的效应向量,并结束处理的执行。
通过进行上述处理,能够得到关于每种类型,一般公众的喜好和 用户独有的喜好之间的差别。另外,通过关于每个预定的一段时间, 例如3月或半年,重新计算用户方效应向量EfUP,能够实时地推荐 反映用户的喜好的节目,如同前面参考图22中所示的流程图说明的处 理的情况一样。
另外,在上面参考图24中所示的流程图说明的处理中,根据用 户在预定的时间,例如1周,1月或3月内观看的节目,得到用户方 效应向量EfUP。但是,用作计算用户方效应向量EfUP的节目可以是 在多个时段,例如较短时段,中等时段和较长时段内观看的节目,如 同前面参考图22中所示的流程图说明的处理的情况一样。这种情况 下,根据用户在每个时段内观看的节目得到用户方效应向量EfUP, 用户方效应向量EfUP被用于确定推荐信息。
除此之外,在上面参考图24中所示的流程图说明的处理中,代 替所有广播的节目,只对用户主要观看节目的特定预定时段内广播的 节目计数。这种特定时段的一个例子是从18:00到22:00的所谓黄 金时段。
参考图25中所示的流程图,下面的说明解释所进行的通过计算 余弦距离,得到将被用来在匹配处理中使用用户独有的喜好和一般公 众的喜好之间的差异的用户方效应向量EfUP的用户方效应向量产生 处理4,所述余弦距离表示关于每种类型,正历史向量UP和一般公 众的喜好之间的相似度。
首先,在步骤S191,在匹配处理部分43中采用的用户信息编目 部分63选择将对其进行这种处理的类型。
随后,在下一步骤S192,用户信息编目部分63从保存在正历史 存储部分47中的正历史向量UP获得所选类型的正历史向量UP。
随后,在下一步骤S193,用户信息编目部分63从表示一般公众 的喜好的标准喜好向量APP获得所选类型的标准喜好向量APP。
如前所述,标准喜好向量APP可以是从分发服务器5接收的向 量,或者由于收视率竞争的效果使节目安排被看作反映一般公众的喜 好的安排,按照上面参考图24中所示的流程图说明的用户方效应向量 产生处理3相同的方式,每种类型的在预定时段内广播的所有节目的 数目可被计数,并且如果需要,可进行归一化处理,以便得到标准喜 好向量APP。
在分发服务器5中,通过利用一般收视率的调查结果,或者通过 采用另一方法,可产生标准喜好向量APP。
随后,在下一步骤S194,用户信息编目部分63通过使用每个大 项的正历史向量UP和标准喜好向量APP,关于每个大项,计算所选 类型的正历史向量UP和所选类型的标准喜好向量APP之间的余弦距 离。余弦距离越长,那么正历史向量UP和标准喜好向量APP之间的 相似度越高。
随后,在下一步骤S195,用户信息编目部分63通过得到在步骤 S194进行的处理中计算的余弦距离的倒数,产生每个大项的用户方效 应向量EfUP。余弦距离的倒数越大,那么正历史向量UP和标准喜好 向量APP之间的相似度越低。
随后,在下一步骤S196,用户信息编目部分63确定所有类型是 否已被处理。如果在步骤S196进行的处理中产生的确定结果指示还没 有处理所有类型,那么处理流程返回步骤S191,再次执行步骤S191 和后续步骤的处理。另一方面,如果在步骤S196进行的处理中产生的 确定结果指示所有类型已被处理,那么结束该流程图代表的处理的执 行。
通过执行上述处理,能够得到每种类型的反映一般公众的喜好和 用户独有的喜好之间的差别的用户方效应向量EfUP。
另外,按照和前面参考图23中所示的流程图说明的处理相同的 方式,通过得到负历史向量MUP和标准喜好向量APP之间的计算相 似度的倒数,用户信息编目部分63可产生每个大项的用户方负效应向 量EfMUP。
参考图26中所示的流程图,下面的说明解释所进行的通过比较 负历史向量MUP与一般公众的喜好,得到用户方负效应向量EfMUP 的用户方负效应向量产生处理1。
首先,在步骤S201,在匹配处理部分43中采用的用户信息编目 部分63获得保存在负历史存储部分48中的负历史向量MUP。
在下一步骤S202,用户信息编目部分63获得表示一般公众的喜 好的标准喜好向量APP。
标准喜好向量APP可以是从分发服务器5接收的向量,或者由 于收视率竞争的影响使节目安排被看作反映一般公众的喜好的安排, 按照上面参考图22中所示的流程图说明的用户方效应向量产生处理1 相同的方式,在预定时段内广播的所有节目的数目可被计数,并且如 果需要可进行归一化处理,以便得到标准喜好向量APP。
在下一步骤S203,用户信息编目部分63对每个大项,计算负历 史向量MUP和标准喜好向量APP之间的余弦距离。余弦距离越长, 那么负历史向量MUP和标准喜好向量APP之间的相似度越高。
在下一步骤S204,用户信息编目部分63通过得到在步骤S203 进行的处理中计算的余弦距离的倒数,产生每个大项的用户方负效应 向量EfMUP。随后,结束该流程图代表的处理的执行。
通过进行上述处理,可以产生用户方负效应向量EfMUP。从而, 能够有效地从推荐节目的列表中排除用户不喜欢的节目。
参考图27中所示的流程图,下面的说明解释所进行的得到每种 类型的用户方负效应向量EfMUP的用户方负效应向量产生处理2。
首先,在步骤S211,在匹配处理部分43中采用的用户信息编目 部分63选择将在后续步骤对其进行处理的类型。
在下一步骤S212,用户信息编目部分63从保存在负历史存储部 分48中的负历史向量MUP中获得所选类型的负历史向量MUP。
在下一步骤S213,用户信息编目部分63获得均表示一般公众的 喜好的标准喜好向量APP之一,作为所选类型的标准喜好向量APP。
随后,在下一步骤S214,用户信息编目部分63根据负历史向量 MUP和标准喜好向量APP,关于每个大项计算所选类型的负历史向 量MUP和所选类型的标准喜好向量APP之间的余弦距离。余弦距离 越长,那么负历史向量MUP和标准喜好向量APP之间的相似度越高。
随后,在下一步骤S215,用户信息编目部分63通过得到在步骤 S214进行的处理中计算的余弦距离的倒数,产生每个大项的用户方负 效应向量EfMUP。余弦距离的倒数越大,那么负历史向量MUP和标 准喜好向量APP之间的相似度越低。
随后,在下一步骤S216,用户信息编目部分63确定所有类型是 否已被处理。如果在步骤S216进行的处理中产生的确定结果指示还没 有处理所有类型,那么处理流程返回步骤S211,再次执行步骤S211 和后续步骤的处理。另一方面,如果在步骤S216进行的处理中产生的 确定结果指示所有类型已被处理,那么结束该流程图代表的处理的执 行。
通过进行上述处理,能够关于每种类型产生用户方负效应向量 EfMUP。从而,能够有效地从推荐节目列表中排除用户不喜欢的节目。
要注意的是也可以在前面参考图23和25-27中所示的流程图说 明的处理中,关于每个大项得到的余弦距离倒数的n倍的形式,得到 用户方效应向量EfUP和用户方负效应向量EfMUP。作为一种备选方 案,根据四舍五入技术从余弦距离的倒数舍去预定数目的数位而获得 的值也可被用作用户方效应向量EfUP或用户方负效应向量EfMUP。 作为另一种备选方案,作为从余弦距离的对应倒数中减去1的结果, 可得到用户方效应向量EfUP和用户方负效应向量EfMUP。作为另一 种备选方案,可以从余弦距离的对应倒数中减去1的结果的n倍的形 式,得到用户方效应向量EfUP和用户方负效应向量EfMUP。
在上面的说明中,节目向量PP和负历史向量MUP都是每个大 项的向量。但是要注意的是节目向量PP和负历史向量MUP也可以都 是具有包括排列成1个数组的所有详细项目分量的格式的向量。另外 这种情况下,不必说也可进行相同的处理。
另外,节目向量抽取部分42抽取的节目向量PP可具有附加于其 上的组ID或群集代码,所述组ID或群集代码表示对应于该节目向量 PP的节目所属的组。如上所述,通过分别进行由图7和8中所示的流 程图表示的处理,产生组ID和群集代码。
如果用户喜欢观看的节目形成连续剧,并且形成该连续剧的所有 节目将被推荐,那么能够减少推荐这些节目的处理量。通过把第一优 先级的相同组中的节目推荐为用户非常喜欢的节目,也可减少推荐处 理的数量。
下面参考图28中所示的流程图,说明包括组推荐的匹配处理。
首先,在步骤S221,在匹配处理部分43中采用的向量运算部分 62确定节目向量抽取部分42抽取的节目向量PP是否具有附加的识别 某一组的信息,以便确定与该节目向量PP相关的节目是否属于该组。 如前所述,附加到节目向量PP上的识别某一组的信息的例子是组ID 和群集代码。
如果在步骤S221进行的处理中产生的确定结果指示节目向量PP 具有附加的识别某一组的信息,那么处理流程进入步骤S222,向量运 算部分62确定组ID或群集代码指示的组是否已在用户信息编目部分 63中被编目为以第一优先级推荐的组。
如果在步骤S222进行的处理中产生的确定结果指示由组ID或群 集代码表示的组已在用户信息编目部分63中被编目为以第一优先级 推荐的组,那么处理流程进入步骤S223,向量运算部分62把与节目 向量PP相关的节目的信息作为推荐信息提供给推荐信息输出部分 49。推荐信息输出部分49在推荐节目列表50中对推荐信息建议的推 荐节目编目,并把推荐节目的信息输出给电视显示设备11或记录/再 现设备12。随后,处理流程进入后面说明的步骤S227。
另一方面,如果在步骤S221进行的处理中产生的确定结果指示 节目向量PP不具有附加的识别某一组的信息,或者在步骤S222进行 的处理中产生的确定结果指示由组ID或群集代码表示的组未在用户 信息编目部分63中被编目为以第一优先级推荐的组,那么处理流程进 入步骤S224,进行前面分别参考图17-21中所示的流程图说明的匹配 处理1到匹配处理5中的任意之一。
随后,在下一步骤S225,通过确定推荐节目的节目向量是否具 有附加的识别某一组的信息,向量运算部分62确定在步骤S224进行 的匹配处理1到匹配处理5任意之一中推荐的节目是否属于该组。如 前所述,附加到节目向量PP上的识别某一组的信息的例子是组ID和 群集代码。如果在步骤S225进行的处理中产生的确定结果指示推荐的 节目并不属于某一组,那么结束该流程图代表的处理的执行。
另一方面,如果在步骤S225进行的处理中产生的确定结果指示 推荐的节目属于某一组,那么处理流程进入步骤S226,向量运算部分 62把作为以第一优先级推荐的组加入节目向量PP的组ID(或者群集 代码)保存在用户信息编目部分63中。
在步骤S223或S226进行的处理结束之后,处理流程进行步骤 S227,向量运算部分62参考作为看作负历史的操作,保存在负历史存 储部分48中的操作的日志,确定是否已收到被看作负历史的操作输 入。在步骤S227进行的处理中检查的操作输入是关于在步骤S223进 行的处理中推荐的节目,或者作为以第一优先级推荐的一组,在步骤 S226进行的处理中被编目的节目而输入的操作输入。这是因为在步骤 S226进行的处理中被编目的节目是在步骤S224进行的处理中推荐的 节目中的一个已归类节目。被看作负历史的操作输入的例子是用户输 入的请求观看另一节目或者记录另一节目,因为用户不喜欢所推荐的 节目,或者在记录节目的再现之前,请求擦除该记录节目的命令。
如果在步骤S227进行的处理中产生的确定结果指示没有收到被 看作负历史的操作输入,那么结束该流程图代表的处理的执行。
另一方面,如果在步骤S227进行的处理中产生的确定结果指示 已收到被看作负历史的操作输入,那么处理流程进行步骤S228,向量 运算部分62从作为以第一优先级推荐的节目组的目录,保存在用户信 息编目部分63中的目录中除去包括目标节目的组。
要注意的是,通过进行前面参考图9中所示的流程图说明的标题 分组处理1,在一些情况下,多个组ID可被分配给一个节目向量PP。 具体地说,在这样的情况下,在步骤S228进行的处理中,根据负历史 操作输入,所有组ID可从作为以第一优先级推荐的组的目录,保存 在用户信息编目部分63中的目录中被除去。作为一种备选方案,均被 看作负历史的操作输入被累积,当用户输入预定数目的负历史输入操 作时,所有组ID可从作为以第一优先级推荐的组的目录,保存在用 户信息编目部分63中的目录中被除去。另外,对于其中节目向量PP 与组ID一一对应地关联的情况,可以采用这种特征。
通过进行上述处理,能够推荐用户喜欢观看的连续剧的所有节 目,能够推荐属于和用户非常喜欢的节目同组的节目,从而能够减少 推荐的操作处理。
在包括如上所述的组推荐的匹配处理中,也可根据从电视显示设 备11或记录/再现设备12获得的用户操作历史,关于对应的组产生正 历史向量UP和负历史向量MUP。
另外,根据在从电视显示设备11或记录/再现设备12获得的用 户操作历史中检测到的正历史,观看相同连续剧或者进行连续剧的记 录的预约的操作的数目可被计数,当所得到的计数超过预定值时,可 以第一优先级推荐该连续剧,而不专门进行匹配处理。
除此之外,代替进行根据用户历史推荐节目的处理,可根据用户 事先设置的主题设置用户模型,并根据用户模型,进行推荐节目的处 理。
通过经由利用主题的过滤过程,抽取和用户事先设置的主题对应 的节目,获得用户模型。初始目录存储部分45保存用户输入的主题。 多个主题可被保存在初始目录存储部分45中。另外,用户可通过进行 操作恰当地更新主题。向量运算部分62从作为均用于产生用户模型的 节目的节目向量PP,节目向量抽取部分42供给的节目向量PP中抽 取均包括保存在初始目录存储部分45中的主题的节目向量PP。随后, 向量运算部分62得到抽取的节目向量PP的总和,如果需要,顺序使 所述总和归一化,从而产生用户模型向量。最后,向量运算部分62 把用户模型向量保存在用户信息编目部分63中。
例如我们假定用户规定时间段Hm=“11PM之后”和类型 Gm=“综艺”作为主题。这种情况下,通过使用主题产生用户模型“深 夜的综艺节目”,进行过滤处理。用户模型“深夜的综艺节目”包括作为 配置要素的在23:00之后深夜时间段中广播的综艺节目中表演的喜剧 演员。从而,例如,在匹配处理中,出现该表演者的节目从与综艺类 型不同的类型的节目中被抽取,作为推荐节目。与综艺类型不同的类 型的例子是戏剧类型。从而,与对每个项目进行匹配处理相比,远远 超出该类型的考虑范围的节目可被确定为用户的喜好。
要注意用于产生用户模型的节目一般可以是在预定时间中广播 的所有节目,或者在预定时段,例如所谓的黄金时段中广播的一组节 目。
另外,例如,在相同的过滤条件下,对不同的各组节目进行过滤 处理,以便产生详细对应于每个不同的节目安排,例如一年的不同时 间的节目安排和不同时段的节目安排的用户模型向量。
更具体地说,即使在相同条件,例如“类型Gm=音乐”下,现代 的节目安排具有不同于10年前的节目安排的广播时间和表演者。从 而,可产生与“10年前的乐迷”用户模型不同的“现代乐迷”用户模型。 从而,能够推荐由其“10年前的乐迷”喜欢听其歌声的流行歌手作为演 员的戏剧或电影。另外,还能够推荐其中现代歌手演唱“10年前的乐 迷”喜欢收听的一首歌曲的节目。
另外,即使对于相同的条件,例如“类型Gm=音乐”,也可进行 过滤处理,从而获得主要是成人观看节目的时段,以及主要是儿童观 看节目的时段的多组不同节目。从而,能够产生不同的用户模型。一 般来说,成人的时段从20:00到24:00,而儿童的时段从15:00到 20:00。
随后,向量运算部分62计算节目向量抽取部分42提供的节目向 量PP和在用户信息编目部分63中编目的用户模型向量之间的相似 度。随后,根据计算结果,向量操作部分62产生推荐信息,并把该信 息提供给推荐信息输出部分49。推荐信息输出部分49在推荐节目列 表50中对推荐信息编目,并把该信息提供给电视显示设备11或记录/ 再现设备12。
下面参考图29中所示的流程图,说明使用用户模型的匹配处理。
首先,在步骤S231,在匹配处理部分43中采用的向量运算部分 62从已抽取节目向量PP的节目向量抽取部分42获得用于产生用户模 型的节目的节目向量PP。用于产生用户模型的节目可以是在预定的一 段时间,例如1月或3月内广播的节目。作为一种备选方案,用于产 生用户模型的节目可以是在预定的一定时间中的预定时段,例如黄金 时段内广播的节目。作为另一种备选方案,用于产生用户模型的节目 可以是在过去,例如10年或20年前的预定一段时间内广播的节目。
随后,在下一步骤S232,初始目录存储部分45获得用户通过操 纵操作输入部分44输入的主题,并保存该主题。向量运算部分62从 初始目录存储部分45读出所述主题,并把该主题设置成过滤条件。例 如,过滤条件可被描述成散列表。
随后,在下一步骤S233,向量运算部分62根据在步骤S232进 行的处理中设置的过滤条件,对在步骤S231进行的处理中获得的节目 向量PP进行过滤处理,以便抽取和过滤条件相符的节目向量PP。例 如,均用于产生用户模型的节目是在过去的3个月内广播的所有节目。 这种情况下,向量运算部分62根据过滤条件“标题Tm或类型Gm= 足球”,对过去3个月的节目向量PP进行过滤处理。
随后,在下一步骤S234,向量运算部分62得到在步骤S233进 行的过滤处理输出的节目向量PP的总和,并把该总和用作用户模型 向量。例如,向量运算部分62根据过滤条件“标题Tm或类型Gm= 足球”,对节目向量PP进行过滤处理。这种情况下,产生用户模型“足 球迷”的用户模型向量。
随后,在下一步骤S235,向量运算部分62计算在步骤S234进 行的处理中产生的用户模型向量和节目向量抽取部分42抽取的节目 向量PP之间的余弦距离。节目向量PP是均用作候选推荐信息的节目, 即,稍后要广播的节目的节目向量PP。
随后,在下一步骤S236,向量运算部分62通过相互比较相似度, 检查以用作候选推荐信息的节目的节目向量PP和用户模型向量之间 的余弦距离的形式,在步骤S235进行的处理中得到的相似度。根据检 查结果,向量运算部分62随后从具有最高相似度的向量开始,抽取预 定数目的短距离节目向量PP,作为推荐信息,并把该推荐信息提供给 推荐信息输出部分49。推荐信息输出部分49在推荐节目列表50中对 该推荐信息编目,并把该信息提供给电视显示设备11或记录/再现设 备12,并结束处理。
通过进行上述处理,即使用户进行的操作的历史不存在,也能够 推荐和用户设置的主题相符的节目。另外,在过去,在根据过滤条件“标 题Tm或类型Gm=足球”进行的过滤处理中,由足球运动员主演的综 艺节目或戏剧不被抽取。另一方面,在前面参考图29中所示的流程图 说明的处理中,通过根据主题“标题Tm或类型Gm=足球”设置用户模 型,由足球运动员主演的综艺节目或戏剧可被抽取为推荐信息,即使 该节目并不符合条件“标题Tm或类型Gm=足球”。这是因为作为构成 用户模型向量的项目的内容和表演者包括大量的足球运动员。
在上述处理中,得到用户模型向量和节目向量PP之间的余弦距 离作为相似度。但是,也可以关于大项计算的每个余弦距离的总和的 形式得到相似度。
要注意的是产生用户模型向量的处理也可在分发服务器5中进 行。这种情况下,通过使用一般由前面参考图2说明的节目向量产生 部分23产生的节目向量PP,进行图29中所示的流程图的步骤 S231-S234的处理。
另外,除了和用户的喜好相符的节目的推荐之外,通过选择具有 节目向量PP和正历史向量UP之间的低相似度,以及节目向量PP和 负历史向量MUP之间的低相似度的节目,用户既不喜欢也不讨厌的 节目被推荐的概率变大。即,具有用户以前未观看的特性的节目被推 荐的概率变大。换句话说,在甚至没有尝试节目的情况下被用户拒绝 的节目被推荐的概率变大。为了通过抽取用户的喜好推进学习过程, 重要的是评估具有用户以前未观看的特性的节目。
从而,向用户呈现的推荐结果被赋予不可预测性。于是,不仅可 能导致用户兴趣的丰富,而且还可能获得对推荐更好地匹配用户喜好 的节目来说非常重要的历史信息。
下面,参考图30中所示的流程图,说明所进行的识别异常 (exceptional)的推荐节目的异常推荐节目选择处理。
首先,在步骤S241,在匹配处理部分43中采用的向量运算部分 62使用节目向量抽取部分42提供的节目向量PP,保存在正历史存储 部分47中的正历史向量UP和保存在负历史存储部分48中的负历史 向量MUP来关于每个大项,计算节目向量PP和正历史向量UP之间 的余弦距离,以及节目向量PP和负历史向量MUP之间的余弦距离。
随后,在下一步骤S242,向量运算部分62得到在正历史方关于 每个项目计算的余弦距离的总和,和在负历史方关于每个项目计算的 余弦距离的总和。即,在步骤S241和S242进行的处理关于每个大项, 产生节目向量PP和正历史向量UP之间的相似度SimUP,以及节目 向量PP和负历史向量MUP之间的相似度SimMUP。
随后,在下一步骤S243,向量运算部分62计算代表节目向量PP 和正历史向量UP之间的相似度的低下,以及节目向量PP和负历史向 量MUP之间的相似度的低下的异常推荐值。
具体地说,异常推荐值可由表达式(1-SimUP)×(1-SimMUP)或 (1/SimUP)×(1/SimMUP)表述。
随后在下一步骤S244,向量运算部分62根据由在步骤S243进 行的处理产生的计算结果,抽取均具有大的异常推荐值的节目作为推 荐信息。最后,结束该流程图所代表的处理的执行。
通过进行上述处理,具有用户迄今未观看的特性的节目可被抽取 为推荐节目。从而,将向用户推荐的节目的选择被赋予不可预测性。 从而,不仅可能导致用户兴趣的丰富,而且还可能获得对推荐更好地 匹配用户喜好的节目来说非常重要的历史信息。
通过进行迄今参考图13-30说明的各项处理,节目推荐处理设备 10能够产生将被提供给电视显示设备11或记录/再现设备12的推荐信 息。
电视显示设备11或记录/再现设备12还接收作为卫星波或地波 被捕捉,并由电视接收设备4解码的广播信号。
根据用户进行的操作,电视显示设备11显示从电视接收设备4 接收的广播信号,或者从记录/再现设备12接收的再现数据。另外, 根据从节目推荐处理设备10接收的推荐信息,电视显示设备11显示 推荐节目的信息,并进行自动设置频道的处理。除此之外,电视显示 设备11把操作日志提供给节目推荐处理设备10。
另一方面,根据用户进行的操作,记录/再现设备12记录从电视 接收设备4接收的广播信号,或者进行记录预约,并且根据从节目推 荐处理设备10接收的推荐信息,记录/再现设备12自动记录推荐的节 目。另外,记录/再现设备12从安装的或嵌入的记录介质再现节目, 并在电视显示设备11上显示再现的节目。除此之外,记录/再现设备 12把操作日志提供给节目推荐处理设备10。
图31是表示电视接收设备4的结构的方框图。在下面的说明中, 电视接收设备4被解释成符合数字广播接收设备的标准规范的普通接 收设备。
卫星波检测部分91是根据从电视显示设备11或记录/再现设备 12接收的选择频道的信号,有选择地检测和接收广播电台通过卫星2 发射的并由天线3接收的卫星波的组件。卫星波检测部分91还把说明 发射模式的发射和多路复用控制信号提供给TMCC(发射和多路复用 配置控制)解码部分92,并把卫星波持有的广播信号提供给解调/解码 处理部分93。
TMCC解码部分92是接收包括在发射和多路复用控制信号中的 信息,并对所述信息解码的组件。该信息包括时隙和指示调制方法和 编码率的发射模式。TMCC解码部分92把解码后的信息提供给解调/ 解码处理部分93。
解调/解码处理部分93是通过采用从TMCC解码部分92接收的 关于发射模式的信息所建议的方法,对从卫星波检测部分91接收的广 播信号解调和解码的组件。解调/解码处理部分93把解调和解码结果 提供给解交错部分94。所述方法的例子是QPSK(四相相移键控)方法 和8相PSK(相移键控)方法。QPSK方法也被称为4相调制方法或4 相PSK方法。
解交错部分94是对输入信号解交错,并把解交错处理的结果提 供给纠错处理部分95的组件。另外,解交错部分94还对解交错结果 进行帧分离处理和解扰处理。
纠错处理部分95是对输入信号进行一般采用Reed-Solomon(里 德-索罗门)方法的纠错处理,并把纠错处理的结果提供给CA(条件访 问)解扰部分101的组件。
地波检测部分96是根据从电视显示设备11或记录/再现设备12 接收的选择频道的信号,有选择地检测和接收天线捕捉的地波的组件。 地波检测部分96还把说明发射模式的发射和多路复用控制信号提供 给TMCC(发射和多路复用配置控制)解码部分97,并把地波持有的广 播信号提供给解调/解码处理部分98。
TMCC解码部分97是接收包括在发射和多路复用控制信号中的 信息,并对所述信息解码的组件。该信息包括时间戳记TS,时隙和指 示调制方法和编码率的发射模式。TMCC解码部分97把解码后的信 息提供给解调/解码处理部分98。
解调/解码处理部分98是通过采用从TMCC解码部分97接收的 关于发射模式的信息所建议的方法,对从地波检测部分96接收的广播 信号解调和解码的组件。解调/解码处理部分98把解调和解码结果提 供给解交错部分99。所述方法的例子是QAM(正交调幅)方法。
解交错部分99是对输入信号解交错,并把解交错处理的结果提 供给TS(传送流)再现部分100的组件。另外,解交错部分99还对解 交错结果进行帧分离处理和解扰处理。
TS再现部分100是根据输入信号产生传送流,并把传送流提供 给CA解扰部分101的组件。
CA解扰部分101是对从纠错处理部分95或TS再现部分100接 收的条件访问信号解扰,并把解扰后的信号提供给多路分解部分102 的组件。
数据输入部分103是通过网络8接收来自EPG接收设备9的EPG 数据和分发服务器5传送的流式数据的组件。数据输入部分103把 EPG数据和流式数据传送给多路分解部分102。
多路分解部分102是对从CA解扰部分101或数据输入部分103 接收的信号进行多路分解,从而产生将被提供给音频信号解码部分 104的音频信号,将被提供给视频信号解码部分105的视频信号,和 将被提供给数据解码部分106的数据的组件。提供给数据解码部分106 的数据包括控制信号和EPG。
音频信号解码部分104是对输入的音频信号解码,并把解码的音 频信号提供给电视显示设备11或记录/再现设备12的组件。出于同样 原因,视频信号解码部分105是对输入的视频信号解码,并把解码的 视频信号提供给电视显示设备11或记录/再现设备12的组件。数据解 码部分106是对输入的数据,例如控制信号和EPG解码的组件。数据 解码部分106把解码后的数据提供给电视显示设备11或记录/再现设 备12。
在电视接收设备4进行的处理中,通过采用预定方法对接收的地 波或分发的流式数据解调和解码,解调和解码的结果被提供给电视显 示设备11或记录/再现设备12。
图32是表示电视显示设备11的结构的方框图。
操作输入部分121是接收来自用户的操作输入,并把代表从用户 接收的操作输入的信号提供给在电视显示设备11中采用的一些组件 的组件。另外,操作输入部分121把从用户接收的操作输入的内容提 供给用户保存所述内容的操作日志列表122。前面参考图13说明的节 目推荐处理设备10中采用的操作日志获取部分46读出保存在操作日 志列表122上的操作日志,作为用户进行的操作的日志。如果从用户 接收的操作输入是选择频道的操作,那么操作输入部分121把该操作 输入提供给频道设置部分123。
频道设置部分123是根据从操作输入部分121接收的代表用户输 入的操作输入的信号,产生指示所选频道的控制信号的组件。频道设 置部分123把该控制信号提供给电视接收设备4。另外,根据保存在 后面说明的推荐节目列表128上的推荐信息,频道设置部分123产生 指示所选频道的控制信号,并把该控制信号提供给电视接收设备4, 作为电视接收设备4用于自动设置频道的控制信号。电视接收设备4 接收由所述控制信号规定的频道的广播信号。
数据输入部分124是从电视接收设备4接收广播信号,并把该信 号传送给图像处理部分125的组件。图像处理部分125是根据输出部 分126采用的图像显示方法,对输入的广播信号进行图像处理的组件。 图像处理部分125把图像处理的结果提供给输出部分126。输出部分 126包括显示装置和诸如扬声器之类的音频输出装置。显示装置的例 子是CRT(阴极射线管)和LCD(液晶显示器)。输出部分126是显示完 成图像处理的输入广播信号的图像信号,并从音频输出装置输出音频 信号的组件。
推荐节目列表获取部件127是从节目推荐处理设备10获得推荐 信息,并把获得的信息传送给推荐节目列表128的组件。推荐节目列 表128对提供的推荐信息编目。频道设置部分123和推荐节目信息显 示控制部分129从推荐节目列表128读出推荐信息。
推荐节目信息显示控制部分129是把从推荐节目列表128读出的 推荐信息提供给图像处理部分125,以便被用于向用户显示推荐节目 的信息的组件。图像处理部分125把从推荐节目信息显示控制部分129 接收的推荐信息作为独立信息,或者作为叠加在由从数据输入部分 124接收的广播信号代表的图像上的信息,传送给输出部分126。输出 部分126在显示装置上显示推荐信息。
要注意的是可允许用户根据从节目推荐处理设备10接收的推荐 信息,确定推荐节目的信息是否要被显示在输出部分126上,或者频 道是否要被自动设置。
参考图33中所示的流程图,下面的说明解释所进行的根据从节 目推荐处理设备10接收的推荐信息,向用户显示推荐节目的信息的推 荐信息显示处理。
首先,在步骤S251,推荐节目列表获取部分127获得在节目推 荐处理设备10中采用的推荐信息输出部分49输出的推荐信息。
随后,在下一步骤S252,推荐节目列表获取部分127在推荐节 目列表128上对获得的推荐信息编目。
随后,在下一步骤S253,推荐节目信息显示控制部分129从推 荐节目列表128读出将在相对于当前时间的预定一段时间内广播的推 荐节目的信息,从而产生用于显示被推荐节目的信息的数据。所述一 段时间的长度一般为3小时或一天。被推荐节目的信息包括每个被推 荐节目的标题,内容,广播时间和广播频道。推荐节目信息显示控制 部分129随后把该数据提供给图像处理部分125。
随后,在下一步骤S254,图像处理部分125进行图像处理,以 便显示用于在输出部分126显示被推荐节目的信息的输入数据,并把 图像处理的结果输出给输出部分126。数据所代表的推荐信息可以独 立信息或者叠加在由从数据输入部分124接收的广播信号代表的图像 上的信息的形式经历图像处理。
随后,在下一步骤S255,输出部分126显示从图像处理部分125 接收的推荐信息。最后,结束该流程图代表的处理的执行。
通过进行上述处理,推荐信息被显示在输出部分126上。从而, 通过参考显示的推荐信息,用户能够选择他所想观看的节目。
参考图34中所示的流程图,下面的说明解释所进行的根据从节 目推荐处理设备10接收的推荐信息,自动设置广播和用户的喜好相符 的节目的频道的自动频道设置处理。
在步骤S271和S272进行的处理与分别在前面参考图33说明的 流程图的步骤S251和S252进行的处理相同。即,推荐节目列表获取 部分127获得由节目推荐处理设备10中采用的推荐信息输出部分49 输出的推荐信息。随后,推荐节目列表获取部分127在推荐节目列表 128对获得的推荐信息编目。
随后,在下一步骤S273,频道设置部分123从节目推荐列表128 获得当前时间的推荐节目的信息。随后,在下一步骤S274,根据被推 荐节目的诈,频道设置部分123产生频道设置信息,并把频道设置信 息作为控制信号输出给电视接收设备4。根据该控制信号,电视接收 设备4接收通过控制信号中规定的频道广播的广播信号。
随后,在下一步骤S275,数据输入部分124从电视接收设备4 获得指定频道的广播信号,并把该信号提供给图像处理部分125。
随后,在下一步骤S276,图像处理部分125对输入的广播信号 进行图像处理,以便显示图像,并把处理结果提供给输出部分126。
随后,在下一步骤S277,输出部分126以作为图像处理的结果 而获得的图像的形式,显示从图像处理部分125接收的推荐节目的信 息的图像,并输出声音。最后,结束该流程图代表的处理的执行。
通过进行上述处理,广播和用户的喜好相符的节目的频道被自动 设置。例如当用户发出关于该处理的命令时,可进行上面参考图34 中所示的流程图说明的自动频道设置处理。从而,当用户存在确定要 观看哪个节目的问题时,广播恰当节目的频道可被自动设置。
另外,当用户持续被认为是忽视的一段时间的每个预定一段时间 不进行输入操作时,或者当被认为是忽视的一段时间的预定一段时间 过去时,可进行上面参考图34中所示的流程图说明的自动频道设置处 理,所述预定一段时间一般为2小时。被认为是忽视的一段时间的预 定一段时间是其间用户清楚知道用户没有设置频道的事实的一段时 间。
要注意的是也可允许用户输入设置不能进行自动频道设置处理 的模式的命令。通过这样禁用自动频道设置处理,当用户有意观看通 过某一频道广播的节目时,该频道不能被自动改变成另一频道。
图35是表示记录/再现设备12的方框图。
操作输入部分141是接收来自用户的操作输入,并把代表从用户 接收的操作输入的控制信号提供给构成记录/再现设备12的其它组件 的组件。另外,操作输入部分141把从用户接收的操作输入的内容提 供给用于保存所述内容的操作日志列表142。前面参考图13说明的节 目推荐处理设备10中采用的操作日志获取部分46读出保存在操作日 志列表142上的操作日志,作为用户进行的操作的日志。
记录设置部分143是根据从操作输入部分141接收的,代表用户 输入的操作输入的信号,抽取进行记录处理所必需的信息,或者从保 存在后面说明的推荐节目列表149上的推荐信息抽取进行记录处理所 必需的信息的组件。进行记录处理所必需的信息包括要记录的节目的 广播开始时间以及广播结束时间,和广播节目的频道。如果从操作输 入部分141接收的控制信号指示从用户接收的操作输入是进行记录预 约的操作,那么记录设置部分143在记录预约列表144上对进行记录 处理所必需的信息编目。如果从操作输入部分141接收的控制信号指 示从用户接收的操作输入是记录当前广播的节目的请求,或者当将通 过利用保存在后面说明的推荐节目列表149上的推荐信息进行自动记 录时,记录设置部分143把进行记录处理所必需的信息提供给记录控 制部分145。
记录控制部分145是根据从记录设置部分143接收的对节目进行 记录处理所必需的信息,产生指示广播要记录的节目的广播频道的控 制信号,或者通过从在记录预约列表144上编目的记录预约信息抽取 当前时间的记录预约信息,产生控制信号的组件。记录控制部分145 把控制信号提供给电视接收设备4。记录控制部分145还是产生进行 记录的控制信号,并把该控制信号提供给记录/再现处理部分147的组 件。根据从记录控制部分14接收的控制信号,电视接收设备4接收通 过规定的频道广播的广播信号。
数据输入部分146是从电视接收设备4接收广播信号,并把该信 号传送给记录/再现处理部分147的组件。记录/再现处理部分147一 般具有允许可拆卸的记录介质被安装在记录/再现处理部分147上的结 构,或者包括内部嵌入的记录介质。可拆卸的记录介质的例子是磁带, 光盘,磁盘,磁光盘和半导体存储器,而内部嵌入的记录介质是硬盘 和半导体存储器。记录/再现处理部分147能够把信息记录到记录介质 上,并从可拆卸的或者嵌入的记录介质再现信息。更具体地说,假定 可按照在记录记录/再现处理部分147上的可拆卸记录介质是磁带。这 种情况下,记录/再现处理部分147配有在记录处理中,把从数据输入 部分146接收的广播信号记录到磁带上,和从磁带再现信息的磁头。 记录/再现处理部分147把再现的信息提供给诸如电视显示设备11之 类的设备,以便显示所述信息。
推荐节目列表获取部分148是从节目推荐处理设备10获得推荐 信息,并把该信息传给推荐节目列表149的组件。推荐节目列表149 是用于对提供的推荐信息编目的组件。记录设置部分143从推荐节目 列表149读出将用于自动记录的推荐信息。
下面参考图36中所示的流程图说明自动记录。
首先,在步骤S291,推荐节目列表获取部分148从在节目推荐 处理设备10中采用的推荐信息输出部分49获得推荐信息。
随后,在下一步骤S292,推荐节目列表获取部分148在推荐节 目列表149对获得的推荐信息编目。
随后,在下一步骤S293,记录设置部分143从推荐节目列表149 抽取当前时间的推荐节目的信息。记录设置部分143随后从抽取的信 息获得记录所需的信息,并把获得信息提供给记录控制部分145。获 得的记录所需信息包括要记录节目的广播开始时间以及广播结束时 间,和广播该频道的频道。
随后,在下一步骤S294,记录控制部分145产生用于接收要记 录的节目的广播信号的频道设置信息,并把频道设置信息作为控制信 号输出给电视接收设备4。根据该控制信号,电视接收设备4接收通 过规定的频道广播的节目的广播信号。
随后,在下一步骤S295,数据输入部分146从电视接收设备4 获得指定频道的广播信号,并把该信号传送给记录/再现处理部分147。
随后,在下一步骤296,记录/再现处理部分147把从电视接收设 备4接收的广播信号记录到安装的或者内部嵌入的记录介质上。最后, 结束该流程图代表的处理的执行。
通过进行上述处理,能够自动记录和用户的喜好相符的节目。在 正在进行用户请求的记录处理时,或者已经开始的记录处理,例如预 约的记录处理正在进行时,不执行上面参考图36中所示的流程图说明 的自动记录处理。
上面的说明解释了根据为当前时间推荐的节目进行的自动记录 处理。但是不必说,也可按照相同的方式根据为比当前时间落后预定 一段时间的某一时刻获得的推荐信息,进行自动记录处理。这样,能 够自动实现记录的预约。
在前面参考图1-36说明的各个处理中,节目向量PP在分发服务 器5中产生。但是,代替在分发服务器5中产生节目向量PP,分发服 务器5可通过网络8把EPG数据提供给节目推荐处理设备,以便在节 目推荐处理设备中用于产生节目向量PP。
图37是关于不是在分发服务器171中产生节目向量PP,而是根 据通过网络8,从分发服务器171提供给节目推荐处理设备191的EPG 数据,在节目推荐处理设备191中产生节目向量的情况,表示分发服 务器171的结构的方框图。这种情况下,还用于产生节目向量PP的 节目推荐处理设备191的结构示于图38中。
要注意的是,和在图2中所示的分发服务器5及图13中所示的 节目推荐处理设备10中采用的相应对应部分相同的部分用和它们的 相应对应物相同的附图标记表示,为了避免重复,不再重复它们的说 明。
即,分发服务器171包括如前参考图2所述那样,同样用在分发 服务器5中的数据获取部分21和数据传输部分25。分发服务器171 从流式数据数据库6读出流式数据,或者从元数据数据库7或包括元 数据的EPG数据读出元数据,并通过网络8把流式数据或元数据传送 给EPG接收设备9或电视接收设备4。
节目推荐处理设备191具有与前面参考图13的节目推荐处理设 备10相同的结构,除了节目推荐处理设备191还包括在图2中所示的 分发服务器5中采用的元数据抽取部分22和节目向量产生部分23之 外。除了节目推荐处理设备10执行的处理之外,节目推荐处理设备 191还进行前面参考图3中所示的流程图说明的节目向量产生处理1, 前面参考图6中所示的流程图说明的节目向量产生处理2,前面参考 图7中所示的流程图说明的分组处理1,和前面参考图8中所示的流 程图说明的分组处理2。
代替产生节目向量PP,分发服务器171可通过网络8把EPG数 据提供给节目推荐处理设备191,以便用于产生节目向量PP。尽管存 在该差异,仍然能够获得和前面参考图1-36说明的相同结果。
另外,还可实现这样一种系统结构,其中EPG接收设备9从电 视显示设备11和记录/再现设备12收集用户进行的操作的信息和设置 信息,并把收集的信息提供给分发服务器201,而分发服务器201不 仅产生节目向量PP,而且进行匹配处理,通过网络8把匹配处理的结 果提供给EPG接收设备9。就这种系统结构来说,网络具有图39中 所示的结构,分发服务器201具有图40中所示的方框图。
要注意的是与图1、37和38中所示的它们的相应对应物等同的 系统结构组件由和它们的相应对应物相同的附图标记表示,并且为了 避免重复,省略了对它们的说明。
即,除了前面参考图37说明的分发服务器171的功能之外,分 发服务器201还具有前面参考图38说明的节目推荐处理设备191的功 能。从而,用户不需要拥有节目推荐处理设备
在图39和40中所示的结构中,分发服务器201进行前面参考图 3-12和图14-30说明的所有各项处理。这些处理包括产生向量,例如 节目向量PP,节目方效应向量EfUP,正历史向量UP,负历史向量 MUP和标准喜好向量APP的处理,对节目向量PP分组的处理,匹 配处理,和选择异常的推荐节目的处理。
要注意的是,此时,用户进行的操作的历史和设置信息一般具有 附着于其上的,用于识别因用户而异的历史和设置信息的用户ID。 EPG接收设备9从电视显示设备11和记录/再现设备12收集操作历 史和设置信息,通过网络8把所述历史和信息传送给分发服务器201。 在分发服务器201中采用的节目推荐处理设备191通过根据附着于所 述操作历史和设置信息上的用户ID,对所述操作历史和设置信息分 类,把从EPG接收设备9接收的操作历史和设置信息保存在诸如初始 目录存储部分45,正历史存储部分47和负历史存储部分48之类的部 分中。
上述说明解释了其中通过使用电视广播信号的EPG数据,推荐 和用户的喜好相符的节目的情况。但是,本发明也可应用于其中通过 把属性信息加入无线电广播和诸如流式数据之类的各种数字内容中, 推荐和用户的喜好相符的节目的情况。
前面说明的每一系列的处理也可通过软件的执行来实现。如果通 过软件的执行来实现上面说明的每一系列的处理,那么构成所述软件 的程序可以一般从网络或者程序记录介质被安装到嵌入专用硬件中的 计算机,通用个人计算机等中。通过把各种程序安装到通用个人计算 机中,个人计算机能够实现各种功能。
上面提及的把要安装到到计算机或通用个人计算机中的程序分 别记录为将由所述计算机或通用个人计算机执行的程序的程序记录介 质是独立于计算机或通用个人计算机分发和提供给用户的包介质。如 前参考图2、13或38所述,包介质的例子包括诸如软盘之类的磁盘 31或71,诸如CD-ROM(光盘-只读存储器)或DVD(数字通用盘)之类 的光盘32或72,诸如MD(MiniDisc)(商标)之类的磁光盘33或73, 以及半导体存储器34或74。
另外,在本说明书中,按照沿着时间轴的预定顺序进行保存在记 录介质中的每个程序的步骤。但是,不必按照沿着时间轴的预定顺序 进行所述步骤。例如,也可同时或者单独地进行保存在记录介质中的 每个程序的步骤。
要注意的是,本说明书中使用的技术术语“系统”意味着包括多个 设备的融合结构。
工业可应用性
如上所述,根据本发明,能够产生内容的属性信息。特别地,可 使内容的属性信息与加权值相关联,每个加权值规定多个项目中的每 一个对属性信息和预定用户的喜好信息之间的相似度的计算的贡献程 度。
另外,根据另一发明,不仅能够选择与用户的喜好相符的内容, 而且还能够通过使用规定多个项目中的每一个对属性信息和预定用户 的喜好信息之间的相似度的计算的贡献程度的加权值信息,来选择内 容。从而,能够选择正确地与用户的喜好相符的内容。
另外,根据另一发明,能够找出用户的喜好。特别地,通过比较 用户的喜好与一般公众的喜好,能够识别用户的喜好的偏差(bias), 从而能够确定用户独有的喜好。
本申请是申请号为200380108320.9、申请日为2003年12月12 日、发明名称为“信息处理设备,信息处理方法,信息处理系统,记录 介质和计算机程序”的发明的分案申请。
高效检索全球专利

IPRDB是专利检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,专利查询、专利分析

电话:13651749426

侵权分析

IPRDB的侵权分析产品是IPRDB结合多位一线专利维权律师和专利侵权分析师的智慧,开发出来的一款特色产品,也是市面上唯一一款帮助企业研发人员、科研工作者、专利律师、专利分析师快速定位侵权分析的产品,极大的减少了用户重复工作量,提升工作效率,降低无效或侵权分析的准入门槛。

立即试用