用于处理信息的装置和方法、以及程序转让专利

申请号 : CN200710154681.7

文献号 : CN101149747B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 角川元辉小林贤一郎

申请人 : 索尼株式会社

摘要 :

本发明提供了一种用于处理信息的装置和方法。信息处理装置包括:从描述了内容的内容信息中提取多个作为所述内容的关键字的字词的提取单元;用于存储包含所述字词的属性的属性字典的属性字典存储单元;用于搜索属性字典、以得到所述多个充当关键字的字词的属性的属性搜索单元;用于判断从所述充当关键字的字词中选择出来并且将被处理的目标字词的各个属性与在所述充当关键字的字词中不同于目标字词的任意其它字词是否匹配,或者判断目标字词的各个属性与其它字词的任意属性是否匹配的属性判断单元;以及用于基于由属性判断单元判断得到的匹配数目来确定所述内容的目标字词的代表属性的确定单元。

权利要求 :

1.一种信息处理装置,包括:

提取装置,用于通过词素分析从描述内容的内容信息中提取多个充当所述内容的关键字的字词;

属性字典存储装置,用于存储包含所述字词的属性的属性字典;

属性搜索装置,用于搜索所述属性字典,以得到所述多个充当关键字的字词的属性;

属性判断装置,用于判断从所述充当关键字的字词中选择出来并且将被处理的目标字词的各个属性,与在所述充当关键字的字词中不同于所述目标字词的任意其它字词是否匹配,或者判断所述目标字词的各个属性与所述其它字词的任意属性是否匹配;

计算装置,基于由所述属性判断装置判断得到的、所述目标字词的属性与所述其它字词或所述其它字词的属性之间的匹配数目和预定权重系数,来计算所述目标字词的属性的分值;以及确定装置,基于所述分值来确定所述内容的目标字词的代表属性。

2.如权利要求1所述的信息处理装置,还包括:

辞典存储装置,用于存储包含所述多个字词的相关字词的辞典;以及相关字词搜索装置,用于将所述目标字词的属性视为所述多个字词中的一个字词,并搜索所述辞典,以得到所述多个字词中的一个字词的相关字词;

其中,所述属性判断装置还判断所述目标字词的属性的相关字词是否与任意所述其它字词或所述其它字词的任意属性相匹配。

3.如权利要求1所述的信息处理装置,还包括:

辞典存储装置,用于存储包含所述多个字词的相关字词的辞典;以及相关字词搜索装置,用于将所述目标字词的属性视为所述多个字词中的一个字词,并搜索所述辞典,以得到所述多个字词中的一个字词的相关字词;

其中,所述属性搜索装置还搜索所述属性字典,以得到所述目标字词的属性的相关字词的属性,并且,其中,所述属性判断装置还判断所述目标字词的属性的相关字词的属性是否与任意所述其它字词或所述其它字词的任意属性相匹配。

4.如权利要求1所述的信息处理装置,还包括:

辞典存储装置,用于存储包含所述多个字词的相关字词的辞典;以及相关字词搜索装置,用于将所述目标字词的属性看作所述多个字词中的一个字词,并搜索所述辞典,以得到所述多个字词中的一个字词的相关字词;

其中,所述属性搜索装置还搜索所述属性字典,以得到由所述相关字词搜索装置找到的所述相关字词的属性,并且,其中,所述相关字词搜索装置还将由所述属性搜索装置找到的所述相关字词的属性视为所述多个字词中的一个字词,并搜索所述辞典,以得到所述多个字词中的一个字词的相关字词,作为所找到的属性的相关字词,并且,其中,由所述属性搜索装置执行的搜索操作和由所述相关字词搜索装置执行的搜索操作被交替反复地执行,并且,其中,所述属性判断装置还判断通过所述交替反复的搜索操作而获得的所述相关字词或所述属性与任意所述其它字词或所述其它字词的任意属性是否相匹配。

5.如权利要求1所述的信息处理装置,还包括:

辞典存储装置,用于存储包含与所述多个字词相关的相关字词的辞典;

相关字词搜索装置,用于将所述目标字词的相关字词视为目标字词相关字词,并搜索所述辞典,以得到所述目标字词相关字词,所述相关字词搜索装置还将所述其它字词的相关字词视为其它字词相关字词,并搜索所述辞典,以得到所述其它字词相关字词;以及相关字词判断装置,用于判断所述目标字词相关字词与所述其它字词相关字词是否相匹配;

其中,所述属性搜索装置还搜索所述属性字典,以得到被确定为与所述其它字词相关字词相匹配的所述目标字词相关字词的属性,并且,其中,所述属性判断装置还判断所述目标字词的属性与所述目标字词相关字词的属性是否相匹配。

6.如权利要求1所述的信息处理装置,其中,所述属性搜索装置还搜索所述属性字典,以得到所述内容的类型的属性,并且,其中,所述属性判断装置还判断所述目标字词的属性与所述类型或所述类型的属性是否相匹配。

7.一种处理信息的方法,包括以下步骤:

通过词素分析从描述内容的内容信息中提取充当所述内容的关键字的多个字词;

搜索包含所述多个字词的属性的属性字典,以得到所述多个字词的属性;

判断从所述充当关键字的字词中选择出来并且将被处理的目标字词的各个属性与所述充当关键字的字词中不同于所述目标字词的任意其它字词是否相匹配,或者,判断所述目标字词的各个属性与所述其它字词的任意属性是否相匹配;

基于由所述属性判断步骤判断得到的、所述目标字词的属性与所述其它字词或所述其它字词的属性之间的匹配数目和预定权重系数,来计算所述目标字词的属性的分值;以及基于所述分值来确定所述内容的目标字词的代表属性。

说明书 :

技术领域

本发明涉及用于处理信息的装置和方法以及程序,特别地,涉及能够选择与内容相关联的关键字的属性中的一个属性、以使得所选择的属性对于该内容为最优的处理信息的装置、处理信息的方法以及程序。

背景技术

近年来,已经开发出基于关键字来搜索内容并显示所找到的内容的电视接收机(例如参考日本未审查专利申请公布No.2005-115790)。
为了检索出与内容相关联的关键字,例如,检索出在内容注释中的字词(word)。
在这种关键字检索(retrieval)方法中,例如,对内容注释执行语素分析(morphological analysis)。其结果是,注释中的字词被分离开来,并且各个分离字词的词性(word type)被识别。其后,例如,检索出被确定为名词的字词来充当关键字。例如,当对“昨天我吃鲑鱼了”这个句子进行语素分析时,检索出被加上“名词”词性标签的字词“鲑鱼”和“昨天”来充当关键字。
在这种情况下,使用所检索出的关键字“鲑鱼”和“昨天”,来搜索具有包含这些关键字的注释的内容。
另外,通过使用限定了字词属性(例如,“街道名称”、“人名”、“食材”、“组织”或“动物”)的属性字典,还可以将词性之外的这些属性赋给分离字词。

发明内容

但是,所述字词可以具有多个属性。例如,字词“鲑鱼”可以具有两个属性“食材”和“鱼类”。在这种情况下,取决于采用所述多个属性中的哪种属性作为充当关键字的字词的属性,可能搜索的内容在语义上不同于与所述关键字相关联的内容。
例如,当显示的是与足球世界杯相关联的内容,并且该内容的注释是这样的句子:“本节目收集了世界杯的著名场景”时,具有两个属性“足球”和“排球”的字词(词组)“世界杯”被检索出充当关键字。在这种情况下,如果采用属性“排球”充当关键字“世界杯”的属性,则搜索其注释包含具有属性“排球”的字词“世界杯”的内容。
因此,本发明提供了能够选择与内容相关联的关键字的多个属性中的一个属性、以使得所选择的属性对于所述内容为最优的一种处理信息的装置、处理信息的方法以及程序。
根据本发明的一个实施例,一种信息处理装置包括:用于通过词素分析从描述了内容的内容信息中提取多个充当所述内容的关键字的字词的提取装置;用于存储包含所述字词的属性的属性字典的属性字典存储装置;用于搜索所述属性字典,以得到所述多个充当关键字的字词的属性的属性搜索装置;用于判断从所述充当关键字的字词中选择出来并且将被处理的目标字词的各个属性与在所述充当关键字的字词中不同于目标字词的任意其它字词是否匹配,或者判断所述目标字词的各个属性与所述其它字词的任意属性是否匹配的属性判断装置;基于由所述属性判断装置判断得到的、所述目标字词的属性与所述其它字词或所述其它字词的属性之间的匹配数目和预定权重系数,来计算所述目标字词的属性的分值的计算装置;以及用于基于所述分值来确定所述内容的目标字词的代表属性的确定装置。
所述的信息处理装置还包括:用于存储包含所述多个字词的相关字词的辞典的辞典存储装置;以及,用于将所述目标字词的属性视为所述多个字词中的一个字词,并搜索所述辞典、以得到所述多个字词中的一个字词的相关字词的相关字词搜索装置。所述属性判断装置还判断目标字词的属性的相关字词是否与任意其它字词或其它字词的任意属性相匹配。
所述的信息处理装置,还包括:辞典存储装置,用于存储包含所述多个字词的相关字词的辞典;以及相关字词搜索装置,用于将目标字词的属性视为所述多个字词中的一个字词,并搜索所述辞典,以得到所述多个字词中的一个字词的相关字词。所述属性搜索装置还搜索属性字典,以得到目标字词的属性的相关字词的属性,并且,其中所述属性判断装置还判断目标字词的属性的相关字词的属性是否与任意一个其它字词或其它字词的任意一个属性相匹配。
所述的信息处理装置,还包括:辞典存储装置,用于存储包含所述多个字词的相关字词的辞典;以及相关字词搜索装置,用于将目标字词的属性视为所述多个字词中的一个字词,并搜索所述辞典,以得到所述多个字词中的一个字词的相关字词。所述属性搜索装置还搜索属性字典,以得到由相关字词搜索装置找到的相关字词的属性。所述相关字词搜索装置还将由所述属性搜索装置找到的相关字词的属性视为所述多个字词中的一个字词,并搜索所述辞典,以得到所述多个字词中的一个字词的相关字词作为所找到的属性的相关字词。可以交替反复地执行由所述属性搜索装置执行的搜索操作和由所述相关字词搜索装置执行的搜索操作。所述属性判断装置还判断通过该交替反复的搜索操作而获得的所述相关字词或所述属性与任意一个所述其它字词或所述其它字词的任意一个属性是否相匹配。
所述的信息处理装置,还包括:辞典存储装置,用于存储包含与所述多个字词相关的相关字词的辞典;相关字词搜索装置,用于将所述目标字词的相关字词视为目标字词相关字词,并搜索所述辞典,以得到所述目标字词相关字词,其中,所述相关字词搜索装置还将所述其它字词的相关字词视为其它字词相关字词,并搜索所述辞典,以得到所述其它字词相关字词;以及相关字词判断装置,用于判断所述目标字词相关字词与所述其它字词相关字词是否相匹配。所述属性搜索装置还搜索所述属性字典,以得到被确定为与所述其它字词相关字词相匹配的所述目标字词相关字词的属性,并且,所述属性判断装置还判断所述目标字词的属性与所述目标字词相关字词的属性是否相匹配。
所述属性搜索装置还搜索所述属性字典,以得到所述内容的类型的属性,并且,所述属性判断装置还判断所述目标字词的属性与所述类型或所述类型的属性是否相匹配。
根据本发明的另一个实施例,一种处理信息的方法包括以下步骤:通过词素分析从描述内容的内容信息中提取充当所述内容的关键字的多个字词;搜索包含所述多个字词的属性的属性字典,以得到所述多个字词的属性;判断从所述充当关键字的字词中选择出来并且将被处理的目标字词的各个属性与所述充当关键字的字词中不同于所述目标字词的任意其它字词是否相匹配,或者判断所述目标字词的各个属性与所述其它字词的任意属性是否相匹配;基于由所述属性判断步骤判断得到的、所述目标字词的属性与所述其它字词或所述其它字词的属性之间的匹配数目和预定权重系数,来计算所述目标字词的属性的分值;以及,基于所述分值来确定所述内容的目标字词的代表属性。
根据本发明的实施例,从描述了内容的内容信息中提取得到多个充当所述内容的关键字的字词。在包含所述字词的属性的属性字典中搜索所述多个充当关键字的字词的属性。随后,判断从所述充当关键字的字词中选择出来并且即将被处理的目标字词的各个属性与所述充当关键字的字词中不同于所述目标字词的任意一个其它字词是否相匹配,或者判断所述目标字词的各个属性与所述其它字词的任意一个属性是否相匹配。基于判断得到的、在所述目标字词的属性与所述其它字词或所述其它字词的属性之间的匹配数目来确定所述内容的目标字词的代表属性。
如上所述,根据本发明的实施例,能够选择与内容相关联的关键字的多个属性中的一个属性,以使得所选择的属性对于所述内容为最优。

附图说明

图1是根据本发明的一个实施例的电视接收机的框图;
图2是示出了节目搜索单元的示例性配置的框图;
图3是详细示出属性确定单元的示例性配置的框图;
图4示出了属性字典的一个示例;
图5是示出列表生成处理的流程图;
图6是示出属性确定处理的流程图;
图7是示出节目搜索处理的流程图;
图8是详细示出所述属性确定单元的配置的另一个示例的框图;
图9示出了辞典的一个示例;
图10是示出所述属性确定处理的另一个示例的流程图;
图11是详细示出所述属性确定单元的配置的又一个示例的框图;
图12是示出又一个属性确定处理的流程图;
图13是详细示出所述属性确定单元的配置的另一个示例的框图;
图14是示出另一个属性确定处理的流程图;
图15是示出另一个属性确定处理的流程图;以及
图16是在所述属性确定处理中的搜索操作和匹配操作的示意性图示。

具体实施方式

在描述本发明的实施例之前,以下将讨论权利要求的特征与本发明的实施例所公开的具体组成要素之间的对应关系。这种描述旨在确保:支持要求了权利的本发明的实施例在本说明书中得到描述。因此,即使在以下实施例中的组成要素并没有被描述为涉及本发明的特定特征,那也并不一定意味着该组成要素没有涉及权利要求的特征。相反,即使在这里将组成要素描述为涉及权利要求的特定特征,那也并不一定意味着该组成要素没有涉及权利要求的其它特征。
此外,这种描述不应当被解释为在实施例中公开的本发明的所有方面都必须在权利要求中有所描述。即,该描述允许存在在实施例中有描述而在本申请的发明中没有要求权利的本发明的各个方面,即,实质上可以通过分案申请来要求权利,或者通过修改来另外要求权利的本发明的各个方面。
根据本发明的一个实施例,信息处理装置包括提取装置(例如,在图3中示出的语素分析单元71)、属性字典存储装置(例如,在图3中示出的属性字典存储单元75)、属性搜索装置(例如,在图3中示出的目标字词属性搜索单元73和其它字词属性搜索单元74)、属性判断装置(例如,在图3中的匹配单元76)和确定装置(例如,在图3中示出的确定单元78)。其中,提取装置用于从描述了内容的内容信息中提取多个充当所述内容的关键字的字词;属性字典存储装置用于存储包含字词属性的属性字典;属性搜索装置用于搜索所述充当关键字的多个字词的属性的属性字典;属性判断装置用于判断从充当关键字的字词中选择出来、将被处理的目标字词的各个属性与在充当关键字的字词中不同于目标字词的任意其它字词是否相匹配,或者判断目标字词的各个属性与其它字词的任意属性是否相匹配;而确定装置用于基于由属性判断装置确定的目标字词的属性与其它字词或其它字词的属性之间的匹配数目,来确定所述内容的目标字词的代表属性。
所述信息处理装置还可以包括辞典存储装置(例如,在图11中示出的辞典存储单元93)和相关字词搜索装置(例如,在图11中示出的属性辞典搜索单元112)。其中,辞典存储装置用于存储包含所述多个字词的相关字词的辞典,而相关字词搜索装置用于将所述目标字词的属性视为所述多个字词中的一个字词,并搜索所述辞典以得到所述多个字词中的一个字词的相关字词。属性判断装置还可以判断所述目标字词的属性的相关字词是否与其它字词中的任意字词或其它字词的属性中的任意属性相匹配。
所述信息处理装置还可以包括辞典存储装置(例如,在图13中示出的辞典存储装置93)和相关字词搜索装置(例如,在图13中示出的属性辞典搜索单元112)。辞典存储装置用于存储包含所述多个字词的相关字词的辞典;而相关字词搜索装置用于将所述目标字词的属性视为所述多个字词中的一个字词,并搜索所述辞典以得到所述多个字词中的一个字词的相关字词。属性搜索装置还可以搜索所述属性字典以得到目标字词属性的相关字词的属性。属性判断装置还可以判断所述目标字词属性的相关字词的属性是否与其它字词中的任意字词或其它字词的属性中的任意属性相匹配。
所述信息处理装置还可以包括辞典存储装置(例如,在图13中示出的辞典存储装置93)和相关字词搜索装置(例如,在图13中示出的属性辞典搜索单元112)。辞典存储装置用于存储包含所述多个字词的相关字词的辞典;而相关字词搜索装置用于将所述目标字词的属性视为所述多个字词中的一个字词,并搜索所述辞典以得到所述多个字词中的一个字词的相关字词。属性搜索装置还可以搜索所述属性字典以得到由所述相关字词搜索装置找到的相关字词的属性。相关字词搜索装置还可以将由属性搜索装置找到的相关字词的属性视为所述多个字词中的一个字词,并搜索所述辞典以得到所述多个字词中的一个字词的相关字词,作为所找到的属性的相关字词。可以交替反复地执行由属性搜索装置进行的搜索操作和由相关字词搜索装置进行的搜索操作。属性判断装置还可以判断通过交替反复的搜索操作而获得的相关字词或属性是否与其它字词中的任意字词或其它字词的属性中的任意属性相匹配。
所述信息处理装置还可以包括辞典存储装置(例如,在图8中示出的辞典存储单元93)、相关字词搜索装置(例如,在图8中示出的目标字词辞典搜索单元91和其它字词辞典搜索单元92)和相关字词判断装置(例如,在图8中示出的匹配单元76)。辞典存储装置用于存储包含与所述多个字词相关的相关字词的辞典;相关字词搜索装置用于将所述目标字词的相关字词视为目标字词相关字词,并搜索所述辞典以得到所述目标字词相关字词,其中,所述相关字词搜索装置还将其它字词的相关字词视为其它字词相关字词,并搜索所述辞典以得到所述其它字词相关字词;而相关字词判断装置用于判断所述目标字词相关字词是否与所述其它字词相关字词相匹配。属性搜索装置还可以搜索所述属性字典以得到经判断与所述其它字词相关字词相匹配的目标字词相关字词的属性,并且属性判断装置还可以判断所述目标字词的属性是否与所述目标字词相关字词的属性相匹配。
所述信息处理装置还可以包括计算装置(例如,在图3中示出的分值计算单元77),该计算装置用于基于由所述属性判断装置确定的、目标字词的属性与其它字词或其它字词的属性之间的匹配数目来计算所述目标字词的属性的分值。确定装置可以基于该分值来确定所述内容的目标字词的代表属性。
根据本发明的另一个实施例,用于处理信息的方法或计算机可读程序包括以下步骤:从描述了内容的内容信息中提取多个充当所述内容的关键字的字词(例如,在图6中示出的步骤S21);搜索包含所述多个字词的属性的属性字典、以得到所述多个字词的属性(例如,在图6中示出的步骤S27和S28);判断从充当关键字的字词中选择出来、将被处理的目标字词的各个属性与在充当关键字的字词中不同于目标字词的任意其它字词是否相匹配,或者判断目标字词的各个属性与其它字词的任意属性是否相匹配(例如,在图6中示出的步骤S29);以及基于由属性判断装置确定的目标字词的属性与其它字词或其它字词的属性之间的匹配数目,来确定所述内容的目标字词的代表属性(例如,在图6中示出的步骤S31)。
将参考附图来详细描述本发明的示例性实施例。
图1是根据本发明的一个示例性实施例的电视接收机11的框图。
如图1所示,电视接收机11包括调谐器31、编码/解码器(CODEC)32、信号处理单元33、显示器34、扬声器35、控制单元37、操作输入单元38、通信单元39、记录单元40和驱动器41,以上所有装置都经由总线36而彼此相连接。电视接收机11接收包含节目的数字信号(图像和声音)的无线电波并输出该节目的图像和声音。
调谐器31接收从广播台(未示出)发送的无线电波形式的数字广播信号。该数字广播信号包含节目的数字信号和节目相关信息的数字信号。节目相关信息包括节目列表、包含其标题的节目注释内容(下文中称作“内容信息”)和节目类型。节目相关信息的一个示例是电子节目指南(EPG)。随后,调谐器31对所接收的数字广播信号进行解调。
在控制单元37的控制之下,调谐器31经由总线36来将经解调的节目的图像数据和音频数据(下文中共同称作“节目数据”)提供给CODEC32或记录单元40。另外,调谐器31经由总线36来将经解调的节目相关信息提供给控制单元37。
CODEC 32使用诸如MPEG-2(运动图像专家组-2)之类的预定方法,来对从记录单元40经由总线36提供的节目数据(经编码的节目数据)进行解码。随后,CODEC 32将经解码的节目数据提供给信号处理单元33。
信号处理单元33对从CODEC 32提供的节目数据执行预定处理。所述预定处理的示例包括将节目数据转换为复合信号(composite signal)的数据转换处理和数模(D/A)转换处理。随后,信号处理单元33将节目数据的图像数据提供给显示器34,并将节目数据的音频数据提供给扬声器35。
另外,信号处理单元33对从控制单元37提供的图像数据,执行例如数据转换处理和D/A转换处理,以显示各种屏幕图像(screen)。信号处理单元33随后将经处理的图像数据提供给显示器34。
显示器34显示与从信号处理单元33提供的图像数据相对应的图像。扬声器35输出与从信号处理单元33提供的音频数据相对应的声音。
控制单元37例如由包括中央处理单元(CPU)、只读存储器(ROM)和随机存取存储器(RAM)的嵌入式微计算机组成。控制单元37根据与从操作输入单元38输入的用户操作相对应的操作信号,来执行各种处理。
例如,控制单元37从提供自调谐器31或通信单元39的节目相关信息中提取每个节目的关键字。其后,控制单元37存储节目的关键字以及关键字的属性。另外,控制单元37还搜索与所显示的节目(当前正显示在显示器34上)相关联的节目。
另外,控制单元37对调谐器31进行控制,从而经由总线36来将通过解调而获得的节目数据提供给记录单元40。因此,节目数据被记录。此外,控制单元37从记录单元40读出节目数据,并经由总线36来将该节目数据提供给CODEC 32。此外,控制单元37生成用于显示各种屏幕图像的图像数据,并经由总线36来将所生成的图像数据提供给信号处理单元33。
控制单元37通过运行例如安装在记录单元40中的计算机程序来执行各种处理。另外,控制单元37按照需要,将由通信单元39下载的计算机程序或记录于加载在驱动器41上的可移动介质42上的计算机程序安装在记录单元40中。可移动介质42的示例包括磁盘、光盘、磁性光盘和半导体存储器。
操作输入单元38例如包括,但并不限于,用于接收从遥控器(未示出)、按钮、键盘、鼠标和开关发送的指令的接收部分。操作输入单元38经由总线36,来将表示用户操作的操作信号提供给控制单元37。
通信单元39经由诸如因特网(未示出)之类的网络来发送和接收各种数据。例如,通信单元39经由网络而从服务器(未示出)接收节目相关信息,并经由总线36来将该信息提供给控制单元37。另外,通信单元39经由网络来例如从服务器(未示出)下载预定节目。
记录单元40经由总线36来存储从控制单元37提供的节目数据。另外,记录单元40还按需存储由控制单元37的CPU运行的计算机程序和各种数据。此外,在控制单元37的控制之下,记录单元40读出所存储的节目数据,并将所读出的节目数据提供给CODEC 32。
可移动介质42按需而被安装在驱动器41上。驱动器41驱动可移动介质42,从而读出存储在可移动介质42上的程序和数据。随后,驱动器41经由总线36而将所读出的程序和数据提供给记录单元40。
随后,通过运行预定的计算机程序,控制单元37起到用于搜索与当前显示的节目相关的节目的节目搜索单元的作用。
图2示出了那样的节目搜索单元的示例性配置。
如图2所示,节目搜索单元50包括提取单元51、属性确定单元52、生成单元53、列表存储单元54、接收单元55、识别单元56、搜索单元57和显示控制单元58。
提取单元51从提供自调谐器31的节目相关信息中提取内容信息。其后,提取单元51将该内容信息提供给属性确定单元52,并将包含在所述内容信息中的标题提供给生成单元53。提取单元51按需而从节目相关信息中提取节目类型(类别)。提取单元51将该类型提供给属性确定单元52。
属性确定单元52从提供自提取单元51的内容信息中提取关键字。属性确定单元52随后使用所述内容信息来执行属性确定处理,用以确定关键字的属性。当所述类型被从提取单元51提供时,属性确定单元52从该类型中提取例如具有名词词性的类型字词。随后,属性确定单元52除了内容信息之外还使用类型字词来执行属性确定处理。这里所使用的术语“字词”并不必然指一个字,而还可以指一个词。
属性确定单元52将通过属性确定处理而确定的属性与相应关键字关联起来。属性确定单元52随后将该属性和该关键字提供给生成单元53。以下将参考图3和随后的附图来详细描述属性确定单元52。
生成单元53为从提取单元51提供的各个标题,生成包含从属性确定单元52提供的属性和相应关键字的列表。其后,生成单元53将所生成的列表提供给列表存储单元54。另外,基于从识别单元56(以下有描述)提供的当前显示的节目的标题,生成单元53从列表存储单元54读出与该标题相对应的列表。随后,生成单元53将登记在该列表中的关键字提供给显示控制单元58。列表存储单元54存储从生成单元53提供的列表。
接收单元55接收从操作输入单元38提供的操作信号中的、与节目搜索操作相关的操作信号。接收单元55随后将该操作信号提供给识别单元56或搜索单元57。例如,接收单元55接收用于显示被显示节目的关键字的操作的操作信号,并将该操作信号提供给识别单元56。另外,接收单元55接收用于从被显示节目的关键字中选择希望的关键字的操作的操作信号,并将该操作信号提供给搜索单元57。
响应于从接收单元55提供的操作信号,识别单元56识别出被显示节目的标题。例如,识别单元56基于被指示最近将显示的节目的频道、当前日期和时间、以及包括在节目相关信息中的节目列表,来识别当前显示的节目的标题。识别单元56将识别得到的标题提供给生成单元53和搜索单元57。
响应于从接收单元55提供的操作信号,搜索单元57从列表存储单元54读出与由用户选择的并且被登记在与从识别单元56提供的被显示节目的标题相对应的列表中的关键字相对应的属性。其后,搜索单元57搜索列表存储单元54,以得到所述属性以及与用户所选择的关键字相关联而登记的列表所对应的标题,作为相关节目的标题。搜索单元57随后将该标题提供给显示控制单元58。
这样,搜索单元57不仅基于当前显示的节目的关键字、还基于该关键字的属性来搜索相关节目的标题。因此,搜索单元57能够更可靠地搜索相关节目的标题。
显示控制单元58生成用于显示一种屏幕图像的图像数据,在所述屏幕图像中列有从生成单元53提供的关键字。显示控制单元58随后将所生成的图像数据提供给信号处理单元33。结果,在显示器34上显示了列有当前显示的节目的关键字的屏幕图像。用户观看该屏幕图像并对操作输入单元38进行操作,从而从列在所述屏幕图像中的关键字中选择希望的关键字。
另外,显示控制单元58生成一种屏幕图像的图像数据,以便显示从搜索单元57提供的标题的列表。其后,显示控制单元58将所生成的图像数据提供给信号处理单元33。结果,示出了相关节目标题的列表的屏幕图像被显示在显示器34上。
用户观看所述屏幕图像并对操作输入单元38进行操作,从而选择希望节目的标题。随后,用户执行用于指示在预定时间处显示、在预定时间处记录、或者立即显示具有所选择的标题的节目的操作。这样,用户能够实现在预定时间处显示、在预定时间处记录、或者立即显示相关节目。
图3是详细示出如图2所示的属性确定单元52的示例性配置的框图。
如图3所示,属性确定单元52包括语素分析单元71、目标字词选择单元72、目标字词属性搜索单元73、其它字词属性搜索单元74、属性字典存储单元75、匹配单元76、分值计算单元77和确定单元78。属性确定单元52基于包含在内容信息中的、不同于给定关键字的关键字的属性来确定该给定关键字的属性。
语素分析单元71对从提取单元51提供的内容信息执行语素分析。因此,该内容信息被分离为多个字词。每一个所述字词的词性被识别出来。语素分析单元71提取被标上“名词”词性的标签的字词充当关键字,并将所提取的关键字提供给目标字词选择单元72。
目标字词选择单元72基于存储在属性字典存储单元75(随后将描述)中的属性字典,来识别从语素分析单元71提供的关键字的属性。目标字词选择单元72从提供自语素分析单元71的关键字中顺序地选择具有多个属性的字词,将其作为将被处理的目标字词。
另外,目标字词选择单元72从提供自语素分析单元71的关键字中选择不同于所选择的字词的字词作为其它字词。此外,目标字词选择单元72将从语素分析单元71提供的关键字中的仅具有一个属性的关键字与该属性关联起来,并将所述关键字和所述属性提供给如图2所示的生成单元53中。
目标字词属性搜索单元73搜索存储在属性字典存储单元75中的属性字典,以得到从目标字词选择单元72提供的目标字词的属性。目标字词属性搜索单元73随后将所找到的所述目标字词的属性提供给匹配单元76。
其它字词属性搜索单元74搜索存储在属性字典存储单元75中的属性字典,以得到从目标字词选择单元72提供的其它字词的属性,作为其它字词属性。其它字词属性搜索单元74随后将所找到的所述其它字词的属性提供给匹配单元76。属性字典存储单元75存储了所述属性字典。
匹配单元76判断从目标字词属性搜索单元73提供的目标字词属性与从其它字词属性搜索单元74提供的其它字词属性是否匹配。即,匹配单元76执行目标字词属性和其它字词属性之间的匹配操作。匹配单元76根据匹配操作的结果,将目标字词属性和其它字词属性中的每一个以及目标字词属性和其它字词属性之间的匹配数目提供给分值计算单元77。
分值计算单元77基于从匹配单元76提供的匹配数目以及预定权重系数,来计算从匹配单元76提供的目标字词的各个属性的分值。例如,分值计算单元77通过将所述匹配数目乘以所述预定权重系数来算出一个值作为分值。在本实施例中,具有更大值的属性被确定为更高分值属性。
在如图3所示的示例中,权重系数的值根据内容信息中的其它字词的位置而变化。下文中,权重系数被称作“位置系数”。例如,这样来确定位置系数,以使得在将被匹配的其它字词为包含在除了标题之外的信息中的情况下的位置系数值比在其它字词为包含在标题中的情况下的位置系数值大。
分值计算单元77将目标字词的各个属性以及所述属性的分值提供给确定单元78。确定单元78基于从分值计算单元77提供的属性和分值,来将具有最高分值的属性确定为节目的目标字词属性。其后,确定单元78将充当关键字的目标字词与所确定的属性关联起来,并将所述目标字词与所述属性提供给生成单元53。
图4示出了存储在如图3所示的属性字典存储单元75中的属性字典的示例。
如图4所示,表的第一行是包含字段“字词”和“属性”的标题行。在第一行之后的行中,写有各个字段的项目。字段“字词”包含字词。字段“属性”包含相应属性或所述字词的属性。
例如,在第二行中,字段“字词”包含“牛”。字段“属性”包含“动物,食物”。即,第二行指示字词“牛”的属性是“动物”和“食物”。
类似地,在第二行之后的行中,字段“字词”包含“烤肉”、“肉”、“食品”、“综艺节目(variety program)”、“世界杯”、“得分(goal)”、“国会”、“众议院”、“参议院”等。字段“属性”包含相应属性“食物”、“食物”、“食物”、“节目类型”、“体育赛事(足球),体育赛事(排球)”、“体育术语(足球),体育术语(运动)”、“组织,结构”、“组织”、“组织”等。
即,第二行之后的行指示以下对应关系:字词“烤肉”的属性是“食物”,字词“肉”的属性是“食物”,字词“食品”的属性是“食物”,字词“综艺节目”的属性是“节目类型”,字词“世界杯”的属性是“体育赛事(足球)”和“体育赛事(排球)”,字词“得分”的属性“体育术语(足球)”和“体育术语(运动)”,字词“国会”的属性是“组织”和“结构”,字词“众议院”的属性是“组织”,而字词“参议院”的属性是“组织”等。
注意,在属性中的圆括号内的各条信息指示更详细的属性。例如,属性“体育赛事(足球)”包括属性“体育赛事”的更详细的子属性“足球”。
接下来将参考图5来描述由如图2所示的节目搜索单元50执行的列表生成处理。例如当相关节目信息被从调谐器31提供时,开始所述的列表生成处理。
在步骤S1,提取单元51从提供自调谐器31的节目相关信息中提取内容信息。其后,提取单元51将该内容信息提供给属性确定单元52,并将包含在内容信息中的标题提供给生成单元53。这时,提取单元51从节目相关信息中提取节目类型,并按需将所述类型提供给属性确定单元52。
在步骤S1中的处理完成之后,处理前进到步骤S2。在步骤S2,属性确定单元52从提供自提取单元51的内容信息中提取关键字。随后,属性确定单元52执行属性确定处理,从而使用所述内容信息来确定关键字属性。如果类型信息提供自提取单元51,则属性确定单元52从该类型信息中提取类型字词,并且除了内容信息之外还使用该类型字词来执行属性确定处理。以下将参考图6、10、12、14和15来详细描述属性确定处理。
在步骤S2中的处理完成之后,处理前进到步骤S3。在步骤S3,对于每一个提供自提取单元51的标题,生成单元53都生成包含由提供自属性确定单元52的属性和相应关键字组成的对的列表。其后,生成单元53将所生成的列表提供给列表存储单元54。因此,列表被存储在列表存储单元54中。
接下来将参考图6来详细描述在图5的步骤S2中由如图3所示的属性确定单元52执行的属性确定处理。
在步骤S21,图3中示出的语素分析单元71对提供自提取单元51的内容信息执行语素分析。其后,语素分析单元71提取被标上“名词”词性的字词充当关键字,并将所提取的关键字提供给目标字词选择单元72。
例如,假设指示节目中包含什么内容的内容信息包括以下文本:“这里将播出世界杯比赛——日本对阵巴西。不要错过中田的获胜得分!”。在这种情况下,语素分析单元71提取了以下被标上“名词”词性标签的字词充当关键字:“世界杯”、“比赛”、“日本”、“巴西”、“中田”和“得分”。
在步骤S21中的处理完成之后,处理前进到步骤S22。在步骤S22,目标字词选择单元72基于存储在属性字典存储单元75中的属性字典,来识别提供自语素分析单元71的关键字的属性。
在步骤S22中的处理完成之后,处理前进到步骤S23。在步骤S23,目标字词选择单元72将仅具有一个属性的各个关键字与所述属性关联起来,并将所述关键字和所述属性提供给生成单元53。其后,处理前进到步骤S24。
在步骤S24,目标字词选择单元72对所述关键字中是否存在具有多个属性的关键字进行判断。如果目标字词选择单元72判断得出不存在具有多个属性的关键字,则处理返回到图5的步骤S2。处理随后前进到步骤S3。
然而,如果目标字词选择单元72判断得出存在具有多个属性的关键字,则处理前进到步骤S25。在步骤S25,目标字词选择单元72从具有多个属性的每个关键字中选择还没有被确定为目标字词的字词中的一个字词作为目标字词。目标字词选择单元72随后将所选择的字词提供给目标字词属性搜索单元73。
在步骤S25中的处理完成之后,处理前进到步骤S26。在步骤S26,目标字词选择单元72从所述关键字中选择不同于被选择的字词的字词作为其它字词。其后,目标字词选择单元72将所述的其它字词提供给其它字词属性搜索单元74。例如,目标字词选择单元72选择具有两个属性“体育赛事(足球)”和“体育赛事(排球)”的关键字“世界杯”作为目标字词。另外,目标字词选择单元72选择不同于目标字词“世界杯”的关键字作为其它字词。
在步骤S26中的处理完成之后,处理前进到步骤S27。在步骤S27,目标字词属性搜索单元73搜索存储在属性字典存储单元75中的属性字典,以得到提供自目标字词选择单元72的目标字词的属性,并将所找到的属性确定为所述目标字词的属性。目标字词属性搜索单元73随后将所述目标字词属性提供给匹配单元76。
在步骤S27中的处理完成之后,处理前进到步骤S28。在步骤S28,其它字词属性搜索单元74搜索存储在属性字典存储单元75中的属性字典,以得到提供自目标字词选择单元72的其它字词的属性,并将所找到的属性确定为所述其它字词的属性。其它字词属性搜索单元74随后将所述其它字词属性提供给匹配单元76。
在步骤S28中的处理完成之后,处理前进到步骤S29。在步骤S29,匹配单元76执行提供自目标字词属性搜索单元73的目标字词属性与提供自其它字词属性搜索单元74的其它字词属性之间的匹配操作。随后,匹配单元76根据匹配操作的结果,来将目标字词的各个属性以及目标字词属性和其它字词属性之间的匹配数目提供给分值计算单元77。
例如,匹配单元76执行目标字词“世界杯”的每个属性“体育赛事(足球)”和“体育赛事(排球)”与其它字词“得分”的每个属性“体育术语(足球)”和“体育术语(运动)”之间的匹配操作。结果,目标字词“世界杯”的属性“体育赛事(足球)”被确定为与其它字词“得分”的属性“体育术语(足球)”在字词“足球”方面相匹配。因此,匹配单元76根据匹配操作的结果,来将目标字词“世界杯”的属性“体育赛事(足球)”与匹配数目“1”一起提供给分值计算单元77,匹配数目“1”是所述属性的匹配数目。
另外,匹配单元76还判断目标字词“得分”的属性“体育术语(足球)”和“体育术语(运动)”中的各个属性之间与其它字词“世界杯”的属性“体育赛事(足球)”和“体育赛事(排球)”中的各个属性是否相匹配。结果,目标字词“得分”的属性“体育术语(足球)”与其它字词“世界杯”的属性“体育赛事(足球)”在字词“足球”方面相匹配。因此,匹配单元76根据匹配操作的结果来将目标字词“得分”的属性“体育术语(足球)”与匹配数目“1”一起提供给分值计算单元77,匹配数目“1”是所述属性的匹配数目。
在步骤S29中的处理完成之后,处理前进到步骤S30。在步骤S30,分值计算单元77基于提供自匹配单元76的匹配数目和预定权重系数,来计算提供自匹配单元76的目标字词的各个属性的分值。随后,分值计算单元77将所述目标字词的各个属性和该属性的分值提供给确定单元78。
在步骤S30中的处理完成之后,处理前进到步骤S31。在步骤S31,确定单元78基于提供自分值计算单元77的属性和分值,来将具有最高分值的属性确定为节目的目标字词属性。
例如,确定单元78基于所述分值,来将具有最高分值的属性“体育赛事(足球)”确定为目标字词“世界杯”的属性。另外,确定单元78还基于所述分值,来将具有最高分值的属性“体育术语(足球)”确定为目标字词“得分”的属性。
在步骤S31中的处理完成之后,处理前进到步骤S32。在步骤S32,确定单元78将充当关键字的目标字词与所确定的属性关联起来,并将所述目标字词与所述属性提供给生成单元53。其后,处理前进到步骤S33。
在步骤S33,目标字词选择单元72对是否存在还没有被从各自具有多个属性的字词中选择出来作为目标字词的字词进行判断。如果目标字词选择单元72判断得出存在还没有被选择作为目标字词的字词,则处理返回到步骤S25。其后,重复如上所述的处理。
然而,如果目标字词选择单元72判断得出不存在还没有被选择作为目标字词的字词,即,如果各自具有多个属性的关键字中的所有字词都已经被选择作为目标字词,则处理返回到图5中的步骤S2。处理随后前进到步骤S3。
这样,当充当关键字的字词具有多个属性时,图3中示出的属性确定单元52基于包含在内容信息中的关键字属性与其它字词属性之间的匹配数目,来确定所述关键字的属性。因此,属性确定单元52能够从关键字的多个属性中选择对于节目内容来说是最优的属性,并将所选择的属性确定为所述关键字的属性。
例如,当内容信息包含以下文本时:“这里将播出世界杯比赛——日本对阵巴西。不要错过中田的获胜得分!”,属性确定单元52可以选择属性“体育赛事(足球)”作为与足球世界杯有关的节目的关键字“世界杯”的属性,而不是选择属性“体育赛事(排球)”。结果,在图2中示出的节目搜索单元50能够基于关键字“世界杯”和关键字“体育赛事(足球)”来搜索与足球世界杯有关的节目的标题作为相关节目的标题。
接下来将参考图7来描述由在图2中示出的搜索相关节目的节目搜索单元50执行的节目搜索处理。例如当接收单元55接收到用于显示当前显示的节目的关键字的用户操作的操作信号时,开始所述的节目搜索处理。
在步骤S41,在接收到用于显示被显示的节目的关键字的用户操作的操作信号之后,识别单元56识别出当前显示的节目的标题,并将识别得到的标题提供给生成单元53和搜索单元57。
在步骤S41中的处理完成之后,处理前进到步骤S42。在步骤S42,在接收到提供自识别单元56的当前显示的节目的标题之后,生成单元53读出与所述标题相对应的列表。随后,生成单元53将列在列表中的关键字提供给显示控制单元58。
在步骤S42中的处理完成之后,处理前进到步骤S43。在步骤S43,显示控制单元58生成用于显示一种屏幕图像的图像数据,在所述屏幕图像中列有从生成单元53提供的关键字。其后,显示控制单元58将所述图像数据提供给信号处理单元33。因此,列有被显示的节目的关键字的屏幕图像被显示在显示器34上。用户观看显示在显示器34上的屏幕图像,并对操作输入单元38进行操作,从而从当前显示的节目的关键字中选择希望的关键字。
在步骤S43中的处理完成之后,处理前进到步骤S44。在步骤S44,接收单元55判断用户是否已经选择关键字,即,其是否接收到用于从当前显示的节目的关键字中选择希望的关键字的操作的操作信号。如果接收单元55判断得出关键字还没有被选择,则接收单元55等待关键字被选择。
但是,在步骤S44,如果接收单元55判断得出用户已经选择关键字,则接收单元55向搜索单元57提供用于从被显示的节目的关键字中选择希望的关键字的操作的操作信号。随后,处理前进到步骤S45。
在步骤S45,在从接收单元55接收到所述操作信号之后,搜索单元57从存储在列表存储单元54中的列表中读出由用户选择的关键字的属性,所述列表与从识别单元56提供的当前显示的节目的标题相对应。
在步骤S46,基于在步骤S45读出的属性和用户选择的关键字,搜索单元57对列表存储单元54进行搜索,以得到与包含彼此关联的属性和关键字的列表相对应的标题,作为相关节目的标题。搜索单元57将所找到的标题提供给显示控制单元58。
在步骤S46中的处理完成之后,处理前进到步骤S47。在步骤S47,显示控制单元58生成用于显示屏幕图像的图像数据,并将所述图像数据提供给信号处理单元33,在所述的屏幕图像中列有从搜索单元57提供的标题。因此,列有相关节目的标题的屏幕图像被显示在显示器34上。随后,处理结束。
图8是详细示出在图2中的属性确定单元52的配置的另一个示例的框图。
如图8所示,属性确定单元52包括语素分析单元71、目标字词选择单元72、目标字词属性搜索单元73、其它字词属性搜索单元74、属性字典存储单元75、分值计算单元77、确定单元78、目标字词辞典搜索单元91、其它字词辞典搜索单元92、辞典存储单元93、匹配单元94以及被选属性搜索单元95。属性确定单元52基于不同于存储在内容信息中的特定关键字的关键字的属性以及与所述特定关键字有关的相关字词,来确定所述特定关键字的属性。如以上在描述图3中所使用的编号方式一样,在描述图8中将使用类似的编号方式。因此,不再重复描述。
辞典存储单元93存储有辞典,以下将更详细地描述该辞典。所述辞典包含字词以及与该字词有关的相关字词。目标字词辞典搜索单元91对所述辞典进行搜索,以得到由目标字词选择单元72选择的目标字词的相关字词。目标字词辞典搜索单元91将所找到的相关字词提供给匹配单元94。注意,与相应的目标字词的关系(例如,上位、下位、关联、同义)被赋给相关字词。
其它字词辞典搜索单元92对存储在辞典存储单元93中的辞典进行搜索,以得到由目标字词选择单元72选择的其它字词的相关字词。其它字词辞典搜索单元92将所找到的相关字词提供给匹配单元94。如上所述,辞典存储单元93存储了所述辞典。
像图3中示出的匹配单元76一样,匹配单元94执行在提供自目标字词属性搜索单元73的目标字词属性与提供自其它字词属性搜索单元74的其它字词属性之间的匹配操作。随后,像匹配单元76一样,匹配单元94根据匹配操作的结果,来将目标字词的各个属性以及目标字词属性与其它字词属性之间的匹配数目提供给分值计算单元77。
另外,匹配单元94还执行在提供自目标字词辞典搜索单元91的目标字词的相关字词与提供自其它字词辞典搜索单元92的其它字词的相关字词之间的匹配操作。随后,根据匹配操作的结果,匹配单元94将确定为与其它字词的相关字词相匹配的目标字词的相关字词提供给被选属性搜索单元95,作为被选相关字词。
此外,匹配单元94还执行在目标字词属性搜索单元73所找到的目标字词的属性与提供自被选属性搜索单元95的被选相关字词的属性之间的匹配操作。随后,匹配单元94根据匹配操作的结果,来将所述目标字词的各个属性以及所述目标字词属性与被选相关字词的属性之间的匹配数目提供给分值计算单元77。
被选属性搜索单元95对存储在属性字典存储单元75中的属性字典进行搜索,以得到从匹配单元94提供的被选相关字词的属性,作为所述被选相关字词的属性。随后,被选属性搜索单元95将所找到的被选相关字词的属性提供给匹配单元94。
在如图8所示的示例中,在分值计算单元77计算分值时,分值计算单元77使用位置系数或者根据在内容信息中的其它字词(从所述其它字词派生出匹配目标)的位置和包含在相关字词(从所述相关字词派生出匹配目标)中的关系而变化的系数(下文中称作“位置关系系数”),来作为权重系数。例如,这样来确定所述位置关系系数以使得:在被选相关字词的属性派生自具有“同义”关系的相关字词的情况下的位置关系系数高于在被选相关字词的属性派生自具有“上位”关系的相关字词的情况下的位置关系系数。
另外,针对目标字词的各个属性,如图8所示的分值计算单元77对根据目标字词属性与其它字词属性之间的匹配结果而算出的分值以及根据目标字词属性与被选相关字词的属性之间的匹配结果而算出的分值求和。这个和被确定为最终分值。分值计算单元77将该分值与属性一起提供给确定单元78。
图9示出了存储在如图8所示的辞典存储单元93中的辞典的示例。
在图9中示出的表具有包括字段“字词”、“相关字词”和“关系”的标题行。从第二行开始,列出了与所述字段相对应的数据。“字词”字段包含字词。“相关字词”字段包含在相应的“字词”字段中的字词的相关字词。“关系”字段包含在“字词”字段中的字词与相关字词之间的关系。
例如,在第二行中,“字词”字段包含“牛”。“相关字词”字段包含“动物”。“关系”字段包含“上位”。即,第二行指示字词“牛”的相关字词为“动物”,而相关字词“动物”与字词“牛”之间的关系是“上位”。即,相关字词“动物”是字词“牛”的上位词。
类似地,从第三行开始,“字词”字段顺序地包含“牛”、“烤肉”、“烤肉”、“食品”、“食品”、“国会”、“国会”、“众议院”、“众议院”、“参议院”、“参议院”、“动物”、“动物”、“食物”、“食物”等。从第三行开始,“相关字词”字段顺序地包含“肉”、“食物”、“肉”、“食物”、“食谱”、“众议院”、“参议院”、“国会”、“参议院”、“国会”、“众议院”、“动物(creature)”、“生物”、“食材”、“烤肉”等。从第三行开始,“关系”字段顺序地包含“关联”、“上位”、“关联”、“同义”、“上位”、“下位”、“下位”、“上位”、“关联”、“上位”、“关联”、“同义”、“上位”、“下位”、“下位”等。
即,从第三行开始的行指示以下内容。字词“牛”的相关字词是字词“肉”,字词“肉”是字词“牛”的关联词。字词“烤肉”的相关字词是字词“食物”和“肉”,字词“食物”是字词“烤肉”的上位词,而字词“肉”是字词“烤肉”的关联词。字词“食品”的相关字词是字词“食物”和字词“食谱”,字词“食物”是字词“食品”的同义词,而字词“食谱”是字词“食品”的上位词。字词“国会”的相关字词是字词“众议院”和“参议院”,字词“众议院”和“参议院”是字词“国会”的下位词。字词“众议院”的相关字词是字词“国会”和“参议院”,字词“国会”是字词“众议院”的上位词,而字词“参议院”是字词“众议院”的关联词。字词“参议院”的相关字词是字词“国会”和“众议院”,字词“国会”是字词“参议院”的上位词,而字词“众议院”是字词“参议院”的关联词。字词“动物”的相关字词是字词“动物(creature)”和“生物”,字词“动物(creature)”是字词“动物”的同义词,而字词“生物”是字词“动物”的上位词。字词“食物”的相关字词是“食材”和“烤肉”,字词“食材”和“烤肉”是字词“食物”的下位词,等。
接下来将参考图10来描述在图5的步骤S2中由如图8所示的属性确定单元52执行的属性确定处理。
在步骤S61到步骤S69中执行的处理类似于在图6中的步骤S21到步骤S29所执行的处理。因此,不再重复详细描述。例如,当关于节目的内容信息是句子“日本国会包括众议院和参议院”时,则通过这些步骤来提取关键字“日本”、“国会”、“众议院”和“参议院”。
另外,基于在图4中示出的属性字典,具有两个属性“组织”和“结构”的关键字“国会”被确定为目标字词。随后,基于如图4所示的属性字典来搜索得到字词“组织”,字词“组织”是其它字词“众议院”和“参议院”的属性。由于所述目标字词的属性“组织”与其它字词“众议院”和“参议院”的属性“组织”相匹配,因此属性“组织”与匹配数目2一起被提供给分值计算单元77。
在步骤S70,分值计算单元77基于从匹配单元94提供的匹配数目以及预定权重系数来计算从匹配单元94提供的目标字词的各个属性的分值。处理随后前进到步骤S71。
在步骤S71,目标字词辞典搜索单元91搜索存储在辞典存储单元93中的辞典,以得到由目标字词选择单元72选择的目标字词的相关字词。目标字词辞典搜索单元91随后将所找到的相关字词提供给匹配单元94。
例如,目标字词辞典搜索单元91搜索如图9所示的辞典,以得到目标字词“国会”的相关字词“众议院”和“参议院”。注意,针对目标字词“国会”,相关字词“众议院”和“参议院”具有关系“下位”。
在步骤S71中的处理完成之后,处理前进到步骤S72。在步骤S72,其它字词辞典搜索单元92搜索存储在辞典存储单元93中的辞典,以得到由目标字词选择单元72选择的其它字词的相关字词。其后,其它字词辞典搜索单元92将所找到的相关字词提供给匹配单元94。
例如,其它字词辞典搜索单元92搜索如图9所示的辞典,以得到其它字词“参议院”的相关字词“国会”和“众议院”,以及其它字词“众议院”的相关字词“国会”和“参议院”。注意,相关字词“国会”具有关系“上位”,而相关字词“众议院”和“参议院”中的每一个都具有关系“关联”。
在步骤S72中的处理完成之后,处理前进到步骤S73。在步骤S73,匹配单元94执行在从目标字词辞典搜索单元91提供的目标字词的相关字词与从其它字词辞典搜索单元92提供的其它字词的相关字词之间的匹配操作。其后,作为匹配操作的结果,匹配单元94将确定为与所述其它字词的相关字词相匹配的所述目标字词的相关字词提供给被选属性搜索单元95,作为被选相关字词。
例如,匹配单元94执行目标字词“国会”的各个相关字词“众议院”和“参议院”、其它字词“众议院”的各个相关字词“国会”和“参议院”、以及其它字词“参议院”的各个相关字词“国会”和“众议院”之间的匹配操作。作为匹配操作的结果,匹配单元94将被确定为与其它字词“众议院”的相关字词“参议院”相匹配的目标字词“国会”的相关字词“参议院”,以及被确定为与其它字词“参议院”的相关字词“众议院”相匹配的目标字词“国会”的相关字词“众议院”提供给被选属性搜索单元95,作为被选相关字词。
在步骤S73中的处理完成之后,处理前进到步骤S74。在步骤S74,被选属性搜索单元95搜索存储在属性字典存储单元75中的属性字典,以得到从匹配单元94提供的被选相关字词的属性,作为所述被选相关字词的属性。随后,被选属性搜索单元95将所找到的属性提供给匹配单元94。例如,被选属性搜索单元95搜索如图4所示的属性字典,以得到从匹配单元94提供的被选相关字词“众议院”和“参议院”的属性“组织”。其后,被选属性搜索单元95将属性“组织”提供给匹配单元94。
在步骤S74中的处理完成之后,处理前进到步骤S75。在步骤S75,匹配单元94执行由目标字词属性搜索单元73找到的目标字词的属性与从被选属性搜索单元95提供的被选相关字词的属性之间的匹配操作。随后,作为匹配操作的结果,匹配单元94将目标字词的各个属性和所述属性与被选相关字词的属性之间的匹配数目一起提供给分值计算单元77。
例如,匹配单元94执行目标字词“国会”的各个属性“组织”和“结构”与被选相关字词“众议院”和“参议院”的属性“组织”之间的匹配操作。随后,作为匹配操作的结果,匹配单元94将被确定为与被选相关字词“众议院”和“参议院”的属性“组织”相匹配的目标字词“国会”的属性“组织”和关于该属性的匹配数目2一起提供给分值计算单元77。
在步骤S75中的处理完成之后,处理前进到步骤S76。在步骤S76,分值计算单元77基于在步骤S75中从匹配单元94提供的匹配数目以及预定权重系数,来计算目标字词的各个属性的分值。随后,分值计算单元77针对目标字词的各个属性来对这个分值和在步骤S70中算出的分值求和。这个和作为各个所述属性的最终分值。随后,分值计算单元77将该分值与属性一起提供给确定单元78。
在步骤S76中的处理完成之后,处理前进到步骤S77。在步骤S77,确定单元78基于所述属性以及从分值计算单元77提供的分值,来将具有最高分值的属性确定为节目的目标字词属性。例如,确定单元78将具有最高分值的属性“组织”确定为目标字词“国会”的属性。
由于在步骤S78和步骤S79中执行的处理类似于在如图6所示的步骤S32和步骤S33中执行的处理,因此,将不再重复对它们的描述。
如上所述,如图8所示的属性确定单元52搜索目标字词和其它字词的相关字词。随后,属性确定单元52执行被确定为与所述其它字词的相关字词相匹配的被选相关字词的属性与所述目标字词的属性之间的匹配操作。在相关技术中,虽然目标字词的意思与其它字词的属性的意思类似,但是由于几种不同的拼写方式而导致这些属性无法被确定为一致。但是,根据本发明,能够增加将那样的目标字词的属性确定为节目的目标字词属性的可能性。因此,能够选择对于所述节目为最优的关键字的属性。
图11是在图2中示出的属性确定单元52的另一个配置的详细框图。
如图11所示,属性确定单元52包括目标字词选择单元72、目标字词属性搜索单元73、属性字典存储单元75、分值计算单元77、确定单元78、辞典存储单元93、语素分析单元111、属性辞典搜索单元112和匹配单元113。属性确定单元52基于不同于特定关键字的关键字的属性的相关字词以及存储在内容信息中的类型字词,来确定所述特定关键字的属性。在描述图11中将使用与以上在描述图3和8中使用的编号方式相类似的编号方式。因此,将不再重复描述。
语素分析单元111对从如图2所示的提取单元51提供的内容信息和类型信息执行语素分析。因此,所述内容信息和类型信息被分离成字词。各个字词的词性被识别出来。像如图3和8所示的语素分析单元71一样,语素分析单元111从包含在所述内容信息中的字词中提取关键字,并将所提取的关键字提供给目标字词选择单元72。另外,语素分析单元111从所述类型信息中提取类型字词,并将所提取的类型字词提供给匹配单元113。
属性辞典搜索单元112将目标字词属性搜索单元73所找到的目标字词的属性视为字词。随后,属性辞典搜索单元112搜索存储在辞典存储单元93中的辞典,以得到所述字词的相关字词。属性辞典搜索单元112随后将所述目标字词的属性的相关字词提供给匹配单元113。
匹配单元113执行在从属性辞典搜索单元112提供的目标字词的属性的相关字词与从语素分析单元111提供的类型字词之间的匹配操作。随后,根据匹配操作的结果,匹配单元113将所述目标字词的各个属性和所述属性的相关字词与所述类型字词之间的匹配数目一起提供给分值计算单元77。
在图11所示的示例中,分值计算单元77采用权重系数以计算分值。根据赋给将被匹配的相关字词的关系的种类来使用不同的权重系数。
接下来将参考图12来详细描述在图5的步骤S2中由图11所示的属性确定单元52执行的属性确定处理。
在步骤S91,语素分析单元111对从提取单元51提供的内容信息和类型信息执行语素分析。像在图3和8中示出的语素分析单元71一样,语素分析单元111从包含在内容信息中的字词中提取关键字,并将所提取的关键字提供给目标字词选择单元72。另外,语素分析单元111从类型信息中提取类型字词,并将该类型字词提供给匹配单元113。
例如,假设所述内容信息包含标题“动物天堂”和注释“这是一档探索牛的有趣行为的节目”,而所述类型包含“自然/动物/环境”。然后,语素分析单元111提取字词“动物”、“天堂”、“节目”、“牛”、和“行为”充当关键字。另外,语素分析单元111提取字词“自然”、“动物”和“环境”作为类型字词。
在步骤S92到S96中执行的处理类似于图6的步骤S22到S25和图7的步骤S27所执行的那些处理。因此,不再重复详细描述。例如,通过这些处理基于图4所示的属性字典来将具有两个属性“动物”和“食物”的关键字“牛”确定为目标字词。
在步骤S96中的处理完成之后,处理前进到步骤S97。在步骤S97,属性辞典搜索单元112将目标字词属性搜索单元73所找到的目标字词的属性视为字词。随后,属性辞典搜索单元112搜索存储在辞典存储单元93中的辞典,以得到所述字词的相关字词,作为所述目标字词的属性的相关字词。属性辞典搜索单元112随后将所述目标字词的属性的相关字词提供给匹配单元113。
例如,属性辞典搜索单元112搜索图9所示的辞典,以得到目标字词“牛”的属性“动物”的相关字词“动物(creature)”和“生物”。另外,属性辞典搜索单元112搜索目标字词“牛”的属性“食物”的相关字词“食材”和“烤肉”。其后,属性辞典搜索单元112将这些相关字词提供给匹配单元113。
在步骤S97的处理完成之后,处理前进到步骤S98。在步骤S98,匹配单元113执行在从属性辞典搜索单元112提供的目标字词的属性的相关字词与从语素分析单元111提供的类型字词之间的匹配操作。随后,根据匹配操作的结果,匹配单元113将所述目标字词的各个属性和所述属性的相关字词与所述类型字词之间的匹配数目一起提供给分值计算单元77。
例如,匹配单元113执行目标字词“牛”的属性“动物”的相关字词“动物(creature)”和“生物”与类型字词“自然”、“creature”和“环境”之间的匹配操作。另外,匹配单元113还执行目标字词“牛”的属性“食物”的相关字词“食材”和“烤肉”与类型字词“自然”、“动物(creature)”和“环境”之间的匹配操作。随后,根据匹配操作的结果,匹配单元113将被确定为与类型字词“动物(creature)”相匹配的相关字词“(creature)”所对应的目标字词“牛”的属性“动物”和在属性“动物”的相关字词“动物(creature)”与类型字词“动物(creature)”之间的匹配数目1一起提供给分值计算单元77。
在步骤S99到S102中执行的处理类似于在图6的步骤S30到S33中执行的那些处理。因此,不再重复描述。例如,通过这些处理,确定单元78将具有最高分值的属性“动物”确定为目标字词“牛”的属性。
如上所述,在图11中示出的属性确定单元52基于目标字词的属性的相关字词以及所述相关字词与类型字词之间的匹配数目,来确定节目的目标字词的属性。因此,属性确定单元52能够将与节目类型相关的属性确定为该节目的目标字词的属性。结果,属性确定单元52能够确定对于该节目的内容来说为最优的关键字属性。
图13是在图2中示出的属性确定单元52的又一个配置的详细框图。
如图13所示,属性确定单元52包括目标字词选择单元72、目标字词属性搜索单元73、其它字词属性搜索单元74、属性字典存储单元75、分值计算单元77、确定单元78、目标字词辞典搜索单元91、其它字词辞典搜索单元92、辞典存储单元93、被选属性搜索单元95、语素分析单元111、属性辞典搜索单元112、类型属性搜索单元121、类型辞典搜索单元122、辞典属性搜索单元123和匹配单元124。
在图13中示出的属性确定单元52基于存储在内容信息中不同于特定关键字的关键字和类型字词的属性、所述属性的相关字词以及相关字词,来确定所述特定关键字的属性。在描述图13中将使用与以上在描述图3、8和11中使用的编号方式相类似的编号方式。因此,不再重复描述。
类型属性搜索单元121搜索存储在属性字典存储单元75中的属性字典,以得到从语素分析单元111提供的类型字词的属性,并将该类型字词的属性提供给匹配单元124。
类型辞典搜索单元122搜索存储在辞典存储单元93中的辞典,以得到由语素分析单元111提取的类型字词的相关字词,并将该类型字词的相关字词提供给匹配单元124。
辞典属性搜索单元123搜索存储在属性字典存储单元75中的属性字典,以得到由属性辞典搜索单元112找到的目标字词的属性的相关字词的属性,并将该目标字词属性的相关字词的属性提供给匹配单元124。
匹配单元124执行在从目标字词属性搜索单元73提供的目标字词的各个属性、从属性辞典搜索单元112提供的目标字词的属性的相关字词、从辞典属性搜索单元123提供的目标字词的属性的相关字词的属性与由目标字词选择单元72选择的其它字词、由语素分析单元111提取的类型字词之间的匹配操作(下文中称作“直接匹配操作”)。随后,根据该直接匹配操作的结果,匹配单元124将所述目标字词的各个属性和在各个所述属性、所述属性的相关字词、和所述属性的相关字词的属性与各个所述其它字词和所述类型字词之间的匹配数目一起提供给分值计算单元77。
另外,匹配单元124还执行在目标字词的各个属性、目标字词的属性的相关字词、和目标字词的属性的相关字词的属性与从其它字词属性搜索单元74提供的其它字词的各个属性和从类型属性搜索单元121提供的类型字词的属性之间的匹配操作(下文中称作“属性匹配操作”)。随后,根据该属性匹配操作的结果,匹配单元124将所述目标字词的属性和在各个所述属性、所述属性的相关字词和所述属性的相关字词的属性与各个所述其它字词的属性和所述类型字词的属性之间的匹配数目一起提供给分值计算单元77。
此外,匹配单元124还执行在从目标字词辞典搜索单元91提供的目标字词的相关字词与从其它字词辞典搜索单元92提供的其它字词的各个相关字词和从类型辞典搜索单元122提供的类型字词的相关字词之间的匹配操作。随后,根据该匹配操作的结果,匹配单元124将被确定为与所述其它字词的相关字词或所述类型字词的相关字词相匹配的所述目标字词的相关字词提供给被选属性搜索单元95,作为被选相关字词。
此外,匹配单元124还执行在目标字词的各个属性、目标字词的属性的相关字词和目标字词的属性的相关字词的属性与从被选属性搜索单元95提供的所述被选相关字词的属性之间的匹配操作(下文中称作“相关字词匹配操作”)。随后,根据该相关字词匹配操作的结果,匹配单元124将目标字词的属性和在所述目标字词的各个属性、所述属性的相关字词和所述属性的相关字词的属性与所述被选相关字词的属性之间的匹配数目一起提供给分值计算单元77。
在图13中示出的示例中,对于根据直接匹配操作的匹配数目来说,在分值计算单元77计算分值时,分值计算单元77使用一系数(下文中称作“直接系数”)来作为权重系数,该系数根据内容信息中的匹配目标的其它字词的位置、匹配目标是其它字词还是类型字词,或者作为匹配目标的相关字词或从相关字词派生出的字词的关系种类而变化。
例如,这样来确定直接系数,以使得在匹配目标为类型字词的情况下的系数大于在匹配目标为其它字词的情况下的系数。
另外,对于根据属性匹配操作的匹配数目来说,使用一系数(下文中称作“属性系数”)作为权重系数,该系数根据在内容信息中的从其派生匹配目标的其它字词的位置、匹配目标派生自其它字词还是派生自类型字词,或者作为匹配目标的相关字词或从其派生相关字词的字词的关系种类而变化。
此外,对于根据相关字词匹配操作的匹配数目来说,使用一系数(下文中称作“相关字词系数”)作为权重系数,该系数根据在内容信息中的其它字词(所述其它字词的相关字词被确定为与被选相关字词的属性相匹配)的位置、匹配目标是被确定为与其它字词的相关字词相匹配的被选相关字词的属性、还是类型字词的相关字词,或者作为匹配目标的相关字词或从其派生相关字词的字词的关系种类而变化。
在图13中示出的分值计算单元77针对目标字词的各个属性而对根据直接匹配、属性匹配和相关字词匹配来计算得到的分值求和。这个和被确定为所述属性的最终分值。所述和与所述属性一起被提供给确定单元78。
接下来将参考图14和15来详细描述在图5的步骤S2中由图13所示的属性确定单元52执行的属性确定处理。
在步骤S111到S117中执行的处理类似于在图12的步骤S91和图6的步骤S22到S27中执行的那些处理。因此,不再重复详细描述。例如,当关于节目的内容信息是这样的句子:“这将我们带到了能够吃到便宜的优质肉牛的旅途”,而类型是“食物/综艺节目”时,通过这些处理而提取得到关键字“烤肉”、“旅途”和“牛”。另外,通过这些处理而提取得到类型字词“食物”和“综艺节目”。
另外,基于在图4中示出的属性信息,例如,具有两个属性“动物”和“食物”的关键字“牛”被确定为目标字词。基于在图4中示出的属性字典,属性“食物”被确定为其它字词“烤肉”的属性。
在步骤S118,像在图12的步骤S97中一样,属性辞典搜索单元112将由目标字词属性搜索单元73找到的目标字词的属性视为字词。随后,属性辞典搜索单元112搜索存储在辞典存储单元93中的辞典,以得到所述字词的相关字词。属性辞典搜索单元112随后将所述目标字词的属性的相关字词提供给匹配单元124。例如,属性辞典搜索单元112搜索在图9中示出的辞典,以得到目标字词“牛”的属性“动物”的相关字词“动物(creature)”和“生物”,以及属性“食物”的相关字词“食材”和“烤肉”。其后,属性辞典搜索单元112将这些相关字词提供给匹配单元124。
在步骤S118中的处理完成之后,处理前进到步骤S119。在步骤S119,辞典属性搜索单元123搜索存储在属性字典存储单元75中的属性字典,以得到由属性辞典搜索单元112找到的目标字词的属性的相关字词的属性,并将所述目标字词的属性的相关字词的属性提供匹配单元124。例如,辞典属性搜索单元123搜索在图4中示出的属性字典,以得到目标字词“牛”的属性“动物”和“食物”的相关字词“烤肉”的属性“食物”。
在步骤S119中的处理完成之后,处理前进到步骤S120。在步骤S120,匹配单元124执行直接匹配操作。随后,根据该直接匹配操作的结果,匹配单元124将所述目标字词的各个属性和在所述属性、所述属性的相关字词、所述属性的相关字词的属性中的一个与其它字词和类型字词中的每一个之间的匹配数目一起提供给分值计算单元77。
匹配单元124执行在目标字词“牛”的属性“动物”和“食物”,目标字词“牛”的属性“动物”和“食物”的相关字词“烤肉”、“动物(creature)”、“生物”和“食材”,目标字词“牛”的属性“食物”的相关字词“烤肉”的属性“食物”中的每一个与其它字词“优质”、“便宜”、“烤肉”和“旅途”以及类型字词“食品”和“综艺节目”中的每一个之间的直接匹配操作。在这种情况下,不存在被确定为与所述其它字词或所述类型字词相匹配的所述目标字词的属性、所述目标字词的属性的相关字词或所述目标字词的属性的相关字词的属性。因此,匹配单元124将所述目标字词的各个属性和匹配数目0一起提供给分值计算单元77。
在步骤S120中的处理完成之后,处理前进到步骤S121。在步骤S121,分值计算单元77使用从匹配单元124提供的匹配数目和预定权重系数,来计算从匹配单元124提供的目标字词的各个属性的分值。
在步骤S121中的处理完成之后,处理前进到步骤S122。在步骤S122,像在图6的步骤S28中一样,其它字词属性搜索单元74搜索存储在属性字典存储单元75中的属性字典,以得到从目标字词选择单元72提供的其它字词的属性,作为所述其它字词的属性。其它字词属性搜索单元74随后将所述其它字词的属性提供给匹配单元124。例如,其它字词属性搜索单元74搜索在图4中示出的属性字典,以得到其它字词“烤肉”的属性“食物”。
在步骤S122中的处理完成之后,处理前进到步骤S123。在步骤S123,类型属性搜索单元121搜索存储在属性字典存储单元75中的属性字典,以得到从语素分析单元111提供的类型字词的属性,并将所述类型字词的属性提供给匹配单元124。例如,类型属性搜索单元121搜索在图4中示出的属性字典,从而获得类型字词“食品”和“综艺节目”的属性“食物”和“节目类型”。
在步骤S123的处理完成之后,处理前进到图15的步骤S124。在步骤S124,匹配单元124执行属性匹配操作。随后,根据该属性匹配操作的结果,匹配单元124将目标字词的各个属性和在所述属性、所述属性的相关字词和所述属性的相关字词的属性中的一个与所述其它字词的属性和所述类型字词的属性中的每一个之间的匹配数目一起提供给分值计算单元77。
例如,匹配单元124判断以下第一项目中的各个是否与以下第二项目中的任意一个相匹配。所述的第一项目是目标字词“牛”的属性“动物”和“食物”,目标字词“牛”的属性“动物”和“食物”的相关字词“烤肉”、“动物(creature)”、“生物”和“食材”,以及目标字词“牛”的属性“食物”的相关字词“烤肉”的属性“食物”。所述第二项目是从其它字词属性搜索单元74提供的其它字词“烤肉”的属性“食物”以及类型字词“食品”和“综艺节目”的属性“食物”和“节目类型”。
随后,根据该属性匹配结果,匹配单元124将被确定为与所述其它字词的属性“食物”和类型字词“食品”的属性“食物”相匹配的目标字词“牛”的属性“食物”和匹配数目“2”一起提供给分值计算单元77。
在步骤S124中的处理完成之后,处理前进到步骤S125。在步骤S125,像在图14的步骤S121中一样,分值计算单元77使用从匹配单元124提供的匹配数目和预定权重系数来计算从匹配单元124提供的目标字词的各个属性的分值。
在步骤S125中的处理完成之后,处理前进到步骤S126。在步骤S126,像在图10的步骤S71中一样,目标字词辞典搜索单元91搜索存储在辞典存储单元93中的辞典,以得到由目标字词选择单元72选择的目标字词的相关字词。目标字词辞典搜索单元91随后将所找到的相关字词提供给匹配单元124。例如,目标字词辞典搜索单元91搜索在图9中示出的辞典,以得到目标字词“牛”的相关字词“动物”和“肉”。
在步骤S126中的处理完成之后,处理前进到步骤S127。在步骤S127,像在图10的步骤S72中一样,其它字词辞典搜索单元92搜索存储在辞典存储单元93中的辞典,以得到由目标字词选择单元72选择的其它字词的相关字词。其后,其它字词辞典搜索单元92将所找到的其它字词的相关字词提供给匹配单元124。例如,其它字词辞典搜索单元92搜索在图9中的辞典,以得到其它字词“烤肉”的相关字词“食物”和“肉”。
在步骤S127中的处理完成之后,处理前进到步骤S128。在步骤S128,类型辞典搜索单元122搜索存储在辞典存储单元93中的辞典,以得到由语素分析单元111提取的类型字词的相关字词,并将所述类型字词的相关字词提供给匹配单元124。例如,类型辞典搜索单元122搜索得到类型字词“食品”的相关字词“食物”和“食谱”。
在步骤S128中的处理完成之后,处理前进到步骤S129。在步骤S129,匹配单元124执行在从目标字词辞典搜索单元91提供的目标字词的相关字词与从其它字词辞典搜索单元92提供的其它字词的相关字词和从类型辞典搜索单元122提供的类型字词的相关字词中的每一个之间的匹配操作。随后,根据该匹配结果,匹配单元124将被确定为与所述其它字词的相关字词或所述类型字词的相关字词相匹配的所述目标字词的相关字词提供给被选属性搜索单元95,作为被选相关字词。
例如,匹配单元124执行目标字词“牛”的相关字词“动物”和“肉”与其它字词“烤肉”的相关字词“食物”和“肉”和类型字词“食品”的相关字词“食物”和“食谱”中的每一个之间的匹配操作。随后,根据该匹配结果,匹配单元124将被确定为与其它字词“烤肉”的相关字词“肉”相匹配的目标字词“牛”的相关字词“肉”提供给被选属性搜索单元95,作为被选相关字词。
在步骤S129中的处理完成之后,处理前进到步骤S130。在步骤S130,像在图10的步骤S74中一样,被选属性搜索单元95搜索存储在属性字典存储单元75中的属性字典,以得到从匹配单元124提供的被选相关字词的属性,作为该被选相关字词的属性。随后,被选属性搜索单元95将所找到的所述被选相关字词的属性提供给匹配单元124。例如,被选属性搜索单元95搜索在图4中示出的属性字典,以得到被选相关字词“肉”的属性“食物”,并将所找到的属性“食物”提供给匹配单元124。
在步骤S130中的处理完成之后,处理前进到步骤S131。在步骤S131,匹配单元124执行相关字词匹配操作。随后,根据该相关字词匹配结果,匹配单元124将所述目标字词的各个属性和在所述属性、所述属性的相关字词和所述属性的相关字词的属性中的一个与所述被选相关字词的属性之间的匹配数目一起提供给分值计算单元77。
例如,匹配单元124执行目标字词“牛”的属性“动物”和“食物”,目标字词“牛”的属性“动物”和“食物”的相关字词“烤肉”、“动物(creature)”、“生物”和“食材”,以及目标字词“牛”的属性“食物”的相关字词“烤肉”的属性“食物”中的每一个与被选相关字词“肉”的属性“食物”之间的匹配操作。随后,根据该相关字词匹配结果,匹配单元124将目标字词“牛”的属性“食物”和匹配数目“2”一起提供给分值计算单元77,其原因在于目标字词“牛”的属性“食物”和目标字词“牛”的属性“食物”的相关字词“烤肉”的属性“食物”与被选相关字词“肉”的属性“食物”相匹配。
在步骤S131中的处理完成之后,处理前进到步骤S132。在步骤S132,像在步骤S121和S125中一样,分值计算单元77使用从匹配单元124提供的匹配数目和预定权重系数来计算从匹配单元124提供的目标字词的各个属性的分值。随后,分值计算单元77针对所述目标字词的各个属性来对所述分值、在图14的步骤S121中算出的分值以及在步骤S125中算出的分值求和。这个和被确定为所述属性的最终分值。该和与所述属性一起被提供给确定单元78。
在步骤S133到S135中执行的处理类似于在图6的步骤S31到步骤S33中执行的那些处理。因此,不再重复描述。
图16是在图14所示的属性确定处理中的搜索操作和匹配操作的示意图。
如图16所示,在图14所示的属性确定处理中的搜索操作和匹配操作包括内容信息搜索次操作201、类型搜索次操作202、直接匹配次操作203、属性匹配次操作204、预先相关字词匹配次操作205-1和相关字词匹配次操作205-2,其中,内容信息搜索次操作201搜索在内容信息中的多条信息,而类型搜索次操作202搜索在类型信息中的多条信息。
内容信息搜索次操作201包括搜索目标字词211的属性或者从目标字词211的属性派生的字词的目标字词属性搜索次操作212。目标字词属性搜索次操作212包括搜索目标字词211的属性的属性搜索次操作221、搜索目标字词211的属性的相关字词的辞典搜索次操作222、以及搜索目标字词211的属性的相关字词的属性的属性搜索次操作223。
另外,内容信息搜索次操作201还包括搜索其它字词213的属性的属性搜索次操作214、搜索目标字词211的相关字词的辞典搜索次操作215、搜索其它字词213的相关字词的辞典搜索次操作216、以及搜索从预先相关字词匹配次操作205-1输出的结果的属性的属性搜索次操作217。
类型搜索次操作202包括搜索类型字词251的属性的属性搜索次操作252和搜索类型字词251的相关字词的辞典搜索次操作253。
直接匹配次操作203执行在从目标字词属性搜索次操作212输出的结果与其它字词213和类型字词251中的每一个之间的匹配处理。属性匹配次操作204执行在从目标字词属性搜索次操作212输出的结果与从属性搜索次操作214输出的结果和从属性搜索次操作252输出的结果中的每一个之间的匹配操作。
预先相关字词匹配次操作205-1在相关字词匹配次操作205-2执行之前,执行匹配处理。预先相关字词匹配次操作205-1执行在从辞典搜索次操作215输出的结果与从目标字词属性搜索次操作212输出的结果和从属性搜索次操作217输出的结果中的每一个之间的匹配处理。
在以上的描述中,交替地执行了一次使用目标字词的、对属性字典的搜索和对辞典的搜索。可替换地,在交替地执行过一次使用目标字词的、对属性字典的搜索和对辞典的搜索之后,再次执行对属性字典的搜索。不过,可以交替地执行多次使用目标字词的、对属性字典的搜索和对辞典的搜索。可替换地,在交替地执行过多次使用目标字词的、对属性字典的搜索和对辞典的搜索之后,可以再次执行对属性字典的搜索。
此外,在以上的描述中,执行了一次使用其它字词或类型字词的、对属性字典的搜索和对辞典的搜索中的一种搜索。但是,像目标字词的情况一样,可以交替地执行预定次数的使用其它字词或类型字词的、对属性字典的搜索和对辞典的搜索。可替换地,在交替地执行过多次使用其它字词或类型字词的、对属性字典的搜索和对辞典的搜索之后,可以再次执行对属性字典的搜索。
虽然以上参考从节目相关信息中提取内容信息的处理来描述示例性实施例,但是也可以例如从节目的隐藏字幕(closed caption)中提取内容信息。
虽然以上参考搜索广播节目来描述了作为搜索内容的示例的示例性实施例,但是搜索的内容也可以是歌曲、视频或文本。例如,当即将搜索的内容是网站中的网页时,从内容的元数据(meta data)(例如,RSS(丰富站点摘要))中提取内容信息。
另外,本发明不仅可以被应用于基于关键字来搜索相关节目的电视接收机,还可以被应用于基于关键字来自动地记录图像的记录装置、基于关键字来搜索相关站点(site)的搜索装置以及基于关键字来判断内容类型的判断装置。
例如,当用户在所述记录装置正在显示广播节目的过程中根据本发明来执行对该记录装置的预定操作时,该记录装置基于关于所显示的广播节目的节目相关信息来执行属性确定处理,从而显示关键字。当用户察看所显示的关键字并选择希望的关键字时,记录装置将用户所选择的关键字和通过属性确定处理来确定的所述关键字的属性存储下来。其后,记录装置基于关于在上述操作被执行之后能够接收的节目的节目相关信息来执行属性确定处理。随后,记录装置提取与所存储的关键字和属性相对应的节目,并自动记录所提取的节目。结果,该记录装置能够自动记录具有与当前显示的节目的内容相类似的内容的节目。
此外,当用户根据本发明来对正在显示网站的所述搜索装置执行预定操作时,该搜索装置基于所显示的网站的RSS来执行属性确定处理,从而将关键字和该关键字的属性存储下来。其后,搜索装置基于其它站点的RSS来执行属性确定处理,并搜索与所存储的关键字和属性相对应的站点。因此,搜索装置显示关于所述站点的信息作为关于相关站点的信息。结果,该搜索装置能够搜索具有与所显示的站点相类似的内容的站点,并因此能够向用户提供所述信息,作为关于相关站点的信息。
此外,根据本发明的判断装置能够基于描述了内容的信息来执行属性确定处理,并从通过所述属性确定处理而确定的关键字的所有属性中提取最经常见到的属性。其后,判断装置将所提取的属性确定为所述内容的类型。结果,所述判断装置能够使用描述了内容的信息来判断该内容的类型。
在本说明书中,描述存储在记录介质中的程序的步骤不仅包括按上述顺序来执行的处理,还包括可以并行地或单独地执行的处理。
本领域技术人员应当了解,在所附权利要求或其等同物的范围内,可以根据设计要求和其它因素来进行各种修改、组合、子组合和变化。
相关申请的交叉引用
本申请包含涉及2006年9月21日在日本专利局提出的日本专利申请No.2006-255797的主题,该申请的全部内容通过引用结合于此。