一种面向智能机器人的人机交互方法及装置转让专利

申请号 : CN201610730823.9

文献号 : CN106326440B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 孔德乾

申请人 : 北京光年无限科技有限公司

摘要 :

一种面向智能机器人的人机交互方法及装置,其中,该方法包括:用户识别步骤,获取当前用户输入的多模态交互数据,对多模态交互数据进行解析,确定出当前用户的身份信息;兴趣分类确定步骤,根据当前用户的身份信息获取当前用户的历史交互数据,利用知识图谱结合历史交互数据确定出当前用户的兴趣分类信息;反馈信息生成步骤,根据当前用户的兴趣分类信息,生成反馈信息并输出。该方法提高了确定出的用户兴趣点的准确性,从而使得智能机器人所生成的反馈信息更加符合用户的行为习惯,提高了智能机器人的人性化水平,改善了机器人的用户体验。

权利要求 :

1.一种面向智能机器人的人机交互方法,其特征在于,包括:用户识别步骤,获取当前用户输入的多模态交互数据,对所述多模态交互数据进行解析,确定出所述当前用户的身份信息;

兴趣分类确定步骤,根据所述当前用户的身份信息获取所述当前用户的历史交互数据,利用知识图谱结合所述历史交互数据确定出所述当前用户的兴趣分类信息;

反馈信息生成步骤,根据所述当前用户的兴趣分类信息,生成反馈信息并输出;

其中,在所述兴趣分类确定步骤中:

对所述历史交互数据中的兴趣点词汇进行统计,并投影到知识图谱中;

对所述知识图谱中的各个兴趣点进行聚类分析,确定出所述当前用户的兴趣分类信息。

2.如权利要求1所述的方法,其特征在于,在所述反馈信息生成步骤中,根据当前用户的兴趣分类信息,确定知识图谱中与该兴趣分类信息相对应的类别,提取所述类别中的最新信息,根据所述最新信息,生成反馈信息并输出。

3.一种面向智能机器人的人机交互装置,其特征在于,包括:用户识别模块,其用于获取当前用户输入的多模态交互数据,对所述多模态交互数据进行解析,确定出所述当前用户的身份信息;

兴趣分类确定模块,其用于根据所述当前用户的身份信息获取所述当前用户的历史交互数据,利用知识图谱结合所述历史交互数据确定出所述当前用户的兴趣分类信息;

反馈信息生成模块,其用于根据所述当前用户的兴趣分类信息,生成反馈信息并输出;

其中,所述兴趣分类确定模块配置为首先对所述历史交互数据中的兴趣点词汇进行统计,并投影到知识图谱中,随后对所述知识图谱中的各个兴趣点进行聚类分析,确定出所述当前用户的兴趣分类信息。

4.如权利要求3所述的装置,其特征在于,所述反馈信息生成模块配置为根据当前用户的兴趣分类信息,确定知识图谱中与该兴趣分类信息相对应的类别,提取所述类别中的最新信息,根据所述最新信息,生成反馈信息并输出。

说明书 :

一种面向智能机器人的人机交互方法及装置

技术领域

[0001] 本发明涉及机器人技术领域,具体地说,涉及一种面向智能机器人的人机交互方法及装置。

背景技术

[0002] 随着科学技术的不断发展,信息技术、计算机技术以及人工智能技术的引入,机器人的研究已经逐步走出工业领域,逐渐扩展到了医疗、保健、家庭、娱乐以及服务行业等领域。而人们对于机器人的要求也从简单重复的机械动作提升为具有拟人问答、自主性及与其他机器人进行交互的智能机器人,人机交互也就成为决定智能机器人发展的重要因素。
[0003] 用户在与机器人进行交互的过程中,往往会暴露出用户的很多爱好或兴趣点。而如果能够有效提取并利用这些用户兴趣点信息的话,无疑将能够使得智能机器人有效引导并谈论用户感兴趣的话题,从而提高产品的用户粘度。
[0004] 现有的用户兴趣点的提取方法往往需要大量的文本语料来进行相关分析,并且最终得到的兴趣点信息往往比较宽泛,因此很难根据得到的兴趣点信息来与用户进行有效交互。

发明内容

[0005] 为解决上述问题,本发明提供了一种面向智能机器人的人机交互方法,其包括:
[0006] 用户识别步骤,获取当前用户输入的多模态交互数据,对所述多模态交互数据进行解析,确定出所述当前用户的身份信息;
[0007] 兴趣分类确定步骤,根据所述当前用户的身份信息获取所述当前用户的历史交互数据,利用知识图谱结合所述历史交互数据确定出所述当前用户的兴趣分类信息;
[0008] 反馈信息生成步骤,根据所述当前用户的兴趣分类信息,生成反馈信息并输出。
[0009] 根据本发明的一个实施例,在所述兴趣分类确定步骤中,将当前用户的历史交互数据中的兴趣点词汇投影到所述知识图谱中,根据知识图谱确定出所述当前用户的兴趣分类信息。
[0010] 根据本发明的一个实施例,在所述兴趣分类确定步骤中,
[0011] 对所述历史交互数据中的兴趣点词汇进行统计,并投影到知识图谱中;
[0012] 对所述知识图谱中的各个兴趣点进行聚类分析,确定出所述当前用户的兴趣分类信息。
[0013] 根据本发明的一个实施例,在所述反馈信息生成步骤中,根据当前用户的兴趣分类信息,确定知识图谱中与该兴趣分类信息相对应的类别,提取所述类别中的最新信息,根据所述最新信息,生成反馈信息并输出。
[0014] 本发明还提供了一种面向智能机器人的人机交互装置,其包括:
[0015] 用户识别模块,其用于获取当前用户输入的多模态交互数据,对所述多模态交互数据进行解析,确定出所述当前用户的身份信息;
[0016] 兴趣分类确定模块,其用于根据所述当前用户的身份信息获取所述当前用户的历史交互数据,利用知识图谱结合所述历史交互数据确定出所述当前用户的兴趣分类信息;
[0017] 反馈信息生成模块,其用于根据所述当前用户的兴趣分类信息,生成反馈信息并输出。
[0018] 根据本发明的一个实施例,所述兴趣分类确定模块配置为将当前用户的历史交互数据中的兴趣点词汇投影到所述知识图谱中,根据知识图谱确定出所述当前用户的兴趣分类信息。
[0019] 根据本发明的一个实施例,所述兴趣分类确定模块配置为首先对所述历史交互数据中的兴趣点词汇进行统计,并投影到知识图谱中,随后对所述知识图谱中的各个兴趣点进行聚类分析,确定出所述当前用户的兴趣分类信息。
[0020] 根据本发明的一个实施例,所述反馈信息生成模块配置为根据当前用户的兴趣分类信息,确定知识图谱中与该兴趣分类信息相对应的类别,提取所述类别中的最新信息,根据所述最新信息,生成反馈信息并输出。
[0021] 本发明所提供的面向智能机器人的人机交互方法不再需要像现有技术那样对大量的文本语料进行分析来确定用户的兴趣点,而是利用知识图谱来根据用户与智能机器人直接的少量聊天内容来获取用户的兴趣点,从而根据用户的兴趣点来生成用户感兴趣的反馈信息,进而吸引用户与智能机器人进行持续交互。该方法提高了确定出的用户兴趣点的准确性,从而使得智能机器人所生成的反馈信息更加符合用户的行为习惯,提高了智能机器人的人性化水平,改善了机器人的用户体验。
[0022] 本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

附图说明

[0023] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要的附图做简单的介绍:
[0024] 图1是根据本发明一个实施例的面向智能机器人的人机交互方法的实现流程图;
[0025] 图2是根据本发明另一个实施例的面向智能机器人的人机交互方法的实现流程图;
[0026] 图3是根据本发明一个实施例的面向智能机器人的人机交互装置的结构示意图。

具体实施方式

[0027] 以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本发明中的各个实施例以及各实施例中的各个特征可以相互结合,所形成的技术方案均在本发明的保护范围之内。
[0028] 同时,在以下说明中,出于解释的目的而阐述了许多具体细节,以提供对本发明实施例的彻底理解。然而,对本领域的技术人员来说显而易见的是,本发明可以不用这里的具体细节或者所描述的特定方式来实施。
[0029] 另外,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0030] 现有的人机交互方法多是采用LDA(Latent Dirichlet Allocation)模型来确定用户交互过程中的中心话题。LDA是一种文档主体生成模型,也称为一个三层贝叶斯概率模型,包含词、主体和文档三层结构。通常可以认为一篇文章的每个词都是通过“以一定概率选择了某个主题,并从这个主题以一定概率选择某个词语”这样一个过程得到的,这也就是所谓的生成模型。其中,文档到主题服从多项式分布,主题到词同样服从多项式分布。
[0031] 然而,传统的LDA模型虽然可以提取出中心话题,但是其实现过程需要依赖大量的文本分析,而且最终得到的也是一系列孤立的词,无法得到准确的中心话题。
[0032] 针对现有技术中所存在的上述问题,本发明提供了一种新的面向智能机器人的人机交互方法。该方法利用知识图谱来进行用户兴趣点的提取,并根据所提取出的兴趣点来生成相应的反馈信息来输出给用户。
[0033] 为了清楚地阐述本发明所提供的面向智能机器人的人机交互方法的实现原理、实现过程以及优点,以下分别结合不同的实施例来对本发明所提供的人机交互方法作进一步地说明。
[0034] 实施例一:
[0035] 图1示出了本实施例所提供的面向智能机器人的人机交互方法的实现流程图。
[0036] 如图1所示,本实施例所提供的人机交互方法首先在步骤S101中获取当前用户输入的多模态交互数据。需要指出的是,在本发明的不同实施例中,该方法在步骤S101中所获取到的多模态交互数据既可以是语音数据,也可以是文本数据,还可以是语音数据和文本数据的结合,抑或是其他合理交互数据(例如图像)与语音数据和文本数据的合理组合,本发明不限于此。
[0037] 在得到当前用户输入的多模态交互数据后,该方法在步骤S102中对该多模态数据进行解析,从而得到当前用户的身份信息。例如,如果用户输入的多模态交互信息中包含语音信息,那么该方法则可以在步骤S102中根据该语音信息提取出相应的声纹信息,并将该声纹信息与智能机器人自身或云端服务器存储的是声纹数据库进行匹配,由于声纹数据库中各个声纹信息是与特定的用户相对应的,因此也就可以确定出当前用户的身份信息。
[0038] 需要指出的是,在本发明的其他实施例中,根据多模态交互数据中所包含的数据类型的不同,还可以采用其他合理的方式来根据所获取到的多模态交互数据确定出当前用户的身份信息,本发明不限于此。
[0039] 如图1所示,本实施例中,在得到当前用户的身份信息后,该方法会在步骤S103中根据当前用户的身份信息获取当前用户的历史交互数据。具体地,本实施例中,智能机器人自身和/或云端服务器中存储有一定时间段内多个用户的交互数据(即历史交互数据),该方法在步骤S103中可以根据当前用户的身份信息来对智能机器人自身和/或云端服务器中所存储的交互数据进行检索,从而得到当前用户的历史交互数据。
[0040] 需要指出的是,在本发明的不同实施例中,该方法所获取到的当前用户的历史交互数据的数据量(即时间段的长度)可以根据实际需要配置为不同的合理值,因此在此并不对该部分内容进行限定。
[0041] 在得到当前用户的历史交互数据后,该方法在步骤S104中利用知识图谱结合历史交互数据来确定出当前用户的兴趣分类信息。由于知识图谱内部已经存在建立好的实体与实体之间的关系,其包含有大量的预定义信息,因此利用知识图谱可以更加准确地从用户与机器人的少量聊天内容(例如历史交互数据)提取出用户的关注点,即确定出用户的兴趣分类信息,从而更好地进行相关信息的推荐。
[0042] 在得到当前用户的分类信息后,该方法也就可以在步骤S105中根据该分类信息来生成相应的反馈信息并输出。由于知识图谱所得到的当前用户的兴趣分类信息能够更加准确地反映出当前用户的兴趣点,因此根据该兴趣点所生成的反馈信息显然能够更加符合当前用户的交互预期,从而引起用户与智能机器人进行持续的交互。
[0043] 需要指出的是,在本发明的不同实施例中,该方法在步骤S105中所生成并的反馈信息可以是不同形式的多模态交互信息,本发明不限于此。例如,在本发明的一个实施例中,该方法在步骤S105中所生成并输出的反馈信息既可以是语音信息,也可以是字符信息,还可以是图像信息等其他合理信息,抑或是以上各类信息的合理组合。
[0044] 从上述描述中可以看出,本实施例所提供的面向智能机器人的人机交互方法不再需要像现有技术那样对大量的文本语料进行分析来确定用户的兴趣点,而是利用知识图谱来根据用户与智能机器人直接的少量聊天内容来获取用户的兴趣点,从而根据用户的兴趣点来生成用户感兴趣的反馈信息,进而吸引用户与智能机器人进行持续交互。该方法提高了确定出的用户兴趣点的准确性,从而使得智能机器人所生成的反馈信息更加符合用户的行为习惯,提高了智能机器人的人性化水平,改善了机器人的用户体验。
[0045] 实施例二:
[0046] 图2示出了本实施例所提供的面向智能机器人的人机交互方法的实现流程图。
[0047] 如图2所示,本实施例中,该人机交互方法首先在步骤S201中获取当前用户输入的多模态交互数据,并在步骤S202中对该多模态交互数据进行解析,从而确定出当前用户的身份信息。在确定出当前用户的身份信息后,该方法在步骤S203中根据当前用户的身份信息来获取当前用户的历史交互数据。
[0048] 需要指出的是,本实施例中步骤S201至步骤S203的具体实现原理以及实现过程与上述实施例一中步骤S101至步骤S103所涉及的内容类似,故在此不再对步骤S201至步骤S203的内容进行赘述。
[0049] 在得到当前用户的历史交互数据后,该方法会将当前用户的历史交互数据中的兴趣点词汇投影到知识图谱中,并根据该知识谱图来确定出当前用户的兴趣分类信息。
[0050] 具体地,如图2所示,本方法会在步骤S204中对该历史交互数据中的兴趣点词汇进行统计,并将统计结果投影到知识图谱中。例如,当前用户的历史交互数据中“篮球”出现了两次,那么知识图谱中“篮球”这个节点就可以得到两分;当前用户的历史交互数据中五次聊到了与吃相关的内容,那么知识图谱中“美食”这个节点就可以得到五分。由于知识图谱中各节点所对应的内容是历史交互数据中所提及的,因此这些节点必然包含当前用户的兴趣信息,而知识图谱中各节点的得分也就表征了该节点的重要程度。通过这种方式,也就将当前用户的历史交互数据中的兴趣点词汇的统计结果投影到了知识图谱中。
[0051] 该方法随后在步骤S205中对知识图谱中各个兴趣点进行聚类分析,从而确定出当前用户的兴趣分类信息。对于知识谱图来说,其各个节点之间不再是孤立的,根据各节点之间的距离来进行聚类操作,从而可以得到用户最感兴趣的话题,这样也就得到了当前用户的兴趣分类信息。
[0052] 在得到当前用户的兴趣分类信息后,该方法在步骤S206中根据当前用户的分类信息,确定出知识图谱中与该兴趣分类信息相对应的类别。在得到该类别后,该方法会在步骤S207中提取出该类别的相关信息(例如最新信息),并根据该相关信息来生成反馈信息并输出给当前用户。
[0053] 例如,如果当前用户的历史交互数据中多次提及到“姚明”,而姚明是一名篮球运动员,因此该方法在步骤S206中可确定出知识图谱中与当前用户分类信息相对应的类别可以是“篮球”,因此该方法也就可以在步骤S207中根据该新闻信息来生成相应的反馈信息(例如美国篮球队又夺得奥运冠军啦)并输出给当前用户,而这显然会吸引当前用户与智能机器人进行聊天交互。
[0054] 本发明还提供了一种面向智能机器人的人机交互装置,图3示出了本实施例中该装置的结构示意图。
[0055] 如图3所示,本实施例所提供给的人机交互装置优选地包括:用户识别模块301、兴趣分类确定模块302以及反馈信息生成模块303。其中,用户识别模块301用于获取当前用户输入的多模态交互数据。需要指出的是,在本发明的不同实施例中,用户识别模块301所获取到的多模态交互数据既可以是语音数据,也可以是文本数据,还可以是语音数据和文本数据的结合,抑或是其他合理交互数据(例如图像)与语音数据和文本数据的合理组合,本发明不限于此。
[0056] 在得到当前用户输入的多模态交互数据后,用户识别模块301会对该多模态交互数据进行解析来得到当前用户的身份信息。具体地,本实施例中,优选地,如果所获取到的多模态交互信息中包含语音信息,用户识别模块301则可以通过提取语音信息中的声纹信息并根据该声纹信息来确定当前用户的身份信息;如果所获取到的多模态交互信息中包含图像信息,用户识别模块301则可以通过人脸识别和/或手势识别的方式来确定当前用户的身份信息。
[0057] 需要指出的是,在本发明的其他实施例中,根据多模态交互数据中所包含的数据类型的不同,用户识别模块301还可以采用其他合理的方式来根据所获取到的多模态交互数据确定出当前用户的身份信息,本发明不限于此。
[0058] 在得到当前用户的身份信息后,用户识别模块301会将当前用户的身份信息传输给兴趣分类确定模块302。兴趣分类确定模块302在接收到该身份信息后,会根据当前用户的身份信息获取当前用户的历史交互数据。
[0059] 具体地,本实施例中,智能机器人自身和/或云端服务器中存储有一定时间段内多个用户的交互数据(即历史交互数据),兴趣分类确定模块302可以根据当前用户的身份信息来对智能机器人自身和/或云端服务器中所存储的交互数据进行检索,从而得到当前用户的历史交互数据。
[0060] 在得到当前用户的历史交互数据后,兴趣分类确定模块302会利用知识图谱结合历史交互数据来确定出当前用户的兴趣分类信息。由于知识图谱内部已经存在建立好的实体与实体之间的关系,其包含有大量的预定义信息,因此利用知识图谱可以更加准确地从用户与机器人的少量聊天内容(例如历史交互数据)提取出用户的关注点,即确定出用户的兴趣分类信息,从而更好地进行相关信息的推荐。
[0061] 需要指出的是,本实施例中,兴趣分类确定模块302根据当前用户的历史交互数据确定当前用户的兴趣分类信息的具体原理以及过程还可以采用如实施例二中步骤S204和步骤S205所示的方式,本发明不限于此。
[0062] 在得到当前用户的分类信息后,兴趣分类确定模块302会将该分类信息传输给反馈信息生成模块303,以由反馈信息生成模块303根据该分类信息来生成相应的反馈信息并输出。由于知识图谱所得到的当前用户的兴趣分类信息能够更加准确地反映出当前用户的兴趣点,因此根据该兴趣点所生成的反馈信息显然能够更加符合当前用户的交互预期,从而引起用户与智能机器人进行持续的交互。
[0063] 需要指出的是,本实施例中,反馈信息生成模块303根据当前用户的兴趣分类信息生成反馈信息的原理以及过程优选地与实施例二中步骤S206和步骤S207所涉及的内容类似,不在此不再对反馈信息生成模块303进行赘述。
[0064] 应该理解的是,本发明所公开的实施例不限于这里所公开的特定结构或处理步骤,而应当延伸到相关领域的普通技术人员所理解的这些特征的等同替代。还应当理解的是,在此使用的术语仅用于描述特定实施例的目的,而并不意味着限制。
[0065] 说明书中提到的“一个实施例”或“实施例”意指结合实施例描述的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,说明书通篇各个地方出现的短语“一个实施例”或“实施例”并不一定均指同一个实施例。
[0066] 虽然上述示例用于说明本发明在一个或多个应用中的原理,但对于本领域的技术人员来说,在不背离本发明的原理和思想的情况下,明显可以在形式上、用法及实施的细节上作各种修改而不用付出创造性劳动。因此,本发明由所附的权利要求书来限定。