基于人工智能的人机智能聊天的方法和装置转让专利

申请号 : CN201510359363.9

文献号 : CN105094315B

文献日 : 2018-03-06

本发明提出一种基于人工智能的人机智能聊天的方法和装置，该基于人工智能的人机智能聊天的方法包括：接收多模态的输入信号，所述多模态的输入信号包括语音信号、图像信号、传感器信号和/或事件驱动信号；对所述多模态的输入信号进行处理，获得文本数据，并根据所述文本数据获得用户的意图；获得所述用户的意图对应的答案，将所述答案转化为多模态的输出信号；输出所述多模态的输出信号。本发明在人机对话中，可以对用户需求进行精确匹配，给出更精确更个性化的回复，可以更自然地进行人机智能聊天，满足用户的聊天需求，提高用户体验。

1.一种基于人工智能的人机智能聊天的方法，其特征在于，包括：接收多模态的输入信号，所述多模态的输入信号包括语音信号、图像信号、传感器信号和/或事件驱动信号；

对所述多模态的输入信号进行处理，获得文本数据，并根据所述文本数据获得用户的意图；

获得所述用户的意图对应的答案，将所述答案转化为多模态的输出信号；

输出所述多模态的输出信号；

其中，所述获得所述用户的意图对应的答案包括：

根据所述用户的意图在记忆系统中进行查找，获得所述用户的意图的约束条件；以及根据所述用户的意图在话题模型和领域实体数据库中进行查找，获得所述用户的意图关联的变量和属性；以及通过主动学习模块获得当前的聊天语境与存储的聊天模式的相似度；

以及访问开放服务接口，获得从所述开放服务接口返回的结果；

根据所述用户的意图，结合所述用户的意图的约束条件、所述用户的意图关联的变量和属性、从所述开放服务接口返回的结果以及与存储的聊天模式的相似度获得所述用户的意图对应的答案。

2.根据权利要求1所述的方法，其特征在于，所述根据所述文本数据获得用户的意图包括：对所述文本数据进行解析，根据解析获得的结果生成用户的意图。

3.根据权利要求2所述的方法，其特征在于，所述对所述文本数据进行解析包括：对所述文本数据进行句法结构分析，对进行句法结构分析后的文本数据进行基于词语的语义分析、基于话题模型的领域多分类识别、语义消歧和基于语法结构和上下文信息的自动补全。

4.根据权利要求1-3任意一项所述的方法，其特征在于，所述根据所述文本数据获得用户的意图之后，还包括：将获得的用户的意图保存在历史用户意图中。

5.根据权利要求1所述的方法，其特征在于，还包括：

将所述用户的意图、所述用户的意图的约束条件，所述用户的意图关联的变量和属性保存在对话模型中；

根据所述对话模型中保存的用户的意图、用户的意图的约束条件、用户的意图关联的变量和属性的统计结果建立不同用户的意图的转移概率图谱，并在适当的时机，根据所述转移概率图谱生成新的话题。

6.根据权利要求1所述的方法，其特征在于，所述对所述多模态的输入信号进行处理，获得文本数据之后，还包括：将所述文本数据中包括的适合记忆的内容保存在记忆系统中。

7.根据权利要求6所述的方法，其特征在于，所述记忆系统包括短期记忆系统和长期记忆系统；

所述将所述文本数据中包括的适合记忆的内容保存在记忆系统中包括：将所述文本数据包括的适合记忆的内容中属于短期记忆的内容保存在短期记忆系统中，将所述文本数据包括的适合记忆的内容中属于长期记忆的内容保存在长期记忆系统中；

所述短期记忆的内容包括：所述用户的历史对话记录、基于所述历史对话记录建立的用户聊天的话题状态序列和基于所述历史对话记录提取的实体相关属性；

所述长期记忆的内容包括：所述用户的个人信息和人口属性、所述用户的偏好、所述用户的地理历史记录、所述用户的消费历史记录、系统的个人信息和人口属性和系统的偏好。

8.根据权利要求1所述的方法，其特征在于，所述对所述多模态的输入信号进行处理，获得文本数据之后，还包括：将所述文本数据中提炼的话题记录在话题模型中，以及将所述文本数据中提炼的实体属性记录在领域实体数据库中。

9.根据权利要求1所述的方法，其特征在于，所述通过主动学习模块获得当前的聊天语境与存储的聊天模式的相似度包括：通过对话模型、话题模型和领域实体数据库对人类的聊天模式进行数值化；

将数值化的聊天模式存储在主动学习模块中；

检测获得当前的聊天语境与存储的聊天模式的相似度。

10.一种基于人工智能的人机智能聊天的装置，其特征在于，包括：接收模块，用于接收多模态的输入信号，所述多模态的输入信号包括语音信号、图像信号、传感器信号和/或事件驱动信号；

处理模块，用于对所述接收模块接收的多模态的输入信号进行处理，获得文本数据；

获得模块，用于根据所述处理模块获得的文本数据获得用户的意图，并获得所述用户的意图对应的答案；

输出模块，用于将所述获得模块获得的答案转化为多模态的输出信号，并输出所述多模态的输出信号；

其中，所述获得模块用于获得所述用户的意图对应的答案包括：所述获得模块，具体用于根据所述用户的意图在记忆系统中进行查找，获得所述用户的意图的约束条件；以及根据所述用户的意图在话题模型和领域实体数据库中进行查找，获得所述用户的意图关联的变量和属性；以及通过主动学习模块获得当前的聊天语境与存储的聊天模式的相似度；以及访问开放服务接口，获得从所述开放服务接口返回的结果；根据所述用户的意图，结合所述用户的意图的约束条件、所述用户的意图关联的变量和属性、从所述开放服务接口返回的结果以及与存储的聊天模式的相似度获得所述用户的意图对应的答案。

11.根据权利要求10所述的装置，其特征在于，所述获得模块用于根据所述文本数据获得用户的意图包括：所述获得模块，具体用于对所述文本数据进行解析，根据解析获得的结果生成用户的意图。

12.根据权利要求11所述的装置，其特征在于，

所述获得模块，具体用于对所述文本数据进行句法结构分析，对进行句法结构分析后的文本数据进行基于词语的语义分析、基于话题模型的领域多分类识别、语义消歧和基于语法结构和上下文信息的自动补全。

13.根据权利要求10-12任意一项所述的装置，其特征在于，还包括：保存模块，用于在所述获得模块获得用户的意图之后，将获得的用户的意图保存在历史用户意图中。

14.根据权利要求10所述的装置，其特征在于，还包括：保存模块和生成模块；

所述保存模块，用于将所述用户的意图、所述用户的意图的约束条件，所述用户的意图关联的变量和属性保存在对话模型中；

所述生成模块，用于根据所述对话模型中保存的用户的意图、用户的意图的约束条件、用户的意图关联的变量和属性的统计结果建立不同用户的意图的转移概率图谱，并在适当的时机，根据所述转移概率图谱生成新的话题。

15.根据权利要求10所述的装置，其特征在于，还包括：保存模块；

所述保存模块，用于在所述处理模块获得文本数据之后，将所述文本数据中包括的适合记忆的内容保存在记忆系统中。

16.根据权利要求15所述的装置，其特征在于，所述记忆系统包括短期记忆系统和长期记忆系统；

所述保存模块，具体用于将所述文本数据包括的适合记忆的内容中属于短期记忆的内容保存在短期记忆系统中，将所述文本数据包括的适合记忆的内容中属于长期记忆的内容保存在长期记忆系统中；

17.根据权利要求10所述的装置，其特征在于，还包括：保存模块；

所述保存模块，用于在所述处理模块获得文本数据之后，将所述文本数据中提炼的话题记录在话题模型中，以及将所述文本数据中提炼的实体属性记录在领域实体数据库中。

18.根据权利要求10所述的装置，其特征在于，所述获得模块用于通过主动学习模块获得当前的聊天语境与存储的聊天模式的相似度包括：所述获得模块，具体用于通过对话模型、话题模型和领域实体数据库对人类的聊天模式进行数值化；将数值化的聊天模式存储在主动学习模块中；检测获得当前的聊天语境与存储的聊天模式的相似度。

基于人工智能的人机智能聊天的方法和装置

技术领域

[0001] 本发明涉及互联网技术领域，尤其涉及一种基于人工智能的人机智能聊天的方法和装置。

背景技术

[0002] 随着人类社会信息化的不断演进以及人工服务成本的不断上升，人们越来越希望通过自然语言与计算机进行交流，人机智能聊天系统成为这样的历史背景下诞生的产物。借助人机智能聊天系统，人类可以使用自然语言与机器进行对话，并通过对话来指挥或者咨询计算机，完成特定的操作，比如通过与智能手机进行人机聊天，指挥智能硬件完成短信读取和回复、查询天气和航班、设置闹钟和行程安排；或者通过与检索系统进行自然语言的对话，完成深度和个性化的信息检索，产品推荐。

[0003] 但是现有技术提供的人机智能聊天系统无法满足用户的聊天需求，无法自然地进行人机智能聊天。

发明内容

[0004] 本发明的目的旨在至少在一定程度上解决相关技术中的技术问题之一。

[0005] 为此，本发明的第一个目的在于提出一种基于人工智能的人机智能聊天的方法。该方法在人机对话中，可以对用户需求进行精确匹配，给出更精确更个性化的回复，可以更自然地进行人机智能聊天，满足用户的聊天需求。

[0006] 本发明的第二个目的在于提出一种基于人工智能的人机智能聊天的装置。

[0007] 为了实现上述目的，本发明第一方面实施例的基于人工智能的人机智能聊天的方法，包括：接收多模态的输入信号，所述多模态的输入信号包括语音信号、图像信号、传感器信号和/或事件驱动信号；对所述多模态的输入信号进行处理，获得文本数据，并根据所述文本数据获得用户的意图；获得所述用户的意图对应的答案，将所述答案转化为多模态的输出信号；输出所述多模态的输出信号。

[0008] 本发明实施例的基于人工智能的人机智能聊天的方法，接收多模态的输入信号之后，对上述多模态的输入信号进行处理，获得文本数据，并根据上述文本数据获得用户的意图，进而获得上述用户的意图对应的答案，然后将上述答案转化为多模态的输出信号，并输出上述多模态的输出信号，从而在人机对话中，可以对用户需求进行精确匹配，给出更精确更个性化的回复，可以更自然地进行人机智能聊天，满足用户的聊天需求，提高用户体验。

[0009] 为了实现上述目的，本发明第二方面实施例的基于人工智能的人机智能聊天的装置，包括：接收模块，用于接收多模态的输入信号，所述多模态的输入信号包括语音信号、图像信号、传感器信号和/或事件驱动信号；处理模块，用于对所述接收模块接收的多模态的输入信号进行处理，获得文本数据；获得模块，用于根据所述处理模块获得的文本数据获得用户的意图，并获得所述用户的意图对应的答案；输出模块，用于将所述获得模块获得的答案转化为多模态的输出信号，并输出所述多模态的输出信号。

[0010] 本发明实施例的基于人工智能的人机智能聊天的装置，接收模块接收多模态的输入信号之后，处理模块对上述多模态的输入信号进行处理，获得文本数据，获得模块根据上述文本数据获得用户的意图，进而获得上述用户的意图对应的答案，然后输出模块将上述答案转化为多模态的输出信号，并输出上述多模态的输出信号，从而在人机对话中，可以对用户需求进行精确匹配，给出更精确更个性化的回复，可以更自然地进行人机智能聊天，满足用户的聊天需求，提高用户体验。

[0011] 本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

[0012] 本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

[0013] 图1为本发明基于人工智能的人机智能聊天的方法一个实施例的流程图；

[0014] 图2为本发明基于人工智能的人机智能聊天的方法中系统架构一个实施例的示意图；

[0015] 图3为本发明基于人工智能的人机智能聊天的方法中用户意图的拓扑结构一个实施例的示意图；

[0016] 图4为本发明基于人工智能的人机智能聊天的装置一个实施例的结构示意图；

[0017] 图5为本发明基于人工智能的人机智能聊天的装置另一个实施例的结构示意图。

具体实施方式

[0018] 下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。相反，本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。

[0019] 本发明提供一种基于人工智能的人机智能聊天的方法，该方法可以被部署在不同的平台(包括且不限于互联网、手机、智能硬件设备或企业专用客服平台等)上，能够以自然语言的方式，通过人类正常交互使用的多模态的信号(包括且不限于语音或图像等)与人类进行聊天交互。

[0020] 图1为本发明基于人工智能的人机智能聊天的方法一个实施例的流程图，如图1所示，该基于人工智能的人机智能聊天的方法可以包括：

[0021] 步骤101，接收多模态的输入信号，上述多模态的输入信号包括语音信号、图像信号、传感器信号和/或事件驱动信号。

[0022] 步骤102，对上述多模态的输入信号进行处理，获得文本数据，并根据上述文本数据获得用户的意图。

[0023] 具体地，根据上述文本数据获得用户的意图可以为：对上述文本数据进行解析，根据解析获得的结果生成用户的意图。

[0024] 其中，对上述文本数据进行解析可以为：对上述文本数据进行句法结构分析，对进行句法结构分析后的文本数据进行基于词语的语义分析、基于话题模型的领域多分类识别、语义消歧和基于语法结构和上下文信息的自动补全。

[0025] 进一步地，根据上述文本数据获得用户的意图之后，还可以将获得的用户的意图保存在历史用户意图中。

[0026] 步骤103，获得上述用户的意图对应的答案，将上述答案转化为多模态的输出信号。

[0027] 步骤104，输出上述多模态的输出信号。

[0028] 具体地，步骤103中，获得上述用户的意图对应的答案可以为：根据上述用户的意图在记忆系统中进行查找，获得上述用户的意图的约束条件；以及根据上述用户的意图在话题模型和领域实体数据库中进行查找，获得上述用户的意图关联的变量和属性；以及通过主动学习模块获得当前的聊天语境与存储的聊天模式的相似度；以及访问开放服务接口，获得从上述开放服务接口返回的结果；根据上述用户的意图，结合上述用户的意图的约束条件、上述用户的意图关联的变量和属性、从上述开放服务接口返回的结果以及与存储的聊天模式的相似度获得上述用户的意图对应的答案。

[0029] 进一步地，还可以将上述用户的意图、上述用户的意图的约束条件，上述用户的意图关联的变量和属性保存在对话模型中；根据上述对话模型中保存的用户的意图、用户的意图的约束条件、用户的意图关联的变量和属性的统计结果建立不同用户的意图的转移概率图谱，并在适当的时机，根据上述转移概率图谱生成新的话题。

[0030] 进一步地，对上述多模态的输入信号进行处理，获得文本数据之后，还可以将上述文本数据中包括的适合记忆的内容保存在记忆系统中。其中，上述记忆系统包括短期记忆系统和长期记忆系统；则将上述文本数据中包括的适合记忆的内容保存在记忆系统中可以为：将上述文本数据包括的适合记忆的内容中属于短期记忆的内容保存在短期记忆系统中，将上述文本数据包括的适合记忆的内容中属于长期记忆的内容保存在长期记忆系统中；

[0031] 上述短期记忆的内容包括：用户的历史对话记录、基于上述历史对话记录建立的用户聊天的话题状态序列和基于上述历史对话记录提取的实体相关属性；

[0032] 上述长期记忆的内容包括：用户的个人信息和人口属性、用户的偏好、上述用户的地理历史记录、上述用户的消费历史记录、系统的个人信息和人口属性和系统的偏好。

[0033] 进一步地，对上述多模态的输入信号进行处理，获得文本数据之后，还可以将上述文本数据中提炼的话题记录在话题模型中，以及将上述文本数据中提炼的实体属性记录在领域实体数据库中。

[0034] 具体地，通过主动学习模块获得当前的聊天语境与存储的聊天模式的相似度可以为：通过对话模型、话题模型和领域实体数据库对人类的聊天模式进行数值化；将数值化的聊天模式存储在主动学习模块中；检测获得当前的聊天语境与存储的聊天模式的相似度。

[0035] 上述基于人工智能的人机智能聊天的方法中，接收多模态的输入信号之后，对上述多模态的输入信号进行处理，获得文本数据，并根据上述文本数据获得用户的意图，进而获得上述用户的意图对应的答案，然后将上述答案转化为多模态的输出信号，并输出上述多模态的输出信号，从而在人机对话中，可以对用户需求进行精确匹配，给出更精确更个性化的回复，可以更自然地进行人机智能聊天，满足用户的聊天需求，提高用户体验。

[0036] 本发明图1所示实施例提供的基于人工智能的人机智能聊天的方法可以通过图2所示的系统架构实现，图2为本发明基于人工智能的人机智能聊天的方法中系统架构一个实施例的示意图，该系统构架可以用来集成不同的数据、组件和模块，并可以定义输入和输出可以接受的信号模式，以及输入输出系统与内部组件和不同内部组件之间用以交换数据的数据结构，不同组件之间交换数据的先后顺序和关系，并且为各种组件提供用于存储数据的通用数据存储设备。

[0037] 如图2所示，在一个具体的实现中，上述系统架构可以集成了以下模块和数据，包括但不限于：输入输出系统、对话模型、对话控制系统、领域实体数据库、话题模型、短期记忆系统、长期记忆系统、主动学习模块和开放服务接口。

[0038] 下面分别对上述模块和数据进行介绍。

[0039] 1、输入输出系统

[0040] 1)输入信号

[0041] 本发明实施例中，输入信号可以为自然界的多模态的输入信号，上述多模态的输入信号可以包括语音信号、图像信号、传感器信号和/或事件驱动信号；其中，传感器信号可以包括：人类相关参数捕捉传感器(人体温度和/或心跳脉搏等)输入的信号，和/或外接环境参数捕捉传感器(地理信息、温度、湿度、光照条件和/或天气状况等)输入的信号；事件驱动信号可以包括事件提醒和/或闹钟等可以主动触发的事件的驱动信号。

[0042] 2)输入信号处理

[0043] 本发明实施例中，接收到上述多模态的输入信号之后，先对上述多模态的输入信号进行处理，获得文本数据，然后根据上述文本数据获得用户的意图。具体地，根据上述文本数据获得用户的意图可以为：对上述文本数据进行解析，根据解析获得的结果生成用户的意图。

[0044] 其中，对上述文本数据进行解析可以为：对上述文本数据进行句法结构分析，对进行句法结构分析后的文本数据进行基于词语的语义分析、基于话题模型的领域多分类识别、语义消歧和基于语法结构和上下文信息的自动补全。下面分别进行举例说明。

[0045] a、句法结构分析

[0046] 例如：对于“帮我查找巴厘岛的航班”这条文本数据，解析之后的句法结构如下：

[0047]

[0048] b、对进行句法结构分析后的文本数据进行基于词语的语义分析

[0049] 例如，对于“帮我查找巴厘岛的航班”这条文本数据，在进行句法结构分析之后，可以提取“巴厘岛”这个实体，以及“航班”这个实体属性。

[0050] c、基于话题模型的领域多分类识别

[0051] 例如，对于“帮我查找巴厘岛的航班”这条文本数据，在进行句法结构分析之后，可以提取“旅游”，“东南亚”这样的话题。

[0052] d、语义消歧

[0053] 例如，对于“我想买一台苹果”这条文本数据，在进行句法结构分析之后，可以对“苹果”进行语义消歧，这里的“苹果”其实指代“苹果设备”。

[0054] e、基于语法结构和上下文信息的自动补全

[0055] 例如，当用户上文的检索词为“今天北京天气怎么样”，当前的检索词为“下雨吗？”时，可以根据上文的信息和短期记忆系统内的信息，判定“下雨吗？”这个需求所指代的地点，也是“北京”，因此，可以对当前的检索词进行补全“北京今天下雨吗？”[0056] 综上所述，用户意图识别是指针对获得的文本数据，进行基于需求类型的分类，生成一种或者多种的意图表示。本发明实施例中，用户意图为一个多层次的拓扑结构，可以如图3所示，图3为本发明基于人工智能的人机智能聊天的方法中用户意图的拓扑结构一个实施例的示意图。

[0057] 3)输出信号

[0058] 本发明实施例中，输出信号也可以为自然界的多模态的输出信号，可以包括语音信号和/或图像信号等。

[0059] 输出系统将获得的上述用户的意图对应的答案，通过专用的硬件设备转化为以上的多模态的输出信号，然后输出该多模态的输出信号。

[0060] 2、对话模型和对话控制系统

[0061] 对话模型类似于人类大脑的工作记忆区，用于刻画当前用户的意图，以及与该意图有关的变量和约束条件。

[0062] 本发明实施例中，对话模型可以与若干系统进行数据交互，具体说明如下：

[0063] 1)通过输入系统，获取当前用户的意图。

[0064] 2)通过记忆系统(包括短期记忆系统和长期记忆系统)，获取用户的意图的约束条件。例如，当用户输入“今天天气怎么样”时，通过记忆系统，可以获取用户经常活动的区域为“北京市海淀区”，那么可以对一个宽泛的检索词进行约束和补全，将该检索词改写成“今天北京市海淀区的天气怎么样”。

[0065] 3)通过话题模型和领域实体数据库，获取用户意图相关的变量和属性。例如，当用户输入“不喜欢现在的Coach包怎么办”时，通过话题模型可以分析出当前的话题为“购物”，“包”，通过领域实体数据库，可以获取“Coach”为“包”的一个品牌，基于以上的用户意图分析和理解，可以获取智能化的产品推荐，比如“那你可以换个牌子试一试，Prada怎么样？”[0066] 本发明实施例中，对话模型可以基于海量数据的统计结果，建立不同用户的意图的转移概率图谱，并且可以在适当的时机，根据上述转移概率图谱自发主动的生成新的话题。其中，上述适当的时机可以包括：当前的话题已经结束、用户的意图已经满足、无法识别用户的意图和/或对于用户的意图有困惑等时机。

[0067] 3、短期记忆系统

[0068] 短期记忆系统类似于人类大脑的短时记忆区，用于存储人机短期的交互历史，存储的交互历史可以包括：

[0069] 1)用户与系统的若干轮的历史对话记录；

[0070] 2)基于上述历史对话记录建立的用户聊天的话题状态序列；

[0071] 例如，假设用户在过去几轮的历史对话记录中，输入的语音分别为：

[0072] “最近天气怎么样？”

[0073] “我想旅游了”

[0074] “巴厘岛旅游”

[0075] “帮我查一下巴厘岛的酒店”

[0076] “航班也查一下”

[0077] 基于上述历史对话记录，可以建立用户聊天的话题状态序列为：“天气”->“旅游”->“巴厘岛”->“酒店”->“航班”。

[0078] 3)基于上述历史对话记录提取的实体相关属性；

[0079] 例如，在上面的用户历史聊天记录中，针对实体“巴厘岛”，可以抽取相关的属性“酒店”和“航班”，并且给予实体属性数据库，可以给出其他属性的推荐“热门景点”，“门票”。

[0080] 短期记忆系统可能随着时间的推移，过去记忆的历史会被系统自动清除掉，并用新的记忆来替代，记忆清除的方式可以采用一直和时间相关的指数衰减函数来完成。

[0081] 4、长期记忆系统

[0082] 长期记忆系统类似于人类大脑的持久记忆区，存储的数据可以包括：

[0083] 1)用户的个人信息和人口属性，例如：姓名、性别和/或居住地等；

[0084] 2)用户的偏好，例如：话题模型可以刻画的兴趣和话题，领域实体数据库可以刻画的实体以及相关的属性；

[0085] 3)用户的地理历史，从全球定位系统(Global Position System；以下简称：GPS)等多模态的输入信号中获取的用户过去到过哪些地方；

[0086] 4)用户的消费历史，用户过去关注和消费的商品列表；

[0087] 5)系统的个人信息和人口属性，在过去用户和系统进行交互时，系统返回的关于系统的个人信息，比如姓名、性别和/或居住地等；

[0088] 6)系统的偏好，在过去用户和系统进行交互时，系统返回的关于系统的兴趣偏好，实体以及相关的属性；

[0089] 5、记忆系统的作用和相关转化

[0090] 本发明实施例中，记忆系统的作用包括：对当前意图进行解析和识别时，可以根据记忆系统的约束条件，来消除歧义，进一步明确用户的意图。根据长期记忆系统保存的用户和系统的个人信息和兴趣，返回给用户个性化的回复，增加交互的亲和感和智能度。

[0091] 长短期记忆系统的相关转化：短期记忆系统中，包含用户和系统的个人信息，兴趣话题，以及偏好的实体和属性，可以转化为长时记忆进入长期记忆系统进行存储；另外，用户和系统进行聊天交互时，可以根据当前的用户的需求，话题模型识别的当前兴趣话题，以及用户当前输入的检索词(query)中的实体，抽取长期记忆系统中的相关记忆，存储在短期记忆系统中，帮助理解当前用户的意图，并对系统的回复进行限制。

[0092] 6、话题模型和领域实体数据库

[0093] 话题模型用来表述一个话题对应的实体、概念、关系和/或属性。

[0094] 话题模型对于每一个特定的话题，可以提供一个具体的词表，分别对应该话题相关的实体、概念、关系和/或属性。

[0095] 话题模型可以对用户的文本进行分类，将用户的文本映射到一个话题，或者多个话题的概率分布。

[0096] 领域实体数据库用来存储实体对应的关系和属性，并且提供实体相关的数据库服务。

[0097] 其中，实体是指自然界具有独立明确意义的个体，包括但不限于：

[0098] 1)组织机构、商业个体；

[0099] 2)电影、电视、视频或歌曲等娱乐产品；

[0100] 3)商品；

[0101] 4)时间；

[0102] 5)城市，国家等地理相关的地点或者区域；

[0103] 6)人物；

[0104] 7)有名称的地点或者建筑物。

[0105] 对于一个具体的实体，领域实体数据库存储该实体在自然界拥有的属性，以及属性值。

[0106] 领域实体数据库还可以存储不同实体之间的关系，通过不同实体之间的关系，建立实体的关系拓扑结构。

[0107] 本发明实施例中，领域实体数据库提供的数据库服务可以包括：

[0108] 查询：根据实体名获取该实体相关的属性，根据实体名获取与该实体有关系的其他实体名，根据一种属性获取具有该属性的实体，以及以上查询的嵌套组合；

[0109] 添加：添加一个实体，一个实体具有的属性，和/或添加两个实体之间的关系；

[0110] 更改：更改实体名，更改实体对应的属性，和/或更改两个实体之间的关系；

[0111] 删除：删除一个实体对应的属性，删除两个实体之间的关系，和/或删除一个实体，该实体包含的属性以及该实体与其他实体之间的关系。

[0112] 7、开放服务接口

[0113] 开放服务接口提供统一的数据交换接口，连接图2所示的系统架构和外置的服务，通过外置服务为智能聊天系统提供可扩展的功能，可扩展的功能可以包括：

[0114] 1)对接酒店和餐馆的外置数据库服务，从而获得客户的订单等数据，并对客户相关的聊天请求给出回应；

[0115] 2)对接电子商务的外置服务，从而获取客户的信息，订单数据，并对客户相关的聊天请求给出查询结果，推荐结果和其他回应。

[0116] 上述开放服务接口实现的功能可以包括：

[0117] 1)定义图2所示的系统架构和外置服务的数据交换的格式；

[0118] 2)自动动态决定什么样的用户请求需要访问什么样的外置服务；

[0119] 3)自动动态决定多个外置服务的访问顺序；

[0120] 4)自动动态决定多个外置服务的结果如何进行聚合和过滤；

[0121] 8、主动学习模块

[0122] 主动学习模块通过用户与智能聊天系统的交互历史，自动学习和积累人类的聊天模式。

[0123] 上述主动学习模块实现的功能可以包括：

[0124] 1)通过对话模型、话题模型和领域实体数据库对人类的聊天模式进行数值化；

[0125] 2)对数值化的人类聊天模式进行存储；

[0126] 3)自动动态检测当前的聊天语境与存储的人类聊天模式的相似度；

[0127] 4)根据当前的聊天语境，从存储的人类聊天模式中，查找和返回一个最相似的回复。

[0128] 本发明图1所示实施例提供的基于人工智能的人机智能聊天的方法基于人工智能(Artificial Intelligence，简称：AI)实现，人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支，企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。

[0129] 人工智能是对人的意识、思维的信息过程的模拟。人工智能不是人的智能，但能像人那样思考，也可能超过人的智能。人工智能是包括十分广泛的科学，由不同的领域组成，如机器学习，计算机视觉等等，总的说来，人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。

[0130] 本发明图1所示实施例提供的基于人工智能的人机智能聊天的方法通过与记忆系统和话题模型的有机结合，可以在对话中，记住用户的历史兴趣以及上文相关的信息，从而给出更精确更个性化的回复；主动学习模块可以在与用户对话的同时，学习用户聊天的模式，并应用到以后与该用户或者其他用户的聊天中；用户意图理解，通过对用户需求进行精准分类，可以更精确的进行需求分发和匹配；开放服务接口，通过对接外置的服务，可以完成更多的用户需求。

[0131] 本发明图1所示实施例提供的基于人工智能的人机智能聊天的方法，可应用于很多不同的应用场景，举例如下：

[0132] 1、本地化服务：餐馆、酒店类的前台接待服务、银行自动取款机(Automatic Tel ler Machine；以下简称：ATM)智能交互服务和/或博物馆的智能引导服务等；

[0133] 2、智能硬件设备：个人智能助理和/或智能交互玩具；

[0134] 3、电子商务：线上商品销售导购和/或智能客服；

[0135] 4、旅游服务：机票旅店预定智能交互服务。

[0136] 图4为本发明基于人工智能的人机智能聊天的装置一个实施例的结构示意图，本实施例中的基于人工智能的人机智能聊天的装置可以作为终端设备，或者终端设备的一部分实现本发明图1所示实施例的流程，如图4所示，该基于人工智能的人机智能聊天的装置可以包括：接收模块41、处理模块42、获得模块43和输出模块44；

[0137] 其中，接收模块41，用于接收多模态的输入信号，上述多模态的输入信号可以包括语音信号、图像信号、传感器信号和/或事件驱动信号；

[0138] 处理模块42，用于对接收模块41接收的多模态的输入信号进行处理，获得文本数据；

[0139] 获得模块43，用于根据处理模块42获得的文本数据获得用户的意图，并获得上述用户的意图对应的答案；其中，获得模块43用于根据上述文本数据获得用户的意图可以为：获得模块43，具体用于对上述文本数据进行解析，根据解析获得的结果生成用户的意图。

[0140] 更具体地，获得模块43，具体用于对上述文本数据进行句法结构分析，对进行句法结构分析后的文本数据进行基于词语的语义分析、基于话题模型的领域多分类识别、语义消歧和基于语法结构和上下文信息的自动补全。

[0141] 输出模块44，用于将获得模块43获得的答案转化为多模态的输出信号，并输出上述多模态的输出信号。

[0142] 图5为本发明基于人工智能的人机智能聊天的装置另一个实施例的结构示意图，与图4所示的基于人工智能的人机智能聊天的装置相比，不同之处在于，图5所示的基于人工智能的人机智能聊天的装置中，还可以包括：保存模块45；

[0143] 其中，保存模块45，用于在获得模块43获得用户的意图之后，将获得的用户的意图保存在历史用户意图中。

[0144] 本实施例中，获得模块43用于获得所述用户的意图对应的答案可以为：获得模块43，具体用于根据上述用户的意图在记忆系统中进行查找，获得上述用户的意图的约束条件；以及根据上述用户的意图在话题模型和领域实体数据库中进行查找，获得上述用户的意图关联的变量和属性；以及通过主动学习模块获得当前的聊天语境与存储的聊天模式的相似度；以及访问开放服务接口，获得从上述开放服务接口返回的结果；根据上述用户的意图，结合上述用户的意图的约束条件、上述用户的意图关联的变量和属性、从上述开放服务接口返回的结果以及与存储的聊天模式的相似度获得上述用户的意图对应的答案。

[0145] 进一步地，上述基于人工智能的人机智能聊天的装置中还可以包括：生成模块46；

[0146] 保存模块45，用于将上述用户的意图、上述用户的意图的约束条件，上述用户的意图关联的变量和属性保存在对话模型中；

[0147] 生成模块46，用于根据上述对话模型中保存的用户的意图、用户的意图的约束条件、用户的意图关联的变量和属性的统计结果建立不同用户的意图的转移概率图谱，并在适当的时机，根据上述转移概率图谱生成新的话题。

[0148] 本实施例中，保存模块45，用于在处理模块42获得文本数据之后，将上述文本数据中包括的适合记忆的内容保存在记忆系统中。其中，上述记忆系统包括短期记忆系统和长期记忆系统；则保存模块45，具体用于将上述文本数据包括的适合记忆的内容中属于短期记忆的内容保存在短期记忆系统中，将上述文本数据包括的适合记忆的内容中属于长期记忆的内容保存在长期记忆系统中；

[0149] 上述短期记忆的内容包括：用户的历史对话记录、基于上述历史对话记录建立的用户聊天的话题状态序列和基于上述历史对话记录提取的实体相关属性；

[0150] 上述长期记忆的内容包括：用户的个人信息和人口属性、用户的偏好、上述用户的地理历史记录、上述用户的消费历史记录、系统的个人信息和人口属性和系统的偏好。

[0151] 本实施例中，保存模块45，用于在处理模块42获得文本数据之后，将上述文本数据中提炼的话题记录在话题模型中，以及将上述文本数据中提炼的实体属性记录在领域实体数据库中。

[0152] 本实施例中，获得模块43用于通过主动学习模块获得当前的聊天语境与存储的聊天模式的相似度可以为：获得模块43，具体用于通过对话模型、话题模型和领域实体数据库对人类的聊天模式进行数值化；将数值化的聊天模式存储在主动学习模块中；检测获得当前的聊天语境与存储的聊天模式的相似度。

[0153] 上述基于人工智能的人机智能聊天的装置中，接收模块41接收多模态的输入信号之后，处理模块42对上述多模态的输入信号进行处理，获得文本数据，获得模块43根据上述文本数据获得用户的意图，进而获得上述用户的意图对应的答案，然后输出模块44将上述答案转化为多模态的输出信号，并输出上述多模态的输出信号，从而在人机对话中，可以对用户需求进行精确匹配，给出更精确更个性化的回复，可以更自然地进行人机智能聊天，满足用户的聊天需求，提高用户体验。

[0154] 需要说明的是，在本发明的描述中，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。此外，在本发明的描述中，除非另有说明，“多个”的含义是两个或两个以上。

[0155] 流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。

[0156] 应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(Programmable Gate Array；以下简称：PGA)，现场可编程门阵列(Field Programmable Gate Array；以下简称：FPGA)等。

[0157] 本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

[0158] 此外，本发明各个实施例中的各功能模块可以集成在一个处理模块中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

[0159] 上述提到的存储介质可以是只读存储器，磁盘或光盘等。

[0160] 在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

[0161] 尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

基于人工智能的人机智能聊天的方法和装置转让专利

申请号 : CN201510359363.9

文献号 : CN105094315B

文献日 : 2018-03-06

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 亓超 , 温泉 , 陈洪亮 , 周湘阳 , 张晓庆 , 忻舟 , 赵世奇

申请人 : 百度在线网络技术(北京)有限公司

摘要 :

权利要求 :

说明书 :