优化对话机器人的方法及装置转让专利

申请号 : CN201811588390.3

文献号 : CN109693244B

文献日 : 2020-06-12

本发明提供了一种优化对话机器人的方法及装置，涉及人工智能的技术领域，包括：与用户交互的机器人平台获取用户输入的语句；根据语句分析用户的行为；若用户的行为与预先设置的行为集相匹配，将获取的语句显示在客服平台；客服平台根据语句查询预先设置的知识库，获取对语句的回复信息，输出至机器人平台，以使机器人平台依据回复信息对语句进行回应；客服平台在语句中，获取回复信息对应的待添加标注数据，依据待添加标注数据对知识库进行扩展，缓解了现有技术中选择离线挖掘学习技术提升对话机器人的能力时，使得对话机器人的学习周期特别长，学习效果不可控的技术问题，提高了对话机器人学习的效果，减小了学习的周期。

1.一种优化对话机器人的方法，其特征在于，所述对话机器人包括机器人平台及客服平台，所述方法包括：与用户交互的机器人平台获取所述用户输入的语句；

根据所述语句分析所述用户的行为，所述用户的行为包括：极端行为、不满行为以及普通行为；

若所述用户的行为与预先设置的行为集相匹配，将获取的所述语句显示在所述客服平台；

所述客服平台根据所述语句，查询预先设置的知识库，获取对所述语句的回复信息，输出至所述机器人平台，以使所述机器人平台依据所述回复信息对所述语句进行回应；

所述客服平台在所述语句中，获取所述回复信息对应的待添加标注数据，依据所述待添加标注数据对所述知识库进行扩展。

2.根据权利要求1所述的方法，其特征在于，所述根据所述语句分析所述用户的行为，包括：将所述语句输入到已经训练好的分类器中，通过所述已经训练好的分类器识别所述用户的行为，所述已经训练好的分类器为通过获取大量人工标注了行为分类的样本数据进行训练得到。

3.根据权利要求1所述的方法，其特征在于，所述若所述用户的行为与预先设置的行为集相匹配，包括：若所述用户的行为属于极端行为，确定所述用户的行为与预先设置的行为集相匹配。

4.根据权利要求1所述的方法，其特征在于，所述若所述用户的行为与预先设置的行为集相匹配，包括：若所述用户的行为属于不满行为，对所述语句进行处理，根据处理后的所述语句判断所述用户是对所述机器人平台不满意还是对办理的业务不满意；

若所述用户是对所述机器人平台不满意，确定所述用户的行为与预先设置的行为集相匹配。

5.根据权利要求1所述的方法，其特征在于，所述若所述用户的行为与预先设置的行为集相匹配，包括：若所述用户的行为属于普通行为，依据所述语句判断所述用户的态度是否为否定态度；

若所述用户的态度为否定态度，则判断所述用户是对所述机器人平台的否定还是对办理的业务的否定；

若所述用户是对所述机器人平台的否定，确定所述用户的行为与预先设置的行为集相匹配。

6.根据权利要求1所述的方法，其特征在于，在确定所述用户的行为与预先设置的行为集相匹配之后，将获取的所述语句显示在所述客服平台之前，所述方法还包括：判断能否进行主动澄清操作，若否，执行所述将获取的所述语句显示在所述客服平台的步骤；

所述判断能否进行主动澄清操作包括：

依据预先设置的主动澄清策略，判断所述机器人平台能否回复所述用户，若不能，确定不能进行主动澄清操作。

7.根据权利要求1所述的方法，其特征在于，在所述机器人平台依据所述回复信息对所述语句进行回应之后，所述方法还包括：所述机器人平台依据所述用户对所述回应进行响应的回复，确定所述用户的行为是否与预先设置的行为集相匹配，若是，则判断需要进行复标操作；

所述复标操作，包括：

将所述语句以及业务的状态发送给所述客服平台中的多个处理平台进行标注；

判断多个处理平台标注的内容是否一致，若一致，则根据所述标注的内容对所述语句进行回应。

8.根据权利要求1-7任一项所述的方法，其特征在于，在获取所述回复信息对应的待添加标注数据之后，依据所述待添加标注数据对所述知识库进行扩展之前，还包括：判断所述待添加标注数据的类别；

根据所述待添加标注数据的类别对所述待添加标注数据进行清洗操作及预处理操作；

判断所述待添加标注数据是否为不合适的数据，若是，则对所述待添加标注数据进行清洗操作；

对所述待添加标注数据进行预处理操作，去掉待添加标注数据中的标点符号及语气词。

9.根据权利要求1所述的方法，其特征在于，在依据所述待添加标注数据对所述知识库进行扩展之后，所述方法还包括：判断扩展后的所述知识库是否对标准测试集中的重要历史数据有影响，若是，则放弃对所述知识库的扩展；

若否，则计算扩展后的所述知识库对所述标准测试集中的判断样本数据的识别准确率。

10.一种优化对话机器人的装置，其特征在于，所述对话机器人包括机器人平台及客服平台，所述装置包括：语句获取模块，用于与用户交互的机器人平台获取所述用户输入的语句；

用户行为分析模块，用于根据所述语句分析所述用户的行为，所述用户的行为包括：极端行为、不满行为以及普通行为；

行为判断模块，用于若所述用户的行为与预先设置的行为集相匹配，将获取的所述语句显示在所述客服平台；

查询回应模块，用于所述客服平台根据所述语句，查询预先设置的知识库，获取对所述语句的回复信息，输出至所述机器人平台，以使所述机器人平台依据所述回复信息对所述语句进行回应；

优化模块，用于所述客服平台在所述语句中，获取所述回复信息对应的待添加标注数据，依据所述待添加标注数据对所述知识库进行扩展。

优化对话机器人的方法及装置

技术领域

[0001] 本发明涉及人工智能技术领域，尤其是涉及一种优化对话机器人的方法及装置。

背景技术

[0002] 随着人工智能技术的发展，对话机器人逐渐应用在客服、外呼、销售等诸多领域中，为客户提供筛选资讯、解答咨询问题、实现简单任务等功能，但是，随着技术的发展，客户对对话机器人的需求千差万别，对话机器人要满足舒适性、灵活性、个性化的要求，同时市场竞争的全球化，使得对对话机器人能力的要求也在不断提高，进一步的，随着市场策略的调整、业务发生的变化、用户信息的更迭，在对话机器人的服务过程中，要求对话机器人不断的自我调整，以适应这种变化。

[0003] 在现有技术中，常用的对话机器人通常包含两个部分：机器人平台和人工服务平台，当机器人平台解决不了用户的问题时，用户可提出要求转人工服务平台，由人工接续机器人为客户提供服务，其中，人工为客户提供服务的方案包括且不限于电话、在线(网页、微信、微博、APP)等渠道，当人工接续机器人工作时，机器人完全丧失了对整个对话的掌控，不再跟进对话，也不能实时从中学习客服行为，进而提升对话机器人的能力。在现有技术中，通常选择离线挖掘学习技术提升对话机器人的能力，但是使用离线挖掘学习技术提升对话机器人的能力时，需要在大量的人工对话记录中进行标注、筛选、清洗、学习，使得对话机器人的学习周期特别长，学习效果也不可控。

发明内容

[0004] 有鉴于此，本发明的目的在于提供一种优化对话机器人的方法及装置，以缓解了现有技术中存在的选择离线挖掘学习技术提升对话机器人的能力时，需要在大量的人工对话记录中进行标注、筛选、清洗、学习，使得对话机器人的学习周期特别长，学习效果不可控的技术问题。

[0005] 第一方面，本发明实施例提供了一种优化对话机器人的方法，该对话机器人包括机器人平台及客服平台，该方法包括：

[0006] 与用户交互的机器人平台获取用户输入的语句；

[0007] 根据语句分析用户的行为，用户的行为包括：极端行为、不满行为以及普通行为；

[0008] 若用户的行为与预先设置的行为集相匹配，将获取的语句显示在客服平台；

[0009] 客服平台根据语句，查询预先设置的知识库，获取对语句的回复信息，输出至机器人平台，以使机器人平台依据回复信息对语句进行回应；

[0010] 客服平台在语句中，获取回复信息对应的待添加标注数据，依据待添加标注数据对知识库进行扩展。

[0011] 结合第一方面，本发明实施例提供了第一方面的第一种可能的实施方式，其中，根据语句分析用户的行为，包括：

[0012] 将语句输入到已经训练好的分类器中，通过已经训练好的分类器识别用户的行为，已经训练好的分类器为通过获取大量人工标注了行为分类的样本数据进行训练得到。

[0013] 结合第一方面，本发明实施例提供了第一方面的第二种可能的实施方式，其中，若用户的行为与预先设置的行为集相匹配，包括：

[0014] 若所述用户的行为属于极端行为，确定用户的行为与预先设置的行为集相匹配。

[0015] 结合第一方面，本发明实施例提供了第一方面的第三种可能的实施方式，其中，若用户的行为与预先设置的行为集相匹配，包括：

[0016] 若用户的行为属于不满行为，对语句进行处理，根据处理后的语句判断用户是对机器人平台不满意还是对办理的业务不满意；

[0017] 若用户是对机器人平台不满意，确定用户的行为与预先设置的行为集相匹配。

[0018] 结合第一方面，本发明实施例提供了第一方面的第四种可能的实施方式，其中，若用户的行为与预先设置的行为集相匹配，包括：

[0019] 若用户的行为属于普通行为，依据语句判断用户的态度是否为否定态度；

[0020] 若用户的态度为否定态度，则判断用户是对机器人平台的否定还是对办理的业务的否定；

[0021] 若用户是对机器人平台的否定，确定用户的行为与预先设置的行为集相匹配。

[0022] 结合第一方面，本发明实施例提供了第一方面的第五种可能的实施方式，其中，在确定用户的行为与预先设置的行为集相匹配之后，将获取的语句显示在客服平台之前，该方法还包括：

[0023] 判断能否进行主动澄清操作，若否，执行将获取的语句显示在客服平台的步骤；

[0024] 判断能否进行主动澄清操作包括：

[0025] 依据预先设置的主动澄清策略，判断机器人平台能否回复用户，若不能，确定不能进行主动澄清操作。

[0026] 结合第一方面，本发明实施例提供了第一方面的第六种可能的实施方式，其中，在机器人平台依据回复信息对语句进行回应之后，该方法还包括：

[0027] 机器人平台依据用户对回应进行响应的回复，确定用户的行为是否与预先设置的行为集相匹配，若是，则判断需要进行复标操作；

[0028] 复标操作，包括：

[0029] 将语句以及业务的状态发送给客服平台中的多个处理平台进行标注；

[0030] 判断多个处理平台标注的内容是否一致，若一致，则根据标注的内容对语句进行回应。

[0031] 结合第一方面至第一方面第六种可能的实施方式，本发明实施例提供了第一方面的第七种可能的实施方式，其中，在获取回复信息对应的待添加标注数据之后，依据待添加标注数据对知识库进行扩展之前，还包括：

[0032] 判断待添加标注数据的类别；

[0033] 根据待添加标注数据的类别对待添加标注数据进行清洗操作及预处理操作；

[0034] 判断待添加标注数据是否为不合适的数据，若是，则对待添加标注数据进行清洗操作；

[0035] 对待添加标注数据进行预处理操作，去掉待添加标注数据中的标点符号及语气词。

[0036] 结合第一方面，本发明实施例提供了第一方面的第八种可能的实施方式，其中，在依据待添加标注数据对知识库进行扩展之后，所述方法还包括：

[0037] 判断扩展后的知识库是否对标准测试集中的重要历史数据有影响，若是，则放弃对知识库的扩展；

[0038] 若否，则计算扩展后的知识库对标准测试集中的判断样本数据的识别准确率。

[0039] 第二方面，本发明实施例还提供一种优化对话机器人的装置，所述对话机器人包括机器人平台及客服平台，该装置包括：

[0040] 语句获取模块，用于与用户交互的机器人平台获取用户输入的语句；

[0041] 用户行为分析模块，用于根据语句分析用户的行为，用户的行为包括：极端行为、不满行为以及普通行为；

[0042] 行为判断模块，用于若用户的行为与预先设置的行为集相匹配，将获取的语句显示在客服平台；

[0043] 查询回应模块，用于客服平台根据语句，查询预先设置的知识库，获取对语句的回复信息，输出至机器人平台，以使机器人平台依据回复信息对语句进行回应；

[0044] 优化模块，用于客服平台在语句中，获取回复信息对应的待添加标注数据，依据待添加标注数据对知识库进行扩展。

[0045] 本发明实施例带来了以下有益效果：本发明提供了一种优化对话机器人的方法及装置，该对话机器人包括机器人平台及客服平台，包括：与用户交互的机器人平台获取用户输入的语句；根据语句分析用户的行为，用户的行为包括：极端行为、不满行为以及普通行为；若用户的行为与预先设置的行为集相匹配，将获取的语句显示在客服平台；客服平台根据语句，查询预先设置的知识库，获取对语句的回复信息，输出至机器人平台，以使机器人平台依据回复信息对语句进行回应；客服平台在语句中，获取回复信息对应的待添加标注数据，依据待添加标注数据对知识库进行扩展，机器人平台通过实时的对知识库进行扩展，缓解了现有技术中存在的选择离线挖掘学习技术提升对话机器人的能力时，需要在大量的人工对话记录中进行标注、筛选、清洗、学习，使得对话机器人的学习周期特别长，学习效果不可控的技术问题，提高了对话机器人学习的效果，减小了学习的周期。

[0046] 本发明的其他特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

[0047] 为使本发明的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

[0048] 为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

[0049] 图1为本发明实施例提供的一种优化对话机器人的方法的流程图；

[0050] 图2为本发明实施例提供的另一种优化对话机器人的方法的流程图；

[0051] 图3为本发明实施例提供的一种优化对话机器人的装置的结构示意图；

[0052] 图4为本发明实施例提供的另一种优化对话机器人的装置的结构示意图。

[0053] 图标：301-语句获取模块；302-用户行为分析模块；303-行为判断模块；304-查询回应模块；305-优化模块；306-复标操作判断模块；307-纠正模块；308-纠正判断模块；309-扩展判断模块；3031-极端行为判断单元；3032-不满行为判断单元；3033-普通行为判断单元；3051-标注数据识别单元；3052-操作单元；3053-清洗操作单元；3054-预处理操作单元。

具体实施方式

[0054] 为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

[0055] 目前，在现有技术中，通常选择离线挖掘学习技术提升对话机器人的能力，但是使用离线挖掘学习技术提升对话机器人的能力时，需要在大量的人工对话记录中进行标注、筛选、清洗、学习，使得对话机器人的学习周期特别长，学习效果也不可控，基于此，本发明实施例提供的一种优化对话机器人的方法及装置，可以缓解现有技术中存在的选择离线挖掘学习技术提升对话机器人的能力时，对话机器人的学习周期特别长，学习效果也不可控的技术问题，实现了实时优化对话机器人的目的，降低了对话机器人的学习周期，提升了学习的效果。

[0056] 为便于对本实施例进行理解，首先对本发明实施例所公开的一种优化对话机器人的方法进行详细介绍。

[0057] 实施例一：

[0058] 本发明实施例提供了一种优化对话机器人的方法，所述对话机器人包括机器人平台及客服平台，参见图1所示的一种优化对话机器人的方法的流程图，该方法包括以下步骤：

[0059] 步骤S101：与用户交互的机器人平台获取用户输入的语句；

[0060] 机器人平台获取用户输入的语句，若用户输入的语句为多条时，则分别获取用户输入的多条语句。

[0061] 步骤S102：根据语句分析用户的行为；

[0062] 具体的，将获取到的语句输入到已经训练好的分类器中，通过已经训练好的分类器识别用户的行为，已经训练好的分类器为通过获取大量人工标注了行为分类的样本数据进行训练得到，其中，用户的行为包括：极端行为、不满行为以及普通行为，例如，若用户输入的语句中包括辱骂性词语、投诉词语则判断用户的行为为极端行为，若用户输入的语句中包括重复性词语、重复的语句，则判断用户的行为为不满行为，具体实现时，用户的极端行为、不满行为还包括其他情况，以上仅为示例性的内容，关于用户行为的具体情况可以根据实际情况进行设置，本发明实施例对此不作具体限制。

[0063] 步骤S103：若用户的行为与预先设置的行为集相匹配，将获取的语句显示在客服平台；

[0064] 步骤S1031：若用户的行为属于极端行为，则确定用户的行为与预先设置的行为集相匹配；

[0065] 步骤S1032：若用户的行为属于不满行为，对用户输入的语句进行处理，根据处理后的语句判断用户是对机器人平台不满意还是对办理的业务不满意；

[0066] 若用户是对机器人平台不满意，确定该用户的行为与预先设置的行为集相匹配；

[0067] 在本发明实施例中，对用户输入的语句进行处理包括：对用户输入的语句进行切词处理，过滤语句中的标点符号，生成多个词语，将生成的词语输入到依存句法分析算法中，输出主语、谓语、宾语，以及词语的词性，例如名词、动词等，进而提取句子的关注点，通过关注点分析句子的主干，通过句子的主干分析出用户是对机器人平台不满意还是对办理的业务不满意，例如，分析的主干为机器人太傻，则判断为用户对机器人平台不满意，若分析的主干为业务/套餐很贵，则判断为用户对办理的业务不满意；若用户是对机器人平台不满意，确定该用户的行为与预先设置的行为集相匹配；若用户对办理的业务不满意，则机器人平台查询与用户输入的语句相匹配的回复内容，回复该用户。

[0068] 步骤S1033：若用户的行为属于普通行为，依据用户输入的语句判断该用户的态度是否为否定态度；若用户的态度为否定态度，则判断用户是对机器人平台的否定还是对办理的业务的否定；

[0069] 若用户是对机器人平台的否定，确定用户的行为与预先设置的行为集相匹配。

[0070] 在本发明实施例中，将该语句输入到已经训练好的机器学习分类模型中判断该语句是否属于否定态度，该机器学习分类模型中包含有大量标注了否定态度的样本语句，若属于否定态度，则对用户输入的语句进行处理，提取出否定词，例如，否定词为不是、不对、错误等，获取否定词否定的内容的主语，进而根据否定内容的主语判断是对机器人平台的否定，即对机器人平台识别内容的否定，还是对办理的业务的否定，若用户是对办理业务的否定则机器人平台根据识别到的内容正常回复用户，若是对机器人平台的否定，则确定用户的行为与预先设置的行为集相匹配，参见图2所示的另一种优化对话机器人的方法的流程图。

[0071] 步骤S1034：若确定用户的行为与预先设置的行为集相匹配，则将获取的语句显示在客服平台。

[0072] 步骤S104：客服平台根据语句，查询预先设置的知识库，获取对语句的回复信息，输出至机器人平台，以使机器人平台依据回复信息对语句进行回应；

[0073] 具体的，预先设置的知识库中包括对话领域里对话机器人应当具备的常识、业务知识、业务流程等，同时知识库还包括业务接口，知识库通过业务接口获取第三方提供的信息。其中，对话机器人依据回复信息通过获取知识库中的信息，能够解决该领域下用户的大部分问题和诉求，进一步的，客服平台能够对知识库中的任何信息进行操作，如定位到流程中的一个节点、填充流程需要的值、定位知识库中的某个知识点等。

[0074] 步骤S105：客服平台在语句中，获取回复信息对应的待添加标注数据，依据待添加标注数据对知识库进行扩展。

[0075] 在本发明实施例中，依据待添加标注数据对知识库进行扩展，完成对对话机器人的优化，待添加标注数据可以为回复信息对应的用户输入的语句或/和用户输入的包含多条上下文语句的数据，例如，用户输入的语句为：帮我买一张从北京到胡志明的机票，由于知识库中预设的城市地名中没有胡志明，致使机器人平台对用户的目的地不能识别，客服平台将胡志明标注为胡志明市，将胡志明市对应的用户输入的语句或/和用户输入的多条语句作为待添加标注数据输入到知识库中进行扩展，当机器人平台再次识别到胡志明时，能够在知识库中识别到回复信息，进而根据回复信息对用户进行回复，实现了对话机器人的实时优化，减小了对话机器人的优化周期，提升了优化效果。

[0076] 本发明实施例通过提供了一种优化对话机器人的方法，该对话机器人包括机器人平台及客服平台，该方法包括：与用户交互的机器人平台获取用户输入的语句；根据语句分析用户的行为；若用户的行为与预先设置的行为集相匹配，将获取的语句显示在客服平台；客服平台根据语句，查询预先设置的知识库，获取对语句的回复信息，输出至机器人平台，以使机器人平台依据回复信息对语句进行回应；客服平台在语句中，获取回复信息对应的待添加标注数据，依据待添加标注数据对知识库进行扩展；实现了对机器人平台知识库的实时扩展、优化，当机器人平台不能识别用户输入的语句时，则客服平台进行操作，并实时的生成待添加标注数据，将待添加标注数据输入到对话机器人的知识库中对知识库进行扩展，实时的优化了对话机器人，缓解了现有技术中存在的选择离线挖掘学习技术提升对话机器人的能力时，需要在大量的人工对话记录中进行标注、筛选、清洗、学习，使得对话机器人的学习周期特别长，学习效果不可控的技术问题，提高了对话机器人学习的效果，减小了学习的周期。

[0077] 作为一个可选实施例，在确定用户的行为与预先设置的行为集相匹配之后，将获取的语句显示在客服平台之前，该方法还包括：

[0078] 判断能否进行主动澄清操作，若否，执行将获取的语句显示在客服平台的步骤；

[0079] 判断能否进行主动澄清操作包括：

[0080] 依据预先设置的主动澄清策略，判断机器人平台能否回复用户，若不能，确定不能进行主动澄清操作。

[0081] 在本发明实施例中，预先设置的主动澄清策略为对话机器人预先设置的知识库中包括可以进行主动澄清操作的内容，根据用户输入的语句，判断用户对机器人平台不满意的内容或者否定内容是否包含在主动澄清操作的内容中，若主动澄清操作的内容中包括不满意的内容或否定的内容，则机器人平台可以主动澄清，否则，不能进行主动澄清操作。

[0082] 作为一个可选实施例，在机器人平台依据回复信息对语句进行回应之后，该方法还包括：

[0083] 机器人平台依据用户对回应进行响应的回复，确定用户的行为是否与预先设置的行为集相匹配，若是，则判断需要进行复标操作；

[0084] 复标操作，包括：

[0085] 将语句以及业务的状态发送给客服平台中的多个处理平台进行标注；

[0086] 判断多个处理平台标注的内容是否一致，若一致，则根据标注的内容对用户输入的语句进行回应，若不一致，则退回到客服平台重新选择多个处理平台进行随机标注。

[0087] 在本发明实施例中，若多个处理平台标注的内容不一致，则退回到客服平台重新选择多个处理平台进行随机标注，若随机标注后的内容仍不一致，则对多个处理平台标注的内容进行分析，判断是否为处理平台标注出错，若是，则对出错的标注内容进行纠正，并根据纠正后的内容对用户输入的语句进行回应；若否，则判断为用户输入的语句内容不清楚，多个处理平台对用户输入的语句进行分析，获得一致的标注内容，并根据一致的标注的内容对用户输入的语句进行回应。

[0088] 作为一个可选实施例，在获取回复信息对应的待添加标注数据之后，依据待添加标注数据对知识库进行扩展之前，该方法还包括：

[0089] 判断待添加标注数据的类别，具体的，该标注数据的类别包括：意图识别标注数据、槽位提取标注数据、态度识别标注数据以及情感识别标注数据，在具体实现时，该标注数据的类别可以根据实际需要进行设置，对此本发明实施例不作具体限制；

[0090] 根据待添加标注数据的类别对待添加标注数据进行清洗操作及预处理操作；

[0091] 判断待添加标注数据是否为不合适的数据，若是，则对待添加标注数据进行清洗操作；

[0092] 对待添加标注数据进行预处理操作，去掉待添加标注数据中的标点符号及语气词。

[0093] 在本发明实施例中，清洗操作是为了将待添加标注数据中的不适合的数据删除，避免使用不合适的数据对知识库进行扩展时产生不良的影响，进而影响机器人平台的优化效果，例如：买票、买、卖票等为不合适的数据，具体的，清洗操作的规则可以根据实际的需要进行设定。

[0094] 作为一个可选实施例，在依据待添加标注数据对知识库进行扩展之后，该方法还包括：

[0095] 判断扩展后的知识库是否对标准测试集中的重要历史数据有影响，若是，则放弃对知识库的扩展；

[0096] 若否，则计算扩展后的知识库对标准测试集的识别准确率。

[0097] 在本发明实施例中，知识库中包括标准测试集，标准测试集中包括判断样本数据及重要历史数据，具体实现时，判断扩展后的知识库是否对标准测试集中的重要历史数据有影响，若是，则放弃对知识库的扩展；若否，则计算扩展后的知识库对标准测试集中的判断样本数据的识别准确率，该识别准确率为第一识别准确率，并获取扩展之前的知识库对标准测试集中的判断样本数据的第二识别准确率，比较第一识别准确率与第二识别准确率，若第一识别准确率大于等于第二识别准确率，则对知识库进行扩展，否则，放弃对知识库的扩展。

[0098] 实施例二：

[0099] 在上述实施例的基础上，本发明实施例还提供了一种优化对话机器人的装置，如图3所示，图中示出的是一种优化对话机器人的装置的结构示意图，该对话机器人包括机器人平台及客服平台，该装置包括：

[0100] 语句获取模块301，用于与用户交互的机器人平台获取用户输入的语句；

[0101] 用户行为分析模块302，用于根据语句分析用户的行为，用户的行为包括：极端行为、不满行为以及普通行为；

[0102] 行为判断模块303，用于若用户的行为与预先设置的行为集相匹配，将获取的语句显示在客服平台；

[0103] 查询回应模块304，用于客服平台根据语句，查询预先设置的知识库，获取对语句的回复信息，输出至机器人平台，以使机器人平台依据回复信息对语句进行回应；

[0104] 优化模块305，用于客服平台在语句中，获取回复信息对应的待添加标注数据，依据待添加标注数据对知识库进行扩展。

[0105] 进一步的，本发明实施例提供的优化对话机器人的装置中，如图4所示的是另一种优化对话机器人的装置的结构示意图，行为判断模块303包括：

[0106] 极端行为判断单元3031，用于若用户的行为属于极端行为，确定用户的行为与预先设置的行为集相匹配。

[0107] 不满行为判断单元3032，用于若用户的行为属于不满行为，对语句进行处理，根据处理后的语句判断用户是对机器人平台不满意还是对办理的业务不满意；若用户是对机器人平台不满意，确定用户的行为与预先设置的行为集相匹配。

[0108] 普通行为判断单元3033，用于若用户的行为属于普通行为，依据语句判断用户的态度是否为否定态度；若用户的态度为否定态度，则判断用户是对机器人平台的否定还是对办理的业务的否定；若用户是对机器人平台的否定，确定用户的行为与预先设置的行为集相匹配。

[0109] 进一步的，所述装置包括：

[0110] 复标操作判断模块306，用于机器人平台依据用户对回应进行响应的回复，确定用户的行为是否与预先设置的行为集相匹配，若是，则判断需要进行复标操作；

[0111] 纠正模块307，用于若需要进行复标操作，则将语句以及业务的状态发送给客服平台中的多个处理平台进行标注；

[0112] 纠正判断模块308，用于判断多个处理平台标注的内容是否一致，若一致，则根据标注的内容对语句进行回应。

[0113] 进一步的，本发明实施例提供的优化对话机器人的装置中，优化模块305包括：

[0114] 标注数据识别单元3051，用于判断待添加标注数据的类别；

[0115] 操作单元3052，用于根据待添加标注数据的类别对待添加标注数据进行清洗操作及预处理操作；

[0116] 清洗操作单元3053，用于判断待添加标注数据是否为不合适的数据，若是，则对待添加标注数据进行清洗操作；

[0117] 预处理操作单元3054，用于对待添加标注数据进行预处理操作，去掉待添加标注数据中的标点符号及语气词。

[0118] 进一步的，所述装置还包括：

[0119] 扩展判断模块309，用于判断扩展后的知识库是否对标准测试集中的重要历史数据有影响，若是，则放弃对知识库的扩展；若否，则计算扩展后的知识库对标准测试集中的判断样本数据的识别准确率。

[0120] 本发明实施例提供的优化对话机器人的装置，与上述实施例提供的优化对话机器人的方法具有相同的技术特征，所以也能解决相同的技术问题，达到相同的技术效果。

[0121] 本发明实施例所提供的进行优化对话机器人的方法的计算机程序产品，包括存储了处理器可执行的非易失的程序代码的计算机可读存储介质，所述程序代码包括的指令可用于执行前面方法实施例中所述的方法，具体实现可参见方法实施例，在此不再赘述。

[0122] 所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

[0123] 在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

[0124] 所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

[0125] 最后应说明的是：以上所述实施例，仅为本发明的具体实施方式，用以说明本发明的技术方案，而非对其限制，本发明的保护范围并不局限于此，尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

优化对话机器人的方法及装置转让专利

申请号 : CN201811588390.3

文献号 : CN109693244B

文献日 : 2020-06-12

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 梁鹏斌 , 宋成业 , 冯梦盈

申请人 : 零犀(北京)科技有限公司

摘要 :

权利要求 :

说明书 :