一种基于区块链的协同问答模型构建方法、装置及设备转让专利

申请号 : CN202210433294.1

文献号 : CN114528392B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 袁展译孙福辉成雨蓉王晓燕张志威张艺璐袁野张娴王国仁

申请人 : 北京理工大学人民法院信息技术服务中心

摘要 :

本文涉及区块链技术领域,尤其涉及一种基于区块链的协同问答模型构建方法、装置及设备。包括,获取构建协同问答模型所需的第一数据;对第一数据进行分析,构建第一区块链的第一问题四元组数据;对第一问题四元组数据进行训练,得到第一问答模型;将第一问答模型的参数发送到中继链;接收中继链发送的第二问答模型的参数和第三问答模型的参数;根据第二问答模型的参数、第三问答模型的参数、更新第一问答模型的参数,并根据第一问题四元组数据对更新参数后的第一问答模型进行训练,最终得到协同问答模型。通过本文实施例,实现了利用跨链技术保证数据的安全性,同时在各区块链的数据不出库的情况下,构建的问答模型的参数,最终得到协同问答模型。

权利要求 :

1.一种基于区块链的协同问答模型构建方法,其特征在于,由第一区块链执行,所述方法包括,获取构建协同问答模型所需的第一数据;

对所述第一数据进行分析,构建所述第一区块链的第一问题四元组数据,所述第一问题四元组数据包括问题文本、问题实体、属性实体和答案文本;

对所述第一问题四元组数据进行训练,得到第一问答模型;

在对所述第一问答模型的参数的共识验证结果为通过的情况下,将所述第一问答模型的参数发送到中继链,以使所述中继链在对所述第一问答模型的参数进行共识验证的结果为通过的情况下,将所述第一问答模型的参数发送给第二区块链和第三区块链进行训练,以分别得到第二问答模型和第三问答模型;

接收所述中继链在对所述第二区块链的第二问答模型的参数和第三区块链的第三问答模型的参数的共识验证的结果为通过的情况下,发送的所述第二问答模型的参数和第三问答模型的参数;

在对所述第二问答模型的参数、第三问答模型的参数的共识验证的结果为通过的情况下,根据所述第二问答模型的参数、第三问答模型的参数、更新所述第一问答模型的参数,并根据所述第一问题四元组数据对更新参数后的所述第一问答模型进行训练,并判断训练过程是否收敛;

若未收敛,则根据更新参数后的所述第一问答模型,执行将所述第一问答模型的参数发送到中继链的步骤;

若所述第一问答模型、第二问答模型和第三问答模型均收敛,则将所述第一问答模型作为协同问答模型。

2.根据权利要求1所述的基于区块链的协同问答模型构建方法,其特征在于,对所述第一问题四元组数据进行训练,得到第一问答模型的步骤包括,将所述第一问题四元组数据分割为训练集、验证集和测试集;

分别对所述训练集、验证集和测试集的数据进行实体序列标注,得到实体序列训练集、实体序列验证集和实体序列测试集;

根据所述实体序列训练集、实体序列验证集和实体序列测试集,构建命名实体识别模型;

对所述第一问题四元组数据中的问题与问题之间的相似度进行标注,得到相似关联训练集、相似关联验证集和相似关联测试集;

根据相似关联训练集、相似关联验证集和相似关联测试集,构建文本相似度模型;

根据所述命名实体识别模型、文本相似度模型、第一问题四元组数据,采用反向传播方法进行训练,得到所述第一问答模型,所述第一问答模型包括带有参数的命名实体识别模型以及带有参数的文本相似度模型。

3.根据权利要求1所述的基于区块链的协同问答模型构建方法,其特征在于,根据所述第二问答模型的参数、第三问答模型的参数、更新所述第一问答模型的参数进一步包括,将所述第一问答模型的参数、第二问答模型的参数以及第三问答模型的参数进行加权聚合,得到更新参数;

将所述更新参数作为所述第一问答模型的参数。

4.根据权利要求1所述的基于区块链的协同问答模型构建方法,其特征在于,根据所述第一问题四元组数据对更新参数后的所述第一问答模型进行训练的步骤中还包括,计算所述第一问答模型的损失函数;

判断训练过程是否收敛的步骤包括,判断所述第一问答模型的损失函数是否收敛。

5.根据权利要求1所述的基于区块链的协同问答模型构建方法,其特征在于,对所述第一问题四元组数据进行训练,得到第一问答模型之前,所述方法还包括,将区块链节点选举出的一个链上节点作为执行节点,以使所述执行节点对所述第一问题四元组数据进行训练。

6.根据权利要求1所述的基于区块链的协同问答模型构建方法,其特征在于,所述方法还包括,接收第一区块链发送的第一问答模型的参数;

在对所述第一问答模型的参数的共识验证的结果为通过的情况下将所述第一问答模型的参数发送给第二区块链和第三区块链;

接收所述第二区块链发送的第二问答模型的参数;

在对所述第二问答模型的参数的共识验证的结果为通过的情况下将所述第二问答模型的参数发送给所述第一区块链和所述第三区块链;

接收所述第三区块链发送的第三问答模型的参数;

在对所述第三问答模型的参数的共识验证的结果为通过的情况下将所述第三问答模型的参数发送给所述第一区块链和所述第二区块链。

7.一种基于区块链的协同问答模型构建装置,其特征在于,包括,

第一数据获取单元,用于获取构建协同问答模型所需的第一数据;

第一问题四元组数据构建单元,用于对所述第一数据进行分析,构建第一区块链的第一问题四元组数据,所述第一问题四元组数据包括问题文本、问题实体、属性实体和答案文本;

第一问答模型训练单元,用于对所述第一问题四元组数据进行训练,得到第一问答模型;

参数发送单元,用于在对所述第一问答模型的参数的共识验证结果为通过的情况下,将所述第一问答模型的参数发送到中继链,以使所述中继链在对所述第一问答模型的参数进行共识验证的结果为通过的情况下,将所述第一问答模型的参数发送给第二区块链和第三区块链进行训练,以分别得到第二问答模型和第三问答模型;

参数接收单元,用于接收所述中继链在对所述第二区块链的第二问答模型的参数和第三区块链的第三问答模型的参数的共识验证的结果为通过的情况下,发送的所述第二问答模型的参数和第三问答模型的参数;

协同问答模型构建单元,在对所述第二问答模型的参数、第三问答模型的参数的共识验证的结果为通过的情况下,根据所述第二问答模型的参数、第三问答模型的参数、更新所述第一问答模型的参数,并根据所述问题四元组数据对更新参数后的所述第一问答模型进行训练,并判断训练过程是否收敛;若未收敛,则根据更新参数后的所述第一问答模型,执行将所述第一问答模型的参数发送到中继链的步骤;若收敛,则将所述第一问答模型作为协同问答模型。

8.根据权利要求7所述的基于区块链的协同问答模型构建装置,其特征在于,还包括,中继链参数接收单元,用于接收第一区块链发送的第一问答模型的参数;

中继链参数发送单元,用于在对所述第一问答模型的参数的共识验证的结果为通过的情况下,将所述第一问答模型的参数发送给第二区块链和第三区块链;

所述中继链参数接收单元进一步用于,接收所述第二区块链发送的第二问答模型的参数;

所述中继链参数发送单元进一步用于,在对所述第二问答模型的参数的共识验证的结果为通过的情况下将所述第二问答模型的参数发送给所述第一区块链和所述第三区块链;

所述中继链参数接收单元进一步用于,接收所述第三区块链发送的第三问答模型的参数;

所述中继链参数发送单元进一步用于,在对所述第三问答模型的参数的共识验证的结果为通过的情况下将所述第三问答模型的参数发送给所述第一区块链和所述第二区块链。

9.一种计算机设备,包括存储器、处理器、以及存储在所述存储器上的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现权利要求1‑6任意一项所述的方法。

10.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被计算机设备的处理器运行时,执行权利要求1‑6任意一项所述的方法。

说明书 :

一种基于区块链的协同问答模型构建方法、装置及设备

技术领域

[0001] 本文涉及区块链技术领域,尤其涉及一种基于区块链的协同问答模型构建方法、装置及设备。

背景技术

[0002] 在司法场景中,法律专业人员的最重要的一部分工作是为专业人员提供可靠和高质量的法律咨询服务,然而,由于法律专业人员的数量不足,确保非专业人员能够获得充足且高质量的咨询服务是本领域内密切关注的问题。
[0003] 目前,司法问答系统有望解决这一难题,但面对法检司三方异构数据结构的数据共享时,现有的公证人机制由于不支持异构的智能合约,因此不能使得法检三方的数据共享。此外,传统的哈希锁定算法只能实现资产的交换而不能实现数据的共享,这也是不能满足司法业务场景的。最后,分布式私钥机制由于不改变原区块链的特性,跨链需要根据原链的特性适配开发,因此开发难度较大,且等待原链确认时间较长,导致运行效率偏低。
[0004] 现在亟需一种基于区块链的协同问答模型构建方法,从而解决现有技术中不能构建出高效的法检司三方的协同问答模型的问题。

发明内容

[0005] 为解决不能构建出高效的法检司三方的协同问答模型的问题,本文实施例提供了一种基于区块链的协同问答模型构建方法、装置及设备,实现了通过区块链技术构建法检司三方的协同问答模型,通过协同问答模型,降低了法检司三方的法律专业人员的工作强度,且确保了非法律专业人员能够获得充足且高质量的法律咨询服务。
[0006] 为了解决上述技术问题,本文的具体技术方案如下:
[0007] 一方面,本文实施例提供了一种基于区块链的协同问答模型构建方法,由第一区块链执行,包括,
[0008] 获取构建协同问答模型所需的第一数据;
[0009] 对所述第一数据进行分析,构建所述第一区块链的第一问题四元组数据,所述第一问题四元组数据包括问题文本、问题实体、属性实体和答案文本;
[0010] 对所述第一问题四元组数据进行训练,得到第一问答模型;
[0011] 在对所述第一问答模型的参数的共识验证结果为通过的情况下,将所述第一问答模型的参数发送到中继链,以使所述中继链在对所述第一问答模型的参数进行共识验证的结果为通过的情况下,将所述第一问答模型的参数发送给第二区块链和第三区块链进行训练,以分别得到第二问答模型和第三问答模型;
[0012] 接收所述中继链在对所述第二区块链的第二问答模型的参数和第三区块链的第三问答模型的参数的共识验证的结果为通过的情况下,发送的所述第二问答模型的参数和第三问答模型的参数;
[0013] 在对所述第二问答模型的参数、第三问答模型的参数的共识验证的结果为通过的情况下,根据所述第二问答模型的参数、第三问答模型的参数、更新所述第一问答模型的参数,并根据所述第一问题四元组数据对更新参数后的所述第一问答模型进行训练,并判断训练过程是否收敛;
[0014] 若未收敛,则根据更新参数后的所述第一问答模型,执行将所述第一问答模型的参数发送到中继链的步骤;
[0015] 若所述第一问答模型、第二问答模型和第三问答模型均收敛,则将所述第一问答模型作为协同问答模型。
[0016] 进一步地,对所述第一问题四元组数据进行训练,得到第一问答模型的步骤包括,[0017] 将所述第一问题四元组数据分割为训练集、验证集和测试集;
[0018] 分别对所述训练集、验证集和测试集的数据进行实体序列标注,得到实体序列训练集、实体序列验证集和实体序列测试集;
[0019] 根据所述实体序列训练集、实体序列验证集和实体序列测试集,构建命名实体识别模型;
[0020] 对所述第一问题四元组数据中的问题与问题之间的相似度进行标注,得到相似关联训练集、相似关联验证集和相似关联测试集;
[0021] 根据相似关联训练集、相似关联验证集和相似关联测试集,构建文本相似度模型;
[0022] 根据所述命名实体识别模型、文本相似度模型、第一问题四元组数据,采用反向传播方法进行训练,得到所述第一问答模型,所述第一问答模型包括带有参数的命名实体识别模型以及带有参数的文本相似度模型。
[0023] 进一步地,根据所述第二问答模型的参数、第三问答模型的参数、更新所述第一问答模型的参数进一步包括,
[0024] 将所述第一问答模型的参数、第二问答模型的参数以及第三问答模型的参数进行加权聚合,得到更新参数;
[0025] 将所述更新参数作为所述第一问答模型的参数。
[0026] 进一步地,根据所述第一问题四元组数据对更新参数后的所述第一问答模型进行训练的步骤中还包括,计算所述第一问答模型的损失函数;
[0027] 判断训练过程是否收敛的步骤包括,判断所述第一问答模型的损失函数是否收敛。
[0028] 进一步地,对所述第一问题四元组数据进行训练,得到第一问答模型之前,所述方法还包括,
[0029] 将区块链节点选举出的一个链上节点作为执行节点,以使所述执行节点对所述第一问题四元组数据进行训练。
[0030] 另一方面,本文实施例还提供了一种,基于区块链的协同问答模型构建方法,包括,
[0031] 接收第一区块链发送的第一问答模型的参数;
[0032] 在对所述第一问答模型的参数的共识验证的结果为通过的情况下将所述第一问答模型的参数发送给第二区块链和第三区块链;
[0033] 接收所述第二区块链发送的第二问答模型的参数;
[0034] 在对所述第二问答模型的参数的共识验证的结果为通过的情况下将所述第二问答模型的参数发送给所述第一区块链和所述第三区块链;
[0035] 接收所述第三区块链发送的第三问答模型的参数;
[0036] 在对所述第三问答模型的参数的共识验证的结果为通过的情况下将所述第三问答模型的参数发送给所述第一区块链和所述第二区块链。
[0037] 另一方面,本文实施例还提供了一种基于区块链的协同问答模型构建装置,包括,[0038] 第一数据获取单元,用于获取构建协同问答模型所需的第一数据;
[0039] 第一问题四元组数据构建单元,用于对所述第一数据进行分析,构建所述第一区块链的第一问题四元组数据,所述第一问题四元组数据包括问题文本、问题实体、属性实体和答案文本;
[0040] 第一问答模型训练单元,用于对所述第一问题四元组数据进行训练,得到第一问答模型;
[0041] 参数发送单元,用于在对所述第一问答模型的参数的共识验证结果为通过的情况下,将所述第一问答模型的参数发送到中继链,以使所述中继链在对所述第一问答模型的参数进行共识验证的结果为通过的情况下,将所述第一问答模型的参数发送给第二区块链和第三区块链进行训练,以分别得到第二问答模型和第三问答模型;
[0042] 参数接收单元,用于接收所述中继链在对所述第二区块链的第二问答模型的参数和第三区块链的第三问答模型的参数的共识验证的结果为通过的情况下,发送的所述第二问答模型的参数和第三问答模型的参数;
[0043] 协同问答模型构建单元,在对所述第二问答模型的参数、第三问答模型的参数的共识验证的结果为通过的情况下,根据所述第二问答模型的参数、第三问答模型的参数、更新所述第一问答模型的参数,并根据所述问题四元组数据对更新参数后的所述第一问答模型进行训练,并判断训练过程是否收敛;若未收敛,则根据更新参数后的所述第一问答模型,执行将所述第一问答模型的参数发送到中继链的步骤;若收敛,则将所述第一问答模型作为协同问答模型。
[0044] 另一方面,本文实施例还提供了一种基于区块链的协同问答模型构建装置,包括,[0045] 参数接收单元,用于接收第一区块链发送的第一问答模型的参数;
[0046] 参数发送单元,用于在对所述第一问答模型的参数的共识验证的结果为通过的情况下,将所述第一问答模型的参数发送给第二区块链和第三区块链;
[0047] 所述参数接收单元进一步用于,接收所述第二区块链发送的第二问答模型的参数;
[0048] 所述参数发送单元进一步用于,在对所述第二问答模型的参数的共识验证的结果为通过的情况下将所述第二问答模型的参数发送给所述第一区块链和所述第三区块链;
[0049] 所述参数接收单元进一步用于,接收所述第三区块链发送的第三问答模型的参数;
[0050] 所述参数发送单元进一步用于,在对所述第三问答模型的参数的共识验证的结果为通过的情况下将所述第三问答模型的参数发送给所述第一区块链和所述第二区块链。
[0051] 另一方面,本文实施例还提供了一种计算机设备,包括存储器、处理器、以及存储在存储器上的计算机程序,处理器执行所述计算机程序时实现上述的方法。
[0052] 最后,本文实施例还提供了一种计算机存储介质,其上存储有计算机程序,计算机程序被计算机设备的处理器运行时,执行上述的方法。
[0053] 本文实施例所述的第一区块链、第二区块链和第三区块链分别对应法院部门、检察院部门和司法行政部门,利用本文实施例,优化了传统司法问答模型的构建方法,各自区块链首先根据自身的数据构建问答模型,然后通过区块链跨链系统来传输和更新不同区块链所构建的问答模型的参数,然后各自区块链再利用其他区块链构建的问答模型的参数对自身的问答模型进行训练,当所有区块链的问答模型训练过程均收敛之后,得到各区块链共同的协同问答模型。实现了利用区块链跨链技术保证数据的安全性,同时又实现了在各自区块链的数据不出库的情况下,利用跨链技术传输各自区块链构建的问答模型的参数,最终得到协同问答模型,保证了各区块链之间数据的独立性。通过本文实施例所构建的协同问答模型,能够更加全面、泛化地回答用户提出的司法问题,提升了用户的使用便利性。

附图说明

[0054] 为了更清楚地说明本文实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本文的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0055] 图1所示为本文实施例一种基于区块链的协同问答模型构建方法的实施系统示意图;
[0056] 图2所示为本文实施例一种基于区块链的协同问答模型构建方法的流程图;
[0057] 图3所示为本文实施例对第一问题四元组数据进行训练,得到第一问答模型的过程;
[0058] 图4所示为本文实施例一种基于区块链的协同问答模型构建方法的流程图;
[0059] 图5所示为本文实施例一种基于区块链的协同问答模型构建装置的结构示意图;
[0060] 图6所示为本文实施例一种基于区块链的协同问答模型构建装置的结构示意图;
[0061] 图7所示为本文实施例基于区块链的协同问答模型构建系统的数据流图;
[0062] 图8所示为本文实施例计算机设备的结构示意图。
[0063] 【附图标记说明】:
[0064] 101、第一区块链;
[0065] 102、第二区块链;
[0066] 103、第三区块链;
[0067] 104、中继链;
[0068] 501、第一数据获取单元;
[0069] 502、第一问题四元组数据构建单元;
[0070] 503、第一问答模型训练单元;
[0071] 504、参数发送单元;
[0072] 505、参数接收单元;
[0073] 506、协同问答模型构建单元;
[0074] 601、参数接收单元;
[0075] 602、参数发送单元;
[0076] 802、计算机设备;
[0077] 804、处理设备;
[0078] 806、存储资源;
[0079] 808、驱动机构;
[0080] 810、输入/输出模块;
[0081] 812、输入设备;
[0082] 814、输出设备;
[0083] 816、呈现设备;
[0084] 818、图形用户接口;
[0085] 820、网络接口;
[0086] 822、通信链路;
[0087] 824、通信总线。

具体实施方式

[0088] 下面将结合本文实施例中的附图,对本文实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本文一部分实施例,而不是全部的实施例。基于本文中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本文保护的范围。
[0089] 需要说明的是,本文的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本文的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、装置、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0090] 需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0091] 如图1所示为本文实施例一种基于区块链的协同问答模型构建方法的实施系统示意图,可以包括:第一区块链101、第二区块链102、第三区块链103以及中继链104,第一区块链101、第二区块链102、第三区块链103与中继链104之间通过网络进行通信,网络可以包括局域网(Local Area Network,简称为LAN)、广域网(Wide Area Network,简称为WAN)、因特网或其组合,并连接至网站、用户设备(例如计算设备)和后端系统。第一区块链101、第二区块链102和第三区块链103分别对应法院链、检察院链和司法行政链,第一区块链101、第二区块链102、第三区块链103分别根据自身存储的数据构建自身的问答模型。中继链104负责第一区块链101、第二区块链102和第三区块链103之间跨链数据传输。其中,第一区块链101、第二区块链102或第三区块链103可以通过一个或多个服务器构建问答模型,服务器上部署有面向司法数据的数据处理系统。可选地,服务器可以是云计算系统的节点(图中未显示),或者每个服务器可以是单独的云计算系统,包括由网络互连并作为分布式处理系统工作的多台计算机。服务器可以运行任何适当的计算系统,使其能够作为第一区块链101、第二区块链102或第三区块链103的区块链网络中的节点。
[0092] 此外,需要说明的是,图1所示的仅仅是本公开提供的一种应用环境,在实际应用中,还可以包括其他应用环境,例如构建多个系统(例如交通管理系统、车辆管理系统、交警管理系统)的协同问答模型也可以在图1所示的第一区块链101、第二区块链102、第三区块链103和中继链104上实现,还可以根据系统的具体数量调整构建协同问答模型的区块链个数,本说明书不做限制。
[0093] 具体地,本文实施例提供了一种基于区块链的协同问答模型构建方法,可以有构建协同问答模型的任意区块链执行,通过区块链跨链系统来传输和更新不同区块链训练的模型参数,从而构建各区块链的协同问答模型。图2所示为本文实施例一种基于区块链的协同问答模型构建方法的流程图。在本图中描述了基于区块链构建协同问答模型的过程,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或装置产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行。具体的如图2所示,所述方法可以包括:
[0094] 步骤201:获取构建协同问答模型所需的第一数据;
[0095] 步骤202:对所述第一数据进行分析,构建所述第一区块链的第一问题四元组数据,所述第一问题四元组数据包括问题文本、问题实体、属性实体和答案文本;
[0096] 步骤203:对所述第一问题四元组数据进行训练,得到第一问答模型;
[0097] 步骤204:在对所述第一问答模型的参数的共识验证结果为通过的情况下,将所述第一问答模型的参数发送到中继链,以使所述中继链在对所述第一问答模型的参数进行共识验证的结果为通过的情况下,将所述第一问答模型的参数发送给第二区块链和第三区块链进行训练,以分别得到第二问答模型和第三问答模型;
[0098] 步骤205:接收所述中继链在对所述第二区块链的第二问答模型的参数和第三区块链的第三问答模型的参数的共识验证的结果为通过的情况下,发送的所述第二问答模型的参数和第三问答模型的参数;
[0099] 步骤206:在对所述第二问答模型的参数、第三问答模型的参数的共识验证的结果为通过的情况下,根据所述第二问答模型的参数、第三问答模型的参数、更新所述第一问答模型的参数,并根据所述第一问题四元组数据对更新参数后的所述第一问答模型进行训练,并判断训练过程是否收敛;
[0100] 步骤207:若未收敛,则根据更新参数后的所述第一问答模型,执行将所述第一问答模型的参数发送到中继链的步骤;
[0101] 步骤208:若所述第一问答模型、第二问答模型和第三问答模型均收敛,则将所述第一问答模型作为协同问答模型。
[0102] 本文实施例所述的第一区块链、第二区块链和第三区块链分别对应法院部门、检察院部门和司法行政部门,利用本文实施例,优化了传统司法问答模型的构建方法,各自区块链首先根据自身的数据构建问答模型,然后通过区块链跨链系统来传输和更新不同区块链所构建的问答模型的参数,然后各自区块链再利用其他区块链构建的问答模型的参数对自身的问答模型进行训练,当所有区块链的问答模型训练过程均收敛之后,得到各区块链共同的协同问答模型。实现了利用区块链跨链技术保证数据的安全性,同时又实现了在各自区块链的数据不出库的情况下,利用跨链技术传输各自区块链构建的问答模型的参数,最终得到协同问答模型,保证了各区块链之间数据的独立性。通过本文实施例所构建的协同问答模型,能够更加全面、泛化地回答用户提出的司法问题,提升了用户的使用便利性。
[0103] 在本文实施例中,第一数据仅在第一区块链上存储,在构建各区块链的协同问答模型时,各区块链获取各自存储的数据并构建问答模型。可以通过自然语言识别技术对第一数据进行分析,构建第一问题四元组数据,可以理解为,所述第一问题四元组数据的问题本文表示问题的文本内容,例如提出的一个完整问题,问题实体表示该问题所针对的主题,属性实体表示针对主题所提出的问题点,答案文本表示该问题的答案。例如,通过本文实施例所述的基于区块链的协同问答模型构建方法构建法检司的协同问答模型时,若法院链的存储的数据为所述第一数据,第一数据为法律、法庭记录等相关的数据,第一问题四元组数据中的问题文本可以例如:“离婚需要什么材料”,则问题实体为:“离婚”,属性实体为:“材料”,答案文本可以为:“若为协议离婚,则需要提供身份证名、结婚证明和离婚协议书”。
[0104] 在本文实施例中,当第一区块链对第一问题四元组数据进行训练,得到第一问答模型后,为了避免第一问答模型的参数被篡改,第一区块链的链上节点对第一问答模型的参数进行共识验证,验证通过后,生成第一问答模型的参数的区块,并存储。通过区块链的共识验证技术,保证了第一问答模型的参数的安全性。在对第一问答模型的参数的共识验证结果为通过的情况下,将第一问答模型的参数发送给中继链,中继链再对接收到的第一问答模型的参数进行共识验证,共识验证通过后,对第一问答模型的参数进行存储,从而保证第一问答模型的参数在跨链传输过程中的安全性。然后中继链将第一问答模型的参数发送给第二区块链和第三区块链,第二区块链或第三区块链接收到第一区块链的第一问答模型的参数后,第二区块链或第三区块链的链上节点首先对第一问答模型的参数进行共识验证,验证通过后对第一问答模型的参数进行存储,从而保证了接收到的第一问答模型的参数的安全性,然后在根据第一问答模型的参数以及自身存储的数据训练自己的问答模型,得到第二问答模型或第三问答模型,将自己的问答模型的参数发送给中继链。中继链在对第二问答模型的参数和第三问答模型的参数的共识验证的结果为通过的情况下,将第二问答模型的参数和第三问答模型的参数发送给第一区块链,第一区块链的链上节点再对接收到的第二问答模型的参数和第三问答模型的参数进行共识验证,共识验证通过后,根据第二问答模型的参数和第三问答模型的参数更新自己生成的第一问答模型的参数,然后在根据自身的第一问题四元组数据对更新后的第一问答模型的参数进行训练,并判断训练过程是否收敛,若未收敛则继续训练第一问答模型,直至所有区块链的问答模型均收敛,各区块链的问答模型相同,得到协同问答模型。
[0105] 需要说明的是,不同区块链均会会监听跨链事务,跨链事务是一种规定的数据结构,里面有确认其他链是否接受成功的字段,当其他链确认接受成功了,该字段会变成true,从而保证数据的一致性。在各区块链训练开始时,需要保证各区块链本地问答模型的结构与初始化参数都是一样的,从而保证最后训练的协同问答模型的模型参数和结构均相同。
[0106] 根据本文的一个实施例,如图3所示,对所述第一问题四元组数据进行训练,得到第一问答模型的步骤包括,
[0107] 步骤301:将所述第一问题四元组数据分割为训练集、验证集和测试集;
[0108] 步骤302:分别对所述训练集、验证集和测试集的数据进行实体序列标注,得到实体序列训练集、实体序列验证集和实体序列测试集;
[0109] 步骤303:根据所述实体序列训练集、实体序列验证集和实体序列测试集,构建命名实体识别模型;
[0110] 步骤304:对所述第一问题四元组数据中的问题与问题之间的相似度进行标注,得到相似关联训练集、相似关联验证集和相似关联测试集;
[0111] 步骤305:根据相似关联训练集、相似关联验证集和相似关联测试集,构建文本相似度模型;
[0112] 步骤306:根据所述命名实体识别模型、文本相似度模型、第一问题四元组数据,采用反向传播方法进行训练,得到所述第一问答模型,所述第一问答模型包括带有参数的命名实体识别模型以及带有参数的文本相似度模型。
[0113] 可以理解为,对将第一问题四元组数据分割成的训练集、验证集和测试集的数据进行实体序列标注,即对第一问题四元组数据标记问题实体的标签,得到的实体序列训练集、实体序列验证集和实体序列测试集中包括了数据属于哪个问题实体,用于后续训练命名实体识别模型。所述命名实体识别模型可以用来识别用户输入的问题的问题实体。对将第一问题四元组数据中问题文本与问题文本之间的相似度打标签,来匹配句子相似度的样本集合,来构建文本相似度模型,用于在命名实体识别模型识别出用户输入的问题的问题实体后,确定与该问题实体相似的问题。然后根据命名实体识别模型、文本相似度模型、第一问题四元组数据,采用反向传播方法进行训练,分别得到带有参数的命名实体识别模型以及带有参数的文本相似度模型,该参数可以表示命名实体识别模型或文本相似度模型中的每一个神经元的数据,可以理解为,第一区块链将训练得到的命名实体识别模型和文本相似度模型中每一个神经元的数据通过跨链传输技术发送给第二区块链和第三区块链(第三区块链采用相同的方法训练自身的问答模型,并将问答模型的参数通过跨链传输技术发送给第二区块链),以使第二区块链根据其他区块链的命名实体识别模型和文本相似度模型中每一个神经元的数据更新自身训练的命名实体识别模型和文本相似度模型中每一个神经元的数据,然后再根据自身的问题四元组数据对自身的命名实体识别模型和文本相似度模型进行训练,从而实现了在其他区块链的数据不出库的情况下,通过其他区块链训练的模型参数构建多个区块链的协同问答模型。需要说明的是,可以利用并行梯度下降算法、Federated Averaging算法、FedProx更新算法等方法,根据其他区块链的问答模型的参数更新自身的问答模型的参数。
[0114] 在通过构建的协同问答模型回答用户问题时,首先通过带有参数的命名实体识别模型识别用户问题的问题实体,然后通过带有参数的文本相似度模型匹配识别出的问题实体,得到与该问题实体相似的问题,最终得到用户问题的答案。
[0115] 根据本文的一个实施例,步骤206中根据所述第二问答模型的参数、第三问答模型的参数、更新所述第一问答模型的参数进一步包括,
[0116] 将所述第一问答模型的参数、第二问答模型的参数以及第三问答模型的参数进行加权聚合,得到更新参数;
[0117] 将所述更新参数作为所述第一问答模型的参数。
[0118] 在本文实施例中,将第一问答模型的参数、第二问答模型的参数以及第三问答模型的参数进行加权聚合,更新第一问答模型的参数的方法,在实现在第二区块链、第三区块链的数据不出库即可训练各区块链的协问答模型的同时,减小了模型训练的计算量。
[0119] 根据本文的一个实施例,保证各区块链最终训练得到的协同问答模型的一致性,根据所述第一问题四元组数据对更新参数后的所述第一问答模型进行训练的步骤中还包括,计算所述第一问答模型的损失函数;
[0120] 判断训练过程是否收敛的步骤包括,判断所述第一问答模型的损失函数是否收敛。
[0121] 可以理解为,各区块链每执行一次迭代(即根据其他区块链的问答模型的参数、自身上一次训练的问答模型的参数以及自身的问题四元组数据对自身的问答模型进行下一次训练的过程),均计算一次本次迭代得到的问答模型的损失值,当损失值小于设定的阈值时,则认为本次迭代得到的问答模型收敛,当各区块链的协同问答模型均收敛时,各区块链的问答模型均相同,即得到了各区块链的协同问答模型。需要说明的是,所述阈值可以通过现有技术中损失函数的计算方法得到,此处不再赘述。
[0122] 在本文实施例中,各区块链的链上节点用于对该区块链训练的问答模型的参数进行共识验证,从而保证训练问答模型的参数不会被篡改,同时,对中继链发送的其他区块链的问答模型的参数进行共识验证,从而保证接收到的其他区块链的问答模型的参数不会被篡改。在训练问答模型的过程中,可以由该区块链的链下服务器训练问答模型,但由于训练问答模型的链下服务器可以为中心化的服务器,因此无法保证问答模型训练过程的安全性。针对上述情况,根据本文的一个实施例,对所述第一问题四元组数据进行训练,得到第一问答模型之前,所述方法还包括,
[0123] 将区块链节点选举出的一个链上节点作为执行节点,以使所述执行节点对所述第一问题四元组数据进行训练。
[0124] 在本文实施例中,可以在区块链的多个链上节点中选举出一个链上节点作为执行节点,由该执行节点执行问答模型训练的过程,由于该执行节点是各链上节点选举得到的,可以理解为,该执行节点的问答模型训练结果被其他链上节点所认同,因此,保证了模型训练过程的安全性。
[0125] 基于同一发明构思,本文实施例还提供了一种基于区块链的协同问答模型构建方法,由中继链执行,如图4所示,包括,
[0126] 步骤401:接收第一区块链发送的第一问答模型的参数;
[0127] 步骤402:在对所述第一问答模型的参数的共识验证的结果为通过的情况下将所述第一问答模型的参数发送给第二区块链和第三区块链;
[0128] 步骤403:接收所述第二区块链发送的第二问答模型的参数;
[0129] 步骤404:在对所述第二问答模型的参数的共识验证的结果为通过的情况下将所述第二问答模型的参数发送给所述第一区块链和所述第三区块链;
[0130] 步骤405:接收所述第三区块链发送的第三问答模型的参数;
[0131] 步骤406:在对所述第三问答模型的参数的共识验证的结果为通过的情况下将所述第三问答模型的参数发送给所述第一区块链和所述第二区块链。
[0132] 在本文实施例中,中继链在接收到任意一方区块链发送的问答模型的参数时,中继链的链上节点对接收到的问答模型的参数进行共识验证,验证通过后,生成该问答模型的参数的提案区块,并存储在链上节点各自的存储区内,从而保证了各区块链的问答模型的参数在跨链传输过程中的安全性。当中继链的链上节点对问答模型的参数的共识验证的结果为通过的情况下,由中继链选举的跨链网关将该问答模型的参数发送给其他方区块链,完成各区块链之间数据的跨链传输。
[0133] 基于同一发明构思,本文实施例还提供了一种基于区块链的协同问答模型构建装置,可以应用于第一区块链、第二区块链或第三区块链中。具体地,如图5所示,包括,[0134] 第一数据获取单元501,用于获取构建协同问答模型所需的第一数据;
[0135] 第一问题四元组数据构建单元502,用于对所述第一数据进行分析,构建所述第一区块链的第一问题四元组数据,所述第一问题四元组数据包括问题文本、问题实体、属性实体和答案文本;
[0136] 第一问答模型训练单元503,用于对所述第一问题四元组数据进行训练,得到第一问答模型;
[0137] 参数发送单元504,用于在对所述第一问答模型的参数的共识验证结果为通过的情况下,将所述第一问答模型的参数发送到中继链,以使所述中继链在对所述第一问答模型的参数进行共识验证的结果为通过的情况下,将所述第一问答模型的参数发送给第二区块链和第三区块链进行训练,以分别得到第二问答模型和第三问答模型;
[0138] 参数接收单元505,用于接收所述中继链在对所述第二区块链的第二问答模型的参数和第三区块链的第三问答模型的参数的共识验证的结果为通过的情况下,发送的所述第二问答模型的参数和第三问答模型的参数;
[0139] 协同问答模型构建单元506,在对所述第二问答模型的参数、第三问答模型的参数的共识验证的结果为通过的情况下,根据所述第二问答模型的参数、第三问答模型的参数、更新所述第一问答模型的参数,并根据所述问题四元组数据对更新参数后的所述第一问答模型进行训练,并判断训练过程是否收敛;若未收敛,则根据更新参数后的所述第一问答模型,执行将所述第一问答模型的参数发送到中继链的步骤;若收敛,则将所述第一问答模型作为协同问答模型。
[0140] 另一方面,本文实施例还提供了一种基于区块链的协同问答模型构建装置,可以应用于中继链中。具体地,如图6所示,包括,
[0141] 参数接收单元601,用于接收第一区块链发送的第一问答模型的参数;
[0142] 参数发送单元602,用于在对所述第一问答模型的参数的共识验证的结果为通过的情况下,将所述第一问答模型的参数发送给第二区块链和第三区块链;
[0143] 所述参数接收单元601进一步用于,接收所述第二区块链发送的第二问答模型的参数;
[0144] 所述参数发送单元602进一步用于,在对所述第二问答模型的参数的共识验证的结果为通过的情况下将所述第二问答模型的参数发送给所述第一区块链和所述第三区块链;
[0145] 所述参数接收单元601进一步用于,接收所述第三区块链发送的第三问答模型的参数;
[0146] 所述参数发送单元602进一步用于,在对所述第三问答模型的参数的共识验证的结果为通过的情况下将所述第三问答模型的参数发送给所述第一区块链和所述第二区块链。
[0147] 基于同一发明构思,本文实施例还提供了一种基于区块链的协同问答模型构建系统,包括第一区块链、第二区块链、第三区块链和中继链。具体地,所述基于区块链的协同问答模型构建系统的数据流图可以如图7所示。需要说明的是,第一区块链、第二区块链和第三区块链训练协同问答模型的过程相同,图7中仅以第一区块链为例,描述了第一区块链训练协同问答模型的过程,基于图7所公开的内容,可以得到第二区块链、第三区块链训练协同问答模型的过程,此处不再赘述。具体地,如图7所示,第一区块链训练协同问答模型的步骤包括:
[0148] 步骤701:第一区块链获取构建协同问答模型所需的第一数据;
[0149] 步骤702:第一区块链对第一数据进行分析,构建第一区块链的第一问题四元组数据;
[0150] 步骤703:第一区块链对第一问题四元组数据进行训练,得到第一问答模型;
[0151] 步骤704:第一区块链在对第一问答模型的参数的共识验证结果为通过的情况下,将第一问答模型的参数发送到中继链;
[0152] 步骤705:中继链在对第一问答模型的参数进行共识验证的结果为通过的情况下,将第一问答模型的参数发送给第二区块链和第三区块链进行训练,并接收第二区块链、第三区块链发送的第二问答模型、第三问答模型的参数;
[0153] 步骤706:中继链在对第二问答模型的参数和第三问答模型的参数的共识验证的结果为通过的情况下,将第二问答模型的参数和第三问答模型的参数发送给第一区块链;
[0154] 步骤707:第一区块链在对第二问答模型的参数、第三问答模型的参数的共识验证的结果为通过的情况下,根据第二问答模型的参数、第三问答模型的参数、更新第一问答模型的参数;
[0155] 步骤708:第一区块链根据第一问题四元组数据对更新参数后的第一问答模型进行训练,并判断训练过程是否收敛;
[0156] 步骤709:若未收敛,则根据更新参数后的第一问答模型,执行步骤704;
[0157] 步骤710:若第一问答模型、第二问答模型和第三问答模型均收敛,则将第一问答模型作为协同问答模型。
[0158] 通过上述装置或系统所取得的有益效果与上述方法所取得的有益效果一致,本说明书实施例不做赘述。
[0159] 如图8所示为本文实施例计算机设备的结构示意图,本文中的装置可以为本实施例中的计算机设备,执行上述本文的方法。计算机设备802可以包括一个或多个处理设备804,诸如一个或多个中央处理单元(CPU),每个处理单元可以实现一个或多个硬件线程。计算机设备802还可以包括任何存储资源806,其用于存储诸如代码、设置、数据等之类的任何种类的信息。非限制性的,比如,存储资源806可以包括以下任一项或多种组合:任何类型的RAM,任何类型的ROM,闪存设备,硬盘,光盘等。更一般地,任何存储资源都可以使用任何技术来存储信息。进一步地,任何存储资源可以提供信息的易失性或非易失性保留。进一步地,任何存储资源可以表示计算机设备802的固定或可移除部件。在一种情况下,当处理设备804执行被存储在任何存储资源或存储资源的组合中的相关联的指令时,计算机设备802可以执行相关联指令的任一操作。计算机设备802还包括用于与任何存储资源交互的一个或多个驱动机构808,诸如硬盘驱动机构、光盘驱动机构等。
[0160] 计算机设备802还可以包括输入/输出模块810(I/O),其用于接收各种输入(经由输入设备812)和用于提供各种输出(经由输出设备814)。一个具体输出机构可以包括呈现设备816和相关联的图形用户接口(GUI)818。在其他实施例中,还可以不包括输入/输出模块810(I/O)、输入设备812以及输出设备814,仅作为网络中的一台计算机设备。计算机设备802还可以包括一个或多个网络接口820,其用于经由一个或多个通信链路822与其他设备交换数据。一个或多个通信总线824将上文所描述的部件耦合在一起。
[0161] 通信链路822可以以任何方式实现,例如,通过局域网、广域网(例如,因特网)、点对点连接等、或其任何组合。通信链路822可以包括由任何协议或协议组合支配的硬连线链路、无线链路、路由器、网关功能、名称服务器等的任何组合。
[0162] 需要说明的是,当本文实施例的第一区块链、第二区块链、第三区块链或中继链的各链上节点为本实施例所述的计算机设备802实现本说明书实施例所述的方法时,也可以不包括呈现设备816和相关联的图形用户接口(GUI)818等。例如仅包括处理设备804、存储资源806和网络接口820组成的计算机最小系统。
[0163] 对应于图2‑图4、图7中的方法,本文实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述步骤。
[0164] 本文实施例还提供一种计算机可读指令,其中当处理器执行所述指令时,其中的程序使得处理器执行如图2‑图4、图7所示的方法。
[0165] 应理解,在本文的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本文实施例的实施过程构成任何限定。
[0166] 还应理解,在本文实施例中,术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系。例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
[0167] 本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本文的范围。
[0168] 所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0169] 在本文所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
[0170] 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本文实施例方案的目的。
[0171] 另外,在本文各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0172] 所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本文的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本文各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read‑Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0173] 本文中应用了具体实施例对本文的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本文的方法及其核心思想;同时,对于本领域的一般技术人员,依据本文的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本文的限制。