一种基于行为基的事件知识表示方法转让专利

申请号 : CN202111186524.0

文献号 : CN114004223B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 逄金辉胡英帅张艳许慧楠

申请人 : 北京理工大学

摘要 :

本发明公开了一种基于行为基的事件知识表示方法,涉及事件知识表示技术领域,其技术方案要点是:以驱动事件的行为为核心,将事件的文本表示通过行为代数和抽象语法符号化,并构建自底向上依次为行为基层、动作层和事件层的Behavior Base GCN模型,将结构化的信息通过模型转换为向量表示。本发明的方法通过在数学理论的推演下,研究行为代数之间的同态和同构保证行为集合的完备性,通过GCN模型的图表示学习框架,以从行为基逐层构建事件的表示和事件与事件的关系,其泛化性和鲁棒性也较强。

权利要求 :

1.一种基于行为基的事件知识表示方法,其特征是:以驱动事件的行为为核心,构建自底向上依次为行为基层、动作层和事件层的Behavior Base GCN模型,具体包括以下步骤:S1、构建行为基层,用行为基来表示事件的原子行为,通过定义行为函数表示具体情境下的状态空间转换,然后基于行为理论和情境语义提出行为基的概念来形式化动作集;

S2、构建动作层,通过行为基层的行为基以及其交互构造出动作集合,所述动作集合为事件中主体的动作集合,动作集合中的每一个元素均表示另一个信息转换函数,且信息转换函数作为行为发生的语义解释;

S3、构建事件层,用于表示具有基本组件的原子事件,且事件层中包括事件发生的主体、客体、动作、时间和地点的信息;所述事件层中的动作由动作层给出,且该动作为该事件发生的触发器;

其中,步骤S1至步骤S3中,采用情境语义代替传统的动词语义描述事件的行为,并通过信息转换识别事件的发生,确保现实世界事件发生的真实性;

在步骤S3中,事件用数学定义表示,具体方法为:

1)假设事件由基于行为语义的原子事件和组合事件组成,其中原子事件是不可分的、原始的且不可约的单元;

并且,组合事件通过算子和集合来表示,原子事件正式表示为五元组:e={sub,act,obj,time,loc},

其中,act表示一个事件的发生行为,即事件的触发器,act在行为基层中生成,sub、obj、time、loc分别是行为的主体、客体、发生时间、发生地点;

2)基于行为理论将事件与事件的关系形式化,组合事件由代数运算符的行为表达式定义,其中,事件算子如下:·e·e表示两种事件的联合组合;

·e;e表示两个事件的顺序组合;

·e||e表示两个事件的平行组合;

·e|e表示两个事件的选择组合;

· 表示一个事件是另外一个事件的条件;

· 表示两个事件是彼此的条件;

·λ(e).e表示事件是基于参数的λ抽象;

·e(e)表示β应用α而β是λ抽象。

2.根据权利要求1所述的一种基于行为基的事件知识表示方法,其特征是:步骤S1中的具体方法为:对于“借书”这个事件,定义Agent A借给Agent B书,在该事件发生后,A拥有的书的数量减少的同时B拥有的书的数量增加,根据A和B对应书的数量的变化断定事件的发生,确保事件发生的真实性,行为函数的定义方法为:

1)主体和客体的状态空间由一组笛卡尔积表示,I=Infsub×Infobj,行为函数F:I→I,行为函数表示状态空间的一组映射关系,即为行为发生的情境语义的解释函数;

2)将状态空间扩展到信息集,在“借书”事件中加入书本类型这个属性,将Agent的状态空间扩展到信息集:Iagent={(书本类型,书本数量)}

IA×B(1)={(数学,1),(数学,0),(计算机,0),(计算机,1)}IA×B(2)={(数学,0),(数学,1),(计算机,0),(计算机,1)}AgentA借给AgentB一本数学书的映射表示为:

IA×B(1)→IA×B(2)

且在行为基层,采用以下矩阵表示IA×B(1)→IA×B(2)的状态转换:所述Behavior Base GCN模型的行为基层的邻接矩阵表示为该行为的状态转移函数,同时输入节点的特征标签;

3)给出行为代数的定义,记行为集为B,行为函数集的子集为C,E为同类交互行为表达式集的子集,Q为规则集,集合C和E均遵守Q中约定的规则,则四元组∑B=(B,C,E,Q)为一个行为代数;

其中,当多个类型的角色处于特定的组或子组织中时,将众多行为代数中的∑‑同态行为代数扩展为具有行为函数集的行为范畴;

4)对于∑‑同态f,将∑H→∑G作为从行为代数∑H到行为代数∑G的映射,则满足:∑B=(B,C,E,Q)和∑G=(BO,CO,EO,QO)为行为代数;对于C∪E中的任何a,f(a)在C0∪E0中;对于C∪E中的每个a,C0∪E0中恰好有一个元素被指定为f(a);

5)给定∑‑同态f:∑H→∑G和∑‑同态g:∑G→∑H,当且仅当 且 时,定义f: 是∑‑同构。

3.根据权利要求1所述的一种基于行为基的事件知识表示方法,其特征是:步骤S2中,通过行为代数的引入定义动作集合;由于动作是事件的触发器,在步骤S1中通过状态空间的转换解释了事件中真实发生的动作,行为基层输出了动作集合的向量表示;利用矩阵及标签特征可以得到“借”这个动作的表示,在动作层,把这些动作作为GCN中的节点,补充事件其他信息作为标签特征训练出事件的表示。

说明书 :

一种基于行为基的事件知识表示方法

技术领域

[0001] 本发明涉及事件知识表示技术领域,更具体地说,它涉及一种基于行为基的事件知识表示方法。

背景技术

[0002] 事件通常指包含参与者在内的某种动作或情况的发生,或事件状态的改变。在形式上,事件的组成要素通常包括事件的触发词或类型、事件的参与者、事件发生的时间或地点等。在现实世界中,事件通常信息的一种较为结构化的表示形式。现有的研究主要存在以下问题:
[0003] (一)存在稀疏性,不利于大规模表示:
[0004] 早期的研究大多采用离散的事件表示,通常将事件表示为由事件元素构成的元组。例如将事件表示为对象的集合、对象间的关系或属性以及事件发生的时间这种三元组,后来有研究者加入其他的信息构成更多元组来表示事件。但是离散的表示形式存在的最大问题就是稀疏性,我们很难通过这种元组来表示大规模的事件。
[0005] (二)情境语义相关性和事件交互性难以兼顾:
[0006] 随着深度学习的发展,人们开始尝试使用深度神经网络为事件学习稠密的向量表示。常用的方法是直接将文本中的单词向量化,这种方法的缺点就是使得相关性不强但文本高度相似的事件表示相近,例如:“She throws football on the playground(她在操场上扔足球)”与“She throws bomb on the playground(她在操场上扔炸弹)”会得到相近的向量表示,尽管两个事件语义上并不相似。
[0007] (三)语义信息丢失和泛化性差:
[0008] 前人的研究使用动词来定义事件的发生,由于自然语言的模糊性,从已识别的动词触发器映射到相应的事件类型可能会导致信息的丢失。只在动词短语最重要的概念层面上建模事件也不能完全保证事件发生的情况。为了保留事件丰富的语义信息,相关研究将事件内信息、事件间信息、外部知识等多种类型的信息融入事件表示中。但是相关研究需要用预定义的特定领域事件模式来提取现实世界的事件,并补充特定的信息来保证下游训练任务的性能,这种方式学习到的事件表示,往往缺乏较好的泛化能力。
[0009] 因此,基于事件中行为发生的情境语义,而不仅仅是单纯的动词语义,本发明旨在解决上述问题,提出一种基于行为基的事件知识表示方法。

发明内容

[0010] 本发明的目的是针对解决上述问题,提供一种基于行为基的事件知识表示方法。
[0011] 本发明的上述技术目的是通过以下技术方案得以实现的:一种基于行为基的事件知识表示方法,以驱动事件的行为为核心,构建自底向上依次为行为基层、动作层和事件层的Behavior Base GCN模型,具体包括以下步骤:
[0012] S1、构建行为基层,用行为基来表示事件的原子行为,通过定义行为函数表示具体情境下的状态空间转换,然后基于行为理论和情境语义提出行为基的概念来形式化动作集;
[0013] S2、构建动作层,通过行为基层的行为基以及其交互构造出动作集合,所述动作集合为事件中主体的动作集合,动作集合中的每一个元素均表示另一个信息转换函数,且信息转换函数为行为发生的语义解释;
[0014] S3、构建事件层,用于表示具有基本组件的原子事件,且事件层中包括事件发生的主体、客体、动作、时间和地点的信息;所述事件层中的动作由动作层给出,且该动作为该事件发生的触发器;
[0015] 其中,步骤S1至步骤S3中,采用情境语义代替传统的动词语义描述事件的行为,并通过信息转换识别事件的发生,确保现实世界事件发生的真实性。
[0016] 进一步地,步骤S1中的具体方法为:对于“借书”这个事件,定义Agent A借给Agent B书,在该事件发生后,A拥有的书的数量减少的同时B拥有的书的数量增加,根据A和B对应书的数量的变化断定事件的发生,确保事件发生的真实性,行为函数的定义方法为:
[0017] 1)主体和客体的状态空间由一组笛卡尔积表示,I=Infsub×Infobj,行为函数F:I→I,行为函数表示状态空间的一组映射关系,即为行为发生的情境语义的解释函数;
[0018] 2)将状态空间扩展到信息集,信息集需要添加一些必要的信息,在“借书”事件中我们加入书本类型这个属性,将Agent的状态空间扩展到信息集:
[0019] Iagent={(书本类型,书本数量)}
[0020] IA×B(1)={(数学,1),(数学,0),(计算机,0),(计算机,1)}
[0021] IA×B(2)={(数学,0),(数学,1),(计算机,0),(计算机,1)}
[0022] AgentA借给AgentB一本数学书的映射表示为:
[0023] IA×B(1)→IA×B(2)
[0024] 且在行为基层,采用以下矩阵表示IA×B(1)→IA×B(2)的状态转换:
[0025]
[0026] 所述Behavior BaseGCN模型的行为基层的邻接矩阵表示为该行为的状态转移函数,同时输入节点的特征标签;
[0027] 3)给出行为代数的定义,记行为集为B,行为函数集的子集为C,E为同类交互行为表达式集的子集,Q为规则集,集合C和E均遵守Q中约定的规则,则四元组∑B=(B,C,E,Q)为一个行为代数;
[0028] 其中,当多个类型的角色处于特定的组或子组织中时,将众多行为代数中的∑‑同态行为代数扩展为具有行为函数集的行为范畴;
[0029] 4)对于∑‑同态f,将∑H→∑G作为从行为代数∑H到行为代数∑G的映射,则满足:
[0030] ∑B=(B,C,E,Q)和∑G=(BO,CO,EO,QO)为行为代数;对于C∪E中的任何a,f(a)在C0∪E0中;对于C∪E中的每个a,C0∪E0中恰好有一个元素被指定为f(a);
[0031] 5)给定∑‑同态f:∑H→∑G和∑‑同态g:∑G→∑H,当且仅当 且 时,定义f: 是∑‑同构。
[0032] 在本方案中,上述“借书”事件可等同替换为“开发票”事件,此处根据真实文本对话举出一列来说明本方案的Behavior Base GCN模型的构建过程:
[0033] 文本数据来自购买者与商家的对话:
[0034] context:["我要开发票","您好,麻烦您提供一下发票抬头(公司名称,公司税号或者个人名称)、邮寄地址(电子发票不用哦)、电话、收货人、邮编,客服会帮您登记开发票的哦"];
[0035] 为了表示开发票这一行为基,behavior:["开"],"object":["发票"];需要构建如下的状态空间,其中信息集扩展为state:["NAME,ORDER NUMBER,EIN,PHONE NUMBER,ADDRESS,BANK ACCOUNT","INVOICE"];然后根据行为函数得到相应的动作表示,行为函数的状态转换解释为商家开具发票,顾客得到发票。最后加入订单的其他信息得到发票类事件的表示。
[0036] 进一步地,步骤S2中,通过行为代数的引入定义动作集合。由于动作是事件的触发器,我们在步骤S1中通过状态空间的转换解释了事件中真实发生的动作,行为基层输出了动作集合的向量表示。我们利用矩阵及标签特征可以得到“开具”这个动作的表示,在动作层,我们把这些动作作为GCN中的节点,补充事件其他信息作为标签特征训练出事件的表示。
[0037] 进一步地,在步骤S3中,事件用数学定义表示,具体方法为:
[0038] 1)假设事件由基于行为语义的原子事件和组合事件组成,其中原子事件是不可分的、原始的且不可约的单元;
[0039] 并且,组合事件通过算子和集合来表示,原子事件正式表示为五元组:
[0040] e={sub,act,obj,time,loc},
[0041] 其中,act为一个事件的发生行为,是事件的触发器,act在行为基层中生成,sub、obj、time、loc分别是行为的主体、客体、发生时间、发生地点;
[0042] 2)基于行为理论将事件到事件的关系形式化,综合事件由代数运算符的行为表达式定义,其中,事件算子如下:
[0043] ·e·e表示两种事件的联合组合;
[0044] ·e;e表示两个事件的顺序组合;
[0045] ·e||e表示两个事件的平行组合;
[0046] ·e|e表示两个事件的选择组合;
[0047] · 表示一个事件是另外一个事件的条件;
[0048] · 表示两个事件是彼此的条件;
[0049] ·λ(e).e表示事件是基于参数的λ抽象;
[0050] ·e(e)表示β应用α而β是λ抽象。
[0051] 综上所述,本发明具有以下有益效果:
[0052] 1、本发明的方法提出了基于行为代数和行为理论来构造事件表示,通过从数学集合论和代数理论的角度出发,为事件中的原子行为定义了抽象语法,通过引入行为函数并研究实体的行为代数之间的同态和同构,将事件的表示符号化和形式化,为事件表示提供了更多的真实性;
[0053] 2、本发明的方法提出了基于图神经网络的三层结构模型来表示以行为驱动的事件,通过将结构化的信息利用神经网络学习为稠密的向量表示,并将事件与事件的关系嵌入其中,将事件嵌入一个连续的向量空间,使事件表示为计算机可以理解的形式,为计算机进行分析提供便利。

附图说明

[0054] 图1是本发明实施例中三层GCN模型的示意图;
[0055] 图2是本发明实施例中的构建的过程示意图。

具体实施方式

[0056] 以下结合附图1‑2对本发明作进一步详细说明。
[0057] 实施例:一种基于行为基的事件知识表示方法,如图1所示,以驱动事件的行为为核心,构建自底向上依次为行为基层、动作层和事件层的三层Behavior Base GCN模型(如图1所示),具体包括以下步骤:
[0058] S1、构建行为基层,用行为基来表示事件的原子行为,通过定义行为函数表示具体情境下的状态空间转换,然后基于行为理论和情境语义提出行为基的概念来形式化动作集;
[0059] 具体方法为:定义Agent A借给Agent B某数量对的书,在该事件发生后,A拥有的书的数量减少的同时B拥有的书的数量增加,根据A和B对应书的数量的变化断定事件的发生,确保事件发生的真实性,在行为基层,事件发生的潜在语义空间可以由两个状态空间的转换定义给出,引入数学理论,使用数学语言来定义和识别行为,行为改变了主体和客体的状态,因此,行为函数的定义方法为:
[0060] 1)主体和客体的状态空间由一组笛卡尔积表示,I=Infsub×Infobj,行为函数F:I→I,行为函数表示状态空间的一组映射关系,即为行为发生的情境语义的解释函数;
[0061] 2)将状态空间扩展到信息集,信息集需要添加一些必要的信息,在“借书”事件中我们加入书本类型这个属性,将Agent的状态空间扩展到信息集:
[0062] Iagent={(书本类型,书本数量)}
[0063] IA×B(1)={(数学,1),(数学,0),(计算机,0),(计算机,1)}
[0064] IA×B(2)={(数学,0),(数学,1),(计算机,0),(计算机,1)}
[0065] AgentA借给AgentB一本数学书的映射表示为:
[0066] IA×B(1)→IA×B(2)
[0067] 且在行为基层,采用以下矩阵表示IA×B(1)→IA×B(2)的状态转换:
[0068]
[0069] 所述Behavior Base GCN模型的行为基层的邻接矩阵表示为该行为的状态转移函数,同时输入节点的特征标签。
[0070] S2、构建动作层,通过行为基层的行为基以及其交互构造出动作集合,所述动作集合为事件中主体的动作集合,动作集合中的每一个元素均表示另一个信息转换函数,且信息转换函数为行为发生的语义解释;其中,动作集合通过行为代数的引入定义。
[0071] S3、构建事件层,用于表示具有基本组件的事件,且事件层中包括事件发生的主体、客体、动作、时间和地点的信息;所述事件层中的动作由动作层给出,且该动作为该事件发生的触发器;
[0072] 其中,在整个过程中,采用情境语义代替传统的动词语义来描述事件的行为,通过信息转换来识别事件的发生,从而保证现实世界事件发生的真实性;
[0073] 其中,事件用数学定义表示,具体方法为:
[0074] 1)假设事件由基于行为语义的原子事件和合成事件两个独立的语义单元组成,其中原子事件是不可分的、原始的且不可约的单元;
[0075] 并且,组合事件通过算子和集合来表示,原子事件正式表示为五元组:
[0076] e={sub,act,obj,time,loc},
[0077] 其中,act为一个事件的发生行为,是事件的触发器,act在行为基层中生成,sub、obj、time、loc分别是行为的主体、客体、发生时间、发生地点;
[0078] 2)基于行为理论将事件到事件的关系形式化,综合事件由代数运算符的行为表达式定义。
[0079] 在本实施例中,由行为驱动的事件图由三个图卷积网络(GCN)自底向上依次构成,如图2所示。
[0080] 在本实施例中,事件算子总结如下:
[0081] ·e·e表示两种事件的联合组合。
[0082] ·e;e表示两个事件的顺序组合。
[0083] ·e||e表示两个事件的平行组合。
[0084] ·e|e表示两个事件的选择组合。
[0085] · 表示一个事件是另外一个事件的条件。
[0086] · 表示两个事件是彼此的条件。
[0087] ·λ(e).e表示事件是基于参数的λ抽象。
[0088] ·e(e)表示β应用α而β是λ抽象。
[0089] 在事件的运算中,通过数学验证可以得到以下规则:
[0090] ·(α·β)·γ=α·(β·γ);
[0091] ·(α;β);γ=α;(β;γ);
[0092] ·α||β=β||α;
[0093] ·α|β=β|α;
[0094] ·
[0095] ·
[0096] ·α;(β|γ)=(α;β)|(α;γ);
[0097] ·α·(β|γ)=(α·β)|(α·γ);
[0098] ·
[0099] ·λ(α).(β|γ)=λ(α).β|λ(α).γ;
[0100] ·α(β|γ)=α(β)|α(γ)。
[0101] 在本发明的上述实施例中,最终通过自底向上的三层GCN模型构造出了一种新型的事件表示方法,可以根据实际的需要选择其中的部分或者全部模块来实现本发明方案的目的。
[0102] 通过本发明的上述实施例,提出了基于行为代数和行为理论来构造事件表示,通过从数学集合论和代数理论的角度出发,为事件中的原子行为定义了抽象语法,通过引入行为函数并研究实体的行为代数之间的同态和同构,将事件的表示符号化和形式化,为事件表示提供了更多的真实性;同时,本发明的方法提出了基于图神经网络的三层结构模型来表示以行为驱动的事件,通过将结构化的信息利用神经网络学习为稠密的向量表示,并将事件与事件的关系嵌入其中,将事件嵌入一个连续的向量空间,使事件表示为计算机可以理解的形式,为计算机进行分析提供便利。
[0103] 本具体实施例仅仅是对本发明的解释,其并不是对本发明的限制,本领域技术人员在阅读完本说明书后可以根据需要对本实施例做出没有创造性贡献的修改,但只要在本发明的权利要求范围内都受到专利法的保护。