基于事件与传播结构的谣言检测方法转让专利
申请号 : CN202110903231.3
文献号 : CN113343126B
文献日 : 2021-12-21
发明人 : 梁刚 , 杨进 , 高玉君 , 许春 , 蒋方婷 , 奚金霞 , 李劭
申请人 : 四川大学
摘要 :
权利要求 :
1.基于事件与传播结构的谣言检测方法,其特征在于:包括下述步骤:步骤1、从获取的公开数据集E所包含的事件 中提取源帖信息、转发关系以及其他特征,其中,其他特征包括用户信息、粉丝数、点赞数,k表示的是事件的序数,ek表示第k个事件,nk为第k个事件ek中的单个帖子,rk为源帖,每个 代表第j个相关的转发帖或响应帖,且j=1…k;
步骤2、使用基于情感极性的BERT对源帖信息进行文本数据增强,进而获得源帖的增强文本特征向量D,包括以下具体步骤:步骤2.1、将源帖信息中的文本数据进行情感极性标注,获得标记数据集S,且S={{p1,y1},{p2,y2},...,{pN,yN}},其中,N为被标记的数据个数,pN为第N个被标记的数据,yN为第N个被标记数据的情感极性标签;
步骤2.2、在标记数据集S上对预训练的BERT进行微调,直至收敛;即将BERT中能对文本的语义相似性进行分类的段表征{EA,EB}改为与标注好的情感极性有关联的情感极性表征Eemotion,从而根据标记数据集上的情感极性标签进行学习;其中,EA表示改词属于句向量A,EB表示词属于句向量B;A,B分别为句向量,且当输入文本为非单一的情感极性时,需调整向量的大小以兼容标签大小;
步骤2.3、对于每次迭代i=1,2,...N,从标记数据集S中抽取句子pi,随机屏蔽k个词,通过基于情感极性的双向编码器表示技术模型根据语境和情感极性预测被屏蔽词的原始词汇索引I,且I=P(·|y,S\{pi}),从而获得与句子情感极性标签相匹配的各种词Term={trem1,trem2,...,tremk},并获得文本特征向量Word={word1,word2,...,wordn};其中,wordi为文本中第i个特征词,S\{pi}表示除去被屏蔽词之外的上下文,y表示除去被屏蔽词之外的上下文的标签,P表示基于情感标记和去除屏蔽词后的句子得到预测屏蔽词的条件概率,tremk表示是第k个情感极性词;
步骤2.4、形成源帖的增强文本特征向量D;
步骤3、将源贴的增强文本特征向量D加入到传播关系的根节点中,与传播关系T结合,形成树型传播结构Gk;
步骤4、将树型传播结构Gk解析成正向树型传播结构 和反向树型传播结构 并将正向和反向两种树型传播结构分别输入到正向的图卷积神经网络模型以及反向的图卷积F R
神经网络模型中,获得传播特性H和扩散特性H ,正向的图卷积神经网络模型和反向的图卷积神经网络模型共同构成基于事件与传播结构的双向图卷积神经网络模型;
步骤5、对正向树型传播结构 以及反向树型传播结构 中包含根节点以及转发节点在内的所有节点进行节点增强操作;
步骤6、使用全连接将基于事件与传播结构的双向图卷积神经网络层与softmax分类函数进行连接,根据softmax分类函数的输出结果用于判断待检测的事件是否为谣言,所述softmax分类函数为: 其中Vi表示分类的类别,i表示类别索引,C表示分类的种类,Si表示输出最大对应的类别。
2.根据权利要求1所述的基于事件与传播结构的谣言检测方法,其特征在于:所述BERT采用双向语言模型从正反两个方向对生成新语句的概率进行建模,再由独立训练的正向语言模型的浅层和反向语言模型的浅层连接而成,形成BERT模型;其中,正向语言模型预测序列的概率表示为: pi表示选择的句子,反向语言模型预测序列的概率表示为: pi表示选择的句子。
3.根据权利要求1所述的基于事件与传播结构的谣言检测方法,其特征在于:所述步骤
3具体为:
将源贴的增强后文本数据的文本特征向量D,且D={word1,word2,…,wordn,tag1,tag2,…,tagn,emotion1,emotion2,…,emotionn}加入到传播关系的根节点中,与传播关系T结合,即concat(D,T),形成树型传播结构Gk,且Gk=
点集合,Bk表示回复帖到转发帖和回复帖到响应帖所形成的边集合;若 对 为一个反馈,即 为 的转发帖或响应帖,则 为一条边,即 若 对rk为一个反馈,则 为一条边,即 以此类推。
4.根据权利要求1所述的基于事件与传播结构的谣言检测方法,其特征在于:所述步骤
4包括下述具体步骤:
步骤4.1、将谣言从根结点开始,自源贴开始通过转发及响应关系形成自前向后的正向树型传播结构 且 和将由社区内各个分散节点聚集到上层根节点表示形成自后向前的反向树型传播结构 且步骤4.2、在每个训练轮次epoch,采用随机删边技术避免过拟合问题,获得邻接矩阵A′,且A′=Gk‑Adrop,其中,Adrop是使用Ne×p从原始边集合中随机采样的矩阵结构,Ne为边的F
总数,p为删除率;在正向树型传播结构 中,邻接矩阵表示为A =A′,在反向树型传播结R T
构 中,邻接矩阵表示为A=A′;
步骤4.3、将构造好的正向树型传播结构 和反向树型传播结构 分别输入到FGCNF R F F F R R R F模型和RGCN模型中,获得传播特性H 和扩散特性H,且H=σ(AXW),H=σ(AXW);其中,Hn×v F R n×v R
∈R 为隐藏层特性,W为FGCN的滤波参数矩阵,H ∈R 为隐藏层特性,W为RGCN的滤波参数矩阵,σ(·)为ReLU激活函数。
5.根据权利要求1所述的基于事件与传播结构的谣言检测方法,其特征在于:所述步骤
5包括下述具体步骤:
n×d
步骤5.1、将原始特征矩阵X∈R 输入到FRBi‑GCN模型中,通过k层GCL后形成的隐藏特征向量Hk;
步骤5.2、再将第k层节点的隐藏特征向量Hk与k‑1层节点的隐藏特征向量Hk‑1进行拼接,得到新的隐藏特征向量 且
步骤5.3、将传播表示 和扩散表示 的节点表示信息分别使用均值池化进行聚合操作 ,得 到 和 将二者 进 行拼 接得 到
6.根据权利要求1所述的基于事件与传播结构的谣言检测方法,其特征在于:所述传播关系由源帖和转发贴之间的转发关系及包括用户信息,粉丝数,点赞数在内的其他特征构成。
说明书 :
基于事件与传播结构的谣言检测方法
技术领域
背景技术
快,范围广,即时性强等优点。然而,由于发布信息时缺乏有效的监管手段,导致社会网络平
台同时也成为谣言传播的温床。根据新浪微博2021年发布的《微博辟谣2020年度报告》显
示,三分之一的谣言始发于社会网络。这些信息在未经处理的情况下可能被迅速地歪曲和
放大,从而误导公众。谣言无节制地在网络上传播不仅影响社会和谐与稳定。因此,快速有
效地检测出社会网络谣言,对净化网络环境,维护公共安全至关重要。
网络平台,如Twitter、Facebook与新浪微博,在其平台上都是采用人工的谣言检测方法。该
方法的优点是简单、准确率高。缺点是需要检测者对用户或平台举报的信息进行逐条判断,
单靠人力对每天产生的数以亿计的数据进行检测,具有明显的滞后性,且检测的质量依赖
于检测者的知识背景与经验,对个人的知识与经验要求极高,也有可能因为个人因素而造
成误判。
数据的特征;其次,利用选择与提取的特征在训练数据集上训练分类模型;最后,使用训练
好的模型对训练数据集外的数据进行预测,经过不断的评估与优化,判断数据是否是谣言。
对于基于机器学习的谣言检测方法而言,如何选择与提取出显著的特征来表征数据对谣言
检测效果至关重要,其优点是相对简单且具有一定的可解释性。缺点是依赖人工进行特征
的选择,耗费人力物力的同时,得到特征向量的鲁棒性较差。且试图用一套通用的特征集合
表征社会网络不同平台不同语言中的全部信息,训练出来的谣言分类器容易陷入过拟合状
态,导致检测准确度不高。
类效果。一般来说,这类方法的在性能上优于上述两类方法。但该方法对数据的需求量大,
当样本数据较少时,训练出来的分类器仍存在分类偏倚问题,且模型训练周期更长,训练出
的模型可解释性差,同时,对GPU的要求较高。
人对谣言检测领域的经验。无法灵活准确地表征社会网络中各种不同类型的谣言以及非谣
言数据。因此,训练出来的谣言分类器往往泛化能力不强,即使训练出来的分类器在训练数
据集合中具有较好的表现,在实际应用中的实用性也较低,且存在检测率低,误报率较高的
问题。现有的谣言检测方法在识别谣言的过程中往往只关注文本内容,模因信息以及传播
结构等特征,缺乏对文本情感极性等重要特征的研究,而情感极性的改变可能完全改变文
本的语义甚至影响到最终训练出来的谣言分类器对信息的鉴别结果。
用的信息是社会网络谣言检测中亟待解决的问题之一。传统的RNN、LSTM、GRU等只关注谣言
信息的时间序列和句子等变长序列信息建模等方面,只能解决在长序列训练过程中,随着
神经网络层数的加深而造成的梯度消失以及梯度爆炸的问题,无法抑制谣言传播与扩散结
构对谣言检测的影响。现有的CNN无法处理谣言传播过程中的全局结构关系,而使用单向的
GCN容易忽略谣言的传播方向这一重要线索。从而导致谣言检测的准确率难以大幅度提升。
传播之间的关联,导致谣言检测过程中,无法通过谣言之间的关系而判断该谣言的共同主
体或相同主题所关联的谣言,从而造成谣言检测的准确率受到影响。因此,如何提高谣言传
播过程中的关联性,同时,考虑社会网络之中的各个相邻节点之间的合作与共享是谣言检
测领域需要解决的问题。
发明内容
的问题导致的检测准率不高的问题,提出了一种事件与传播结构相结合的社交网络谣言检
测方法,通过事件检测克服现有方法的特性稀疏与检测冷启动问题,在检测过程中引入
BERT模型引增强检测数据的文本特征,在检测方法中引入适合社交网络的图神经网络,能
够针对灵活适应社交网络的节点数目的变换关系的变化进行数据分析。
表示的是事件的序数,ek表示第k个事件,nk为第k个事件ek中的单个帖子,rk为源帖,每个
代表第j个相关的转发帖或响应帖,且j=1…k;
第j个相关的转发帖或响应帖,且j=1…k。
源帖的增强文本特征向量D;
F R
RGCN(反向的图卷积神经网络)模型中,获得传播特性H和扩散特性H ,FGCN模型和RGCN模型
共同构成基于事件与传播结构的双向图卷积神经网络(FRBi‑GCN)模型;
述softmax分类函数为: 其中Vi表示分类的类别,i表示类别索引,C表示分类
的种类,Si表示输出最大对应的类别,e为自然对数,e优选取值为2.718,softmax分类函数
最终选择Si值最大的Vi作为分类的类别。
为第N个被标记数据的情感极性标签;
感极性有关联的情感极性表征(Emotional PolarityEmbedding,EPE)Eemotion,从而根据标
记数据集上的情感极性标签进行学习;其中,EA表示改词属于句向量A,EB表示词属于句向量
B;A,B分别为句向量,且当输入文本为非单一的情感极性时,需调整向量的大小以兼容标签
大小;
{pi}),从而获得与句子情感极性标签相匹配的各种词Term={trem1,trem2,...,tremk},并
获得文本特征向量Word={word1,word2,...,wordn};其中,wordi为文本中第i个特征词,S\
{pi}和y分别表示除去被屏蔽词之外的上下文及其标签,P表示基于情感标记和去除屏蔽词
后的句子得到预测屏蔽词的条件概率,tremk表示是第k个情感极性词;
记,如@、#等,emotioni为标注的情感极性。
和反向语言模型的浅层连接而成,形成BERT模型;其中,正向语言模型预测序列的概率表示
为: pi表示选择的句子,反向语言模型预测序
列的概率表示为: pi表示选择的句子。
关系的根节点中,与传播关系T结合,即concat(D,T),形成树型传播结构Gk,且Gk=
其中,tagi,为文本中第i个特殊符号标记,如@、#等,emotioni为标注的情感极性,
Vk表示图的
顶点集合,Bk表示回复帖到转发帖和回复帖到响应帖所形成的边集合;若 对 为一个
反馈,即 为 的转发帖或响应帖,则 为一条边,即 若 对rk为一个反
馈,则 为一条边,即 以此类推。
节点表示形成自后向前的反向树型传播结构 且
F
的总数,p为删除率;在正向树型传播结构 中,邻接矩阵表示为A=A′,在反向树型传播
R T
结构 中,邻接矩阵表示为A=A′;
FGCN模型和RGCN模型中,获得传播特性H和扩散特性H ,且H =σ(A XW),H=σ(AXW);其
F n×v F R n×v R
中,H∈R 为隐藏层特性,W为FGCN的滤波参数矩阵,H∈R 为隐藏层特性,W为RGCN的滤
波参数矩阵,σ(·)为ReLU激活函数。
积神经网络(Forward Reverse Bi‑Directional Graph Convolutional Networks,FRBi‑
GCN)的参数,其中,单个节点的隐藏特征向量维度为64,随机删边技术的中断率为0.2,删边
率为0.5,迭代次数为100,而整体基于事件生成的树型传播结构将以80%,10%,10%的比
例划分为训练集、测试集和验证集。
题,本发明提出了基于情感极性BERT的文本数据增强方法来提高模型提取特征的能力,从
而增强训练出来分类器的泛化能力。该方法考虑情感极性特征对谣言检测的影响,将BERT
的词表征、情感极性表征与位置表征三部分相结合;使用该方法不仅能挖掘表示文本的深
层特征,从而避免特征构建的问题,且能生成人工难以发现的隐藏特征,同时考虑上下文语
义与标签对屏蔽位置单词的影响,以此根据语境在屏蔽词位置生成相同情感极性的不同表
达形式。
度和散布广度三方面,形成自前向后的基于关系链的深度传播结构以及自后向前的基于社
会群体之间的广度扩散结构;在检测时,通过正向的图卷积神经网络来支持自源帖开始通
过转发关系链而形成的自前向后深度传播结构,通过反向的图卷积神经网络来支持由社区
内各个分散节点聚集到上层节点表示的广度扩散结构,充分利用事件中蕴含的谣言之间潜
在的关联以及社会网络中信息来进行谣言检测,从而提高谣言检测的准确率。
传播结构的传播树节点增强方法,将每个通过GCL后形成隐藏层特征向量的节点与其上一
层节点的隐藏层特征向量进行拼接,得到新的特征矩阵,在更好地利用源帖以及各个转发
节点中蕴含的丰富信息的同时从各节点之间的关系中获得更准确的节点表示,从而提高谣
言检测的准确率。
附图说明
具体实施方式
施方式是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领
域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明
保护的范围。因此,以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要
求保护的本发明的范围,而是仅仅表示本发明的选定实施方式。基于本发明中的实施方式,
本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本
发明保护的范围。
入神经网络中完成一次前向计算及反向传播的过程;
的是事件的序数,ek表示第k个事件,nk为第k个事件ek中的单个帖子,rk为源帖,每个 代
表第j个相关的转发帖或响应帖,且j=1…k;
第j个相关的转发帖或响应帖,且j=1…k。
源帖的增强文本特征向量D,且D={word1,word2,…,wordn,tag1,tag2,…,tagn,emotion1,
emotion2,…,emotionn};其中,wordi为文本中得到的第i个特征词以及BERT模型提取的隐
藏特征词,tagi,为文本中第i个特殊符号标记,如@、#等,emotioni,为标注的情感极性;
标记,emotioni为标注的情感极性,
Vk表示图的
顶点集合,Bk表示回复帖到转发帖和回复帖到响应帖所形成的边集合;若 对 为一个
反馈,即 为 的转发帖或响应帖,则 为一条边,即 若 对rk为一个反
馈,则 为一条边,即 以此类推;
F R
向的图卷积神经网络)模型中,获得传播特性H和扩散特性H ,FGCN模型和RGCN模型共同构
成基于事件与传播结构的双向图卷积神经网络(FRBi‑GCN)模型;
softmax分类函数为: 其中Vi表示分类的类别,i表示类别索引,C表示分类的
种类,Si表示输出最大对应的类别,e为自然对数,e优选取值为2.718,softmax分类函数最
终选择Si值最大的Vi作为分类的类别。
性有关联的情感极性表征(Emotional Polarity Embedding,EPE)Eemotion,从而根据标记数
据集上的情感极性标签进行学习;其中,EA表示改词属于句向量A,EB表示词属于句向量B;A,
B分别为句向量,且当输入文本为非单一的情感极性时,需调整向量的大小以兼容标签大
小;基于情感的掩码语言模型(EPBERT模型)允许表示层融合上下文以及情感标签等信息,
即允许进一步训练基于情感极性标签条件的深度双向表示;
{pi}),从而获得与句子情感极性标签相匹配的各种词Term={trem1,trem2,...,tremk},并
获得文本特征向量Word={word1,word2,...,wordn};其中,wordi为文本中第i个特征词,S\
{pi}和y分别表示除去被屏蔽词之外的上下文及其标签,tremk表示是第k个情感极性词;
记,如@、#等,emotioni为标注的情感极性。
模,再由独立训练的正向语言模型的浅层和反向语言模型的浅层连接而成,形成BERT模型;
其中,正向语言模型预测序列的概率表示为:
pi表示选择的句子,反向语言模型预测序列的概率表示为:
pi表示选择的句子。
{word1,word2,…,wordn,tag1,tag2,…,tagn,emotion1,emotion2,…,emotionn}加入到传播
关系的根节点中,与传播关系T结合,即concat(D,T),形成树型传播结构Gk,且Gk=
其中,tagi,为文本中第i个特殊符号标记,如@、#等,emotioni为标注的情感极性,
Vk表示图的
顶点集合,Bk表示回复帖到转发帖和回复帖到响应帖所形成的边集合;若 对 为一个
反馈,即 为 的转发帖或响应帖,则 为一条边,即 若 对rk为一个反
馈,则 为一条边,即 以此类推。
表示形成自后向前的反向树型传播结构 且 通过本发明提出的基
于事件与传播结构的双向图卷积神经网络(FRBi‑GCN),结合事件与信息传播深度和散布广
度三方面进行谣言检测,以提高谣言检测准确率。
F
总数,p为删除率;在正向树型传播结构 中,邻接矩阵表示为A =A′,在反向树型传播结
R T
构 中,邻接矩阵表示为A=A′;
训练epoch,为避免过拟合问题,采用随机删边技术(DropEdge),在每个训练阶段,随机地从
输入的传播树中删除边,以产生一定速率的不同变形副本。该方法能增加输入的随机性以
及多样性。
表示为A=A′,在RGCN中,邻接矩阵表示为A=A′。
模型和RGCN模型中,获得传播特性H 和扩散特性H,且H=σ(AXW),H=σ(AXW);其中,H
n×v F R n×v R
∈R 为隐藏层特性,W为FGCN的滤波参数矩阵,H ∈R 为隐藏层特性,W为RGCN的滤波参
数矩阵,σ(·)为ReLU激活函数。
征向量Hk,其中,X∈R 为FRBi‑GCN模型输入的原始特征矩阵,Hk为第k个GCL生成的隐藏特
征向量;
隐藏特征向量Hk与k‑1层层节点的隐藏特征向量Hk‑1进行拼接,得到新的隐藏特征向量
且 为第k层节点隐藏层特征向量与k‑1层节点隐藏层特征向
量拼接后所得隐藏特征向量。
如下所示:
赞数等在内的其他特征构成。
法更新基于事件与传播结构的双向图卷积神经网络(Forward Reverse Bi‑Directional
Graph Convolutional Networks,FRBi‑GCN)的参数,其中,单个节点的隐藏特征向量维度
为64,随机删边技术的中断率为0.2,删边率为0.5,迭代次数为100,而整体基于事件生成的
树型传播结构将以80%,10%,10%的比例划分为训练集、测试集和验证集。
(Emotional Polarity Embedding,EPE)表征;然后,在被标记数据集上对预训练的BERT进
行微调,直到收敛;最后,对于被标记数据集中的每个句子,随机地屏蔽其中的几个词,再通
过EPBERT预测与句子情感极性标签相匹配的各种词。EPBERT模型的整体架构如图2所示。其
模型层数为12,隐藏层神经元数为768,头自注意力数为12,总参数为110M。EPBERT的训练轮
次范围在1‑50之间,屏蔽词的范围在1‑2之间。
关系链传播的因果特征。RGCN则是聚集了谣言在社区内扩散的结构特征。将FGCN的传播表
示特征向量和RGCN的扩散表示特征向量通过全连接层进行融合,从而得到最终结果。FRBi‑
GCN谣言检测模型如图3所示。本发明将数据集随机地划分为5个部分,并进行5倍交叉验证。
采用随机梯度下降法更新FRBi‑GCN的参数,其中,单个节点的隐藏特征向量维度为64,随机
删边技术的中断率为0.2,删边率为0.5,迭代次数为100,而整体基于事件生成的树型传播
结构将以80%,10%,10%的比例划分为训练集、测试集和验证集。
取FGCN和RGCN的隐藏特征外,还将每层节点(除根节点外)与上一层节点的特征向量进行拼
n
接,构造一个新的特征矩阵,增强节点之间关联性。传播树节点增强如图4所示。其中,X∈R
×d
为FRBi‑GCN模型输入的原始特征矩阵,Hk为第k个GCL生成的隐藏特征向量。 为第k层节
点隐藏层特征向量与k‑1层节点隐藏层特征向量拼接后所得隐藏特征向量。
(FRBi‑GCN)以及基于事件级数据的传播树节点增强技术。其中,基于情感极性的双向编码
器表示技术的文本数据增强技术用于提高谣言检测模型的提取特征的能力;基于事件与传
播结构的双向图卷积神经网络(FRBi‑GCN)用于结合事件与信息传播深度和散布广度三方
面进行谣言检测,以提高模型检测准确率。基于事件级数据的传播树节点增强技术用于增
强源帖与转发贴之间的关联性,从而提高谣言检测的准确率。
编码器表示技术(EPBERT)对源帖信息进行文本数据增强(基于情感极性BERT的文本数据增
强)。然后,将源帖和转发贴之间的转发关系(转发关系1~转发关系M)及包括用户信息,粉
丝数,点赞数等在内的其他特征(其他特征1~其他特征K)构成传播关系,同时,将增强后的
文本向量特征加入到传播关系的根节点中,与传播关系结合,形成树型传播结构,再从根节
点开始,通过转发及响应关系而形成的自前向后的正向树型传播结构 和将由社区内各
个分散节点聚集到上层根节点表示形成自后向前的反向树型传播结构 分别输入到
FGCN模型和RGCN模型中。最后,对传播树中包含根节点以及转发节点在内的所有节点进行
节点增强操作,并通过softmax分类器鉴别出该事件是否是谣言。
表第j个相关的转发帖或响应帖,且j=1…k。
中,正向语言模型预测序列的概率表示为: pi
表示选择的句子,反向语言模型预测序列的概率表示为:
pi表示选择的句子
性有关联的情感极性表征(Emotional Polarity Embedding,EPE)Eemotion,从而根据标记数
据集上的情感极性标签进行学习;其中,EA表示改词属于句向量A,EB表示词属于句向量B;A,
B分别为句向量,且当输入文本为非单一的情感极性时,需调整向量的大小以兼容标签大
小;基于情感的掩码语言模型(EPBERT模型)允许表示层融合上下文以及情感标签等信息,
即允许进一步训练基于情感极性标签条件的深度双向表示;
极性标签相匹配的各种词Term={trem1,trem2,...,tremk},并获得文本特征向量Word=
{word1,word2,...,wordn};其中,wordi为文本中第i个特征词,tremk表示是第k个情感极性
词;
根节点中,与传播关系T结合,即concat(D,T),形成树型传播结构Gk,且Gk=
wordi为文本中得到的第i个特征词以及BERT模型提取的隐藏特征词,tagi,为文本中第i个
特殊符号标记,如@、#等,emotioni为标注的情感极性,
Vk表示图的顶点集合,Bk表示回复帖到转发帖和回
复帖到响应帖所形成的边集合,则
由于
代表第j个相关的转发帖或响应帖,因此,若 对 为一个反馈,即 为 的转发帖或
响应帖,则 为一条边,即 若 对rk为一个反馈,则 为一条边,即
以此类推。
表示形成自后向前的反向树型传播结构 且 通过本发明提出的
基于事件与传播结构的双向图卷积神经网络(FRBi‑GCN),结合事件与信息传播深度和散布
广度三方面进行谣言检测,以提高谣言检测准确率。
训练轮次epoch,为避免过拟合问题,采用随机删边技术(DropEdge),在每个训练阶段,随机
地从输入的传播树中删除边,以产生一定速率的不同变形副本。该方法能增加输入的随机
性以及多样性。
表示为A=A′,在RGCN中,邻接矩阵表示为A=A′。
型和RGCN模型中,获得传播特性H和扩散特性H。
个分散节点聚集到上层根节点表示形成自后向前的反向树型传播结构 且
在每个训练epoch,采用随机删边技术避免过拟合问题,获得邻接矩
阵A′=Gk‑Adrop,其中,Adrop是使用Ne×p从原始边集合中随机采样的矩阵结构,Ne为边的总
F
数,p为删除率;在正向树型传播结构 中,邻接矩阵表示为A =A′,在反向树型传播结构
R T
中,邻接矩阵表示为A =A′。将正向和反向两种树型传播结构分别输入到正向的图卷
F F
积神经网络(FGCN)以及反向的图卷积神经网络(RGCN)中,获得传播特性Hw=σ(AXW)和扩
R R R F n×v F R n×v
散特性H=σ(A XW);其中,H ∈R 为隐藏层特性,W为FGCN的滤波参数矩阵,H∈R 为隐
R
藏层特性,W为RGCN的滤波参数矩阵,σ(·)为ReLU激活函数;
征向量Hk,其中,X∈R 为FRBi‑GCN模型输入的原始特征矩阵,Hk为第k个GCL生成的隐藏特
征向量;
隐藏特征向量Hk与k‑1层层节点的隐藏特征向量Hk‑1进行拼接,得到新的隐藏特征向量
且 为第k层节点隐藏层特征向量与k‑1层节点隐藏层特征向
量拼接后所得隐藏特征向量。
操作,得到S和S,进而将二者进行拼接得到
如下所示:
强技术,增强了源帖与转发贴之间的关联性,从而达到提高谣言检测准确率的目的。
范围之内。