
基本信息:
- 专利标题: 一种基于事件标签的文本分类方法
- 申请号:CN202410903529.8 申请日:2024-07-08
- 公开(公告)号:CN118733777B 公开(公告)日:2025-07-25
- 发明人: 张煇 , 杨勇 , 刘俊龙 , 李龙
- 申请人: 北京长河数智科技有限责任公司 , 长河信息股份有限公司
- 申请人地址: 北京市丰台区汽车博物馆西路8号院3号楼7层705
- 专利权人: 北京长河数智科技有限责任公司,长河信息股份有限公司
- 当前专利权人: 北京长河数智科技有限责任公司,长河信息股份有限公司
- 当前专利权人地址: 北京市丰台区汽车博物馆西路8号院3号楼7层705
- 代理机构: 北京法筑知识产权代理有限公司
- 代理人: 李明
- 主分类号: G06F16/35
- IPC分类号: G06F16/35 ; G06F16/334 ; G06F40/284 ; G06F40/30 ; G06F40/216 ; G06N3/0455 ; G06N3/042 ; G06N3/0464 ; G06N3/048 ; G06N3/084
摘要:
本申请公开了一种基于事件标签的文本分类方法,涉及计算机技术领域,包括:获取文本,并进行预处理;利用预训练的回环神经网络XLNet,将预处理后的文本转换为词向量序列;将词向量序列输入预训练的Transformer编码器,输出表示文本语义的文本向量编码;根据文本分类任务,构建表示文本类别的事件标签集;将标签集作为输入,利用预训练的图神经网络,获取标签之间的层级关系,输出表示标签语义的标签向量;通过动态协作过滤的注意力机制,将文本向量编码和标签向量进行融合,得到融合特征;利用融合特征作为输入,训练文本分类的神经网络模型;利用训练后的文本分类的神经网络模型进行文本分类。针对现有技术中文本分类精度低,本申请提高了文本分类精度。
公开/授权文献:
- CN118733777A 一种基于事件标签的文本分类方法 公开/授权日:2024-10-01