
基本信息:
- 专利标题: 基于查询窗口建模的回复关系发现方法与装置
- 申请号:CN202411409785.8 申请日:2024-10-10
- 公开(公告)号:CN119578536A 公开(公告)日:2025-03-07
- 发明人: 柳厅文 , 崔诗尧 , 张竞文 , 李全刚 , 苏涛宇
- 申请人: 中国科学院信息工程研究所
- 申请人地址: 北京市海淀区树村路19号
- 专利权人: 中国科学院信息工程研究所
- 当前专利权人: 中国科学院信息工程研究所
- 当前专利权人地址: 北京市海淀区树村路19号
- 代理机构: 北京君尚知识产权代理有限公司
- 代理人: 李文涛
- 主分类号: G06N5/025
- IPC分类号: G06N5/025 ; G06N3/0455 ; G06N5/04 ; G06F18/2431 ; G06F16/3329
摘要:
本发明公开了一种基于查询窗口建模的回复关系发现方法与装置,属于自然语言处理领域。本发明基于社交平台上采集的真实群聊数据构建回复关系发现任务数据集,经数据预处理后建模当前查询消息相对应的查询窗口,对当前查询消息及其对应的查询窗口进行编码以作为模型的输入,通过针对任务优化的损失函数对模型进行训练,经训练的模型能够输出候选消息与当前查询消息之间构成回复关系的可能性取值。本发明缓解了短文本语义线索缺失和预测偏向负样本的问题,增强模型对短文本环境的适应能力,增强模型对正样本的学习能力,提升模型在公开数据集上的对比实验效果。
IPC结构图谱:
G | 物理 |
--G06 | 计算;推算;计数 |
----G06N | 基于特定计算模型的计算机系统 |
------G06N5/00 | 利用基于知识的模式的计算机系统 |
--------G06N5/02 | .知识表达 |
----------G06N5/022 | ..知识工程;知识收集 |
------------G06N5/025 | ...从数据中提取规则 |