
基本信息:
- 专利标题: 一种在医疗文本中提取疾病及其症状和诱因的方法
- 申请号:CN202411920515.3 申请日:2024-12-25
- 公开(公告)号:CN119783667A 公开(公告)日:2025-04-08
- 发明人: 曲庆楠 , 冯洪海
- 申请人: 河南大学
- 申请人地址: 河南省郑州市郑东新区明理路北段379号
- 专利权人: 河南大学
- 当前专利权人: 河南大学
- 当前专利权人地址: 河南省郑州市郑东新区明理路北段379号
- 代理机构: 郑州优盾知识产权代理有限公司
- 代理人: 栗改
- 主分类号: G06F40/279
- IPC分类号: G06F40/279 ; G06F40/216 ; G06F18/22 ; G16H10/60
摘要:
本发明公开了一种在医疗文本中提取疾病及其症状和诱因的方法,步骤包括:获取医疗文本;从医疗文本中提取症状群信息及诱因链信息并输出;根据预设的句式规则,对医疗文本中的所有句子进行句式规则匹配,将符合预设的句式规则的句子进行分割,获得包含有效信息的子句群与不包含有效信息的子句群;对包含有效信息的子句群中的子句进行句式规则匹配,对每一个匹配到的子句进行信息提取,提取出症状表现和诱因的目标信息;依据除杂规则从提取的目标信息中选出符合除杂规则的目标信息;根据标记规则为符合除杂规则的目标信息中的每个子句匹配主语;输出主语和符合除杂规则的目标信息。本发明处理复杂文本的适应性强且信息提取的精度高。
IPC结构图谱:
G06F40/279 | 文字实体的识别 |