一种基于负样本多样性的问答模型集成方法转让专利
申请号 : CN202110516176.2
文献号 : CN113254609B
文献日 : 2022-08-09
发明人 : 方钰 , 翟鹏珺 , 崔雪
摘要 :
一种基于负样本多样性的问答模型集成方法。自动问答系统的问答匹配阶段常通过集成模型来捕捉语料中多角度的信息,从而提升问答系统的准确性和稳定性。在中文医疗问答领域,现有问答模型集成方法大多数使用随机采样或单一相似度距离分段采样的方法获取负样本,忽略了负样本的多样性,进而导致基模型的多样性不足,影响了集成模型的效果。本发明根据正负样本间的多种相似度距离,分别对负样本进行排序和分段采样,由此构成多个训练样本集,并基于这些训练样本集训练出多个基模型最后进行集成,不仅弥补了基模型多样性的不足,也提升了问答模型的稳定性和准确率。