获取文本提取模型的方法及装置转让专利

申请号 : CN201710107787.5

文献号 : CN106909656B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 陈益

摘要 :

本发明公开了一种获取文本提取模型的方法及装置,属于机器学习技术领域。该方法包括:获取第一文本提取模型,第一文本提取模型根据人工标注的第一训练文本集合得到;如果第一文本提取模型的提取准确度低于预设阈值,获取第二训练文本集合,第二训练文本集合包括多个第一训练语料和通过第一文本提取模型从多个第一训练语料中提取的多个第一目标文本;根据第一训练文本集合和第二训练文本集合,获取第二文本提取模型。本发明通过第一文本提取模型获取第二训练文本集合,使得获取文本提取模型的过程趋于自动化,由于通过模型获取训练文本集合的效率远高于人工标注的效率,因此采用本发明的获取方法可以大大减少人力成本和时间成本。