基于TF-IDF和领域词典的主题内容聚合分析方法转让专利

申请号 : CN201910359911.6

文献号 : CN110110047B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 赵瑞雪寇远涛张洁鲜国建仲跻亮

申请人 : 中国农业科学院农业信息研究所

摘要 :

本发明公开了一种基于TF‑IDF和领域词典的主题内容聚合分析方法,属于情报信息处理领域。基于TF‑IDF获取主题需求词的扩展词集;将其作为检索文本遵循基于领域词典的检索策略完成对资源池中多种类型资源的检索,经过审核进行资源删补,对每种目标资源类型,根据资源的时效性、权威性及相关度进行有序排列和发布。与传统方法相比,本方法通过扩展词集保证了主题内资源的检全率,通过基于领域词典的检索策略和具有针对性的各类型资源排序模型,保证了主题内资源的检准率;通过审核原则保障了主题内资源的质量。易扩展易维护,同时大大降低了主题资源内容聚合的时间和人工成本。