
基本信息:
- 专利标题: 一种垃圾邮件的识别方法、装置以及电子设备
- 申请号:CN201710085329.6 申请日:2017-02-17
- 公开(公告)号:CN108462624B 公开(公告)日:2021-03-09
- 发明人: 沈朝阳
- 申请人: 阿里巴巴集团控股有限公司
- 申请人地址: 英属开曼群岛大开曼资本大厦一座四层847号邮箱
- 专利权人: 阿里巴巴集团控股有限公司
- 当前专利权人: 阿里巴巴集团控股有限公司
- 当前专利权人地址: 英属开曼群岛大开曼资本大厦一座四层847号邮箱
- 代理机构: 北京清源汇知识产权代理事务所
- 代理人: 冯德魁
- 主分类号: H04L12/58
- IPC分类号: H04L12/58
摘要:
本申请公开了一种垃圾邮件的识别方法,包括:提取待识别邮件的正文并进行分词,获得所述待识别邮件的词条集;结合预先获得的基准词频表识别所述词条集当中的噪音字符,并计算所述词条集当中的噪音字符占比;判断所述噪音字符占比是否大于预设噪音字符占比阈值,若是,将所述待识别邮件识别为垃圾邮件。所述垃圾邮件的识别方法,根据噪音字符的特性识别待识别邮件当中的噪音字符,并进一步根据待识别邮件当中包含的噪音字符来识别待识别邮件是否为垃圾邮件,实现方式简单,识别垃圾邮件的准确率更高。
公开/授权文献:
- CN108462624A 一种垃圾邮件的识别方法、装置以及电子设备 公开/授权日:2018-08-28