
基本信息:
- 专利标题: 基于可解释性机器学习的抗生素抗性基因的宿主分析方法
- 申请号:CN202510284448.9 申请日:2025-03-11
- 公开(公告)号:CN120148651A 公开(公告)日:2025-06-13
- 发明人: 朱腾义 , 李懿 , 陶翠翠 , 李书音 , 吴军
- 申请人: 扬州大学
- 申请人地址: 江苏省扬州市大学南路88号
- 专利权人: 扬州大学
- 当前专利权人: 扬州大学
- 当前专利权人地址: 江苏省扬州市大学南路88号
- 代理机构: 南京启扬知识产权代理事务所(普通合伙)
- 代理人: 陈栋智
- 主分类号: G16B40/20
- IPC分类号: G16B40/20 ; G16B30/10 ; G06F18/243
摘要:
本发明公开了生物信息学技术领域内的一种基于可解释性机器学习的抗生素抗性基因的宿主分析方法,包括以下步骤:步骤1)基因组数据收集:收集同种环境样品的大量基因组数据,计算基因数据中抗生素抗性基因、物种菌属的种类和相对丰度并将其处理成矩阵,使用Pauta准则对选定抗生素抗性基因的相对丰度进行分析、去除异常值后划分训练集和测试集;步骤2)分析模型的构建;步骤3)可解释的相关性分析:通过Shap值量化模型中不同菌属对抗生素抗性基因的贡献,根据不同菌属平均Shap值的差异判断菌属对于抗生素抗性基因的影响,本发明可以分析多种细菌菌属与抗生素抗性基因的相关性,为抗生素抗性基因的生态风险评价和管理提供必要的技术支持。
IPC结构图谱:
G | 物理 |
--G16 | 特别适用于特定应用领域的信息通信技术 |
----G16B | 生物信息学,例如特别适用于计算分子生物学中的遗传或蛋白质相关数据处理的信息与通信技术 |
------G16B40/00 | 特别适用于生物统计学的ICT;特别适用于与生物信息学相关的机器学习或数据挖掘,例如知识发现或模式发现的ICT |
--------G16B40/20 | .监督数据分析 |