
基本信息:
- 专利标题: 一种针对缺失数据的功能聚类方法、装置、设备及介质
- 申请号:CN202510384376.5 申请日:2025-03-28
- 公开(公告)号:CN120496644A 公开(公告)日:2025-08-15
- 发明人: 韩莹 , 周冠宇 , 董昂 , 杨帆 , 邬荣领 , 吴双 , 王玉 , 龙飞 , 涂华彬 , 向平
- 申请人: 贵州茅台酒股份有限公司
- 申请人地址: 贵州省遵义市仁怀市茅台镇
- 专利权人: 贵州茅台酒股份有限公司
- 当前专利权人: 贵州茅台酒股份有限公司
- 当前专利权人地址: 贵州省遵义市仁怀市茅台镇
- 代理机构: 北京市万慧达律师事务所
- 代理人: 李庭庭
- 主分类号: G16B40/30
- IPC分类号: G16B40/30 ; G16B40/20 ; G06F18/23213
摘要:
本申请提供了一种针对缺失数据的功能聚类方法、装置、设备及介质,其中,针对缺失数据的功能聚类方法,包括:选取模型初步的聚类中心以及SAD1协方差矩阵参数,并通过零膨胀模型或忽略零值的最大似然估计拟合得到每类微生物的异速生长函数参数;将每类微生物的异速生长函数参数和SAD1协方差矩阵参数作为初始的模型参数,以EM算法对模型进行迭代更新,直到模型收敛后输出每个微生物所属的类别。本申请所提供的功能聚类方法基于零膨胀模型或忽略零值的最大似然估计,提高聚类的准确度并加快聚类过程,能够有效解决微生物组学数据挖掘中因低丰度微生物数据零膨胀导致的聚类不准确问题。
IPC结构图谱:
G | 物理 |
--G16 | 特别适用于特定应用领域的信息通信技术 |
----G16B | 生物信息学,例如特别适用于计算分子生物学中的遗传或蛋白质相关数据处理的信息与通信技术 |
------G16B40/00 | 特别适用于生物统计学的ICT;特别适用于与生物信息学相关的机器学习或数据挖掘,例如知识发现或模式发现的ICT |
--------G16B40/30 | .无监督数据分析 |