
基本信息:
- 专利标题: 基于边缘计算架构的模型结构化剪枝方法、装置
- 申请号:CN202410293163.7 申请日:2024-03-14
- 公开(公告)号:CN118070868B 公开(公告)日:2025-04-08
- 发明人: 郭嘉丰 , 程学旗 , 李晨昊 , 李琳 , 张志斌 , 廖华明 , 邱强
- 申请人: 中国科学院计算技术研究所
- 申请人地址: 北京市海淀区中关村科学院南路6号
- 专利权人: 中国科学院计算技术研究所
- 当前专利权人: 中国科学院计算技术研究所
- 当前专利权人地址: 北京市海淀区中关村科学院南路6号
- 代理机构: 北京市立康律师事务所
- 代理人: 马砚花; 梁挥
- 主分类号: G06N3/082
- IPC分类号: G06N3/082 ; G06N3/063
摘要:
本发明提出一种基于边缘计算架构的模型结构化剪枝方法及装置,该方法包括:根据集群中每一边缘设备的硬件资源信息,对边缘设备进行分组;对于同一组的边缘设备,将神经网络加速器在该边缘设备硬件的实际运行时间与内存资源消耗作为资源约束条件,对该边缘设备上部署的神经网络模型进行剪枝;校准修剪后的神经网络模型。该方法提高了计算设备的硬件处理速度,降低了内存消耗,进而提升了计算机系统的内部性能。
公开/授权文献:
- CN118070868A 基于边缘计算架构的模型结构化剪枝方法、装置 公开/授权日:2024-05-24
IPC结构图谱:
G | 物理 |
--G06 | 计算;推算;计数 |
----G06N | 基于特定计算模型的计算机系统 |
------G06N3/00 | 基于生物学模型的计算机系统 |
--------G06N3/02 | .采用神经网络模型 |
----------G06N3/04 | ..体系结构,例如,互连拓扑 |
------------G06N3/082 | ...修改架构,例如:添加、删除或静默节点或连接 |