
基本信息:
- 专利标题: 资源分配方法、装置、设备及介质
- 申请号:CN202411954618.1 申请日:2024-12-26
- 公开(公告)号:CN119883622A 公开(公告)日:2025-04-25
- 发明人: 朱天阳 , 彭玄
- 申请人: 斑马网络技术有限公司
- 申请人地址: 上海市徐汇区淮海西路55号2楼D1座
- 专利权人: 斑马网络技术有限公司
- 当前专利权人: 斑马网络技术有限公司
- 当前专利权人地址: 上海市徐汇区淮海西路55号2楼D1座
- 代理机构: 北京同立钧成知识产权代理有限公司
- 代理人: 谢百韬; 臧建明
- 主分类号: G06F9/50
- IPC分类号: G06F9/50 ; G06N3/04
摘要:
本申请提供一种资源分配方法、装置、设备及介质,该方法包括:获取候选算法的基本信息,所述基本信息用于指示每个所述候选算法在同一业务场景下的算力、内存及耗时需求,所述候选算法包括神经网络算法和/或普通算法;根据所述基本信息,获取所述候选算法对应的资源划分策略,所述资源划分策略用于指示每个候选算法对已有NPU资源的划分;当业务运行时,根据所述资源划分策略启动候选算法,以使每个候选算法按照预先分配的NPU资源运行。该方法可以通过离线方式确认候选算法的算力需求,并通过划分NPU的资源,将多个候选算法部署到NPU的不同资源上,实现了对神经网络算法和/或普通算法的并行加速,提高了NPU资源的利用率,同时降低了其他资源的负载。
IPC结构图谱:
G | 物理 |
--G06 | 计算;推算;计数 |
----G06F | 电数字数据处理 |
------G06F9/00 | 电数字数据处理的控制单元 |
--------G06F9/06 | .应用存入的程序的,即应用处理设备的内部存储来接收程序并保持程序的 |
----------G06F9/22 | ..微控制或微程序装置 |
------------G06F9/50 | ...资源分配,例如,中央处理单元(CPU)的 |