
基本信息:
- 专利标题: 一种计算系统、模型训练方法、装置及设备、介质和产品
- 申请号:CN202411162431.8 申请日:2024-08-23
- 公开(公告)号:CN118709745B 公开(公告)日:2024-11-26
- 发明人: 王彦伟 , 刘俊 , 李霞 , 李仁刚
- 申请人: 浪潮(北京)电子信息产业有限公司
- 申请人地址: 北京市海淀区上地信息路2号2-1号C栋1层
- 专利权人: 浪潮(北京)电子信息产业有限公司
- 当前专利权人: 浪潮(北京)电子信息产业有限公司
- 当前专利权人地址: 北京市海淀区上地信息路2号2-1号C栋1层
- 代理机构: 北京集佳知识产权代理有限公司
- 代理人: 林哲生
- 主分类号: G06N3/084
- IPC分类号: G06N3/084 ; G06F1/18
摘要:
本申请公开了一种计算系统、模型训练方法、装置及设备、介质和产品,涉及计算机技术领域,该人工智能计算系统包括多个计算节点,多计算节点包括主机、计算设备和网卡;计算设备包括第一硬件接口、第一设备一致性维护引擎、第一计算核心,计算设备通过第一硬件接口连接主机;网卡包括第二硬件接口、第二设备一致性维护引擎,网卡通过第二硬件接口连接主机;计算设备通过缓存的刷新操作与网卡的网卡内存之间传输梯度数据,网卡用于与其他计算节点同步梯度数据。本申请提高了计算设备与网卡梯度数据的传输效率,进而提高了人工智能模型的训练效率。
公开/授权文献:
- CN118709745A 一种计算系统、模型训练方法、装置及设备、介质和产品 公开/授权日:2024-09-27
IPC结构图谱:
G | 物理 |
--G06 | 计算;推算;计数 |
----G06N | 基于特定计算模型的计算机系统 |
------G06N3/00 | 基于生物学模型的计算机系统 |
--------G06N3/02 | .采用神经网络模型 |
----------G06N3/04 | ..体系结构,例如,互连拓扑 |
------------G06N3/084 | ...反向传播,例如:使用梯度下降 |