- 专利标题: 模型检查点文件保存方法、装置、设备及存储介质
-
申请号: CN202310899664.5申请日: 2023-07-21
-
公开(公告)号: CN116627659B公开(公告)日: 2023-12-01
- 发明人: 潘青华 , 张海俊 , 胡文龙 , 汪锦想 , 于振华 , 胡国平 , 刘聪 , 魏思 , 王士进 , 刘权
- 申请人: 科大讯飞股份有限公司
- 申请人地址: 安徽省合肥市高新区望江西路666号
- 专利权人: 科大讯飞股份有限公司
- 当前专利权人: 科大讯飞股份有限公司
- 当前专利权人地址: 安徽省合肥市高新区望江西路666号
- 代理机构: 北京集佳知识产权代理有限公司
- 代理商 王雨
- 主分类号: G06F9/50
- IPC分类号: G06F9/50 ; G06F3/06
摘要:
本申请公开了一种模型检查点文件保存方法、装置、设备及存储介质,本申请在确定需要保存检查点checkpoint文件时,为了避免单节点网卡或磁盘IO拥塞问题,引入了负载均衡机制,将模型分割后的各个部分的checkpoint文件保存任务分散到多个不同的设备节点上,控制不同的设备节点采用并行处理的方式执行本设备节点的checkpoint文件保存任务,这样可以充分利用各设备节点的资源,避免单节点网卡或磁盘IO拥塞,提高保存效率。
公开/授权文献
- CN116627659A 模型检查点文件保存方法、装置、设备及存储介质 公开/授权日:2023-08-22