- 专利标题: 一种面向分布式集群的任务执行方法、装置、介质及设备
-
申请号: CN202310669715.5申请日: 2023-06-07
-
公开(公告)号: CN116382599B公开(公告)日: 2023-08-29
- 发明人: 侯瑞峥 , 程稳 , 李勇 , 张莹 , 刘懿 , 胡陈枢 , 陈光 , 曾令仿
- 申请人: 之江实验室
- 申请人地址: 浙江省杭州市余杭区中泰街道科创大道之江实验室
- 专利权人: 之江实验室
- 当前专利权人: 之江实验室
- 当前专利权人地址: 浙江省杭州市余杭区中泰街道科创大道之江实验室
- 代理机构: 北京博思佳知识产权代理有限公司
- 代理商 邓超
- 主分类号: G06F3/06
- IPC分类号: G06F3/06 ; G06F9/50 ; G06N3/098 ; G06N3/084
摘要:
本说明书公开了一种面向分布式集群的任务执行方法、装置、介质及设备。所述面向分布式集群的任务执行方法包括:获取样本数据,根据磁盘带宽和本地延迟,以及网络带宽和网络延迟,对样本数据的数量进行划分,将第一样本数量的样本数据存储在各计算节点的本地磁盘,将第二样本数量的样本数据存储在存储节点,针对每个计算节点,将该计算节点的本地磁盘中指定数量的样本数据与其他计算节点的本地磁盘中的样本数据进行交换,得到更新后样本数据,以及,从所述存储节点中读取远端样本数据,根据更新后本地样本数据和远端样本数据,在该计算节点上执行当前训练周期针对目标模型的训练任务。
公开/授权文献
- CN116382599A 一种面向分布式集群的任务执行方法、装置、介质及设备 公开/授权日:2023-07-04