-
公开(公告)号:CN119918621A
公开(公告)日:2025-05-02
申请号:CN202510404733.X
申请日:2025-04-02
Applicant: 之江实验室
Abstract: 本说明书公开了一种与机器学习框架解耦的容错训练方法及装置。在本说明书提供的机器学习框架解耦的容错训练方法中,可以在定位到发生异常的异常从节点后,将异常从节点从训练网络出剔除,并选择合适的备援从节点补充异常从节点的空缺,快速构建新的重构训练网络,重新执行未完成的训练,自动快速地重启训练任务,减少不必要的用户工作量;同时,本方法在执行过程中与机器学习训练框架解耦,能够以最小的代码侵入成本实现,大幅降低了学习与应用时需要的成本。
-
公开(公告)号:CN119623548A
公开(公告)日:2025-03-14
申请号:CN202411553118.7
申请日:2024-11-01
Applicant: 之江实验室
Abstract: 本说明书公开了一种模型训练方法、一种任务执行时间预测方法及装置,具体包括:根据历史模型训练任务的历史资源占用数据,筛选出相似历史模型训练任务。将历史模型训练任务和相似历史模型训练任务的历史资源占用数据输入预测模型,使得其确定出历史模型训练任务对应的资源占用特征数据,从而确定历史模型训练任务对应的预测执行时长。根据预测执行时长和历史任务执行时长进行训练。训练后的预测模型根据目标模型训练任务的资源占用数据,确定目标模型训练任务的预测执行时长。本说明书中的方法预测效率更高且更加精准。进而使得后续资源分配时有效提升训练资源的利用率,避免资源浪费和搁置的同时,也极大程度上提高了整体训练过程的训练效率。
-
公开(公告)号:CN119597601A
公开(公告)日:2025-03-11
申请号:CN202411503872.X
申请日:2024-10-25
Applicant: 之江实验室
IPC: G06F11/34 , G06F9/48 , G06F9/50 , G06F18/213 , G06F18/25 , G06F18/27 , G06N20/10 , G06N3/04 , G06N3/08
Abstract: 本说明书公开了一种基于运行时长预测的深度学习任务执行方法及装置。所方法包括:通过智算集群中的各计算节点按照当前任务分配策略执行目标深度学习任务,并在目标深度学习任务执行指定时长后,获取各计算节点上的计算资源在指定时长内的性能监控数据序列,对各计算节点对应的性能监控数据进行处理,针对每个计算节点对应的目标监控数据,提取该目标监控数据在时域上的时域特征和该目标监控数据在频域上的频域特征;将时域特征和频域特征输入预先训练的时长预测模型,确定完成目标深度学习任务所需的运行时长,根据运行时长,对当前任务分配策略进行调整,以根据调整后的任务分配策略执行目标深度学习任务。
-
公开(公告)号:CN115249315B
公开(公告)日:2023-02-03
申请号:CN202211148079.3
申请日:2022-09-21
Applicant: 之江实验室
IPC: G06V10/764 , G06N20/00 , G06F9/48
Abstract: 本发明公开了面向异构计算设备的深度学习图像分类方法及装置,将深度学习模型建模为一个有向无环图,有向无环图的节点表深度学习模型的算子,节点之间的有向边代表深度学习模型算子间的数据传输;根据算子分别在各异构计算设备上的处理时间为节点赋值,根据算子间数据在两个计算设备间的传输时间为节点之间的有向边赋值;将每个节点之间的有向边替换为新的节点,并增加两条有向边,保持有向无环图的拓扑结构,用原有向边的权重为新的节点赋值;对算子的内存占用、设备的内存限制、算子在设备上的执行顺序、设备与设备间的数据传输、设备与设备间的数据传输顺序建模,模型的目标函数是模型的端到端推理时延,从而得到最小时延的模型。
-
公开(公告)号:CN112287609B
公开(公告)日:2021-03-30
申请号:CN202011576823.0
申请日:2020-12-28
Applicant: 之江实验室
IPC: G06F30/27 , G06N5/04 , G06F111/02
Abstract: 本发明公开了一种面向机器人任务划分的端、边、云协同计算装置,属于机器人技术领域。该装置包括任务建模计算层、任务离线切分层和任务在线执行层;任务建模计算层对不同的机器人任务在不同的设备下分层执行的计算时延以及传输时延进行计算;任务离线切分层根据计算时延和传输时延对目标网络模型进行水平和垂直切分,生成最佳的任务执行策略;任务在线执行层则根据任务离线切分层输出的任务执行策略进行任务的分配、下发和调度,完成任务的在线运行。本发明的协同计算装置可以保护机器人终端的数据隐私,有效地提升了机器人给定任务的执行效率,同时显著地提高了任务划分的性能,具有较好的实用性。
-
-
-
-