-
公开(公告)号:CN118395194B
公开(公告)日:2024-09-13
申请号:CN202410853483.3
申请日:2024-06-28
Applicant: 浪潮电子信息产业股份有限公司
IPC: G06F18/214 , G06N3/0464 , G06F8/41
Abstract: 本发明公开了一种模型训练方法、产品、设备及计算机可读存储介质,涉及分布式训练领域,为解决上层训练框架和加速装置之间兼容难度大的问题,该模型训练方法包括在与通用接入平台连接的多个备选加速装置中确定目标加速装置;通用接入平台包括多个待编译模块;基于满足目标加速装置的运行需求的编译信息对至少一个待编译模块中定义的虚拟方法进行实例化,以创建方法实例;控制当前训练框架在当前训练阶段调用对应的待编译模块中的方法实例训练预设模型。本发明能够降低分布式训练中的上层训练框架和加速装置之间的兼容难度,无需对加速装置进行适配开发,降低加速装置的开发难度和维护难度。
-
公开(公告)号:CN118395194A
公开(公告)日:2024-07-26
申请号:CN202410853483.3
申请日:2024-06-28
Applicant: 浪潮电子信息产业股份有限公司
IPC: G06F18/214 , G06N3/0464 , G06F8/41
Abstract: 本发明公开了一种模型训练方法、产品、设备及计算机可读存储介质,涉及分布式训练领域,为解决上层训练框架和加速装置之间兼容难度大的问题,该模型训练方法包括在与通用接入平台连接的多个备选加速装置中确定目标加速装置;通用接入平台包括多个待编译模块;基于满足目标加速装置的运行需求的编译信息对至少一个待编译模块中定义的虚拟方法进行实例化,以创建方法实例;控制当前训练框架在当前训练阶段调用对应的待编译模块中的方法实例训练预设模型。本发明能够降低分布式训练中的上层训练框架和加速装置之间的兼容难度,无需对加速装置进行适配开发,降低加速装置的开发难度和维护难度。
-
公开(公告)号:CN119357025A
公开(公告)日:2025-01-24
申请号:CN202411931726.7
申请日:2024-12-26
Applicant: 浪潮电子信息产业股份有限公司
IPC: G06F11/3604 , G06N3/045 , G06N3/09 , G06N3/10
Abstract: 本申请公开了一种模型训练基准评测方法、设备、程序产品及介质,涉及计算机技术领域。该方法包括:确定模型微调工具,并获取模型微调工具内预置的训练启动脚本;为训练启动脚本配置用于实现不同的评测场景的基准评测选项,并在训练启动脚本中添加用于自动处理模型在各评测场景下训练后的训练误差的误差验证指令;基于训练启动脚本中的基准评测选项,利用循环语句在目标硬件设备上启动模型训练任务,并通过训练启动脚本中添加的误差验证指令,将模型训练任务的训练误差与预设基准误差进行对比判断,以生成各评测场景下的基准评测任务结果。通过本申请的技术方案,可以提升人工智能算力执行框架的基准评测效率。
-
-