一种模型训练加速方法及装置
    1.
    发明公开

    公开(公告)号:CN117112008A

    公开(公告)日:2023-11-24

    申请号:CN202310955141.8

    申请日:2023-07-31

    Abstract: 一种模型训练加速方法,应用于云管理平台,包括:云管理平台接收客户端发送的训练任务请求信息,训练任务请求信息包括待训练模型的信息和训练模式的信息,训练模式包括加速训练模式,加速训练模式的加速训练参数基于用户在加速配置界面中的操作确定;当训练模式为加速训练模式时,云管理平台根据加速训练参数,加载加速库中对应的目标加速模块至训练节点;目标加速模块为加速库中具有加速功能的功能模块;云管理平台指示训练节点基于目标加速模块,对待训练模型进行加速训练。用户只需要在云平台前端勾选所需的加速配置,无需安装加速包或者加速镜像,也不需要修改代码,解决了在模型训练加速前需要复杂操作的问题。

    一种虚拟并行计算单元资源调整方法及系统

    公开(公告)号:CN117311954A

    公开(公告)日:2023-12-29

    申请号:CN202210710820.4

    申请日:2022-06-22

    Abstract: 本申请提供了一种虚拟并行计算单元资源调整方法及系统,所述方法包括:云服务平台向一个或多个用户提供存储资源,存储资源归属于第一虚拟并行计算单元;在检测到第一虚拟并行计算单元中的存储资源占用量大于或等于第一阈值的情况下,确定目标存储资源;将目标存储资源划分至第一虚拟并行计算单元中,目标存储资源和第一存储资源位于同一台主机或不同台主机上。采用本申请的方法,可以实现虚拟并行计算单元中的存储资源的调整,满足用户的需求,提高存储资源的利用率。

Patent Agency Ranking