-
公开(公告)号:CN112882751B
公开(公告)日:2025-01-14
申请号:CN202110222487.8
申请日:2021-02-25
Applicant: 曙光信息产业(北京)有限公司
Abstract: 本申请提供一种CUDA程序移植方法、装置、电子设备及存储介质,涉及代码移植技术领域。该方法包括:从CUDA平台获取待移植的CUDA程序的代码文件和编译构建规则;确定其编译构建流程信息;将代码文件中的待转码文件中的CUDA相关代码转换为HIP代码,以获得转码文件;基于编译构建流程信息修改转码文件对应的编译构建规则,将转码文件及修改后的编译构建规则作为程序源代码;基于编译构建规则编译程序源代码,再将程序源代码迁移至ROCm平台。该方法利用HIP将CUDA程序移植为兼容NVIDIA和AMD的跨平台程序,还对编译构建信息进行分析修改,能够对大型应用程序的CUDA代码进行代码转换,提高移植的效率。
-
公开(公告)号:CN114035795A
公开(公告)日:2022-02-11
申请号:CN202111156980.0
申请日:2021-09-30
Applicant: 曙光信息产业(北京)有限公司
Abstract: 本申请公开了一种核函数预编译方法、装置、计算机设备和存储介质。该方法包括:获取参数列表,参数列表用于定义核函数的参数信息;根据预设节点列表将参数列表划分为多个子列表,预设节点列表包括多个从节点;分别将每个子列表下发至对应的从节点,以指示从节点根据子列表对对应的核函数进行预编译后生成可执行文件;获取从节点发送的可执行文件,从而使网络模型训练时能够直接运行可执行文件,而无需在启动阶段对核函数进行实时编译,从而有效减少网络模型训练的启动时间,进而提升网络模型训练的效率,且分布式编译可以大大减少核函数编译的时间消耗。
-
公开(公告)号:CN114035795B
公开(公告)日:2025-05-06
申请号:CN202111156980.0
申请日:2021-09-30
Applicant: 曙光信息产业(北京)有限公司
IPC: G06F8/41 , G06N3/0464 , G06N3/08
Abstract: 本申请公开了一种核函数预编译方法、装置、计算机设备和存储介质。该方法包括:获取参数列表,参数列表用于定义核函数的参数信息;根据预设节点列表将参数列表划分为多个子列表,预设节点列表包括多个从节点;分别将每个子列表下发至对应的从节点,以指示从节点根据子列表对对应的核函数进行预编译后生成可执行文件;获取从节点发送的可执行文件,从而使网络模型训练时能够直接运行可执行文件,而无需在启动阶段对核函数进行实时编译,从而有效减少网络模型训练的启动时间,进而提升网络模型训练的效率,且分布式编译可以大大减少核函数编译的时间消耗。
-
公开(公告)号:CN112882751A
公开(公告)日:2021-06-01
申请号:CN202110222487.8
申请日:2021-02-25
Applicant: 曙光信息产业(北京)有限公司
Abstract: 本申请提供一种CUDA程序移植方法、装置、电子设备及存储介质,涉及代码移植技术领域。该方法包括:从CUDA平台获取待移植的CUDA程序的代码文件和编译构建规则;确定其编译构建流程信息;将代码文件中的待转码文件中的CUDA相关代码转换为HIP代码,以获得转码文件;基于编译构建流程信息修改转码文件对应的编译构建规则,将转码文件及修改后的编译构建规则作为程序源代码;基于编译构建规则编译程序源代码,再将程序源代码迁移至ROCm平台。该方法利用HIP将CUDA程序移植为兼容NVIDIA和AMD的跨平台程序,还对编译构建信息进行分析修改,能够对大型应用程序的CUDA代码进行代码转换,提高移植的效率。
-
-
-