-
公开(公告)号:CN119003133B
公开(公告)日:2025-04-18
申请号:CN202411465450.8
申请日:2024-10-21
Applicant: 山东科技大学
Abstract: 本发明公开了一种数据分布的图神经网络训练任务批处理调度方法,属于分布式计算中的任务调度技术领域,将图神经网络训练任务简称为任务,将执行图神经网络训练任务的系统称为分布式系统,将分布式系统中一个可独立运行的计算单元称为计算节点;同时,假定分布式系统中所有的计算节点是同构的,每个计算节点包含至少1个用于图神经网络训练的加速卡;批处理调度方法具体包括如下步骤:步骤1、调度开始前,初始化各项参数;步骤2、记录提交的任务并获取任务属性,并将提交的任务加入任务列表;步骤3、使用遗传算法进行任务调度。本发明可以有效提高加速卡资源利用率,实现资源利用率的最大化,降低能耗。
-
公开(公告)号:CN119003133A
公开(公告)日:2024-11-22
申请号:CN202411465450.8
申请日:2024-10-21
Applicant: 山东科技大学
Abstract: 本发明公开了一种数据分布的图神经网络训练任务批处理调度方法,属于分布式计算中的任务调度技术领域,将图神经网络训练任务简称为任务,将执行图神经网络训练任务的系统称为分布式系统,将分布式系统中一个可独立运行的计算单元称为计算节点;同时,假定分布式系统中所有的计算节点是同构的,每个计算节点包含至少1个用于图神经网络训练的加速卡;批处理调度方法具体包括如下步骤:步骤1、调度开始前,初始化各项参数;步骤2、记录提交的任务并获取任务属性,并将提交的任务加入任务列表;步骤3、使用遗传算法进行任务调度。本发明可以有效提高加速卡资源利用率,实现资源利用率的最大化,降低能耗。
-