基于异构GPU负载均衡的图神经网络分区方法

    公开(公告)号:CN119311414B

    公开(公告)日:2025-04-18

    申请号:CN202411421334.6

    申请日:2024-10-12

    Inventor: 邹毅 宋县锋 施政

    Abstract: 本发明公开基于异构GPU负载均衡的图神经网络分区方法,涉及GNN技术,针对现有技术中没有考虑分区之间的通信影响等问题提出本方案。S1.获取原始图G及分区目标数量N;S2.使用图分区算法进行粗化分区;S3.将每个子图随机预分配给各GPU;S4.对每个GPU进行计算开销建模;S5.对每个GPU进行通信开销建模;S6.根据计算开销和通信开销,设置启发式分区函数和内存约束;S7.根据启发式分区函数和内存约束对粗化分区进行调整;S8.将划分完成的分区子图分配至对应的GPU,执行图计算任务并汇总输出。其优点在于,所划分的子图可以在精度影响很小的情况下,不仅能适配GPU的性能,还尽可能减少通信需求,并防止内存溢出,最终有效减少训练时间、提升训练效率。

    一种EDA电路仿真器加速计算的方法

    公开(公告)号:CN117634394A

    公开(公告)日:2024-03-01

    申请号:CN202311630393.X

    申请日:2023-11-30

    Inventor: 施政 宋县锋 邹毅

    Abstract: 本发明公开了一种EDA电路仿真器加速计算的方法,涉及电子设计自动化技术,针对现有技术中很难对真实数据预测的问题提出本方案。结合真实开源稀疏矩阵集合和企业真实电路矩阵集合基于DyLaClass算法进行标签和聚类后,通过机器学习模型训练得到最佳格式预测模型;在电路进行仿真并产生电路网表矩阵后,利用所述最佳格式预测模型对电路网表矩阵的最佳格式进行预测;将所述电路网表矩阵以最佳格式进行储存,再参与后续仿真运算。优点在于,所得到的模型预测准确度比现有技术的模型更加精确,用户可以尽可能的将更多的真实数据输入参与训练模型,而不需要将数据进行筛选剔除来拼凑一个较好的数据分布。可以更高效的提升电路矩阵乘法的速度。

    基于异构GPU负载均衡的图神经网络分区方法

    公开(公告)号:CN119311414A

    公开(公告)日:2025-01-14

    申请号:CN202411421334.6

    申请日:2024-10-12

    Inventor: 邹毅 宋县锋 施政

    Abstract: 本发明公开基于异构GPU负载均衡的图神经网络分区方法,涉及GNN技术,针对现有技术中没有考虑分区之间的通信影响等问题提出本方案。S1.获取原始图G及分区目标数量N;S2.使用图分区算法进行粗化分区;S3.将每个子图随机预分配给各GPU;S4.对每个GPU进行计算开销建模;S5.对每个GPU进行通信开销建模;S6.根据计算开销和通信开销,设置启发式分区函数和内存约束;S7.根据启发式分区函数和内存约束对粗化分区进行调整;S8.将划分完成的分区子图分配至对应的GPU,执行图计算任务并汇总输出。其优点在于,所划分的子图可以在精度影响很小的情况下,不仅能适配GPU的性能,还尽可能减少通信需求,并防止内存溢出,最终有效减少训练时间、提升训练效率。

    基于异构GPU算力感知的子图划分方法、装置及介质

    公开(公告)号:CN117492984B

    公开(公告)日:2025-01-07

    申请号:CN202311412727.6

    申请日:2023-10-27

    Abstract: 本发明公开了一种基于异构GPU算力感知的子图划分方法、装置及介质,属于图数据处理技术领域。其中方法包括:获取原始图数据G及子图划分目标数量N,根据原始图的节点数和边数,计算整体计算负担;评估每个GPU的算力,结合评估结果设计算力感知的启发式函数,为每个GPU确定目标计算负担;根据每个节点的度数构建加权图Gw;使用图分区算法对加权图Gw完成粗化图的划分,得到子图;根据启发式函数和节点权重,调整不同子图的大小,以完成全部子图的划分。本发明充分考虑不同GPU的算力,来细化调整子图的规模,可以显著提高图计算任务在含有不同算力GPU的集群上的执行效率,以最大化每个GPU的计算潜力。

    一种基于融合手工特征与深度特征的图像匹配方法

    公开(公告)号:CN115937552B

    公开(公告)日:2024-10-29

    申请号:CN202211296680.7

    申请日:2022-10-21

    Abstract: 本发明公开了一种基于融合手工特征与深度特征的图像匹配方法,包括以下步骤:提取图像的手工特征生成手工特征描述符,对所得特征描述符进行L1归一化并对每一个元素求平方根;重新构建彩色图像的尺度金字塔,在相应金字塔层上提取局部图像块,并将图像块旋转至主方向;使用坐标注意力残差网络CAR‑HyNet模型对局部图像块提取深度特征,并生成深度特征描述符;训练CAR‑HyNet模型,并使用三元损失训练出最优模型;提取手工特征描述符与深度特征描述符双方对特征点的置信程度,将手工特征描述符与深度特征描述符进行决策级融合,生成新的特征点;筛选待配对图像中正确匹配的特征,得到包含两幅待配对图像中正确匹配的特征点对。

    一种基于融合手工特征与深度特征的图像匹配方法

    公开(公告)号:CN115937552A

    公开(公告)日:2023-04-07

    申请号:CN202211296680.7

    申请日:2022-10-21

    Abstract: 本发明公开了一种基于融合手工特征与深度特征的图像匹配方法,包括以下步骤:提取图像的手工特征生成手工特征描述符,对所得特征描述符进行L1归一化并对每一个元素求平方根;重新构建彩色图像的尺度金字塔,在相应金字塔层上提取局部图像块,并将图像块旋转至主方向;使用坐标注意力残差网络CAR‑HyNet模型对局部图像块提取深度特征,并生成深度特征描述符;训练CAR‑HyNet模型,并使用三元损失训练出最优模型;提取手工特征描述符与深度特征描述符双方对特征点的置信程度,将手工特征描述符与深度特征描述符进行决策级融合,生成新的特征点;筛选待配对图像中正确匹配的特征,得到包含两幅待配对图像中正确匹配的特征点对。

    基于异构GPU算力感知的子图划分方法、装置及介质

    公开(公告)号:CN117492984A

    公开(公告)日:2024-02-02

    申请号:CN202311412727.6

    申请日:2023-10-27

    Abstract: 本发明公开了一种基于异构GPU算力感知的子图划分方法、装置及介质,属于图数据处理技术领域。其中方法包括:获取原始图数据G及子图划分目标数量N,根据原始图的节点数和边数,计算整体计算负担;评估每个GPU的算力,结合评估结果设计算力感知的启发式函数,为每个GPU确定目标计算负担;根据每个节点的度数构建加权图Gw;使用图分区算法对加权图Gw完成粗化图的划分,得到子图;根据启发式函数和节点权重,调整不同子图的大小,以完成全部子图的划分。本发明充分考虑不同GPU的算力,来细化调整子图的规模,可以显著提高图计算任务在含有不同算力GPU的集群上的执行效率,以最大化每个GPU的计算潜力。

Patent Agency Ranking