-
公开(公告)号:CN119311414B
公开(公告)日:2025-04-18
申请号:CN202411421334.6
申请日:2024-10-12
Applicant: 华南理工大学
Abstract: 本发明公开基于异构GPU负载均衡的图神经网络分区方法,涉及GNN技术,针对现有技术中没有考虑分区之间的通信影响等问题提出本方案。S1.获取原始图G及分区目标数量N;S2.使用图分区算法进行粗化分区;S3.将每个子图随机预分配给各GPU;S4.对每个GPU进行计算开销建模;S5.对每个GPU进行通信开销建模;S6.根据计算开销和通信开销,设置启发式分区函数和内存约束;S7.根据启发式分区函数和内存约束对粗化分区进行调整;S8.将划分完成的分区子图分配至对应的GPU,执行图计算任务并汇总输出。其优点在于,所划分的子图可以在精度影响很小的情况下,不仅能适配GPU的性能,还尽可能减少通信需求,并防止内存溢出,最终有效减少训练时间、提升训练效率。
-
公开(公告)号:CN117634394A
公开(公告)日:2024-03-01
申请号:CN202311630393.X
申请日:2023-11-30
Applicant: 华南理工大学
IPC: G06F30/367 , G06F30/27
Abstract: 本发明公开了一种EDA电路仿真器加速计算的方法,涉及电子设计自动化技术,针对现有技术中很难对真实数据预测的问题提出本方案。结合真实开源稀疏矩阵集合和企业真实电路矩阵集合基于DyLaClass算法进行标签和聚类后,通过机器学习模型训练得到最佳格式预测模型;在电路进行仿真并产生电路网表矩阵后,利用所述最佳格式预测模型对电路网表矩阵的最佳格式进行预测;将所述电路网表矩阵以最佳格式进行储存,再参与后续仿真运算。优点在于,所得到的模型预测准确度比现有技术的模型更加精确,用户可以尽可能的将更多的真实数据输入参与训练模型,而不需要将数据进行筛选剔除来拼凑一个较好的数据分布。可以更高效的提升电路矩阵乘法的速度。
-
公开(公告)号:CN119311414A
公开(公告)日:2025-01-14
申请号:CN202411421334.6
申请日:2024-10-12
Applicant: 华南理工大学
Abstract: 本发明公开基于异构GPU负载均衡的图神经网络分区方法,涉及GNN技术,针对现有技术中没有考虑分区之间的通信影响等问题提出本方案。S1.获取原始图G及分区目标数量N;S2.使用图分区算法进行粗化分区;S3.将每个子图随机预分配给各GPU;S4.对每个GPU进行计算开销建模;S5.对每个GPU进行通信开销建模;S6.根据计算开销和通信开销,设置启发式分区函数和内存约束;S7.根据启发式分区函数和内存约束对粗化分区进行调整;S8.将划分完成的分区子图分配至对应的GPU,执行图计算任务并汇总输出。其优点在于,所划分的子图可以在精度影响很小的情况下,不仅能适配GPU的性能,还尽可能减少通信需求,并防止内存溢出,最终有效减少训练时间、提升训练效率。
-
公开(公告)号:CN117492984B
公开(公告)日:2025-01-07
申请号:CN202311412727.6
申请日:2023-10-27
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于异构GPU算力感知的子图划分方法、装置及介质,属于图数据处理技术领域。其中方法包括:获取原始图数据G及子图划分目标数量N,根据原始图的节点数和边数,计算整体计算负担;评估每个GPU的算力,结合评估结果设计算力感知的启发式函数,为每个GPU确定目标计算负担;根据每个节点的度数构建加权图Gw;使用图分区算法对加权图Gw完成粗化图的划分,得到子图;根据启发式函数和节点权重,调整不同子图的大小,以完成全部子图的划分。本发明充分考虑不同GPU的算力,来细化调整子图的规模,可以显著提高图计算任务在含有不同算力GPU的集群上的执行效率,以最大化每个GPU的计算潜力。
-
公开(公告)号:CN115937552B
公开(公告)日:2024-10-29
申请号:CN202211296680.7
申请日:2022-10-21
Applicant: 华南理工大学
IPC: G06V10/75 , G06V10/46 , G06V10/82 , G06V10/44 , G06V10/80 , G06V10/771 , G06N3/0464 , G06N3/096
Abstract: 本发明公开了一种基于融合手工特征与深度特征的图像匹配方法,包括以下步骤:提取图像的手工特征生成手工特征描述符,对所得特征描述符进行L1归一化并对每一个元素求平方根;重新构建彩色图像的尺度金字塔,在相应金字塔层上提取局部图像块,并将图像块旋转至主方向;使用坐标注意力残差网络CAR‑HyNet模型对局部图像块提取深度特征,并生成深度特征描述符;训练CAR‑HyNet模型,并使用三元损失训练出最优模型;提取手工特征描述符与深度特征描述符双方对特征点的置信程度,将手工特征描述符与深度特征描述符进行决策级融合,生成新的特征点;筛选待配对图像中正确匹配的特征,得到包含两幅待配对图像中正确匹配的特征点对。
-
公开(公告)号:CN115937552A
公开(公告)日:2023-04-07
申请号:CN202211296680.7
申请日:2022-10-21
Applicant: 华南理工大学
IPC: G06V10/75 , G06V10/46 , G06V10/82 , G06V10/44 , G06V10/80 , G06V10/771 , G06N3/0464 , G06N3/096
Abstract: 本发明公开了一种基于融合手工特征与深度特征的图像匹配方法,包括以下步骤:提取图像的手工特征生成手工特征描述符,对所得特征描述符进行L1归一化并对每一个元素求平方根;重新构建彩色图像的尺度金字塔,在相应金字塔层上提取局部图像块,并将图像块旋转至主方向;使用坐标注意力残差网络CAR‑HyNet模型对局部图像块提取深度特征,并生成深度特征描述符;训练CAR‑HyNet模型,并使用三元损失训练出最优模型;提取手工特征描述符与深度特征描述符双方对特征点的置信程度,将手工特征描述符与深度特征描述符进行决策级融合,生成新的特征点;筛选待配对图像中正确匹配的特征,得到包含两幅待配对图像中正确匹配的特征点对。
-
公开(公告)号:CN115879404B
公开(公告)日:2024-10-22
申请号:CN202211390949.8
申请日:2022-11-07
Applicant: 华南理工大学
IPC: G06F30/367 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于视觉Transform电路网表仿真加速优化方法,通过将电路网表生成的稀疏矩阵转换成灰度图像,再经VIT模型进行图像的特征提取后,选择最适合本电路网表的稀疏矩阵存储格式,从而达到后续电路仿真器计算加速的效果。利用本发明提出的基于VIT模型的矩阵灰度图分类识别方法,可以将电路仿真器乘法计算的速度显著提升,极大缩短芯片设计周期。
-
公开(公告)号:CN117492984A
公开(公告)日:2024-02-02
申请号:CN202311412727.6
申请日:2023-10-27
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于异构GPU算力感知的子图划分方法、装置及介质,属于图数据处理技术领域。其中方法包括:获取原始图数据G及子图划分目标数量N,根据原始图的节点数和边数,计算整体计算负担;评估每个GPU的算力,结合评估结果设计算力感知的启发式函数,为每个GPU确定目标计算负担;根据每个节点的度数构建加权图Gw;使用图分区算法对加权图Gw完成粗化图的划分,得到子图;根据启发式函数和节点权重,调整不同子图的大小,以完成全部子图的划分。本发明充分考虑不同GPU的算力,来细化调整子图的规模,可以显著提高图计算任务在含有不同算力GPU的集群上的执行效率,以最大化每个GPU的计算潜力。
-
公开(公告)号:CN115879404A
公开(公告)日:2023-03-31
申请号:CN202211390949.8
申请日:2022-11-07
Applicant: 华南理工大学
IPC: G06F30/367 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于视觉Transform电路网表仿真加速优化方法,通过将电路网表生成的稀疏矩阵转换成灰度图像,再经VIT模型进行图像的特征提取后,选择最适合本电路网表的稀疏矩阵存储格式,从而达到后续电路仿真器计算加速的效果。利用本发明提出的基于VIT模型的矩阵灰度图分类识别方法,可以将电路仿真器乘法计算的速度显著提升,极大缩短芯片设计周期。
-
-
-
-
-
-
-
-