-
公开(公告)号:CN118245206A
公开(公告)日:2024-06-25
申请号:CN202410089254.9
申请日:2024-01-23
Abstract: 本申请涉及一种稀疏稠密矩阵数据的并行处理方法与系统,其中,方法包括:获取待划分的稀疏矩阵,并根据GPU的线程块参数计算密集矩阵划分的边界值;对所述稀疏矩阵的长行进行行细分;将行细分后所述稀疏矩阵中第一存储格式的数组压缩形成第二存储格式的数组;根据所述边界值将所述第二存储格式的数组划分为多个矩阵块,并将所述多个矩阵块分配给GPU中不同的线程块和线程,由所述线程块循环执行直至所有矩阵块完成计算。整个过程中,针对待划分的稀疏矩阵进行行细分和数据压缩处理,再利用GPU对划分得到的矩阵块进行并行处理,可以显著提升数据处理效率,最终实现高效的稀疏稠密矩阵数据的并行处理。
-
公开(公告)号:CN118132911A
公开(公告)日:2024-06-04
申请号:CN202410089206.X
申请日:2024-01-23
IPC: G06F17/16 , G06F18/2136 , G06F18/2113 , G06F18/20 , G06F18/214 , G06F18/21 , G06F18/2431 , G06N5/01
Abstract: 本申请涉及一种图计算中稀疏矩阵向量乘的自适应方法与装置,其中,方法包括:获取图计算中稀疏矩阵,并提取稀疏矩阵的稀疏特征;获取输入的稀疏向量,提取稀疏向量特征;根据稀疏矩阵以及稀疏向量特征,采用预设决策树模型进行最优算法选择;根据稀疏矩阵以及稀疏向量特征,并采用选择的最优算法进行计算,迭代返回获取图计算中稀疏矩阵,并提取稀疏矩阵的稀疏特征的步骤,直至满足预设迭代结束条件;决策树模型在训练时构建稀疏矩阵向量乘候选计算内核列表,在图算法的迭代过程中,选择最优算法,同时针对输入的稀疏矩阵分别获取稀疏特征和稀疏向量特征,确保预设决策树模型准确预测,因此,整个方案可以实现图计算中稀疏矩阵向量乘的自适应处理。
-
公开(公告)号:CN117971472A
公开(公告)日:2024-05-03
申请号:CN202410120605.8
申请日:2024-01-29
Abstract: 本申请涉及一种基于ARM处理器的SpMV并行加速处理方法与系统,其中,方法包括:加载稀疏矩阵;若当前ARM处理器支持NUMA,则获取最大NUMA节点数目m,并将已加载的所述稀疏矩阵基于m进行行划分;将划分好的所述稀疏矩阵根据NUMA策略分配到各个节点上,并将每个节点上的子矩阵再根据线程数再次划分;将每个线程中需要处理的子矩阵按照列的相似度进行重排,并将对应的向量也重新排序;将排序后的子矩阵转换为对齐的CSR格式,并且每个线程将对齐的CSR格式的子矩阵与对应的向量进行SpMV处理;将每个节点上的SpMV相乘结果合并得到计算结果。整个过程中,通过列重排显著减少对齐的CSR格式中的向量对,可以显著加速SpMV操作,实现高效的基于ARM处理器的SpMV并行加速处理。
-
公开(公告)号:CN118568300A
公开(公告)日:2024-08-30
申请号:CN202410632283.5
申请日:2024-05-21
Applicant: 湖南大学
IPC: G06F16/901
Abstract: 本申请涉及一种图形计算中强联通分量检测方法、装置、设备及介质,其中,方法包括:获取初始有向图中顶点个数、各顶点的出度、以及顶点平均度数;根据所述各顶点的出度以及所述顶点平均度数,确定目标枢轴;将所述目标枢轴的传入和传出标签初始化为所述顶点个数加1,得到新增虚拟顶点的目标有向图;采用ECL‑SCC算法对所述目标有向图进行SCC检测。整个过程中,先确定初始有向图中的目标枢轴,基于目标枢轴来新增虚拟顶点,在后续ECL‑SCC算法中即可根据最大标签传播的特性将枢轴所在的SCC移除,显著减少后续ECL‑SCC算法迭代的次数,实现高效的图形计算中强联通分量检测。
-
公开(公告)号:CN119441961A
公开(公告)日:2025-02-14
申请号:CN202411266935.4
申请日:2024-09-11
Applicant: 湖南大学
IPC: G06F18/241 , G06F18/213 , G06F18/25 , G06F18/22 , G06N3/0455
Abstract: 本申请涉及一种基于特征降维聚合的多模态并行优化计算方法与装置,其中,方法包括:获取第一模态嵌入层参数矩阵和第二模态嵌入层参数矩阵;对第一模态嵌入层参数矩阵和第二模态嵌入层参数矩阵进行降维和注意力计算,得到所有注意力头的重要性矩阵;根据每个注意力头的重要性矩阵、预设的注意力头舍弃率和预设的注意力头性能阈值,从所有注意力头中选择前预设数量需要保留的头,得到保留的注意力头集合;基于保留的注意力头集合,进行模态间融合、模态间相似特征聚合计算以及模态间注意力决策处理,得到注意力分数矩阵的掩码矩阵;根据掩码矩阵恢复重新组织高精度的注意力计算,取出对应的第二模态键矩阵中的特征向量进行浮点数计算。
-
公开(公告)号:CN114996651B
公开(公告)日:2024-11-08
申请号:CN202210620730.6
申请日:2022-06-02
Applicant: 湖南大学
Abstract: 本申请涉及一种计算机中任务数据处理方法、装置、计算机设备和介质。该方法包括:获取计算任务对应的SK算法矩阵;基于SK算法矩阵中每一行的元素和,对SK算法矩阵中的每一行的元素进行行缩放,并将缩放后的行元素缓存至预设数组;根据预设数组中缓存的元素,得到对行缩放后的SK算法矩阵进行列缩放的缩放因子;基于缩放因子,对行缩放后的SK算法矩阵进行列缩放,得到缩放后的SK算法矩阵;根据缩放后的SK算法矩阵进行SK算法处理,得到任务数据处理结果。采用本方法能够提高任务数据处理效率。
-
公开(公告)号:CN115987292A
公开(公告)日:2023-04-18
申请号:CN202211702359.4
申请日:2022-12-29
Applicant: 湖南大学
IPC: H03M7/30
Abstract: 本申请涉及一种嵌入式编码方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取待编码数据,根据待编码数据生成尾数矩阵;对尾数矩阵进行梯形结构检测,得到尾数矩阵中每一行数据对应的前导零的数量;基于每一行数据对应的前导零的数量,得到尾数矩阵中的各比特组;根据尾数矩阵中的各比特组,对待编码数据进行编码,得到目标编码数据。采用本方法能够有效提高嵌入式编码的编码速率。
-
公开(公告)号:CN119781673A
公开(公告)日:2025-04-08
申请号:CN202411779168.7
申请日:2024-12-05
Applicant: 湖南大学
Abstract: 本申请实施例提供了一种利用退火模拟算法生成数据‑编码映射序列的方法和装置,它模拟物理退火过程,从某一较高的初始温度出发,随着温度的不断下降,以一定概率突跳在全局进行寻优,并最终趋于全局最优。搜索过程中趋于零概率的突跳特性可有效避免算法陷入局部最优。因此,在寻找较优的编码映射方案的前提下,能够降低计算量。
-
公开(公告)号:CN114996651A
公开(公告)日:2022-09-02
申请号:CN202210620730.6
申请日:2022-06-02
Applicant: 湖南大学
Abstract: 本申请涉及一种计算机中任务数据处理方法、装置、计算机设备和介质。该方法包括:获取计算任务对应的SK算法矩阵;基于SK算法矩阵中每一行的元素和,对SK算法矩阵中的每一行的元素进行行缩放,并将缩放后的行元素缓存至预设数组;根据预设数组中缓存的元素,得到对行缩放后的SK算法矩阵进行列缩放的缩放因子;基于缩放因子,对行缩放后的SK算法矩阵进行列缩放,得到缩放后的SK算法矩阵;根据缩放后的SK算法矩阵进行SK算法处理,得到任务数据处理结果。采用本方法能够提高任务数据处理效率。
-
公开(公告)号:CN114860811A
公开(公告)日:2022-08-05
申请号:CN202210572598.6
申请日:2022-05-25
Applicant: 湖南大学
IPC: G06F16/2458 , G06F16/28 , G06F16/22 , G06F16/27
Abstract: 本申请涉及一种数据集的中值近似值查找方法、装置和计算机设备。所述方法包括:获取当前的待处理数组和预定义的近似中值查找事件的当前状态,根据近似中值查找事件的当前状态,确定待处理数组的均值和标准差,构建累积频率分布表,基于累积频率分布表和上述事件的当前状态,查找出中值近似值所在的数据分组,确定待处理数组的中值近似值,并将均值、标准差、中值近似值以及中值近似值所在的数据分组的位置标识传递给下一数组,若上述事件的当前状态为第一状态,则将第一状态切换为第二状态,返回获取待处理数组和预定义的近似中值查找事件的当前状态的步骤,直至查找出数据集中所有数组的中值近似值。采用本方法能提高近似中值查找效率。
-
-
-
-
-
-
-
-
-