-
公开(公告)号:CN119474631A
公开(公告)日:2025-02-18
申请号:CN202411532329.2
申请日:2024-10-30
Applicant: 北京邮电大学
Abstract: 本发明提供一种稀疏矩阵乘法算子的数据处理加速方法和装置,包括:数据处理过程中获得需处理的稀疏矩阵乘法算子,对稀疏矩阵进行压缩后其存储形式包括非零元数组、行指针数组、全局列索引数组和本地列索引数组。全局列索引记录稀疏矩阵划分的一组连续预设数量的稀疏行中非零元素在稀疏矩阵的列索引,每个列索引数组中全局列索引不重复。本地列索引记录每个非零元素在全局列索引数组中的位置索引。利用全局列索引访问稠密矩阵中对应的行数据并读取到临时缓存区。利用本地列索引访问临时缓存区内稠密矩阵中对应行数据。计算非零元素与稠密矩阵中对应行数据的乘积并累加,输出结果矩阵。本发明能够提高数据处理速度,降低内存访问开销。
-
公开(公告)号:CN119556935A
公开(公告)日:2025-03-04
申请号:CN202411710550.2
申请日:2024-11-27
Applicant: 北京邮电大学
IPC: G06F8/41 , G06N3/0464 , G06N3/063 , G06N3/08
Abstract: 本申请公开了一种多层卷积算子融合优化方法、装置、设备、介质及产品,涉及编译优化技术领域,该方法包括:确定待部署模型的原始计算图,基于硬件性能模型,确定原始计算图中的多个可融合算子子图;基于可融合算子子图优化原始计算图,得到优化计算图;基于优化计算图和分片尺寸,得到待部署模型的并行优化代码;目标机器运行并行优化代码,得到待部署模型的优化性能;本申请通过基于可融合算子子图优化原始计算图,能够提高目标机器执行神经网络模型时的性能。
-