-
公开(公告)号:CN119847977A
公开(公告)日:2025-04-18
申请号:CN202510026194.0
申请日:2025-01-08
Applicant: 中国科学院计算技术研究所
IPC: G06F15/177 , G06N5/01 , G06F9/50
Abstract: 本发明的实施例提供了一种用于多芯粒的可重构存内计算加速器的布局方法,包括:获取与布局相关的加速器参数和应用程序的应用参数;根据加速器参数和应用参数,将应用程序中的算子转换为加速器支持的功能,得到应用程序所需的各功能及其数量;模拟将每个功能独立配置到加速器的单个芯粒上,得到初始布局;多次执行预设优化方式以迭代优化布局,得到布局结果,包括:执行粗粒度优化操作,其包括:使用模拟退火算法对输入的布局进行迭代优化,优化时的扰动方式是随机交换其中两个芯粒上配置的功能,优化函数为基于布局计算的各芯粒间总的数据传输开销;执行功能整合操作,其包括:基于加速器参数尝试对粗粒度优化操作优化后的布局进行功能整合。
-
公开(公告)号:CN118550870A
公开(公告)日:2024-08-27
申请号:CN202410496156.7
申请日:2024-04-24
Applicant: 中国科学院计算技术研究所
IPC: G06F15/78
Abstract: 本发明提供了一种通用存内计算加速器,该加速器包括多个处理单元,用于并行执行多个指令缓存中的指令,其中,一个处理单元对应于一个指令缓存,每个处理单元用于执行对应指令缓存中的多条指令,且每个处理单元包括多个存算核,一个存算核用于执行一条指令,且每个存算核包括多个存算阵列,用于存储不同类型的数据,多个存算阵列基于各自存储的数据并行执行同一条指令。本发明上述实施例设计的存内计算加速器支持通用计算任务,提高了本发明上述实施例存内计算加速器在实际应用中的利用率,从而避免了严重的资源浪费。
-
公开(公告)号:CN115964015A
公开(公告)日:2023-04-14
申请号:CN202211658543.3
申请日:2022-12-22
Applicant: 中国科学院计算技术研究所
Abstract: 本发明实施例提供一种基于存内计算的稀疏矩阵稠密乘法加速器,该加速器包括:控制器,用于根据当前的计算任务,确定其中稀疏矩阵的所有非零数值、稠密向量的所有非零数值、稀疏矩阵和稠密向量的每个非零数值对应的行索引值和列索引值,且非零数值为浮点数值;CAM阵列,用于存储稀疏矩阵的每个非零数值对应的行索引值和列索引值,根据稠密向量的每个非零数值的行索引值匹配需与之进行计算的稀疏矩阵的每个非零数值的列索引值和行索引值,得到匹配结果;MAC阵列,用于根据CAM阵列的匹配结果关联存储稀疏矩阵的每个非零数值和稠密向量的每个非零数值,并执行关联存储的稀疏矩阵的每个非零数值与稠密向量对应的非零数值间的浮点乘法计算,得到计算结果。
-
-