-
公开(公告)号:CN118520914A
公开(公告)日:2024-08-20
申请号:CN202410156012.7
申请日:2024-02-04
Applicant: 延世大学校产学协力团
IPC: G06N3/063 , G06N3/0464 , G06F18/22
Abstract: 本发明涉及神经网络加速器及其控制方法。本公开包括存储至少一个指令的存储器,以及被配置为执行存储在存储器中的至少一个指令的至少一个处理器,其中,至少一个处理器执行至少一个指令以:标识构成展开的输入张量的多个数据块的第一阵列,展开的输入张量是通过使用通用矩阵乘法(GEMM)运算展开输入张量以执行卷积运算获得的;标识块距离,块距离指示第一阵列中的多个数据块中具有最高数据相似度的一对数据块之间的距离;通过基于块距离对多个数据块进行分组来形成多个数据块集;以及将多个数据块集分配给并行处理通用矩阵乘法运算的多个组件。