-
公开(公告)号:CN119047526A
公开(公告)日:2024-11-29
申请号:CN202410994000.1
申请日:2024-07-24
Applicant: 浙江大学
IPC: G06N3/063 , G06N3/0464 , G06F17/15 , G06F7/57 , G06F7/544
Abstract: 本发明公开了一种完全复用GEMM和ALU架构实现Depth‑wise卷积的计算方法和装置,包括:确定GEMM和ALU架构,获取卷积层的输入特征图数据和权重数据,将输入特征图数据和权重数据划分成若干数据块和子数据块,并获得各数据块的计算顺序;按照计算顺序,将各输入特征图数据块和各权重子数据块不同通道的数据输入到对应的单通道计算单元;各单通道计算单元对各输入特征图数据矩阵和各权重子数据矩阵进行卷积计算,获得输出特征图数据块;按照顺序将输出特征图数据块写回存储器的对应地址中。本发明提高Depth‑wise卷积运算过程中GEMM计算资源的利用率,提高数据的吞吐量和处理性能。
-
公开(公告)号:CN119045726A
公开(公告)日:2024-11-29
申请号:CN202410994002.0
申请日:2024-07-24
Applicant: 浙江大学
IPC: G06F3/06 , G06F15/78 , G06F17/15 , G06N3/063 , G06N3/0464
Abstract: 本发明属于超越函数运算领域,公开了一种基于Depth‑wise卷积计算的通用数据访存的方法及装置,包括步骤1:将输入特征图数据和权重数据划分成若干数据块和若干子数据块并获得各数据块的索引顺序;步骤2:按照Depth‑wise卷积的计算顺序,从片外存储器中读取输入特征图数据块和权重数据块,单独计算各输入特征图数据和各权重数据在片上缓存器的行地址和列地址,依次写入片上缓存器中;步骤3:采用通用数据加载方式,计算各输入特征图数据和权重数据在片上缓存器的行地址和列地址,从片上缓存器中读取待卷积的输入特征图数据和权重数据。本发明提高了数据写入和读取的通用性,提高数据访存的灵活性和并行性。
-