-
公开(公告)号:CN118627565B
公开(公告)日:2025-01-03
申请号:CN202411105645.1
申请日:2024-08-13
Applicant: 南京大学
IPC: G06N3/065 , G06N3/0464 , G06F9/30
Abstract: 本发明公开了一种基于脉动阵列的可配置卷积运算加速装置及方法,属于超大规模集成电路的神经网络硬件加速技术领域。本发明方案针对现有卷积运算加速装置存在的问题,提出一种改进运算方式的脉动阵列,即采用行方向上广播、列方向上脉动的运算方式,将中间计算结果固定在PE中,无需停止运算以更新权重,大大提高了PE利用率,使得实际算力接近理论峰值算力,而且由于采用了行方向上广播的方式,每行PE工作状态相同,从而使得每个周期需要输出运算结果的PE数量相同,有效保证了输入输出数据吞吐率的稳定,充分利用输出通道的数据带宽。
-
公开(公告)号:CN116843977A
公开(公告)日:2023-10-03
申请号:CN202310843090.X
申请日:2023-07-11
Applicant: 南京大学
IPC: G06V10/764 , G06V10/77 , G06V10/82 , G06V10/94 , G06N3/0464 , G06N3/048 , G06N3/084 , G06N3/063
Abstract: 本发明公开了一种实现MLP‑MIXER图像分类算法的方法及其装置。该方法包括如下步骤:S1、预处理输入图像得到二维数据;S2、将数据层归一化防止训练过拟合,完成令牌MLP;S3、完成层归一化和通道MLP;S4、模型深度为N,重复N次S2‑S3,完成整个特征提取过程;S5、经过全局平均池化和全连接层完成分类。其中,令牌MLP和通道MLP中采用DRAM阵列完成转置,使用FLASH阵列完成MLP的矩阵乘运算,使用加法电路完成跳过连接。本发明降低了设计控制数据输入输出存算器件阵列的难度和部署权重参数到存算器件阵列的难度。
-
公开(公告)号:CN118627565A
公开(公告)日:2024-09-10
申请号:CN202411105645.1
申请日:2024-08-13
Applicant: 南京大学
IPC: G06N3/065 , G06N3/0464 , G06F9/30
Abstract: 本发明公开了一种基于脉动阵列的可配置卷积运算加速装置及方法,属于超大规模集成电路的神经网络硬件加速技术领域。本发明方案针对现有卷积运算加速装置存在的问题,提出一种改进运算方式的脉动阵列,即采用行方向上广播、列方向上脉动的运算方式,将中间计算结果固定在PE中,无需停止运算以更新权重,大大提高了PE利用率,使得实际算力接近理论峰值算力,而且由于采用了行方向上广播的方式,每行PE工作状态相同,从而使得每个周期需要输出运算结果的PE数量相同,有效保证了输入输出数据吞吐率的稳定,充分利用输出通道的数据带宽。
-
-