一种基于脉动阵列的可配置卷积运算加速装置及方法

    公开(公告)号:CN118627565B

    公开(公告)日:2025-01-03

    申请号:CN202411105645.1

    申请日:2024-08-13

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于脉动阵列的可配置卷积运算加速装置及方法,属于超大规模集成电路的神经网络硬件加速技术领域。本发明方案针对现有卷积运算加速装置存在的问题,提出一种改进运算方式的脉动阵列,即采用行方向上广播、列方向上脉动的运算方式,将中间计算结果固定在PE中,无需停止运算以更新权重,大大提高了PE利用率,使得实际算力接近理论峰值算力,而且由于采用了行方向上广播的方式,每行PE工作状态相同,从而使得每个周期需要输出运算结果的PE数量相同,有效保证了输入输出数据吞吐率的稳定,充分利用输出通道的数据带宽。

    一种基于存算一体器件的Maxout激活函数运算加速装置及其方法

    公开(公告)号:CN119322910A

    公开(公告)日:2025-01-17

    申请号:CN202411070020.6

    申请日:2024-08-06

    Applicant: 南京大学

    Abstract: 本发明提供了一种基于存算一体器件的Maxout激活函数运算加速装置及其方法。该装置包括:数据拆分模块,用于将数据拆分成整数部分和小数部分;数据截取模块,用于将整数部分和小数部分的数据分别以二进制形式拆分成固定比特长度,并传输给存算一体器件阵列,同时产生相应的移位控制信号传输给累加器模块;比较器模块,用于对阵列的输出结果进行比较,得到最大值并输出;累加器模块,用于对比较器模块的输出结果进行移位累加,并根据移位控制信号输出累加后的结果;权重队列存储模块,用于存储神经网络工作负载对应的权重,在完成一层计算之后更新存算于一体器件阵列中的权重。本发明具有低功耗、高能效、精度可调以及低计算延迟的优势。

    一种基于脉动阵列的可配置卷积运算加速装置及方法

    公开(公告)号:CN118627565A

    公开(公告)日:2024-09-10

    申请号:CN202411105645.1

    申请日:2024-08-13

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于脉动阵列的可配置卷积运算加速装置及方法,属于超大规模集成电路的神经网络硬件加速技术领域。本发明方案针对现有卷积运算加速装置存在的问题,提出一种改进运算方式的脉动阵列,即采用行方向上广播、列方向上脉动的运算方式,将中间计算结果固定在PE中,无需停止运算以更新权重,大大提高了PE利用率,使得实际算力接近理论峰值算力,而且由于采用了行方向上广播的方式,每行PE工作状态相同,从而使得每个周期需要输出运算结果的PE数量相同,有效保证了输入输出数据吞吐率的稳定,充分利用输出通道的数据带宽。

    面向存算一体器件温漂特性的精度补偿装置及方法

    公开(公告)号:CN116384456A

    公开(公告)日:2023-07-04

    申请号:CN202310320690.8

    申请日:2023-03-29

    Applicant: 南京大学

    Abstract: 本发明提供了一种面向存算一体器件温漂特性的精度补偿装置及方法。该精度补偿装置包括上位机、补偿阵列模块、部分和补偿逻辑模块、温度传感模块、补偿阵列控制模块、ADC阵列和加法树,其中,补偿阵列模块,用于存储针对不同温度范围而训练得到的权重值,并对推理结果进行第一次补偿;部分和补偿逻辑模块,用于对加法树的输出结果进行采样和对推理结果进行第二次补偿。本发明可以解决存算一体器件权重随温度漂移而导致的向量矩阵乘法计算结果偏差、神经网络推理精度退化等问题,可适用于不同种类的存算一体器件,具有一定的通用性。

Patent Agency Ranking