-
公开(公告)号:CN110837891B
公开(公告)日:2022-05-17
申请号:CN201911014330.5
申请日:2019-10-23
Applicant: 南京大学
IPC: G06N3/08
Abstract: 本发明涉及基于一种SIMD架构的自组织映射方法及系统,包括:距离计算模块,通过计算输入向量和对应竞争层神经元权值向量的曼哈顿距离,找到距离最小的最佳匹配竞争层神经元;学习率和领域半径计算模块,通过移位操作实现学习率和领域半径的更新;合作模块,在竞争中获胜的神经元不是单独被激励的,而是通过确定获胜神经元为中心的领域,领域内的神经元共同被激励;权值更新模块,在获胜神经元领域半径内部的神经元对应权重得到更新,将计算好的权重存回片上SRAM。本发明支持样本任意分类与任意特征的运算,能够实现低复杂度与高精度的要求。
-
公开(公告)号:CN109282903A
公开(公告)日:2019-01-29
申请号:CN201710596908.7
申请日:2017-07-20
Applicant: 南京大学
IPC: G01J5/20
Abstract: 本发明公开了一种基于表面电磁波共振的高性能CMOS红外微测辐射热计。该微测辐射热计包括L形微桥结构,微桥结构单元包括桥墩、桥臂和红外吸收体,红外吸收体为多层结构,自上而下依次为氮化硅层、金属光栅层、二氧化硅层、蛇形铝热敏电阻层和二氧化硅层。本发明的微测辐射热计结构与传统的微测辐射热计结构相比,在热敏电阻层上面增加了金属光栅,形成MIM结构,该结构利用表面电磁波激发共振,显著提高了探测器的红外吸收率,增加了探测器响应,实现高效率探测。同时本发明的微测辐射热计基于标准CMOS集成电路工艺,具有工艺上容易实现、价格低廉等优点。
-
公开(公告)号:CN111860819B
公开(公告)日:2023-11-07
申请号:CN202010731785.5
申请日:2020-07-27
Applicant: 南京大学
IPC: G06N3/063 , G06N3/0464
Abstract: 本发明涉及一种可拼接、可分段的全连接神经网络推理加速器及其加速方法,加速器包括控制模块、存储模块、计算模块三大功能模块,控制模块有三种模式:配置模式、搬运模式、计算模式。本发明充分利用全连接计算的可并行性以及权重的可共享性,支持多批处理、多路并行计算。控制模块通过模式的跳转来控制整个全连接的实现与加速。本发明可以实现对输入神经元和权重的独立地址的拼接,即可以将需要进行多次计算的全连接合并为一次全连接运算;其次,本发明可以实现全连接计算的拆分,通过暂存中间结果的方式对其进行分段计算,在硬件资源有限的情况下,实现大规模的全连接神经网络的计算。
-
公开(公告)号:CN109977347B
公开(公告)日:2023-06-13
申请号:CN201910251542.9
申请日:2019-03-29
Applicant: 南京大学
Abstract: 本发明的支持多模式配置的可重构FFT处理器,包括:片上SRAM存储器,通过数据对外传输模块与片外存储器进行通信;可重构计算阵列,包含有若干基于IEEE‑754标准的单精度浮点加法器、减法器以及浮点乘法器;FFT控制器,控制FFT运算的整个流程;数据对外传输模块,控制处理器与片外存储器之间的数据传输。有益效果:该处理器具有运算精度高,加速效果明显,硬件资源利用率高的优点。
-
公开(公告)号:CN110826710B
公开(公告)日:2021-04-23
申请号:CN201910996386.9
申请日:2019-10-18
Applicant: 南京大学
Abstract: 本发明公开了基于横向脉动阵列的RNN前向传播模型的硬件加速实现系统及方法,首先配置网络参数,对数据进行初始化后,基于横向脉动阵列,计算中权重采用分块设计,隐藏层计算的权重矩阵按行进行分块,经过矩阵乘向量和向量求和运算和激活函数运算,计算得到隐藏层神经元,随后根据获得的隐藏层神经元,经过矩阵乘向量、向量求和运算和激活函数运算,产生RNN输出层结果,最终依据时间序列长度配置信息,产生RNN网络所需的输出结果,本方法隐藏层和输出层多维度并行,提高了计算的流水性,同时RNN网络中权重矩阵参数共享的特点,采用分块设计,进一步提高计算的并行度,灵活度高、可扩展性强、存储资源利用率高,加速比高,大大降低了计算。
-
公开(公告)号:CN111860819A
公开(公告)日:2020-10-30
申请号:CN202010731785.5
申请日:2020-07-27
Applicant: 南京大学
Abstract: 本发明涉及一种可拼接、可分段的全连接神经网络推理加速器及其加速方法,加速器包括控制模块、存储模块、计算模块三大功能模块,控制模块有三种模式:配置模式、搬运模式、计算模式。本发明充分利用全连接计算的可并行性以及权重的可共享性,支持多批处理、多路并行计算。控制模块通过模式的跳转来控制整个全连接的实现与加速。本发明可以实现对输入神经元和权重的独立地址的拼接,即可以将需要进行多次计算的全连接合并为一次全连接运算;其次,本发明可以实现全连接计算的拆分,通过暂存中间结果的方式对其进行分段计算,在硬件资源有限的情况下,实现大规模的全连接神经网络的计算。
-
公开(公告)号:CN110826710A
公开(公告)日:2020-02-21
申请号:CN201910996386.9
申请日:2019-10-18
Applicant: 南京大学
Abstract: 本发明公开了基于横向脉动阵列的RNN前向传播模型的硬件加速实现系统及方法,首先配置网络参数,对数据进行初始化后,基于横向脉动阵列,计算中权重采用分块设计,隐藏层计算的权重矩阵按行进行分块,经过矩阵乘向量和向量求和运算和激活函数运算,计算得到隐藏层神经元,随后根据获得的隐藏层神经元,经过矩阵乘向量、向量求和运算和激活函数运算,产生RNN输出层结果,最终依据时间序列长度配置信息,产生RNN网络所需的输出结果,本方法隐藏层和输出层多维度并行,提高了计算的流水性,同时RNN网络中权重矩阵参数共享的特点,采用分块设计,进一步提高计算的并行度,灵活度高、可扩展性强、存储资源利用率高,加速比高,大大降低了计算。
-
公开(公告)号:CN110837891A
公开(公告)日:2020-02-25
申请号:CN201911014330.5
申请日:2019-10-23
Applicant: 南京大学
IPC: G06N3/08
Abstract: 本发明涉及基于一种SIMD架构的自组织映射方法及系统,包括:距离计算模块,通过计算输入向量和对应竞争层神经元权值向量的曼哈顿距离,找到距离最小的最佳匹配竞争层神经元;学习率和领域半径计算模块,通过移位操作实现学习率和领域半径的更新;合作模块,在竞争中获胜的神经元不是单独被激励的,而是通过确定获胜神经元为中心的领域,领域内的神经元共同被激励;权值更新模块,在获胜神经元领域半径内部的神经元对应权重得到更新,将计算好的权重存回片上SRAM。本发明支持样本任意分类与任意特征的运算,能够实现低复杂度与高精度的要求。
-
公开(公告)号:CN109977347A
公开(公告)日:2019-07-05
申请号:CN201910251542.9
申请日:2019-03-29
Applicant: 南京大学
Abstract: 本发明的支持多模式配置的可重构FFT处理器,包括:片上SRAM存储器,通过数据对外传输模块与片外存储器进行通信;可重构计算阵列,包含有若干基于IEEE‑754标准的单精度浮点加法器、减法器以及浮点乘法器;FFT控制器,控制FFT运算的整个流程;数据对外传输模块,控制处理器与片外存储器之间的数据传输。有益效果:该处理器具有运算精度高,加速效果明显,硬件资源利用率高的优点。
-
公开(公告)号:CN110232441B
公开(公告)日:2023-05-09
申请号:CN201910528794.1
申请日:2019-06-18
Applicant: 南京大学
IPC: G06N3/063
Abstract: 本发明的基于单向脉动阵列的堆栈式自编码算法推理的硬件实现,包括信号控制模块、输入输出控制模块、数据地址产生模块和计算阵列模块;信号控制模块:接收开始信号,控制各模块间通信,产生结束信号;输入输出控制模块:输入时读取片外DDR的数据并按特定方式存入片内SRAM,输出时将片内SRAM数据按特定方式写回DDR;数据地址产生模块:生成源数据或结果数据地址;计算阵列模块:以单向脉动阵列的方式进行神经网络算法的推理运算。本发明支持批处理,支持流水操作,通过乒乓操作实现部分计算时间和访存时间的隐藏,加速比高,可扩展性好。
-
-
-
-
-
-
-
-
-