-
公开(公告)号:CN109245773A
公开(公告)日:2019-01-18
申请号:CN201811279234.9
申请日:2018-10-30
Applicant: 南京大学
Abstract: 本发明涉及基于块循环稀疏矩阵神经网络的编解码方法,对具有块循环稀疏权值矩阵的全连接神经网络进行压缩编码;利用权值矩阵的循环特性和稀疏性,设计的采取掩模矩阵和非零值列表的编码方法;利用输入激励的稀疏性,设计的采取掩模向量和非零值列表的编码方法;充分利用了掩模矩阵和循环矩阵的特点,采用了硬件友好的解码方法。有益效果为:对稀疏的输入激励向量和权值矩阵同时进行压缩编码,有效减少数据所需的存储空间和运算过程中搬运数据所需的存储接入次数。在神经网络运算过程中,该方法能够有效降低访存消耗的能量,便于处理器跳过不必要的运算,提高硬件系统的吞吐率。
-
公开(公告)号:CN108710505A
公开(公告)日:2018-10-26
申请号:CN201810480883.9
申请日:2018-05-18
Applicant: 南京大学
IPC: G06F9/30
CPC classification number: G06F9/30036
Abstract: 本发明提供了一种基于FPGA的稀疏矩阵向量乘处理器,包括:预处理控制器模块,用于调度和冒险检测,使存储单元向运算单元阵列保持连续的数据流;运算模块,为多个计算单元组成计算单元阵列,通过单精度浮点乘法、加法器,实现单精度浮点稀疏矩阵向量乘运算;存储控制器模块,控制对片外DRAM中数据的读写。有益效果:所述处理器可以对存储带宽和运算资源进行扩展,有效提高了处理器的运算效率和通用性。
-
公开(公告)号:CN111208865B
公开(公告)日:2021-10-08
申请号:CN201811398206.9
申请日:2018-11-22
Applicant: 南京大学
Abstract: 一种光电计算单元、光电计算阵列及光电计算方法,所述光电计算单元包括一个半导体多功能区结构,所述半导体多功能区结构,包括至少一个载流子控制区,至少一个耦合区,以及至少一个光生载流子收集区和读出区。
-
公开(公告)号:CN109245773B
公开(公告)日:2021-09-28
申请号:CN201811279234.9
申请日:2018-10-30
Applicant: 南京大学
Abstract: 本发明涉及基于块循环稀疏矩阵神经网络的编解码方法,对具有块循环稀疏权值矩阵的全连接神经网络进行压缩编码;利用权值矩阵的循环特性和稀疏性,设计的采取掩模矩阵和非零值列表的编码方法;利用输入激励的稀疏性,设计的采取掩模向量和非零值列表的编码方法;充分利用了掩模矩阵和循环矩阵的特点,采用了硬件友好的解码方法。有益效果为:对稀疏的输入激励向量和权值矩阵同时进行压缩编码,有效减少数据所需的存储空间和运算过程中搬运数据所需的存储接入次数。在神经网络运算过程中,该方法能够有效降低访存消耗的能量,便于处理器跳过不必要的运算,提高硬件系统的吞吐率。
-
公开(公告)号:CN111208865A
公开(公告)日:2020-05-29
申请号:CN201811398206.9
申请日:2018-11-22
Applicant: 南京大学
Abstract: 一种光电计算单元、光电计算阵列及光电计算方法,所述光电计算单元包括一个半导体多功能区结构,所述半导体多功能区结构,包括至少一个载流子控制区,至少一个耦合区,以及至少一个光生载流子收集区和读出区。
-
-
-
-