-
公开(公告)号:CN116932457A
公开(公告)日:2023-10-24
申请号:CN202310843208.9
申请日:2023-07-11
Applicant: 南京大学
Abstract: 本发明公开了一种改进的线缓存滑窗装置及其存储方法。其装置包括线缓存以及滑窗,线缓存的输入端连接时钟信号、复位信号、输入数据、输入信号有效信号、滑窗完成信号和线缓存滑窗复位信号;线缓存的输出端连接中间数据、满信号、备份缓存满信号、缓存切换信号和线缓存滑窗复位信号;滑窗的输入端与线缓存的输出端连接,同时还连接时钟信号、复位信号、滑窗使能信号、中间数据和满信号;滑窗的输出端连接滑窗完成信号、线缓存滑窗复位信号、输出数据、输出数据有效信号和滑窗切换信号。本发明增加了线缓存与滑窗之间的滑窗完成等待切换信号、滑窗开始信号两个信号,使得线缓存滑窗装置可以适配任意卷积步长、填充系数的情形。
-
公开(公告)号:CN116911365A
公开(公告)日:2023-10-20
申请号:CN202310744336.8
申请日:2023-06-21
Applicant: 南京大学
IPC: G06N3/063 , G06N3/0464 , G06F15/78 , G06F3/06
Abstract: 本发明提供了一种适用于存算一体阵列的数据流通路装置及其方法。该装置包括:全局缓冲区,用于缓存推理过程的中间结果,并将已就绪的下一步骤数据输送到等待区寄存器组中;等待区寄存器组,用于存储和驱动要进入存算一体阵列进行计算的输入数据;存算一体阵列,用于根据预先映射的权重信息实现神经网络推理过程的卷积操作和全连接层计算,并将所得到的计算中间结果传输到单指令多数据流模块;单指令多数据流模块,用于实现神经网络推理过程中的池化操作、激活函数的功能,并将结果传输到所述全局缓冲区。本发明的数据流通路装置和方法可以简化数据的存储和调度,提高电路模块的复用性。
-
公开(公告)号:CN110825346B
公开(公告)日:2023-09-12
申请号:CN201911074103.1
申请日:2019-10-31
Applicant: 南京大学
IPC: G06F7/523
Abstract: 本发明提供了一种低逻辑复杂度的无符号近似乘法器。该近似乘法器包括部分积矩阵生成模块、第一阶段近似压缩模块、第二阶段近似压缩模块、第二阶段准确压缩模块和加法器模块。在部分积矩阵的压缩部分引入“近似”,在部分积矩阵压缩的第一阶段全部使用近似压缩器;在部分积矩阵压缩的第二阶段,权重高位部分使用全加器和半加器,权重低位部分仅使用近似压缩器。本发明使用的近似压缩器都仅使用逻辑与门和逻辑或门,相对于精确的压缩器(半加器和全加器)逻辑简单,硬件开销小。本发明的近似乘法器在提升电路性能的同时保障了准确度,在精度和硬件成本方面取得了较好的平衡。
-
公开(公告)号:CN116049094B
公开(公告)日:2023-07-21
申请号:CN202310341643.1
申请日:2023-04-03
Applicant: 南京大学
Abstract: 本发明公开了一种基于光电存算一体单元的多阈值配置装置及其方法,属于光电探测领域和超大规模集成电路的数字信号处理领域。本发明装置包括缓存模块、配置模块、计算阵列、读出模块、排序模块和全局控制模块,缓存模块用于实现数据的存储、更新与分发;配置模块用于生成外部控制信号以控制计算阵列数据的写入与读出;计算阵列用于实现高精度存算功能;读出模块读出阵列存储的数据;排序模块用于生成阵列计算需要的数据格式;全局控制模块用于控制数据分发并定位当前配置状态。本发明的装置及方法基于光电存算一体单元可以实现多阈值的配置与计算工作,缩短实际写入所需的时间,降低器件写入带来的误差,减少配置环节,提高工作效率。
-
公开(公告)号:CN108762719B
公开(公告)日:2023-06-06
申请号:CN201810497969.2
申请日:2018-05-21
Applicant: 南京大学
Abstract: 本发明的并行广义内积重构控制器,包括:中间结果计算模块,接收源数据并根据源数据计算中间结果向量,生成向量的地址,存入bank;每完成一个的计算生成一个完成信号,并将所述完成信号发送至最终结果计算模块,作为启动信号;最终结果计算模块,读数据进入复数乘累加器进行最终结果计算得到结果矩阵第L个元素,生成向量的地址,存入bank;数据存储地址处理模块,根据乒乓操作选择信号进行数据选择,生成正确的bank地址信号。有益效果:计算时间少且存储资源利用率大,可满足在许多信号检测应用场景中进行非均匀检测时,获取检验统计量的高实时性要求。
-
公开(公告)号:CN115456903B
公开(公告)日:2023-05-09
申请号:CN202211166825.1
申请日:2022-09-23
Applicant: 南京大学
IPC: G06T5/00 , G06N3/0442 , G06N3/0895 , G06N3/0464
Abstract: 本发明提供一种基于深度学习的全彩夜间视觉增强方法和系统。该方法包括以下步骤:S1、采集各种环境光照度下的RAW格式图像序列信息;S2、预处理RAW格式图像序列,获得像素融合之后的RGB格式图像序列;S3、获取黑电平图像,去除黑电平;S4、根据图像典型区域亮度线性提亮;S5、通过带有门控循环单元的去噪网络获取去噪后的图像序列;S6、恢复初始亮度;S7、通过自监督的循环卷积神经网络自适应调整图像序列的亮度。本发明使用长时序信息对图像序列去噪,能够有效去除10‑3Lux左右环境下采集的图像噪声,提高图像信噪比。
-
公开(公告)号:CN115238872A
公开(公告)日:2022-10-25
申请号:CN202211005398.9
申请日:2022-08-22
Applicant: 南京大学
Abstract: 本发明涉及一种适用于任意卷积尺寸的winogard快速卷积分块方法。该分块方法包括如下步骤:步骤1,根据输入矩阵、卷积核尺寸选定适合的winograd参数;步骤2,计算分块参数、循环判断参数等控制条件进行分块循环计算;步骤3,将各个分块进行winogard快速卷积,并将得到的卷积结果值按顺序拼接;步骤4,将得到的拼接卷积结果去掉其中重复计算的行、列值,最后就可得到正确的卷积结果值。本发明创新性地提出一种适用于任意卷积尺寸的winogard快速卷积分块方法,具有一定的通用性,既能满足快速卷积算法的正确性、高效性,在硬件部署上也比传统的补零方法节约更多的资源消耗。
-
公开(公告)号:CN113933111A
公开(公告)日:2022-01-14
申请号:CN202111168017.4
申请日:2021-09-30
Applicant: 南京大学
IPC: G01N1/18
Abstract: 本发明提供了一种实现图像尺寸放大的上采样装置及其方法。其装置包括数据存储单元、数据传输单元、数据接收单元、卷积运算单元、读控制单元和写控制单元。本发明提供的实现图像上采样的方法,可以对不同尺寸图像、不同类型的图像进行处理,同时采用了流水化、模块化的思想,通过对处理的图像数据进行分块处理,重复使用分块中部分数据,例如分块的某一行及某一列,以避免卷积操作造成的图像的信息损失,提升了图像上采样的效果,也减少了硬件资源的开销。
-
公开(公告)号:CN113625963A
公开(公告)日:2021-11-09
申请号:CN202110804248.3
申请日:2021-07-16
Applicant: 南京大学
Abstract: 本发明公开了一种基于存算一体器件的卷积神经网络层间的存储装置及方法。该装置的卷积输入结构包括线缓存滑窗,线缓存滑窗包括线缓存以及滑窗,线缓存的输入端连接时钟信号、复位信号、输入数据、输入信号有效信号、滑窗完成信号和线缓存滑窗复位信号;线缓存的输出端连接中间数据、满信号、备份缓存满信号、缓存切换信号和线缓存滑窗复位信号;滑窗的输入端与线缓存的输出端连接,同时还连接时钟信号、复位信号、滑窗使能信号、中间数据和满信号;滑窗的输出端连接滑窗完成信号、线缓存滑窗复位信号、输出数据、输出数据有效信号和滑窗切换信号。本发明的装置和方法应用在神经网络可使实际运行中所需的片上存储器大大减少,提高性能和能效比。
-
公开(公告)号:CN111208865B
公开(公告)日:2021-10-08
申请号:CN201811398206.9
申请日:2018-11-22
Applicant: 南京大学
Abstract: 一种光电计算单元、光电计算阵列及光电计算方法,所述光电计算单元包括一个半导体多功能区结构,所述半导体多功能区结构,包括至少一个载流子控制区,至少一个耦合区,以及至少一个光生载流子收集区和读出区。
-
-
-
-
-
-
-
-
-