-
公开(公告)号:CN118550504A
公开(公告)日:2024-08-27
申请号:CN202410714983.9
申请日:2024-06-04
申请人: 南京大学
IPC分类号: G06F7/72
摘要: 本发明提供了一种基‑2低延迟蒙哥马利模乘ASIC模块及其方法。其模块包括:顶层收发模块,用于获取第一输入变量A、第二输入变量B、模数N以及来自5‑2CSA核心计算单元模块的中间结果S’,并控制MMM控制迭代模块及5‑2CSA核心计算单元模块进行计算,得到蒙哥马利模乘结果S;5‑2CSA核心计算单元模块,用于接受顶层收发模块传输的第一输入变量A、第二输入变量B以及模数N,进行蒙哥马利模乘计算,并将得到的中间结果S’传输回顶层收发模块中;MMM控制迭代模块,用于控制5‑2CSA核心计算单元模块的蒙哥马利模乘计算的迭代过程。本发明优化了电路模块的面积开销,使实际运行中所需的时延和资源大大减少。
-
公开(公告)号:CN115984104B
公开(公告)日:2023-09-22
申请号:CN202211545255.7
申请日:2022-12-05
申请人: 南京大学
摘要: 本发明公开一种基于自监督学习的多聚焦图像融合方法及装置。其方法步骤为:S1、采集多个场景下的远‑近聚焦图像对;S2、对采集到的远‑近聚焦图像对进行图像增广;S3、分别获取增广后的远‑近聚焦图像对及其灰度值并进行通道拼接;S4、通过带有全局特征金字塔提取单元和全局注意连接上采样单元的全局特征编码网络获取0‑1的二进制标志Mask(x,y);S5、对单通道的Mask(x,y)进行通道扩充至三通道Mask3(x,y);S6、利用三通道Mask3(x,y)对远‑近聚焦图像对进行像素加权平均融合得到全聚焦图像。本发明使用自监督的全局特征编码网络,可以在多焦点图像融合中准确生成焦点图。
-
公开(公告)号:CN113672196B
公开(公告)日:2023-09-15
申请号:CN202110804257.2
申请日:2021-07-16
申请人: 南京大学
IPC分类号: G06F7/523 , G06F15/78 , G06N3/0464 , G06N3/063
摘要: 本发明提供了一种基于单数字信号处理单元的双乘法计算装置和方法。计算装置包括:输入处理单元,用于拼接具有公共乘数的两个被乘数得到长乘数;通用乘法器单元,用于计算长乘数与公共乘数的乘法运算;输出修正单元,用于根据公共乘数的符号位和第二被乘数的数值,对通用乘法器单元的输出结果进行拆分和修正,得到最终的输出值。该计算装置能够将共享乘数的两次短操作数乘法,合并为一次长操作数乘法,同时输出两个乘法结果。本发明适用有符号或无符号定点数的乘法,能有效提高复用同一乘数时,乘法操作的数据吞吐率和硬件资源利用率。
-
公开(公告)号:CN116051428B
公开(公告)日:2023-07-21
申请号:CN202310332399.2
申请日:2023-03-31
申请人: 南京大学
IPC分类号: G06T5/00 , G06T3/40 , G06N3/0464 , G06N3/08
摘要: 本发明公开了一种基于深度学习的联合去噪与超分的低光照图像增强方法,属于计算机视觉领域。本发明方法将训练好的增强网络、去噪网络、超分网络与全局线性提亮模块按一定顺序组织成一个包含所有处理流程的整体网络,将待处理的低光照图像输入到该网络中,依次经过低光照图像增强、全局线性提亮、去噪和超分辨率重建,得到亮度增强后的高清彩色图像。本发明在增强图像亮度的同时,不仅能够保证色彩保真度和细节还原度,而且提高了信噪比与清晰度。此外,本发明的方法具有一定灵活性,根据不同情况来决定输入的图像样本是否要经过全局线性提亮模块、去噪网络和超分网络的处理,这样能够保证输出图像在主观上和客观上的质量评价指标都比较高。
-
公开(公告)号:CN116384456A
公开(公告)日:2023-07-04
申请号:CN202310320690.8
申请日:2023-03-29
申请人: 南京大学
摘要: 本发明提供了一种面向存算一体器件温漂特性的精度补偿装置及方法。该精度补偿装置包括上位机、补偿阵列模块、部分和补偿逻辑模块、温度传感模块、补偿阵列控制模块、ADC阵列和加法树,其中,补偿阵列模块,用于存储针对不同温度范围而训练得到的权重值,并对推理结果进行第一次补偿;部分和补偿逻辑模块,用于对加法树的输出结果进行采样和对推理结果进行第二次补偿。本发明可以解决存算一体器件权重随温度漂移而导致的向量矩阵乘法计算结果偏差、神经网络推理精度退化等问题,可适用于不同种类的存算一体器件,具有一定的通用性。
-
公开(公告)号:CN116049094A
公开(公告)日:2023-05-02
申请号:CN202310341643.1
申请日:2023-04-03
申请人: 南京大学
摘要: 本发明公开了一种基于光电存算一体单元的多阈值配置装置及其方法,属于光电探测领域和超大规模集成电路的数字信号处理领域。本发明装置包括缓存模块、配置模块、计算阵列、读出模块、排序模块和全局控制模块,缓存模块用于实现数据的存储、更新与分发;配置模块用于生成外部控制信号以控制计算阵列数据的写入与读出;计算阵列用于实现高精度存算功能;读出模块读出阵列存储的数据;排序模块用于生成阵列计算需要的数据格式;全局控制模块用于控制数据分发并定位当前配置状态。本发明的装置及方法基于光电存算一体单元可以实现多阈值的配置与计算工作,缩短实际写入所需的时间,降低器件写入带来的误差,减少配置环节,提高工作效率。
-
公开(公告)号:CN110837624B
公开(公告)日:2023-04-21
申请号:CN201911104123.9
申请日:2019-11-13
申请人: 南京大学
IPC分类号: G06F17/17
摘要: 本发明公开了一种针对sigmoid函数的近似计算装置,包括负数输入转换单元、常数乘法单元、移位单元、特殊值产生单元、进位保留加法器和负数结果转换单元。负数输入转换单元用于对输入的负值x取绝对值,并输出其绝对值的二进制原码;常数乘法单元计算1.4375×x的值并输出运算结果的整部部分k和小数部分p;移位单元用于对输入p进行移位操作;特殊值产生单元用于产生λ=sigmoid(kln2)的近似值;进位保留加法器用于实现三个数的加法;负数结果转换单元实现输入x为负数时相应结果的转换功能。本发明的装置能够实现sigmoid函数的近似计算,在保持较高近似精度的同时,极大地降低运算延时、功耗及减小面积开销。
-
公开(公告)号:CN115984104A
公开(公告)日:2023-04-18
申请号:CN202211545255.7
申请日:2022-12-05
申请人: 南京大学
摘要: 本发明公开一种基于自监督学习的多聚焦图像融合方法及装置。其方法步骤为:S1、采集多个场景下的远‑近聚焦图像对;S2、对采集到的远‑近聚焦图像对进行图像增广;S3、分别获取增广后的远‑近聚焦图像对及其灰度值并进行通道拼接;S4、通过带有全局特征金字塔提取单元和全局注意连接上采样单元的全局特征编码网络获取0‑1的二进制标志Mask(x,y);S5、对单通道的Mask(x,y)进行通道扩充至三通道Mask3(x,y);S6、利用三通道Mask3(x,y)对远‑近聚焦图像对进行像素加权平均融合得到全聚焦图像。本发明使用自监督的全局特征编码网络,可以在多焦点图像融合中准确生成焦点图。
-
公开(公告)号:CN111445019B
公开(公告)日:2023-04-18
申请号:CN202010361012.2
申请日:2020-04-30
申请人: 南京大学
IPC分类号: G06N3/063 , G06N3/0464
摘要: 本发明公开了一种分组卷积中通道混洗操作的实现装置及方法。该实现装置包括顶层控制单元、Reg数组和通道混洗模块,顶层控制单元用于将分组卷积结果存入Reg数组,并且控制通道混洗模块的数据处理过程;Reg数组用于存储分组卷积得到的各通道数据并向通道混洗模块输出数据;通道混洗模块用于对Reg数组传来的数据按混洗规则进行通道混洗处理并输出数据。在顶层控制单元的控制下完成对分组卷积结果的混洗操作,可以加快数据处理的速度、提高FPGA片上资源的利用率、降低系统的瞬时负载,本发明装置结构简单、可靠、方便实现。
-
公开(公告)号:CN111445012B
公开(公告)日:2023-04-18
申请号:CN202010347520.5
申请日:2020-04-28
申请人: 南京大学
IPC分类号: G06N3/0464 , G06N3/063 , G06F17/15 , G06F15/78
摘要: 本发明公开了一种基于FPGA的分组卷积硬件加速器及其方法。该加速器包括:顶层控制器,用于对输入数据进行处理和分组存放并将权重和激励数据传递给数据分发模块;数据分发模块,用于根据输入特征图尺寸进行数据选择和分组存放并将权重和激励数据分发给卷积运算阵列;卷积运算阵列,用于分组完成稀疏卷积的乘加运算操作;结果控制模块,用于对卷积运算阵列输出的部分和的结果进行累加缓存并进行通道随机混合操作;线性激活函数单元,用于对结果控制模块输出的结果加偏置和激活函数操作;存储器DDR,用于存储原始输入图像数据、卷积运算阵列的中间结果和最终输出的特征图。本发明可以对特征图进行快速卷积操作,并且获得更多的特征图信息。
-
-
-
-
-
-
-
-
-