-
公开(公告)号:CN111443893A
公开(公告)日:2020-07-24
申请号:CN202010347709.4
申请日:2020-04-28
Applicant: 南京大学
Abstract: 本发明公开了一种基于CORDIC算法的N次根计算装置及方法。该装置包括基本计算模块、CORDIC模块和控制模块;控制模块用于控制CORDIC模块和基本计算模块之间的配合计算;CORDIC模块用于进行对数运算、除法运算、双曲正弦运算和双曲余弦运算;基本计算模块用于对需要输入给CORDIC模块的数据或CORDIC模块输出的数据进行加法和移位操作。首先利用双曲CORDIC旋转模式对被开方数进行对数运算,然后利用线性CORDIC向量模式进行除法运算,最后利用双曲CORDIC向量模式进行指数运算,得到N次根的计算结果。本发明能够实现N次根的计算,在保持较高精度的同时,极大地降低了硬件资源的开销。
-
公开(公告)号:CN111428196A
公开(公告)日:2020-07-17
申请号:CN202010234283.1
申请日:2020-03-30
Applicant: 南京大学
IPC: G06F17/17
Abstract: 本发明公开了一种基于随机计算的非单调函数近似计算装置,包括输入移位单元、特殊值生成单元、随机比特流生成单元、取反选择单元、逻辑运算单元和计数器单元。输入移位单元将输入自变量x的高m位取出,作为特殊值生成单元的输入,特殊值生成单元通过组合逻辑映射得到装置需要的特殊值,随机比特流生成单元将特殊值转换为随机比特流,逻辑运算单元对随机比特流进行按位逻辑运算并输出相应的结果比特流,计数器单元统计结果比特流中“1”的个数以得到输出结果。本发明的装置能实现基于随机计算原理近似计算非单调函数,在保持较高精度的同时,极大地降低了硬件架构的功耗和面积开销。
-
公开(公告)号:CN111428195A
公开(公告)日:2020-07-17
申请号:CN202010234266.8
申请日:2020-03-30
Applicant: 南京大学
IPC: G06F17/17
Abstract: 本发明公开了一种基于随机计算的减函数近似计算装置。该装置包括输入移位单元、特殊值产生单元、随机数产生单元、逻辑门单元和输出计数单元,输入移位单元得到输入自变量x左移m位后得到的整数部分p和小数部分q,特殊值产生单元通过逻辑映射的方法分别产生λ和近似值,三个随机数产生单元分别将λ、和q转化为随机比特流,逻辑门单元通过与非门和与门对随机比特流进行按位逻辑操作并输出相应结果比特流,输出计数单元用于计数比特流中1的个数,转化为二进制实数输出。本发明的装置基于随机计算和分段近似的方法能实现近似计算输入与输出均在区间[0,1)上的减函数,在保持较高精度的同时,极大地降低了硬件架构的功耗、面积开销。
-
公开(公告)号:CN111208865A
公开(公告)日:2020-05-29
申请号:CN201811398206.9
申请日:2018-11-22
Applicant: 南京大学
Abstract: 一种光电计算单元、光电计算阵列及光电计算方法,所述光电计算单元包括一个半导体多功能区结构,所述半导体多功能区结构,包括至少一个载流子控制区,至少一个耦合区,以及至少一个光生载流子收集区和读出区。
-
公开(公告)号:CN110837624A
公开(公告)日:2020-02-25
申请号:CN201911104123.9
申请日:2019-11-13
Applicant: 南京大学
IPC: G06F17/17
Abstract: 本发明公开了一种针对sigmoid函数的近似计算装置,包括负数输入转换单元、常数乘法单元、移位单元、特殊值产生单元、进位保留加法器和负数结果转换单元。负数输入转换单元用于对输入的负值x取绝对值,并输出其绝对值的二进制原码;常数乘法单元计算1.4375×x的值并输出运算结果的整部部分k和小数部分p;移位单元用于对输入p进行移位操作;特殊值产生单元用于产生λ=sigmoid(kln2)的近似值;进位保留加法器用于实现三个数的加法;负数结果转换单元实现输入x为负数时相应结果的转换功能。本发明的装置能够实现sigmoid函数的近似计算,在保持较高近似精度的同时,极大地降低运算延时、功耗及减小面积开销。
-
公开(公告)号:CN110647983A
公开(公告)日:2020-01-03
申请号:CN201910944467.4
申请日:2019-09-30
Applicant: 南京大学
Abstract: 本发明公开了一种基于存算一体器件阵列的自监督学习的加速系统及方法。该加速系统包括缓存模块、计算阵列、权重输入模块、辅助电路、控制模块和参数更新模块;缓存模块、计算阵列和参数更新模块依次相连;权重输入模块与计算阵列相连接,用于更新计算阵列;控制模块分别与缓存模块、权重输入模块、计算阵列和参数更新模块连接;计算阵列和辅助电路用于完成对自监督神经网络的运算。本发明借助存算一体计算阵列的面积和功耗优势,实现了一种自监督学习的加速系统和方法,相比现有利用图形计算显卡和传统数字电路的处理系统,可以节省大量的能耗和产品体积。
-
公开(公告)号:CN110058841A
公开(公告)日:2019-07-26
申请号:CN201910321975.7
申请日:2019-04-22
Applicant: 南京大学
IPC: G06F7/544
Abstract: 本发明提供了一种面向具有对称性的非线性函数的通用计算装置和方法。计算装置包括取绝对值单元、地址索引单元、查找表单元、乘加单元、取符号位单元、减法器和选择器。其中,地址索引单元包括比较器、控制器、地址寄存器和分段端点存储器。本发明提供的面向具有对称性的非线性函数计算装置,可以计算任意具有轴对称或中心对称的非线性函数值,具有一定的通用性。同时本发明根据目标分段线性函数与原始非线性函数的最大绝对误差对原始非线性函数进行分段处理,可实现近似计算结果的精度可控。
-
公开(公告)号:CN108665063A
公开(公告)日:2018-10-16
申请号:CN201810480881.X
申请日:2018-05-18
Applicant: 南京大学
IPC: G06N3/063
Abstract: 本发明提供了一种用于BNN硬件加速器的双向数据级并行处理卷积加速系统包括:存储单元,用于存储输入的激励数据、卷积核参数以及该层卷积运算结束后的结果;运算控制器,控制各个卷积层之间数据的传递、激励的输入与读取卷积核参数的读取、参数运算以及计算结果的存储;卷积运算模块,根据所述控制器指令,读取缓冲单元里的数据和参数,完成卷积操作;数据搬运模块,根据运算控制器的配置信息,将所有参数与激励数据从片外DDR搬运至片上存储器。通过增加运算资源和数据存储资源的开销,大大提高了运算吞吐率。
-
公开(公告)号:CN106803415A
公开(公告)日:2017-06-06
申请号:CN201710189439.7
申请日:2017-03-27
Applicant: 南京大学
IPC: G09G3/32
CPC classification number: G09G3/32
Abstract: 本发明涉及一种基于ARM处理器的LED数字模组包括:网络通信模块,接收上位机发出的配置信息和多媒体数据;播放控制模块,接收所述配置信息后,将配置信息进行保存,并将所述多媒体数据通过ARM芯片的硬件解码单元进行解码得到流媒体压缩信息;输出接口模块,将所述流媒体压缩信息通过GPIO口转化成LED阵列的控制信息并同步进行显示。有益效果为:利用ARM处理器自身频率高、可编程性强的优势,解决了基于FPGA等硬件架构的专用LED控制模组通用性差和刷新频率低的问题,提高了LED屏的显示效率;采用高速网络接口传输信息,使得数据吞吐率大大提高。
-
公开(公告)号:CN220914254U
公开(公告)日:2024-05-07
申请号:CN202322424227.6
申请日:2023-09-06
Applicant: 南京大学
IPC: H01L31/113 , H01L31/0224 , H01L31/0352 , H01L31/18 , G06E3/00
Abstract: 本实用新型公开了一种高光电转换效率的光电计算单元及光电计算组件。本实用新型所述的光电计算单元包括在衬底收集区上依次形成的、包括底层介质层,电荷耦合层、顶层介质层和控制栅极的栅极区域,以及在同样衬底收集区上形成、且位于所述栅极区域相对两侧的源端和漏端,其特征在于,所述源端和漏端在水平方向上分别远离所述栅极区域预定阈值的距离,以至于经过退火工艺导致的源端和漏端的水平方向扩散不会使得源端和漏端与栅极区域竖直交叠。本实用新型所述的光电计算单元进行了大间距的源端和漏端设计,并使源端和漏端分别与栅极区域之间具有小梯度的离子掺杂浓度分布,使装置实现高水平的光输入效率。
-
-
-
-
-
-
-
-
-