-
公开(公告)号:CN110879697A
公开(公告)日:2020-03-13
申请号:CN201911034169.8
申请日:2019-10-29
Applicant: 南京大学
Abstract: 本发明公开了一种近似计算tanh函数的装置,包括输入补码选择单元、常数乘法单元、移位单元、特殊值产生单元、加法单元和输出补码选择单元。输入补码选择单元将输入自变量x映射到正数区间输出,常数乘法单元计算2.875×x的整数部分k与小数部分 特殊值产生单元产生 的近似值,移位单元得到 的两个部分值,加法单元计算Ω(k)与两个移位结果的和或差,输出补码选择单元将加法单元的结果转换到x对应的正数或负数区间输出。本发明的装置能实现近似计算tanh函数,在保持较高精度的同时,极大地降低了硬件架构的功耗、面积以及延时开销。
-
公开(公告)号:CN111445013B
公开(公告)日:2023-04-25
申请号:CN202010347546.X
申请日:2020-04-28
Applicant: 南京大学
IPC: G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明一种针对卷积神经网络的非零探测器及其方法。该非零探测器包括顶层控制单元,用于将输入的激励与权重数据存入本地缓存模块,并控制激励与权重探零模块和位与及寻址模块的操作;本地缓存模块,用于存放卷积神经网络的激励与权重数据;激励与权重探零模块,用于根据本地缓存模块的激励与权重数据进行非零筛选,并将得到的比特图返回本地缓存模块;位与及寻址模块,用于将激励比特图向量和权重比特图向量按位与,得到对应位置上的权重和激励值都非零的地址,并输出给本地缓存模块。本发明的非零探测器在不额外占用太多存储与运算资源的情况下,有效地提高了卷积神经网络的计算效率,缩小了卷积神经网络计算量。
-
公开(公告)号:CN110837624B
公开(公告)日:2023-04-21
申请号:CN201911104123.9
申请日:2019-11-13
Applicant: 南京大学
IPC: G06F17/17
Abstract: 本发明公开了一种针对sigmoid函数的近似计算装置,包括负数输入转换单元、常数乘法单元、移位单元、特殊值产生单元、进位保留加法器和负数结果转换单元。负数输入转换单元用于对输入的负值x取绝对值,并输出其绝对值的二进制原码;常数乘法单元计算1.4375×x的值并输出运算结果的整部部分k和小数部分p;移位单元用于对输入p进行移位操作;特殊值产生单元用于产生λ=sigmoid(kln2)的近似值;进位保留加法器用于实现三个数的加法;负数结果转换单元实现输入x为负数时相应结果的转换功能。本发明的装置能够实现sigmoid函数的近似计算,在保持较高近似精度的同时,极大地降低运算延时、功耗及减小面积开销。
-
公开(公告)号:CN111445019B
公开(公告)日:2023-04-18
申请号:CN202010361012.2
申请日:2020-04-30
Applicant: 南京大学
IPC: G06N3/063 , G06N3/0464
Abstract: 本发明公开了一种分组卷积中通道混洗操作的实现装置及方法。该实现装置包括顶层控制单元、Reg数组和通道混洗模块,顶层控制单元用于将分组卷积结果存入Reg数组,并且控制通道混洗模块的数据处理过程;Reg数组用于存储分组卷积得到的各通道数据并向通道混洗模块输出数据;通道混洗模块用于对Reg数组传来的数据按混洗规则进行通道混洗处理并输出数据。在顶层控制单元的控制下完成对分组卷积结果的混洗操作,可以加快数据处理的速度、提高FPGA片上资源的利用率、降低系统的瞬时负载,本发明装置结构简单、可靠、方便实现。
-
公开(公告)号:CN110879697B
公开(公告)日:2021-09-28
申请号:CN201911034169.8
申请日:2019-10-29
Applicant: 南京大学
Abstract: 本发明公开了一种近似计算tanh函数的装置,包括输入补码选择单元、常数乘法单元、移位单元、特殊值产生单元、加法单元和输出补码选择单元。输入补码选择单元将输入自变量x映射到正数区间输出,常数乘法单元计算2.875×x的整数部分k与小数部分特殊值产生单元产生的近似值,移位单元得到的两个部分值,加法单元计算Ω(k)与两个移位结果的和或差,输出补码选择单元将加法单元的结果转换到x对应的正数或负数区间输出。本发明的装置能实现近似计算tanh函数,在保持较高精度的同时,极大地降低了硬件架构的功耗、面积以及延时开销。
-
公开(公告)号:CN111445019A
公开(公告)日:2020-07-24
申请号:CN202010361012.2
申请日:2020-04-30
Applicant: 南京大学
Abstract: 本发明公开了一种分组卷积中通道混洗操作的实现装置及方法。该实现装置包括顶层控制单元、Reg数组和通道混洗模块,顶层控制单元用于将分组卷积结果存入Reg数组,并且控制通道混洗模块的数据处理过程;Reg数组用于存储分组卷积得到的各通道数据并向通道混洗模块输出数据;通道混洗模块用于对Reg数组传来的数据按混洗规则进行通道混洗处理并输出数据。在顶层控制单元的控制下完成对分组卷积结果的混洗操作,可以加快数据处理的速度、提高FPGA片上资源的利用率、降低系统的瞬时负载,本发明装置结构简单、可靠、方便实现。
-
公开(公告)号:CN111445013A
公开(公告)日:2020-07-24
申请号:CN202010347546.X
申请日:2020-04-28
Applicant: 南京大学
Abstract: 本发明一种针对卷积神经网络的非零探测器及其方法。该非零探测器包括顶层控制单元,用于将输入的激励与权重数据存入本地缓存模块,并控制激励与权重探零模块和位与及寻址模块的操作;本地缓存模块,用于存放卷积神经网络的激励与权重数据;激励与权重探零模块,用于根据本地缓存模块的激励与权重数据进行非零筛选,并将得到的比特图返回本地缓存模块;位与及寻址模块,用于将激励比特图向量和权重比特图向量按位与,得到对应位置上的权重和激励值都非零的地址,并输出给本地缓存模块。本发明的非零探测器在不额外占用太多存储与运算资源的情况下,有效地提高了卷积神经网络的计算效率,缩小了卷积神经网络计算量。
-
公开(公告)号:CN111428196A
公开(公告)日:2020-07-17
申请号:CN202010234283.1
申请日:2020-03-30
Applicant: 南京大学
IPC: G06F17/17
Abstract: 本发明公开了一种基于随机计算的非单调函数近似计算装置,包括输入移位单元、特殊值生成单元、随机比特流生成单元、取反选择单元、逻辑运算单元和计数器单元。输入移位单元将输入自变量x的高m位取出,作为特殊值生成单元的输入,特殊值生成单元通过组合逻辑映射得到装置需要的特殊值,随机比特流生成单元将特殊值转换为随机比特流,逻辑运算单元对随机比特流进行按位逻辑运算并输出相应的结果比特流,计数器单元统计结果比特流中“1”的个数以得到输出结果。本发明的装置能实现基于随机计算原理近似计算非单调函数,在保持较高精度的同时,极大地降低了硬件架构的功耗和面积开销。
-
公开(公告)号:CN111428195A
公开(公告)日:2020-07-17
申请号:CN202010234266.8
申请日:2020-03-30
Applicant: 南京大学
IPC: G06F17/17
Abstract: 本发明公开了一种基于随机计算的减函数近似计算装置。该装置包括输入移位单元、特殊值产生单元、随机数产生单元、逻辑门单元和输出计数单元,输入移位单元得到输入自变量x左移m位后得到的整数部分p和小数部分q,特殊值产生单元通过逻辑映射的方法分别产生λ和近似值,三个随机数产生单元分别将λ、和q转化为随机比特流,逻辑门单元通过与非门和与门对随机比特流进行按位逻辑操作并输出相应结果比特流,输出计数单元用于计数比特流中1的个数,转化为二进制实数输出。本发明的装置基于随机计算和分段近似的方法能实现近似计算输入与输出均在区间[0,1)上的减函数,在保持较高精度的同时,极大地降低了硬件架构的功耗、面积开销。
-
公开(公告)号:CN110837624A
公开(公告)日:2020-02-25
申请号:CN201911104123.9
申请日:2019-11-13
Applicant: 南京大学
IPC: G06F17/17
Abstract: 本发明公开了一种针对sigmoid函数的近似计算装置,包括负数输入转换单元、常数乘法单元、移位单元、特殊值产生单元、进位保留加法器和负数结果转换单元。负数输入转换单元用于对输入的负值x取绝对值,并输出其绝对值的二进制原码;常数乘法单元计算1.4375×x的值并输出运算结果的整部部分k和小数部分p;移位单元用于对输入p进行移位操作;特殊值产生单元用于产生λ=sigmoid(kln2)的近似值;进位保留加法器用于实现三个数的加法;负数结果转换单元实现输入x为负数时相应结果的转换功能。本发明的装置能够实现sigmoid函数的近似计算,在保持较高近似精度的同时,极大地降低运算延时、功耗及减小面积开销。
-
-
-
-
-
-
-
-
-