-
公开(公告)号:CN111078187A
公开(公告)日:2020-04-28
申请号:CN201911194267.8
申请日:2019-11-28
Applicant: 南京大学
Abstract: 本发明提供一种针对单精度浮点数的任意次方根求解方法及其求解器。求解器包括:除法计算模块,用于对输入的次方根值N进行除法操作;反正切值计算模块,用于将输入的单精度浮点数的尾数部分M进行求反正切值的操作并得到对数值log2M;计算模块,用于对单精度浮点数的指数部分E、次方根值N的倒数1/N以及对数值log2M进行乘法和加法操作;正弦和余弦计算模块,用于对计算模块得到的计算结果求以2为底双曲正弦和余弦值;计算结果整合模块,将求得的双曲正弦和双曲余弦值求和,并与指数部分E的中间计算结果进行整合,得到单精度浮点数格式的最终计算结果。本发明的求解器可以计算任意单精度浮点数的任意次方根值,具有一定通用性。
-
公开(公告)号:CN106951356B
公开(公告)日:2020-04-07
申请号:CN201710188724.7
申请日:2017-03-27
Applicant: 南京大学
IPC: G06F11/30
Abstract: 本发明涉及一种信号接口处理板状态信息监测方法,包括:上电信息监测,在上电之后进行一次性监测,输出上电监测信息,为上电后信号接口处理板发生状态异常时提供参考;随帧信息监测,对此刻分发输出的每一帧数据所包含的各类信息进行监测,输出随帧监测信息,以便在数据出现卡断情况时提供数据帧情况;实时信息监测,所述实时信息包括显示传输数据速率与每个模块内部包含细节的详细信息,输出实时刷新监测信息,在定位问题时将所述实时信息示出;顶层监测,接收上述所有监测信息,并将所述监测信息输出。涵盖了工程中可能出现的不同信息类型,并将它们根据各自特点对应处理,节省了大量查找问题的时间和精力。
-
公开(公告)号:CN110879697A
公开(公告)日:2020-03-13
申请号:CN201911034169.8
申请日:2019-10-29
Applicant: 南京大学
Abstract: 本发明公开了一种近似计算tanh函数的装置,包括输入补码选择单元、常数乘法单元、移位单元、特殊值产生单元、加法单元和输出补码选择单元。输入补码选择单元将输入自变量x映射到正数区间输出,常数乘法单元计算2.875×x的整数部分k与小数部分 特殊值产生单元产生 的近似值,移位单元得到 的两个部分值,加法单元计算Ω(k)与两个移位结果的和或差,输出补码选择单元将加法单元的结果转换到x对应的正数或负数区间输出。本发明的装置能实现近似计算tanh函数,在保持较高精度的同时,极大地降低了硬件架构的功耗、面积以及延时开销。
-
公开(公告)号:CN110138358A
公开(公告)日:2019-08-16
申请号:CN201910359412.7
申请日:2019-04-30
Applicant: 南京大学
IPC: H03H17/06
Abstract: 本发明公开了一种偶长线性相位有限冲击响应(FIR)数字滤波器。该滤波器包括前置加法模块,用于将采样后的输入数据按一定的规则进行分组并累加;系数乘法模块,用于将预先处理的滤波器抽头系数和前置加法模块的输出数据相乘;后置加法模块,用于将系数乘法模块的输出数据变换成传统FIR滤波器的输出结果;输出模块,用于输出并行数据。本发明的滤波器利用了对称系数的固有特性,与现有的快速FIR算法(FFA)快速并行FIR滤波器结构相比,可以减少子滤波器段中的乘法器数量,从而大大节省硬件成本。
-
公开(公告)号:CN110110851A
公开(公告)日:2019-08-09
申请号:CN201910359395.7
申请日:2019-04-30
Applicant: 南京大学
Abstract: 本发明提供了一种LSTM神经网络的FPGA加速器及其加速方法。加速器包括数据分发单元、运算单元、控制单元和存储单元;运算单元包括稀疏矩阵向量乘模块、非线性激活函数模块和按元素乘加计算模块;控制单元发出控制信号给数据分发单元,数据分发单元从存储单元中读取输入激励值和神经网络权重参数,并输入到运算单元进行运算。本发明按非零权重值的个数均匀地分配给每个运算单元,这样不会造成运算资源的闲置,从而提高整个网络的运算性能。同时,采用稀疏网络的形式存储剪枝后的神经网络,每一列的权重值存储在同一个地址空间,并根据行索引对其进行编码,在保证精度的情况下,提高了运算性能和数据吞吐率。
-
公开(公告)号:CN107248883B
公开(公告)日:2019-08-06
申请号:CN201710292659.2
申请日:2017-04-28
Applicant: 南京大学
IPC: H04B10/079
Abstract: 本发明涉及一种面向高吞吐量负载平衡硬件的实时监测系统,包括:光纤数据接收模块,通过FIFO接收来自光口的下行光纤数据;随帧监测信息采集模块,对光纤数据接收模块接收的每一帧数据进行监测,并监测数据处理模块是否正常工作,输出所述监测信息;数据处理模块,完成光纤数据的接收,按照工作模式选择,将光纤数据进行合并,将合并后的数据写入DDR读写模块;DDR读写模块,完成光纤数据的有效帧和所述监测信息的存储和读出;数据分配模块,将DDR读写模块存储的数据和所述监测信息按帧读出;数据发送模块,模块根据ID号选择处理簇并将光纤数据输出。有意效果:通过对资源的合理配置,实现了高吞吐量实时数字信号处理系统中负载平衡的实时监测方法,节省了芯片的面积,同时满足系统实时性和稳定性的要求。
-
公开(公告)号:CN105930201B
公开(公告)日:2019-03-22
申请号:CN201610262442.2
申请日:2016-04-25
Applicant: 南京大学
IPC: G06F9/455
Abstract: 本发明涉及可重构专用处理器核的功能模拟器,包括:对外接口模块,模拟可重构专用处理器核内部寄存器组和内部SRAM的功能,接收需要模拟的配置指令,根据所述配置指令解析得到的任务信息,并将所述任务信息写入一个全局的任务队列;控制模块,模拟可重构专用处理器核内部主控制器的功能,根据所述任务队列在各模块之间传递所述任务信息,从所述任务队列获取当前需要执行的运算任务和即将进行的运算任务,调度运算实现模块执行运算任务;运算实现模块,执行若干种算法输出运算结果数据与运算状态,并执行任务信息、运算结果数据的搬运。有益效果为:模拟速度更快,便于系统级调试和优化;有助于提高效率和节约成本。
-
公开(公告)号:CN109245773A
公开(公告)日:2019-01-18
申请号:CN201811279234.9
申请日:2018-10-30
Applicant: 南京大学
Abstract: 本发明涉及基于块循环稀疏矩阵神经网络的编解码方法,对具有块循环稀疏权值矩阵的全连接神经网络进行压缩编码;利用权值矩阵的循环特性和稀疏性,设计的采取掩模矩阵和非零值列表的编码方法;利用输入激励的稀疏性,设计的采取掩模向量和非零值列表的编码方法;充分利用了掩模矩阵和循环矩阵的特点,采用了硬件友好的解码方法。有益效果为:对稀疏的输入激励向量和权值矩阵同时进行压缩编码,有效减少数据所需的存储空间和运算过程中搬运数据所需的存储接入次数。在神经网络运算过程中,该方法能够有效降低访存消耗的能量,便于处理器跳过不必要的运算,提高硬件系统的吞吐率。
-
公开(公告)号:CN108762719A
公开(公告)日:2018-11-06
申请号:CN201810497969.2
申请日:2018-05-21
Applicant: 南京大学
CPC classification number: G06F12/0646 , G06F7/483 , G06F15/7867
Abstract: 本发明的并行广义内积重构控制器,包括:中间结果计算模块,接收源数据并根据源数据计算中间结果向量,生成向量的地址,存入bank;每完成一个中间结果向量的计算生成一个完成信号,并将所述完成信号发送至最终结果计算模块,作为启动信号;最终结果计算模块,读数据进入复数乘累加器进行最终结果计算得到结果矩阵第L个元素,生成向量的地址,存入bank;数据存储地址处理模块,根据乒乓操作选择信号进行数据选择,生成正确的bank地址信号。有益效果:计算时间少且存储资源利用率大,可满足在许多信号检测应用场景中进行非均匀检测时,获取检验统计量的高实时性要求。
-
公开(公告)号:CN108710944A
公开(公告)日:2018-10-26
申请号:CN201810412916.6
申请日:2018-04-30
Applicant: 南京大学
CPC classification number: G06N3/08 , G06N3/0481
Abstract: 本发明的生成可训练的分段式线性激活函数的方法,用于简化硬件加速过程中复杂的非线性激活函数的计算问题。该发明利用分段式的线性函数对非线性的激活函数进行替代,通过自身学习的办法不断更新系数,以达到利用线性函数替代非线性激活函数的目的。相比一般的线性激活函数而言,本方法更为接近原本非线性激活函数,相对误差较小,并在不断的逆向传播中更新系数,加快了学习的收敛速度,并在一定范围内尽可能的消除了梯度爆炸和梯度消失的问题。
-
-
-
-
-
-
-
-
-