-
公开(公告)号:CN110826710A
公开(公告)日:2020-02-21
申请号:CN201910996386.9
申请日:2019-10-18
Applicant: 南京大学
Abstract: 本发明公开了基于横向脉动阵列的RNN前向传播模型的硬件加速实现系统及方法,首先配置网络参数,对数据进行初始化后,基于横向脉动阵列,计算中权重采用分块设计,隐藏层计算的权重矩阵按行进行分块,经过矩阵乘向量和向量求和运算和激活函数运算,计算得到隐藏层神经元,随后根据获得的隐藏层神经元,经过矩阵乘向量、向量求和运算和激活函数运算,产生RNN输出层结果,最终依据时间序列长度配置信息,产生RNN网络所需的输出结果,本方法隐藏层和输出层多维度并行,提高了计算的流水性,同时RNN网络中权重矩阵参数共享的特点,采用分块设计,进一步提高计算的并行度,灵活度高、可扩展性强、存储资源利用率高,加速比高,大大降低了计算。
-
公开(公告)号:CN110689123A
公开(公告)日:2020-01-14
申请号:CN201910926748.7
申请日:2019-09-27
Applicant: 南京大学
Abstract: 本发明公开了一种基于脉动阵列的多隐层可复用的长短期记忆神经网络前向加速系统及方法,该系统包括:算法控制模块,负责控制计算流程;门向量计算模块,负责接收源数据并在控制模块控制下将源数据传入脉动阵列,依次计算门向量并存入存储模块;细胞状态计算模块,接收到启动信号后读入门向量数据,计算神经元状态值和隐藏层输出值,存入存储模块;存储地址生成模块,负责生成存储地址。有益效果:实现了输入-隐藏层的可复用,网络规模包括输出层节点数、隐藏层节点数、时间序列长度等可配置,灵活度高,可扩展性强,存储资源利用率高,运算速度快。
-
公开(公告)号:CN110427960A
公开(公告)日:2019-11-08
申请号:CN201910528797.5
申请日:2019-06-18
Applicant: 南京大学
IPC: G06K9/62
Abstract: 本发明涉及可重构多分类支持向量机系统,该系统包括:主控制模块,存储控制模块,核函数运算模块,类别运算模块和结果比较模块。所述主控制模块为整个决策过程提供控制信息和重构信息;所述的存储控制模块控制数据的存储;所述的核函数运算模块计算测试数据和支持向量之间的核函数;所述的类别运算模块计算决策值和分类类别;所述的结果比较模块比较不同模型计算得到的决策值,得到测试数据的最终分类结果。与传统方法相比,本发明充分利用硬件的并行性,加快了支持向量机分类的运算速度,核函数运算模块和类别运算模块共享计算资源,支持硬件可重构,对于不同特征数的样本具有很好的灵活性。
-
公开(公告)号:CN110350932A
公开(公告)日:2019-10-18
申请号:CN201910596448.7
申请日:2019-07-03
Applicant: 南京大学
Abstract: 本发明设计了一种功能可扩展的外差式结构高频宽带接收机,该系统包括:单片机、电源模块、低噪声前置放大器模块、混频器模块、本振信号源模块、中频滤波器模块、数字衰减AGC模块、有效值检波模块、相位鉴频器和包络检波电路模块。有益效果:各个模块采用分立的标准接口设计,具有较高的可拆卸和可拓展性,系统预留了多个测量端口和拓展点,用户可根据实际需求调整已有模块或增加新电路模块,可方便地进行二次开发和性能优化,满足对于突发事件的极端情况中,特定场景或特定信号的专用性设计。
-
公开(公告)号:CN110347617A
公开(公告)日:2019-10-18
申请号:CN201910597031.2
申请日:2019-07-03
Applicant: 南京大学
IPC: G06F12/1081 , G06F13/28
Abstract: 本发明涉及了一种多核SoC中DMA模块的功能验证方法,具体步骤为:首先建立基于有向二分图的多核SoC中DMA模块抽象配置模型;然后采用等价类划分算法将原本扁平无序的配置空间转换成了三层的配置空间树;接着采用深度优先算法对配置空间树的叶子节点集进行遍历,得到包含高层次配置信息的无冗余全覆盖叶子节点序列;最后通过内核相关的DMACfg转换函数将每个叶子节点转换成实际DMA的配置信息。有益效果:本发明的证方法可以在保证完备的功能覆盖率基础上最小化验证配置激励集。
-
公开(公告)号:CN109711543A
公开(公告)日:2019-05-03
申请号:CN201811646423.5
申请日:2018-12-30
Applicant: 南京大学
Abstract: 本发明公开了可重构的深度置信网络实现系统,该系统包括:控制单元用于控制深度置信网络算法的运算流程;数据暂存单元用于存储计算所需的输入层信息、权重、偏置及输出层结果;受限玻尔兹曼机用于计算深度置信网络中各层结点的激活概率,以决定其激活状态;参数更新单元用于更新深度置信网络中各层结点的权重及偏置,其仅在训练算法中被激活。有益效果:该实现系统通过复用受限玻尔兹曼机及控制算法状态跳转可支持训练和推理两种算法,降低了算法的硬件资源开销,并保证了算法性能,适用于各种人工智能场景。
-
公开(公告)号:CN109509137A
公开(公告)日:2019-03-22
申请号:CN201810966120.5
申请日:2018-08-22
Applicant: 南京大学
IPC: G06T1/00
Abstract: 本发明涉及一种嵌入比16分之一的图片水印嵌入及盲提取方法,水印嵌入方法包括如下步骤:步骤1)将载体图片分成若干4*4的图像块,并形成对应的RGB矩阵;在RGB转Y的模块中,通过色彩空间转换公式将RGB矩阵转换呈Y矩阵;步骤2)通过式(2)求出Y矩阵DCT变换域的直流分量DC;步骤3)根据式(2)结合式(3)通过同时裁剪离散余弦变换和离散余弦变换逆变换两个变换,并进一步进行裁剪色彩空间转换的操作,实现将水印信息直接嵌入在RGB通道上。有益效果:解决水印嵌入比由传统的1/64提升到1/16时,传统方法所面临的载体图片失真严重和水印提取质量较差的问题。
-
公开(公告)号:CN105429646B
公开(公告)日:2019-03-22
申请号:CN201510388034.7
申请日:2015-06-30
Applicant: 南京大学
Abstract: 本发明涉及一种咬尾阶梯码编码方法,包括如下步骤1)选择一种(n,k)线性分组码作为分量码,其中n代表码长,n∈(500,5000),k代表编码前信息长度;2)按照阶梯码中的方式对接受到的信息进行分组,构造矩阵,先在第一个矩阵的下方添加一个参与编码的全零矩阵,接着用分量码对剩余矩阵进行编码,编码的同时产生校验位矩阵,再将分组内最后一个矩阵与第一个矩阵编码完成首尾的衔接,最后用得到的校验位矩阵替代内补充的全零矩阵,完成编码。有益效果为:码通过采用这种新型的编码方案,新型的咬尾阶梯码有了分组码的特性,组与组之间的编码过程相互独立,且组内每一个矩阵内的信息依旧被包含在两个分量码之中,保证了纠错的性能。
-
公开(公告)号:CN109446478A
公开(公告)日:2019-03-08
申请号:CN201811284263.4
申请日:2018-10-30
Applicant: 南京大学
IPC: G06F17/16
Abstract: 本发明涉及基于迭代和可重构方式的复协方差矩阵计算系统,包括片上SRAM存储器、片外DDR存储器、可重构单元、DMA控制器以及加速核,所述加速核包括:矩阵协方差运算模块,通过迭代计算方式轮询片上SRAM存储器的各区域源数据,并计算出下三角协方差矩阵;共轭对称模块,根据协方差矩阵的共轭对称性质,将下三角协方差矩阵通过地址映射和重构存储的方式得出完整的复协方差矩阵,形成最终的运算结果;DMA接口函数模块,将通过DMA方式从片外DDR存储器读入的数据按分区方式存入片上SRAM存储器。有益效果:本发明支持任意列数的复矩阵进行协方差运算,降低了传统硬件实现方式的源数据计算量以及多次将结果数据写回DDR的时间。
-
公开(公告)号:CN104657334B
公开(公告)日:2018-12-28
申请号:CN201410834299.0
申请日:2014-12-29
Applicant: 南京大学
IPC: G06F17/14
Abstract: 本发明涉及一种快速傅里叶变化的基2‑4‑8混合基蝶算器,包括基2单元、基4单元以及基8单元,所述基8单元包括主要由第一复数加法器、实数运算单元连接组成的前置运算单元与基4单元,所述前置运算单元通过第一寄存器与所述基4单元连接,所述基8单元、基4单元以及基2单元并接形成流水线架构。益效果为:相对于完整的基8蝶形运算器资源开销小使用更加灵活,同时有良好的并行性来满足高吞吐率系统的需求;基2‑4‑8混合基的结构使蝶算器可以像基2算法一样可以支持2的整数次幂点的序列长度。
-
-
-
-
-
-
-
-
-