-
公开(公告)号:CN111723336A
公开(公告)日:2020-09-29
申请号:CN202010486502.5
申请日:2020-06-01
Applicant: 南京大学
Abstract: 本发明提出了一种采用循环迭代方式的基于cholesky分解的任意阶矩阵求逆硬件加速系统,包括DSP核,外部DDR存储器,AXI接口,主控制器、双DMA控制器、SRAM存储器、PE运算阵列及矩阵求逆运算模块;所述矩阵求逆模块包括cholesky分解,三角矩阵求逆和三角矩阵乘法三个子运算模块,三个子模块使用相同的数据存储方式;采用循环迭代的方法代替传统的乘累加计算,求解cholesky分解的结果以及三角矩阵的逆矩阵,降低了读写数据时的寻址复杂度;采用一种适用于三角矩阵的新型矩阵乘法算法,缩短了矩阵乘法的计算时间;本发明支持4至256阶中任意阶数复数矩阵的求逆运算,具有硬件复杂度低,存储资源利用率高的特点,实现了高阶高性能的设计目标。
-
公开(公告)号:CN107196792B
公开(公告)日:2020-08-04
申请号:CN201710349231.7
申请日:2017-05-17
Applicant: 南京大学
Abstract: 本发明公开了一种可扩展的支持动态部分重构的可重构计算配置网络系统,采用多层次嵌套树形结构形成配置网络系统,配置流每一次改变配置路径方向都扩展两个配置方向,形成一条配置链上配置串行传递、多条配置链上配置并行传递的串并行混合配置的重构方式,多层次嵌套树形结构由至少一个双树配置网络结构与一个双向主干配置链组成,双树配置网络结构由两个单树配置网络结构组成,每个单树配置网络结构均与可重构计算单元相连。本发明几乎不增加逻辑资源消耗的前提下,减少了互连和配置功耗。
-
公开(公告)号:CN110826710A
公开(公告)日:2020-02-21
申请号:CN201910996386.9
申请日:2019-10-18
Applicant: 南京大学
Abstract: 本发明公开了基于横向脉动阵列的RNN前向传播模型的硬件加速实现系统及方法,首先配置网络参数,对数据进行初始化后,基于横向脉动阵列,计算中权重采用分块设计,隐藏层计算的权重矩阵按行进行分块,经过矩阵乘向量和向量求和运算和激活函数运算,计算得到隐藏层神经元,随后根据获得的隐藏层神经元,经过矩阵乘向量、向量求和运算和激活函数运算,产生RNN输出层结果,最终依据时间序列长度配置信息,产生RNN网络所需的输出结果,本方法隐藏层和输出层多维度并行,提高了计算的流水性,同时RNN网络中权重矩阵参数共享的特点,采用分块设计,进一步提高计算的并行度,灵活度高、可扩展性强、存储资源利用率高,加速比高,大大降低了计算。
-
公开(公告)号:CN110689123A
公开(公告)日:2020-01-14
申请号:CN201910926748.7
申请日:2019-09-27
Applicant: 南京大学
Abstract: 本发明公开了一种基于脉动阵列的多隐层可复用的长短期记忆神经网络前向加速系统及方法,该系统包括:算法控制模块,负责控制计算流程;门向量计算模块,负责接收源数据并在控制模块控制下将源数据传入脉动阵列,依次计算门向量并存入存储模块;细胞状态计算模块,接收到启动信号后读入门向量数据,计算神经元状态值和隐藏层输出值,存入存储模块;存储地址生成模块,负责生成存储地址。有益效果:实现了输入-隐藏层的可复用,网络规模包括输出层节点数、隐藏层节点数、时间序列长度等可配置,灵活度高,可扩展性强,存储资源利用率高,运算速度快。
-
公开(公告)号:CN110427960A
公开(公告)日:2019-11-08
申请号:CN201910528797.5
申请日:2019-06-18
Applicant: 南京大学
IPC: G06K9/62
Abstract: 本发明涉及可重构多分类支持向量机系统,该系统包括:主控制模块,存储控制模块,核函数运算模块,类别运算模块和结果比较模块。所述主控制模块为整个决策过程提供控制信息和重构信息;所述的存储控制模块控制数据的存储;所述的核函数运算模块计算测试数据和支持向量之间的核函数;所述的类别运算模块计算决策值和分类类别;所述的结果比较模块比较不同模型计算得到的决策值,得到测试数据的最终分类结果。与传统方法相比,本发明充分利用硬件的并行性,加快了支持向量机分类的运算速度,核函数运算模块和类别运算模块共享计算资源,支持硬件可重构,对于不同特征数的样本具有很好的灵活性。
-
公开(公告)号:CN110350932A
公开(公告)日:2019-10-18
申请号:CN201910596448.7
申请日:2019-07-03
Applicant: 南京大学
Abstract: 本发明设计了一种功能可扩展的外差式结构高频宽带接收机,该系统包括:单片机、电源模块、低噪声前置放大器模块、混频器模块、本振信号源模块、中频滤波器模块、数字衰减AGC模块、有效值检波模块、相位鉴频器和包络检波电路模块。有益效果:各个模块采用分立的标准接口设计,具有较高的可拆卸和可拓展性,系统预留了多个测量端口和拓展点,用户可根据实际需求调整已有模块或增加新电路模块,可方便地进行二次开发和性能优化,满足对于突发事件的极端情况中,特定场景或特定信号的专用性设计。
-
公开(公告)号:CN110347617A
公开(公告)日:2019-10-18
申请号:CN201910597031.2
申请日:2019-07-03
Applicant: 南京大学
IPC: G06F12/1081 , G06F13/28
Abstract: 本发明涉及了一种多核SoC中DMA模块的功能验证方法,具体步骤为:首先建立基于有向二分图的多核SoC中DMA模块抽象配置模型;然后采用等价类划分算法将原本扁平无序的配置空间转换成了三层的配置空间树;接着采用深度优先算法对配置空间树的叶子节点集进行遍历,得到包含高层次配置信息的无冗余全覆盖叶子节点序列;最后通过内核相关的DMACfg转换函数将每个叶子节点转换成实际DMA的配置信息。有益效果:本发明的证方法可以在保证完备的功能覆盖率基础上最小化验证配置激励集。
-
公开(公告)号:CN109711543A
公开(公告)日:2019-05-03
申请号:CN201811646423.5
申请日:2018-12-30
Applicant: 南京大学
Abstract: 本发明公开了可重构的深度置信网络实现系统,该系统包括:控制单元用于控制深度置信网络算法的运算流程;数据暂存单元用于存储计算所需的输入层信息、权重、偏置及输出层结果;受限玻尔兹曼机用于计算深度置信网络中各层结点的激活概率,以决定其激活状态;参数更新单元用于更新深度置信网络中各层结点的权重及偏置,其仅在训练算法中被激活。有益效果:该实现系统通过复用受限玻尔兹曼机及控制算法状态跳转可支持训练和推理两种算法,降低了算法的硬件资源开销,并保证了算法性能,适用于各种人工智能场景。
-
公开(公告)号:CN109509137A
公开(公告)日:2019-03-22
申请号:CN201810966120.5
申请日:2018-08-22
Applicant: 南京大学
IPC: G06T1/00
Abstract: 本发明涉及一种嵌入比16分之一的图片水印嵌入及盲提取方法,水印嵌入方法包括如下步骤:步骤1)将载体图片分成若干4*4的图像块,并形成对应的RGB矩阵;在RGB转Y的模块中,通过色彩空间转换公式将RGB矩阵转换呈Y矩阵;步骤2)通过式(2)求出Y矩阵DCT变换域的直流分量DC;步骤3)根据式(2)结合式(3)通过同时裁剪离散余弦变换和离散余弦变换逆变换两个变换,并进一步进行裁剪色彩空间转换的操作,实现将水印信息直接嵌入在RGB通道上。有益效果:解决水印嵌入比由传统的1/64提升到1/16时,传统方法所面临的载体图片失真严重和水印提取质量较差的问题。
-
公开(公告)号:CN105429646B
公开(公告)日:2019-03-22
申请号:CN201510388034.7
申请日:2015-06-30
Applicant: 南京大学
Abstract: 本发明涉及一种咬尾阶梯码编码方法,包括如下步骤1)选择一种(n,k)线性分组码作为分量码,其中n代表码长,n∈(500,5000),k代表编码前信息长度;2)按照阶梯码中的方式对接受到的信息进行分组,构造矩阵,先在第一个矩阵的下方添加一个参与编码的全零矩阵,接着用分量码对剩余矩阵进行编码,编码的同时产生校验位矩阵,再将分组内最后一个矩阵与第一个矩阵编码完成首尾的衔接,最后用得到的校验位矩阵替代内补充的全零矩阵,完成编码。有益效果为:码通过采用这种新型的编码方案,新型的咬尾阶梯码有了分组码的特性,组与组之间的编码过程相互独立,且组内每一个矩阵内的信息依旧被包含在两个分量码之中,保证了纠错的性能。
-
-
-
-
-
-
-
-
-