-
公开(公告)号:CN108805266B
公开(公告)日:2021-10-26
申请号:CN201810497967.3
申请日:2018-05-21
Applicant: 南京大学
IPC: G06N3/04
Abstract: 本发明提供了一种可重构CNN高并发卷积加速器,包括:权重地址生成单元,生成卷积核数据在缓存中的地址;结果地址生成单元,生成结果数据在缓存中的地址;可重构计算单元,可将计算阵列重构为两种不同粒度的乘累加树电路;特征图地址生成单元,生成特征图数据在缓存中的地址;主控制器,生成与地址同步的累加器清零信号,选通可重构计算单元中对应的电路,产生整个运算结束的中断信号;存储交换单元,将有效的特征图读地址、权重读地址转换为对存储单元的读操作,将有效的结果写地址和数据转换为对存储单元的写操作。有益效果:简化控制部分,极大地提高多通道二维卷积运算并行度和对存储访问的效率,减少占用的资源。
-
公开(公告)号:CN108416164B
公开(公告)日:2021-09-28
申请号:CN201810250930.0
申请日:2018-03-23
Applicant: 南京大学
IPC: G06F30/20 , G06F119/08
Abstract: 本发明公开了一种基于有限数目温度传感器的三维片上网络温度重建系统,该系统采用高斯和滤波器来重建三维片上网络芯片的温度,高斯和滤波器用若干高斯分布的加权和近似一个非高斯分布,因此若干高斯项滤波结果可被合并成一个等效高斯项;所述高斯和滤波器硬件架构是一个可重用架构,该可重用架构可实现计算资源和存储资源的复用,其包含三部分:可重用控制器、存储资源、计算单元阵列。本发明可以有效解决温度传感器数目有限且噪声为非高斯的情况下,三维片上网络温度重建的问题,本发明述及的可重用高斯和滤波器硬件架构可以提高计算资源和存储资源的利用率,同时减少面积、降低功耗。
-
公开(公告)号:CN106649200A
公开(公告)日:2017-05-10
申请号:CN201611222110.8
申请日:2016-12-27
Applicant: 南京大学
CPC classification number: G06F17/142 , G06F7/575 , G06F17/5068
Abstract: 本发明的一种基于时分复用的自相关运算VLSI设计方法,包括如下步骤:(1)通过FFT模块将源数据补零后做2的幂次方傅立叶变换,并输出一次中间结果;(2)将所述中间结果进行共轭点乘,并将二次中间结果存回原地址;(3)最后通过逆FFT模块,对所述二次中间结果做逆傅立叶变换,得到自相关结果。有益效果:通过增减存储资源和计算资源,满足不同点数自相关运算的性能需求。
-
公开(公告)号:CN105426345A
公开(公告)日:2016-03-23
申请号:CN201510994192.7
申请日:2015-12-25
Applicant: 南京大学
IPC: G06F17/16
CPC classification number: G06F17/16
Abstract: 本发明涉及一种矩阵求逆运算方法,包括如下步骤:1)首先进行列选主元LU分解:根据公式PA=LU,将源矩阵A分解为单位下三角矩阵L、上三角矩阵U和置换矩阵P;2)接着进行三角矩阵求逆:对L矩阵求逆得到其逆矩阵L-1,将U矩阵的转置矩阵求逆后再转置得到U-1;3)最后进行矩阵相乘:将矩阵U-1和矩阵 L-1相乘,并根据置换矩阵P将矩阵乘法结果进行列变换得到源矩阵A-1。有益效果为:通过使用列选主元LU分解算法,有效地降低矩阵求逆算法的时间复杂度,增加矩阵求逆运算的可并行性,减少矩阵求逆运算的时间,并且支持任意阶数的矩阵求逆运算,可以根据运算点数需求增加或减少硬件资源,更好地满足实际应用的需求。
-
公开(公告)号:CN106649200B
公开(公告)日:2019-06-04
申请号:CN201611222110.8
申请日:2016-12-27
Applicant: 南京大学
Abstract: 本发明的一种基于时分复用的自相关运算VLSI设计方法,包括如下步骤:(1)通过FFT模块将源数据补零后做2的幂次方傅立叶变换,并输出一次中间结果;(2)将所述中间结果进行共轭点乘,并将二次中间结果存回原地址;(3)最后通过逆FFT模块,对所述二次中间结果做逆傅立叶变换,得到自相关结果。有益效果:通过增减存储资源和计算资源,满足不同点数自相关运算的性能需求。
-
公开(公告)号:CN108536931A
公开(公告)日:2018-09-14
申请号:CN201810250929.8
申请日:2018-03-23
Applicant: 南京大学
IPC: G06F17/50
Abstract: 本发明公开了一种基于贪婪算法的三维片上网络中温度传感器的部署方法,该方法首先建立一个基于状态空间的三维片上网络的热模型,然后设定可观测性格拉姆矩阵的秩作为优化目标函数,最后采用贪婪算法,从温度传感器可选的位置集合V中选择一个大小为m的子集S用来部署温度传感器,该子集使得目标函数最大化。本发明可以在多项式时间内找到一个次优解,并保证满足一定的误差界。与传统方法相比,在存在测量噪声以及传感器数目有限的情况下,本发明结合卡尔曼滤波可以实现较高精度的全芯片温度重建。
-
公开(公告)号:CN108416164A
公开(公告)日:2018-08-17
申请号:CN201810250930.0
申请日:2018-03-23
Applicant: 南京大学
IPC: G06F17/50
Abstract: 本发明公开了一种基于有限数目温度传感器的三维片上网络温度重建系统,该系统采用高斯和滤波器来重建三维片上网络芯片的温度,高斯和滤波器用若干高斯分布的加权和近似一个非高斯分布,因此若干高斯项滤波结果可被合并成一个等效高斯项;所述高斯和滤波器硬件架构是一个可重用架构,该可重用架构可实现计算资源和存储资源的复用,其包含三部分:可重用控制器、存储资源、计算单元阵列。本发明可以有效解决温度传感器数目有限且噪声为非高斯的情况下,三维片上网络温度重建的问题,本发明述及的可重用高斯和滤波器硬件架构可以提高计算资源和存储资源的利用率,同时减少面积、降低功耗。
-
公开(公告)号:CN108536931B
公开(公告)日:2022-02-08
申请号:CN201810250929.8
申请日:2018-03-23
Applicant: 南京大学
IPC: G06F30/20
Abstract: 本发明公开了一种基于贪婪算法的三维片上网络中温度传感器的部署方法,该方法首先建立一个基于状态空间的三维片上网络的热模型,然后设定可观测性格拉姆矩阵的秩作为优化目标函数,最后采用贪婪算法,从温度传感器可选的位置集合V中选择一个大小为m的子集S用来部署温度传感器,该子集使得目标函数最大化。本发明可以在多项式时间内找到一个次优解,并保证满足一定的误差界。与传统方法相比,在存在测量噪声以及传感器数目有限的情况下,本发明结合卡尔曼滤波可以实现较高精度的全芯片温度重建。
-
公开(公告)号:CN108805266A
公开(公告)日:2018-11-13
申请号:CN201810497967.3
申请日:2018-05-21
Applicant: 南京大学
IPC: G06N3/04
CPC classification number: G06N3/0454
Abstract: 本发明提供了一种可重构CNN高并发卷积加速器,包括:权重地址生成单元,生成卷积核数据在缓存中的地址;结果地址生成单元,生成结果数据在缓存中的地址;可重构计算单元,可将计算阵列重构为两种不同粒度的乘累加树电路;特征图地址生成单元,生成特征图数据在缓存中的地址;主控制器,生成与地址同步的累加器清零信号,选通可重构计算单元中对应的电路,产生整个运算结束的中断信号;存储交换单元,将有效的特征图读地址、权重读地址转换为对存储单元的读操作,将有效的结果写地址和数据转换为对存储单元的写操作。有益效果:简化控制部分,极大地提高多通道二维卷积运算并行度和对存储访问的效率,减少占用的资源。
-
公开(公告)号:CN108804380A
公开(公告)日:2018-11-13
申请号:CN201810489109.4
申请日:2018-05-21
Applicant: 南京大学
CPC classification number: G06F15/7846 , G06F13/30 , G06F15/7867
Abstract: 本发明提供了矢量运算硬件加速器多核级联的周期精确仿真模型,基于SystemC周期精确模型,包括:控制模块,产生配置参数并输出;传输模块,接收配置参数,根据配置参数完成专用处理器核外部的数据与地址传输、专用处理器核内部的数据与地址传输以及级联模式下多个专用处理器核之间的数据与地址传输;运算模块,接收配置参数,根据配置参数选定相应的基础运算单元,并将运算单元搭建成由配置参数决定的算法运算模块后,进行运算。存储模块,接收配置参数,根据配置参数存储运算模块运算时所需的数据以及运算模块运算时产生的中间结果和最终结果。有益效果:实现了矢量运算硬件加速器多核级联的系统仿真,可支持更大运算规模的算法,仿真速度快。
-
-
-
-
-
-
-
-
-