一种可重构定浮点通用FFT处理器
    61.
    发明公开

    公开(公告)号:CN106951394A

    公开(公告)日:2017-07-14

    申请号:CN201710189440.X

    申请日:2017-03-27

    Applicant: 南京大学

    CPC classification number: G06F17/142 G06F7/57

    Abstract: 本发明提供了一种可重构定浮点通用FFT处理器,既可以实现18位的定点FFT运算,也可以实现32位的单精度浮点FFT运算。所述处理器将定点运算器(包括乘法器和加法器)与主体结构相分离,定点运算器可重构为单精度浮点运算器。处理器主体通过调用定点运算器或重构而成的单精度浮点运算器来完成定点或浮点FFT运算。所述处理器采用混合基流水结构,不仅支持定浮点计算还支持可配置的计算点数,在保证精确度和数据吞吐率的情况下,有效的提高了处理器的通用性。

    一种基于脉动阵列的可配置卷积运算加速装置及方法

    公开(公告)号:CN118627565B

    公开(公告)日:2025-01-03

    申请号:CN202411105645.1

    申请日:2024-08-13

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于脉动阵列的可配置卷积运算加速装置及方法,属于超大规模集成电路的神经网络硬件加速技术领域。本发明方案针对现有卷积运算加速装置存在的问题,提出一种改进运算方式的脉动阵列,即采用行方向上广播、列方向上脉动的运算方式,将中间计算结果固定在PE中,无需停止运算以更新权重,大大提高了PE利用率,使得实际算力接近理论峰值算力,而且由于采用了行方向上广播的方式,每行PE工作状态相同,从而使得每个周期需要输出运算结果的PE数量相同,有效保证了输入输出数据吞吐率的稳定,充分利用输出通道的数据带宽。

    一种用于夜视场景的图像传输系统及其方法

    公开(公告)号:CN119094703A

    公开(公告)日:2024-12-06

    申请号:CN202411224700.9

    申请日:2024-09-03

    Applicant: 南京大学

    Abstract: 本发明公开一种用于夜视场景的图像传输系统及其方法。该图像传输系统包括:图像采集推流设备,用于采集较暗场景下图像数据、预处理采集图像、编码图像数据以及推流编码后的图像;图像处理设备,用于拉流所述图像采集推流设备所推流图像、对所拉流数据进行解码操作、对于所解码数据进行预处理、对预处理后数据进行夜视增强并显示夜视增强后的图像数据。本发明拓宽了夜视产品的使用场景,使得图像采集与图像处理分离,可在后端算力更强的设备上使用效果更好的夜视处理程序进行图像处理。

    一种适用于异步电路的轮询仲裁器及其方法

    公开(公告)号:CN113641605B

    公开(公告)日:2024-10-01

    申请号:CN202110804144.2

    申请日:2021-07-16

    Applicant: 南京大学

    Abstract: 本发明公开了一种适用于异步电路的轮询仲裁器及其方法。该轮询仲裁器包括仲裁部分、互斥锁部分和多路选择部分;其中,仲裁部分由多级仲裁单元级联而成,仲裁部分的输入为请求信号以及各请求的权值信息,仲裁部分的输出为反应仲裁结果的响应信号;互斥锁部分由多级互斥单元级联而成,互斥锁部分的输入为从仲裁部分输出的响应信号以及从后级流水线结构输出的握手信号,互斥锁部分的输出为选通信号以及向前级流水线结构传递的握手信号;多路选择部分的输入为互斥锁部分输出的选通信号以及输入数据,多路选择部分的输出为仲裁优先级最高的有效数据。本发明的轮询仲裁器适用于异步电路,取消对于全局时钟的依赖。

    一种基于光电存算一体器件的U-Net深度学习网络加速装置

    公开(公告)号:CN118468954A

    公开(公告)日:2024-08-09

    申请号:CN202410495923.2

    申请日:2024-04-24

    Applicant: 南京大学

    Abstract: 本发明提供一种基于光电存算一体器件的U‑Net深度学习网络加速装置及方法。该装置包括:编码混合层模块,用于对特征图执行卷积、归一化以及下采样操作,并将结果输出给双卷积层模块;双卷积层模块,用于对特征图执行双卷积和归一化操作,并将生成的特征图输出给解码混合层模块;解码混合层模块,用于对特征图执行上采样、卷积以及归一化操作,并将结果输出给分类输出模块;分类输出模块,用于对特征图执行卷积操作,并输出分类预测的结果。本发明实现了对U‑Net深度学习网络在硬件层面上的加速,依托光电存算一体器件降低中间片上缓存带来的带宽压力,实现资源消耗和计算性能的兼顾。

    基于光电存算单元阵列的字线驱动电路

    公开(公告)号:CN118098311A

    公开(公告)日:2024-05-28

    申请号:CN202410521087.0

    申请日:2024-04-28

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于光电存算单元阵列的字线驱动电路,属于模拟集成电路领域。该字线驱动电路包括工作模式切换电路和工作状态切换电路,基于模式切换电路和状态切换电路实现输出电压的切换,在满足光电存算阵列多种模式工作电压切换功能的基础上,按照状态切换控制信号HV_EN的切换高速驱动光电存算阵列的字线为HV/0V,以避免字线处于浮空状态的不确定电势,实现了神经网络权重的精准存储,满足光电存算阵列高精度的编程、复位以及高速高精度的数字型激励读出推理需求。

    一种可实现高精度光输入的光电计算装置及校准方法

    公开(公告)号:CN112230709B

    公开(公告)日:2023-12-12

    申请号:CN202011112962.8

    申请日:2020-10-16

    Applicant: 南京大学

    Abstract: 本发明公开了一种可实现高精度光输入的光电计算装置及校准方法。其装置包括发光阵列、光电计算阵列和光学调制机构,发光阵列由多个发光单元周期性排列组成,光电计算阵列由多个光电计算单元周期性排列组成,光学调制机构用于对发光单元发出的光子进行调制;光电计算装置还包括辅助对准机构,辅助对准机构使得发光单元发出的光子经过光学调制机构后能够入射在计算关系上与发光单元相对应的光电计算单元中;辅助对准机构包括至少一个可成像阵列,可成像阵列与发光阵列或光电计算阵列二者之一在整个装置的光路中相对于另一者具有对易性。本发明不仅可以提高光输入的精度,而且可以方便地进行现场校准或调焦。

Patent Agency Ranking