-
公开(公告)号:CN119376449A
公开(公告)日:2025-01-28
申请号:CN202411490434.4
申请日:2024-10-24
Applicant: 南京大学
IPC: G05D23/19
Abstract: 本发明公开了一种基于片上网络的紧凑型交叉温控方法,涉及多处理器嵌入式开发技术领域,设计交错相位控制策略以增加控制周期内最小网络单元的节点纠正次数,避免同步温控引起的热问题,设计负反馈温控策略以控制节点和邻接节点之间的交互行为,进一步稳定节点的温度,基于控制相位分配算法将片上网络中节点类型的分配类比为图着色问题,设置剪枝约束和选取约束以优化回溯法,快速生成最优类型分配方案,并结合交错相位控制策略和负反馈温控策略实现片上网络的最佳交叉温控,设计性能评估方案,经检验,本发明提出的方法在评估指标上均优于对比方案,有效解决了片上网络的热问题。
-
公开(公告)号:CN113131950B
公开(公告)日:2024-02-13
申请号:CN202110442919.6
申请日:2021-04-23
Applicant: 南京大学
IPC: H03M13/13
Abstract: 本发明提供了一种极化码的自适应连续消除优先译码方法,其中所述方法采用基于优先级的搜索策略和网格存储策略,使用优先队列存储优先级信息并根据码字的子节点类型指导候选路径的扩展,使用网格结构计算并存储中间结果,同时采用一种基于路径度量的自适应节点插入策略来减少优先队列中的路径数量,通过优先级队列与网格结构的迭代信息交互,完成极化码译码。本发明的目的在于,利用优先级搜索策略降低译码算法的复杂度,通过自适应节点插入策略避免了大多数不必要的路径扩展,在保证译码性能的同时,显著降低了算法的时间复杂度。
-
公开(公告)号:CN113377333B
公开(公告)日:2023-08-22
申请号:CN202110602128.5
申请日:2021-05-31
Applicant: 南京大学
Abstract: 本发明提出了基于抛物线综合法求复数的N次开根号的硬件计算系统和方法。该系统包括:控制单元使用状态机的方式控制整个系统的运算流程;可变模式的圆周CORDIC计算单元,用以实现输入复数在平面坐标形式与极坐标形式之间的相互转化;开根单元,用以计算待求复数的极坐标形式中的模长的N次开根;相角计算单元,根据输入k用以计算得到复数的极坐标形式中的相角。有效地利用抛物线综合法和CORDIC方法,既保证了计算精度,又让整个计算系统实现超低时延计算。其次,通过改变输入k,可选择需要输出的N次开根结果。改变圆周CORDIC模块的正向迭代次数,可在一定范围内灵活地调节计算精度。最后,减少了整个系统的面积消耗。
-
公开(公告)号:CN113127802B
公开(公告)日:2023-08-08
申请号:CN202110459595.7
申请日:2021-04-27
Applicant: 南京大学
Abstract: 本发明首次提出了一种基于CORDIC算法的复对数实现方法、装置、设备及计算机存储介质,主要利用圆周向量模块(VC‑CORDIC),双曲向量模块(VH‑CORDIC)进行联级操作。首先,将所需计算目标的实部和虚部输入圆周向量模块(VC‑CORDIC)进行迭代计算,VC‑CORDIC模块得出所求结果的虚部以及实部中间值;然后将实部中间值的相邻值作为VH‑CORDIC模块的输入进行迭代计算,得出的结果经过减法和移位操作之后得到所求结果的实部,进一步减少了计算的复杂度,相比于传统的查找表、线性近似的方法,本发明具有精度高、面积小、功耗低的特点。
-
公开(公告)号:CN116361605A
公开(公告)日:2023-06-30
申请号:CN202310374142.3
申请日:2023-04-10
Applicant: 南京大学 , 上海航天测控通信研究所
Abstract: 本发明提出了一种递归型FFT处理器的低功耗优化方法,基于查找表搜索法的旋转因子生成单元不仅具有现有技术的运算架构,而且增加了额外的判断逻辑和控制逻辑,用来减少旋转因子生成过程中的访存和复数乘法次数,有效地降低了功耗。另外旋转因子计算单元负责将旋转因子和蝶形运算结果进行复数乘法运算从而得到最终结果,针对大点数二维FFT算法的运算过程,将相位因子代替列变换最后一级的旋转因子,通过超前计算的方法减少了一级的额外读写访存,达到降低功耗的目的,同时减少了一级FFT的计算时间。
-
公开(公告)号:CN110689123B
公开(公告)日:2023-04-18
申请号:CN201910926748.7
申请日:2019-09-27
Applicant: 南京大学
IPC: G06N3/063 , G06N3/0464 , G06N3/08 , G06N3/0442
Abstract: 本发明公开了一种基于脉动阵列的多隐层可复用的长短期记忆神经网络前向加速系统及方法,该系统包括:算法控制模块,负责控制计算流程;门向量计算模块,负责接收源数据并在控制模块控制下将源数据传入脉动阵列,依次计算门向量并存入存储模块;细胞状态计算模块,接收到启动信号后读入门向量数据,计算神经元状态值和隐藏层输出值,存入存储模块;存储地址生成模块,负责生成存储地址。有益效果:实现了输入‑隐藏层的可复用,网络规模包括输出层节点数、隐藏层节点数、时间序列长度等可配置,灵活度高,可扩展性强,存储资源利用率高,运算速度快。
-
公开(公告)号:CN115375892A
公开(公告)日:2022-11-22
申请号:CN202211144905.7
申请日:2022-09-20
Applicant: 南京大学
Abstract: 本发明公开了一种大尺寸图像预处理方法,所述方法包括构建滤除模块,对重复的、无效的信息进行过滤;构建分割模块,提供一种可拼接的分割方法对图像进行有效分割;构建区域保护模块,处理含有重要目标的区域保留重要信息。本发明为图像可滤除无效信息、可有效分割、可保护重点区域的大尺寸图像预处理提供了一种可行性方案,能够滤除重复的、无效的信息,最大限度保留物体信息,提升切割效率,避免造成硬件资源的浪费,对重点信息实施区域保护,避免重要信息丢失。
-
公开(公告)号:CN115203718A
公开(公告)日:2022-10-18
申请号:CN202210567493.1
申请日:2022-05-24
Applicant: 南京大学
IPC: G06F21/60
Abstract: 基于余数系统和BFV方案的同态加密重线性化方法及系统,所述方法包括读取同态乘法计算得到的第三项密文多项式;将所述第三项密文多项式按照RNS的各个基进行分解,获得每个基的分量;将所述每个基的分量复制到RNS各个基对应的若干组通道中,形成分解后的第三项密文多项式组;对所述分解后的第三项密文多项式组和两组重线性化密钥组进行NTT变换,并对其结果依序进行内积运算和INTT变换,得到两组第三项密文多项式的输出结果;将两组第三项密文多项式的输出结果,分别与同态乘法计算得到的第一项密文多项式、第二密文多项式相加,获得重线性化后的两项密文。通过对同态乘法中运算量最大的重线性化部分进行加速,大大提高了同态乘法的效率。
-
公开(公告)号:CN114708602A
公开(公告)日:2022-07-05
申请号:CN202210437836.2
申请日:2022-04-25
Applicant: 南京大学
IPC: G06V30/412 , G06K9/62 , G06N3/04 , G06N3/08 , G06V10/774 , G06V10/82
Abstract: 本发明提供一种基于神经网络的手写英文文本识别方法,具体包括:获取数据集并训练得到字母识别母模型与字母识别子模型;训练得到语法判断模型;构建词典模块;利用字母识别母模型以及单词提取算法得到初次识别结果;利用词典模块判断测试图片中单词是否全部存在;将不存在的单词利用字母识别子模型识别得到其它识别结果;利用词典模块和语法判断模型对其他识别结果进行分类;对所有识别结果进行优先级排序。本发明在保留YOLO中的NMS非极大值抑制算法的同时,可输出多种可能识别结果,同时应用新的单词提取算法实现了对识别结果中单词的划分,为手写英文文本识别任务提供了一种新方法,大大提高了识别的准确性和灵活性。
-
公开(公告)号:CN114266351A
公开(公告)日:2022-04-01
申请号:CN202111537939.8
申请日:2021-12-15
Applicant: 南京大学
Abstract: 本发明提供了一种基于无监督学习时间编码的脉冲神经网络训练方法及系统。方法步骤如下:步骤1、根据与输入像素强度相关的特定编码方案生成脉冲序列,将输入图像编码为脉冲时间向量;步骤2、将输入图像编码的脉冲时间向量从小到大排序;步骤3、排序后的向量用于生成每个神经元的输出脉冲时间;步骤4、更新首脉冲神经元的突触权重;步骤5、每个神经元在训练完成后根据其对十类数字的最早反应分配一类,这些神经元用于在测试集上测量网络的分类精度。本方法使用脉冲时间依赖可塑性(STDP)训练网络,只更新连接到首脉冲神经元的权重,显著降低了突触权重更新的频率,可以减少计算的冗余,降低功耗和面积开销。
-
-
-
-
-
-
-
-
-