一种基于不恢复余数法的硬件开方模块

    公开(公告)号:CN116127241A

    公开(公告)日:2023-05-16

    申请号:CN202211499511.3

    申请日:2022-11-28

    Inventor: 刘昊 钱超

    Abstract: 本发明公开一种基于不恢复余数法的整数开方硬件模块,该模块包括:总线接口单元和开方迭代运算单元;其中,总线接口单元采用AHB协议,负责CPU与硬件加速内核之间的控制信号和数据交互,同时控制各个模块之间的信号交互,针对外部总线输入数据进行预处理,实现对输入到迭代模块中的输入值进行调整,优化迭代次数,并调整输出结果;开方迭代运算单元完成不恢复余数算法整数开方功能,由单次的迭代模块来构成逐级流水线结构。由单次的迭代模块来构成逐级流水线结构,同时充分利用业内常用MCU总线外设挂载需求和低成本方案,提高开方运算的运算效率,利用传统浮点开方硬件实现算法变换成整数运算,并设计接口以兼容计算能力较低的内核应用。

    一种面向神经网络加速器的精度可配置乘累加单元

    公开(公告)号:CN116108904A

    公开(公告)日:2023-05-12

    申请号:CN202310221906.5

    申请日:2023-03-09

    Applicant: 东南大学

    Abstract: 本发明公开了一种设计面向神经网络加速器的精度可配置乘累加单元,先将第零计算单元、第一计算单元通过第五求和模块进行求和,然后将第二计算单元、第三计算单元通过第六求和模块进行求和,最后对以上两个求和生成的部分通过第三求和模块进行最终求和;其中精度可配置乘累加单元中所有求和模块按照输入位宽的不同进行相应的关断以适应2位、4位和8位不同位宽的卷积神经网络各个层的乘累加操作。它们在保证CNN的一定精度的情况下,不仅简化了计算单元和外部复杂的可配置逻辑,而且引入了近似计算的概念。首次在可配置的计算单元中引入了近似计算,使得该架构能够基于位级灵活性进一步降低功耗,并适应来自网络不同量化方法的参数。

    基于反射信号的单基站室内UWB优化定位方法

    公开(公告)号:CN115866744A

    公开(公告)日:2023-03-28

    申请号:CN202211232505.1

    申请日:2022-10-10

    Applicant: 东南大学

    Abstract: 基于反射信号的单基站室内UWB优化定位方法,属于室内无线定位技术领域。本发明主要利用反射信号,采用单基站完成室内定位。在获得室内地图的基础上,对其进行建模,放置定位基站,在环境中放置定位标签,接收多径信号,通过对实际接收信号的处理,缩小定位标签的可能范围,遍历约束区域网格点,采用射线跟踪模型进行接收波形仿真,与实际接收信号波形进行对比,获取每个网格点的相似概率,然后在约束区域拟合出相似概率热力图,概率最高点即为定位解算位置。该方案可以优化室内场景中的定位精度,降低了成本,提高了基站的利用率,为室内UWB定位方式提供了一种新的思路,具有一定的参考价值。

    一种基于FPGA的支持通道分离卷积的神经网络加速器

    公开(公告)号:CN112766479B

    公开(公告)日:2022-11-11

    申请号:CN202110100516.3

    申请日:2021-01-26

    Applicant: 东南大学

    Abstract: 本发明公开一种基于FPGA的支持通道分离卷积的神经网络加速器,该加速器包括:Ping‑Pong寄存器文件、可配置数据流的输出特征值行映射单元ORMU阵列、功能单元模块以及存储器接口模块等;Ping‑Pong寄存器文件从控制处理器接受配置和控制字,完成计算后发出中断信号;ORMU阵列采用可配置的片上网络将ORMU单元和缓存互联,以满足不同数据带宽需求的神经网络的计算;功能单元模块用以实现Pooling池化、Relu激活以及批量归一化BN等功能;存储器接口模块用以传输权重和特征值。本发明通过灵活的分层网状片上网络,以支持通道分离卷积(逐通道卷积和逐点卷积)、传统卷积以及全连接对数据带宽的不同需求,从而保证较高的计算单元的利用率,极大的提升了推理/计算速度。

    多分支可调节瓶颈卷积模块以及端对端的立体匹配网络

    公开(公告)号:CN111968168B

    公开(公告)日:2022-10-25

    申请号:CN202010776723.6

    申请日:2020-08-05

    Applicant: 东南大学

    Abstract: 本发明公开了一种多分支可调节瓶颈卷积模块(MAB)以及端对端的立体匹配网络,用于估计左右图像的视差。通过调节MAB模块中多分支的尺度系数、各分支空洞卷积的扩张率,来调整卷积捕获信息的通道数以及感受野,进而权衡节省计算量、数据访存量的收益与卷积结果的信息量。该MAB模块可作为轻量级的特征提取模块,广泛使用在深度学习网络中。基于MAB模块以及其3D拓展构造轻量级端对端立体匹配神经网络,与之前的立体匹配神经网络相比,模型参数量和操作次数大大降低,但在SceneFlow和KITTI数据集上测试,精度达到SOTA水准。因此,它更容易部署到嵌入式平台、可穿戴设备等资源受限的系统上。

    一种基于RAUKF的RSSI室内定位算法

    公开(公告)号:CN114979943A

    公开(公告)日:2022-08-30

    申请号:CN202210546742.9

    申请日:2022-05-18

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于RAUKF的RSSI室内定位算法,通过采集待定位节点至离其最近的三个锚节点之间的RSSI值,利用信号传播模型将RSSI值转化为距离。通过得到的距离,利用最小二乘法确定待定位节点的具体位置,运用无迹卡尔曼滤波对待定位节点运动轨迹进行预测,最终运用RAUKF方法对运动轨迹进行平滑处理,得到精确结果。RAUKF方法对无迹卡尔曼滤波的过程噪声协方差和测量噪声协方差进行了优化,进一步提高了准确度,解决了传统自适应滤波数值偏移、迭代发散等问题,为室内定位提供了一种优良的定位算法。

    一种优化片上网络功耗的组合路由方法

    公开(公告)号:CN109150717B

    公开(公告)日:2022-03-22

    申请号:CN201810722908.1

    申请日:2018-07-04

    Applicant: 东南大学

    Abstract: 本发明公开了一种优化片上网络功耗的组合路由方法,包括:在二维网格的拓扑结构下片上网络中,开始时采用自适应的路由方法;计算网络中的每个节点的路由转换因子α,路由转换因子为:其中C表示该节点的所有路径选择中改变的数量,Nc表示路径选择中没有改变的数量;将路由转换因子小于阈值的节点的路由方法由自适应性路由方法替换成确定性路由方法,否则保持该节点的路由方法不变。根据不同的节点流量不同的特点,根据路由转换因子α来确定每个节点采用的路由方法,这种采用将自适应路由方法和确定性路由方法相结合的组合路由方法的片上网络比只采用单一的自适应路由方法的片上网络的功耗要低,可以实现降低片上网络的功耗。

    面向卷积神经网络加速器的对数近似乘累加器

    公开(公告)号:CN113360131A

    公开(公告)日:2021-09-07

    申请号:CN202110629459.8

    申请日:2021-06-07

    Applicant: 东南大学

    Inventor: 刘昊 汪茹晋

    Abstract: 本发明公开了一种面向卷积神经网络加速器的对数近似乘累加器,包括最左侧高位筛选模块、自适应误差补偿模块、自适应累加电路、基本乘累加单元,最左侧高位筛选模块对输入数据进行有效数据位筛选,先筛选出最左侧有效位所在的数据组,然后对其进行特征位筛选,最后进行数据位补偿;自适应误差补偿模块对输入数据进行误差补偿判定,将补偿结果传输给乘法寄存器低位端,即自适应寄存器端;自适应累加电路根据自适应寄存器端的数据特征,实现精确的累加结果,并将结果存储在累加寄存器;基本乘累加单元辅助最左侧高位筛选模块、自适应误差补偿模块、自适应累加电路完成完整的乘累加计算。本发明能够在保证数据精度的同时,降低电路的功耗。

    一种可配置的通用卷积神经网络加速器

    公开(公告)号:CN110390384B

    公开(公告)日:2021-07-06

    申请号:CN201910554533.7

    申请日:2019-06-25

    Applicant: 东南大学

    Abstract: 本发明公开了一种可配置的通用卷积神经网络加速器,属于计算、推算、计数的技术领域。该加速器包括:PE阵列、状态控制器、功能模块、权重缓存区、特征图缓存区、输出缓存区和寄存器栈,状态控制器包括网络参数寄存器和工作状态控制器。通过配置网络参数寄存器对不同规模的网络均能取得优异的加速效果,工作状态控制器控制着加速器工作状态的切换并将控制信号发送至其它模块。权重缓存区、特征图缓存区和输出缓存区均由多个数据子缓存区构成,用于分别存放权重数据、特征图数据和计算结果。本发明能够针对不同的网络特点,配置合适的数据重用模式、阵列尺寸和子缓存区个数,通用性好,功耗低,吞吐量高。

Patent Agency Ranking