一种基于长短期记忆网络的缓存替换系统及方法

    公开(公告)号:CN111582455B

    公开(公告)日:2023-04-18

    申请号:CN202010390271.8

    申请日:2020-05-08

    Abstract: 本发明公开了一种基于长短期记忆网络的缓存替换系统及方法,该系统包括中央处理器、分类器以及缓存控制器,分类器由输入产生器和决策器组成;该方法包括步骤:1)将中央处理器的地址发送到输入产生器中,输入产生器计算当前地址的钥匙,并将钥匙发送至决策器中;2)决策器接收钥匙后,采用四种预测器对当前钥匙进行分类,并在各自的小缓存中进行实验,根据命中与否更新各自计数器的数值,选择器通过比较四种预测器的计数器数值,取最高数值所属预测器的结果,作为最后一级缓存的缓存特性,缓存控制器依据缓存特性更新缓存;3)利用缓存特性,中央处理器将缓存特性的影响加入缓存数据块的优先级更新机制中,得到性能更高的缓存替换方法。

    一种基于DSP的混合位宽加速器及融合计算方法

    公开(公告)号:CN114239819A

    公开(公告)日:2022-03-25

    申请号:CN202111605030.1

    申请日:2021-12-24

    Abstract: 本发明提供一种基于高位宽DSP的混合位宽加速器及融合计算方法,以DSP作为主要计算单元,对乘数和被乘数分别连接,并分别进行移位即插入不同的隔离位宽,可以实现多组任意低位宽乘累加运算。本发明加速器支持任意乘法并行度,最大化DSP计算性能;支持任意位宽的乘数和被乘数,支持乘数固定和不固定两种情况,通用性更好,适用范围广。

    用于图神经网络推理的动态可重构PE单元及PE阵列

    公开(公告)号:CN113705773A

    公开(公告)日:2021-11-26

    申请号:CN202110853134.8

    申请日:2021-07-27

    Abstract: 本发明提供用于图神经网络推理的动态可重构PE单元及PE阵列,本发明用于图神经网络推理的动态可重构PE单元,提取多种不同图神经网络算法中的共同算子,形成共同的运算单元,根据图神经网络算法需要通过多路选择器输入不同图神经网络算法算法的数据,通过运算单元运算后由多路分配器分配输出。计算单元在配置信息的控制下动态地在不同算法数据流之间切换。从而动态可重构PE单元能适用于多种不同的图神经网络算法,在配置信息的控制下动态地在不同算法数据流之间切换。

    一种Winograd卷积运算加速方法及加速模块

    公开(公告)号:CN113283587A

    公开(公告)日:2021-08-20

    申请号:CN202110588325.6

    申请日:2021-05-28

    Abstract: 本发明提供一种Winograd卷积运算加速方法及加速模块,对于非3×3形状的卷积运算,使用基于步长的卷积核拆分方法将输入矩阵拆分或者填充为4×4的输入矩阵,将卷积核矩阵拆分或者填充为3×3的卷积核矩阵;使用卷积核转换矩阵G和输入矩阵转换矩阵BT对3×3的卷积核矩阵和4×4的输入矩阵分别进行Winograd变换,得到变换后的卷积核矩阵U和输入矩阵V;对变换后的卷积核矩阵U中的元素uξ,v按照比特级精度进行权重拆分,通过累加运算和移位运算得到矩阵Z;对矩阵Z进行Winograd变换,获得卷积运算的输出矩阵。本发明不但能合理利用片上资源、降低计算复杂度,且可以兼容大多数尺寸的卷积运算。

    一种针对可重构加速器片上互联结构的硬件木马攻击方法

    公开(公告)号:CN112434350A

    公开(公告)日:2021-03-02

    申请号:CN202011192716.8

    申请日:2020-10-30

    Abstract: 本发明公开了一种针对可重构加速器片上互联结构的硬件木马攻击方法,包括以下步骤:1)硬件木马触发模块能够以配置信息或20‑bit图像数据作为触发输入,生成触发信号。比较配置信息或图像数据与攻击者预先定义的触发条件一致性来决定触发信号是否有效;2)硬件木马负载模块在触发信号有效时,修改片上互联结构中选择器的控制选择信号;3)控制选择信号被修改,改变片上互联结构中原始的数据通路和运算电路结构,造成错误的推理计算。本发明提供的一种针对可重构加速器片上互联结构的硬件木马攻击方法,该方法攻击可重构片上互联结构,改变片上互联结构中原始的数据通路和运算电路结构,导致神经网络加速器分类精度的下降。

    基于多分支卷积神经网络的行人识别方法

    公开(公告)号:CN111582091A

    公开(公告)日:2020-08-25

    申请号:CN202010345173.2

    申请日:2020-04-27

    Abstract: 本发明公开了一种基于多分支卷积神经网络的行人识别方法,包括步骤:1)初始化多分支卷积神经网络;2)边训练边筛选卷积核,作为构建块添加到各分支,构成精度和运算量可分离的多分支卷积神经网络;3)设置时间监测点和精度预估值,验证精度,如果低于精度预估值,则返回步骤2),如果和预估值相差5%以内则停止,相差大于5%则集训训练;4)继续训练,筛选多分支卷积神经网络的全连接层的超参数;5)最后设计生成的模型,存储到移动摄像头的硬件处理架构中,离线推理其拍摄到的视频或者图像中是否有人出现。本发明为行人识别设计多分支的卷积神经网络架构,加宽网络宽度,改进模型推理识别行人的整体网络性能。

    一种面向内存计算和室内是否有人的神经网络设计方法

    公开(公告)号:CN110363287A

    公开(公告)日:2019-10-22

    申请号:CN201910584312.4

    申请日:2019-07-01

    Abstract: 本发明公开了一种面向内存计算和室内是否有人的神经网络设计方法,设计超轻量级神经网络模型,即UL-CNN模型;将UL-CNN模型根据基于内存计算架构的芯片对高电平不敏感以及内存限制在2K*2K范围内的规则,使用定点化处理调整卷积运算和全连接矩阵运算方法,从而使UL-CNN模型应用在基于内存计算架构的Conv-Flash芯片上进行推理,最终进行室内是否有人检测。本发明在解决室内有人无人问题时,与其他主流CNN相比参数量和计算量减少,计算时间更短,但是准确率基本不变。

Patent Agency Ranking