脉动阵列变速控制方法及可变速脉动阵列微框架系统

    公开(公告)号:CN111401522B

    公开(公告)日:2023-08-15

    申请号:CN202010171246.0

    申请日:2020-03-12

    Abstract: 本发明公开了一种脉动阵列变速控制方法和可变速脉动阵列微框架系统,其中方法包括:脉动阵列包括至少两个处理单元;方法包括:获取脉动阵列中所有处理单元的待转变精度模式;确定所有待转变精度模式中处理单元处理所需时长最长的处理周期,并将其作为脉动阵列的下一运行周期;在处理单元的下一实际处理周期后设置数个阻塞周期,以使得所有处理单元的下一处理周期的时长与脉动阵列的下一运行周期的时长相等。本发明可实现在多种精度下灵活切换,且每个固定周期下,脉动阵列内部的处理单元的精度可以是不同的,进而加速卷积神经网络的推理过程。

    视频实时识别分割和检测方法及装置

    公开(公告)号:CN112084949B

    公开(公告)日:2022-07-19

    申请号:CN202010946166.8

    申请日:2020-09-10

    Abstract: 本发明公开了一种视频实时识别分割和检测方法及装置,其中分割方法包括对目标视频进行解码,获得目标视频的I类帧图像数据、P类帧图像数据和运动矢量表;基于运动矢量表获取B类帧的运动矢量;基于第一预设神经网络得到I类帧图像分割结果和P类帧图像分割结果;根据I类帧图像分割结果、P类帧图像分割结果、B类帧运动矢量以及已获取B帧图像数据的重建结果获取B类帧的重建结果;将B类帧的重建结果、I类帧图像分割结果、P类帧图像分割结果输入到第二预设神经网络得到B类帧的图像分割结果。本发明方法维持准确率的同时实现更高的性能,解决现有对视频识别任务处理方法无法在确保精度较高的基础上降低计算量和能耗的问题。

    基于关键对象拼合的实时视频识别加速器架构

    公开(公告)号:CN113255564A

    公开(公告)日:2021-08-13

    申请号:CN202110652261.1

    申请日:2021-06-11

    Abstract: 本发明公开了一种基于关键对象拼合的实时视频识别加速器架构,包括对象追踪模块、对象聚合模块、对象拆分模块、预设神经网络加速器、更新对象队列模块和主存模块。其中对象追踪模块用于获取P帧图像数据中关键对象矩形框的原始位置信息或B帧图像数据中关键对象矩形框的原始位置信息;对象聚合模块用于基于对P帧图像数据中的关键对象矩形框和/或B帧图像数据中的关键对象矩形框进行合并,得到合成帧;预设神经网络加速器用于对合成帧进行处理,得到合成帧识别结果;对象拆分模块用于对合成帧进行拆分,并将拆分结果返回到原始图像数据中。本发明架构大大节省了目标视频识别任务中的计算工作量,提高了识别任务处理速度和识别准确率。

    一种面向神经网络的可变计算精度的SIMT微架构

    公开(公告)号:CN112990449A

    公开(公告)日:2021-06-18

    申请号:CN201911271108.3

    申请日:2019-12-12

    Abstract: 本发明涉及一种面向神经网络的可变计算精度的SIMT微架构,包括L1指令缓存、L0指令缓存、线程组调度器、指令调度单元、U‑Core阵列、特殊函数单元、寄存器堆和读写单元,其中,L1指令缓存、L0指令缓存、线程组调度器与指令调度单元依次连接,U‑Core阵列和特殊函数单元均与指令调度单元和寄存器堆连接,读写单元与线程组调度器连接,所述的U‑Core阵列为由多个可配置成不同精度的计算单元U‑Core组成的计算单元阵列。与现有技术相比,本发明具有计算灵活度高、计算性能高、计算效率高、计算精度可变、通用性高等特点。

    一种基于SIMT编程模型的张量化并行计算方法

    公开(公告)号:CN111831429A

    公开(公告)日:2020-10-27

    申请号:CN202010534263.6

    申请日:2020-06-11

    Abstract: 本发明提供一种基于SIMT编程模型的张量化并行计算方法,基于主机端、转换单元和设备端之间的交互,将设备端的数据处理单元由标量转换为张量元,实现对数据的张量化运算处理,拓展了SIMT编程模型所适用的异构平台的范围,提高了编程模型的通用性,灵活性和便捷性;以及在执行任务指令时,对检测到的为对张量元运算处理的任务指令,通过调用预先封装的小核函数进行运算处理,既提高了底层计算的效率,又方便了计算调度的实现。

    脉动阵列变速控制方法及可变速脉动阵列微框架

    公开(公告)号:CN111401522A

    公开(公告)日:2020-07-10

    申请号:CN202010171246.0

    申请日:2020-03-12

    Abstract: 本发明公开了一种脉动阵列变速控制方法和可变速脉动阵列微框架,其中方法包括:脉动阵列包括至少两个处理单元;方法包括:获取脉动阵列中所有处理单元的待转变精度模式;确定所有待转变精度模式中处理单元处理所需时长最长的处理周期,并将其作为脉动阵列的下一运行周期;在处理单元的下一实际处理周期后设置数个阻塞周期,以使得所有处理单元的下一处理周期的时长与脉动阵列的下一运行周期的时长相等。本发明可实现在多种精度下灵活切换,且每个固定周期下,脉动阵列内部的处理单元的精度可以是不同的,进而加速卷积神经网络的推理过程。

Patent Agency Ranking