基于贝叶斯优化的结构化剪枝方法、装置、终端及介质

    公开(公告)号:CN115526312A

    公开(公告)日:2022-12-27

    申请号:CN202211228686.0

    申请日:2022-10-09

    Abstract: 本申请提供基于贝叶斯优化的结构化剪枝方法、装置、终端及介质,本发明与其他手动剪枝方法相比,无需对每个卷积层手动设置剪枝阈值来识别候选的滤波器参数;与随机剪枝方法相比,使用更系统的方法来寻找候选剪枝参数,避免了模型重要参数被剪枝的可能性;与其他基于群体的方法相比,并不会在每次迭代中都生成一组解决方案,所提出的方法受益于贝叶斯优化的探索策略,因此所耗的计算时间更少;本发明所提出的方法具有一个新颖的目标函数,在找到模型的最佳参数时考虑了资源约束和模型性能。

    一种面向神经网络的可变计算精度的SIMT系统

    公开(公告)号:CN112990449B

    公开(公告)日:2022-10-25

    申请号:CN201911271108.3

    申请日:2019-12-12

    Abstract: 本发明涉及一种面向神经网络的可变计算精度的SIMT系统,包括L1指令缓存、L0指令缓存、线程组调度器、指令调度单元、U‑Core阵列、特殊函数单元、寄存器堆和读写单元,其中,L1指令缓存、L0指令缓存、线程组调度器与指令调度单元依次连接,U‑Core阵列和特殊函数单元均与指令调度单元和寄存器堆连接,读写单元与线程组调度器连接,所述的U‑Core阵列为由多个可配置成不同精度的计算单元U‑Core组成的计算单元阵列。与现有技术相比,本发明具有计算灵活度高、计算性能高、计算效率高、计算精度可变、通用性高等特点。

    基于关键对象拼合的实时视频识别加速器

    公开(公告)号:CN113255564B

    公开(公告)日:2022-05-06

    申请号:CN202110652261.1

    申请日:2021-06-11

    Abstract: 本发明公开了一种基于关键对象拼合的实时视频识别加速器,包括对象追踪模块、对象聚合模块、对象拆分模块、预设神经网络加速器、更新对象队列模块和主存模块。其中对象追踪模块用于获取P帧图像数据中关键对象矩形框的原始位置信息或B帧图像数据中关键对象矩形框的原始位置信息;对象聚合模块用于基于对P帧图像数据中的关键对象矩形框和/或B帧图像数据中的关键对象矩形框进行合并,得到合成帧;预设神经网络加速器用于对合成帧进行处理,得到合成帧识别结果;对象拆分模块用于对合成帧进行拆分,并将拆分结果返回到原始图像数据中。本发明大大节省了目标视频识别任务中的计算工作量,提高了识别任务处理速度和识别准确率。

    基于关键对象拼合的视频识别方法及装置存储介质和终端

    公开(公告)号:CN113378717A

    公开(公告)日:2021-09-10

    申请号:CN202110652794.X

    申请日:2021-06-11

    Abstract: 本发明公开了一种基于关键对象拼合的视频识别方法及装置存储介质和终端,其中方法包括对目标视频进行解码;获取I类帧图像识别结果;通过对象追踪算法获取P类帧图像数据中的所有关键对象矩形框和B类帧图像数据中的所有关键对象矩形框;通过对象聚合算法对所获取的关键对象矩形框进行聚合,并将合成帧输入到预设深度神经网络中得到合成帧识别结果;通过对象拆分算法对合成帧识别结果进行拆分,并将拆分结果返还到原图像数据中。本发明方法通过挤压掉输入到预设深度神经网络中的非关键信息来减少视频帧所对应的冗余计算,大大节省了目标视频识别任务中的计算工作量,提高了识别任务处理速度和识别准确率。

    视频实时识别分割及检测架构

    公开(公告)号:CN111985456A

    公开(公告)日:2020-11-24

    申请号:CN202010945694.1

    申请日:2020-09-10

    Abstract: 本发明公开了一种视频实时识别分割及检测架构,包括主存以及通过总线分别与主存连接的视频解码器、视频识别处理模块和神经网络处理模块;其中视频识别处理模块用于基于运动矢量表存储B类帧的运动矢量,并基于B类帧的运动矢量按解码顺序依次从主存中读取B帧图像数据参考帧中的图像分割结果和已获取的B帧图像数据的重建结果或B帧图像数据的参考帧图像检测结果并处理,获取B类帧的重建结果。本发明结构通过将视频解码器和神经网络紧密地联系起来,来维持准确率的同时实现更高的性能,解决现有对视频识别任务处理方法无法在确保精度较高的基础上降低计算量和能耗的问题。

    一种基于SIMT编程模型的张量化并行计算方法

    公开(公告)号:CN111831429B

    公开(公告)日:2024-04-02

    申请号:CN202010534263.6

    申请日:2020-06-11

    Abstract: 本发明提供一种基于SIMT编程模型的张量化并行计算方法,基于主机端、转换单元和设备端之间的交互,将设备端的数据处理单元由标量转换为张量元,实现对数据的张量化运算处理,拓展了SIMT编程模型所适用的异构平台的范围,提高了编程模型的通用性,灵活性和便捷性;以及在执行任务指令时,对检测到的为对张量元运算处理的任务指令,通过调用预先封装的小核函数进行运算处理,既提高了底层计算的效率,又方便了计算调度的实现。

Patent Agency Ranking