一种计算和访存高效的CNN网络模型计算调度映射方法

    公开(公告)号:CN114330653A

    公开(公告)日:2022-04-12

    申请号:CN202111586693.3

    申请日:2021-12-23

    Abstract: 本发明属于深度学习领域,公开了一种计算和访存高效的CNN网络模型计算调度映射方法。包括如下步骤:步骤1:根据片上SRAM存储配置确定存储映射方案;步骤2:根据片上可并发MAC计算单元配置确定计算映射方案;步骤3:根据网络模型、存储和计算映射方案,确定流水调度优化方案。本发明的一种计算和访存高效的CNN网络模型计算调度映射方法包括单位MAC计算单元算力、可并发强度、片上缓存颗粒度、缓存大小,并结合算法网络结构特点,为每个网络层实现优化映射,提出计算、存储、访存带宽多目标优化的网络结构映射实现方法。

    一种基于参数取值选择的视频结构化分析系统软硬协同优化方法

    公开(公告)号:CN119094810A

    公开(公告)日:2024-12-06

    申请号:CN202411075832.X

    申请日:2024-08-07

    Abstract: 本发明属于视频分析技术领域,公开了一种基于参数取值选择的视频结构化分析系统软硬协同优化方法,包括步骤1:多模块算法控制参数和实现参数集构建;基于业界主流的YOLO+byteTrack+ResNet+SIFT CDVS特征视频结构化分析系统框架,结合异构多计算平台的编码算法特点和流水约束,为各模块选择硬件实现友好的算法框架;步骤2:多模块耦合参数优化取值选择;根据流水吞吐约束,通过一定并发粒度和并发强度的控制参数配置,实现系统吞吐和硬件消耗的平衡。本发明支持六个算法模块联合优化,支持码率、计算复杂度、算法精度以及系统处理检索延时等目标性能联合优化;实现多个算法模块多目标性能联合优化。

Patent Agency Ranking