卷积神经网络的分块卷积优化方法及装置

    公开(公告)号:CN107437110A

    公开(公告)日:2017-12-05

    申请号:CN201710560643.5

    申请日:2017-07-11

    Inventor: 程健 李钢 赵天理

    CPC classification number: G06N3/082 G06N3/0454 G06N3/063

    Abstract: 本发明涉及深度神经网络领域,提出了一种卷积神经网络的分块卷积优化方法及装置,旨在解决神经网络中卷积运算在硬件处理系统中的处理瓶颈问题,该优化方法包括:选择待分块卷积的卷积层,并确定其分块尺寸上限;根据分块尺寸的上限,确定输入特征图的分块数、分块尺寸;基于分块数、分块尺寸、卷积核尺寸、输入特征图尺寸、输入特征图边界填充尺寸,计算分块特征图的分块边界填充尺寸;基于分块数、分块尺寸、分块边界填充尺寸,构建基于分块边界填充的卷积,并替换原始卷积。本发明大大缓解了卷积神经网络在嵌入式硬件平台运行的资源受限问题,并在读写存储器时最大限度的提高突发长度,提高吞吐量,降低延时,提高效率。

    卷积神经网络的分块卷积优化方法及装置

    公开(公告)号:CN107437110B

    公开(公告)日:2021-04-02

    申请号:CN201710560643.5

    申请日:2017-07-11

    Inventor: 程健 李钢 赵天理

    Abstract: 本发明涉及深度神经网络领域,提出了一种卷积神经网络的分块卷积优化方法及装置,旨在解决神经网络中卷积运算在硬件处理系统中的处理瓶颈问题,该优化方法包括:选择待分块卷积的卷积层,并确定其分块尺寸上限;根据分块尺寸的上限,确定输入特征图的分块数、分块尺寸;基于分块数、分块尺寸、卷积核尺寸、输入特征图尺寸、输入特征图边界填充尺寸,计算分块特征图的分块边界填充尺寸;基于分块数、分块尺寸、分块边界填充尺寸,构建基于分块边界填充的卷积,并替换原始卷积。本发明大大缓解了卷积神经网络在嵌入式硬件平台运行的资源受限问题,并在读写存储器时最大限度的提高突发长度,提高吞吐量,降低延时,提高效率。

    基于图像处理的Depthwise快速卷积系统及图像识别方法

    公开(公告)号:CN111260598A

    公开(公告)日:2020-06-09

    申请号:CN202010035427.0

    申请日:2020-01-14

    Inventor: 李钢 周欢欢 张旸

    Abstract: 本发明公开了一种基于图像处理的Depthwise快速卷积系统,包括图像像素读取单元、DW卷积计算单元;所述图像像素读取单元能够以多维度的形式将待处理的图像存储到存储单元中;所述DW卷积计算单元按行对图像数据进行读取后,与三行的卷积核进行乘累加计算,获得所有像素点的计算结果。本发明实现了图像卷积的快速算法,可以减少重复读取图像存储单元的过程,降低了卷积使用的计算空间,有助于快速准确地得出图像卷积的结果。

Patent Agency Ranking