一种用于卷积神经网络计算的动态自适应数据截断方法

    公开(公告)号:CN110210611B

    公开(公告)日:2021-09-07

    申请号:CN201910395234.3

    申请日:2019-05-13

    Abstract: 本发明提供一种用于卷积神经网络计算的动态自适应数据截断方法,包括:在t位图像数据后面扩充m位小数点位置数据,在t位权值数据后面扩充m位小数点位置数据;在乘法运算时,t位图像数据和t位权值数据进行乘法运算得到2*t位结果数据,两个m位小数点位置数据进行加法运算,得到2*t位结果数据的小数点位置,记为M;对2*t位结果数据中高位的0值进行压缩,压缩后的数据从高位进行截取得到t位结果数据,根据截掉的低位数据的位宽和M得到与截取出来的t位结果数据对应的小数点位置;将t位结果数据与其所对应的小数点位置数据拼接。在保证保留高位数据的同时,尽可能多的保留小数位,使得在给定硬件架构下,数据运算精度尽可能高。

    一种用于动态可重构阵列的卷积运算数据流调度方法

    公开(公告)号:CN109409511B

    公开(公告)日:2020-07-28

    申请号:CN201811115052.8

    申请日:2018-09-25

    Abstract: 一种用于动态可重构阵列的卷积运算数据流调度方法,IRB通过对权值数据和图像数据进行调度,将矩阵内积拆分成行,映射到不同的PE单元内进行计算,计算所得到的结果累加,所得到的累加和在最后一级SPE内做激活,输出激活后的数据,完成调度。将权值数据不同行固定在不同的PE单元内,然后将图像数据逐行映射到每个PE单元与权值数据做卷积,中间数据暂存在PE单元内,然后逐级传输到下个PE单元进行累加,形成流水线,得到卷积数据。在计算CNN网络的过程中,IRB数据流可以提高输入图像数据和权值数据的复用率,减少数据的片内片外流动,有利于降低数据流动的功耗和时间,对性能和效能都有提升。

    一种用于卷积神经网络加速的多层数据分区域联合计算方法

    公开(公告)号:CN110222819B

    公开(公告)日:2021-04-20

    申请号:CN201910395256.X

    申请日:2019-05-13

    Abstract: 本发明提供一种用于卷积神经网络加速的多层数据分区域联合计算方法,包括如下步骤:步骤1,将第一全连接层图像划分为若干个第一全连接层区域,反向推导各第一全连接层区域的图像数据所分别对应的输入图像数据,按照反向推导结果将输入图像划分为若干个与第一全连接层区域一一对应的输入图像区域;步骤2,对各输入图像区域依次进行卷积运算直到各自对应的第一全连接层区域,在对后一个输入图像区域进行卷积运算的过程中,对前一个输入图像区域对应的第一全连接层区域的权值数据进行读取和运算。降低了运算时硬件系统所需的带宽及存储量,平衡了卷积神经网络卷积层与全连接层对硬件资源的需求关系。

    一种含工艺台阶外部件与薄板基体的激光调制焊接方法

    公开(公告)号:CN111085779B

    公开(公告)日:2021-03-23

    申请号:CN201911288776.7

    申请日:2019-12-12

    Abstract: 本发明公开了一种含工艺台阶外部件与薄板基体的激光调制焊接方法,包括以下步骤:1)检测待焊薄壁工件的待焊接区域,确定待焊薄壁工件的特征尺寸参数,并根据待焊薄壁工件的特征尺寸参数规划焊接路径,同时计算激光摆动的频率及振幅,并根据待焊薄壁工件的熔深范围确定激光调制的参数;2)对待焊薄壁工件进行预处理;3)激光焊接头发出的激光光束按照步骤1)规划的焊接路径,以步骤1)得到的激光摆动的频率及振幅和激光调制的参数在惰性气体的保护下对待焊薄壁工件的待焊接区域进行激光摆动调制焊接,直至完成薄壁工件的焊接,该方法能够有效的解决焊缝熔深不均匀,减少间隙敏感性。

    一种用于卷积神经网络加速的多层数据分区域联合计算方法

    公开(公告)号:CN110222819A

    公开(公告)日:2019-09-10

    申请号:CN201910395256.X

    申请日:2019-05-13

    Abstract: 本发明提供一种用于卷积神经网络加速的多层数据分区域联合计算方法,包括如下步骤:步骤1,将第一全连接层图像划分为若干个第一全连接层区域,反向推导各第一全连接层区域的图像数据所分别对应的输入图像数据,按照反向推导结果将输入图像划分为若干个与第一全连接层区域一一对应的输入图像区域;步骤2,对各输入图像区域依次进行卷积运算直到各自对应的第一全连接层区域,在对后一个输入图像区域进行卷积运算的过程中,对前一个输入图像区域对应的第一全连接层区域的权值数据进行读取和运算。降低了运算时硬件系统所需的带宽及存储量,平衡了卷积神经网络卷积层与全连接层对硬件资源的需求关系。

    一种基于零值检测的卷积神经网络硬件系统及运算方法

    公开(公告)号:CN110222835A

    公开(公告)日:2019-09-10

    申请号:CN201910394463.3

    申请日:2019-05-13

    Abstract: 本发明一种基于零值检测的卷积神经网络硬件系统及运算方法,PE阵列向输入数据存储器发送读使能信号,输入数据存储器中读出的输入数据分为两路,一路传输到PE阵列,另一路传输到零值检测模块;零值检测模块检测输入数据是否为0值,得到的结果分为两路,一路发送到PE阵列,如果输入数据为0,则PE阵列将输出数据置为0;否则PE阵列正常工作;另一路与PE阵列的发出的读使能信号做逻辑运算,当输入数据检测不为0且PE阵列发送的权值数据的读使能信号为1时,权值被读出传输到PE阵列中与输入数据完成运算;当零值检测模块检测出输入数据为0时,跳过该输入数据所对应的权值的行地址。本发明可以减少不必要的乘法运算,减少数据访存。

    一种用于卷积神经网络计算的动态自适应数据截断方法

    公开(公告)号:CN110210611A

    公开(公告)日:2019-09-06

    申请号:CN201910395234.3

    申请日:2019-05-13

    Abstract: 本发明提供一种用于卷积神经网络计算的动态自适应数据截断方法,包括:在t位图像数据后面扩充m位小数点位置数据,在t位权值数据后面扩充m位小数点位置数据;在乘法运算时,t位图像数据和t位权值数据进行乘法运算得到2*t位结果数据,两个m位小数点位置数据进行加法运算,得到2*t位结果数据的小数点位置,记为M;对2*t位结果数据中高位的0值进行压缩,压缩后的数据从高位进行截取得到t位结果数据,根据截掉的低位数据的位宽和M得到与截取出来的t位结果数据对应的小数点位置;将t位结果数据与其所对应的小数点位置数据拼接。在保证保留高位数据的同时,尽可能多的保留小数位,使得在给定硬件架构下,数据运算精度尽可能高。

Patent Agency Ranking