一种深度神经网络的激活量量化方法及装置

    公开(公告)号:CN109583561A

    公开(公告)日:2019-04-05

    申请号:CN201710899328.5

    申请日:2017-09-28

    Abstract: 本发明实施例提供了一种深度神经网络的激活量量化方法及装置,其中,深度神经网络的激活量量化方法包括:针对深度神经网络中网络层的激活量,获取激活量的初始量化最大值;从初始量化最大值开始,按预设方式递减,得到包括多个数值的初始待选数值集合;计算利用初始待选数值集合中各数值对激活量进行量化得到的量化结果与激活量之间的重构误差;确定各数值对应的重构误差中的最小重构误差;基于与最小重构误差相对应的数值,确定第一量化最大值;根据第一量化最大值及预设比特数,对激活量进行量化。通过本方案可以减少量化带来的误差。

    一种目标识别方法及装置

    公开(公告)号:CN112800813B

    公开(公告)日:2024-06-07

    申请号:CN201911108141.4

    申请日:2019-11-13

    Abstract: 本申请实施例提供了一种目标识别方法及装置,获取待识别图片,将待识别图片输入预先训练的目标深度学习模型,得到待识别图片中的目标特征,将该目标特征与预先标定的目标特征进行比较,得到待识别图片的目标识别结果。其中,目标深度学习模型在对输入的待识别图片进行运算时,针对目标深度学习模型中的每一个网络层,将输入该网络层的输入特征、该网络层的网络权重和该网络层输出的输出特征中的至少一项量化为位宽小于16比特的低比特整型数据。对于每个网络层,参与运算的是位宽较低的低比特整型数据,降低了参与运算的数据的位宽和数据量,能够提升目标深度学习模型进行目标识别的运算速率,从而提高了目标识别的效率。

    一种数据处理、网络训练方法、电子设备及存储介质

    公开(公告)号:CN114298280A

    公开(公告)日:2022-04-08

    申请号:CN202111635076.8

    申请日:2021-12-29

    Abstract: 本申请实施例提供了一种数据处理、网络训练方法、电子设备及存储介质,该方法包括:获取深度神经网络的网络层的输入数据,网络层的原始权重被分解为量化处理的N个子权重;将输入数据分别与N个子权重进行卷积处理,得到N个子权重对应的N个中间数据;对N个中间数据进行求和处理,得到网络层的输出数据。这样,将网络层的原始权重分解为量化处理的N个子权重,通过对N值的调整,可以灵活的平衡网络的效率与性能。

    一种目标识别方法及装置
    4.
    发明公开

    公开(公告)号:CN112800813A

    公开(公告)日:2021-05-14

    申请号:CN201911108141.4

    申请日:2019-11-13

    Abstract: 本申请实施例提供了一种目标识别方法及装置,获取待识别图片,将待识别图片输入预先训练的目标深度学习模型,得到待识别图片中的目标特征,将该目标特征与预先标定的目标特征进行比较,得到待识别图片的目标识别结果。其中,目标深度学习模型在对输入的待识别图片进行运算时,针对目标深度学习模型中的每一个网络层,将输入该网络层的输入特征、该网络层的网络权重和该网络层输出的输出特征中的至少一项量化为位宽小于16比特的低比特整型数据。对于每个网络层,参与运算的是位宽较低的低比特整型数据,降低了参与运算的数据的位宽和数据量,能够提升目标深度学习模型进行目标识别的运算速率,从而提高了目标识别的效率。

    一种深度神经网络的激活量量化方法及装置

    公开(公告)号:CN109583561B

    公开(公告)日:2021-05-07

    申请号:CN201710899328.5

    申请日:2017-09-28

    Abstract: 本发明实施例提供了一种深度神经网络的激活量量化方法及装置,其中,深度神经网络的激活量量化方法包括:针对深度神经网络中网络层的激活量,获取激活量的初始量化最大值;从初始量化最大值开始,按预设方式递减,得到包括多个数值的初始待选数值集合;计算利用初始待选数值集合中各数值对激活量进行量化得到的量化结果与激活量之间的重构误差;确定各数值对应的重构误差中的最小重构误差;基于与最小重构误差相对应的数值,确定第一量化最大值;根据第一量化最大值及预设比特数,对激活量进行量化。通过本方案可以减少量化带来的误差。

    深度神经网络中的网络层运算方法及装置

    公开(公告)号:CN110751259A

    公开(公告)日:2020-02-04

    申请号:CN201810814030.4

    申请日:2018-07-23

    Abstract: 本申请实施例提供了深度神经网络中的网络层运算方法及装置,方法包括:获取网络层的输入数据、网络层各输入通道对应的输入位移量以及网络层各输出通道对应的输出位移量;针对各滤波器,分别利用该滤波器中各卷积核,对相应输入通道的输入数据进行卷积运算,得到各输入通道的卷积结果;针对各滤波器,根据各输入位移量,按照第一预设数据精度及数据范围,将该滤波器的各卷积结果进行对齐操作,并将对齐后的各卷积结果进行累加,得到该滤波器的累加结果;针对各滤波器,按照该滤波器对应的输出位移量,对该滤波器的累加结果进行移位,确定移位后的各滤波器的累加结果为网络层的运算结果。通过本方案可以提高网络层运算的准确率和效率。

Patent Agency Ranking