一种卷积神经网络的压缩方法、装置及电子设备

    公开(公告)号:CN112308197A

    公开(公告)日:2021-02-02

    申请号:CN201910680935.1

    申请日:2019-07-26

    Abstract: 本发明实施例提供了一种卷积神经网络的压缩方法、装置及电子设备。针对每一卷积层,该方法包括:将该卷积层的权值张量变形为第一二维矩阵;确定第一二维矩阵的多个第一奇异值分解项;按照第一选取规则,从多个第一奇异值分解项中,选取至少一个第一奇异值分解项;利用各个第一奇异值分解项,对第一二维矩阵进行近似分解,得到第一分解矩阵和第二分解矩阵;将第一分解矩阵和第二分解矩阵分别变形为第一子权值张量和第二子权值张量,作为压缩后的权值张量;在得到目标卷积神经网络每一层卷积层压缩后的权值张量后,得到被压缩的目标卷积神经网络。与现有技术相比,应用本发明实施例提供的方案,可以降低关于压缩前后的卷积神经网络间的精准度差异。

    一种卷积神经网络的压缩方法、装置及电子设备

    公开(公告)号:CN112308197B

    公开(公告)日:2024-04-09

    申请号:CN201910680935.1

    申请日:2019-07-26

    Abstract: 本发明实施例提供了一种卷积神经网络的压缩方法、装置及电子设备。针对每一卷积层,该方法包括:将该卷积层的权值张量变形为第一二维矩阵;确定第一二维矩阵的多个第一奇异值分解项;按照第一选取规则,从多个第一奇异值分解项中,选取至少一个第一奇异值分解项;利用各个第一奇异值分解项,对第一二维矩阵进行近似分解,得到第一分解矩阵和第二分解矩阵;将第一分解矩阵和第二分解矩阵分别变形为第一子权值张量和第二子权值张量,作为压缩后的权值张量;在得到目标卷积神经网络每一层卷积层压缩后的权值张量后,得到被压缩的目标卷积神经网络。与现有技术相比,应用本发明实施例提供的方案,可以降低关于压缩前后的卷积神经网络间的精准度差异。

    一种目标检测方法和装置

    公开(公告)号:CN111414909B

    公开(公告)日:2023-05-12

    申请号:CN202010182524.2

    申请日:2020-03-16

    Abstract: 本发明提供了一种目标检测方法,包括以下步骤:获取一原始图像;将原始图像输入卷积神经网络结构中进行若干次特征提取得到特征图,设置其中一张特征图为共享特征图;从共享特征图获取若干目标特征图,分别对每个目标特征图进行特征提取获取分支特征图;以及分别对每个分支特征图进行分类和回归操作,进行目标检测。每个分支特征图负责检测一定尺寸范围的目标,不再需要向其他分支特征图输送特征,或者不再需要与其他分支特征图进行融合,在一定程度上将不同尺寸目标的目标检测之间进行了解耦。同时,该方法无需进行上采样运算,不会带来网络计算带宽的增大,在计算量上也不会有明显增加。本发明还提供一种目标检测装置。

    声源定位及语音增强方法、装置
    4.
    发明公开

    公开(公告)号:CN115932733A

    公开(公告)日:2023-04-07

    申请号:CN202211632780.2

    申请日:2022-12-19

    Abstract: 本发明公开了一种声源定位及语音增强方法、装置,该语音增强方法包括:将双麦克风信号转换到频域,并将频域信号转换成极坐标形式;根据麦克风间距和声速计算出麦克风信号相位差的斜率范围,并根据精度需要将相位差斜率进行划分;将划分的各相位差斜率换成相位补偿到第二麦克风频谱,并计算得到差分矩阵和求和矩阵;根据差分矩阵和求和矩阵获得最匹配斜率;将最匹配斜率进行拓展,并结合目标声源方位范围得出目标斜率区间;根据目标斜率区间计算出第二麦克风的补偿频谱,并与第一麦克风频谱信号进行目标语音增强,通过目标方向和非目标方向阻塞频谱计算增益因子,通过比较声源的相位差和目标方向相位差的关系,对非目标方向声源做进一步抑制。

    一种视频图像非整数倍超分辨率重建装置及方法

    公开(公告)号:CN114240760A

    公开(公告)日:2022-03-25

    申请号:CN202111640472.X

    申请日:2021-12-29

    Abstract: 本发明公开了一种视频图像非整数倍超分辨率重建方法及装置,该方法包括:S1,获取图像帧及图像帧运动信息图;S2,分别进行相同位置的分块处理;S3,进行运动概率估计;S4,对每个图像块纹理复杂度进行分类;S5,基于运动概率估计与纹理复杂度分类标签选择超分辨率网络;S6,设计多个超分辨率网络,并使用相同数据集训练;S7,利用K个超分辨率网络,对选取的超分辨率网络进行正向推理,输出每个图像块的非整数倍超分辨率图像块;S8,将每个图像块的超分结果与前一帧对应块的超分结果进行基于运动的加权融合,得到当前帧的超分辨率输出;S9,对当前帧所有图像块的超分结果进行拼接融合,得到当前帧全幅面超分结果。

    一种基于三维查找表的图像颜色校正方法及装置

    公开(公告)号:CN110992289A

    公开(公告)日:2020-04-10

    申请号:CN201911243612.2

    申请日:2019-12-06

    Abstract: 本发明公开了一种基于三维查找表的图像颜色校正方法及装置,该方法包括:S1,采集图像并生成RGB域图像;S2,利用标准色卡及测试色卡图像建立一级查找表,并生成一级插值色卡图;S3,利用一级查找表对S1获得的图像进行插值得到一级插值图像;S4,将一级插值图像与S1获得的图像加权融合,作为一级颜色校正结果,将一级插值色卡图和测试色卡图像加权融合得到一级色卡校正结果;S5,根据前一级查找表、测试色卡及前一级插值色卡图或前一级色卡校正结果,与标准色卡图建立多级查找表;S6,利用多级查找表与前一级颜色校正结果进行插值得到当前级次的插值结果;S7,对当前级次的插值结果和前一级颜色校正结果进行加权融合。

    图像时空域联合降噪的三维递归滤波方法及装置

    公开(公告)号:CN119919296A

    公开(公告)日:2025-05-02

    申请号:CN202411979146.5

    申请日:2024-12-31

    Abstract: 本发明提供一种图像时空域联合降噪的三维递归滤波方法及装置。本发明的图像时空域联合降噪方法不同于传统三维递归滤波拆成三个一维滤波直接串联的思路,而是通过在逐点空域递归的过程中融入时域递归的信息,提升空域滤波的效果,接着在逐点时域滤波的过程中融入空域递归的信息,提升时域滤波的效果,如此反复递归遍历整幅图像,在相同级别的运算逻辑和存储开销下,本发明相比传统时空域串联、时空域并联方法能够更好地提升图像清晰度和信噪比的同时,运动拖影缺少和雨点噪声的现象均有减少。

    一种视频去噪装置
    9.
    发明公开

    公开(公告)号:CN115861128A

    公开(公告)日:2023-03-28

    申请号:CN202211719412.1

    申请日:2022-12-30

    Abstract: 本发明提供一种视频去噪装置,包括噪声强度估计模块、去噪网络结构、无监督训练模块和参数调节模块,噪声强度估计模块采集多帧带噪视频和原始图像数据,并得到带噪视频图像对应的噪声强度;无监督训练模块提供训练损失函数;去噪网络结构对噪声强度经过空域变换和时域合成解耦生成多帧噪声强度图,同时根据训练损失函数对去噪网络结构进行训练;参数调节模块用于控制去噪网络结构的时域合成力度,能够在只拥有真实带噪视频没有不带噪源视频的情况下训练视频去噪模型,并且方便部署到嵌入式设备上,支持用户灵活调节参数;噪声估计模块的噪声估计和无监督学习模块的无监督学习均真实带噪视频展开的,其实用性更强。

Patent Agency Ranking