一种深度特征压缩方法
    42.
    发明公开

    公开(公告)号:CN113537456A

    公开(公告)日:2021-10-22

    申请号:CN202110660867.X

    申请日:2021-06-15

    Applicant: 北京大学

    Abstract: 本发明公开了一种深度特征压缩方法,本发明构建并训练一压缩模型,该模型首先对神经网络提取的图像特征表示进行变换,产生变换后的紧凑表示,提取变换后的表示的超先验码流;超先验码流用于产生码本各个基元素的线性组合系数;码本从特征中学习获得;根据线性组合系数和对应的码本产生超先验概率估计,从而使用熵编码器进行熵编码,产生码流;码流通过熵解码和解码变换产生输出的特征表示。本发明能够对深度特征进行有效压缩,而且能够对多个任务特征进行协同压缩,重建时,对特征进行分离操作,分别产生对应不同任务的重建特征;本发明还能够支持训练时未见的新任务。

    一种基于多参考帧的环路滤波方法及电子装置

    公开(公告)号:CN113132729A

    公开(公告)日:2021-07-16

    申请号:CN202010042012.6

    申请日:2020-01-15

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于多参考帧的环路滤波方法及电子装置,其步骤包括:将原始帧送入视频编码器进行编码得到当前帧,并获取所述当前帧的第一参考帧与第二参考帧;计算所述当前帧、所述第一参考帧以及所述第二参考帧两两间的光流集合;将所述当前帧、所述第一参考帧、所述第二参考帧以及所述光流集合送入一深度卷积循环神经网络,得到滤波重建帧。本发明利用空域信息之外,额外使用了时域信息,提出了联合学习机制,提升了参考帧的质量,在不显著提升网络参数量的基础上,获得了更好的编码性能。

    低光照图像的增强方法及装置

    公开(公告)号:CN109255756B

    公开(公告)日:2020-12-29

    申请号:CN201710576592.5

    申请日:2017-07-14

    Abstract: 本发明提供一种低光照图像的增强方法及装置,该方法包括:计算原图像至少一个通道图像的增强梯度;建立关于至少一个通道图像的求解亮度分量和反射分量的目标函数;对至少一个通道图像的目标函数进行求解,以获得至少一个通道图像的亮度分量和反射分量;根据至少一个通道图像的亮度分量和反射分量计算至少一个通道增强后的图像;将各通道增强后的图像进行合成,或将某一通道增强后的图像与其他通道的原图像进行合成,以形成增强后的低光照图像。由于在目标函数中不在对数域上求解反射分量和亮度分量,所以有效抑制了图像中的噪声,并且在约束亮度分量的梯度时进行了1范数的约束,所以能够有效避免在图像增强的结果中产生光晕的现象。

    图像处理方法及装置
    45.
    发明授权

    公开(公告)号:CN107818545B

    公开(公告)日:2020-07-14

    申请号:CN201610819926.2

    申请日:2016-09-12

    Abstract: 本发明提供一种图像处理方法及装置,包括:对第一图像采用插值算法得到第二图像;确定以每个插值像素点为中心的第一局部窗口和第二局部窗口,并在第二图像中选择与第二局部窗口的相似度小于第一预设阈值的第三局部窗口;根据每个第三局部窗口的中心点与每个第三局部窗口中的每个参考点在第二局部窗口中选择N个第一参考点;确定以第一局部窗口中任一个非插值像素点为中心的第四局部窗口,在第四局部窗口中选择与N个第一参考点对应的N个第二参考点,根据N个第二参考点和第四局部窗口的中心点,确定N个第一参考点分别对应的权重系数;根据权重系数和第二局部窗口的N个第一参考点,更新第一局部窗口的中心点的像素值。从而提高图像处理效果。

    一种基于反馈优化的人机视觉编码方法和装置

    公开(公告)号:CN111163318A

    公开(公告)日:2020-05-15

    申请号:CN202010020628.3

    申请日:2020-01-09

    Applicant: 北京大学

    Abstract: 本申请公开了一种基于反馈优化的人机视觉编码方法,所述方法包括:编码端获取所述目标视频对应的像素特征后输入预设预测模型中生成语义特征;编码端基于所述语义特征生成视频流和特征流;解码端基于所述编码后的特征流和视频流生成解码视频;解码端当接收到针对客户端输入的参数调整指令时,生成码率参数发送至编码端;编码端获取当前码率;编码端基于所述码率参数对所述当前码率进行调整生成调整后的码率;编码端基于所述调整后的码率增强所述视频流和所述特征流,生成增强后的视频流和增强后的特征流;解码端基于所述增强后的视频流和增强后的特征流对编码端模型进行更新。因此,采用本申请实施例,可以提高视频特征抽取和压缩效率。

    图像修补方法和图像修补装置

    公开(公告)号:CN106651776B

    公开(公告)日:2019-08-30

    申请号:CN201510717939.4

    申请日:2015-10-29

    Abstract: 本发明提供了一种图像修补方法和图像修补装置,其中,图像修补方法,包括:确定待修补图像中包含有未知像素点的至少一个缺失块;对于所述至少一个缺失块中的任一缺失块,聚类得到所述任一缺失块的相似块,以形成由所述任一缺失块聚类得到的类;根据由所述任一缺失块聚类得到的类,构成具有低秩性质的矩阵;采用核范数逼近所述矩阵的秩,并采用奇异值阈值的方法对所述矩阵进行求解;根据对所述矩阵求解后的值,对所述待修补图像中的所述任一缺失块进行修补。本发明的技术方案提高了对图像中缺失块修补的准确性,有效地实现了对缺失块的图像进行修补的目的。

    视频动作识别方法、装置和机器设备

    公开(公告)号:CN110163052A

    公开(公告)日:2019-08-23

    申请号:CN201810861147.8

    申请日:2018-08-01

    Abstract: 本发明揭示了一种视频动作识别方法、装置和机器设备。所述方法包括:获取进行动作识别的视频数据;对视频数据在神经网络中进行网络各层的特征抽取中,经由神经网络的网络结构使得视频图像上抽取的空域特征进入双线性层;相邻帧视频图像之间根据空域特征进行双线性层上的双线性相关性运算,获得视频数据中每帧视频图像的时空域特征;通过时空域特征进行视频中动作的分类,获得视频数据的动作识别结果。对于神经网络中网络各层的特征抽取,在双线性层上双线性相关性运算中参数和计算复杂度得到控制,进而在控制复杂度的情况下抽取了时空域特征由此,实现了时域关系上的显式建模,有效提升动作识别的性能。

    视频超分辨率处理方法及装置

    公开(公告)号:CN109862370A

    公开(公告)日:2019-06-07

    申请号:CN201711242841.3

    申请日:2017-11-30

    Abstract: 本发明提供一种视频超分辨率处理方法及装置,通过获取视频的每一帧图像,将图像输入卷积神经网络;通过卷积神经网络对图像依次进行特征提取、特征降维、非线性映射以及向高维空间映射,获得超分辨率特征;并根据特征提取所得特征以及超分辨率特征进行重建,得到超分辨率图像;最后编码形成超分辨率视频码流。通过卷积神经网络实现对视频的超分辨率处理,通过特征降维、非线性映射以及向高维空间映射,减少计算复杂度,降低时间复杂度,并采用跳跃连接,降低网络的学习难度,保留输出图像的复杂纹理,从而在保证视频处理需要的实时性的同时,实现了较高的重建质量,在视频实时传输和压缩、视频修复等领域具有非常广阔的应用前景。

Patent Agency Ranking