基于小样本学习和稀疏表示的多光照人脸识别方法

    公开(公告)号:CN101976352A

    公开(公告)日:2011-02-16

    申请号:CN201010523581.9

    申请日:2010-10-29

    Inventor: 宋利 胡蝶 支琤

    Abstract: 一种图像处理技术领域的基于小样本学习和稀疏表示的多光照人脸识别方法,通过构建图像光照集并采用熵图像法合成虚拟合成样本,然后采用稀疏表达法从虚拟训练样本中获得待识别个体在过完备人脸基上的稀疏表示;最后将样本重构系数向量代入类别带通函数后对原测试图像进行重构,得到各类别重构样本与原测试图像的残差,并代入类别判定公式得到识别结果。本发明解决原有稀疏框架需求庞大学习样本的问题,并且达到良好的识别性能。尤其对于遮挡和多光照情况具有较好的鲁棒性,获得采样需求、识别率以及人机交互率性能方面的突破。

    基于宏块级和像素级运动估计的视频差错掩盖方法

    公开(公告)号:CN100531400C

    公开(公告)日:2009-08-19

    申请号:CN200710044221.9

    申请日:2007-07-26

    Abstract: 一种数字视频通信技术领域的基于宏块级和像素级运动估计的视频差错掩盖方法,步骤为:接收端视频解码的错误检测:视频解码过程中,通过错误检测机制定位出当前帧内错误宏块的位置;当错误检测发现传输差错时,对受损宏块进行宏块级的运动估计和像素级的运动估计;根据估计出的宏块级运动矢量、像素级运动矢量和参考帧中相应位置的像素值,加权预测受损宏块内每个像素的预测值;根据获得的预测值对受损宏块内像素进行替代。本发明与现有技术相比,峰值信号噪声平均要高1.3db,且具有更好的主观视觉效果。本发明尤其适合于较差传输性能的PSTN或无线信道,能显著地提高视频传输的可靠性,改善视频图像的质量。

    去噪扩散模型和局部线性嵌入正则化的三维高斯溅射方法

    公开(公告)号:CN118941457A

    公开(公告)日:2024-11-12

    申请号:CN202410918055.4

    申请日:2024-07-10

    Inventor: 宋利 郭帅

    Abstract: 本公开提供一种去噪扩散模型和局部线性嵌入正则化的三维高斯溅射方法,其包括:对稀疏图像进行稀疏重建处理,确定稀疏图像的初始高斯分布;采用邻域高斯致密化方式对稀疏图像的初始高斯分布进行高斯密集化处理,确定经过高斯密集化处理的稀疏图像的高斯表示;采用局部线性嵌入正则化策略对稀疏图像的高斯表示进行局部线性嵌入正则化处理,确定经过局部线性嵌入正则化处理的高斯表示;采用去噪扩散模型正则化策略对经过局部线性嵌入正则化处理的高斯表示对应的图像进行图像恢复处理,确定合成的新视角图像。通过本公开,提高生成的高斯表示的局部分布的平滑性,并防止过拟合并减少伪影,实现更高的渲染速度和更高的性能。

    一种高效的高动态范围视重建方法及系统

    公开(公告)号:CN118071663A

    公开(公告)日:2024-05-24

    申请号:CN202410316029.4

    申请日:2024-03-20

    Abstract: 本发明提供一种高效的高动态范围视重建方法,包括:构建一个标准动态范围视频转换为高动态范围视频的域映射子系统,域映射子系统包含仿射变换模型,在低分辨率空间预测标准动态范围到高动态范围视频映射的仿射变换参数,利用预测的仿射变换参数将标准动态范围视频转换为高动态范围视频;构建高动态范围视频细节增强子系统,细节增强子系统对域映射子系统输出的高动态范围视频进一步增强亮度和颜色细节;训练域映射子系统和细节增强子系统,得到最优网络参数;将待重建的标准动态范围视频输入训练后的域映射子系统和细节增强子系统依次处理,生成高动态范围视频。本发明改善了高动态范围视频的重建效果,并且在算法效率上显著优于现有算法。

    一种图像后期和谐化处理方法、系统及终端

    公开(公告)号:CN113269792B

    公开(公告)日:2023-07-21

    申请号:CN202110494193.0

    申请日:2021-05-07

    Inventor: 宋利 凌军 解蓉

    Abstract: 本发明公开了一种图像后期和谐化处理方法、系统及终端,该方法包括:利用前景掩膜分割图指示待处理区域,得到前景掩膜区域图,在每一归一化层,将前景掩膜区域图缩放到与该归一化层的特征大小相同;区域自适应实例归一化层根据缩放后的前景掩膜区域图,从输入图像特征图的背景区域提取出统计特征,并将统计特征通过反调制应用到前景区域的特征上,使得前景与背景在特征部分具有相似的统计特征;将区域自适应实例归一化层应用到图像和谐化映射网络中,将输入图像的前景图像输入到图像和谐化映射网络中,输出已将前景图像调整后的图像。通过本发明,保证了前景与背景之间具有更加连续的视觉风格,可应用到现有的图像处理软件,且取得较好的改善。

    预测模式确定方法、装置、电子设备及计算机存储介质

    公开(公告)号:CN116347071A

    公开(公告)日:2023-06-27

    申请号:CN202310199480.8

    申请日:2023-02-24

    Abstract: 本申请提供预测模式确定方法、装置、电子设备以及计算机存储介质,在预测模式确定方法中,先获得能够用于对待编码单元进行编码的各个候选预测模式的初始排序,在确定初始排序之后,基于初始排序与待编码单元的尺寸,判断初始排序中可选择的预测模式是否符合待编码单元的尺寸对应的预设调整条件;若是,则对可选择的预测模式的排序采用对应于预设调整条件的调整方式进行调整,获得调整后的排序,进而对待编码单元进行率失真优化计算,实现降低率失真优化计算过程的计算量,同时提升计算效率。同时,针对不同的待编码单元的尺寸,对初始排序中可选择的预测模式的排序采用不同的调整方式进行调整,能够适配不同尺寸的待编码单元。

    一种基于VMAF的感知视频率失真编码优化方法及装置

    公开(公告)号:CN111970511B

    公开(公告)日:2023-05-19

    申请号:CN202010703001.8

    申请日:2020-07-21

    Abstract: 本发明公开一种基于VMAF的感知视频率失真编码优化方法,其中,在编码单元被编码前,计算编码单元与前一帧的像素差异并进行归一化,得到时域内容因子;在编码单元被编码前,计算编码单元的亮度、对比度、纹理并进行归一化,根据加权系数得到空域内容因子;根据得到所述时域内容因子和所述空域感知因子,拟合得到编码单元对于整体帧图像的VMAF分数的影响因子;使用所述VMAF影响因子,修改编码过程中的率失真优化的拉格朗日因子,得到最终的编码方案。同时,本发明还公开了对应的装置。本发明避免了基于机器学习的质量指标VMAF在编码过程中的高复杂度问题,在保持相同的时间复杂度情况下提升编码性能。

    提升空间可分级编码视频在丢包网络中重建质量的方法

    公开(公告)号:CN111726623B

    公开(公告)日:2022-11-11

    申请号:CN202010456887.0

    申请日:2020-05-26

    Abstract: 本发明提供一种提升空间可分级编码视频在丢包网络中的重建质量的方法,其中:获得初步高分辨率图像,该初步高分辨率图像经过一个CNN网络获取其图像特征;分别提取当前帧的所述初步高分辨率图像和前几帧解码得到的高分辨率图像的运动特征,将所述运动特征与所述初步图像特征进行融合,得到融合特征;将所有融合特征级联,恢复出当前帧高分辨率图像。本发明结合空间分级编码视频的特点,充分利用了当前帧低分辨率图像信息和前几帧存在的高分辨率图像信息,因而能够在增强层丢失处恢复出高质量的高分辨率图像。

    基于缓冲区位移的低延迟比特率自适应方法、设备及介质

    公开(公告)号:CN113747184B

    公开(公告)日:2022-10-21

    申请号:CN202110884855.5

    申请日:2021-08-03

    Abstract: 本发明公开一种基于缓冲区位移的低延迟比特率自适应方法、设备及介质,包括:获取视频实时的缓冲区大小;依次采用值滤波器和滑动平均滤波器,实时在窗口内对历史缓冲区大小进行滤波,以平滑缓冲区历史值的瞬态变化;根据实时缓冲区位移和一个比特率的概率分布设计效用函数;根据所述效用函数将比特率适应工程转化为在线凸优化问题,通过梯度上升方法最大化效用函数从而更新比特率的概率分布,可以用于实现低延迟HTTP流媒体的自适应。与传统的基于缓冲区的ABR将绝对缓冲区长度作为输入不同,本发明跟踪实时缓冲区动态,根据实时缓冲区位移,做出比特率决策,平均比特率有明显提高,平均比特率切换次数有明显减少,且具有较好鲁棒性。

Patent Agency Ranking