失真-感知权衡可控的图像压缩方法、系统、介质及设备

    公开(公告)号:CN119211548A

    公开(公告)日:2024-12-27

    申请号:CN202411323995.5

    申请日:2024-09-23

    Abstract: 本公开提供一种失真‑感知权衡可控的图像压缩方法、系统、介质及设备,其中,失真‑感知权衡可控的图像压缩方法,包括:将待处理图像输入预训练的基线编码器,确定第一隐变量;将第一隐变量进行熵编码,确定第二隐变量;将第二隐变量输入预设的可控特征融合模块,确定第三隐变量;将第三隐变量输入预训练的基线解码器,确定重建图像。通过本公开,在不改变预训练的基线深度学习图像编解码器的参数和结构的同时,能够通过预设的可控特征融合模块调整单一隐变量中的失真‑感知权衡,实现灵活调整失真‑感知权衡,用户能够根据需求获取不同的解码图像。

    一种基于动态NeRF的体积视频处理方法及系统

    公开(公告)号:CN118075493A

    公开(公告)日:2024-05-24

    申请号:CN202410151312.6

    申请日:2024-02-02

    Abstract: 本发明提供了一种基于动态NeRF的体积视频处理方法及系统,包括:将辐射场的表示分解为系数场、基场;根据时间戳将动态序列划分为等间隔的画面组,引入残差场作为基场的特征补偿;根据采样点的坐标,利用三线性插值分别在系数场、基场中得到系数特征、基特征;特征映射:将系数特征、基特征进行合并,映射为颜色、密度;基于采样点的坐标、颜色和密度进行体积渲染,得到给定像素点的渲染颜色;将系数特征、基特征进行量化、熵编码,压缩动态NeRF;构建损失函数,训练动态NeRF。本发明的技术方案,动态辐射场的表征更紧凑;并且将动态辐射场的建模和压缩进行了端到端的联合优化,与现有的ReRF相比能实现更高的压缩效率。

    一种三维重建方法及系统

    公开(公告)号:CN113674354B

    公开(公告)日:2024-05-24

    申请号:CN202111001389.8

    申请日:2021-08-30

    Inventor: 宋利 周凯

    Abstract: 本发明公开了一种三维重建方法及系统、计算机设备及计算机可读存储介质。所述方法包括:获取面向同一标定物的多个图像采集器采集的多帧图像,其中,每一帧图像包括彩色图像和深度图像,各图像采集器采集的帧图像是准同步的;基于各图像采集器采集的帧图像生成与其对应的点云;将各图像采集器对应的点云转换至世界坐标系以获得融合后的点云;去除融合后的点云中的重叠区域和离群点,以获得三维模型。本发明的技术方案在很大程度上提高了三维重建后的图像的质量和准确度。

    基于结构冗余检测的卷积神经网络模型剪枝方法

    公开(公告)号:CN111160519B

    公开(公告)日:2023-12-08

    申请号:CN201911214732.X

    申请日:2019-12-02

    Abstract: 本发明提供一种基于结构冗余检测的卷积神经网络模型剪枝方法,其中:首先在训练集上训练卷积神经网络模型,并在验证集上对其进行评估;然后尝试剪枝神经网络模型的不同子结构并微调其余结构,以检测被剪枝的子结构的冗余性,在每次迭代中,如果剪枝后的神经网络模型无法通过微调重新获得大部分丢失的精度,则将剪枝的结构还原。重复该方法,直到模型所有子结构的冗余性都被检验;最后在训练集和验证集上重新初始化并训练剪枝后的模型,得到最终的优化模型。本发明减少了神经网络的资源消耗,改善了现有模型剪枝方法实现复杂的问题。

    一种联合超分辨率、色域扩展和逆色调映射方法及设备

    公开(公告)号:CN112102166B

    公开(公告)日:2023-12-01

    申请号:CN202010871696.0

    申请日:2020-08-26

    Abstract: 本发明提供一种联合超分辨率、色域扩展和逆色调映射方法及设备,其中:S1:将高分辨率、高色域和高动态范围的视频帧下转换为低分辨率、低色域和标准动态范围的视频帧,组成训练数据集和测试数据集;S2:基于局部残差学习和全局残差学习设计一个卷积神经网络;S3:使用所述训练数据集不断训练优化所述卷积神经网络,得到能完成联合超分辨率、色域扩展和逆色调映射的卷积神经网络;S4:将所述测试数据集中低分辨率、低色域和标准动态范围的视频帧输入至S3训练后得到的所述卷积神经网络,得到高分辨率、高色域和高动态范围的视频帧。本发明改善了现有方法的伪影问题,提高了主观和客观质量。

    针对移动蜂窝网络的可配置低延迟拥塞控制方法及系统

    公开(公告)号:CN113747498B

    公开(公告)日:2023-11-28

    申请号:CN202110889020.9

    申请日:2021-08-03

    Abstract: 本发明提供了一种针对移动蜂窝网络的可配置低延迟拥塞控制方法及系统,包括:使用最小滤波器从最近的RTT样本序列中估计最新的RTT;使用线性回归方法根据历史RTT向量计算RTT梯度;使用估计的RTT和RTT梯度检测拥塞并计算动态步长调节拥塞窗口。本发明基于网络延迟提取拥塞信号,并根据估计的RTT和RTT梯度迅速调整拥塞窗口,可以对快速变化的移动蜂窝网络做出反应,增强了实际应用的适用性和可行性。

    基于深度特征提取的图像重定向方法及系统、终端

    公开(公告)号:CN111161340B

    公开(公告)日:2023-06-02

    申请号:CN201911216043.2

    申请日:2019-12-02

    Abstract: 本发明提供一种基于深度特征提取的图像重定向方法及系统、终端,其中:训练用于前景分割的卷积神经网络,该网络可以将图像中的显著的前景物体和背景进行分割;使用所述网络提取出输入图像低阶特征和高阶特征,提取出不同尺度上的特征图;对所述特征图进行线性加权组合,生成衡量输入图像各像素重要程度的重要度图,并将输入图像和重要度图以预先设定好的网格大小为单位进行划分;根据重要度图计算设定的综合目标函数,通过求解一个二次最优化问题最终生成重定向图像。本发明改善了现有的图像重定向方法的对图像高阶语义理解不足,易造成显著物体发生明显变形、图像全局信息丢失的问题,更好地实现了图像的重定向。

    基于实时虚拟视角插值的多用户自由视角视频方法及系统

    公开(公告)号:CN114897681A

    公开(公告)日:2022-08-12

    申请号:CN202210419565.8

    申请日:2022-04-20

    Abstract: 本发明提供实时虚拟视角插值方法,包括:获取第一彩色纹理图像和第二彩色纹理图像到需要插值的视角位置的虚拟第三彩色纹理图像的双向光流;获取第一彩色纹理图像和第二彩色纹理图像在虚拟第三彩色纹理图像中的可见性掩码矩阵;基于双向光流,第一彩色纹理图像和第二彩色纹理图像分别扭曲到虚拟第三彩色纹理图像位置;基于可见性掩码,在虚拟第三彩色纹理图像位置处获得初次虚拟第三彩色纹理图像并优化,得到最终插值出的虚拟第三彩色纹理图;迭代,指数级插值出任意数量的虚拟视图。本发明轻量级且高效,能够利用很少的计算资源实时插值出高质量的虚拟中间视角视图,能够方便地被部署在边缘服务器端或者客户端,对自由视角视频系统十分友好。

    基于3D卷积的视频比特位深扩展方法、装置及介质

    公开(公告)号:CN113691792B

    公开(公告)日:2022-07-29

    申请号:CN202110885354.9

    申请日:2021-08-03

    Abstract: 本发明提供一种基于3D卷积的视频比特位深扩展方法、装置及介质,包括:S1:建立由低比特图像与对应的高比特图像组成有监督的数据集;S2:建立视频位深扩展网络,视频位深扩展网络以3D卷积为基本单元,以编码器‑解码器为主要结构;S3:以最小化损失函数为目标,优化更新视频位深扩展网络中的参数,每轮训练完成后使用测试集对视频位深扩展网络的学习效果和泛化能力进行测试;S4:训练完成后,将测试集中的低比特图像序列输入到网络中,重建出高比特图像序列。本发明保留了图像位深扩展方法性能的同时,改善了现有图像位深扩展方法在处理视频时由于同一区域前后处理结果不一致,易出现闪烁、抖动和假边缘移动等的问题。

    一种人脸图像去识别及复原系统和方法

    公开(公告)号:CN113935915A

    公开(公告)日:2022-01-14

    申请号:CN202111181272.2

    申请日:2021-10-11

    Inventor: 宋利 曹靖宜 解蓉

    Abstract: 本发明提供了一种个性化且可恢复的人脸去识别系统及方法,获得原始人脸图像或去识别人脸图像的身份特征和属性特征;根据用户设定的密码、隐私保护程度对得到的所述身份特征进行编辑,保护阶段中输入原始人脸图像中抽取出的身份特征计算出去识别人脸身份特征,恢复阶段中输入去识别人脸图像中抽取出的身份特征计算出复原人脸身份特征;根据计算得出的去识别人脸身份特征或复原人脸身份特征和输入的人脸图像抽取出的属性特征,合成对应的去识别人脸图像或复原人脸图像。本发明融合编解码网络结构、多尺度特征融合与身份特征编辑,实现了多样化且可恢复的人脸图像隐私保护。

Patent Agency Ranking