一种基于H.264的I帧码率控制方法

    公开(公告)号:CN101572806A

    公开(公告)日:2009-11-04

    申请号:CN200910085818.7

    申请日:2009-06-01

    Abstract: 本发明公开了一种基于H.264的I帧码率控制方法,用于依次对当前图像序列中除第一个图像组(GOP)外的其它GOP中的I帧进行码率控制,包括:预先建立I帧的R-QP模型,用于表示I帧的码率与量化参数QP以及图像梯度之间的对应关系,在为当前帧进行码率控制时,计算为当前帧分配的编码比特数R,并将所述R分别代入所述R-QP模型的三个区域,根据当前帧的梯度和所述R计算在每个区域中的QP,在计算得到的QP中,选择与相应区域的QP取值范围一致的QP,作为当前帧的QP。采用本发明所述的I帧码率控制方法,能够实现对I帧进行更有效的码率控制。

    基于多模型聚合的动作识别方法、系统、设备和存储介质

    公开(公告)号:CN119360434A

    公开(公告)日:2025-01-24

    申请号:CN202411255283.4

    申请日:2024-09-09

    Abstract: 本发明涉及计算机视觉技术领域,具体公开一种基于多模型聚合的动作识别方法、系统、设备和存储介质,包括:获取目标域的每个样本视频对应的多个目标路径权重和聚合动作识别结果;基于每个样本视频对应的动作识别标签、聚合动作识别结果、实例级可转移性估计指标的量化值以及多个目标路径权重,计算损失值并迭代优化;将待测视频输入至训练好的路径生成网络,得到待测视频对应的多个目标路径权重,并根据待测视频对应的多个目标路径权重及相应训练好的源域模型,得到待测视频的聚合动作识别结果。本发明的方法通过提升源域模型到目标域场景的适应能力,从而提高了模型在目标域场景下的动作识别准确性。

    基于自监督预训练大模型的高动态范围成像方法

    公开(公告)号:CN118714463A

    公开(公告)日:2024-09-27

    申请号:CN202410579410.X

    申请日:2024-05-10

    Abstract: 本发明公开了一种基于自监督预训练大模型的高动态范围成像方法,属于计算机视觉图像技术领域。本发明结合自监督预训练大模型设计了新的高动态范围成像管线,包含基于充分先验的大模型特征提取与赋权叠加、语义融合校正、重建等模块,通过各模块的依次工作,使得多个不同曝光经过预对齐和特征提取后比对语义信息,融合校正到参考图像,共同生成一个无鬼影的高动态范围图像。本发明设计合理,充分利用了大规模图像数据集中的语义信息作为先验来提取得到更优质、便于分析融合的图像特征和利用语义分割信息为鬼影区域作权重干预,减少鬼影的产生同时提升了高动态范围成像的精度。

    基于视觉语言模型的多激励融合零样本病变检测方法

    公开(公告)号:CN117633558A

    公开(公告)日:2024-03-01

    申请号:CN202311650342.3

    申请日:2023-12-04

    Abstract: 本发明提出了基于视觉语言模型的多激励融合零样本病变检测算法,属于多模态医学图像处理技术领域。本发明提出的方法包括步骤:1)将多个激励直接输入模型中,获得对应的中间变量C。2)选择合适的融合策略,对中间变量C进行归类。3)将分类后的中间变量C′分别进行位置聚类、尺寸聚类、类别标签修正、置信度阈值筛选四步操作。4)将筛选后的来自不同激励的进行多级特征融合筛选后,送入小型分类网络中进行进一步的分类判断,得到最终的融合结果。本发明通过集成学习的思想以及深度学习基本网络框架的辅助,打破了原有的单输入网络结构的限制,实现了没有数量限制的多激励融合,从而大大提高零样本条件下,视觉语言模型对医学图像领域病变检测任务的准确率。

    基于双一致性约束的行人再识别技术

    公开(公告)号:CN113065434A

    公开(公告)日:2021-07-02

    申请号:CN202110312827.6

    申请日:2021-03-24

    Abstract: 本发明设计了一种基于双一致性约束的行人再识别技术,属于计算机视觉图像技术领域。针对目前行人再识别模型过拟合至训练相机,难以泛化到新相机的问题,本发明提出了分布一致性约束以及知识一致性约束,引导模型提取相机无关特征。分布一致性约束要求不同相机的输出特征服从一致分布,由相机分布对齐损失函数实施。知识一致性目的是要求模型在不同相机中学习到的参数更新相似,由知识一致正则化向实施。实验结果表明我们的策略能够提升模型过滤相机信息,提取相机无关特征的能力,有效地增强模型对新相机的泛化能力。

    基于双路编解码器的低照度图像亮度增强及超分辨率方法

    公开(公告)号:CN112614061A

    公开(公告)日:2021-04-06

    申请号:CN202011443876.5

    申请日:2020-12-08

    Abstract: 本发明涉及一种基于双路编解码器的低照度图像亮度增强及超分辨率方法,属于计算机视觉图像技术领域。第一步,通过共享参数的编码器对暗光图像进行特征提取,得到一组特征图;第二步,将特征图送入超分辨率解码器进行解码,得到超分辨率特征图;第三步,对第一步中编码器输出的特征图和第二步的超分辨率特征图分别进行池化得到两个特征向量,并使用注意力机制对其加权融合,然后送入低照度解码器进行解码。最后,对两个解码器的输出进行后处理,得到超分辨率后的对应图像。本发明设计合理,针对目前低照度增强方法的缺陷,将低照度增强和图像超分辨率任务相结合,提高了重建图像的视觉效果,整体在低照度增强和超分综合任务上取得了较好的效果。

    基于生成式对抗网络模型的数据增强行人再识别方法

    公开(公告)号:CN110188835A

    公开(公告)日:2019-08-30

    申请号:CN201910483958.3

    申请日:2019-06-05

    Abstract: 本发明涉及一种基于生成式对抗网络模型的数据增强行人再识别方法,包括使用Mask-RCNN图像分割算法分割出图像中行人的掩膜图像;结合掩膜图像和手工标注行人属性,训练一个端到端的改进星形生成式对抗网络,从一个摄像头下的真实行人图像生成任何数量摄像头下的假训练图像;使用训练好的改进星形生成式对抗网络生成所有真实图像对应的所有相机域的假训练图像;将真实图像和假训练图像一起送入行人再识别模型,计算行人图像间距离并完成行人再识别功能。本发明设计合理,利用生成式对抗网络生成更多的训练样本,同时生成的图像背景能够有效地表示相对应摄像头下的真实场景,有效提高行人再识别模型的鲁棒性和判决能力,有效提高了行人再识别的准确率。

    基于帧间模式和运动修补的时域错误隐藏方法

    公开(公告)号:CN103313064B

    公开(公告)日:2016-04-13

    申请号:CN201310226333.1

    申请日:2013-06-07

    Abstract: 本发明涉及一种基于帧间模式和运动修补的时域错误隐藏方法,其主要技术特点是:包括以下步骤:根据与当前受损宏块上、下、左、右相邻的正确接收块的帧间模式信息进行错误隐藏方法分类,分别对受损块的运动矢量进行修复;使用运动补偿的方法,利用修复后得到的运动矢量在其参考帧中取得该受损块的重构值。本发明充分利用与受损宏块相邻正确接收块的帧间模式信息采用不同的错误隐藏方法对受损块的运动矢量进行修复,对复杂区域用基于子块的运动修补方法,对相对平坦区域用边界匹配法,对静止区域用零运动矢量法,能更精确地恢复出受损块的运动矢量,提高错误隐藏的效果,算法复杂度合适,能够保证在移动应用中的实时性。

    基于无线传感器网络的多目标无源跟踪方法

    公开(公告)号:CN103176164B

    公开(公告)日:2016-01-13

    申请号:CN201310124457.9

    申请日:2013-04-11

    Abstract: 本发明涉及一种基于无线传感器网络的多目标无源跟踪方法,其技术特点是:包括以下步骤:⑴根据传感器网络的接收信号强度建立测量模型;⑵根据步骤⑴建立的测量模型,通过多目标-多伯努利滤波算法和粒子滤波算法的结合,实现室内环境下可变多目标定位与跟踪。本发明设计合理,所建立的测量模型在室内环境下拥有较高的精确度,模型预测值逼近实际观测值;目标检测与跟踪算法具有较高的精度和稳定性,能检测与跟踪多个目标;测量模型和目标算法的计算复杂度合适,保证跟踪系统运行的实时性。

Patent Agency Ranking