-
公开(公告)号:CN107316058A
公开(公告)日:2017-11-03
申请号:CN201710450327.2
申请日:2017-06-15
Applicant: 国家新闻出版广电总局广播科学研究院 , 北京邮电大学
CPC classification number: G06K9/629 , G06K9/4604 , G06K9/6227 , G06K9/6256 , G06N3/04
Abstract: 本发明涉及一种通过提高目标分类和定位准确度改善目标检测性能的方法,其主要技术特点是:根据卷积神经网络架构提取图像特征,并选择卷积层前M层输出进行特征融合,形成多特征的特征图;在卷积层M上进行网格划分,在每个网络中预测固定数目和大小的目标候选框;将候选框映射到特征图上进行裁剪,然后将裁剪结果进行多特征连接;将上述结果通过全连接层后,通过Softmax分类算法对图像特征进行分类,并用重叠面积损失函数进行在线迭代回归定位,得到最终目标检测的结果。本发明设计合理,通过卷积神经网络提取特征,并对图像特征进行多层融合,最后使用Softmax分类算法对图像特征进行分类,并采用重叠面积损失函数进行定位,获得了良好的目标检测结果。
-
公开(公告)号:CN107292259A
公开(公告)日:2017-10-24
申请号:CN201710450306.0
申请日:2017-06-15
Applicant: 国家新闻出版广电总局广播科学研究院 , 北京邮电大学
Abstract: 本发明涉及一种基于AdaRank的深度特征和传统特征的集成方法,其主要技术特点是:将图像数据进行分割,针对不同部分分别构造并训练深度卷及神经网络,用以获得深度特征;从行人再识别数据中提取传统特征,包括LOMO特征、ELF6特征、Hog3D特征;选取如下三种度量学习方法:KISSME、kLFDA和LMNN;将所有特征与三种度量学习方法进行组合张成笛卡尔乘积,得到一系列弱排序器;利用AdaRank算法,对弱排序器进行集成学习,最终得到强排序器。本发明设计合理,结合了深度学习、多特征、度量学习、集成学习,通过构造“弱排序器”并进行集成学习,使得系统的整体性能远远高于单一特征和单一度量算法,使得系统整体匹配率大大提升,获得了很好的性能。
-
公开(公告)号:CN106595633A
公开(公告)日:2017-04-26
申请号:CN201611070529.6
申请日:2016-11-25
Applicant: 北京邮电大学
CPC classification number: G01C21/005 , G01C21/206
Abstract: 本发明提供一种室内定位方法及装置,属于室内定位技术领域。方法包括:根据多重传感器采集到的数据,预测行人的位置信息;基于室内运动模型,获取行人的室内运动状态;基于室内环境地图模型,根据室内运动状态及室内预设节点的位置信息,对预测得到的行人位置信息进行校准,得到行人的最终位置信息。本发明通过预测行人的位置信息。基于室内运动模型,获取行人的室内运动状态。基于室内环境地图模型,根据室内运动状态及室内预设节点的位置信息,对预测得到的行人位置信息进行校准,得到行人的最终位置信息。由于不用安装外部设备,从而在避免设计复杂度较高的系统的同时,还可减少硬件成本消耗,进而使得室内定位时耗费的成本较低。
-
公开(公告)号:CN104243973A
公开(公告)日:2014-12-24
申请号:CN201410432154.8
申请日:2014-08-28
Applicant: 北京邮电大学 , 北京广电天地科技有限公司 , 国家广播电影电视总局广播电视规划院
IPC: H04N17/00
Abstract: 本发明涉及一种基于感兴趣区域的视频感知质量无参考客观评价方法,其技术特点是:在待测视频中提取包括运动区域和人类皮肤区域的感兴趣区域,对两个感兴趣区域进行融合得到最终的感兴趣区域,并赋予感兴趣区域/非感兴趣区域不同的评价权重;逐帧对图像失真程度进行评价;将上述每帧图像的评价权重及两种评价结果进行结合和转换,以匹配主观评价结果。本发明设计合理,综合考虑了运动区域和人类皮肤区域并结合两种图像中的块效应和模糊失真特征,实现了对视频质量无参考评价功能,具有较好的场景适应性并表现出了较好的与主观评价结果的相关性,不仅可以用于视频质量评价,而且还可用于图片质量的评价。
-
公开(公告)号:CN102595140A
公开(公告)日:2012-07-18
申请号:CN201210060588.0
申请日:2012-03-09
Applicant: 北京邮电大学
Abstract: 本发明涉及一种基于图像修复和矢量预测算子的帧内预测视频编码方法,其技术特点是:(1)计算当前块基于HEVC中传统帧内预测模式的率失真代价值RD1;(2)计算当前块基于拉普拉斯方程图像修复方法的帧内预测模式的率失真代价值RD2,若RD2小于RD1,则计算当前块基于全变分模型图像修复方法的帧内预测模式的率失真代价值RD2;(3)计算当前块基于矢量预测算子的帧内预测模式的率失真代价值RD3;(4)编码端根据RD1、RD2和RD3的比较结果,计算得到当前块的预测像素值并对当前块进行预测、压缩和编码。本发明设计合理,提高了已有的基于图像修复的帧内预测模式的预测准确性,能够在编解码后视频质量基本不变的情况下,降低编码码率,从而提高视频编码的压缩效率。
-
公开(公告)号:CN102291582A
公开(公告)日:2011-12-21
申请号:CN201110281532.3
申请日:2011-09-21
Applicant: 北京邮电大学
IPC: H04N7/26
Abstract: 本发明涉及一种基于运动补偿精化的分布式视频编码方法,包括以下步骤:(1)在编码端将视频序列分成关键帧和WZ帧,然后对WZ帧进行DCT变换、量化和Turbo编码;(2)在解码端,关键帧采用H.264帧内解码,使用改进的三维递归运动搜索方法产生前向和后向运动补偿图像,然后采用运动补偿内插法生成边信息解码WZ帧。本发明设计合理,采用改进的三维递归搜索运动方法(3DRS),能够有效地善初始边信息(SI)质量;同时采用时空边界匹配算法(STBMA)实现对边信息的精化,其充分利用空间和时间的平滑性能来获取更精确的运动矢量,具有更好的率失真性能。
-
公开(公告)号:CN101646088A
公开(公告)日:2010-02-10
申请号:CN200910089185.7
申请日:2009-08-03
Applicant: 北京邮电大学
Abstract: 本发明公开了一种视频压缩编码中的资源分配方法,包括:对于每个编码的参考帧n 0 ,计算该参考帧丢失造成的瞬时传输失真D t (n 0 );再根据该瞬时传输失真计算错误扩散的传播因子;然后,利用瞬时传输失真D t (n 0 )和传播因子slope(n 0 ),预测该参考帧丢失造成的帧组级传输失真;根据帧组级传输失真为该参考帧分配资源。应用本发明,能够准确预测参考帧的错误传输对于帧组的影响,从而实现合理的资源分配。
-
公开(公告)号:CN114004752B
公开(公告)日:2025-04-29
申请号:CN202111008281.1
申请日:2021-08-30
Applicant: 北京邮电大学
IPC: G06T5/90 , G06T9/00 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/0475 , G06N3/094
Abstract: 本发明设计了一种基于非配对训练的错误曝光图像的亮度调节方法,属于计算机视觉图像技术领域。本发明首先将任意亮度等级的图像和目标亮度的图像通过编码器分别解耦为内容分量和一个满足高斯分布的亮度分量,或直接输入一个高斯分布作为目标亮度分量,然后通过解码器将待处理的某亮度图像的内容分量和目标的亮度分量重新耦合生成目标亮度的图像。其中对亮度分量的处理是指将不同亮度等级的亮度分量拟合为唯一对应的高斯分布,将其转化为可调节的变量,本发明通过控制高斯分布的均值来实现目标亮度的转化。实验表明,本发明实现了图像不同亮度间的转化,能够有效恢复不同程度的欠曝和过曝图像,并在各个数据集较强的泛化能力。
-
公开(公告)号:CN119380161A
公开(公告)日:2025-01-28
申请号:CN202411315315.5
申请日:2024-09-20
Applicant: 北京邮电大学 , 北京卓视智通科技有限责任公司
IPC: G06V10/82 , G06V10/774 , G06V20/62 , G06N3/0464
Abstract: 本发明涉及计算机视觉技术领域,具体公开一种目标检测优化方法、系统、电子设备和存储介质,包括:将待测图像输入训练好的目标检测模型,得到所述待测图像的目标检测框及所述目标检测框的第一置信度;利用CO‑STAR框架,生成所述待测图像的背景描述文本,并将所述目标检测框和所述背景描述文本输入至训练好的多模态大语言模型,得到所述目标检测框的第二置信度;将所述目标检测框的第一置信度与第二置信度进行置信度融合,得到所述目标检测框的目标置信度。本发明利用多模态大语言模型对目标检测结果进行复检,以高可解释性的方式给出新的置信度判定,显著提高已有检测框架的精度,从而实现了对目标检测结果的优化。
-
公开(公告)号:CN116579947A
公开(公告)日:2023-08-11
申请号:CN202310604365.4
申请日:2023-05-26
Applicant: 北京邮电大学
IPC: G06T5/00 , G06V10/774 , G06V10/82 , G06N3/0464 , G06V10/80
Abstract: 本发明涉及一种基于纯噪声训练的亮度可调的低照度图像增强方法,其技术特点是:训练阶段采样随机高斯噪声作为低照度输入图像;将低照度输入图像和亮度变化因子分别送入到图像处理模块和亮度处理模块中,得到特征图和特征向量;对特征图和特征向量通过卷积和非线性变换的操作,实现特征的融合和重构,输出通道数为6的曲线参数;将低照度输入图像增强为由亮度变化因子的幅值指导的具有特定亮度的输出图像;作均值和对比度变换,得到伪参考图像;计算总损失,进行迭代优化网络。本发明采用纯噪声的训练策略,帮助模型绕过常用的色彩恒常和光照平滑损失,使难以设计的非线性曲线形式简化为线性曲线形式,实现了低照度增强领域降本增效的功能。
-
-
-
-
-
-
-
-
-