-
公开(公告)号:CN106595633A
公开(公告)日:2017-04-26
申请号:CN201611070529.6
申请日:2016-11-25
Applicant: 北京邮电大学
CPC classification number: G01C21/005 , G01C21/206
Abstract: 本发明提供一种室内定位方法及装置,属于室内定位技术领域。方法包括:根据多重传感器采集到的数据,预测行人的位置信息;基于室内运动模型,获取行人的室内运动状态;基于室内环境地图模型,根据室内运动状态及室内预设节点的位置信息,对预测得到的行人位置信息进行校准,得到行人的最终位置信息。本发明通过预测行人的位置信息。基于室内运动模型,获取行人的室内运动状态。基于室内环境地图模型,根据室内运动状态及室内预设节点的位置信息,对预测得到的行人位置信息进行校准,得到行人的最终位置信息。由于不用安装外部设备,从而在避免设计复杂度较高的系统的同时,还可减少硬件成本消耗,进而使得室内定位时耗费的成本较低。
-
公开(公告)号:CN103281779B
公开(公告)日:2015-08-12
申请号:CN201310233725.0
申请日:2013-06-13
Applicant: 北京空间飞行器总体设计部 , 北京邮电大学
Abstract: 本发明涉及一种基于背景学习的射频层析成像方法,其主要技术特点是:包括以下步骤:1、根据无线传感器网络的接收信号强度,利用混合高斯背景学习算法或核密度估计背景学习算法建立每条链路的接收信号强度值的分布模型,判断各个链路是否受到影响;2、根据每条链路的接收信号强度值的分布模型,利用Tikhonov正则化进行图像重构。本发明将混合高斯背景学习算法或核密度估计背景学习算法(KDE)运用到射频层析成像中,来估计各个链路RSS测量值的分布,实现了多目标检测与跟踪功能,具有的优点是:1、在多目标和时变环境中能获得更高的准确性和有效性;2、不需要线下训练的过程。
-
公开(公告)号:CN104243973A
公开(公告)日:2014-12-24
申请号:CN201410432154.8
申请日:2014-08-28
Applicant: 北京邮电大学 , 北京广电天地科技有限公司 , 国家广播电影电视总局广播电视规划院
IPC: H04N17/00
Abstract: 本发明涉及一种基于感兴趣区域的视频感知质量无参考客观评价方法,其技术特点是:在待测视频中提取包括运动区域和人类皮肤区域的感兴趣区域,对两个感兴趣区域进行融合得到最终的感兴趣区域,并赋予感兴趣区域/非感兴趣区域不同的评价权重;逐帧对图像失真程度进行评价;将上述每帧图像的评价权重及两种评价结果进行结合和转换,以匹配主观评价结果。本发明设计合理,综合考虑了运动区域和人类皮肤区域并结合两种图像中的块效应和模糊失真特征,实现了对视频质量无参考评价功能,具有较好的场景适应性并表现出了较好的与主观评价结果的相关性,不仅可以用于视频质量评价,而且还可用于图片质量的评价。
-
公开(公告)号:CN103298156A
公开(公告)日:2013-09-11
申请号:CN201310233976.9
申请日:2013-06-13
Applicant: 北京空间飞行器总体设计部 , 北京邮电大学
Abstract: 本发明涉及一种基于无线传感器网络的无源多目标检测跟踪方法,其主要技术特点是:包括以下步骤:根据无线传感器网络中不同无线链路接收信号强度,采用扫描圈开窗检测方法构建无源多目标的滑动扫描圈模型,并采用HAC聚类算法进行聚类分析从而提取出检测结果;根据检测结果并采用PHD无源多目标粒子滤波跟踪算法,得到目标数目变化的多目标跟踪结果。本发明设计合理,其检测与跟踪算法具有较高的精度和鲁棒性,能在复杂的多径环境中检测与跟踪多个目标,同时目标检测与跟踪算法的计算复杂度适中,保证检测跟踪系统运行的实时性。
-
公开(公告)号:CN102595140A
公开(公告)日:2012-07-18
申请号:CN201210060588.0
申请日:2012-03-09
Applicant: 北京邮电大学
Abstract: 本发明涉及一种基于图像修复和矢量预测算子的帧内预测视频编码方法,其技术特点是:(1)计算当前块基于HEVC中传统帧内预测模式的率失真代价值RD1;(2)计算当前块基于拉普拉斯方程图像修复方法的帧内预测模式的率失真代价值RD2,若RD2小于RD1,则计算当前块基于全变分模型图像修复方法的帧内预测模式的率失真代价值RD2;(3)计算当前块基于矢量预测算子的帧内预测模式的率失真代价值RD3;(4)编码端根据RD1、RD2和RD3的比较结果,计算得到当前块的预测像素值并对当前块进行预测、压缩和编码。本发明设计合理,提高了已有的基于图像修复的帧内预测模式的预测准确性,能够在编解码后视频质量基本不变的情况下,降低编码码率,从而提高视频编码的压缩效率。
-
公开(公告)号:CN102291582A
公开(公告)日:2011-12-21
申请号:CN201110281532.3
申请日:2011-09-21
Applicant: 北京邮电大学
IPC: H04N7/26
Abstract: 本发明涉及一种基于运动补偿精化的分布式视频编码方法,包括以下步骤:(1)在编码端将视频序列分成关键帧和WZ帧,然后对WZ帧进行DCT变换、量化和Turbo编码;(2)在解码端,关键帧采用H.264帧内解码,使用改进的三维递归运动搜索方法产生前向和后向运动补偿图像,然后采用运动补偿内插法生成边信息解码WZ帧。本发明设计合理,采用改进的三维递归搜索运动方法(3DRS),能够有效地善初始边信息(SI)质量;同时采用时空边界匹配算法(STBMA)实现对边信息的精化,其充分利用空间和时间的平滑性能来获取更精确的运动矢量,具有更好的率失真性能。
-
公开(公告)号:CN101646088A
公开(公告)日:2010-02-10
申请号:CN200910089185.7
申请日:2009-08-03
Applicant: 北京邮电大学
Abstract: 本发明公开了一种视频压缩编码中的资源分配方法,包括:对于每个编码的参考帧n 0 ,计算该参考帧丢失造成的瞬时传输失真D t (n 0 );再根据该瞬时传输失真计算错误扩散的传播因子;然后,利用瞬时传输失真D t (n 0 )和传播因子slope(n 0 ),预测该参考帧丢失造成的帧组级传输失真;根据帧组级传输失真为该参考帧分配资源。应用本发明,能够准确预测参考帧的错误传输对于帧组的影响,从而实现合理的资源分配。
-
公开(公告)号:CN119360434A
公开(公告)日:2025-01-24
申请号:CN202411255283.4
申请日:2024-09-09
Applicant: 北京邮电大学 , 北京卓视智通科技有限责任公司
IPC: G06V40/20 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/0475
Abstract: 本发明涉及计算机视觉技术领域,具体公开一种基于多模型聚合的动作识别方法、系统、设备和存储介质,包括:获取目标域的每个样本视频对应的多个目标路径权重和聚合动作识别结果;基于每个样本视频对应的动作识别标签、聚合动作识别结果、实例级可转移性估计指标的量化值以及多个目标路径权重,计算损失值并迭代优化;将待测视频输入至训练好的路径生成网络,得到待测视频对应的多个目标路径权重,并根据待测视频对应的多个目标路径权重及相应训练好的源域模型,得到待测视频的聚合动作识别结果。本发明的方法通过提升源域模型到目标域场景的适应能力,从而提高了模型在目标域场景下的动作识别准确性。
-
公开(公告)号:CN118714463A
公开(公告)日:2024-09-27
申请号:CN202410579410.X
申请日:2024-05-10
Applicant: 北京邮电大学
IPC: H04N23/741 , H04N23/81 , H04N23/84 , H04N23/951 , G06V20/70 , G06V10/26 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/09
Abstract: 本发明公开了一种基于自监督预训练大模型的高动态范围成像方法,属于计算机视觉图像技术领域。本发明结合自监督预训练大模型设计了新的高动态范围成像管线,包含基于充分先验的大模型特征提取与赋权叠加、语义融合校正、重建等模块,通过各模块的依次工作,使得多个不同曝光经过预对齐和特征提取后比对语义信息,融合校正到参考图像,共同生成一个无鬼影的高动态范围图像。本发明设计合理,充分利用了大规模图像数据集中的语义信息作为先验来提取得到更优质、便于分析融合的图像特征和利用语义分割信息为鬼影区域作权重干预,减少鬼影的产生同时提升了高动态范围成像的精度。
-
公开(公告)号:CN117633558A
公开(公告)日:2024-03-01
申请号:CN202311650342.3
申请日:2023-12-04
Applicant: 北京邮电大学
IPC: G06F18/23 , G06F18/25 , G06F18/241 , G06V10/25 , G06V10/40 , G06F18/213 , G06F18/22 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明提出了基于视觉语言模型的多激励融合零样本病变检测算法,属于多模态医学图像处理技术领域。本发明提出的方法包括步骤:1)将多个激励直接输入模型中,获得对应的中间变量C。2)选择合适的融合策略,对中间变量C进行归类。3)将分类后的中间变量C′分别进行位置聚类、尺寸聚类、类别标签修正、置信度阈值筛选四步操作。4)将筛选后的来自不同激励的进行多级特征融合筛选后,送入小型分类网络中进行进一步的分类判断,得到最终的融合结果。本发明通过集成学习的思想以及深度学习基本网络框架的辅助,打破了原有的单输入网络结构的限制,实现了没有数量限制的多激励融合,从而大大提高零样本条件下,视觉语言模型对医学图像领域病变检测任务的准确率。
-
-
-
-
-
-
-
-
-