-
公开(公告)号:CN116600114A
公开(公告)日:2023-08-15
申请号:CN202310596099.5
申请日:2023-05-24
Applicant: 北京航空航天大学
IPC: H04N19/115 , H04N19/154 , H04N19/105 , H04N19/139 , H04N19/167 , H04N19/182 , H04N19/513 , H04N19/54 , H04N19/57 , H04N19/593 , H04N19/96 , G06T9/00
Abstract: 本公开涉及一种全景视频编码方法、装置、设备及可读存储介质。相较于现有技术,本公开实施例通过对全景视频进行视窗预测,预测得到全景视频的多个候选视窗以及每个候选视窗的重要性系数,考虑了视频的主观质量,进一步,基于多个候选视窗进行显著性预测,得到视窗显著图,解决了对整帧进行显著性处理存在的算力浪费或码率浪费的问题,基于全景视频的多个候选视窗、每个候选视窗的重要性系数、视窗显著图以及预设的编码树单元的码率分配规则,计算全景视频中的每个编码树单元的分配码率,基于每个编码树单元的分配码率对全景视频进行编码,在保证主观观看质量的条件下大幅度节省了码率,不局限于在线编码场景,可以应用于离线观看场景,适用性强。
-
公开(公告)号:CN116503243A
公开(公告)日:2023-07-28
申请号:CN202310118262.7
申请日:2023-02-10
Applicant: 北京航空航天大学
IPC: G06T3/40
Abstract: 本公开涉及一种图像处理方法、装置、设备及存储介质。获取待处理全景图像;利用预先训练的图像缩放模型,对待处理全景图像联合进行降采样处理、可逆映射处理以及升采样处理,生成待处理全景图像对应的目标全景图像,可逆映射处理保留了经过降采样处理得到的高频信息,并且,经过升采样处理对保留的高频信息进行重建。由此,利用图像缩放模型的联合处理策略,对待处理全景图像进行缩放处理,保证了降采样过程和升采样过程之间相互依赖,并且能够经过可逆映射处理保留高频信息,进而经过升采样处理还原该高频信息,解决了高频信息发生丢失并且无法恢复的问题,因此可以有效地还原全景图像,提高了全景图像的处理效果。
-
公开(公告)号:CN115103118B
公开(公告)日:2023-04-07
申请号:CN202210699748.X
申请日:2022-06-20
Applicant: 北京航空航天大学
IPC: H04N23/951 , H04N25/58 , H04N25/62 , H04N23/741
Abstract: 本公开涉及一种高动态范围图像生成方法、装置、设备及可读存储介质。相较于现有技术,本公开实施例不需要真值图像的参与,降低高动态范围图像重建的难度,通过提取低动态范围图像的浅层特征,对浅层特征与运动掩膜进行特征联结,得到每组的联结特征,进一步,对每组的联结特征以及三张初始图像中包括的参考图像对应的浅层特征进行聚合处理,得到待重建图像的聚合特征,通过预训练的局部模型对低动态范围图像的局部信息进行整合,保留图像细节,并通过预训练的全局模型探索全局的文本信息来去除运动产生的伪影,可以使生成的高动态范围图像与低动态范围图像的联系更加紧密,进而提升了生成的高动态范围图像的效果,从而提升用户体验。
-
公开(公告)号:CN115103118A
公开(公告)日:2022-09-23
申请号:CN202210699748.X
申请日:2022-06-20
Applicant: 北京航空航天大学
Abstract: 本公开涉及一种高动态范围图像生成方法、装置、设备及可读存储介质。相较于现有技术,本公开实施例不需要真值图像的参与,降低高动态范围图像重建的难度,通过提取低动态范围图像的浅层特征,对浅层特征与运动掩膜进行特征联结,得到每组的联结特征,进一步,对每组的联结特征以及三张初始图像中包括的参考图像对应的浅层特征进行聚合处理,得到待重建图像的聚合特征,通过预训练的局部模型对低动态范围图像的局部信息进行整合,保留图像细节,并通过预训练的全局模型探索全局的文本信息来去除运动产生的伪影,可以使生成的高动态范围图像与低动态范围图像的联系更加紧密,进而提升了生成的高动态范围图像的效果,从而提升用户体验。
-
公开(公告)号:CN115063494A
公开(公告)日:2022-09-16
申请号:CN202210762210.9
申请日:2022-06-29
Applicant: 北京航空航天大学
IPC: G06T9/00 , G06T7/10 , G06V10/74 , G06V10/30 , G06V10/774
Abstract: 本申请实施例提供了一种火星图像压缩方法、装置、计算机设备和存储介质,涉及图像处理技术领域。该方法包括:获取待压缩火星图像;根据待压缩火星图像的非局部相似度与预设相似度阈值的关系,判断是否利用目标火星图像压缩模型对待压缩火星图像进行压缩;目标火星图像压缩模型包括第一编码器、第一解码器、第二编码器、第二解码器;第一编码器、第一解码器、第二编码器、第二解码器均包括一个或多个非局部模块,非局部模块用于提取待压缩火星图像的非局部特征;若是,则将待压缩火星图像输入目标火星图像压缩模型进行压缩,获取待压缩火星图像对应的压缩图像。用于解决现有的图像压缩方法不能对非局部相似度较高的火星图像实现高效压缩的问题。
-
公开(公告)号:CN113825139A
公开(公告)日:2021-12-21
申请号:CN202110957559.3
申请日:2021-08-18
Applicant: 北京航空航天大学
IPC: H04W12/63 , H04W12/122 , H04W12/10 , H04W4/02 , H04W64/00 , H04L9/32 , G16Y40/10 , G16Y40/50 , G16Y40/60
Abstract: 本申请公开了一种基于区块链的物联网设备位置指纹定位方法及系统,该方法包括建立基于区块链的链上位置指纹数据库;由区域内的已定位实际位置的物联网设备上传对应的电磁指纹,并将电磁指纹记录在位置指纹数据库中,由智能合约分配链下的求解节点训练定位模型,并在求解节点读取位置指纹数据库后,生成电磁指纹定位算法模型;接收其他节点的定位请求,根据定位请求利用电磁指纹定位算法模型在链上生成定位结果,并将定位结果返回给发送定位请求的其他节点。该方法解决了物联网设备缺乏定位能力以及定位篡改、伪造的问题,可用于提高物联网设备定位的安全性并为部分不具备定位能力的物联网设备提供定位服务。
-
公开(公告)号:CN106815876B
公开(公告)日:2019-08-02
申请号:CN201611252617.8
申请日:2016-12-30
IPC: G06T9/00
Abstract: 图像稀疏表征多字典学习联合优化训练方法,属于多媒体通信和图像数据处理领域,其特征在于,把训练用图像单元的梯度矩阵经奇异值分解后的奇异值矩阵中的非零元素视作对应梯度方向的能量值,根据设定的能量值参数门限把图像单元分为各项同性图像和各项异性图像,依次学习共享字典和专门化字典,用一个反映经稀疏表征后的各向同性和各向异性图像的残差,各字典的自相关和互相关程度以及非零元素正则化等因素最小化的目标函数予以优化,在优化过程中,依次用正交匹配追踪算法优化A0,Ak,再用梯度下降算法优化D0,Dk,在保留欲优化参数时,其他不涉及欲优化参数的项视为常数。本发明用于图像压缩时,细节保留好,失真率较低,图像品质相对较好。
-
公开(公告)号:CN106993188A
公开(公告)日:2017-07-28
申请号:CN201710131188.7
申请日:2017-03-07
Applicant: 北京航空航天大学
IPC: H04N19/147 , H04N19/19 , G06K9/00 , G06K9/62
Abstract: 本发明提供了一种基于多人脸视频显著性的HEVC压缩编码方法,属于计算机视觉领域。本发明首先建立包含视觉关注点分布的多人脸视频数据库,检测数据库中视频中的人脸并提取脸部特征,然后建立并训练多隐马尔科夫模型,用人脸在每一帧落入的关注点百分比的变化衡量人脸的显著性变化,作为隐藏状态,将所提取的脸部特征分别作为观测特征,从而实现多人脸显著性检测。更进一步地,以预测得到的显著性图谱指导视频编码过程中的码率分配,将每权重比特bpw代替每像素比特bpp来计算编码需要的量化参数,实现HEVC编码。采用本发明方法,显著性检测结果性能好,在资源有限的情况下有效提升了压缩后视频的主观质量。
-
公开(公告)号:CN104506852A
公开(公告)日:2015-04-08
申请号:CN201410826849.4
申请日:2014-12-25
Applicant: 北京航空航天大学
IPC: H04N17/00 , H04N19/154
Abstract: 本发明公开了一种面向视频会议编码的客观质量评估方法,包括训练和评估两部分;训练部分包括步骤一:脸部及脸部区域提取;步骤二:获取单个像素点的受关注程度;步骤三:对脸部区域进行校准和归一化;步骤四:获取高斯混合模型;评估部分包括步骤一:针对一组视频,自动提取出背景、脸部、左眼、右眼、嘴、鼻子区域内像素个数;步骤二:对脸部区域进行校准和归一化;步骤三:获取权重图谱;步骤四:计算基于高斯混合模型的峰值信噪比,评估视频会议系统编码后的图像质量。本发明避免了传统方法未考虑到视频内容的不足,可通过赋予视频图像脸部更多的权重,提升图像质量评估的精度,使其更加反映主观质量评估的结果。
-
公开(公告)号:CN103637900A
公开(公告)日:2014-03-19
申请号:CN201310711816.0
申请日:2013-12-20
Applicant: 北京航空航天大学
Abstract: 本发明公开了一种基于图像识别的智能导盲杖,属于电子信息工程技术领域。所述的智能导盲杖由手型杖柄、智能杖体、滚轮杖尖和蓝牙耳机四部分组成,在导盲杖内嵌入人机交互子系统、路况识别子系统、导航子系统和滚轮制动系统。所述的蓝牙耳机配合人机交互子系统,实现良好人机交互。为了配合导盲杖的图像识别,本发明对现有盲道加以改进。本发明采用图像识别处理的方法,有效识别盲道与公交信息,协助盲人安全独立的出行。导盲杖滚轮杖尖的设计减小盲人受力,手型杖柄的设计融入人性化的设计因素,操作方便。本发明的设计具有实用性和可实现性,体现了强烈的人性关怀,具有良好的市场推广价值和意义。
-
-
-
-
-
-
-
-
-