-
公开(公告)号:CN119151783A
公开(公告)日:2024-12-17
申请号:CN202410944662.8
申请日:2024-07-15
Applicant: 北京信息科技大学
IPC: G06T3/4053 , G06T3/4046 , G06T7/00 , G06N3/0455 , G06N3/088
Abstract: 本发明涉及一种基于条件VAE模型的光场角度超分辨方法,属于计算成像、机器视觉与数字图像处理技术领域,包括如下步骤:通过采集视点平面等间隔稀疏的光场子孔径图像阵列LFγ和中心子孔径图像LF0分别输入视差估计模块(P)和特征提取模块(F),获得场景初始视差图和不同层级的中心子孔径特征;本发明可以不依赖大规模的高分辨率训练数据集,可对全部光场子孔径图像同步做角度域的超分辨重构,设计一种基于光场数据的空角一致性混合损失函数,使新模型在重构角度高分辨率的子孔径图像时能够利用耦合在子孔径图像种的视差信息,在合成和真实数据集上数值实验结果接近有监督方法,同时能够满足基于深度学习的方法对光场角度域的超分辨。
-
公开(公告)号:CN119964238A
公开(公告)日:2025-05-09
申请号:CN202510034605.0
申请日:2025-01-09
Applicant: 北京信息科技大学
Abstract: 本发明公开了一种基于动作快慢特征的多模态鸟类动作识别方法及装置,该方法包括:计算输入视频相邻两帧图像之间的光流运动矢量;将光流运动矢量值按照区间进行划分,得到多个快慢类别;将每个快慢类别转化为一个二进制向量,得到动作快慢特征;将动作快慢特征与视觉‑文本特征相融合,共同作为模型的语义查询部分;训练模型:将语义查询部分与视频特征向量均输入解码器,解码器利用语义查询部分对解码器进行引导,使解码器能够聚焦于与语义查询部分的信息进行解码,得到动作识别结果,计算动作识别结果的平均精度均值,平均精度均值作为评价训练效果的指标。本发明能够更好地捕捉到鸟类动作中的时间动态信息,具有更高的识别准确性和鲁棒性。
-
公开(公告)号:CN116805330A
公开(公告)日:2023-09-26
申请号:CN202310866985.5
申请日:2023-07-14
Applicant: 北京信息科技大学
Abstract: 本发明公开了一种由聚焦堆栈重建深度的方法和装置,其包括:步骤101,通过改变物距或相距的方式,采集一组聚焦深度不同的图像序列,获得聚焦堆栈;步骤102,使用测度算子计算初始的聚焦测度体数据u;其中,聚焦测度体数据包括聚焦堆栈中每个像素的聚焦测度;步骤103,根据聚焦堆栈与聚焦测度体数据u的数据结构之间的相似程度,计算聚焦堆栈与聚焦测度体数据的结构一致性S;步骤104,结合结构一致性S,利用三维自适应加权全变分模型优化聚焦测度体数据u,得到优化后的聚焦堆栈体数据u;步骤105,根据优化后的聚焦测度体数据,获得深度图。本发明能够有效解决聚焦堆栈估计深度中弱纹理区域和遮挡区域深度线索丢失问题,进而提升重建深度的精度。
-
-