-
公开(公告)号:CN114998411B
公开(公告)日:2024-01-09
申请号:CN202210475411.0
申请日:2022-04-29
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本发明涉及一种结合时空增强光度损失的自监督单目深度估计方法和装置,其中,方法包括:获取图像序列中相邻的若干帧图像;将所述图像输入至训练好的深度学习网络中得到深度信息和位姿信息,其中,所述深度学习网络的光度损失信息基于深度感知像素对应关系的空间变换模型得到,并利用全向自动掩膜来避免运动(56)对比文件詹雁.基于域适应的图像深度信息估计方法研究《.中国优秀硕士学位论文全文数据库信息科技辑》.2021,(第2021(04)期),I138-811.
-
公开(公告)号:CN116309698A
公开(公告)日:2023-06-23
申请号:CN202310038906.1
申请日:2023-01-11
Applicant: 中国科学院上海微系统与信息技术研究所
IPC: G06T7/246 , G06T5/00 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及一种基于运动特征弥补引导的多帧光流估计方法,包括以下步骤:提取至少连续两帧的输入图像的图像特征;基于相邻两帧的输入图像的图像特征,采用运动编码器得到初始运动特征;将初始运动特征和历史集成特征输入至MFC单元,所述MFC单元通过交叉注意力得到增强运动特征,并与初始运动特征合并得到集成特征;将所述集成特征输入至迭代模块进行迭代计算,得到最终光流。本发明可以大大改进光流估计在遮挡区域的性能。
-
公开(公告)号:CN118351252A
公开(公告)日:2024-07-16
申请号:CN202410417649.7
申请日:2024-04-09
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本发明涉及一种基于先验深度与高斯溅射模型融合的场景三维重建方法,包括:获取多视角下的场景图像;将多视角下的场景图像输入至场景三维重建模型中,完成场景的三维重建;其中,场景三维重建模型包括:单目深度估计网络与视觉里程计,用于基于多视角下的场景图像得到多视角下场景图像的稠密先验深度与相机位姿;点云生成模块,用于使用稠密先验深度与相机位姿生成世界坐标系下的空间点云,并将空间点云初始化为一组具有不透明度和球面谐波的三维高斯体;三维高斯优化模块,用于使用先验深度引导的自适应密度控制策略对三维高斯体的空间分布进行优化调整,完成场景的三维重建。本发明缓解观测数据不足导致的重建模糊问题。
-
公开(公告)号:CN118052841A
公开(公告)日:2024-05-17
申请号:CN202410070464.3
申请日:2024-01-18
Applicant: 中国科学院上海微系统与信息技术研究所
IPC: G06T7/20 , G06T7/10 , G06T7/50 , G06N3/0499 , G06N3/08
Abstract: 本发明涉及一种融合语义的无监督深度估计与视觉里程计方法和系统,其中,方法包括:接收视频序列;将所述视频序列输入至预测模型,得到预测结果;其中,所述预测模型包括:深度估计子网络,用于估计输入的目标图像对应的深度图;位姿估计子网络,用于估计输入的目标图像和源图像之间的相对位姿;语义分割子网络,用于对输入的目标图像和重建目标图像进行语义分割,得到用于构造语义重投影损失的目标图像语义分割结果和重建目标图像语义分割结果;语义掩码模块,用于根据目标图像语义分割结果构造语义掩码;重投影模块,用于根据深度图、相对位姿和语义掩码对源图像进行重投影操作,得到重建目标图像。本发明能够增强重投影损失的效用。
-
公开(公告)号:CN118037801A
公开(公告)日:2024-05-14
申请号:CN202410109880.X
申请日:2024-01-25
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本发明涉及一种双目图像的立体匹配方法,包括以下步骤:获取双目图像;采用立体匹配模型对所述双目图像进行分析获得视差估计;所述立体匹配模型包括:视差估计网络,用来提取所述双目图像的多尺度双目融合特征,并根据所述双目融合特征预测视差估计;光谱转换网络,用来分别提取所述双目图像不同视角的多尺度单目特征进而生成单目伪图像,且在任一尺度的多尺度单目特征提取后嵌入特征交互模块对所述任一尺度的所述单目特征进行优化;所述视差估计网络和所述光谱转换网络通过所述单目伪图像和所述视差估计来调整网络参数。本发明能够增强图像域差异较大区域的特征感知,获得更为精确的立体匹配结果。
-
公开(公告)号:CN116310313A
公开(公告)日:2023-06-23
申请号:CN202310061744.3
申请日:2023-01-17
Applicant: 中国科学院上海微系统与信息技术研究所
IPC: G06V10/26 , G06V10/77 , G06V10/774 , G06V10/82 , G06N3/088
Abstract: 本发明涉及一种基于特征级无监督域适应网络的语义分割方法,包括以下步骤:获取图像数据;将所述图像数据输入至特征级无监督域适应网络,实现对所述图像数据的分割效果可视化,所述特征级无监督域适应网络为一个包含三个共享权重分支的自训练网络,所述自训练网络包括源分支部分、目标分支部分和目标‑源分支部分;所述源分支部分用于学习源域内分布,所述目标分支部分用于学习目标域内分布,所述目标‑源分支部分用于在特征级对齐所述源域和目标域之间的域间分布。本发明能够有效增强域适应能力,在目标域数据集上实现了更好的分割效果。
-
公开(公告)号:CN110097591B
公开(公告)日:2023-05-26
申请号:CN201910356368.4
申请日:2019-04-29
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本发明提供一种弓网状态的检测方法,通过获取接触线与受电弓之相交区域的原始图像,经由直线提取算法获得接触线的直线特征,进而根据所述直线特征,以动态权重直线聚类的方式拟合出接触线的虚拟二维模型,并对虚拟二维模型进行立体匹配,获得视差信息,而后得出三维信息并创建接触线的虚拟三维模型,根据接触线的虚拟三维模型,以及受电弓的虚拟三维模型,即可获取所述弓网的状态。通过本发明提供的方法,可准确地识别刚性接触网中的接触线,而用于识别检测的装置结构简单,成本低且效果好。此外,通过本发明提供的弓网状态的检测方法可实现连续且不间断地对弓网状态进行自动检测,能有效降低工作人员劳动强度,提高工作效率。
-
公开(公告)号:CN112270688A
公开(公告)日:2021-01-26
申请号:CN202011216784.3
申请日:2020-11-04
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本申请涉及一种前景提取方法、装置、设备或存储介质,该方法包括:获取红外图像序列和可见光图像序列;红外图像序列和可见光图像序列一一对应;对红外图像序列中每帧红外图像进行对比度处理,得到初始掩膜图像序列;将初始掩膜图像序列和可见光图像序列进行串联,得到输入图像序列;根据已训练的特征提取模型对输入图像序列进行特征提取,得到特征张量;根据已训练的长短时记忆网络模型,确定特征张量对应的预测掩膜图像;根据预测掩膜图像和可见光图像,确定前景图像。本申请实施例提供的一种前景提取方法适用于静止或运动的前景物体,包括半透明物体、运动模糊物体和虚焦物体的提取,可以提高前景物体的边缘的提取精度。
-
公开(公告)号:CN110097591A
公开(公告)日:2019-08-06
申请号:CN201910356368.4
申请日:2019-04-29
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本发明提供一种弓网状态的检测方法,通过获取接触线与受电弓之相交区域的原始图像,经由直线提取算法获得接触线的直线特征,进而根据所述直线特征,以动态权重直线聚类的方式拟合出接触线的虚拟二维模型,并对虚拟二维模型进行立体匹配,获得视差信息,而后得出三维信息并创建接触线的虚拟三维模型,根据接触线的虚拟三维模型,以及受电弓的虚拟三维模型,即可获取所述弓网的状态。通过本发明提供的方法,可准确地识别刚性接触网中的接触线,而用于识别检测的装置结构简单,成本低且效果好。此外,通过本发明提供的弓网状态的检测方法可实现连续且不间断地对弓网状态进行自动检测,能有效降低工作人员劳动强度,提高工作效率。
-
-
-
-
-
-
-
-