-
公开(公告)号:CN117636282A
公开(公告)日:2024-03-01
申请号:CN202311620329.3
申请日:2023-11-30
Applicant: 中国科学院上海微系统与信息技术研究所
IPC: G06V20/56 , G06V10/80 , G06V10/764 , G06V10/40 , G06V10/774 , G06V10/776 , G06V10/82
Abstract: 本发明涉及一种基于多重约束的栅格占据率估计方法、设备及介质,方法包括:接收车辆周围相机传感器获取的多视角相机图像;将多视角相机图像输入至栅格占据率估计模型中,得到栅格占据率预测结果;其中,栅格占据率估计模型增加了对每个视角的二维重投影监督,能够有效约束对侧不同物体的特征,还设计了基于物体一致性的空间约束,利用周围体素对处理后的当前体素进行语义标注的影响,解决预测三维结果中的异常值问题。本发明能有效提高算法精度及运算速度,提高了栅格占据率的估计效果。
-
公开(公告)号:CN116681759B
公开(公告)日:2024-02-23
申请号:CN202310419746.5
申请日:2023-04-19
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本发明涉及一种基于自监督视觉惯性里程计的相机位姿估计方法,包括:获取多帧图像以及每两帧图像之间的IMU数据;将所述多帧图像和IMU数据输入至网络模型中,得到位姿变换信息和深度信息;其中,所述网络模型基于视惯融合里程计网络构建,在所述视惯融合里程计网络的IMU网络模块前增加基于自注意力机制尺度恢复模块;所述自注意力机制尺度恢复模块用于估计尺度信息。本发明能够提高里程计的准确性。
-
公开(公告)号:CN114882091B
公开(公告)日:2024-02-13
申请号:CN202210476348.2
申请日:2022-04-29
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 分类模块用于进行深度边缘语义分类预测;所述本发明涉及一种结合语义边缘的深度估计 语义边缘检测模块用于输出图像的语义边缘分方法,包括:获取待深度估计的图像;将所述图像 类预测。本发明能够提高准确度。输入至训练好的深度学习网络中得到深度预测图和语义边缘预测图;所述深度学习网络包括:共享特征提取模块、深度估计模块、边缘增强权重模块、深度边缘语义分类模块和语义边缘检测模块;所述共享特征提取模块用于提取所述图像中的特征信息,并传输给所述深度估计模块和语义边缘检测模块;所述深度估计模块通过所述语义边缘检测模块输出的语义边缘引导视差平滑,并通过图像双重构的方式进行深度估计;所述边缘增强权重模块基于所述深度估计模块输出的(56)对比文件Jing Liu 等.CollaborativeDeconvolutional Neural Networks for JointDepth Estimation and SemanticSegmentation《.IEEE TRANSACTIONS ON NEURALNETWORKS AND LEARNING SYSTEMS》.2018,第第29卷卷(第第11期期),5655-5666.
-
公开(公告)号:CN117495919A
公开(公告)日:2024-02-02
申请号:CN202311561532.8
申请日:2023-11-22
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本发明涉及一种基于遮挡物体检测及运动连续性的光流估计方法,包括:接收连续的两帧图像;将连续的两帧图像输入至光流估计模型中,得到光流估计值;其中,光流估计模型包括:特征提取部分提取连续的两帧图像的图像特征和上下文特征;匹配部分基于连续的两帧图像的图像特征计算相关像素点匹配,得到4D代价体;遮挡点估计部分对4D代价体进行特征相似度判断函数处理并通过卷积网络得到遮挡点;关联优化部分根据遮挡点估计出潜在匹配位置,并与4D代价体给出的位置计算对比整合,得到优化后的4D代价体;迭代优化部分根据优化后的4D代价体与上下文特征进行迭代优化,得到光流估计值。本发明能够提升光流估计精度。
-
公开(公告)号:CN117011925A
公开(公告)日:2023-11-07
申请号:CN202310814418.5
申请日:2023-07-05
Applicant: 上海大学 , 中国科学院上海微系统与信息技术研究所
Abstract: 本发明涉及一种基于注意力机制和深度先验的注视点检测方法,包括:对场景图中的头部图像进行特征提取得到视线特征,根据视线特征预测出注视方向,并根据注视方向进行编码生成注视场;将场景图、场景深度图和注视场输入至以ResNet网络为骨干的特征金字塔网络,得到视线区域定位注视区域的显著物体。本发明能够提高注视点检测的精度。
-
公开(公告)号:CN111862236B
公开(公告)日:2023-10-20
申请号:CN202010713282.5
申请日:2020-07-22
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本发明提供一种定焦双目相机自标定方法及系统,包括:1)获取左右原始图像;2)校正左右原始图像;3)从左右校正图像中提取特征点并匹配;4)统计左右图像纵坐标偏差的平均值,若大于第一阈值则修正估计第一参数组,校准后再次比较,反复迭代修正,直至小于第一阈值;5)找到静态物体;6)处于移动状态时,追踪静态物体的视差及车轮运动信息;7)得到车轮运动距离与静态物体的三维距离变化值的距离偏差,若大于第二阈值则修正估计第二参数组,重新计算,反复迭代校正,直至小于第二阈值,完成自标定。本发明利用实时图像追踪和车体运动信息,对外参进行优化标定,完成图像校正工作,为车体提供准确的三维识别数据。
-
公开(公告)号:CN115979683A
公开(公告)日:2023-04-18
申请号:CN202211688228.5
申请日:2022-12-27
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本申请提供基于结构光系统的车底震动测量方法、装置、介质及设备,本发明通过标定相机与激光平面的相对位置关系,建立二维激光点与三维空间的映射关系,实时精准地测量列车和轨道的相对位移,并通过跟踪匹配算法实时校准,实现对几何参数的补偿,解决了目前列车震动测量方法累计误差大、无法校准的问题。
-
公开(公告)号:CN115116123A
公开(公告)日:2022-09-27
申请号:CN202210497450.0
申请日:2022-05-09
Applicant: 中国科学院上海微系统与信息技术研究所
IPC: G06V40/18 , G06V10/26 , G06V10/774 , G06V10/82 , G06V10/764 , G06N3/08
Abstract: 本发明涉及一种基于迭代学习的半监督人眼多要素分割方法,包括以下步骤:将可见光下眼部数据集划分为有标签眼部数据集和无标签眼部数据集;基于有标签眼部数据集利用有监督深度学习网络进行训练,得到预训练模型;基于预训练模型通过前向推理获取无标签眼部数据集的伪标签;基于有标签眼部数据集对无标签眼部数据集和伪标签进行筛选,得到信任数据集;将有标签眼部数据集和信任数据集输入至有监督深度学习网络进行再训练,若未达到训练完成要求,则返回上述的伪标签获取步骤,否则结束训练得到人眼分割模型;采用人眼分割模型对人眼进行多要素分割。本发明能够在使用少量标签数据的情况下,提升模型的精度和鲁棒性。
-
公开(公告)号:CN114998411A
公开(公告)日:2022-09-02
申请号:CN202210475411.0
申请日:2022-04-29
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本发明涉及一种结合时空增强光度损失的自监督单目深度估计方法和装置,其中,方法包括:获取图像序列中相邻的若干帧图像;将所述图像输入至训练好的深度学习网络中得到深度信息和位姿信息,其中,所述深度学习网络的光度损失信息基于深度感知像素对应关系的空间变换模型得到,并利用全向自动掩膜来避免运动物体的像素参与光度误差的计算。本发明能够提高光度损失的准确性,进而更好的监督深度网络的学习。
-
公开(公告)号:CN112729160B
公开(公告)日:2022-03-25
申请号:CN202110009843.8
申请日:2021-01-05
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本发明涉及计算机视觉技术领域,本申请公开了一种基于远心成像的投影标定方法、装置、系统及存储介质。该投影标定方法是通过对标定板的多个参考点进行筛选,从而剔除不在同一平面的参考点,获取到在同一平面的参考点的相位坐标,即横向相位和纵向相位,进一步得到这些在同一平面的参考点在投影仪成像平面的像素坐标,通过计算出该投影仪的内参数和外参数,完成对该投影仪的标定。本申请提供的该投影标定方法具有标定精准度高的特点。
-
-
-
-
-
-
-
-
-