-
公开(公告)号:CN113822172B
公开(公告)日:2024-06-14
申请号:CN202111017499.3
申请日:2021-08-30
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本发明提供一种视频时空行为检测方法,包括:截取视频图像;检测视频片段中间帧中的所有可能的目标对象及其边框信息,以及提取视频上下文特征和目标对象特征;获取目标对象特征对于上下文特征的依赖,根据依赖更新目标对象特征;根据目标对象特征的最终结果值生成多个行为特征形成的集合;获取各行为特征间的依赖,根据依赖更新行为特征集合;利用行为特征的更新值预测每个目标对象的各行为概率。本发明的视频时空行为检测方法通过获取上下文依赖来更新更新目标对象特征,并且利用行为特征之间的依赖更新行为特征集合,可以提高视频行为检测的准确率。
-
公开(公告)号:CN111882613B
公开(公告)日:2024-06-14
申请号:CN202010723128.6
申请日:2020-07-24
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本发明基于边缘语义的视觉里程计方法、装置、存储介质及设备。所述基于边缘语义的视觉里程计方法包括:提取图像序列的边缘特征和语义信息,并分别对这二者进行距离变换,以得到边缘距离残差和语义距离残差;利用所述语义距离残差对所述边缘距离残差进行约束,并联合非线性优化的边缘距离误差和语义距离误差估计相机的相对运动。本发明联合优化边缘和语义距离误差的边缘语义视觉里程计,能够充分利用语义信息来提升运动估计的鲁棒性和精确性。
-
公开(公告)号:CN118115512A
公开(公告)日:2024-05-31
申请号:CN202410196044.X
申请日:2024-02-22
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本发明涉及一种抠图方法及装置。其中,方法包括以下步骤:获取目标图像的mask图;基于所述mask图,生成所述目标图像的初始alpha图;对所述初始alpha图进行上采样操作;根据上采样操作后的所述初始alpha图中各像素点的alpha值划分前景区域、未知区域和背景区域,获得trimap图;将所述目标图像和所述trimap图输入抠图模型,得到所述目标图像的alpha图。本发明能够生成精确的trimap图,进而提高自然图像抠图方法的实用性,获取高质量的抠图。
-
公开(公告)号:CN112288824B
公开(公告)日:2024-04-12
申请号:CN202011165184.9
申请日:2020-10-27
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本发明公开了一种基于现实场景的长焦相机标定装置及标定方法,所述装置包括测距机构和控制机构;控制机构包括俯仰机构和偏摆机构,俯仰机构设于偏摆机构的上方,俯仰机构包括俯仰组件和和用于测量俯仰角度的俯仰角度测量组件;偏摆机构包括偏摆组件和用于测量偏摆角度的偏摆角度测量组件;测距机构设置于控制机构上,测距机构能够随控制机构同步运动,测距机构用于测量特征点到测距机构的直线距离。本发明方法通过标定装置,获取现实场景中的特征点在同一坐标系下三维坐标,利用这些特征点来完成长焦相机的标定;由于特征点均来自现实场景,因此限制较小,而且这些特征点可以遍布相机的大部分画面,从而具有较好的标定结果。
-
公开(公告)号:CN116245940B
公开(公告)日:2024-04-05
申请号:CN202310052012.8
申请日:2023-02-02
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本发明涉及一种基于结构差异感知的类别级六自由度物体位姿估计方法,包括:将深度图输入至目标检测分割网络进行识别,并根据识别结果得到物体实例的观测点云,并基于物体实例的观测点云选择目标物体对应的类别先验;提取观测点云和类别先验的特征,得到实例几何特征和类别几何特征;将实例几何特征和类别几何特征输入信息交互增强模块,得到增强的实例几何特征和类别几何特征;再通过所述语义动态融合模块进行语义和几何信息的融合,得到实例融合特征和类别融合特征;基于类别融合特征得到实例NOCS模型;通过匹配网络将实例NOCS模型和观测点云进行匹配,并根据相似性计算得到目标物体的6D位姿和大小。本发明能够提高6D位姿估计的准确性。
-
公开(公告)号:CN112418296B
公开(公告)日:2024-04-02
申请号:CN202011298898.7
申请日:2020-11-18
Applicant: 中国科学院上海微系统与信息技术研究所
IPC: G06V20/00 , G06V10/764 , G06V10/82 , G06V10/80 , G06V10/25 , G06T7/246 , G06F40/289 , G10L15/26
Abstract: 本发明涉及一种基于人眼视觉注意机制的仿生双眼目标识别与跟踪方法,包括:仿生双眼装置对当前场景进行检测;构建实例级分割网络、和显著性注视点检测网络以及人体姿态检测网络;将当前场景的图像信息输入所述实例级分割网络,得到当前场景下的实例级分割结果图;尝试基于当前场景中的语音信息、人体姿态检测网络和显著性注视点检测网络获取显著性注视点区域的掩码图;将显著性注视点区域的掩码图与实例级分割结果图相对准,获取当前场景中的显著性目标及其实例级类别和轮廓,仿生双眼装置对该显著性目标进行追踪。本发明提高了跟踪切换鲁棒性,能使最终结果更精确,也更贴近人眼视觉机制。
-
公开(公告)号:CN112381031B
公开(公告)日:2024-02-02
申请号:CN202011331116.5
申请日:2020-11-24
Applicant: 中国科学院上海微系统与信息技术研究所
IPC: G06V20/52 , G06V20/40 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及一种基于卷积神经网络的实时在线受电弓羊角检测方法,包括:步骤S1,根据列车历史往返一次的全程视频制作训练集;步骤S2,采用训练集对预训练模型进行再训练,得到羊角掩膜检测网络;步骤S3,将全程视频输入羊角掩膜检测网络,获取每个羊角的掩膜信息;步骤S4,对每个羊角的掩膜信息进行统计,获取每个羊角的损伤判别条件;步骤S5,获取列车行驶的实时视频,将列车行驶的实时视频输入所述羊角掩膜检测网络,获取每个羊角的实时掩膜信息,并根据损伤判别条件检测每个羊角是否发生损伤。本发明能够在不影响列车运行的情况下实现实时在线检测,在复杂背景环境中具有更高的鲁棒性。同时,本发明能够有效增加检测精度。
-
公开(公告)号:CN114998411B
公开(公告)日:2024-01-09
申请号:CN202210475411.0
申请日:2022-04-29
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本发明涉及一种结合时空增强光度损失的自监督单目深度估计方法和装置,其中,方法包括:获取图像序列中相邻的若干帧图像;将所述图像输入至训练好的深度学习网络中得到深度信息和位姿信息,其中,所述深度学习网络的光度损失信息基于深度感知像素对应关系的空间变换模型得到,并利用全向自动掩膜来避免运动(56)对比文件詹雁.基于域适应的图像深度信息估计方法研究《.中国优秀硕士学位论文全文数据库信息科技辑》.2021,(第2021(04)期),I138-811.
-
公开(公告)号:CN113160321B
公开(公告)日:2023-12-26
申请号:CN202110196390.4
申请日:2021-02-22
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本发明涉及一种实时图像序列的几何映射方法和装置,方法包括:建立原始图像序列和目标图像序列的按输出图像像素坐标顺序排列的输出顺序映射表;在不改变输出顺序映射表中映射对的内部对应关系的前提下,对映射对重新排序,将映射对按照原始图像的浮点坐标的整数部分顺序进行排列,排列的顺序与原始图像的像素输入的顺序一致,建立输入顺序定点映射表;根据输入顺序定点映射表中映射单元中对应的映射对的数量对输入顺序定点映射表进行压缩,建立输入顺序压缩映射表;在接入实时图像序列时对输入顺序压缩映射表进行读取和恢复,并执行映射操作。本发明能够在较低的硬件资源条件下以高实时性达到图像序列的几何映射的目的。
-
公开(公告)号:CN117278831A
公开(公告)日:2023-12-22
申请号:CN202311055844.1
申请日:2023-08-22
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本发明涉及一种基于窄波段滤光的自适应补光系统和方法,其中,系统包括:图像获取模块,用于获取目标物体的图像;所述图像获取模块的镜头前设置有窄波段滤光片;窄波段补光模块,用于对所述目标物体提供窄波段的补光光源;所述窄波段补光模块发出的光的波长范围与所述窄波段滤光片的光谱波长范围相同;中央处理模块,用于根据所述图像中目标物体所占区域的像素均值调整所述窄波段补光模块的光照强度。本发明能够在复杂场景中提供高稳定性的自适应补光效果。
-
-
-
-
-
-
-
-
-