-
公开(公告)号:CN117523249A
公开(公告)日:2024-02-06
申请号:CN202210903222.9
申请日:2022-07-28
Applicant: 中国科学院上海微系统与信息技术研究所
IPC: G06V10/764 , G06V10/80 , G06V10/82 , G06N3/084 , G06N3/0464
Abstract: 本申请涉及计算机技术领域,提供了一种目标检测方法、装置、电子设备及存储介质,将待处理图像输入至目标检测模型的目标基础特征提取网络得到目标基础特征图;将目标基础特征图输入至目标检测模型的目标定位分支网络得到目标位置信息;将目标基础特征图输入至目标检测模型的目标层级分类分支网络得到每个分类层级对应的目标分类特征图;针对每个分类层级对应的目标分类分支网络,将分类层级对应的目标分类特征图与下级分类层级对应的目标分类特征图进行融合处理,基于融合后的融合目标分类特征图预测分类层级对应的目标分类信息。本申请可以同时满足不同粒度要求的目标检测,可以提高粗粒度的分类精度。
-
公开(公告)号:CN117495919A
公开(公告)日:2024-02-02
申请号:CN202311561532.8
申请日:2023-11-22
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本发明涉及一种基于遮挡物体检测及运动连续性的光流估计方法,包括:接收连续的两帧图像;将连续的两帧图像输入至光流估计模型中,得到光流估计值;其中,光流估计模型包括:特征提取部分提取连续的两帧图像的图像特征和上下文特征;匹配部分基于连续的两帧图像的图像特征计算相关像素点匹配,得到4D代价体;遮挡点估计部分对4D代价体进行特征相似度判断函数处理并通过卷积网络得到遮挡点;关联优化部分根据遮挡点估计出潜在匹配位置,并与4D代价体给出的位置计算对比整合,得到优化后的4D代价体;迭代优化部分根据优化后的4D代价体与上下文特征进行迭代优化,得到光流估计值。本发明能够提升光流估计精度。
-
公开(公告)号:CN117373133A
公开(公告)日:2024-01-09
申请号:CN202311447158.9
申请日:2023-11-02
Applicant: 中国科学院上海微系统与信息技术研究所
IPC: G06V40/20 , G06V20/40 , G06V10/44 , G06V10/74 , G06V10/77 , G06V10/82 , G06N3/0464 , G06N3/0499 , G06N3/08
Abstract: 本发明涉及一种基于CLIP模型图文双支共享机制的动作识别方法,包括:获取待识别视频并分为多帧RGB图;将多帧RGB图输入至动作识别模型,得到待识别视频中主体的动作类别;其中,动作识别模型中的视觉‑文本信息共享模块用于形成共享token;时空增强模块用于重塑图像特征序列以及更新共享token;图像特征提取部分用于结合视觉‑文本信息共享模块和时空增强模块提取多帧RGB图的视觉特征;文本特征提取部分用于结合视觉‑文本信息共享模块从类别文本中提取文本特征;相似度计算模块,用于计算文本特征和视觉特征的相似度,将相似度最大的类别作为待识别视频中主体的动作类别。本发明能达到准确、高效的行为识别性能。
-
公开(公告)号:CN117011925A
公开(公告)日:2023-11-07
申请号:CN202310814418.5
申请日:2023-07-05
Applicant: 上海大学 , 中国科学院上海微系统与信息技术研究所
Abstract: 本发明涉及一种基于注意力机制和深度先验的注视点检测方法,包括:对场景图中的头部图像进行特征提取得到视线特征,根据视线特征预测出注视方向,并根据注视方向进行编码生成注视场;将场景图、场景深度图和注视场输入至以ResNet网络为骨干的特征金字塔网络,得到视线区域定位注视区域的显著物体。本发明能够提高注视点检测的精度。
-
公开(公告)号:CN111862236B
公开(公告)日:2023-10-20
申请号:CN202010713282.5
申请日:2020-07-22
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本发明提供一种定焦双目相机自标定方法及系统,包括:1)获取左右原始图像;2)校正左右原始图像;3)从左右校正图像中提取特征点并匹配;4)统计左右图像纵坐标偏差的平均值,若大于第一阈值则修正估计第一参数组,校准后再次比较,反复迭代修正,直至小于第一阈值;5)找到静态物体;6)处于移动状态时,追踪静态物体的视差及车轮运动信息;7)得到车轮运动距离与静态物体的三维距离变化值的距离偏差,若大于第二阈值则修正估计第二参数组,重新计算,反复迭代校正,直至小于第二阈值,完成自标定。本发明利用实时图像追踪和车体运动信息,对外参进行优化标定,完成图像校正工作,为车体提供准确的三维识别数据。
-
公开(公告)号:CN116805223A
公开(公告)日:2023-09-26
申请号:CN202310626806.0
申请日:2023-05-30
Applicant: 中国科学院上海微系统与信息技术研究所 , 安徽爱观视觉科技有限公司
IPC: G06Q10/0639 , G06Q30/0283
Abstract: 本发明涉及一种基于成本核算的供应商评估方法及系统。所述方法主要包括以下步骤:根据需要评估的物资种类获取相关数据,基于上述数据分别计算得到每个供应商提供的该物资种类的综合成本,该物资综合成本为物资的取得成本、使用成本、末期成本之和,基于上述物资综合成本对供应商进行排序并展示评估结果。本评估方法所需原始数据自动从工厂的信息化管理系统中提取,无需人工介入,数据分析过程无需评估专家打分或设置权值,无需人工智能/机器学习方面的专家调节超参数,杜绝了人为故意影响评价结果的可能性,同时也减轻了企业的人力负担。
-
公开(公告)号:CN116758000A
公开(公告)日:2023-09-15
申请号:CN202310515955.X
申请日:2023-05-09
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本发明涉及一种基于深度学习的弓网几何参数车载实时检测方法及装置,方法包括:获取列车运行过程中的双目监控图像;将所述双目监控图像输入至训练好的关键区域识别模型,得到接触线与碳滑板的关键接触区域;将所述关键接触区域的中心作为计算关键点,基于视差原理计算得到接触线在相机坐标系下的空间位置关系;将所述接触线在相机坐标系下变换到以双目相机基线中心的世界坐标系,得到接触线基于车顶的几何参数。本发明能够实现便捷、可靠、高精度的测量。
-
公开(公告)号:CN115979683A
公开(公告)日:2023-04-18
申请号:CN202211688228.5
申请日:2022-12-27
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本申请提供基于结构光系统的车底震动测量方法、装置、介质及设备,本发明通过标定相机与激光平面的相对位置关系,建立二维激光点与三维空间的映射关系,实时精准地测量列车和轨道的相对位移,并通过跟踪匹配算法实时校准,实现对几何参数的补偿,解决了目前列车震动测量方法累计误差大、无法校准的问题。
-
公开(公告)号:CN115116123A
公开(公告)日:2022-09-27
申请号:CN202210497450.0
申请日:2022-05-09
Applicant: 中国科学院上海微系统与信息技术研究所
IPC: G06V40/18 , G06V10/26 , G06V10/774 , G06V10/82 , G06V10/764 , G06N3/08
Abstract: 本发明涉及一种基于迭代学习的半监督人眼多要素分割方法,包括以下步骤:将可见光下眼部数据集划分为有标签眼部数据集和无标签眼部数据集;基于有标签眼部数据集利用有监督深度学习网络进行训练,得到预训练模型;基于预训练模型通过前向推理获取无标签眼部数据集的伪标签;基于有标签眼部数据集对无标签眼部数据集和伪标签进行筛选,得到信任数据集;将有标签眼部数据集和信任数据集输入至有监督深度学习网络进行再训练,若未达到训练完成要求,则返回上述的伪标签获取步骤,否则结束训练得到人眼分割模型;采用人眼分割模型对人眼进行多要素分割。本发明能够在使用少量标签数据的情况下,提升模型的精度和鲁棒性。
-
公开(公告)号:CN114998411A
公开(公告)日:2022-09-02
申请号:CN202210475411.0
申请日:2022-04-29
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本发明涉及一种结合时空增强光度损失的自监督单目深度估计方法和装置,其中,方法包括:获取图像序列中相邻的若干帧图像;将所述图像输入至训练好的深度学习网络中得到深度信息和位姿信息,其中,所述深度学习网络的光度损失信息基于深度感知像素对应关系的空间变换模型得到,并利用全向自动掩膜来避免运动物体的像素参与光度误差的计算。本发明能够提高光度损失的准确性,进而更好的监督深度网络的学习。
-
-
-
-
-
-
-
-
-