-
公开(公告)号:CN117373133A
公开(公告)日:2024-01-09
申请号:CN202311447158.9
申请日:2023-11-02
Applicant: 中国科学院上海微系统与信息技术研究所
IPC: G06V40/20 , G06V20/40 , G06V10/44 , G06V10/74 , G06V10/77 , G06V10/82 , G06N3/0464 , G06N3/0499 , G06N3/08
Abstract: 本发明涉及一种基于CLIP模型图文双支共享机制的动作识别方法,包括:获取待识别视频并分为多帧RGB图;将多帧RGB图输入至动作识别模型,得到待识别视频中主体的动作类别;其中,动作识别模型中的视觉‑文本信息共享模块用于形成共享token;时空增强模块用于重塑图像特征序列以及更新共享token;图像特征提取部分用于结合视觉‑文本信息共享模块和时空增强模块提取多帧RGB图的视觉特征;文本特征提取部分用于结合视觉‑文本信息共享模块从类别文本中提取文本特征;相似度计算模块,用于计算文本特征和视觉特征的相似度,将相似度最大的类别作为待识别视频中主体的动作类别。本发明能达到准确、高效的行为识别性能。
-
公开(公告)号:CN117011925A
公开(公告)日:2023-11-07
申请号:CN202310814418.5
申请日:2023-07-05
Applicant: 上海大学 , 中国科学院上海微系统与信息技术研究所
Abstract: 本发明涉及一种基于注意力机制和深度先验的注视点检测方法,包括:对场景图中的头部图像进行特征提取得到视线特征,根据视线特征预测出注视方向,并根据注视方向进行编码生成注视场;将场景图、场景深度图和注视场输入至以ResNet网络为骨干的特征金字塔网络,得到视线区域定位注视区域的显著物体。本发明能够提高注视点检测的精度。
-
公开(公告)号:CN111862236B
公开(公告)日:2023-10-20
申请号:CN202010713282.5
申请日:2020-07-22
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本发明提供一种定焦双目相机自标定方法及系统,包括:1)获取左右原始图像;2)校正左右原始图像;3)从左右校正图像中提取特征点并匹配;4)统计左右图像纵坐标偏差的平均值,若大于第一阈值则修正估计第一参数组,校准后再次比较,反复迭代修正,直至小于第一阈值;5)找到静态物体;6)处于移动状态时,追踪静态物体的视差及车轮运动信息;7)得到车轮运动距离与静态物体的三维距离变化值的距离偏差,若大于第二阈值则修正估计第二参数组,重新计算,反复迭代校正,直至小于第二阈值,完成自标定。本发明利用实时图像追踪和车体运动信息,对外参进行优化标定,完成图像校正工作,为车体提供准确的三维识别数据。
-
公开(公告)号:CN116805223A
公开(公告)日:2023-09-26
申请号:CN202310626806.0
申请日:2023-05-30
Applicant: 中国科学院上海微系统与信息技术研究所 , 安徽爱观视觉科技有限公司
IPC: G06Q10/0639 , G06Q30/0283
Abstract: 本发明涉及一种基于成本核算的供应商评估方法及系统。所述方法主要包括以下步骤:根据需要评估的物资种类获取相关数据,基于上述数据分别计算得到每个供应商提供的该物资种类的综合成本,该物资综合成本为物资的取得成本、使用成本、末期成本之和,基于上述物资综合成本对供应商进行排序并展示评估结果。本评估方法所需原始数据自动从工厂的信息化管理系统中提取,无需人工介入,数据分析过程无需评估专家打分或设置权值,无需人工智能/机器学习方面的专家调节超参数,杜绝了人为故意影响评价结果的可能性,同时也减轻了企业的人力负担。
-
公开(公告)号:CN116758000A
公开(公告)日:2023-09-15
申请号:CN202310515955.X
申请日:2023-05-09
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本发明涉及一种基于深度学习的弓网几何参数车载实时检测方法及装置,方法包括:获取列车运行过程中的双目监控图像;将所述双目监控图像输入至训练好的关键区域识别模型,得到接触线与碳滑板的关键接触区域;将所述关键接触区域的中心作为计算关键点,基于视差原理计算得到接触线在相机坐标系下的空间位置关系;将所述接触线在相机坐标系下变换到以双目相机基线中心的世界坐标系,得到接触线基于车顶的几何参数。本发明能够实现便捷、可靠、高精度的测量。
-
公开(公告)号:CN115979683A
公开(公告)日:2023-04-18
申请号:CN202211688228.5
申请日:2022-12-27
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本申请提供基于结构光系统的车底震动测量方法、装置、介质及设备,本发明通过标定相机与激光平面的相对位置关系,建立二维激光点与三维空间的映射关系,实时精准地测量列车和轨道的相对位移,并通过跟踪匹配算法实时校准,实现对几何参数的补偿,解决了目前列车震动测量方法累计误差大、无法校准的问题。
-
公开(公告)号:CN115116123A
公开(公告)日:2022-09-27
申请号:CN202210497450.0
申请日:2022-05-09
Applicant: 中国科学院上海微系统与信息技术研究所
IPC: G06V40/18 , G06V10/26 , G06V10/774 , G06V10/82 , G06V10/764 , G06N3/08
Abstract: 本发明涉及一种基于迭代学习的半监督人眼多要素分割方法,包括以下步骤:将可见光下眼部数据集划分为有标签眼部数据集和无标签眼部数据集;基于有标签眼部数据集利用有监督深度学习网络进行训练,得到预训练模型;基于预训练模型通过前向推理获取无标签眼部数据集的伪标签;基于有标签眼部数据集对无标签眼部数据集和伪标签进行筛选,得到信任数据集;将有标签眼部数据集和信任数据集输入至有监督深度学习网络进行再训练,若未达到训练完成要求,则返回上述的伪标签获取步骤,否则结束训练得到人眼分割模型;采用人眼分割模型对人眼进行多要素分割。本发明能够在使用少量标签数据的情况下,提升模型的精度和鲁棒性。
-
公开(公告)号:CN114998411A
公开(公告)日:2022-09-02
申请号:CN202210475411.0
申请日:2022-04-29
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本发明涉及一种结合时空增强光度损失的自监督单目深度估计方法和装置,其中,方法包括:获取图像序列中相邻的若干帧图像;将所述图像输入至训练好的深度学习网络中得到深度信息和位姿信息,其中,所述深度学习网络的光度损失信息基于深度感知像素对应关系的空间变换模型得到,并利用全向自动掩膜来避免运动物体的像素参与光度误差的计算。本发明能够提高光度损失的准确性,进而更好的监督深度网络的学习。
-
公开(公告)号:CN112367674B
公开(公告)日:2022-06-24
申请号:CN202011239109.2
申请日:2020-11-09
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本发明涉及一种有效的三维环境下毫米波通信系统性能建模方法,包括以下步骤:对用户设备的接收功率进行建模;基于KL散度的高斯逼近方法,得到用户设备接收功率的近似分布;将用户设备的接收信噪比分布建模为高斯混合模型;基于用户设备接收功率的近似分布对小区覆盖率和小区平均数据传输速率进行建模。本发明能够对小区覆盖和平均数据传输速率进行揭示。
-
公开(公告)号:CN112729160B
公开(公告)日:2022-03-25
申请号:CN202110009843.8
申请日:2021-01-05
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本发明涉及计算机视觉技术领域,本申请公开了一种基于远心成像的投影标定方法、装置、系统及存储介质。该投影标定方法是通过对标定板的多个参考点进行筛选,从而剔除不在同一平面的参考点,获取到在同一平面的参考点的相位坐标,即横向相位和纵向相位,进一步得到这些在同一平面的参考点在投影仪成像平面的像素坐标,通过计算出该投影仪的内参数和外参数,完成对该投影仪的标定。本申请提供的该投影标定方法具有标定精准度高的特点。
-
-
-
-
-
-
-
-
-