一种注视检测方法、装置、设备及存储介质

    公开(公告)号:CN112308932B

    公开(公告)日:2023-12-08

    申请号:CN202011217737.0

    申请日:2020-11-04

    Abstract: 本申请公开一种注视检测方法、装置、设备及存储介质,本申请通过获取目标相机采集的目标对象的基准图像和参考图像,以及目标相机的内外参;基于基准图像对应的像素坐标系,构建基准图像对应的头部坐标系;确定第一坐标转换关系;基于目标对象的双眼瞳孔中心在基准图像和参考图像各自对应的像素坐标系中的第一像素坐标、第二像素坐标,以及目标相机的内外参,确定目标对象的双眼瞳孔中心在基准图像对应的相机坐标系中的第一相机坐标;基于平均人脸模型和基准图像对应的头部坐标系确定目标对象的双眼眼球中心,以及目标对象的双眼眼球中心的第一头部坐标;确定基准图像对应的相机坐标系中的目标对象的视线方向和注视点,可以实现利用相机作为采集设备。(56)对比文件Li Sun et al..Real time gazeestimation with a consumer depthcamera.Information Sciences.2015,第320卷全文.宋金淼;王楠楠;王心瀚;段晓东.基于KINECT的人眼视线方向估测方法研究.大连民族大学学报.2017,(第03期),全文.

    一种多目立体相机的校准及深度图像处理方法

    公开(公告)号:CN111402309B

    公开(公告)日:2023-11-03

    申请号:CN202010149137.9

    申请日:2020-03-05

    Abstract: 本发明提供一种多目立体相机的校准及深度图像处理方法,包括:在多目相机设备中选取基准相机和待修正相机,并获取相应的基准相机图像和对待修正相机图像;根据所述基准相机图像和对待修正相机图像对所述待修正相机的内参量和外参量进行优化;得到最终的深度图像。本发明的方法利用匹配特征的深度计算结果实现对相机参量的优化,使多个深度图像的交界部分过渡平滑,可以根据优化的参量对未重合部分的深度图像进行进一步的精化调整,并且通过不同双目间的相互约束,保证最终深度结果一致性与稳定性。

    并联式仿生眼的绝对位置获取装置

    公开(公告)号:CN116572286A

    公开(公告)日:2023-08-11

    申请号:CN202310524108.X

    申请日:2023-05-09

    Abstract: 本发明涉及一种并联式仿生眼的绝对位置获取装置,包括传感器部件;基板,固定于传感器部件的下方;转盘组件,包括依次设置的三个转盘,第一转盘的上方设有上固定基座,第三转盘的下方设有下固定基座,三个转盘可相对于上固定基座和下固定基座转动;三个连杆组件,基板通过其分别与三个转盘相连;电机组件,包括三个电机,穿过下固定基座而分别延伸进三个转盘内后分别与其转动连接;上固定基座上设有码盘,每个连杆组件上均设置有位置读取装置,其与码盘相配合以获得连杆组件的绝对位置信息。本发明的并联式仿生眼的绝对位置获取装置,通过一个码盘即可获得传感器部件的绝对位置信息,提升了传感器姿态估计精度,且避免初始化时设备卡死的问题。

    一种基于多模态知识图谱的图像场景检索系统及方法

    公开(公告)号:CN111694965B

    公开(公告)日:2023-06-13

    申请号:CN202010478948.3

    申请日:2020-05-29

    Abstract: 本发明涉及一种基于多模态知识图谱的图像场景检索系统,通过用户界面输入检索信息并获取检索结果,包括:场景采集模块,设置为采集若干包含不同目标对象的图像场景;场景解析模块,设置为对采集的图像进行场景理解,得到不同目标对象及其之间的关系;多模态数据管理模块,设置为对目标对象及其之间的关系进行存储与查询;检索交互模块,设置为从检索信息提取关键词,并获取与关键词对应的节点信息,最后创建数据交换文件返回用户界面。本发明还提供一种基于多模态知识图谱的图像场景检索方法,能够降低存储涉及多幅图像场景结果的难度,简单直观且全面地展示出目标对象及其之间的关系。同时,本发明提高检索的准确性和场景检索的效率。

    一种图像识别方法、装置、电子设备及存储介质

    公开(公告)号:CN110929637B

    公开(公告)日:2023-05-16

    申请号:CN201911139594.3

    申请日:2019-11-20

    Abstract: 本申请涉及一种图像识别方法、装置、电子设备及存储介质,通过获取人体骨架图像序列;确定每帧人体骨架图像的骨架关节点集合中对应的相对坐标集合;基于相对坐标集合、骨架关节点的数量和人体骨架图像序列中图像的帧数确定相对坐标张量;确定多个帧间差分值集合;基于多个帧间差分值集合、骨架关节点的数量和人体骨架图像序列中图像的帧数确定时间差分张量;基于相对坐标张量和时间差分张量确定输入张量;基于已训练的动作识别模型对输入张量进行动作识别,得到人体骨架图像序列对应的动作类别。本申请利用人体骨架关节点信息来构建基于图卷积网络的动作识别模型的输入张量,进行动作识别,可以提升对人类动作识别的准确度。

Patent Agency Ranking