一种目标图像处理模型的确定方法、装置及存储介质

    公开(公告)号:CN112580804B

    公开(公告)日:2024-04-05

    申请号:CN202011555461.7

    申请日:2020-12-23

    Abstract: 本发明涉及一种目标图像处理模型的确定方法、装置及存储介质,方法包括根据待剪枝图像处理模型的历史剪枝信息和历史精度信息,确定当前剪枝信息;基于当前剪枝信息,对待剪枝图像处理模型进行剪枝处理,得到剪枝后的模型;将样本图像输入剪枝后的模型,进行特征预测处理,得到预测特征信息;根据样本图像的标签信息和预测特征信息,确定剪枝后的模型的精度信息;根据剪枝后的模型的精度信息和当前剪枝信息,确定待剪枝信息;若待剪枝信息满足预设停止剪枝条件,将剪枝后的模型确定为目标图像处理模型。本发明可以减小目标图像处理模型的结构,减少目标图像处理模型所占资源,还可以保证剪枝后的网络模型的精度。

    目标对象的位置区域确定方法、装置、电子设备及存储介质

    公开(公告)号:CN111161314B

    公开(公告)日:2024-03-12

    申请号:CN201911298738.X

    申请日:2019-12-17

    Abstract: 本申请涉及目标对象的位置区域确定方法、装置、电子设备及存储介质,该方法通过获取图像序列;获取目标对象在图像序列的当前帧图像中的当前位置区域,并基于当前位置区域确定搜索区域;从当前位置区域确定第一特征信息;第一特征信息包括当前位置区域的语义信息;从搜索区域确定第二特征信息;第二特征信息包括搜索区域的语义信息;基于第一特征信息和第二特征信息确定相似程度值集合;从相似程度值集合确定目标相似程度值;基于目标相似程度值和当前位置区域的尺寸确定目标对象在下一帧图像中的位置区域。如此,通过学习到更高级的语义信息,可以提高对目标对象位置区域跟踪确定的准确度,可以提高目标对象的跟踪精度和鲁棒性。

    一种手部3D关键点的标注方法

    公开(公告)号:CN113326751B

    公开(公告)日:2024-02-13

    申请号:CN202110547828.9

    申请日:2021-05-19

    Abstract: 本发明涉及一种手部3D关键点的标注方法,包括:构建通用手部3D骨架模型;获取待标注手部每根手指均伸直的初始帧图像,构建待标注手部3D骨架模型;获取在不同手势下的若干待标注手部3D骨架姿态;获取待标注手部的当前帧图像以及当前帧图像的初始3D骨架姿态,在当前帧图像中标注出当前手部关键点的2D位置,确定当前帧图像的真实3D骨架姿态,获取当前帧图像中的手部3D关键点;对所述当前手部关键点的2D位置进行光流跟踪,获取下一帧图像的手部关键点的2D位置;重复上述步骤,直到所有图像的手部3D关键点均完成标注。本发明可以减少人工标注的工作量,从而降低人工成本并提高效率,同时可以提高标注精度。(56)对比文件Onur G. Guleryuz 等.Fast Lifting for3D Hand Pose Estimation in AR/VRApplications《.2018 25th IEEEInternational Conference on ImageProcessing (ICIP)》.2018,1-5.Jameel Malik 等.Simultaneous HandPose and Skeleton Bone-Lengths Estimationfrom a Single Depth Image《.arXiv:1712.03121》.2017,1-9.Christian Zimmermann 等.Learning toEstimate 3D Hand Pose from Single RGBImages《.arXiv:1705.01389》.2017,1-9.

    双目相机自标定方法及系统

    公开(公告)号:CN111862234B

    公开(公告)日:2023-10-20

    申请号:CN202010711704.5

    申请日:2020-07-22

    Abstract: 本发明提供一种双目相机自标定方法及系统,包括:1)获取左右原始图像;2)校正左右原始图像;3)从左右校正图像中提取特征点并匹配;4)统计左右图像纵坐标偏差的平均值,若大于对应阈值则修正估计第一参数组,反复迭代修正,直至小于对应阈值;5)找到静态物体;6)处于移动状态时,追踪静态物体的视差及车轮运动信息;7)得到车轮运动距离与静态物体的三维距离变化值的距离偏差,若大于对应阈值则修正估计第二参数组,反复迭代校正,直至小于对应阈值,完成自标定。本发明利用实时图像追踪和车体运动信息,对内外参进行优化标定,完成图像校正工作,为车体提供准确的三维识别数据。

    一种基于双目视觉系统的受电弓燃弧检测方法和装置

    公开(公告)号:CN116433639A

    公开(公告)日:2023-07-14

    申请号:CN202310419749.9

    申请日:2023-04-19

    Abstract: 本发明涉及一种基于双目视觉系统的受电弓燃弧检测方法和装置,其中,方法包括:采用双目相机对受电弓进行拍摄,获取双目图像,所述双目图像中包括受电弓与接触网;将所述双目图像送入第一yolov5目标检测模型中进行目标检测,得到受电弓与接触网的接触区域,以及受电弓与接触网的接触点;将所述双目图像送入第二yolov5目标检测模型中进行目标检测,检测出双目图像中的燃弧火花;对检测出双目图像中的燃弧火花进行三维重建,得到燃弧火花在空间的三维坐标;基于所述燃弧火花在空间的三维坐标计算所述燃弧火花和所述受电弓与接触网的接触点的距离,并根据距离滤除错误结果。本发明可以实现实时高精度的燃弧检测。

    一种移动机器人视听觉融合感知与导航方法

    公开(公告)号:CN116380061A

    公开(公告)日:2023-07-04

    申请号:CN202211614647.4

    申请日:2022-12-15

    Abstract: 本发明涉及一种移动机器人视听觉融合感知与导航方法,包括以下步骤:对移动机器人的视觉传感器系统与听觉传感器系统进行参数标定;利用视觉传感器系统和标定的参数构建导航栅格地图;使用视觉传感器系统获取交互对象的视频序列,并基于三维卷积和长短期记忆网络的手势识别方法,利用注意力机制和多尺度特征融合,实现以所述视频序列为输入的端到端手势行为识别;从所述视频序列中提取出感兴趣的目标对象并进行跟踪,并利用听觉传感器系统和视觉传感器系统得到具有显著性的目标对象的序列。本发明能够以更加智能和自然的方式与机器人导航系统进行交互。

    一种基于线结构光的无公共视场的多相机标定方法

    公开(公告)号:CN116342717A

    公开(公告)日:2023-06-27

    申请号:CN202310419747.X

    申请日:2023-04-19

    Abstract: 本发明涉及一种基于线结构光的无公共视场的多相机标定方法,包括:利用空间中至少3个不同方向的平面标定装置来标定每个相机的内部参数;调整激光平面,使空间标定装置在相邻两台相机的有效成像区域内接到清晰的激光线条,其中,每台相机的成像次数不少于两组;在拍到的激光线条图像中,提取激光线条的能量中心坐标,利用每台相机不少于两条激光直线在各自的相机坐标系内计算拟合平面;重复上述步骤,得到多组拟合平面参数;根据得到的多组拟合平面参数,利用平面共面约束,求解相机之间的初始相对位置关系,并通过LM优化算法提高标定精度。本发明能够用较低的成本、在更多的场景中提供高精度的标定结果。

    基于结构差异感知的类别级六自由度物体位姿估计方法

    公开(公告)号:CN116245940A

    公开(公告)日:2023-06-09

    申请号:CN202310052012.8

    申请日:2023-02-02

    Abstract: 本发明涉及一种基于结构差异感知的类别级六自由度物体位姿估计方法,包括:将深度图输入至目标检测分割网络进行识别,并根据识别结果得到物体实例的观测点云,并基于物体实例的观测点云选择目标物体对应的类别先验;提取观测点云和类别先验的特征,得到实例几何特征和类别几何特征;将实例几何特征和类别几何特征输入信息交互增强模块,得到增强的实例几何特征和类别几何特征;再通过所述语义动态融合模块进行语义和几何信息的融合,得到实例融合特征和类别融合特征;基于类别融合特征得到实例NOCS模型;通过匹配网络将实例NOCS模型和观测点云进行匹配,并根据相似性计算得到目标物体的6D位姿和大小。本发明能够提高6D位姿估计的准确性。

    一种实体之间关系特征信息的确定方法、装置、电子设备及存储介质

    公开(公告)号:CN110928959B

    公开(公告)日:2023-04-28

    申请号:CN201911028767.4

    申请日:2019-10-28

    Abstract: 本申请实施例所公开的一种实体之间关系特征信息的确定方法、装置、电子设备及存储介质,其中方法包括:接收任务请求,对任务请求进行解析,获取参考实体对,确定待识别对象中与参考实体对匹配的目标实体对集合,确定目标实体对集合中每个目标实体对包含的两个目标实体之间的相对方向信息和距离数据,基于关系数据模型对相对方向信息和距离数据进行处理,得到每个目标实体对的关系数据,根据关系查询库对关系数据进行查询,得到每个目标实体对的关系特征信息。本申请实施例,能够明确实体时间的关系界定,能够实现对场景的有效分析、认知与表达,辅助计算机以结构化的格式获悉更加丰富的场景理解信息,为实现计算机下一步操作的推理和决策奠定基础。

Patent Agency Ranking