引入空间对比信息的目标检测框提取方法、系统及设备

    公开(公告)号:CN115082713A

    公开(公告)日:2022-09-20

    申请号:CN202211016337.2

    申请日:2022-08-24

    Inventor: 杨明浩 蒋逸铭

    Abstract: 本发明属于图像识别领域,具体涉及了引入空间对比信息的目标检测框提取方法、系统及设备,旨在解决现有的目标检测方法在小样本的条件下进行目标检测的精度较低的问题。本发明包括:将预测边界框分为大目标边界框和小目标边界框;对于所述大目标边界框,根据预设的第一缩放系数生成多个第一候选框;对于所述小目标边界框,根据预设的第二缩放系数生成多个第二候选框;通过引入空间对比信息的孪生神经网络的目标检测框准确提取模型选取优选目标检测框。本发明通过对预测边界框进行二次判定,结合滑动窗口的思想,通过生成多个不同候选框的方式提取出目标的信息,再通过孪生网络计算出与目标最接近的边界框,进一步提升了小样本目标检测的精度。

    执行机构操作空间视觉信息确定方法及系统

    公开(公告)号:CN112541936A

    公开(公告)日:2021-03-23

    申请号:CN202011448839.3

    申请日:2020-12-09

    Inventor: 杨明浩 孙杨昌

    Abstract: 本发明涉及一种执行机构操作空间视觉信息确定方法及系统,所述视觉信息确定方法包括:获取关于执行机构操作空间的多个样本;其中,每一样本均包括光学图像、深度图像及三维坐标;根据各样本,建立视觉信息映射模型;具体包括:针对每一样本,根据目标物的光学图像、深度图像,确定目标像素位置信息;根据目标像素位置信息,确定二值掩码图像;基于各目标物的光学图像、深度图像、二值掩码图像及三维坐标,确定视觉信息映射模型;获取待测目标物的待测光学图像、待测深度图像;基于视觉信息映射模型,根据所述待测光学图像、待测深度图像,可快速确定所述待测目标物的三维坐标信息。

    一种基于多尺度时序建模的维度情感识别方法

    公开(公告)号:CN104361316B

    公开(公告)日:2017-04-19

    申请号:CN201410601169.2

    申请日:2014-10-30

    Abstract: 本发明公开了一种基于多尺度时序建模的维度情感识别方法,该方法包括以下步骤:对于视频序列中的每帧图像进行人脸检测及跟踪,并提取人脸关键点作为第一类组人脸特征;提取人脸区域图像、人脸嘴部区域图像和人脸眼睛区域图像中像素的灰度值作为第二、三、四类组人脸特征;根据单位时间段t内多帧图像的四类组人脸特征进行维度情感初步预测;根据连续N个单位时间段t的情感初步预测结果用线性回归器进行时序及模态融合,输出视频序列的情感预测值。本发明方法对视频序列信号进行不同尺度的时序建模,实现了序列中每一时序单元的精确预测。本发明适用于视频中人脸信号的情感识别,具有实时性好、并能够大幅度提高识别精度等优点。

    一种基于多尺度时序建模的维度情感识别方法

    公开(公告)号:CN104361316A

    公开(公告)日:2015-02-18

    申请号:CN201410601169.2

    申请日:2014-10-30

    Abstract: 本发明公开了一种基于多尺度时序建模的维度情感识别方法,该方法包括以下步骤:对于视频序列中的每帧图像进行人脸检测及跟踪,并提取人脸关键点作为第一类组人脸特征;提取人脸区域图像、人脸嘴部区域图像和人脸眼睛区域图像中像素的灰度值作为第二、三、四类组人脸特征;根据单位时间段t内多帧图像的四类组人脸特征进行维度情感初步预测;根据连续N个单位时间段t的情感初步预测结果用线性回归器进行时序及模态融合,输出视频序列的情感预测值。本发明方法对视频序列信号进行不同尺度的时序建模,实现了序列中每一时序单元的精确预测。本发明适用于视频中人脸信号的情感识别,具有实时性好、并能够大幅度提高识别精度等优点。

    一种互动娱乐商标广告的植入方法

    公开(公告)号:CN101388067B

    公开(公告)日:2012-02-08

    申请号:CN200710121661.X

    申请日:2007-09-12

    Abstract: 本发明属于模式识别技术和数字互动娱乐领域,基于计算机视觉和图像处理技术的新型数字互动娱乐商标广告方法,把模式识别和统计学习技术运用于交互游戏中的商标广告,包括步骤:选取正负样本;标定正样本;用统计学习的方法训练正负样本;根据训练结果生成瀑布型级联分类器;根据分类器识别视频中的商标。本发明数字互动娱乐商标广告方法改变了传统的单一广告模式,利用最新的计算机视觉与图像处理技术实现商标的自动检测和识别,将广告与游戏同步,并且广告过程需要用户的参与,实时、鲁棒、趣味性强,并且易于实现和操作。本发明不仅可以扩大游戏的增值渠道,而且使游戏更具交互性和沉浸感。

    用于果蔬采摘的机械手及采摘机器人

    公开(公告)号:CN119817330A

    公开(公告)日:2025-04-15

    申请号:CN202510147511.4

    申请日:2025-02-11

    Inventor: 杨明浩 朱辰炜

    Abstract: 本发明提供了一种用于果蔬采摘的机械手及采摘机器人,涉及农业自动化技术领域,该机械手包括:壳体;抓握组件,抓握组件的第一端位于壳体内,抓握组件的第二端从壳体向外伸出;传动组件,安装在壳体内,抓握组件的第一端安装在传动组件上;第一驱动组件,安装在壳体内,适用于驱动传动组件在第一轴线上往复运动,使得抓握组件的第一端驱动位于壳体外的第二端夹持或释放球形或类球形的果蔬;以及第二驱动组件,安装在壳体内,适用于在抓握组件夹持果蔬的情况下,通过传动组件驱动抓握组件绕第一轴线多圈旋转,使果蔬与果梗分离。

    引入空间对比信息的目标检测框提取方法、系统及设备

    公开(公告)号:CN115082713B

    公开(公告)日:2022-11-25

    申请号:CN202211016337.2

    申请日:2022-08-24

    Inventor: 杨明浩 蒋逸铭

    Abstract: 本发明属于图像识别领域,具体涉及了引入空间对比信息的目标检测框提取方法、系统及设备,旨在解决现有的目标检测方法在小样本的条件下进行目标检测的精度较低的问题。本发明包括:将预测边界框分为大目标边界框和小目标边界框;对于所述大目标边界框,根据预设的第一缩放系数生成多个第一候选框;对于所述小目标边界框,根据预设的第二缩放系数生成多个第二候选框;通过引入空间对比信息的孪生神经网络的目标检测框准确提取模型选取优选目标检测框。本发明通过对预测边界框进行二次判定,结合滑动窗口的思想,通过生成多个不同候选框的方式提取出目标的信息,再通过孪生网络计算出与目标最接近的边界框,进一步提升了小样本目标检测的精度。

    高分辨率图像目标检测方法及系统

    公开(公告)号:CN112541431B

    公开(公告)日:2022-09-30

    申请号:CN202011455217.3

    申请日:2020-12-10

    Inventor: 杨明浩 黄雷

    Abstract: 本发明涉及一种高分辨率图像目标检测方法及系统,所述检测方法包括:根据待检高分辨率图像的尺寸,确定分块基准比例大小;根据所述待检高分辨率图像的尺寸、分块基准比例大小,以及待检目标的最大尺寸,对待检高分辨率图像进行分块,得到多个基准块图像;针对每一基准块图像,通过检测设备检测基准块图像中的目标,确定检测时间;根据各检测时间及各基准块图像,确定分块效率函数;根据分块效率函数,确定最优分块比例;根据最优分块比例,对所述待检高分辨率图像进行二次分块,得到多个子图像;通过检测设备检测,可快速、准确的确定各子图像中目标,使得检测设备的硬件资源的利用率最高。

    基于图像分块的超分辨率增强小目标检测方法

    公开(公告)号:CN115082775A

    公开(公告)日:2022-09-20

    申请号:CN202210888803.X

    申请日:2022-07-27

    Inventor: 杨明浩 黄雷

    Abstract: 本发明属于目标检测领域,具体涉及一种基于图像分块的超分辨率增强小目标检测方法、系统、设备,旨在解决解决现有的小目标检测方法检测准确率较低的问题。本方法包括:获取待进行小目标检测的场景图像,作为输入图像;计算输入图像分块时标准块的宽高;得到输入图像在水平方向、垂直方向上分块的步长;对输入图像进行填充,并对填充后的输入图像进行分块,得到输入图像分块后各图像块;采用预训练的超分别率模型对得到的各图像块进行图像增强,增强后,输入训练好的目标检测模型,得到输入图像中各图像块中小目标物体对应的矩形区域,并进行回归、非极大值抑制处理,进而得到检测结果。本发明提高了小目标检测的准确率。

    面向执行器操作空间的RGBD视觉实时重建方法及系统

    公开(公告)号:CN113269859A

    公开(公告)日:2021-08-17

    申请号:CN202110642486.9

    申请日:2021-06-09

    Abstract: 本发明属于视觉信息实时重建领域,具体涉及了一种面向执行器操作空间的RGBD视觉实时重建方法及系统,旨在解决现有技术实时性低、对人工辅助标定依赖性大、对环境变化适应性低的问题。本发明包括:对执行器操作空间环境下获得的RGB图像物体轮廓进行分割;采用基于深度神经网络的投影方法,将在RGB和深度图像中的物体轮廓映射到执行器操作空间,采用距离限制的离群点消除策略减少重建误差;对RGB轮廓进行Delaunay三角形剖分,并根据RGB图像到执行器操作空间的映射关系按照三角形纹理贴图的方式将剖分后的图像的纹理贴到三维物体轮廓上,完成物体信息的重建。本发明不需要计算摄像机内外参,并且重建速度快、实时性强,无需人工辅助标定,对环境变化适应性强。

Patent Agency Ranking