一种基于外观与形态解耦的长时期跨摄像头目标关联方法及系统

    公开(公告)号:CN114092873A

    公开(公告)日:2022-02-25

    申请号:CN202111271643.6

    申请日:2021-10-29

    Inventor: 刘宏 石伟 丁润伟

    Abstract: 本发明涉及一种基于外观与形态解耦的长时期跨摄像头目标关联方法及系统。该方法对输入的训练图像通过人体稠密解析估计和边缘估计提取人体轮廓图像,求取训练图像与人体轮廓图像的残差,得到人体外观图像;利用形态表征模型对人体轮廓图像进行高级语义特征提取,利用外观表征模型对人体外观图像进行高级语义特征提取;利用三元组损失函数和识别损失函数训练外观表征模型和形态表征模型,采用学习的两个表征模型对待查询行人图像和候选行人图像提取形态特征和外观特征,通过计算相似性得分得到跨摄像头场景中的关联目标。本发明不需要采用复杂的对抗学习模型就能提取行人的形态信息,并可避免挖掘涉及隐私的人脸信息及不可靠的行人步态信息。

    一种基于深度神经网络和卷积神经网络的双耳声源定位方法和系统

    公开(公告)号:CN110517705B

    公开(公告)日:2022-02-18

    申请号:CN201910808413.5

    申请日:2019-08-29

    Abstract: 本发明公开了一种基于深度神经网络和卷积神经网络的双耳声源定位方法和系统,首先对双耳声音信号提取双耳能量差和互相关函数;接着将提取的双耳能量差和互相关函数输入训练完成的级联神经网络,在深度神经网络分支中判别声音源的方向,在卷积神经网络中提取声音源前后向区分的细节信息,得出声音源在机器人头部前半平面或后半平面的信息;最后,综合深度神经网络和卷积神经网络的输出结果,得出最终的定位结果。本发明能够在一定程度上抵抗噪声和混响的干扰,完成声源前后向及角度的判别问题,实现全向声源定位。

    基于小目标搜索缩放技术的水下目标检测方法和系统

    公开(公告)号:CN112419227A

    公开(公告)日:2021-02-26

    申请号:CN202011096905.5

    申请日:2020-10-14

    Abstract: 本发明涉及一种基于小目标搜索缩放技术的水下目标检测方法和系统。该方法的步骤为:将待检测图片输入至目标检测网络Faster‑RCNN+FPN,得到第一检测结果;提取FPN中特征图的热力图,并提取FPN中特征图的边缘图,将热力图和边缘图进行结合,得到综合热力图;在综合热力图上进行搜索,找到激活值之和最大的窗口,提取待检测图片中该窗口内的图片并输入目标检测网络,得到第二检测结果;将第一检测结果和第二检测结果进行决策融合,得到最终的目标检测结果。本发明通过分析FPN激活值对原图进行缩放,关注密集小目标部分,从而进行多尺度推断,能够提高模型对小目标的检测能力。

    基于在线初始化梯度增强回归树的目标跟踪方法及系统

    公开(公告)号:CN103226835B

    公开(公告)日:2016-01-27

    申请号:CN201310130189.1

    申请日:2013-04-15

    Abstract: 本发明涉及一种基于在线初始化梯度增强回归树的目标跟踪方法及系统,在视频输入端、跟踪目标输出端以及在线训练分类器构成的系统中,方法步骤为:1)在视频序列中选择跟踪目标,提取类Haar特征的正负样本;2)根据所述正负样本随机建立在线分类器得到训练残差;3)将所述训练残差作为在线分类器的训练样本进行训练修正,建立目标模型;4)从下一帧视频图像获取图像置信图,目标窗口确定置信值最大的位置,完成跟踪。本发明使得其能够快速收敛到最优点,完成对随机森林检测的优化,并且通过在线学习实现分类器的更新,很好地解决了目标外观变化、快速运动以及遮挡等问题。

    基于在线初始化梯度增强回归树的目标跟踪方法及系统

    公开(公告)号:CN103226835A

    公开(公告)日:2013-07-31

    申请号:CN201310130189.1

    申请日:2013-04-15

    Abstract: 本发明涉及一种基于在线初始化梯度增强回归树的目标跟踪方法及系统,在视频输入端、跟踪目标输出端以及在线训练分类器构成的系统中,方法步骤为:1)在视频序列中选择跟踪目标,提取类Haar特征的正负样本;2)根据所述正负样本随机建立在线分类器得到训练残差;3)将所述训练残差作为在线分类器的训练样本进行训练修正,建立目标模型;4)从下一帧视频图像获取图像置信图,目标窗口确定置信值最大的位置,完成跟踪。本发明使得其能够快速收敛到最优点,完成对随机森林检测的优化,并且通过在线学习实现分类器的更新,很好地解决了目标外观变化、快速运动以及遮挡等问题。

    一种基于加权模板匹配的双耳声源定位方法和装置

    公开(公告)号:CN112731289B

    公开(公告)日:2024-05-07

    申请号:CN202011456914.0

    申请日:2020-12-10

    Abstract: 本发明公开了一种基于加权模板匹配的双耳声源定位方法和装置。在训练阶段,首先从训练数据中提取不同方向的双耳互相关函数和双耳强度差,为提取的各个方向的双耳互相关函数和双耳强度差建立模板;然后通过梯度下降法训练不同方向、不同频带的权重值。在线定位阶段,同样首先对信号提取特征,接着在不同特征和不同频带上将所提取的特征与各个方向的模板进行相似度匹配,最后通过加权融合不同特征不同频带的相似度,得到最终的声源方向相似度,取最大相似度方向为声源方向。实验在不同种类噪声环境下进行,实验结果表明本发明可以在一定程度上抵抗噪声的干扰,实现声源的角度定位问题。

    基于主动跟踪和自适应手势识别的交接方法、装置及设备

    公开(公告)号:CN117576787A

    公开(公告)日:2024-02-20

    申请号:CN202410060569.0

    申请日:2024-01-16

    Abstract: 本申请公开了一种基于主动跟踪和自适应手势识别的交接方法、装置及设备,方法包括通过机器人安装的深度相机采集视频图像;基于视频图像通过媒体管道获取相机坐标系下的第一手部地标;将第一手部地标转换至预设的世界坐标系以得到第二手部地标;将第二手部地标输入经过训练的手势识别模型,通过手势识别模型确定所述视频图像对应的用户手势;通过机器人将交互对象交互给用户。本申请实施例通过使用包括媒体管道提示手部地标和通过手势识别模型识别用户手势的两阶段方法,在面对不同物体和不同照明条件时均能准确识别到用户手势,提高了人机交互的准确性,确保了与人类抓握一致的平稳和自然的交接过程。

    基于视觉语言模型的三维人体行为识别网络训练方法

    公开(公告)号:CN117576786A

    公开(公告)日:2024-02-20

    申请号:CN202410059351.3

    申请日:2024-01-16

    Abstract: 本申请公开了一种基于视觉语言模型的三维人体行为识别网络训练方法,方法包括将点云视频输入四维点云编码器确定点云特征嵌入;将RGB视频和文本数据输入视觉语言模型确定视频特征嵌入和文本特征嵌入;基于点云特征嵌入、文本特征嵌入及视频特征嵌入确定对齐损失项,基于点云特征嵌入确定第一分类损失项,基于视频特征嵌入确定第二分类损失项;基于对齐损失项、第一分类损失项和第二分类损失项对初始三维人体行为识别网络进行训练,以得到三维人体行为识别网络。本申请通过将点云特征嵌入分别与视频特征嵌入和文本特征嵌入对齐,来从大规模图像-文本对的训练中学习共享的视觉和文本空间,提高了三维人体行为识别网络的模型性能。

    基于小目标搜索缩放技术的水下目标检测方法和系统

    公开(公告)号:CN112419227B

    公开(公告)日:2024-02-20

    申请号:CN202011096905.5

    申请日:2020-10-14

    Abstract: 本发明涉及一种基于小目标搜索缩放技术的水下目标检测方法和系统。该方法的步骤为:将待检测图片输入至目标检测网络Faster‑RCNN+FPN,得到第一检测结果;提取FPN中特征图的热力图,并提取FPN中特征图的边缘图,将热力图和边缘图进行结合,得到综合热力图;在综合热力图上进行搜索,找到激活值之和最大的窗口,提取待检测图片中该窗口内的图片并输入目标检测网络,得到第二检测结果;将第一检测结果和第二检测结果进行决策融合,得到最终的目标检测结果。本发明通过分析FPN激活值对原图进行缩放,关注密集小目标部分,从而进行多尺度推断,能够提高模型对小目标的检测能力。

Patent Agency Ranking