一种目标检测方法、装置及电子设备

    公开(公告)号:CN111767935B

    公开(公告)日:2023-09-05

    申请号:CN201911056322.7

    申请日:2019-10-31

    Abstract: 本发明实施例提供了一种目标检测方法、装置及电子设备。其中,所述方法包括:获取待处理图像在多个降采样倍率下的多个初始图像特征;针对除目标降采样倍率外其他降采样倍率下的各个初始图像特征,将该初始图像特征缩放至所述目标降采样倍率,得到映射图像特征;融合所述目标降采样倍率下的初始图像特征和各个所述映射图像特征,得到所述目标降采样倍率下的融合图像特征;将所述目标降采样倍率下的融合图像特征缩放至各个所述其他降采样倍率,得到各个所述其他降采样倍率下的融合图像特征;基于所述待处理图像在所述多个降采样倍率下的融合图像特征,对所述待处理图像进行目标检测。可以提高目标检测的准确性。

    抓取点预测模型训练方法、物体抓取点确定方法及装置

    公开(公告)号:CN115984668A

    公开(公告)日:2023-04-18

    申请号:CN202310015157.0

    申请日:2023-01-04

    Abstract: 本申请提供一种抓取点预测模型训练方法、物体抓取点确定方法及装置,涉及计算机视觉技术领域,该抓取点预测模型训练方法包括:获取训练图片;将训练图片输入目标神经网络模型的图像特征提取模型,得到图像特征信息;将图像特征信息输入实例特征生成模型,得到实例特征信息;生成实例特征信息的位置参考点信息;将实例特征信息输入抓取点生成模型,得到预测抓取点信息,利用预测抓取点信息、二维抓取点位置标注信息和位置参考点信息生成损失函数;利用损失函数调整目标神经网络模型,得到抓取点预测模型。本发明通过实例特征信息的位置参考点信息,减小抓取点的预测搜索范围,提高抓取点预测模型训练的效率。

    一种端到端多人姿态估计方法和装置

    公开(公告)号:CN115131820A

    公开(公告)日:2022-09-30

    申请号:CN202210658293.7

    申请日:2022-06-10

    Inventor: 石大虎 李亮奇

    Abstract: 本申请实施例公开了一种端到端多人姿态估计方法和装置。本申请可以将已获得的原始图像对应的降采样特征图输入至视觉特征编码器,以得到多尺度融合特征,然后将多尺度融合特征输入至姿态解码器,从多尺度融合特征中解码出包含候选姿态的姿态信息,然后将姿态信息、以及多尺度融合特征输入至关节点解码器,实现对候选姿态中的关节点的微调以得到目标姿态。本方案不需要将多人姿态估计先转换为单人姿态估计,降低了多人姿态估计的计算量,以及本申请提供的方案不需要单独设置的需要先验性信息的图神经网络对姿态估计的结果进行精调,提高了姿态估计的效率,以及由于本方案姿态解码器和关节点解码器可以通过自学习实现端到端的优化。

    图像分类模型训练方法、图像分类方法、装置及电子设备

    公开(公告)号:CN117058458A

    公开(公告)日:2023-11-14

    申请号:CN202311102196.0

    申请日:2023-08-29

    Inventor: 李亮奇 石大虎

    Abstract: 本申请实施例提供了图像分类模型训练方法、图像分类方法、装置及电子设备,电子设备获取多个图像集,将类别文本输入文本编码器,获得文本特征向量,作为图像语义向量标签,将样本图像输入初始图像分类模型,提取预测图像特征向量,基于预测图像特征向量与图像语义向量标签的差异,对初始图像分类模型训练,得到图像分类模型。由于文本特征向量根据类别文本的语义确定,因此所表达语义相近的类别文本对应的文本特征向量在特征空间中距离接近,反之语义不同的类别文本对应的文本特征向量在特征空间中相互远离,从而无需人工分析不同类别间的关系。由于采用多个图像集训练一个模型,而不需要分别训练多个模型,可以提高模型训练效率,降低资源消耗。

    图像处理方法、装置、设备及存储介质

    公开(公告)号:CN111860543A

    公开(公告)日:2020-10-30

    申请号:CN202010725910.1

    申请日:2020-07-24

    Inventor: 石大虎 谭文明

    Abstract: 本申请实施例公开了一种图像处理方法、装置、设备及存储介质,属于图像处理技术领域。该方法应用于电子设备中,电子设备能够用于运行神经网络模型,神经网络模型包括卷积层和归一化层,归一化层位于卷积层之后,该方法包括:在对神经网络模型进行训练的过程中,确定归一化层的上一层所输出的多个第一特征图的通道数,多个第一特征图至少由卷积层经过卷积处理;基于通道数和多个第一特征图,确定多组第一数值,每组第一数值包括多个第一特征图在至少两个通道上的像素值,且各个组包括的通道互不相同;基于多组第一数值,对多个第一特征图进行归一化处理。本申请实施例可以保证归一化处理的数据统计量,使得精度较高,从而保证了图像处理效果。

    一种目标检测神经网络训练方法和装置

    公开(公告)号:CN111353597A

    公开(公告)日:2020-06-30

    申请号:CN201811582168.2

    申请日:2018-12-24

    Abstract: 本申请实施例提供了一种目标检测神经网络训练方法和装置。其中,方法包括:利用所述特征提取子网络对样本视频中参考视频帧进行处理,以基于所述参考视频帧与关键视频帧之间的变换关系,计算所述关键视频帧的图像特征,得到预估图像特征,所述参考视频帧为所述样本视频中未经过标定的视频帧,所述样本视频为所述样本视频中经过标定的视频帧;利用所述检测子网络对所述预估图像特征进行处理,得到预测结果;基于所述预测结果与所述关键视频帧的标定结果之间的误差计算损失,对所述目标检测神经网络的网络参数进行调整。可以在不增加因标定带来的工作量的情况下,提高经过训练的目标检测神经网络的准确性。

    目标检测方法、装置及存储介质

    公开(公告)号:CN111783797B

    公开(公告)日:2023-08-18

    申请号:CN202010610242.8

    申请日:2020-06-30

    Abstract: 本发明实施例提供一种目标检测方法、装置及存储介质,通过对待检测图像进行特征提取和特征融合,得到多张不同尺度的第一特征图,分别对多张不同尺度的第一特征图进行目标检测,得到第一目标检测结果。通过对第一目标检测结果中的各目标框对应的类别分数信息进行修正,得到修正后的第二目标检测结果。再对第二目标检测结果中的各目标框进行非极大值抑制,确定最终的目标检测结果。上述方法可有效降低相近类别之间的误检,提高目标检测的准确性。

    一种目标检测方法、装置及电子设备

    公开(公告)号:CN111767935A

    公开(公告)日:2020-10-13

    申请号:CN201911056322.7

    申请日:2019-10-31

    Abstract: 本发明实施例提供了一种目标检测方法、装置及电子设备。其中,所述方法包括:获取待处理图像在多个降采样倍率下的多个初始图像特征;针对除目标降采样倍率外其他降采样倍率下的各个初始图像特征,将该初始图像特征缩放至所述目标降采样倍率,得到映射图像特征;融合所述目标降采样倍率下的初始图像特征和各个所述映射图像特征,得到所述目标降采样倍率下的融合图像特征;将所述目标降采样倍率下的融合图像特征缩放至各个所述其他降采样倍率,得到各个所述其他降采样倍率下的融合图像特征;基于所述待处理图像在所述多个降采样倍率下的融合图像特征,对所述待处理图像进行目标检测。可以提高目标检测的准确性。

    一种光流神经网络训练方法及装置

    公开(公告)号:CN111311646A

    公开(公告)日:2020-06-19

    申请号:CN201811518482.4

    申请日:2018-12-12

    Abstract: 本申请实施例提供了一种光流神经网络训练方法及装置。其中,方法包括:将样本图像帧和所述样本图像帧的相邻图像帧输入第一神经网络和第二神经网络,得到所述第一神经网络输出的第一稠密光流和所述第二神经网络输出的第二稠密光流,所述第一神经网络为预先经过训练的光流神经网络,所述第二神经网络为模型复杂度低于所述第一神经网络的光流神经网络;基于所述第一稠密光流与所述第二稠密光流之间的偏差,调整所述第二神经网络的网络参数。选用本申请实施例,由于第二神经网络能够学习到第一神经网络已经学习到的图像对到稠密光流的映射关系,可以使得第二神经网络的性能逼近于模型复杂度更高的第一神经网络。

Patent Agency Ranking