一种图像识别方法、装置及电子设备

    公开(公告)号:CN111767934B

    公开(公告)日:2023-11-03

    申请号:CN201911054684.2

    申请日:2019-10-31

    Inventor: 石大虎

    Abstract: 本发明实施例提供了一种图像识别方法、装置及电子设备。其中,所述方法包括:获取待识别图像在多个不同降采样倍率下的多个图像特征;针对所述多个不同降采样倍率中的每个降采样倍率,融合所述多个图像特征在该降采样倍率下的投影,得到所述待识别图像在该将降采样倍率下的融合特征;根据所述待识别图像在所有降采样倍率下的融合特征,确定所述待识别图像的识别结果。可以通过融合不同采样倍率下的图像特征,得到同时包括较完整的纹理信息和语义信息的融合特征,因此该融合特征可以适用于多种不同的图像识别任务,即可以通过同一个流程完成不同的图像识别任务,因此简化了图像识别流程。

    基于视频的目标检测方法、装置、设备及存储介质

    公开(公告)号:CN111860064B

    公开(公告)日:2023-10-20

    申请号:CN201910360492.8

    申请日:2019-04-30

    Inventor: 石大虎 谭文明

    Abstract: 本申请公开了一种基于视频的目标检测方法、装置、设备及存储介质,属于目标检测技术领域。所述方法包括:获取待检测视频中的连续N帧视频图像,该N为大于1的整数;调用目标检测模型,该目标检测模型至少包括三维卷积层和目标检测层,该三维卷积层用于将该N帧视频图像的特征进行卷积融合,该目标检测层用于基于卷积融合后得到的目标特征图检测出视频图像中的目标;将该N帧视频图像输入至该目标检测模型中进行处理,输出目标检测结果。本申请基于特征关联后的目标特征图进行目标检测不仅可以保证检测的准确性,即避免漏检和误检的情况,而且还可以避免需要人工设计不同的规则,提高了目标检测的适应性。

    物体感知方法、装置及电子设备
    13.
    发明公开

    公开(公告)号:CN115471707A

    公开(公告)日:2022-12-13

    申请号:CN202211177495.6

    申请日:2022-09-26

    Inventor: 李亮奇 石大虎

    Abstract: 本申请实施例提供一种物体感知方法、装置及电子设备。在本实施例中,通过目标物体感知模型从待检测图像中划分出候选对象区域并输出候选对象区域对应的视觉特征(非文本特征)、以及大规模视觉语言预训练模型输出的各候选类别(预先设定好的类别)对应的文本特征,来确定候选对象区域中候选对象所属的目标类别,实现了基于大规模视觉语言预训练实现物体感知;基于如上描述的大规模视觉语言预训练模型输出的各候选类别对应的文本特征,这相当于借助大规模视觉语言预训练模型的先验知识(预先设定好的候选类别对应的文本特征),并结合大规模视觉语言预训练模型超大范围的感知能力,提高了最终物体感知结果(也即候选对象所属的目标类别)的准确度。

    图像处理方法、装置及设备

    公开(公告)号:CN111784555A

    公开(公告)日:2020-10-16

    申请号:CN202010549772.6

    申请日:2020-06-16

    Inventor: 石大虎 谭文明

    Abstract: 本发明提供一种图像处理方法、装置及设备,可提高对具有一定并行度的应用平台的利用率。该方法包括:获得待处理的目标图像;确定目标图像对应的N个目标特征图;将N个目标特征图输入至神经网络,得到图像处理结果;神经网络包括N个特征处理子网络和图像处理子网络;N个特征处理子网络对目标特征图进行处理并输出特征处理结果至图像处理子网络;N个特征处理子网络中的至少一个包括分组卷积层,每一分组卷积层包括多个并联的卷积层、且各卷积层对应的输入通道数相同;N个特征处理子网络对应的输入通道数相同、且由一个分组卷积层对应的输入通道数确定;图像处理子网络用于对输入的特征处理结果进行图像处理得到图像处理结果。

    目标检测方法、装置及存储介质

    公开(公告)号:CN111783797A

    公开(公告)日:2020-10-16

    申请号:CN202010610242.8

    申请日:2020-06-30

    Abstract: 本发明实施例提供一种目标检测方法、装置及存储介质,通过对待检测图像进行特征提取和特征融合,得到多张不同尺度的第一特征图,分别对多张不同尺度的第一特征图进行目标检测,得到第一目标检测结果。通过对第一目标检测结果中的各目标框对应的类别分数信息进行修正,得到修正后的第二目标检测结果。再对第二目标检测结果中的各目标框进行非极大值抑制,确定最终的目标检测结果。上述方法可有效降低相近类别之间的误检,提高目标检测的准确性。

    目标检测模型的训练方法、装置和存储介质

    公开(公告)号:CN111753870A

    公开(公告)日:2020-10-09

    申请号:CN202010298486.7

    申请日:2020-04-16

    Abstract: 本申请实施例提出了一种目标检测模型的训练方法、装置和存储介质,其中,上述方法包括:获取训练样本;将所述训练样本输入至预置目标检测模型进行训练,得到第一梯度;根据预置第一区间数对所述第一梯度进行不均匀划分,得到第一区间集合,并根据所述第一区间集合内的每个区间的样本数获得所述每个区间的第一梯度密度,其中,所述第一区间集合包括多个不均匀的区间;根据所述第一梯度密度对所述预置目标检测模型继续进行训练,得到训练后的目标检测模型。本申请通过对训练样本的梯度进行不均匀划分,可以有效解决训练样本不均衡问题,从而可以提高模型的检测性能。

    一种目标检测神经网络训练方法和装置

    公开(公告)号:CN111353597B

    公开(公告)日:2023-12-05

    申请号:CN201811582168.2

    申请日:2018-12-24

    Abstract: 本申请实施例提供了一种目标检测神经网络训练方法和装置。其中,方法包括:利用所述特征提取子网络对样本视频中参考视频帧进行处理,以基于所述参考视频帧与关键视频帧之间的变换关系,计算所述关键视频帧的图像特征,得到预估图像特征,所述参考视频帧为所述样本视频中未经过标定的视频帧,所述样本视频为所述样本视频中经过标定的视频帧;利用所述检测子网络对所述预估图像特征进行处理,得到预测结果;基于所述预测结果与所述关键视频帧的标定结果之间的误差计算损失,对所述目标检测神经网络的网络参数进行调整。可以在不增加因标定带来的工作量的情况下,提高经过训练的目标检

    图像处理方法、装置及设备

    公开(公告)号:CN111784555B

    公开(公告)日:2023-08-25

    申请号:CN202010549772.6

    申请日:2020-06-16

    Inventor: 石大虎 谭文明

    Abstract: 本发明提供一种图像处理方法、装置及设备,可提高对具有一定并行度的应用平台的利用率。该方法包括:获得待处理的目标图像;确定目标图像对应的N个目标特征图;将N个目标特征图输入至神经网络,得到图像处理结果;神经网络包括N个特征处理子网络和图像处理子网络;N个特征处理子网络对目标特征图进行处理并输出特征处理结果至图像处理子网络;N个特征处理子网络中的至少一个包括分组卷积层,每一分组卷积层包括多个并联的卷积层、且各卷积层对应的输入通道数相同;N个特征处理子网络对应的输入通道数相同、且由一个分组卷积层对应的输入通道数确定;图像处理子网络用于对输入的特征处理结果进行图像处理得到图像处理结果。

    目标检测模型的训练方法、装置和存储介质

    公开(公告)号:CN111753870B

    公开(公告)日:2023-08-18

    申请号:CN202010298486.7

    申请日:2020-04-16

    Abstract: 本申请实施例提出了一种目标检测模型的训练方法、装置和存储介质,其中,上述方法包括:获取训练样本;将所述训练样本输入至预置目标检测模型进行训练,得到第一梯度;根据预置第一区间数对所述第一梯度进行不均匀划分,得到第一区间集合,并根据所述第一区间集合内的每个区间的样本数获得所述每个区间的第一梯度密度,其中,所述第一区间集合包括多个不均匀的区间;根据所述第一梯度密度对所述预置目标检测模型继续进行训练,得到训练后的目标检测模型。本申请通过对训练样本的梯度进行不均匀划分,可以有效解决训练样本不均衡问题,从而可以提高模型的检测性能。

    一种光流神经网络训练方法及装置

    公开(公告)号:CN111311646B

    公开(公告)日:2023-04-07

    申请号:CN201811518482.4

    申请日:2018-12-12

    Abstract: 本申请实施例提供了一种光流神经网络训练方法及装置。其中,方法包括:将样本图像帧和所述样本图像帧的相邻图像帧输入第一神经网络和第二神经网络,得到所述第一神经网络输出的第一稠密光流和所述第二神经网络输出的第二稠密光流,所述第一神经网络为预先经过训练的光流神经网络,所述第二神经网络为模型复杂度低于所述第一神经网络的光流神经网络;基于所述第一稠密光流与所述第二稠密光流之间的偏差,调整所述第二神经网络的网络参数。选用本申请实施例,由于第二神经网络能够学习到第一神经网络已经学习到的图像对到稠密光流的映射关系,可以使得第二神经网络的性能逼近于模型复杂度更高的第一神经网络。

Patent Agency Ranking