一种基于多层级分类分支的目标检测方法及系统

    公开(公告)号:CN118038133A

    公开(公告)日:2024-05-14

    申请号:CN202410067260.4

    申请日:2024-01-17

    Abstract: 本发明涉及一种基于多层级分类分支的目标检测方法及系统。其中的目标检测方法包括以下步骤:获取待测样本;利用基于多层级分类分支的目标检测模型对所述待测样本进行检测,获得目标检测结果;所述基于多层级分类分支的目标检测模型包括:特征提取模块,用来提取所述待测样本的特征向量;特征融合模块,用来对所述特征向量进行特征融合获得融合特征向量;预测模块,用来根据所述融合特征向量生成目标检测框和与所述目标检测框对应的多个层级的分类结果,并将所述多个层级的分类结果进行融合计算得到最终分类结果。在现有深度学习的目标检测网络的基础上,通过增加多层级分类分支预测结果的融合计算,有效提升其分类及识别能力。

    一种结合语义边缘的深度估计方法

    公开(公告)号:CN114882091B

    公开(公告)日:2024-02-13

    申请号:CN202210476348.2

    申请日:2022-04-29

    Abstract: 分类模块用于进行深度边缘语义分类预测;所述本发明涉及一种结合语义边缘的深度估计 语义边缘检测模块用于输出图像的语义边缘分方法,包括:获取待深度估计的图像;将所述图像 类预测。本发明能够提高准确度。输入至训练好的深度学习网络中得到深度预测图和语义边缘预测图;所述深度学习网络包括:共享特征提取模块、深度估计模块、边缘增强权重模块、深度边缘语义分类模块和语义边缘检测模块;所述共享特征提取模块用于提取所述图像中的特征信息,并传输给所述深度估计模块和语义边缘检测模块;所述深度估计模块通过所述语义边缘检测模块输出的语义边缘引导视差平滑,并通过图像双重构的方式进行深度估计;所述边缘增强权重模块基于所述深度估计模块输出的(56)对比文件Jing Liu 等.CollaborativeDeconvolutional Neural Networks for JointDepth Estimation and SemanticSegmentation《.IEEE TRANSACTIONS ON NEURALNETWORKS AND LEARNING SYSTEMS》.2018,第第29卷卷(第第11期期),5655-5666.

    一种基于遮挡物体检测及运动连续性的光流估计方法

    公开(公告)号:CN117495919A

    公开(公告)日:2024-02-02

    申请号:CN202311561532.8

    申请日:2023-11-22

    Abstract: 本发明涉及一种基于遮挡物体检测及运动连续性的光流估计方法,包括:接收连续的两帧图像;将连续的两帧图像输入至光流估计模型中,得到光流估计值;其中,光流估计模型包括:特征提取部分提取连续的两帧图像的图像特征和上下文特征;匹配部分基于连续的两帧图像的图像特征计算相关像素点匹配,得到4D代价体;遮挡点估计部分对4D代价体进行特征相似度判断函数处理并通过卷积网络得到遮挡点;关联优化部分根据遮挡点估计出潜在匹配位置,并与4D代价体给出的位置计算对比整合,得到优化后的4D代价体;迭代优化部分根据优化后的4D代价体与上下文特征进行迭代优化,得到光流估计值。本发明能够提升光流估计精度。

    一种基于迭代学习的半监督人眼多要素分割方法

    公开(公告)号:CN115116123A

    公开(公告)日:2022-09-27

    申请号:CN202210497450.0

    申请日:2022-05-09

    Abstract: 本发明涉及一种基于迭代学习的半监督人眼多要素分割方法,包括以下步骤:将可见光下眼部数据集划分为有标签眼部数据集和无标签眼部数据集;基于有标签眼部数据集利用有监督深度学习网络进行训练,得到预训练模型;基于预训练模型通过前向推理获取无标签眼部数据集的伪标签;基于有标签眼部数据集对无标签眼部数据集和伪标签进行筛选,得到信任数据集;将有标签眼部数据集和信任数据集输入至有监督深度学习网络进行再训练,若未达到训练完成要求,则返回上述的伪标签获取步骤,否则结束训练得到人眼分割模型;采用人眼分割模型对人眼进行多要素分割。本发明能够在使用少量标签数据的情况下,提升模型的精度和鲁棒性。

    一种三维语义地图的构建方法、装置、电子设备及存储介质

    公开(公告)号:CN111190981B

    公开(公告)日:2020-11-06

    申请号:CN201911354167.7

    申请日:2019-12-25

    Abstract: 本申请涉及一种三维语义地图的构建方法、装置、电子设备及存储介质,该方法通过获取环境图像集合,并根据已训练的语义分割模型对环境图像集合进行语义分割,得到语义图像序列。将语义图像序列的每帧语义图像投射到预先建立的三维坐标系上,得到第一点云集合,第一点云集合中的第一点云对应每帧语义图像。对第一点云集合进行滤波,得到滤波后的第一点云集合;对滤波后的第一点云集合中的第一点云进行聚类处理,得到第二点云集合;对第二点云集合进行滤波,得到三维语义地图。本申请将彩色图像序列和深度图像序列结合作为语义分割模型的输入,如此,可以提升语义预测能力,且基于带语义的点云分层次地进行滤波,可以节约缓存、提升实时性。

Patent Agency Ranking