一种基于阶段性持续学习的可伸缩单流追踪方法

    公开(公告)号:CN116433727B

    公开(公告)日:2023-10-27

    申请号:CN202310691919.9

    申请日:2023-06-13

    Abstract: 本发明涉及视觉目标追踪技术领域,特别是指一种基于阶段性持续学习的可伸缩单流追踪方法。一种基于阶段性持续学习的可伸缩单流追踪方法包括:获取搜索图像以及模板图像,对搜索图像以及模板图像进行处理,获得输入图像;将输入图像进行特征向量化处理,获得向量化特征;基于向量化特征,通过交互窗口自注意力模块以及动态混合注意力模块,获得目标图像特征;根据目标图像特征,通过分类头以及回归头,获得输出图像;根据输出图像,在目标时序运动中进行目标追踪。本发明是一种基于阶段间持续学习具备优秀前后景区分能力的追踪方法。

    一种基于多任务学习的图像分割方法

    公开(公告)号:CN115797632A

    公开(公告)日:2023-03-14

    申请号:CN202211527682.2

    申请日:2022-12-01

    Abstract: 本发明公开了一种基于多任务学习的图像分割方法,包括:构建样本数据集;其中,样本数据集由对比学习数据集、网状结构图像、对应语义分割标签和对应关系向量标签组成;构建基于对比学习的特征提取器;构建基于多任务学习的图像分割模型;其中,图像分割模型包括共享编码器、语义分割任务模块和关系预测任务模块;基于对比学习数据集对特征提取器进行训练;基于网状结构图像、对应语义分割标签和对应关系向量标签构成的样本数据集对图像分割模型进行训练;利用训练好的图像分割模型对待分割图像进行语义分割,得到分割结果。本发明的图像分割方法有效提升了网状结构图像分割精度,解决了目前网状结构图像分割精度不够理想的技术问题。

    一种尺度自适应的模板匹配方法
    44.
    发明公开

    公开(公告)号:CN114821128A

    公开(公告)日:2022-07-29

    申请号:CN202210720448.5

    申请日:2022-06-24

    Abstract: 本发明公开了一种尺度自适应的模板匹配方法,包括:获取不同角度的同一场景的两幅图像,在其中一幅中手工框取感兴趣图像块作为模板图像,另一幅作为搜索图像;将模板图像和搜索图像输入特征提取网络,获取对应的特征图FT和FIS;计算归一化后的FT和FIS各像素之间的相似性,获取相似性度量图;产生自适应多尺度候选框;生成均值滤波后的相似性度量图;在搜索图像中选取出候选图像块;获取任一候选图像块和模板的特征描述;计算模板的特征描述符与任一候选图像块的特征描述符的相似性;将相似性最大的特征描述符所对应的候选图像块作为模板图像最终的匹配结果。本发明可自适应产生目标框,且适用于视角变化较大的立体结构的图像匹配问题。

    一种基于分割大模型与注意力融合的图像匹配方法和装置

    公开(公告)号:CN118038095B

    公开(公告)日:2024-07-23

    申请号:CN202410151230.1

    申请日:2024-02-02

    Abstract: 本发明公开了一种基于分割大模型与注意力融合的图像匹配方法和装置,属于图像匹配技术领域,所述方法包括:通过骨干网络确定待匹配图像对间的相似度图;通过分割大模型对待匹配图像对进行全图像区域分割;将所述相似度图用于分割后的图像区域,得到前景匹配区域对;将前景匹配区域对以及所述骨干网络输出的低分辨率特征图对输入融合注意力模块,得到相似区域图像特征图对;计算所述相似区域图像特征图对的相似性,确定粗匹配特征点;并依据所述高分辨率特征图对和所述粗匹配特征点,确定图像匹配点结果。本申请提供的基于分割大模型与注意力融合的图像匹配方案,能够有效提高图像匹配精度。

    一种多域注意力增强的三维点云语义分割方法及装置

    公开(公告)号:CN118351307A

    公开(公告)日:2024-07-16

    申请号:CN202410456964.0

    申请日:2024-04-16

    Abstract: 本发明公开了一种多域注意力增强的三维点云语义分割方法及装置,涉及计算机视觉技术领域。包括:获取待分割的三维点云数据;将三维点云数据输入到训练好的多域注意力增强的三维点云语义分割模型;其中,三维点云语义分割模型包括卷积注意力编码器模块、Transformer编码器模块、卷积注意力解码器模块以及分割头模块;根据三维点云数据以及三维点云语义分割模型,得到三维点云语义分割结果。本发明设计了一种点云语义分割方法,其使用多域注意力,在控制运算成本的前提下增强网络分割性能,并形成自定义配置框架,方便用户控制模型训练等过程,并快速部署。

    一种双向动态地图与智能体交互的轨迹预测方法及装置

    公开(公告)号:CN118135503A

    公开(公告)日:2024-06-04

    申请号:CN202410236795.X

    申请日:2024-03-01

    Abstract: 本发明涉及自动驾驶领域,特别是指一种双向动态地图与智能体交互的轨迹预测方法及装置,包括:根据智能体轨迹、地图数据以及轨迹预测模型,得到智能体未来的轨迹预测结果,模型包括智能体、地图编码器,多个双向互动模块,智能体、地图解码器。本发明开发了一种能够动态整合地图信息和智能体行为,考虑环境动态性和智能体间复杂交互的轨迹预测方法。采用智能体与地图环境双向交互机制,结合环境变化的额外的监督信号,动态整合地图和智能体间的交互。引入辅助任务,如交通流预测、智能体路径预测和道路节点的特征重构,以指导地图特征的演化并与轨迹预测对齐。突破了传统的静态地图范式,为轨迹预测领域带来了新的视角和可能性。

    一种基于多任务学习的图像分割方法

    公开(公告)号:CN115797632B

    公开(公告)日:2024-02-09

    申请号:CN202211527682.2

    申请日:2022-12-01

    Abstract: 术问题。本发明公开了一种基于多任务学习的图像分割方法,包括:构建样本数据集;其中,样本数据集由对比学习数据集、网状结构图像、对应语义分割标签和对应关系向量标签组成;构建基于对比学习的特征提取器;构建基于多任务学习的图像分割模型;其中,图像分割模型包括共享编码器、语义分割任务模块和关系预测任务模块;基于对比学习数据集对特征提取器进行训练;基于网状结构图像、对应语义分割标签和对应关系向量标签构成的样本数据集对图像分割模型进行训练;利用训练好的图像分割模型对待分割图像进行语义分割,得到分割结果。本发明的图像(56)对比文件LIXIN ZHANG et al..Segmentation andMeasurement of Superalloy MicrostructureBased on Improved Nonlocal Block《.IEEEAccess》.2022,32418-32425.Rihuan Ke et al..Multi-task deeplearning for image segmentation usingrecursive approximation tasks《.arXiv》.2020,1-24.

    一种基于扩散模型的图像去模糊方法

    公开(公告)号:CN116645287A

    公开(公告)日:2023-08-25

    申请号:CN202310578005.1

    申请日:2023-05-22

    Abstract: 本发明公开了一种基于扩散模型的图像去模糊方案,属于图像处理技术领域。所述方法包括:构建DMDIFF去模糊网络模型;其中,所述DMDIFF去模糊网络包括模糊图像特征编码器、深度梯度提取UNet骨干网络和交叉注意力子网络;对训练样本图像进行数据增强处理,得到目标训练样本;通过所述目标训练样本训练所述DMDIFF去模糊网络模型,得到目标扩散模型;将待处理图像输入所述目标扩散模型进行去模糊处理,生成目标图像。本方案基于扩散模型学习差值模板,重点学习图像中的高频信息,避免了GAN、VAE等生成模型训练困难、去模糊结果呈现平滑的问题。

    一种层级敏感的图像特征聚合方法

    公开(公告)号:CN116452931A

    公开(公告)日:2023-07-18

    申请号:CN202310382755.1

    申请日:2023-04-11

    Abstract: 本发明公开了一种层级敏感的图像特征聚合方法,包括:在Transformer网络中加入局部自适应特征聚合模块和语义信息聚合模块,构建出层次结构敏感的特征聚合框架;其中,所述特征聚合框架包括三次特征聚合过程,且在三次特征聚合过程中分别采用了不同的聚合方案;将待处理的图像输入所述特征聚合框架中进行特征聚合,得到特征图像。本发明可使Transformer建立更准确的全局关系,并在图像分类、目标检测、语义分割等多个任务上取得更好的效果。

Patent Agency Ranking