-
公开(公告)号:CN116452866A
公开(公告)日:2023-07-18
申请号:CN202310349933.0
申请日:2023-04-04
Applicant: 北京科技大学顺德创新学院
IPC: G06V10/764 , G06V10/40 , G06V10/26 , G06V10/80
Abstract: 本发明提供一种基于点云‑体素的几何自适应点云分类和分割方法及装置,属于计算机视觉技术领域。所述方法包括:构建基于体素的深度卷积算子和基于点的位置自适应池化算子;根据构建的深度卷积算子和位置自适应池化算子,构建基于点云‑体素的特征提取模块,自适应地提取和融合输入点云中不同尺度的特征;根据构建的特征提取模块,构建基于点云‑体素的几何自适应网络;输入点云分类数据集和点云部件分割数据集对构建的几何自适应网络进行训练,利用训练好的几何自适应网络实现点云的形状分类和部件分割任务。采用本发明,能够提高点云形状分类和部件分割的精度并具有高效快速的特点。
-
公开(公告)号:CN116433727A
公开(公告)日:2023-07-14
申请号:CN202310691919.9
申请日:2023-06-13
Applicant: 北京科技大学
IPC: G06T7/246 , G06N3/0455 , G06N3/08 , G06T7/73 , G06V10/44 , G06V10/74 , G06V10/764 , G06V10/82
Abstract: 本发明涉及视觉目标追踪技术领域,特别是指一种基于阶段性持续学习的可伸缩单流追踪方法。一种基于阶段性持续学习的可伸缩单流追踪方法包括:获取搜索图像以及模板图像,对搜索图像以及模板图像进行处理,获得输入图像;将输入图像进行特征向量化处理,获得向量化特征;基于向量化特征,通过交互窗口自注意力模块以及动态混合注意力模块,获得目标图像特征;根据目标图像特征,通过分类头以及回归头,获得输出图像;根据输出图像,在目标时序运动中进行目标追踪。本发明是一种基于阶段间持续学习具备优秀前后景区分能力的追踪方法。
-
公开(公告)号:CN116167941A
公开(公告)日:2023-05-26
申请号:CN202310183552.X
申请日:2023-02-17
Applicant: 北京科技大学
IPC: G06T5/00 , G06T7/40 , G06T7/90 , G06N3/0464
Abstract: 本发明公开了一种基于RGB通道恢复的水下图像增强方法,包括:获取由水下退化图像和水下清晰图像构成的图像集;采用生成对抗网络构建水下图像增强模型,并设计一个多项损失函数;基于获取的图像集和设计的多项损失函数,训练水下图像增强模型;将待增强的水下退化图像输入训练好的水下图像增强模型,得到待增强的水下退化图像所对应的清晰图像。本发明能够对水下退化图像不同衰减程度的通道针对性地进行处理,有效、鲁棒地增强水下图像。
-
公开(公告)号:CN114998605B
公开(公告)日:2023-01-31
申请号:CN202210503164.0
申请日:2022-05-10
Applicant: 北京科技大学
IPC: G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明提供一种恶劣成像条件下图像增强引导的目标检测方法,属于图像增强和计算机目标检测技术领域。所述方法包括:在现有的目标检测网络基础上,加入增强网络分支,将目标检测网络主干网络的头部卷积层特征图和增强网络分支增强后的图像分别都进行最大池化和平均池化后,计算目标检测网络和增强网络分支总的损失函数L;将恶劣成像条件下获取的图像集分别输入目标检测网络和增强网络分支,利用损失函数L对目标检测网络和增强网络分支进行训练;将恶劣成像条件下获取的待检测的图像输入训练好的目标检测网络,输出目标检测结果。采用本发明,能够在提高目标检测的精度的同时,不会增加额外的计算负担。
-
公开(公告)号:CN114820389B
公开(公告)日:2022-09-23
申请号:CN202210714947.3
申请日:2022-06-23
IPC: G06T5/00 , G06V10/774 , G06V10/82 , G06N3/08
Abstract: 本发明提供一种基于无监督解耦表征的人脸图像去模糊方法,属于计算机视觉中的低质量图像复原技术领域。所述方法包括:获取由清晰图像及模糊图像构成的训练集;其中,所述图像为人脸图像;构建基于生成对抗网络的去模糊生成网络,确定其总的目标函数;其中,通过所述去模糊生成网络解耦语义内容信息和域内特性,所述去模糊生成网络包括:内容域编码器、特征域编码器、特征域生成器、特征域鉴别器;利用得到的训练集和总的目标函数,训练所述去模糊生成网络;将待处理的模糊图像作为输入,利用训练好的所述去模糊生成网络生成清晰的人脸图像。采用本发明,能够解决其他无监督方法在训练过程中出现的域转移和解耦不一致的问题。
-
公开(公告)号:CN119992410A
公开(公告)日:2025-05-13
申请号:CN202510004451.0
申请日:2025-01-02
Applicant: 北京科技大学
IPC: G06V20/40 , G06V10/22 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于双向线索增强的时序动作定位方法及系统,属于计算机视觉技术领域,该方法包括:获取待处理的视频数据;将获取的视频数据输入时序动作定位模型;其中,所述时序动作定位模型包括:视频特征提取模块、双向线索增强模块和动作检测头;所述视频特征提取模块用于提取视频数据对应的视频特征;所述双向线索增强模块用于采用双向的特征提取机制对视频特征提取模块提取的视频特征进行特征提取和增强,得到增强的特征;所述动作检测头用于根据增强的特征,完成对动作实例的分类和定位;利用所述时序动作定位模型对输入视频中的动作进行定位和分类。本发明方案可有效提升动作定位准确性。
-
公开(公告)号:CN118038095B
公开(公告)日:2024-07-23
申请号:CN202410151230.1
申请日:2024-02-02
Applicant: 北京科技大学
IPC: G06V10/75 , G06V10/74 , G06V10/26 , G06V10/80 , G06V10/82 , G06V10/44 , G06N3/045 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种基于分割大模型与注意力融合的图像匹配方法和装置,属于图像匹配技术领域,所述方法包括:通过骨干网络确定待匹配图像对间的相似度图;通过分割大模型对待匹配图像对进行全图像区域分割;将所述相似度图用于分割后的图像区域,得到前景匹配区域对;将前景匹配区域对以及所述骨干网络输出的低分辨率特征图对输入融合注意力模块,得到相似区域图像特征图对;计算所述相似区域图像特征图对的相似性,确定粗匹配特征点;并依据所述高分辨率特征图对和所述粗匹配特征点,确定图像匹配点结果。本申请提供的基于分割大模型与注意力融合的图像匹配方案,能够有效提高图像匹配精度。
-
公开(公告)号:CN118351307A
公开(公告)日:2024-07-16
申请号:CN202410456964.0
申请日:2024-04-16
Applicant: 北京科技大学
IPC: G06V10/26 , G06V10/82 , G06V10/96 , G06N3/0464 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种多域注意力增强的三维点云语义分割方法及装置,涉及计算机视觉技术领域。包括:获取待分割的三维点云数据;将三维点云数据输入到训练好的多域注意力增强的三维点云语义分割模型;其中,三维点云语义分割模型包括卷积注意力编码器模块、Transformer编码器模块、卷积注意力解码器模块以及分割头模块;根据三维点云数据以及三维点云语义分割模型,得到三维点云语义分割结果。本发明设计了一种点云语义分割方法,其使用多域注意力,在控制运算成本的前提下增强网络分割性能,并形成自定义配置框架,方便用户控制模型训练等过程,并快速部署。
-
公开(公告)号:CN118135503A
公开(公告)日:2024-06-04
申请号:CN202410236795.X
申请日:2024-03-01
Applicant: 北京科技大学
IPC: G06V20/54 , G06V10/764 , G06V10/44 , G06V10/80 , G06V10/766 , G06V10/82 , G08G1/01 , G06N3/042 , G06N3/0464 , G06N3/0455 , G06N3/0442 , G06N3/09
Abstract: 本发明涉及自动驾驶领域,特别是指一种双向动态地图与智能体交互的轨迹预测方法及装置,包括:根据智能体轨迹、地图数据以及轨迹预测模型,得到智能体未来的轨迹预测结果,模型包括智能体、地图编码器,多个双向互动模块,智能体、地图解码器。本发明开发了一种能够动态整合地图信息和智能体行为,考虑环境动态性和智能体间复杂交互的轨迹预测方法。采用智能体与地图环境双向交互机制,结合环境变化的额外的监督信号,动态整合地图和智能体间的交互。引入辅助任务,如交通流预测、智能体路径预测和道路节点的特征重构,以指导地图特征的演化并与轨迹预测对齐。突破了传统的静态地图范式,为轨迹预测领域带来了新的视角和可能性。
-
公开(公告)号:CN115797632B
公开(公告)日:2024-02-09
申请号:CN202211527682.2
申请日:2022-12-01
Applicant: 北京科技大学
IPC: G06V10/26 , G06V10/82 , G06V10/774 , G06V10/74 , G06N3/0455 , G06N3/0464 , G06N3/0895 , G06N3/084
Abstract: 术问题。本发明公开了一种基于多任务学习的图像分割方法,包括:构建样本数据集;其中,样本数据集由对比学习数据集、网状结构图像、对应语义分割标签和对应关系向量标签组成;构建基于对比学习的特征提取器;构建基于多任务学习的图像分割模型;其中,图像分割模型包括共享编码器、语义分割任务模块和关系预测任务模块;基于对比学习数据集对特征提取器进行训练;基于网状结构图像、对应语义分割标签和对应关系向量标签构成的样本数据集对图像分割模型进行训练;利用训练好的图像分割模型对待分割图像进行语义分割,得到分割结果。本发明的图像(56)对比文件LIXIN ZHANG et al..Segmentation andMeasurement of Superalloy MicrostructureBased on Improved Nonlocal Block《.IEEEAccess》.2022,32418-32425.Rihuan Ke et al..Multi-task deeplearning for image segmentation usingrecursive approximation tasks《.arXiv》.2020,1-24.
-
-
-
-
-
-
-
-
-