-
公开(公告)号:CN118298169B
公开(公告)日:2024-10-25
申请号:CN202410236797.9
申请日:2024-03-01
Applicant: 北京科技大学
IPC: G06V10/26 , G06V10/764 , G06V10/774 , G06V10/40 , G06V20/56
Abstract: 本发明公开了一种基于大模型引导的图像分割方法,属于图像处理与计算机视觉技术领域,该方法包括:构建大模型引导分割网络模型;其中,大模型引导分割网络模型包括大模型优化模块和多任务图像处理模块;大模型优化模块用于对输入图像进行分割与过滤,得到接近真实场景标签的分割掩码,作为引导信息;多任务图像处理模块用于提取输入图像的特征图,并融合所述引导信息,实现图像分割;采用预设类型的图像集对构建的大模型引导分割网络模型进行训练;利用训练好的大模型引导分割网络模型得到待分割图像的图像分割结果。采用本发明的方案,可使模型能够利用大模型的良好分割结果进行引导;同时减少模型对数据标签的依赖,从而增强模型的泛化性能。
-
公开(公告)号:CN119723678A
公开(公告)日:2025-03-28
申请号:CN202510217146.X
申请日:2025-02-26
Applicant: 北京科技大学
IPC: G06V40/20 , G06V20/40 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0895
Abstract: 本发明提供一种基于伪标签生成的弱监督时序动作定位方法及装置,涉及时序动作定位技术领域。该方法包括:对未剪辑视频进行片段划分,获得视频片段集合;通过特征提取器进行特征提取,获得逐片段特征集合;通过弱监督分支进行初步动作分类,获得分类注意力序列以及多尺度的动作提案集合;使用提案融合策略进行提案融合优化,获得伪标签提案集合;根据动作提案集合生成不确定性掩码集合。基于注意力机制,通过动态优化机制对全监督分支进行优化训练,获得第二优化全监督分支;基于特征提取器、弱监督分支和第二优化全监督分支进行动作定位。本发明是一种高质量伪标签生成的充分利用先验信息且有效结合全监督方法的弱监督时序动作定位方法。
-
公开(公告)号:CN117953029B
公开(公告)日:2024-06-07
申请号:CN202410356521.4
申请日:2024-03-27
Applicant: 北京科技大学
IPC: G06T7/50 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及图像增强技术领域,特别是指一种基于深度信息传播的通用深度图补全方法及装置。基于深度信息传播的通用深度图补全方法包括:使用深度传感器对场景进行数据采集,获得稀疏深度图;使用彩色相机对场景进行数据采集,获得RGB图;采用预填充方法,对稀疏深度图进行深度填充,获得稠密深度图;将稀疏深度图、RGB图和稠密深度图,输入ResUNeT网络进行特征提取,获得亲和力图;根据稠密深度图以及亲和力图进行迭代传播,获得补全深度图。本发明是一种克服深度传感器分辨率不足的补全精度高、推理速度快的深度图补全方法。
-
公开(公告)号:CN120070865A
公开(公告)日:2025-05-30
申请号:CN202510191072.7
申请日:2025-02-20
Applicant: 北京科技大学
IPC: G06V10/25 , G06V10/80 , G06V10/771 , G06V10/44 , G06V10/764 , G06V10/52
Abstract: 本发明公开了一种基于多尺度特征融合和特征增强的小目标检测方法,属于目标检测技术领域,所述方法包括:通过引入特征融合模块、特征增强模块以及特征重建模块,构建基于多尺度特征融合和特征增强的小目标检测模型;对构建的小目标检测模型进行训练;利用训练好的小目标检测模型实现小目标检测。本发明提供的基于多尺度特征融合和特征增强的小目标检测方法利用特征融合和特征增强方法,并且借助特征重建来解决现有小目标检测算法的特征信息不足,以及小目标易于被遮挡,难以与复杂背景区分的问题,提高了小目标检测性能。
-
公开(公告)号:CN119992129A
公开(公告)日:2025-05-13
申请号:CN202510205028.7
申请日:2025-02-24
Applicant: 北京科技大学
IPC: G06V10/72 , G06N3/0464 , G06V10/25 , G06V10/774 , G06V10/764 , G06V10/766 , G06V10/82
Abstract: 本发明提供了一种小目标检测方法和系统,属于计算机视觉领域。所述方法先获取历史图像及真实标注样本,样本类别包括极端小目标、相对小目标、普通小目标和正常尺寸目标;构建小目标检测模型;将历史图像输入卷积神经网络提取特征图;再将特征图输入改进的CRPN,基于不同的样本类别,得到候选样本,再映射在特征图上,获得感兴趣区域及特征,再基于特征得到样本的预测类别和回归位置;同时,从感兴趣区域的特征中筛选出正样本和典型负样本,基于预测类别、回归位置、正样本教师集和典型负样本教师集对小目标检测模型进行训练,最后将当前待检测的图像输入训练完成的小目标检测模型,输出检测结果。本发明提高了小目标检测的精度和准确度。
-
公开(公告)号:CN118298169A
公开(公告)日:2024-07-05
申请号:CN202410236797.9
申请日:2024-03-01
Applicant: 北京科技大学
IPC: G06V10/26 , G06V10/764 , G06V10/774 , G06V10/40 , G06V20/56
Abstract: 本发明公开了一种基于大模型引导的图像分割方法,属于图像处理与计算机视觉技术领域,该方法包括:构建大模型引导分割网络模型;其中,大模型引导分割网络模型包括大模型优化模块和多任务图像处理模块;大模型优化模块用于对输入图像进行分割与过滤,得到接近真实场景标签的分割掩码,作为引导信息;多任务图像处理模块用于提取输入图像的特征图,并融合所述引导信息,实现图像分割;采用预设类型的图像集对构建的大模型引导分割网络模型进行训练;利用训练好的大模型引导分割网络模型得到待分割图像的图像分割结果。采用本发明的方案,可使模型能够利用大模型的良好分割结果进行引导;同时减少模型对数据标签的依赖,从而增强模型的泛化性能。
-
公开(公告)号:CN117953029A
公开(公告)日:2024-04-30
申请号:CN202410356521.4
申请日:2024-03-27
Applicant: 北京科技大学
IPC: G06T7/50 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及图像增强技术领域,特别是指一种基于深度信息传播的通用深度图补全方法及装置。基于深度信息传播的通用深度图补全方法包括:使用深度传感器对场景进行数据采集,获得稀疏深度图;使用彩色相机对场景进行数据采集,获得RGB图;采用预填充方法,对稀疏深度图进行深度填充,获得稠密深度图;将稀疏深度图、RGB图和稠密深度图,输入ResUNeT网络进行特征提取,获得亲和力图;根据稠密深度图以及亲和力图进行迭代传播,获得补全深度图。本发明是一种克服深度传感器分辨率不足的补全精度高、推理速度快的深度图补全方法。
-
-
-
-
-
-