-
公开(公告)号:CN117953029A
公开(公告)日:2024-04-30
申请号:CN202410356521.4
申请日:2024-03-27
Applicant: 北京科技大学
IPC: G06T7/50 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及图像增强技术领域,特别是指一种基于深度信息传播的通用深度图补全方法及装置。基于深度信息传播的通用深度图补全方法包括:使用深度传感器对场景进行数据采集,获得稀疏深度图;使用彩色相机对场景进行数据采集,获得RGB图;采用预填充方法,对稀疏深度图进行深度填充,获得稠密深度图;将稀疏深度图、RGB图和稠密深度图,输入ResUNeT网络进行特征提取,获得亲和力图;根据稠密深度图以及亲和力图进行迭代传播,获得补全深度图。本发明是一种克服深度传感器分辨率不足的补全精度高、推理速度快的深度图补全方法。
-
公开(公告)号:CN116129333A
公开(公告)日:2023-05-16
申请号:CN202310395174.1
申请日:2023-04-14
Applicant: 北京科技大学
IPC: G06V20/40 , G06V10/75 , G06V10/762 , G06V10/774 , G06V10/82 , G06N3/08 , G06N3/0464
Abstract: 本发明公开了一种基于语义探索的开集动作识别方法,包括:针对给定的输入视频,提取出预设维度的片段级视觉特征;通过联合学习显式知识语义和隐式数据语义来探索视频的语义信息;基于片段级视觉特征与视频的语义信息,获得最终的视频特征;基于所述视频特征,利用预设的识别模型实现开集动作识别。本发明的技术方案可更好地感知开放场景,并有效提升最终的识别性能。
-
公开(公告)号:CN114612347B
公开(公告)日:2022-08-16
申请号:CN202210506856.0
申请日:2022-05-11
Applicant: 北京科技大学
Abstract: 本发明提供一种多模块级联的水下图像增强方法,属于计算机视觉技术领域。所述方法包括:将现有的空气图像增强网络与颜色校正网络级联,构建多模块级联增强网络,其中,空气图像增强网络用于解决水下图像中与空气图像相似的退化问题,颜色校正网络用于校正水下图像中存在的色偏;获取成对水下图像数据集,利用获取的成对水下图像数据集训练所述多模块级联增强网络;获取待增强的水下图像,将待增强的水下图像送入训练好的多模块级联增强网络,得到增强后的水下图像。采用本发明,能够解决水下成像中不同类型的退化问题。
-
公开(公告)号:CN111210422A
公开(公告)日:2020-05-29
申请号:CN202010033737.9
申请日:2020-01-13
Applicant: 北京科技大学
Abstract: 本发明提供一种基于红外图像的对空目标检测方法,能够较为有效地对红外图像序列中的对空小目标进行检测。所述方法包括:提取红外图像各像素点邻域的对比度特征,生成对比度图像;提取红外图像各像素点的邻域亮度差分特征,生成邻域亮度差分图像;融合对比度图像和邻域亮度差分图像;对融合后的图像进行置零操作的双阈值处理,提取目标位置。本发明适用于基于红外图像的对空目标检测。
-
公开(公告)号:CN119671955A
公开(公告)日:2025-03-21
申请号:CN202411705503.9
申请日:2024-11-26
Applicant: 北京科技大学
IPC: G06T7/00 , G06N3/0464 , G06N3/096
Abstract: 本发明公开了一种基于扩散模型的电极板短路检测方法,属于电极板短路检测技术领域,其包括:获取电极板的红外图像及显著图,构建样本数据集;将扩散模型引入电极板短路检测,在基于扩散模型的目标检测框架中添加显著性感知的特征增强分支和全局特征微调模块,构建检测模型;其中,显著性感知的特征增强分支用于引入显著图特征来增强红外图像特征;全局特征微调模块用于对图像特征进行微调,以获得与目标相关的上下文背景信息;对检测模型进行训练;利用训练好的模型对待检测的电极板进行检测。本发明可提取更高质量、更加丰富全面的目标特征,从而提高检测精度。
-
公开(公告)号:CN118115913B
公开(公告)日:2024-09-27
申请号:CN202410204210.6
申请日:2024-02-23
Applicant: 北京科技大学
IPC: G06V20/40 , G06V10/62 , G06V10/774 , G06V10/82 , G06N3/0455 , G06N3/08
Abstract: 本发明涉及深度学习计算机视觉领域目标追踪领域,特别是指一种两阶段追踪方法及装置,方法包括:获取待进行目标追踪的视频数据,根据视频数据获取图像对;构建基础追踪模型,采用双向视觉引导训练方法、视频序列微调方法以及目标层级的随机擦除数据增强方法,对基础追踪模型进行训练,得到训练好的追踪模型;根据图像对以及训练好的追踪模型,得到目标追踪结果。本发明提出了一种两阶段的训练方式,能够在有效利用视频序列信息的同时不增加任何推理成本。除此之外,本发明提出了一种目标层级的随机擦除数据增强方案,能够很好模拟在追踪过程中出现的遮挡问题,使训练的追踪器更加鲁棒。
-
公开(公告)号:CN116645287B
公开(公告)日:2024-03-29
申请号:CN202310578005.1
申请日:2023-05-22
Applicant: 北京科技大学
IPC: G06T5/73 , G06N3/0464 , G06N3/08 , G06V10/82 , G06V10/774
Abstract: 本发明公开了一种基于扩散模型的图像去模糊方案,属于图像处理技术领域。所述方法包括:构建DMDIFF去模糊网络模型;其中,所述DMDIFF去模糊网络包括模糊图像特征编码器、深度梯度提取UNet骨干网络和交叉注意力子网络;对训练样本图像进行数据增强处理,得到目标训练样本;通过所述目标训练样本训练所述DMDIFF去模糊网络模型,得到目标扩散模型;将待处理图像输入所述目标扩散模型进行去模糊处理,生成目标图像。本方案基于扩散模型学习差值模板,重点学习图像中的高频信息,避免了GAN、VAE等生成模型训练困难、去模糊结果呈现平滑的问题。
-
公开(公告)号:CN116452931B
公开(公告)日:2024-03-19
申请号:CN202310382755.1
申请日:2023-04-11
Applicant: 北京科技大学
IPC: G06V10/80 , G06V10/82 , G06V10/762
Abstract: 本发明公开了一种层级敏感的图像特征聚合方法,包括:在Transformer网络中加入局部自适应特征聚合模块和语义信息聚合模块,构建出层次结构敏感的特征聚合框架;其中,所述特征聚合框架包括三次特征聚合过程,且在三次特征聚合过程中分别采用了不同的聚合方案;将待处理的图像输入所述特征聚合框架中进行特征聚合,得到特征图像。本发明可使Transformer建立更准确的全局关系,并在图像分类、目标检测、语义分割等多个任务上取得更好的效果。
-
公开(公告)号:CN116664867A
公开(公告)日:2023-08-29
申请号:CN202310582786.1
申请日:2023-05-22
Applicant: 北京科技大学
IPC: G06V10/44 , G06V10/80 , G06V10/774
Abstract: 本发明公开了一种基于多证据融合选取训练样本的特征提取方法及装置,该方法包括:在特征提取网络的训练阶段引入多种不同的图像检索算法;对特征提取网络进行训练;训练过程包括:在输入图像中确定锚点、正样本点和负样本点;分别利用每一图像检索算法计算锚点和正样本点之间的正样本相似度,以及锚点与负样本点之间的负样本相似度;基于计算出的正样本相似度和负样本相似度更新负样本点,得到更新后的负样本点;将利用多种不同的图像检索算法所得到的更新后的负样本点进行融合,计算损失函数;利用训练好的特征提取网络对待处理图像进行特征提取,得到提取结果。本发明可提高描述子可靠性,进而提高匹配准确率和数量,有利于视觉定位等下游任务。
-
公开(公告)号:CN116662600A
公开(公告)日:2023-08-29
申请号:CN202310678818.8
申请日:2023-06-08
Applicant: 北京科技大学
IPC: G06F16/587 , G06T7/73 , G06V10/74
Abstract: 本发明公开了一种基于轻量结构化线地图的视觉定位方法,包括:通过图像检索,将查询图像与数据库图像进行图像匹配,根据图像匹配结果,找到与查询图像最相似的多个数据库图像,作为候选数据库图像;构建用于视觉定位的线地图;对所述查询图像和所述候选数据库图像进行线提取和匹配,构建二维到三维的线对应关系;基于构建的二维到三维的线对应关系,求解初始姿态;对求解出的初始姿态进行姿态迭代优化,得到最终的相机位姿。本发明可在较低的内存消耗下估计出较好的相机六自由度位姿,具有重大的应用前景和价值。
-
-
-
-
-
-
-
-
-