-
公开(公告)号:CN114004752B
公开(公告)日:2025-04-29
申请号:CN202111008281.1
申请日:2021-08-30
Applicant: 北京邮电大学
IPC: G06T5/90 , G06T9/00 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/0475 , G06N3/094
Abstract: 本发明设计了一种基于非配对训练的错误曝光图像的亮度调节方法,属于计算机视觉图像技术领域。本发明首先将任意亮度等级的图像和目标亮度的图像通过编码器分别解耦为内容分量和一个满足高斯分布的亮度分量,或直接输入一个高斯分布作为目标亮度分量,然后通过解码器将待处理的某亮度图像的内容分量和目标的亮度分量重新耦合生成目标亮度的图像。其中对亮度分量的处理是指将不同亮度等级的亮度分量拟合为唯一对应的高斯分布,将其转化为可调节的变量,本发明通过控制高斯分布的均值来实现目标亮度的转化。实验表明,本发明实现了图像不同亮度间的转化,能够有效恢复不同程度的欠曝和过曝图像,并在各个数据集较强的泛化能力。
-
公开(公告)号:CN119380161A
公开(公告)日:2025-01-28
申请号:CN202411315315.5
申请日:2024-09-20
Applicant: 北京邮电大学 , 北京卓视智通科技有限责任公司
IPC: G06V10/82 , G06V10/774 , G06V20/62 , G06N3/0464
Abstract: 本发明涉及计算机视觉技术领域,具体公开一种目标检测优化方法、系统、电子设备和存储介质,包括:将待测图像输入训练好的目标检测模型,得到所述待测图像的目标检测框及所述目标检测框的第一置信度;利用CO‑STAR框架,生成所述待测图像的背景描述文本,并将所述目标检测框和所述背景描述文本输入至训练好的多模态大语言模型,得到所述目标检测框的第二置信度;将所述目标检测框的第一置信度与第二置信度进行置信度融合,得到所述目标检测框的目标置信度。本发明利用多模态大语言模型对目标检测结果进行复检,以高可解释性的方式给出新的置信度判定,显著提高已有检测框架的精度,从而实现了对目标检测结果的优化。
-
公开(公告)号:CN116579947A
公开(公告)日:2023-08-11
申请号:CN202310604365.4
申请日:2023-05-26
Applicant: 北京邮电大学
IPC: G06T5/00 , G06V10/774 , G06V10/82 , G06N3/0464 , G06V10/80
Abstract: 本发明涉及一种基于纯噪声训练的亮度可调的低照度图像增强方法,其技术特点是:训练阶段采样随机高斯噪声作为低照度输入图像;将低照度输入图像和亮度变化因子分别送入到图像处理模块和亮度处理模块中,得到特征图和特征向量;对特征图和特征向量通过卷积和非线性变换的操作,实现特征的融合和重构,输出通道数为6的曲线参数;将低照度输入图像增强为由亮度变化因子的幅值指导的具有特定亮度的输出图像;作均值和对比度变换,得到伪参考图像;计算总损失,进行迭代优化网络。本发明采用纯噪声的训练策略,帮助模型绕过常用的色彩恒常和光照平滑损失,使难以设计的非线性曲线形式简化为线性曲线形式,实现了低照度增强领域降本增效的功能。
-
公开(公告)号:CN109886871B
公开(公告)日:2023-04-07
申请号:CN201910014480.X
申请日:2019-01-07
Applicant: 国家新闻出版广电总局广播科学研究院 , 北京邮电大学
IPC: G06T3/40
Abstract: 本发明涉及一种基于通道注意力机制和多层特征融合的图像超分辨率方法,在残差支路开头,使用基于深度学习的单层卷积层直接提取低分辨率图像的原始特征;使用六个级联的基于通道注意力机制和多层特征融合的卷积循环单元来提取精确的深度特征;通过反卷积层对深度特征进行上采样,并且使用单层卷积层对上采样的特征进行降维,得到高分辨率图像的残差;在映射支路,使用双三次插值方法对低分辨图像进行上采样,得到高分辨率图像的映射;将高分辨率图像的映射和残差逐像素相加得到最终的高分辨率图像。本发明设计合理,充分考虑了特征通道间的差异性,高效地利用了层次化的特征,在取得较高准确率的同时,保持了较快的运行速度。
-
公开(公告)号:CN113159173A
公开(公告)日:2021-07-23
申请号:CN202110427314.X
申请日:2021-04-20
Applicant: 北京邮电大学
Abstract: 本发明涉及一种结合剪枝与知识蒸馏的卷积神经网络模型压缩方法。该方法包括:获取图像训练集A;获取目标网络模型,对其包含的每个通道引入缩放因子γ;对目标网络模型进行训练,将训练后的模型作为教师网络;按照缩放因子γ的绝对值大小对教师网络的通道数剪枝,将剪枝后的模型视为学生网络;获取图像训练集A中少量图像,同时输入教师、学生网络,分别计算教师、学生网络各卷积层通道输出的特征图之间的分布差异;将分布差异作为损失函数,对学生网络进行训练,使其模型精度快速恢复至教师网络的水平;输出训练后的学生网络。本发明具有压缩率高、快速恢复压缩模型精度的优势,从而便于网络模型在终端设备上的部署。
-
公开(公告)号:CN113158584A
公开(公告)日:2021-07-23
申请号:CN202110566230.4
申请日:2021-05-24
Applicant: 北京邮电大学
Abstract: 本发明提出了多模态特征嵌入预训练网络搭配效果评估的上界替代法,属于计算机视觉多模态技术领域。本发明提出的方法包括步骤:1)将所有模态特征嵌入预训练网络所提取到的特征进行遍历搭配;2)对得到的所有的搭配情况,对任务网络按照正式训练时提前设定好的参数,利用测试集部分进行训练;3)、对得到的每种搭配对应的模型,对其在测试集上进行测试,记录每一种搭配所对应的测试结果;4)、对所对应的每一种测试结果,选择效果最好的结果对应的模态特征嵌入预训练网络搭配;5)、对选出的网络搭配,将任务模型在这种搭配下所对应的训练集的特征下进行训练,训练得到的模型就是最优的模型。
-
公开(公告)号:CN112465727A
公开(公告)日:2021-03-09
申请号:CN202011439065.8
申请日:2020-12-07
Applicant: 北京邮电大学
Abstract: 本发明设计了一种基于HSV色彩空间和Retinex理论的无正常曝光图像参考的低照度图像增强方法,属于计算机视觉图像技术领域。针对于无正常曝光图像参考的低照度增强任务,本发明将其分解为颜色保留任务和亮度增强任务。对于颜色保留任务,本发明通过HSV色彩空间分离出颜色信息,并保留到增强后的图像上。对于亮度增强任务,本发明通过对分离出的亮度信息进行扰动,得到同一场景的不同光照水平的图像对,通过Retinex理论中的反射一致性约束得到反射分量,并将反射分量作为亮度增强的结果。实验表明,本发明可以有效地增强低照度图像,并在各个数据集和不同光照程度的低照度图像上有很强的泛化能力。
-
公开(公告)号:CN109886871A
公开(公告)日:2019-06-14
申请号:CN201910014480.X
申请日:2019-01-07
Applicant: 国家新闻出版广电总局广播科学研究院 , 北京邮电大学
IPC: G06T3/40
Abstract: 本发明涉及一种基于通道注意力机制和多层特征融合的图像超分辨率方法,在残差支路开头,使用基于深度学习的单层卷积层直接提取低分辨率图像的原始特征;使用六个级联的基于通道注意力机制和多层特征融合的卷积循环单元来提取精确的深度特征;通过反卷积层对深度特征进行上采样,并且使用单层卷积层对上采样的特征进行降维,得到高分辨率图像的残差;在映射支路,使用双三次插值方法对低分辨图像进行上采样,得到高分辨率图像的映射;将高分辨率图像的映射和残差逐像素相加得到最终的高分辨率图像。本发明设计合理,充分考虑了特征通道间的差异性,高效地利用了层次化的特征,在取得较高准确率的同时,保持了较快的运行速度。
-
公开(公告)号:CN109190626A
公开(公告)日:2019-01-11
申请号:CN201810842201.4
申请日:2018-07-27
Applicant: 国家新闻出版广电总局广播科学研究院 , 北京邮电大学
Abstract: 本发明涉及一种基于深度学习的多路径特征融合的语义分割方法,包括以下步骤:使用多路径特征融合方法提取图像的基础深度特征;将提取的基础深度特征经过解码端网络,恢复原始图像分辨率信息,并生成分割结果;以交叉熵损失函数为目标训练网络,使用准确率和mIoU评价网络性能。本发明设计合理,其充分考虑了局部信息以及全局信息,在网络中的特征提取端和分类端添加了很多条路径,网络的输出是与原图像分辨率大小一致的分割图,使用图像已有的标签计算分割准确率,以最小化交叉熵损失函数为目标来训练网络,有效地提高了图像语义分割地准确率。
-
公开(公告)号:CN108960141A
公开(公告)日:2018-12-07
申请号:CN201810721706.5
申请日:2018-07-04
Applicant: 国家新闻出版广电总局广播科学研究院 , 北京邮电大学
CPC classification number: G06K9/00362 , G06K9/6247 , G06K9/627
Abstract: 本发明涉及一种基于增强型深度卷积神经网络的行人再识别方法,使用基础深度学习卷积神经网络模型提取行人图像的基础深度特征,同时使用传统手动特征提取方法提取行人图像的手动特征并降维;应用特征重建模块将基础深度特征和手动特征融合成增强型深度特征;通过特征比较预测两张图像中行人是否为同一个人,联合使用分类损失函数和验证损失函数对输入图像进行分类和异同验证,以最小化联合损失为目标来训练网络,使得网络生成更有判别力的行人图像特征。本发明充分利用了手动特征和深度特征之间的互补性,提出了联合使用分类损失和验证损失函数用于监督网络训练的策略,获得了良好的性能,有效地提高行人再识别准确率。
-
-
-
-
-
-
-
-
-