-
公开(公告)号:CN108171663B
公开(公告)日:2021-05-25
申请号:CN201711416650.4
申请日:2017-12-22
Applicant: 哈尔滨工业大学
Abstract: 基于特征图最近邻替换的卷积神经网络的图像填充系统,属于图像填充技术领域,解决了现有图像填充方法无法快速地获得整体语义一致且具有良好清晰度的填充图像的问题。所述系统:生成网络对待填充图像先编码后解码,得到已填充图像。生成网络的解码器包括N个反卷积层,对于第一反卷积层~第N‑1反卷积层中的任意M个反卷积层,生成网络基于每个反卷积层的输出结果和该反卷积层对应的卷积层的输出结果,并采用特征图最近邻替换的方式得到附加特征图,并将每个反卷积层的输出结果、该反卷积层对应的卷积层的输出结果和附加特征图共同作为下一反卷积层的输入对象。判别网络用于判断已填充图像是否为待填充图像对应的真实图像。
-
公开(公告)号:CN111640073A
公开(公告)日:2020-09-08
申请号:CN202010413635.X
申请日:2020-05-15
Applicant: 哈尔滨工业大学
Abstract: 一种图像盲去噪系统,属于图像去噪技术领域。本发明针对现有图像去噪方法依赖噪声与清晰图像对进行模型的训练,可行性差的问题。其自监督学习模块包括:基于空洞卷积的盲点网络和图像相关的噪声水平估计网络,用于对噪声样本图像集中的噪声样本图像通过自监督损失优化,并基于贝叶斯预测得到初步盲去噪图像,得到第一数据集;图像相关的噪声水平估计网络还对清晰样本图像集中的清晰样本图像进行处理,生成对应噪声图像,得到清晰样本图像与对应噪声图像对组成的第二数据集;知识蒸馏模块用于在全监督模式下采用第一数据集和第二数据集训练基于多级小波的卷积神经去噪网络,得到去噪模型。本发明基于非成对图像实现盲去噪。
-
公开(公告)号:CN105654492A
公开(公告)日:2016-06-08
申请号:CN201511029299.4
申请日:2015-12-30
Applicant: 哈尔滨工业大学
CPC classification number: G06T17/30 , G06T2207/30244
Abstract: 基于消费级摄像头的鲁棒实时三维重建方法,本发明涉及基于消费级摄像头的鲁棒实时三维重建方法。本发明是要解决现有方法计算成本高,重建的模型不精确并且不完整的问题。一、在摄像头移动的过程中,基于摄像头当前的视频帧作为输入,估计每一视频帧在场景坐标系下的相机姿态:二、在视频帧中选择最佳的关键帧用于深度估计;三、采用快速鲁棒的深度估计算法估计每一视频帧的深度信息得到每一视频帧的深度图:四、将每一视频帧的深度图转换为截断符号距离场,在体素上并行地执行TSDF的加权平均,增量地融合每一视频帧的深度图,并通过Marching cubes算法构建三角网格表面。本发明应用于图像处理领域。
-
公开(公告)号:CN102184383B
公开(公告)日:2013-04-10
申请号:CN201110096820.1
申请日:2011-04-18
Applicant: 哈尔滨工业大学
Abstract: 一种印刷体字符图像样本的自动生成方法,它涉及字符图像样本的自动生成方法。本发明解决了现有的字符采集方法分割精度低,需人工校验,从而造成样本采集速度慢的技术问题。本发明:将印刷体字符处理成样本字符,设计带有定位区的文档模板,将样本字符输到文档模板的字符区,转换为PDF格式后打印纸质文档,再扫描或照相后,得到实际图像;将PDF格式文档变换为图像,得到理想图像;再从PDF格式文档中抽取字符的位置信息,得到理想图像的字符基准;将理想图像与实际图像配准,建立两幅图像的映射关系,根据射影变换模型将理想图像的字符位置信息映射到实际图像中,将字符图像提取出来,编码保存。本发明适于任何语种的印刷体字符图像。
-
公开(公告)号:CN119831963A
公开(公告)日:2025-04-15
申请号:CN202411914324.6
申请日:2024-12-24
Applicant: 哈尔滨工业大学
IPC: G06T7/00 , G06T7/10 , G06T5/50 , G06T3/4038 , G06V10/80 , G06V10/82 , G06F40/126 , G06N3/045 , G06N3/08
Abstract: 基于多模态先验知识融合的少样本工业异常检测方法,属于计算机视觉中的工业异常检测领域。解决了传统的异常检测方法未能充分考虑不同样本间的细微差异、以及缺乏对全局信息的有效利用的问题。本发明引入了一种创新的视觉‑语言先验融合方法,这一方法的核心在于两项主要创新:构建视觉‑语言先验融合模块和类内平衡模块。通过对视觉‑语言信息以及参考样本图像所对应的图像级参考特征和图块级参考特征图的有效利用,引入视觉‑语言先验融合和类内特征平衡两个核心创新组件,融合视觉先验与语言先验信息、并平衡类内的变化,实现更精准的工业异常检测。本发明主要应用在工业异常检测。
-
公开(公告)号:CN119722944A
公开(公告)日:2025-03-28
申请号:CN202411799153.7
申请日:2024-12-09
Applicant: 哈尔滨工业大学
Abstract: 基于4D高斯泼溅的单目模糊视频重建方法,属于图像复原和三维重建领域。解决了现有的单目模糊视频重建方法在处理物体运动模糊时,存在产生视频视觉质量低和渲染结果实时性差的问题。本发明构造4DGS模型,通过模拟相机运动模糊和物体运动模糊的物理形成过程,合成模糊图像,以便与真实模糊图像计算损失实现对所构建的4DGS模型的训练,并利用训练后的4DGS模型实现视频重建。本发明主要用于实现4D场景重建。
-
公开(公告)号:CN117746140B
公开(公告)日:2025-01-10
申请号:CN202311772256.X
申请日:2023-12-21
Applicant: 哈尔滨工业大学
IPC: G06V10/764 , G06N3/084 , G06F18/22 , G06V10/82 , G06N3/045
Abstract: 一种基于提示词微调和特征重放的小样本类增量图像分类方法,属于计算机视觉领域中的小样本类增量图像分类领域。本发明针对现有基于纯视觉模型的小样本类增量图像分类方法分类能力差的问题。包括使用可学习提示词和类别名的拼接作为文本编码器的输入,利用图像特征和文本特征的匹配结果,以及真实标签计算交叉熵损失函数来优化可学习提示词;利用上一阶段训练好的提示词来初始化当前阶段的提示词,根据每个类别训练图片的特征,以及VAE输出的合成特征,来估计每个类别特征层面上的高斯分布;在当前阶段使用旧类别的特征高斯分布做虚拟特征采样,计算交叉熵损失函数,并综合新旧类别的交叉熵损失来约束提示词的优化方向。本发明用于增量图像分类。
-
公开(公告)号:CN118865407A
公开(公告)日:2024-10-29
申请号:CN202411151077.9
申请日:2024-08-21
Applicant: 哈尔滨工业大学
Abstract: 用于图像分割的基于文本的贝叶斯零样本域适应训练方法,属于计算机视觉中的零样本域适应领域。解决了现有的零样本域适应方法主要集中于优化经验风险最小化目标,通常依赖于基于有限提示的离散增强训练,难以充分捕捉目标域的复杂性,从而削弱了迁移模型的有效性的问题。本发明从贝叶斯角度将零样本域适应中的参数的学习过程视为变分推理问题,具体通过对源域和目标域之间的残差进行概率性的建模,引入与域间隙相关的不确定性,进而减少了模型对特定权重的依赖,从而提高模型在目标域的性能。本发明主要用于对图像进行语义分割。
-
公开(公告)号:CN114283064B
公开(公告)日:2024-09-06
申请号:CN202111602313.0
申请日:2021-12-24
Applicant: 哈尔滨工业大学
IPC: G06T3/4053 , G06T3/4046 , G06N3/0464 , G06N3/0455 , G06N3/084 , G06N3/0895 , G06N3/048
Abstract: 一种基于真实世界双焦距图像的超分辨率自监督学习系统,属于图像复原技术领域。本发明针对使用仿真数据训练的基于参考的图像超分辨率方法在真实场景中不适用的问题。包括:图像退化模块,用于根据低分辨率图像对高分辨率目标图像进行退化处理,获得伪低分辨率图像;低分辨率图像对齐模块,通过偏移估计器估计低分辨率图像与伪低分辨率图像之间的偏移量;根据所述偏移量获得变形后低分辨率图像;参考图像对齐模块,计算参考图像与伪低分辨率图像之间的相似度对参考图像进行变形,获得变形后参考图像;复原模块,用于根据参考图像对变形后低分辨率图像和变形后参考图像进行处理,获得最终的超分辨率图像。本发明用于低分辨率图像的超分辨率。
-
公开(公告)号:CN117274083B
公开(公告)日:2024-07-26
申请号:CN202311201250.7
申请日:2023-09-18
Applicant: 哈尔滨工业大学
IPC: G06T5/90 , G06T5/60 , G06N3/0464 , G06N3/048 , G06N3/09
Abstract: 一种基于多曝光图像的自监督高动态范围图像重建方法,属于底层视觉技术领域。本发明针对现有用于高动态范围图像重建的神经网络模型训练过程中的目标图像不易获取,影响图像重建效果的问题。它针对目标图像不易获取的问题,在模型训练阶段采用自监督的方式进行参数学习;本发明在两个互补成分的监督下学习重建网络,这两个互补成分可以从多曝光图像中构建,并分别关注高动态范围图像的颜色与结构信息;其中,颜色分量从对齐后的多曝光图像中估计,结构分量由在颜色分量与参考图像监督下的结构注意网络生成;在测试阶段,重建网络可以直接用于合成高动态范围图像。本发明用于高动态范围图像的重建。
-
-
-
-
-
-
-
-
-