-
公开(公告)号:CN112508973B
公开(公告)日:2024-10-18
申请号:CN202011118130.7
申请日:2020-10-19
Applicant: 杭州电子科技大学
IPC: G06T7/12 , G06T7/155 , G06T5/30 , G06T5/90 , G06T5/60 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开一种基于深度学习的MRI图像分割方法。本发明先利用图像数据增强、提取技术,对数据进行扩容,利用形态学的方法,得到前列腺边缘的标签。然后在U‑Net网络基础上加入IBN模块,把maxpool层改成stride conv层,采用2D和3D卷积结合的方法,作为编码部分;在解码部分中,采用两个解码器,其中一个解码器进行前列腺整体的分割预测,另一个解码器进行单独的前列腺边缘的预测。本发明采用了IN和BN相结合的策略,使得模型泛化能力得到加强。同时,把原本下采样的maxpool层改成stride conv层,使得模型保留图像细节信息的能力得到加强,使得分割的结果更加精细。采用2D和3D卷积相结合的做法进一步提高模型的精度。
-
公开(公告)号:CN118736380A
公开(公告)日:2024-10-01
申请号:CN202410856450.4
申请日:2024-06-28
Applicant: 杭州电子科技大学
IPC: G06V10/82 , G06V10/774 , G06V10/74 , G06V10/764 , G06V10/80 , G06N3/0455 , G06N3/0464 , G06N3/096
Abstract: 本发明公开了一种基于特征对比迁移学习的开集识别方法及系统,该方法首先通过预训练的多层视觉编码器获取待识别图像的图像特征和已知类别的类别特征锚点。其次将图像特征和类别特征锚点拼接成图像‑类别特征对,通过相似度网络计算类别相似度值并得到类别差异特征。然后将图像特征、类别差异特征通过交叉注意力网络,得到待识别图像的潜在闭集分类结果。最后取潜在闭集分类结果对应的类别相似度值作为待识别图像的开集分数,与设定阈值比较判断待识别图像属于已知类还是未知类。本发明提高了模型的闭集分类性能和开集识别性能,并在细粒度开集识别任务中表现出色。
-
公开(公告)号:CN114299588B
公开(公告)日:2024-05-10
申请号:CN202111654265.X
申请日:2021-12-30
Applicant: 杭州电子科技大学
IPC: G06V40/16 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/09
Abstract: 本发明公开了一种基于局部空间转换网络的实时目标编辑方法,首先获取高分辨率图像并制作训练数据集和测试数据集,然后通过掩码转换网络获取目标掩码的仿射变换矩阵,并实现目标图像的采样再使用空洞修复网络修复图像空洞,最后通过获得的数据集训练并测试掩码转换网络和空洞修复网络。本发明MTN专注于掩码学习,可使用与业务无关的数据集训练网络模型,降低了构建数据集的成本和模型的训练成本,完成目标编辑任务的同时解决了传统深度学习方法中图像空洞的出现问题。
-
公开(公告)号:CN117522813A
公开(公告)日:2024-02-06
申请号:CN202311485313.6
申请日:2023-11-09
Applicant: 杭州电子科技大学
IPC: G06T7/00 , G06V10/80 , G06V10/44 , G06V10/764 , G06V10/82
Abstract: 本发明公开了一种基于ViT进行空域和频域特征融合的光场图像质量评价方法。本发明包括如下步骤:步骤S1:对光场图像进行预处理;步骤S2:对预处理后的光场图像,提取空间‑角度信息和频域‑角度信息并进行融合,得到融合特征图;步骤S3:将融合特征图输入到小样本Transformer编码网络提取失真特征;步骤S4:将得到的失真特征送入分数预测模块,得到客观质量评价分数。本发明提取米字型光场子孔径图像,并将每个方向的子孔径图像拆分成三个堆栈分别输入,在尽可能提供更多的光场角度信息的同时,控制了模型计算的复杂度。本发明使模型能够获取融合了空域、频域以及角度的特征信息。丰富的特征信息有利于模型对失真特征的提取。
-
公开(公告)号:CN114170316A
公开(公告)日:2022-03-11
申请号:CN202111528516.X
申请日:2021-12-13
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于环绕视点的位姿估计优化方法。本发明将稀疏视点图片与对应粗略相机位姿作为输入,利用编解码神经网络提取出图片序列的不同尺度的特征,将不同尺度的特征进行转置卷积并两两相乘,按照粗略相机位姿映射并融合为3D特征体素,通过3D卷积网络提取特征点空间坐标、密度与颜色信息作为输入进入MLP网络,回归得到位姿偏移误差,更新对照视点位姿并回归主视点坐标系。本发明对输入的多视点图片进行预处理,利用神经网络,基于多视图,将特征匹配与位姿优化两个任务集成起来,得到了精确的相机位姿。本发明提出的于环绕视图的位姿估计优化方法,提高了位姿估计的精度,大大提升了三维重建的质量。
-
公开(公告)号:CN112907641A
公开(公告)日:2021-06-04
申请号:CN202110151211.5
申请日:2021-02-03
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于细节信息保持的多视点视图深度估计方法。本方法首先利用U型神经网络提取出图片序列在不同尺度的特征,在同一尺度的特征中,分为两个分支:一个分支进行分割操作,得到高质量细节保持的目标分割图;一个分支进行为后续的深度估计进行特征提取。将不同尺度的特征与同尺度下的分割图Fs相乘,按照单应矩阵映射融合为3D特征体素,最后通过回归得到深度图。将该深度图与对应大小的Fs逐像素相乘,通过由粗到细不同尺度的优化,输出最终的深度图,其中只有目标的深度信息有效。本发明提出的基于细节信息保持的多视点视图深度估计方法,避免了重建中背景对目标的影响,提高了深度估计的精度。
-
公开(公告)号:CN110163246B
公开(公告)日:2021-03-30
申请号:CN201910276356.0
申请日:2019-04-08
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于卷积神经网络的单目光场图像无监督深度估计方法。本发明先利用公开的大型光场图像数据集作为训练集,通过数据增强、数据扩充使训练集样本趋于平衡。构建改进的ResNet50网络模型,使用编码器和解码器分别提取模型的高级和低级的特征,再通过密集差结构将编码器和解码器的结果融合,同时另外构建了一个超分辨率遮挡检测网络,能够使用深度学习准确的预测出各个视角之间的遮挡问题;基于光场图像深度估计任务的目标函数是多损失函数,通过预先定义好的网络模型对预处理后的图像进行训练,最后在测试集上对网络模型进行泛化评估。本发明对复杂场景的光场图像预处理效果显著,实现了更精确光场图像无监督深度估计的效果。
-
公开(公告)号:CN110163108B
公开(公告)日:2020-12-08
申请号:CN201910329213.1
申请日:2019-04-23
Applicant: 杭州电子科技大学
Abstract: 本发明公开了基于双路径特征融合网络的鲁棒声呐目标检测方法。传统图像处理方法使用图像分割的方法将背景和目标区分;本发明如下:一、搭建双路径特征融合网络。二、对步骤1所得的双路径特征融合网络进行训练。三、声呐图像的生成和特征提取。四、结合默认框进行声呐图像目标框的分类和检测。本发明将深度学习技术融入到目标检测中,将声呐数据生成的声呐图像输入网络模型中,在模型中一次性完成特征提取、目标检测、目标分类,从而大大提高检测速度。本发明可以提取到更多的深层次特征,从根本上优化了目标分类,回归。本发明采用多尺度密集相连,以融合多层次特征,提升中小目标检测效果。
-
公开(公告)号:CN106652048B
公开(公告)日:2020-07-14
申请号:CN201611260181.7
申请日:2016-12-30
Applicant: 杭州电子科技大学
IPC: G06T19/20
Abstract: 本发明提出一种基于3D‑SUSAN角点算子的三维模型感兴趣点提取方法。本发明首先读取三维模型顶点,并简化模型顶点以及模型网格化,计算每个顶点的曲率。再通过高斯滤波处理每个顶点的曲率,进行去噪处理。接着确定一个中心点并取中心点周围的36个邻居点,若中心顶点与邻居顶点的曲率差小于曲率相似度阈值,则进入下一步;若每个顶点的USAN值小于几何阈值,则该中心顶点就是兴趣点。最后对本发明所提出的基于3D‑SUSAN角点算子提取的三维模型感兴趣点从错误率、缺失率、误差率进行评估。本发明不仅可以提取三维模型兴趣点而且仍保留了SUSAN的抗噪能力强、计算量小效率高、性能稳定的优点。
-
公开(公告)号:CN106340041A
公开(公告)日:2017-01-18
申请号:CN201610828210.9
申请日:2016-09-18
Applicant: 杭州电子科技大学
IPC: G06T7/55
CPC classification number: G06T2207/10024 , G06T2207/10052
Abstract: 本发明公开了一种基于级联遮挡滤除滤波器的光场相机深度估计方法。本发明根据遮挡信息在光线级、像素级和图像级中的不同表现形式,通过从光线级到像素级再到图像级的三层级联遮挡滤除滤波,滤除或保持原始光场图像数据中可能的遮挡信息,减少光场相机深度估计中的歧义性判断,实现精确的深度估计。本发明的主要特点在于通过光线级遮挡滤除滤波器滤除可能被遮挡的光线,通过像素级遮挡滤除滤波器保持处于深度不连续边缘处像素的遮挡特性,通过图像级遮挡滤除滤波器提取像素间的图像级遮挡信息,从而在深度估计中排除具有歧义性的遮挡信息,提高估计精度。
-
-
-
-
-
-
-
-
-