-
公开(公告)号:CN117274047A
公开(公告)日:2023-12-22
申请号:CN202310946812.4
申请日:2023-07-31
Applicant: 杭州电子科技大学
IPC: G06T3/40 , G06V10/774 , G06V10/77 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种双路卷积与自注意力结合的红外图像超分辨率重建方法,包括如下步骤:1、对获得的开源红外图像数据集进行训练数据和测试数据的划分,并对数据进行预处理;2、构建融合特征的网络模型,所述融合特征网络模型包括浅层特征提取网络、深层特征提取网络和图像重建提取网络3、基于构建好的红外图像训练数据集,对融合特征的网络模型进行训练;4、将构建好的红外图像测试数据集作为输入,通过训练好的融合特征网络模型进行红外图像超分辨率重建。本发明结合CNN和自注意力,利用不同大小的感受野,对图像的局部特征和全局特征进行建模,并加入双向信息交互模块,增强了通道维度和空间维度的建模能力,得以更好地恢复重建图像的细节。
-
公开(公告)号:CN112395442B
公开(公告)日:2022-06-14
申请号:CN202011084050.4
申请日:2020-10-12
Applicant: 杭州电子科技大学
IPC: G06F16/535 , G06F16/54 , G06F16/55 , G06F16/583 , G06F16/9535 , G06K9/62 , G06N3/04 , G06N3/08 , G06V10/774 , G06V10/764 , G06V10/82
Abstract: 本发明公开了一种移动互联网上的低俗图片自动识别与内容过滤方法。本发明步骤:1.基于两大开源数据集建立用于训练和测试四分类低俗图像数据集;2.进行数据预处理;3.构建多阶段注意力机制的神经网络架构;4.基于四分类低俗图像数据集,对多阶段注意力机制的神经网络架构进行训练,获得注意力机制模型;5.将训练过后的注意力机制模型用数据的测试集进行测试,以验证模型的准确率指标;6.将最优的注意力机制模型用于数据的可视化,以热力图的形式展现出图像的高权重重点区域。本发明通过部署注意力机制,对图像的特征图的关键特征所在的区域进行加权操作。通过热力图的形式对特征图进行了数据可视化,通过可视化实验更好地解释模型的决策过程。
-
公开(公告)号:CN113743188A
公开(公告)日:2021-12-03
申请号:CN202110720384.4
申请日:2021-06-28
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于特征融合的互联网视频低俗行为检测方法。本发明步骤:1:构建一个用于低俗不良动作检测的五分类视频数据集;同时对数据集中各个类别的样本视频数据进行统计;2:对五分类视频数据集进行数据预处理和人工序列化类型标注;3:构建对动作长度敏感的感受野自适应U型时序卷积网络AU‑TCN,包括时序卷积神经网络、时序注意力卷积模块和多尺度时域特征融合结构;4:将构建好的网络模型运用于数据集进行训练测试,以验证网络模型的准确率指标;5:使用训练后的模型对各类数据集进行实验结果可视化,以图片的形式展现出视频分割结果。本发明联合学习视频的局部关键特征,智能的对海量移动互联网视频进行识别并对低俗内容进行过滤。
-
公开(公告)号:CN120014691A
公开(公告)日:2025-05-16
申请号:CN202510408322.8
申请日:2025-04-02
Applicant: 杭州电子科技大学
IPC: G06V40/18 , G06V10/774 , G06V10/82 , G06V10/80 , G06N3/0464 , G06N3/0455 , G06T7/00
Abstract: 本发明公开了一种基于选择性状态空间融合的眼科影像分类方法,该方法首先获取眼底医学影像数据,进行预处理,生成眼底医学影像数据集。其次构建S3FNet模型,通过小波多尺度特征提取器、归纳偏置Transformer编码器IBTE和多模型聚合模块MA的协同工作实现眼底医学影像的分类。最后使用眼底医学影像数据集对S3FNet模型进行训练和测试评估,生成最终的分类模型。本发明提显著提升了眼底医学影像特征提取的效率和精度,完成眼科疾病的分类准确性。
-
公开(公告)号:CN119128643A
公开(公告)日:2024-12-13
申请号:CN202411232840.0
申请日:2024-09-04
Applicant: 杭州电子科技大学
IPC: G06F18/241 , G06F18/213 , G06N3/0455 , G06N3/0464 , G06F18/25
Abstract: 本发明公开了一种基于MSTNet神经网络的奥茨海默多模态分类方法,包括如下步骤:步骤1、获取奥茨海默ADMC多维数据集,所述多维数据集包括统一数据来源的脑电图、核磁共振成像和量表数据,并将多维数据集划分为训练集和测试集;步骤2、构建MSTNet多模态神经网络模型,所述MSTNet多模态神经网络模型包括时间特征编码器、跨模态融合注意力模块、特征标记器和表格编码架构;步骤3、使用训练集对MSTNet多模态神经网络模型进行训练,结合多模态数据特点,对MSTNet多模态神经网络模型参数调优;步骤4、使用测试集评估完成训练的MSTNet多模态神经网络模型,最终实现奥茨海默多模态分类功能。该方法能够实现自动、智能的奥茨海默多模态分类功能,具有较高的分类准确率和效率。
-
公开(公告)号:CN118691752A
公开(公告)日:2024-09-24
申请号:CN202411182743.5
申请日:2024-08-27
Applicant: 杭州电子科技大学
Abstract: 本发明公开了基于无人机的室内外多尺度三维重建方法,该方法首先选择关键帧预测无人机轨迹和姿态,针对多尺度扭曲函数的空间细分,将帧中一个像素点作为视图射线进行采样,用一个可学习特征库捕获空间配置中图像点的特征。其次在空间中合成不同分辨率图像,将每个图像点位置和相应的特征通过全局‑局部场景编码器得到该像素的隐藏特征。最后像素的隐藏特征传递到渲染解码器MLP层,预测每条光线的局部颜色和密度,完成三维重建。本发明构建更连续、更平滑的整体结构,实现了更好的时间一致性,确保高保真的还原局部细节。
-
公开(公告)号:CN118038152A
公开(公告)日:2024-05-14
申请号:CN202410187005.3
申请日:2024-02-20
Applicant: 杭州电子科技大学
IPC: G06V10/764 , G06V10/52 , G06V10/774 , G06V10/80 , G06V10/82 , G06V10/25 , G06N3/084 , G06N3/09
Abstract: 本发明公开了基于多尺度特征融合的红外小目标检测和分类方法。首先根据红外小目标检测识别的任务目标,构建三分类红外图像小目标数据集;然后基于YOLOv5的先验知识设计用于红外目标检测的深度神经网络的拓扑结构Infra‑YOLO;最后基于自建的三分类红外图像小目标数据集,对提出的网络架构进行训练,获得单帧图像检测识别的模型。本发明方法能够有效提取红外图像中不同尺度大小目标的关键特征;不仅通过检测结果可视化来显示单帧红外图像中目标的位置信息和类别信息,而且以热力图的形式展示了特征图经过模型各模块显示的关键区域,可视化实验能更好地解释模型的决策过程,以此更好地辅助专业鉴定的过程。
-
公开(公告)号:CN117423105A
公开(公告)日:2024-01-19
申请号:CN202311219112.1
申请日:2023-09-21
Applicant: 杭州电子科技大学
IPC: G06V20/69 , G06V10/42 , G06V10/44 , G06V10/80 , G06V10/82 , G06V10/764 , G06V10/774 , G06V10/776 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种基于SE‑WBC40Net的白细胞显微图像自动分类方法,包括以下步骤:构建白细胞显微图像分类神经网络,所述白细胞显微图像分类神经网络包括网络分类器和添加在网络分类器上的SE块,所述SE块融入有三个残差块,每个所述残差块由两个卷积层和一个残差层组成,以便于提取突出的特征,并逐层生成特征表示;构建了自己的白细胞显微图像数据集,并划分为训练集和测试集;在训练集上通过一些训练策略来优化网络分类器,并对网络模型参数调优,使网络达到最优效果;使用测试集测试评估得到的网络模型,最终实现自动、智能的白细胞显微图像分类功能。从而实现自动、智能的白细胞显微图像分类功能,同时具有较高的分类准确率和效率。
-
公开(公告)号:CN116797605A
公开(公告)日:2023-09-22
申请号:CN202310380776.X
申请日:2023-04-11
Applicant: 杭州电子科技大学
IPC: G06T7/10 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于SCUnet++神经网络的肺栓塞CT图像识别分割方法,包括如下步骤:S1、构建用于识别分割肺栓塞CT图像的SCUnet++神经网络模型;S2、建立肺栓塞CT图像数据集,并划分为训练集和测试集;S3、使用训练集对SCUnet++神经网络模型进行训练,结合肺栓塞CT图像特点,对SCUnet++神经网络模型参数调优,得到最终分割网络模型;S4、使用测试集测试评估得到的最终分割网络模型,通过最终分割网络模型实现自动、智能的肺栓塞CT图像识别分割功能。该方法能够实现自动、智能的肺栓塞CT图像识别分割功能,具有较高的分割准确率和效率。
-
公开(公告)号:CN116630299A
公开(公告)日:2023-08-22
申请号:CN202310714829.7
申请日:2023-06-16
Applicant: 杭州电子科技大学
IPC: G06T7/00 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/0895 , G06T7/11 , G16H30/20
Abstract: 本发明公开了一种基于半监督神经网络的医学影像处理方法,S1、获取图片数据集;S2、构建DFCPS模型并训练,所述DFCPS模型包括数据增强策略和神经网络,所述神经网络包括主干网络、ASPP模块、上采样模块和Softmax函数;所述主干网络采用ResNet‑50,并引入残差连接构建深层网络,所述ASPP模块包括四个卷积层,四个所述卷积层的空洞卷积率分别为1、12、24、36;S3、使用训练好的神经网络进行图像分割。该方法通过合理地利用未标记数据和少量标记数据,以及强增强和弱增强的数据增强技术,对模型进行训练并取得理想的结果。
-
-
-
-
-
-
-
-
-