-
公开(公告)号:CN118447312A
公开(公告)日:2024-08-06
申请号:CN202410557855.8
申请日:2024-05-08
Applicant: 杭州电子科技大学 , 浙江伽奈维医疗科技有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于交互式融合与匹配的三模态少样本目标检测方法,该方法首先对多模态少样本目标检测数据集进行预处理。其次采用U型网络架构,由权重共享的编码器、特征融合与匹配FC模块、多模态特征匹配MC模块和三层渐进式解码器,构建三模态少样本目标检测网络。最后采用二元交叉熵损失函数,以及深度监督的方式,计算损失并对三模态少样本目标检测网络进行训练。本发明有效提升泛化性能,并降低对数据标注的依赖,预测结果与实际物体边界更为一致。
-
公开(公告)号:CN118196388A
公开(公告)日:2024-06-14
申请号:CN202410359770.9
申请日:2024-03-27
Applicant: 杭州电子科技大学丽水研究院
IPC: G06V10/25 , G06V10/44 , G06V10/52 , G06V10/80 , G06V10/82 , G06V20/10 , G06N3/0455 , G06N3/0495 , G06N3/0464 , G06N3/084 , G06N3/0985
Abstract: 本发明公开了一种基于卷积的轻量级遥感图像显著目标检测方法,通过使用经过轻量化修改后的卷积神经网络,降低参数和计算复杂度,提高网络的推理速度;通过使用增强模块分别在空间和通道维度上对编码器特征进行增强,使其包含更准确信息;通过解码器模块逐步融合增强后特征,恢复特征图尺度,得到最终预测图。本发明模型拥有更小的参数量和计算复杂度,降低了对计算资源的需求,加快了推理速度,可以满足在边缘设备上进行实时运行的需求,生成的遥感图像显著性预测图更加准确。
-
公开(公告)号:CN117853450A
公开(公告)日:2024-04-09
申请号:CN202410032868.3
申请日:2024-01-10
Applicant: 杭州电子科技大学
IPC: G06T7/00 , G06V10/52 , G06N3/0464 , G06N3/0455 , G06N3/0495 , G06N3/08 , G06N5/04
Abstract: 本发明公开了一种基于视觉显著性的轻量化带钢表面缺陷检测方法,该方法首先进行尺度统一和数据扩增的数据预处理。其次构建基于视觉显著性的轻量化带钢表面缺陷检测模型,该缺陷检测模型包括编码器模块、多尺度卷积模块、解码器模块、预测头和可结构重参数的线性分支。最后训练构建好的轻量化带钢表面缺陷检测模型,进行测试,输出缺陷检测结果。本发明在不降低检测精度的前提下,显著降低的模型大小和远超的检测速度。
-
公开(公告)号:CN117612264A
公开(公告)日:2024-02-27
申请号:CN202311721804.6
申请日:2023-12-14
Applicant: 杭州电子科技大学
IPC: G06V40/20 , G06V10/762 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于图卷积网络的人体动作识别方法。首先获取基于骨架的动作识别数据集。对数据集中的缺失数据进行特征插补,得到补全后的输入序列;通过加权邻接矩阵构造方法,获得改进的加权邻接矩阵;然后根据改进的加权邻接矩阵训练网络框架;网络框架由两部分组成:GCN网络以及SoftMax分类器。最后通过训练好的网络框架对待识别的人体图序列S进行人体动作识别。本发明通过在单个人体动作识别管道中结合缺失联合处理预处理步骤和一种新颖的邻接矩阵构建方法来提高基于GCN的方法的人类动作识别性能。同时本发明的框架更轻量化,具有更少的可学习参数。
-
公开(公告)号:CN117333456A
公开(公告)日:2024-01-02
申请号:CN202311299639.X
申请日:2023-10-09
Applicant: 杭州电子科技大学
IPC: G06T7/00 , G06T7/73 , G06V10/25 , G06V10/46 , G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于显著目标检测的条带钢缺陷预测方法,包括如下步骤:S1、通过由5层编码器层组成的编码器提取图片中的5层特征,分别记为h1、h2、h3、h4、h5;S2、用桥接层连接编码器,通过桥接层输出hbg;S3、使用解码器模块进行解码,所述解码器模块包括解码器、5层FEE Module,所述解码器由5层解码器层组成,所述编码器的输出h5输入相应的第5层FEE Module中,所述h4与解码器第5层的输出以及hbg送入上层FEE Module中,上层FEE Module输出作为上层解码器的输入;S4、由最上层的解码器层的输出,经过一个1*1的卷积,将通道输出成1,即为最后的输出结果。该方法基于显著目标检测的方法能够自动识别和定位潜在的缺陷区域,减少了人工操作的需求。
-
公开(公告)号:CN114898120B
公开(公告)日:2023-04-07
申请号:CN202210586991.0
申请日:2022-05-27
Applicant: 杭州电子科技大学
IPC: G06V10/46 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于卷积神经网络的360度图像显著目标检测方法,包括如下步骤:S1、图像转换;S2、搭建特征金字塔网络;S3、采用四个特征聚合模块,每个模块由一个特征转换子模块完成立方体投影特征向等距形特征转换并与原等距形图像特征组合后,使用一个空洞卷积池化金字塔子模块实现特征的优化,从而得到多层次的聚合特征;S4、将多层次的聚合特征连接并馈送到注意力集成模块,通过推断空间和通道注意机制自适应地选择可靠空间和通道信息与原特征融合得到最终特征并完成显著目标检测。该方法使用图像映射关系基于等距形360度图像构建对应的立方体投影图像,使用双种类图像作为输入解决了单一等矩形图像输入造成的球面到平面投影的不良失真问题。
-
公开(公告)号:CN115294359A
公开(公告)日:2022-11-04
申请号:CN202210990986.6
申请日:2022-08-17
Applicant: 杭州电子科技大学 , 中电数据服务有限公司
Abstract: 本发明涉及一种基于深度学习的高分辨率图像显著性目标检测方法,包括步骤一、低分辨率分支的特征提取;步骤二、中分辨率分支的特征提取;步骤三、高分辨率分支的特征提取;步骤四、多分辨率特征的融合;步骤五、残差解码网络得到预测图;步骤六、级联标签监督并进行端到端训练。本发明提供的网络模型是并行网络,可以在充分有效地利用语义信息和细节信息来实现对高分辨率图像中显著性目标的预测的同时,在网络中保持高分辨率。
-
公开(公告)号:CN115019068A
公开(公告)日:2022-09-06
申请号:CN202210580683.7
申请日:2022-05-26
Applicant: 杭州电子科技大学 , 中电数据服务有限公司
Abstract: 本发明公开了一种基于编解码架构的渐进式显著目标识别方法,包括如下步骤:S1、图像数据预处理,并将预处理后的图像数据制作成训练集;S2、搭建目标识别网络并获取精确显著图像;S3、训练集中的图像数据输入至目标识别网络并训练。本发明通过在网络编码过程、解码过程中采用不同的渐进融合方式,有效减少了层间、尤其是间隔层之间的噪声污染保证了多尺度特征信息的有效利用,另外,通过渐进式连接方法取代传统模型中的简单跳跃连接、长连接,在保证多尺度特征信息能有效传递的同时,对不同特征层间的噪声信息进行筛除、提纯,使得伪装图像的显著目标检测模型性能得到巨大提升。
-
公开(公告)号:CN113554599A
公开(公告)日:2021-10-26
申请号:CN202110718776.7
申请日:2021-06-28
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于人类视觉效应的视频质量评价方法。本发本发明方法包括内容特征提取网络、上下文注意机制网络和时间记忆效应网络。模型的输入是当前帧图像。首先,深度特征提取网络提取内容感知特征,注意力模块采用循环神经网络强化学习内容感知特征,再将注意力感知转移。然后,将内容感知特征与注意力感知转移相结合得到当前帧的质量得分,通过时间记忆效应模型对帧质量得分进行全局平均池化,得到视频的总体质量。本发明方法提供的网络模型可以充分有效地利用模仿人类视觉行为来实现对视频的质量评价。
-
公开(公告)号:CN113536978A
公开(公告)日:2021-10-22
申请号:CN202110720395.2
申请日:2021-06-28
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于显著性的伪装目标检测方法。本发明第一条路径首先提取图像的低级、中级与高级特征并通过合并区分性特征与多尺度特征融合相加得到一个初始的伪装目标区域特征图。第二条路径将第一条路径得到的中层特征与初始伪装目标区域特征图融合的同时对特征进行加强,然后再次提取高级特征并进行与第一条路径相似的操作得到最终的伪装目标区域特征图,其结果为一张像素值在[0,1]的灰度图。本发明将注意力机制引入图像处理,以初始预测图作为注意力引导中级特征的增强。同时使用残差增强模块对特征进行处理增强特征。通过搜索识别两个阶段对图像中的伪装目标区域进行检测。利用图像的多级特征与显著性引导实现对伪装目标的预测。
-
-
-
-
-
-
-
-
-