-
公开(公告)号:CN117853616B
公开(公告)日:2025-02-14
申请号:CN202410041920.1
申请日:2024-01-10
Applicant: 杭州电子科技大学
IPC: G06T11/60 , G06N3/0475 , G06N3/0455 , G06N3/096 , G06V10/44 , G06V10/82 , G06V10/764 , G06V10/56 , G06T15/55
Abstract: 本发明涉及计算机图形学和深度学习领域,尤其涉及一种基于神经辐射场的人体动作迁移图像生成方法,包括:将源人体动作图像和目标动作语义掩码进行预处理,并输入训练后的NeRF解耦生成器G,获取G输出的各像素点所属的语义类别概率S、密度σ和颜色C;基于语义类别概率S、密度σ和颜色C生成合成人体图像、合成语义掩码和反转语义掩码;根据合成语义掩码和反转语义掩码自适应调整所述G的参数;并重新获取最终输出的人体动作迁移图像的合成人体图像。上述方法解决了现有方法在动作迁移过程中形状和外观相互粘连的问题,并消除了人体图像合成对骨骼先验的依赖。
-
公开(公告)号:CN118262141B
公开(公告)日:2025-02-07
申请号:CN202410175080.8
申请日:2024-02-07
Applicant: 杭州电子科技大学
IPC: G06V10/764 , G06V10/774 , G06T3/4038 , G06N3/0464 , G06N3/0455 , G06N3/09
Abstract: 本发明公开一种基于边缘紧缩和曝光的伪装目标检测方法,包括:在训练阶段,针对训练集中每一训练图像及该训练图像的真值图,训练目标检测模型,使用模型中编码单元输出的编码特征经由条件随机场处理,获取中间过程损失和特征图,在编码单元对应的解码单元中基于特征图和编码特征和相邻解码单元输出的特征基于边缘曝光机制进行解码处理,获取中间过程损失,遍历每一解码单元获得最终输出的真值图,根据中间过程损失和最终的真值图的损失,调整目标检测模型的权重参数,获得训练的目标检测模型,进而对待处理的图像进行检测,获得输出的真值图。本发明的方法能够定位精确边缘,解决了现有技术中边缘无法精确区分的问题。
-
公开(公告)号:CN118279709A
公开(公告)日:2024-07-02
申请号:CN202410272861.9
申请日:2024-03-11
Applicant: 杭州电子科技大学
Abstract: 本发明涉及一种显著目标检测方法,包括:S1、获取待检测图像;S2、将待检测图像输入至训练好的显著检测模型中,得到显著图;显著检测模型包括:编码组件、解码组件;解码组件的前n个解码单元和编码单元对应,编码组件基于输入至显著检测模型的图像,输出编码特征以及低维度特征向量;解码组件的第m个解码单元,将低维度特征向量进行解码处理,得到解码特征;第a个解码单元与第a‑1个解码单元之间通过贝叶斯池化模块连接,将第a个解码单元所得到的解码特征贝叶斯池化处理,得到处理后的特征图;第x个解码单元,接收编码特征、贝叶斯池化处理后的特征图,采用边缘紧缩和前景曝光注意力机制进行处理,输出解码特征。
-
公开(公告)号:CN119672418A
公开(公告)日:2025-03-21
申请号:CN202411738028.5
申请日:2024-11-29
Applicant: 杭州电子科技大学
IPC: G06V10/764 , G06V10/25 , G06V10/44 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/09
Abstract: 本发明公开了一种融合目标检测和分割的井盖隐患集成识别方法及系统,该方法首先对井盖图片数据进行预处理,并划分单元格及锚框。其次通过YOLO v8x提取预处理后的井盖图片的多尺度特征,输出井盖预测结果。采用Bagging集成学习策略,基于井盖预测结果利用加权投票机制,得到井盖隐患类别的判别结果。然后将预处理后的井盖图片输入由PVTv2‑B4组成的编码器模块进行井圈特征提取,输出井圈预测结果。同时基于井圈预测结果对井圈进行二次分析,得到井圈隐患类别的判别结果。最后结合井盖和井圈的判别结果得到隐患类别。本发明提升了复杂场景下对井盖状态的精细化识别能力,实现对井圈边界的精准勾勒与定位。
-
公开(公告)号:CN118279709B
公开(公告)日:2024-12-24
申请号:CN202410272861.9
申请日:2024-03-11
Applicant: 杭州电子科技大学
Abstract: 本发明涉及一种显著目标检测方法,包括:S1、获取待检测图像;S2、将待检测图像输入至训练好的显著检测模型中,得到显著图;显著检测模型包括:编码组件、解码组件;解码组件的前n个解码单元和编码单元对应,编码组件基于输入至显著检测模型的图像,输出编码特征以及低维度特征向量;解码组件的第m个解码单元,将低维度特征向量进行解码处理,得到解码特征;第a个解码单元与第a‑1个解码单元之间通过贝叶斯池化模块连接,将第a个解码单元所得到的解码特征贝叶斯池化处理,得到处理后的特征图;第x个解码单元,接收编码特征、贝叶斯池化处理后的特征图,采用边缘紧缩和前景曝光注意力机制进行处理,输出解码特征。
-
公开(公告)号:CN118262141A
公开(公告)日:2024-06-28
申请号:CN202410175080.8
申请日:2024-02-07
Applicant: 杭州电子科技大学
IPC: G06V10/764 , G06V10/774 , G06T3/4038 , G06N3/0464 , G06N3/0455 , G06N3/09
Abstract: 本发明公开一种基于边缘紧缩和曝光的伪装目标检测方法,包括:在训练阶段,针对训练集中每一训练图像及该训练图像的真值图,训练目标检测模型,使用模型中编码单元输出的编码特征经由条件随机场处理,获取中间过程损失和特征图,在编码单元对应的解码单元中基于特征图和编码特征和相邻解码单元输出的特征基于边缘曝光机制进行解码处理,获取中间过程损失,遍历每一解码单元获得最终输出的真值图,根据中间过程损失和最终的真值图的损失,调整目标检测模型的权重参数,获得训练的目标检测模型,进而对待处理的图像进行检测,获得输出的真值图。本发明的方法能够定位精确边缘,解决了现有技术中边缘无法精确区分的问题。
-
公开(公告)号:CN117853616A
公开(公告)日:2024-04-09
申请号:CN202410041920.1
申请日:2024-01-10
Applicant: 杭州电子科技大学
IPC: G06T11/60 , G06N3/0475 , G06N3/0455 , G06N3/096 , G06V10/44 , G06V10/82 , G06V10/764 , G06V10/56 , G06T15/55
Abstract: 本发明涉及计算机图形学和深度学习领域,尤其涉及一种基于神经辐射场的人体动作迁移图像生成方法,包括:将源人体动作图像和目标动作语义掩码进行预处理,并输入训练后的NeRF解耦生成器G,获取G输出的各像素点所属的语义类别概率S、密度σ和颜色C;基于语义类别概率S、密度σ和颜色C生成合成人体图像、合成语义掩码和反转语义掩码;根据合成语义掩码和反转语义掩码自适应调整所述G的参数;并重新获取最终输出的人体动作迁移图像的合成人体图像。上述方法解决了现有方法在动作迁移过程中形状和外观相互粘连的问题,并消除了人体图像合成对骨骼先验的依赖。
-
-
-
-
-
-