-
公开(公告)号:CN118196850A
公开(公告)日:2024-06-14
申请号:CN202410136122.7
申请日:2024-01-31
Applicant: 杭州电子科技大学
IPC: G06V40/16 , G06V10/26 , G06V10/82 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了基于深度学习的高分辨率艺术人脸标记点检测方法,首先准备用于模型训练和评估的艺术人脸数据集及对应的标记点注释;分别得到全局低分辨率预测标记点检测图和各区域高分辨率预测标记点检测图;通过均方差损失优化全局低分辨率和区域高分辨率预测标记点检测图;最后将各个区域的高分辨率预测标记点检测图还原回全局坐标系即实现人脸标记点检测。本发明在绘画和版画等艺术品人脸标记点检测中表现出杰出的效果。本发明提出了一种全局编‑解码器网络和区域编‑解码器网络相结合的方式实现对艺术人脸标记点进行粗略和细化标记,标记效果比现有方法更优异。
-
公开(公告)号:CN118195913A
公开(公告)日:2024-06-14
申请号:CN202410136127.X
申请日:2024-01-31
Applicant: 杭州电子科技大学
IPC: G06T5/50 , G06T5/60 , G06N3/0464 , G06N3/0455 , G06N3/09
Abstract: 本发明公开了一种基于语义驱动的人体图像合成方法。首先通过姿态编码器对人体姿态热图进行处理;同时通过一个图像编码器根据真实图像和对应的语义图,根据语义图将复杂的人体进行拆分;最终,将姿态编码器和图像编码器的数据都输入到特征融合模块,在经过最终的采样,进行人物图像合成后,将数据输入到鉴别器中,由鉴别器判别真伪;之后再进行下一轮的训练,直到合成出高质量,可控的人体图像。本发明方法,同时能够将语义图像和训练图像结合,有效降低人物图像合成难度,增强图像合成质量。通过特征融合模块,能够解耦出人物的外观和姿态,能够实现高效且精确地控制人物姿态,并且与外观不存在纠缠。
-
公开(公告)号:CN117217205A
公开(公告)日:2023-12-12
申请号:CN202311186741.9
申请日:2023-09-14
Applicant: 杭州电子科技大学
Inventor: 颜成钢 , 付赫男 , 刘一秀 , 高宇涵 , 孙垚棋 , 朱尊杰 , 王帅 , 王鸿奎 , 殷海兵 , 张继勇 , 李宗鹏 , 赵治栋 , 丁贵广 , 付莹 , 郭雨晨 , 赵思成
IPC: G06F40/211 , G06F40/30 , G06F18/214 , G06N20/00
Abstract: 本发明公开了一种面向CLIP模型的图片文本后门攻击方法,首先生成触发词和触发图片,再将从句选择合适的位置添加进想要攻击的句子中形成中毒样本,将触发图片以特定的噪声比例添加进原始想要下毒的图片中形成中毒图片;最后用中毒数据集训练CLIP模型,推理阶段用触发词与触发图片替换过的句子或图片,从而诱骗目标模型预测目标类别。本发明隐蔽性好,中毒样本在训练集中不容易发现,图片触发器几乎可以看做是隐形的,文本触发器既不改变原句语义,也不会产生语法错误,提高了训练集中有毒样本的隐蔽性;能够达到攻击方法灵活,攻击成功率高,攻击样本质量好的效果。
-
公开(公告)号:CN118351391A
公开(公告)日:2024-07-16
申请号:CN202410350933.7
申请日:2024-03-26
Applicant: 杭州电子科技大学
IPC: G06V10/774 , G06V10/764 , G06V10/82 , G06N3/0475 , G06N3/045 , G06N3/094
Abstract: 本发明公开了一种后门攻击可见触发器视觉优化方法。确定要攻击的机器学习模型和目标应用场景;选择一个适合目标应用的具有代表性的数据集;设计针对性触发器,加入数据集并训练:在目标模型上测试添加了触发器的数据样本;根据测试结果调整触发器的特性,以提高效果和隐蔽性;最后识别和剔除可能引起怀疑的样本,进一步优化这些样本,减少异常特征。本发明方法能够使触发器或恶意内容在视觉上更难被识别,增加了攻击的隐秘性和有效性,促进后门攻击和防御的研究。通过精细调整触发器的特性,使其更加难以被现有的后门防御系统所识别。优化后的触发器可以更好地融入背景中,减少被人眼直接识别的可能性。
-
公开(公告)号:CN118279709A
公开(公告)日:2024-07-02
申请号:CN202410272861.9
申请日:2024-03-11
Applicant: 杭州电子科技大学
Abstract: 本发明涉及一种显著目标检测方法,包括:S1、获取待检测图像;S2、将待检测图像输入至训练好的显著检测模型中,得到显著图;显著检测模型包括:编码组件、解码组件;解码组件的前n个解码单元和编码单元对应,编码组件基于输入至显著检测模型的图像,输出编码特征以及低维度特征向量;解码组件的第m个解码单元,将低维度特征向量进行解码处理,得到解码特征;第a个解码单元与第a‑1个解码单元之间通过贝叶斯池化模块连接,将第a个解码单元所得到的解码特征贝叶斯池化处理,得到处理后的特征图;第x个解码单元,接收编码特征、贝叶斯池化处理后的特征图,采用边缘紧缩和前景曝光注意力机制进行处理,输出解码特征。
-
公开(公告)号:CN117788305A
公开(公告)日:2024-03-29
申请号:CN202311687866.X
申请日:2023-12-08
Applicant: 杭州电子科技大学
IPC: G06T5/50 , G06T17/00 , G06V40/10 , G06V10/26 , G06V20/70 , G06V10/764 , G06V10/44 , G06V10/422 , G06V10/82 , G06N3/0455 , G06N3/09
Abstract: 本发明公开了一种基于语义引导的神经人体动作迁移方法。本发明方法仅从单视角人体图像和对应的人体各部位解析语义图中学习并解耦人体外观和形状,然后用语义反转的方法实现人体动作迁移和重建。本发明方法解决了现有方法中对大量多视角人体图像数据需求的问题,并消除了三维人体图像合成对骨骼先验的依赖。
-
公开(公告)号:CN115222998B
公开(公告)日:2023-01-03
申请号:CN202211120458.1
申请日:2022-09-15
Applicant: 杭州电子科技大学 , 浙江大华技术股份有限公司
Inventor: 颜成钢 , 殷俊 , 颜拥 , 王洪波 , 胡冀 , 熊剑平 , 李亮 , 郑博仑 , 林聚财 , 孔书晗 , 王亚运 , 孙垚棋 , 金恒 , 朱尊杰 , 高宇涵 , 殷海兵 , 王鸿奎 , 陈楚翘 , 刘一秀 , 李文超 , 王廷宇 , 张勇东 , 张继勇
IPC: G06V10/764 , G06V10/30 , G06V10/40 , G06V10/774 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种图像分类方法。首先构建通道维度注意力网络和空间维度多尺度自注意力网络;然后将输入图像预处理后输入通道维度注意力网络,生成基于通道维度的注意力特征图;将基于通道维度的注意力特征图输入至空间维度的多尺度自注意力网络,生成基于特征图空间维度的多尺度自注意力特征图;最后将最终生成的多维度多尺度注意力特征图输入到分类器单元中,将模型输出的向量转换成概率表示,完成图像分类。本发明设计了一种新的多尺度自注意力机制,它利用一系列的深度可分离卷积操作,生成特征信息高度相关的局部特征图和区域特征图,不但可以强化自注意力机制的细粒度特征提取能力,还可以高效的提取有效的全局信息。
-
-
-
-
-
-