-
公开(公告)号:CN118966314A
公开(公告)日:2024-11-15
申请号:CN202411119125.6
申请日:2024-08-15
申请人: 电子科技大学(深圳)高等研究院
IPC分类号: G06N3/094 , G06V10/82 , G06V10/25 , G06V10/774 , G06V10/764 , G06N3/084
摘要: 本发明公开了一种针对目标检测模型的对抗训练方法,首先收集干净样本构成训练样本集将目标检测模型初步训练到收敛,然后依次生成置信度任务对抗样本集、分类任务对抗样本集和定位任务对抗样本集,并分别采用各个对抗样本集对目标检测模型进行对抗训练,在对抗训练时计算损失函数对目标检测模型中各个参数的梯度敏感度,将高梯度敏感度的参数进行更新,其他参数则不更新,循环以上过程进行对抗训练直到达到对抗训练结束条件。本发明通过拆分对抗训练任务并生成不同对抗样本进行参数更新,从而减轻不同任务之间的梯度冲突,在不增加网络容量的情况下,平衡目标检测模型在对抗样本上的鲁棒性和在干净样本上的准确率。
-
公开(公告)号:CN118916520A
公开(公告)日:2024-11-08
申请号:CN202411020426.3
申请日:2024-07-29
申请人: 电子科技大学(深圳)高等研究院
IPC分类号: G06F16/783 , G06F16/732 , G06F16/33 , G06F16/332 , G06F18/22 , G06F18/25 , G06V20/40 , G06V20/70 , G06F40/126 , G06F40/30 , G06N3/0455 , G06N3/08
摘要: 本发明公开了一种基于全局与局部语义的视频‑文本检索方法,构建包括文本特征提取模块,视频特征提取模块,全局交互模块,局部交互模块和相似度融合模块的视频‑文本跨模态匹配模型,全局交互模块用于对文本特征提取模块和视频特征提取模块所提取得到的文本特征和视频特征计算得到全局相似度,局部交互模块用于基于Transformer编码器对文本的词特征和视频特征计算得到局部相似度,再由相似度融合模块将全局相似度和局部相似度融合得到视频‑文本的匹配度。本发明构建视频‑文本跨模态匹配模型,通过挖掘跨模态的潜在共享语义来优化视频‑文本检索。
-
公开(公告)号:CN118968546A
公开(公告)日:2024-11-15
申请号:CN202410970722.3
申请日:2024-07-19
申请人: 电子科技大学(深圳)高等研究院
IPC分类号: G06V40/10 , G06V10/75 , G06V10/26 , G06V10/30 , G06V10/44 , G06V10/82 , G06N3/0455 , G06N3/0464
摘要: 本发明公开了一种基于轮廓信息的人体姿态估计域泛化方法,首先设置三个子模型并分别采用相应的训练样本集进行预训练,包括实例分割模型,轮廓检测模型和初始人体姿态估计模型,然后基于预训练好的三个子模型构建基于轮廓信息的人体姿态估计模型,采用两个轮廓检测模型分别从输入图像和分割得到的行人图像中提取人体轮廓并融合得到最终的人体轮廓,在初始人体姿态估计模型中视觉提取编码器中每层Transformer编码器后增加幅度处理模块用于对特征进行增强,对基于轮廓信息的人体姿态估计模型进行训练后,采用该模型估计得到输入图像的人体姿态图像。本发明通过引入轮廓信息提高人体姿态估计域泛化的性能。
-
公开(公告)号:CN118821086A
公开(公告)日:2024-10-22
申请号:CN202410926631.X
申请日:2024-07-10
申请人: 电子科技大学(深圳)高等研究院
IPC分类号: G06F21/16 , G06F40/279 , G06F40/30
摘要: 本发明公开了一种针对大语言模型转述攻击的基于句子语义的水印方法,在生成式大语言模型生成新的词语标记时,先根据输入标记序列生成词汇表中每个词语标记的对数概率,采用语义嵌入模型得到当前输入标记序列的语义嵌入向量,并将其投影至预先设置的向量空间,得到对应的投影语义嵌入向量,从中选取最小的若干元素序号构成绿色列表,对于词汇表中每个词语标记,如果属于绿色列表则根据预设的水印强度对其对数概率进行修正,如果不属于绿色列表则当前对数概率即为修正后的对数概率,根据修正后的对数概率选择新的词语标记,如此循环,生成水印文本。本发明通过生成绿色列表并指导新词语标记的生成逻辑,以抵抗对于大语言模型的转述攻击。
-
公开(公告)号:CN118797726A
公开(公告)日:2024-10-18
申请号:CN202411084305.5
申请日:2024-08-08
申请人: 电子科技大学(深圳)高等研究院
IPC分类号: G06F21/62 , G06V40/10 , G06V10/774 , G06F16/583
摘要: 本发明公开了一种基于稳定扩散模型的行人图像数据集处理方法,首先对于待匿名处理的行人图像数据集中每张行人图像生成对应的提示文本,根据实际需要构建稳定扩散模型并进行预训练,然后采用行人图像数据集对其进行微调训练,然后生成与行人图像数据集的提示文本不同的新提示文本,分别多次输入微调训练后的稳定扩散模型生成行人图像,为根据同一个新提示文本所生成的所有行人图像分配相同的行人身份ID,构成匿名行人图像数据集。本发明对行人图像数据集进行有效匿名处理,在不牺牲数据集性能的前提下有效保护行人图像的隐私。
-
公开(公告)号:CN118939828A
公开(公告)日:2024-11-12
申请号:CN202411142461.2
申请日:2024-08-20
申请人: 电子科技大学(深圳)高等研究院
IPC分类号: G06F16/583 , G06F16/538 , G06F18/214 , G06V10/40 , G06V10/74 , G06V10/80 , G06V10/82 , G06N3/0499 , G06N3/045
摘要: 本发明公开了一种基于图像量化的通用图像检索方法,首先构建训练样本集,再构建包括视觉特征提取模块,一阶量化跨域模块,组合特征提取模块和二阶量化跨类别模块的图像量化模型;在训练过程中,先随机初始化一阶代码本,经过视觉特征提取模块和一阶代码本利用对比学习机制学习到跨域一致性特征,基于一阶码本更新得到二阶码本,通过组合特征提取模块和二阶码本获取新类别感知的特征,再由二阶量化跨类别模块得到量化组合特征;在检索时将搜索图像库中的每张图像和待检测图像输入图像量化模型得到每张图像的组合特征,基于该组合特征得到检索结果。本发明可有效解决图像检索任务中的跨领域和跨类别挑战,显著提高图像检索的准确性和效率。
-
公开(公告)号:CN116797874A
公开(公告)日:2023-09-22
申请号:CN202310717695.4
申请日:2023-06-16
申请人: 嵩山实验室 , 电子科技大学(深圳)高等研究院
IPC分类号: G06V10/774 , G06V10/764 , G06V10/82 , G06N3/045
摘要: 本发明涉及图像分类模型的安全领域,具体涉及一种基迁移的对抗样本制备方法,其首先,将输入图像按设定的采样次数复制并分别添加扰动,获得一组分别按随机方向接近替代模型的决策边界的边界点样本;然后,利用替代模型,计算各边界点样本的损失梯度;之后,计算边界点样本的平均梯度,并以平均梯度的方向添加设定步长的扰动,获得当前步的输出图像;最终,通过多次的迭代获得对抗样本。该方法,通过对替代模型决策边界信息的充分利用,进行边界拟合,增强了对抗样本的迁移性,迁移范围广,能有效评估多种不同结构的模型,评估结果更接近目标模型的鲁棒性下限。适用于基于迁移的黑盒模型鲁棒性评估。
-
公开(公告)号:CN118918610A
公开(公告)日:2024-11-08
申请号:CN202411020428.2
申请日:2024-07-29
申请人: 电子科技大学(深圳)高等研究院
IPC分类号: G06V40/10 , G06V10/26 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/08
摘要: 本发明公开了一种基于自我提示学习的域泛化行人重识别方法,首先构建根据提示对输入图像进行分割得到前景图像的图像分割模型,并采用大规模图像分割任务的数据集进行预训练,然后以预训练好的图像分割模型作为基础,构建基于自我提示的行人重识别模型,在该模型中通过注意力引导的生成自我提示集合,从而生成分割提示,并基于以此得到的分割结果,通过软掩码技术对特征图进行处理,然后二次提取行人特征,根据该二次行人特征进行行人重识别。本发明通过自动生成高质量的提示集,进行像素级别的目标‑场景分离,以缓解模型在未见过的相机场景中受到背景和遮挡等干扰导致的泛化能力不佳,提高行人重识别的准确性。
-
-
-
-
-
-
-