图像敏感内容的检测方法、装置、电子装置和存储介质

    公开(公告)号:CN119904866A

    公开(公告)日:2025-04-29

    申请号:CN202411942785.4

    申请日:2024-12-25

    Abstract: 本申请涉及一种图像敏感内容的检测方法、装置、电子装置和存储介质,其中,该图像敏感内容的检测方法包括:获取待检测图像;将待检测图像输入至目标多模态大模型中的视觉特征判断网络进行视觉检测处理,得到初始图像语义信息,并将初始图像语义信息输入至目标多模态大模型中的文本特征判断网络进行文本检测处理,得到目标图像语义信息;获取预设的第一向量库;第一向量库中存储有敏感语义向量;基于目标图像语义信息与第一向量库中各敏感语义向量之间的第一匹配结果,生成待检测图像的第一敏感内容检测结果。通过本申请,解决了图像敏感内容检测的准确性低的问题。

    基于思维链的大模型敏感内容审查方法和装置

    公开(公告)号:CN119862872A

    公开(公告)日:2025-04-22

    申请号:CN202411921547.5

    申请日:2024-12-25

    Abstract: 本申请涉及一种基于思维链的大模型敏感内容审查方法和装置,其中,该基于思维链的大模型敏感内容审查方法包括:构建用于指示目标模型审查逻辑的思维链模板;思维链模板包括针对目标模型的角色设定、行为描述和输出规范;基于思维链模板和预设的内容标签体系,生成对应的提示词;基于提示词,通过目标模型对待检测文本进行审查,得到待检测文本对应的第一输出结果。通过本申请,解决了已有的基于训练的检测方法无法及时应对不断变化的敏感内容风险,导致泛化性差的问题,实现了对敏感内容的灵活检测,有效提高泛化性。

    基于自监督辅助任务的深度合成音频跨域检测方法和装置

    公开(公告)号:CN119479611B

    公开(公告)日:2025-04-29

    申请号:CN202510032491.6

    申请日:2025-01-09

    Abstract: 本申请涉及一种基于自监督辅助任务的深度合成音频跨域检测方法和装置,其中,该方法包括:获取待检测音频作为测试数据集;基于预设的自监督辅助任务对测试数据集进行增广处理,得到增广数据集;基于增广数据集,将自监督辅助任务作为优化目标,对预训练的目标检测模型进行微调,得到目标微调模型;目标检测模型的训练任务包括伪造检测任务和自监督辅助任务;将测试数据集输入到目标微调模型中,得到检测结果。通过本申请,解决了相关技术中泛化性不足、跨域检测效果明显下降的问题,提高模型泛化性的同时,能够极大程度上降低模型训练的开销;并且够适应测试数据集中深度伪造属性的分布差异,从而提升跨域检测性能。

    可拓展的大语言模型越狱攻击方法、装置、介质和产品

    公开(公告)号:CN119884311A

    公开(公告)日:2025-04-25

    申请号:CN202411948089.4

    申请日:2024-12-26

    Abstract: 本申请涉及一种可拓展的大语言模型越狱攻击方法、装置、介质和产品,方法包括:获取与越狱任务对应的第一提示,并根据问题模板生成所述第一提示的第一回答数据;根据与所述越狱任务对应的角色描述和/或情境描述、预设的格式需求,更新预设的第一提示模板中的写入内容;以所述第一回答数据为示例,结合第一提示模板中的所述角色描述和/或情境描述对所述第一提示进行转写,得到符合所述格式需求的第二提示;获取目标大语言模型基于所述第二提示生成的第二回答数据。采用本方法能够解决大语言模型应对越狱攻击时的安全边界的评估范围狭窄的问题。

    图像水印处理网络的训练方法和水印嵌入方法

    公开(公告)号:CN119887489A

    公开(公告)日:2025-04-25

    申请号:CN202411946994.6

    申请日:2024-12-26

    Abstract: 本申请涉及一种图像水印处理网络的训练方法和水印嵌入方法,其中,该图像水印处理网络的训练方法包括:在训练阶段,在编码器网络和解码器网络之间的扰动层,基于预设的像素变换,和/或,预设的坐标变换,对编码器网络输出的图像添加扰动,以对编码器网络和解码器网络进行训练;以及,基于预设的残差信息损失函数,对编码器网络和解码器网络进行训练,得到训练后的图像水印处理网络;残差信息损失函数基于水印残差图像与水印图像之间的互信息构建;水印残差图像为水印图像与对应的原始图像的残差图像。其能够提高对图像扰动的鲁棒性,并同时降低身份信息泄露的风险。

    基于自监督辅助任务的深度合成音频跨域检测方法和装置

    公开(公告)号:CN119479611A

    公开(公告)日:2025-02-18

    申请号:CN202510032491.6

    申请日:2025-01-09

    Abstract: 本申请涉及一种基于自监督辅助任务的深度合成音频跨域检测方法和装置,其中,该方法包括:获取待检测音频作为测试数据集;基于预设的自监督辅助任务对测试数据集进行增广处理,得到增广数据集;基于增广数据集,将自监督辅助任务作为优化目标,对预训练的目标检测模型进行微调,得到目标微调模型;目标检测模型的训练任务包括伪造检测任务和自监督辅助任务;将测试数据集输入到目标微调模型中,得到检测结果。通过本申请,解决了相关技术中泛化性不足、跨域检测效果明显下降的问题,提高模型泛化性的同时,能够极大程度上降低模型训练的开销;并且够适应测试数据集中深度伪造属性的分布差异,从而提升跨域检测性能。

    以控制为中心的自监督学习的双阶段通用智能体训练方法

    公开(公告)号:CN117540788A

    公开(公告)日:2024-02-09

    申请号:CN202410029633.9

    申请日:2024-01-09

    Abstract: 本发明公开了一种以控制为中心的自监督学习的双阶段通用智能体训练方法,属于人工智能感知决策技术领域,包括以下步骤:步骤1、设计多模态的决策基础模型,包括编码器和控制解码器;步骤2、收集跨领域跨模态跨具身的多任务数据集;步骤3、使用以控制为中心的自监督损失函数通过自监督学习训练多模态的决策基础模型;步骤4、通过多模态指令对齐的模仿学习来训练多模态的决策基础模型;步骤5、将训练完成的多模态的决策基础模型部署到平台中进行测试使用。本发明提供了一种以控制为中心的自监督学习的双阶段通用智能体训练方法,具有卓越的适应性,能够适应跨领域、跨场景和跨具身的广泛决策任务。

    一种基于隐空间仿射的文生图模型测评方法

    公开(公告)号:CN117494118A

    公开(公告)日:2024-02-02

    申请号:CN202311771082.5

    申请日:2023-12-21

    Abstract: 本发明公开了一种基于隐空间仿射的文生图模型测评方法,涉及文生图模型安全性测评技术领域,包括以下步骤:S1:根据目标生成的有害内容撰写相应有害提示词P;S2:将有害提示词P输入文生图模型;S3:分离被禁止的提示词PN的敏感部分W;S4:去除PN的敏感部分W并记为PT,将PT输入文生图模型测试提示词能否通过安全模块的限制;S5:利用隐空间仿射原理重新生成敏感部分W的替代词,与PT重新构成攻击提示词PA;S6:将PA输入文生图模型测试攻击效果。本发明采用上述的一种基于隐空间仿射的文生图模型测评方法,问询次数更低,效率更高,生成图像种类更可控。

    一种针对链接攻击与伪造攻击的相机指纹隐私保护方法

    公开(公告)号:CN116260619A

    公开(公告)日:2023-06-13

    申请号:CN202211674524.X

    申请日:2022-12-26

    Abstract: 本发明公开了一种针对链接攻击与伪造攻击的相机指纹隐私保护方法,包括通过高斯分布采样得到至少三个子模糊噪声,获得一张待模糊处理的图片,通过根据子模糊噪声数量生成对应数量子模糊噪声系数以及噪声掩码(由0或1组成的矩阵),并且通过子模糊噪声系数以及噪声掩码将所有子模糊噪声组合成一个模糊噪声等步骤,本发明实现了在不影响合法用户正常通过基于相机指纹的身份认证系统的前提下,同时解决了链接攻击与伪造攻击两大安全隐患,可以帮助用户有效地防御身份链接攻击,速度上远远快于多次迭代去噪,实现稳定的相机指纹伪造攻击检测,避免不法分子窃取合法用户相机指纹用以通过身份认证系统。

Patent Agency Ranking