一种多模态模型的训练方法、图像分类方法及装置

    公开(公告)号:CN117593566A

    公开(公告)日:2024-02-23

    申请号:CN202311412779.3

    申请日:2023-10-27

    Inventor: 梁坚 王政博

    Abstract: 本发明提供一种多模态模型的训练方法、图像分类方法及装置,通过初始多模态模型中的生成器,确定通用类别名对应的通用图像数据,生成器是在变分自编码器的基础上,应用任务图像数据及其类别名训练得到的;变分自编码器基于初始多模态模型中的文本编码器构建得到;根据任务图像数据及其类别名,以及通用图像数据及其通用类别名,对初始多模态模型进行模型微调,以使模型在更好地适应于当前任务的同时,提升在其他任务上的性能,得到多模态模型,克服了传统方案中微调训练会影响模型的泛化性能,从而使得模型在其他任务上的表现欠佳的缺陷,不仅提升了模型在当前任务上的性能,还改善了其在其他任务上的表现,实现了多模态模型泛化能力的提升。

    模型优化方法、装置、电子设备、存储介质及产品

    公开(公告)号:CN117521774A

    公开(公告)日:2024-02-06

    申请号:CN202311270480.9

    申请日:2023-09-27

    Inventor: 梁坚 生力军

    Abstract: 本发明提供一种模型优化方法、装置、电子设备、存储介质及产品,涉及数据处理技术领域,包括:将未携带标签的目标域数据输入教师模型,得到教师模型的第一输出;其中,教师模型是基于携带有标签的源域数据训练得到的源域模型;将伪对抗样本和目标域数据输入预设学生模型,得到预设学生模型的第二输出;其中,伪对抗样本是根据未携带标签的目标域数据和预设学生模型确定的;基于第一输出和第二输出,确定预设学生模型的训练目标;基于目标域数据、伪对抗样本和训练目标对预设学生模型进行训练,在满足预设训练条件的情况下,得到训练好的学生模型;基于训练好的学生模型和源域模型进行模型自适应处理。

    模型的安全迁移方法及装置
    4.
    发明公开

    公开(公告)号:CN119989342A

    公开(公告)日:2025-05-13

    申请号:CN202510064446.9

    申请日:2025-01-15

    Inventor: 梁坚 生力军

    Abstract: 本发明提供一种模型的安全迁移方法及装置,方法包括:基于潜在危险模型分别应用目标域样本数据和噪声样本数据进行模型预测,得到目标预测向量和噪声预测向量,潜在危险模型基于待迁移模型和目标域样本数据训练得到;基于各样本类别下目标域样本数据对应的目标预测向量和噪声预测向量,计算得到各样本类别的类别权重;基于目标域样本数据和类别权重,对待迁移模型进行重训练得到目标域模型。本发明提供的方法,通过利用潜在后门样本对于噪声干扰较为鲁棒的现象为所有目标域样本数据分配权重;基于目标域样本数据和各样本类别的类别权重,对待迁移模型进行重训练,实现对来自目标域的潜在后门攻击的有效防御,且保证目标域模型的正常任务性能。

    网络模型窃取行为检测方法及装置

    公开(公告)号:CN117220932A

    公开(公告)日:2023-12-12

    申请号:CN202311112055.7

    申请日:2023-08-30

    Inventor: 赫然 梁坚 关霁洋

    Abstract: 本发明提供一种网络模型窃取行为检测方法及装置,该网络模型窃取行为检测方法包括:获取探测数据集;基于源模型对探测数据集进行相关性分析,得到第一相关性矩阵,基于非窃取模型对探测数据集进行相关性分析,得到第二相关性矩阵,基于待检测模型对探测数据集进行相关性分析,得到第三相关性矩阵;基于第一距离、第二距离和误分类率,得到窃取行为检测距离,窃取行为检测距离用于检测待检测模型是否面临窃取攻击。本发明所述方法能够保证网络模型在主任务上的性能稳定,且不受对抗训练和迁移学习的影响,提升了模型知识产权算法的鲁棒性及检测效果,同时不需要训练替代模型,提高模型的算法运行效率。

    一种基于空类蒸馏和大类抑制的解决联邦学习中数据异质性问题的方法及系统

    公开(公告)号:CN119939461A

    公开(公告)日:2025-05-06

    申请号:CN202510008150.5

    申请日:2025-01-03

    Inventor: 梁坚 郭况浦

    Abstract: 本发明公开了一种基于空类蒸馏和大类抑制的解决联邦学习中数据异质性问题的方法及系统,属于联邦学习技术领域。所述方法包括每个用户统计本地训练数据集中不存在训练样本的类别,记为空类集合;在本地训练过程中,将全局模型和本地模型在每个样本输出中对应空类别的logit值基于空类蒸馏损失函数加以约束;每个用户统计本地训练数据集的类别分布概率;在本地训练过程中,基于统计的所述本地训练数据集的类别分布概率,直接对本地模型在每个样本输出的logit值基于大类抑制损失函数进行约束。本发明有效缓解了联邦学习中空类别准确率下降和小类别样本误分类的问题,从而减少了数据异质性对全局模型性能的负面影响。

    人脸视频深度伪造检测方法及装置

    公开(公告)号:CN117542124A

    公开(公告)日:2024-02-09

    申请号:CN202311268531.4

    申请日:2023-09-27

    Inventor: 梁坚 徐雨婷

    Abstract: 本发明提供一种人脸视频深度伪造检测方法及装置,涉及图像处理技术领域,包括:对目标视频进行人脸区域识别和裁剪,得到仅包含人脸区域的人脸区域视频;根据所述人脸区域视频中M组不同的连续N帧人脸区域视频帧,生成所述人脸区域视频对应的M帧人脸区域缩略图,其中,每帧所述人脸区域缩略图包括连续N帧人脸区域视频帧;将各帧所述人脸区域缩略图分别输入人脸视频深度伪造检测模型,输出每帧所述人脸区域缩略图对应的视频伪造概率;在各个所述视频伪造概率的平均值超过预设第一预设阈值的情况下,判定所述目标视频为伪造视频。

    基于高斯判别分析的多模态模型微调方法及装置

    公开(公告)号:CN118885844A

    公开(公告)日:2024-11-01

    申请号:CN202410836004.7

    申请日:2024-06-26

    Abstract: 本发明提供一种基于高斯判别分析的多模态模型微调方法及装置,方法包括:获取训练图像,其中,训练图像包括对应的类别标签;通过视觉编码器对训练图像进行编码处理,得到训练图像的视觉特征;基于视觉特征确定每个类别标签的类别均值向量,并根据类别均值向量确定对应类别标签的协方差逆矩阵;对协方差逆矩阵进行高斯判别分析处理,得到视觉编码器对应的视觉分类器;将视觉分类器与文本编码器对应的文本分类器进行加权集成,得到多模态模型的最终分类器,其中,最终分类器用于识别多个类别标签。通过本申请,能够在无须训练多模态模型的情况下,提高多模态模型在下游任务上的性能。

Patent Agency Ranking