微调大语言模型的方法及电子设备

    公开(公告)号:CN119398126A

    公开(公告)日:2025-02-07

    申请号:CN202510003176.0

    申请日:2025-01-02

    Abstract: 本申请提供了一种微调大语言模型的方法及电子设备;涉及计算机技术领域。该方法包括:在第i个微调阶段,对大语言模型的参数空间进行采样,得到模型参数向量;基于模型参数向量与零阶规模参数,计算阶段损失函数的差分隐私零阶梯度;阶段损失函数为大语言模型的损失函数更新得到;基于差分隐私零阶梯度与学习率,按预设的迭代轮次对大语言模型的模型参数进行迭代处理,得到第i个微调阶段的目标模型参数;本申请实施例,可以降低微调模型的资源消耗,有效保护数据隐私的同时保证模型性能。

    提示词的水印注入检测方法、装置和终端设备

    公开(公告)号:CN119808035A

    公开(公告)日:2025-04-11

    申请号:CN202411875060.8

    申请日:2024-12-18

    Abstract: 本申请涉及一种提示词的水印注入检测方法、装置和终端设备,包括:将注有初始水印令牌的提示词和提示词所对应的提问信息输入大模型,得到第一输出值,并计算第一损失函数;将提示词和初始校验令牌输入大模型,得到第二输出值,并计算第二损失函数;利用第一损失函数、第二损失函数更新初始水印令牌、初始校验令牌,得到目标水印令牌、目标校验令牌;由待检测大模型将目标校验令牌和待检测提示词组合后作为待检测大模型的最终输入,得到大模型输出的第三输出值,在第三输出值与目标验证信息的相似度达到预设阈值的情况下,确定待检测提示词注有目标水印令牌。通过本申请,解决了相关技术中大模型的更新会降低对提示词的版权追踪的有效性的问题。

    以控制为中心的自监督学习的双阶段通用智能体训练方法

    公开(公告)号:CN117540788A

    公开(公告)日:2024-02-09

    申请号:CN202410029633.9

    申请日:2024-01-09

    Abstract: 本发明公开了一种以控制为中心的自监督学习的双阶段通用智能体训练方法,属于人工智能感知决策技术领域,包括以下步骤:步骤1、设计多模态的决策基础模型,包括编码器和控制解码器;步骤2、收集跨领域跨模态跨具身的多任务数据集;步骤3、使用以控制为中心的自监督损失函数通过自监督学习训练多模态的决策基础模型;步骤4、通过多模态指令对齐的模仿学习来训练多模态的决策基础模型;步骤5、将训练完成的多模态的决策基础模型部署到平台中进行测试使用。本发明提供了一种以控制为中心的自监督学习的双阶段通用智能体训练方法,具有卓越的适应性,能够适应跨领域、跨场景和跨具身的广泛决策任务。

    基于对抗生成网络的深度合成图像检测增强方法及装置

    公开(公告)号:CN117593311B

    公开(公告)日:2024-06-21

    申请号:CN202410081459.2

    申请日:2024-01-19

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于对抗生成网络的深度合成图像检测增强方法及装置,属于图像检测技术领域,包括以下步骤:收集深度合成图像数据集#imgabs0#;根据数据集训练真伪检测模型;训练对抗生成网络以提高真伪检测模型对深度合成数据的检测性能;根据真伪检测模型构建包含梯度信息在内新数据集#imgabs1#;根据新数据集#imgabs2#对第三方真伪检测模型进行重新训练;深度合成服务方使用对抗生成网络对深度合成图片进行增强,使得第三方真伪检测模型以高检测率检测深度合成图片。本发明采用上述的一种基于对抗生成网络的深度合成图像检测增强方法及装置,可以提高对深度合成图片的检测率。

    一种生成内容来源判断方法、装置和存储介质

    公开(公告)号:CN117892142A

    公开(公告)日:2024-04-16

    申请号:CN202410013254.0

    申请日:2024-01-04

    Abstract: 本发明公开了一种生成内容来源判断方法,该方法基于由生成模型生成的目标类别样本集训练得到目标上下文向量,由随机获得的非目标类别样本集训练得到非目标上下文向量,将待测样本的文本特征分别与目标上下文向量的提示词特征和非目标上下文向量的提示词特征进行比较,如果接近目标上下文向量的提示词特征则证明该待测样本来源与生成模型,本发明利用上述过程首次提出了准确识别来源的方法。本发明还公开了一种生成内容来源判断装置和存储介质。

    一种面向资源受限设备且具有隐私保护的联邦组模型训练方法及系统

    公开(公告)号:CN117749484A

    公开(公告)日:2024-03-22

    申请号:CN202311761433.4

    申请日:2023-12-20

    Abstract: 本发明公开了一种面向资源受限设备且具有隐私保护的联邦组模型训练方法及系统,包括:基于设备的资源对参与联邦学习的所有设备进行分组,并根据任务模型对这些分组定制组模型,所述模型为深度学习模型;构建ReDe层,用于重映射用户上传的特征映射,确保服务器端组子模型的训练;利用知识蒸馏,从任务模型的预测中提取额外的训练信息加入到训练损失中来提升组模型的精度;设计补偿损失和漂移校正,减少非独立同分布的数据分布所带来的客户漂移影响;结合内积函数加密,保证参与者训练过程中的隐私安全。本发明让更多资源受限的设备能够参与联邦学习,同时保证了参与者的隐私安全,并且在非独立同分布的数据分布下仍有较高的预测准确性。

    基于路侧单元的车载自动驾驶算法优化方法、系统及装置

    公开(公告)号:CN117622221A

    公开(公告)日:2024-03-01

    申请号:CN202311770170.3

    申请日:2023-12-20

    Abstract: 本发明公开一种基于路侧单元的车载自动驾驶算法优化方法、系统及装置,方法包括:车辆终端通过车载传感器获取车辆感知信息,得到车辆决策信息,将所述车辆感知信息和车辆决策信息按照预设封装格式发送至路侧终端;基于路侧感知信息得到路侧决策信息,并基于路侧决策信息对所述车辆决策信息进行修正,得到修正决策信息;基于路侧感知信息对所述车辆感知信息进行修正,得到修正感知信息;将修正感知信息及修正决策信息发送至车辆终端;对初始自动驾驶模型进行优化,得到优化自动驾驶模型。通过本发明的方法解决了车载自动驾驶模型不能在线、实时进行算法更新的问题,提高算法迭代速度,保障训练所得模型与真实路况的匹配度。

    一种通过特征解耦的后门触发器逆向方法

    公开(公告)号:CN117057410A

    公开(公告)日:2023-11-14

    申请号:CN202311072072.2

    申请日:2023-08-24

    Applicant: 浙江大学

    Inventor: 徐雄 秦湛

    Abstract: 本发明公开了一种通过特征解耦的后门触发器逆向方法,该方法基于少量的良性样本,可以对后门的触发器进行精准的逆向,并且获取其目标标签;逆向出来的后门样本后续可用于后门模型的防御;该方法包括:使用少量的良性样本,预训练一个生成模型,使其输出无限接近输入;通过使用良性样本训练和特征层形状一致的掩码使输出的特征分割为良性特征和后门特征;利用掩码训练生成模型使其能够输出后门样本以完成触发器逆向。本发明首次提出了使用良性样本解耦后门模型的特征层并且使用生成模型逆向后门触发器并输出后门样本的方法,能够非常高效地生成后门样本,大大减少了触发器逆向所需要的时间,并且可以适用于多种后门攻击方法。

    过滤软件虚假关联的神经网络模型训练方法以及存储介质

    公开(公告)号:CN116702138A

    公开(公告)日:2023-09-05

    申请号:CN202310460428.3

    申请日:2023-04-25

    Inventor: 杨雨晨 秦湛

    Abstract: 本申请涉及一种过滤软件虚假关联的神经网络模型训练方法以及存储介质,所述方法包括:基于所获取的软件样本数据集的接口级特征,构建特征矩阵;以降低特征之间的伪关联度为优化目标对所述软件样本数据集的样本全局权重进行优化;所述伪关联度基于所述特征矩阵确定;基于网络优化器以及权重优化器,对所述神经网络模型进行优化;所述网络优化器以及权重优化器基于优化后的所述样本全局权重生成。采用本方法实现了对软件样本中存在的虚假关联的平衡过滤,解决了由于软件样本数据集计算量庞大导致的虚假关联过滤效果差的问题,提升了软件在完全未知分布下的识别精度。

Patent Agency Ranking