一种模型训练方法、装置及系统

    公开(公告)号:CN116910205A

    公开(公告)日:2023-10-20

    申请号:CN202310752628.6

    申请日:2023-06-25

    Abstract: 本发明提供了模型训练方法、装置及系统,所述方法包括构建待训练的对话模型,待训练的对话模型包括生成模型、推断模型和检索模型;基于有标注的第一数据对待训练的对话模型中的推断模型和检索模型进行有监督的预训练,预训练后的推断模型用于根据第一数据中的用户输入数据和系统回复数据得到隐变量数据,预训练后的检索模型用于根据第一数据中的用户输入数据从数据库中检索得到查询结果;基于第一数据和无标注的第二数据形成的训练样本,对预训练后的对话模型进行半监督训练,得到训练好的对话模型,训练好的对话模型中生成模型用于生成对话动作数据和系统回复数据。提升了任务型对话任务中模型对于知识的结合能力,更加适用于知识型的任务。

    一种模型训练方法、装置及系统

    公开(公告)号:CN116910205B

    公开(公告)日:2025-05-13

    申请号:CN202310752628.6

    申请日:2023-06-25

    Abstract: 本发明提供了模型训练方法、装置及系统,所述方法包括构建待训练的对话模型,待训练的对话模型包括生成模型、推断模型和检索模型;基于有标注的第一数据对待训练的对话模型中的推断模型和检索模型进行有监督的预训练,预训练后的推断模型用于根据第一数据中的用户输入数据和系统回复数据得到隐变量数据,预训练后的检索模型用于根据第一数据中的用户输入数据从数据库中检索得到查询结果;基于第一数据和无标注的第二数据形成的训练样本,对预训练后的对话模型进行半监督训练,得到训练好的对话模型,训练好的对话模型中生成模型用于生成对话动作数据和系统回复数据。提升了任务型对话任务中模型对于知识的结合能力,更加适用于知识型的任务。

    水印生成方法、装置、设备、介质及产品

    公开(公告)号:CN119067826A

    公开(公告)日:2024-12-03

    申请号:CN202411083413.0

    申请日:2024-08-08

    Abstract: 本公开提供一种水印生成方法、装置、设备、介质及产品,应用于人工智能安全技术领域。本公开中,基于待训练的对抗样本生成模型、干净样本和验证样本,生成训练用水印。基于表征训练用水印的分类标签的概率、预设的第一损失子函数和预设的第二损失子函数,计算总损失函数;第一损失子函数用于增加训练用水印的分类标签被识别为目标标签的概率,第二损失子函数用于减小对抗样本生成模型输出的训练用水印与干净样本的像素之间的差异。采用总损失函数优化待训练的对抗样本生成模型的参数,获得训练对抗样本生成模型。基于训练对抗样本生成模型、干净样本和验证样本,生成干净样本的水印。因此,可以提高对样本进行版权验证的有效性和隐蔽性。

Patent Agency Ranking