模型训练方法、装置、计算机设备及存储介质

    公开(公告)号:CN114861671B

    公开(公告)日:2024-11-05

    申请号:CN202210375330.3

    申请日:2022-04-11

    发明人: 张旭 文博 刘云峰

    摘要: 本申请涉及模型训练方法、装置、计算机设备、存储介质和计算机程序产品。该方法包括:将文本样本数据输入第一模型中,根据得到的第一样本特征数据确定第一损失;将文本样本数据输入第二模型中,根据得到的第二样本特征数据和第一样本特征数据确定第二损失;将文本样本数据输入第三模型中,得到第三样本特征数据,基于预设条件,确定以第一样本特征数据和第三样本特征数据的相似度得到第三损失,或以第三样本特征数据之间的相似度以及第一样本特征数据和第三样本特征数据之间的相似度得到第三损失;根据第一损失、第二损失和第三损失确定损失函数,损失函数用于对第一模型进行训练。本方案可使第一模型的收敛速度更快,文本识别的精确度更高。

    模型训练方法、装置、计算机设备及存储介质

    公开(公告)号:CN114861671A

    公开(公告)日:2022-08-05

    申请号:CN202210375330.3

    申请日:2022-04-11

    发明人: 张旭 文博 刘云峰

    IPC分类号: G06F40/30 G06N3/08

    摘要: 本申请涉及模型训练方法、装置、计算机设备、存储介质和计算机程序产品。该方法包括:将文本样本数据输入第一模型中,根据得到的第一样本特征数据确定第一损失;将文本样本数据输入第二模型中,根据得到的第二样本特征数据和第一样本特征数据确定第二损失;将文本样本数据输入第三模型中,得到第三样本特征数据,基于预设条件,确定以第一样本特征数据和第三样本特征数据的相似度得到第三损失,或以第三样本特征数据之间的相似度以及第一样本特征数据和第三样本特征数据之间的相似度得到第三损失;根据第一损失、第二损失和第三损失确定损失函数,损失函数用于对第一模型进行训练。本方案可使第一模型的收敛速度更快,文本识别的精确度更高。