-
公开(公告)号:CN114861671B
公开(公告)日:2024-11-05
申请号:CN202210375330.3
申请日:2022-04-11
申请人: 深圳追一科技有限公司
IPC分类号: G06F18/214 , G06F18/22 , G06F40/30 , G06F40/279 , G06N3/0442 , G06N3/045 , G06N3/042 , G06N3/096
摘要: 本申请涉及模型训练方法、装置、计算机设备、存储介质和计算机程序产品。该方法包括:将文本样本数据输入第一模型中,根据得到的第一样本特征数据确定第一损失;将文本样本数据输入第二模型中,根据得到的第二样本特征数据和第一样本特征数据确定第二损失;将文本样本数据输入第三模型中,得到第三样本特征数据,基于预设条件,确定以第一样本特征数据和第三样本特征数据的相似度得到第三损失,或以第三样本特征数据之间的相似度以及第一样本特征数据和第三样本特征数据之间的相似度得到第三损失;根据第一损失、第二损失和第三损失确定损失函数,损失函数用于对第一模型进行训练。本方案可使第一模型的收敛速度更快,文本识别的精确度更高。
-
公开(公告)号:CN114861671A
公开(公告)日:2022-08-05
申请号:CN202210375330.3
申请日:2022-04-11
申请人: 深圳追一科技有限公司
摘要: 本申请涉及模型训练方法、装置、计算机设备、存储介质和计算机程序产品。该方法包括:将文本样本数据输入第一模型中,根据得到的第一样本特征数据确定第一损失;将文本样本数据输入第二模型中,根据得到的第二样本特征数据和第一样本特征数据确定第二损失;将文本样本数据输入第三模型中,得到第三样本特征数据,基于预设条件,确定以第一样本特征数据和第三样本特征数据的相似度得到第三损失,或以第三样本特征数据之间的相似度以及第一样本特征数据和第三样本特征数据之间的相似度得到第三损失;根据第一损失、第二损失和第三损失确定损失函数,损失函数用于对第一模型进行训练。本方案可使第一模型的收敛速度更快,文本识别的精确度更高。
-