一种语言模型的训练方法、装置、存储介质及设备

    公开(公告)号:CN114254649A

    公开(公告)日:2022-03-29

    申请号:CN202111538138.3

    申请日:2021-12-15

    Abstract: 本申请公开了一种模型训练的方法、装置、存储介质及设备,该方法包括获取低资源语料以及所述低资源语料的平行语料,所述平行语料为与所述低资源语料表达相同语义的高资源语料,所述低资源语料包括方言文本或少数民族语言文本,所述高资源语料包括普通话文本;根据所述低资源语料和所述平行语料,构建训练语料;将所述训练语料输入所述语言模型进行模型训练,直至所述语言模型满足训练停止条件。该方法能够提高语言模型对方言或少数民族语言进行语义理解的效果。

    文本分类模型的训练方法及其设备、存储介质

    公开(公告)号:CN112800227B

    公开(公告)日:2023-01-17

    申请号:CN202110124674.2

    申请日:2021-01-29

    Abstract: 本申请公开了一种文本分类模型的训练方法及其设备、存储介质。其中,文本分类模型的训练方法包括:获取正文本样本和与正文本样本对应的至少一个负文本样本,其中,正文本样本与对应的负文本样本属于不同的分类类型;利用正文本样本与至少一个负文本样本之间的第一语义差异,干预文本分类模型对正文本样本进行分类,得到正文本样本的预测类型;基于正文本样本的预测类型和实际类型,调整文本分类模型的网络参数。上述方案,文本分类模型在训练过程中,基于正文本样本和负文本样本之间的语义差异,干预文本分类模型的分类工作,使得训练得到的文本分类模型的分类更加准确。

    文本分类模型的训练方法及其设备、存储介质

    公开(公告)号:CN112800227A

    公开(公告)日:2021-05-14

    申请号:CN202110124674.2

    申请日:2021-01-29

    Abstract: 本申请公开了一种文本分类模型的训练方法及其设备、存储介质。其中,文本分类模型的训练方法包括:获取正文本样本和与正文本样本对应的至少一个负文本样本,其中,正文本样本与对应的负文本样本属于不同的分类类型;利用正文本样本与至少一个负文本样本之间的第一语义差异,干预文本分类模型对正文本样本进行分类,得到正文本样本的预测类型;基于正文本样本的预测类型和实际类型,调整文本分类模型的网络参数。上述方案,文本分类模型在训练过程中,基于正文本样本和负文本样本之间的语义差异,干预文本分类模型的分类工作,使得训练得到的文本分类模型的分类更加准确。

Patent Agency Ranking