-
公开(公告)号:CN116401365A
公开(公告)日:2023-07-07
申请号:CN202310379357.4
申请日:2023-04-11
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F16/35 , G06F16/33 , G06F18/214 , G06F18/241
Abstract: 本申请实施例公开了一种平行语料数据对的构建方法、装置及存储介质。其中,该方法包括:将具有第一风格特征的第一语料数据输入第一风格转换模型中,得到具有第二风格特征的第二语料数据;第一风格转换模型基于回译训练得到;将第一语料数据输入第二风格转换模型中,得到具有第二风格特征的第三语料数据;第二风格转换模型基于对抗训练得到;计算第二语料数据的第二风格特征对应的第一得分;计算第三语料数据的第二风格特征对应的第二得分;若第一得分大于第二得分,则利用第二语料数据和第一语料数据构建第一平行语料数据对;若第一得分不大于第二得分,则利用第三语料数据和第一语料数据构建第一平行语料数据对,解决平行语料数据对稀缺的问题。