一种平行语料数据对的构建方法、装置及存储介质

    公开(公告)号:CN116401365A

    公开(公告)日:2023-07-07

    申请号:CN202310379357.4

    申请日:2023-04-11

    Abstract: 本申请实施例公开了一种平行语料数据对的构建方法、装置及存储介质。其中,该方法包括:将具有第一风格特征的第一语料数据输入第一风格转换模型中,得到具有第二风格特征的第二语料数据;第一风格转换模型基于回译训练得到;将第一语料数据输入第二风格转换模型中,得到具有第二风格特征的第三语料数据;第二风格转换模型基于对抗训练得到;计算第二语料数据的第二风格特征对应的第一得分;计算第三语料数据的第二风格特征对应的第二得分;若第一得分大于第二得分,则利用第二语料数据和第一语料数据构建第一平行语料数据对;若第一得分不大于第二得分,则利用第三语料数据和第一语料数据构建第一平行语料数据对,解决平行语料数据对稀缺的问题。

Patent Agency Ranking