-
公开(公告)号:CN118749117A
公开(公告)日:2024-10-08
申请号:CN202280092556.0
申请日:2022-12-29
Applicant: 微软技术许可有限责任公司
IPC: G10L15/183
Abstract: 本文一般所讨论的是针对多语言模型生成的设备、系统和方法。一种方法可以包括针对低资源语言,确定指示低资源语言中的每个低资源语言之间的语言相似性的相应的语言相似性值,基于相应的语言相似性值将低资源语言聚类到组中,聚合与给定组相对应的语言的训练数据得到经聚合的训练数据,以及基于经聚合的训练数据来训练重排序语言模型得到经训练的重排序语言模型。