低资源多语言变换器模型
    3.
    发明公开

    公开(公告)号:CN118749117A

    公开(公告)日:2024-10-08

    申请号:CN202280092556.0

    申请日:2022-12-29

    Abstract: 本文一般所讨论的是针对多语言模型生成的设备、系统和方法。一种方法可以包括针对低资源语言,确定指示低资源语言中的每个低资源语言之间的语言相似性的相应的语言相似性值,基于相应的语言相似性值将低资源语言聚类到组中,聚合与给定组相对应的语言的训练数据得到经聚合的训练数据,以及基于经聚合的训练数据来训练重排序语言模型得到经训练的重排序语言模型。

    微分段安全语音转录
    4.
    发明公开

    公开(公告)号:CN115605947A

    公开(公告)日:2023-01-13

    申请号:CN202180032695.X

    申请日:2021-04-30

    Abstract: 提供了用于在多个分布式计算设备处保护对机器学习训练数据的数据访问的实施例。包括与优选的数据安全性等级相对应的原始数据的电子内容被划分成多个微分段。多个微分段被限制性地分发到多个计算设备,该多个计算设备将转录标签应用于多个微分段。带标签的微分段被重构成训练数据,该训练数据随后被用于训练机器学习模型,同时促进来自经重构的微分段的训练数据所包括的原始数据的数据安全性的提高。

Patent Agency Ranking