-
公开(公告)号:CN118742953A
公开(公告)日:2024-10-01
申请号:CN202280092206.4
申请日:2022-12-29
Applicant: 微软技术许可有限责任公司
Abstract: 本公开实施例涉及提供了针对获得、训练和使用基于神经转换器的端到端AST模型的系统和方法。该端到端AST模型至少包括(i)配置为接收和编码音频数据的声学编码器,(ii)与端到端AST模型中的声学编码器集成在并行模型架构中的预测网络,以及(iii)与声学编码器和预测网络串联集成的联合层。端到端的AST模型配置为生成第一语言的输入音频数据的第二语言的转录,使得声学编码器学习多个时间处理路径。