-
公开(公告)号:CN116635932A
公开(公告)日:2023-08-22
申请号:CN202180084448.4
申请日:2021-11-23
Applicant: 微软技术许可有限责任公司
IPC: G10L15/08
Abstract: 所公开的语音识别技术通过以下操作改进用户感知的延迟,同时维持准确性:由主(例如,准确)语音识别引擎(SRE)和辅(例如,快速)SRE并行地接收音频流;利用主SRE生成主结果;利用辅SRE生成辅结果;将辅结果附加到词列表;以及将主结果合并到词列表中的辅结果中。将来自主SRE和辅SRE的输出组合到如本文中所描述的单个解码器中改善了用户感知的延迟,同时维持或者提高了准确性,以及其他优点。
-
公开(公告)号:CN118749117A
公开(公告)日:2024-10-08
申请号:CN202280092556.0
申请日:2022-12-29
Applicant: 微软技术许可有限责任公司
IPC: G10L15/183
Abstract: 本文一般所讨论的是针对多语言模型生成的设备、系统和方法。一种方法可以包括针对低资源语言,确定指示低资源语言中的每个低资源语言之间的语言相似性的相应的语言相似性值,基于相应的语言相似性值将低资源语言聚类到组中,聚合与给定组相对应的语言的训练数据得到经聚合的训练数据,以及基于经聚合的训练数据来训练重排序语言模型得到经训练的重排序语言模型。
-