-
公开(公告)号:CN108701453B
公开(公告)日:2023-04-04
申请号:CN201780014729.6
申请日:2017-02-27
Applicant: 微软技术许可有限责任公司
IPC: G10L15/065 , G06N3/045 , G10L15/16
Abstract: 本文中描述的技术使用模块化模型来处理语音。基于深度学习的声学模型包括不同类型的神经网络层的堆叠。基于深度学习的声学模型的子模块可以用于表示不同的非音素的声学因素,诸如口音来源(例如,母语、非母语)、语音通道(例如,移动、蓝牙、桌面等)、语音应用场景(例如,话音搜索、短消息口述等)和说话者变型(例如,单个说话者或集群说话者)等。本文中描述的技术在第一上下文中使用某些子模块并且在第二上下文中使用第二组子模块。
-
公开(公告)号:CN108701453A
公开(公告)日:2018-10-23
申请号:CN201780014729.6
申请日:2017-02-27
Applicant: 微软技术许可有限责任公司
IPC: G10L15/065 , G06N3/04 , G10L15/16
CPC classification number: G10L15/16 , G06N3/04 , G06N3/0445 , G06N3/0454 , G06N3/08 , G10L15/02 , G10L15/063 , G10L15/065 , G10L15/183 , G10L15/28
Abstract: 本文中描述的技术使用模块化模型来处理语音。基于深度学习的声学模型包括不同类型的神经网络层的堆叠。基于深度学习的声学模型的子模块可以用于表示不同的非音素的声学因素,诸如口音来源(例如,母语、非母语)、语音通道(例如,移动、蓝牙、桌面等)、语音应用场景(例如,话音搜索、短消息口述等)和说话者变型(例如,单个说话者或集群说话者)等。本文中描述的技术在第一上下文中使用某些子模块并且在第二上下文中使用第二组子模块。
-