-
公开(公告)号:CN112420026A
公开(公告)日:2021-02-26
申请号:CN201910783303.8
申请日:2019-08-23
申请人: 微软技术许可有限责任公司
IPC分类号: G10L15/08 , G10L15/26 , G06F16/332 , G06F16/35
摘要: 本公开提供了用于优化关键词检索系统的方法和装置。可以生成包含给定关键词的话语文本集合。可以合成与所述话语文本集合相对应的语音信号集合。可以利用所述语音信号集合中的至少一部分语音信号以及所述话语文本集合中与所述至少一部分语音信号相对应的话语文本来优化所述关键词检索系统中的声学模型。
-
公开(公告)号:CN112420026B
公开(公告)日:2024-06-18
申请号:CN201910783303.8
申请日:2019-08-23
申请人: 微软技术许可有限责任公司
IPC分类号: G10L15/08 , G10L15/26 , G06F16/332 , G06F16/35
摘要: 本公开提供了用于优化关键词检索系统的方法和装置。可以生成包含给定关键词的话语文本集合。可以合成与所述话语文本集合相对应的语音信号集合。可以利用所述语音信号集合中的至少一部分语音信号以及所述话语文本集合中与所述至少一部分语音信号相对应的话语文本来优化所述关键词检索系统中的声学模型。
-
公开(公告)号:CN113470662A
公开(公告)日:2021-10-01
申请号:CN202010244661.4
申请日:2020-03-31
申请人: 微软技术许可有限责任公司
摘要: 提供了用于生成和使用文本到语音(TTS)数据以供改进的语音识别模型的系统、方法和设备。利用关键词无关的基线训练数据来训练主模型。在一些实例中,利用新的TTS训练数据来修改主模型的声学和语言模型子组件。在一些实例中,新的TTS训练是从用于在基线训练数据中代表不足的关键词的多说话者神经TTS系统获得的。在一些实例中,新的TTS训练数据被用于关键词检出(KWS)应用中的发音学习和关键词相关置信评分的归一化。在一些实例中,新的TTS训练数据被用于语音识别模型中的快速说话者适配。
-
公开(公告)号:CN113470662B
公开(公告)日:2024-08-27
申请号:CN202010244661.4
申请日:2020-03-31
申请人: 微软技术许可有限责任公司
摘要: 提供了用于生成和使用文本到语音(TTS)数据以供改进的语音识别模型的系统、方法和设备。利用关键词无关的基线训练数据来训练主模型。在一些实例中,利用新的TTS训练数据来修改主模型的声学和语言模型子组件。在一些实例中,新的TTS训练是从用于在基线训练数据中代表不足的关键词的多说话者神经TTS系统获得的。在一些实例中,新的TTS训练数据被用于关键词检出(KWS)应用中的发音学习和关键词相关置信评分的归一化。在一些实例中,新的TTS训练数据被用于语音识别模型中的快速说话者适配。
-
-
-