-
公开(公告)号:CN107077841B
公开(公告)日:2020-10-16
申请号:CN201580031571.4
申请日:2015-06-12
Applicant: 微软技术许可有限责任公司
Abstract: 本技术与利用循环神经网络(RNN)来将文本转换为语音相关。循环神经网络可以被实现为用于确定文本的特性的多个模块。在实施例中,可以利用词性RNN模块、发音RNN模块、语言注音标记RNN模块、以及上下文感知和语义挖掘RNN模块全部。来自RNN模块的特性是通过基于其他RNN模块的输出来确定输入文本的拼音特性的超结构RNN模块来处理。超结构RNN模块可以生成能够由语音合成器转换为可听见的语音的生成序列。生成序列还可以通过全局优化模块在被合成为可听见的语音之前进行优化。
-
公开(公告)号:CN107077638A
公开(公告)日:2017-08-18
申请号:CN201580031721.1
申请日:2015-06-10
Applicant: 微软技术许可有限责任公司
Abstract: 本技术涉及利用递归神经网络(RNN)执行字母到声音的转换。RNN可以实现为用于进行字母到声音的转换的RNN模块。RNN模块接收文本输入,并将文本转换为对应的音素。在确定对应的音素时,RNN模块可以分析文本的字母和在被分析字母周围的字母。RNN模块还可以以相反次序分析文本的字母。RNN模块还可以接收关于输入文本的上下文信息。字母到声音转换于是还可以基于接收到的上下文信息。确定出的音素可以用于根据输入文本生成合成语音。
-
公开(公告)号:CN107516511B
公开(公告)日:2021-05-25
申请号:CN201610410602.3
申请日:2016-06-13
Applicant: 微软技术许可有限责任公司
Abstract: 描述了意图识别和情绪的文本到语音学习系统。示例意图识别系统包括处理器和存储指令的存储器。指令致使处理器接收包括说出的单词的语音输入。指令致使处理器基于语音输入来生成文本结果并基于语音输入来生成声学特征注释。指令还致使处理器将意图模型应用到文本结果和声学特征注释以基于语音输入来识别意图。用于适配情绪的文本到语音模型的示例系统包括处理器和存储器。存储器存储致使处理器接收包括语音输入的训练示例并接收包括与该语音输入相关联的情绪信息的标记数据的指令。指令还致使处理器从训练示例中提取音频信号矢量并基于音频信号矢量和标记数据来生成经情绪适配的声音字体模型。
-
公开(公告)号:CN107516511A
公开(公告)日:2017-12-26
申请号:CN201610410602.3
申请日:2016-06-13
Applicant: 微软技术许可有限责任公司
CPC classification number: G10L25/63 , G06F17/2785 , G06N3/02 , G10L15/265 , G10L15/063 , G10L25/03 , H04M2250/74
Abstract: 描述了意图识别和情绪的文本到语音学习系统。示例意图识别系统包括处理器和存储指令的存储器。指令致使处理器接收包括说出的单词的语音输入。指令致使处理器基于语音输入来生成文本结果并基于语音输入来生成声学特征注释。指令还致使处理器将意图模型应用到文本结果和声学特征注释以基于语音输入来识别意图。用于适配情绪的文本到语音模型的示例系统包括处理器和存储器。存储器存储致使处理器接收包括语音输入的训练示例并接收包括与该语音输入相关联的情绪信息的标记数据的指令。指令还致使处理器从训练示例中提取音频信号矢量并基于音频信号矢量和标记数据来生成经情绪适配的声音字体模型。
-
公开(公告)号:CN107077841A
公开(公告)日:2017-08-18
申请号:CN201580031571.4
申请日:2015-06-12
Applicant: 微软技术许可有限责任公司
Abstract: 本技术与利用循环神经网络(RNN)来将文本转换为语音相关。循环神经网络可以被实现为用于确定文本的特性的多个模块。在实施例中,可以利用词性RNN模块、发音RNN模块、语言注音标记RNN模块、以及上下文感知和语义挖掘RNN模块全部。来自RNN模块的特性是通过基于其他RNN模块的输出来确定输入文本的拼音特性的超结构RNN模块来处理。超结构RNN模块可以生成能够由语音合成器转换为可听见的语音的生成序列。生成序列还可以通过全局优化模块在被合成为可听见的语音之前进行优化。
-
-
-
-