-
公开(公告)号:CN114938679A
公开(公告)日:2022-08-23
申请号:CN202080092553.8
申请日:2020-11-03
Applicant: 微软技术许可有限责任公司
IPC: G10L13/02
Abstract: 系统被配置成通过以下操作来以个性化话音生成文本到语音数据:在从特定用户收集的自然语音数据上训练文本到语音机器学习模型,确认从其收集数据的用户的身份,以及授权来自用户的使用个性化话音来生成新语音数据的请求。系统被进一步配置成用所生成的个性化语音数据来将机器学习模型训练为神经文本到语音模型。
-
公开(公告)号:CN107077841B
公开(公告)日:2020-10-16
申请号:CN201580031571.4
申请日:2015-06-12
Applicant: 微软技术许可有限责任公司
Abstract: 本技术与利用循环神经网络(RNN)来将文本转换为语音相关。循环神经网络可以被实现为用于确定文本的特性的多个模块。在实施例中,可以利用词性RNN模块、发音RNN模块、语言注音标记RNN模块、以及上下文感知和语义挖掘RNN模块全部。来自RNN模块的特性是通过基于其他RNN模块的输出来确定输入文本的拼音特性的超结构RNN模块来处理。超结构RNN模块可以生成能够由语音合成器转换为可听见的语音的生成序列。生成序列还可以通过全局优化模块在被合成为可听见的语音之前进行优化。
-
公开(公告)号:CN107077638A
公开(公告)日:2017-08-18
申请号:CN201580031721.1
申请日:2015-06-10
Applicant: 微软技术许可有限责任公司
Abstract: 本技术涉及利用递归神经网络(RNN)执行字母到声音的转换。RNN可以实现为用于进行字母到声音的转换的RNN模块。RNN模块接收文本输入,并将文本转换为对应的音素。在确定对应的音素时,RNN模块可以分析文本的字母和在被分析字母周围的字母。RNN模块还可以以相反次序分析文本的字母。RNN模块还可以接收关于输入文本的上下文信息。字母到声音转换于是还可以基于接收到的上下文信息。确定出的音素可以用于根据输入文本生成合成语音。
-
公开(公告)号:CN107077841A
公开(公告)日:2017-08-18
申请号:CN201580031571.4
申请日:2015-06-12
Applicant: 微软技术许可有限责任公司
Abstract: 本技术与利用循环神经网络(RNN)来将文本转换为语音相关。循环神经网络可以被实现为用于确定文本的特性的多个模块。在实施例中,可以利用词性RNN模块、发音RNN模块、语言注音标记RNN模块、以及上下文感知和语义挖掘RNN模块全部。来自RNN模块的特性是通过基于其他RNN模块的输出来确定输入文本的拼音特性的超结构RNN模块来处理。超结构RNN模块可以生成能够由语音合成器转换为可听见的语音的生成序列。生成序列还可以通过全局优化模块在被合成为可听见的语音之前进行优化。
-
-
-