-
公开(公告)号:CN107112005A
公开(公告)日:2017-08-29
申请号:CN201580053839.4
申请日:2015-04-17
Applicant: 微软技术许可有限责任公司
IPC: G10L15/02
Abstract: 本文所描述的技术的各方面涉及一种新型的深度神经网络(DNN)。该新的DNN在本文中被描述成深度神经支持向量机(DNSVM)。传统的DNN在顶层和各底层处使用多项逻辑回归(softmax激活)以进行训练。新的DNN改为使用支持向量机(SVM)作为一个或多个层,包括顶层。本文所描述的技术可使用两种训练算法中的一种来训练DNSVM以在最大-间隔标准中学习SVM和DNN的参数。第一种训练方法是帧级训练。在帧级训练中,新的模型被示为与具有DNN特征的多类SVM相关。第二种训练方法是序列级训练。序列级训练与具有DNN特征和HMM状态转移特征的结构化SVM相关。
-
公开(公告)号:CN107516511B
公开(公告)日:2021-05-25
申请号:CN201610410602.3
申请日:2016-06-13
Applicant: 微软技术许可有限责任公司
Abstract: 描述了意图识别和情绪的文本到语音学习系统。示例意图识别系统包括处理器和存储指令的存储器。指令致使处理器接收包括说出的单词的语音输入。指令致使处理器基于语音输入来生成文本结果并基于语音输入来生成声学特征注释。指令还致使处理器将意图模型应用到文本结果和声学特征注释以基于语音输入来识别意图。用于适配情绪的文本到语音模型的示例系统包括处理器和存储器。存储器存储致使处理器接收包括语音输入的训练示例并接收包括与该语音输入相关联的情绪信息的标记数据的指令。指令还致使处理器从训练示例中提取音频信号矢量并基于音频信号矢量和标记数据来生成经情绪适配的声音字体模型。
-
公开(公告)号:CN107516511A
公开(公告)日:2017-12-26
申请号:CN201610410602.3
申请日:2016-06-13
Applicant: 微软技术许可有限责任公司
CPC classification number: G10L25/63 , G06F17/2785 , G06N3/02 , G10L15/265 , G10L15/063 , G10L25/03 , H04M2250/74
Abstract: 描述了意图识别和情绪的文本到语音学习系统。示例意图识别系统包括处理器和存储指令的存储器。指令致使处理器接收包括说出的单词的语音输入。指令致使处理器基于语音输入来生成文本结果并基于语音输入来生成声学特征注释。指令还致使处理器将意图模型应用到文本结果和声学特征注释以基于语音输入来识别意图。用于适配情绪的文本到语音模型的示例系统包括处理器和存储器。存储器存储致使处理器接收包括语音输入的训练示例并接收包括与该语音输入相关联的情绪信息的标记数据的指令。指令还致使处理器从训练示例中提取音频信号矢量并基于音频信号矢量和标记数据来生成经情绪适配的声音字体模型。
-
-