Patent search ap:("微软技术许可有限责任公司") AND inv:"汪曦" Page 1

1.

发明公开
语音波形生成有权

公开(公告)号：CN111602194A

公开(公告)日：2020-08-28

申请号：CN201880085612.1

申请日：2018-09-30

Applicant: 微软技术许可有限责任公司

Inventor： 崔洋 , 汪曦 , 何磊 , 宋謌平

IPC: G10L13/00

Abstract: 本公开内容提供了用于生成语音波形的方法和装置。可以接收与输入相关联的基频信息、声门特征和声道特征，其中声门特征包括相位特征、形状特征和能量特征。基于基频信息和声门特征通过第一神经网络模型来生成声门波形。基于声门波形和声道特征通过第二神经网络模型来生成语音波形。

2.

发明授权
语音波形生成有权

公开(公告)号：CN111602194B

公开(公告)日：2023-07-04

申请号：CN201880085612.1

申请日：2018-09-30

Applicant: 微软技术许可有限责任公司

Inventor： 崔洋 , 汪曦 , 何磊 , 宋謌平

IPC: G10L13/00

Abstract: 本公开内容提供了用于生成语音波形的方法和装置。可以接收与输入相关联的基频信息、声门特征和声道特征，其中声门特征包括相位特征、形状特征和能量特征。基于基频信息和声门特征通过第一神经网络模型来生成声门波形。基于声门波形和声道特征通过第二神经网络模型来生成语音波形。

3.

发明公开
自动音频内容生成审中-实审

公开(公告)号：CN113628609A

公开(公告)日：2021-11-09

申请号：CN202010387249.8

申请日：2020-05-09

Applicant: 微软技术许可有限责任公司

Inventor： 汪曦 , 张少飞 , 肖雨佳 , 刘越颖 , 何磊

IPC: G10L13/08 , G10L13/10 , G10L13/02

Abstract: 本公开提供了用于自动音频内容生成的方法和装置。可以获得文本。可以构建与所述文本对应的上下文。可以至少基于所述上下文来确定参考因素，所述参考因素至少包括与所述文本对应的角色类别和/或角色。可以至少基于所述文本和所述参考因素来生成与所述文本对应的语音波形。

4.

发明授权
经由教师-学生学习在话音识别中进行的域自适应有权

公开(公告)号：CN110998716B

公开(公告)日：2024-01-23

申请号：CN201880051796.X

申请日：2018-06-21

Applicant: 微软技术许可有限责任公司

Inventor： 李锦宇 , M·L·塞尔策 , 汪曦 , 赵蕤 , 龚一凡

IPC: G10L15/06 , G10L15/065 , G10L15/16 , G10L25/30 , G06N3/0442 , G06N3/084 , G06N3/096

Abstract: 经由对不同话音域的模型的学生/教师训练而提供了新域中的话音识别的改进。基于在现有域中训练的教师模型来为新域创建学生模型。该学生模型并行于该教师模型的操作、分别利用新域和现有域中的输入而被训练，以开发适应于辨识新域中的话音的神经网络。该新域中的数据可以排除转录标签，而是与在现有域中被分析的数据(由该教师模型所分析)并行化。来自该教师模型的输出与该学生模型的输出相比较，并且差异被用来调节该学生模型的参数以更好地辨识第二域中的话音。

5.

发明公开
经由教师-学生学习在话音识别中进行的域自适应有权

公开(公告)号：CN110998716A

公开(公告)日：2020-04-10

申请号：CN201880051796.X

申请日：2018-06-21

Applicant: 微软技术许可有限责任公司

Inventor： 李锦宇 , M·L·塞尔策 , 汪曦 , 赵蕤 , 龚一凡

IPC: G10L15/06 , G10L15/065 , G10L15/16 , G10L25/30 , G06N3/04 , G06N3/08 , G06N3/12 , G06N5/00

Abstract: 经由对不同话音域的模型的学生/教师训练而提供了新域中的话音识别的改进。基于在现有域中训练的教师模型来为新域创建学生模型。该学生模型并行于该教师模型的操作、分别利用新域和现有域中的输入而被训练，以开发适应于辨识新域中的话音的神经网络。该新域中的数据可以排除转录标签，而是与在现有域中被分析的数据(由该教师模型所分析)并行化。来自该教师模型的输出与该学生模型的输出相比较，并且差异被用来调节该学生模型的参数以更好地辨识第二域中的话音。

Patent Agency Ranking