-
公开(公告)号:CN106104673B
公开(公告)日:2019-10-18
申请号:CN201580012496.7
申请日:2015-02-27
Applicant: 微软技术许可有限责任公司
Abstract: 本发明提供了对用于自动语音识别的深度神经网络(DNN)模型的适配和个性化。可以在诸如话音搜索或短消息命令之类的ASR任务中接收包括一个或多个扬声器的语音特征的话语。然后,可以将分解方法应用于该DNN模型中的原始矩阵。响应于应用该分解方法,该原始矩阵可以被变换为比该原始矩阵更小的多个新矩阵。然后,可以将方阵加到所述新矩阵。然后,可以将扬声器特定参数存储在该方阵中。然后,可以通过更新该方阵来对该DNN模型进行适配。这个过程可以被应用于该DNN模型中的所有多个原始矩阵。经适配的DNN模型可以包括与原始DNN模型中接收的参数相比数量减少的参数。
-
公开(公告)号:CN110998716B
公开(公告)日:2024-01-23
申请号:CN201880051796.X
申请日:2018-06-21
Applicant: 微软技术许可有限责任公司
IPC: G10L15/06 , G10L15/065 , G10L15/16 , G10L25/30 , G06N3/0442 , G06N3/084 , G06N3/096
Abstract: 经由对不同话音域的模型的学生/教师训练而提供了新域中的话音识别的改进。基于在现有域中训练的教师模型来为新域创建学生模型。该学生模型并行于该教师模型的操作、分别利用新域和现有域中的输入而被训练,以开发适应于辨识新域中的话音的神经网络。该新域中的数据可以排除转录标签,而是与在现有域中被分析的数据(由该教师模型所分析)并行化。来自该教师模型的输出与该学生模型的输出相比较,并且差异被用来调节该学生模型的参数以更好地辨识第二域中的话音。
-
公开(公告)号:CN110998716A
公开(公告)日:2020-04-10
申请号:CN201880051796.X
申请日:2018-06-21
Applicant: 微软技术许可有限责任公司
Abstract: 经由对不同话音域的模型的学生/教师训练而提供了新域中的话音识别的改进。基于在现有域中训练的教师模型来为新域创建学生模型。该学生模型并行于该教师模型的操作、分别利用新域和现有域中的输入而被训练,以开发适应于辨识新域中的话音的神经网络。该新域中的数据可以排除转录标签,而是与在现有域中被分析的数据(由该教师模型所分析)并行化。来自该教师模型的输出与该学生模型的输出相比较,并且差异被用来调节该学生模型的参数以更好地辨识第二域中的话音。
-
公开(公告)号:CN106104673A
公开(公告)日:2016-11-09
申请号:CN201580012496.7
申请日:2015-02-27
Applicant: 微软技术许可有限责任公司
Abstract: 本发明提供了对用于自动语音识别的深度神经网络(DNN)模型的适配和个性化。可以在诸如话音搜索或短消息命令之类的ASR任务中接收包括一个或多个扬声器的语音特征的话语。然后,可以将分解方法应用于该DNN模型中的原始矩阵。响应于应用该分解方法,该原始矩阵可以被变换为比该原始矩阵更小的多个新矩阵。然后,可以将方阵加到所述新矩阵。然后,可以将扬声器特定参数存储在该方阵中。然后,可以通过更新该方阵来对该DNN模型进行适配。这个过程可以被应用于该DNN模型中的所有多个原始矩阵。经适配的DNN模型可以包括与原始DNN模型中接收的参数相比数量减少的参数。
-
-
-