-
公开(公告)号:CN117690432A
公开(公告)日:2024-03-12
申请号:CN202311846228.8
申请日:2023-12-27
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种基于生成对抗网络的语音唤醒方法、装置、存储介质、电子设备及计算机程序产品,该方法包括:获取待识别的目标语音数据;对目标语音数据进行声学特征提取,得到目标声学特征;将目标声学特征输入语音识别模型中进行处理,语音识别模型包括解码器和已训练的生成对抗网络,生成对抗网络包括生成器和第一判别器,生成器用于根据目标声学特征生成目标编码特征;第一判别器用于根据目标编码特征输出第一判别结果;解码器用于根据预设唤醒词对目标编码特征进行解码,并输出解码分数;根据第一判别结果和解码分数,进行车载语音系统的唤醒操作,从而无需用户手动操作即可唤醒车载语音系统,简化了唤醒流程,用户体验感好。
-
公开(公告)号:CN115346518A
公开(公告)日:2022-11-15
申请号:CN202210794643.2
申请日:2022-07-05
Applicant: 科大讯飞股份有限公司
Inventor: 孙俊
Abstract: 本发明提供一种语音仿真信号获取、语音识别方法、装置、设备及介质,所述方法包括:确定人声信号以及噪声信号;基于人声声源与声音采集设备之间的相对位置信息,对人声信号进行混响,得到人声混响信号;基于噪声声源与声音采集设备之间的相对位置信息,对噪声信号进行混响,得到噪声混响信号;对人声混响信号和噪声混响信号进行叠加,得到语音仿真信号。本发明提供的语音仿真信号获取、语音识别方法、装置、设备及介质,能够在对人声混响信号和噪声混响信号进行叠加后,准确得到语音仿真信号,且人声信号和噪声信号是易于获取的信号,从而可以避免传统方法中样本语音信号难以获取的问题。
-