Patent search ap:("科大讯飞股份有限公司") AND inv:"孙俊" Page 1

1.

发明公开
基于生成对抗网络的语音唤醒方法、装置及存储介质审中-实审

公开(公告)号：CN117690432A

公开(公告)日：2024-03-12

申请号：CN202311846228.8

申请日：2023-12-27

Applicant: 科大讯飞股份有限公司

Inventor： 孙俊 , 申凯 , 万根顺 , 潘嘉 , 刘聪 , 高建清 , 熊世富

IPC: G10L15/22 , G10L15/08 , G10L15/10 , G10L19/16 , G10L25/03

Abstract: 本申请公开了一种基于生成对抗网络的语音唤醒方法、装置、存储介质、电子设备及计算机程序产品，该方法包括：获取待识别的目标语音数据；对目标语音数据进行声学特征提取，得到目标声学特征；将目标声学特征输入语音识别模型中进行处理，语音识别模型包括解码器和已训练的生成对抗网络，生成对抗网络包括生成器和第一判别器，生成器用于根据目标声学特征生成目标编码特征；第一判别器用于根据目标编码特征输出第一判别结果；解码器用于根据预设唤醒词对目标编码特征进行解码，并输出解码分数；根据第一判别结果和解码分数，进行车载语音系统的唤醒操作，从而无需用户手动操作即可唤醒车载语音系统，简化了唤醒流程，用户体验感好。

2.

发明公开
语音仿真信号获取、语音识别方法、装置、设备及介质审中-实审

公开(公告)号：CN115346518A

公开(公告)日：2022-11-15

申请号：CN202210794643.2

申请日：2022-07-05

Applicant: 科大讯飞股份有限公司

Inventor： 孙俊

IPC: G10L15/06 , G10L25/48

Abstract: 本发明提供一种语音仿真信号获取、语音识别方法、装置、设备及介质，所述方法包括：确定人声信号以及噪声信号；基于人声声源与声音采集设备之间的相对位置信息，对人声信号进行混响，得到人声混响信号；基于噪声声源与声音采集设备之间的相对位置信息，对噪声信号进行混响，得到噪声混响信号；对人声混响信号和噪声混响信号进行叠加，得到语音仿真信号。本发明提供的语音仿真信号获取、语音识别方法、装置、设备及介质，能够在对人声混响信号和噪声混响信号进行叠加后，准确得到语音仿真信号，且人声信号和噪声信号是易于获取的信号，从而可以避免传统方法中样本语音信号难以获取的问题。

Patent Agency Ranking