-
公开(公告)号:CN117854510A
公开(公告)日:2024-04-09
申请号:CN202311766277.0
申请日:2023-12-19
Applicant: 科大讯飞股份有限公司
IPC: G10L17/06 , G10L17/02 , G10L15/26 , G10L15/183
Abstract: 本申请公开了一种演讲者识别方法及其装置、设备、存储介质,该方法包括:对当前语音进行识别,得到当前语音的识别文本;基于识别文本,提取得到文本特征,并基于识别文本抽取,得到提示词,其中,提示词指示当前语音之后的发言内容中涵盖的字词类别;基于文本特征和提示词进行预测,得到当前语音之后的发言内容及其目标发言人。上述方案,能够提高当前语音之后的发言内容及其目标发言人识别的准确性。
-
公开(公告)号:CN117912481A
公开(公告)日:2024-04-19
申请号:CN202311550330.3
申请日:2023-11-16
Applicant: 科大讯飞股份有限公司
IPC: G10L21/0224 , G10L21/0232 , G10L21/0332 , G10L21/04 , G10L15/06 , G10L15/065 , G10L15/16
Abstract: 本申请提出一种语音降噪方法、装置、电子设备及存储介质,该方法获取待降噪语音对应的语音特征,语音特征包括波形特征和语谱图特征;利用预先确定的语音降噪参数,对语音特征进行降噪处理,得到降噪语音信号;其中,语音降噪参数,是利用预先采集的样本噪声语音的样本语音特征,进行降噪处理训练而确定的,样本语音特征包括样本噪声语音的波形特征和语谱图特征。采用本申请的技术方案,利用样本噪声语音的波形特征和语谱图特征对语音降噪参数进行训练,实现了在语音的时域和频域上结合降噪训练,提高了语音降噪参数的降噪准确度,从而提高了利用语音降噪参数进行降噪处理时,语音的降噪效果。
-