-
公开(公告)号:CN114708852A
公开(公告)日:2022-07-05
申请号:CN202210255584.1
申请日:2022-03-15
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本发明提供一种语音识别方法、装置、电子设备和存储介质,所述方法包括:将待识别语音的语音特征输入至语音识别模型,得到语音识别模型输出的识别文本;语音识别模型是基于领域样本语音的标签识别文本和第一识别文本之间的差异,以及第一识别文本和第二识别文本之间的差异,对学生模型进行参数迭代得到的;第一识别文本是学生模型基于领域样本语音的语音特征确定的,第二识别文本是教师模型基于领域样本语音的语音特征确定的,教师模型基于通用样本语音及其标签识别文本训练得到。本发明提供的语音识别方法、装置、电子设备和存储介质,在特定领域场景下能够准确进行语音识别。
-
公开(公告)号:CN113707168A
公开(公告)日:2021-11-26
申请号:CN202111031462.6
申请日:2021-09-03
Applicant: 合肥讯飞数码科技有限公司
IPC: G10L21/0208 , G10L21/0216 , G10L21/0264 , G10L25/03 , G10L25/30
Abstract: 本申请提出一种语音增强方法、装置、设备及存储介质,该方法包括:将带噪语音输入预先训练的复合式对抗增强网络模型,得到所述复合式对抗增强网络模型输出的语音增强结果,所述语音增强结果中至少包括增强语音;其中,所述复合式对抗增强网络模型对带噪语音进行语音增强处理得到的增强语音的声纹特征,接近于与带噪语音对应的干净语音的声纹特征。上述方法可以在对带噪语音进行语音增强的同时,降低语音增强造成的语音失真。
-
公开(公告)号:CN111477219A
公开(公告)日:2020-07-31
申请号:CN202010383187.3
申请日:2020-05-08
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本发明实施例提供一种关键词区分方法、装置、电子设备和可读存储介质,其中方法包括:确定待测音频的关键词疑似片段的音频特征;将所述待测音频的关键词疑似片段的音频特征输入至关键词区分模型中,得到所述关键词区分模型输出的关键词区分结果;其中,所述关键词区分模型是基于样本音频的样本关键词疑似片段的音频特征以及所述样本关键词疑似片段对应的样本关键词标注内容训练得到的。本发明实施例提供的关键词区分方法,以待测音频的关键词疑似片段的音频特征作为关键词区分模型的输入,通过对识别准确率不高的关键词疑似片段进行进一步区分,滤除关键词疑似片段中的虚警,从而区分出准确的关键词信息。
-
公开(公告)号:CN111429887A
公开(公告)日:2020-07-17
申请号:CN202010314113.4
申请日:2020-04-20
Applicant: 合肥讯飞数码科技有限公司
IPC: G10L15/02 , G10L15/06 , G10L15/08 , G10L15/183 , G10L15/26
Abstract: 本发明公开了一种基于端到端的语音关键词识别方法、装置以及设备。本发明的构思在于与端到端思想相结合,由预建的关键词识别网络从特征向目标进行直接拟合,使得识别过程更加简洁、高效且可以避免不良影响的叠加效应,同时关键词识别网络更易达到全局最优,且能够有效降低开发成本,因此在实际业务场景中具有较高的实用价值。本发明还对识别特征的获取策略进行改进,从而可以充分表征出适应业务场景的发音特性,以便捕获到更多的潜在关键信息,降低漏警虚警,此外,本发明提供的关键词识别网络架构可以从声学角度利用到上下文信息,从根本上解决了现有方案仅通过孤立发音样本进行识别的弊端,进而明显改善了从音频中锁定关键词的处理效果。
-
-
-