-
公开(公告)号:CN116682461A
公开(公告)日:2023-09-01
申请号:CN202310822386.3
申请日:2023-07-05
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请公开了一种音频信号选取方法、装置、相关设备及信号接收系统,本申请获取各个候选音频信号并提取每一候选音频信号的声学特征,该声学特征为,能够以其为依据解码得到目标音频信号的声学特征,其中,目标音频信号趋近于或等同于候选音频信号。鉴于声学特征的上述特性可知,声学特征包含了候选音频信号的各个维度的本征信息,如此才能够基于各维度丰富的本征信息解码还原出原始的候选音频信号。显然,声学特征所包含的各维度的本征信息必然包含了影响音频信号质量的各维度的影响因素,在此基础上,可以基于该声学特征准确的评估候选音频信号的质量,并参考各候选音频信号的质量,选取满足设定质量条件的候选音频信号,作为最终选取结果。
-
公开(公告)号:CN111583963B
公开(公告)日:2023-03-21
申请号:CN202010419124.9
申请日:2020-05-18
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请提出一种重复音频检测方法、装置、设备及存储介质,该方法包括:分别获取待检测音频数据集中的各音频数据的音频特征;根据待检测音频数据集中的各音频数据的音频特征,分别确定每两个音频数据间的相似度影响序列;其中,相似度影响序列包括该两个音频数据的音频特征的每一特征维度对于度量该两个音频数据的相似度的贡献度;对于待检测音频数据集中的每两个音频数据,依据其各自的音频特征,和该两个音频数据间的相似度影响序列,确定该两个音频数据各自的加权音频特征;以待检测音频数据集中的每两个音频数据的加权音频特征之间的相似度为依据,检测待检测音频数据集中的重复音频数据。采用上述方案可以更准确地检测出重复音频数据。
-
公开(公告)号:CN115223571A
公开(公告)日:2022-10-21
申请号:CN202210683340.3
申请日:2022-06-15
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请公开了一种声纹提取方法、声纹识别方法及相关装置、设备和介质,其中,声纹提取方法包括:获取由目标对象的各目标语音提取到的初始声纹特征,分别与参考声纹特征之间的差值声纹特征;从若干高斯混合模型中,确定与差值声纹特征匹配的高斯混合模型,作为差值声纹特征对应的目标混合模型;基于差值声纹特征和差值声纹特征对应的目标混合模型,分析得到信道特征,并从差值声纹特征对应的初始声纹特征中剥离信道特征,得到差值声纹特征对应的优化声纹特征;基于各差值声纹特征分别对应的优化声纹特征进行特征融合,得到目标对象的最终声纹特征。上述方案,能够尽可能地削弱声纹特征中的信道噪声,以提升声纹识别的准确性。
-
公开(公告)号:CN114842833A
公开(公告)日:2022-08-02
申请号:CN202210514378.8
申请日:2022-05-11
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请公开了一种语音识别方法及相关装置、电子设备和存储介质,其中,语音识别方法包括:获取待识别语音;基于语音识别模型对待识别语音进行识别,得到识别文本;其中,语音识别模型包括编码网络和解码网络,编码网络基于样本第一干净语音经特征聚类并量化后的帧级第一量化特征、样本第一带噪语音的帧级带噪语音特征之间的对比损失训练得到,样本第一带噪语音由样本第一干净语音加噪得到,解码网络在编码网络训练收敛之后基于样本第二带噪语音进行有监督训练得到。上述方案,够在低信噪比和低资源的场景下,提升语音识别性能。
-
公开(公告)号:CN114708854A
公开(公告)日:2022-07-05
申请号:CN202210283915.2
申请日:2022-03-21
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本发明提供一种语音识别方法、装置、电子设备和存储介质,所述方法包括:确定待识别语音;基于第一语音识别模型,对待识别语音的频谱特征进行声学状态预测,得到待识别语音的第一声学状态后验概率;基于第二语音识别模型,对待识别语音的语义特征进行声学状态预测,得到待识别语音的第二声学状态后验概率;融合第一声学状态后验概率和第二声学状态后验概率,基于融合得到的融合后验概率进行语音识别解码,得到待识别语音的识别文本。本发明提供的语音识别方法、装置、电子设备和存储介质,在领域场景下能够准确进行语音识别。
-
公开(公告)号:CN114708852A
公开(公告)日:2022-07-05
申请号:CN202210255584.1
申请日:2022-03-15
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本发明提供一种语音识别方法、装置、电子设备和存储介质,所述方法包括:将待识别语音的语音特征输入至语音识别模型,得到语音识别模型输出的识别文本;语音识别模型是基于领域样本语音的标签识别文本和第一识别文本之间的差异,以及第一识别文本和第二识别文本之间的差异,对学生模型进行参数迭代得到的;第一识别文本是学生模型基于领域样本语音的语音特征确定的,第二识别文本是教师模型基于领域样本语音的语音特征确定的,教师模型基于通用样本语音及其标签识别文本训练得到。本发明提供的语音识别方法、装置、电子设备和存储介质,在特定领域场景下能够准确进行语音识别。
-
公开(公告)号:CN114203169A
公开(公告)日:2022-03-18
申请号:CN202210094152.7
申请日:2022-01-26
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请提供了一种语音识别结果确定方法、装置、设备及存储介质,其中,方法包括:获取目标语音在多个语音识别系统上分别对应的候选集,其中,目标语音在一个语音识别系统上对应的候选集包括基于该语音识别系统获得的若干候选识别结果;将获取的多个候选集两两组合,以得到若干组候选集;确定若干组候选集分别对应的相似性信息,并基于若干组候选集分别对应的相似性信息,从多个候选集中确定目标语音的识别结果,其中,相似性信息为对应的两个候选集中的第一候选集包含的候选识别结果与第二候选集包含的候选识别结果的句子级别的相似性信息。通过本申请提供的语音识别结果确定方法能够较快地确定出准确度较高的语音识别结果。
-
公开(公告)号:CN113707168A
公开(公告)日:2021-11-26
申请号:CN202111031462.6
申请日:2021-09-03
Applicant: 合肥讯飞数码科技有限公司
IPC: G10L21/0208 , G10L21/0216 , G10L21/0264 , G10L25/03 , G10L25/30
Abstract: 本申请提出一种语音增强方法、装置、设备及存储介质,该方法包括:将带噪语音输入预先训练的复合式对抗增强网络模型,得到所述复合式对抗增强网络模型输出的语音增强结果,所述语音增强结果中至少包括增强语音;其中,所述复合式对抗增强网络模型对带噪语音进行语音增强处理得到的增强语音的声纹特征,接近于与带噪语音对应的干净语音的声纹特征。上述方法可以在对带噪语音进行语音增强的同时,降低语音增强造成的语音失真。
-
公开(公告)号:CN113488023A
公开(公告)日:2021-10-08
申请号:CN202110770019.4
申请日:2021-07-07
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请公开了一种语种识别模型构建方法、语种识别方法,先利用第一样本语音及其实际语种、第二样本语音,针对待训练教师模型和待训练学生模型进行两阶段训练,得到待使用教师模型和待使用学生模型,以使该待使用教师模型和该待使用学生模型均具有较好的语种识别性能;再根据该待使用学生模型确定语种识别模型,以使该语种识别模型也具有较好的语种识别性能;最后,借助该语种识别模型针对待识别语音进行语种识别,得到该待识别语音的预测语种。其中,因无标签训练数据能够弥补带标签训练数据中数据分布失衡的缺陷,使得基于带标签训练数据和无标签训练数据进行构建的语种识别模型具有较好的语种识别性能,如此能够提高语种识别准确性。
-
公开(公告)号:CN113409771A
公开(公告)日:2021-09-17
申请号:CN202110573557.4
申请日:2021-05-25
Applicant: 合肥讯飞数码科技有限公司
Abstract: 本申请公开了一种伪造音频的检测方法、伪造音频的检测系统和计算机可读存储介质,该方法包括:获取待测音频和真实音频;提取待测音频和真实音频中属于共用音素状态的音频部分,其中,共用音素状态为待测音频和真实音频中均存在的音素状态,音频部分包括属于待测音频的第一音频部分和属于真实音频的第二音频部分;基于第一音频部分和第二音频部分之间的特征相似度,确定待测音频是否为伪造音频。通过上述方式,本申请能够提高对音频真伪检测的准确度,从而实现有效地鉴别音频的真假。
-
-
-
-
-
-
-
-
-