-
公开(公告)号:CN113140222B
公开(公告)日:2023-08-01
申请号:CN202110505478.X
申请日:2021-05-10
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种声纹向量提取方法、装置、设备及存储介质,方法包括:获取目标语音数据对应的语谱片段序列,基于语谱片段序列和预先建立的第一声纹提取模型确定声纹向量,第一声纹提取模型以第一训练语谱片段为训练样本,采用第二声纹提取模型辅助训练得到,第一声纹提取模型的训练目标包括:使基于第一声纹向量和第二声纹向量分别针对设定身份标签预测的概率趋于一致,第一声纹向量为第一声纹提取模型针对第一训练语谱片段提取的声纹向量,第二声纹向量为第二声纹提取模型针对第二训练语谱片段提取的声纹向量,第二训练语谱片段为对第一训练语谱片段的时序进行打乱后的语谱片段。本申请提供的声纹向量提取方法不受语音时序信息的干扰。
-
公开(公告)号:CN115762574A
公开(公告)日:2023-03-07
申请号:CN202211435101.2
申请日:2022-11-16
Applicant: 科大讯飞股份有限公司
IPC: G10L25/57 , G10L25/03 , G06F18/25 , G06F18/2431 , G06N3/0455 , G06N3/0464 , G06N3/042 , G06N3/08
Abstract: 本申请提出一种基于语音的动作生成方法、装置、电子设备及存储介质,该方法包括:确定目标语音中包含的动作意图,并确定与所述动作意图相匹配的第一动作序列;以及,从所述目标语音中提取得到语音韵律特征,并基于所述语音韵律特征预测得到与所述语音韵律特征相匹配的第二动作序列;对所述第一动作序列和所述第二动作序列进行融合处理,生成与所述目标语音相匹配的动作序列。上述方案通过多维度的信息生成了与目标语音相匹配的动作序列,从而使得生成的与目标语音相匹配的动作序列更准确,并且更加自然、协调。
-
公开(公告)号:CN106157953A
公开(公告)日:2016-11-23
申请号:CN201510181631.2
申请日:2015-04-16
Applicant: 科大讯飞股份有限公司 , 中国科学技术大学
Abstract: 本发明公开了一种连续语音识别方法及系统,该方法包括:预先训练语音去噪与声学分类相融合的神经网络;接收待识别的连续语音信号;提取所述语音信号的声学特征;根据所述声学特征和所述神经网络得到语音建模单元的后验概率;对所述语音信号连续语音段的所有帧语音的建模单元后验概率进行维特比解码,得到语音识别结果。利用本发明,可以提高连续语音识别结果的正确率。
-
-