Patent search ap:("科大讯飞股份有限公司") AND inv:"徐文渊" Page 1

1.

发明公开
一种假音检测方法、假音检测模型获取方法及相关设备审中-实审

公开(公告)号：CN116403603A

公开(公告)日：2023-07-07

申请号：CN202310492726.0

申请日：2023-04-28

Applicant: 科大讯飞股份有限公司

Inventor： 唐海桃 , 高天 , 徐文渊 , 陈艳姣 , 方昕 , 刘俊华 , 刘聪

IPC: G10L25/51 , G10L17/04 , G10L17/18

Abstract: 本发明提供了一种假音检测方法、假音检测模型获取方法及相关设备，假音检测方法包括：获取目标语音；基于预先获得的目标假音检测模型，检测目标语音是否为假音，目标假音检测模型采用标注有语音类别的训练语音对构建的假音检测模型训练得到，构建的假音检测模型包括语音编码器、根据语音编码器的输出获取说话人表征的说话人表征模块、根据语音编码器的输出获取假音表征的假音表征模块，以及根据说话人表征模块的输出和假音表征模块的输出进行语音分类的语音分类模块，说话人表征模块通过结合说话人分类任务，辅以语音编码器训练得到，语音编码器为通过预训练获得的语音预训练模型。本发明提供的假音检测方法可准确地检测出语音是否为假音。

2.

发明公开
一种声纹特征提取方法、装置、设备及存储介质审中-实审

公开(公告)号：CN116312563A

公开(公告)日：2023-06-23

申请号：CN202310362146.X

申请日：2023-04-03

Applicant: 科大讯飞股份有限公司

Inventor： 李晋 , 高天 , 方昕 , 刘聪 , 徐文渊 , 陈艳姣

IPC: G10L17/04 , G10L17/02 , G10L17/20

Abstract: 本发明提供了一种声纹特征提取方法、装置、设备及存储介质，方法包括：获取目标语音数据的若干语谱片段；基于预先训练得到的声纹提取模型对若干语谱片段分别提取声纹特征，其中，声纹提取模型以若干时序未打乱的训练语谱片段和若干时序打乱的训练语谱片段为训练样本，以训练样本包含的各训练语谱片段分别对应的真实身份标签为样本标签，以使基于声纹提取模型对训练样本包含的每个训练语谱片段提取的声纹特征预测的身份标签与对应的真实身份标签趋于一致为目标训练得到；基于目标语音数据的若干语谱片段分别对应的声纹特征确定目标语音数据对应的声纹特征。本发明提供的声纹特征提取方法不易受语音时序的影响，可提取到较为精准鲁棒的声纹特征。

Patent Agency Ranking