一种说话人身份确认方法、装置及存储介质

    公开(公告)号:CN110223699B

    公开(公告)日:2021-04-13

    申请号:CN201910407670.8

    申请日:2019-05-15

    Inventor: 蔡晓东 李波 黄玳

    Abstract: 本发明公开了一种说话人身份确认方法、装置及存储介质,属于声纹识别技术领域。该方法包括以下步骤:获取已训练的说话人确认神经网络;将待识别说话人语音与说话人语音数据库输入至所述已训练的说话人确认神经网络,识别所述待识别说话人语音对应的说话人的身份。该装置包括获取模块以及识别模块。本发明使得说话人确认能够基于所述已训练的说话人确认神经网络进行,以提高说话人确认神经网络识别说话人身份的准确度以及识别的稳定度。

    一种端到端说话人确认方法、装置及存储介质

    公开(公告)号:CN109256135B

    公开(公告)日:2021-05-18

    申请号:CN201810988567.2

    申请日:2018-08-28

    Inventor: 蔡晓东 李波

    Abstract: 本发明提供一种端到端说话人确认方法、装置及存储介质,其方法包括构建说话人确认端到端网络,所述说话人确认端到端网络包括前端的ResCNN残差卷积神经网络模型和后端的,ResCNN残差卷积神经网络模型用于提取语音帧级别特征,阈值再加权注意力模型对语音帧级别特征转化为句子级别特征,从而完成对所述说话人确认端到端网络的训练;通过训练得到的说话人确认端到端网络,以确定测试语音的注册人;本发明实现了端到端处理,阈值再加权注意力模型通过赋予权重的形式提取出关键语音帧级别特征,将非关键语音帧级别特征筛除,再进行加权平均处理来放大关键语音帧级别特征,从帧级别特征转化为句子级别特征,极大的提高了语音识别度。

    一种声纹识别方法、装置及存储介质

    公开(公告)号:CN108877812B

    公开(公告)日:2021-04-02

    申请号:CN201810936422.8

    申请日:2018-08-16

    Inventor: 蔡晓东 李波

    Abstract: 本发明提供一种声纹识别方法、装置及存储介质,其方法包括根据多个人声语音样本基于特征提取网络进行模型训练,得到特征提取模型;将测试语音输入所述特征提取模型中,得到测试语音特征向量;将所述测试语音特征向量与预先建立的注册语音特征向量数据库进行匹配,根据匹配结果确定所述测试语音的注册人。本发明将人声语音样本由一维语音信息转化为二维语音信息,并进行训练,得到的特征提取网络能够快速提取特征向量,利于快速、准确的识别出注册语音与测试语音是否为同一人声。

    一种说话人身份确认方法、装置及存储介质

    公开(公告)号:CN110223699A

    公开(公告)日:2019-09-10

    申请号:CN201910407670.8

    申请日:2019-05-15

    Inventor: 蔡晓东 李波 黄玳

    Abstract: 本发明公开了一种说话人身份确认方法、装置及存储介质,属于声纹识别技术领域。该方法包括以下步骤:获取已训练的说话人确认神经网络;将待识别说话人语音与说话人语音数据库输入至所述已训练的说话人确认神经网络,识别所述待识别说话人语音对应的说话人的身份。该装置包括获取模块以及识别模块。本发明使得说话人确认能够基于所述已训练的说话人确认神经网络进行,以提高说话人确认神经网络识别说话人身份的准确度以及识别的稳定度。

    一种声纹识别方法、装置及存储介质

    公开(公告)号:CN108877812A

    公开(公告)日:2018-11-23

    申请号:CN201810936422.8

    申请日:2018-08-16

    Inventor: 蔡晓东 李波

    Abstract: 本发明提供一种声纹识别方法、装置及存储介质,其方法包括根据多个人声语音样本基于特征提取网络进行模型训练,得到特征提取模型;将测试语音输入所述特征提取模型中,得到测试语音特征向量;将所述测试语音特征向量与预先建立的注册语音特征向量数据库进行匹配,根据匹配结果确定所述测试语音的注册人。本发明将人声语音样本由一维语音信息转化为二维语音信息,并进行训练,得到的特征提取网络能够快速提取特征向量,利于快速、准确的识别出注册语音与测试语音是否为同一人声。

    一种端到端说话人确认方法、装置及存储介质

    公开(公告)号:CN109256135A

    公开(公告)日:2019-01-22

    申请号:CN201810988567.2

    申请日:2018-08-28

    Inventor: 蔡晓东 李波

    Abstract: 本发明提供一种端到端说话人确认方法、装置及存储介质,其方法包括构建说话人确认端到端网络,所述说话人确认端到端网络包括前端的ResCNN残差卷积神经网络模型和后端的,ResCNN残差卷积神经网络模型用于提取语音帧级别特征,阈值再加权注意力模型对语音帧级别特征转化为句子级别特征,从而完成对所述说话人确认端到端网络的训练;通过训练得到的说话人确认端到端网络,以确定测试语音的注册人;本发明实现了端到端处理,阈值再加权注意力模型通过赋予权重的形式提取出关键语音帧级别特征,将非关键语音帧级别特征筛除,再进行加权平均处理来放大关键语音帧级别特征,从帧级别特征转化为句子级别特征,极大的提高了语音识别度。

Patent Agency Ranking