发明授权
- 专利标题: 一种基于音频指纹的语音检索方法及系统
-
申请号: CN202010938773.X申请日: 2020-09-09
-
公开(公告)号: CN112035696B公开(公告)日: 2024-05-28
- 发明人: 张秋余 , 许福久 , 张其文 , 段宏湘 , 白建 , 赵雪娇
- 申请人: 兰州理工大学
- 申请人地址: 甘肃省兰州市七里河区兰工坪路287号
- 专利权人: 兰州理工大学
- 当前专利权人: 兰州理工大学
- 当前专利权人地址: 甘肃省兰州市七里河区兰工坪路287号
- 代理机构: 北京高沃律师事务所
- 代理商 杜阳阳
- 主分类号: G06F16/635
- IPC分类号: G06F16/635 ; G06F16/683 ; G10L15/02 ; G10L15/08 ; G10L25/24
摘要:
本发明涉及一种基于音频指纹的语音检索方法及系统。该方法包括:提取时长为20s的原始语音的梅尔频率倒谱系数MFCC特征和线性预测倒谱系数LPCC特征;将所述MFCC特征和所述LPCC特征进行特征组合处理,确定组合后的特征矩阵;基于信息熵的特征降维方法,对所述组合后的特征矩阵进行列降维,确定列降维后的特征矩阵;基于能量的特征降维方法,对所述列降维后的特征矩阵进行行降维,确定行降维后的特征矩阵;根据所述行降维后的特征矩阵构建音频指纹数据库;利用归一化汉明距离算法,将待查询语音片段与所述音频指纹库中的音频指纹进行匹配检索。本发明能够提高对长语音片段的检索效率和检索精度以及音频指纹的检索鲁棒性。
公开/授权文献
- CN112035696A 一种基于音频指纹的语音检索方法及系统 公开/授权日:2020-12-04