一种基于音频指纹的语音检索方法及系统
摘要:
本发明涉及一种基于音频指纹的语音检索方法及系统。该方法包括:提取时长为20s的原始语音的梅尔频率倒谱系数MFCC特征和线性预测倒谱系数LPCC特征;将所述MFCC特征和所述LPCC特征进行特征组合处理,确定组合后的特征矩阵;基于信息熵的特征降维方法,对所述组合后的特征矩阵进行列降维,确定列降维后的特征矩阵;基于能量的特征降维方法,对所述列降维后的特征矩阵进行行降维,确定行降维后的特征矩阵;根据所述行降维后的特征矩阵构建音频指纹数据库;利用归一化汉明距离算法,将待查询语音片段与所述音频指纹库中的音频指纹进行匹配检索。本发明能够提高对长语音片段的检索效率和检索精度以及音频指纹的检索鲁棒性。
公开/授权文献
0/0