一种基于音频指纹的语音检索方法及系统

发明授权

CN112035696B 一种基于音频指纹的语音检索方法及系统有权

请登陆查看更多内容

专利标题： 一种基于音频指纹的语音检索方法及系统
申请号： CN202010938773.X

申请日： 2020-09-09
公开(公告)号： CN112035696B

公开(公告)日： 2024-05-28
发明人: 张秋余 , 许福久 , 张其文 , 段宏湘 , 白建 , 赵雪娇
申请人： 兰州理工大学
申请人地址： 甘肃省兰州市七里河区兰工坪路287号
专利权人： 兰州理工大学
当前专利权人： 兰州理工大学
当前专利权人地址： 甘肃省兰州市七里河区兰工坪路287号
代理机构： 北京高沃律师事务所
代理商 杜阳阳
主分类号： G06F16/635
IPC分类号： G06F16/635 ; G06F16/683 ; G10L15/02 ; G10L15/08 ; G10L25/24

摘要：

本发明涉及一种基于音频指纹的语音检索方法及系统。该方法包括：提取时长为20s的原始语音的梅尔频率倒谱系数MFCC特征和线性预测倒谱系数LPCC特征；将所述MFCC特征和所述LPCC特征进行特征组合处理，确定组合后的特征矩阵；基于信息熵的特征降维方法，对所述组合后的特征矩阵进行列降维，确定列降维后的特征矩阵；基于能量的特征降维方法，对所述列降维后的特征矩阵进行行降维，确定行降维后的特征矩阵；根据所述行降维后的特征矩阵构建音频指纹数据库；利用归一化汉明距离算法，将待查询语音片段与所述音频指纹库中的音频指纹进行匹配检索。本发明能够提高对长语音片段的检索效率和检索精度以及音频指纹的检索鲁棒性。

公开/授权文献

CN112035696A 一种基于音频指纹的语音检索方法及系统公开/授权日：2020-12-04

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06F	电数字数据处理（基于特定计算模型的计算机系统入G06N）
G06F16/00	信息检索；数据库结构；文件系统结构
G06F16/60	.•音频数据
G06F16/63	..••查询
G06F16/635	...•••基于附加数据的过滤,例如,用户或组配置文件