发明授权
- 专利标题: 基于人工智能的语音特征提取方法及装置
-
申请号: CN201611239071.2申请日: 2016-12-28
-
公开(公告)号: CN106710589B公开(公告)日: 2019-07-30
- 发明人: 李超 , 李先刚
- 申请人: 百度在线网络技术(北京)有限公司
- 申请人地址: 北京市海淀区上地十街10号百度大厦三层
- 专利权人: 百度在线网络技术(北京)有限公司
- 当前专利权人: 百度在线网络技术(北京)有限公司
- 当前专利权人地址: 北京市海淀区上地十街10号百度大厦三层
- 代理机构: 北京清亦华知识产权代理事务所
- 代理商 宋合成
- 主分类号: G10L15/02
- IPC分类号: G10L15/02 ; G10L25/18
摘要:
本发明提出一种基于人工智能的语音特征提取方法及装置,其中,方法包括:对待识别语音进行频谱分析,得到待识别语音的语谱图,利用图像识别算法中的Inception卷积结构,对语谱图进行特征提取,得到待识别语音的语音特征。本发明中,通过对待识别语音进行频谱分析,将连续的待识别语音转换成语谱图进行表示,由于Inception卷积结构为可以精准识别图像特征的有效的图像识别方式,利用Inception卷积结构对语谱图进行识别,提取出待识别语音较为准确的语音特征,进而可以提高语音识别的准确率。
公开/授权文献
- CN106710589A 基于人工智能的语音特征提取方法及装置 公开/授权日:2017-05-24