发明公开
- 专利标题: 语音拼接点检测方法及存储介质
-
申请号: CN202111116267.3申请日: 2021-09-23
-
公开(公告)号: CN113555007A公开(公告)日: 2021-10-26
- 发明人: 傅睿博 , 陶建华 , 易江燕
- 申请人: 中国科学院自动化研究所
- 申请人地址: 北京市海淀区中关村东路95号
- 专利权人: 中国科学院自动化研究所
- 当前专利权人: 中国科学院自动化研究所
- 当前专利权人地址: 北京市海淀区中关村东路95号
- 代理机构: 北京华夏泰和知识产权代理有限公司
- 代理商 李永叶
- 主分类号: G10L15/02
- IPC分类号: G10L15/02 ; G10L15/04 ; G10L15/16 ; G10L25/24 ; G10L25/30
摘要:
本公开涉及一种语音拼接点检测方法及存储介质,上述方法包括:获取待检测语音,并确定所述待检测语音的高频成分和低频成分;根据所述高频成分和所述低频成分提取所述待检测语音所对应的第一倒谱特征和第二倒谱特征;以帧为单位,拼接所述待检测语音中的每一帧语音中的第一倒谱特征和第二倒谱特征,得到参数序列;将所述参数序列输入神经网络模型,输出所述待检测语音所对应的特征序列,其中,所述神经网络模型已通过训练,学习并保存有参数序列与所述特征序列之间的对应关系;根据所述特征序列对所述待检测语音进行语音拼接点检测。采用上述技术手段,解决现有技术中,通过单一的声学特征对语音拼接点进行检测,语音拼接点检测的准确率低的问题。
公开/授权文献
- CN113555007B 语音拼接点检测方法及存储介质 公开/授权日:2021-12-14