- 专利标题: 基于音素时长特征的虚假语音检测方法及装置
-
申请号: CN202110841276.2申请日: 2021-07-26
-
公开(公告)号: CN113284513B公开(公告)日: 2021-10-15
- 发明人: 陶建华 , 汪涛 , 易江燕 , 傅睿博
- 申请人: 中国科学院自动化研究所
- 申请人地址: 北京市海淀区中关村东路95号
- 专利权人: 中国科学院自动化研究所
- 当前专利权人: 中国科学院自动化研究所
- 当前专利权人地址: 北京市海淀区中关村东路95号
- 代理机构: 北京华夏泰和知识产权代理有限公司
- 代理商 李永叶
- 主分类号: G10L25/51
- IPC分类号: G10L25/51 ; G10L25/30 ; G10L25/24 ; G10L25/18 ; G06N3/08 ; G06N3/04 ; G06N3/00
摘要:
本发明提供基于音素时长特征的虚假语音检测方法,包括:从音频训练数据中提取声学特征;利用音频训练数据对深度学习网络进行预训练,得到预训练深度学习网络;应用预训练深度学习网络的最后n层的隐含特征作为中间变量,提取音素时长特征向量;将所述声学特征和所述音素时长特征向量作为输入,输入到判别器进行训练;应用音频测试数据,重复步骤S1‑S3,得到测试数据的声学特征和音素时长特征向量,将测试数据的声学特征和音素时长特征向量输入到训练好的判别器,得测试语音的真伪检测结果。
公开/授权文献
- CN113284513A 基于音素时长特征的虚假语音检测方法及装置 公开/授权日:2021-08-20