基于音素时长特征的虚假语音检测方法及装置

发明授权

请登陆查看更多内容

专利标题： 基于音素时长特征的虚假语音检测方法及装置
申请号： CN202110841276.2

申请日： 2021-07-26
公开(公告)号： CN113284513B

公开(公告)日： 2021-10-15
发明人: 陶建华 , 汪涛 , 易江燕 , 傅睿博
申请人： 中国科学院自动化研究所
申请人地址： 北京市海淀区中关村东路95号
专利权人： 中国科学院自动化研究所
当前专利权人： 中国科学院自动化研究所
当前专利权人地址： 北京市海淀区中关村东路95号
代理机构： 北京华夏泰和知识产权代理有限公司
代理商 李永叶
主分类号： G10L25/51
IPC分类号： G10L25/51 ; G10L25/30 ; G10L25/24 ; G10L25/18 ; G06N3/08 ; G06N3/04 ; G06N3/00

摘要：

本发明提供基于音素时长特征的虚假语音检测方法，包括：从音频训练数据中提取声学特征；利用音频训练数据对深度学习网络进行预训练，得到预训练深度学习网络；应用预训练深度学习网络的最后n层的隐含特征作为中间变量，提取音素时长特征向量；将所述声学特征和所述音素时长特征向量作为输入，输入到判别器进行训练；应用音频测试数据，重复步骤S1‑S3，得到测试数据的声学特征和音素时长特征向量，将测试数据的声学特征和音素时长特征向量输入到训练好的判别器，得测试语音的真伪检测结果。

公开/授权文献

CN113284513A 基于音素时长特征的虚假语音检测方法及装置公开/授权日：2021-08-20

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L25/00	不限于组G10L 15/00-G10L 21/00的语言或者声音分析技术(当利用语音检测器来感知一些信号特殊特征的基于半导体的静噪放大器，如无信号时的感知入H03G3/34)
G10L25/48	.专门适用于特定用途
G10L25/51	..比较或判别