-
公开(公告)号:CN116778910A
公开(公告)日:2023-09-19
申请号:CN202310505872.2
申请日:2023-05-06
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G10L15/02 , G10L15/06 , G10L15/16 , G10L15/28 , G06F18/2135 , G06F18/241 , G06N3/0464 , G06N3/08
Abstract: 本申请提供了一种语音检测方法,包括:获取目标语音,将所述目标语音进行预处理,所述预处理包括预加重、分帧及加窗;确定所述预处理后目标语音的第一声道特征、第一声源波特征和多种第一相关特征;基于所述第一声道特征、第一声源波特征和多种第一相关特征确定所述第一主成分特征;将所述第一主成分特征输入训练好的分类器,输出分类的结果,所述分类结果为伪造语音,或自然语音。本申请利用伪造语音在基频处留下的痕迹信息,利用伪造语音与自然语音在声源和声道特征上的差异以实现伪造语音检测。使用主成分分析的方法分别对声源和声道特征进行筛选,选取具有较高相关性的主成分作为特征,减少特征维度和冗余特征,提高模型的泛化能力和效率。
-
公开(公告)号:CN119559964A
公开(公告)日:2025-03-04
申请号:CN202310496296.X
申请日:2023-05-05
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本申请提供了一种伪造语音检测方法,包括:训练阶段,训练阶段包括:采集用于训练第一语音信号;确定第一语音信号中的静音帧和语音帧;对第一语音信号的静音帧进行零值掩蔽;获取掩蔽后的第一语音信号的特征;将特征输入伪造语音检测模型进行训练,得到训练好的伪造语音检测模型;推理阶段,推理阶段包括:采集目标语音,获取目标语音的特征;对所述目标语音进行零值掩蔽,获取掩蔽后的所述目标语音的特征;将目标语音的特征输入训练好伪造语音检测模型,输出目标语音的检测结果,检测结果包括目标语音为伪造语音或目标语音为真语音。
-
公开(公告)号:CN113157967A
公开(公告)日:2021-07-23
申请号:CN202110420849.4
申请日:2021-04-19
Applicant: 中国科学院声学研究所
Abstract: 本申请提供了一种音频检索方法及装置。该方法包括:根据待检索的音频信号的指纹序列,采用哈希索引在音频指纹库中获得相似指纹序列;然后,在频域维度分别将指纹序列和各个相似指纹序列划分为数量相同的多段指纹;比较各个相似指纹序列中各段指纹与指纹序列中各段指纹的差异性,从而确定音频信号是否被音频指纹库检索成功。该方案解决了音频信号存在背景音乐干扰时,音频信号被错误的检索成功的问题,提升音频信号被检出的准确率。
-
公开(公告)号:CN116597818A
公开(公告)日:2023-08-15
申请号:CN202310440282.6
申请日:2023-04-21
Applicant: 中国科学院声学研究所
Abstract: 本申请提供一种语音检测模型的训练方法,包括:采集训练语音检测模型使用的语音,分别提取语音中每一条语音的声纹特征并进行差分得到第一特征信号。将第一特征信号作为神经网络的输入,使用损失函数迭代训练神经网络的参数,直至满足结束条件,得到目标语音检测模型。神经网络用于学习第一特征信号中携带的时序信息。由此,通过建立可以深度学习语音所携带时序信息的目标语音检测模型,可以提高对语音信号的真伪进行检测的准确性和鲁棒性。
-
公开(公告)号:CN116959425A
公开(公告)日:2023-10-27
申请号:CN202310746199.1
申请日:2023-06-21
Applicant: 中国科学院声学研究所
Abstract: 本发明提供一种鲁棒的伪造语音算法的溯源方法及装置。该方法包括:利用训练数据集训练针对伪造语音算法的分类器;利用训练好的分类器处理所述训练数据集,得到所述分类器中的隐层针对所述各条伪造语音生成的隐层特征;利用训练好的分类器处理待检测的目标语音信号,得到所述分类器中的隐层生成的目标隐层特征和所述分类器的输出层输出的目标分类结果;分别计算所述目标隐层特征与若干隐层特征的距离,并确定其中的最短距离;当所述最短距离大于或等于预设阈值时,将所述目标分类结果作为所述目标语音信号的最终分类结果。如此,可以使用声码器生成伪造算法识别的训练集。引入最邻近节点算法,通过最邻近距离的分布区分训练集中不存在的分布外数据。
-
公开(公告)号:CN116758943A
公开(公告)日:2023-09-15
申请号:CN202310820588.4
申请日:2023-07-05
Applicant: 中国科学院声学研究所
Abstract: 本发明实施例公开一种合成语音检测方法、装置、电子设备及存储介质,涉及语音识别技术领域,能够提高检测合成语音的准确率。所述方法包括:获取第一集合中的第一语音信号;第一语音信号包括真实语音信号以及合成语音信号;基于第一语音信号以及预设分类模型,生成第一交叉熵损失函数;生成分类模型的当前模型参数下的近似第一集合外的数据的后验分布特征,基于后验分布特征,生成第二交叉熵损失函数;基于第一交叉熵损失函数以及第二交叉熵损失函数,生成总损失函数;利用总损失函数进行梯度回传,对分类模型进行参数更新,以获得更新后的分类模型;将待检测语音信号的声学特征输入所述更新后的分类模型,以获得待检测语音信号的检测结果。
-
-
-
-
-