一种音频检索方法及装置

    公开(公告)号:CN113157967A

    公开(公告)日:2021-07-23

    申请号:CN202110420849.4

    申请日:2021-04-19

    Abstract: 本申请提供了一种音频检索方法及装置。该方法包括:根据待检索的音频信号的指纹序列,采用哈希索引在音频指纹库中获得相似指纹序列;然后,在频域维度分别将指纹序列和各个相似指纹序列划分为数量相同的多段指纹;比较各个相似指纹序列中各段指纹与指纹序列中各段指纹的差异性,从而确定音频信号是否被音频指纹库检索成功。该方案解决了音频信号存在背景音乐干扰时,音频信号被错误的检索成功的问题,提升音频信号被检出的准确率。

    一种语音检测模型训练和语音检测方法

    公开(公告)号:CN116597818A

    公开(公告)日:2023-08-15

    申请号:CN202310440282.6

    申请日:2023-04-21

    Abstract: 本申请提供一种语音检测模型的训练方法,包括:采集训练语音检测模型使用的语音,分别提取语音中每一条语音的声纹特征并进行差分得到第一特征信号。将第一特征信号作为神经网络的输入,使用损失函数迭代训练神经网络的参数,直至满足结束条件,得到目标语音检测模型。神经网络用于学习第一特征信号中携带的时序信息。由此,通过建立可以深度学习语音所携带时序信息的目标语音检测模型,可以提高对语音信号的真伪进行检测的准确性和鲁棒性。

    一种鲁棒的伪造语音算法的溯源方法及装置

    公开(公告)号:CN116959425A

    公开(公告)日:2023-10-27

    申请号:CN202310746199.1

    申请日:2023-06-21

    Abstract: 本发明提供一种鲁棒的伪造语音算法的溯源方法及装置。该方法包括:利用训练数据集训练针对伪造语音算法的分类器;利用训练好的分类器处理所述训练数据集,得到所述分类器中的隐层针对所述各条伪造语音生成的隐层特征;利用训练好的分类器处理待检测的目标语音信号,得到所述分类器中的隐层生成的目标隐层特征和所述分类器的输出层输出的目标分类结果;分别计算所述目标隐层特征与若干隐层特征的距离,并确定其中的最短距离;当所述最短距离大于或等于预设阈值时,将所述目标分类结果作为所述目标语音信号的最终分类结果。如此,可以使用声码器生成伪造算法识别的训练集。引入最邻近节点算法,通过最邻近距离的分布区分训练集中不存在的分布外数据。

    一种合成语音检测方法、装置、电子设备以及存储介质

    公开(公告)号:CN116758943A

    公开(公告)日:2023-09-15

    申请号:CN202310820588.4

    申请日:2023-07-05

    Abstract: 本发明实施例公开一种合成语音检测方法、装置、电子设备及存储介质,涉及语音识别技术领域,能够提高检测合成语音的准确率。所述方法包括:获取第一集合中的第一语音信号;第一语音信号包括真实语音信号以及合成语音信号;基于第一语音信号以及预设分类模型,生成第一交叉熵损失函数;生成分类模型的当前模型参数下的近似第一集合外的数据的后验分布特征,基于后验分布特征,生成第二交叉熵损失函数;基于第一交叉熵损失函数以及第二交叉熵损失函数,生成总损失函数;利用总损失函数进行梯度回传,对分类模型进行参数更新,以获得更新后的分类模型;将待检测语音信号的声学特征输入所述更新后的分类模型,以获得待检测语音信号的检测结果。

Patent Agency Ranking