一种在线声纹特征更新方法及设备、存储设备和建模设备

    公开(公告)号:CN112735438B

    公开(公告)日:2024-05-31

    申请号:CN202011594594.5

    申请日:2020-12-29

    Abstract: 本申请提供了一种在线声纹特征更新方法,还提供了相应的在线声纹特征更新设备,以及存储设备和建模设备;本申请中的方法中,需要进行声纹特征更新的设备通过在需要测试音频数据时,采用初始化时默认的声纹模型提取器对待测试的测试音频数据进行声纹模型提取,并且进行数据分析后再采用新的声纹模型提取器重新提取分析后的注册音频数据,完成在线更新;通过这种方式,本申请能够使待测试的测试音频可以快速体验新的声纹模型提取器的检索比对效果。

    声纹提取方法、身份识别方法及相关设备

    公开(公告)号:CN114783415A

    公开(公告)日:2022-07-22

    申请号:CN202210239481.6

    申请日:2022-03-11

    Abstract: 本申请公开了一种声纹提取方法、身份识别方法、声纹提取装置、身份识别装置、电子设备及计算机可读存储介质。该声纹提取方法包括:基于目标对象的第一语谱图进行特征提取,得到若干音素片段的特征序列;其中,特征序列包括至少一个帧级特征;基于音素片段的特征序列进行特征统计,得到音素片段的音素特征;基于若干音素片段的音素特征,得到所述目标对象的声纹特征。通过上述方式,能够提高声纹特征的鲁棒性和准确性。

    一种声纹向量提取方法、装置、设备及存储介质

    公开(公告)号:CN113140222A

    公开(公告)日:2021-07-20

    申请号:CN202110505478.X

    申请日:2021-05-10

    Abstract: 本申请提供了一种声纹向量提取方法、装置、设备及存储介质,方法包括:获取目标语音数据对应的语谱片段序列,基于语谱片段序列和预先建立的第一声纹提取模型确定声纹向量,第一声纹提取模型以第一训练语谱片段为训练样本,采用第二声纹提取模型辅助训练得到,第一声纹提取模型的训练目标包括:使基于第一声纹向量和第二声纹向量分别针对设定身份标签预测的概率趋于一致,第一声纹向量为第一声纹提取模型针对第一训练语谱片段提取的声纹向量,第二声纹向量为第二声纹提取模型针对第二训练语谱片段提取的声纹向量,第二训练语谱片段为对第一训练语谱片段的时序进行打乱后的语谱片段。本申请提供的声纹向量提取方法不受语音时序信息的干扰。

    一种在线声纹特征更新方法及设备、存储设备和建模设备

    公开(公告)号:CN112735438A

    公开(公告)日:2021-04-30

    申请号:CN202011594594.5

    申请日:2020-12-29

    Abstract: 本申请提供了一种在线声纹特征更新方法,还提供了相应的在线声纹特征更新设备,以及存储设备和建模设备;本申请中的方法中,需要进行声纹特征更新的设备通过在需要测试音频数据时,采用初始化时默认的声纹模型提取器对待测试的测试音频数据进行声纹模型提取,并且进行数据分析后再采用新的声纹模型提取器重新提取分析后的注册音频数据,完成在线更新;通过这种方式,本申请能够使待测试的测试音频可以快速体验新的声纹模型提取器的检索比对效果。

    语音匹配方法、装置、电子设备及存储介质

    公开(公告)号:CN111968650A

    公开(公告)日:2020-11-20

    申请号:CN202010826186.1

    申请日:2020-08-17

    Abstract: 本发明实施例提供一种语音匹配方法、装置、电子设备及存储介质,所述方法包括:确定待匹配话单的两个待匹配号码;将待匹配话单中的语音数据的声纹特征分别与两个待匹配号码的声纹特征进行匹配,得到待匹配话单中的语音数据与两个待匹配号码的匹配关系;其中,任一待匹配号码的声纹特征是对该待匹配号码的话单集中每一语音数据的声纹特征进行聚类得到的,该待匹配号码的话单集包括多个以该待匹配号码为一端、不同号码为另一端的话单。本发明实施例提供的方法、装置、电子设备及存储介质,保证了语音数据与其对应主被叫号码的一致性。

    模型训练方法、说话人识别方法、装置、设备、介质及产品

    公开(公告)号:CN118197321A

    公开(公告)日:2024-06-14

    申请号:CN202410189599.1

    申请日:2024-02-20

    Abstract: 本申请提出一种模型训练方法、说话人识别方法、装置、设备、介质及产品,该模型训练方法包括:在对声纹提取模型进行声纹身份预测训练的过程中,基于所述声纹提取模型的隐层声学特征,执行声学特征预测任务,得到声学特征预测结果;所述声学特征预测任务包括根据所述语音数据的第一语音帧的声学特征,预测所述语音数据的第二语音帧的声学特征;基于所述声学特征预测结果以及所述第二语音帧的真实声学特征,确定声学特征预测损失;以降低所述声学特征预测损失和所述声纹提取模型的身份预测训练损失为目标,对所述声纹提取模型进行参数优化。上述方案训练得到的声纹提取模型能够提取高精度的声纹模型,进而可以支持实现更高精度的声纹识别。

    语音匹配方法、装置、电子设备及存储介质

    公开(公告)号:CN111968650B

    公开(公告)日:2024-04-30

    申请号:CN202010826186.1

    申请日:2020-08-17

    Abstract: 本发明实施例提供一种语音匹配方法、装置、电子设备及存储介质,所述方法包括:确定待匹配话单的两个待匹配号码;将待匹配话单中的语音数据的声纹特征分别与两个待匹配号码的声纹特征进行匹配,得到待匹配话单中的语音数据与两个待匹配号码的匹配关系;其中,任一待匹配号码的声纹特征是对该待匹配号码的话单集中每一语音数据的声纹特征进行聚类得到的,该待匹配号码的话单集包括多个以该待匹配号码为一端、不同号码为另一端的话单。本发明实施例提供的方法、装置、电子设备及存储介质,保证了语音数据与其对应主被叫号码的一致性。

    声纹提取方法、装置、设备及可读存储介质

    公开(公告)号:CN115019808A

    公开(公告)日:2022-09-06

    申请号:CN202210616862.1

    申请日:2022-06-01

    Abstract: 本申请公开了一种声纹提取方法、装置、设备及可读存储介质。获取待进行声纹提取的语音数据之后,先确定语音数据对应的语谱片段,再针对每个语谱片段,对语谱片段进行声纹提取,得到语谱片段的融合有语音数据的录制环境信息的声纹表征向量;对各个语谱片段的融合环境信息的声纹表征向量进行加权平均,得到语音数据的融合有语音数据的录制环境信息的声纹表征向量。上述方案中,语音数据的声纹表征向量融合有语音数据的录制环境信息,其精准度更高,因此,采用上述方案能够消除语音数据录制环境差异对声纹信息的精准度的影响。

    虚假视频检测方法和装置、电子设备及存储介质

    公开(公告)号:CN112686123A

    公开(公告)日:2021-04-20

    申请号:CN202011562921.9

    申请日:2020-12-25

    Abstract: 本申请公开了一种虚假视频检测方法和装置、电子设备及存储介质。该方法包括:获取待测试视频和第一历史视频,待测试视频包括多个第一视频帧,第一历史视频包括多个第二视频帧;分别将各第一视频帧中面部以外的人体区域与对应的第二视频帧中面部以外的人体区域进行比对,得到比对结果;判断比对结果是否满足第一预设条件;若满足,则认为待测试视频为虚假视频。通过上述方式,能够提高虚假视频判断结果的准确度。

Patent Agency Ranking