声纹识别方法、模型的训练方法、相关装置及存储介质

    公开(公告)号:CN118197322A

    公开(公告)日:2024-06-14

    申请号:CN202410216418.X

    申请日:2024-02-27

    Abstract: 本申请公开了一种声纹识别方法、模型的训练方法、相关装置及存储介质,声纹识别模型的训练方法包括:获取待训练声纹识别模型以及获取第一音频数据集,待训练声纹识别模型中最后一层分类节点包括第一数量个分类节点,待训练声纹识别模型中除最后一层节点以外的其他节点的参数与已训练的基准声纹识别模型中的参数相同;利用待训练声纹识别模型对若干第一目标对象的第一真假音训练数据进行分类,得到各待训练节点输出的各第一真假音训练数据的分类结果;基于各第一真假音训练数据的分类结果以及各第一真假音训练数据的类别标签之间的差异,调整待训练声纹识别模型中的参数。上述方案,能够提高模型对特定对象的真假音识别的准确度。

    语种识别方法、装置、设备、存储介质及程序产品

    公开(公告)号:CN118351872A

    公开(公告)日:2024-07-16

    申请号:CN202410262433.8

    申请日:2024-03-07

    Abstract: 本申请提供了语种识别方法、装置、设备、存储介质及程序产品,该方法包括:获取待处理音频数据;将所述待处理音频数据输入至语种识别模型,得到所述待处理音频数据对应的目标语种;其中,所述语种识别模型是根据伪语种向量和音频样本集合中各个音频样本对应的音频特征向量进行语种识别训练得到的,其中,所述伪语种向量是对所述音频样本集合中第一音频样本对应的第一音频特征向量进行转换处理得到的,所述伪语种向量与所述音频样本集合中第二音频样本对应的第二音频特征向量的方向相同,所述第一音频样本和所述第二音频样本是不同的语种音频。根据本申请的技术方案,能够有效提升语种识别的准确性。

Patent Agency Ranking