基于音视频的用户认证方法和装置

    公开(公告)号:CN103973441A

    公开(公告)日:2014-08-06

    申请号:CN201310033654.X

    申请日:2013-01-29

    CPC classification number: G06F21/32 G06F2221/2117

    Abstract: 本申请提供了基于音视频的用户认证方法和装置。其中,该方法包括:获取用户在进行身份注册时提供的视频图像帧、语音帧;利用视频图像帧和语音帧分别训练出人脸模型和声纹模型,将人脸模型、声纹模型与所述用户的标识对应存储至设定存储空间;在对任一用户进行认证时,采集该被认证用户的视频图像帧和语音帧,从设定存储空间找到与采集的视频图像帧匹配的人脸模型,并获取与该找到的人脸模型对应的第一用户标识,以及,从设定存储空间找到与该采集的语音帧匹配的声纹模型,并获取该找到的声纹模型对应的第二用户标识;比较第一用户标识和第二用户标识是否相同,依据比较结果验证所述被认证用户是否通过认证。采用本发明,能够避免现有用户认证带来的诸多风险问题。

    一种声纹识别方法和装置
    52.
    发明公开

    公开(公告)号:CN103971690A

    公开(公告)日:2014-08-06

    申请号:CN201310032846.9

    申请日:2013-01-28

    CPC classification number: G10L17/18

    Abstract: 本发明实施方式提出一种声纹识别方法和装置。方法包括:基于无标注语音数据建立深层神经网络初级模型,并且基于有标注语音数据对该深层神经网络初级模型进行训练,以获取深层神经网络二级模型;利用该深层神经网络二级模型注册说话人高层声纹特征与说话人标识;接收测试语音数据,基于该深层神经网络二级模型从测试语音数据中提取测试语音高层声纹特征,并且基于该测试语音高层声纹特征确定说话人标识。通过深层神经网络自动学习语音信号当中包含能够抵御噪声干扰的高层次说话人信息,可以有效抵御噪声干扰。

    文本处理模型的构建方法和文本处理方法

    公开(公告)号:CN112749557A

    公开(公告)日:2021-05-04

    申请号:CN202010784088.6

    申请日:2020-08-06

    Abstract: 本申请涉及一种文本处理模型的构建方法和文本处理方法。文本处理模型的构建方法包括:获取文本训练样本,对文本训练样本进行分词处理,获得多个目标分词以及各个目标分词的分类结果;调用分类模型对文本训练样本进行编码处理,获得文本向量,并对目标分词进行编码处理,获得目标分词的第一词向量;通过分类模型中缓存的门限函数对第一词向量进行处理,获得第二词向量;通过第二词向量、第一词向量、文本向量以及目标分词的分类结果,对分类模型进行训练,得到文本处理模型。这样不仅强化了文本与目标分词之间的交互,而且通过词向量对文本向量进行门限控制,可以抑制与词语不相关的向量的特征维度,从而支持文本中词语的高精度分类。

    语音情感检测方法、装置、计算机设备及存储介质

    公开(公告)号:CN108346436B

    公开(公告)日:2020-06-23

    申请号:CN201710725390.2

    申请日:2017-08-22

    Inventor: 刘海波

    Abstract: 本发明提出了一种语音情感检测方法,所述方法包括:获取待检测语音数据;对所述待检测语音数据进行分帧处理得到语音帧,提取各个语音帧对应的语音特征形成语音特征矩阵,将语音特征矩阵输入已训练的情感状态概率检测模型,输出所述待检测语音数据对应的情感状态概率矩阵,将所述情感状态概率矩阵和语音特征矩阵输入已训练的情感状态转移模型得到对应的情感状态序列,所述已训练的情感状态转移模型包括已训练的情感状态转移概率参数,根据所述情感状态序列确定所述待检测语音数据对应的情感状态,该方法大大提高了语音情感检测的准确度。此外,还提出了一种语音情感检测装置、计算机设备及存储介质。

Patent Agency Ranking