一种基于二次建模的说话人识别方法

    公开(公告)号:CN106898355A

    公开(公告)日:2017-06-27

    申请号:CN201710031899.7

    申请日:2017-01-17

    Applicant: 清华大学

    Abstract: 本发明提出一种基于二次建模的说话人识别方法,属于声纹识别、模式识别与机器学习领域。该方法在模型训练阶段,获取待识别说话人的训练语音数据并预处理;根据训练语音数据训练得到第一个DNN模型;利用第一个DNN模型,对训练语音数据进行识别,提取易混语音数据;根据易混语音数据训练得到第二个DNN模型;在说话人识别阶段,获取待识别语音数据并预处理;利用第一个DNN模型对待识别语音数据进行识别,若识别概率大于设定阈值,则得到说话人识别结果;否则通过第二个DNN模型对待识别语音数据进行第二次识别,得到说话人识别结果。本发明通过建立两个DNN模型,同时考虑说话人宏观特征和微观特征,有效提高说话人识别的准确率。

    身份验证的方法、装置、计算机设备及存储介质

    公开(公告)号:CN110379433B

    公开(公告)日:2021-10-08

    申请号:CN201910711306.0

    申请日:2019-08-02

    Abstract: 本申请涉及一种身份验证的方法、装置、计算机设备及存储介质。方法包括:获取目标用户根据目标动态验证码输入的语音数据;根据预设的分段算法,将语音数据划分为至少一个语音帧;针对每个语音帧,根据预设的声学特征提取算法,提取该语音帧对应的声学特征向量;将该语音帧对应的声学特征向量输入至预先训练的身份验证多任务模型,输出该语音帧对应的中间用户特征向量和第一后验概率集合;根据各语音帧对应的中间用户特征向量和预设的池化算法,确定目标用户对应的第一用户特征向量;根据目标用户对应的第一用户特征向量和各语音帧对应的第一后验概率集合,对目标用户进行身份验证。采用本申请可以降低服务器的计算复杂度,提高服务器的处理效率。

    语种识别方法及计算机设备

    公开(公告)号:CN108510977B

    公开(公告)日:2020-05-22

    申请号:CN201810235261.X

    申请日:2018-03-21

    Applicant: 清华大学

    Abstract: 本发明提供了一种语种识别方法及计算机设备,首先获取多个语种的语音样本,通过多个语种样本中每一语音样本的每一音素序列的N元文法的特征超矢量的概率值与二叉决策树特征超矢量比较计算,再将所有音素序列的比较计算结果拼接得到每一语音样本的联合特征超矢量;通过分类器将训练库中语种样本的联合特征超矢量进行分类和语种建模,得到每一语种的联合支持矢量,获取输入的待测的语音段并得其联合特征超矢量,在训练库中查询与联合特征超矢量匹配的联合支持矢量,得到与语音段对应的目标语种。本发明使用联合特征超矢量可以使长上下文音素序列更准确的建模,从而可以让一个语音段的特征描述更加精细,提高语种识别性能。

    一种轴承载流摩擦测试装置及方法

    公开(公告)号:CN111189637B

    公开(公告)日:2024-08-30

    申请号:CN202010152813.8

    申请日:2020-03-06

    Inventor: 尹维 高建华 刘艺

    Abstract: 本发明提供了一种轴承载流摩擦测试装置及方法,该试验装置主要包括控制系统、加载系统、夹具系统、驱动系统、数据采集系统、载流系统、轴承系统。夹具系统包括轴承夹具和与选择轴接触的碳板夹具,均采用铜合金材料,且与旋转轴接触部分采用弧形碳板,实现面‑面接触。能够实现平面轴承、锥轴承和球轴承等载流条件下的摩擦学行为测试、研究。本发明提供了一种载流条件下轴承的摩擦磨损行为以及润滑脂的理化指标和润滑性能加速退化的装置及方法,以期为电机轴承电蚀问题研究提供技术支持。

    基于DNN模型和支持向量机模型的说话人个数估计方法

    公开(公告)号:CN106898354A

    公开(公告)日:2017-06-27

    申请号:CN201710123753.5

    申请日:2017-03-03

    Applicant: 清华大学

    Abstract: 本发明提出基于DNN模型和支持向量机模型的说话人个数估计方法,属于语音信号处理和深度学习领域。模型训练阶段,首先获取N个说话人的训练语音数据,得到深度神经网络DNN模型;然后获取M个说话人的训练语音数据,每个说话人的梅尔倒谱特征对应DNN模型的N个输出概率,组成M个说话人的N维特征,建立M个支持向量机SVM模型;说话人个数估计阶段,将每条待测语音数据的梅尔倒谱特征输入DNN模型得到N维特征并依次输入M个SVM模型中评分,得分最高的SVM模型即为该条待测语音数据所对应的类别,类别总个数即为估计的说话人个数。该方法解决多说话人场景中说话人个数计算不准确的问题,提高语音数据中说话人个数估计的准确率。

    语种识别系统
    8.
    发明授权

    公开(公告)号:CN108648747B

    公开(公告)日:2020-06-02

    申请号:CN201810234745.2

    申请日:2018-03-21

    Applicant: 清华大学

    Abstract: 本发明提供了一种语种识别系统,所述识别系统包括:获取模块、超矢量计算模块、分类模块及语种识别模块;通过获取模块获取语种的语音样本,并得到音素序列的概率值和二叉决策树特征超矢量的概率值;再通过超矢量计算模块将音素序列的概率值与二叉决策树特征超矢量的概率值进行比较计算、拼接,从而得到语音样本的联合特征超矢量;分类模块用于将训练库中语种样本的联合特征超矢量进行分类和语种建模,得到每一语种的联合支持矢量,语种识别模块用于获取输入的待测的语音段,在训练库中匹配联合支持矢量,得到与语音段对应的目标语种。本发明能够提高语种识别的准确性。

    语种识别系统
    9.
    发明公开

    公开(公告)号:CN108648747A

    公开(公告)日:2018-10-12

    申请号:CN201810234745.2

    申请日:2018-03-21

    Applicant: 清华大学

    Abstract: 本发明提供了一种语种识别系统,所述识别系统包括:获取模块、超矢量计算模块、分类模块及语种识别模块;通过获取模块获取语种的语音样本,并得到音素序列的概率值和二叉决策树特征超矢量的概率值;再通过超矢量计算模块将音素序列的概率值与二叉决策树特征超矢量的概率值进行比较计算、拼接,从而得到语音样本的联合特征超矢量;分类模块用于将训练库中语种样本的联合特征超矢量进行分类和语种建模,得到每一语种的联合支持矢量,语种识别模块用于获取输入的待测的语音段,在训练库中匹配联合支持矢量,得到与语音段对应的目标语种。本发明能够提高语种识别的准确性。

    一种基于数字口令与声纹联合确认的用户身份验证方法

    公开(公告)号:CN107104803A

    公开(公告)日:2017-08-29

    申请号:CN201710208226.4

    申请日:2017-03-31

    Applicant: 清华大学

    Abstract: 本发明提出一种基于数字口令与声纹联合确认的用户身份验证方法,属于身份验证技术领域。该方法包括初始化阶段:获取初始化训练音频并建立文本相关的通用背景模型;注册阶段:记录用户注册信息并建立文本相关的用户模型;验证阶段:用户按照服务器指定的顺序录制用户验证音频,根据用户验证音频的短时谱特征以及文本相关的用户模型与文本相关的通用背景模型,验证该用户验证音频的声纹是否属于目标用户且内容与正确数字串文本是否相符,得到声纹验证分数和文本验证分数;将两个验证分数加权求和得到最终验证分数,当最终验证分数超过设定阈值时,验证通过。本发明在传统口令验证的基础上,结合数字口令确认和声纹确认,增强了身份验证的安全性。

Patent Agency Ranking