一种基于动态分割逆离散余弦变换倒谱系数的音声特征提取算法

    公开(公告)号:CN109767756A

    公开(公告)日:2019-05-17

    申请号:CN201910087494.4

    申请日:2019-01-29

    Abstract: 本发明公开了一种基于动态分割逆离散余弦变换倒谱系数的音声特征提取算法,具有如下步骤:S1、对音声信号进行预加重、分帧和加窗预处理:S2、对于预处理后的音声信号进行从时域到频域的变换形式处理:S3、利用聚类分析算法,计算步骤S2得到的逆离散余弦变换倒谱系数之间的相似度,并把相似度最大的相邻两类依次合并;迭代以上过程,直至聚类至24类,得到的动态分割逆离散余弦变换倒谱系数即为音声特征。本发明完善了现有技术没有充分利用音声动态特征进行频域变换的缺点,使本发明具有更广泛的适应性,且在说话人识别上可以获得更高的识别精度。

    一种基于余弦相似度的动态音声特征提取方法

    公开(公告)号:CN110197657B

    公开(公告)日:2022-03-11

    申请号:CN201910430464.9

    申请日:2019-05-22

    Abstract: 本发明公开了一种基于余弦相似度的动态音声特征提取方法,包括以下步骤:S1:采用预加重、分帧和加窗方法将语音信号预处理成时域信号,采用窗口函数将语音信号分解为一定长度的帧;S2:将语音时域信号转换成频域信号,获取每帧语音频域信号的320维的离散余弦反变换(IDCT‑Cepstrum Coefficient)倒谱系数;S3:对语音的频域信号进行相邻维之间的余弦相似度计算;S4:找到余弦相似度的两列最大相邻维进行合并;S5:重复操作S3至S4将320维语音频域信号降维到14维的语音频域特征;S6:将语音特征以直方图形式表示。

    一种基于动态分割逆离散余弦变换倒谱系数的音声特征提取算法

    公开(公告)号:CN109767756B

    公开(公告)日:2021-07-16

    申请号:CN201910087494.4

    申请日:2019-01-29

    Abstract: 本发明公开了一种基于动态分割逆离散余弦变换倒谱系数的音声特征提取算法,具有如下步骤:S1、对音声信号进行预加重、分帧和加窗预处理:S2、对于预处理后的音声信号进行从时域到频域的变换形式处理:S3、利用聚类分析算法,计算步骤S2得到的逆离散余弦变换倒谱系数之间的相似度,并把相似度最大的相邻两类依次合并;迭代以上过程,直至聚类至24类,得到的动态分割逆离散余弦变换倒谱系数即为音声特征。本发明完善了现有技术没有充分利用音声动态特征进行频域变换的缺点,使本发明具有更广泛的适应性,且在说话人识别上可以获得更高的识别精度。

    一种基于余弦相似度的动态音声特征提取方法

    公开(公告)号:CN110197657A

    公开(公告)日:2019-09-03

    申请号:CN201910430464.9

    申请日:2019-05-22

    Abstract: 本发明公开了一种基于余弦相似度的动态音声特征提取方法,包括以下步骤:S1:采用预加重、分帧和加窗方法将语音信号预处理成时域信号,采用窗口函数将语音信号分解为一定长度的帧;S2:将语音时域信号转换成频域信号,获取每帧语音频域信号的320维的离散余弦反变换(IDCT-Cepstrum Coefficient)倒谱系数;S3:对语音的频域信号进行相邻维之间的余弦相似度计算;S4:找到余弦相似度的两列最大相邻维进行合并;S5:重复操作S3至S4将320维语音频域信号降维到14维的语音频域特征;S6:将语音特征以直方图形式表示。

Patent Agency Ranking